Documente Academic
Documente Profesional
Documente Cultură
Capitolul 5. Nuclee
5.1. Transformarea în trăsături ................................................................. 107
5.2. Teorema lui Mercer................................................................................ 111
5.3. Tipuri de nuclee ....................................................................................... 112
5.3.1. Nucleul polinomial ..................................................................... 112
5.3.2. Nucleul gaussian ......................................................................... 116
5.3.2. Nucleul sigmoid .......................................................................... 118
4
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8. Extensii
8.1. Probleme de regresie ............................................................................ 157
8.2. Probleme de clasificare cu clase multiple ..................................... 160
8.2.1. Abordarea „una versus toate” ............................................... 160
8.2.2. Abordarea „toate versus toate” ............................................. 161
8.3. Exemple ...................................................................................................... 162
8.3.1. Abordarea „una versus toate” ............................................... 164
8.3.2. Abordarea „toate versus toate”............................................. 166
8.4. Concluzii ..................................................................................................... 168
5
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1
Dendrite
Corp celular
Nucleu Butoni terminali
Direcţia semnalului
Con de emergenţă
Axon
Neuron presinaptic
Sinapsă
Dendrite
8
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
9
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
încarcă” şi nu se mai poate activa din nou. Abia apoi neuronul revine în
starea de repaus şi poate genera un nou impuls.
Neuronii au un prag de depolarizare. Dacă potenţialul creat este mai
mic decât acest prag, neuronul postsinaptic nu se activează. Potenţialul creat
de o sinapsă excitatoare este mult mai mic decât pragul de depolarizare, prin
urmare un impuls poate fi generat doar prin efectul combinat al mai multor
sinapse. Dintre miile de terminaţii sinaptice care sunt conectate la un
neuron, câteva sute sunt active simultan sau la intervale de timp suficient de
apropiate ca efectele lor să se poată însuma. Potenţialul membranar al
neuronului postsinaptic este în fiecare moment rezultanta activităţii tuturor
sinapselor active în acel moment.
În figura 1.2 se poate observa formaţiunea denumită con de
emergenţă al axonului. Acesta este ultimul loc din corpul celular unde
potenţialele din intrările sinaptice se sumează înainte de a fi transmise
axonului.
Neuronul respectă principiul totul sau nimic. Dacă depolarizarea nu
este suficient de puternică pentru a depăşi pragul, canalele de ioni nu se
deschid. Dacă depolarizarea depăşeşte pragul, canalele se deschid şi se
generează un impuls electric. Acesta este întotdeuna la fel de mare, de
exemplu 40 mV, fără valori intermediare. Intensitatea unui stimul este dată
de frecvenţa impulsurilor. Unui stimul mai puternic îi corespunde o
frecvenţă mai mare. De exemplu, un stimul de durere puternică poate avea o
frecvenţă de până la 800 Hz (Malmivuo & Plonsey, 1995; Freudenrich,
2007; Mastin, 2010; Ribrault, Sekimoto & Triller, 2011; Tamarkin, 2011;
Gregory, 2014).
Acest principiu poate fi descris prin analogie cu aprinderea unui fitil,
care necesită o anumită temperatură. Sub aceasta, fitilul nu se aprinde. Însă
10
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
un chibrit cu o temperatură mai mare decât pragul nu face fitilul să ardă mai
repede, odată ce s-a aprins (Byrne, 2014).
În figura 1.3 (după Wikimedia Commons, 2014a) se prezintă un
impuls tipic, unde se pot vedea şi valorile curenţilor propriu-zişi şi ale
pragului.
Impuls
Tensiune (mV)
re
Repo
lariza
la
rizar
Depo
Prag Iniţieri
eşuate
Stare de repaus
Perioadă
refractară
Timp (ms)
11
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
1.2. Perceptronul
Ieşirea este binară: neuronul este activat (1) sau nu (0), ceea ce îl
face echivalent cu o propoziţie logică, care poate fi adevărată sau falsă.
Intrările sunt excitatoare (ai) sau inhibitoare (bj). Aceste intrări sunt sumate
direct şi neuronul se activează dacă suma depăşeşte un prag fix. De
asemenea, neuronul se activează doar dacă nu există intrări inhibitoare.
Funcţia de activare este următoarea:
(1.1)
12
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
13
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
nişte trăsături sintetice ale imaginii. Aceste trăsături erau conectate la ieşire,
prin modelul standard pe care îl vom discuta în secţiunea următoare.
Antrenând perceptronul cu o mulţime de imagini şi ieşirile corespunzătoare,
sistemul putea învăţa să clasifice imaginile (Kröse & van der Smagt, 1996;
Champandard, 2003).
14
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
x1
w1
x2 w2 Σwixi - θ y
wn
xn
, (1.2)
(1.3)
15
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (1.4)
. (1.5)
Exemplu
16
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
17
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (1.6)
(1.7)
. (1.8)
Ecuaţia este reprezentată în figura 1.9 (după Kröse & van der Smagt,
1996).
18
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
(1.9)
. (1.10)
19
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (1.11)
x1
w1
x2 w2 Σwixi y
wn -θ
xn
1
. (1.12)
20
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
. (1.13)
Exemplu
21
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Vom folosi pentru perceptron funcţia treaptă, însă dacă problema era
definită cu valori ale clasei de –1 în loc de 0, se putea folosi funcţia semn
fără alte modificări.
De asemenea, pentru a simplifica şi mai mult lucrurile, vom ignora
pragul. În această situaţie, găsirea perechii de ponderi se rezumă la a găsi
orientarea potrivită a unei drepte care se poate roti în jurul originii.
Dacă vectorul de ponderi este w = (–0,2, 0,1), ieşirile perceptronului
pentru cei doi vectori vor fi:
1.5
0.5
-0.5
-1
-1.5
-1.5 -1 -0.5 0 0.5 1 1.5
22
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
(1.14)
echivalent cu:
, (1.15)
1.5
0.5
-0.5
-1
-1.5
-1.5 -1 -0.5 0 0.5 1 1.5
23
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
24
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
1.5
0.5
-0.5
-1
-1.5
-1.5 -1 -0.5 0 0.5 1 1.5
25
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (1.16)
26
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
se iniţializează toate ponderile wi cu 0 sau cu valori aleatorii din intervalul [–0,5, 0,5]
se iniţializează rata de învăţare eta cu o valoare din intervalul (0, 1], de exemplu 0,1
se iniţializează numărul maxim de epoci P, de exemplu 100
p = 0 // numărul epocii curente
erori = true // un flag care indică existenţa erorilor de antrenare
27
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
1.5
0.5
-0.5
-0.5 0 0.5 1 1.5
1.5
0.5
-0.5
-0.5 0 0.5 1 1.5
28
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
1.5
0.5
-0.5
-0.5 0 0.5 1 1.5
29
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
1.5
0.5
-0.5
-0.5 0 0.5 1 1.5
30
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
. (1.17)
. (1.18)
. (1.19)
31
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
, (1.20)
. (1.21)
32
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 1. Reţele neuronale cu un singur strat
. (1.22)
. (1.23)
Prin urmare:
. (1.24)
33
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
34
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2
36
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
37
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (2.1)
38
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
. (2.2)
39
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(2.3)
. (2.4)
40
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
Demonstraţie
(2.5)
41
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (2.6)
. (2.7)
. (2.8)
. (2.9)
. (2.10)
42
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
. (2.11)
(2.12)
. (2.13)
Exemple
43
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
44
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
45
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
şi deci:
46
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
47
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
48
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
49
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Cazul 1 Cazul 2
Figura 2.5. Ipoteze consistente cu datele de antrenare
În primul caz, din contra, chiar dacă există tot o infinitate de drepte
care pot separa clasele punctelor eşantionate, ca în figura 2.5a, toate vor fi
destul de apropiate de suprafaţa de decizie reală (figura 2.3a).
Teoria învăţării statistice încearcă să formalizeze din punct de vedere
matematic diferenţele dintre aceste două situaţii şi să identifice
caracteristicile claselor de ipoteze învăţabile sau ne-învăţabile.
Ideea fundamentală care a condus la dezvoltarea iniţială a maşinilor
cu vectori suport este determinarea unui echilibru între eroarea obţinută
pentru mulţimea de antrenare şi capacitatea metodei de învăţare de a modela
orice mulţime de antrenare. O metodă cu o capacitate mică este ca un
polinom de grad mic care nu poate aproxima o funcţie complexă, fenomen
denumit sub-potrivire (engl. “underfitting”). Una cu o capacitate mare este
ca un polinom de grad foarte mare care trece exact prin punctele eşantionate
ale funcţiei, însă are variaţii mari în zonele intermediare şi deci probabil că
nu va interpola bine punctele (Leon, 2012), fenomen denumit supra-
potrivire (engl. “overfitting”). Un alt exemplu intuitiv (Burges, 1998) pentru
o metodă cu o capacitate mare este analogia cu un botanist cu memorie
fotografică care cunoaşte foarte mulţi arbori, însă atunci când i se arată un
nou arbore, ajunge la concluzia că nu este de fapt arbore deoarece are un
număr de frunze diferit de cel al arborilor pe care i-a văzut anterior. O
50
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
51
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Exemplu
52
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
În toate aceste cazuri, există o linie dreaptă care poate despărţi cele
3 puncte, astfel încât toate punctele dintr-o clasă să fie de o parte a dreptei şi
toate punctele din cealaltă clasă să fie de cealaltă parte a dreptei.
Tot pentru 3 puncte, există alte configuraţii (9 şi 10) care nu pot fi
separate de o linie dreaptă. Totuşi, pentru calculul dimensiunii VC este
necesar să existe cel puţin o situaţie în care clasa de ipoteze să clasifice
corect punctele. Pentru 3 puncte, o astfel de situaţie este cea prezentată în
configuraţiile 1-8.
Dacă pentru aceeaşi clasă de ipoteze vom considera o problemă
similară cu N = 4 puncte dispuse arbitrar, se poate vedea că există cel puţin
2 configuraţii (11 şi 12) în care nicio linie dreaptă nu poate separa corect
cele două clase. Este problema tipică a funcţiei binare SAU-EXCLUSIV (XOR),
care nu este separabilă liniar şi care nu poate fi învăţată de un perceptron cu
un singur strat. Mai mult, nu există nicio mulţime de 4 puncte pentru care o
linie dreaptă să poată realiza toate cele 16 clasificări necesare. Punctele pot
forma un patrulater, în care colţurile opuse aparţin aceleiaşi clase, pot forma
un triunghi cu un punct interior care să aibă o clasă diferită de vârfurile
triunghiului sau pot exista 3 puncte coliniare în clase diferite (Aaronson,
2008b). Niciuna din aceste situaţii nu poate fi rezolvată cu o linie dreaptă.
Prin urmare, dimensiunea VC a clasei de ipoteze a liniilor drepte în
plan este 3.
Pentru 4 puncte există alte clase de ipoteze, de exemplu cea a
funcţiilor cuadratice pentru configuraţiile 9-12, care pot clasifica punctele
corect şi prin urmare au o dimensiune VC mai mare.
53
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Exemplu
54
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
55
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (2.14)
56
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
. (2.15)
57
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (2.16)
. (2.17)
58
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
. (2.18)
. (2.19)
59
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
riscul empiric scade când modelul devine mai complex, adică odată cu
creşterea dimensiunii VC.
Numărul de instanţe de antrenare N este considerat mic dacă
raportul N / dVC este mic, de exemplu N / dVC < 20 (Vapnik, 1995). Dacă
N / dVC este mare, al doilea termen este mic şi riscul real se apropie de riscul
empiric. Prin urmare, pentru minimizarea riscului real, trebuie găsit un
echilibru între complexitatea modelului şi performanţele la antrenare, o
formalizare a ideii briciului lui Occam: găsirea celui mai simplu model cu
performanţe bune la antrenare (Osuna, Freund & Girosi, 1997a).
Primul termen din sumă, riscul empiric, depinde de o funcţie anume,
pe când al doilea (radicalul), denumit încredere VC, depinde de dimensiunea
VC a întregii mulţimi de funcţii.
Principiul minimizării riscului structural defineşte compromisul
între calitatea aproximării datelor de antrenare şi complexitatea funcţiei de
aproximare (Vapnik, 1995). Principiul presupune construirea unei structuri
imbricate de modele de învăţare cu dimensiuni VC
nedescrescătoare , unde , ca în figura 2.10.
Modul în care folosesc acest principiu mașinile cu vectori suport va
fi prezentat în secţiunea 3.4.
60
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 2. Noţiuni de teoria învăţării
Încrederea VC
Sub-potrivire Supra-potrivire
Riscul empiric
d1 d* dX dVC
H1 H* HX
61
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 3
3.1. Introducere
0
0 1 2 3 4 5 6 7
64
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 3. Probleme separabile liniar
0
0 1 2 3 4 5 6 7
0
0 1 2 3 4 5 6 7
65
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 0
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
66
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 3. Probleme separabile liniar
, (3.1)
, (3.2)
Exemplu
3.5
2.5
1.5
0.5
0
0 1 2 3 4 5 6 7 8 9 10
67
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
respectiv:
68
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 3. Probleme separabile liniar
w
5
4
Vectori suport
m (w · x) + b = 1
1
(w · x) + b = 0
(w · x) + b = -1
0
0 1 2 3 4 5 6 7
, (3.3)
unde:
. (3.4)
69
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
, (3.5)
. (3.6)
. (3.7)
-1
-2
-2 -1 0 1 2 3 4 5 6
70
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 3. Probleme separabile liniar
, (3.8)
. (3.9)
Exemplu
71
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
adică:
72
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 3. Probleme separabile liniar
(1/2, 1/2), nu (1, 1). Rezultatele de mai sus privind calculul marginii m
însă nu se modifică, deoarece este vectorul unitate (de lungime 1):
. (3.10)
73
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(3.11)
respectând constrângerile:
. (3.12)
, (3.13)
unde n este dimensionalitatea spaţiului de intrare iar R este raza celei mai
mici sfere care conţine toţi vectorii de antrenare.
Astfel, prin maximizarea marginii, se minimizează de fapt
dimensiunea VC a modelului. De vreme de hiperplanul de separare are
eroare de antrenare nulă (separând corect toate instanţele de antrenare),
maximizarea marginii va minimiza şi limita superioară a riscului aşteptat
(Gutierrez-Osuna, 2000). De asemenea, dimensiunea VC depinde de
lungimea vectorului de ponderi w şi este independentă de numărul de
atribute al problemei. Aceasta înseamnă că eroarea reală a unui hiperplan de
74
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 3. Probleme separabile liniar
75
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4
Dualitatea Lagrange
12
10
-2
-3 -2 -1 0 1 2 3
78
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
10
α=4
α=1
2
0
f
-2
-4
-3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1
79
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (4.1)
. (4.2)
10
4
f
α=1
2
-2
α=4
-4
-6
-8
-10
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
80
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
14
12
10
-2
-4
-6
-3 -2 -1 0 1 2 3
81
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
82
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
. (4.3)
. (4.4)
83
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (4.5)
. (4.6)
. (4.7)
. (4.8)
84
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
85
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
x = 0, între cei doi „pereţi” cuadratici şi apoi mergem în sus, pe fundul văii,
spre punctul (0, 2). Dacă inversăm ordinea, ajungem mai întâi într-un punct
de pe un perete unde y = 2 şi apoi coborâm pe perete spre acelaşi punct
(0, 2) (după Welling, 2005).
Exemple
86
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
cu x este 0:
87
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
88
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
3.5
2.5
1.5
0.5
-0.5
-1
-3 -2 -1 0 1 2 3
89
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
3.5
2.5
1.5
0.5
-0.5
-1
-3 -2 -1 0 1 2 3
90
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
3.5
2.5
1.5
0.5
-0.5
-1
-3 -2 -1 0 1 2 3
f
panta = −α
x
A (g(x), f(x))
C ϕ(α)
91
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
92
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
B
(g(x), f(x))
α =0
A D
g
Diferenţa A
de dualitate
B
93
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
astfel încât:
(4.10)
. (4.11)
Se defineşte lagrangianul:
94
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
, (4.12)
(4.13)
unde:
(4.14)
astfel încât:
. (4.15)
. (4.16)
(4.17)
. (4.18)
95
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(4.19)
(4.20)
(4.21)
96
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
(4.22)
(4.23)
(4.24)
. (4.25)
. (4.26)
(4.27)
97
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(4.28)
. (4.29)
(4.30)
respectând constrângerile:
(4.31)
. (4.32)
Conform condiţiei:
(4.33)
98
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
. (4.34)
(4.35)
, (4.36)
99
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (4.36)
Exemplu
0.5
-0.5
-1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
(4.37)
cu constrângerile:
αi ≥ 0 (4.38)
. (4.39)
100
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
101
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
102
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
în instanţa 1: ,
în instanţa 3: .
103
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
0
0 1 2 3 4 5 6 7
– 0.5 ∙ 2 ∙ ∙ 4 ∙ ∙
4 ∙ ∙ 4 ∙ ∙ – 8 ∙ ∙ – 9 ∙ ∙ – 10 ∙ ∙
4 ∙ ∙ 10 ∙ ∙ 8 ∙ ∙ 6 ∙ ∙ – 16 ∙
∙ – 19 ∙ ∙ – 20 ∙ ∙ 4 ∙ ∙ 8 ∙ ∙ 8 ∙
∙ 8 ∙ ∙ – 16 ∙ ∙ – 18 ∙ ∙ – 20 ∙ ∙ 4 ∙
∙ 6 ∙ ∙ 8 ∙ ∙ 10 ∙ ∙ – 16 ∙ ∙
– 17 ∙ ∙ – 20 ∙ ∙ – 8 ∙ ∙ – 16 ∙ ∙ – 16 ∙ ∙
– 16 ∙ ∙ 32 ∙ ∙ 36 ∙ ∙ 40 ∙ ∙ – 9 ∙
∙ – 19 ∙ ∙ – 18 ∙ ∙ – 17 ∙ ∙ 36 ∙ ∙
41 ∙ ∙ 45 ∙ ∙ – 10 ∙ ∙ – 20 ∙ ∙ – 20 ∙ ∙
– 20 ∙ ∙ 40 ∙ ∙ 45 ∙ ∙ 50 ∙ ∙ "
104
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 4. Dualitatea Lagrange
sau echivalent:
105
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
0
0 1 2 3 4 5 6 7
Pentru unele probleme pot exista foarte mulţi vectori suport, iar în
acest caz programele generale de optimizare pot fi mai puţin eficiente. De
aceea, pentru SVM se folosesc în general algoritmi speciali de optimizare,
precum algoritmul de optimizare secvenţială minimală (engl. “Sequential
Minimal Optimization”, SMO), descris în capitolul 7.
106
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 5
Nuclee
0.5
-0.5
-1
0 1 2 3 4 5 6 7
φ(x)
x
φ(o) φ(x)
x o φ(x)
o o φ(o)
o
φ(x)
φ(o) φ(o)
x x
40
35
30
25
20
15
10
0
1 2 3 4 5 6 7
108
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 5. Nuclee
. (5.1)
. (5.2)
. (5.3)
Exemplu
Fie nucleul:
109
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
şi
110
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 5. Nuclee
(5.4)
. (5.5)
111
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Există mai multe clase de funcţii care pot servi drept nuclee pentru
transformarea datelor. Nucleele folosite în mod uzual pentru maşinile cu
vectori suport sunt:
• nucleul liniar: ;
• nucleul polinomial: ;
• nucleul gaussian sau cu funcţii de bază radială (engl. “radial basis
functions”, RBF): ;
• nucleul sigmoid: .
112
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 5. Nuclee
cu 9 dimensiuni.
Când se aleg diferite nuclee care satisfac teorema lui Mercer, chiar
apropiate din punct de vedere al parametrilor, pot exista salturi mari în
dimensionalitatea spaţiului trăsăturilor.
Pentru acelaşi nucleu dar cu o problemă tridimensională, adică
x = (x1, x2, x3), vom avea o transformare într-un spaţiu cu 13 dimensiuni:
113
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Exemplu
114
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 5. Nuclee
115
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
0.5
-0.5
-1
0 1 2 3 4 5 6 7
116
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 5. Nuclee
cele două argumente. Şi produsul scalar din nucleul polinomial are aceeaşi
semnificaţie.
Folosind această interpretare, se pot găsi funcţii nucleu pentru
probleme cu formulări diferite de cele ale clasificării clasice. De exemplu,
fie problema clasificării proteinelor: o proteină este reprezentată de un şir de
caractere, care semnifică aminoacizi. Scopul este clasificarea proteinelor,
adică a acestor şiruri de caractere în familii şi super-familii definite de
relaţiile dintre structură şi funcţionalitate. Să presupunem că φ(x) reprezintă
numărul de apariţii al fiecărui subşir de lungime k în şirul x. Pentru 20 de
aminoacizi standard, problema presupune lucrul într-un spaţiu cu 20k
dimensiuni, care nu este fezabil nici pentru valori relativi mici ale lui k.
Însă, folosind algoritmi de potrivire a şirurilor (engl. “string matching”), se
poate calcula eficient nucleul , astfel încât se va lucra
implicit în spaţiul cu 20k dimensiuni, fără însă a calcula vectorii trăsăturilor
în acest spaţiu (Leslie, 2004; Ng, 2007).
Este de asemenea important de precizat că nucleul gaussian
proiectează spaţiul atributelor într-un spaţiu infinit dimensional.
Vom da în continuare un exemplu intuitiv asupra modului în care se
poate demonstra acest rezultat (Iyer & Ghose, 2013). Să considerăm cazul
unei probleme bidimensionale, n = 2. Presupunând că γ = 1, putem exprima
ecuaţia nucleului gaussian astfel:
117
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
vom obţine:
118
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 5. Nuclee
119
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 6
w
5
3
ξ1 ξ2
(w · x) + b = 1
1
(w · x) + b = 0
(w · x) + b = -1
0
0 1 2 3 4 5 6 7
(6.1)
astfel încât:
(6.2)
ξi ≥ 0 (6.3)
cu i = 1..N.
Parametrul de cost C este o măsură a erorii admise în clasificare. El
controlează compromisul dintre a permite erori pe mulţimea de antrenare şi
a forţa margini stricte. Creşterea valorii lui C măreşte costul clasificării
greşite a instanţelor şi determină crearea unui model mai precis dar care
poate să nu generalizeze bine. O valoare foarte mare pentru C este
122
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 6. Probleme neseparabile liniar
(6.4)
(6.5)
astfel încât:
0 ≤ αi ≤ C, i = 1..N. (6.6)
123
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(6.7)
(6.8)
6.2. Exemple
0.5
-0.5
-1
0 1 2 3 4 5 6 7 8 9
124
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 6. Probleme neseparabile liniar
-1
0 2 4 6 8 10 12 14 16
125
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
126
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 6. Probleme neseparabile liniar
127
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
128
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 6. Probleme neseparabile liniar
129
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
130
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 6. Probleme neseparabile liniar
131
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7
Algoritmul SMO
Din noul punct (0,67 , 5), realizăm optimizarea după x2, considerând
fix pe x1:
134
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
135
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(7.1)
astfel încât:
0 ≤ αi ≤ C, i = 1..N (7.2)
(7.3)
. (7.4)
(7.5)
136
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
(7.6)
137
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(7.7)
unde s = y1y2.
138
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
(7.8)
. (7.9)
139
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
(7.10)
. (7.11)
(7.12)
. (7.13)
. (7.14)
, (7.15)
140
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
(7.16)
, (7.17)
(7.18)
141
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (7.19)
142
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
143
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
. (7.20)
. (7.21)
144
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
. (7.22)
. (7.23)
.(7.24)
145
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
main
{
Se iniţializează elementele vectorului alpha cu 0
Se iniţializează pragul cu 0
–3
Se iniţializează epsilon cu o valoare mică, de exemplu 10
numChanged = 0
examineAll = true
146
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
if (examineAll)
examineAll = false
else if (numChanged == 0)
examineAll = true
}
}
procedure ExamineExample(i2)
{
y2 = target[i2]
alpha2 = multiplicatorul lagrangian pentru i2
if ((r2 < – epsilon && alpha2 < C) or (r2 > epsilon && alpha2 > 0))
{
if ((numărul de elemente ale lui alpha diferite de 0 şi C) > 1)
{
i1 = alege un alt multiplicator care maximizează pasul
147
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
if (TakeStep(i1, i2))
return 1
}
148
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
if (eta < 0)
{
a2 = alpha2 – y2 * (E1 – E2) / eta
if (a2 < L)
a2 = L
else if (a2 > H)
a2 = H
}
else
{
Lobj = ΘD pentru a2 = L
Hobj = ΘD pentru a2 = H
149
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Examine example
r2 < -epsilon && alpha2 < C2) || (r2 > epsilon && alpha2 > 0)
i2 = 0, a2 = 0.000, E2 = 1.000, r2 = -1.000, alphaNonBounded = 0
150
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
Update alphas
a1[3]=0.125 a2[0]=0.125 return 1
Examine example
r2 < -epsilon && alpha2 < C2) || (r2 > epsilon && alpha2 > 0)
i2 = 1, a2 = 0.000, E2 = 0.500, r2 = -0.500, alphaNonBounded = 2
151
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
E[0]=-0.375
E[1]=0.000
E[2]=-1.250
E[3]=-0.875
Update alphas
a1[0]=0.000 a2[1]=0.125 return 1
Examine example
r2 < -epsilon && alpha2 < C2) || (r2 > epsilon && alpha2 > 0)
i2 = 2, a2 = 0.000, E2 = -1.250, r2 = -1.250, alphaNonBounded = 2
Update alphas
a1[1]=0.438 a2[2]=0.313 return 1
152
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
Examine example
r2 < -epsilon && alpha2 < C2) || (r2 > epsilon && alpha2 > 0)
i2 = 3, a2 = 0.125, E2 = 1.000, r2 = 1.000, alphaNonBounded = 3
Update alphas
a1[1]=0.326 a2[3]=0.014 return 1
Examine example
Examine example
r2 < -epsilon && alpha2 < C2) || (r2 > epsilon && alpha2 > 0)
i2 = 2, a2 = 0.313, E2 = -0.667, r2 = -0.667, alphaNonBounded = 3
153
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Update alphas
a1[1]=0.493 a2[2]=0.479 return 1
Examine example
r2 < -epsilon && alpha2 < C2) || (r2 > epsilon && alpha2 > 0)
i2 = 3, a2 = 0.014, E2 = 1.000, r2 = 1.000, alphaNonBounded = 3
154
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 7. Algoritmul SMO
E[1]=0.028
E[2]=0.000
E[3]=0.986
Update alphas
a1[2]=0.493 a2[3]=0.000 return 1
Examine example
r2 < -epsilon && alpha2 < C2) || (r2 > epsilon && alpha2 > 0)
i2 = 1, a2 = 0.493, E2 = 0.028, r2 = -0.028, alphaNonBounded = 2
Update alphas
a1[2]=0.500 a2[1]=0.500 return 1
Examine example
155
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
Examine example
Examine example - not in if - return 0
Examine example
Examine example
Examine example
Examine example
Examine example
156
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8
Extensii
(8.1)
astfel încât:
. (8.2)
(8.3)
astfel încât:
(8.4)
ξi ≥ 0. (8.5)
cu i = 1..N.
Această situaţie este reprezentată în figura 8.2 (Statnikov et al.,
2009).
158
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8. Extensii
159
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
160
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8. Extensii
. (8.6)
O altă metodă foarte des folosită este cea denumită toate versus toate
(engl. “all versus all”), care construieşte k · (k – 1) / 2 modele, fiecare fiind
antrenat doar cu instanţele a 2 clase (Knerr, Personnaz & Dreyfus, 1990;
Kreßel, 1999). Pentru a clasifica o instanţă x, se folosesc toţi aceşti
clasificatori şi fiecare dă un vot asupra apartenenţei lui x la o anumită clasă:
dacă indică apartenenţa lui x la clasa i, atunci numărul
de voturi corespunzător clasei i este incrementat. În final, se alege clasa cu
cele mai multe voturi. Dacă două clase au acelaşi număr de voturi, se poate
alege în mod arbitrar prima clasă, în ordine lexicografică (Hsu & Lin, 2002).
161
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
8.3. Exemple
162
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8. Extensii
2.5
1.5
0.5
0
0 1 2 3 4 5 6 7
163
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
164
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8. Extensii
165
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
166
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8. Extensii
167
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
8.4. Concluzii
168
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Capitolul 8. Extensii
169
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Referinţe
172
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Referinţe
173
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
20101/Chapter%20Notes/Fall%202011/chapter_7%20Fall%2020
11.htm
[22] Fisher, R. A. (1936) The use of multiple measurements in
taxonomic problems, Annual Eugenics, vol. 7, part II, pp. 179-
188
[23] Freudenrich, C. (2007) How Nerves Work, HowStuffWorks.com,
http://health.howstuffworks.com/human-body/systems/nervous-
system/nerve5.htm/printable
[24] Georgiou, G. M. (1997) Single-layer networks, in Fiesler, E. &
Beale, R. (eds.), “Handbook of Neural Computation”, IOP
Publishing Ltd and Oxford University Press
[25] Gibbs, P. & Sugihara, H. (1997) What is Occam’s Razor?,
http://math.ucr.edu/home/baez/physics/General/occam.html
[26] Gregory, M. J. (2014) The Nervous System: Neurons,
http://faculty.clintoncc.suny.edu/faculty/michael.gregory/files/
bio%20102/bio%20102%20lectures/nervous%20system/
neurons.htm
[27] Groves, P. M. & Rebec, G. V. (1988) Introduction to Biological
Psychology, 3rd edition, W. C. Brown Publishers, Dubuque, Iowa
[28] Guestrin, C. (2005) PAC-learning, VC Dimension and Margin-
based Bounds, http://www.cs.cmu.edu/~guestrin/Class/10701-
S05/slides/pac-vc.pdf
[29] Gutierrez-Osuna, R. (2010) Support vector machines,
http://research.cs.tamu.edu/prism/lectures/pr/pr_l21.pdf
[30] Hastie, T., Tibshirani, R. & Friedman, J. (2001) Elements of
Statistical Learning: Data Mining, Inference and Prediction,
Springer-Verlag, New York
174
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Referinţe
175
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
[40] Iyer, A. & Ghose, A. (2013) Why does the RBF (radial basis
function) kernel map into infinite dimensional space?,
http://www.quora.com/Why-does-the-RBF-radial-basis-function-
kernel-map-into-infinite-dimensional-space
[41] Kearns, M. & Vazirani, U. (1994) An Introduction to
Computational Learning Theory, MIT Press, Cambridge,
Massachusetts
[42] Kecman, V. (2001) Learning and Soft Computing: Support
Vector Machines, Neural Networks, and Fuzzy Logic Models,
The MIT Press, Cambridge, Massachusetts
[43] Keerthi, S. S., Shevade, S. K., Bhattacharyya, C. & Murthy, K. R.
K. (2001) Improvements to Platt’s SMO Algorithm for SVM
Classifier Design, Neural Computation, vol. 13, no. 3, pp. 637-
649, doi: 10.1162/089976601300014493
[44] Klivans, A. (2005) The PAC Learning Model,
http://www.cs.utexas.edu/~klivans/f06lec2.pdf
[45] Knerr, S., Personnaz, L. & Dreyfus, G. (1990) Single-layer
learning revisited: a stepwise procedure for building and training
a neural network, in Fogelman, J. (ed.), „Neurocomputing:
Algorithms, Architectures and Applications”, Springer-Verlag
[46] Kreßel, U. (1999) Pairwise classification and support vector
machines, in Schölkopf, B., Burges, C. J. C. & Smola, A. J.
(eds.), “Advances in Kernel Methods – Support Vector
Learning”, pp. 255-268, MIT Press, Cambridge, Massachusetts
[47] Kröse, B. & van der Smagt, P. (1996) An Introduction to Neural
Networks, University of Amsterdam
176
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Referinţe
177
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
178
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Referinţe
179
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
180
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Referinţe
181
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
182
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Referinţe
183
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com
Inteligenţă artificială: maşini cu vectori suport
184
Florin Leon (2014). Inteligenţă artificială: maşini cu vectori suport
Tehnopress, Iaşi, ISBN 978-606-687-155-6, http://florinleon.byethost24.com