Documente Academic
Documente Profesional
Documente Cultură
Învățare automată
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
23. Învățarea cu întărire ............................................................................... 128
24. Învățarea cu întărire profundă ........................................................... 141
Sisteme multi-agent
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
1. Introducere în inteligența artificială
5
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
A acționa rațional: A descoperi acțiunea optimă, care aduce
utilitatea maximă, indiferent de natura prelucărilor interne. Acțiunile
raționale sunt studiate de majoritatea cercetărilor actuale, deoarece
comportamentul este observabil și mai ușor de testat științific decât
gândirea, iar raționalitatea este clar definită.
6
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Metode de căutare a căilor
7
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Funcții utilizate în general:
f(n) este un cost estimat. Cu cât este mai mic f(n), cu atât este mai
bun nodul n;
g(n) este costul căii de la nodul inițial la n. Este cunoscută;
h(n) este estimarea costului căii de la n la un nod scop. Este o
estimare euristică.
Tipuri de căutare:
8
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Ecuația pathmax face ca valorile lui f să fie monoton
nedescrescătoare pe căile traversate din arborele de căutare: la generarea
unui nod fiu c al lui p: f(c) = max( f(p), g(c) + h(c) ).
9
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Jocuri
10
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
În cazul cel mai favorabil, retezarea alfa-beta are complexitatea
d/2
O(b ), deci poate căuta pe o adâncime de două ori mai mare decât
minimax.
wi 2 ln n
ni ni
11
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
victorie sau înfrângere). După terminarea simulării, pentru toate pozițiile
vizitate se incrementează numărul de jocuri și, dacă e cazul, numărul de
victorii. După aplicarea algoritmului (în mod repetat), se alege mutarea cu
cel mai mare număr de vizite ni, deoarece valoarea sa este cel mai bine
estimată.
12
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
4. Probleme de satisfacere a constrângerilor
Euristici de optimizare:
13
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
5. Metode de optimizare
1. Algoritmii evolutivi
14
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Selecția alege un părinte (cromozom) pentru noua generație, pe baza
funcției de adaptare. Selecția acționează la nivel de individ și este
independentă de reprezentare, adică nu depinde de codare, ci doar de funcția
de adaptare.
Tipuri de selecție:
15
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Mutația modifică genele unui copil cu o probabilitate mică, numită
rată de mutație.
Mutația binară neagă valoarea unei gene.
Mutația reală resetează o genă la o valoare aleatorie în domeniul de
definiție sau modifică puțin valoarea existentă.
Criteriile de terminare cele mai folosite sunt: atingerea unui număr
specificat de generații sau convergența populației.
2. Evoluția diferențială
16
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Selecția se realizează la nivel de cromozom:
x (t 1) dacă f xi (t 1) f y i (t )
y i (t 1) i
y i (t ) altfel
yˆ (t ) argmin ( f ( y1 (t ), f ( y 2 (t ), ..., f ( y s (t ))
17
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Vitezele sunt limitate la o valoare Vmax.
Se actualizează poziția curentă:
xi (t 1) xi (t ) vi (t 1)
c1 c2
1 w
2
18
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
k
p (t )
(t ) (t )
ij ij
dacă j N ik
(t ) (t )
ij
il il
lN ik
unde: ηij este în general o funcție de lungimea arcului, de obicei ηij = 1 / dij ,
α ≥ 0, β ≥ 1. Dacă α = 0, este o căutare greedy. Dacă β ar fi 0, doar feromonii
contează și de obicei căutarea nu converge. Nik este o vecinătate fezabilă a
furnicii k, adică mulțimea nodurilor nevizitate încă.
Actualizarea feromonilor se face după relația:
m
ij (t 1) ij (t ) ijk (t )
k 1
5. Hill climbing
19
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
6. Călirea simulată
20
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
încearcă găsirea punctului optim din vecinătate, care ar putea fi optimul
global.
Criteriul de terminare este când T se apropie de 0 sau când nu se mai
fac tranziții, nici în stări mai rele, nici în stări mai bune.
O(q; a, b) ai qi bij qi q j
i (i , j )
8. Optimizarea multi-obiectiv
21
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
8.1. Algoritm scalar cu sumă ponderată a obiectivelor
22
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Indivizii care aparțin aceluiași front sunt sortați pe baza distanței de
aglomerare. Distanța de aglomerare este distanța Manhattan între vecinii
din front ai unui individ. Pentru extreme, distanța se consideră ∞. Un individ
mai bun are o distanță de aglomerare mai mare. Efectul este selecția
indivizilor aflați în regiuni mai puțin aglomerate și previne omogenizarea
soluțiilor, deci convergența prematură (fig. Deb, 2001).
23
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
6. Reprezentarea cunoașterii
1. Ierarhia cunoașterii
24
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
ploaia să-și urmeze cursul.” / “The best thing one can do when it rains is to
let it rain.” (H. W. Longfellow)
2. Sisteme expert
3. Rețele semantice
25
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Rețelele semantice permit și utilizarea de etichete mai generale
pentru arce. O proprietate importantă a acestui mod de reprezentare este
moștenirea trăsăturilor. În exemplul următor, Rex este un animal, este viu și
are patru picioare fiindcă este câine.
26
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
De exemplu, pentru o cameră de hotel, reprezentarea prin cadre este
următoarea (Luger, 2005):
27
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Elementele unui scenariu: condiții de intrare, rezultate, proprietăți
(lucrurile care „sprijină” desfășurarea scenariului, de exemplu: într-un
restaurant există mese, scaune, meniuri), roluri (acțiunile pe care le
îndeplinesc participanții, de exemplu: chelnerul ia comanda, clientul
plătește), scene (împărțirea scenariului pe aspecte temporale, de exemplu:
intrarea în restaurant, comanda, luarea mesei).
28
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
6. Ontologii
29
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
7. Metode de inferență în logica propozițională
și predicativă
30
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
care conține reuniunea literalilor celor două clauze-premisă, fără perechea
complementară.
Într-o formulare mai generală, rezoluția propozițională se bazează pe
următoarea regulă de inferență:
sau echivalent:
C1 = {..., χ, ...}
C2 = {..., ¬χ, ...}
-------------------------------
C1 ∖ { χ } ⋃ C2 ∖ { ¬χ }
p∨q
¬p ∨ r
----------
q∨r
p
¬p
------
{}
31
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
O propoziție φ este demonstrabilă dintr-o mulțime Δ de clauze dacă
și numai dacă procesul de rezoluție propozițională generează clauza vidă din
mulțimea Δ ∪ {¬φ}.
Este o demonstrație de tip reducere la absurd. Se include în
mulțimea de clauze concluzia negată și, prin procesul de rezoluție, se
încearcă să se ajungă la o contradicție. Dacă se ajunge, concluzia se poate
demonstra, dacă nu, concluzia nu se poate demonstra.
p
p q
(q r ) s
p
p p q
p q
(q r ) s q s
r s
32
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Un sistem logic este decidabil dacă există o metodă eficientă care
determină dacă o formulă arbitrară este o teoremă a sistemului logic
considerat, adică dacă se poate stabili dacă o formulă este adevărată sau nu.
Logica propozițională este decidabilă. De exemplu, cu algoritmul de
rezoluție propozițională, o demonstrație se termină întotdeauna: deoarece
există un număr finit de clauze care pot fi generate dintr-o mulțime inițială
finită de clauze, la un moment dat algoritmul nu mai poate genera noi
clauze. Dacă până în acel moment a ajuns la o contradicție, demonstrația a
reușit. Dacă nu, concluzia propusă nu poate fi demonstrată.
33
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
anumite variabile iau valorile unor simboluri). De exemplu (Russell &
Norvig, 2002):
34
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
În forma normal conjunctivă, premisele sunt:
35
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
8. Logica vagă (fuzzy)
A ( x) : X [0, 1]
A {( x, A ( x)) | x X }
A 1 / x1 ... n / xn
36
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
aparține mulțimii oamenilor tineri în proporție de 90%, una de 30 de ani în
proporție de 70% iar una de 50 de ani nu aparține mulțimii (gradul său de
apartenență este 0). Aceste lucruri se reprezintă grafic ca în figura 8.1.
37
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Noțiuni fundamentale
supp(A) = {x X | A ( x) 0} .
h(A) = sup A ( x) .
xX
n(A) = {x X | A ( x) 1} .
38
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Numere fuzzy
cx
1 , c x c
x c
A ( x) 1 ,c x c
0, altfel
39
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
cx
1 , c x c
1, c x d
A ( x) x d
1 ,d x d
0, altfel
40
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
În logica fuzzy, regula de inferență corespunzătoare este următoarea:
a1 b1 a1 b2 ...
R B| A a2 b1 ...
...
41
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Prin metoda de inferență Larsen, mulțimea rezultată B' este o
variantă „scalată” a lui B, la înălțimea fixată de A'.
4.3. Defuzzificarea
x (x )
i A i
xCG i
(x )
i
A i
42
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
În figura 8.8, în dreapta, mulțimea delimitată cu albastru este B, cea
delimitată cu roz este B' iar valoarea pe axa X indicată cu roșu este centrul
de greutate.
43
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Se combină intrările fuzzificate urmând regulile fuzzy pentru
stabilirea puterilor de activare ale regulilor;
4. Se calculează consecvenții regulilor prin combinarea puterilor de
activare ale regulilor cu funcțiile de apartenență ale ieșirilor;
5. Se combină consecvenții pentru a determina mulțimea de ieșire;
6. Se defuzzifică mulțimea de ieșire, doar dacă se dorește ca ieșirea să
fie strictă.
5.2. Fuzzificarea
44
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
5.3. Combinarea antecedenților multipli
45
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
5.6. Defuzzificarea
46
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Figura 8.11. Sistem de inferență cu o intrare strictă și una fuzzy (Knapp, 2004)
47
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
9. Rețele bayesiene
48
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2.1. Algoritmul Bayes-Ball
49
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
{B, C,...}. Toate evenimentele {A, B, C,...} ar putea fi cauzate de alte
evenimente necunoscute. O relație de corelație nu implică o relație de
cauzalitate. O relație de cauzalitate implică o relație de corelație.
50
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Rețele bayesiane dinamice
51
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
10. Metode de planificare
Poor ∧ Unknown
At(Plane1, Melbourne) ∧ At(Plane2, Sydney)
Rich ∧ Famous
At(Plane1, Tahiti)
52
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Reprezentarea acțiunilor se face prin scheme de acțiuni, care au
precondiții și postcondiții (efecte):
53
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Metode de planificare prin căutare în spațiul stărilor
No delete list:
eliminarea efectelor negative (a listei de ștergere), fără
a elimina precondițiile. Este una din cele mai utilizate euristici;
Eliminarea tuturor precondițiilor acțiunilor;
Presupunerea independenței subscopurilor: costul rezolvării unei
conjuncții de subscopuri este aproximativ egal cu suma costurilor de
rezolvare independentă a subproblemelor.
54
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Euristicile presupun rezolvarea efectivă a unor probleme simplificate
de planificare. În practică, aceste costuri sunt neglijabile.
55
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Euristici pentru POP:
4. Algoritmul FF
56
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Este un algoritm rapid, dar nu garantează găsirea soluției optime (cu
numărul minim de pași).
57
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
11. Algoritmi de clasificare
1. Învățarea automată
58
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Clasificarea și regresia
3. Tipuri de atribute
59
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Discrete (simbolice): nominale (culoarea ochilor, nume, sex, CNP ca
obiect, nu număr) sau ordinale (înălțime: mică, medie, mare,
ranguri, calificative);
Continue (numerice): de tip rațional (unde există un „element
neutru”, de exemplu, 0: lungime, distanță, prețuri) sau de tip interval
(temperatura în grade Celsius, date calendaristice).
4. Arbori de decizie
60
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Atunci când este partiționat un nod, se preferă partiționarea care
determină noduri-fiu cu cea mai omogenă distribuție de clase. Prin urmare,
necesită o măsură a „impurității” nodurilor, precum entropia (E) sau indexul
Gini (G):
c
E (t ) p(i | t ) log 2 p(i | t )
i 1
c
G ( t ) 1 p (i | t )
2
i 1
k
ni
Gsplit Gi
i 1 n
unde ni este numărul de instanțe din nodul fiu i, iar n este numărul de
instanțe din nodul p. Formula este similară pentru entropie.
Calitatea unei partiționări este determinată de creșterea omogenității
submulțimilor rezultate. Trebuie maximizat câștigul informațional:
Δ = I(părinte) – Σi (ni / n · I(fiui)). Deoarece I(părinte) este același pentru
toți fiii, se preferă valoarea minimă pentru Σi (ni / n · I(fiui)). Termenul de
„câștig informațional” se utilizează când se folosește entropia ca măsură de
impuritate, dar principiul este același pentru indexul Gini sau orice altă
măsură de impuritate.
Prin urmare, se vor încerca partiționările după toate atributele și se
va selecta partiționarea cu valoarea minimă pentru formula de mai sus.
După ce un atribut a fost folosit pentru partiționare, este eliminat din
mulțimile rezultate (pentru nodurile-fiu).
Când avem atribute continue, pentru eficientizarea calculelor se
sortează valorile, acestea se parcurg liniar, actualizându-se numărarea
61
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
instanțelor și calculându-se indexul Gini și se alege poziția de partiționare
cu indexul Gini minim. Pentru optimizarea acestui proces, se calculează
indexul Gini doar pentru pozițiile unde se schimbă valoarea clasei.
P( A1 A2 ... An | C ) P(C )
P(C | A1 A2 ... An )
P( A1 A2 ... An )
62
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Putem estima P(Ai | Cj) pentru toate Ai și Cj . Trebuie găsită valoarea
Cj astfel încât produsul P(Cj) Πi P(Ai | Cj) să fie maxim.
Dacă una din probabilitățile condiționate este 0, atunci tot produsul
devine 0. Fie nc numărul de clase. Corecția Laplace evită anularea
produsului de probabilităţi cauzată de un factor nul prin modificarea
formulei pentru P(Ai | Cj):
nij 1
P( Ai | C j )
n j nc
Calcule simple;
Robustețe la zgomot și atribute irelevante;
Aplicabilitate pe mulțimi de antrenare medii sau mari;
Presupunerea că atributele sunt independente condițional este
deseori infirmată în realitate, dar metoda funcționează totuși bine.
63
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
6. Învățarea bazată pe instanțe (algoritmul celor mai
apropiați k vecini, k-Nearest Neighbors, kNN)
1/ p
n p
d x, y xi yi
i 1
x'i
xi min i 0, 1
max i min i
64
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Ponderarea instanțelor se bazează pe faptul că vecinii mai apropiați
au o influență mai mare la stabilirea clasei. Influența fiecărui vecin poate fi
ponderată pe baza distanței:
wi = 1 / d(xq, xi)2
65
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
12. Clasificarea bazată pe ansambluri
1. Bagging
66
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
decizia corectă. Dacă p < 0,5, adăugarea de noi votanți scade calitatea
deciziei.
67
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Random Forest este una din cele mai bune metode de clasificare
„clasice”. Subiectivitatea scade deoarece arborii componenți pot crește
foarte mult, până capturează toate detaliile problemei. Varianța scade
datorită mulțimilor bootstrapped și medierii rezultatelor individuale ale
arborilor componenți.
2. Boosting
2.1. Adaboost
T
H (x ) sgn t ht (x )
t 1
68
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Se poate folosi orice clasificator, cu condiția ca rata sa de eroare să
fie mai mică decât 50%. De obicei, se folosește algoritmul Decision Stump,
un arbore de decizie cu un singur nivel, în care criteriul de selecție al
atributelor și pragurilor este numărul de erori rezultat:
m
ht argmin j Dt (i ) yi h j ( xi )
h j H i 1
69
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Agregarea în stivă
70
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
13. Generalizarea
71
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Leave one out: n – 1 instanțe sunt folosite pentru antrenare, iar a
n-a pentru testare. Procesul se repetă de n ori. Este o formă de
validare încrucișată pentru situațiile în care există puține date.
72
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
14. Selecția trăsăturilor
k
G (vi ) 1 p 2j
j 1
k
E (vi ) p j log 2 p j
j 1
r
ni
G G (vi )
i 1 n
r
n
E i E (vi )
i 1 n
73
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Pentru atribute numerice, se poate utiliza scorul Fisher, care
măsoară raportul dintre separarea medie inter-clasă și separarea medie intra-
clasă:
k
p
j 1
j ( j )2
F k
p
j 1
j 2j
74
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Metode de acoperire (wrapper)
75
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
15. Regresia liniară, logistică, softmax
min 1 yi w xi b 0
w, b
i
76
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
generalizeze cât mai bine. De cele mai multe ori, pentru termenul de
regularizare se folosește norma euclidiană:
R( w, b) w wd2
2
0/1 l ( y, yˆ ) 1y yˆ 0
Hinge l ( y, yˆ ) max( 0, 1 y yˆ )
Logistică l ( y, yˆ ) log 2 1 exp( y yˆ )
Exponențială l ( y, yˆ ) exp( y yˆ )
Pătratică l ( y, yˆ ) ( y yˆ ) 2
unde yˆ w x b .
De exemplu, Decision stump folosește funcția de cost 0/1,
perceptronul multistrat folosește funcția de cost pătratică, iar Adaboost
folosește funcția de cost exponențială.
O problemă de regresie liniară se poate rezolva cu metoda
gradientului descendent. Funcția obiectiv este:
J ( w)
1 n
w1 w2 xi yi 2 w 2
2 i 1 2
cu:
2
w w12 w22
77
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Gradienții celor doi parametri w1 și w2 ai modelului sunt:
J ( w) n n
g1 yˆ i yi w1 ei w1
w1 i 1 i 1
J ( w) n n
g2 yˆ i yi xi w2 ei xi w2
w2 i 1 i 1
wi wi gi
ˆ XW
Y
W XT X XT Y
1
Adăugând regularizarea:
W XT X I D XT Y
1
78
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Regresia logistică
1
P( yi 1 | xi , w) T
wT xi pi
1 exp( w xi )
P( yi 0 | xi , w) 1 P( yi 1 | xi , w) 1 wT xi 1 pi
J (w ) n
xij pi yi
w j i 1
3. Regresia softmax
79
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Funcția indică probabilitățile ca o instanță să aparțină fiecărei clase.
Funcția obiectiv este:
n k T
1 exp( w j x i )
J ( w ) 1 yi j log k
n i 1 j 1
l 1
exp( w Tl x i )
iar gradienții:
J ( w) 1 n
x i 1 yi j P yi j | x i , w
w j n i 1
n k
2
w
i 0 j 1
2
ij
wj
80
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
4. Metrici de eroare
81
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
4.2. Matricea de confuzii
82
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
16. Rețele neuronale
1. Perceptronul standard
n
y f wi xi
i 1
1 dacă a 0
f (a )
1 dacă a 0
0 dacă a 0
f (a )
1 dacă a 0
83
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
n
w x
i 1
i i 0
n 1
y f wi xi
i 1
Δw = α ∙ x ∙ e
unde Δw este corecția ponderii, α este rata de învățare, x este intrarea, iar e
este eroarea (yd – y).
Perceptronul standard (cu un singur strat) poate învăța tot ce poate
reprezenta, dar nu poate reprezenta multe funcții. Mai ales, nu poate
reprezenta funcții neseparabile liniar, de exemplu, XOR.
2. Adaline
n 1
y wi xi
i 1
1
Ei ydi yi 2
2
84
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Antrenarea presupune minimizarea erorii în raport cu ponderile.
Regula de ajustare a ponderilor este aceeași ca la perceptron.
În cazul unei funcții de activare f neliniare, dar derivabile, regula
delta este:
Ei
xij y di yi f ' ( yi )
w j
de unde se deduce:
w j xij ei f ' ( yi )
3. Perceptronul multi-strat
85
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Proprietatea de aproximare universală. O rețea neuronală cu un
singur strat ascuns, cu un număr posibil infinit de neuroni, poate aproxima
orice funcție reală continuă.
Din punct de vedere practic, un strat nu poate avea un număr infinit
de neuroni. Un strat suplimentar poate reduce foarte mult numărul de
neuroni necesari în straturile ascunse.
1
f ( x)
1 ex
1 e 2 x
f ( x)
1 e 2 x
86
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
4. Algoritmul de retro-propagare (backpropagation)
w jk y j yk 1 yk ek
wij xi y j 1 y j k w jk
k
87
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
17. Mașini cu vectori suport
h(x) = g(wTx + b)
1 dacă z 0
g( z)
1 dacă z 0
88
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Maximizarea marginii se poate face rezolvând o problemă de
optimizare numită problemă primară:
1 2
min w
w ,b 2
astfel încât:
yi wT x i b 1, i 1, ..., m
echivalent cu:
gi yi wT x i b 1 0, i 1, ..., m
m
1 m m
max i yi y ji j x i , x j
α
i 1 2 i 1 j 1
astfel încât:
i 0, i 1, ..., m
m
y
i 1
i i 0
89
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Rezolvând problema duală, se determină αi , iar apoi se calculează w
și b:
m
w i y i x i
i 1
1
b y s t y t x s , x t
S sS tS
unde S este mulțimea vectorilor suport, iar |S| este numărul lor.
90
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Cantitatea necesară pentru clasificare este:
T
m m
w x i y i x i x b i y i x i , x b
T
i 1 i 1
m
f (x) i yi K x i , x b
i 1
91
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Nucleul sigmoid (este funcția de activare de la perceptronul
multi-strat, dar uneori nu este valid conform teoremei lui
Mercer): K (x, z) tanh( xT z r ) .
3. Margini flexibile
1 m
min w C i
2
w ,b 2
i 1
astfel încât:
yi wT x i b 1 i
i 0
92
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
C controlează compromisul dintre a permite erori pe mulțimea de
antrenare și a forța margini stricte. Creșterea valorii lui C mărește costul
clasificării greșite a instanțelor și determină crearea unui model mai precis,
dar care poate să nu generalizeze bine. Dacă C este mare, marginea de
separare va fi mai mică. Dacă C este mic, marginea de separare va fi mai
mare.
Problema duală este:
m
1 m m
max i yi y ji j x i , x j
α
i 1 2 i 1 j 1
astfel încât:
0 i C
m
y
i 1
i i 0
93
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
C argmax f (x)
i1..k
94
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
18. Rețele neuronale profunde
Rețele clasice:
o 1-2 straturi;
o Funcții de activare sigmoide;
o Funcții de cost bazate pe MSE;
o Algoritmi de antrenare: backpropagation, RProp, Levenberg-
Marquardt etc.;
Rețele profunde:
o Mai multe straturi;
o Funcții de activare mai simple: ReLU;
o Funcții de cost bazate pe MLE;
o Algoritmi de antrenare: SGD, RMSProp, Adam etc.;
o Alte metode de inițializare a ponderilor, regularizare, pre-
antrenare.
95
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
1.1. Funcții de activare
f ( x) max( 0, x)
df 0 dacă x 0
dx 1 dacă x 0
Leaky ReLU
x dacă x 0
f ( x)
0.01x altfel
96
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Parametric ReLU (PReLU), unde parametrul a poate fi învățat:
x dacă x 0
f ( x)
ax altfel
97
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
are ca efect atenuarea oscilațiilor și permite mărirea ratei de învățare,
ceea ce accelerează învățarea;
Adam (Adaptive Moment) : Poate fi văzut ca o combinație între metoda
momentului și algoritmul RMSProp.
2
Wi ~ N 0,
ni ni 1
6 6
Wi ~ U ,
ni ni 1 ni ni 1
2
Wi ~ N 0,
(1 a 2 ) ni
98
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
1.5. Dropout
2. Autoencodere
99
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
De multe ori, se folosesc autoencodere subcomplete
(undercomplete), unde |h| < |x|. Stratul ascuns este o versiune comprimată a
intrării. Autoencoderele reprezintă astfel o metodă de reducere a
dimensionalității problemei, ceea ce ajută învățarea întrucât majoritatea
modelelor de învățare presupun reținerea trăsăturilor esențiale ale datelor.
100
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Variational Autoencoder(VAE) este un model în care se determină o
distribuție parametrică, de obicei de tip gaussian, care aproximează datele de
intrare. Avantajul este că pot fi eșantionate noi exemple din această
distribuție, generând astfel date noi, din distribuția datelor de intrare. De
exemplu, dacă VAE se antrenează cu fețe de persoane, eșantionând
distribuția ascunsă (codul), se pot genera („inventa”) fețe noi, care nu
aparțin unor persoane reale din mulțimea de antrenare (fig. Shiffman, 2016).
101
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
19. Modele bazate pe energie
1. Modelul Ising
E s J ij si s j M H i si
(i, j ) i
unde (i, j) reprezintă perechile de atomi vecini, Jij este puterea interacțiunii
vecinilor (i, j ), Hi este un câmp magnetic extern, M este momentul magnetic
și T este temperatura.
Probabilitatea unei stări este:
e E ( s ) /( k B T )
PT ( s )
Z
cu Z un factor de normalizare:
Z e E ( s ) /( k B T )
s
102
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
O temperatură mică determină un comportament feromagnetic
(sistemul este magnetizat). O temperatură mare determină un comportament
paramagnetic (sistemul nu este magnetizat).
2. Rețele Hopfield
103
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Rețeaua Hopfield este o memorie auto-asociativă: își poate aminti
modelele stocate, își poate aminti un model dacă primește doar o parte din el
și își poate aminti modelele dacă primește versiuni similare, dar nu identice,
sau versiuni afectate de zgomot.
Rețeaua Hopfield folosește neuroni cu funcție de activare semn:
1 dacă X t 0
Y t 1 1 dacă X t 0
Y t dacă X t 0
M
W Ym YmT M I
m 1
Y sgn W X
104
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2.2. Procesul de optimizare
1
E (x ) x w x T θ x T
2
1 n n n
E (x) ij i j
2 i 1 j 1
w x x
i 1
i xi
2
n
n
E1 xij 1
j 1 i 1
2
n n
E2 xij 1
i 1 j 1
105
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Ponderile conexiunilor între neuronii de pe aceeași linie sau coloană
sunt –2. Celelalte ponderi sunt 0. Un neuron „aprins” pe o linie sau coloană
îi inhibă pe ceilalți. Toate pragurile sunt –1. Dacă niciun alt neuron nu este
aprins pe linie sau coloană, se aprinde neuronul curent.
Se pornește cu un vector de intrare x generat aleatoriu, cu elemente
de 0 și 1 (în loc de –1 și 1; așa este definită aici problema). Se actualizează
în mod repetat starea rețelei (sau până când aceasta nu se mai modifică).
Pentru a asigura stabilitatea, neuronii trebuie activați secvențial și în ordine
aleatorie.
Problema are mai multe soluții. Rețeaua converge la o soluție, care
poate fi diferită la fiecare rulare. De exemplu:
0 0 0 1
1 0 0 0
Y
0 1 0 0
0 0 1 0
106
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Mașini Boltzmann
107
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Fie următoarele notații: stratul vizibil: vi 0, 1 , stratul ascuns:
N
E ( v, h) vT w h aT v bT h
1 E ( v ,h )
P ( v, h ) e
Z
Z e E ( v,h)
v h
108
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Pornind de la aceste relații, se deduc probabilitățile de activare ale
neuronilor, bazate pe funcția sigmoidă:
b
1
P( h j 1 | v ) w j , v
1 exp b j w j , v
j
P(vi 1 | h) ai w i , h
wij vi h j
data
vi h j
model
unde 〈x〉d este valoarea așteptată a lui x după distribuția d, iar ε este rata de
învățare.
Primul termen, cu distribuția data, este ușor de obținut:
P(h j 1 | v ) b j vi wij
i
P(vi 1 | h) ai h j wij
j
109
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Putem distinge două faze în procesul de învățare:
110
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
RBM-urilor antrenate anterior rămân fixe. Ponderile se ajustează strat cu
strat prin învățare nesupervizată. Dacă scopul final este clasificarea, se
antrenează un clasificator clasic pe nivelul cel mai de sus, prin învățare
supervizată. În final, toate ponderile sunt rafinate (fine tuned) cu algoritmul
backpropagation.
111
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
20. Vectori de cuvinte (word embeddings)
1. Modelul word2vec
112
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Stratul de intrare primește vectori one-hot, stratul ascuns are funcții
liniare, iar stratul de ieșire este de tip softmax. Funcția obiectiv presupune
maximizarea probabilității tuturor cuvintelor de context, dat fiind cuvântul
central corespunzător. Între vectorii de cuvinte se realizează produsul scalar,
care este o măsură de similaritate.
114
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
21. Algoritmi de grupare (clustering)
2
C (i ) argmin xi c j
j
1
cj
nj
x
i: xi C j
i
Se repetă cei doi pași până când nu se mai modifică poziția niciunui
centru.
115
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Algoritmul converge, dar găsește de obicei un minim local al
funcției de eroare. În general, se recomandă mai multe rulări și alegerea
rezultatului celui mai potrivit. Algoritmul dă rezultate bune dacă grupurile
sunt convexe și mai ales de formă aproximativ sferică.
Valoarea optimă a lui k nu se cunoaște apriori. De obicei, se încearcă
mai multe valori pentru numărul de grupuri k și se alege valoarea care dă
cele mai bune rezultate. O metodă automată de alegere a lui k este metoda
cotului (elbow method). Se alege valoarea lui k pentru care funcția de eroare
nu mai scade prea mult odată cu creșterea lui k.
În funcție de alegerea centrelor inițiale, rezultatele finale pot diferi
mult. O măsură a calității grupării este coeficientul de siluetă. Scopul său
este maximizarea similarității intra-grup și minimizarea similarității inter-
grup.
116
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Pentru o instanță, se calculează: ai (distanța medie față de instanțele
din același grup) și bi (distanța minimă față de orice instanță din orice alt
grup). Coeficientul de siluetă al instanței i este:
2. Algoritmul EM (Expectation-Maximization)
1 1
exp x μ Σ 1 x μ
T
f (x | μ, Σ)
2 n/2
Σ
1/ 2
2
1 1 x 2
f ( x | , ) exp
2
2
2
117
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Centrele (cu mediile și matricea de covarianță / deviațiile standard)
se inițializează în mod aleatoriu.
P (C j ) P ( x i | C j )
P (C j | x i )
P (C
k
k ) P ( xi | C k )
1 n
P(C j ) PC j | xi
n i 1
PC | x x j i i
j i
PC | x
i
j i
PC j
| xi xi j xi j T
j i
PC
i
j | xi
L ln P(C j ) P xi | C j
i j
118
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Gruparea ierarhică
119
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Pentru gruparea aglomerativă, la un moment dat trebuie determinate
două grupuri care vor fi combinate. Acest lucru se face prin minimizarea
unui anumit criteriu. Există mai multe criterii, dintre care menționăm:
D(C1 , C2 ) min D( x1 , x2 )
x1C1
x2 C2
D(C1 , C2 ) max D( x1 , x2 )
x1C1
x2 C2
1 1
D(C1 , C2 )
n1 n2
D( x , x )
x1 C1 x 2 C 2
1 2
120
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Deciziile de combinare sunt critice deoarece procesul este greedy –
nu permite revizuirea unor decizii deja luate. Gruparea aglomerativă nu
scalează bine, deoarece presupune analiza unui număr mare de instanțe sau
grupuri.
4. Algoritmul DBSCAN
121
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Dbscan(d, eps, minPts):
for each unvisited point p in dataset d
mark p as visited
neighborhood = Region(p, eps)
if count(neighborhood) < minPts
ignore p
else
c = new cluster
ExpandCluster(p, neighborhood, c, eps, minPts)
122
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
123
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
22. Rețele cu auto-organizare
1. Învățarea hebbiană
wij x j yi
unde α este rata de învățare, iar funcțiile de activare sunt de obicei liniare.
Pentru intrări multiple:
D
y wi xi
i 1
y wT x x T w
124
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Regula lui Oja este o formulă care aproximează această normalizare:
w y (x y w)
i
wij yi x j wkj y k
k 1
2. Algoritmul Kohonen
125
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Neuronii (în spațiul de ieșire) sunt dispuși într-o structură regulată:
matrice (2D) sau vector (1D). Ponderile fiecărui neuron sunt inițializate
aleatoriu. Ponderile au aceeași dimensionalitate ca datele de intrare. Fiecare
neuron poate fi reprezentat ca un punct în spațiul n-dimensional al intrărilor,
în funcție de valorile ponderilor sale.
Pentru fiecare vector de intrare, se determină în spațiul de intrare cel
mai apropiat neuron, conform ponderilor acestuia:
i * argmin x w i
i
x w j j i*
w j
0 j i*
126
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Cele mai importante proprietăți ale algoritmului Kohonen sunt:
127
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
23. Învățarea cu întărire
1. Noțiuni generale
128
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
(S, A, R): Stare, Acțiune, Recompensă. Acțiunile afectează de obicei și
recompensele ulterioare, nu numai pe cele imediate: au un efect întârziat.
129
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Fiecare politică generează secvențe multiple de stări, datorită
incertitudinii tranzițiilor T(s, a, s' ). Utilitatea (sau valoarea) unei politici π
este valoarea așteptată a sumei tuturor recompenselor actualizate observate
după toate secvențele posibile de stări:
Ecuația Bellman:
Utilitatea unei stări este recompensa imediată pentru acea stare plus
utilitatea așteptată maximă a stării următoare.
Politica optimă alege acțiunea care conduce în starea cu cea mai
mare utilitate așteptată:
130
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Exemplu (Russell & Norvig, 2002):
Sunt n stări posibile, n ecuații Bellman, una pentru fiecare stare, prin
urmare trebuie rezolvat un sistem de n ecuații cu n necunoscute: U(s). Nu se
poate rezolva ca sistem de ecuații liniare din cauza funcției max. Se rezolvă
iterativ:
131
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2.2. Iterarea politicilor (policy iteration)
Dacă o acțiune este în mod evident mai bună decât toate celelalte, nu
avem nevoie de valorile exacte ale utilităților.
Algoritmul alternează doi pași:
132
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Aceasta este acțiunea optimă ai*(s). Dacă ai*(s) ≠ πi(s), se
actualizează politica: πi+1(s) ← ai*(s).
În acest mod, se pot actualiza doar părțile „promițătoare” ale
spațiului de căutare.
Pseudocod (Russell & Norvig, 2002):
3. Învățarea cu întărire
Comparație:
133
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Tipuri de învățare cu întărire:
134
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3.1.1. Estimarea directă a utilității
De exemplu:
135
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Trebuie estimate T(s, π(s), s' ) și R(s) din încercări, adică frecvențele
tranzițiilor și mediile recompenselor. Probabilitățile și recompensele
învățate se introduc în ecuațiile Bellman și se rezolvă sistemul de ecuații
liniare cu necunoscutele Uπ(s).
Pseudocod (Russell & Norvig, 2002):
136
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
După prima încercare: U(1,3) = 0,84, U(2,3) = 0,92. Fie tranziția
(1,3) → (2,3) în a doua încercare. Între cele două stări, constrângerea dată
de ecuația Bellman impune ca U(1,3) = –0,04 + U(2,3) = 0,88 (cu γ = 1).
Estimarea U(1,3) = 0,84 este mai mică și trebuie mărită puțin.
(n) ,
n 1 n 1
2
(n)
137
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3.2. Învățarea activă
138
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Agentul trebuie să favorizeze:
U ( s) max Q( s, a )
a
Q( s, a ) Q( s, a ) R( s) max Q( s' , a' ) Q( s, a )
a'
139
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Actualizările se fac de fiecare dată când acțiunea a aplicată în s duce
în s'. Rata de învățare α determină viteza de actualizare a estimărilor. De
obicei, α (0, 1).
Pseudocod (Russell & Norvig, 2002):
140
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
24. Învățarea cu întărire profundă
141
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
1. Studii de caz
1.1. TD-Gammon
142
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Ieșirile sunt valorile Q ale tuturor acțiunilor posibile.
Algoritmul DQN utilizează o serie de metode pentru optimizarea
antrenării:
143
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
1.3. AlphaGo
Programul AlphaGo a fost primul care a învins unul din cei mai buni
jucători de go din lume. AlphaGo Zero este o variantă ulterioară, cu
performanțe superioare.
AlphaGo Zero nu se bazează pe trăsături ale jocului identificate
manual sau prin învățare din jocuri umane. Se folosesc doar regulile jocului,
de aici partea de “Zero” a numelui. Antrenarea se face exclusiv prin self-
play. A descoperit variante noi ale strategiilor clasice de joc.
Intrările rețelei sunt reprezentate de o stivă de imagini 19 x 19 x 17.
Pentru fiecare poziție de pe tabla de joc există 17 trăsături binare: primele 8
indică dacă poziția este ocupată de AlphaGo în starea curentă, respectiv 7
stări anterioare. Următoarele 8 indică același lucru pentru adversar. Ultima
indică mutarea curentă: 1 pentru negru, 0 pentru alb.
AlphaGo Zero combină modelele neuronale cu Monte Carlo Tree
Search (MCTS), o metodă stohastică de căutare a soluțiilor în jocuri cu
factori mari de ramificare. Folosește o rețea cu două capete, care
aproximează politicile (probabilitățile de selecție ale acțiunilor), respectiv
valorile. Rețeaua este de tip rezidual (residual neural network, ResNet).
144
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Pentru o configurație de joc dată, rețeaua neuronală calculează atât
probabilitățile mutărilor P, cât și probabilitatea de a câștiga V. Se rulează
MCTS pentru a rafina probabilitățile de mutare P’ și câștig V’. Se
actualizează parametrii rețelei pentru a apropia P și V de P’ și V’. Procesul
seamănă cu algoritmul de iterare a politicilor: self-play cu MCTS reprezintă
evaluarea politicilor, iar actualizarea rețelei reprezintă îmbunătățirea
politicilor. Pentru MCTS, capătul de politică ajută la scăderea lățimii de
căutare dintr-un nod (preferând acțiunile mai promițătoare), iar capătul de
valoare ajută la scăderea adâncimii de căutare în nodurile frunză (fig. Silver
et al., 2017).
145
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
25. Agenți și sisteme multi-agent
146
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Diferența principală dintre agenți și obiectele din programarea
orientată pe obiecte este gradul de autonomie. În obiecte, metodele sunt
apelate direct, iar fluxul de control se mută direct în metodă. Decizia de
execuție este la sursă (obiectul care apelează). Agenții primesc solicitări de a
îndeplini acțiuni, dar un agent poate refuza o solicitare. Decizia de execuție
este la destinație (agentul care primește cererea).
147
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
26. Complexitate și emergență
1. Automate celulare
148
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Clasa IV: include toate comportamentele anterioare (sunt numite
„reguli complexe”).
Regula 110 este Turing completă, adică orice calcul sau program
poate fi simulat folosind acest automat. Orice secvență de biți se poate
regăsi pe o linie dacă dimensiunea liniei și numărul de expandări sunt
suficient de mari.
149
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Sisteme Lindenmeyer
+ rotește dreapta
Axiomă: B
– rotește stânga
Regula 1: B → F[–B]+B
[ salvează poziția și unghiul
Regula 2: F → FF
] reface poziția și unghiul
3. Inteligența colectivă
150
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Modelul Boids: simulează comportamentul unui stol de păsări, pe
baza a trei reguli simple: apropierea de centrul de greutate al
vecinilor, evitarea coliziunilor cu vecinii și potrivirea vitezei cu
aceea a vecinilor;
Modelarea traficului auto: paradoxul lui Braess. Adăugarea de noi
artere de circulație nu îmbunătățește întotdeauna traficul. Invers,
închiderea unor artere îl poate îmbunătăți.
151
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
27. Arhitecturi de agenți
Deliberative:
o Bazate pe raționamentul deductiv;
o Bazate pe raționamentul practic;
Reactive;
Hibride.
1. Arhitecturi logice
152
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Arhitectura BDI
153
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Arhitecturi reactive
4. Arhitecturi hibride
Tipuri de stratificare:
154
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Stratificarea verticală: Percepțiile și acțiunile sunt tratate de un
singur strat. Prezintă similarități cu modul în care funcționează
organizațiile: informațiile se trimit spre nivelurile superioare, iar
deciziile de execuție se trimit spre nivelurile inferioare. Este mai
puțin tolerantă la defecte: defectele dintr-un strat pot afecta întregul
comportament al agentului.
155
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
28. Comunicarea inter-agent
156
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Acte ilocuționare (illocutionary acts): enunțuri care exprimă intenția
de a interacționa. De exemplu, actul de a informa clienții despre
închiderea barului;
Acte perlocuționare (perlocutionary acts): enunțuri care exprimă
intenția de a provoca un anumit răspuns comportamental la
ascultător. De exemplu, actul de a determina clienții să își termine
băuturile.
(inform
:sender agent1
:receiver agent2
:content (price good2 150)
:language sl
:ontology hp1-auction)
157
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
proprietăților dintr-un domeniu și implicit comunicării de informații între
agenți.
Exemple de informații în limbajul KIF:
158
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
29. Algoritmi de căutare a căilor pentru
sisteme multi-agent
159
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
numite noduri SAU, și noduri care reprezintă efectele posibile ale unei
acțiuni, adică stările care pot rezulta din aplicarea unei acțiuni într-o stare,
numite noduri ȘI (fig. Russell & Norvig, 2002).
160
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Când nedeterminismul poate determina ca o acțiune câteodată să nu
aibă niciun efect, există soluții ciclice, de exemplu [while State = 5 do
Right].
161
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2.2. Căutarea cu observații limitate
162
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Căutarea online
163
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3.2. Algoritmul RTA*
Deși h trebuie să fie mai mică decât distanța reală, cu cât h este mai
mare, cu atât algoritmul găsește mai repede soluția. Dacă h(i) > h*(i),
algoritmul poate să nu găsească soluția optimă. RTA* încearcă să mărească
artificial h prin utilizarea funcției secondmin în loc de min. Algoritmul
RTA* este, de asemenea, complet.
Pseudocod (Weiss, 2000):
164
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
de la un nod de start la un nod scop. Deoarece folosește informații de
la căutarea anterioară, numărul de noduri examinate este mult mai
mic decât dacă ar fi aplicat din nou, de la zero, algoritmul A*;
D* lite: aplică LPA* pentru a găsi calea cea mai scurtă către un nod
scop în situația în care agentul se mișcă pe o traiectorie într-un graf
care se modifică. Prin urmare, diferența față de LPA* este că nodul
de start se modifică și el. Acești doi algoritmi sunt eficienți când
schimbările din graf au loc în vecinătarea agentului. Dacă
schimbările au loc lângă nodul scop, o căutare A* de la zero poate fi
mai eficientă;
Field D*: este o variantă a D* lite în care mișcarea nu este constrânsă
de un grid. Unghiurile de deplasare au valori reale, într-un domeniu
continuu. Este util pentru a genera traiectorii netede pentru roboți
mobili. Roverele NASA de pe Marte folosesc acest algoritm.
165
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
30. Teoria jocurilor
Deținutul 2
Neagă Mărturisește
Neagă –1, –1 –5, 0
Deținutul 1
Mărturisește 0, –5 –3, –3
1. Dominanța
166
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2. Jocuri de sumă nulă cu doi agenți
2 1
1 2
167
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3 3
4 2
R1 : 3x 3 1 x 6 x 3
R2 : 4 x 2 1 x 2 6 x
1 / 2
E PR y, 1 y 1 / 2
1 / 2
168
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Un joc (2 x n) poate fi transpus, rezultând un joc (n x 2), care se
rezolvă cu metoda anterioară.
169
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3.1. Calculul echilibrelor Nash pure
Deținutul 2
Neagă Mărturisește
Neagă –1, –1 –5, 0 }
Deținutul 1
Mărturisește { 0, –5 { –3, –3 }
Cerșetorul
Muncește Nu muncește
Ajută 3, 2 –1, 3
Guvernul
Nu ajută –1, 1 0, 0
3 · x + (–1) · (1 – x) = (–1) · x + 0 · (1 – x)
⇒ x = 0,2, 1 – x = 0,8
2 · y + 1 · (1 – y) = 3 · y + 0 · (1 – y)
⇒ y = 0,5, 1 – y = 0,5
170
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Un rezultat este optim Pareto dacă este mai bun sau la fel decât orice
alt rezultat din toate punctele de vedere și mai bun strict din cel puțin un
punct de vedere. Optimalitatea Pareto înseamnă o situație mai bună pentru
cel puțin un agent fără a dezavantaja niciun alt agent.
Într-o stare optimă Pareto, agenții nu au motivația de a devia în
coaliție. În cazul dilemei deținutului, ambii agenți au un câștig mai mare
împreună dacă ambii neagă.
Deținutul 2
Neagă Mărturisește
Neagă –1, –1 –5, 0
Deținutul 1
Mărturisește 0, –5 –3, –3
Peugeot
F M
F –10, –40 40, 10
Renault
M 10, 40 –40, –10
50 50
RP
50 50
171
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Matricea amenințărilor (threat matrix) este utilizată pentru descrierea
puterii de negociere a agenților:
30 30
RP
30 30
5.1. Nucleul
O alocare (imputation) este mulțimea de câștiguri (x1, x2, ..., xn) care
satisface următoarele condiții: suma câștigurilor este maximul posibil, iar
fiecare agent obține un câștig cel puțin la fel de bun ca acela obținut dacă nu
ar coopera.
Nucleul (core) unui joc cu n agenți este mulțimea alocărilor
nedominate. Nucleul unui joc cu funcția caracteristică v este mulțimea
tuturor alocărilor x = (x1, x2, ..., xn) astfel încât, pentru orice coaliție
S = {Pi1, Pi2,…, Pim}, avem: xi1 + xi2 + … + xim ≥ v(S).
Orice alocare din nucleu poate fi privită ca o soluție a jocului.
Nucleul este stabil.
Dacă o alocare nu se află în nucleu, atunci există cel puțin o coaliție
ai cărei membri nu obțin câștigul maxim pe care l-ar putea obține altfel.
Acești agenți preferă o altă alocare.
Exemplu: 3 studenți doresc să cumpere o carte, care costă 110 unități
monetare. Pentru 2 cărți sau 3 cărți cumpărate împreună, există o reducere
de 10, respectiv 20 unități / exemplar. Valorile coalițiilor exprimă banii
economisiți. Această reprezentare a jocului se numește formă caracteristică.
172
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
v({P1 )} v({P2 )} v({P3 )} 0
v({P1 , P2 )} v({P1 , P3 )} v({P2 , P3 )} 20
v({P1 , P2 , P3 )} 60
1
( A, i ) v B( , i ) i v B( , i )
A! A
1 1
(1) v(1) v() v(2, 1) v(2) (1 0 6 3) 2
2 2
1 1
(2) v(1, 2) v(1) v(2) v() (6 1 3 0) 4
2 2
173
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Valoarea Shapley există întotdeauna, este unică și este întotdeauna
fezabilă (suma câștigurilor agenților este maximă). Poate să nu aparțină
nucleului, chiar dacă jocul are nucleu; în acest caz, este instabilă.
Nucleul unui joc convex este întotdeauna nevid, iar valoarea Shapley
aparține nucleului și este în centrul său de greutate.
5.3. Nucleolus
eS (x) v( S ) xi
iS
6. Jocuri secvențiale
Într-un joc secvențial, jucătorii decid unul după altul, cu sau fără
informații complete despre deciziile celorlalți.
Aceste jocuri se reprezintă în formă extinsă, adică succesiunea de
decizii se reprezintă ca un arbore, în care ramurile exprimă deciziile, iar
frunzele exprimă câștigurile corespunzătoare combinațiilor de decizii care
au condus acolo.
174
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Pentru un astfel de arbore, strategiile jucătorilor sunt combinațiile
care stabilesc în mod unic o stare finală în arbore. Fie următorul exemplu,
un joc secvențial de sumă nulă (Straffin, 1993).
Colin are 13 strategii pure: AJM, AKM, ALM, BNP, BOP, CQS,
CQT, CQU, CQV, CRS, CRT, CRU și CRV. CRS înseamnă că agentul Colin
alege mai întâi C, iar dacă Rose alege H sau I, atunci Colin alege R sau S,
respectiv.
Rose are 8 strategii pure: DFH, DFI, DGH, DGI, EFH, EFI, EGH și
EGI. EFH înseamnă că Rose alege E, F sau H dacă agentul Colin alege A, B
sau C, respectiv.
175
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Fie următorul joc (Straffin, 1993):
176
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Procesul se repetă pentru jucătorul care decide pe penultimul nivel și așa
mai departe până în rădăcină.
177
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
După reducerea arborelui făcută de Colin, arborele devine (fig.
Straffin, 1993):
H T
l –1 2
r 2 –1
178
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
31. Protocoale pentru licitații
Mai există licitații în care toți participanții plătesc, dar doar unul
câștigă (all-pay): de exemplu, în competiții în care toți fac un efort, dar există
doar un singur câștigător în final. Pentru licitarea unui bun cu valoarea 1,
strategia de echilibru pentru n participanți este de a licita 1 / n.
180
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Licitații combinatorice
181
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
32. Protocoale de votare
182
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
punct. Există și varianta atribuirii de la n-1 la 0 puncte. Punctele se
sumează pentru toți agenții. Alternativa cu cele mai multe puncte
este câștigătoare. Poate conduce la paradoxul inversării (reversal
paradox): eliminarea alternativei celei mai puțin dorite poate conduce
la schimbarea câștigătorului.
1
https://en.wikipedia.org/wiki/Schulze_method
183
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
1. Să fie complet (să ordoneze toate alternativele);
2. Să fie tranzitiv;
3. Din două alternative A și B, dacă toți votanții preferă pe A lui B, în
rezultatul votului A să fie deasupra lui B;
4. Ordonarea să se bazeze exclusiv pe preferințele votanților
individuali;
5. Să nu fie dictatorial (rezultatul să nu fie determinat de preferințele
unui singur agent);
6. Să fie independent de alternativele irelevante (schimbările din lista
de alternative, adică adăugarea sau eliminarea unor candidați să nu
modifice ordonarea celorlalți candidați neafectați de schimbări).
Votul cu un singur tur (plurality voting): Dacă A este mai bine cotat
decât B, B introduce un nou candidat C, care să ia voturi de la A;
Votarea în perechi (procedura de amendare): Există 3 alternative: A,
B, C. Se votează A vs. B, apoi câștigătorul vs. C. Gruparea
alternativelor din prima rundă de vot favorizează votul strategic și
poate schimba rezultatul final (paradoxul agendei).
184
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
adaugă un pas suplimentar înainte de aplicarea unui protocol standard de
votare P. Candidații sunt mai întâi grupați aleatoriu în perechi. Se fac alegeri
în perechi și cine pierde este eliminat. Candidații rămași intră în procesul de
votare definit de protocolul P.
185
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
33. Protocoale de negociere
186
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
argmax ui ( ' ) , E { | i , j ui ( ) u j ( )}
'E i
argmax ui ( ' )
' i
argmax ui ( ' )
'
187
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
γ2 factorii de actualizare ai celor doi agenți. Dacă agentul 1 propune primul,
atunci soluția de echilibru pentru o unitate de utilitate (u1 + u2 = 1) este:
1 2 1 1 2
u1 , u2 ,
1 1 2 1 1 2
u1 , u2 1
,
1 1
u1
riski
u2
188
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
unde Δu1 este utilitatea pe care o pierde i dacă acceptă oferta lui j, iar Δu2
este utilitatea pe care o pierde i dacă nu acceptă și determină conflictul.
Dacă ui(δi) = 0, se consideră riski = 1. Valori mari ale riscului,
apropiate de 1, înseamnă că agentul are puțin de pierdut dacă nu se ajunge la
o înțelegere și prin urmare este dispus să riște eșecul negocierii. Valori mici
ale riscului, apropiate de 0, înseamnă că agentul are mai mult de pierdut
dacă se ajunge la conflict.
La fiecare pas, agentul cu risc mai mic face o concesie: cea mai mică
concesie care schimbă totuși balanța riscurilor.
Pseudocod (Vidal, 2007):
189
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
2.4. Protocolul cu un singur pas (one-step protocol)
190
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
34. Proiectarea mecanismelor
191
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
35. Protocolul rețelelor de contracte
(contract net protocol)
192
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Managerul (inițiatorul):
o Anunță că are un task care trebuie îndeplinit;
o Primește și evaluează oferte de la contractanții potențiali;
o Acordă contractul contractantului potrivit;
o Primește și sintetizează rezultatele;
Contractantul (participantul):
o Primește anunțurile de task-uri;
o Își evaluează capacitatea de a le îndeplini;
o Răspunde, adică acceptă sau refuză task-ul;
o Execută task-ul dacă oferta sa este acceptată de către
manager;
o Raportează rezultatele.
unde Tp sunt task-urile pe care p le are deja, iar cp(T) reprezintă costul lui p
pentru mulțimea de task-uri T.
În mod similar, un manager m alocă un task Tcontract din mulțimea sa
de task-uri Tm unui participant dacă îi plătește acestuia mai puțin decât suma
pe care o economisește el însuși pentru că nu execută Tcontract :
193
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Prețul de contractare poate fi la jumătate între cele două costuri
marginale.
Există mai multe tipuri de contracte:
194
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
36. Metode de coordonare
195
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Unele scopuri sunt necesare pentru realizarea altora, sau le pot
facilita. Realizarea scopurilor presupune și maximizarea sumei utilităților
agenților, prin urmare facilitarea are drept consecință creșterea acestei
utilități. Realizarea fiecărui scop este cuantificată de trei parametri: calitate,
cost și durată. Aceștia au valori probabilistice, de exemplu, pentru scopul G1
există o probabilitate de 20% să aibă calitatea 0 (să nu fie îndeplinit) și o
probabilitate de 80% să aibă calitatea 8. Pentru scopul G31, costul va fi de 10
unități cu probabilitatea de 100%.
Fiecare agent are doar o perspectivă locală asupra task-urilor care
trebuie executate. Prin interacțiuni directe, succesive, cu ceilalți agenți, un
agent află structura de task-uri ale acestora și își poate modifica propria
planificare pentru a le facilita execuția și prin urmare, pentru a crește
utilitatea întregului sistem.
196
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Formarea echipei: Agentul solicită sprijin și dacă are succes,
rezultatul este că un grup de alți agenți declară că vor să participe la
acțiunea comună. Echipa stabilește scopurile care trebuie atinse;
Formarea planului: Se creează planul comun de urmat, de exemplu,
prin negociere, în care se stabilesc mijloacele: succesiunea de acțiuni
din plan pentru fiecare agent din echipă;
Acțiunea echipei: Planul agreat este executat de către agenți.
197
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
37. Învățarea în sisteme multi-agent
1. Jocuri repetate
198
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
3. Dinamica replicatorilor (replicator dynamics)
199
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Un agent de nivel 2 consideră ca toți ceilalți agenți sunt de nivel 1 și
calculează modele ale modelelor acestora.
Un agent de nivel n consideră că toți ceilalți agenți sunt de nivel
n – 1 și îi modelează în consecință.
Costul computațional pentru creșterea nivelului cu unu este
exponențial. Totuși, diferența de utilitate obținută prin incrementarea
nivelului scade când nivelul este deja destul de mare.
200
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
Referințe
201
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
17. FIPA, Foundation for Intelligent Physical Agents (2002). Agent Communication
Language (ACL), http://www.fipa.org/repository/aclspecs.html.
18. Freund, Y., Schapire, R. E. (1997). A decision-theoretic generalization of on-line
learning and an application to boosting, Journal of Computer and System
Sciences, vol. 55, no. 1, pp. 119-139.
19. Fullér, R. (1995). Neural Fuzzy Systems, Åbo Akademi University,
http://users.abo.fi/rfuller/ln1.pdf
20. Goodfellow, I., Bengio, Y., Courville, A. (2016). Deep Learning, MIT Press.
21. Graupe, D. (2016). Deep Learning Neural Networks, Design and Case Studies,
World Scientific Publishing.
22. Han, J., Kamber, M., Pei, J. (2011). Data Mining: Concepts and Techniques, 3rd
Edition, Morgan Kaufmann.
23. Hanson, S. J., Remmele, W., Rivest, R. L. (1993). Machine Learning: From
Theory to Applications, Springer.
24. Hoffmann, J. (2001). FF: The Fast-Forward Planning System, AI Magazine, vol.
22, no. 3, pp. 57-62, http://www.cs.toronto.edu/~sheila/2542/w06/readings/
ffplan01.pdf
25. Hsu, W. H. (2001). Decision Trees, Occam’s Razor, and Overfitting,
http://www.kddresearch.org/Courses/Fall-2001/CIS732/Lectures/Lecture-05-
20010906.pdf
26. Jeffrey-Pennington, R., Manning, C. (2014). Glove: Global Vectors for Word
Representation, Conference on Empirical Methods in Natural Language
Processing.
27. Kameshwaran, S. (2002). Constraint Satisfaction Problems and Games,
http://purana.csa.iisc.ernet.in/~mbk/jammin/Talk4.ppt, 2002
28. Keogh, E., Heuristic Search, http://www.cs.ucr.edu/~eamonn/teaching/
cs170materials/Heuristic%20Search.ppt
29. Klir, G. J., Yuan, B. (1995). Fuzzy Sets and Fuzzy Logic: Theory and Applications,
Prentice Hall PTR.
30. Knapp, B. (2004). Fuzzy inference systems, https://www.cs.princeton.edu/courses/
archive/fall07/cos436/HIDDEN/Knapp/fuzzy004.htm.
31. Kohonen, T. (1995). Self-Organizing Maps, Springer Verlag, Berlin.
32. Kononenko, I. (1994). Estimation Attributes: Analysis and Extensions of RELIEF,
European Conference on Machine Learning, Catana, Italy, Springer-Verlag.
33. Kubalik, J. (2000). Machine Learning, http://cyber.felk.cvut.cz/gerstner/
HUT2000/ml/ml1.ppt
34. Kurfess, F. J., Artificial Intelligence, http://www.csc.calpoly.edu/~fkurfess/
Courses/CSC-480/F03/Slides/Games.ppt
35. Latombe, J.-C. (2007). Blind (Uninformed) Search, http://ai.stanford.edu/
~latombe/cs121/2007/slides/C-blind-search.ppt
202
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
36. Latombe, J.-C. (2007). Constraint Satisfaction Problems (CSP),
http://ai.stanford.edu/~latombe/cs121/2007/slides/G-const-sat.ppt
37. Latombe, J. C., Getoor, L. (2005). Reinforcement Learning,
http://www.cs.umbc.edu/courses/graduate/671/fall05/slides/c28_rl.ppt
38. Leon, F. (2006). Agenți inteligenți cu capacități cognitive, Tehnopress, Iași.
39. Leon, F. (2012). Inteligență artificială: raționament probabilistic, tehnici de
clasificare, Tehnopress, Iași.
40. Leon, F. (2014). Inteligență artificială: mașini cu vectori suport, Tehnopress, Iași.
41. Lin, F. O., ed. (2005). Designing Distributed Learning Environments with
Intelligent Software Agents, Information Science Publishing.
42. Luger, G. F. (2005). Artificial Intelligence, Structures and Strategies for Complex
Problem Solving, The Benjamin/Cummings Publishing Company, Inc., Redwood
City, California.
43. Marsland, S. (2015). Machine Learning, An Algorithmic Perspective, Second
Edition, CRC Press.
44. Matas, J., Sochman, J. (2017). AdaBoost, http://www.robots.ox.ac.uk/~az/lectures/
cv/adaboost_matas.pdf.
45. MathWorks (2010). Fuzzy Logic Toolbox – Function Reference,
http://www.mathworks.co. jp/access/helpdesk/help/toolbox/fuzzy/fp4856.html.
46. Mikolov, T., Chen, K., Corrado, G., Dean, J. (2013). Efficient Estimation of Word
Representations in Vector Space, https://arxiv.org/abs/1301.3781
47. Mitchell, T. M. (1997). Machine Learning, McGraw-Hill Science/Engineering/
Math.
48. Mnih, V., Kavukcuoglu, K., Silver, D., Graves, A., Antonoglou, I., Wierstra, D.,
Riedmiller, M. (2013). Playing Atari with Deep Reinforcement Learning, arXiv
preprint arXiv:1312.5602.
49. Mohammed, M., Khan, M. B., Bashier, E. B. M. (2016). Machine Learning,
Algorithms and Applications, CRC Press.
50. Morey, E. (2004). Game Theory, http://www.colorado.edu/economics/morey/
6808/game-lect.pdf
51. Müller, A. C., Guido, S. (2016). Introduction to Machine Learning with Python: A
Guide for Data Scientists, O'Reilly Media.
52. Murphy, K. P. (2012). Machine Learning, A Probabilistic Perspective, MIT Press.
53. Narayanan, S. (2007). A* Search, http://inst.eecs.berkeley.edu/~cs188/sp07/slides/
SP07%20cs188%20lecture%204%20--%20a-star%20search.ppt
54. Negnevitsky, M. (2004). Artificial Intelligence: A Guide to Intelligent Systems,
2nd Edition, Addison Wesley.
55. Ng, A. (2010). Autoencoders, http://ufldl.stanford.edu/tutorial/unsupervised/
Autoencoders/.
56. Nilsson, N. J. (2001). Introduction to Machine Learning, http://robotics.stanford.
edu/people/nilsson/mlbook.html.
203
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
57. Padgham, L., Winikoff, M. (2004). Developing Intelligent Agent Systems: A
Practical Guide, Wiley Series in Agent Technology, Wiley.
58. Peng, Y., Game Playing: Adversarial Search, http://www.csee.umbc.edu/~ypeng/
AI/471/lecture-notes/Ch06.ppt
59. Porter, J. (2016). Deep Learning: Fundamentals, Methods and Applications, Nova
Science.
60. Portnoy, M. (2006). Intro to Game Theory, http://www.cse.yorku.ca/~lan/
seminars/intro_to_game_theory_2006.ppt
61. Priddy, K. L., Keller, P. E. (2005). Artificial Neural Networks: An Introduction,
SPIE Publications.
62. Principe , J. (2010). Neural Networks for Signal Processing. Hebbian learning and
PCA, http://www.cnel.ufl.edu/courses/EEL6814/chapter6.pdf
63. Rasmusen, E. (2006). The Welfare Game, http://rasmusen.org/g601/overheads/
gi03- overheads.pdf
64. Russell, S. J., Norvig, P. (1998). Planning, AIMA Slides, https://people.eecs.
berkeley.edu/~russell/slides/chapter11.pdf.
65. Russell, S. J., Norvig, P. (2002). Artificial Intelligence: A Modern Approach,
Prentice Hall, 2nd Edition.
66. Schank, R. C., Abelson, R. (1977). Scripts, Plans, Goals, and Understanding,
Hillsdale, NJ, Earlbaum Assoc.
67. Setzer, V. W. (2001). Data, Information, Knowledge and Competency,
http://www.ime.usp. br/~vwsetzer/data-info.html.
68. Shiffman, M. (2016). Under the Hood of the Variational Autoencoder,
https://blog. fastforwardlabs.com/2016/08/22/under-the-hood-of-the-variational-
autoencoder-in.html.
69. Shkodyrev, V. P. (2009). Perceptron – Simplest Neural Network,
www.powershow.com/view/11df69-OWFlO/Lecture_6_Perceptron_Simplest_
Neural_Network.
70. Shoham, Y., Leyton-Brown, K. (2008). Multiagent Systems: Algorithmic, Game-
Theoretic, and Logical Foundations, Cambridge University Press.
71. Silver, D., Schrittwieser, J., Simonyan, K. et al. (2017). Mastering the game of Go
without human knowledge, Nature 550, 354–359, DOI: 10.1038/nature24270.
72. Singh, M. (2017). Word embedding, https://medium.com/data-science-group-
iitr/word-embedding-2d05d270b285.
73. Smith, J. R. (2001). Conjunctive normal form, http://vorpal.math.drexel.edu/
course/founds/proving/node1.html
74. Stahl, S. (1999). A Gentle Introduction to Game Theory, American Mathematical
Society.
75. Straffin, P. (1993). Game Theory And Strategy, American Mathematical Society.
76. Sutton, R. S., Barto, A. G. (2018). Reinforcement Learning: An Introduction, 2nd
Edition, MIT Press, Cambridge, MA.
204
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com
77. Tan, P.-N., Steinbach, M., Kumar, V. (2006). Introduction to Data Mining,
Addison-Wesley.
78. Van Dyke Parunak, H. (1997). "Go to the ant": Engineering principles from
natural multi-agent systems, Annals of Operations Research, vol. 75, pp 69-101.
79. Vidal, J. M. (2007). Fundamentals of Multiagent Systems, http://jmvidal.cse.sc.
edu/papers/mas.pdf
80. Walker, E., Heuristic, http://cs.hiram.edu/~walkerel/cs386/Heuristic.ppt.
81. Wang, X. (2016). Deep Learning in Object Recognition, Detection and
Segmentation, Now Publishers.
82. Weiss, G., ed. (2000). Multiagent Systems - A Modern Approach to Distributed
Artificial Intelligence, The MIT Press, Cambridge, Massachusetts.
83. Williams, B.C. (2012). Planning as Heuristic Forward Search, http://www.ai.mit.
edu/courses/16.412J/lectures/L6%20Planning%20as%20Heuristic%20Forward
%20Search_9.30.ppt
84. Witten, I. H., Frank, E. (2000). Data Mining: Practical machine learning tools
with Java implementations, Morgan Kaufmann, San Francisco.
85. Wooldridge, M. (2002). An Introduction to MultiAgent Systems, John Wiley &
Sons.
86. Zaharie, D. (2007). A Comparative Analysis of Crossover Variants in Differential
Evolution, Proceedings of the International Multiconference on Computer Science
and Information Technology, pp. 171-181, http://citeseerx.ist.psu.edu/viewdoc/
download?doi=10.1.1.215.7335&rep=rep1&type=pdf.
205
Florin Leon (2020). Sinteze de inteligenta artificiala, Tehnopress, Iasi, ISBN 978-606-687-429-8
http://florinleon.byethost24.com