Documente Academic
Documente Profesional
Documente Cultură
INVATAREA AUTOMATA
9.1 Principii de baza
In dezvoltarea programelor de invatare automata se pot distinge trei etape:
(1) etapa optimista in care se considera posibila realizarea sistemelor cu autoreglare
care s-ar putea modifica si adapta mediului (1960-1965) dar care a fost abandonata
datorita limitarilor teoretice si a capacitatii de calcul limitate, pina de curind cind
cercetarile legate de retelele neuronal au reluat aceaasta directie
(!) etapa desc"isa de teza lui #$ %inston (19&0) in care invatarea este vazuta ca un
proces comple' si dificil aceasta perspectiva a dus la studiul unor forme de invatare
mai simple si, pe de alta parte, la ideea ca un sistem de invatare automata trebuie sa
contina o cantitate semnificativa de cunostinte apriorice pentru a aa(unge la
performante
()) etapa a treia determinata de necesitatea de ac"izitie a cunostintelor in sisteme
e'pert$ *pre deosebire de etapele (1) si (!) care s-au concentrat numai pe invatarea
prin memorare si invatarea din e'emple, etapa ()) se ocupa si de invatarea prin
instruire directa si invatarea prin analogie$
*e pot identifica patru perspective asupra invatarii:
Invatarea este procesul prin care un sistem isi imbunatateste performantele (+erbert
*imon)$
Invatarea este ac"izitia cunostintelor e'plicite aceasta perspectiva porneste de la
necesitatea e'primarii e'plicite a cunostintelor invatate pentru a facilita verificarea,
modificarea si e'plicarea lor in sistem$
Invatarea este ac"izitiaa deprinderilor de rezolvare a problemelor (desi oamenii inteleg ce
trebuie sa faca cind li se e'plica cum trebuie sa faca ceva, nu a(ung imediat la operatii
eficiente)$
Invatarea este formare teoriilor, formarea ipotezelor si inferenta inductiva deci procesul
de invatare este privit din punct de vedere al stiintei$
9.2 Un odel al in!atarii
#lecind de la definitia lui *imon, se pote construi un model simplificat al procesului de
invaatare care permite si clasificareaa diverselor tipuri de invatare automata$ ,ediul ofera stimuli
sau informatie elementului de invatare (-I), elementul de invatare foloseste aceasta informatie
pentru a imbunatati cunostintele (e'plicite) din baza de cunostinte si elementul de prelucrare (-#)
foloseste baza de cunostinte pentru a rezolva problema$ In final, infomatia obtinuta in incercarea
de a rezolva problema poate servi caa .feedbac/. pentru elementul de invatare$ ,ediul, baza de
cunostinte si elementul de prelucrare determina natura problemei particulare de invatare si deci
functiile particulare pe care elementul de invatare trebuie sa le realizeze$
,ediu
(profesor)
-lement de
invatare
*timuli
(informatie)
0aza de
cunostinte
-lementul de
prelucrare
(actiune)
-valuator al
prelucrarilor
1eedbac/
informatie
prelucrare
"i#ura 9.1 Un odel $ipli%icat al proce$ului de in!atare
9.2.1 Mediul
,ediul influenteaza procesul de invatare prin nivelul si calitatea informatiei oferite$ Nivelul
informtiei se refera la gradul de generalitate al acesteia (abstractdetaliat)$ -lementul de invatare
are rolul de a reduce diferenta dintre nivelul la care informatia este transmisa de mediu si nivelul
la care elementul de prelucrare o poate utiliza pentru a rezolva problema$ 2aca elementul de
invatare primeste sfaturi generale (abstracte) trebuie sa completeze detaliile astfel incit elementul
de prelucrare sa poata interpreta informatia intr-o situatie data, iar daca elementul de invatare
primeste informatii specifice despre o situatie particulara, elementul de invatare trebuie sa
generalizeze aceasta informatie (prin ignorarea detaliilor nesemnificative) pentru a g"ida
elementul de prelucrare intr-o clasa mai larga de situatii$
-lementul de invatare trebuie sa faca presupuneri (deoarece cunostintele lui sint imperfecte),
adica sa formeze ipoteze despre cum sa reduca diferenta$ 2upa aceasta, sistemul trebuie sa
primeasca un .feedbac/. pe baza caruia sa evalueze ipotezele formate$ In acest fel, un sistem de
invatare invata prin incercare si eroare$
*e pot identifica patru tipuri de invatare:
!
(1) Invatare prin memorare$ ,ediul ofera informatii e'act la nivelul elementul de
prelucrare (al problemei de rezolvat), deci nu trebuie sa se formeze ipoteze$
(!) Invatare prin instruire$ Informatia din mediu este abstracta sau generala si
elementul de instruire trebuie sa presupuna (sa genereze ipoteze pentru) detaliile
care lipsesc$
()) Invatarea din exemple$ Informatia din mediu este specifica si detaliata, iar
elementul de invatare trebuie sa formeze ipoteze despre reguli generale$
(3) Invatarea prin analogie$ Informatia din mediu este relevanta numai pentru probleme
similare si elmentul de invatare trebuie sa descopere analogia si sa formeze ipoteze
despre reguli similare pentru problema curenta$
2in punct de vedere al calitatii informatiei oferite de mediu, aceasta poate fi aleatorie sau
nu, cu zgomot sau nu, selectata cu gri(a de profesor sau nu$
9.2.2 &aza de cuno$tinte
#rocesul de invatare este influentat de forma si continutul cunostintelor din baza de cunostinte$
2in punct de vedere al formei conteaza metoda de reprezentare a cunostintelor si capacitatea de
e'tensibilitate a reprezentarii$ #entru ca programul de invatare sa poata utiliza e'plicit
cunostintele dobindite, trebuie sa e'iste o meta-descriere care sa arate cum sint structurate
cunostintele$ 4neori meta-cunostintele sint introduse e'plicit ca parte a baza de cunostinte, alteori
sint codificate implicit$ *copul acestora este de a permite elementului de prelucrare sa-si modifice
propriile reprezentari prin adaugarea de noi termeni in vocabular si noi structuri de reprezentare$
5ontinutul bazei de cunostinte trebuie sa specifice initial cunostinte despre problema, care sa
a(ute la formarea, testsrea si rafinarea ipotezelor$
9.2.' Eleentul de prelucrare
-lementul de prelucrare depinde de comple'itatea tipului de problema de rezolvat: clasificare sau
predictie pe baza unui singur concept, sinteza conceptelor multiple, probleme de planificare, deci
sinteza unor secvecte de e'ecutie a actiunilor$ 6 componenta importanta care influenteaza
elementul de prelucrare este evaluatorul actiunilor deoarece elementul de prelucrare trebuie sa
aiba o posibilitate de a-si valida sau corecta ipotezele facute$ 7numite sisteme de invatare au
cunostinte separate pentru evaluare (de e'emplu sistemul 7, are reguli euristice care determina
interesul descoperirii de noi concepte)$ 7lte sisteme asteapta de la mediu sau profesor un standard
de evaluare pentru a compara ipoteza curenta (de e'emplu in sistemele de invatare din e'emple
standardul de evaluare e'tern este clasificarea corecta a fiecarui e'emplu)$
9.2.( E)eple de tipuri de in!atare
Invatarea prin memorare$ *istemul de invatare nu prelucreaza informatia pentru a o intelege
deoarece aceasta este data c"iar sub forma in care poate fi utilizata de -#$ -I doar memoreaza
informatia pentru o utilizare ulterioara$$ 4n e'emplu este sistemul de invatare a lui *amuel ce isi
imbunatateste performantele in (ocul de sa" prin memorarea fiecarei pozitii de pe tabla de sa" ce
)
a fost evaluata pozitiile anterior memorate sint utilizate pentru cresterea vitezei si pentru
cresterea numarului de mutari investigate in avans$
Invatarea prin instruire directa$ Informatia primita din mediu este abstracta sau generala$
-lementul de invatare trebuie sa o transforme intr-o forma utilizabila de elementul de prelucrare$
7ceasta transformare se numeste operationalizare$ *istemul trebuie sa inteleaga si sa interpreteze
cunostintele de nivel ridicat, apoi sa le coreleze cu ceea ce stie de(a (8-9-*I7*, 166)$ *istemul
166 ce invata reguli de (ucat carti, trebuie sa operationalizeze indicatii strategice de tipul .-vita
sa iei puncte. in strategii specifice de tipul .#une o carte mai mica decit orice carte (ucata pina in
acest moment.$
Invatarea din exemple$ *istemul trebuie sa generalizeze e'emplele in reguli de nivel mai ridicat
ce pot fi aplicate in g"idarea elementului de prelucrare$ 4n program care invata conceptul de
perec"e intr-un (oc de carti, trebuie sa sintetizeze din doua e'emple de tipul:
3 pica 3 trefla 5 caro & cupa
& pica 6 trefla 6 caro 9 cupa
conceptul de descriere a unei perec"i: doua carti de acelasi rang, indiferent de culoare si de
valoarea celorlalte carti$
Invatarea prin analogie$ 7cest tip de invatare, putin studiat pina in prezent, ridica probleme ca:
ce este analogia, cum sint recunoscute analogiile, cum se transfera cunostintele relevante$ 4n
sistem cu o baza de cunostinte continind cunostinte despre diagnosticarea bolilor umane poate
invata prin analogi diagnosticarea defectelor din calculatoare, prin corelarea simptomelor
pacientilor cu disfunctiuni ale calculatorului, a tratamentului unei boli cu o metoda de depanare,
etc$
9.' In!atarea prin eorare
Invatarea prin memorare consta in salvarea cunostintelor noi a$i$ in momentul in care acestea sint
din nou necesare singuara problema sa fie regasirea lor si nu calculul sau inferarea acestora$
-lementul de prelucrare rezolva problema iar elementul de invatare tine minte problema si solutia
acesteia$ -lementul de prelucrare poate fi vazut ca o functie f care considera un element de intrare
(: ,$$$, : )
1 n
si calculeaza un sablon de iesire
(; ,$$$,; )
1 p
iar invatarea consta in memorarea
perec"ii asociate
<(: ,$$$, : )(; ,$$$, ; )=
1 n 1 p
$ In timpul unor calcule ulterioare care necesita
f (: ,$$$, : )
1 n
elementul de prelucrare poate regasi
(; ,$$$,; )
1 p
din memorie in loc sa-l calculeze$
(: ,$$$, : ) (; ,$$$, ; ) <(: ,$$$, : )(; ,$$$,; )=
*ablon de
intrare
1unctii de
prelucrare
*abloane de
iesire
#erec"e asociata
1 n
f
1 p
depune
1 n 1 p
7sa cum calculele pot fi reduse la tabele de corespondente de valori, tot asa acest tip de invatare
poate fi privit ca reducerea deductiilor la asocieri de valori$ #roblemele care apar in acest tip de
invatare sint:
3
(1) 6rganizarea memoriei in asa fel incit regasirea sa fie mai rapida decit calculul sau
deductia$
(!) *tabilitatea mediului (informatia memorata sa fie valabila si ulterior) realizata fie
prin monitorizarea sc"imbarilor mediului si actualizarea cunostintelor memorate, fie
prin verificarea valabilitatii cunostintelor la fiecare regasire$
()) -valuarea informatiei inaintea fiecarei memorari sau memorarea tuturor
informatiilor si eliminarea ulterioara a acelora ce se dovesesc a nu mai fi utile$
*e prezinta in continuare ca e'emplu programul de (ucat sa" a lui *amuel$ #rogramul
contine regulile de (ucat sa" corect si trebuie sa invete sa (oace sa" bine prin memorarea si
regasirea pozitiilor pe tabla de sa" intilnite in (ocuri anterioare$ *trategia de rezolvare a problemei
este cautarea intr-un arbore de (oc minma' in care se inspecteaza toate urmatoarele trei miscari
posibile si se foloseste o functie de evaluare statica pentru a estima miscrea cea mai buna de
e'ecutat$ #rogramul memoreaza fiecare miscare selectata impreuna cu valoarea functiei de
evaluare$
7 0
5 2
>a reluarea (ocului, in momentul intilnirii unei aceleiasi pozitii (7), aceasta nu se mai
evalueaza ci se utilizeaza valoarea de(a memorata$ 7vanta(ul principal al acestei abordari consta
insa in faptul ca valoarea memorata pentru pozitia 7 este o mai buna estimare a sanselor de cistig
prin alegerea acestei mutari decit daca s-ar aplica din nou functia de evaluare pentru 7 daca
valoarea memorata pentru 7 intervine in calculul estimarii unei mutari :, estimarea lui : se va
face pe baza inspectarii a 6, 9, $$$ mutari in avans$ 7ceasta abordare imbunatateste adincimea
efectiva de cautare pentru mutarea :$
7 -
2
5
#rogramul a memorat un numar de apro'imativ 5)$000 de pozitii in urma mai multor partide
succesive iar performantele lui au a(uns la nivelul unui (ucator mediu de sa"$ *-a estimat ca
programul ar trebui sa a(unga sa memoreze un numar de apro'imativ 1 milion de pozitii pentru a
atinge nivelul de competenta a unui campion de sa"$
9.( In!atarea prin in$truire directa
5ercetarile in domeniul invatarii prin instruire s-au ocupat de dezvoltarea unor sisteme ce accepta
sfaturi la nivel abstract si le transforma in reguli ce pot g"ida efectiv elementul de prelucrare,
incercind astfel automatizarea completa a procesului de instruire (3$1)$ #e de alta parte, tot in
acest tip de invatare pot fi incluse si cercetarile in domeniul dezvoltarii de instrumente de
ingineria cunostintelor cum ar fi editoare de baze de cunostinte, depanatoare simbolice ale
procesului de deductie, verificatoare ale consistentei bazei de cunostinte, etc$ (3$!)$ In aceste
abordari e'pertul este o parte integranta a sistemului de instruire succesul comercial al actualelor
medii de dezvoltare a sistemelor e'pert a dovedit viabilitatea acestor directii de cercetare$
9.(.1 Autoatizarea in$truirii directe
-tapele necesare in automatizarea instruirii directe sint:
(1) 5erere de sfaturi de la e'pert$
(!) Interpretarea sfaturilor si transformarea lor in reprezentare interna$
()) 6perationalizare, i$e$ transformarea sfaturilor intr-o forma direct utilizabila de
elementulde prelucrare$
(3) Integrarea cunostintelor in baza de cunostinte$
(5) -valuarea actiunilor efectuate de elementul de prelucrare$
*i$teul "OO
*istmul 166 (?$ ,osto@) invata reguli din domeniul (ocurilor de carti pe baza sfaturilor date de
un e'pert$ 7ctivitatea sistemului poate fi vazuta ca o activitate de planificare in care un sfat de
tipul .-vita sa iei puncte. este interpretat ca un scop iar programul trebuie sa dezvolte un plan
e'ecutabil pentru a realiza acest scop$ 2ificultatea consta in faptul ca scopul poate fi prost definit
sau imposibil de realizat deci programul trebuie sa dezvolte strategii apro'imative$ *istemul 166
nu realizeaza pasul (!) care ar consta in traducerea sfaturilor din limba( natural in forma interna,
ci este necesar ca utilizatorul sa prezinte sfaturile direct in forma de reprezentare folosita de
sistem$ 2esi contine o baza de cunostinte cu reguli de transformare a sfaturilor generale in reguli
specifice si un interpretor de aplicare a acestor reguli, utilizatorul trebuie sa indice ce reguli sa se
aplice si ce parte a e'presiei (sfatului) sa se transforme practic strategia de control a sistemului
este indicata de utilizator$ 5u toate aceste limitari drastice, programul a permis o analiza detaliata
a te"nicilor necesare operationalizarii$
6
0aza de cunostinte a sistemului contine: concepte ale domeniului cum ar fi carte, culoare,
rang, levata, (ucator, preia sfaturi sub forma de restrictii cum ar fi fiecare (ucator pune o carte la
culoare, (ucatorul cu cartea de rang cel mai mare cistiga levata sfaturi sub forma de euristici cum
ar fi preia toate punctele dintr-un (oc, daca nu se pot prelua toate punctele dintr-un (oc atunci
preia cit mai putine puncte$
4n e'emplu de operationalizare a sfatului .-vita sa iei puncte. este:
(a) pentru a evita sa iei puncte in general, trebuie sa eviti sa iei puncte in levata curenta
(b) daca o levata contine puncte, trebuie sa incerc sa nu o preiau
(c) pot sa fac (b) prin evitarea cartii cistigatoare
(d) pot sa realizez (c) (ucind o carte mai mica decit cele (ucate pina in prezent$
*e aplica deci o strategie de reducere a problemelor pina cind sfatul se poate aplica direct
la situatia data$ #rin operationalizare sfatul initial
(evita (iaApuncte eu) (levata))
se transforma in
(scop (not (or <inAtimpul (fiecare ( ((ucatori) ((oacaAcarte ()) (iaApuncte eu)=
<inAtimpul (iaAlevata (cistigatorAlevata)) (iaApuncte eu)=)))
iar prin alte operationalizari succesive, forma finala este
(scop (implicatie (and (carteAmareAculoare (carte eu)) <posibil (levataAareApuncte)=)
<carteAmica (carte eu)=))
9.+ In!atarea prin inductie ,din e)eple-
9.+.1 Principii de baza
#rocesul inductiv poaate fi descris simbolic prin urmatorul model$ 1ie # si B doua predicate daca
se constata ca
#(a ), #(a ),$$$, #(a )
1 ! /
se poate generaliza prin inductie ( ') #(') $ ,ai general,
daca se observa implicatiile
#(a ) B(b ), #(a ) B(b ),$$$, #(a ) B(b )
1 1 ! ! / /
se poate
generaliza prin inductie ( ', C) #(') B(C) $ >a formarea unei ipoteze generalizate despre o
clasa completa (posibil infinita) prin observarea numai a unei parti a membrilor ei, se deduce o
concluzie incerta, aceasta fiind forma esentiala a invatarii inductive$
1iind date:
(1) observatii (e'emple)
(!) cunostintele de baza ale domeniului
()) scopuri sau criterii de evaluare
&
elementul de invatare trebuie sa gaseasca o asertiune inductiva sau un concept care implica toate
e'emplele observate si este consistent atit cu (!) cit si cu ())$
*e definesc o serie de notiuni cu care se opereaza frecvent in invatarea inductiva$
Obiect - 6 entitate ce poate fi descrisa printr-o serie de atribute si relatiile intre acestea$
Clasa - 1iind dat un univers de obiecte 4, o clasa este un subset al lui 4$
Concept - 6 descriere a unei clase sau o regula care partitioneaza universul de obiecte 4
in doua multimi, una care satisface descrierea sau regula si alta ce nu satisface$
Ipoteza - o asertiune despre anumite obiecte din universul 4 este un concept tentativ care
imparte universul de obiecte$
Concept tinta - 4n concept care clasifica corect toate obiectele din univers$
Exemple (instabte) pozitive - e'emple de obiecte care apartin conceptului tinta$
Exemple (instante) negative - e'emple de obiecte care nu apartin conceptului tinta$
Regula de clasificare consistenta - o regula care este adevarata pentru toate e'emplele
pozitive si falsa pentru toate e'emplele negative$
Inductie - procesul de formare a claselor$
>ocalizarea unui singur concept intr-un univers care contine n obiecte este o problema de
cautare e'ponentiala deoarece universul tuturor multimilor di"otomice (5 si 4-5) continind n
obiecte poate fi reprezentat ca o structura de latice cu n noduri, deci !
n
posibilitati$ 5autarea
regulilor de descriere a unui concept este g"idata de multimea e'emplelor$ *e pot deci identifica
doua spatii de cautare intr-o problema de invatare inductiva: spatiul instantelor (al exemplelor) si
spatiul conceptelor (al regulilor)$ 4n sistem de invatare din e'emple poate fi vazut ca un sistem
de cautare simultana si cooperativa in aceste doua spatii$ 2oua aspecte principale sint legate de
spatiul conceptelor: modalitate de reprezentare a acestuia si strategia de cautare$ ,etoda de
reprezentare a spatiului conceptelor este importanta deoarece aceasta trebuie sa permita realizarea
usoara a diferitelor prelucrari din sistem$
In timpul procesului de invatare pot apare doua procese e'ecutate alternativ: generalizare si
specializare$ Deneralizarea reprezinta formarea descrierii sau regulii pentru o clasa mai larga
decit aceea care este consistenta cu e'emplele, iar specializarea reprezinta formarea unei descrieri
sau reguli mai restrictive dar consistenta cu e'emplele$ *pecializarea poate fi necesara daca
elementul de invatare supra-generalizeaza o ipoteza supra-generalizata este inconsistenta
deoarece include si e'emple negative pe linga cele pozitive$
-'emple de metode de specializare:
sc"imbarea variabilelor (dintr-un concept) in constante
adaugarea unei con(unctii
eliminarea unei dis(unctii
E
-'emple de metode de generalizare:
sc"imbarea constantelor in varibile
eliminarea conditiilor din descriere (eliminarea con(unctiilor)
adaugarea unei alternative (adaugarea dis(unctiilor)
parcurgerea in sus a arborelui de concepte, in cazul in care universul de obiecte este
structurat ta'onomic
inc"iderea intervalului daca doua sau mai multe e'emple au valori numerice
(d , d )
i (
se
ordoneaza aceste valori si se considera ca valoare in concept intervalul
<min(d , d ), ma'(d , d )=
i ( i (
generalizarea constructiva o serie de predicate
-ste#e(f , f ) -ste#e(f , f ) -ste#e(f , f )
! 1 ) ! 3 )
se poate generaliza la
-ste#rimul(f ) -ste4ltimul(f )
3 1
f K c H (c Fd )
(/ (/ (/ (/
reprezinta probabilitatea ca obiectele din 5 sa aiba valoarea a
(/
pentru atributul 7
(
g K1 f
(/ (/
1E
cistigul informational dat de atributul 7
(
D K + +
( c ( med
1iecare D
(
este calculat si atributele sint ordonate in functie de aceste valori$ 7rborele
rezultat prin selectia atributelor in aceasta ordine va fi minimal din punct de vedere al numarului
de noduri$ 5antitatea calculata ca
+ K p log p
i ! i
i
cu
p K1
i
i
Cazul (a)$ *electarea atributelor se face in ordinea 1orma, 5uloare, 2imensiune$ *e aplica
algoritmul pe multimea initiala -
1orma
cerc triung"i
51K(1F,!F,3-,6-) 5!K()-,5-)
*e aplica algoritmul pentru atributele 5uloare, 2imensiune pe submultimea 51$
1orma
cerc triung"i
51!K(3-,6-)
5!K()-,5-)
rosu
galben
511K(1F,!F)
*e aplica algoritmul pentru 511 cum toate e'emplele din 511 sint e'emplele pozitive,
nodul se etic"eteaza cu F (sau 27)$ *e aplica algoritmul pentru 51! cum toate e'emplele din
51! sint e'emplele negative, nodul se etic"eteaza cu - (sau J4) la fel pentru 5!$ 7rborele
rezultat va avea 5 noduri si va fi:
19
1orma
cerc triung"i
rosu galben
5uloare
27 J4
J4
Cazul (b)$ *e selecteaza atributele in ordinea 2imensiune, 1orma, 5uloare$ 5onstructia arborelui
va parcurge urmatoarele etape:
2imensiune
mare mic
51K(!F,5-,6-) 5!K(1F,)-,3-)
(!)
2imensiune
mare mic
51!K(5-)
5!K(1F,)-,3-)
cerc triung"i
511K(!F,6-)
())
2imensiune
mare mic
51!K(5-)
5!K(1F,)-,3-)
cerc triung"i
5111K(!F)
rosu
galben
511!K(6-)
(3)
!0
2imensiune
mare mic
51!K(5-) 5!1K(1F,3-)
cerc triung"i
5111K(!F)
rosu
galben
511!K(6-)
cerc triung"i
5!!K()-)
(5)
2imensiune
mare mic
51!K(5-)
5!11K(1F)
cerc triung"i
5111K(!F)
rosu
galben
511!K(6-)
cerc triung"i
5!!K()-)
rosu
galben
5!1!K(3-)
7rborele rezultat pentru aceasta ordine de alegere a atributelor are 11 noduri$
2imensiune
mare mic
cerc
triung"i
rosu galben
triung"i
rosu galben
1orma 1orma
5uloare
5uloare
cerc
27 27 J4
J4
J4
J4
Calculul cistigului informational
n K 6 " K !
+ K ! log ! 3 log 3
c ! !
7tributul 7
1
cu valorile a K mic
11
si a K mare
1!
c K1
11
d K !
11
p K )H 6
11
f K1H (1F!)
11
g K1 f
11 11