Sunteți pe pagina 1din 12

Curs 9. Decizie artificială. Sisteme expert.

Retele neuronale
9.1. Decizia artificiala
Capacitatea de a decide este o proprietate a sistemelor inteligente. Ea se referă
la abilitatea sistemelor de a alege, pe baza informaţiilor obţinute din mediu, un
comportament tactic compatibil cu planul strategic general care îi direcţionează
activitatea.
Decizia artificială este capacitatea sistemelor artificiale de a lua decizii în mod
automat, utilizând în acest scop mijloace tehnice. Cum decizia artificială adaptează
comportamentul sistemului automat la condiţiile mediului în care acesta evoluează, ea
se include în ceea ce se numeşte conducere adaptivă a sistemelor automate.

EXEMPLE.
1. Luarea deciziei automate în cazul unui proces de recunoaştere a formei
şi situării obiectelor.
Recunoaşterea formei şi a situării obiectelor reclamă examinarea mai multor
caracteristici, ceea ce presupune efectuarea unor operaţii logice succesive, organizate
după un sistem denumit arbore de decizie. Acesta este un graf arborescent, având ca
noduri momentele de decizie şi ca laturi operaţiile de evaluare ale condiţiilor (operaţii
de comparare).
În figura 9.1 se prezintă un arbore de decizie.

Fig.9.1. Arbore de decizie.

Nodurile, reprezentate prin cercuri, corespund momentelor de decizie


intermediare, iar cele reprezentate prin pătrate, corespund momentelor de decizie
finală. Laturile sunt reprezentate prin linii. Evaluarea condiţiilor se realizează
comparând caracteristicile de referinţă CR ai mostrei cu caracteristicile operaţionale C O

70
stabiliţi pentru obiectul de recunoscut. La fiecare etapă de comparaţie există trei
posibilităţi:
CO = CR  obiect  A;
CO  CR  Obiect  A;
Lipsesc date  nu se recunoaşte obiectul cercetat.
A treia situaţie conduce la decizia intermediară nu se stie, ceea ce va trece sistemul de
decizie artificială pe nivelul următor, într-o succesiune dirijată după organigrama din
figura 9.2.

Fig. 9.2. Organigrama trecerii pe arborele de decizie la nivelele de comparare succesive,


în vederea recunoaşterii artificiale a obiectului A.

2. Stabilirea automată a mişcărilor de ocolire a obstacolelor de către un


robot mobil (robocar)
Se presupune că punctul caracteristic P al robocarului trebuie să se deplaseze
din punctul A1 în punctul B (fig. 9.3).
În intervalul [A1, B] apare un obstacol neprevăzut. Robocarul va ocoli
obstacolul printr-o succesiune de decizii ordonate, care se elaborează utilizând
caracteristici invariante ale mediului ideal şi caracteristici operaţionale, care se
modifică cu schimbările ce se petrec în mediul real în timpul deplasării. Informaţiile
necesare definirii caracteristilor mediului ideal se procură prin învăţare, folosind de
exemplu senzori video. Informaţiile despre schimbările mediului real se culeg în faza
operaţională, folosind senzori de proximitate montaţi pe robocar.
Căutând să atingă ţinta în timp cât mai scurt, sistemul de decizie artificială al
robocarului va stabili iniţial traseul de deplasare după linia A 1B. Pornind pe acest
drum, robocarul se apropie de obstacol până la distanţa senzitivă h0, când prin
semnalul generat, senzorul de proximitate va anunţa sistemul de comandă despre
apariţia pericolului de coliziune. Pentru evitarea ciocnirii, sistemul de decizie
artificială trebuie să modifice traseul iniţial, după criteriul scoaterii robocarului din
zona de pericol. Îndepartarea cea mai rapidă are loc pe direcţia segmentului A 2A3,
amplasat perpendicular pe faţa detectată a obstacolului. După efectuarea retragerii pe
distanţa de siguranţă h, despre care informează traductoarele de deplasare ale

71
robocarului, sistemul de decizie automată va stabili un traseu nou pentru atingerea
ţintei, amplasat pe direcţia A3B. Succesiunea mişcărilor de apropiere şi îndepărtare va
continua până când robocarul ajunge în poziţia A 7, de unde va accesa ţinta după traseul
A7B, pe care nu mai există nici un obstacol.

Fig. 9.3. Ocolirea obstacolului de către robocar.

Succesiunea deciziilor pe care trebuie să le adopte sistemul de decizie artificială


pentru ocolirea obstacolelor neprevizibile, este prezentată în ordinograma din figura
9.4.

72
Fig. 9.4. Ordinograma de dirijare a succesiunii de decizii
la ocolirea unui obstacol.
Pentru a deosebi situatiile relative cu caracter aleator dintre robocar, ţintă şi
diferite obstacole, ordinograma trebuie să asigure trimiterea pe trei nivele de
comparaţie. Dacă traseul de deplasare este fără obstacole, deciziile se aduc comparând
informaţiile din bucla superioară din partea dreaptă a figurii. La apariţia obstacolului
deciziile vor rezulta din conlucrarea a două bucle de comparaţie, reprezentate în partea
dreaptă jos şi în partea stângă.

9.2. Sisteme expert


Prin sistem expert se înţelege un program de calcul specializat pentru rezolvarea
problemelor din domeniul lor de expertiză.
Sistemele expert lucrează în regim interactiv. Operatorul uman adresează prin
calculator întrebarea iar sistemul expert răspunde printr-un mesaj afişat pe ecran. Acest
program specializat oferă răspunsuri şi la întrebari de tipul ‘de ce?’. Din acest motiv
sistemul expert poate fi considerat şi un mijloc de explicare a soluţiilor date la
probleme.
Sistemul expert se perfecţionează continuu. El memorează soluţiile problemelor
rezolvate operaţional şi tine seama de soluţiile respective atunci când ulterior este
solicitat să facă expertiza altor probleme. Schema din figura 9.5 redă principiul
sistemului expert.

Fig. 9.5. Schema de principiu a unui sistem expert.

O parte importantă a sistemului expert este baza sa de cunoştinţe. Ea este


structurată pe fapte si reguli. Partea denumită maşină de inferenţă realizează corelaţii
între fapte, reguli şi soluţii. Interfaţa cu utilizatorul constituie cea de a treia parte a
sistemului expert. Utilizatorul este un operator uman, care prin intermediul interfeţei
introduce în sistem informaţiile şi întrebările sale iar sistemul expert returnează
concluziile rezultate sau soluţiile problemei analizate, oferind şi explicaţii.
Organizarea bazei de cunoştinţe se face ţinând seama de regulile care
sintetizează experienţa (expertiza) anterioară a sistemului. Regulile sunt organizate pe
nivele. Conlucrarea operatorului uman cu baza de date are loc interactiv şi iterativ.
Pentru fiecare nivel operatorul introduce informaţiile şi formulează succesiv
întrebările. Fiecare nivel comunică concluzii şi soluţii.
Regulile pot avea forma unor informaţii de condiţii şi forma unor informatii de
soluţii sau de concluzii.
Informaţiile de condiţie au forma generică:
- dacă…………

73
- şi……….
- şi………..
Informaţia de concluzie aferentă unei anumite informaţii de condiţie se prezintă
sub forma:
- atunci……….
Programul codifică faptele, regulile de condiţii şi de soluţii, precum şi celelalte
informaţii, atribuind acestora coduri exprimate în cifre. Maşina de inferenţă corelează
practic aceste coduri atunci când elaborează soluţia potrivită la o problemă dată.
Sistemul expert modelează de fapt modul de gândire al omului. Maşina de
inferenţă reproduce acest proces specific uman pe baza a două procedee, denumite
specific înlănţuire înainte (forward chaining) şi înlănţuire înapoi (backward chaining).
Prin procedeul backward chaining se elaborează concluzia respectiv soluţia problemei
expertizate şi se verifică dacă acestea corespund condiţiilor impuse. Procedeul forward
chaining este inversul procedeului backward chaining, fiind folosit pentru elaborarea
răspunsului “atunci….”. Unele sisteme expert lucrează cu logica fuzzy (raţionament
vag).

Exemplu de SE
Spre deosebire de alte domenii ale ingineriei, în domeniul sudării dezvoltarea
sistemelor expert s-a făcut remarcată abia în ultimii 5 ani. Sistemele expert dedicate
acoperă o arie de preocupări relativ extinsă în următoarele domenii:
a) stocarea de informaţii – proceduri de stocare omologate; liste cu sudori
autorizaţi;
b) efectuarea de calcule repetitive – conversii de unităţi de măsură, calculul
volumului la sudare; calculul necesarului de materiale pentru sudare;
calculul costurilor de fabricaţie;
c) interpretări de standarde – tratamente termice; proceduri de sudare; calculul
temperaturii de preîncălzire; calcule de apreciere a comportării la oboseală;
d) recomandări – selectare parametri de sudare; selectare materiale
consumabile; selectare simboluri în domeniul sudării.
Un exemplu de asemenea sistem este cel numit WELD-ASIST, destinat asistării
operatorilor sudori în elaborarea tehnologiilor de sudare MIG/MAG a oţelurilor slab
aliate şi cu conţinut redus de carbon, în cazul sudării robotizate. Este elaborat prin
utilizarea sistemului de dezvoltare de tip instrumental PERSONAL CONSULTANT
PLUS (Texas Instruments).
Structura sistemului dedicat este modulară, fiind conceput sub formă a trei
module independente, fiecare modul având funcţiuni specifice: modul de consultare
pentru elaborarea tehnologiilor de sudare – acesta furnizează utilizatorului toate
datele necesare efectuării sudurii, funcţie de datele de intrare; modul de consultare
pentru remedierea defectelor – destinat asistării utilizatorului în depistarea cauzelor
care au provocat apariţia unor defecte în timpul sudării, furnizând sfaturi pentru
remedierea acestora; modul de consultanţă pentru îmbunătăţirea procesului – în cazul
când nu apar defecte, dar aspectul sudurii nu este corespunzător, sau procesul
recomandat nu este aplicabil, acest modul oferă recomandările necesare.

74
Una dintre caracteristicile cele mai semnificative ale sistemului este faptul că
parametrii de sudare pot fi transmişi, prin intermediul unei interfeţe adecvate, sursei de
sudare şi controlerului robotului.
O caracteristică esenţială a sistemelor expert este faptul că toate acoperă o gamă
largă de domenii, de la proiectare şi recomandări de fabricaţie la inspecţie şi au fost
dezvoltate în mod special în scopul de a ajuta inginerul sudor. Dezvoltarea cu succes a
acestor sisteme expert ar trebui să crească performanţele inginerilor sudori asigurându-
le o bază de cunoştinţe în domeniul lor de activitate. Beneficiarii unor astfel de sisteme
vor fi întreprinderile mici şi mijlocii unde nu sunt angajaţi mai mult de un inginer
sudor.

Aplicatii ale sistemelor expert în procesul de sudare


În figura 9.6 este prezentat conceptul unui sistem de sudare integrat. Cerinţa
specifică a unui astfel de sistem este adaptabilitatea, adică posibilitatea de a regla şi
modifica în timp real parametrii de sudare. În acest sens sunt folosite datele din
programele iniţiale care sunt modificate la variaţiile ce apar în timpul procesului
propriu-zis (sistemul expert). Funcţtiile adaptive necesită acţiuni de corectare şi
schimbare a coordonatelor şi orientării pistoletului. Parametrii de sudare adaptivi sunt
selectaţi automat printr-o bază de date. Corecţia în timp real a coordonatelor
pistoletului se face cu ajutorul metodelor de urmărire a îmbinării sudate.

75
Fig. 9.6. Sistem de sudare integrat cu sistem expert.

9.3. Reţele neuronale artificiale


O reţea neuronală artificială (RNA) este o structură alcătuită dintr-o mulţime
de elemente simple de procesare interconectate şi care se numesc unităţi sau noduri.
Fiecare unitate are o caracteristică de intrare-ieşire şi implementează o relaţie locală de
calcul sau o funcţie. Ieşirea oricărei unităţi este determinată de caracteristica ei intrare-
ieşire, de interconectările cu alte unităţi, de eventuale intrări din exterior.
Funcţia globală realizată de o RNA este determinată de topologia reţelei,
caracteristicile neuronilor individuali, strategia de învăţare (antrenare), datele utilizate
pentru antrenare. Pentru a fi utile, sistemele neuronale trebuie să fie capabile să
memoreze informaţii, adică ele trebuie să fie antrenabile. RNA sunt antrenate în
speranţa ca vor avea o comportare asociativă corectă atunci când la intrare li se aplică
noi forme pentru cunoaştere sau clasificare.
În figura 9.7 este prezentată o RNA adaptabilă.
Ţinta

Reţea neuronală
(include şi
conexiunile
Intrare dintre neuroni) Ieşire
76

Actualizare
ponderi
Fig. 9.7. Schema de principiu a unei RNA.

Reţeaua este modificată (actualizată) pe baza comparaţiei dintre mărimea de


ieşire şi o mărime "ţintă", până când ieşirea reţelei atinge ţinta. Acesta este principiul
"antrenării supervizate". Există reţele care pot fi obţinute prin "antrenare
nesupervizată" ce pot fi utilizate la identificarea grupurilor de date.
"Legea de învăţare" sau "algoritmul de antrenare" reprezintă procedura de
modificare a ponderilor w şi b (bias) şi este utilizată pentru a antrena reţeaua neuronală
în vederea realizării unei sarcini particulare (task).
În cadrul învăţării supervizate, i se prezintă reţelei un set de date de intrare
împreună cu setul corect de semnale de ieşire, împreună alcătuind setul de antrenare:
{p1, t1}, {p2, t2}, ..., {pq, tq}, unde pq este o intrare a reţelei iar tq este ieşirea corectă
(ţinta), corespunzătoare intrării pq. Când o intrare este aplicată reţelei, ieşirile acesteia
sunt comparate cu semnalele ţintă. Regula de învăţare este utilizată pentru pentru a
ajusta (modifica) ponderile w şi b în sensul apropierii semnalelor de ieşire ale reţelei
de valorile semnalelor ţintă.
Legea de învăţare este nesupervizată când se prezintă reţelei numai setul de date
de intrare, fără a cunoaşte datele corecte de ieşire corespunzătoare intrărilor date.
După o evoluţie istorică ce prezintă variaţii bruşte ale interesului uman pentru
domeniul RNA, odată depăşită etapa de exagerare ("reţelele neurale pot rezolva orice
problemă") şi a zonei de scepticism ("reţelele neuronale nu sunt utile"), se poate spune
că trasătura dominantă a stadiului actual este aceea de realism [37]. Aceasta se
manifestă prin precizarea corectă a performanţelor, avantajelor şi dezavantajelor
modelelor neuronale artificiale, pe baza cunoştinţelor interdisciplinare din domeniile
biologiei, psihologiei, calculatoarelor, ingineriei electrice, prelucrării semnalelor,
matematicii, fizicii, opticii şi tehnologiilor VLSI. Se poate afirma că RNA realizează
pe de o parte lărgirea unor orizonturi deja existente şi deschiderea de noi perspective
de cercetare.

EXEMPLE : Reţea neuronală liniară adaptivă


Modelul neuronal. Un neuron liniar cu R intrări este prezentat în figura 9.8.

a = f(Wp+b)
p1
w1,1
+
p2 1
n a

p3
f
‘ 0 n
b
‘ w1,R
‘ 1 1
-
pR 77 1
Fig. 9.8. Model neuronal liniar.

Arhitectura retelei. Reţeaua neuronală liniară ilustrată în figura 9.9 are un strat
cu S neuroni conectaţi la R intrări prin intermediul matricii pondere W. Această reţea
este deseori numită MADALINE ( Many ADALINES).

Fig. 9.9. Reţea neuronală liniară.

Legea de învăţare. În cazul reţelelor neuronale liniare, legea de învăţare este


dată de algoritmul Widrow-Hoff (algoritmul minimizării erorii medii pătratice),
cunoscut şi sub denumirea de algoritmul LMS (least-mean-square) sau regula delta. Ca
şi în cazul perceptronului, i se prezintă reţelei un set de date de intrare împreună cu
setul corect de semnale de ieşire, împreună alcătuind setul de antrenare:
{p1, t1}, {p2, t2}, ..., {pq, tq},
unde pq este o intrare a reţelei iar tq este ieşirea corectă (ţintă), corespunzătoare intrării
pq. Cand o intrare este aplicată reţelei, ieşirile acesteia sunt comparate cu semnalele
ţintă. Eroarea este calculată ca diferenţă dintre ţinta şi ieşirea reţelei ( e = t - a ). Se
doreşte minimizarea mediei sumei acestor erori (“mse”).
Q Q
1
mse= ∑ e( k )2= Q1 ∑ (t ( k )−a( k ))2
Q k=1 k =1
Acest algoritm modifică ponderile w şi b ale reţelei în sensul minimizării "mse".
Algoritmul de învăţare Widrow-Hoff estimează mse utilizând pătratul erorii la fiecare
iteraţie. Dacă considerăm derivatele parţiale ale pătratului erorii în raport cu ponderile
w şi biasurile b, la iteraţia k, avem:
∂ e2 ( k ) ∂e (k )
=2 e( k )
∂ w1 , j ∂w 1, j
∂ e2 ( k ) ∂e (k )
=2 e( k )
∂b ∂b , pentru j = 1, 2, ..., R.
Derivatele parţiale ale erorii în raport cu ponderile w sunt:

78
∂ e(k ) ∂[ t( k )−a(k )] ∂
= = [ t(k )−(Wp(k )+b )]
∂ w1 , j ∂w 1, j ∂w 1, j
sau
R
∂ e(k ) ∂
= [ t(k )−( ∑ w1 ,i p i (k )+b)]
∂ w1 , j ∂w 1, j i=1
Aici, pi(k) este elementul i al vectorului de intrare la iteraţia k.
∂e (k )
=− p j ( k ).
Similar, ∂ w 1 , j
∂e (k ) ∂e(k )
=− p j ( k ) =−1
Aceste relaţii pot fi scrise mai simplu: ∂ w1 , j , ∂b .
Astfel, se constată că modificările ponderilor w şi b sunt 2e(k)p(k) şi respectiv
2e(k), şi ele reprezintă baza algoritmului de învăţare Widrow-Hoff.
Aceste rezultate pot fi extinse în cazul neuronilor multipli şi pot fi scrise sub
formă matricială astfel:
W (k+1 )=W (k)+2 α⋅e(k) pT (k )
b( k+1)=b(k )+2 α⋅e(k )
În aceste relaţii eroarea e şi ponderea b sunt vectori, iar  este rata de învăţare.
Dacă  este mare, învăţarea decurge rapid, dar dacă este prea mare poate apărea
fenomenul de instabilitate şi erorile pot chiar creşte.

Reţea neuronală liniară – Filtre liniare adaptive


Fără nici o îndoială, reţeaua neuronală liniară ADALINE a fost şi este şi în
prezent una din cele mai utilizate reţele neuronale cu aplicaţii practice. Cea mai
importantă aplicaţie este filtrarea adaptivă. Problema filtrării liniare optimale
presupune găsirea setului optim de parametri (ponderi) pentru care eroarea medie
pătratică este minimă. Cu alte cuvinte, în procesul de adaptare a parametrilor se
urmăreşte ca diferenţa dintre ieşirea circuitului şi ieşirea dorită să fie minimă în sens
statistic. Pentru aceasta, avem nevoie de o nouă componentă, linia de întârziere (fig.
9.10).
Semnalul de intrare este situat în stânga şi este afectat de N-1 întârzieri.
Semnalul de ieşire este un vector de dimensiune N, alcătuit din semnalul de intrare la
timpul curent, semnalul anterior, ş.a.m.d.

79
Fig. 9.10. Modelul liniei de întârziere :
TDL – (tapped delay line) linie de intarziere; D – (delay) intarziere; pdj(k),
j = 1…N – componentele vectorului de iesire din linia de intarziere;
N – numarul de semnale de iesire din linia de intarziere.

Putem combina o linie de întârziere cu o reţea ADALINE pentru a crea un filtru


liniar adaptiv (fig. 9.11).

Fig. 9.11. Modelul filtrului liniar adaptiv:


p(k) – semnal de intrare in FLA la iteratia k; pdj(k), j = 1…N – componentele vectorului de
iesire din linia de intarziere; w1,1…w 1,N – ponderile semnalelor de iesire din linia de intarziere;
TDL – (tapped delay line) linie de intarziere; b (bias) – semnal de intrare; N – numarul de
semnale de iesire din linia de intarziere; a(k) – semnalul de iesire din FLA la iteratia k.

Ieşirea filtrului este dată de relaţia:


R
a( k )=f (Wp+ b )=∑ w 1, i p (k −i+1 )+ b
i−1
Filtrele liniare adaptive (FLA) sunt utilizate pe scară largă în diverse domenii
(egalizare adaptivă, compensarea ecoului, antene adaptive, detecţia semnalelor în
medii nestaţionare, etc) şi reprezintă la ora actuală circuite fundamentale de procesare
adaptivă a semnalelor.
Compensarea interferenţelor sau compensarea zgomotului (fig. 9.9) este o
problemă de filtrare optimală, cu aplicaţii în reţelele fixe de telecomunicaţii, în
radiocomunicaţii, în prelucrări de semnale vocale şi de imagini, în electronica

80
medicală.
Intrare primara

Sursă de semnal

e
Sursă de zgomot
FA

Intrare de referinţă

Fig. 9.9. Filtru adaptiv în aplicaţie de compensare adaptivă a interferenţelor.

Principiul compensării interferenţelor este următorul: un semnal însoţit de


zgomot (x(t) + n(t)) este recepţionat la o intrare a compensatorului numită intrare
primară. În acelaşi timp, o a doua intrare, numită intrare de referinţă, recepţionează
un zgomot no(t) corelat într-o formă necunoscută cu zgomotul n(t). Această intrare de
referinţă trebuie amplasată într-o zonă în care semnalul util este detectat foarte slab sau
deloc. Zgomotul de referinţă este filtrat cu un FLA, care va produce un estimat al
zgomotului n(t).

81

S-ar putea să vă placă și