Sunteți pe pagina 1din 9

Curs 8.

Elemente de inteligenţă artificială utilizate în robotică

Inteligența Artificială (AI) este capacitatea mașinilor sau a computerelor de a


îndeplini atribuții și sarcini asociate în mod obișnuit cu inteligența umană. Definiția
cea mai des acceptată a Inteligenței Artificiale a fost dată în 1955, de omul de știință
John McCarthy: „Este vorba despre inteligență artificială atunci când o mașină se
comportă într-un mod care ar putea fi considerat inteligent, dacă ar fi vorba de un
om.”
Principalele abilități inteligente umane pe care trebuie să le dovedească un
sistem AI – un computer sau un robot coordonat de un computer – sunt:
 capacitatea de a raționa,
 abilitatea de a descoperi sensul într-o situație dată,
 abilitatea de a generaliza, plecând de la un caz particular,
 capacitatea de a învăța din experiențe anterioare.
Pe lângă cele de mai sus, iată alte câteva comportamente asociate cu inteligența
umană: planificarea, rezolvarea problemelor, percepția, manipularea și – poate una
dintre direcțiile cele mai evidente spre care se îndreaptă Inteligența Artificială –
inteligența socială și creativitatea.

8.1. Perceptia artificiala


Este element al inteligentei artificiale care se refera la capacitatea unui sistem
de a forma un model al mediului cu care conlucreaza prin intermediul informatiilor
senzoriale.
Perceptia artificiala se bazeaza pe informatii furnizate de traductoare si senzori
si prelucrare cu mijloace tehnice. Perceptia artificiala este specifica sistemelor
artificiale.
Ea poate fi partiala – cand sunt retinute sau observate numai anumite
caracteristici ale mediului, sau integrala – cand se tinde spre observarea si retinerea
tuturor caracteristicilor mediului.
Modelul alcatuit prin perceptie este o imagine. In sens restrans, imaginea
mediului se percepe cu ajutorul senzorilor video si a celor tactili.

8.1.1. Perceptia imaginii partiale


Cea mai simpla imagine partiala a mediului este constatarea faptului ca un
obiect exista sau nu intr-un anumit loc. Constatarea existentei sau nonexistentei poate
fi facuta cu ajutorul unor senzori tactili (de existenta).
De exemplu, intr-un sistem de fabricatie flexibila robotizat, obiectele sunt
manipulate de catre robot. Este esential ca sistemul de comanda sa fie informat asupra
existentei sau lipsei obiectului in dispozitivul de prehensiune. Constatarea prin
mijloace tehnice a acestei probleme, defineste o imagine partiala a mediului. Ea se
transmite sistemului de comanda, dupa prelucrarea semnalului emis sau neemis de
senzorul tactil montat in bacul dispozitivului.
O alta modalitate de formare a imaginii partiale despre mediu se bazeaza pe
recunoasterea obiectelor dupa semnele purtate. Aceste semne pot fi geometrice simple,
sau litere inscriptionate pe obiectele de manipulat cu robotul.

61
Imaginea partiala poate fi alcatuita si prin recunoasterea starii de echilibru in care se
gaseste la un moment dat un obiect cu mai multe stari de echilibru posibile. Un sistem
de formare a imaginii partiale desrpe starea de echilibru a unui obiect rotund cu doua
trepte de diametre, sprijinit pe ghidajele unui dispozitiv, este ilustrat in figura 8.1.

Fig.8.1. Perceptia imaginii partiale cu doi senzori video fotoelectrici.

Dispozitivul are doi senzori fotoelectrici identici, dispusi pe nivele diferite,


respectiv superior si inferior. Fiecare senzor contine o dioda fotoluminiscenta LED si o
fotodioda, amplasate astfel ca sa cuprinda obiectul. In cele patru situari posibile (a, b,
c, d), obiectul obtureaza fotodiodele diferit, deci si nivelul semnalelor furnizate de
senzori vor apare in combinatii diferite. Imaginea partiala despre situarea obiectului
rezulta din decelarea electronica a nivelelor de semnal culese de la cei doi senzori.
Imaginea partiala poate fi perceputa si cu asa numitii senzori video cooperativi.
Acesti senzori coopereaza cu geometria obiectului a carei forma si dimensiuni se
urmaresc. In figura 8.2., dispozitivul de perceptie artificiala este folosit pentru
controlul existentei a doua gauri intr-un obiect de tip flansa.

Fig.8.2. Perceptie de imagine cu senzor cooperativ.

Fascicolul luminos emis de sursa S, deviat de oglinzile O1, O2, O3, O4, ajunge
la fotodioda F, traversand cele doua gauri. Aparitia semnalului electric la bornele
fotodiodei semnifica cazul obiectului corect executat. Daca cel putin una dintre gauri
lipseste, nu apare semnal, ceea ce semnifica un obiect incorect executat.

8.1.2. Percepţia imaginii complete


Expresia imagine completă este convenţională. Niciodată nu se pot percepe
toate detaliile mediului, dar se tinde spre obţinerea unui număr cât mai mare de

62
caracteristici, mai ales a acelora care să permită în activitatea operaţională
recunoaşterea formei obiectelor (a mostrelor), respectiv a situării acestora în mediu.
Percepţia imaginii complete are următoarele faze:
- achiziţia imaginii
- prelucrarea imaginii
- extragerea caracteristicilor
- interpretarea informaţiei.
Ultimele trei faze poartă numele de tratarea imaginii.

A. Achiziţia imaginii.
Înseamnă preluarea informaţiei din mediu de către sistemul de percepţie
artificială cu ajutorul senzorilor vizuali, tactili (matrici de senzori tactili şi senzori de
tip piele artificială).
Această operaţie se bazează pe constatarea faptului că anumite puncte aparţin
sau nu obiectului a cărui imagine se doreşte a fi achiziţionată. În figura 8.3 se prezintă
un senzor matricial 6 x 6 în contact cu un obiect triunghiular. Cele zece elemente active
ale matricei semnalează apartenenţa de obiectul atins a aceluiaşi număr de puncte. Cu
ajutorul semnalelor emise de elementele senzorului matricial se deduce atât forma cât
şi situarea relativă a obiectului în raport cu senzorul.

Fig.8.3. Dispunerea elementelor senzitive la un senzor tactil matriceal.

Constatarea apartenenţei unor puncte de obiect se poate realiza şi fără atingerea


obiectului. La o iluminare adecvată, punctele de pe suprafeţele obiectului reflectă
lumina difuz. Unele elemente ale matricii fotosensibile din senzorul video (camera de
luat vederi CCD), vor fi iluminate în lumină difuză diferit. Cele iluminate vor da
semnal de ieşire, cele neiluminate nu vor da. Din analiza semnalelor de ieşire, se pot
trage concluzii cu privire la apartenenţa de obiect a punctelor care reflectă lumina.
Imaginea achiziţionată în acest mod reprezintă totalitatea semnalelor provenite de la
elementele matricii fotosensibile a senzorului video.
Aceste semnale se numesc pixeli (de la picture element sau element de
imagine). Dacă imaginea este achiziţionată de la un senzor tactil matricial, semnalul
provenit de la un element al acestuia poartă numele de tactel.
Rezultatul achiziţiei de imagine este este o configuraţie de pixeli sau tacteli.
Obiectul constituie de regulă o entitate în spaţiul 3D, dar calea descrisă nu
permite decât constatarea apartenenţei punctelor de anumite feţe ale obiectului, care la
rândul lor delimitează un spaţiu 2D. Feţele pot fi cele funcţionale ale obiectului sau pot
fi create special în scopul achiziţiei de imagine. Pentru achiziţionarea unei imagini 3D

63
este nevoie de utilizarea a doi senzori tactili sau video matriciali. În acest caz fiecare
senzor va achiziţiona imaginea unei feţe diferite.
Imaginea poate fi achiziţionată binar sau pe nivele de gri, în funcţie de
senzorul video utilizat.
Dacă imaginea a fost achiziţionată binar, informaţia se referă numai la faptul că
punctul aparţine sau nu obiectului. O matrice de senzori tactili achiziţionează imagini
binare.
Achiziţionând imagini numai pe nivele de gri, pe lângă stabilirea apartenenţei
punctelor de obiect, imaginea devine un purtător de informaţii despre calitatea
suprafeţei care conţine punctele respective. Astfel, punctelor de suprafaţă mai
reflectante le corespund pete de imagine mai deschise (mai apropiate de culoarea albă),
iar petelor de suprafaţă mai absorbante le corespund pete de imagine mai închise (mai
apropiate de culoarea neagră). Ordonarea petelor de imagine între limitele alb şi negru
se exprimă prin nivele de gri. În acest scop, intervalul dintre limite se împarte într-un
număr de subintervale în funcţie de construcţia senzorului utilizat. Numărul uzual al
nivelelor de gri este 8 sau 256.
Un sistem artificial de recunoaştere a obiectelor achiziţionează imagini prin
instruire şi operaţional. La achiziţia prin instruire se arată sistemului obiectul de
referinţă, a cărei imagine se prelucrează şi se memorează sub forma unui set de
invarianţi. La achiziţia operativă se prelevează imaginile altor obiecte, care vor fi
acceptate ca fiind recunoscute numai dacă invarianţii lor corespund, prin comparare, cu
cei stabiliţi pentru obiectul de referinţă.

B. Prelucrarea imaginii.
Procedura principală de prelucrare a imaginii este digitalizarea. Aceasta constă
în alocarea fiecărui pixel a unei valori numerice. Dacă imaginea s-a achiziţionat binar,
pixelul care corespunde unui punct de pe obiect primeşte valoarea „1”, iar pixelul care
nu corespunde unui punct de pe obiect primeşte valoarea „0”. Dacă imaginea s-a
achiziţionat pe nivele de gri, atunci valoarea „0” se atribuie acelor pixeli care nu au
puncte corespunzătoare pe obiect, iar acei pixeli care au puncte corespondente pe
obiect vor primi valorile nivelelor de gri detectate.
În figura 8.4 este ilustrată imaginea digitalizată a unui obiect triunghiular. În
matricea imagine, numărul elementelor este egal cu numărul de pixeli continuţi.
Mulţimea de pixeli afectaţi cu cifra “1” indică forma obiectului. Claritatea (rezoluţia)
imaginii creşte prin mărirea numărului de elemente în matrice.

Fig.8.4. Imagine digitalizată binar.

64
În figura 8.5 este ilustrată o imagine digitalizată pe nivele de gri, conţinând
pixeli repartizaţi în intervalul 0 – 64.

Fig.8.5. Imagine digitalizată pe nivele de gri.

Memorarea imaginii achiziţionată în mod de instruire, înseamnă memorarea


matricii rezultată din digitalizarea ei. La modul operaţional, matricea obţinută prin
digitalizarea imaginii achiziţionate se compară cu matricea obţinută în mod de
instruire, de exemplu prin scădere. Dacă diferenţa este o matrice nulă, obiectul a cărei
imagine a fost achiziţionată în mod operaţional este identic cu cel achiziţionat în mod
de instruire.
Cu creşterea rezoluţiei sistemului, va creşte şi numărul cifrelor care trebuie
memorate şi cu care trebuie efectuate operaţii. O matrice de 1024 x 1024 conţine peste
un milion de pixeli. Operarea în timp real cu acest număr mare de cifre necesită o
capacitate mare de calcul, ceea ce constituie un impediment major. Reducerea
volumului de calcul presupune micşorarea numărului de pixeli semnificativi (cu valori
nenule), fără ca informaţia să devină prea săracă. Pentru soluţionarea acestui deziderat
s-au elaborat diferite metode de prelucrare a imaginii.

Metode de prelucrare a imaginii.


O primă metodă, aplicabilă în cazul imaginilor digitalizate binar este cea de
extragere a conturului. Ea are la bază un algoritm care prevede egalarea cu “0” a
valorii pentru acei pixeli care au în vecinătăţi, pe linie şi pe coloană, pixeli de valoare
“1” şi menţinerea valorii “1” pentru acei pixeli care au în vecinătăţi şi pixeli de valoare
“0”. Aceste operaţii sunt efectuate de calculator după un program. Cum numărul
pixelilor semnificativi pe contur este mai mic decât pe aria mărginită de acesta, timpul
necesar pentru compararea imaginilor de reduce.
La imaginile achiziţionate pe nivele de gri, pentru a nu pierde informaţia legată
de luciul suprafeţelor, s-a elaborat metoda extragerii muchiilor interioare. Ea
extrage din imagine muchii care delimitează pete de luciu egal, utilizând operatori
matematici denumiti filtre. Există filtre Lagrange, Sobel, Kalman ş.a.
Filtrul Sobel foloseşte o matrice 3 x 3 (fig.8.6). Elementele A, B, C, D, E, F, G,
H, I ale matricii reprezintă valorile atribuite pixelilor pe nivele de gri. Pentru stabilirea
apartenenţei pixelului E de o muchie interioară se calculează funcţia:
g(E) = A + 2B +C – (G + 2H + I) + A + 2D + G – (C + 2F + I).
Dacă g(E) > k, unde k este o constantă a dispozitivului folosit pentru
achiziţionarea imaginii, atunci pixelul E aparţine unei muchii interioare, iar în cazul
65
contrar nu aparţine. Calculatorul stabileşte pentru fiecare pixel din imagine o funcţie
g(E) şi pe baza inegalităţii g(E) > k, reţine doar punctele care aparţin muchiilor
interioare.

Fig.8.6. Matricea 3 x 3 a filtrului Sobel.

Altă metodă de prelucrare este binarizarea. Ea se aplică imaginilor


achiziţionate pe nivele de gri. La aceasta metodă, calculatorul citeşte pe rând toate
valorile “v” atribuite pixelilor care alcătuiesc imaginea şi le compară cu o valoare
constantă “v0”, aleasă în funcţie de calitatea imaginii achiziţionate. Toţi acei pixeli care
au valori v < v0, se înlocuiesc cu “0” iar cei care au valori v > v 0, se înlocuiesc cu “1”.
În urma acestor înlocuiri imaginea trece de pe nivele de gri, într-o imagine digitalizată
binar. Deşi informaţia de luciu se pierde, binarizarea elimină paraziţii datoraţi
zgomotului electric, ridicând claritatea imaginii şi contrastul.
Alta metoda este segmentarea. Vezi fig.8.7.

C. Extragerea caracteristicilor
Ea urmareste si mai mult reducerea si mai mult a numarului de marimi cu care
se opereaza in procesul tratarii imaginii. Caracteristicile unei imagini se clasifica
astfel:
a) Caracteristici structurale de forma. Ele indica modul in care forma unui
sistem se compune din subsisteme cu legaturi intre ele. Prin aceste
caracteristici se poate recunoaste forma obiectelor, dar situarea lor nu.
Exemple de caracteristici structurale de forma:
a1) numarul de gauri de pe o fata a obiectului. O zona de pixeli cu valori “0”
in interiorul unei zone de pixeli cu valori “1” indica existenta unei gauri. Numarul
acestor zone indica numarul de gauri si caracterizeaza din punct de vedere structural
forma (figura 8.7). Obiectul din figura b prezinta o gaura, cel din gigura a nu.

66
Fig.8.7. Obiecte analizate prin segmentare.
a2) numarul punctelor cu pozitii speciale. In figura 8.8 s-au reprezentat doua
obiecte. Obiectul A se distinge prin 4 puncte aflate pe colturi, iar obiectul B prin doua
puncte aflate pe capete. Aceste puncte special pozitionate, pot fi recunoscute in
imaginile digitalizate ale obiectelor prin faptul ca pixelii corespunzatori de valoare 1
au in vecinatati tot atatia pixeli de valoare 0 ca si de valoare 1. Pe baza unui program,
calculatorul stabileste cati pixeli din imagine satisfac conditiile de mai sus. Daca se
gasesc 4 asemenea pixeli, obiectul are 4 colturi (A) iar daca se gasesc numai 2 pixeli,
obiectul este delimitat de doua puncte de capat (B).

Fig.8.8. Doua obiecte determinate prin 4 (A), respectiv 2 (B) puncte


si imaginile lor digitalizate binar.

a3) Histograma nivelelor de gri. Se aplica imaginilor achizitionate pe nivele de


gri. Calculatorul numara cati pixeli ai imaginii exista pe fiecare nivel de gri. Forma
fetei obiectului rezulta fie prin sirul numerelor de pixeli gasiti pentru fiecare nivel, fie
prin transformata geometrica a acestora intr-o histograma (fig.8.8).

67
Fig.8.9. Histograma nivelelor de gri (a) si cea binarizata (b).

Compararea a doua obiecte poate fi facuta prin compararea celor doua grupe de
numere, sau a celor doua histograme. Daca diferenta dintre sirurile de numere este nul,
sau cele doua histograme se suprapun, obiectele sunt identice.

b) Caracteristicile metrice ale formei. Acestea sut invarianti care dau


informatii despre forma obiectului mostra si nu dau informatii de situare.
Caracteristicile metrice de forma sunt legate de dimensiunile obiectului a
carei imagine se achizitioneaza. Datele dimensionale se evalueaza prin calcul,
pe baza imaginii achizitionate si numararea de catre calculator a pixelilor
continuti pe un anumit segment.
Fie imaginea achizitionata binar din fig.8.10, la care s-a extras conturul
triunghiular. Pixeli de colt sunt notati cu A, B, C. Lungimile laturilor se exprima in
pasi de pixeli. Numararea se face pe laturile suprapuse cu o linie, respectiv cu o
coloana, rezultand: AB = 6, BC = 6. Lungimea AC se determina prin calcul:
AC 2 = √ AB2 +BC2 = √72=8 , 48528 .

Fig.8.10. Calculul lungimii segmentelor intr-o imagine.

Cele mai uzuale caracteristici metrice ale formei sunt:


b1) Raza cercului circumscris unui contur. Se considera conturul imaginii
unui obiect, marcat prin pixelii de valoare 1 (fig.8.8).

Fig.8.8. Stabilirea cercului circumscris unui contur.

Fie S centrul de greutate al conturului (pozitia lui S se va determina la punctul


c1) si A punctul din contur cel mai indepartat de S. Pozitia lui A se poate stabili
numarand pentru fiecare punct de contur pixelii existenti pe coloana (m) si pe linie (n),

68
2 2

cu care se calculeaza distantele: SA= m +n . Se retine distanta cea mai mare,
care reprezinta tocmai raza cercului circumscris conturului: Rext = SAmax. Pentru
punctul A din exemplu m = 3 si n = 2 iar Rext = 3,60555.
b2) Raza cercului inscris in contur. Ea reprezinta jumatate din numarul minim
al pasilor de pixeli continuti pe liniile si coloanele cuprinse in interiorul conturului
(fig.8.12.). Raza cercului inscris in contur se calculeaza cu relatia R int = nmin / 2, unde
nmin este numarul pasilor de pixeli 0 dintre cei mai apropiati pixeli 1 ai conturului (intre
punctele A si B). In exemplul considerat, nmin = 1, deci
Rint = 0,5.

Fig.8.12. Raza cercului inscris unui contur.

b3) Raza cercului mediu al conturului. Daca pentru conturul extras se cunosc
razele Rext si Rint, raza cercului mediu se determina prin calcul, cu relatia: R med = (Rext +
Rint) / 2 = 2,50988 (pentru exemplele considerate).
b4) Latura celui mai mic patrat circumscris conturului si latura celui mai
mare patrat inscris in contur. Aceste caracteristici metrice sunt prezentate in fig.2.13.

Fig.8.13. Patratul circumscris si cel inscris unui contur.

Lungimea Lext reprezinta numarul maxim al pasilor de pixeli, numarati pe liniile


si coloanele conturului, incluzand si pixelii care apartin acestuia. Lungimea L min
reprezinta numarul minim al pasilor de pixeli, stabiliti prin numarare pe liniile incluse
intre pixelii conturului.

69

S-ar putea să vă placă și