Sunteți pe pagina 1din 57

Sisteme bazate pe cunotine

Sistemele bazate pe cunotine sunt o ramur a inteligenei artificiale. Scopul lor este de a stoca i manipula
cunotine reprezentate printr-un limbaj formal, astfel nct s poate fi incluse ntr-un mecanism inferenial
pentru a rezolva o problem. Exemple ale sistemelor bazate pe cunotine sunt: sistemele expert, sisteme de
mentenan, sisteme de prelucrare de informaii, sisteme de lucru cu limbajul natural.
Limbajul formal utilizat la reprezentarea cunotinelor este, de obicei, bazat pe logic i matematic i are
bine fundamentate aspectele semantice i sintactice. Pentru formalizarea cunotinelor se pot folosi logica
propoziiilor, logica predicatelor de ordinul unu, logica fuzzy, logica posibilist, cadre, Xml, reele
semantice. Fiecare metod de reprezentare de cunotine are asociat metoda de raionament
corespunztoare.

1.1 Metode de reprezentare a cunotinelor

Nivelul de inteligen al sistemului bazat pe cunotine este dat, pe de o parte de cantitatea de cunotine
pe care o conine, iar pe de alt parte de capacitatea de a realiza raionamente pentru a obine noi informaii i
pentru a infera concluzii.
Metodele de reprezentare de cunotine pot fi clasificate n formalisme bazate pe logic i formalisme
care nu sunt bazate pe logici. Metodele de reprezentare bazate pe logic stau la baza limbajelor formale (de
exemplu, logica propoziiilor, logica predicatelor de ordin unu, logica fuzzy, logica posibilist) (simbolice).
Aceste metode de reprezentare sunt uor de neles, pot fi implementate pentru raionament, dar au
dezavantajul c nu permit structurarea cunotinelor. Metodele de reprezentare non-logice au la baz
reprezentrile obiectuale, diagramatice (al cror rol este mai mult de a explica, dect de a reprezenta,
ontologii), reprezentri bazate pe reguli, reele neuronale. Aceste metode, sunt i ele sugestive, includ
capaciti de schematizare i structurare, dar sunt mai greu de utilizat n mecanisme de inferen. Pentru a
putea realiza inferen se poate ncerca transformarea reprezentrilor non-logice n reprezentri logice care
au asociate diferite mecanisme de raionament sau n grafuri care au asociai algoritmi specifici.

1.1.1 Reprezentarea prin scheme a cunotinelor

Cu ajutorul schemelor se pot reprezenta cunotine:


Declarative sau conceptuale care cuprind faptele, conceptele.
Procedurale prin care se reprezint metodele sau raionamentele. Acestea pot fi abductive (care
demonstreaz c un lucru exist), deductive (demonstreaz c un lucru trebuie s existe), inductive
(arat c un lucru este n general adevrat).
Condiionale, contextuale sau strategice conin condiii care descriu contextul de aplicare i
secvena de proceduri de aplicat sau concepte ntre care se stabilesc asociaii.
1
n general, schemele sunt implementate cu ajutorul grafurilor. n nodurile grafurilor pot fi reprezentate
faptele i conceptele (cunotine declarative), dar i atributele obiectelor sau faptelor, mpreun cu tipul de
valori pe care le pot lua atributele. Aceste valori pot fi concrete, dac li se poate asocia un aspect din lumea
real, sau abstracte, care pot fi descrise prin alte scheme.

1.1.2 Metode de reprezentare structurat a cunotinelor

n continuare prezentm diverse metode non-logice de reprezentare de cunotine, care, n marea lor
majoritate conin reprezentri schematice ale datelor.

1.4.2.1 Reprezentri ale cunotinelor declarative

Arbori semantici sunt utilizai n sistemele bazate pe cunotine n care este nevoie de organizarea
pe categorii a conceptelor i reprezentarea de structuri grafice. Forma arborelui pune n eviden
legturile ierarhice ntre concepte. n nodurile reelei sunt trecute concepte pentru reprezentarea de
entiti, atribute, stri sau evenimente. Arcele reprezint relaiile dintre concepte. Tipurile de concepte
sunt organizate n ierarhii, iar proprietile unui concept sunt motenite de sub-conceptele de care este
legat prin relaii.
Acest tip de arbore poate avea mai multe interpretri posibile, deoarece nu precizeaz tipul de legtur
reprezentat prin arce. Legturile pot fi de superioritate (ntre o clas i subclasele acesteia), de
inferioritate (apartenena unei entiti la o clas).
De obicei, sunt folosite n sistemele de instruire pentru structurarea cursurilor, a materialelor didactice,
a paginilor din site-urile web.
Un exemplu de reea semantic pentru prezentarea unei clasificri a limbajelor de nivel nalt, mpreun
cu exemple la fiecare ramur a clasificrii.

Limbaje de programare
de nivel inalt

procedurale declarative compilate interpretate

Java Prolog C++ Java TclTk

Hri/ grafuri conceptuale sunt mai generale dect arborii semantici i sunt folosite n sistemele
bazate pe cunotine pentru reprezentarea semanticilor n limbaj natural prin tipurile de relaii dintre
concepte. Sunt utilizate pentru realizarea de reele de asocieri ntre concepte, n prezentri sau
explicaii furnizate de utilizator, sau pentru construirea i organizarea cunotinelor utilizatorului. Au
forma unui graf, care nu este obligatoriu ierarhic. Nodurile grafului reprezint concepte, iar arcele
relaiile ntre dou concepte. Tipul fiecrei relaii este precizat printr-o caracterizare nscris n dreptul
arcului (Sowa, 1984) sau prin reprezentarea a dou tipuri de noduri (concepte i relaii). Se face

2
observaia c frunze ale grafului pot fi numai nodurile conceptuale. Pentru calculabilitate, grafurile
conceptuale pot fi formalizate prin logica propoziiilor sau logica predicatelor. Avantajul utilizrii unei
structuri ierarhizate riguroase este c permite interaciunea dintre module i este relativ uor de folosit
(comprehensive).
Acelai exemplu de mai sus, cu adugarea unei motivaii a clasificrii:

Limbaje de programare
de nivel inalt

clasific clasific mod de mod de


lucru lucru

procedurale declarative compilate interpretate

exemplu exemplu

Java C++ TclTk Prolog Clips

Reele semantice reprezint grafic baze de cunotine relaionare complexe. Sunt utilizate grafuri
entitate-relaie (propuse de Chen, 1976). Pentru a fi reprezentate n calculator, reelele semantice pot fi
transformate cu ajutorul logicii predicatelor de ordin unu, n care nodurile reprezint literali, iar arcele
predicate. ntreaga reea poate fi structurat sub form de formule logice care conin conectori logici.
Ca exemplu, se consider relaiile de rudenie ntre persoane reprezentate cu ajutorul predicatelor de
ordin unu, astfel:
tata(paul, ion)
tata(marian, paul)
bunic(A,B):- tata(A,P), tata(P,B)
Reprezentarea grafic se poate face dup cum urmeaz:

tatal lui tatal lui


Marian Paul Ion

este bunic

Cadre i obiecte reprezint concepte sau obiecte organizate ntr-o structur arborescent, mpreun
cu atributele i valorile asociate. Obiectele pot avea asociate i metode sau relaii pentru reprezentarea
structurii ierarhice.
Ontologii sunt utilizate pentru reprezentri semantice de cunotine structurate cu scopul de a se
realiza partajarea i reutilizarea cunotinelor. Cu ajutorul ontologiilor cunotinele sunt reprezentate
din punct de vedere conceptual. Pentru a deveni calculabile, ontologiile sunt implementate cu ajutorul

3
limbajelor, care pot fi bazate pe frame-uri, limbaje de logic de descriere, limbaje bazate pe logica
predicatelor.

1.4.2.2 Reprezentri ale cunotinelor procedurale:

O procedur este un ansamblu de etape pentru realizarea de aciuni. Ansambluri structurate de proceduri
alctuiesc algoritmi sau raionamente, pentru obinerea de concluzii. Un algoritm este reprezentat cu ajutorul
organigramelor:
Diagrame cauzale sunt o form de reprezentare procedural utilizat n sisteme de luare a deciziilor,
n sisteme expert, pentru a stabili legturi de influen sau legturi cauz-efect ntre diferii factori.
Diagrama cauzal permite subdivizarea problemei de decizie n subprobleme de decizie local bazate
pe atributele pe care le influeneaz direct. Exemplu de diagram cauzal:

Sursa calculator Memoria RAM Placa video Cablu nmonitor


nu porneste defecta defecta neconectat

Test memorie Monitorul nu are


incorect imagine

defect
Afisare mesaj pe
sursa
monitor

Nu porneste
calculatorul

Arbori de decizie sunt asociai unei caracteristici. Pentru a construi un arbore de decizie se ncepe
cu atributele care influeneaz caracteristica i se traseaz arce pentru toate valorile posibile spre un alt
atribut. Cnd sunt epuizate toate atributele se leag fiecare ramur a arborelui la atributul de baz.
Astfel, un arbore de decizie permite construirea direct a unui ansamblu de reguli ce constituie baza de
cunotine a unui sistem decizional (de exemplu, sistem expert).

4
Detecteaza hard-
DA discul?
Afisare corecta
verificare
DA memorie
Memorie defecta
Afisare mesaj pe NU
monitor?
DA
DA Placa video
NU defecta
Calculatorul Monitorul are
porneste? imagine?

NU Conectat cablu
Sursa alimentare monitor?
NU defecta

Arbori de deducie sunt folosii pentru reprezentarea etapelor necesare la rezolvarea unei probleme.
Nodurile arborilor cuprind enunuri, iar arcele au scrise regulile care autorizeaz deducia.
Enunuri: se cunosc e, not(f).
Reguli:
R1 dac b, c, d atunci a.
R2 dac e, not(f) atunci c.
R3 e not(f)
R3 dac not(f) atunci b.
R4 R2
R4 dac b,e atunci d.
b
Deducie: a
d c

R1
a

5
1.2 Logica predicatelor - fundamente teoretice

Logica predicatelor este un limbaj capabil s descrie enunuri matematice i s garanteze corectitudinea
raionamentelor. Limbajul predicatelor de ordin unu dispune de instrumente pentru a defini diverse tipuri de
obiecte matematice, cum ar fi: numere, variabile numerice, funcii i operaii matematice, relaii, propoziii,
teoreme matematice.
n calculul predicatelor, componentele unui enun sunt interpretate pentru determinarea valorilor de
adevr ale enunului. Termenul de predicat este folosit n accepiunea de formul deschis. Formulele
deschise pot deveni enunuri sau propoziii dac variabilele care intr n componena lor iau valori constante
individuale sau sunt cuantificate universal sau existenial. Un enun declarativ se numete n logica simbolic
atom. Pentru construirea unui atom n logica predicatelor se folosesc patru tipuri de simboluri logice:
1. simboluri individuale sau constante denumesc obiecte, care pot fi numerice sau nu i sunt notate cu
litere mici (de exemplu, popescu, animal, 100);
2. variabile sunt notate cu litere mari (de exemplu, X, Y, Z);
3. simboluri funcionale (funcii, functori) se noteaz cu litere mici i pot reprezenta i operatori (de
exemplu, f, factorial , nr-argumente, plus);
4. simboluri predicative (predicate) se noteaz cu litere mari (de exemplu, P, Q, MAIMARE);
Limbajul predicatelor de ordin nti este exprimat printr-un alfabet. Din simbolurile alfabetului se alctuiete
ansamblul tuturor formulelor limbajului.
Funciile i predicatele au un numr dat de argumente, iar acest numr se numete aritate. Dac o
funcie sau un predicat au n argumente, acestea se numesc n-are.
Enunurile din limbajul natural sunt formate din cuvinte, iar obiectele din domeniul de reprezentare
sunt reprezentate prin substantive. ntr-un limbaj formalizat cum este logica predicatelor, obiectele sunt
reprezentate prin termeni a cror sintax este explicat n continuare.
Un termen poate fi definit recursiv astfel:
o constant;
o variabil;
o funcie f(t1,...,tn), unde f este un simbol funcional, ti sunt termeni;
orice termen generat dup regulile de mai sus;
Aspectele sintactice sunt date de alfabetul limbajului predicatelor, care este dat de:
separatori ( ) ,
termeni;
variabile;
atomi;
conectori , , , , ;

cuantificatori existenial i universal care se aplic numai variabilelor;

6
Un atom este un predicat n-ar P(t1,...,tn), unde ti, i=1,...,n sunt termeni.
Un atom pozitiv este un atom care nu conine negaii.
Daca atomul A este pozitiv n formula F, atunci este pozitiv i n formulele ( x)F si (x)F ,

F G, F G, F G .
Dac atomul A este pozitiv n formula F, atunci este negativ n formulele F, F G .
Ordinea operatorilor este:
, , negare, orice, exista
sau
si
, implica, echivalent
Exemple:
- pentru a reprezenta expresia x mai mare dect y se poate folosi atomul maimare(X,Y), n care maimare
este un functor, iar X i Y sunt termeni (variabile);
- pentru a reprezenta expresia x mai mare dect 10 se folosete notarea maimare(X,10);
- pentru a reprezenta operaia care realizeaz media aritmetic se utilizeaz termenul media(X,Y), n care X
i Y sunt variabile, iar media este un simbol funcional;
- expresia media lui x i 7 mai mare dect y se reprezint n logica predicatelor maimare(media(X,7),Y);
- enunul Petru este student la specializarea Calculatoare se formalizeaz n limbajul logicii predicatelor
prin predicatul STUDENT(petru, calculatoare). Pentru a exprima c exist cel puin un student la secia
Calculatoare utilizm: ( X)STUDENT(X,calculatoare).
- declaraia orice student la Calculatoare cunoate programare se exprim prin
( X) (STUDENT(X,calculatoare) CUNOATE_PROGRAMARE(X)).
- deducia Petru cunoate programare se transform n predicatul CUNOATE_PROGRAMARE(petru).
Pentru a reprezenta enunul Petru nu cunoate programare folosim negaia
CUNOATE_PROGRAMARE(petru).
- pentru a exprima faptul c un student care a promovat are media notelor mai mare dect 5 utilizm
combinaia promovat(X,maimare(media(Z,Y),5)). Dac tim c Petru are notele 6 i 10 i reprezentm
promovabilitatea lui atunci folosim un termen compus: promovat(petru,maimare(media(6,10),5)).

n limbajul natural o combinaie de cuvinte alctuiete un enun (propoziie) cu un anumit neles. n


logica predicatelor, enunul este construit din termeni care alctuiesc o formul sau o formul bine format.
O formul bine format se definete recursiv astfel:
1. un atom (este un predicat n-ar P(t1,...,tn), unde ti, i=1,...,n sunt termeni);
2. dac F i G sunt formule, atunci F, F G, F G, F G, F G sunt formule;

3. dac F este formul i x este o variabil liber, atunci ( x)F si (x)F sunt formule;
4. formulele se genereaz prin aplicarea de un numr finit de ori a regulilor de mai sus.
Variabilele care apar n formule pot fi libere sau legate.

7
O variabil dintr-o formul este legat dac apare n formula pe care cuantificatorul respectiv o aplic sau
apare chiar n acel cuantificator. Deci, o variabil cuantificat universal sau existenial este o variabil legat
n formula prefixat de acel cuantificator.
O variabil este liber dac nu este legat, adic dac are cel puin o apariie liber n acea formul.
O formul care nu conine variabile libere se numete formul nchis.

Un literal este o formul redus la un atom (adic o formul care conine numai predicate). Deci un
literal este un atom sau negaia unui atom. Un literal pozitiv este un atom. Un literal negativ este negaia unui
atom.

Aspectele semantice se ocup de urmtoarele aspecte:


interpretarea formulelor bine formate;
formule valide, inconsistente, echivalente;
consecin logic;
clauze Horn;
demonstrarea teoremelor prin reguli de inferen permite obinerea de formule bine formate plecnd
de la una sau mai multe formule bine formate aplicnd modus ponnens, modus tollens, specializrii
universale;
n logica predicatelor, deoarece n formule sunt implicate variabile, pentru a defini o interpretare a unei
formule trebuiesc definite domeniul i asignarea constantelor, domeniul i asignarea funciilor, domeniul i
asignarea predicatelor care apar n fomul.
O interpretare a unui limbaj L de ordin unu este constituit din urmtoarele elemente:
o mulime nevid D numit domeniul interpretrii;
fiecrei constante din limbajul L i se asigneaz un element din D;
fiecrui simbol de funcie n-ar din limbajul L i se asigneaz o aplicaie D n D .

fiecrui simbol de predicat P de aritate n, i se asigneaz o aplicaie D n {T, F} .


O interpretare a unei formule F const dintr-un domeniu nevid D i asignarea de valori fiecrei constante,
funcie sau predicat care apar n F n modul urmtor:
1. fiecrei constante i se asigneaz un element din D;
2. fiecrei funcii n-are i se asigneaz o aplicaie de la Dn la D, unde Dn={(x1,...,xn)|x1 din D,...,xn din D};
3. fiecrui predicat n-ar i se asociaz o aplicaie de la Dn la {True, False}.
Se spune c formula F are o interpretare peste domeniul D. Cnd se evalueaz valorile de adevr ale unei
formule F peste un domeniu D, (x) se interpreteaz ca pentru toate elementele din D, iar ( x) ca
exist cel puin un element din D.

Regulile de evaluare a valorilor de adevr ale unei formule pentru orice interpretare peste domeniul D
sunt:

8
1. dac valorile de adevr ale lui G i H sunt evaluate, atunci se pot evalua i pentru
G, G H, G H, G H, G H ;
2. (x)G este adevrat T, dac valoarea de adevr a lui G este T pentru orice element din D, altfel este
False;
3. ( x)G este T dac valoarea de adevr a lui G este T pentru cel puin un element din D, altfel este F.
O formul care conine variabile libere nu poate fi evaluat. n logica predicatelor, deoarece exist un numr
infinit de domenii, exist i un numr infinit de interpretri ale unei formule. Din aceast cauz nu se poate
verifica validitatea sau inconsistena unei formule prin evaluarea ei sub toate interpretrile posibile.
O formul este consistent (realizabil) dac exist cel puin o interpretare n care formula s fie
evaluat True.
Dac o formul este consistent ntr-o interpretare se spune c interpretarea este un model al formulei sau c
interpretarea satisface formula.
O formul este inconsistent (nerealizabil) dac i numai dac nu exist nici o interpretare care s
satisfac formula.
O formul este valid dac i numai dac orice interpretare a formulei este model al formulei
(interpretarea satisface formula).
Relaia dintre valoarea de adevr a formulei i termenii de clasificare ai formulei este:

valid invalid

ntotdeauna Uneori adevrat, ntotdeauna


adevrat uneori fals fals

contingent

consistent (realizabil) inconsistent


O formul G este consecin logic a formulelor F1,...,Fn dac i numai dac sub orice interpretare,
dac F1 ... Fn este adevrat, atunci i G este adevrat.

Teorema deduciei arat c fiind date formulele F1,...,Fn i o formul G, G este o consecin logic a
formulelor F1,...,Fn dac i numai dac formula ((F1 ... Fn ) G) este valid sau ((F1 ... Fn ) G)

este inconsistent.

9
1.3 Reprezentarea cunotinelor imperfecte

Cunotinele referitoare la domeniul de cunoatere sunt preluate din lumea real i sunt supuse
imperfeciunii. Sistemele bazate pe cunotine trebuie s reprezinte i s utilizeze imperfeciunea
cunotinelor, cu scopul adaptrii ct mai bine la necesitile utilizatorului.
De aceea, n capitolele urmtoare, vom ncerca s facem o scurt trecere n revist a principalelor
metode de reprezentare i tratare a cunotinelor imperfecte:
logici i teorii formale pentru reprezentri simbolice nestructurate:
o teoria probabilitii;
o logic posibilist;
o teoria Dempster-Shafer;
o logic fuzzy;
modele grafice care modeleaz legturile de interdependen dintre cunotine pentru
reprezentarea structurat a acestora:
o reele Bayesene;
o reele posibiliste;
metode de raionament asociate metodelor de reprezentare structurat a cunotinelor;
metode de raionament ipotetic: deducia, inducia, abducia;
raionamentul prin aproximare;
inferen n sisteme de producie;
raionament Bayesean;
raionament plauzibil;
raionament posibilist;
raionament imperfect;

1.3.1 Metode de tratare a imperfeciunii informaiei pentru reprezentarea


cunotinelor

n inteligena artificial, pentru reprezentarea sau codificarea informaiei provenit dintr-un domeniu
al lumii reale, se folosesc diferite metode de formalizare a cunotinelor, la care se asociaz tehnici de
inferen specifice, cu scopul de a obine noi cunotine n domeniul studiat. n general, cunotinele din
lumea real sunt supuse imperfeciunilor. n abordrile inteligenei artificiale, imperfeciunea este studiat
din dou puncte de vedere: imprecizia i incertitudinea.
La baza metodelor de reprezentare a cunotinelor stau sistemele formale al cror scop este de a defini
aspectele teoretice (limbaj, axiome, reguli de inferen, metode de raionament), care apoi pot fi

10
implementate n diferite abordri. Teoriile formale folosite pentru reprezentarea cunotinelor imperfecte pot
avea mai multe interpretri pentru aceleai cunotine. Caracteristic fiecrei interpretri sunt definite reguli
de inferen i metode de raionament. Sistemele formale au dezavantajul unei reprezentri nestructurate a
cunotinelor. Acest dezavantaj poate fi suplinit prin utilizarea de sisteme de reprezentare grafice, care
folosesc reprezentri structurate (grafuri, reele) pentru cunotine simbolice combinate cu metode de cutare
n spaii complexe. Modelele grafice au dezavantajul unor metode rudimentare, neteoretizate pentru
raionamentul sub imperfeciune, dar care este suplinit de teoriile formale. Combinarea logicelor simbolice
cu metodele grafice de reprezentare a cunotinelor au dus la obinerea unor abordri care permit
raionamente cu cunotine imperfecte, ntre care pot exista legturi de interdependen (cauzalitate,
independen, condiionalitate).

1.3.2 Raionamente cu cunotine imperfecte

Principalele aspecte de interes n cadrul sistemelor bazate pe cunotine sunt modalitatea de


reprezentare (formalizare) a cunotinelor (adic, ansamblu de metode de codificare simbolic) i
mecanismul de raionament (capabil s ndeplineasc funcii de inferen simbolic). Aceste dou aspecte, de
reprezentare i de raionament sunt legate i trebuie s ndeplineasc o serie de proprieti: s fie clare,
expresive, eficace, optimizate (din punctul de vedere al spaiului de memorare sau al timpului de calcul). De
obicei, se ajunge s se fac un compromis ntre claritatea i puterea de reprezentare, pe de o parte, i
eficacitatea raionamentului, pe de alt parte. Raionamentul este de mai multe tipuri, iar calificativele
asociate cuvntului raionament pot face referire, fie la natura raionamentului (prin aproximare, calitativ,
prin analogie, etc.), fie la natura cunotinelor (aproximativ, temporal, plauzibil, etc.). Unele mecanisme de
raionament nu accept dect un singur mod de reprezentare al cunotinelor, altele pot fi folosite n
combinaie cu diverse reprezentri.
Principalele tipuri de raionament aplicat n sistemele bazate pe cunotine sunt:
raionamentul logic (deductiv, inductiv, abductiv);
raionamentul prin aproximare;
raionamentul cu aspecte temporale (de revizuire, previzionar, n timp real);
raionament bazat pe model (cauzal);
raionamentul prin analogie (ca strategie particular de raionament este cel bazat pe caz);
raionamentul distribuit (paralelismul sistemelor, sisteme multi-agent, sisteme conexioniste);
planificare (abordri generale sau specifice).
Fiecare tip de raionament care poate fi aplicat unei baze de cunotine este n strns legtur cu
formalismul de reprezentare al acesteia.
Punctul de plecare comun al sistemelor bazate pe cunotine este conceptul de ipotez, adic
informaie nou sau cunotine create printr-un mecanism de raionament asociat unui fenomen observat ntr-

11
un anumit univers de aplicaie. O ipotez poate fi obinut prin diverse mecanisme de raionament logic
(deducie, abducie, generalizare-inducie).
Modelele de raionament care permit construirea de ipoteze sunt:
Deducia permite validarea concluziilor deducerii pornind de la un set de premise (aplicarea
cunotinelor generale la cunotinele particulare). Problemele de construcie de ipoteze nu sunt
considerate doar probleme de deducie particulare deoarece, ele sunt constructive. Rezolvarea unei
probleme de deducie const n a determina dac un fapt e adevrat, fals sau nedeterminat ntr-o teorie.
Rezolvarea unei probleme de construcie de ipoteze const n determinarea acelor ipoteze pentru care
un fapt este o consecin a teoriei. O problem de construcie deductiv de ipoteze are urmtoarea
schem de inferen:
P(a), x (P(x) Q(x))
Q(a)
Inducia este inversul raionamentului deductiv, deoarece generalizeaz premisele. Acest tip de
raionament este aplicat cnd se dorete generalizarea legilor, regulilor universului de discurs.
Conceptul de generalizare inductiv este folosit pentru construirea ipotezelor disjunctive. Schema de
inferen este:
P(a) Q(a)
x (P(x) Q(x))
Abducia acest raionament ataeaz cauze plauzibile unei mulimi de premise. Acest tip de
raionament este folosit n problemele de diagnoz. n aceste probleme, ipotezele interesante exprim
funcionarea defectuas a componentelor sistemului de diagnosticat. Ipotezele explic de ce
comportamentul sistemului este diferit de cel dorit sau ateptat. Raionamentul abductiv este folosit
pentru construirea ipotezelor conjunctive. Abducia mai este folosit i n alte ramuri ale inteligenei
artificiale, cum ar fi: nelegerea limbajului natural (Charniak, 1988, Stickel, 1988), recunoatere de
forme (Cox and Pietrzykowski, 1986), sisteme de meninere a adevrului bazate pe ipoteze, n care,
fiecrui fapt i sunt asociate mulimi de ipoteze care le justific (Reiter and Kleer, 1987).
Raionamentul abductiv are urmtoarea schem de inferen:
Q(a), x (P(x) Q(x))
P(a)

12
1.4 Cunotine imperfecte

n lumea real, de cele mai multe ori, cunotinele sunt inexacte, imprecise sau incerte i sunt
exprimate calitativ, prin limbaj natural. n practic, n limbajul natural, informaia, structurat ca piese de
cunoatere, se poate exprima sub forma unei propoziii (eventual, logice), care poate conine predicate i,
eventual, cuantificatori. Cuantificatorii sunt folosii pentru a reprezenta diverse caracteristici i proprieti ale
informaiei, cu ajutorul adjectivelor i al adverbelor. n inteligena artificial, reprezentarea informaiei
const n gsirea unei corespondene ntre lumea real i un sistem simbolic sau formal, care s permit
execuia de raionamente. Pentru alegerea unui sistem formal adecvat, informaia (cunotinele), trebuie
studiat din trei puncte de vedere:
din punct de vedere logic structura. n aceast situaie, cunoaterea este privit sub aspectul
legturilor interne, al cauzalitii i al relaiilor ntre entiti, cu scopul organizrii n structuri
relaionale i de grup.
din punct de vedere al ansamblului coninutul. Se consider aspecte ale ncrcturii de informaie
care poate furniza caracteristicile i proprietile entitilor de cunoatere.
din punct de vedere al evenimentelor - relaia cu faptele reale. n acest caz, accentul se pune pe
evoluia de la o stare la alta, fie prin nregistrarea strilor succesive, fie prin nregistrarea strii iniiale
i a regulilor de transformare de la o stare la alta.

Definirea unui element de informaie se face folosind cvadruplul <obiect, atribut, valoare,
factor_de_ncredere>:
Obiect la care face referire piesa de cunoatere.
Atribut este o funcie care poate modifica valoarea sau un ansamblu de valori ale obiectului.
Valoare corespunde unui predicat, adic o mulime de referine legate de atribut.
Factor de ncredere este un indicator al fiabilitii elementului de informaie.

Pentru a se putea lucra cu piese de cunoatere, acestea trebuiesc formalizate ntr-un anumit formalism, care
apoi s permit i raionamentul cu aceste cunotine.
Imperfeciunea cunotinelor face referire la atributele acestora. Termenii din limbajul natural curent prin
care se poate exprima imperfeciunea pot fi:
Adjective: imprecis, incert, aproximativ, probabil, posibil, fuzzy, credibil.
Adverbe: probabil, aproape, cert, n general.

Imperfeciunea informaiei se poate exprima prin imprecizie i incertitudine, care sunt dou puncte de
vedere antagoniste ale aceleiai realiti. Noiunea de imprecis (valoarea informaiei poate fi fracionat sau
se definete apartenena gradual) se refer la coninutul unei piese de informaie (valoarea) exprimat ntr-
un anumit formalism, iar noiunea de incertitudine se refer la posibilitatea ca o informaie s fie adevrat
13
sau fals, deci la valoarea de adevr, n sensul de a fi conform cu realitatea (factorul de ncredere sau gradul
de certitudine). Imprecizia se exprim prin calificativele vag, fuzzy, general, ambiguu, iar incertitudinea se
exprim cu ajutorul calificativelor probabil, posibil, necesar, plauzibil, credibil.
Calificativul imprecis se aplic atunci cnd nu se tie exact valoarea cunotinelor. Calificativul
ambiguu este forma de imprecizie legat de limbaj, exprimat prin termeni omonimi, care se refer la mai
multe contexte sau referine posibile. Calificativul general este legat de abstractizare, prin faptul c se
desemneaz un ansamblu de obiecte printr-o proprietate comun. Termenii de vag i fuzzy se refer la
absena unei delimitri clare a mulimii de valori.
Exemple: X are ntre 160 i 180 cm, ceea ce nseamn c nlimea lui X aparine intervalului [160,
180]; temperatura este n jur de 38 C, adic temperatura este variabil n jurul valorii de 38; X este aproape
al fel de bun la matematic ca i Y, caz n care se aplic operatorii de imprecizie aproape la fel i bun.
Calificativul incert se aplic n cazul cunotinelor a cror valoare de adevr este cunoscut cu mai
mult sau cu mai puin precizie.
Exemple de cunotine incerte: X va intra probabil la oral, ceea ce corespunde cu este probabil ca (X
va intra la oral); s iei metroul este o soluie bun, adic acestei afirmaii i se poate asocia un anumit grad de
ncredere; dac bolnavul tuete, atunci este suspect de bronit, ceea ce nseamn c ipoteza de bronit este
probabil; vremea va fi probabil frumoas, la care se aplic operatori de incertitudine probabil i
imprecizie frumoas.

n teoriile formale utilizate n inteligena artificial (Besnard, Dubois, Farinas, Prade, Siegel, 1989), o
informaie se formalizeaz printr-o expresie de tipul A este B, care nu se exprim prin proprietatea
universal toi A sunt B, ci sub o form de tipul n general A este B. Fiecare formalism descrie
calificativul n general n manier proprie, astfel:
n logica defectelor a lui Reiter este dat urmtoarea interpretare: un A este un B, fr nici o excepie
cunoscut.
n logica modal ne-monoton a lui Doyle i McDermott, se nelege c dac este convenabil ca B i
dac A, atunci B.
n logica lui McCarthy, se face interpretarea toi A care nu sunt anormali, sunt B.
n logica presupunerilor a lui Besnard i Siegel, se exprim prin toi A pentru care se presupune B,
sunt B.
Logica condiional a lui Delgrande, are urmtoarea interpretare: A tipici sunt B.
Logica posibilist sau logica incertitudinii a lui Dubois i Prade, stipuleaz c un A este aproape cert
un B.
Logica fuzzy a lui Zadeh (care folosete predicate graduale sau vagi), exprim cu ct mai mult este A,
cu att mai cert c este B sau cu ct mai mult este A, cu att mai mult este B.
Logica cuantificatorilor numerici (eventual vagi) introduce interpretarea: cea mai mare parte din A
sunt B sau a fi A i a nu fi B este rar.

14
n inteligena artificial, pentru a reprezenta baze de cunotine este nevoie de un formalism i de o
metodologie de raionament pentru a infera cu acele cunotine. Exist diverse teorii formale folosite la
reprezentarea cunotinelor, iar prerile despre acestea, avantajele i dezavantajele lor depind de scopul n
care sunt folosite. Unii cercettori consider c doar teoriile formale, care asigur entiti i relaii bine
definite i care sunt exprimate ntr-un limbaj care are o semantic denotaional clar sunt suficient de
precise pentru a fi nelese i de alii, n afar de autorul lor, (Allen and Kautz).
Criterii de comparare a teoriilor formale de reprezentare a cunotinelor:
Portabilitate general se poate rspunde la ntrebri de ordin general sau nu se poate rspunde
dect la ntrebri individualizate. Se poate face distincie ntre rspunsurile implicite i cele sigure?
Interpretri multiple care pot fi date pentru aceeai reprezentare a cunotinelor ntr-un anumit
formalism. Alegerea unei teorii formale poate fi ghidat de intuiia sensului interpretrii sau a
rspunsului care se intenioneaz a fi dat ntrebrilor.
Tranzitivitate se poate concluziona din expresia A este B i din expresia B este C c A este
C?
Monotonia dac formalismul este monoton sau ne-monoton.
Contrapunerea dac se poate utiliza un enun de tipul A este B pentru a rspunde la ntrebarea
B este A?
Concluzii antagoniste este posibil s se obin mai multe concluzii distincte i parial antagoniste?
Dac da, se pune problema alegerii uneia dintre ele pe baza unor criterii de preferabilitate.
Informaii disjunctive tiind c A OR B i A este C i B este C, este posibil s se
concluzioneze C?
Cuantificatori care sunt tipurile de cuantificatori acceptai (de exemplu: mic, foarte, mult, o parte,
aproape, etc.)
Revizuirea cunotinelor este posibil ca baza de cunotine s revin la starea iniial, dup ce au
fost aplicai mai muli pai de inferen? Se poate s se obin help i explicaii dup un pas de
inferen?
Modularitatea reprezentrii baza de cunotine are o structur modular astfel nct introducerea
unei noi informaii s nu modifice reprezentarea existent?
Complexitatea i calculabilitatea raionamentului este un aspect important datorit restriciilor
impuse de sistemele de calcul.

Dintre teoriile formale de reprezentare a cunotinelor, se disting formalismele logice, ca fiind


sistematic interpretabile, motivul principal al interpretabilitii rezultnd din garania c toate cunotinele
reprezentate cu ajutorul formalismelor logice sunt comprehensibile, verificabile, i c metodele de inferen
utilizate (care pot fi deductive, inductive, abductive, etc.) sunt justificabile (Schubert).
Logica propoziiilor i a predicatelor de ordin I, clasice, sunt sisteme formale formate din limbaj,
axiome i reguli de inferen. Pentru a putea lucra i cu alte tipuri de cunotine (incomplete, incerte,

15
imperfecte, temporale, etc.) s-au definit o serie de logici ne-clasice sau ne-standard prin care se descriu
diferite forme de inferen, astfel:
S-a extins limbajul logicii prin introducerea unor predicate particulare (logica presupunerilor) sau a
unor operatori (posibil i necesar n logica posibilist, operatori care indic trecutul i viitorul,
operatorul cred n logica epistemic) sau a unor cuantificatori (alii dect i ). S-a introdus
caracterul vag asupra predicatelor (logica fuzzy) sau grade de incertitudine asupra propoziiilor (logica
posibilist).
S-au definit noi axiome.
Se poate folosi alt tip de implicaie dect implicaia material (logica condiional). S-a definit o nou
noiune de deducie care permite formularea rspunsurilor n anumite abordri particulare i s-au
definit noi semantici.
n continuare vom prezenta diferite teorii care sunt folosite pentru reprezentarea cunotinelor imprecise i
incerte.

16
1.5 Logica fuzzy reprezentarea cunotinelor imprecise

n logica fuzzy (Zadeh, 1965) se consider, din punct de vedere semantic, c un termen sau o idee,
exprimate n logica propoziiilor sau logica predicatelor de ordin unu, pot conine nuane introduse ca grade
de apartenen. De exemplu, X este tnr cu un grad de 0.5 pe un interval de la 0 la 1. sau dac se are n
vedere mulimea oamenilor tineri. O persoan la 18 ani este sigur considerat tnr, dar o persoan la 30 ani
mai poate fi considerat tnr? O persoan la 70 ani sigur nu este tnr. Se constat c nu exist o singur
valoare cantitativ care sa defineasc termenul tnr. Pentru unii oameni, vrsta de 25 ani semnific tnr,
pentru alii vrsta de 35 de ani nseamn tnr.
Cunotinele imprecise cu care se poate lucra n teoria mulilor fuzzy (Zadeh, 1973) pot fi:
predicate fuzzy de exemplu mare, cald, nalt;
fapte fuzzy cum ar fi expresia Pmntul este aproape rotund, puin aplatizat la poli;
reguli fuzzy exemple: pentru a reui trebuie s munceti, dac bolnavul tuete, atunci s ia
sirop, cu ct este mai degradat fotoliul, cu att este mai puin confortabil (regula gradual);
aprecierea probabilitilor fuzzy mult posibil, aproape adevrat;
cuantificatori fuzzy mare parte din, general, uneori;
operatori de comparare la fel ca, mai puin dect;
modificatori fuzzy puin, foarte, aproape;

Definiia unei mulimi fuzzy- o mulime fuzzy A pe un domeniu de discurs U este definit printr-o

funcie A (u ) (pe care, mai departe o vom nota cu A(u) pentru simplificare), A = U [0,1] sau cu A(u),
unde u U, A U , A este mulimea fuzzy, iar U descrie universul de discurs, care reprezint gradul de
apartenen al elementului u la mulimea A. Universul de discurs poate fi definit ca o mulime compact sau
ca o mulime cu un numr finit de elemente discrete (caz n care, u se numete singleton).

Principala proprietate a mulimilor fuzzy este de a sublinia ideea de apartenen parial. Dac funcia de
apartenen are valoarea 1, atunci ea reflect apartenena total, iar dac are valoarea 0, reflect ne-
apartenena absolut. Funcia de apartenen reprezint gradul de apartenen al elementului u la mulimea
fuzzy A sau exprim n ce punct valoarea u este compatibil cu conceptul descris de mulimea A.
Diferite reprezentri:
date imprecise sau precise: Ainaltime
1
o persoana are o nlime de 140cm (precis);
o persoana are o nlime ntre 180 i 190cm
(imprecis non-fuzzy exprimat prin interval)
140 160 180 190 cm
pentru valoarea lingvistic nlime;
o persoana are o nlime n jur de 160cm (imprecis fuzzy );

17
ATANAR(u)
1
predicate fuzzy: TANAR

cuantificatori (general, uneori) sau modificatori (nu prea, foarte) care se pot aplica mulimilor fuzzy
rezultnd alte mulimi fuzzy:
TANAR
ATANAR(u) Foarte
1 TANAR
Aproape
TANAR
u

Metodele de determinare a funciilor de apartenen pot fi (Dubois, Prade, 1985):


Epistemice ntre care exist mai multe categorii distincte:
Simple, definite pe o referin liniar obiectiv (de exemplu mare) funcia de apartenen se obine
prin ntrebri.
Complexe, cnd pot interveni simultan mai multe referine (de exemplu bondoc).
Dificil de identificat pe referine graduale (de exemplu frumos).
Statistice care presupune ipoteza (nu ntotdeauna satisfcut) c rezultatele aleatoare sunt suficient de
precise. Exist metode de definire a unor intervale pentru datele imprecise, sau de calculare a
probabilitilor pe baza crora se calculeaz distribuia de posibilitate care este asociat cu funcia de
apartenen.

Reprezentri grafice ale funciilor de apartenen


trapezoidal este cel mai des utilizat tip de funcie de apartenen, la care se specific cvadruplul
(, a , b, ) astfel:
funcia de apartenen este:

0 pentru u < a-
u-a
1+ pentru a u a
a a b b+

A(u) = 1 pentru a u b
b-u
1+ pentru b<u < b +

0 pentru b+ u

Pentru a=b se obine forma triunghiular, iar pentru a=b i = = 0 se obie singleton.

18
u

poligonal sunt folosite pentru a reprezenta un rezultat fuzzy

1
clopotul lui Gauss A(u) =
u a 2
1+ ( )

a- a a+

0 pentru u<a-2 si u>a+2



cosinus cu funcia de apartene A(u) = u-a
(1+cos 2 ) / 2 pentru a-2 u a+2

de tip cosinus, dar cu laterale nesimetrice

De exemplu, termenul fuzzy tnr poate fi definit printr-o mulime fuzzy ca n tabel:

Pornind de la definiia funciei de apartenen se poate scrie:

19
Tanar (25) = 1, Tanar (30) = 0.8 ,..., Tanar (50) = 0
Valorile gradului de apartenen constituie o posibil distribuie a termenului tnr. Tabelul se poate pune n
form grafic astfel:

Pe un univers de discurs U se pot defini mai multe mulimi fuzzy, care se pot intersecta. De exemplu,
pentru universul vrstelor persoanelor se pot defini mulimile fuzzy ale copiilor, tinerilor i btrnilor.

Caracteristicile mulimilor fuzzy


Dac universul de discurs U este mulimea numerelor reale, atunci A este o cantitate fuzzy. Mulimile
obinuite pot fi considerate cazuri specifice ale mulimilor fuzzy, la care sunt permise doar apartenena total
sau ne-apartenena, situaii n care se numesc mulimi crisp sau booleene.
Dac se face presupunerea c funcia de apartenen este normalizat (adic, exist u U pentru care
A(u)=1), atunci toate valorile u, pentru care A(u)=1, se numesc valori modale ale mulimii A.
Un interval fuzzy este o cantitate fuzzy convex, adic funcia de apartenen este cvasi-concav
(Zadeh, 1963):
w [u, v] A(w) min(A(u), A(v))
Un numr fuzzy este un interval semi-continuu superior, care are un suport compact i valoare modal
unic.
Pentru mulimea A fuzzy a universului de discurs U, se definete suportul lui A ca fiind submulimea
lui U ale crei elemente au grade de apartenen diferite de zero n A:
supp(A)={ u U | A(u)>0 }
nlimea mulimii fuzzy A este dat de cele mai mari valori ale funciei de apartenen:
h(A)= sup A(u)
uU

20
Nucleul mulimii fuzzy A este reprezentat de submulimea lui U ale crei elemente au grade de apartenen
unitare n A:
n(A)={ u U | A(u)=1 }
Suportul include ntotdeauna nucleul.

Operatori fuzzy
Mulimile fuzzy pot reprezenta din punct de vedere cantitativ termeni lingvistici vagi. n vorbirea curent se
pot utiliza calificatori pentru a nuana termenii lingvistici vagi (de exemplu, foarte, oarecum, aproape).
Reprezentarea acestora se poate face prin operatori fuzzy al cror rol este de a modifica matematic funcia de
apartenen a mulimii fuzzy. Aceti operatori sunt:
concentrarea are ca efect reducerea valorilor funciei de apartenen ACONC(u)=(A(u))2. Poate fi
folosit pentru a exprima adverbul foarte.

ACONC

puterea are ca efect reducerea de n ori a valorilor funciei de apartenen APOW(u)=(A(u))n. Poate fi
folosit pentru a exprima foarte foarte i este o extensie a concentraiei.

APOW

dilatarea are ca efect mrirea valorilor funciei de apartenen ADIL(u)= A(u ) . Poate fi folosit

pentru a exprima termeni ca oarecum.

ADIL

21
intensificarea are ca efect mrirea valorilor funciei de apartenen mai mari de 0,5 i micorarea
2 * A 2 (u ), A(u ) 0.5
celor sub 0,5, astfel: AINT(u)= .
1 2 * (1 A(u )) , A(u ) > 0.5
2

Poate fi folosit pentru a exprima termenul ntr-adevr.

AINT

Operaii cu mulimi fuzzy


Prin faptul c funciile sunt definite pe subdomenii reprezentate prin mulimi, noiunile clasice ale
teoriei mulimilor (intersecia, reuniunea, complementaritatea, incluziunea, etc.) sunt extinse la funciile de
apartenen. Mulimile fuzzy pot fi reprezentate ca o submulime de mulimi clasice incluse unele n altele,
numite nivele de tiere. Scopul reprezentrii prin nivele de tiere este s se poat extinde uor noiunile
teoretice din teoria mulimilor clasice la mulimile fuzzy.
De exemplu, pentru funcia de apartene A se definete nivelul de tiere t prin mulimea
0 pentru A(u)<t
At =
1 pentru A(u) t

At

Fie F i G submulimi fuzzy ale universului de discurs U. Considerm urmtoarele operaii asupra mulimilor
fuzzy:
incluziunea (F este o submulime a lui G) dac - F G F(u) G(u), u U .

22
intersecia
(F G)(u) = min(F(u),G(u))
sau varianta Lukasiewicz (F L G)(u) = max(0, F(u) + G(u) 1)
sau produsul probabilistic (F P G)(u) = F(u) * G(u)

F G

varianta clasic
reuniunea
(F G)(u) = max(F(u),G(u))
sau varianta Lukasiewicz (F L G)(u) = min(1, F(u) + G(u))
sau suma probabilistica (F P G)(u) = F(u) + G(u) F(u) * G(u)

F G

complementaritatea FC (u) = 1 F(u) .

egalitatea A=B dac A(u)=B(u), u U .


produs cartezian A B(u , v) = min(A(u ), B( v)) ;

cardinalitate card(A ) = A(u ) ;


ui
i

comensurabilitate scala de apartenen poate fi aceeai pentru diverse mulimi fuzzy implicate ntr-
un tot unitar. Rolul gradului de apartenen este de a stabili comensurabilitatea ntre entiti care nu au
legturi unele cu altele, dar sunt legate ntr-un context la nivel semantic.
sup A(u) = t B(u)
COMP(A;B)(t) = -1
, t [0,1]
0 daca A (t) =

Inferen fuzzy
n lumea real, multe cunotine sunt imperfecte sau incerte, iar fiina uman este capabil s obin
concluzii sigure (diagnostic, decizie, etc.) folosind premise aproximate. Raionamentele prin aproximare
trebuie s fie combinate cu o modalitate de reprezentare a cunotinelor imperfecte, incerte sau imprecise
23
astfel nct s fie capabile s propage aproximarea n cursul etapelor de raionament. Anumite forme ale
raionamentului prin aproximare, cum ar fi raionamentul prin interpolare, raionamentul dup preferin,
raionamentul calitativ i temporal au fost cercetate n diferite modele ale mulimilor fuzzy. Alte forme ale
raionamentului prin aproximare, de exemplu raionamentul bazat pe caz, raionamentul bazat pe similariti,
raionamentul implicit, raionamentul abductiv, raionamentul bazat pe cuantificatori fuzzy, au fost introduse
n modelele raionamentului plauzibil din teoria posibilitii. Toate aceste forme de raionament trebuiesc
tratate independent i separat.
Raionamentul prin aproximare i raionamentul plauzibil au la baz metode de calcul asupra
cunotinelor imperfecte pentru a putea obine consecine posibile ale deciziilor poteniale, pentru diagnoz,
sau pentru a elabora un plan, pentru a prevedea evenimente, sau a presupune stri de fapte. Scopul principal
al raionamentelor prin aproximare i plauzibil este de a obine, n mod eficient, reprezentri aproximate ale
cunotinelor imperfecte folosind un sistem de calcul. Datorit complexitii raionamentului uman, n
sisteme de calcul nu se pot modela dect fragmente ale acestuia.

Cel mai dificil aspect n modelarea raionamentului prin aproximare este gsirea unei reprezentri
simple a cunotinelor care s permit obinerea impreciziei cunotinelor umane aa cum sunt ele exprimate
prin limbaj natural. Trebuie s se gseasc o legtur ntre pstrarea expresivitii, care este o parte a
abundenei limbajului natural i simplificarea cunotinelor, care le face mai uor de folosit ntr-un sistem de
calcul. Teoria mulimilor fuzzy asigur o modalitate de transformare a reprezentrii mentale a cunotinelor
n entiti care s suporte constrngeri i s poat fi folosite n modelare.

O propoziie fuzzy este de forma x este A, unde x este o variabil cu valori n universul de discurs U, iar A
este o mulime fuzzy. O propoziie fuzzy elementar este de forma x ia valoarea u, unde u este un element
al domeniului de discurs U. O astfel de propoziie se numete precis n raport cu referina U. Toate
propoziiile care nu sunt elementare i sunt diferite de false-F, sunt imprecise.
Trebuie s se fac distincie ntre noiunile imprecise:
non-fuzzy de exemplu nlimea este ntre 70 i 80 cm;
fuzzy - nlimea este n jur de 75;
O propoziie ntotdeauna fals F, este x ia valori din , iar o propoziie ntotdeauna adevrat T

este x ia valori din U.


Coninutul propoziiei imprecise x este A poate fi reprezentat prin mulimea fuzzy de valori mai
mult sau mai puin posibile pe care le poate lua variabila x: A(u), adic posibilitatea ca x s ia valoarea u este
dat de gradul de apartenen a lui u la A.
Dac exist o singur valoare u pentru care A(u)=1, atunci faptul x este u este precis. Dac exist mai
multe valori u pentru care A(u)=1 i 0 n rest, atunci faptul x este u este imprecis, dar este non-fuzzy.
Dac A(u) (0,1) atunci faptul x este u este fuzzy.

24
Abordare inferenial general a raionamentului prin aproximare
Are la baz folosirea regulilor de producie care constau din:
Condiie este alctuit din elemente condiionale legate prin operatori logici and, or;
Concluzie care poate s introduc un nou fapt n baza de fapte, s emit o ipotez, s declaneze o
procedur sau o aciune;
Factor de ncredere care este un coeficient numeric ataat regulii pentru a exprima ncrederea n
regula respectiv.
Forma general a unei reguli fuzzy este: Condiie ->( implica) -> Concluzie

De asemenea, i cunotinele pot avea ataai coeficieni de ncredere, caz n care, n inferen se urmresc
trei aspecte:
Potrivirea faptelor existente n lista de fapte cu partea condiional a regulilor (procesul de pattern-
matching);
Propagarea incertitudinii;
Combinarea incertitudinii n cazul concluziilor multiple;

Metodele de raionament care lucreaz numai din punct de vedere semantic introduc reguli fuzzy i inferena
acestora prin modus ponens generalizat.
Se consider regula dac x A atunci y B , unde x i y variabile din domeniile U i V, iar A i B sunt
submulimi ale lui U i V. Aplicarea regulii de inferen Modus Ponens n logica fuzzy are urmtoare form:
Premis: dac x A atunci y B
Ipotez (fapt): x A
Consecin: y B
unde B=A o ( A B )

Implicaia o este util pentru reprezentarea regulilor fuzzy i determin imaginea fuzzy a mulimii A prin
relaia de implicare. Exist dou familii de implicaii:
S-implicaia poate lua una din formele:
implicaia Kleene-Dienes: max(1-a,b), (S este de forma max).
implicaia Reichenbach: 1-a+a*b, (S este de forma sumei probabilistice).
R-implicaia este folosit n procesele de deducie cu nelesul c b este cel puin la fel de adevrat ca
i a.
Inferena fuzzy A B poate fi implementat prin operatorii minim sau produs.

25
1.6 Teorii logice ale incertitudinilor

Deoarece n multe domenii ale inteligenei artificiale se lucreaz cu cunotine incerte, a aprut
necesitatea introducerii unor teorii logice ale incertitudinii, care asociaz unei mulimi de formule logice
(considerate axiome), grade de ncredere (de certitudine), exprimate astfel:
{(p i , i ) | i = 1,..., n}, i = g(p i ) .
Astfel de teorii care lucreaz cu reprezentarea incertitudinii din cunotine i care au asociate i metode de
raionament sunt:
asocierea la formulele din logica clasic a unui grad de incertitudine, exprimat prin gradul de probabilitate
care reflect numrul de interpretri n care formula este adevrat pentru un anumit model dat i printr-o
distribuie de probabilitate asupra modelelor (Los, 1963, Fenstad, 1967, Carnap, 1950).
grade de posibilitate i necesitate asociate formulelor din logica clasic sau formulelor nchise din logica
de ordin nti (Dubois and Prade, 1984).
logica definit de teoria Dempster-Shafer.
Pentru teoriile logice ale incertitudinii au fost propuse metode de deducie automate (Van Emden,
1986, Subrahmanian, 1987, 1988) pentru utilizarea diferitelor reguli de combinare pentru gradele de
incertitudine, fr s se fac referire la o anumit interpretare n termeni de msur a incertitudinii
(probabilitate, posibilitate sau altceva). Datele (p i , i ) sunt interpretate ca o mulime de constrngeri care

limiteaz o msur de incertitudine g, incomplet caracterizat. Semantica lui (p i , i ) exprim o mulime de

msuri de incertitudine g notat i = {g | g (p i ) = i } . Raionamentul const n evaluarea intervalului care

conine g(p) pentru o formul dat p, interval obinut prin intersecia mulimilor I P asociate celor n
i
i

formule (p i , i ) . Rspunsul unui sistem, bazat pe logica incertitudinii, pentru formula p este un interval

[, ] care include g(p). Interpretarea acestui interval depinde de tipul msurii de incertitudine utilizat
(probabilitate, posibilitate, etc.). Oricare grad de incertitudine este utilizat, acesta trebuie s aib o
interpretare clar, dependent de contextul n care este definit. Modalitile de combinare i propagare a
acestor grade sunt bine definite n logica probabilitii, logica posibilitii, logica definit de teoria lui Shafer.
Aceste tipuri de logici sunt utilizate pentru tratarea numeric a incertitudinii.

Exist mai multe interpretri sub care se poate trata calificativul incert:
Extensional calificativul incert este interpretat ca valoare de adevr generalizat, adic certitudinea
unei entiti este definit ca o funcie unic a certitudinilor sub-entitilor din care este format.
Notaia A B nseamn c atunci cnd apare A se poate calcula certitudinea lui B printr-o
p

echivalen care este o funcie care exprim puterea regulii p. Propagarea certitudinii este justificat
dac se presupune implicit independena condiional ntre cunotinele domeniului (impactul lui A

26
asupra ncrederii lui B din regula A B nu depinde de faptul c alt regul care influeneaz A sau
p

B a fost executat).
Intensional asigneaz certitudini mulimilor de posibiliti i formulelor combinate prin aplicarea
operaiilor teoriei mulimilor asupra mulimilor reprezentate prin formule. O entitate notat cu
A B este interpretat n sensul certitudinii condiionale: certitudinea apariiei evenimentului B
p

condiionat de adevrul despre A este egal cu puterea regulii p (adic g(B|A)=p).


Exist teorii la care reprezentrile de cunotine pot avea interpretri i intensionale i extensionale (de
exemplu un sistem probabilistic).
Pentru reprezentarea intuitiv a bazelor de cunotine incerte i pentru a uura raionamentul se
folosesc modele grafice de reprezentare a cunotinelor, care combin reprezentarea grafic a dependenelor
dintre cunotine cu gradele de certitudine asociate fiecrei componente.
Cel mai cunoscut sistem care a folosit grade de certitudine pentru a reprezenta grade pariale de
ncredere a fost MYCIN, un sistem expert pentru diagnosticarea infeciilor bacteriene (anii 1980). Motorul
de inferen al sistemului MYCIN este cu nlnuire napoi i scopul su este de a cuta bolile posibile pentru
anumite simptome. Raionamentul n MYCIN deriv din noiunea de probabilitate condiionat, iar factorul
de ncredere utilizat poate fi interpretat din punct de vedere extensional, ca msuri de necesitate i de
imposibilitate.
Un alt sistem expert este Prospector, care utilizeaz calificativul incert din punct de vedere
extensional.

1.6.1 Teoria clasic a probabilitii

Teoria clasic a probabilitii este o teorie demonstrat, cu axiome clare i necontestate i cu aplicaii
avansate. Controversele relative la teoria probabilitii se refer la interpretare (calculul anselor, frecven,
subiectivitate) i la modul de obinere al valorilor probabilitilor (statistic, empiric).
Teoria probabilitii permite raionamentul evenimentelor incerte i se bazeaz pe noiunea de
probabilitate P a unui eveniment incert a, notat cu P(a), definit ca frecvena de apariie a evenimentului
bazat pe observaiile anterioare.
Axiome ale teoriei probabilitii:
P(a) este un numr n intervalul [0,1].
Dac a este un eveniment sigur atunci P(a)=1.
Dac a i b sunt evenimente mutual exclusive, atunci P(a b) = P(a) + P(b) . Mutual exclusive
nseamn c nu pot fi adevrate simultan.
Dac a este un eveniment, atunci P(a a) = P(a) + P(a) = 1 , adic probabilitatea unui eveniment
sau a evenimentului contrar este egal cu 1.

27
1.6.2 Logica posibilist

Posibilitatea i necesitatea au fost subliniate pentru prima oar de Aristotel, dar apoi au fost dezvoltate
n cadrul unui formalism de reprezentare a cunotinelor incerte, pentru care se folosesc msuri graduale
(Zadeh, 1978; Dubois and Prade, 1987).
Logica posibilist utilizeaz formule din calculul propoziiilor sau formule nchise din logica de ordin
nti, la care adaug un grad de posibilitate sau necesitate, care are valori n intervalul [0,1] (de exemplu,
predicatul Tanar(X) este adevrat sau fals cu un anumit grad de posibilitate).
Fie ( p) gradul sau msura de posibilitate a formulei p i N(p) msura necesitii lui p. Logica
posibilist definete un set de axiome i convenii astfel:
N(p) =1 coninutul cunotinelor disponibile n formula p este cert/sigur adevrat

(p) =0 coninutul cunotinelor disponibile este imposibil astfel nct p s fie adevrat

p, (p) = 1 - N(p)
(in particular, ( p) =0 N (p) = 1 , adic dac p este imposibil, atunci p este sigur adevrat)

( p ) = ( p ) = 1
exprim c nici nu se afirm p, nici nu se infirm p (caz de ignoran total)
N ( p ) = N ( p ) = 0

axioma fundamental a msurilor de posibilitate (Zadeh, 1978; Dubois, Prade, 1987):


( p q) = max( (p), (q))
se face presupunerea c informaia imprecis sau vag asupra creia se aplic gradul de posibilitate
este descris n termeni de mulimi fuzzy
axioma dual pentru msura necesitii:
N( p q ) = min( N(p), N(q ))

p, (p) N(p) - o formul este posibil adevrat nainte de a fi necesar adevrat, deoarece
max( (p), (p)) = 1 N(p) > 0
(p) = 1, deci N(p) = 0
p, (p) N(p)
dac apare o inconsisten ntr-o propoziie p astfel nct
N(p) > 0 and N(p) > 0 min(N(p),N(p)) se apropie de 1
ceea ce nseamn c p i p sunt simultan adevrate.

N(p) > 0 (p) = 1

(p) < 1 N(p) = 0

N(p) + N(p) 1

(p) + (p) 1

28
Msurile de posibilitate i necesitate constituie, din punct de vedere matematic, cele mai bune exemple
de probabiliti inferioare i superioare (Dubois, Prade, 1987). Adic, dndu-se perechea (, N ) aceasta
delimiteaz msura probabilitii astfel: p, N(p) P(p) (p) .
N( p) = inf{P(p)}
(p) = sup{P(p)}
Teoria posibilitii a fost folosit mpreun cu alte teorii pentru a se lucra cu piese de informaii incerte
i au fost studiate mai multe aspecte ale teoriei, astfel: teoria posibilitii n legtur cu mulimile fuzzy ce
permit lucrul cu posibiliti i necesiti numerice (Dubois, Prade,1988), teoria posibilitii asociat cu
funcia de ncredere pentru valori numerice (Klir, Folger, 1988), teoria posibilitii din punct de vedere
cantitativ cu aspecte matematice teoretice i practice (De Cooman, all, 1995, 1997), deosebirile dintre
aspectele calitativ i cantitativ ale teoriei (Dubois, Prade, 1998).

1.6.3 Teoria Dempster-Shafer

Definiia msurii de credibilitate (Shafer, 1976) se face plecnd de la o funcie sau o distribuie de
mas de probabilitate m astfel:
m (False) = 0 ; m(p) = 1
p

Propoziiile p asupra crora se distribuie unitatea de mas total (adic cele pentru care m(p)>0) se
numesc propoziii focale.
Msura de credibilitate se exprim prin: dac p i q sunt propoziii, atunci CR(q) =
p,p a q
m(p) .

CR este o msur de incertitudine.


Prin dualitate se definete msura de plauzibilitate PL, astfel:
dac p este o propoziie, atunci PL( p) = 1 CR (p)

dac p i q sunt propoziii, atunci PL(q) = m(p)


p,p nu a q

Proprieti ale msurilor de credibilitate i plauzibilitate (Shafer, 1976):


dac p a q atunci CR (p) CR (q ) si PL(p) PL(q) ;

CR ( p q ) CR (p) + CR (q ) CR (p q ) ;

PL( p q ) PL(p) + PL(q) PL( p q) ;

CR (p) + CR (p) 1 ;

PL( p) + PL(p) 1 ; CR (p) PL(p) ;

n caz de ignoran total avem


CR (p) = CR (p) = 0
, adic propoziiile contrare pot fi plauzibile, dar nu sunt credibile.
PL(p) = PL(p) = 1

29
1.7 Raionamentul prin aproximare i raionamentul plauzibil

n lumea real, multe cunotine sunt imperfecte sau incerte, iar fiina uman este capabil s obin
concluzii sigure (diagnostic, decizie, etc.) folosind premise aproximate. Raionamentele prin aproximare
trebuie s fie combinate cu o modalitate de reprezentare a cunotinelor imperfecte, incerte sau imprecise
astfel nct s fie capabile s propage aproximarea n cursul etapelor de raionament. Anumite forme ale
raionamentului prin aproximare, cum ar fi raionamentul prin interpolare, raionamentul dup preferin,
raionamentul calitativ i temporal au fost cercetate n diferite modele ale mulimilor fuzzy. Alte forme ale
raionamentului prin aproximare, de exemplu raionamentul bazat pe caz, raionamentul bazat pe similariti,
raionamentul implicit, raionamentul abductiv, raionamentul bazat pe cuantificatori fuzzy, au fost introduse
n modelele raionamentului plauzibil din teoria posibilitii. Toate aceste forme de raionament trebuiesc
tratate independent i separat.
n logica clasic, o propoziie (care exprim corpul unei cunotine) poate fi adevrat, fals,
necunoscut sau nedeterminat, n cadrul unei teorii. Dar de cele mai multe ori este nevoie s se raioneze cu
cunotine i date inexacte, incerte sau imprecise (limbaj calitativ). Tipurile de probleme care au nevoie de
raionament cu cunotine incerte sau imprecise sunt: de diagnoz, interpretarea semnalelor sau a imaginilor,
luarea de decizii, interogarea bazelor de date.
Exist mai multe abordri ale raionamentului prin aproximare.

1.7.1 Abordare inferenial general


Are la baz folosirea regulilor de producie care constau din:
Condiie este alctuit din elemente condiionale legate prin operatori logici and, or;
Concluzie care poate s introduc un nou fapt n baza de fapte, s emit o ipotez, s declaneze o
procedur sau o aciune;
Factor de ncredere care este un coeficient numeric ataat regulii pentru a exprima ncrederea n regula
respectiv.
De asemenea, i cunotinele pot avea ataai coeficieni de ncredere, caz n care, n inferen se urmresc
trei aspecte:
Potrivirea faptelor existente n lista de fapte cu partea condiional a regulilor (proces pattern-matching);
Propagarea incertitudinii;
Combinarea incertitudinii n cazul concluziilor multiple;

1.7.2 Probabiliti i raionament Bayesean


Probabilitatea ataat unui eveniment poate exprima frecvena de apariie a evenimentului respectiv
(abordarea frecventist sau statistic) sau gradul de ncredere asociat evenimentului (abordarea subiectiv).
Teorema lui Bayes se aplic pentru a calcula probabilitatea condiional a unei ipoteze H dndu-se observaia
sau evidena E:
30
P(E | H) P(H)
P(H | E) =
P(E)
Se tie c P(E) este o constant de normalizare care poate fi calculat, de exemplu, prin marginalizare:
P(E ) = P(E, H ) = P(E | H )P(H ) cu condiia ca P(H ) = 1
i
i
i
i i
i
i

Dac sunt mai multe evidene conjunctive E1 ... E m , atunci pentru aplicarea teoremei lui Bayes sunt

necesare 2 n 1 probabiliti apriori, (2 m 1) 2 n probabiliti condiionate, fiind posibile 2 n + m situaii.


Pentru a evita numrul mare de calcule se ine cont de ipoteza de independen condiional i teorema lui
Bayes devine:
P(E 1 | H)...P(E m | H) P(H)
P(H | E 1 ... E m ) = n

P(E
i =1
1 | H i )...P ( E m | H i ) P ( H i )

care presupune adevrate trei ipoteze: H i sunt mutual exclusive, exhaustive i evidenele condiionate de
ipoteze sunt independente. Dar, n practic, aceste trei ipoteze nu sunt realiste i nu pot fi aplicate n
sistemele complexe. Alte dezavantaje sunt:
trebuiesc estimate toate probabilitile apriori, ceea ce este dificil, deoarece valorile numerice sunt
obinute de la experi ntr-o manier empiric;
propagarea probabilitilor necesit calcule numeroase, cu toate c anumii coeficieni pot s aib doar
o influen minor asupra rezultatelor;
este imposibil s se reprezinte ignorana;
condiia ca suma probabilitilor s fie egal cu 1 face dificil evaluarea bazei de cunotine;

1.7.3 Teoria Dempster-Shafer pentru raionamentul plauzibil


Aceast teorie (Shafer, 1968) permite modelarea situaiilor n care raionamentul se focalizeaz mai
mult asupra ntregii mulimi de ipoteze, dect asupra ipotezelor elementare. Pentru raionament se atribuie
ncrederi att sub-mulimilor de elemente, ct i elementelor singleton ale mulimii de ipoteze de apariie a
evenimentelor.
Plauzibilitatea i credibilitatea au conotaii specific epistemice i pot fi obinute prin inferen plecnd de la
cunotinele date: este credibil tot ce se deduce direct din corpul cunotinei i este plauzibil tot ceea ce se
induce a nu fi n contradicie.
n concluzie, teoria Dempster-Shafer permite asocierea gradelor de incertitudine i sub-mulimilor de
ipoteze, nu numai ipotezelor singleton, exprimnd ncrederea sau credibilitatea printr-un interval
[CR(p), PL(p)] [0,1] .
Gradul de incertitudine asupra propoziiei p este INC(p) = PL(p) CR(p) . Dac INC(p) este 0 pentru toate
propoziiile unui domeniu de discurs, atunci sistemul se raporteaz la un sistem Bayesean.
Interpretri date intervalului [CR (p), PL(p)] :

[0,1] semnific faptul c nu se tie nimic despre p;


31
[0,0] p este fals;
[1,1] p este adevrat;
[, ] - probabilitatea lui p este egal cu ;

[,1] - sursa de cunotine suport parial p;

[0, ] - sursa de cunotine suport parial p ;

[, ] - sursa de cunotine suport p cu gradul i p cu gradul ;


Teoria Dempster-Shafer este folosit n cazul n care se folosesc surse de cunotine independente (de
exemplu sistemele de interpretare de semnale prin cuvinte, imagini, semnale industriale). Informaia
furnizat de sursele de cunotine se traduce prin afectarea distribuiilor de mas de probabilitate. De
asemenea, teoria Dempster-Shafer este folosit pentru a modela raionamentul care ine cont de ignorana
total i care d posibilitatea de a se cumula informaii furnizate de diferite surse de cunotine.
Raionamentul se desfoar astfel: n absena informaiei iniiale, masa de probabilitate total este afectat
iniial. Apoi, pe msur ce apar rezultatele observaiilor, masa de probabilitate se deplaseaz spre sub-
mulimile corespondente evenimentelor care sunt cele mai specifice pn n momentul n care ntlnete,
eventual, mulimi de singletonuri corespunztoare ipotezelor individuale. n cazul surselor de cunotine
multiple, masele se combin (prin sum ortogonal). Credibilitatea i plauzibilitatea diferitelor ipoteze se
calculeaz prin cumulare.

1.7.4 Raionament posibilist


Teoria posibilitii (Dubois and Prade, 1987) trateaz noiuni de imprecizie i incertitudine folosind
noiunea de distribuie de posibilitate, legat de apartenena fuzzy la o mulime.
Se tie c p, (p) N (p) - o formul e posibil nainte de a fi necesar.
Intervalul [N(p), (p)] caracterizeaz incertitudinea asupra propoziiei sau formulei p i are ntotdeauna
unul din cele dou capete la limita intervalului [0, 1]. Probabilitatea lui p se gsete n acest interval.
n teoria probabilitilor P(p)=1 arat c p este cert.
n teoria posibilitilor avem urmtoarele combinaii:
N(p) = 1 si (p) = 1 N(p) = 0 si (p) = 0 arat c p este cert;

N(p) < 1 si N(p) < 1 nseamn c informaia este incomplet;

N(p) > 0 si N(p) > 0 arat c avem incoeren.

32
2. Metode de reprezentare a cunotinelor imperfecte prin modele
grafice

Modelele grafice folosesc, pentru reprezentare, grafuri, ale cror noduri reprezint variabile aleatoare,
iar arcele reprezint legturile de dependen condiional dintre noduri.
Modelele grafice pot fi:
Neorientate numite i cmpuri aleatoare Markov (MRF). Acestea au o definiie simpl a
independenei: dou noduri A i B sunt condiional independente dac, se d nodul C astfel nct
toate legturile dintre nodurile A i B se fac prin nodul C. Sunt folosite n fizic i la prelucrri de
imagini.
Orientate numite i reele de incertitudini, au o definiie a independenei mai complicat. Sunt
folosite n statistic, inteligent artificial, relaii deterministe, nvare.
nlnuite care sunt o combinaie ntre modelele grafice orientate i cele neorientate.

Ideea fundamental a modelelor grafice este aceea de modularitate, permind unui sistem complex s
fie construit prin combinarea unor subsisteme simple.
Reelele pentru reprezentarea cunotinelor incerte sunt modele grafice care au la baz o teorie logic
(probabiliti sau posibiliti) i teoria grafurilor, asigurnd o modalitate natural de a rezolva probleme
complexe, care conin incertitudini, din domeniul matematicii aplicate, din domeniul ingineresc i din
inteligen artificial. Teoria logice sunt folosite pentru legturile dintre subsistemele de cunotine,
asigurnd consisten ntregului sistem i pentru interfaa dintre date i model. Teoria grafurilor asigur un
model grafic, prin care utilizatorul poate modela interactiv seturi de variabile sau structuri de date i
legturile dintre acestea.
Modele grafice pentru reprezentarea dependenelor probabilistice sunt: reelele Bayesene, grafuri
Markov si distribuii Gibbs, arbori de probabiliti, modele Markov ascunse (care sunt cazuri speciale ale
reelelor Bayesene), procese de decizie Markov (MDP) i procese de decizie Markov parial observabile
(POMDP), reprezentri combinate. Multe din sistemele probabilistice, cum ar fi statistica, teoria informaiei,
recunoaterea formelor, modele Markov ascunse, filtre Kalman, modele Ising, sunt cazuri speciale ale
formalismului general al modelelor grafice, [Michael Jordan, 1998].

33
2.1 Reprezentarea cunotinelor prin reele Bayesene

Reelele Bayesene reprezint o metod grafic de reprezentare a cunotinelor, care folosete teoria
probabilitii matematice pentru modelarea incertitudinii asupra informaiilor i asupra diverselor aspectelor
de interes. Acestea au asociate metode de raionament care combin cunotinele incerte cu evidena
observabil pentru a obine noi cunotine. Reelele Bayesene se mai numesc i reele de ncredere (belief
networks), hri de cunotine (knowledge maps), reele cauzale probabilistice (probabilistic causal
networks). Mai departe le vom referi cu denumirea de reele Bayesene.
Modelele grafice probabilistice bazate de grafuri orientate aciclice (DAG) au o tradiie bogat, care
ncepe cu geneticianul Sewall Wright (1921). Variante ale acestor modele au fost folosite n multe domenii,
dar odat cu apariia tiinei cognitive i a inteligenei artificiale acestea s-au folosit sub denumirea de reele
Bayesene. Dezvoltarea lor iniial, la sfritul anilor 1970 a fost motivat de nevoia de a modela combinaiile
de evidene sub dou aspecte top-down (semantic) i bottom-up (perceptual). Posibilitatea de a infera
bidirecional, combinat cu rigurozitatea teoriei probabilitii au dus la folosirea reelelor Bayesene ca
metode de raionament n cazurile de incertitudine din inteligena artificial i din sistemele expert,
nlocuind, astfel, sistemele bazate pe reguli folosite anterior, (Pearl, 1988, Shafer and Pearl, 1990,
Heckerman and all, 1995, Jensen, 1996).
Pe scurt, reelele Bayesene sunt definite cu ajutorul grafurilor, care au asociate tabele de probabiliti
i care sunt folosite pentru a modela i raiona cu incertitudini.
Principalul scop al raionamentelor n reelele Bayesene este acela de a recalcula probabilitile
asociate variabilelor innd cont de noile evenimente observate i de a exploata presupunerile de
independen dintre variabile pentru a face calculele mai eficiente.

2.2 Teoria probabilitii aplicat reelelor Bayesene

Teoria probabilitilor poate fi privit sub mai multe aspecte diferite:


clasic probabilitatea este proporia dintre numrul de cazuri favorabile din numrul total de cazuri
(posibile).
frecventist probabilitatea este o valoare limit, care reprezint frecvena de apariie a unui anumit
eveniment dintr-un numr infinit de ncercri.
logic probabilitatea este o proprietate logic a unei stri de cunotine despre un fenomen i exist
independent fa de experien.
subiectivist probabilitatea este un grad de ncredere ideal exprimat de un agent despre un
eveniment incert (Bayesian).
Reelele Bayesene sunt utilizate pentru reprezentarea cunotinelor incerte, ntre care exist legturi cauzale,
exprimate cu ajutorul probabilitilor privite din punct de vedere subiectivist.

34
Dndu-se o submulime X ={ x1,, xn } de variabile aleatoare xi , unde x i U , astfel nct toate
variabilele din X au stri observabile. Atunci se obine o instan a lui X, care va fi notat cu:
P(X| ) = X = P(x i | x1 ,.., x i 1 , ) = P(x i | x , )k
i
i X

pentru toate observaiile x i = k i , unde x i X .

reprezint informaia de stare iniial, de baz, care este cunoscut.

2.2.1 Msuri ale probabilitii

Logica probabilitii aplicat reelelor Bayesene modeleaz incertitudinea informaiei de baz i


dependenele cauzale i funcionale dintre evenimente cu ajutorul urmtoarelor mrimi:
Distribuia de probabilitate a mulimii X={x1,,xn}, unde x1,,xn sunt evenimente mutual exhaustive
(acoper toate posibilitile), este dat de mulimea de valori {P(x1),,P(xn)}. Evenimentele probabile
x1,,xn sunt numite i instane al mulimii X.
Dac mulimea X este discret sau continu, distribuia de probabilitate satisface urmtoarele condiii:
o Discret mulimea X este de forma X ={ x1,, xn } i se obine un set finit de rezultate
posibile: P(xi)>=0, care ndeplinesc urmtoarea condiie de normalizare:
n

P(x ) = 1
i =0
i

daca X este binar avem P(x) + P(x) = 1

0,4

0,3

0,2

0,1

x1 x2 x3 x4
Fig. 1.1 Exemplu de distribuie de probabilitate pentru variabile discrete

o Continu mulimea X are valori dintr-un interval, X [a,b] i se obine distribuia de


probabilitate (sau funcia densitate) peste valori continue:
b

P(x)dx = 1 , unde P(x)>=0


a

7
De exemplu P(5<x<7)= P(x)dx 5

35
P(x)

5 7 x
Fig. 1.2 Exemplu de distribuie de probabilitate pentru variabile continue

evenimente asociate (joint) presupunem c sistemul S este realizat din dou subsisteme cu urmtoarele
instane:
A={a1,,an} i B={b1,,bm}.
Distribuia de probabilitate asociat lui A i B, notat cu P(A,B), este dat de mulimea de valori
{P(a1,b1),,P(a1,bm),,P(an,b1),,P(an,bm)}={ P(ai,bj)| i=1n,j=1m},
unde P(ai,bj) este probabilitatea evenimentului (ai bj).
n cazul general distribuia de probabilitate asociat este dat de formula:
P(x , y) P(X=x Y=y), adic probabilitatea ca X=x i Y=y

probabilitate condiional este gradul de ncredere a evenimentului incert X=x dndu-se c Y=y
(evenimentul Y este cunoscut):
P(x | y) P(X=x | Y=y)
Dac se mai adaug i informaie de stare iniial C avem: P(X|Y,C).
n cazul n care P(X|Y,C)=P(X|C), se spune c X i Y sunt condiional independente n contextul C.

2.2.2 Reguli ale teoriei probabilitii Bayesene

Adaptate reelelor Bayesene specificm n continuare o serie de reguli ale teoriei probabilitii folosite
pentru calculul probabilitii asociate unor evenimente reprezentate cu ajutorul reelei:
regula produs
P(X , Y) = P(X | Y) P(Y) = P(Y | X) P(X)
marginalizarea dac se cunoate distribuia de probabilitate asociat P(X,Y) atunci se poate
calcula probabilitatea P(X) cu urmtoarea formul (numit marginalizare):
n
P(X)= P(X, y )
i =1
i

tiind c evenimentele (x,y1),...,(x,ym) sunt mutual exclusive.


Folosind aceast formul se spune c Y este marginalizat prin P(X,Y).

Daca Y este binar avem P(X) = P(X,y) + P(X,y)

Teorema lui Bayes (Thomas Bayes a fost matematician i teolog, secolul XVIII)

36
Pornete de la regula produs P(H , E) = P(H | E) P(E) = P(E | H) P(H) pentru a calcula ncrederea
n ipoteza H innd cont de noua eviden E:

P(E | H) P(H)
P(H|E) =
P(E)

n general, teorema lui Bayes se folosete pentru a recalcula ncrederea P(H|E) prin produsul
dintre ncrederea aprioric P(H) i probabilitatea P(E|H), care este probabilitatea de apariie a
evenimentului E atunci cnd ipoteza H este adevrat. P(E) este o constant de normalizare care
poate fi calculat, de exemplu, prin marginalizare:
P(E ) = P(E, H ) = P(E | H )P(H ) cu condiia ca P(H ) = 1
i
i
i
i i
i
i

Astfel teorema lui Bayes devine:


P(E | H) P(H)
P(H|E) =

i
P(E | H i )P(H i )

De exemplu, n cazul n care H este binar avem:

P(e | h) P(h) P(e | h) P(h)


P(h|e) = =
P(e ,h) + P(e , h) P(e |h) P(h) + P(e | h) P(h)
Dac se introduce i contextul modelului teorema lui Bayes devine:

P(H | C) P(E|H,C)
P(H|E,C) =
P(E|C)

Cu urmtoarele reprezentri: H - ipoteza, E - evidena, C - context.


Probabilitile condiionate arat gradul de ncredere n unele propoziii bazate pe presupunerea
c alte propoziii sunt adevrate.
P(H|E,C) este probabilitatea posterioar a ipotezei H innd cont de efectul evidenei E asupra
contextului C.
P(H|C) este probabilitatea aprioric a ipotezei H, n contextul C.
P(E|H,C) probabilitatea evidenei E dndu-se H i C adevrate.
P(E|C) factor de normalizare sau factor de scalare.

Regula nlnuirii (descompunerea) se obine din regula produs prin deducie, astfel:
P(X1,X2)=P(X1 | X2) P(X2) pentru dou variabile.
P(X1,X2,X3)=P(X1 | X2, X3) P(X2, X3)=P(X1 | X2, X3) P(X2 | X3) P(X3) pentru trei variabile.
P(X1,X2,...,Xn)=P(X1 | X2,, Xn) P(X2 | X3,, Xn) P(Xn-1 | Xn) P(Xn) regula nlnuirii
pentru cazul general.

37
Aceast formul este util n reelele Bayesene, deoarece poate fi folosit la calculul distribuiei
de probabilitate asociat pentru ntreaga reea. n reelele Bayesene existena nodurilor
condiional independente reduce mult calculele necesare. n general, toate probabilitile pot fi
calculate din distribuia de probabilitate asociat, care se obine mult mai simplu atunci cnd
exist ct mai multe noduri condiional independente.

2.3 Aspecte reprezentaionale ale reelelor Bayesene

Pentru reprezentarea reelelor Bayesene se folosesc grafuri aciclice orientate (DAG Directed Acyclic
Graph) care au ataate probabiliti:
Noduri i variabile nodurile sunt folosite pentru reprezentarea variabilelor propoziionale de interes
(de exemplu, temperatura unui sistem, vrsta unui pacient, proprietatea unui obiect, observarea unui
eveniment). Fiecare nod are asociat o variabil xi. Notm cu U={ x1 ,..., x m } domeniul de variabile.
Variabilele pot lua valori discrete (cu numr finit sau numrabil de stri) sau continue.
Arce pentru reprezentarea legturilor informaionale i a dependenelor cauzale dintre variabile.
Incertitudinea este reprezentat la nivelul fiecrui nod i exprim fora cauzalitii ntre variabile.
Probabilitatea fiecrui nod, dndu-se prinii si, pentru a cuantifica dependenele dintre variabilele
din reea. Probabilitatea este dat astfel:
o pentru nodul rdcin al grafului se specific toate gradele de probabilitate (numite apriori)
asociate fiecrei instane (x) a variabilei (xi) ataat nodului. Pentru fiecare nod rdcin
probabilitatea trebuie s asigure condiia de normalizare astfel nct P(x) = 1 .
xXi

o pentru celelalte noduri, care nu sunt rdcini ale grafului, se specific probabilitile
condiionale astfel:
P(x i |pa i ), unde pa i = parinti(x i ) este un element al produsului cartezian i X i .
Probabilitatea condiional trebuie s verifice condiia de normalizare astfel nct
pa i i X i , P(x
x i Xi
i | pa i ) = 1 .

Folosind gradele de probabilitate (apriori i condiional) se calculeaz distribuia de probabilitate asociat.


Condiii care trebuiesc respectate la realizarea unei reele Bayesene:
s includ toate variabilele care sunt importante pentru modelarea sistemului astfel nct, fiecare
variabil s reprezinte un element distinct al situaiei de modelat. Variabilele pot fi discrete sau
continue. O variabil este un element al modelului probabilistic i poate lua diferite valori dintr-o
mulime, valori care sunt mutual exclusive i exhaustive.
s foloseasc cunotinele cauzale pentru a reprezenta conexiunile din graf, astfel nct un arc din graf
s plece de la cauz spre efect.
cunotinele iniiale sunt folosite pentru specificarea distribuiilor condiionale de probabilitate.
38
2.4 Raionament n reelele Bayesene

Scopul reelelor Bayesene este de a face predicii asupra cuantificrii incertitudinii condiionat de
anumite ipoteze i evidene. Reelele Bayesene asociaz nodurilor din reprezentarea grafului probabiliti
condiionate de nodurile cu care sunt n relaii de dependen. Din punct de vedere matematic nelesul | n
P(A|B) este bine definit, dar cnd se modeleaz aspecte ale lumii reale trebuie s se acorde o atenie sporit,
deoarece exist mai multe interpretri ale unei relaii de dependen. La modelarea cunotinelor dependente
ale unui sistem se reprezint doar condiionarea acelor stri sensibile ale modelului.

2.4.1 Tipuri de raionament n reele Bayesene

Din punctul de vedere al relaiilor dintre cunotinele unui sistem (care pot fi considerate ca propoziii
condiionale valide n reelele Bayesene) exist cteva tipuri de raionament. Aceste tipuri de raionament
determin i domeniul de aplicare al reelelor Bayesene.
Cauzal efectul determin cauza, (de exemplu, un accident este cauzat de un defect introdus de
designerul sistemului). Raionamentul cauzal este principala abordare a modelrii folosind reele
Bayesene. Pornind de la acest punct de vedere, topologia reelelor Bayesene reflect structura cauzal
a lumii reale i asigur un model de inferen, de predicie i de explicaii asupra proprietilor
sistemelor reale. Acest mod de interpretare al cauzalitii i are rdcinile n modul de vedere
epistemologic al cauzalitii exprimat de Locke: nu este doar un mod de a descrie lumea real, chiar
este o proprietate a acesteia. Un alt punct de vedere, cel al lui Hume, abordeaz cauzalitatea sub
aspect pur mental, n care cauzele i efectele sunt mai mult conectate, dect produse unul de altele.
n raionamentul cauzal se folosesc aspecte temporale ale relaiilor dintre cunotine, deoarece
explicarea evenimentelor se face innd cont de momentul n care s-au produs acestea. Efectele
urmeaz cauzele, deoarece o cauz se produce mai devreme sau n acelai timp cu efectul su. Aceast
observaie, nu trebuie considerat trivial, deoarece la modelarea variabilelor ntr-o reea Bayesean se
pierde importana evenimentelor n funcie de secvena de timp, care poate ajuta la organizarea
fluxului de cauze i efecte.
O alt component important n raionamentul cauzal este componenta fizic. Acolo unde se pot
identifica conexiunile fizice directe, acestea trebuiesc folosite pentru a identifica structura cauzal,
astfel c, evenimentele i agenii cauzali s fie conectai pentru a putea interaciona.
n reelele Bayesene se folosete probabilitatea condiionat msurat prin P(A|B), care exprim
probabilitatea lui A atunci cnd se cunoate c B este adevrat. n limbaj cauzal aceasta se traduce
prin: B cauzeaz A cu probabilitatea P, unde P exprim gradul de ncredere sau frecvena cu care B
cauzeaz A. Din topologia reelei Bayesene, a ti c B cauzeaz A nu este suficient pentru a ti exact

39
n ce condiii A este cauzat de B. Deci, nu se tie exact cnd un efect este consecina necesar a unei
cauze sau cnd cauza este condiia suficient pentru un efect.
Exist patru tipuri de determinri cauzale care pot fi modelate, de obicei, folosind reele Bayesene:
o Natural se modeleaz efectele unui proces fizic, natural, care se produce fr un motiv, fr un
scop (de exemplu, fumatul duce la apariia cancerului de plmni, un cutremur duce la erori n
sistemul de protecie al unei centrale nucleare);
o Productiv se modeleaz efectul unei aciuni, realizat de om sau de maini (agentul cauzal), care
transform sau creeaz un eveniment sau o stare (de exemplu, un programator care reface o
secven de cod pentru a nltura anumite erori);
o Accidental se modeleaz efectul unei aciuni neintenionate (de exemplu, se caut consecina unui
proces de proiectare care a introdus erori n produs);
o Pentru un scop se modeleaz efectele unei aciuni deliberate;
Cauzalitatea se poate considera o proprietate obiectiv a lumii reale, dar asta nu nseamn c, diferii
observatori, nu pot modela diferit acelai fenomen.
Statistic ansa de apariie a unui eveniment dintr-o populaie de evenimente posibile sau metoda
exemplificrii (de exemplu, posibilitatea de eroare determinat de un numr de erori observate n
anumite condiii). Reele Bayesene pot fi folosite la reprezentarea determinrii statistice, deoarece
probabilitatea evenimentelor este determinat de ansa de a experimenta sau de a alege un eveniment
particular dintr-o mulime de evenimente posibile sau dintr-un proces stohastic (aleator).
Structural fenomenul determinat complet de o structur creia i aparine sau determinat de
proprietile clasei de evenimente creia i aparine (de exemplu defectul modulului X determinat de
introducerea n modului Y). Determinarea structural poate fi modelat cu reelele Bayesene prin
folosirea unor relaii logice i probabilistice. Se pot identifica patru tipuri de determinare structural:
o Determinist unde relaiile dintre noduri sunt logice sau funcionale. n acest caz, valorile unui
nod copil sunt determinate complet de valorile nodurilor prini. Se pot folosi toi operatorii clasici
aritmetici i logici pentru definirea funciilor folosind reele Bayesene.
o De definire unde relaiile dintre noduri sunt definite de alte noduri. n acest caz atributul unei
variabile poate fi definit de sub-atributele sale.
o Arhitectural unde nodurile sunt legate conform unui principiu conceptual sau fizic. Aici
nodurile reelei Bayesene reprezint un ablon al principiului, iar legturile arat interdependena
dintre noduri.
o Analogic unde nodurile motenesc atributele clasei de noduri. Pentru reprezentare se folosesc
analogii sau metafore pentru a transmite proprietile unei clase de obiecte sau evenimente la
obiectul sau evenimentul curent, care este studiat.

40
2.4.2 Semantici probabiliste
Orice model probabilistic al unui domeniu trebuie s reprezinte, implicit sau explicit, distribuia
asociat (joint distribution), care definete probabilitatea fiecrui eveniment posibil cu ajutorul valorilor
tuturor variabilelor. ntr-o reea Bayesean numrul evenimentelor este mare i din aceast cauz
complexitatea de calcul a distribuiei de probabilitate crete exponenial. n aceste condiii se realizeaz
compactarea distribuiei de probabilitate asociat prin factorizarea local a distribuiei condiionale pentru
fiecare variabil dndu-se prinii acesteia. Astfel, dac xi sunt valorile variabilei Xi si pai sunt mulimi de
valori ale prinilor lui Xi, atunci P(xi | pai) este distribuia de probabilitate condiional.
Semantica global a reelelor Bayesene specific distribuia de probabilitate asociat complet
pentru toate variabilele i este dat de produsul:
P(x1,...,xn) = P(x
i
i | pa i ) (2.4.1)

Presupunnd c numrul de prini pentru fiecare nod este limitat, se observ c numrul de parametri cerui
pentru calculul probabilitii condiionale asociate nodurilor crete liniar cu numrul nodurilor reelei, n
timp ce distribuia global asociat crete exponenial. Pentru o reprezentare compact a parametrilor
distribuiei condiionale se pot folosi: modele noisy-OR, arbori de decizie, reele neurale.
Semantica local a reelelor Bayesene specific dependena fiecrei variabile fa de descendenii
acesteia dndu-se prinii. Introducnd independena fiecrei variabile fa de descendenii si ecuaia (2.4.1)
se simplific. Semantica local este util la definirea reelelor Bayesene, deoarece selectarea prinilor dintre
cauzele directe satisface automat condiiile locale de independen condiional.
Semantica global conduce la o varietate mare de algoritmi de raionament.

2.4.3 Algoritmi de raionament

Scopul reelelor Bayesene este acela de a calcula distribuia de probabilitate asociat tuturor
variabilelor reelei care specific semantica global. Pentru simplificarea complexitii i micorarea
numrului de calcule necesare, trebuie s se in cont de independenele locale dintre variabile, care pot fi de
mai multe tipuri. Astfel sunt mai multe tipuri de algoritmi de raionament:
Raionament evidenial (n cazul unor evidene ale propoziiilor)
Folosind ecuaia produs (2.4.1) se poate exprima orice propoziie dorit n termeni de probabiliti
condiionale specificate ntre nodurile reelei. Aceste expresii pot fi simplificate astfel nct s reflecte
structura reelei. Primul algoritm propus pentru calcule probabilistice n reele Bayesene folosea o
arhitectur distribuit de trecere de mesaje (message-passing), caracteristic mai multor structuri
cognitive (Pearl, 1982, Kim and Pearl, 1983). Iniial, acest algoritm se limita doar la o reea care avea o
reprezentare grafic de arbore, dar mai trziu s-au generalizat pentru orice tip de reele (Lauritzen and
Spiegelhalter, 1988). Alte metode exacte cuprind condiionarea n cazul eliminrii ciclurilor din graf
(Pearl, 1988) i eliminarea variabilelor (Zhang and Poole, 1996).

41
Incertitudine n timp
n mediile care se schimb n timp, este util s se urmreasc acele variabile ale cror valori variaz la
momente diferite de timp. Pentru aceste cazuri se folosesc reele Bayesene dinamice (Dean and
Kanazawa, 1989), care memoreaz aceste procese prin reprezentarea unor copii ale strilor de variabile
pentru fiecare moment de timp. Un set de variabile Xt memoreaz starea variabilelor la momentul t, iar
setul Et memoreaz strile observabile la momentul t. Modelul observabil P(Et |Xt ) este codificat cu
ajutorul distribuiilor de probabilitate condiional pentru variabilele observabile, dndu-se starea
variabilelor. Modelul de tranziii P(Xt+1 |Xt ) leag starea la momentul t de starea de la momentul t+1.
Memorarea proceselor variabile n timp const n calcularea distribuiei de probabilitate curent pentru
setul de stare dndu-se toate observaiile anterioare P(Xt |E1... Et ). Reele Bayesene dinamice sunt mai
expresive dect alte modele probabilistice temporale, cum ar fi modelele Markov ascunse sau filtrele
Kalman, deoarece ofer posibilitatea introducerii relaiilor cauzale dintre cunotine, supuse diferitelor
grade de incertitudine.
nvarea n reele Bayesene
Probabilitile condiionale P(xi |pai ) pot fi recalculate continuu pe baza datelor observate folosind
metode de gradient sau metode EM, care folosesc doar informaii locale obinute n urma inferenei
(Lauritzen, 1995, Binder and all., 1997), asemntor cu ajustarea ponderilor la reelele neurale. De
asemenea, este posibil s se nvee i structura reelelor calculnd complexitatea reelelor pe baza
potrivirii datelor (Friedman, 1998).
Reele cauzale
Majoritatea modelelor grafice probabilistice, inclusiv reelele Bayesene, descriu distribuii de
probabilitate pe baza evenimentelor observate, dar nu precizeaz nimic despre ceea ce se ntmpl atunci
cnd apare un eveniment sigur (cert). O reea cauzal este o reea Bayesean la care prinii fiecrui nod
sunt cauzele directe ale nodului respectiv. Dac apare un eveniment cert asociat unui nod, atunci toate
legturile cauzale dintre nod i prinii si sunt terse, iar n calculul distribuiei de probabilitate se
nlocuiete variabila asociat nodului cu valoarea cert observat, reducndu-se astfel, complexitatea de
calcul. Reelele cauzale modeleaz un domeniu ca o colecie de mecanisme stabile, care pot fi
reconfigurate local, n momentul apariiei unor evenimente certe. Aceste reele sunt folosite pentru
predicia de ctre un agent, ale unor aspecte diverse ale aceleiai aciuni (Pearl, 1996).
Reele Bayesene funcionale
Reelele Bayesene sunt capabile s raioneze cu evidene si cu aciuni. Pentru a putea sa proceseze
informaii incorecte (eronate, contradictorii), fiecare probabilitate condiional P(xi |pai ) este nlocuit cu
o relaie funcional xi = fi (pai, ei ), unde ei este eroare stohastic (neobservat). Cnd funcia fi i eroarea
ei sunt cunoscute, tuturor evenimentelor incorecte li se pot asigna probabiliti unice, folosind propagarea
evidenelor ntr-o structur numit reea geamn. Cnd funcia fi este parial cunoscut, pot fi calculate
limite pentru probabilitile propoziiilor incorecte (Balke and Pearl, 1995, Pearl, 1995).

42
Descoperire cauzal
Reelele Bayesene pot fi folosite la descoperirea legturilor cauzale n datele statistice neprelucrate (Pearl
and Verma, 1991, Spirtes and all, 1993, Pearl, 2000).
De exemplu, se consider urmtoarea dependen intranzitiv ntre trei evenimente: A i B sunt
dependente, B i C sunt dependente, i totui A i C sunt independente. Un exemplu uzual de astfel de
evenimente este c A i C sunt cauze independente ale efectului B.
Schimbnd direcia arcelor de dependen, se obine un scenariu n care B este cauza i A i C sunt
efectele. Acest scenariu este posibil din punct de vedere matematic, dar nu este natural din punct de
vedere logic, deoarece necesit acordarea fin a probabilitilor implicate: dependena dorit va fi distrus
la cea mai mic schimbare a probabilitilor.
Din experimente, s-a observat c formele de dependen certe, care nu depind de informaia temporal,
sunt caracteristici conceptuale ale direcionalitii cauzale certe. Aceste forme sunt folosite la inferena
structurilor cauzale ale datelor neprelucrate i garanteaz c orice structur alternativ compatibil cu
datele este mai puin stabil dect cea iniial, adic cea mai mic fluctuaie a parametrilor face structura
incompatibil cu datele.
ncrederi sigure (plain)
ncrederile nu sunt revizuite prin ajustarea numeric a probabilitilor, ci prin acceptarea unor propoziii
(de exemplu, adevrat pentru toate cazurile practice). Aceste propoziii, numite ncrederi sigure,
manifest caracteristici ale teoriilor logice, dar i probabiliste. Din punct de vedere logic, sunt deductiv
nchise, iar din punct de vedere probabilistic, pot fi recalculate, deoarece variaz cu diferite grade.
Reelele Bayesene pot fi folosite ca modele dinamice a ncrederilor sigure prin nlocuirea probabilitilor
ordinare cu probabiliti ne-standard, care converg spre zero sau spre unu, la infinit (Goldszmidt and
Pearl, 1996).
Alte modele de raionament
Reelele Bayesene pot fi considerate ca modele cognitive pentru raionamentul propoziional sub
incertitudine. Pot lucra cu zgomot sau informaii pariale, folosind algoritmi locali, distribuiii de inferen
i nvare. Asigur reprezentri locale, n care nodurile corespund propoziiilor de interes. Experimentele
recente (Tenenbaum and Griffiths, 2001), au artat c pot captura inferena cauzal, att a prinilor, ct i
a copiilor. Mai mult, sunt capabile s captureze moduri de raionament, cum ar fi explicaiile, mult mai
uor dect alte modele. Reelele Bayesene prezint avantaje i la modelele de raionament simbolice,
ct i la cele subsimbolice.

43
2.5 Inferen probabilistic n reelele Bayesene

Tipuri de inferen n reelele Bayesene:


Bottom-up determin cauza plecnd de la efect i se mai numete i cu nlnuire napoi. Sunt
folosite mai ales n sistemele expert.
Top-down determin efectul tiind cauza i se mai numesc i cu nlnuire nainte. Reelele Bayesene
se mai numesc i modele generative, deoarece specific n ce mod cauzele genereaz efectele.

Inferena n reelele Bayesene const n utilizarea noii informaii despre unele variabile pentru a
recalcula ncrederile asupra altor variabile din reea. Deci, inferena nseamn acumularea evidenei i
propagarea ncrederii. n teoria probabilitii acumularea de informaie (eviden) se face prin calculul
distribuiilor de probabilitate condiionale.
Pentru inferena n reelele Bayesene se dau:
variabilele scop Xt;
variabilele eviden Xe;
alte variabile Xo;
reeaua Bayesean format din mulimea tuturor variabilelor (X t , X e , X o ) ;

noua informaie despre evidena Xe (fie prin nvare Xe=xe, fie prin eviden virtual).

Scopul inferenei este s specifice valorile pentru probabilitile scopurilor condiionate de evidene
P(X t | X e ) sau P(X t | evidenta) , presupunnd c se dorete s se cunoasc distribuia pentru una din
variabilele scop.
Avantajele oferite de reelele Bayesene sunt:
nu este nevoie s se specifice nainte care variabile sunt considerate variabile scop i care sunt
variabile eviden;
aceeai reea poate fi folosit pentru inferen n ambele direcii;
teoria probabilitii care este folosit n reelele Bayesene este util pentru a exprima relaii calitative
ntre ncrederi i pentru a procesa aceste relaii astfel nct s se obin concluzii intuitive plauzibile
(Pearl, 1998);
reelele Bayesene sunt nelese nu att ca sisteme pasive pentru stocarea cunotinelor factuale, dar mai
ales ca arhitecturi computaionale pentru raionamentul cu aceste cunotine. Aceasta nseamn c
legturile din reea trebuie tratate ca singurul mecanism direct i corect care trece fluxul de date prin
procesul de interogare i recalculare a ncrederilor (Pearl, 1998). Acest mecanism se folosete de
independenele din reea, de separarea controlului relaiilor din reea de reprezentarea cunotinelor, de
implementare orientat obiect.

44
Se observ c este dificil s se recalculeze probabilitile n lumina noilor evenimente chiar i n reele
Bayesene cu un numr mic de noduri. n reele Bayesene cu multe noduri i cu multe dependene ntre
noduri, fiecare variabil asociat nodurilor putnd s aib mai mult de dou valori, numrul de calcule crete
foarte mult i realizarea propagrii certitudinii n aceste reele devine foarte dificil. De fapt, nici nu exist
algoritmi universali eficieni care s realizeze aceste calcule (problema are grad de dificultate NP
probleme de decizie care sunt foarte complexe din punctul de vedere al calculelor, Cooper, 1988). Din
aceast cauz, cu teoria dezvoltat pn n anii 1980, nu era posibil s se rezolve probleme realiste folosindu-
se reele Bayesene. Ulterior s-au descoperit algoritmi de propagare valabili pentru anumite tipuri de reele i
care sunt eficieni i pentru clase de reele mai mari. Astfel amintim algoritmii pentru reele simplu
conectate, algoritmii pentru reele cu conexiuni puine, sau pentru reele supuse la diveri algoritmi de
aproximare. Aceti algoritmi au fost inclui n medii de dezvoltare a reelelor Bayesene, care au i interfa
grafic, care permite desenarea grafurilor i completarea tabelelor de probabiliti. Astfel de sisteme software
sunt folosite pentru rezolvarea problemelor complexe utiliznd reele Bayesene, deoarece pun la dispoziia
utilizatorilor toate instrumentele necesare efecturii automate a tuturor calculelor. Astfel popularitatea
reelelor Bayesene a crescut n ultimii ani, demonstrndu-se utile n aplicaii de diagnoz medical, diagnoza
defectelor mecanice, interfee adaptive pentru software-uri de larg utilizare. Avantajul reelelor Bayesene
este faptul c reprezentarea vizual intuitiv asigur clarificarea presupunerilor i a raionamentelor, ascunse
de obicei, de experiena experilor. Cel mai mare avantaj al acestor reele se obine prin aplicarea regulilor
teoriei probabilitilor bayesene pentru propagarea evidenei asupra probabilitilor evenimentelor incerte.
Reelele Bayesene asigur calculul probabilitilor oricrui submulimi de variabile dndu-se evidene asupra
oricrui alt submulimi.

Reelele Bayesene pot fi specificate prin:


un graf orientat aciclic care codific dependenele condiionale dintre variabile.
distribuii de probabilitate locale pentru noduri dndu-se valorile pentru prini.

O reea Bayesean pentru un domeniu U calculeaz distribuia de probabilitate generalizat pentru


U folosind regula de nlnuire a probabilitilor (sau regula general a produsului), care const din distribuii
de probabilitate locale combinate cu o mulime de independene condiionale, astfel:
n n
P(x1 ,..,x n |) = P(x | x ,..,x
i =1
i 1 i 1 ,) = P(x | pa ,), unde pa
i =1
i i i = parinti(x i ) (2.5.1)

La aceast ecuaie se pot aduga i independene condiionale ntre variabile, care permit simplificarea
calculelor. O variabil, asociat unui nod, este condiional independent de strmoii si, dac se dau
prinii si, n ordine topologic, ntre copii i strmoi.

Pentru reelele Bayesene se completeaz tabelele de ncredere (notate cu TU ), care se definesc pe

universul de discurs U = {U1 ,..., U k } i au k*k elemente nenegative, cte un element pentru fiecare

45
combinaie de valori ale variabilelor din U. Tabelele de ncredere sunt folosite pentru a reprezenta distribuia
de probabilitate asociat definit pe universul de discurs U. Operaiile care se pot efectua pe o tabel de
ncrederi sunt: multiplicarea (intrare la intrare), divizarea (intrare la intrare), marginalizarea, normalizarea
(divizarea tuturor intrrilor prin suma tuturor intrrilor). O tabel de ncredere definit pe U poate fi tabel de
probabiliti asociate dac suma tuturor intrrilor este 1.

Fie U = X Z si V=Y Z dou universuri de variabile, astfel nct X, Y, Z s fie disjuncte. Fie
TU si TV tabelele de ncredere pentru universurile U i V. Fie reuniunea celor dou universuri de discurs:
W = UV =XYZ.
Atunci tabela de ncredere produs corespunztoare universului W este dat de:
TW (x, y, z) = TU (x, z) TV (y, z) .
Tabela de ncredere divizat (ponderat) corespunztoare lui W este dat de:
TU (x, z)
TW (x, y, z) = , dac TV (y, z) = 0 ,
TV (y, z)

sau TW (x, y, z) = 0 daca TV (y, z) = 0 .


Tabela de ncredere marginal a lui TU este dat de formula:
TU (u) = T
v
W (u, v) .

Tabela de ncredere normalizat se obine prin divizarea fiecrui element din tabel cu suma tuturor
celorlalte elemente. Dac toate elementele din tabel sunt zero atunci tabela este indefinit.
Determinarea unei variabile V este o tabel de ncredere pentru V n care toate elementele sunt egale cu 0 sau
cu 1.
Fie F1 ,..., Fm determinrile pentru variabila U. Tabela de ncrederi condiionale TU | F1 ,..., Fm este o tabel de

ncrederi obinut prin normalizarea produsului TU F1 ... Fm . Tabela de ncrederi condiionale este

distribuia de probabilitate TU condiionat pe valorile pentru care nici o determinare Fi nu are elemente
egale cu 0.

n inferen din reelele Bayesene, recalcularea probabilitilor se face prin crearea unei singure tabele
de ncrederi pentru toate variabilele din reeaua Bayesean i recalcularea acestei tabele cnd se introduce o
nou eviden. Aceast recalculare este imposibil atunci cnd reeaua Bayesean cuprinde mai mult de
cteva variabile. Din acest motiv se folosesc diveri algoritmi de optimizare n reelele Bayesene.

46
2.6 Transmiterea evidenei n reelele Bayesene

n reelele Bayesene se pot ntlni dou tipuri de evidene:


Evidena hard (instanierea) pentru nodul X este evidena dat de o valoare particular pe care o
are variabila X. n acest caz, se spune c variabila X este instaniat cu valoarea respectiv.
Evidena soft - pentru nodul X este orice eviden care asigur recalcularea valorilor probabilitii
apriori ale evenimentului asociat lui X. Acest tip de eviden modeleaz situaiile n care evidena
despre valoarea unei variabile nu este concludent.
n reelele Bayesene se pot ntlni trei tipuri de legturi ntre noduri:
Legtur serial care permite ca orice eviden introdus nodului de nceput s se propage
prin toate nodurile care fac parte din aceast legtur, astfel c nici un nod intermediar nu este
instaniat. Un exemplu de legtur serial este dat n figura de mai jos:

A B C

Presupunem c apare o eviden asupra evenimentului A, ceea ce implic o cretere a ncrederii


asupra evenimentului B, care la rndul su implic o cretere a ncrederii asupra evenimentului
C. Astfel c evidena asupra lui A este transmis prin B la C. Dac presupunem c avem o
eviden hard asupra lui B, atunci orice cunotin asupra lui A este irelevant pentru C,
deoarece evidena lui B este esenial. Deci evidena lui A nu se poate transmite lui C, dac B
blochez calea de la A la C.
Concluzia este c, n legtura serial, evidena se poate transmite de la A la C dac B nu este
instaniat. Se mai spune c A i C sunt d-separate dndu-se B.
Legtur divergent permite ca evidena s fie transmis ntre dou noduri copii ai aceluiai
printe, dac printele nu este instaniat.
O astfel de legtur arat ca n figur:

B C

Orice eviden asupra lui A este transmis la ambii copii B i C. Aspectul asupra cruia se
manifest interes este atunci cnd se transmite informaie de la B la C (i invers). Orice eviden
despre B duce la creterea ncrederii n A, care duce la creterea ncrederii n C. Presupunem c
avem o eviden hard asupra lui A. n acest caz orice eviden asupra lui B nu schimb cu nimic
ncrederea asupra lui C, deoarece A blocheaz calea ca evidena s fie transmis. Valoarea lui C

47
este influenat doar de certitudinea asupra lui A. Astfel c, atunci cnd A este cunoscut B i C
devin independente.
n concluzie, evidena se poate transmite de la B la C prin A, doar dac A nu este instaniat. Se
spune c B i C sunt d-separate dndu-se A.
Deci, legtura divergent este inactiv dac A este necunoscut, i este activ, dac exist
evident hard sau soft pentru A sau pentru descendenii acestuia.
Legtur convergent permite transmiterea evidenei ntre doi prini doar cnd nodul copil a
primit o eviden (hard sau soft). O astfel de legtur arat ca n figur:

B C

Orice eviden asupra lui B sau C se transmite i asupra lui A. Se pune problema transmiterii
evidenei ntre B i C. Dac nu este nici o eviden asupra lui A, atunci B i C sunt
independente, deci nu se poate transmite nimic ntre B i C.
Dac se tie ceva despre A (eviden hard sau soft), atunci prinii lui A devin dependeni i
orice eviden a unuia se transmite i la cellalt.
Concluzia este c se poate transmite eviden ntre prini doar dac se cunoate orice eviden
asupra lui A. Se spune c B i C sunt d-separate atunci cnd nu se tie nimic despre A.
Deci, legtura convergent este activ dac A este necunoscut, i este inactiv dac exist
eviden hard asupra lui A (evidena soft las legtura activ).

Aceste trei cazuri permit stabilirea dependenei sau independenei ntre oricare dintre nodurile unei reele
Bayesene.

48
2.7 Alte tipuri de inferen n reelele Bayesene

Unul dintre aspectele importante ale reelelor Bayesene const din faptul c acestea sunt reprezentri
directe ale informaiilor, i nu a proceselor de raionament. Astfel, arcele reprezint conexiuni cauzale directe
i nu fluxuri de informaie n cursul raionamentului (cum sunt sistemele bazate pe reguli sau reelele
neuronale). Procesele de raionament pot opera n reelele Bayesene prin propagarea informaiei n orice
direcie. Presupunerea de independen ntre variabile este util pentru simplificarea obinerii cunotinelor
(prin reducerea numrului de parametri cerui pentru a specifica distribuia de posibilitate) i pentru
simplificarea complexitii inferenei, dar nu este suficient. Pentru a simplifica i mai mult obinerea
cunotinelor i a inferenei se folosesc i alte tipuri de inferen, astfel:
Independena influenei cauzale (ICI) este un mecanism prin care o variabil printe, cauz a unei
variabile copil este independent de valorile unei alte variabile printe (Heckerman, Mamdani,
1993). Un astfel de model este modelul noisy-or care simplific specificarea distribuiei unui efect
cnd sunt mai multe cauze. Apariia unei eveniment printe este o cauz pentru evenimentul copil,
care nu depinde de valorile celorlali prini, dar nu nseamn c este independent fa de ceilali
prini. Cauzele opereaz zgomotos dac sunt adevrate atunci pot sau nu s determine apariia
efectului. Efectul apare cnd apar una sau mai multe cauze, deci poate apare din cauza unui printe
sau a altui printe. La modelul noisy-or este nevoie apriori de probabilitatea de apariie a unui
efect atunci cnd apare o cauz i nici o alt cauz nu se manifest. Modelul se aplic indiferent
dac sunt arce ntre nodurile prini.
La cazul general: se dau n cauze C1 ,...,Cn care pot avea valori binare si efectul E binar.

C1 C2 Cn

Se presupune c pentru apariia efectului E este nevoie de cel puin o cauz Ci . Cnd Ci este
adevrat, probabilitatea ca Ci s cauzeze E are valoarea pi, i nu depinde de alte cauze Cj. Ecuaiile
modelului noisy-or sunt:
P(E = 0 | C1 ,...,Cn ) = (1 p )
Ci =1
i

(2.7.1)
P(E = 1| C1 ,...,C n ) = 1 (1 p )
Ci =1
i

Probabilitile necesare sunt: n modelul general, pentru P(E | C1 ,...,Cn ) sunt necesare 2n
probabiliti (celelalte 2n probabiliti pot fi determinate din axioma P(a a) = P(a) + P(a) = 1 ),

pe cnd la modelul noisy-or sunt necesare n probabiliti p1 ,..., p n din care se calculeaz celelalte

49
probabiliti. Probabilitatea pi este probabilitatea s apar efectul E atunci cnd cauza Ci este
adevrat i toate celelalte cauze sunt false.

Un model echivalent cu modelul noisy-or: se consider variabilele trigger Qi (Qi este adevrat
dac Ci cauzeaz E).

Q1 Q2 Qn

C1 C2 Cn

Distribuiile de probabilitate sunt:


1 daca cel putin un Qi = 1
P(E = 1| Q1 ,...,Q n ) =
0 altfel
Evenimentul E este adevrat dac i numai dac este cauzat de una din cauze astfel:
p daca Ci = 1
P(Qi = 1| Ci ) = i
0 daca Ci = 0
Evenimentul E poate fi cauzat de Ci, doar dac Ci este adevrat. Dac Ci este adevrat atunci poate
cauza E cu probabilitatea pi.
Acest model este echivalent cu modelul noisy-or, iar distribuia marginal a evenimentului E
cauzat de cauzele C1, ...,Cn este dat de ecuaia (2.7.1).

Mai exist i modelul noisy-or cu probabilitate leak, care este probabilitatea unui eveniment
cauz de background, care este ntotdeauna prezent i care foreaz ca probabilitatea efectului E
s fie ntotdeauna diferit de 0, indiferent de cauze.

Modelul temporal pentru noisy-or este echivalent din punct de vedere matematic cu modelul
noisy-or i consider c toate cauzele sunt inactive, fiind disponibil numai evenimentul cauz
background (care modeleaz cauze nemodelate). Dac evenimentul efect a fost activat pe baza
evenimentului iniial la momentul de timp 0, atunci efectul rmne activat. Altfel se activeaz cnd
apare o cauz, cu probabilitatea asociat cauzei respective.

50
C1 C2 Cn

E E E

Avantajele modelului temporal sunt date de obinerea maleabil a informaiilor i de faptul c nu


implic evenimente neobservabile.
De observat c independena influenei cauzale nu este aceeai cu independena cauzelor. Influena
cauzal se poate aplica independent de faptul c prinii sunt sau nu independeni. Independena
influenei cauzale poate fi folosit pentru calculul distribuiei locale doar pe baza unor evenimente
cauz, reducnd astfel calculele. Aceast metod de inferen nu se reprezint grafic n reelele
Bayesene.
Independen asimetric variabilele pot fi independente fa de alte variabile nu pentru toate
valorile, doar numai pentru anumite valori. Independena asimetric nu se reprezint n reelele
Bayesene. Pentru a reprezenta independenele asimetrice se utilizeaz mai multe grafuri, fiecare
reprezentnd o parte a problemei de inferen. Pentru aceasta se folosesc multi-reelele Bayesene
formate din reele locale asociate cu distribuia de probabilitate marginal (Geiger, Heckerman,
1991; Mahoney, 1999; Mahoney, Laskey, 1991) i reelele de similaritate care sunt o colecie de
reele locale, sau structuri de decizie arborescente auxiliare asociate unui nod, sau specificarea unor
partiii generale (Friedman, Goldszmidt, 1996).

Algoritmii de inferen local calculeaz distribuii de probabilitate locale pentru fiecare combinaie de
cauze care sunt implicate ntr-o legtur restrictiv care poate fi reprezentat prin alt tip de independen.
Algoritmul lui Pearl pentru reele simplu conectate
Are ca scop calculul distribuiei de probabilitate pentru o variabil dndu-se evidena despre o alt
variabil. Ideea principal este de a calcula ncrederile asociate variabilelor strmoi i descendeni ai
variabilei eviden, separat unele de altele, folosindu-se regula Bayes i regula nlnuirii.
Algoritm pentru reele cu conexiuni multiple
ntr-o reea multiplu conectat evidena unui nod poate fi calculat din mai multe direcii. Soluia (dac
reeaua nu este prea dens conectat) este de a combina nodurile n clusteri (astfel nct nodurile s fie
simplu conectate i evidena se propag printr-un algoritm de message-passing), de a aranja clusterii ntr-
un arbore de jonciune, de a propaga ncrederile n aceti clusteri (prin tabele de ncredere locale pentru
fiecare cluster), i de a proiecta rezultatul ncrederii asupra variabilelor din reeaua iniial (tabela de
ncredere a ntregii reele este o tabel de probabiliti asociate pentru nodurile din fiecare cluster).

Procesul de inferen ntr-o reea Bayesean const n adugarea sau tergerea evidenelor asupra
cunotinelor reprezentate n model, ceea ce duce la recalcularea probabilitilor asociate.
51
Multe modele, cum ar fi cele care au structuri repetitive (serii variabile n timp, analiza imaginilor), au
o reprezentare grafic care conine multe noduri. Din acest motiv adncimea la care se face inferena este
mare, ceea ce duce la un timp foarte mare alocat procesului de inferen. Pentru a reduce acest timp se
folosesc algoritmi de aproximare (sunt P-hard), care dau rezultate foarte bune n practic. Astfel de algoritmi
sunt:
Metode variaionale - cel mai simplu exemplu este aproximarea minim a domeniului, care folosete
teorema aproximrii sumelor de numere aleatoare prin cele mai mari numere. n reelele Bayesene,
se face abstracie de arcele dintre noduri i se introduce un nou parametru, numit parametru
variaional, pentru fiecare nod, care se calculeaz iterativ, astfel nct s minimizeze diferena dintre
distribuia de probabilitate i aproximarea acesteia (MacKay, 1995, MacKay and Gibbs, 1996) .
Metoda exemplificrii (Monte Carlo) - const n selectarea unui subdomeniu reprezentativ cu scopul
de a determina parametrii sau caracteristicile ntregului domeniu. n reelele Bayesene se consider
exemplele x cu probabilitatea P(X) i se calculeaz P(y|x), unde y este evidena. Pentru anumite
cazuri se folosete nlnuirea Monte Carlo Markov (MCMC), care include cazurile speciale de
exemplificare Gibbs i algoritmul Metropolis-Hasting.
Propagarea ncrederii n bucle (Pearl) - se aplic la grafurile care au bucle, care n teorie pot duce la
numrarea dubl, dar n practic, n cazul unei singure bucle, evenimentele duble sunt anulate (Yair
Weiss, 1997). n cadrul acestei metode, se folosete un graf modificat, numit acoperire universal,
obinut prin eliminarea buclei.
Minimizarea condiionrii mulimilor de tiere - prin instanierea unor variabile se pot elimina buclele
dintr-un graf. Dezavantajul este c atunci cnd seturile de tiere sunt mari, aceast metod este lent.
Prin instanierea doar a unui submulimi de valori ale unei mulii de tiere, se pot calcula
minimizrile probabilitilor de interes (Murthy P., Bhattacharyya S., Lee E., 1995).
Metode de aproximare parametric - aceast metod folosete calcule intermediare obinute prin
diverse modele de aproximare (Hinton, Van Camp, 1993).

2.8 Reprezentarea cunotinelor prin reele posibiliste orientate


Reelele posibiliste orientate, notate cu R sau G (grafuri posibiliste), sunt strns legate teoria
posibilitii i au fost studiate de Pearl (1988), Dawid (1979), Jensen (1996). Reelele posibiliste sunt reele
Bayesene la care baza de cunotine este modelat folosind logica posibilist. Logica posibilist i grafurile
posibiliste sunt dou direcii diferite de reprezentare a cunotinelor. Logica posibilist ordoneaz piesele de
informaie, exprimate prin formule logice, dup nivelul lor de certitudine, pe cnd grafurile reprezint relaii
ntre variabile. Aceste dou tipuri de reprezentri sunt echivalente din punct de vedere semantic, dac i
numai dac lucreaz cu aceeai distribuie de posibilitate (care ordoneaz interpretrile posibile). Datorit
teoriei posibilitii, nu este necesar s se introduc structuri de grafuri n teoria posibilitii, spre deosebire de
teoria probabilitii, deoarece este mai greu de lucrat cu logic probabilist. Logica posibilist a fost obiectul
a numeroase studii i diferitele conexiuni cu raionamentul ne-monoton, cu teoria deciziei sunt stabilite clar.
52
Dar, reelele posibiliste orientate au fost puin studiate, cercetrile orientndu-se spre adaptri formale directe
ale abordrii probabiliste fr preocupare asupra reprezentrii cunotinelor (Fonck, 1994), sau spre o
manier de prezentare a rezultatelor obinute plecnd de la date imprecise (Gebhardt and Kruse, 1995).
Noiunea de baz a reelelor posibiliste orientate, n contextul teoriei posibilitii este msura
posibilitii condiionate. Deoarece noiunea de condiionare are mai multe definiii i reelele posibiliste se
pot construi pe baza operatorilor de:
Minim - pentru aspectul calitativ;
Produs - pentru aspectul numeric;

Reeaua este format din:


Noduri care au asociate variabile (de exemplu, temperatura unui bolnav, culoarea unei maini). Se
noteaz cu = {A1 ,..., A n } mulimea tuturor variabilelor (sau notat cu V). Unei variabile Ai i se
asociaz domeniul de valori Di (mulimea de valori pe care le poate lua Ai). Mulimea domeniilor de
valori asociate tuturor variabilelor reelei se noteaz cu D = {D1 ,..., D n } .

Un eveniment elementar const n asignarea unei valori posibile (din domeniul de valori Di)

variabilei Ai. Cnd toate variabilele sunt binare (adic Di ={True, False} sau Di ={ a i , a i })
evenimentele elementare se numesc interpretri (n sensul logicii clasice). Mulimea tuturor
evenimentelor elementare este reprezentat prin produsul cartezian D1 ... D n . Formulele,
reprezentate ca mulimi de interpretri se numesc, de asemenea, interpretri.
Arce care codific legtura sau influena cauzal ntre variabile. Incertitudinea este reprezentat la
nivelul fiecrui nod i exprim fora cauzalitii ntre variabile. Cnd exist un arc de la nodul Ai la
nodul Aj atunci nodul Ai se numete printele nodului Aj. Prinii unui nod Ai sunt notai cu Par(Ai).
Posibilitile apriori pentru fiecare nod Ai, care nu este rdcin, se specific pentru fiecare instan a
lui Ai, astfel (a i ) unde a i Di . Posibilitile apriori trebuie s satisfac condiia de normalizare:

max ai Di (a i ) = 1 .

Posibiliti condiionale pentru fiecare nod Aj astfel:


(a j | Par(A j ) ) unde a j D j si Par(A j ) este un element al produsului cartezian i Di ,

iar Di Par(A j ) sunt domeniile asociate prinilor lui Aj. Posibilitile condiionate trebuie s

satisfac condiia de normalizare:


Par(A j ) i Di avem max a jD j (a j | Par(A j ) ) = 1 .

53
2.9 Teoria posibilitii aplicat reelelor posibiliste

Logica posibilist este, n principal, de natur calitativ (contrar logicii probabiliste), n sensul c
singura proprietate cerut este cea de structur total ordonat pe scala utilizat. Valorile precise nu au, deci,
nici o importan real.
Structura ordonat se introduce prin preordonarea p este mai sigur dect q, ceea ce corespunde cu
N(p)>N(q).
Logica posibilist este o logic tratabil (rezolvabil) prin calcule, deoarece complexitatea de calcul
este de ordinul log2 n*SAT, unde n este numrul de niveluri de certitudine utilizat n baza de cunotine, iar
SAT complexitatea problemei n logica clasic.

Logica posibilist, din punct de vedere sintactic, lucreaz cu perechi (p, ) unde p este o formul din
logica clasic propoziional i este un element dintr-o mulime liniar, finit, total ordonat (aspectul
calitativ) sau dintr-un interval semi-deschis (0,1] (aspectul numeric). Perechea (p, ) exprim faptul c
formula p este cert cu gradul cel puin , notat cu N(p) , unde N este msura necesitii asociat
distribuiei de posibilitate care st la baza unei anumite semantici (adic, a unei informaii posibil incomplet
despre lume). Perechile (p, ) formeaz o baz posibilist de cunotine sau de ncrederi, notat cu .

Dndu-se baza de cunotine posibile , se poate genera distribuia de posibilitate din asociind

fiecrei interpretri nivelul de compatibilitate cu informaia disponibil.

Cnd o baz posibilist este alctuit dintr-o singur formul {(p, )}, atunci fiecare interpretare
care satisface formula p primete gradul de posibilitate () = 1 atta timp ct este complet consistent cu p
(adic satisface p) i fiecare interpretare care falsific p primete gradul de posibilitate () < (este mai
puin cert dect p). n particular, dac = 1 (p este complet cert) atunci () = 0 ceea ce nseamn c
este imposibil. O modalitate de a realiza aceast constrngere este de a asigna () = 1 (iar pe o scal
ordonat se folosete inversarea graficului).
Astfel, distribuia de posibilitate asociat lui bazei de cunotine posibile este:

1 daca a p
= {(p, )} este , {(p, )} () =
1 altfel

Cnd baza posibilist este general = {(p , ), i=1...n} atunci toate interpretrile care satisfac toate
i i

ncrederile n baza vor avea cel mai mare grad de posibilitate, adic egal cu 1, iar celelalte interpretri

sunt grupate dup cea mai mare ncredere a formulei pe care o falsific.
Astfel, distribuia de posibilitate asociat este:

54
= {(p , ), i=1...n} este ,
i i

1,
() =
daca a

1 max{i | (pi , i ) si a p }, altfel
i

Deci, poate fi obinut ca rezultatul combinaiei conjunctive de {(pi ,i )} folosind operatorul de minim:


() = min{{(pi ,i )} () | (pi , i ) }.

reprezint cunotinele disponibile despre lumea real.


() = 1 nseamna c e total posibil s fie o interpretare a lumii reale.
0 < () < 1 nseamn c este posibil s fie o interpretare a lumii reale.
() = 0 nseamn c sigur nu reprezit o interpretare a lumii reale.
Distribuia de posibilitate este normalizat dac () = 1 .
Distribuia de posibilitate implic certitudinea formulei p prin:
Gradul de posibilitate: (p) = max{() | a p} , care arat c p este consistent cu informaia
disponibil exprimat prin .
Gradul de necesitate sau de certitudine: N(p) = min{1 () | a p} care evalueaz c ceea ce
extinde p este necesar cu informaia disponibil.
Pentru p si q avem:
(p q) = max( (p), (q))
N(p q) = min(N(p), N(q))
N(p) = 1 (p)
Spre deosebire de teoria probabilitii, teoria posibilitii nu este dual, adic
N(p) si N(p), resprectiv (p) si (p) nu sunt legate din punct de vedere funcional.
Pentru o distribuie de posibilitate normalizat avem:
min(N(p), N(p)) = 0 si max( (p), (p))=1
Pentru o distribuie de posibilitate ne-normalizat se ajunge la o situaie de inconsisten:
N(p) > 0 si N(p)>0 arat c i p i p sunt sigure simultan, ceea ce este o contradicie.
Observaie: baze de ncrederi posibiliste diferite din punct de vedere sintactic pot avea aceeai distribuie de
posibilitate din punct de vedere semantic. Aceste baze sunt echivalente deoarece -tieturile (care sunt baze

de ncrederi clasice) sunt echivalente logic. O -tietur a unei baze de ncrederi posibiliste este o

mulime de formule clasice al cror nivel de certitudine mai mare sau egal dect .

Pentru calculul distribuiei de posibilitate asociate ntr-o reea posibilist orientat se folosesc aceleai
formule ca pentru probabiliti. Deoarece sunt dou definiii ale condiionrii posibiliste n teoria posibilitii
sunt i dou metode de descompunere pentru calculul distribuiei de posibilitate asociat, astfel:

55
(x1...x n ) = min i =1,n (x i | xi )
sau
(x1...x n ) = (x
i =1,n
i | x i ) (2.9.1)

unde x i = {a i, a i } sunt instanele posibiliste ale variabilei A i i x i {x1...x n }

Sau se mai poate scrie:


(A1...A n ) = min( (A n | A1...A n 1 ),..., (A 2 | A1 ), (A1 ) )
(A1...A n ) = (A n | A1...A n 1 ) *...* (A 2 | A1 ) * (A1 )

Aa cum am vzut n teoria posibilitii nu exist o descompunere unic pentru distribuia de posibilitate,
aceasta depinznd de ordinea iniial a variabilelor.

Reelele posibiliste sunt, deci, de dou feluri: R min i R *

Atunci cnd se folosete, pentru calculul distribuiei de posibilitate asociate produsul, este asemntor cu
calculul distribuiei de probabilitate. Dar, valorile asociate variabilelor nu se pot interpreta simultan n teoria
posibilitii i n teoria probabilitii, deoarece n teoria posibilitii (a) < 1 implica (a)=1 , pe cnd n
teoria probabilitii nu putem avea simultan P(a)<1 i P( a)<1.
Totui, gradul de ncredere asociat unui nod dup instanierea variabilei nu este acelai, deoarece
necesit calculul gradului de ncredere asociat evenimentelor oarecare, i n acest caz, n teoria posibilitii se
folosete operatorul maxim, iar n teoria probabilitilor se folosete operatorul aditiv.

Reelele posibiliste, fiind o modalitate de reprezentare grafic a cunotinelor, reprezint dependenele


condiionale sau funcionale dintre piesele de cunoatere. Din acest motiv o noiune pe care o vom prezenta
n continuare este cea de posibilitate condiionat.

2.9.1 Condiionare i independen posibilist


Noiunea de condiionare din teoria posibilitii se definete asemntor cu noiunea de condiionare
din teoria probabilitii, pornind de la teorema lui Bayes:
P(p q)
P(q|p) =
P(q)
n teoria posibilitii exist diferite definiii pentru condiionare corespunztoare abordrilor calitativ
sau numeric.
Cazul calitativ - noiunea msurii posibilitii condiionate a fost introdus de Hisdal (1978) ca o
ecuaie a principiului specificitii minimale, astfel:
fie o scal finit de posibilitate (de obicei intervalul [0, 1]):
q, q p avem
(p q) = min( (q|p), (p) )

56
Aceast ecuaie permite mai multe definiii pentru posibilitatea condiionat ( | p) .
Una dintre ele este cea propus de Dubois i Prade (1988) ca o soluie la aceast ecuaie cnd (p) > 0 :

1 , daca (p q) = (p)
(q | p) =
(p q) altfel, adica (p q) < (p)

Cazul numeric
(q | p) * (p) daca (p) 0
(p q) =
0 altfel
n ambele cazuri avem N(q | p) = 1 (q | p) .

57

S-ar putea să vă placă și