Sunteți pe pagina 1din 13

1

Curs nr. 6
Clasificatori bayesieni. Reelele Bayesiene


1. Abordarea bayesian. Probabilitate bayesian. Msurarea probabilitii
bayesiene

Probabilitatea bayesian a unui eveniment x este gradul de ncredere al unei persoane
asupra apariiei acelui eveniment. n timp ce probabilitatea clasic este o proprietate
fizic a lumii (de exemplu probabilitatea ca o moned s cad pe una din fee),
probabilitatea bayesian este o proprietate a persoanei care atribuie acea probabilitate (de
exemplu gradul de ncredere al persoanei c moneda va cdea pe una din fee). Pentru a
diferenia aceste dou abordri asupra probabilitilor, ne vom referi la probabilitatea n
sens clasic ca fiind probabilitatea fizic a acelui eveniment i ne vom referi la gradul de
ncredere n acel eveniment ca fiind probabilitate bayesian.

O important deosebire ntre probabilitatea fizic i cea bayesian este faptul c pentru
msurarea celei de-a doua nu avem nevoie de ncercri repetate. De exemplu, imaginai-
v aruncarea repetat a unui cub de zahr pe o suprafa ud. De fiecare dat cnd este
aruncat cubul, dimensiunile lui se vor modifica uor. Pentru aproximarea probabilitii
fizice ar fi nevoie de condiii greu de realizat. Astfel ar fi necesar ca fiecare aruncare s
poat fi repetat de mai multe ori n aceleai condiii (cubul de zahr ar trebui s rmn
acelai la nceputul ncercrilor i totui n fiecare ncercare ar trebui s-i modifice forma
pentru a respecta evenimentul al crei probabilitate trebuie aproximat). Pentru
aproximarea probabilitii bayesiene este suficient s se determine gradul de ncredere al
persoanei la un moment dat.

O critic obinuit adus definirii bayesiene a probabilitii este aceea c probabilitile
par arbitrare. De ce ar trebui ca gradul de ncredere s satisfac regulile probabilitilor?
n particular are sens s atribuim o probabilitate de zero unui eveniment care nu se va
ntmpla, dar ce probabiliti atribuim credinelor care nu sunt la extreme? Fr a fi nimic
neobinuit aceste ntrebri au fost studiate intens. Referitor la prima ntrebare, muli
cercettori au sugerat diferite seturi de proprieti ce ar trebui satisfcute de gradul de
ncredere. S-a dovedit c fiecare set de proprieti au condus de fiecare dat la acelai set
de legi: legile probabilitii. Dei fiecare set de legi este complet, faptul c seturi diferite
conduc ctre legile probabilitilor furnizeaz un argument destul de puternic pentru
utilizarea probabilitilor spre a msura credinele.

n general procesul de msurare a unui grad de ncredere este referit drept o estimare de
probabilitate. Tehnica descris mai sus este una dintre multe altele existente n tiina
managementului, n domeniul cercetrilor operaionale i n psihologie. O problem a
acestei estimri este aceea a preciziei. Poate oare cineva s spun c probabilitatea sa
referitoare la evenimentul x este 0.601 sau 0.599? n cele mai multe cazuri nu. Cu toate
acestea probabilitile sunt folosite pentru luarea deciziilor, cnd aceste decizii nu sunt
senzitive la mici variaii n probabilitate.
2
n practic se execut analize de senzitivitate pentru a ajuta un om s tie cnd este
necesar o precizie n plus. O alt problem a acestor estimri de probabilitate este aceea
a acurateei. De exemplu, experiene recente sau pur i simplu modul n care o ntrebare
este formulat poate conduce la presupunerea c aceasta nu reflect adevratele
convingeri ale unei persoane. Metode de mbuntire a acurateei pot fi gsite n
literatura referitoare la analiza-deciziei.

2. Utilizarea probabilitilor bayesiene

S considerm urmtorul exemplu: Fie o pionez normal (una cu un cap rotund i plat).
Dac aruncm pioneza n aer va ateriza fie cu vrful n jos (pe fa) fie cu vrful n sus
(pe spate). Vom arunca n sus pioneza de N+1 ori, asigurndu-ne c proprietile fizice
ale pionezei i condiiile n care este aruncat rmn stabile de-a lungul timpului. Din
primele N observaii vrem s determinm probabilitatea ca la a N+1-a aruncare s pe
fa. n analiza clasic a sistemului, presupunem c exist o probabilitate fizic de a
ateriza cu vrful n jos, probabilitate care este necunoscut. Estimm aceast probabilitate
fizic din cele N observaii folosind criterii cum ar fi eroare minim i dispersie minim.
Apoi estimm probabilitatea de a ateriza cu vrful n jos la aruncarea N+1. n analiza
bayesian, pe lng presupunerile care le facem la modelul clasic mai introducem n
model i un grad de nencredere n aceast probabilitate fizic, i ne folosim de regulile
probabilitilor pentru a calcula probabilitatea celei de-a N+1-a aruncri.

Pentru a explica analiza bayesian a acestei probleme, vom folosi o serie de notaii:
(1)Vom nota o variabil printr-o liter mare (ex: X,Y,X
i
), i vom vota starea sau
valoarea acesteia prin aceeai liter dar mic (x,y,x
i
).
(2)Vom nota o mulime de variabile printr-o liter mare ngroat (ex: X,Y,X
i
).
Vom folosi litera corespunztoare ngroat dar mic pentru a nota faptul c fiecrei
variabile dintr-o anumit mulime i s-a atribuit o valoare. Vom spune c mulimea X se
afl n configuraia x(X=x).
(3)Vom folosi ) | ( x X = p (sau ) | ( x p ca o prescurtare) pentru a nota
probabilitatea bayesian ca X=x avnd informaia .
(4)De asemenea vom folosi ) | ( x p pentru a nota distribuia de probabilitate a lui
X. Semnificaia lui ) | ( x p se va nelege din context.

ntorcndu-ne la problema cu pioneza, definim O ca fiind o variabil ale crei valori u
corespund valorilor posibile ale probabilitii fizice. Ne vom exprima nencrederea n O
folosind funcia de densitate de probabilitate ) | ( u p . n plus folosim X
l
pentru a nota
variabila reprezentnd rezultatul aruncrii numrul l, cu l=1,...,N+1, i
D={X
1
=x
1
,,X
N
=x
N
} pentru a nota mulimea observaiilor noastre. n termeni bayesieni
problema pionezei se reduce la a calcula ) , | (
1
D x p
N+
din ) | ( u p (adic combinm
rezultatele celor N ncercri i cunotinele apriorice asupra sistemului).

Pentru a face aceasta mai nti vom determina distribuia de probabilitate pentru O avnd
D i cunotinele de fond :

3
(1)
) | (
) , | ( ) | (
) , | (

u u
u
D p
D p p
D p =
dac:

(2)
}
= u u u d p D p D p ) | ( ) , | ( ) | (

Dezvoltm termenul ) , | ( u D p i ajungem la ecuaia:

(3)
) | (
) 1 ( ) | (
) , | (

u u u
u
D p
p
D p
t h

=
unde h i t reprezint numrul de cazuri n care pioneza a czut pe fa respectiv pe
spate observate n D.

Distribuiile de probabilitate ) | ( u p i ) , | ( u D p sunt referite n mod frecvent drept
distribuii apriori respectiv aposteriori. Despre cantitile h i t se poate spune c sunt
statistic suficiente pentru o repartiie binomial deoarece ele furnizeaz o sumarizare a
datelor suficient pentru calcularea distribuiei aposteriori din cea apriori.

n final facem media valorilor posibile ale lui O pentru a determina probabilitatea ca
aruncarea n cu numrul N+1 pioneza s cad pe fa:

(4)
) ( ) , | (
) , | ( ) , | " " ( ) , | " " (
) , | (
1 1
u u u u
u u u
u D p
N N
E d D p
d D p virf X p D virf X p
=
= = =
}
}
+ +

unde ) (
) , | (
u
u D p
E se numete expectana valorii u respectndu-se distribuia p(u | D , ).

Pentru a completa acest exemplu avem nevoie de o metod pentru a estima distribuia
apriori a lui O. O abordare des ntlnit, i folosit de obicei datorit simplitii, este de a
estima c aceasta este o distribuie beta:

(5)
1 1
) 1 (
) ( ) (
) (
) , | ( ) | (

I I
I
=
t h
t h
t h
Beta p
o o
u u
o o
o
o o u u
unde o
h
>0 i o
t
>0 sunt parametrii distribuiei cu o=o
h
+o
t
, i I(.) este funcia
Gamma care satisface relaiile: I(x+1)=xI(x) i I(1)=1. Cantitile o
h
i o
t
sunt referite
adesea ca fiind hiper-parametrii pentru a-i distinge de parametrii u. Hiper-parametrii
trebuie s fie mai mari ca zero pentru ca distribuia s fie normalizat. Distribuia apriori
beta este convenabil cu att mai mult cu ct se poate observa c i funcia de distribuie
aposteriori va fi tot o funcie beta:

(6) ) , | ( ) 1 (
) ( ) (
) (
) , | (
1 1
t h Beta
t h
N
D p
t h
t h
t h
t h
+ + =
+ I + I
+ I
=
+ +
o o u u u
o o
o
u
o o


4
Vom spune c o mulime de distribuii beta reprezint o familie conjugat de distribuii
pentru repartiia binomial. De asemenea expectana valorii u relativ la aceast distribuie
are o form simpl:
(7)
}
=
o
o
u o o u u
h
t h
d Beta ) , | (

Deci dac folosim o distribuie aprioric beta vom avea o expresie simpl pentru
probabilitatea ca pioneza s cad pe fa:

(8)
N
h
D virf X p
h
N
+
+
= =
+
o
o
) , | " " (
1


Presupunnd c p(u|) este o distribuie beta, se pune problema estimrii acesteia. De
exemplu putem stabili probabilitatea pentru unul din cazurile posibile pentru prima
aruncare. Mai departe s presupunem c am vzut rezultatele a k aruncri, i restabilim
probabilitatea noastr pentru o situaie n urmtoarea aruncare. Vom avea pentru k=1:

(9)
1
1
) , " " | " " ( ; ) | " " (
1 2 1
+ +
+
= = =
+
= =
t h
h
t h
h
virf X virf X p virf X p
o o
o

o o
o

Avnd aceste probabiliti stabilite, putem afla o
h
i o
t
. Dei distribuia beta este
convenabil ea nu prezint acuratee pentru unele probleme. De exemplu s presupunem
c acea pionez este vrjit. n acest caz, o distribuie aprioric ceva mai potrivit ar fi o
mixtur de funcii Beta, de exemplu:

(10) ) 2 , 2 ( 2 . 0 ) 20 , 1 ( 4 . 0 ) 1 , 20 ( 4 . 0 ) | ( Beta Beta Beta p + + = u
unde 0.4 este probabilitatea ca pioneza s fie nclinat spre cazul cderii pe o fa sau
alta. De fapt am introdus o variabil ascuns sau neobservat (H), ale crei stri
corespund cu trei posibiliti:
(1)pioneza are tendina s cad cu vrful n jos
(2)pioneza are tendina s cad cu vrful n sus
(3)pioneza este normal
i am presupus c variabila u condiionat de fiecare stare a lui H are distribuie beta.

n general este relativ uor s se determine dac o distribuie aprioric de tip beta reflect
cu acuratee credinele cuiva. n cazurile n care distribuia apriori beta nu ofer
acurateea necesar ea poate fi uor adaptat prin adugarea de variabile ascunse precum
n exemplul de mai sus.

Pn acum s-au luat n consideraie doar observaii obinute dintr-o repartiie binomial.
n general, observaiile pot fi obinute din orice form de distribuie de probabilitate
fizic:

(11) ) , ( ) , | ( u u x f x p =
5
unde ) , ( u x f este funcia de probabilitate cu parametrii u. Se presupune c numrul
acestor parametrii este finit. De exemplu X poate fi o variabil continu ce are o
distribuie de probabilitate fizic de tip Gaussian cu media i dispersia v.
(12)
v
tu u
2 / ) ( 2 / 1
2
) 2 ( ) , | (

=
x
c x p
unde u={ ,v}.

Indiferent de forma funcional, se pot descoperi lucruri noi n legtur cu parametrii din
datele pe care le avem folosind abordarea bayesian. Dup ce s-a fcut i n cazul
binomial, se definesc variabile corespunztor cu parametrii necunoscui, se estimeaz
distribuia aprioric a acestor variabile i se utilizeaz regula lui Bayes pentru a modifica
gradul de ncredere referitor la aceti parametrii n funcie de date:

(13)
) | (
) | ( ) , | (
) , | (

u u
u
D p
p D p
D p =

Apoi facem media valorilor posibile ale lui O pentru a face predicii. De exemplu:

(14)
}
+ +
= u u u d D p x p D x p
N N
) , | ( ) , | ( ) , | (
1 1

Pentru o familie de distribuii cunoscute drept familia exponenialelor, aceste calcule pot
fi fcute eficient. Printre membrele acestei clase sunt: funcia binomial, multinomial,
normal, Gamma, Poisson i multivariat-normal. Bernardo i Smith au sintetizat
cantitile i calculele Bayesiene pentru membrele cele mai uzate ale familiei
exponenialelor. Mai jos vom sumariza aceste elemente pentru distribuia multinomial,
pe care o vom folosi pentru a exprima multe dintre ideile acestei lucrri.

n repartiia multinomial, variabila X observat este discret, avnd r stri posibile
x
1
,...,x
r
. Funcia de probabilitate este dat de expresia:

(15) r k x X p
k
k
,..., 1 , ) , | ( = = = u u
unde u={u
2
,,u
r
} sunt parametrii. (Parametrul u
1
este dat de expresia:

r
k
k
2
1 u ).

n acest caz ca i n cazul repartiiei binomiale parametrii corespund unor probabiliti
fizice. Datele statistice suficiente pentru setul de date D={X
1
=x
1
,,X
N
=x
N
} sunt
reprezentate de {N
1
,,N
r
} unde N
i
este numrul de apariii a lui X=x
r
n D. Conjugata
simpl apriori folosit cu repartiia multinomial este distribuia Dirichlet:

(16)
[
[
=

=
I
I
=
r
k
k r
k
k
r
k
Dir p
1
1
1
1
) (
) (
) ,..., | ( ) | (
o
u
o
o
o o u u
unde

=
=
r
i
k
1
o o , i r k
k
,..., 1 , 0 = > o . Distribuia aposteriori va fi:

(17) ) ,..., | ( ) , | (
1 1 r r
N N Dir D p + + = o o u u
6
Tehnicile de estimare a distribuiei beta pot fi folosite i pentru estimarea distribuiilor
Dirichlet. Avnd distribuia apriori i setul de date D, distribuia de probabilitate pentru
urmtoarea observaie este dat de:
(18)
}
+
+
= + + = =
+
N
N
d N N Dir D x X p
k k
r r k
k
N
o
o
u o o u u ) ,..., | ( ) , | (
1 1 1


Dup cum vom vedea o alt msur importat n analiza bayesian este probabilitatea
marginal sau dovada p(D|). n acest caz avem:

(19)
( )
( )
[
=
I
+ I
+ I
I
=
r
k k
k k
N
N
D p
1
) (
) (
) | (
o
o
o
o


Menionm c specificarea explicit a strii cunotinei n cadrul formulelor este util,
deoarece ea subliniaz caracterul subiectiv al probabilitilor. Totui odat ce conceptul
este conturat, notaia adaug doar confuzie. n restul lucrrii nu vom mai meniona
explicit.

n concluzie, dei abordarea bayesian i cea clasic dau uneori aceleai predicii, ele sunt
metode de nvare din date fundamental diferite. Drept exemplu, s relum exemplul cu
pioneza. Acolo estimarea bayesian este obinut ntr-o manier opus abordrii clasice.
Mai exact n abordarea clasic u este fix i ne strduim s ne imaginm toate mulimile
de date de dimensiune N care pot fi generate prin eantionare din distribuia binomial
determinat de u. Fiecare set de date D vor apare cu o probabilitate p(D|u) i vor produce
o estimaie u
*
(D). Pentru a evalua un estimator, calculm expectana i dispersia :
(20)
( )
( )
( ) ( ) ( )
( )
( ) ( )

=
=
D
D p D p
D
D p
E D D p Disp
D D p E
2
*
|
* *
) | (
* *
|
|
) ( ) | (
u u u u
u u u
u u
u

Apoi alegem un estimator care ntr-un fel echilibreaz eroarea )) ( (
*
) | (
u u
u D p
E i
dispersia acestor estimri pe mulimea valorilor posibile ale lui u. n final aplicm
estimatorul setului de date pe care le observm. Un estimator folosit n mod normal este
estimatorul ML (de verosimilitate maxim) care selecteaz valoarea u care maximizeaz
probabilitatea p(D|u). Pentru eantionarea binomial avem:
(21)

=
=
r
k
k
k
ML
N
N
D
1
*
) ( u

Pentru aceasta i pentru alte tipuri de eantionri estimatorul ML este nedeplasat. Aceasta
nseamn c pentru toate valorile lui u, estimatorul ML are eroarea zero. n plus pentru
toate valorile lui u, dispersia estimatorului ML nu este mai mare dect orice alt estimator
nedeplasat. n contrast, n abordarea bayesian, D este fixat i ne imaginm toate valorile
posibile de u din care ar fi putut fi generate datele. Nu avem o certitudine asupra lui u i
pn acum estimarea final a expectanei lui u n concordan cu credinele aposteriori
despre valoarea sa este:
7
(22)
}
= u u u u
u
d D p E
D p
) , | ( ) (
) , | (


Expectanele din cele dou abordri sunt diferite i n majoritatea cazurilor duc la
estimri diferite. Un mod de a ncadra aceast diferen este acela de a spune c
abordrile clasic i bayesian au definiii diferite asupra a ce nseamn un bun estimator.
Ambele soluii sunt corecte n sensul c ele sunt auto-consistente. Din nefericire ambele
metode au deficienele lor, care duc la dispute interminabile n legtur cu meritele
fiecrei abordri.

3. Reele bayesiene, definiie i avantaje

O reea bayesian este un model grafic ce reprezint relaiile probabilistice ntre
variabilele unei mulimi. n ultimul deceniu, reelele bayesiene au devenit o modalitate
popular de reprezentare a cunotinelor nesigure n sistemele expert. Mai recent
cercettorii au dezvoltat metode pentru construirea automat de reele bayesiene din date.
Tehnicile care s-au dezvoltat sunt noi i nc n proces de evoluie, dar ele s-au dovedit
remarcabil de eficiente n anumite probleme de analiz a datelor.

Primul avantaj se refer la faptul c reelele bayesiene pot manipula uor mulimi
incomplete de date. De exemplu, considerai o clasificare sau o problem de regresie n
care dou dintre variabilele explicative sunt puternic corelate. Aceast corelaie nu
reprezint o problem pentru metodele standard de nvare supervizat avnd n vedere
c variabilele explicative sunt msurate separat. Cnd ns una dintre aceaste variabile nu
este observat, majoritatea modelelor vor produce predicii cu acuratee redus, deoarece
ele nu includ corelaia dintre variabilele explicative. Reelele bayesiene ofer o
modalitate natural de modelare a acestor tipuri de dependene.

Al doilea avantaj se refer la faptul c reelele bayesiene permit utilizatorului s afle de
existena unor relaii cauzale. Aflarea acestor relaii este important pentru cel puin
dou motive. Procesul este util cnd ncercm s ne formm o imagine de ansamblu
asupra domeniul unei probleme. n plus cunoaterea acestor relaii cauzale ne permite s
facem predicii n momentul unor modificri. De exemplu, un analist de marketing poate
dori s afle dac este avantajos s mreasc expunerea unei anumite reclame n vederea
creterii vnzrilor unui produs. Pentru a rspunde la aceast ntrebare prin analiza unei
reele bayesiene a datelor existente se poate determina dac reclama respectiv este cauz
pentru creterea vnzrilor i dac da n ce msur. Utilizarea reelelor bayesiene ajut s
se rspund la astfel de ntrebri dei nu s-au efectuat experimente asupra problemei n
cauz.

Al treilea avantaj, reelele bayesiene n combinaie cu tehnicile statistice Bayesiene
faciliteaz combinarea cunotinelor dintr-un domeniu i a datelor. Oricine a realizat
o analiz a lumii reale tie importana datelor apriorice (cunotinelor despre un
domeniu), mai ales cnd datele sunt puine sau costisitoare. Faptul c anumite sisteme
comerciale pot fi construite doar pe baza cunotinelor apriorice este o mrturie a
importanei acestora. Reelele bayesiene au o semantic cauzal care face ca modelarea
8
cunotinelor apriorice s fie uoar. n plus, reelele bayesiene reprezint puterea
relaiilor cauzale prin probabiliti.

Al patrulea avantaj se refer la faptul c metodele Bayesiene n combinaie cu reelele
Bayesiene i cu alte tipuri de modele ofer o abordare eficient i bine documentat
asupra evitrii supra-antrenrii. n aceste reele nu este nevoie s pstrm parte din
datele disponibile pentru testare. Folosind abordarea Bayesian, modelele pot fi
rafinate ntr-o aa manier nct toate datele disponibile pot fi folosite pentru testare.

In concluzie, avantaje ale reelelor bayesiene sunt urmtoarele:
sunt mult mai compacte dect sistemele de baz conduse
folosesc informaii din trecut pentru a previziona ceea ce se va ntmpla
ofer o analiz valid chiar i cnd informaiile sunt nesigure
ofer posibilitatea prezicerii sau a diagnosticrii, n funcie de analiza cerut
se realizeaz cu un cost mai redus dect construirea sistemelor de decizii sau
sistemelor expert
este uor de explicat cum un sistem ajunge la o anumit decizie, aciune
ofer posibilitatea diagnosticrii problemelor:

Reelele bayesiene pot fi folosite n numeroase domenii cu ajutorul analizei de
senzitivitate este uor de neles cum prin schimbarea inputurilor sunt afectate rezultatele.
Reelele bayesiene au fost deja aplicate n numeroase domenii de afaceri. n oricare din
exemplele date descrierea sistemului ar fi imposibil prin reguli de afaceri:
selectarea oportunitilor de mprumut cu risc sczut
estimarea momentului cnd echipamentul va avea nevoie de reparaii, pri de
baz sau inputuri senzor sau nregistrri
rezolvarea rapid a problemelor clienilor via instrumente de comunicare on line
diagnosticarea i depanarea problemelor de pe site-urilor reelelor celulare n timp
util
controlarea vehiculelor autonome i navigarea lor
planificarea resurselor pentru proiecte a cror riscuri i beneficii s fie cele mai
oportune.

4. Structura unei reele Bayesiene

Reelele Bayesiene sunt modele grafice n care variabilele sunt reprezentate de noduri i
relaiile cauzale sunt sgei numite muchii.


nod printe





nod fiu
precipitaii
condiii de
drum
9



Nodul reprezint o variabil n modelul dat. E reprezentat printr-un oval. Muchia
reprezint o relaie cauzal dintre dou noduri. E reprezentat printr-o sgeat indicnd
direcia i cauzalitatea. nsemntatea muchiei ntre X i Y e c nodul X influeneaz pe Y.
Cum un nod l influeneaz pe cellalt e descris n tabela de probabiliti. Muchiile
determin de asemenea nite termeni calificativi pentru noduri. Cnd dou noduri sunt
unite de o muchie nodul cauzal e printele celuilalt. Avem nod rdcin, care nu are
printe i frunz pentru nodurile care nu au fii. Valorile luate de o variabil se numesc
stri. De exemplu strile importante pentru precipitaii sunt (Deloc, Uoar, Puternic);
tim c precipitaiile fac drumul practicabil sau impracticabil.

4.1 Tabele de probabiliti condiionate

Fiecare nod are un tabel de probabiliti condiionate asociat lui. Probabilitile
condiionate sunt bazate pe informaiile prioritare sau experiena din trecut. O
probabilitate condiionat e scris matematic ca P(x|p1,p2,...pn) i reprezint
probabilitatea variabilei X n starea x fiind dat printele P1 n starea p1, P2 n starea
p2....respectiv Pn n starea pn. Asta se ntmpl pentru fiecare printe i stare a acestuia.
E un rnd n tabel care descrie c e cel mai probabil ca i fiul s fie ntr-o anumit stare.
De exemplu figura care urmeaz, pentru condiii de drum nodul poate fi citit: Dac
printele precipitaii este n stare deloc, atunci probabilitatea ca i condiiile de drum s
fie impracticabile e 5%. Astfel se pot citi toate nodurile.
printe fiu
precipitaii condiii de drum
impracticabil practicabil
deloc 0,050 0,950
usoar 0,100 0,900
puternic 0,700 0,300




4.2 Presupuneri i eviden

Presupunerile sunt probabilitatea ca o variabil s fie ntr-o anumit stare bazat pe
adugarea datelor cunoscute. Presupunerile apriori sunt un caz special a acestora fiind
bazate doar pe informaii prioritare i sunt determinate doar de informaii stocate n tabela
de probabiliti. Evidena este informaia despre o situaie curent i poate fi de dou
tipuri:
Evidena puternic: Faptul c nodul are 100% o stare i 0% alte stri.
Evidena slab: Orice eviden care nu e puternic. Cu alte cuvinte faptul c un
nod este ntr-o stare cu o probabilitate mai mic de 100% i n alte stri cu o
strile nodului selectat
probabilitile condiionate
strile nodului printe
10
probabilitate mai mare de 0%. Este folosit pentru informaii despre care exist o
nesiguran cum ar fi rapoarte contradictorii sau surse ndoielnice.

4.3 Implementare n MSBNx

MSBNx este o aplicaie Windows pentru crearea i evaluarea reelelor bayesiene.
Componentele MSBNx pot fi integrate n program pentru a influena adoptarea unor
ipoteze i luarea deciziilor n condiii de incertitudine.

Construirea unei reele Bayesiene urmeaz un set de instruciuni:
Includerea tuturor variabilelor importante din model
Folosire cunotinelor cauzale pentru a ghida conexiunile fcute n graf
Folosirea cunotinelor prioritare pentru a specifica distribuia condiionat

Cunoaterea cauzal nseamn n acest context legarea variabilelor din model astfel nct
arcele s conduc de la cauze la efecte. Pe cnd teoria probabilitii se poate ocupa att cu
variabile discrete ct i continue, MSBNx poate accepta doar variabile cu un numr
limitat de valori, adic discrete. De exemplu dac avem variabila vrst care poate lua
diferite valori fiind o variabil continu, o vom transforma n una discret mprind-o n
intervale, astfel: copil 0-18,adult 18-45, vrsta a 2-a :45-65, vrsta a 3 a: peste 65.

Orice variabil din lumea real e reprezentat de o variabil Bayesian. O astfel de
variabil descrie un set de stri care reprezint toate posibilitile de valori distincte ale
variabilei. Odat ce setul de variabile i strile lor sunt tiute, pasul urmtor este s
definim relaiile cauzale dintre ele. Pentru fiecare variabil aceasta nseamn s formulezi
urmtoarele ntrebri:
Ce alte variabile (dac exist) influeneaz direct aceast variabil?
Ce alte variabile (dac exist) sunt direct influenate de variabil?

Pentru crearea unei reele bayesiene cu MSBNx se parcurg urmtorii pai:

1. Se creeaz un set de variabile reprezentnd elemente distincte ale situaiei modelate.
2. Pentru fiecare variabil se definete setul de stri de ieire pe care le poate avea.
Aceasta trebuie s acopere toate posibilitile i s fie distincte.
3. Se stabilesc dependenele condiionate dintre variabile. Aceasta nseamn creearea
arcelor (linii cu sgei) care duc de la nodul printe la nodul copil
4. Se formuleaz probabilitile prioritare. Aceasta nseamn mrirea modelului prin
adugarea probabilitilor numerice pentru fiecare variabil din pasul 3.

Cnd lucreaz cu o reea bayesian, utilizatorul selecteaz din lista de stri posibile ale
variabilelor starea observat; sistemul realizeaz apoi raionamente matematice de
probabilitate utiliznd regula lui Bayes i actualizeaz probabilitile variabilelor care
sunt conectate cu variabilele ale cror stri au fost observate.



11
S considerm urmtorul exemplu: Valoarea adugat reprezint surplusul de ncasri
peste valoarea consumurilor provenite de la teri sau bogia creat prin valorificarea
potenialului tehnic, material i financiar al ntreprinderii.
Pentru a analiza valoarea adugat este necesar s realizm descompunerea n factori.
Modelul factorial rezultat este: T
VA=Q
e
*

va Q
e

wh

va g
i

va
i


Va-valoarea adugat, Q
e
- producia exerciiului,

va- valoarea adugat medie, T-timpul


total lucrat,

wh - productivitatea orar, g
i
- structura valorii adugate, va
i
- valoarea
adugat la 1 leu producie a exerciiului pe produs. Pentru a vedea care este
probabilitatea ca valoarea adugat s evolueze ntr-un anumit fel n funcie de
modificrile observate ale factorilor de influen, construim reeaua bayesian urmtoare:



Fiecare nod din graf reprezint o variabil iar arcele reprezint condiionrile existente
ntre ele. Variabilele au anumite stri care au asociate probabiliti.
Tabelele de prioriti condiionate sunt :
- pentru variabila Timp_lucrat:
12

- pentru variabila Productivitate_orara:

-pentru variabila VA_pe_produs:

-pentru variabila Struct_VA:


- pentru varabila Productia_exercitiu:



De exemplu un rnd din tabel se citete astfel: Dac timpul lucrat scade i
productivitatea crete atunci producia exerciiului crete cu o probabilitate de 0,68% d ,
ceea ce se explic prin faptul c productivitatea e o variabil calitativ, a crei influen e
mai mare.





13
-pentru variabila Vamedie:



-pentru variabila VA:



Utiliznd opiunea Evaluate, putem seta strile observate pentru anumite variabile i ni se
vor returna probabilitile pentru care celelalte variabile vor lua o stare sau alta. De
exemplu, dac se observ o cretere a productivitii orare i o mbuntire a structurii
valorii adugate, n condiiile n care nu tim nimic despre celelalte variabile atunci
probabilitatea ca valoarea adugat s creasc este de 95,04%.

S-ar putea să vă placă și