Documente Academic
Documente Profesional
Documente Cultură
Exemples 1
M. Smith attend larrive de M. Holmz et Dr Watson. Ils sont en retard et M. Smith a un autre rendez-vous important juste aprs. Etant donn quil fait froid, M. Smith suppose alors que les routes sont geles, il conclut alors quils ont probablement eu un accident (ses deux visiteurs sont de mauvais conducteurs). Sa secrtaire entre et linforme que Dr Watson a eu un accident, il annonce sa secrtaire quil compte aller son rendez-vous car tant donn que les routes sont geles, il est fort probable que M. Holms a eu un accident lui aussi. Sa secrtaire linforme quil se trompe et que les routes ne sont pas geles. Tenant compte de cette nouvelle information, il dcide dattendre M. Holms encore dix minutes. Soient les 3 variables alatoires binaires : G : routes Geles W : Dr Watson a eu un accident H : M. Holms a eu un accident
G H
H
G est la cause de H et W
Exemple 2
Ce matin-l, alors que le temps est clair et sec, M. Holms sort de sa maison. Il saperoit que la pelouse de son jardin est humide. Il se demande alors sil a plu pendant la nuit, ou sil a simplement oubli de dbrancher son arroseur automatique. Il jette alors un coup dil la pelouse de son voisin, et saperoit quelle est galement humide. Il en dduit alors quil a probablement plu, et il dcide de partir au travail sans vrifier son arroseur automatique. Soient les variables alatoires suivantes : A : M. Holms a oubli son arroseur automatique P : Il a plu pendant la nuit J : Lherbe de mon jardin est humide V : Lherbe du jardin du voisin est humide A P
Rseaux causaux
Graphe sans circuits Sommets : Un ensemble de variables alatoires ayant chacune un ensemble dtats fini. Arcs : entre les variables (traduisant une certaine causalit).
A
Parents de C
Fils de A et de B
Prob(A) : probabilit de A avant larrive de E. Prob(A/E) : probabilit de A aprs larrive de linformation E. En gnral Prob(A/E) Prob(A)
d-sparation
- Connexion en srie :
A C B
- Connexion divergente :
A
C B
- Connexion convergente :
A C
Linformation circule de A B lorsque soit C ou soit lun de ses descendants a reu une information lmentaire.
d-sparation
2 noeuds A et B, dans un rseau causal, sont dites d-spars si sur toute chane entre A et B il existe un nud intermdiaire V telle que lune des deux conditions suivantes soit ralise : -! La connexion, en V, est en srie ou divergente et V est instanci. -! La connexion, en V, est convergente et lon ne dispose pas dinformations lmentaires ni sur V ni sur de ses descendants.
A Exemple : Graphe causal avec B et M instancis. On a : A et G sont d-spars D H K M i B i C E I L F G J
Markov Blanket (Couverture de Markov) dune variable A est forme par les parents de A, des fils de A et des nuds partageant un fils avec A.
A
Rsultat Si tous les nuds de la couverture de Markov de A sont instancis alors A est d-spar du reste des nuds du graphe
Probabilits
A, B et C sont 3 variables alatoires ayant pour ensembles dtats respectifs : {a1,a2}, {b1 , b2} et {c1, c2, c3}. On donne ci-dessous leur table de probabilit jointe P(A,B,C).
p(a2,b1,c2)
a1 b1 c1 c2 c3 P(A,B) 0,01 0,004 0,006 0,02 b2 0,04 0,03 0,01 0,08 b1 0,1 0,108 0,062 0,27 a2 b2 0,278 0,152 0,2 0,63 P(C) 0,428 0,294 0,278
a1 P(B) 0,29
a2 0,71 P(A)
b1 0,1
b2 0,9
Lois conditionnelles
a1 b1 c1 c2 c3 0,023 0,014 0,022
P(A,B/C) a2 b2 0,093 0,102 0,036 b1 0,234 0,367 0,223 b2 1 0,65 1 0,517 1 0,719
Indpendance conditionnelle
Etant donn 3 variables alatoires A,B et C (discrtes). A et C seront dites indpendantes sachant B si : p(A=ai/B=bj,C=ck)= p(A=ai/B=bj) Remarque, cette dfinition entrane aussi : p(C=ck /B=bj, A=ai)= p(C=ck/B=bj) ! Rsultat : A et C sont indpendantes sachant B, si et seulement si : p(A=ai ,C=ck/B=bj) = p(A=ai/B=bj) p(C=ck/B=bj)
O pa(Ai) reprsente lensemble des parents de Ai (lensemble p(Ai) est parfois vide)
Exemple dun RB
A AA
On se donne : Les probabilits priori P(A), P(B) Les probabilits conditionnelles P(C/A), P(D/B), P(E/C), P(F/C,D)
Exemple 3
Langage L sur une alphabet {a,b}. Lors de la transmission, les mots sont spars par le symbole c . Dautre part, certains caractres peuvent tre affects par la transmission et tre confondus avec dautres. Un mot de 5 caractres est transmis, construire un modle qui permet de calculer la probabilit du mot transmis t=t1t2t3t4t5 sachant le mot observ est o=o1o2o3o4o5. Un rseau Baysien (Modle simple)
T1 O1 T2 O2 T3 O3 T4 O4 T5 O5
Ce modle suppose que : p(T1,T2,T3,T4,T5,O1,O2,O3,O4,O5)= p(T1)p(O1/T1)p(T2/T1)p(O2/T2)p(T3/T2)p(O3/T3)p(T4/T3)p(O4/T4)p(T5/T4)p(O5/T5) NB Si les deux tables p(Oi/Ti) et p(Ti+1/Ti) sont constantes (indpendantes de i) ce modle gnre une squence de 5 mots suivant un modle dune chane de Markov cache..
b1 a1 a2 (0.006,0.054) (0.014,0.126)
b2 (0.048,0.432) (0.032,0.288)
III- La table suivante reprsente un teste T pour un vnement A : P(T/A) T=oui T=non A=oui 0.99 0.01 A=non 0.001 0.999
Ce teste sera appliqu dans 2 contextes diffrents : Contexte 1 : Lvnement A se ralise avec une probabilit de 0.2. Contexte 2 : Lvnement A se ralise avec une frquence de 0.001. Calculer dans les deux cas la probabilit : P(A=oui/T=oui)
Solution de I
Solution de II
Loi marginal E
b1 P(A,B,C) a1 a2 c1 0,006 0,014 b1 P(B,C) c1 0,02 c2 0,18 c2 0,054 0,126 b2 c1 0,048 0,032 b2 c1 0,08 b2 a2 0,14 a1 0,48 a2 0,32 P(A/B) a1 0,3 c2 0,72 P(C/B) c1 0,1 b1 a2 0,7 c2 0,432 0,288 b1 b2 p(B) 0,2 0,8 b1 c2 0,9 b2 a1 0,6 a2 0,4 b2 c1 0,1 c2 0,9
Probabilit E conditionnelle
Loi marginal
P(A,B) a1
b1 0,06
Loi marginal E
Probabilit E conditionnelle
10
b1
P(A/B)P(C/B)
c1 0,03 0,07
a1 a2
Solution de III
Contexte
P(A,T)=P(T/A)P(A)
1 : p(A)
0,2
0,8
P(A=o/T=o)
= 0,996
P(A=oui/T=oui)= P(A=oui,T=oui)/P(T=oui)
11
P(A,T)=P(T/A)P(A P(A,T)=P(T/A)P(A)
Contexte
2 : p(A) 0,001 0,999 p(A,T) T=oui T=non P(A=o/T=o) = 0,553
2
A=oui 0,00099 0,00001 A=non 0,0008 0,998001 p(T) 0,00179 0,998011
P(A=oui/T=oui)= P(A=oui,T=oui)/P(T=oui)
Dans ce cas le teste est mauvais, car cette probabilit est proche de 0,5
12
! Naf Bayes Dans le cas dun problme de diagnostic, on a des symptmes et des causes. Une cause C dpend des symptmes A1, ,Ap, il sagit de dterminer la probabilit de la cause C connaissant ses symptmes : P(C/ A1=a1, ,Ap=ap). Si on fait lhypothse que les symptmes sont indpendants connaissant la cause C :
A1 C Ap
Ou logique
On suppose que C et tous les Ai sont des variable binaires. On considre la variable A=(A1,Ap). La table du ou logique est dfinie par : Pou (C=1/ A1=A2==Ap=0)=0 et Pou(C=1/ A
(0,0,,0))=1.
(0,0,,0))=0.
Ou Bruit
On considre en plus la variable A=(A1,Ap), o les variables Ai sont binaires et 2 2 indpendants, et le rseau baysien suivant :
A1 A1 C Ap Ap
13
Ou bruit (suite 1)
Dfinition dun rseau baysien
La probabilit jointe : Pb(A, A,C) = Pour A=(a1, , aj, ..., ap)=a On en dduit :
Ou bruit (suite 2)
Interprtation : Si Aj = 1 alors C=1 sauf si un vnement !j se ralise et qui entrane C=0. Lvnement !j se ralise avec la probabilit qj. On suppose en plus que les vnements qj sont indpendants. Exemple : Le mal de gorge du matin peut tre caus par le froid, une
angine ou autres causes. Ce qui correspond au graphe suivant :
1 Froid (Fr) 2 Angine (An) 3 Autres (Au)
A3=1 A1 =1 A1=0 1-q1q2q3= 0,99 1-q2q3 =0,97
14
aa ab
ba
0,011
0,014
0,01
0,01
0,031
0,046
0,031
0,045
0,198
bb
0,05 0,111
0,06 0,135
0,056 0,122
0,057 0,124
0,016 0,103
0,023 0,153
0,015 0,101
0,023 0,151
0,3
P(O/T)
T=a O=a O=b O=c 0,80 0,10 0,10 T=b 0,15 0,80 0,05 a b a 0,6 0,4
P(T2
Si on retient le modle prcdent et on recalcule les probabilits des mots en utilisant la formule : p(T1,T2,T3,T4,T5)= p(T1)p(T2/T1)p(T3/T2)p(T4/T3)p(T5/T4) On obtient la probabilit jointe suivante :
aa ab ba bb
15
T3
Probabilit Jointe
Rduire ce graphe : consiste choisir un graphe sans circuit parmi 210 possibilits.
Distance entre deux lois de probabilits : P tant la vraie probabilit et P* celle dduite dun modle graphique. On peur dfinir 2 mesures de distance : Euclidienne Kullback-leibler
16
Taille du graphe : U tant lensemble des variables alatoires. Pour tout modle de graphe M choisi, on dfini : Taille(M )=
P* tant la probabilit dfinie par le rseaux baysien du modle M. On dfini la fonction cot suivante : Taille(M)+KDistE(P,P*) K qui ralise le compromis entre les 2 termes.
Si on prend K=10.000, le modle M qui ralise le minimum de la fonction cot est dfini par le graphe suivant :
T1 T2 T3 T5 T4
aa ab ba bb
17
"#
B
X1
A B
X2
A B
X3
XT-1
A B
XT
B
YT-1
Observations
Y1
Y2
Y3
YT
Observations
Exemples
Le lait dune vache peut tre infect. Pour dtecter si le lait est infect, on dispose d'un test. Ce test peut donner soit un rsultat positif soit un rsultat ngatif. Le test n'est pas parfait, il peut donner un rsultat positif sur un lait non infect ainsi quun rsultat ngatif sur un lait infect. Nous avons deux variables alatoires : Infect : ayant deux valeurs oui ou non Test : ayant deux valeurs positif ou ngatif
Rseau Baysien Infect Test
18
Exemple (suite)
Modlisation de 5 jours avec la proprit 2-jours de mmoire de la variable infect
Inf1 Test1 Inf2 Test2 Inf3 Test3 Inf4 Test4 Inf5 Test5
Modlisation de 5 jours avec la proprit 2-jours de mmoire de la variable infect et 1-jour de mmoire de la variable Test
Inf1 Test1 Inf1 Test2 Inf1 Test3 Inf1 Test4 Inf1 Test5
19