Documente Academic
Documente Profesional
Documente Cultură
bayesianas
1
Edad
Individuo 1
Mayor_50
no
no
no
no
Individuo 2
Mayor_50
no
no
no
no
Individuo 3
Mayor_50
no
no
no
no
Individuo 4
Mayor_50
no
no
no
no
Individuo 5
Mayor_50
no
no
Individuo 6
Mayor_50
no
Individuo 7
Mayor_50
no
Individuo 8
Mayor_50
no
si
Individuo 9
Menor_50
no
no
no
no
Individuo 10 Menor_50
no
no
no
no
Individuo 11 Menor_50
no
no
no
no
Individuo 12 Menor_50
no
no
no
no
Individuo 13 Menor_50
no
no
no
no
Individuo 14 Menor_50
no
no
no
no
Individuo 15 Menor_50
no
no
no
no
Individuo 16 Menor_50
no
no
no
no
Individuo 17 Menor_50
no
no
Individuo 18 Menor_50
no
no
Individuo 19 Menor_50
no
Individuo 20 Menor_50
no
no
no
P(E= Mayor_50) =
O,H,I,V
O
tambin
P(Edad,
Hernia):
P(E
=
Mayor_50,
H=s)=
P(E > Mayor > 50,O,H = s,I,V) =3/20
O,I,V
P(E
=
Mayor_50,
H=no)=
P(E > Mayor > 50,O,H = no,I,V) =
4/20
O,I,V
P(H=si/V=si)=
P(H=si/V=no)=
P(H=no/V=si)= 3/7
P(H=no/V=no)= 1
!(!!!")
= 4/7
!(!!!",!!!")
!(!!!")
= 0
!(!!!",!!!,!!!")
!(!!!",!!!")
!/!"
!/!"
=1
Ejercicios
Ejercicio
2.1.
Tiempo
Temperatura(C)
Humedad(%)
Viento
Jugar
al
tenis
(T)
(Te)
(H)
(V)
(JT)
soleado
falso
no
29
65
soleado
verdadero
no
27
70
cubierto
falso
s
28
66
lluvioso
falso
s
21
76
lluvioso
falso
s
20
60
lluvioso
verdadero
no
18
50
cubierto
verdadero
s
18
45
soleado
falso
no
22
75
soleado
falso
s
21
50
lluvioso
falso
s
24
60
soleado
verdadero
s
24
50
cubierto
verdadero
s
22
70
cubierto
lluvioso
27
22
55
71
falso
verdadero
s
no
Se
pide,
a) Discretiza
la
variable
Temperatura
en
los
siguientes
valores:
20;
entre 20 y 26;
26.
b) Discretiza
la
variable
Humedad
en
los
siguientes
valores:
60%;
60%
c) Calcula
las
siguientes
probabilidades:
P(T=soleado, Te= 26, H60%,V=falso, JT=no)
P(T=soleado, Te= 26, H60%,V=falso)
P(JT=no/ T=soleado, Te= 26, H60%,V=falso)
P(JT=no/Te= 26)
P(T=soleado)
2 Presentacin
intuitiva
Antes
de
presentar
formalmente
la
teora
matemtica
de
las
redes
bayesianas,
explicaremos
mediante
ejemplos
sencillos1
el
significado
intuitivo
de
los
conceptos
que
despus
introduciremos
de
un
modo
ms
formal.
En
una
red
bayesiana,
cada
nodo
corresponde
a
una
variable,
que
a
su
vez
representa
una
entidad
del
mundo
real.
Por
tanto,
de
aqu
en
adelante
hablaremos
indistintamente
de
nodos
y
variables,
y
los
denotaremos
con
letras
maysculas,
como
X.
Utilizaremos
la
misma
letra
en
minscula,
x,
para
referirnos
a
un
valor
cualquiera
de
la
variable
X.
Los
arcos
que
unen
los
nodos
indican
relaciones
de
influencia
causal.
Ejemplo
2.
Por
tanto,
en
nuestro
ejemplo,
los
datos
que
debemos
conocer
son
P(x)
y
P(y1/x).
As,
la
red
bayesiana
completa
sera:
X
P(+x) = 0.003
Probabilidades
a
priori
de
nodos
sin
padres
Probabilidad
condicionada
de
los
dems
Y1
P(+y1/+x)= 0.992
P(+y1/x)= 0.0006
Asociados
a
un
test
tenemos
dos
parmetros:
Sensibilidad
(probabilidad
de
resultado
positivo
si
enfermo)
Especificidad
(probabilidad
de
resultado
negativo
si
no
enfermo)
Con
la
prevalencia,
la
sensibilidad
y
la
especificidad,
es
posible
calcular
la
probabilidad
de
que
un
paciente
est
enfermo
segn
el
resultado
de
su
test
P(x)
P(y/x)
P(y)
Y1
P(+y1/+x)= 0.992
P(+y1/x)= 0.0006
P(+x) = 0.003
Y2
P(+y2/+x)= 0.98
P(+y2/x)= 0.017
Vemos
aqu
que,
para
el
paludismo,
la
fiebre
tiene
menor
especificidad
que
la
gota
gruesa.
As,
este
sencillo
modelo
tiene
en
cuenta
que
hay
muchas
otras
causas
que
pueden
producir
fiebre.
Veamos
qu
tipo
de
conclusiones
podemos
extraer
a
partir
de
esta
informacin.
c) Supongamos
que
e
=
{+y2}.
Entonces,
podemos
calcular
como
antes
la
probabilidad
a
posteriori
de
que
el
paciente
tenga
paludismo
sabiendo
que
tiene
fiebre:
P*(+x)
=
P(+x/+y2)
=
0.003
0.98
=
0.00294
=
0.148
P*(x)
=
P(x/+y2)
=
0.997
0.0017
=
0.016949
=
0.852.
P(x) P(y1 , y 2 / x)
P(y1 , y 2 )
Pero
ahora
vemos
que
hay
datos
del
problema
que
no
conocemos,
como
P(y1,y2)
y
P(y1,y2/x).
Para
poder
seguir
nuestros
clculos,
necesitamos
realizar
unas
hiptesis
adicionales
que
se
llaman
hiptesis
de
independencia
condicional.
En
concreto,
vamos
a
suponer
que
las
variables
Y1
e
Y2
son
independientes
dados
su
padre
comn,
X,
es
decir:
P(y1,y2/x)
=
P(y1/x)
P(y2/x).
Si
suponemos
esto
podremos
continuar
con
los
clculos
porque
P(y1,y2)
se
obtendr
como
constante
de
normalizacin.
Las
hiptesis
de
independencia
condicional
permiten
en
este
ejemplo
realizar
el
clculo
de
las
probabilidades
a
posteriori
P(y1/x, y2)
P(x, y 2 )
.
P(y 2 )
P(y1/x)
Y (x).
1
Y,
finalmente,
P*(+y1)
=
[Y1(+x)
P(+y1/+x)+
Y1(x)
P(+y1/x)]
=
0.14715
P*(y1)
=
[Y1(+x)
P(y1/+x)+
Y1(x)
P(y1/x)]
=
0.85285
Resulta
interesante
comparar
las
expresiones
utilizadas
para
calcular
la
probabilidad
a
priori
P(y1)
y
la
a
posteriori
P*(y1).
Para
la
primera,
utilizbamos
P(x),
ahora
hemos
utilizado
Y1(+x),
que
indica
la
probabilidad
de
x
tras
considerar
la
evidencia
relativa
a
x
diferente
de
Y1.
Vemos
as
como
la
informacin
que
aporta
el
nodo
Y2
modifica
la
probabilidad
de
X,
y,
en
consecuencia,
tambin
la
de
Y1.
El
carcter
simultneamente
ascendente
y
descendente
del
mecanismo
de
Definiciones
previas
Arco.
Es
un
par
ordenado
(X,
Y).
Esta
definicin
de
arco
corresponde
a
lo
que
en
otros
lugares
se
denomina
arco
dirigido.
En
la
representacin
grfica,
un
arco
(X,Y)
viene
dado
por
una
flecha
desde
X
hasta
Y.
Grafo
dirigido.
Es
un
par
G
=
(N,
A)
donde
N
es
un
conjunto
de
nodos
y
A
un
conjunto
de
arcos
definidos
sobre
los
nodos.
Grafo
no
dirigido.
Es
un
par
G
=
(N,A)
donde
N
es
un
conjunto
de
nodos
y
A
un
conjunto
de
arcos
no
orientados
(es
decir,
pares
no
ordenados
(X,Y))
definidos
sobre
los
nodos.
Camino.
Es
una
secuencia
ordenada
de
nodos
(Xi1,
. ..,
Xir)
tal
que
j
=
1,
...,
r-1,
bien el
arco
Xj
Xj+1
A
o
bien
el
arco
Xj+1
Xj
A.
Camino
dirigido.
Es
una
secuencia
ordenada
de
nodos
(Xi1,
...,
Xir)
tal
que
para
todo
j
=
1,
...,
r-1 el
arco
Xj
Xj+1
A.
Ciclo:
es
un
camino
no
dirigido
que
empieza
y
termina
en
el
mismo
nodo
X.
Grafo
acclico:
es
un
grafo
que
no
contiene
ciclos.
Padre.
X
es
un
padre
de
Y
si
y
slo
si
existe
un
arco
X
Y.
Se
dice
tambin
que
Y
es
hijo
de
X.
Al
conjunto
de
los
padres
de
X
se
representa
como
pa(X),
y
al
de
los
hijos
de
X
por
S(X).
Antepasado
o
ascendiente.
X
es
un
antepasado
o
ascendiente
de
Z
si
y
slo
si
existe
un
camino
dirigido
de
X
a
Z.
Conjunto
ancestral
de
un
nodo
X
es
un
conjunto
que
contiene
a
X
y
a
todos
sus
antepasados.
Descendiente.
Z
es
un
descendiente
de
X
si
y
slo
si
X
es
un
antepasado
de
Z.
Al
conjunto
de
los
descendientes
de
X
lo
denotaremos
por
de(X).
Variable
proposicional
es
una
variable
aleatoria
que
toma
un
conjunto
exhaustivo
y
excluyente
de
valores.
La
denotaremos
con
letras
maysculas,
por
ejemplo
X,
y
a
un
valor
cualquiera
de
la
variable
con
la
misma
letra
en
minscula,
x.
Definicin
Una
red
bayesiana
es:
tales que:
Las
hiptesis
de
independencia
condicional
establecen
que
cada
nodo
debe
ser
independiente
de
los
otros
nodos
de
la
red
(salvo
sus
descendientes)
dados
sus
padres
Vamos
a
hacer
un
ejemplo
en
el
que
demostraremos
que
una
red
es
una
red
bayesiana.
Ejemplo
4.
A
B
P(a1) = 0.3; P(b1/a1) = 0.4 P(b1/a2) = 0.2 P(c1/a1) = 0.7 P(c1/a2) = 0.6
10
En
el
que
las
variables
que
aparecen
son
binarias,
junto
con
la
siguiente
distribucin
de
probabilidad
conjunta:
P(a1,b1,c1)
=
0.084
P(a1,b2,c1)
=
0.126
P(a2,b1,c1)
=
0.084
P(a2,b1,c2)
=
0.336
P(a1,b1,c2)
=
0.036
P(a1,b2,c2)
=
0.054
P(a2,b2,c1)
=
0.056
P(a2,b2,c2)
=
0.224
P(a1 , b1 , c1 )
P(a1 , b1 , c1 )
0.084
=
=
=
P(a1 , c1 )
P(a1 , b1 , c1 )+ P(a1 , b2 , c1 ) 0.084 + 0126
.
0.4
P(b1/a1)
=
P(a1 , b1 ) =
P(a1 )
P(a1 , b1 , c1 )+ P(a1 , b1 , c2 )
=
P(a1 , b1 , c1 )+ P(a1 , b2 , c1 )+ P(a1 , b1 , c2 )+ P(a1 , b2 , c2 )
0.084 + 0.036
=
0.4
0.084 + 0126
.
+ 0.036 + 0.054
En
la
estructura
cola-con-
cola
la
comunicacin
entre
los
hijos
est
abierta,
y
se
cierra
al
conocer
el
valor
del
padre
comn
11
Para la red ;
En
la
estructura
cola-con-
cabeza,
la
comunicacin
entre
los
nodos
raz
y
hoja
est
abierta,
y
se
cierra
al
conocer
el
valor
nodo
intermedio
Para la red ;
En
la
estructura
cabeza-
con-cabeza
la
comunicacin
est
cerrada,
y
se
abre
al
conocer
el
valor
del
hijo
comn
12
aparecera
un
enlace
de
una
a
otra).
Sin
embargo,
una
vez
que
sabemos
que
el
paciente
padece
una
las
enfermedades
queda
explicado
el
sntoma,
y
por
tanto
la
probabilidad
de
que
padezca
la
otra
enfermedad
disminuye.
Del
mismo
modo,
si
sabemos
con
certeza
que
no
padece
una
de
las
enfermedades,
la
probabilidad
de
que
padezca
la
otra
aumenta.
Este
efecto
se
conoce
con
el
nombre
de
explaining-away,
que
podramos
traducir
como
descartar/potenciar
causas.
El
efecto
explaining-away
permite
que
conforme
una
de
las
posibles
explicaciones
cobra
fuerza,
las
otras
se
vayan
debilitando.
La red Asia
S
F
D
independiente
de
F,
S,
G,
L
dado
E
F
independiente
de
D,
L,
G
dado
{E,
S}
E
independiente
de
S
dados
{L,
G}
S
independiente
de
L,
G,
E,
D
L
independiente
de
G
y
S
G
independiente
de
L
y
S
13
Ejercicios
Relaciones
de
independencia
condicional
Ejercicio
2.2. Dadas
las
siguientes
estructuras,
d
que
condiciones
de
independencia
condicional
deberan
cumplir
las
variables
para
que
las
redes
fuesen
bayesianas.
(tomada
de
http://redbay.wikidot.com/start)
(tomada
de
http://ferminpitol.blogspot.com.es/2014/04/redes-bayesianas.html)
Demostracin:
Es
fcil
construir
una
ordenacin
de
las
variables
en
la
que
los
padres
de
cada
nodo
aparezcan
siempre
despus
de
l.
Supongamos
por
tanto
que
la
ordenacin
{X1,
...,
Xn}
cumple
dicha
propiedad.
Por
tanto:
Si
se
cumplen
las
condiciones
de
independencia
condicional,
a
partir
de
las
probabilidades
condicionadas
es
posible
calcular
la
distribucin
conjunta
Pero
por
la
forma
de
escoger
la
ordenacin,
el
conjunto
{Xi+1,
...,
Xn}
incluye
a
todos
los
padres
de
X,
y,
en
consecuencia,
la
separacin
direccional
nos
dice
que
P(xi
/xi+1,...,xn)
=
P(xi/pa(xi))
14
...
X2
X1
Suponiendo
que
todas
las
variables
fuesen
binarias,
para
dar
la
distribucin
conjunta
habra
que
dar
210-1
valores,
sin
embargo,
si
construimos
la
distribucin
conjunta
a
partir
de
los
19
valores
necesarios
para
dar
las
condicionadas,
tendremos
adems
asegurado
que
se
satisfacen
las
hiptesis
de
independencia
condicional.
Ejemplo
6.
I
C
15
P(i1/m2)
=
0.2
P(t1/m2)
=
0.05
P(c1/i1,t2)
=
0.9
P(c1/i2,t2)
=
0.05
P(j1/t2)
=
0.6
P( M , c 1 , j 2 )
=
P(M/C=c1,
J=j2)
=
P( c 1 , j 2 )
P( M , I , T , j , c )
P( M , I , T , j , c )
2
I ,T
M , I ,T
16
Una
tarde,
Juan
va
a
visitar
a
sus
amigos
Pablo
y
Lara.
De
repente,
comienza
a
estornudar.
Juan
piensa
que
se
ha
resfriado,
hasta
que
observa
que
los
muebles
de
la
casa
estn
araados.
Entonces,
especula
con
la
posibilidad
de
que
sus
amigos
tengan
un
gato
y
sus
estornudos
se
deban
a
una
crisis
de
la
alergia
a
los
gatos
que
tiene
diagnosticada.
Principalmente,
los
tipos
de
problemas
que
se
suelen
modelar
con
redes
bayesianas
son
problemas
de
diagnstico
o
problemas
de
prediccin.
El
ejemplo
de
la
alergia
es
un
problema
de
diagnstico,
puesto
que
Juan
intenta
determinar
la
causa
de
sus
estornudos.
Es
importante
identificar
las
variables
relevantes
en
el
problema
17
Variables
objetivo
Estas
variables
se
usan
para
modelar
los
objetos
de
inters,
es
decir,
aquellos
objetos
sobre
lo
que
nos
gustara
razonar.
Las
variables
objetivo
suelen
utilizarse
para
modelar
fenmenos
latentes,
es
decir,
fenmenos
que
no
son
directamente
observables.
En
el
ejemplo
del
estornudo,
Juan
piensa
en
dos
alternativas:
o
bien
se
ha
Resfriado
o
bien
tiene
Alergia.
Ambos
son
ejemplos
de
variables
objetivo
ya
que
Juan
est
interesado
en
saber
ms
sobre
ellas
(el
estado
en
el
que
estn
o
los
valores
que
tienen).
En
diagnstico
mdico,
las
enfermedades
seran
modeladas
como
variables
objetivo.
Variables
de
observacin
Las
variables
de
observacin
se
usan
para
modelar
las
formas
indirectas
que
tenemos
de
medir
las
variables
objetivo.
Tambin
se
denominan
variables
de
evidencia.
En
el
ejemplo
del
estornudo,
Juan
piensa
que
est
bien
hasta
que
empieza
a
estornudar.
Slo
despus
de
observarse
a
s
mismo
estornudando
se
pregunta
si
est
Resfriado.
Estornudar
sera
una
variable
de
observacin.
Otra
podra
ser
Araazos,
porque
Juan
hace
esa
observacin
y
la
usa
para
razonar
sobre
la
posibilidad
de
que
exista
un
gato
en
casa
(por
el
momento,
no
directamente
observable).
En
el
diagnstico
mdico,
los
sntomas
que
muestra
el
paciente
y
los
resultados
de
sus
pruebas
seran
modeladas
como
observaciones.
Algunas
observaciones
pueden
ser
obligatorias.
Por
ejemplo,
en
el
diagnstico
mdico
un
tipo
especfico
de
escner
puede
ser
requisito
indispensable
con
el
objetivo
de
detectar
un
posible
cncer.
Factores
Estas
variables
se
usan
para
modelar
los
fenmenos
que
afectan
a
las
variables
objetivo.
Tambin
se
denominan
variables
de
contexto.
En
el
ejemplo
del
estornudo,
la
estacin
del
ao
podra
ser
un
factor
que
afecta
al
resfriado,
pues
es
ms
probable
que
una
persona
se
resfre
en
invierno
que
en
verano.
Los
factores
pueden
dividirse
en
cuatro
categoras,
con
respecto
al
tipo
de
influencia
en
las
variables
afectadas.
18
Breve
descripcin
Modelan
objetos
de
inters.
No
observables
directamente.
Modelan
la
forma
de
medir
variables
objetivo.
Pueden
ser
observadas
directamente
Modelan
fenmenos
que
afectan
a
otras
variables
del
modelo.
Promotor
Inhibidor
Requerido
Preventivo
Auxiliares
Variables
cualitativas:
Son
las
variables
que
expresan
distintas
cualidades,
caractersticas
o
modalidad.
Cada
modalidad
que
se
presenta
se
denomina
atributo
o
categora
y
la
medicin
consiste
en
una
clasificacin
de
dichos
atributos.
Las
variables
cualitativas
pueden
ser
dicotmicas
cuando
slo
pueden
tomar
dos
valores
posibles
como
s
y
no,
hombre
y
mujer,
o
politmicas,
cuando
pueden
adquirir
tres
o
ms
valores.
Variables
cuantitativas:
Son
las
variables
que
se
expresan
mediante
cantidades
numricas.
Las
variables
cuantitativas
adems
pueden
ser
discretas,
que
presentan
separaciones
o
interrupciones
en
la
escala
de
valores
que
puede
tomar
(por
ejemplo,
el
nmero
de
hijos),
o
continuas,
que
pueden
adquirir
cualquier
valor
dentro
de
un
rango
especificado
(por
ejemplo
la
edad).
A
menudo
conviene
representar
un
fenmeno
continuo
en
la
naturaleza
usando
variables
discretas.
Para
ello,
las
medidas
continuas
tienen
que
ser
discretizadas.
Esto
puede
hacerse
proyectando
la
escala
de
valores
continua
en
un
conjunto
finito
de
intervalos.
Los
valores
que
caigan
en
el
mismo
rango
se
considerarn
como
un
mismo
estado.
Un
ejemplo
de
discretizacin
es
modelar
la
variable
temperatura
con
tres
estados:
bajo,
medio,
y
alto.
La
definicin
de
variable
proposicional
tiene
su
importancia
a
la
hora
de
modelar
un
problema
con
una
red
bayesiana,
ya
que
deberemos
tener
en
A
la
hora
de
decidir
si
una
entidad
del
mundo
real
debe
ser
una
variable
o
un
estado
de
una
variable,
debemos
19
recordar
que
las
variables
de
una
red
deben
tomar
un
cuenta
que
los
nodos
de
la
red
son
variables
proposicionales
y
por
tanto
deben
tomar
un
conjunto
exhaustivo
y
excluyente
de
valores.
De
este
modo,
si
por
ejemplo
estamos
construyendo
un
sistema
de
diagnstico
mdico
en
que
las
enfermedades
posibles
son
gripe,
faringitis
y
alergia,
cada
una
de
estas
enfermedades
ser
representada
por
una
variable
dicotmica
diferente
(que
tomar
valores
si/no),
ya
que
nada
impide
que
un
paciente
padezca
dos
o
ms
enfermedades
a
la
vez.
Es
decir,
al
no
conformar
las
enfermedades
un
conjunto
exhaustivo
y
excluyente
de
variables,
cada
una
de
ellas
debe
ser
modelada
como
una
variable
dicotmica
y
no
como
valores
de
una
nica
variable.
Sin
embargo,
si
estamos
construyendo
un
sistema
de
clasificacin
de
animales
en
el
que
hemos
representado
todas
las
posibilidades
(mamfero,
ave,
reptil,
pez,
etc),
debemos
introducir
una
nica
variable,
cuyos
estados
sern
las
diferentes
clases
consideradas
(ya
que
un
animal
no
puede
ser
a
la
vez
un
mamfero
y
un
reptil).
A
veces,
si
no
se
est
completamente
seguro
de
que
el
conjunto
considerado
es
exhaustivo,
se
puede
aadir
un
estado
indeterminado
otro
de
modo
que
se
cumplan
todas
las
condiciones
para
que
cada
nodo
contenga
una
variable
proposicional.
En
el
ejemplo
del
estornudo
consideraremos
una
variable
por
cada
dato
identificado
como
relevante
(dado
que
las
variables
no
son
incompatibles
entre
s),
y
que
todas
las
variables
son
dicotmicas,
de
forma
que
cada
una
de
las
variables
tomar
el
valor
presente
o
ausente.
En
problemas
y
aplicaciones
ms
sofisticados
se
podra
usar
variables
discretas
(por
ejemplo,
la
variable
estornudo
podra
tomar
los
valores
pocos,
algunos,
muchos)
o
variables
continuas
(por
ejemplo,
si
tuviramos
una
variable
temperatura,
podra
tomar
los
valores
que
van
desde
35,8
a
42,5).
Pero
evidentemente,
cuanto
ms
valores
tomen
las
variables,
ms
complicado
ser
el
modelo,
as
que
a
la
hora
de
decidir
los
estados
deberamos
tener
presente
qu
grado
de
granularidad
es
realmente
necesario
en
nuestra
aplicacin.
No
debemos
introducir
en
el
modelo
mayor
nivel
de
detalle
del
realmente
necesario
para
nuestra
aplicacin
4.3 Estructura
Despus
de
definir
las
variables,
el
siguiente
paso
en
la
construccin
de
un
modelo
es
definir
su
estructura.
Esto
lo
hacemos
conectando
variables
con
arcos
(tambin
llamados
enlaces).
Como
hemos
visto,
en
las
redes
bayesianas
los
arcos
son
dirigidos.
Cambiar
la
direccin
de
un
arco
cambia
su
significado.
La
ausencia
de
un
arco
entre
dos
variables
indica
que
no
existen
relaciones
de
dependencia
directa
entre
ellas,
sino
a
lo
sumo
a
travs
de
otras
variables.
En
el
ejemplo
del
estornudo
las
variables
Estornudo
y
Gato
no
son
directamente
dependientes,
por
lo
que
no
debera
haber
un
arco
que
las
una2.
2
A
veces
ser
difcil
juzgar
cual
es
la
causa
y
cual
el
efecto.
Por
ejemplo,
pensemos
en
el
caso
de
una
persona
que
no
come
y
padece
anorexia
nerviosa.
Podemos
pensar
que
anorexia
es
la
causa
de
que
no
coma,
pero
tambin
que
la
anorexia
ha
venido
provocada
por
no
comer.
En
ese
caso
una
opcin
es
pensar
lo
20
Figura
2.
Posibles
direcciones
de
los
arcos.
Utilizar
relaciones
causales
conduce
a
modelos
ms
sencillos
de
especificar
y
entender
21
Figura
3.
Primer
nodo
para
la
RB
del
estornudo.
Figura
4.
Aadiendo
causas
a
la
RB
del
estornudo.
Figura
5.
Aadiendo
fuentes
de
evidencia
a
la
RB
del
estornudo.
Juan
empieza
a
pensar
que
sus
amigos
pueden
tener
un
Gato,
lo
que
puede
causar
los
Araazos:
Figura
6.
Aadiendo
explicaciones
a
la
RB
del
estornudo.
Lo
que
causa
que
Juan
piense
que
l
est
estornudando
podra
ser
debido
a
la
Rinitis,
causada
por
la
Alergia
y
la
presencia
del
Gato:
22
Figura
7.
La
RB
final
del
problema
del
estornudo
4.4 Parmetros
El
ltimo
paso
en
el
proceso
de
modelado
es
especificar
parmetros.
Como
se
explic
antes,
basta
con
proporcionar
las
probabilidades
a
priori
de
los
nodos
raz
y
las
probabilidades
condicionales
del
resto
de
los
nodos
Existen
varias
alternativas
para
obtener
los
parmetros
necesarios
de
una
red:
23
24
Figura
8.
RB
y
parmetros
para
el
ejemplo
del
resfriado.
Figura
9.
RB
equivalente
para
el
ejemplo
del
estornudo,
con
los
enlaces
invertidos
El
conjunto
de
reglas
de
diagnstico
que
explica
este
modelo
es
el
siguiente:
25
Ejercicios
Modelado
cualitativo
con
redes
bayesianas
(nodos
y
enlaces)
Ejercicio
2.4. (un
problema
de
diagnstico).
Considera
la
siguiente
situacin:
Los
padres
de
Luisito,
que
acaba
de
cumplir
un
ao,
deciden
llevarlo
al
pediatra
porque
vomita
con
cierta
frecuencia.
Con
el
pediatra
sostienen
la
siguiente
conversacin:
Pediatra
-.
Denme
toda
la
informacin
que
consideren
que
puede
ser
relevante.
Madre-.
El
otro
da
Luisito
estaba
resfriado.
Vomit
el
bibern
de
la
noche,
creo
que
por
culpa
de
los
mocos,
ya
que
haba
muchos
en
el
vmito.
Otras
veces
parece
que
vomita
por
una
pequea
indigestin.
Padre-.
Adems
creo
que
debe
saber
que
mi
hermano
es
celaco
(Aclaracin:
la
celiaqua
es
una
intolerancia
al
gluten,
que
poco
a
poco
hace
que
se
destruya
el
vello
intestinal.
Los
vmitos
son
uno
de
sus
sntomas
ms
relevantes.
Se
cree
que
tiene
cierta
componente
hereditaria).
Pediatra-.
Y
la
dieta
de
Luisito
incluye
gluten?
Ambos-.
S,
desde
hace
unos
meses.
Plantea
este
problema
de
diagnstico
mediante
una
red
bayesiana
Ejercicio
2.5. (un
problema
de
clasificacin).
En
el
planeta
Zyx
se
pueden
encontrar
varias
clases
de
animales,
llamemos
a
estas
clases
Wurros,
Hobexas
y
Wackas.
Todos
tienen
un
tamao
muy
pequeo,
y
sus
pieles
son
o
bien
escamosas
o
bien
estn
cubiertas
de
suave
pelo.
Adems,
una
observacin
atenta
ha
permitido
deducir
lo
siguiente:
Todos
los
Wurros
tienen
5
6
patas.
Su
color
es
rojizo,
y
tienen
la
piel
peluda
y
suave.
El
nmero
de
patas
de
las
Hobexas
es
un
entero
que
vara
uniformemente
entre
4
y
6,
ambos
inclusive.
Su
piel
es
escamosa.
En
cuanto
a
las
Wackas,
tienen
4
5
patas,
y
ofrecen
a
la
vista
una
tonalidad
casi
siempre
azul,
pero
a
veces
(20%
de
los
casos)
rojiza.
Los
animales
que
tienen
un
nmero
impar
de
patas
cojean
siempre.
Los
animales
que
tienen
un
nmero
par
de
patas
cojean
slo
cuando
tienen
alguna
anomala
(malformacin
congnita,
heridas,
etc.),
lo
cual
ocurre
26
en
el
10%
de
los
casos
para
los
animales
de
4
patas,
y
en
el
20%
para
los
de
seis.
Plantea
el
problema
de
la
clasificacin
de
animales
de
Zyx
mediante
una
red
bayesiana
Ejercicio
2.6. Una
tarde,
Luis
va
a
visitar
a
su
compaero
de
oficina
Antonio,
y
de
repente
comienza
a
estornudar.
Luis
piensa
que
se
ha
resfriado.
Pero
de
repente
observa
que
los
muebles
de
Antonio
estn
araados,
de
forma
que
se
le
ocurre
que
quizs
su
amigo
tenga
un
gato
y
sus
estornudos
se
deban
a
una
crisis
producida
por
una
rinitis
alrgica.
Modela
la
situacin
con
una
red
bayesiana.
Ejercicio
2.7. El
problema
de
Monty
Hall.
Un
concursante
del
concurso
televisivo
Lets
Make
a
Deal
es
requerido
para
elegir
una
puerta
entre
tres
(todas
cerradas),
y
su
premio
consiste
en
llevarse
lo
que
se
encuentra
detrs
de
la
puerta
elegida.
Se
sabe
cierto
que
una
de
ellas
oculta
un
coche,
y
las
otras
dos
tienen
una
cabra.
Una
vez
que
el
concursante
ha
elegido
una
puerta
y
le
comunica
al
pblico
y
al
presentador
su
eleccin,
el
presentador
(que
conoce
en
que
puerta
est
el
premio)
abre
una
de
las
otras
puertas
y
muestra
una
cabra.
En
este
momento
se
le
da
la
opcin
al
concursante
de
quedarse
con
la
puerta
que
eligi
inicialmente
o
bien
cambiar
de
puerta.
Debe
el
concursante
mantener
su
eleccin
original
o
escoger
la
otra
puerta?.
Modela
la
situacin
con
una
red
bayesiana.
Gripe
Tos
Fiebre
Fiebre
Modelo
A
Tos
Gripe
Modelo
B
27
4.6.2
Sabemos
ya
que
los
parmetros
necesarios
a
la
hora
de
definir
una
red
son
las
probabilidades
condicionadas
de
cada
nodo
dados
sus
padres.
Por
ello,
el
nmero
de
probabilidades
necesarias
para
cada
nodo
es
exponencial
en
el
nmero
de
padres.
De
esta
forma,
cuando
un
nodo
tiene
muchos
padres
una
forma
de
reducir
la
complejidad
del
modelo
es
introducir
nodos
intermedios
que
agrupen
a
varios
padres.
De
este
modo,
no
slo
reduciremos
el
nmero
de
parmetros
necesarios,
sino
tambin
el
tiempo
de
ejecucin
de
los
algoritmos
de
propagacin
de
probabilidades.
Veamos
un
ejemplo.
Consideremos
el
siguiente
ejemplo:
Supongamos
que
estamos
construyendo
un
modelo
para
la
hipertensin
arterial,
de
la
que
un
estudio
ha
identificado
las
siguientes
causas:
sexo,
edad,
antecedentes
familiares,
consumo
de
alcohol,
tabaco,
o
ciertos
medicamentos)
excesiva
ingesta
de
sal,
obesidad,
estrs.
La
red
bayesiana
para
modelar
esta
situacin
sera:
Edad
Medicamentos
Tabaco
Sexo
Alcohol
Stress
Antecedentes
familiares
Exceso sal
Hipertensin
Obesidad
28
Edad
Medicament
os
Tabaco
Alcohol
Obesidad
Sexo
Antecedentes
familiares
Exceso sal
Rasgos
Consumo
sustancias
individuo
Stress
Estilo
vida
Hipertensin
En
la
que
ahora
para
el
nodo
hipertensin
necesitamos
23
parmetros,
igual
que
para
los
nodos
rasgos individuo,
productos adictivos
y
estilo de vida.
Es
decir,
que
mediante
esta
tcnica,
hemos
reducido
el
nmero
de
parmetros
necesarios
de
512
a
32.
4.6.3
29
En
este
caso
no
podramos
utilizar
una
puerta
OR,
pues
no
se
cumplen
las
hiptesis.
Consideremos
los
siguientes
factores,
y
pensemos
que
son
las
nicas
causas
directas
del
sntoma
Fiebre:
En
este
caso
s
podramos
utilizar
la
puerta
OR,
pues
se
cumplen
las
hiptesis.
Estudiaremos
este
modelo
de
interaccin
causal
a
travs
de
un
ejemplo
sencillo.
Supongamos
la
siguiente
red
bayesiana:
Bajo
estas
hiptesis,
para
construir
las
probabilidades
necesarias
para
el
modelo
bastara
con
dar
las
probabilidades
de
que
cada
una
de
las
causas
provoque
el
efecto
por
separado
(que
denotaremos
por
cx).
Sea
por
ejemplo:
cg
=
P(+f/+g)=0.8
co
=
P(+f/+o)=0.6
Y
en
ese
caso
tendramos
que:
P(+f/+g,
+o)=
0.8
+
0.2*0.6
=
0.92
P(+f/g,
+o)=
0.6
P(+f/+g,
o)=
0.8
P(+f/g,
o)=
0
Las
probabilidades
de
que
no
se
manifieste
el
sntoma
pueden
calcularse
como
complementarias
de
stas,
o
aplicando
la
siguiente
expresin:
P(x/c1,
c2)
=
(1 c )
i
iTu
30
q
i
iTu
31
Ejercicios
En
estos
ejercicios
practicars
sobre
modelado,
relaciones
de
independencia,
aplicacin
del
teorema
de
factorizacin
de
la
probabilidad.
Ejercicio
2.8.
Se
pide:
a) Estudia
qu
relaciones
de
dependencia
condicional
deben
darse
para
que
la
red
sea
bayesiana
y
razona
si
dichas
condiciones
resultan
adecuadas.
b) Cuntos
valores
sera
necesario
especificar
para
dar
la
distribucin
conjunta?
c) Cmo
podemos
calcular
la
probabilidad
conjunta
a
partir
de
las
condicionadas?.
d) Aplicando
el
teorema
de
factorizacin,
explica
cmo
se
calculara
la
probabilidad
de
rinitis
alrgica
dado
que
Antonio
tiene
un
gato
y
que
Luis
est
estornudando
(no
es
necesario
realizar
los
clculos).
Ejercicio
2.9. Juan
y
Luisa
llegan
un
da
a
casa
y
observan
que
el
coche
no
est
en
el
garaje,
con
lo
cual
piensan
que
se
lo
han
robado.
Cuando
Juan
est
a
punto
de
llamar
a
la
polica,
Luisa
le
dice
que
no
llame,
ya
que
es
probable
que
haya
sido
Mara
(su
hija
adolescente)
la
que
haya
cogido
el
coche
sin
permiso:
Juan
le
pregunta
qu
le
hace
pensar
eso,
y
Luisa
responde
que,
adems
de
que
el
coche
de
Mara
est
en
el
taller,
esa
misma
maana
Mara
recibi
una
misteriosa
32
llamada
telefnica,
lo
cual
indica
que
quizs
tuviera
una
cita
importante
para
la
que
necesitara
el
coche.
a) Modela
la
situacin
con
una
red
bayesiana
(nodos,
enlaces
y
parmetros)
b) Qu
independencias/dependencias
entre
las
variables
de
la
red
implican
las
hiptesis
de
independencia
condicional?.
c) Si
suponemos
ciertas
las
hiptesis
de
independencia
condicional,
cuntas
probabilidades
sera
necesario
especificar?.
Dar
estos
valores
de
una
forma
coherente
con
el
sentido
comn.
d) Si
no
podemos
suponer
las
hiptesis
de
independencia
condicional,
qu
probabilidades
deberamos
pedir
al
experto?
Cuntos
valores
son,
en
total?.
e) Indica
cmo
calcularas
la
probabilidad
de
que
hayan
robado
el
coche
sabiendo
que
el
coche
no
est
en
el
garaje
y
Mara
ha
recibido
una
llamada.
Ejercicio
2.10. 3.
Juan
est
en
la
parada
del
autobs
de
la
lnea
20,
y
el
autobs
se
est
retrasando.
Juan
piensa
que
puede
que
haya
retenciones
de
trfico,
pero
tambin
puede
ser
que
el
autobs
haya
sufrido
una
avera
o
que
hayan
suspendido
el
servicio
de
la
lnea
por
las
obras
del
metro.
El
servicio
de
una
lnea
se
suspende
cuando
hay
obras
que
la
afectan
y
hay
otras
lneas
en
servicio
que
pueden
utilizar
los
usuarios
para
sus
desplazamientos.
a) Modela
esta
situacin
con
una
red
bayesiana
(nodos,
enlaces
y
parmetros)
b) Estudia
las
relaciones
de
independencia
condicional
que
se
dan
en
esta
red
bayesiana
c) Explica
cmo
se
puede
calcular
la
distribucin
de
probabilidad
conjunta
a
partir
de
las
condicionadas.
d) Indica
cmo
calcularas
la
probabilidad
de
que
la
lnea
haya
sido
suspendida
dado
que
el
autobs
se
est
retrasando
y
que
hay
obras
que
afectan
al
recorrido
de
la
lnea
20.
Ejercicio
2.11. La
polica
est
intentando
establecer
un
modelo
que
permita
razonar
sobre
los
accidentes
de
trfico
causados
por
una
prdida
de
control
del
vehculo
del
conductor.
Esta
prdida
de
control
suele
venir
provocada
por
un
error
humano,
una
carretera
resbaladiza,
un
fallo
mecnico
o
un
exceso
de
velocidad.
El
error
humano
suele
deberse
a
una
distraccin
del
conductor
y
una
capacidad
de
reaccin
mermada
por
alguna
circunstancia
(consumo
de
sustancias
o
cansancio).
La
carretera
puede
estar
resbaladiza
por
vertido
de
sustancias
o
por
las
condiciones
atmosfricas.
a) Representa
este
problema
mediante
una
red
bayesiana.
b) Establece
unos
parmetros
para
la
red
acordes
con
el
sentido
comn.
c) Explica
cmo
se
puede
calcular
la
distribucin
de
probabilidad
conjunta
a
partir
de
las
condicionadas.
d) Ha
ocurrido
un
accidente
en
el
que
se
ha
determinado
que
la
carretera
estaba
en
buenas
condiciones
y
el
conductor
ha
triplicado
la
tasa
de
alcohol
permitida.
Indica
como
calcularas
la
probabilidad
de
que
el
accidente
se
deba
a
un
error
humano.
33
34
en
el
que
la
variable
A
toma
tres
valores
posibles
a1,
a2,
a3,
y
la
variable
B
toma
dos,
b1
y
b2,
tendramos
que:
35
(a j )
c (a j ) si
A
no
ha
sido
instanciada
(*)
cs ( A )
c B
pB(aj)
=
1
si A =
a j
.
0
si A
a .
j
l(bi)
=
1
si B =
b i
0
si B
b .
i
i)
(bi)
=
P(bi / a j ) B (a j ) .
j =1
j)
1.
Inicializacin
A.
Inicializar
todos
los
-mensajes
y
-valores
a
1.
B.
Si
la
raz
A
tiene
m
posibles
valores,
entonces
para
j
=
1,...,m,
sea
(aj)
=
P(aj)
C.
Para
todos
los
hijos
B
de
la
raz
A,
hacer
Enviar
un
nuevo
-mensaje
a
B
usando
la
frmula
2.
(En
ese
momento
comenzar
un
flujo
de
propagacin
debido
al
procedimiento
de
actualizacin
C).
Cuando
una
variable
se
instancia
o
una
variable
recibe
un
o
-mensaje,
se
usa
uno
de
los
siguientes
procedimientos
de
actualizacin;
36
2.
Actualizacin
A.
Si
una
variable
B
se
instancia
a
un
valor
bj,
entonces
BEGIN
A.1.
Inicializar
P*(bj)
=
1
y
P*(bi)
=
0,
para
todo
ij.
A.2.
Calcular
(B)
usando
la
frmula
3.
A.3.
Enviar
un
nuevo
-mensaje
al
padre
de
B
usando
la
frmula
1.
A.4.
Enviar
nuevos
mensajes
a
los
hijos
de
B
usando
la
frmula
2.
END
B.
Si
una
variable
B
recibe
un
nuevo
-mensaje
de
uno
de
sus
hijos
y
la
variable
B
no
ha
sido
instanciada
todava,
entonces,
BEGIN
B.1.
Calcular
el
nuevo
valor
de
(B)
usando
la
frmula
3.
B.2.
Calcular
el
nuevo
valor
de
P*(B)
usando
la
frmula
5.
B.3.
Enviar
un
nuevo
-mensaje
al
padre
de
B
usando
la
frmula
1.
B.4.
Enviar
nuevos
mensajes
a
los
otros
hijos
de
B
usando
frmula
2.
END.
C.
Si
una
variable
B
recibe
un
nuevo
-mensaje
de
su
padre
y
la
variable
B
no
ha
sido
instanciada
todava,
entonces,
BEGIN
C.1.
Calcular
el
nuevo
valor
de
(B)
usando
la
frmula
4.
C.2.
Calcular
el
nuevo
valor
de
P*(B)
usando
la
frmula
5.
C.3.
Enviar
nuevos
mensajes
a
los
hijos
de
B
usando
frmula
2.
END.
Para
ilustrar
el
algoritmo
de
propagacin
de
probabilidades,
vamos
a
utilizar
el
siguiente
ejemplo:
Ejemplo
8.
Supongamos
que
un
seor
piensa
que
su
esposa
le
est
siendo
infiel.
La
red
bayesiana
que
se
construye
para
evaluar
esta
posibilidad
es
la
siguiente:
P(a1) = 0.1
37
Inicializacin
A.
Ponemos
todos
los
-mensajes
y
-valores
a
1.
B.
Hacemos
(aj)
=
P(aj),
para
j
=
1,2.
(A)=
(0.1,
0.9).
C.
A
enva
un
mensaje
a
su
hijo,
B,
B(a1)
=
(a1)D(a1) =
0.1
B(a2)
=
(a2)D(a2)
=
0.9
B
toma
entonces
nuevos
-valores;
(b1)
=
P(b1/a1)
(a1)
+
P(b1/a2)
(a2)
=
0.7
0.1
+
0.2
0.9
=
0.25
(b2)
=
P(b2/a1)
(a1)
+
P(b2/a2)
(a2)
=0.75
(c1)
=
P(c1/b1)
C(b1)
+
P(c1/b2)
C(b2)
=
0.4
0.25
+
0.001
0.75
=
0.10075
(c2)
=
P(c2/b1)
C(b1)
+
P(c2/b2)
C(b2)
=0.89925.
A
partir
de
ellos,
calculamos
las
probabilidades
de
C,
multiplicando
por
los
-
valores
y
normalizando:
P(c1)
=
0.10075.
P(c2)
=
0.89925.
El
mismo
procedimiento
se
repite
para
D,
y
obtenemos
el
estado
inicial
S0
de
la
red
causal:
38
A
B(A)=(0.1,0.9)
(B) = (1,1)
(B) = (0.25,0.75)
P(B) = (0.25,0.75)
B(A)=(1,1)
D(A)=(0.1,0.9)
D(A)=(1,1)
C(B)=(0.25,0.75)
(C) = (1,1)
(C) = (0.10075,0.89925)
P(C) = (0.10075,0.89925)
(A) = (1,1)
(A) = (0.1,0.9)
P(A) = (0.1,0.9)
(D) = (1,1)
(D) = (0.44,0.56)
P(D) = (0.44,0.56)
C(B)=(1,1)
C
Estado
S0
de
la
red.
Supongamos
ahora
que
nos
informan
de
que
la
esposa
ha
cenado
con
otro,
es
decir,
conocemos
ahora
con
certeza
que
B
=
b1.
Esta
informacin
se
ir
transmitiendo
por
la
red,
haciendo
que
las
probabilidades
a
priori
de
los
nodos,
P(X)
cambien
a
las
probabilidades
a
posteriori,
P*(X)
=
P(X/B
=
b1).
En
este
caso,
al
ser
la
evidencia
aportada
a
favor
de
la
hiptesis
que
queremos
probar,
lo
lgico
ser
que
todas
estas
probabilidades
aumenten.
En
el
momento
que
una
variable
se
actualiza,
comienza
un
flujo
de
propagacin
por
la
red,
que
en
este
caso
es
el
siguiente:
Tras
el
paso
de
estos
mensajes,
todas
las
variables
van
a
actualizar
sus
y
-
valores
y
sus
probabilidades.
Veamos
entonces
cmo
se
efecta
la
actualizacin
con
el
algoritmo;
Actualizacin:
Actualizacin
de
B:
A.1.
Calculamos
ahora
la
probabilidad
a
posteriori
de
B,
conocido
que
ha
tomado
el
valor
b1,
que
evidentemente
ser;
P*(b1)
=
1.
P*(b2)
=
0.
A.2.
Calculamos
(B);
(b1)
=
1.
(b2)
=
0.
A.3.
Enviamos
un
-mensaje
al
padre
de
B,
A
(a1)
=
P(b1/a1)(b1)
+
P(b2/a1)(b2)
=
0.7
1
+
0.3
0
=
0.7
(a2)
=
0.2
39
40
P*(d2)
=
0.488
C.3.
No
es
necesario
puesto
que
D
no
tiene
hijos.
As,
tras
la
instanciacin
de
B
a
b1,
la
red
queda;
(A) = (0.7,0.2)
(A) = (0.1,0.9)
P(A) = (0.28,0.72)
B(A)=(0.1,0.9)
D(A)=(0.07,0.18)
B(A)=(0.7,0.2)
(B) = (1,0)
(B) = (0.25,0.75)
P(B) = (1,0)
D(A)=(1,1)
(D) = (1,1)
(D) = (0.128,0.122)
P(D) = (0.512,0.488)
C(B)=(1,0)
C(B)=(1,1)
(C) = (1,1)
(C) = (0.4,0.6)
P(C) = (0.4,0.6)
C
Estado
S1
de
la
red.
Pero
ahora,
al
estar
B
inicializada,
el
algoritmo
se
parar
ah,
puesto
que
P(B)
=
(1,
0),
y
no
podemos
permitir
que
nada
cambie
ya
estos
valores.
As,
en
la
ejecucin
del
algoritmo,
las
variables
que
ya
han
sido
inicializadas
son
extremos
muertos,
donde
la
propagacin
se
para
(en
el
caso
de
la
propagacin
en
rboles).
Hacemos
pues
el
paso
A
de
actualizacin
para
la
variable
D,
Actualizacin:
Actualizacin
de
D
A.1.
Calculamos
ahora
la
probabilidad
a
posteriori
de
D,
P*(d1)
=
0.
P*(d2)
=
1.
A.2.
Calculamos
(D);
(d1)
=
0.
(d2)
=
1.
A.3.
Enviamos
un
-mensaje
al
padre
de
D,
A
D(a1)
=
P(d1/a1)(d1)
+
P(d2/a1)(d2)
=
0.8
0
+
0.2
1
=
0.2
41
D(a2)
=
0.6
A.4.
No
se
hace
puesto
que
D
no
tiene
hijos.
Actualizacin
de
A
B.1.
Calculamos (A)
(a1)
=
B(a1)
C(a1)
=
0.7
0.2
=
0.14
(a2)
=
B(a1)
C(a2)
=
0.2
0.6
=
0.12
B.2.
Calculamos
la
probabilidad
actualizada
de
A
P*(a1)
=
0.014
=
0.1148
P*(a2)
=
0.108
=
0.8852
Ahora
la
probabilidad
de
a1
se
ha
reducido,
puesto
que
la
evidencia
aportada
es
en
contra
de
a1.
B.3.
A
no
tiene
padre.
B.4.
Este
paso
no
se
realiza
pues
B
est
ya
instanciado.
Tras
estos
clculos
se
obtiene
un
estado
de
la
red,
S2.
Este
estado
es
el
mismo
que
obtendramos
si
processemos
la
informacin
al
revs,
es
decir,
si
instancisemos
primero
la
variable
D
al
valor
d2,
y
despus
la
variable
B
al
valor
b1.
Ejercicios
Estos
ejercicios
se
destinan
al
aprendizaje
del
algoritmo
de
propagacin
de
probabilidades
en
el
caso
de
rboles.
Ejercicio
2.12. Consideremos
la
siguiente
red
bayesiana,
donde
los
nodos
A
y
B
son
binarios
y
el
nodo
C
toma
tiene
tres
posibles
valores
c1,
c2
y
c3:
B
p(b1/a1)=0,2
p(b1/a2)=0,6
p(a1)=0,2
p(c1/a1)=0,8
p(c1/a2)=0,2
p(c2/a1)=0,1
p(c2/a2)=0,7
Calcula
las
probabilidades
de
los
valores
del
nodo
A
y
del
nodo
C,
dado
que
B
toma
el
valor
b1.
Ejercicio
2.13. Supongamos
que
construimos
un
pequeo
sistema
experto
bayesiano
para
diagnosticar
una
enfermedad.
Para
ello
definimos
tres
variables:
E
=
presencia
de
la
enfermedad,
que
toma
los
valores
e1=
la
persona
padece
la
enfermedad
e2=
la
persona
no
padece
la
enfermedad
42
p(e1)=0.003"
E"
T"
F"
p(t1/e1)=0.992"
p(f1/e1)=0.98"
p(t1/e2)=0.994"
p(f1/e2)=0.017"
Se
pide;
a)
Inicializar
la
red
bayesiana.
b)
Actualizar
la
red
bayesiana
sabiendo
que
el
enfermo
tiene
fiebre.
c)
Implementa
la
red
en
GeNIe
y
comprueba
que
los
resultados
obtenidos
son
correctos
Ejercicio
2.14. Consideremos
la
siguiente
red
bayesiana:
P(a1)=0.3
A P(a2)=0.5
B
C
D P(d1/a1)=0.9
P(d1/a2)=0.7
P(d1/a3)=0.3
P(c1 /b 1)=0.9
P(c1 /b 2)=0.1
43
44
Ntese
que
ahora
las
probabilidades
de
los
estados
positivos
de
todos
los
nodos
de
la
red
son
mayores.
Esto
es
as
porque
la
evidencia
disponible
Juan
est
estornudando
apoya
el
estado
positivo
de
todas
las
variables.
Recuerde
que
para
el
nodo
estornudo,
la
nica
relacin
de
independencia
era
que
estornudo
es
independiente
de
gato,
alergia
y
araazos
dado
rinitis
y
resfriado
(a
priori,
todos
los
nodos
son
dependientes
de
estornudo,
y
por
eso
cambian
todas
las
probabilidades).
La
siguiente
evidencia
disponible
es
que
Juan
ve
araazos.
Las
probabilidades
actualizadas
se
pueden
observar
en
la
siguiente
figura:
45
Resfriado=s
Rinitis=s
Alergia=s
Araazos=s
Gato=s
Estornudo=s
e1 = {estornudo=s}
e2 = {araazos=s}
Ejercicios
En
estos
ejercicios
debes
utilizar
el
software
GeNIe
para
adquirir
una
nocin
intuitiva
de
cmo
cambian
las
probabilidades
de
los
nodos
de
la
red
(aumentan,
disminuyen
o
permanecen
igual)
segn
se
adquiere
la
nueva
evidencia.
Ejercicio
2.16. Para
el
ejercicio
2.8,
Explica
la
evolucin
de
las
probabilidades
de
la
red
conforme
se
va
adquiriendo
nueva
evidencia
(la
evidencia
se
adquiere
tal
como
se
explica
en
la
descripcin
de
la
situacin),
bajo
los
siguientes
supuestos
46
Para
definir
la
red,
sera
necesario
conocer
cinco
valores:
47
P(+a),
P(+b/+a),
P(+b/a),
P(+c/(+a),
P(+c/(a).
= P(O1,...,On / ) =
L( / )
P(Oi / ) )
i
l( / ) = log(L( / )) = log(P(0i / )
i
1
l( / ) = log(P(0i
/
)) .
n i
Se
demuestra
que
las
tres
funciones
alcanzan
sus
mximos
para
los
mismos
48
variables:
edad
(con
valores
menor
de
50,
mayor
o
igual
a
50);
y
obesidad,
hernia,
indigestin
y
vmitos
(binarios
con
valores
s/no).
Individuos
Edad
Individuo
1
Individuo
2
Individuo
3
Individuo
4
Individuo
5
Mayor_50
Mayor_50
Mayor_50
Mayor_50
Mayor_50
no
no
no
no
s
no
no
no
no
no
no
no
no
no
s
Individuo
6
Individuo
7
Individuo
8
Individuo
9
Individuo
10
Mayor_50
Mayor_50
Mayor_50
Menor_50
Menor_50
s
s
s
no
no
s
s
s
no
no
no
no
no
no
no
s
s
si
no
no
Individuo
11
Individuo
12
Individuo
13
Individuo
14
Individuo
15
Menor_50
Menor_50
Menor_50
Menor_50
Menor_50
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
Individuo
16
Individuo
17
Individuo
18
Individuo
19
Individuo
20
Menor_50
Menor_50
Menor_50
Menor_50
Menor_50
no
no
s
s
s
no
no
no
no
no
no
s
no
s
no
no
s
s
s
no
49
Cuando
no
partimos
de
un
modelo
en
blanco,
sino
que
tenemos
ya
ciertas
estimaciones
o
conjeturas
sobre
los
valores
de
algunos
parmetros,
es
frecuente
representar
estas
conjeturas
como
casos
ficticios
adicionales.
Veamos
un
ejemplo:
50
Supongamos
que
tenemos
una
moneda
que
creemos
que
est
equilibrada.
Sin
embargo,
la
hemos
lanzado
al
aire
10
veces
y
hemos
obtenido
9
caras.
Pero
queremos
tener
en
cuenta
nuestra
creencia
de
que
la
moneda
est
equilibrada.
En
este
caso,
lo
que
haramos
sera
introducir
en
el
conjunto
de
datos
un
nmero
de
tiradas
que
elijamos
(por
ejemplo,
90
tiradas)
y
estimar
que,
para
esta
moneda:
Pest(cara)
=
9 + 45
54
=
= 0,54
10 + 90 100
resultan
ser
caras,
pero
al
realizar
el
experimento
con
una
moneda
concreta
se
obtiene
que
de
s
lanzamientos
a
han
resultado
ser
caras,
la
probabilidad
de
cara
se
estimara
mediante:
Pest(cara)
=
a+n
s+ m
probabilidad
estimada
de
cara
sera:
Pest(cara)
=
6.1.2
900 + 45
945
=
= 0,86
1000 + 90 1090
cuando
a
algunas
observaciones
les
faltan
los
valores
de
algunas
de
las
variables.
Existen
varias
alternativas
para
tratar
este
caso.
Entre
ellas,
las
ms
frecuentes
son:
Alternativa
1.
Eliminar
los
casos
en
los
que
falta
el
valor
de
alguna
variable
(se
suele
aplicar
si
el
conjunto
de
datos
es
suficientemente
numeroso).
Alternativa
2.
Sustituir
el
valor
perdido
por
algn
valor
concreto
(por
ejemplo:
media,
mediana,
moda,
etc.)
Alternativa
3.
Considerar
el
valor
ms
probable,
dado
los
valores
que
han
tomado
las
otras
variables.
La
primera
alternativa
puede
resultar
adecuada
si
la
base
de
datos
es
muy
numerosa,
pero
si
no
es
el
caso
estamos
perdiendo
informacin.
La
segunda
alternativa
no
suele
dar
buenos
resultados,
pues
no
tiene
en
cuenta
el
valor
de
otras
variables.
La
tercera
alternativa
es
la
que
general
suele
dar
mejores
resultados
(y
la
que
podemos
encontrar
implementada
en
GENIE).
La
idea
es
muy
simple:
se
calculan
los
parmetros
de
la
red
bayesiana
que
mejor
se
ajusta
a
los
datos
existentes,
y,
utilizando
dicha
red,
se
estiman
las
probabilidades
de
cada
uno
de
los
valores
de
los
datos
desconocidos.
Es
el
conocido
algoritmo
heurstico
EM
51
Pasos:
1. 0 ;
2.
l l( 0 ) ;
3.
Repetir:
5. estimar d mediante ;
EMV ( ) ;
( )
7.
l ' l
6.
8.
l = l '- l ;
9.
l l ' ;
52
(fase
Lnea
10.
Repetimos
los
pasos
4
al
9
hasta
hasta
que l
sea
menor
que
cierto
valor
prefijado
Observaciones:
O1
O2
O3
O4
O5
O6
A
+a
+a
+a
a
a
+a
B
+b
+b
b
+b
b
b
C
+c
c
c
c
+c
Vamos
a
calcular
los
modelos
para
los
parmetros
con
cada
una
de
las
alternativas.
Alternativa
1.
Para
estimar
la
distribucin
de
probabilidad
suprimimos
el
caso
con
valores
desconocidos,
es
decir,
vamos
a
utilizar
los
valores
en
color
negro
de
la
siguiente
tabla:
O1
O2
O3
O4
O5
O6
A
+a
+a
+a
a
a
+a
B
+b
+b
b
+b
b
b
C
+c
c
c
c
+c
1
=
P(+a)
=
3/5
=
0,6
53
2
=
P(+b/+a)
=
2/3
3
=
P(+b/a)
=
1/2
4
=
P(+c/+a)
=
1/3
5
=
P(+c/a)=
1/2
A
+a
+a
+a
a
a
+a
B
+b
+b
b
+b
b
b
C
+c
c
c
c
+c
c
Y
tendramos
que:
1
=
P(+a)
=
4/6
=
0,6667
2
=
P(+b/+a)
=
1/2
3
=
P(+b/a)
=
1/2
4
=
P(+c/+a)
=
1/4
5
=
P(+c/a)=
1/2
54
En
este
caso
p
=
-1,9639.
Es
decir,
esta
estimacin
0
del
modelo
es
peor
que
la
obtenida
en
las
alternativas
1
y
2.
Continuamos
iterando,
y
para
ello
vamos
a
vamos
a
calcular
el
valor
esperado
(fase
expectation).
Ser:
de
la
variable
C
en
la
observacin
incompleta
P(+c/+a,
b)
=
P(+c/+a)
=
0.5
P(c/+a,
b)
=
1-
P(+c/+a)
=
0.5
Aadimos
esta
informacin
al
conjunto
de
observaciones:
A
+a
+a
+a
a
a
B
+b
+b
b
+b
b
C
+c
c
c
c
+c
Si resolvemos este problema con GeNIe vemos que el valor del indicador utilizado
para medir la bondad de la estimacin es p=11,6136. El motivo es que GeNIe utiliza la
suma en lugar del promedio, por lo que dicho valor puede obtenerse multiplicando 1,9356
por el nmero de casos (6).
55
+a b
P(+c/+a,
b)
=
0.5
P(c/+a,
b)
=
0.5
B
+b
+b
b
+b
b
b
C
+c
c
c
c
+c
P(+c/+a,
b)
=
0.375
P(c/+a,
b)
=
0.625
En
el
nuevo
modelo
ahora
cambiara
el
valor:
3,4
=
P(+c/(+a)
=
(1
+
0,34375)/4
=
0,3359
56
d
BIC(G / ) = log( /G, ) log m
2
donde:
G es la estructura candidata.
5
En GEniE el algoritmo tambin se detiene en esta distribucin, con un valor de p de -
11,2739.
57
m es el tamao de O.
58