Sunteți pe pagina 1din 6

X

-
t
h
C
O
N
F
E
R
E
N
C
E

O
N
M
E
C
H
A
N
I
C
A
L
V
I
B
R
A
T
I
O
N
S
X
TI MISOARA 2002
BULETINUL TIINIFIC AL
UNIVERSITII POLITEHNICA DIN TIMIOARA
SERIA MECANIC
Tom 47(61), 2002
Transactions on
MECHANICS

SISTEME EXPERT PENTRU DIAGNOSTICAREA
HEPATITELOR VIRALE B, C I B+D


Adriana Albu
*
, Andreea Drgulescu
**



Abstract

Expert systems are becoming a very important part of medical decision making because the human
experts who have to make decisions can not process the huge amounts of data. So, they need a good
expert system that should be able to process those huge amounts of data and to help them to make
the decision easier and more reliable. This paper presents an expert system that can suggest a way
in the evolution of a patient infected with hepatitis B virus.

Keywords: expert system, B hepatite, probabilities, Bayes


1. Introducere

n orice domeniu de activitate factorul cheie n atingerea scopurilor propuse este reprezentat
prin luarea unei decizii bune. Dar drumurile ctre o decizie bun sunt uneori multe. Totui la baz
exist o combinaie de trei aspecte [7]: experien din cazuri anterior rezolvate, rezultatele ultimelor
cercetri i raionamentul personal.
Sistemele expert [2] sunt produse ale inteligenei artificiale, ramur a tiinei calculatoarelor
ce urmrete dezvoltarea de programe inteligente. Un sistem expert este un program, care pe baza
cunotinelor (reinute ntr-o baz de cunotine), raioneaz (folosind un anumit algoritm) pentru
obinerea de rezultate ntr-o activitate dificil ntreprins uzual doar de experii umani.
n medicin luarea unei decizii apare ntr-un mod foarte important atunci cnd trebuie pus

*
Adriana Albu - Universitatea "Politehnica" Timioara, e-mail: adrianaa@aut.utt.ro
**
Andreea Drgulescu - Universitatea de Medicin i Farmacie Timioara, e-mail: drandre76@yahoo.com
un diagnostic deoarece la stabilirea unui diagnostic, apar mai multe alternative, dei toate datele
medicale au fost colectate. Se poate construi un program care s sugereze cea mai plauzibil
alternativ. Sistemul poate oferi i o valoare asociat bolii, aceasta fiind interpretat ca un scor de
plauzibilitate.
Evident, decizia final asupra diagnosticului este lsat exclusiv medicului.
Trebuie precizat c domeniul de aplicabilitate al acestui tip de sistem expert nu este numai
medicina. Oriunde exist, n anumite condiii date, posibilitatea de a lua mai multe decizii, putem
aplica astfel de sisteme (domeniile economic, militar etc.).


2
Abordarea n acest mod a hepatitelor virale [4] se datoreaz unei mulimi de cauze
sintetizate astfel:
sunt boli infecto-contagioase care se manifest sporadic, epidemic sau endemic i care survin n
toate arealele geografice;
reprezint o cauz considerabil de morbiditate i mortalitate att prin infecia acut ct i prin
evoluia spre cronicizare care include: hepatita cronic, ciroza i cancerul hepatic;
au dobndit dimensiunea unei probleme majore de sntate public.
Diferenierea ntre tipurile de hepatit B, C i B+D se face analiznd o serie de markeri. Cel
mai important dintre ei este AgHBs. Dac AgHBs este negativ se testeaz AntiHVC i dac acesta
este pozitiv se poate afirma c pacientul este infectat cu virusul hepatitei C. Dac AgHBs este
pozitiv se va testa AntiHD i dac va fi pozitiv atunci bolnavul are hepatit B+D, altfel (dac
AntiHD este negativ) va fi diagnosticat cu hepatit B. Astfel sistemul expert va trata ntr-o prim
faz hepatita viral acut B, aceasta fiind cea mai frecvent.
Exist trei tipuri evolutive ale hepatitei virale acute B (obinuit, cu recderi, cu
decompensri) i ase forme ale bolii (uoar, medie, grav, prelungit, colestatic i comatoas).
Ar fi deci interesant i mai ales util dac, la internarea unui pacient despre care se tie c este
infectat cu virusul hepatitei B, s-ar putea preciza, cu o oarecare probabilitate, care va fi tipul
evolutiv i forma bolii.
Se propune un sistem expert care, pe baza simptomelor i analizelor, va sugera medicului ce
tip evolutiv i ce form a bolii poate avea un anumit pacient. Sistemul propus a fost creat pe baza
unui studiu pe un numr de pacieni la care se cunotea modul n care au evoluat, comparndu-se
evoluia lor real cu cea sugerat de calculator. Modul n care s-a realizat practic mecanismul de
diagnosticare s-a concretizat prin mai multe etape sintetizate astfel:
La implementarea sistemului s-a folosit cu precdere Teorema lui Bayes. Rezultatele
obinute cu acest algoritm au fost analizate i interpretate i apoi am realizat alte dou variante
mbuntite ale sistemului folosind Formula lui Aitken i Modelul logistic.
Att Teorema lui Bayes, ct i cele dou variantele folosesc metode statistice. Exist un
numr de pacieni investigai pentru care se rein ntr-un fiier (baza.dbf) toate premisele
standardizate (un set de simptome i analize clinice unitare) i diagnosticul final (care se presupune
a fi corect). Se creeaz astfel o surs viabil de informaii, oarecum diferit de experiena personal
a unui anumit medic.


2. Implementarea sistemului expert folosind Teorema lui Bayes

2.1. Consideraii despre teoria probabilitilor

Toi cei trei algoritmi folosii pentru obinerea diagnosticului au la baz calculul
probabilistic, deci se impun cteva precizri n acest domeniu [6].
Se noteaz cu mulimea tuturor rezultatelor posibile ale unui eveniment (i o vom
considera finit). O submulime a lui se numete eveniment. Evenimentul se numete
evenimentul cert, iar evenimentul {} (notat i I) se numete evenimentul imposibil.
Probabilitatea unui eveniment E se noteaz p(E), este un numr real i are urmtoarele
proprieti axiomatice: 0 p(E) 1; p() = 1; p(I) = 0.
Dac dou evenimente E i F sunt mutual exclusive (mulimi disjuncte), probabilitatea ca
mcar unul s apar este suma probabilitilor lor individuale: E F = {} p(EF) = p(E) + p(F).
Probabilitatea p(EF) semnific faptul c i evenimentul E i evenimentul F trebuie
obligatoriu s apar mpreun i se numete probabilitate compus. Se noteaz: p(EF) = p(E,F)
Probabilitatea condiionat a evenimentului E n cazul apariiei obligatorii a lui F este notat
p(E|F). Probabilitile condiionate sunt msuri ale gradului de realizare a unor evenimente a cror
probabilitate se modific odat cu realizarea unui eveniment sau a unei experiene.


3
Cnd p(F) 0, p(E|F) se definete ca raportul dintre probabilitatea compus p(E,F) i
probabilitatea de apariie a lui F:
) (
) , (
) | (
F p
F E p
F E p = (2.1)
Dou evenimente E i F sunt independente cnd probabilitatea:
p(E,F) = p(E) p(F) (2.2)
Independena ofer o cale simpl pentru calculul probabilitii interseciei i unele
simplificri n calculul probabilitii unor evenimente.


2.2. Utilizarea teoriei probabilitilor n diagnoza medical

n acest caz este vzut ca o mulime de pacieni (numit i populaie statistic).
Se presupune c
j
este o variabil propoziional asociat unei boli (diagnosticul). Formal
spus,
j
=1 (notat i D
j
) este mulimea tuturor pacienilor care au acea boal.
Fie S = {
1
,
2
, ,
n
} o mulime ordonat de variabile propoziionale asociate tuturor
simptomelor considerate standard.
De exemplu:
2
= 0 nseamn c pacienii nu au temperatur

2
= 1 nseamn c pacienii au temperatur
Relativ la baza de date considerat (investigat), un anumit pacient va avea asociat un vector
de valori s = ( s
1
, s
2
, , s
n
) reprezentnd valorile asociate variabilelor din S, i o boal
j
( j = 1,m
unde m este numrul de boli luate n considerare).
Pentru un nou pacient se cunoate doar vectorul s asociat (toate simptomele i analizele
sale). Scopul este a sugera medicului un diagnostic. n acest sens, se calculeaz pentru fiecare boal

k
(pentru fiecare tip evolutiv i form a bolii) probabilitatea asociat, adic valoarea p(D
k
|S=s).
Dac populaia statistic ar fi foarte mare, s-ar numra ci pacieni au avut aceeai boal
i exact acelai vector asociat s i ar fi mprit la card D
k
(numrul total de cazuri care au avut acea
boal).
n practic, acest lucru este foarte greu de realizat din cauza numrului excesiv de mare de
cazuri pe care ar trebui s le conin baza de date. n plus, simptomele nu sunt ntotdeauna aceleai
la pacieni diferii, dar care au aceeai boal.
Exist ns o serie de alternative pentru calculul lui p(D
k
|S=s). Trei dintre aceste alternative
sunt descrise n continuare.


2.3. Teorema lui Bayes

Este una din formulele de calcul cu probabiliti condiionate care arat c:
) (
) ( ) | (
) | (
F p
E p E F p
F E p

= (2.3)
Teorema lui Bayes aplicat n diagnoza medical arat c:
) (
) ( ) | (
) | (
S p
D p D S p
S D p
k k
k

= (2.4)
p(D
k
) este simplu de calculat, cunoscnd frecvena cu care
k
=1 apare n populaia :

=
=
card
cardD
card
x x card
D p
k k
k
} 1 ) ( | {
) (

(2.5)
p(S|D
k
) necesit mai multe calcule i trebuie presupus c simptomele sunt independente
condiionat n prezena bolii
k
. Atunci:


4

=
=
n
i
k i k
D p D S p
1
) | ( ) | ( (2.6)
unde:
) (
) , (
) | (
k
k i
k i
D p
D p
D p

= (2.7)
i

= =
=
card
S D card
card
x x x card
D p
i k i k
k i
} { } 1 ) ( , 1 ) ( {
) , (
I
(2.8)
p(S) este, de asemenea, destul de greu de calculat. Dac se presupune c toate bolile sunt
mutual exclusive, adic fiecare pacient trebuie s aib la un moment dat doar o singur boal (i nu
este ntotdeauna aa) se poate folosi urmtoarea formul:

=
=
m
j
j j
D p D S p S p
1
) ( ) | ( ) ( (2.9)
unde j este un indice al tuturor bolilor investigate
1
,
2
, ,
m
, iar termenii sumei se calculeaz
folosind relaiile anterioare.
n final rezult, pentru teorema lui Bayes, relaia de calcul:

= =
=

=
m
j
n
i
j i j
n
i
k i k
k
D p D p
D p D p
S D p
1 1
1
) | ( ) (
) | ( ) (
) | (

k=1,m (2.10)
Aplicarea formulei date de teorema lui Bayes asupra unei baze de date care reprezint o
populaie statistic cu scopul de a determina un diagnostic pentru un nou pacient se numete
inferen prin regula bayes-ian.
Implementarea unui astfel de sistem din punct de vedere al programrii este foarte simpl.
Exist memorate n baza de date pe de o parte simptomele i analizele clinice, pe de alt parte
diagnosticul tipul evolutiv i forma bolii pentru 150 de pacieni care reprezint populaia
statistic (fiierul baza.dbf). n final se obine probabilitatea de apariie pentru fiecare boal n
parte.


3. mbuntiri ale inferenei bayes-iene

3.1. Formula lui Aitken

S-a observat, practic, c n cazul unei populaii statistice mari teorema lui Bayes duce la un
timp de calcul excesiv din cauza formulei (2.6) de calculul a probabilitii p(S|D
k
). O soluie de
mbuntire n acest sens o constituie formula lui Aitken [6]:

=
T
t
st st n
k
T
D S p
1
) 1 (
1
) | (

( k=1,m ) (3.1)
unde T = numrul total de pacieni
n = numrul de simptome

= factor de netezire pentru boala ( 0.5

1)
st = distana Hamming ntre valoarea S = (S
1
, S
2
, , S
n
) a pacientului nou i S
t
=(S
1
t
, S
2
t
, ,
S
n
t
) a pacientului t din baza de date investigat
Distana Hamming [3] este derivat din formula general a lui Minkovski. Dac toate
caracteristicile S
i
i S
i
t
, i = 1,n, sunt codificate binar (au toate valorile 0 sau 1), aa cum este cazul
nostru, atunci se poate calcula distana Hamming. Ea este egal cu numrul de caracteristici care


5
sunt diferite n S i S
t
. Aplicarea lui SAU EXCLUSIV, simbolizat aici prin XOR, permite calculul
foarte rapid al distanei Hamming conform relaiei:

=
=
n
i
t
i i g Ham
S S XOR d
1
min
) , ( (3.2)
unde AND i OR simbolizeaz operaiile logice I respectiv SAU.
Succesul formulei lui Aitken depinde i de alegerea judicioas a parametrului

. Exist o
serie de metode de optimizare. Empiric, pentru o boal mai rspndit

va fi mai mic, iar pentru o


boal mai rar va fi mai apropiat de valoarea 1.


3.2. Modelul logistic

Unul din marile neajunsuri ale teoremei lui Bayes era acela c bolile trebuiau s fie mutual
exclusive, condiie care micora drastic aria de aplicabilitate a teoremei. O soluie n acest sens o
ofer modelul logistic[6].
Se introduce noiunea de antiprobabilitate:
) ( 1
) (
) (
) (
) (
E p
E p
E p
E p
E o

= = (3.3)
i antiprobabilitate condiionat:
) | (
) | (
) | (
F E p
F E p
F E o = (3.4)
din care:
) ( 1
) (
) (
E o
E o
E p
+
= i
) | ( 1
) | (
) | (
F E o
F E o
F E p
+
=
Se observ c este mai uor de calculat o(E|F) dect p(E|F). O metod este discriminarea
logistic (Anderson, 1982) care demonstreaz formula:

=
+ = =
n
i
i i
s a a s S D o
1
0
) | ( ln (3.5)
unde vectorul a = (a
1
, a
2
, , a
n
) poate fi calculat prin diverse metode.
Pentru diagnoza medical s-a propus urmtoarea metod particular:

=
+ = =
n
i
i ik k k
sign w w s S D o
1
0
) ( ) | ( ln k=1,m (3.6)
unde n numrul de simptome
m numrul de boli
w
i
se numesc ponderi i se calculeaz cu:
) ( ln
0 k k
D o w = i
) | (
) | (
ln
k i
k i
ik
D p
D p
w

= i = 1,n
Pentru pacientul diagnosticat se baleiaz lista de simptome i se calculeaz:

=
=
=
1 , 1
0 , 1
) (
i
i
i
daca
daca
sign

i = 1,n (3.7)
Se poate observa c:
) | ( ln
) | ( ln
1
) | (
S D o
S D o
k
k
k
e
e
S D p
+
= (3.8)
ceea ce este tocmai rezultatul dorit.






6
4. Concluzii

Medicina este unul din domeniile n care se poate cere ajutorul unui sistem expert datorit
faptului c la un moment dat pot exista mai multe alternative n ceea ce privete diagnosticul ce
urmeaz a fi pus.
Se poate realiza un astfel de sistem capabil s sugereze medicului utilizator tipul evolutiv i
forma bolii n cazul unui pacient despre care se tie c este infectat cu virusul hepatitei B i ale crui
simptome i analize clinice se cunosc i sunt oferite drept premise.
S-au implementat trei algoritmi. Cel mai important, pentru domeniul abordat de aceast
lucrare, rmne teoreme lui Bayes. Aceasta are ns i unele dezavantaje.
O populaie statistic mai mare ar conduce la posibilitatea mbuntirii sistemului i
metodologiei propuse (exist doar 150 de pacieni investigai). De asemenea, procentul de
corectitudine a rezultatelor oferite de aceast teorem ar fi mult mai ridicat dac numrul de
simptome ar fi mai mare. Pentru ca diagnosticul s fie ct mai corect, un lucru important este
omogenitatea bolilor (tip evolutiv i form) asociate populaiei statistice.
In cazul unei populaii statistice mai mari apare o alt problem: timpul de calcul necesar n
cazul aplicrii teoremei lui Bayes. Soluia o reprezint formula lui Aitken, i ea implementat n
lucrare.
Teorema lui Bayes mai are un mare dezavantaj: ea impune ca bolile s fie mutual exclusive,
adic un pacient nu are voie s sufere de mai multe boli la un moment dat. Acest lucru nu
deranjeaz n cazul domeniul ales pentru c oricum un bolnav nu poate evolua i spre forma uoar
i spre forma grea a hepatitei virale acute B. Dar dac se lrgete domeniul, atunci nu se mai poate
impune ca un subiect s sufere doar de o singur boal. Condiia impus de teorem reduce aadar
aria sa de aplicabilitat. Exist i pentru aceast problem o soluie: modelul logistic. Acesta are un
caracter mai general dect teorema lui Bayes pentru c nu mai prevede ca bolile s fie mutual
exclusive.
Sistemul pune la dispoziie aceti trei algoritmi i pentru fiecare dintre ei efectueaz un
studiu asupra procentului n care rezultatele oferite sunt corecte. Analiznd acest procent i innd
cont de constrngerile impuse de fiecare caz n parte, medicul va decide care algoritm este cel mai
potrivit pentru un nou pacient a crui evoluie trebuie determinat.
Se poate deci conclude c rezultatele obinute n urma utilizrii acestui sistem expert, n care
s-au implementat Teorema lui Bayes, Formula lui Aitken i Modelul logistic sunt destul de
elocvente pentru a putea determina medicii s foloseasc n viitorul ct mai apropiat un astfel de
sistem ca asistent.


Bibliografie

[1] ALBU A., Sistem expert pentru diagnoz medical, Referat de doctorat, 2002
[2] CRSTOIU D., Sisteme expert, Editura ALL, Bucureti, 1994
[3] HOLBAN ., Inteligen artificial - note de curs, Universitatea "Politehnica" Timioara,
2000
[4] NICOAR E., CRIAN A., Imunomodularea n hepatitele virale (actualiti i perspective),
Editura Mirton, Timioara, 1996
[5] ONICESCU O., Probabiliti i procese aleatoare, Editura tiinific i Enciclopedic,
Bucureti, 1977
[6] PESCARU D., Sisteme expert - note de curs, Universitatea "Politehnica" Timioara, 2000
[7] PODGORELEC V., Self-adapting Evolutionari Decision Support Model, IEEE, 1999.

S-ar putea să vă placă și