Documente Academic
Documente Profesional
Documente Cultură
2
Reguli de decizie
Consideram cazul binar:
– aplicind teorema lui Bayes pentru o valoare observata a caracteristicii, de ex. X=x,
rezulta
P(θ1/x) si P(θ2/x)
Pentru a raspunde intrebarii: carei stari ii apartine starea reala caracterizata de proba X=x?
3
Reguli de decizie
Probabilitatea erorii unei decizii de incadrare gresita a starii reale (θr ):
• probabilitatea medie a erorii unei decizii pentru toate valorile posibile ale vectorului
caracteristicilor X este:
– P(e)=P(e/x)P(x)+P(e/x-)P(x-) (2)
P ( x / 1 ) P ( 2 )
θ1 daca (2)
– Decide P ( x / 2 ) P (1 )
θ2 altfel
5
Reguli de decizie
Eroarea rezultata se numeste eroarea bayes si este cea mai buna performanta care
poate fi obtinuta.
Daca, conform regulii PAM, am decis θr =θ2 si decizia corecta este θ1 , atunci
6
Reguli de decizie
Regula verosimilitatii maxime
– Decide
θ2 altfel
7
Reguli de decizie
Regula riscului minim
• Fie ω(di, θj) pierderea (costul) deciziei di atunci cind starea reala este θj.
8
Reguli de decizie
9
Reguli de decizie
Criteriul de optim, conform teoriei bayesiene a deciziilor→
minimizarea riscului (pierderilor medii)
• decizia optima:
d * ( x ) arg min R ( d i / x )
di
sau
d * ( x ) arg min (d j , H j ) P ( H j / x1 ,.., xn )
di j
=1 - P(Hi/x)
Conform regulii pentru risc minim se calculeaza pierderile medii pentru fieacre clasa I
conform regulii:
c* ( x) arg min R(ci / x)
di
• Regula de decizie optima poate fi una din cele trei reguli care
minimizeaza probabilitatea erorii de clasificare
• Daca este indeplinita conditia de independenta a
caracteristicilor(atributelor) atunci clasificatorul se numeste
Clasificatorul Bayes Naiv
13
Clasificatorul Bayes
fi (x)=P(Ci /x)
o realizare a
P(Xi =xi /Cj ) pentru toate valorile
vectorului dom(Xi )
caracteristicil
or
15
Estimarea parametrilor modelului
probabilistic - clasificatorului Bayes
Parametrii modelului probabilistic (probabilitatile apriorice si
verosimilitatile caracteristicilor) pot fi estimati sub forma frecventelor
relative dintr-un set de date - instante ale vectorului caracteristicilor
la care se cunoaste clasa de apartenenta (clasificare supervizata):
nr.cazuri( X x, C c)
• P(X=x/C=c)=
nr.cazuri(C c)
nr.cazuri (C = c)
• P(C=c)= nr.total cazuri
16
Estimarea parametrilor modelului
probabilistic-utilizarea Clasificatorului Bayes
pacient X1 X2 Clas (starea)
Exemplu:
1 N J C2
Presupunem baza de date din tabel,
unde caracteristicile sunt: 2 N M C2
X1=Temperatura: {Normal, Febra} 3 F J C1
X2= Tensiunea: {Joasa, medie,Mare),
4 N m C1
independente conditional si
clasele: C1-bolnav , C2-sanatos. 5 F m C2
6 F M C1
7 F M C1
8 F m C1
18
Ajustarea Laplace (vezi carte pg . 109)
C1 C2 C1 C2
N 1 2 +1
X1 F 0 2
X1 N 2 3
F 1 3
J 1 2
X2 m 1 1 X2
J 2 3
m 2 2
M 2 1
M 3 2
19
Reguli de decizie
Aplicatie: clasificarea e-mail-urilor: Spam (S) si nonSpam
(⌐S)
Multimea starilor (claselor): Θ={S, ⌐S},) si o variabila X: cuvintul “cod”
• Analiza aposteriorica: ?
• Decizia optima: ?
20