Sunteți pe pagina 1din 12

TEORIA PROBABILITII.

THOMAS BAYES

Masteranzi: Bobin Cristina Pampa Florina-Alina

2008

1. Biografie Thomas Bayes s-a nscut n Londra, Anglia, n anul 1702. A fost cel mai mare dintre cei apte copii ai lui Joshua i Anne Bayes. n 1719 s-a nscris la Universitatea din Edinburgh, unde a studiat logica i teologia. Bayes a fost hirotonisit ca preot dizident ca i tatl sau, pe care l-a asistat prima dat n Holborn. n anul 1733 a devenit preot la Biserica Presbiterian din Tunbridge Wells. n 1742 a fost ales membru al Royal Society, cu toate c, la acel moment, nu avea publicat nici o lucrare n domeniul matematicii. Se presupune c Bayes a ncercat s se retrag din preoie n 1749, dar a rmas preot pn n anul 1752, cnd s-a retras, continund s locuiasc n Tunbridge Wells. Se cunosc dou lucrri publicate n timpul vieii sale: n anul 1731, ,,Divine Benevolence, or an Attempt to Prove That the Principal End of the Divine Providence and Government is the Happiness of His Creatures i ,,An Introduction to the Doctrine of Fluxions, and a Defence of the Mathematicians Against the Objections of the Author of the Analyst (aprut sub anonimat n 1736). Thomas Bayes a murit la 17 aprilie 1761, la vrsta de 59 de ani, n Tunbridge Wells, Anglia.

2. Teorema lui Bayes n urma cercetrilor efectuate de ctre profesorul Stigler, n 1983, s-a afirmat c teorema lui Bayes a fost descoperit de ctre Nicholas Sanderson nainte de Bayes. Aceast teorem poart numele matematicianului i clugrului Thomas Bayes. Richard Price, prietenul acestuia, a publicat, n 1764, dup moartea autorului, lucrarea acestuia, sub denumirea ,,An Essay Towards Solving a Problem in the Doctrine of Chances. Pierre-Simon Laplace a extins aceste rezultate n 1774 ntr-un eseu, netiind, aparent, de lucrarea lui Bayes. ,,Formula lui Bayes ne d posibilitatea ca dup ce tim c un eveniment ce poate apare din mai multe cauze s-a realizat, acesta s se fi realizat dintr-o cauz anume.1 Din punct de vedere matematic, formula apare enunat astfel: fie (X, , P) un cmp de probabilitate i A 1, A2 ... An o partiie a lui X. Fie B un eveniment cu probabilitate nenul. Atunci: PB(Ai)= Demonstraie: PB(Ai)=
P B Ai P Ai PAi B = P B P Aj PAj B P Ai PAi B P Aj PAj B

1 Genoveva, Burc, Matematici aplicate Teoria probabilitii i statistic matematic, Editura ,,Alma Mater, Bacu, 2007, p. 11

conform teoriei probabilitii totale.2

3. Aplicarea teoremei bayes-iene n domeniul criminalisticii Expertiza criminalistic este recunoscut i utilizat n cercetarea cauzelor penale, avnd rol att n domeniul constatrii mecanice a caracteristicilor obiectelor supuse examinrii, ct i n domeniul stabilirii identitii dintre obiectele supuse cercetrii. n urma activitii expertului criminalist, se ntocmete un raport de expertiz, formulnd concluzii (certe, de probabilitate, de imposibilitate a identificrii). Identificarea criminalistic poate fi definit ca stabilirea prin mijloace tehnico-tiinifice a identitii unei fiine sau a unui obiect care are legtur cu fapta incriminat.3 Are specificul su, urmrind att stabilirea identitii, ct i a neidentitii. Astfel, putem vorbi despre o identificare dup descrierea trsturilor eseniale, una dup memorie, iar o alt categorie, dup urmele lsate. Identificarea criminalistic este guvernat de anumite principii (obiectele supuse examinrii apar ca obiecte scop i obiecte mijloc; obiectele supuse identificrii cuprind elemente relativ stabile i elemente variabile; examinarea analitic i sintetic a elementelor caracteristice; interpretarea cauzal i dinamicitatea) i se realizeaz treptat, trecnd de la general la particular (identificare generic i identificare individual). Pe baza acestei activiti, expertul criminalist formuleaz concluzii certe pozitive i negative; de probabilitate; de imposibilitate. Concluziile de probabilitate permit orientarea muncii de elaborare a versiunilor n procesul cercetrii. Ele nu confirm sau infirm o anumit mprejurare, ci ofer o opinie tiinific cu caracter de supoziie. Conform prof. Augustin Lazr, concluziile de probabilitate stabilesc posibilitatea, eventualitatea unei fapte sau mprejurri, ele rmnnd numai presupuneri ale expertului4, deoarece, pe baza datelor pe care le are la dispoziie, nu poate formula o prere cert. Aceste concluzii sunt ntemeiate nu pe impresii subiective, ci pe cercetri tiinifice. n doctrin s-a pus n discuie utilitatea concluziilor de probabilitate formulate de ctre expertul criminalist. Pe de-o parte, acestea sunt acceptate ca fiind utile i pertinente cauzelor penale, iar pe de alt parte, s-a considerat c acestea nu ofer o soluie viabil pentru anchetatori. Teorema lui Bayes vine s sublinieze rolul i importana concluziilor de probabilitate, mai
2 Genoveva, Burc, op. cit. 3 Ionescu, Lucian; Sandu, Dumitru, Identificarea criminalistic, Editura ,,tiinific, Bucureti, 1990, p. 58 4 Lazr, Augustin, Criminalistica, Alba Iulia, 2004, p. 207

ales n evaluarea probelor circumstaniale. n criminalistic, aceast teorem ne ajut s determinm posibilitatea ntmplrii unui eveniment despre care nu tim nimic, de cte ori s-ar putea ntmpla i de cte ori ar fi comis, n circumstanele date. n criminalistic, teorema lui Bayes a fost transpus astfel:
OG / E= P E /G O G P E /not G

unde: O diferena; P probabilitatea; G vinovia; Not-G nevinovia; E prob circumstanial dat; O(G) posibilitatea vinoviei suspectului nainte de examinarea probei date (posibilitatea a priori); P(E/G) posibilitatea apariiei probei cnd suspectul este vinovat; P(E/not-G) probabilitatea apariiei probei cnd suspectul este nevinovat; O(G/E) posibilitatea ca suspectul s fie vinovat conform probelor circumstaniale date pe care le examinm (posibilitatea a posteriori). Teorema lui Bayes deriv din urmtoarele legi de probabilitate: 1) - probabilitatea poate lua valori n intervalul de la 1 pn la 0 i numai un eveniment care are loc cu certitudine are probabilitatea 1; 2) - dac dou evenimente se exclud reciproc i dorim s cunoatem probabilitatea ca unul sau altul s fie adevrat, atunci se adun probabilitile pentru fiecare; 3) - dac dou evenimente pot avea loc simultan, atunci probabilitatea ca acestea s fie adevrate se obine prin multiplicarea probabilitilor acestora.5 Potrivit teoriei bayes-iene exprimate mai sus, pentru a se stabili, dup examinarea probelor, posibilitatea vinoviei suspectului O(G/E), trebuie nmulit rata de asemnare dup evaluarea probelor (LR)6 cu posibilitatea ca nainte de examinarea probei date, suspectul s fie vinovat O(G).7 O(G) se afl mprind probabilitatea existenei vinoviei suspectului la posibilitatea nevinoviei acestuia.
5 Potorac, Romic, Strategii de interpretare a informaiilor furnizate de ctre profilele genetice, n revista Criminalistica, Nr. 4/iulie 2004, p. 12 6 ,,likelihood ratio - reprezint raportul dintre probabilitatea apariiei probei cnd suspectul este vinovat i probabilitatea apariiei probei cnd suspectul nu este vinovat 7 Posibilitatea existenei vinoviei subiectului naintea examinrii oricror probe

Primul termen al raportului este ntotdeauna egal cu 1, iar al doilea termen este egal cu restul rmas dup ce scdem suspectul din populaia relevant, stabilit n fiecare caz n parte. Calcularea valorilor numerice ale ratei de asemnare, pentru diferite genuri de expertiz, au ca i corespondent o scal verbal; cu ct valoarea ratei de asemnare difer de 1 n orice direcie, cu att mai mare va fi efectul asupra probabilitii vinoviei subiectului: a) valoarea LR este foarte apropiat de 1 proba nu prezint importan prea mare n stabilirea vinoviei sau nevinoviei suspectului; b) dac valoarea LR este mai mic dect 1 se merge spre aprecierea nevinoviei suspectului; c) cnd valoarea LR este mai mare dect 1 gradul de vinovie al suspectului este mai ridicat. Ultima etap din aplicarea teoremei lui Bayes reprezint nmulirea ratei de asemnare cu posibilitatea a priori a vinoviei suspectului, obinnd ca i rezultat posibilitatea vinoviei suspectului a posteriori.
O G / E= LRO G

n practic, experii ajung de cele mai multe ori la formularea unor concluzii de probabilitate, iar nu de certitudine, fapt dovedit de teorema lui Bayes, demonstrndu-se acest lucru prin calcule matematice, metode tiinifice i raionamente logice. Teorema lui Bayes este folosit n expetize precum: identificarea fptuitorului dintr-un numr de persoane suspecte, identificarea urmelor papilare, identificarea urmelor provocate de autoturisme, interpretarea probelor ADN, iar n cazul unora dintre aceste expertize, prin aplicarea teoriei, se poate ajunge chiar la o concluzie de certitudine a identificrii.

4. Alte domenii de aplicare Teorema lui Bayes este aplicat i n alte domenii n afar de criminalistic. n urmtoarele rnduri prezentm unele dintre acestea. a) Teorema lui Bayes este un instrument ce poate fi folosit pentru a re-evalua probabilitatile diferitelor ipoteze diagnostic posibile. Dac D1,D2...Dn este o familie complet de evenimente ale cror probabiliti a priori P(D1), P(D2)...P(Dn) sunt cunoscute, iar S este un alt eveniment pentru care toate probabilitile condiionate P(S/D1),P(S/D2)...P(S/Dn) sunt cunoscute, atunci probabilitile condiionate inverse P(Di/S) sunt obinute cu formula: P(Di/S)=
P Di P S / Di P D1P S / D1P D2 P S / D2 ... P DnP S / Dn

Notaiile D1, D2...Dn de mai sus se pot referi la aceste ipoteze diagnostic posibile. Probabilitile a priori P(Di) pot fi estimate prin diverse metode, de exemplu prin folosirea datelor statistice sau de recensamnt la nivel naional. Evenimentul S poate fi un semn sau un simptom. n contextul prezenei acestui semn/simptom, probabilitile ipotezelor diagnostic trebuie s fie reevaluate; teorema lui Bayes de mai sus ne ,,ajut cu o formul prin care putem calcula aceste probabiliti a posteriori.8 b) Teorema lui Bayes este folositoare i n evaluarea testelor privind consumul de droguri. S presupunem c un astfel de test este 99% sensibil i 99% exact, adic testul va identifica n mod corect o persoan ca fiind consumatoare de droguri pentru 99% din timpul su i va identifica, la fel de corect i tot pentru 99% din timp, c o persoan nu este consumatoare de droguri. Acesta pare a fi un test destul de exact n privina rezultatelor, cu toate acestea, teorema bayes-ian va releva un potenial defect al testului. S presupunem c o firm vrea s i testeze angajaii privind consumul de opiu i n urma testrilor reiese c 0,5% dintre acetia sunt consumatori de droguri. Vrem s aflm probabilitatea ca, dat fiind rezultatul pozitiv al testului, un angajat s fie n concret un consumator de opiu. Fie D eventualitatea ca angajatul s fie consumator de droguri i N eventualitatea ca acesta s nu fie consumator. Fie + situaia unui rezultat pozitiv al testului. Trebuie s aflm urmtoarele: P(D) probabilitatea ca angajatul s fie consumator de droguri, independent de orice fel de informaie. P(D) = 0,005 avnd n vedere c 0,5% dintre angajai sunt consumatori de droguri. Aceasta este probabilitatea a priori a lui D. P(N) probabilitatea ca angajatul s nu fie consumator de droguri. Acest termen al ecuaiei se calculeaz astfel: 1 P(D) = 0,995 P(+D) probabilitatea ca testul s fie pozitiv, dat fiind c angajatul este consumator de droguri. P(+D) = 0,99 avnd n vedere c testul este corect n procent de 99%. P(+N) probabilitatea ca testul s fie pozitiv, dat fiind c angajatul nu este consumator de droguri.
8 Spircu, Tiberiu, Teorema lui Bayes curs pentru doctorat, 2006, p. I-8

P(+N) = 0,01 avnd n vedere c testul va produce un rezultat pozitiv fals n privina a 1% dintre neconsumatori. P(+) probabilitatea unui test pozitiv, independent de alte informaii: P(+) = 0,0149 sau 1,49% care este aflat adunnd probabilitatea ca un rezultat pozitiv s apar (= 99% * 0,5% = 0,495%) cu probabilitatea apariiei unui rezultat pozitiv fals (= 1% * 99,5% = 0,995%). Aceasta este probabilitatea a priori a lui +. Date fiind aceste informaii, putem calcula probabilitatea a posteriori P(D+) a unui angajat care a fost testat pozitiv, ca n concret s fie consumator de droguri:
P(+D) * P(D) P(D+) = P(+) = P(+D) * P(D) + P (+N) * P(N) P(+D) * P(D) = 0,99 * 0,005 + 0,01 * 0,995 0,99 * 0,005 = 0,3322

n ciuda aparentei exactiti a testului, probabilitatea ca un angajat care a fost testat pozitiv s fie n concret un consumator de droguri este de numai 33%, astfel este mai probabil ca angajatul s fie un neconsumator. Cu ct mai neuzual este situaia pe care o testm, cu att mai mare este procentul de teste pozitive care vor avea de fapt rezultate pozitive false. c) Un alt domeniu de aplicare al teoremei bayes-iene este cel al testelor de medicin legal, a cror funcie, indiferent dac este vorba de testarea paternitii sau de identificare, este de a exclude numrul maxim de posibili indivizi. n testele de paternitate, aceasta se realizeaz prin identificarea alelei obligatorii i determinarea dac tatl posibil posed aceast alel. Indicele de paternitate (PI) reprezint ansa relativ ca tatl prezumtiv s transmit alela obligatorie, fa de un alt individ nenrudit din populaie. Este un ,,raport de probabilitate, adic raportul dintre ansa tatlui prezumtiv de a transmite alela, versus un alt individ din populaie.9 Fie X probabilitatea combinat ca tatl prezumtiv s fi transmis toate alelele obligatorii. Const n produsul tuturor valorilor de 0,5 sau 1 pentru fiecare locus. Deoarece testul de paternitate are doar dou posibiliti este sau nu este tatl biologic probabilitatea prioritar este 1 din dou opiuni posibile, adic 0,5 indicnd c ,,prioritatea neutr
9 ulescu, Mihai C.; Mixich, Vlad A.; Milan Dressler Milan; Enache, Sanda, Evaluarea statistic n analiza ADN n scop modico-legal, n Romanian Journal of Legal Medicine, vol. XIII, nr. 4/2005, p. 343-344

poate fi prioritatea corect. Dac este folosit valoarea de 0,5 pentru prioritatea prioritar, formula se reduce la expresia matematic care se folosete pentru indicele de paternitate combinat (CPI): probabilitate de paternitate P=0,5= 1 11 /PI [CPI ]

Probabilitatea paternitii este probabilitatea ca tatl prezumtiv s fie tatl copilului. De aceea, dac CPI este 400, probabilitatea ca tatl prezumtiv s fie tatl biologic este de 99,75%. Invers, probabilitatea ca tatl prezumtiv s nu fie tatl biologic al copilului este de 0,0025 sau 0,25%. Aceast ultim valoare este 1 din 400, sau reciproca lui PI. d) Teorema lui Bayes este utilizat, n special, n domenii cum ar fi sfatul genetic, pentru a se estima riscul unei femei de a nate un copil afectat. Astfel, avem formula:
X P X PY 1P

unde X reprezint posibilitatea ca evenimentul s aib loc (s se nasc un copil afectat); Y reprezint probabilitatea ca evenimentul s nu aib loc (s nu se nasc un copil afectat); P este prima probabilitate pentru ca X s aib loc; 1-P este prima probabilitate ca X s nu aib loc.

5. Exemplu concret de aplicare a teoremei lui Bayes n criminalistic I. Organul de urmrire penal dispune efectuarea unei expertize n vederea identificrii automobilului implicat n comiterea infraciunii de omor i, de asemenea, pune la dispoziia expertului mulajul urmei lsate de una dintre anvelope i o mostr de vopsea galben gsit pe corpul victimei. Vopseaua prezentat ca prob a fost identificat de expert ca fiind folosit la vopsirea automobilelor Dacia Logan, n condiiile in care, n Romnia, sunt puse n circulaie 5001 de astfel de automobile. Formula bayes-ian, adaptat la spea expus, se prezint astfel:
OG / E= P E /G O G P E /not G

unde: O= diferena; P= probabilitatea; G= identitatea; not-G= neidentitatea; E= proba prezentat expertului, adic mulajul urmei lsate de anvelop; 9

O(G)= posibilitatea identificrii automobilului nainte de examinarea probei date; P(E/G)= probabilitatea apariiei probei cnd automobilul este identificat; P(E/not-G)= probabilitatea apariiei probei cnd automobilul nu este identificat ca fiind cel folosit la comiterea infraciunii; O(G/E)= posibilitatea identificrii automobilului dup examinarea probei date. Formula lui Bayes presupune parcurgerea a trei etape: 1. Calcularea termenului O(G). Dup cum am precizat i ntr-o seciune anterioar, O(G) se calculeaz fcnd raportul dintre probabilitatea identificrii automobilului nainte de examinarea probei date i probabilitatea neidentificrii automobilului nainte de examinarea probei date:
OG= P G 1 = =0,002 P notG 5000

2. Calcularea ratei de asemnare (LR). n acest caz se calculeaz raportul dintre probabilitatea apariiei probei cnd automobilul este identificat ca fiind cel folosit la comiterea infraciunii i probabilitatea apariiei probei cnd automobilul nu este astfel identificat, ambele dup examinarea probei date. Primul termen al ecuaiei este 1, iar cel de-al doilea termen reprezint frecvena caracteristicilor specifice ale probei care se ntlnesc la numrul relevant de automobile. Mulajul urmei lsate de anvelop relev c pe obiectul creator de urm se regsesc dou striaii neregulate, iar din evidenele poliiei reiese c exist 400 automobile Dacia Logan a cror anvelope aveau striaii asemntoare, vizibile cu ochiul liber. Din punct de vedere matematic, ecuaia arat astfel:
LR= P E / G 1 1 = = =400 P E / notG 1/400 0,0025

Avnd n vedere rezultatul obinut, probabilitatea ca automobilul suspectat ar fi cel folosit la comiterea infraciunii de omor, este foarte ridicat. 3. Rezultatul final este reprezetat de posibilitatea ca automobilul s fie identificat, conform probelor examinate, ca fiind cel folosit la svrirea infraciunii. Pentru a ajunge la aceast soluie trebuie s nmulim termenul LR cu termenul O(G). Astfel:
OG / E= LRO G =400 0,002 =0,8

Dup finalizarea acestor etape de lucru, expertul trece la formularea raportului de expertiz. n spea analizat, concluziile expertului vor fi de probabilitate, n forma PROBABIL DA. Comparnd valoarea ratei de asemnare cu rezultatul final al formulei, putem observa c aceste valori sunt ndeprtate pe o scar de la 1000 la 1000, astfel considernd c aceast oscilaie este de chintesena teoremei lui Bayes.

II. Iat, de exemplu, expertul este sesizat cu realizarea unei expertize asupra unui nscris care este redactat folosindu-se un stilou marca Pelikan. Ca probe, n vederea realizrii expertizei, sunt prezentate urmtoarele date: n Romnia mai exist doar 10 stilouri de aceeai marc i acelai model, dat fiind c sunt de colecie i au fost fabricate ntr-un numr foarte mic; urmele de cerneal de pe nscrisul examinat prezint mici zgrieturi, presupunndu-se c penia instrumentului folosit este puin ndoit sau are un alt defect care, la realizarea anumitor micri de scriere, zgrie hrtia i ntrerupe linia cernelii. Acestea fiind spuse, expertul trece la aplicarea teoriei bayes-iene, conform celor trei etape expuse mai sus: 1. Calcularea probabilitii identificrii stiloului nainte de examinarea probei referitoare la particularitile peniei.
OG= P G 1 = =0,111 P notG 9

2. Calcularea ratei de asemnare, avnd n vedere aici forma specific a peniei folosit la redactarea nscisului. Expertul a identificat c din totalul de 10 stilouri de aceeai marc i acelai model, trei dintre acestea au penia puin ndoit i las urme de zgrieturi pe hrtie.
LR= P E / G 1 1 = = =3,003 P E / notG 1/ 3 0,333

Dup cum se poate observa, rezultatul ratei de asemnare indic un nivel ridicat de probabilitate n favoarea identificrii stiloului ca fiind cel folosit la redactarea nscrisului. 3. Rezultatul final al acestei formule, ca s conduc la formularea unei concluzii certe, trebuie s fie mai mare dect 1:
OG / E= LRO G =3,003 0,111 =0,333

Dup cum observm, dei rata de asemnare este foarte ridicat, rezultatul formulei nu trece peste nivelul cerut, dar nu se afl nici foarte departe. n acest caz este evident c expertul va formula o concluzie de probabilitate, n forma PROBABIL DA.

11

Bibliografie
1. Almoreanu, Sorin, Elemente de criminalistic, Ed. ,,Alma Mater, Cluj-Napoca, 2000 2. Albu, Adriana; Drgulescu, Andreea, Sisteme expert pentru diagnosticarea hepatitelor virale B, C i B+C, Buletinul tiinific al Universitii ,,Politehnica din Timioara, 2002 3. Curran, James M.; Hicks, Tacha; Buckleton John S., Forensic Interpretation of Glass Evidence, CRC Press, 2000 4. Dinu, Octavian; Mirodotescu, Bogdan, Teoria Bayes, probabiliti subiective 5. Genoveva, Burc, Matematici aplicate Teoria probabilitii i statistic matematic, Editura ,,Alma Mater, Bacu, 2007 6. Ionescu, Lucian; Sandu, Dumitru, Identificarea criminalistic, Editura ,,tiinific, Bucureti, 1990 7. Lazr, Augustin, Criminalistica, Alba Iulia, 2004 8. Lazr, Augustin; Almoreanu, Sorin, Expertiza criminalistic a documentelor. Aspecte tactice i tehnice, Ed. ,,Lumina Lex, Bucureti, 2008 9. Niedermayer, Daryle, An Introduction to Bayesian Networks and their Contemporary Applications, decembrie, 1998 10. Potorac, Romic, Strategii de interpretare a informaiilor furnizate de ctre profilele genetice, n revista Criminalistica, Nr. 4/iulie 2004 11. Spircu, Tiberiu, Teorema lui Bayes curs pentru doctorat, 2006 12. ulescu, Mihai C.; Mixich, Vlad A.; Milan Dressler Milan; Enache, Sanda, Evaluarea statistic n analiza ADN n scop modico-legal, n Romanian Journal of Legal Medicine, vol. XIII, nr. 4/2005 13. www.britannica.com 14. www.wikipedia.org