Sunteți pe pagina 1din 6

Curs Biostatistica

1. Probabilitate
Teoria probabilitilor, n forma sa clasic cunoscut astzi, s-a nscut
acum aproximativ patru secole. Ea are la baz noiunea de ntmplare,
incertitudine, hazard, termenul az-zahr, ce provine din limba arab, nsemnnd
chiar joc de zaruri. Putem meniona aici i termenul aleator, care provine din
latin alea, desemnnd tot aruncarea zarului.
Dac trecem pe scurt n revist istoria calculului probabilitilor, trebuie
neaprat s-i amintim pe B. Pascal i P. de Fermat care au fost primii care au
dat o argumentare matematic jocurilor de noroc ce cunoteau o mare amploare
la acea dat (sec. XVII). Chestiunea de la care au plecat cei doi (menionm aici
celebrele scrisori dintre ei) a fost problema lui Mr din anul 1654 (dup
numele cavalerului de Mr, cunoscut de Pascal prin anul 1652), care se referea
la repartiia mizei ntre doi juctori care abandoneaz o partid nainte de
sfritul acesteia. Primele tratate asupra teoriei probabilitilor au fost scrise de
C. Huygens (1657) i J. Bernoulli (1713 Ars Conjectandi), menionnd apoi
pe Th. Bayes (1763 formula lui Bayes), P.S. de Laplace (1812 Trait
analytique des probabilits), D. Poisson (1837 legea numerelor mari) i K.F.
Gauss (1809 teoria erorilor). Pn n sec. XX, lucrrile aprute au ncercat s
detaeze teoria probabilitilor de problema concret a jocurilor de noroc, cea
care, de fapt, dduse natere primelor dezbateri privind cuantificarea hazardului.
Sfritul secolului XIX i, mai ales, secolul trecut au coincis cu o dezvoltare fr
precedent a teoriei probabilitilor, notnd aici pe A. Markov, P.L. Cebev,
A.M. Liapunov, A. Hincin, A. Kolmogorov, E. Borel, M. Frchet, P. Lvy,
W. Feller, etc. Sfritul secolului XX a dus, odat cu apariia i dezvoltarea
tehnologiei informaiei, la o explozie a dezvoltrii calculului probabilitilor,
privit, mai ales, prin prisma aplicaiilor sale practice, amintind, n special,
interfaa sa cea mai cunoscut cu lumea real dat de statistic

2. Analiz combinatoric
Analiza combinatoric se ocup, schematic vorbind, de enumerarea
(contorizarea sau numrarea) unor anumite elemente aparinnd unei mulimi
finite de obiecte i care au o caracteristic aparte. De exemplu, ne intereseaz s
aflm n cte moduri diferite putem mpri 5 cri de joc sau cte meniuri
diferite putem face combinnd apte feluri de mncare Aceast tehnic a
numrrii a aprut nc din antichitate, putnd meniona c, de exemplu, dac
formula pentru Cn2 era cunoscut nc din sec. III e.n., formula general a
combinrilor Cnk este menionat prima dat de ctre matematicianul hindus
1

Curs Biostatistica

Bhaskara de-abia n sec. XII. In fine, s mai amintim c B. Pascal a remarcat


pentru prima dat legtura dintre Cnk i coeficienii din formula binomului lui
Newton.

Permutri, aranjamente i combinri


Vom ncepe prin a defini noiunea de cardinal. Astfel, prin cardinalul unei
mulimi finite A = {a1, a2,..., an} nelegem numrul n al elementelor sale i vom
nota:
card (A) = n.
S menionm c pentru mulimea A avnd card (A) = n, avem card (P(A)) = 2n
(formula lui Cardan), unde mulimea P(A) reprezint mulimea prilor sale.
Pentru produsul cartezian a dou mulimi finite A i B, avem relaie
card (A B) = card (A) card (B).
Fie A o mulime finit. O permutare a lui A este o bijecie de la A la A.
Numrul permutrilor (aplicaiilor bijective) lui A este dat de:

Ann = n (n 1) ... 2 1 = n!, n 1 (n factorial); 0! = 1.


De exemplu, dac A = {1, 2, 3}, atunci permutrile sale sunt 123, 132, 213, 231,
312, 321.
De multe ori este util s considerm submulimi ordonate ale unei mulimi date.
Ajungem astfel la definirea aranjamentelor ordonate. Fie A = {a1, a2,..., an}.
Orice submulime ordonat de k elemente a lui A, dat de { a j , a j ,..., a j }, se
numete un aranjament de ordin k. Numrul aranjamentelor de ordin k ale unei
mulimi cu n elemente este dat de:
Ank n (n 1)...(n k 1) ,
1

reprezentnd, de fapt, numrul aplicaiilor injective ale mulimii {1, 2,..., k} n A.


Dac k = n, atunci obinem permutrile lui A.
In fine, s considerm acum submulimile de cte k elemente ale lui A care nu
mai sunt ordonate ca n cazul aranjamentelor, numite i combinri de ordin k.
Numrul acestor combinri este dat de:
Ank
n!
C

.
k ! k !(n k )!
k
n

Curs Biostatistica

Not. Formula n! apare deseori n multe formule, aa c apare nevoia unei


estimri a ei n cazul cnd n este suficient de mare i nu este necesar valoarea
exact. Pentru aceasta se folosete formula lui Stirling:
n! nn e n 2n ,

pentru calculul ei care existnd i programe.


Principalele proprieti ale combinrilor sunt urmtoarele:
n

1)

C
k 0

k
n

2n ,

2) Cnk Cnnk ,
3) Cnk Cnk1 Cnk11 , 1 k n 1 (formula lui Pascal),
n

4) (a b) Cnk a k b nk (binomul lui Newton)


n

k 0

Vom meniona aici i formula coeficientului multinomial:


Cnn n ...n
1 2

n!
,
n1 !n2 !...nk !

care are urmtoarea interpretare: s presupunem c mulimea A conine n


elemente i fie n1, n2,..., nk numere ne-negative, astfel nct n1 + n2 +...+ nk = n.
Atunci exist C nn n ...n partiii ordonate diferite {A1, A2,..., Ak} ale lui A, fiecare Ar
coninnd nr elemente, r = 1, 2,..., k. Cnn n ...n se numete coeficient multinomial
deoarece avem formula:
1 2

1 2

(a b c)n Cnn n n a n bn c n .
1 2 3

In ncheiere s amintim principiul (regula) produsului: Dac o operaie O1


poate fi efectuata n n1 moduri diferite, operaia O2 n n2 moduri diferite, etc.,
operaia Ok poate fi efectuat n nk moduri diferite, atunci cele k operaii pot fi
efectuate una dup alta n n1 n2 ...nk moduri diferite, n alt exprimare Dac un
obiect O1 poate fi ales n n1 moduri diferite, obiectul O2 n n2 moduri diferite,
etc., obiectul Ok poate fi ales n nk moduri diferite, atunci cele k obiecte pot fi
alese unul dup altul n n1 n2 ...nk moduri diferite, care se poate demonstra
folosind cardinalul produsului cartezian.

Curs Biostatistica

Exemple.
1. Problema zilei de natere: Cte persoane trebuie s fie ntr-o sal, astfel
nct s obinem cu o anumit probabilitate dat ca dou persoane din sal s
nu aib aceeai zi de natere?
S presupunem c sunt k persoane n sal i c ziua de natere a fiecrei
persoane este egal probabil cu a celorlalte. Presupunnd c anul standard are
365 de zile, atunci vor exista 365k moduri posibile n care secvena de k persoane
poate face alegerea zilei de natere. Pentru a argumenta, s observm c pentru
prima persoan exist 365 de posibiliti diferite i, pentru fiecare astfel de
alegere fcut, pentru a doua persoan vor exista tot 365 de posibiliti, .a.m.d.
k
Pe de alt parte exist A365
de posibiliti ca secvena de k persoane s aib zile
de natere diferite, deoarece pentru prima persoan se pot alege 365 de zile
diferite, pentru a doua mai rmn 364 de posibiliti, .a.m.d., iar pentru a k-a
mai rmn doar (365 - k 1) posibiliti de alegere, adic, n total,
365 364 ... (365 k 1) posibiliti. Plecnd de la definiia empiric a
probabilitii, care spune c ansa de producere a unui fenomen este dat
de raportul dintre numrul cazurilor favorabile producerii i numrul
cazurilor posibile, rezult c probabilitatea cutat ca cele k persoane s
k
A365
aib zile de natere diferite este P =
. De exemplu, pentru 15 persoane
365k
P = 0,7471, pentru 20 de persoane P = 0,5886 i pentru 25 de persoane
P = 0,4313. Dac ns numrul persoanelor crete la 50 obinem P = 0,02962, iar
pentru 100 de persoane avem o probabilitate insignifiant P = 0,0000003, deci
exist o descretere neliniar. Sa menionm c se pot face programe de
calculator pentru a gsi aceste valori i a rspunde la ntrebarea de la nceput.
2. Problema iniialelor: Exist ntr-o facultate (cu peste 1000 studeni) cel
puin dou persoane care s aib aceleai dou iniiale, presupunnd c
fiecare persoan are dou iniiale (alfabet cu 26 litere)?
Pentru a rspunde la ntrebare s observm c exist 26 de posibiliti
pentru alegerea primei iniiale i alte 26 de posibiliti pentru alegerea celei de-a
doua iniiale, n total 676 seturi de iniiale. Cum numrul studenilor depete
676, vor fi cel puin doi studeni cu aceleai dou iniiale.
3. Graf arbore de numrare. S presupunem c o persoan trebuie s aleag
un meniu la un restaurant. Se tie c pentru felul nti sunt dou posibiliti: sup
sau ciorb; pentru felul doi exist trei posibiliti: friptur, pete sau vegetale
(legume); pentru desert exist dou posibiliti de alegere: prjitur sau
ngheat. Cte meniuri posibile are de ales persoana respectiv? In figura de
mai jos prezentm sub forma unui graf de tip arbore modurile posibile de
alegere.
4

Curs Biostatistica

Aa dup cum se observ, exist 2 3 2 12 meniuri diferite posibile.


Aceast diagram-arbore poate fi completat dac se adaug pentru fiecare
ramur a sa o anumit probabilitate de alegere (evident, pentru fiecare nivel
suma acestora va fi egal cu 1). Plecnd de la date statistice privind estimarea
acestor probabiliti, se ajunge n final la construirea unui arbore care ajut la
nelegerea mai bun a modului cum se comport clienii, obinndu-se deci
decizii optime de planificare a meniurilor. De exemplu, dac 60% dintre clieni
aleg supa ca apoi 50% dintre acetia s aleag friptur, atunci tragem concluzia
c 6/10 1/ 2 = 30% dintre clieni aleg nti supa apoi friptura, .a.m.d., crend
astfel un anumit tip de profil de client.
4. Problema ierarhizrii minii norocoase la poker. Se tie c n jocul de
poker o mn care cuprinde 4 cri cu aceiai valoare (e.g. 4 valei) bate un
full, adic trei cri cu aceiai valoare plus altele dou cu alt valoare (e.g. 3
dame i dou cri cu valoarea 3). Intrebarea este: de ce este aa?
Rspunsul se bazeaz pe a calcula ansa fiecrei mini i a considera mai
valoroas mna mai rar, deci cu ansa mai mic de apariie. Pentru aceasta s
reamintim c sunt 13 cri cu valori diferite, fiecare de patru tipuri distincte, n
total 52 de cri. Pentru a obine o mn cu patru cri de aceiai valoare s
observm, mai nti, c pentru alegerea acestora avem 13 posibiliti. Pentru
fiecare dintre cele 13 posibiliti, exist 12 4 = 48 de posibiliti de alegere a
celei de-a 5-a cri. In total avem 13 48 = 624 de posibiliti de a obine 4 cri
cu aceiai valoare. In total sunt C525 = 2.598.960 de mini posibile, deci
probabilitatea de o obine 4 cri cu aceiai valoare este egal cu 624/ C525 =
5

Curs Biostatistica

0,00024. In ceea ce privete ansa de a obine un full, exist 13 posibiliti de


a alege numrul ce poate apare pe cele trei cri de acelai fel; pentru fiecare
dintre acestea, exist C43 = 4 alegeri diferite ale tipului de carte. Odat alese cele
trei cri cu aceiai valoare, avem 12 posibiliti pentru alegerea valorii ce va
aprea de dou ori; pentru fiecare astfel de alegere avem C42 = 6 posibiliti de
alegere a crilor. Rezult c, n total, avem 13 4 12 6 = 3744 posibiliti de a
obine un full, deci probabilitatea corespunztoare este egal cu 3744/ C525 =
0,0014. Comparnd cele dou probabiliti nelegem de ce 4 cri cu aceiai
valoare sunt mai valoroase dect un full, probabilitatea lor fiind de
aproximativ 6 ori mai mic.

S-ar putea să vă placă și