Sunteți pe pagina 1din 12

1 Legi de probabilitate clasice

Legi de probabilitate clasice

1 Repartitii discrete
1. Repartitia (legea) Bernoulli si repartitia binomiala
Efectuam un experiment care are numai doua rezultate posibile: succes sau esec
(prezenta sau absenta unei anumite caracteristici). Introducem o variabila discreta
care ia numai doua valori: 1 (succes sau prezenta caracteristicii) si 0 (esec).
P (X = 1) = p si P (X = 0) = 1 p
Exemplu. Sa presupunem ca 2,3% dintr-o populatie sufera de o boala genetica.
Alegem la ntamplare un individ; definim variabila X - prezenta sau absenta bolii.
Atunci repartitia lui X este:
( )
1 0
0, 023 1 0, 023
In realitate nu cunoastem probabilitatea p - parametru care trebuie estimat: Ce
proportie din populatie are boala respectiva?
Repetam experimentul A de n ori (probabilitatea ca A sa se produca la o efectuare
a experientei este P (A) = p) si ne intereseaza de cate ori se realizeaza A. Numarul
X al realizarilor lui A cand efectuam de n ori experienta are distributia binomiala
cu parametrii n si p (Schema lui Bernoulli).
O variabila aleatoare X are repartitie binomiala de parametri n si p daca repartitia
sa are forma:
( )
k
X , k {0, 1, . . . , n}, p > 0, q > 0, p + q = 1, n N.
Cnk pk q nk
Pentru aceasta variabila, legea de probabilitate este data de

f (k) = P (X = k) = Cnk pk q nk .

Se verifica usor faptul ca f este o densitate de repartitie.

(i) f (k) 0, k {0, 1, . . . , n};



n
n
(ii) f (k) = Cnk pk q nk = (p + q)n = 1.
k=0 k=0
Daca variabila aleatoare X are o distributie binomiala cu parametrii n si p atunci
M (X) = np si D2 (X) = npq (q = 1 p).
Exemplu. Stim ca 2,3% din populatie are boala. Alegem la ntamplare 10 indivizi
si observam daca au sau nu boala. Numarul indivizilor dintre cei 10 care ar putea
avea boala = X; variabila binomiala; p = 0, 023, n = 10.
x
P (X = x) = C10 (0.023)x (1 0.023)10x x = 0, 1, . . . 10.
2 Legi de probabilitate clasice

2 (0.023)2 (1 0.023)8 .
Pentru x = 2: P (X = 2) = C10

2. Repartitia Poisson
Sa consideram un experiment n care ne intereseaza numarul de realizari ale unui
eveniment ntr-un interval continuu de timp sau spatiu. De asemenea, aparitia eveni-
mentului ntr-un anumit subinterval nu depinde de aparitia lui ntr-un alt subinterval
(independente); apritia evenimentului depinde numai de lungimea subintervalului.
Parametrul specifica numarul de aparitii X ale evenimentului ntr-un anumit in-
terval.
O variabila aleatoare X are o repartitie Poisson de parametru (X P oisson())
daca repartitia sa are forma

k
X k , k N, > 0.
e
k!
Legea de probabilitate Poisson este data de

k
f (k) = P (X = k) = e .
k!
Functia f este o densitate de repartitie deoarece satisface conditiile:

(i) f (k) 0, k N;




k k
(ii) f (k) = e = e = e e = 1.
k! k!
k=0 k=0 k=0

O variabila aleatoare X cu repartitia Poisson de parametru > 0 are M (X) =


si dispersia D2 (X) = .
Exemple Variabila X = numarul de ncrucisari (crossovers) care apar ntr-un
proces de meioza (ntre doua pozitii (loci ) A si B pe acelasi cromozom; ntr-un
interval al spatiului); parametru necunoscut, trebuie estimat.
Intr-un sistem de asteptare, variabila X reprezinta numarul sosirilor n unitatea
de timp (fixata). Daca > 0 este rata sosirilor n unitatea de timp atunci X urmeaza
repartitia Poisson de parametru .
Altele: numarul accidentelor, aparitia unor anomalii, numarul coloniilor bacte-
riene etc.

3. Repartitia geometrica
Probabilitatea de aparitie a unui eveniment la o realizare a experientei este p. Ne
intereseaza numarul de repetari ale experimentului pana la realizarea evenimentului
respectiv.
O variabila aleatoare X are repartitie geometrica de parametru p, daca repartitia
sa are forma:
3 Legi de probabilitate clasice

( )
n
X , n = 1, 2 . . . .
p(1 p)n1
Exemplu Analiza unei secvente de ADN; studiul unei secvente particulare de
nucleotide. De exemplu, pentru T nucleotida ntr-o gena, vrem sa obtinem un model
referitor la numarul de nucleotide care urmeaza pana la urmatorul T .

. . . AAGT GGGAGGCCAT CCA . . .

Rezultatul depinde de pozitia lui T , de gena respectiva etc.


Sa luam p = 0, 25. X Geometric(0.25);
P (X = n) = 0.25(0.75)n1 , n = 1, 2, . . . .
Probabilitatea ca urmatorul T sa apara n pozitia urmatoare (doi T la rand) este
P (X = 1) = 0.25(0.75)0 = 0.25.
Probabilitatea ca urmatorul T sa apara n pozitia a doua este P (X = 2) =
0.25(0.75)1 = 0.1875 etc.

4. Repartitia uniforma discreta O variabila aleatoare discreta X are repartitie


uniforma daca repartitia sa are forma:

1 2 ... k ... n
X 1 1 1 1 .
... ...
n n n n
n
1 1
n
1 n(n + 1) n+1
Pentru variabila X, M (X) = k = k= = .
n n n 2 2
k=1 k=1
(n + 1)(2n + 1)
In acelasi mod se calculeaza media variabilei X 2 si se obtine M (X 2 ) = .
6
n 1
2
Valoarea dispersiei este D2 (X) = .
12
4 Legi de probabilitate clasice

2 Repartitii continue
1. Repartitia uniforma
O variabila aleatoare are repartitia uniforma pe [a, b] daca densitatea sa de repartitie
este f : R R,
1
, x [a, b]
f (x) = ba
0, x / [a, b]


0, xa

xa
Functia de repartitie este F (x) = , x (a, b]

ba

1, x>b
Se verifica usor ca o variabila X cu repartitie uniforma pe [a, b] are media M (X) =
a+b (b a)2
si dispersia D2 (X) = .
2 12

2. Repartitia normala
Legea normala, cunoscuta si ca legea Gauss-Laplace joaca un rol important n
teoria probabilitatilor si statistica matematica. O variabila aleatoare X urmeaza
legea de repartitie normala X N (m, 2 ) daca are densitatea de repartitie de forma:

1 (xm)2
f (x; m, ) = e 22
2
Parametrii m si ai repartitiei normale au o semnificatie aparte. Daca se cal-
culeaza media si dispersia unei variabile X N (m, 2 ) se obtine:

M (X) = m, D2 (X) = 2 .

In practica, multe fenomene, procese sau caracteristici fie se supun modelului normal,
fie difera foarte putin de acesta. Pe de alta parte, din punct de vedere teoretic, se
stie ca n anumite conditii relativ generale, legea normala poate fi considerata ca
aproximand alte modele.
1) Functia de repartitie a variabilei X N (m, 2 ) este:

x
(t m)2
1
FX (x) = P (X < x) = e 2 2 dt.
2

X m
Variabila Z = se numeste variabila normala standard si se poate arata ca

are media M (Z) = 0, iar dispersia D2 (Z) = 1. De asemenea, densitatea de repartitie
a variabilei Z este
1
fZ (x) = ex /2 .
2

2
Graficul functiei fZ este reprezentat n figura de mai jos.
Functia de repartitie FZ : R R,
5 Legi de probabilitate clasice

t2
x 0 t2 x t2
1 1 1 1
FZ (x) = P (Z < x) = e 2 dt = e 2 dt+ e 2 dt = +(x), x R
2 2 2 0 2

unde
t2
x
1
: R R, (x) = e 2 dt este functia lui Laplace. Valorile functiei lui
2 0
Laplace sunt tabelate.
2) Daca X N (m, 2 ) si a, b R atunci
( ) ( ) ( ) ( )
1 bm 1 am bm am
P (a < X < b) = F (b)F (a) = + = .
2 2

In particular,

P (|X m| < k) = P (m k < X < m + k) = (k) (k) = 2(k).

Pentru k = 3 avem P (|X m| < 3) = 2(3) = 0, 9974, deci aproape toate valorile
variabilei X se afla ntre m 3 si m + 3.
3) O proprietate importanta, folosita n statistica matematica este urmatoarea:
Daca X1 , X2 , . . . , Xn sunt n variabile aleatoare repartizate normal Xi N (mi , i2 ),
n

atunci variabila aleatoare Z = Xi este repartizata normal Z N ( mi , i2 ).
i=1
4) Cuantilele repartitiei normale sunt simetrice.
Reamintim definitia cuantilelor pentru o variabila aleatoare oarecare. Fie
(0, 1] si X o variabila aleatoare continua cu densitatea de repartitie f si functia de
repartitie F . Numim -cuantila pentru repartitia F , solutia reala x a ecuatiei

F (x ) = .
6 Legi de probabilitate clasice

Tinand cont de definitia functiei de repartitie, egalitatea se mai scrie echivalent

P (X x ) =

sau x
f (x)dx = .

Aceste cuantile (calculate pentru anumite repartitii clasice) joaca un rol important
n determinarea unui interval de ncredere garantat cu precizia (0, 1] (data) care
sa estimeze media, respectiv dispersia teoretica a unei colectivitati statistice.

3. Repartitia Gamma
O variabila aleatoare X are o repartitie Gamma cu parametrii > 0 si > 0
(X Gamma(, )) daca
1 1 x
f (x) = x1 e ,
()

pentru x > 0 si f (x) = 0 pentru x 0, unde



() = x1 ex dx.
0

Proprietati
1. () = ( 1)( 1), pentru > 1
2. ()
( )= ( 1)!, pentru N
1
3. = .
2
O variabila X Gamma(, ) are M (X) = si D2 (X) = 2 .
Pentru valori mari ale parametrilor, repartitia Gamma se apropie de forma repartitiei
normale.

4. Repartitia exponentiala
1
Un caz particular al repartitiei Gamma; = 1, = . Mai precis, X Exponential()

daca are densitatea de repartitie data de:

f (x) = ex , x > 0; > 0.


1 1
M (X) = , D2 (X) = 2 .

Calcul simplu: = 2; f (x) = 2e2x , x > 0;

P (X > 1) = 1 2e2x dx = 2e2 = 0.1353.
7 Legi de probabilitate clasice

Figura 1: Repartitia Gamma pentru diferite valori ale parametrilor

Figura 2: P (2.41 X 4.12)

5. Repartitia Beta
O variabila aleatoare X are o repartitie Beta cu parametrii > 0 si > 0
(X Beta(, )) daca
8 Legi de probabilitate clasice

Figura 3: = 7; = 2.6; M (X) = 18.2

Figura 4: Repartitia exponentiala pentru diferite valori ale lui .

( + 1
f (x) = x (1 x)1 , 0 x 1.
()()

M (X) = , D2 (X) = .
+ ( + )2 ( + + 1)
9 Legi de probabilitate clasice

Figura 5: Repartitia Beta pentru diferite valori ale parametrilor

6. Repartitia Student t
Aceasta lege a fost introdusa de matematicianul si statisticianul englez William
S. Gosset.
O variabila aleatoare X are o repartitie Student cu grade de libertate (X t ),
daca densitatea sa de repartitie este:
( )
+1
( 2
) + 1
2 x 2
f (x) = ( ) 1 + x R, N .

2
Se observa ca n acest caz densitatea de repartitie este o functie para, adica:

f (x) = f (x).

Se arata ca: M (X) = 0, D2 (X) = .
2

Pe masura ce creste, forma graficului repartitiei t se apropie de cea a graficului


repartitiei normale.
Functia de repartitie F a lui X verifica identitatea:

FX (x) = 1 FX (x),
10 Legi de probabilitate clasice

Figura 6: Repartitia Student si repartitia normala standard

de unde rezulta urmatoarea relatie ntre cuantilele t; ale variabilei Student:

t; = t;1 .

Rezulta de aici ca:


t; 1+ = t; 1
2 2

si
P (|X| t; 1+ ) = .
2

Aceste cuantile se utilizeaza pentru determinarea unui interval de ncredere garan-


tat cu precizia (0, 1) data, pentru estimarea mediei teoretice a unei colectivitati
statistice normale, folosind selectii aleatoare de volum n mic (n 30).
7. Repartitia 2
O variabila aleatoare X are o repartitie 2 cu grade de libertate (X 2 ), daca
densitatea sa de repartitie este:

1 1 1 x
f (x) = x e 2 ; x > 0.
2
( 2 ) 2 2

Este un caz particular al repartitiei Gamma: = , = 2.
2
M (X) = ; D2 (X) = 2.

Denumirea de grad de libertate este justificata de urmatoarea proprietate:


Daca X1 , X2 , . . . , Xr sunt variabile aleatoare independente de tip N (0, 1) atunci

X = X12 + X22 + + Xr2

este o variabila aleatoare de tip 2r . (Numarul indica numarul variabilelor aleatoare


de clasa N (0, 1) care prin ridicare la patrat si sumare genereaza o variabila de clasa
2 .)
11 Legi de probabilitate clasice

Figura 7: Repartitia 2 pentru diferite valori ale lui

Repartitia 2 este stabila n sensul ca daca X1 21 , X2 22 atunci X1 + X2


21 +2 .
Pentru (0, 1) fixat, cuantilele hn; 1 ale repartitiei 2 satisfac relatia
2

P (hn; 1 X hn; 1+ ) = ,
2 2

sunt asimetrice si se deduc din tabele.


Aceste cuantile se folosesc n statistica matematica pentru determinarea unui
interval de ncredere garantat cu precizia data, care estimeaza dispersia teoretica
2 a unei colectivitati statistice normale pe baza selectiilor aleatoare (indiferent de
volum).
8. Repartitia Fisher-Snedecor (F)
O variabila aleatoare cu densitatea de repartitie
( ) 1 +2
((1 + 2 ) /2) 1 2
fX (x; 1 , 2 ) = (1 /2 )1 /2 x1 /21 1 + x , x>0
(1 /2)(2 /2) 2

se numeste de tip F . Clasa acestor repartitii o vom nota cu F (1 , 2 ).

Cateva dintre proprietatile functiei de repartitie:


1) FX (x; 1 , 2 ) = 1 FX ( x1 ; 2 , 1 ). (Ordinea parametrilor conteaza.)
1
2) Daca X1 F (1 , 2 ) si X2 F (2 , 1 ) atunci X1 = .
X2
3) Daca X1 2 (x; 1 ) si X2 2 (x; 2 ) sunt doua variabile independente, atunci
2 X 1
variabila Y = F (1 , 2 ).
1 X 2
5) Pentru (0, 1) fixat, se definesc cuantilele repartitiei F (2 , 1 ) ca fiind
numerele reale f1 ;2 ; 1 ce verifica relatia:
2
12 Legi de probabilitate clasice

Figura 8: Repartitia F pentru diferite valori ale parametrilor

1
P (X f1 ;2 ; 1 ) = .
2 2
Se observa ca f1 ;2 ; = f2 ;1 ; . Se arata ca
1
f1 ;2 ; 1 = .
2 f1 ;2 ; 1+
2

Aceste cuantile se folosesc n analiza dispersionala cu un factor pentru verificarea


ipotezelor compuse de egalitate a doua sau mai multe medii, respectiv a doua sau mai
multe dispersii, corespunzatoare la subcolectivitati statistice ale aceleiasi colectivitati
statistice generale.

S-ar putea să vă placă și