Documente Academic
Documente Profesional
Documente Cultură
MASTER – ANUL I
-ROSIORII DE VEDE-
ELEMENTE DE TEORIA
PROBABILITATILOR
CUPRINS
1.10 EXEMPLE DE LEGI DE PROBABILITATE DE TIP CONTINUU……………3
1. Tipuri de distributii
(1)
unde,
Dupa cum rezulta din fig. 1, care reflecta expresia (1), functia de distributie discreta
se reprezinta grafic ca o 'scara crescatoare'.
2.
b) distributii ale altor variabile aleatoare (de exemplu: numarul de cicluri pana la
primul defect, etc.): 2 (Pearson), , t (Student), Ficher, etc.
Variabila aleatoare (t) urmeaza legea de distributie normala [N(m, )], daca
densitatea de distributie este data de expresia:
(2)
unde,
m, - parametrii distributiei (definiti in cadrul paragrafului 2.3).
Reprezentarea grafica a functiei [f(t)] - fig. 3 - se numeste curba normala sau clopotul
lui Gauss.
Aliura curbei este dependenta de valoarea indicatorului (). Curba are doua puncte
de inflexiune, cu abscisele (m - ) si (m + ). Intre limitele [m - 3; m + 3] se incadreaza
aproape toate valorile statistice ale variabilei (t).
(3)
(4)
(5)
Fig. 4 - Variatia indicatorului 'f(y)' in cazul distributiei 'normale normata'
(6)
Functia lui Laplace [ (y)] are valori tabelate in intervalul [0; 0,5].
P(t1 < t < t2) = 2 (y), cand t1 si t2 sunt simetrici fata de medie.
(7)
unde,
(8)
(9)
2. Distributia lognormala
O variabila aleatoare este distribuita lognormal, daca logaritmul sau are o distributie
normala.
expresia: (1
0)
Aceasta lege de distributie este caracterizata prin Z(t) = ct. = . Manifestarea acestei
legi are loc chiar pe durata vietii utile a produsului (zona II, fig.2.5).
(12
)
unde,
(1
3)
In expresiile indicatorilor 'm' si 'D', intra functia Euler de speta intai [21].
Pentru indicatorul 'R(t)' si, implicit, pentru ceilalti indicatori se mai aplica [19 25]
si o alta expresie de calcul, echivalenta cu expresia (12):
(1
4)
unde,
k - parametru de scara;
Expresia (14) evidentiaza faptul ca, distributia exponentiala este un caz particular al
repartitiei Weibull. Se poate afirma ca un produs care se conformeaza distributiei exponentiale
nu memoreaza efectul solicitarilor, in timp ce un produs care se conformeaza - sub aspect
fiabilistic - distributiei Weibull memoreaza (inregistreaza, evidentiaza) efectele solicitarilor.
(1
5)
(1
6)
Compararea, sub aspect grafic, intre aliura indicatorului 'R(t)', pentru diferite legi de
distributie se da in fig. 9.
1. Distributia binomiala
fie 'n' extractii succesive dintr-un lot de 'N' produse, reintroducandu-se in lot
produsele extrase, dupa verificare;
fiecare din cele 'n' produse verificate poate fi defect cu probabilitatea 'p'
(evenimentul A), sau corespunzator cu probabilitatea q = 1 - p (evenimentul contrar );
(17)
(1
8)
(19
)
unde,
(20)
Variabila 'x' reprezinta numarul producerii evenimentului 'A' in cele 'n' incercari.
(21
)
2. Distributia Poisson
(22)
Intrucat, in cazul distributiei Poisson, 'n' este foarte mare (n ), se aproximeaza cu
'n' toate valorile: n-1, n-2, etc. Deoarece x << n, rezulta:
(23)
(24)
Cand parametrul (a) creste (a > 30), distributia Poisson tinde sa se suprapuna peste
cea Bernoulli.
Distributia 2
variabilele (x1, x2, , xn) urmeaza, fiecare, o lege normala [N (m ,)] si sunt legate
de variabila aleatoare cu 'n' grade de libertate (2) prin relatia:
(26)
(2
7)
(2
7)
(28
)
Media si dispersia sunt date, pentru cazul general, de expresiile:
(29
)
4. Distributia
(30)
unde,
x - variabila aleatoare;
, - parametrii distributiei.
(31
)
(32)
O varibila aleatoare X are o distributie uniforma discreta daca repartitia sa are forma:
X: .
a) f(x) 0 , x=1,2, ,n ;
b) .
II. M(X) = .
III. M2(x) = .
IV. D(X) = .
V. g(t) = .
VI. Mediana Me imparte seria valorilor argumentului x in doua parti, astfel ca numarul
valorilor inferioare lui Me si numarul valorilor superioare lui Me sa fie egale.
Daca seria valorilor i ordonate are n=2k termeni, atunci orice valoare cuprinsa intre
termenii de rang k si k+1 satisfac definitia medianei, deci este vorba de intervalul median
(k,k+1).
Luam Me = .
X:
I. Functia f(x) = qx.p, x = 0,1,2,,n, cu p+q=1, este o functie de probabilitate, caci:
b) .
F(x) = .
M(X) = .
S = 1 + 2q + 3q2 + . + xqx-1 +
q + q2 + q 3 + + q x + =
S=
X:
si se spune ca variabila aleatoare X are o distributie binomiala (sau Bernoulli) a carei functie
de probabilitate s-a calculat dupa schema urnei cu bila revenita.
b)
Observatii.
2) Pentru calculul valorilor functiei f(x) cand n are valori mari, care este destul de
anevoios, in aplicatii se foloseste adesea pentru calculul factorialelor formula asimptotica a lui
Moivre-Stirling:
n! nn.e-n. = g(n) .
Este bine sa precizam ca, desi eroarea absoluta (n!-g(n)) este mare si ea creste o data
cu n, totusi eroarea relativa (raportul dintre valoarea aproximativa si cea reala) este foarte
aproape de 1 cand n creste si aceasta ne satisface deoarece probabilitatile sunt caturi de
produse factoriale.
n! = g(n).(1 + n ),
in care n > 0 descreste si tinde la zero, daca n creste. Se demonstreaza ca n < 1/(11n) si se ia
apoximativ egal cu 1/(12n).
g(p) =
calculul facut direct sau chiar folosind formula Moivre-Stirling pentru diversi termeni,este
destul de greoi.
Ne propunem sa dam o alta metoda, poate mai simpla, pentru calculul sumei g(t), si
anume:
Derivand in raport cu p, gasim:
f'(x,n) =
g'(p) = ;
g'(p) = nf(r-1,n-1) = .
g(p) =
(p) = = ( p - 1 )! , p > 0 ;
B(p,q) =
obtinem:
g(p) =
Pentru integrala din membrul doi, numita functia Beta incompleta, sunt construite
tabele in raport cu valorile p,r,n. Din aceste motive, formula de mai sus este folosita in
practica pentru calculul probabilitatii, ca dintr-o selectie repetata sa obtinem cel mult un
numar r de elemente care sa posede o anumita caracteristica.
4) Cand n este mare (deci cand n creste), probabilitatea f(x,n) tinde catre o valoare
limita, careia ii spunem distributia asimptotica a distributiei binomiale.
Dupa cum vom vedea, valoarea ceamai probabila a variabilei X (adica valoarea
pentru care functia de probabilitate f(x), x=0,1,2,,n este maxima) este egala cu np. Fie Z=X-
np, abaterea variabilei X de la valoarea cea mai probabila np. Probabilitatea obtinerii in n
probe a unei abateri egala cu Z este egala cu probabilitatea ca X sa ia valoarea np+z, deci:
PZ = pnp+z qn-np-z =
deoarece: n-np-z=n(1-p)-z=nq-z.
PZ = ,
obtinem distributia:
(t) = ,
F(x) = P(X<x) =
P(a<X<b) =
a' = , b' =
iar valorile integralei sunt tabelate.
Pentru valorile lu x < np-q, functia de probabilitate f(x) este crescatoare, iar pentru
valorile lui x > np+q, functia de probabilitate f(x) este descrescatoare, deci daca x np,
np+p, functia de probabilitate ia valori maxime.
Cate valori maxime poate lua variabila numar intreg x in np-q, np+p ?
Numarul intreg x se poate situa fie in interiorul intervalului, cand extremitatile lui nu
sunt numere intregi si in acest caz exista o singura valoare care face functia f(x) maxima, fie
la extremitatile intervalului cand acestea sunt numere intregi si in acest caz exista doua valori
care fac functia de probabilitate maxima.
In cazul ca M0 este unic determinat, el este valoarea intreaga cea mai apropiata de np
(M0 difera cu mai putin de o unitate de np, care reprezinta dupa cum vom vedea, valoarea
medie a distributiei binomiale).
Daca exista doua valori pentru care functia de probabilitate f(x) este maxima, vom
avea un interval modal. In acest caz se ia deobicei:
Avem:
M(X) = si M2(X) = .
Fie identitatea:
(pt+q)n = ,
pe care o derivam de doua ori in raport cu t si de fiecare data vom lua t=1. Obtinem:
n(pt+q)n-1.p = ,
n(n-1)(pt+q)n-2p2 = ,
M2(X) = np(np+q) si 2 = .
Distributia binomiala, dupa cum am aratat, este caracteristica unei extractii din urna cu
bila revenita. Pentru extractia din urna de ordinul k, variabila aleatoare care
Xk : ,
valoarea 0 fiind data pentru producerea evenimentului , iar valoarea 1 fiind data pentru
producerea evenimentului A.
Cum avem:
D .
VI. Functia genratoare, g(t).
Avem:
g(t) = M(eXt) =
g'(t) = n(pet+q)n-1.pet ;
= .
Daca q= p, distributia este simetrica; daca q p, ea este asimetrica; q < p , < 0
-asimetrie negativa (modul este deplasat spre dreapta); q > p, > 0 -asimetrie pozitiva (modul
este deplasat spre stanga).
=
Excesul : E = 0, cand n .
f(x) = p.
Distributia:
X: sau X:
se numeste distributie binomiala negativa sau distributie binomiala cu exponent negativ (in
forma a doua de exprimare a distributiei apare mai clar ca poate lua valorile: n,n+1,n+2,
In adevar,
b)
Avem:
h'(q) = n(1-q)-(n+1) ,
h'(q) = n(n+1)(1-q)-(n+2) ,
..
h(k)(q) = n(n+1)(n+k-1)(1-q)-(n+k) ,
de unde
h(0) = 1 = ,
h'(0) = n =
h'(0) = n(n+1) = 2 ,
h(k)(0) = n(n+1)(n+k-1) = n!
deci
(1)
de unde
M(X) =
de unde:
Cu aceasta:
M2=
X =
X: .
Avem:
Pentru calculul sumei din membrul drept, se porneste de la identitatea (1+y) a+b =
(1+y) .(1+y)b, careia i se aplica binomul lui Newton, iar dupa identificarea polinoamelor in y
a
sau
M(X) = .
Deoarece:
x.
avem:
deci:
M(X) = .
Deoarece M(X) = .
M(X) = pn .
f(x) = , y = n-x ,
se obtine:
Se constata ca lungimea intervalului este 1; deci M0(X) este unic determinat cand
extremitatile nu sunt numere intregi; exista un interval modal cand extremitatile sunt numere
intregi.
Cand t este un numar mare fata de n, avem intervalul asimptotic: pn-q , pn+p , adica
valoarea modala aproximativa M0(X) = np, formal este aceeasi ca la distributia binomiala.
V. Dispersia D(X).
D(X)= .
Observatii.
1) Variabila aleatoare X (care reprezinta numarul de bile extrase) asociata urnei cu bila
nerevenita are o repartitie hipergeometrica, unde n este numarul de extrageri nerevenite,
a este numarul de bile albe si t este numarul total de bile albe si negre din urna.
2) Valoarea medie se poate calcula usor si astfel. Pentru aceasta sa consideram o urna
cu a bile albe si b bile negre (a+b=t) din care se extrag una cate una n bile (fara intoarcere) si
luam variabilele aleatoare Xk, cu :
Xk =
X= si M(X) =
Deoarece variabilele aleatoare Xk nu sunt independente doua cate doua, nu putem sa
scriem: D(X) = .
X:
In adevar,
b)
Pentru calculul probabitatii f(x) s-au intocmit tabele pentru : 0,1 a 20.
II. Distributia Poisson este valoarea asimptotica a distributiei binomiale, adica avem:
, unde a=np.
In adevar,
fn(x) =
obtinem: .
Observatii.
a. probabilitatea p este mica; din acest motiv aceasta lege mai este numita si legea
micilor probabilitati.
4) Distributia Poisson se aplica atunci cand un numar mare de obiecte este repartizat in
mod uniform pe o suprafata mare. Conditia uniformitatii este esentiala pentru valabilitatea
rezultatelor. De exemplu, daca in agricultura se studiaza distributia larvelor unor insecte pe o
suprafata cultivabila nu se poate folosi distributia Poisson, deoarece repartitia larvelor nu este
uniforma.
f(x) = e-np
. .
Se observa ca valoarea medie M(X)=a, in cazul cand distributia Poisson este valoarea
asimptotica a unei distributii binomiale este a=np, deci aceeasi cu valoarea medie a
distributiei binomiale.
Avem:
g(t) = g(t) = ;
Analog:
c(t) = .
Avem:
M(X) =
M2(X) =
= +
+ e-aa a2e-aea+a
M2(X) = a2 + a 2 = ;
D(X) = a2 + a - a2 D(X) = a X = .
g'(t) = e-a. ;
M3(X) = a(a3+6a2+7a+1) .
VI. Modul M0 .
Coeficientul de asimetrie: = .
Cand n , 0, caci a deoarece a=np, adica pentru volum mare, distributia devine
simetrica.
Coeficientul de boltire: = .
Cand a (n ) atunci 3 .
P(X x) = .
(x) = .
b. .
F(x) = .
Modul M0, corespunde valorii lui x pentru care (x) este maxima; deoarece (x) este
Me = .
b. .
F(x) = ,
M(X) = .
Pornind de la expresia: z=ln(1+b2)-ln(1+a2)=
M(X) = .
&9.Distributia normala
b. Cu schimbarea de variabila:
, x = m + t , dx =
.
Graficul functiei densitate de probabilitate depinde de parametrii m si (forma curbei
ramanand aceeasi) si are forma unui clopot (clopotul lui Gauss) cu max n(x;m,)=
iar x=m, axa de simetrie; abscisele punctelor de inflexiune: x=m.
Fata de parametrul m, curba n(x;m,) sufera translatii de-a lungul axei Ox,
mentinandu-si atat forma cat si marimea. Fata de parametrul , curbele sunt mai ascutite sau
mai plate, astfel ca suprafata inchisa de axa Ox sa aiba aria 1u2 .
n(x;0,1) = ,
iar pentru x cuprins intre 0 si 3,99 valorile acestei functii se gasesc in tabele speciale. De
exemplu, n(0;0 , 1)=max=0,3980; n(1;0 , 1)=n(-1;0 , 1)=0,2420; n(3,99;0 , 1)=n(-3,99;0 , 1) =
=0,00l ,etc.
Din tabele deducem ca pentru x > 4 valorile functiei n(x;0 , 1) sunt neglijabile, deci
curba se aproprie foarte mult de axa Ox cand x creste.
Daca facem o translatie a sistemului Oxy la un sistem paralele O'x'y', astfel incat
originea noului sistem sa fie punctul de abscisa m, aceasta revine la a considera ecuatiile de
translatie: x'=x-m, y'=y sau x=x'+m, y'=y care de fapt duc pe x in x'+m ceea ce este
echivalent cu a considera m=0.
In acest caz, functia n(x;m,) devine n(x;0,) pe care o vom numi distributia
centrata, care in functie de variatia lui , are grafice diferite.
Din reprezentarea grafica a curbei n(x;m,), datorita simetriei curbei fata de dreapta
x=m, putem scrie: M(X)=m, M0=m, Me=m.
Cu schimbarea de variabila:
M(X)= =
= =
= M(X)=m.
D(X) = =
=
D(X) = 2 X = .
N(x;m,) = .
Cu schimbarea de variabila: y =
Functia:
N(z;0,1) =
Se verifica:
= unde: .
despre care se stie ca in sensul obisnuit nu se poate integra. Dar, ca integrala definita, aceasta
se poate calcula cu ajutorul unor metode aproximative de calcul al integralelor definite.
Functia:
este numita functia integrala a lui Laplace. Geometric, functia integrala a lui Laplace
reprezinta aria marginita de curba n(x;0,1), dreptele x=0 (axa Oy), x=z si axa Ox.
Din definitia acestei functii, se observa ca functia (z) este simetrica fata de origine,
caci, (-z) = -(z) ceea ce arata ca este suficient sa cunoastem valorile lui (z) numai pentru
z > 0. In acest sens sunt date tabele ale valorilor functiei lui Laplace.
Din interpretarea geometrica data functiei lui Laplace si din proprietatile integralei
definite, deducem:
N(x;m,) = .
=
In particular,
c(t) = .
Cu substitutia: u=
itx -
c(t) = c(t) = .
M1 = .
V . Momente centrate mr .
Cu substitutia:
mr = =
=
,
Coeficientul de boltire: = .
(x;a,b) =
k' = -x+b(a-1).xa-1 ,
si ' = 0, cand x = b(a-1). Pentru a < 1 , x > 0 si 0 ; pentru a>1, x=b(a-1) este abscisa
punctului de maxim. Deci M0=b(a-1).
(x;a) =
Mr = =
deci:
Mr = a(a+1)(a+2) (a+r-1)br .
In particular, pentru:
r = 1 , avem M(X) = M1 = ab ;
r = 2 , avem M2 = a(a+1)b2 ;
Folosind formula:
m1 = 0 ;
m2 = D(X) = ab2 ;
m3 = M3 -3M1M2 + 2 = 2ab3 ;
m4 = 3a(a+2)b4 , etc.
Coeficientii de asimetrie sunt :
1 = ; 2 = .
= , cu excesul E = -3= .
c(t) =
deci :
c(t) = (1 - itb)-a .
c(t) = =
= 1+
= 1+ .
b. .
F(x;a,b) = .
Ea satisface relatia:
F(x;a,b) = 1 - F(1-x;a,b),
F(1-x;a,b) =
Folosind definitia,
Mr =
In particular,pentru
r =1, M1 = M(X) = ;
r = 2, M2 =
2) Daca a, b , distributia Beta tinde catre distributia normala n(x;0,1) .
Legea de distributie Hi-patrat (Pearson ) pe care o vom nota cu 2, are functia
densitate de probabilitate :
(x)= ,
= .
Reamintim ca :
geometric, aria marginita de curba y = (x), axa Ox cu x > 02 da probabilitatea P(2 > 02) = .
Cu schimbarea de variabila :
x = 22t , dx = 22dt
Mr = =
= 2r2r Mr= (+2)(+4)(+2r-2)2r .
In particular , pentru :
r = 1 , M1 = M(X) =2 ;
r = 2 , M2 = (+2)4 ;
r = 3 , M3 = (+2)(+4)6 ,etc.
m1 = 0 ;
m2 = 24 ;
m4 = 12(+4)8 , etc.
cu p= c(t)= =
c(t) = .
= ,= cu excesul E= .
Fara demonstratie, enuntam urmatoarele proprietati din care rezulta un mod de a
genera o variabila aleatoare cu o distributie 2sau legatura intre distributia 2 si distributia
normala.
P2. Daca din fiecare din variabilele aleatoare independente X1,X2, ,Xn are o distributie
normala cu parametrii 0 si 1, atunci varaiabila aleatoare X=X 12++Xn2 are o
distributie 2 cu grade de libertate.
(t) = , t real .
=2 .
.
In adevar, cu substitutia:
I=
M(X) =
Cu substitutia:
D(X)= =
D(X) =
h(t)=t2r+1 cu h(-t) = h(t) adica functii simetrice in raport cu originea iar intervalul de
integrat este si el simetric (-,) deducem ca M2r+1 = 0.
M2r= =
=
M2r =
iar acesta exista daca , adica distributia 't' este aplicabila unei
distributii rezultate din expresii statistice formate din variabile cu cel putin doua grade de
libertate.
M2r = = m2r .
r = 1 , M2 = m2 = D(X) =
r = 2 , M4 = m4 =
este o curba simetrica fata de axa Oy. Apoi, M(X)=0, D(X)= , ceea ce arata ca pentru n
mare (practic >30), avem D(X) 1, adica aceeasi parametri ca la distributia normala n(x;0,1).
Momentele centrate m2r+1 = 0, m2r 0, de asemenea o proprietate intalnita la distributia
normala.
In plus avem:
adica tocmai momentele centrate in cazul distributiei n(x;0,1).
In concluzie, distributia 't' pentru n numar mare, tinde catre distributia normala.
In practica sunt calculate valorile functiei de repartitie sub forma de tabele si mai ales
sunt folosite tabele care satisfac ecuatia: P(X > t) = , adica se determina valoarea lui t,
pentru un dat.
h(x) =
b. Cu substitutia:
x=
= =
M(X) = ;
Mr = .
Y= ,
urmeaza legea Fisher cu parametrii m si n (legatura intre distributia normala si distributia 'F').
Este un caz particular al distributiei Gama, obtinandu-se din aceasta pentru a=1 si
b=1/p. Astfel, o variabila aleatoare X are o distributie exponential negativa de parametru p
(p > 0), daca functia densitate de probabilitate este:
h(x) = .
b. .
Functia de repartitie este:
M(X) = , D(X) = X = ;
c(t) = .
Figura 5.1.
Vom da cateva proprietati analoage celor date pentru functiile de repartitie unidimensionale:
(P1) F este nedescrescatoare in raport cu fiecare argument;
(P3) ;
(P4) ; ;
(P5)
(4.5.1.)
Avem:
(5.2.)
Avem:
(5.3.)
Sa se determine:
R:
1.
2.
(5.4.)
(5.5.)
(5.6.)
(5.7.)
Avem:
(5.8.)
(5.8'.)
(5.9.)
(5.10.)
(5.11.)
se cere sa se calculeze:
1. ; ; , daca .
R. 1. Avem:
de unde:
deci:
-1 1
-1
trebuie astfel ales, incat toate probabilitatile sa fie cuprinse intre 0 si 1 deci
2. . Avem , , , deci
Deoarece , rezulta .