Sunteți pe pagina 1din 25

Curs 1 1

CURSUL I






PROBABILITATI
DISTRIBUTII
VARIABILE ALEATOARE




Curs 1 2
ELEMENTE DE TEORIA PROBABILITILOR

CMPURI DE PROBABILITATE
Teoria matematic a probabilitilor pornete de la faptul c fiecrui rezultat
posibil al unui experiment aleator, rezultat pe care l vom denumi eveniment, i se
asociaz o valoare numeric, numit probabilitatea evenimentului respectiv. Aceast
valoare este o caracteristic obiectiv a evenimentului n condiiile experimentului dat.
S efectum, de exemplu, un experiment de m ori. Dac n cele m experiene un
eveniment A s-a produs de k ori, atunci 0 k m, de unde rezult pentru frecvena
relativ:
0
m
k
1,
adic frecvena relativ a unui eveniment este ntotdeauna un numr cuprins ntre 0 i 1.
innd cont c frecvena relativ oscileaz n jurul probabilitii evenimentului considerat
i c probabilitate este acea caracteristic a evenimentului care ne indic n ce proporii se
produce evenimentul n cazul repetrii experimentului de un numr foarte mare de ori,
rezult c i probalitatea este tot un numr ntre 0 i 1. Din definiia probabilitii ca
generalizare a conceptului de frecven relativ, rezult c probabilitatea unui eveniment
imposibil este 0, iar probabilitatea unui eveniment sigur este 1.
Evenimentele pot fi simple, n sensul c nu se pot descompune mai departe, sau
compuse din alte evenimente ce se petrec simultan. n acest context putem considera
dou operaii ntre evenimente.
Scriem AB i nelegem prin aceasta un eveniment care const n producerea
evenimentelor A i B, simultan. Scriem AB pentru cazul cnd se produce cel puin
unul din cele dou evenimente.
Fiind date dou rezultate A i B ale unui experiment efectuat de n ori, s
presupunem c A s-a obinut de
1
k ori i B de
2
k ori. Evenimentul AB, deci obinerea
unui eveniment din cele dou rezultate, s-a obinut ca atare, de
n
k k 2 1+
=
n
k1
+
n
k 2
ori, ceea ce
sugereaz o regul de tipul
Probabilitate (AB) = Probabilitate (A) + Probabilitate (B)
n cele ce urmeaz vom introduce o prezentare axiomatic a conceptului de
probabilitate, dup Kolmogorov
1
.
Curs 1 3
Corp borelian
Definiie:
Fie E o mulime i K o familie nevid de pri ale lui E, K (E) cu proprietile:
1. A K CA K
2. ( )
N i
i A K

1
i A K
3. E K
Deci, este nchis la operaiile de complementare i reuniune.
Se spune, n acest caz, c familia K, mpreun cu operaiile menionate, formeaz
un corp bolerian. Denumirea de borelian vine de la matematicianul Emil Borel, unul
dintre fondatorii teoriei probabilitilor.
Consecin:
Un corp borelian este o familie nchis fa de operaiunea de intersecie,
indiferent de numrul elementelor sale pe care le intersectm:
( )
N i
i A K
i
A K
Demonstraia se face imediat folosind faptul c
i i
i i
A C A
| |
=
|
\
I U
i proprietile 1 i 2.
Propoziie:
Fiind dat o familie de corpuri boreliene ( ) I i i K , intersecia lor este tot un corp
borelian.
Demonstratia se face imediat, folosind proprietile corpului borelian i ale operaiilor de
intersecie, reuniune i complementare.
Definiie:
Fie H o familie oarecare de pri ale unei mulimi E . H poate fi completat la
un corp borelian, numit corpul generat de , dac i se adaug E i toate mulimile ce se
formeaz prin reuniune, intersecie i complementare pornind de la elementele H .
Dac lum pe dreapt, mulimea intervalelor deschise de forma (- ,a), aR,
corpul borelian generat se numete simplu borelianul pe dreapta i constituie baza
teoriei probabilitilor, aa cum va fi ea abordat n prezenta lucrare. Deoarece orice
interval nchis se poate obine prin operaiile meionate din intervale deschise i invers,
Curs 1 4
orice interval deschis poate fi generat pornind de la intervale nchise, borelianul pe
dreapta este n acelai timp generat de mulimea intervalelor nchise.
ntr-adevr, se poate scrie:
[ ] b a, =


=
|

\
|
+
1
1
,
1
n
n
b
n
a i ( )

= (

+ =
1
1
,
1
,
n
n
b
n
a b a
Definiie:
O familie ( ) I i i A se numete desfacere a lui E dac:
1. I este cel mult numrabil;
2. = j i A A j i,
3. E Ai =

Spaii msurabile
Definiie
O mulime E mpreun cu un corp borelian K formeaz un spaiu msurabil (E,K).
Elementele lui K se numesc mulimi msurabile.
Definiie
Fiind date (E,K) si (F,L) spaii msurabile, o funcie f: (E,K) (F,L) se numete
funcie msurabil dac ndeplinete condiia:
A, ALf
-1
(A)K sau, altfel spus: f
-1
(L) K
Proprieti
a) Dac f i g sunt msurabile, atunci f g, f +g i f*g sunt msurabile.
b) Dac f este continu, atunci f este borelian msurabil.
Observaie
Se poate face un paralelism ntre spaiile topologice i spaiile msurabile, ntre
funciile continue i funciile msurabile. Astfel, o funcie este continu dac preimaginea
oricrei mulimi deschise este o mulime deschis iar msurabil este atunci cnd
preimaginea oricrei mulimi msurabile este msurabil. Deasemenea, dac f i g sunt
dou funcii continue, atunci f + g i f*g sunt continue.



Curs 1 5
Definiie
Se numete msur orice funcie pozitiv definit pe corpul mulimilor msurabile,
: KR
+
, aditiv pe orice familie ( ) I i i A numrabil de mulimi msurabile
disjuncte: ( ) ( )


= =
1 1
, , n n m n A A A A m n


Consecine
a) ( ) 0 =
ntr-adevr, dac lum A A = 1 , = 2 A ( ) ( ) ( ) ( ) 0 2 = = =
b) Fie un ir de mulimi ... 2 1 A A i fie n A A = , atunci ( ) ( ) A An
Demonstraie:
Fie 1 + = n n A B \ n A . Mulimile n B sunt disjuncte i n n B B B A ... 2 1 = .
Din aditivitatea lui rezult ( ) ( ) n
n
i
i
n
i
i n s B B A = =
|
|

\
|
=

= = 1 1



( ) ( ) ( ) A A B s s
n
n
i
i n = = =

=

=

1 1

n A A = i ( ) i A < ( ) n A < ( ) A
Altfel, { } ,... 1 , + = n n An ,

= n A dar ( ) = n A
Exemple
a) Fie definit dup cum urmeaz:
( ) = A dac Aeste infinit i
( ) = A numrul elementelor din A, dac A este finit.
Aceast msur se numete n mod natural msura de numrare.
b) Fie un punct exterior E x
0
fixat. Definim:
( ) 1
0
= A
x
dac A x 0 i
( ) A
x
0
= 0 dac 0 x A
Msura este utilizat n mecanica cuantic i se numete msura lui Dirac.
Probabilitate Vom defini probabilitatea ca o msur particular.
Definiie:
Fiind dat un spaiu msurbil ( ) K E, . O funcie P: [ ] 1 , 0 K cu proprietile:
a) P msur i
Curs 1 6
b) P( ) E =1
se numete probabilitate.
Deci, probabilitatea ar fi o msur normat.
Proprieti:
Pe baza proprietilor msurii i a faptului c P( ) E =1, se pot demonstra cu
uurin urmtoarele proprieti:
1. ( ) ( ) ( ) B P A P B A P B A = /
2. ( ) n , ( ) = + n n n A P A A 1 ( ) n n A P lim
3. ( ) n , ( ) ( ) n n n n n A P A P A A + = lim 1
4. ( ) ( ) ( ) ( ) B A P B P A P B A P + =
5. ( ) ( )

n n A P A P

, numit subaditivitate numrabil


6. ( ) 0 = P
7. ( ) ( ) A P CA P =1
n contextul teoriei probabilitilor, mulimile msurabile devin evenimente,
spaiul msurabil devine cmp de evenimente, iar E devine evenimentul total.
Definiie:
Un cmp de evenimente ( ) K E, nzestrat cu probabilitatea P, se numete cmp de
probabilitate.
Definiie:
Un eveniment care nu mai poate fi inclus n alt eveniment
B A K B K A , , sau = B A
se numete eveniment elementar sau atom.
Observaii
Prezentarea axiomelor teoriei probabilitilor n contexul mai larg al teoriei
msurii, dincolo de formalismul simplu i rigoare, ofer i avantajul unor interpretri
fenomenologice i picturale pentru unele formule. Astfel, dac probabilitatea este o
msur, la fel ca aria pentru figurile plane, formula:
( ) ( ) ( ) ( ) B A P B P A P B A P + =
se poate citi ca:
Curs 1 7
aria ( ) B A = aria ( ) A + aria ( ) B - aria ( ) B A
ceea ce pare ca evident.
Fig. 1.
A AB B
Definiia clasic elementar a probabilitii deriv n mod natural din noiunea de
frecven, despre care am vorbit mai sus.
Dac un eveniment A se poate realiza n m feluri diferite dintr-un numr total n de
evoluii posibile( )
n j
j
e
, 1 =
, egal probabile, atunci :
a) ( )
n j
e P
1
= i
b) ( )
n
m
A P =
Exemplu
Exemplul clasic de cmp de probabilitate finit l constituie evenimentele ce pot
aprea atunci cnd, dintr-o urn n care se afl bile albe i negre se extrag n bile. Dac
proporia bilelor albe n urn este p, i deci a celor negre este q = 1 - p, probabilitatea
evenimentului A, ca din n bile extrase, k s fie albe, conform definiiei clasice definite
mai sus, se calculeaz imediat i este:
( ) q p
C
A P
k n k
k
n

=
De exemplu, evenimentul ca din trei bile extrase, dou s fie albe - a - i una s fie
neagr - n- se poate descompune n felul urmtor :
A = (a a n) U (a n a) U (n a a)
i
P(A) = P(a a n) + P(a n a) + P(n a a) = p
2
q + p
2
q + p
2
q = 3 p
2
q =
2
3
C p
2
q
3-2
Probabilitate condiionat
Fie B un eveniment a crei probabilitate este diferit de 0. Probabilitatea unui
eveniment A, reprezint proporia n care ne ateptm s se realizeze A n cadrul tuturor
evenimentelor cmpului de probabilitate la care aparine A
Curs 1 8
Probabilitatea lui A se mai poate analiza ns i n contextul n care tim c s-a
produs anterior evenimentul B. Probabilitatea evenimentului A condiionat de B se
noteaz, n acest caz, cu: P(A/B) sau P
B
(A).
Dac s-a constatat experimental o frecven de apariie k
A
i, respectiv k
B
, pentru
A i B, frecvena relativ de apariie a lui A, cnd deja a aprut B, va fi:
( )
( )
B P
B A P
n
k
n
k
k
k
B
AB
B
AB

=
n acest context apare natural definiia probabilitii evenimentului A,
condiionat de B, prin formula:
( )
( )
( )
B P
B A P
A P
B

=
Un caz special l constituie acela n care probabilitatea de apariie a evenimentului
A este aceiai, indiferent dac s-a produs sau nu evenimentul B:
P(A) = P
B
(A)
Spunem, n acest caz, c evenimentele A i B sunt evenimente independente.
Observm c, rescriind formula anterioar
( )
( )
( )
B P
B A P
A PB

= ( ) ( ) ( ) ( ) ( ) B P A P B P A P B A P B * * = =
se poate lua ca definiie c dou evenimente sunt independente atunci cnd:
( ) ( ) ( ) B P A P B A P * =

Formula probabilitii cauzelor (Bayes)
Fie A
1
, A
2
,, A
n
o desfacere a lui E pe care, n contextul teoriei probabilitilor, o
numim sistem complet de evenimente. Ea reprezint n acelai timp o desfacere pentru E
ct i pentru orice eveniment E X .

j A E =
( )

X A X i =
Dat fiind c evenimentele X Ai sunt disjuncte, avem ( ) ( )

= X A P X P i .
S presupunem c ( ) 0 , i A P i . n aceste condiii avem urmtoarea teorem:

Curs 1 9
Teorema probabilitii cauzelor
Probabilitatea producerii oricrui eveniment X, este egal cu suma probabilitilor
de producere a lui X, condiionate de evenimentele complete ale sistemului ( ) n i i A , 1 = i
( )
( ) ( )
( ) ( )

=
X P A P
X P A P
A P
i
j
A i
A j
j X
Demonstraie:
Din definiie avem P
X
(A
j
) =
( )
( )
X P
A X P j

deci, P
X
(A
j
) =
( )
( )

i
i
j
X A P
A X P

=
( )
( )
( )
( )
( )
( )

i
i
i
i
j
j
j
A P
A P
X A P
A P
A P
A X P

=
( ) ( )
( ) ( )

X P A P
X P A P
I
j
A i
A j

P
X
(A
j
) poate fi interpretat ca fiind probabilitatea ca X s aib cauza A
j
. n acest
caz, formula calculeaz probabilitatea lui X n funcie de probabilitile cauzelor care ar fi
putut determina evenimentul X. Probabilitile P(A
k
) se numesc apriorice, pentru c ele
se cunosc nainte de eveniment. Probabilitile P
X
(A
j
) sunt probabilitile acelorai cauze,
dar dup ce s-a ntmplat evenimentul X, i se numesc din acest motiv, probabiliti
aposteriorice.
Exemplu, cnd un pacient intoxicat este adus la urgen el prezint anumite
simptome i medicul, folosind experiena sa, rezultatele determinrilor n snge i un
sistem computerizat elaboreaz o list cu probabilitile ca intoxicaia s se fi fcut cu o
anumit substan.
n fizica statistic parametrii termodinamici sau cuantici ai unui sistem rezult din
nsumarea unui numr foarte mare de evenimente. Probabilitatea de trecere de la o stare
iniial la o stare final este dat de suma probabilitilor de trecere pe anumite ci A
i

ponderate fiecare cu probabilitatea, sau altfel spus ponderea lor, p(A
i
). Deoarece numrul
cilor poate fi de puterea continuului, n locul sumelor apar integrale.
Sau, dac s-ar produce o crim, aposteriori, ne punem problema ierarhizrii
suspiciunilor privind potenialii criminali.
Problema nu este de loc teoretic dac suntem de exemplu o societate de
asigurri sau dac testul este un test de malignitate.
Curs 1 10
Bayer a fost un episcop care s-a preocupat de cauzele evenimentelor din lumea
aceasta i legtura lor cu cauza final Dumnezeu.
Formula probabilitii cauzelor ne arat cum se transform probabilitile
apriorice n probabiliti aposteriorice, dup apariia evenimentului X.
De exemplu, tiind c un medicament se absoarbe n, i se elimin din snge pe
mai mult ci, cu diferite probabiliti date de considerente fizico-chimice i fiziologice, n
funcie de rezultatul unor determinri a concentraiei ale acestora n sngele unui pacient,
ne putem pune problema stabilirii ponderilor efective ale acestor ci, n scopul
individualizrii tratamentului.
Observaie:
Putem deasemenea s considerm cazul particular al desfacerii evenimentului
total n dou evenimente A i complementul su CA.
Formula lui Bayes devine n acest caz:
P
X
(A) =
( ) ( )
( ) ( ) ( ) ( ) CA P X P A P X P
A P X P
CA A
A
+

Aplicaie:
Dac, de exemplu, P(B) este proporia (probabilitatea) unei boli n populaie i
cunoscnd proporia n care un test diagnostic este pozitiv la bolnavi P
B
(T) i la
sntoi P
NB
(T) putem calcula probabilitatea ca un pacient la care rezultatul testului
este pozitiv s fie bolnav:
P
+
(B)=
( ) ( )
( ) ( ) ( ) ( ) NB P T P B P T P
B P T P
NB B
B
+

unde:
P
B
(T) este probabilitatea ca un bolnav s fie catalogat pozitiv de ctre test i se
numete sensibilitatea testului.
P
NB
(T) este probabilitatea ca un sntos s fie catalogat negativ de ctre test i se
numete specificitatea testului.
Problema devine teribil de important dac, de exemplu, este vorba de un test de
depistare a cancerului.


Curs 1 11
VARIABILE ALEATOARE
Definiii:
a) Se numete variabil aleatoare (ntmpltoare sau statistic) o funcie real f
definit pe mulimea K a evenimentelor, cu proprietatea c, oricare ar fi numrul real a,
mulimea x K pentru care f(x) a este un eveniment din K.
n termeni de teoria msurii, o variabil aleatoare este o funcie f : (E, K, P) (R, B),
msurabil.
Practic vorbind avem definit probabilitatea ca variabila s aib valori mai mici dect
orice numr dat a.
b) O variabil aleatoare se numete variabil aleatoare simpl dac ia un numr finit
de valori: f : ER, f (E) finit i P( f (x) = x
i
) = P( f
-1
(x
i
) ) = p
i

c) Vom lucra, n cele ce urmeaz, ca regul, cu variabile aleatoare independente,
adic variabile ce iau valori independente una de cealalt:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
j i j i
y y g P x x f P y y g x x f P = = = = = * ,
j i
y x ,
Observaie:
Se poate verifica uor c variabilele aleatoare formeaz o algebr, adic suma, i
produsul a dou variabile aleatoare este tot o variabil aleatoare; mai mult compunerea a
dou variabile aleatoare este tot o variabil aleatoare.
Trebuie n acest context s fim ateni la independena sau nonindependena
variabilelor aleatoare implicate n operaie.
De exemplu putem citi X+X unde X este o variabil aleatoare n dou feluri. Putem,
de exemplu, s considerm un experiment repetat de dou ori rezultatele fiind
independente
|
|

\
|
=
|
|

\
|
+
|
|

\
|
4
1
2
1
4 3
4
1
2
2
1
2
1
2 1
2
1
2
1
2 1
,
n timp ce, dac considerm c X i X nu iau valori independent, atunci
X+X =2X =
|
|

\
|
2
1
2
1
4 2

Putem reprezenta grafic aceste probabiliti.
Curs 1 12
De exemplu, X=
|
|

\
|
4
1
2
1
3 2
4
1
1
apare sub forma
p
i

1/2
1/4
0 1 2 3 x
i
Dar putem reprezenta curba cumulativ a distribuiei
P(x<x
i
)
1
3/4
1/2
1/4
0 1 2 3 x
i

Definiie
Funcia de repartiie asociat lui f este funcia F(x), F:R [ ] 1 , 0 definit de
formula:
F(x) = P( f < x ) = P( f
-1
(- ,x) )
Importana acestei funcii const n faptul c, dac F(x) este dat se poate determina
probabilitatea ca f s ia valori ntr-un interval I R, oricare ar fi acel interval.
n cazul n care f ia un numr finit de valori, de exemplu { } 3 , 2 , 1 , cnd cunoatem
( ) 3 , 2 , 1 = k k f P , cunoatem practic i ( ) 3 , 2 , 1 = = k k f P .
ntr-adevr, ( ) ( ) 2 1 = = f P f P
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 2 1 * 3 2 * 3 2 3 2 = = = = f P f P f P f P f f P f P
( ) ( ) ( ) 2 1 1 3 = = = = f P f P f P
Ca regul general: ( ) ( ) ( ) k f P k f P k f P + = = 1 1
Deci am determinat o distribuie de probabilitate care poate fi reprezentat sub forma
unei matrici:
( )
|
|

\
|
= =
3 2 1
3 2 1
p p p
k f P
Curs 1 13
Proprieti
Funcia de repartiie are urmtoarele proprieti:
a) a b F(a) F(b)
b) a lim F(a) = 0
c) + a lim F(a) = 1
d) F este continu la stnga.
Dac F este continu spunem c f este variabil aleatoare continu. n acest caz,
probabilitatea ca f s ia orice valoare particular este 0.
, P( f(x) = ) = 0
Exemplu:
Dac ne punem problema probabilitii ca temperatura n camer s fie t =20,347562
aceasta ste evident zero i de fapt problema nici nu are sens n msura n care
temperatura este o valoare medie n jurul creia avem fluctuaii continue. Dac ne punem
problema ca temperatura s fie ntr-un anumit interval noiunea de funcie de repartiie
capt un coninut concret.
Definiie
Fie F(x) funcia de repartiie a unei variabile aleatoare . Dac exist o funcie (x),
integrabil pe intervalul ( ) + , , cu proprietatea c pentru orice xR este verificat
egalitatea:
(x) =
x
F


atunci, (x) se numete densitatea de repartiie sau densitatea de probabilitate a
variabilei aleatoare ,
n acest caz, probabilitatea ca variabila aleatoare s ia valori ntr-un interval
(- ,a) este dat de formula:
P((x) < a) = F(a) = ( )dt t
a



i respectiv:
P(b (x) < a) = F(a)-F(b) = ( )dt t
a


- ( )dt t
b


= ( )dt t
a
b




Curs 1 14
Definiie
Se numete valoare medie (sau speran matematic) a unei valori aleatoare f,
numrul
M(f) =

i ip x , atunci cnd este o variabil aleatoare simpl i, respectiv


M(f) = ( )dx x x

+

, atunci cnd este o variabil aleatoare continu, cu densitatea de
probabilitate .
n literatur, operatorul de medie se mai noteaz i cu E, de la expectation
speran n englez.
n cazul variabilelor simple se observ c valoarea medie a variabilei f este media
ponderat a valorilor sale x
i
, cu ponderile p
i
, care reprezint frecvenele de apariie ale
valorilor respective.
Proprieti ale mediei:
Dac f i g sunt independente, atunci avem:
a) M(af) = aM(f)
b) M(f+g) = M(f) + M(g)
c) M(fg) = M(f)M(g)
Vom schia o demonstraie a proprietii b):
M(f+g) = ( )( ) l k
l k
l k x x G F P +

,
= ( ) ( )

k
k
l
l k x G F P + ( ) ( )

l
l
k
l k x G F P
Dar, pe de alt parte, folosind proprietile interseciilor i reuniunilor de mulimi,
respectiv distributivitatea interseciei fa de reuniune i a interseciei fa de reuniune, i
faptul c

l
l G = E avem ( )

l
l k G F P = P(F
k ( )

l
l G
) = P(F
k
) i
similar, ( )

k
l k G F P = P(G
l
).
Deci,
M(f+g) = ( ) k
k
k x F P

+ ( ) l
l
l x G P

= M(f) + M(g)
Noiunea de medie se generalizeaz, definindu-se momentul de ordin k al unei
variabile aleatoare:
( )
k
k i i
M f x p =

, atunci cnd este o variabil aleatoare simpl


i respectiv,
Curs 1 15
M
k
(f) =

+

x
k
(x)dx , atunci cnd este o variabil aleatoare continu.
Se numete moment centrat de ordin k al variabilei aleatoare f momentul de
ordinul k al abaterii sale fa de medie.
( ) ( )
i
k
f i
c
k
p x f M

=
i respectiv, ( ) [ ] ( )dx x f M x
k
c
k

+

= ,n cazul unei variabile aleatoare continue.
Dispersia de selecie, sau varianta unui ir de rezultate numerice ale unui
experiment este media aritmetic a ptratelor abaterilor acestor valori fa de media lor
aritmetic X .
Dac x
1
, x
2
, , x
n
sunt cele n valori ale seriei, dispersia de selecie a acestora,
2
X
s este:
2
X
s =
( )
n
X x
i

2

Dup cum vom vedea mai departe la statistic, o formul mai util pentru
dispersia de selecie este:
2
X
s =
( )
1
2

n
X x
i

Dispersia de selectie este indicatorul principal al mprtierii datelor unui
experiment.
Dispersia unei variabile aleatoare este conceptul ce generalizeaz dispersia de
selecie.
Definiie
Dispersia variabilei aleatoare X de noteaz D(X) sau
2
i este, n particular,
momentul centrat de ordinul doi.
D(X) =
2
= M[(X-M(X))
2
] = ( ) ( ) ( )dx x X M x
2

+


i respectiv

2
= M[(X-M(X))
2
] = ( )
i X i
p x
2

, atunci cnd variabila aleatoare este discret.


Rdcina ptrat a dispersiei, , se numete abaterea medie ptratic a variabilei X,
iar s
x
abaterea standard.

Curs 1 16
Proprieti
a) Pentru orice variabil aleatoare X i orice constante a i b
D(aX+b) = a
2
D(X)
b) Dac X, Y sunt dou variabile aleatoare independente
D(X+Y) = D(X) + D(Y)
Demonstraie:
Pentru orice dou variabile aleatoare X i Y, cu mediile
X
i respectiv
Y
, avem
D(X+Y)=M(X+Y-
X
-
Y
)
2
=M(X-
X
)
2
+M(Y-
Y
)
2
+ 2 M[(X-
X
) (Y-
Y
)]=D(X)+D(Y)+
2 M[(X-
X
) (Y-
Y
)]
Dar, atunci cnd X i Y sunt independente M(XY) =
X

Y
,
M[(X-
X
) (Y-
Y
)] = M(XY-X
Y
-Y
X
+
X

Y
)=
X

Y-

X

Y-

X

Y+

X

Y
=0
M[(X-
X
) (Y-
Y
)] = 0
i deci D(X+Y) = D(X) + D(Y)
c) ntre dispersie, valoarea medie i momentul de ordinul doi exist relaia:
D(f) = M(f
2
) (M(f))
2

Demonstraie:
D(X) = ( )
i X i
p x
2

=
i i
p x

2
-2
i X i
p x

+
i X
p

2
= M(f
2
) - 2
2
X
+
2
X
=
= M(f
2
) (M(f))
2
Observaie
Dac numim M(f
2
) media ptratului si (M(f))
2
ptratul mediei formula capt
o formulare uor de reinut:Dispersia este egal cu media ptratului, minus ptratul
mediei.
Relaia se mai poate scrie sub forma
( )
2 2 2
X X
M X = + i am putea s-o numim
teorema lui Pitagora n probabilitate.
Exemplu
n modelul clasic al urnei cu bile pe care l-am prezentat mai sus, probabilitatea
evenimentului din n bile extrase, k sunt albe era
k n k k
n k
q p C p

= .
Media variabilei aleatore X care da numrul de bile albe din n bile extrase va fi,
prin definiie,
M(X) =
k n k k
n
q p kC


Curs 1 17
Pentru a calcula aceast sum considerm urmtoarea identitate
(pt + q)
n
=
k n k k k
n
q t p C

, pe care o derivm n raport cu t


((pt + q)
n
)

= (
k n k k k
n
q t p C


np(pt + q)
n-1
=
k n k k k
n
q kt p C

1
i apoi facem t = 1 np =

k n k k
n
kq p C
Am obinut, deci, M(X) = np
Folosind aceiai identitate, dar derivnd de dou ori se arat c: D(X) = npq
Cunoaterea mediei i dispersiei unei variabile aleatoare d o indicaie asupra
intervalului n care se afl valorile variabilei, cu cea mai mare probabilitate. Mai exact,
dup cum arat teorema urmtoare, cu ct ne ndeprtm mai mult de valoarea medie, cu
att valorile respective sunt mai puin probabile ca valori ale variabilei date.
Inegalitatea lui Cebev
Dac
2
este dispersia variabilei aleatoare X, probabilitatea ca modulul abaterii
sale de la valoarea medie s ia valori mai mari dect un numr > 0 este mai mic dect
2
2

.
( )
2
2

m x P
i

Demonstraie:
Pornim de la definiia dispersiei ( ) [ ] ( )
i i i
p m x m x M
2
2 2

= = i mprim
suma n doi termeni: unul corespunztor valorilor
i
x pentru care m x
i
i unul
corespunztor valorilor lui
i
x pentru care m x
i
< .
( )
i i
p m x
2
2

= = ( )
i
m x
i
p m x
i
2

+ ( )
i
m x
i
p m x
i
2


Dac neglijm primul termen al sumei i minorm m x
i
nlocuindu-l cu n al doilea
termen, se obine
( )
n
i
k k k
m x
i
p p p p + + + =


...
2 1
2 2 2

,
cu
n
k k k
p p p + + + ...
2 1
suma probabilitilor valorilor
i
k
x pentru care m x
i
k
.
Curs 1 18
Dar
n
k k k
p p p + + + ...
2 1
= ( ) m x P i deci am obinut
( )
2 2
P x m ceea ce
implic urmtoarea relaie: ( ) m x P
2
2

.
Deoarece suma ntre probabilitatea unui eveniment A i probabilitatea
evenimentului contrar CA este 1, avem P(CA) = 1-P(A) i inegalitatea se mai poate scrie
sub forma
( )
2
2
1

m x P
i

Exemplu:
Fie 3 = , atunci inegalitatea Cebev d: ( ) 88 . 0
9
8
9
1
1 3 = = = m x P
i

Exprimat n cuvinte, aceast inegalitate aparent banal, spune din punct de vedere
fenomenologic, enorm de mult:
Probabilitatea ca orice variabil aleatoare s ia valori mai ndeprtate de
valoarea sa medie dect de trei valori standard, este mai mic dect 0,12.
Vom vedea mai departe c, n cazul n care variabila aleatoare are suplimentar
unele proprieti de regularitate, aceast probabilitate este chiar mult mai mic.
Aceiai inegalitate ne permite nelegerea legturii ntre frecvena i probabilitate,
legtura care exprim nsi fundamentarea statisticii pe teoria probabilitilor.
S considerm variabila aleatoare care d numrul de bile albe ntr-o extracie de
n bile din urn. Pentru aceast variabil avem urmtoarea teorem, care se generalizeaz
n teoria probabilitilor n forme care depesc ns cadrul acestei lucrri.
Teorema lui Bernoulli:
Dac se noteaz cu p probabilitatea ca un eveniment A (de exemplu apariia bilei
albe) s se realizeze ntr-un experiment i
n
k
f
n
= este frecvena cu care se realizeaz
evenimentul A n n experimente identice consecutive, irul (f
n
) converge ctre p n
probabilitate. Altfel spus:
Frecvena tinde n probabilitate la probabilitatea teoretic.
Demonstraie:
Curs 1 19
( ) ( ) ( ) n k M k P n np k P p
n
k
P
n n n
= =
|
|

\
|


lim lim lim
Dar, aplicnd inegalitatea lui Cebev: ( ) ( )
2 2
2

n
n k M k P i deci
0 lim lim
2 2
2
=
|
|

\
|

n
p
n
k
P
n n

Teorema lui Bernoulli afirm numai c inegalitatea p f
n
nu are ansa s
fie realizat sau c inegalitatea p f
n
are anse mari s fie ndeplinit dac n este
suficient de mare.
DISTRIBUII DE PROBABILITATE
Distribuia normal
Spunem c o variabil aleatoare este normal repartizat ( ) , m N , atunci cnd
densitatea sa de probabilitate este data de formula:
( )
( )
2
2
2
2
1
, ,



m x
e m x

=
O prim condiie ca ( ) x s fie distribuie de probabilitate este aceea c
( ) ( ) ( ) 1 = + =

+

t f P dx x
Pentru a verifica aceast condiie, plecm de la un rezultat care s-a obinut la
cursul de matematic folosind integrala dubl, i anume :
2
2
2
=

dx e
x

n cazul nostru, dac facem schimbarea de variabil

m x
u

= avem
( )
( )
1
2
1
2
1
2 2
2
2
2
= = =

+

+

+

du e dx e dx x
u m x



Vom arta n continuare c o variabil aleatoare normal repartizat are media m i
dispersia
2
.
S calculm mai nti media:
Curs 1 20
[ ]
( )
( )
( )
2 2
2 2
2 2
1 1
2 2
x m x m
M X xe dx x m m e dx



+ +

= = + =

( )
2
2
1
*
2
2
1 1
0
2 2
x m
u
x m
e dx m ue du m m m


| |

+ + |
\

= + = + = + =


Integrala este nul deoarece funcia de integrat este impar.
Pentru calculul dispersiei ne folosim de identitatea:
( ) ( ) ( ) ( )
2 2
2
D X M X M X M X M X = = ( (


( )
( )
( ) = + = =
+

+


du e u m dx e x X M
u m x


2
2
2
2 2
2
2
2
2
1
2
1

=
|
|

\
|
+ + =

+


du e u e u m e m
u u u
2
2 2
2 2
2
2 2 2
2
2
1


2
2 2 2
2
1
2
2
u
m u e du

| |
= + |
|
\


Calculm separat integrala rmas i obinem:
2 2 2 2
2
2 2 2 2
1* 2
u u u u
u e du u ue du ue e du
+

+ + +

| | | |
= = = | |
| |
\ \


unde am integrat prin pri, lund = u i =

2
2
u
ue
Deci am obinut ( ) ( )

2 2
2
1
2 2 2
+ = m X M i nlocuind n expresia lui
( ) X D obinem:
( ) ( )
2 2 2 2
2 2
2
1

= + = m m X D
Pornind de la proprietile operatorilor de medie i dispersie
( ) ( ) m X M m X M =
( ) ( ) X D m X D = i
( ) X D
a a
X
D
2
1
= |

\
|

Curs 1 21
se obine c, dac o variabil aleatoare este normal repartizat ( ) , m N , variabila
aleatoare redus

m X
este repartizat ( ) 1 , 0 N , deci cu distribuia de probabilitate
( )
2
2
x
e x

=
Funcia de repartiie asociat este funcia ( ) dx e t
t
x

=
2
2
numit funcia lui
Laplace i ale crei valori se gsesc n tabelele din practic toate crile de statistic i
probabiliti.
Distribuie binomial
Distribuia binomial apare, aa cum s-a artat mai sus, la descrierea
evenimentelor asociate extraciilor dintr-o urn cu bile albe i bile negre.
Distribuia variabilei aleatoare numrul de bile albe din n bile extrase se poate
reprezenta i sub form matricial:
|
|

\
|
=
0 1 1 1 0 0
... ...
1 0
q p C
n
q p C
k
q p C q p C
X
n k
n
k n k k
n
n
n
n
n

Dup cum am artat media i dispersia unei variabile aleatoare repartizate
binomial sunt np M = si npq D =
Repartiia binomial apare ntotdeauna atunci cnd un experiment cu numai dou
rspunsuri posibile se repet de n ori. Un caz particular l prezint experimentele care se
repet de un numr foarte mare de ori, iar evenimentul n a crui apariie suntem
interesai are o probabilitate foarte mic, categorisit uzual ca eveniment rar.
La limit, cnd n , 0 p , dar np rmne constant, = np , se obine
distribuia Poisson.
Distribuia POISSON
Considerm deci c = np i trecem la limit dup n

( ) ( )
= |

\
|

+
=


k n
k
k
n
k n k k
n n
n n k
k n n n
q p C

1
!
1 ... 1
lim lim
( ) ( ) 1 ... 1
1
*lim lim 1
!
n k
k
n n k
n n n k
k n n


+
| |
=
|
\

Curs 1 22
dar
( ) ( )
1
1 ... 1
lim =
+

k
n
n
k n n n
i
( )


=
(
(

\
|
= |

\
|
e
n n
n
k n
n
n
k n
n
1 lim 1 lim
i deci,



= e
k
q p C
k
k n k k
n n
!
lim
Deci, distribuia Poisson este dat de matricea

|
|

\
|
=


e
n
n
e
k
k
e e
X
n k
!
...
!
...
! 1
1 0

Calculnd, dup definiie, media i dispersia unei variabile aleatoare distribuite
Poisson i innd cont c

e
k
k
k
=

0
!
,

e
k
k
k
k
=

0
!
, ( )

e
k
k k
k
k
2
2
!
1 =

e
k
k
k
k
=

1
!

se obine
( )
( ) ( )

= =

= =

1
1
1 0
! 1 ! 1 !
k
k
k
k
k
k
e e
k
e
k
e
k
e
k X M

( )
( )
( ) [ ] ( )
( )





= + =
=
(

+ =
|
|

\
|
+ =
=
|
|

\
|
+ =



2 2
2
2 1 1
2
0 0 0
2
2
0
2
! !
1
!
1
! !
2
! !
e e e
k
k
k
k k e e
k
k k k e
k k
k
k
k
e
k
k
e X D
k k
k k
k
k
k k k
k k k
k
k

Exemplu:
Numrul evenimentelor adverse la un medicament dat este repartizat Poisson.
Cel mai mult este utilizat distribuia Poisson n fizica statistic.
Aproximarea normal a distribuiei binomiale
Ca o regul general, dac np i nq sunt mai mari sau egale cu 5, poate fi folosit
aproximarea normal. Pentru distribuiile binomiale n care p<0,5 aproximarea este bun
Curs 1 23
pentru valori ale lui np i nq mai mici dect 5. n aceste condiii,
n
pq
p
n
k
npq
np k

=

este
aproximativ normal distribuit cu media 0 i deviaia standard 1.
Aceast transformare nlesnete de obicei calculul probabilitilor binomiale.

Repartitia
2
Helmert - Pearson
Se consider n observaii independente x
1
, x
2
, , x
n
(variabile aleatoare
independente) normal distribuite ( )
2
, N .

Variabilele standard


=
i
i
x
u , n i , 1 = sunt de asemenea independente, iar
suma ptratelor lor va avea o distributie ce poate fi determinat.
Se definete

=
n
i
u X
1
2
.
Distribuia variabilei X rezultate se noteaz
2
(n) i este diferit pentru fiecare
valoare a lui n, iar parametru n se definete ca numrul de gradelor de libertate.
Vom determina n continuare parametrii (media i dispersia) unei variabile
distribuite
2
.
Pentru a afla media distributiei
2
este necesar aflarea lui [ ]
2
i
u M .
Deoarece [ ] 0 =
i
u M , [ ] [ ] ( ) [ ] [ ] 1
2 2
= = =
i i i i
u D u M u M u M
Ca urmare M[
2
(n)] = [ ] [ ] n n u M u M
n
i
n
i
= = =

1 *
1
2
1
2

Dispersia va fi:
D[
2
(n)]
= [ ] [ ] [ ] ( ) ( ) ( ) [ ] ( ) [ ] 1
4
2
2 4 2
1
2
1
2
= = = =
i i i i
n
i
n
i
u M n u M u M n u nD u D u D
Pentru a obine [ ]
4
i
u M se folosete regula integrrii prin pri:
( ) ( ) ( ) ( ) ( ) ( )dx x g x f x g x f dx x g x f

=
n acest caz se va identific:
( ) ( )
( ) ( )
2 2
2 3
2 2
3
u u
ue x g e x g
u x f u x f

= =
= =
, deci se va obine:
Curs 1 24
( )
2 2 2
2 2
4 4 4 3 3
2 2 2
2 2 2
2 2
1 1 1
2 2 2
1 1
3 3 3 3
2 2
u u u
i
u u
M u u u du u e du u ue du u e
u e du u e du M u



+
+ + +

+ +

| |
( = = = = |

|
\
| |
( = = = |

|
\



Atunci,
[ ] [ ] [ ] ( ) ( ) 2 1 3
2 2 4 2
= = =
i i i
u M u M u D
i substituind n relaia de mai sus se va obine
D[
2
(n)] = [ ] n u nD
i
2
2
=
Deci variabila
2 2
2
2
1
2
...
n
x x x x + + + = este repartizat
2
(n), cu n grade de libertate,
avnd media E(
2
) = n, respectiv dispersia D(
2
) = 2n.
Se poate arta c densitatea de probabilitate este dat de funcia
f(
2
) = ( )
1
2
2
2
2
2
2
2
1

\
|

n
n
e
n

,
unde este funcia Euler de spea I-a studiat la cursul de matematic
anume : ( )
1
0
t
e t dt

+

=

.
Repartitia
2
se folosete foarte mult n statistica matematic n verificarea
ipotezelor asupra egalitii dispersiilor.

Repatiia STUDENT
Analog cu distribuia
2
, repartiia t a fost propus de Student (pseudonimul lui
W.S.Gosset, chimist statistician englez), pentru statistica seleciilor mici i exprim
deviaiile mediilor de selecie x , fa de media ntregii populaii , msurate n
n
s

(abaterea standard a mediilor de selecie).
Dac sunt date dou variabile aleatoare ( ) 1 , 0 N Z si ( ) n V
2
independente, se
spune c variabila ( ) n t
n
V
Z
t = este repartizat Student cu n grade de libertate.
Curs 1 25
Mrimea t nu depinde dect de numrul gradelor de libertate.
Distribuia de probabilitate a unei variabile aleatoare repartizate Student tinde
pentru n , la distribuia normal ( )
2
2
2
1
t
e t


Densitatea de probabilitate este dat de funcia:
( )
1
2
2
1
1 2
* * 1
2
n
n
x
f x
n n n
+

+ | |

|
| |
\
= +
|
| |
\

|
\
unde x R i n N .
Repartiia F (Behrens - Fisher Snedecor) sau distribuia raportului a dou
dispersii
Se consider frecvent n statistic raportul a dou dispersii care estimeaz aceeai
dispersie general a unei colectiviti. Dintr-o colectivitate general se extrag dou
selecii ( )
1
2
n U , ( )
2
2
n V . Raportul lor este o variabil aleatoare repartizat F
( )
2 1
2
1
, n n F
n
V
n
U
F =
Examinnd acest raport se observ c el nu conine dispersia colectivitii
generale
2
, de unde rezult c distribuia acestui raport nu depinde dect de numrul
gradelor de libertate n
1
si n
2
ale celor dou dispersii.
Densitatea de probabilitate este dat de funcia:
( )
1 1 2
1
2
1 2
2 2 1
1 1
1 2 2 2
2
* * * 1 *
*
2 2
n n n
n
n
n n
n n
f x x x
n n n n
+

+ | |

|
| | | |
\
= +
| |
| | | |
\ \

| |
\ \
, cnd 0 x .



1
Andrei Nicolaevici Kolmogorov (1903-1987), fost profesor la Universitatea din Moscova, a avut
contribuii deosebite n analiza matematic, analiza funcional i teoria probabilitilor. Cartea sa
Grundbegriffe der Wahrscheinlichketetsrechnung, Berlin, 1933, a nsemnat o revoluie n teoria
probabilitilor, artnd c, formal, aceast teorie se poate trata ca un caz particular de teorie a
integralei (sau teoria msurii).