Documente Academic
Documente Profesional
Documente Cultură
statistic
CUPRINS
Introducere...........................................................................................................7
3
Capitolul 5. Convergena variabilelor aleatoare............................................131
5.1. Convergena aproape sigur i convergena n probabilitate..........131
5.2. Legi ale numerelor mari i aplicaii ...............................................137
5.2.1. Legea slab............................................................................137
5.2.2. Legea tare..............................................................................138
5.3. Convergena n repartiie................................................................148
5.4. Teorema limit central ................................................................155
4
11.10. nc un exemplu.........................................................................242
11.11. Testarea irurilor binare.............................................................243
11.12. Testarea statistic a irurilor binare...........................................243
11.13. Noiunea de P-valoare................................................................245
11.14. Un exemplu: statistic repartizat normal..................................247
11.15. Alt exemplu: statistic repartizat 2.........................................249
Bibliografie........................................................................................................295
Anexe.................................................................................................................297
5
Introducere
10
Capitolul 1
Teoria probabilitilor
1.1.1. Evenimente
Definiia 1.1.2. Prin eveniment vom nelege orice rezultat al unei experiene
despre care putem spune c s-a realizat sau c nu s-a realizat, dup efectuarea
experimentului considerat. Evenimentele se pot clasifica n: evenimente sigure;
evenimente imposibile, evenimente aleatoare.
11
Observaia 1.1.9. O analogie ntre evenimente i mulimi permite o scriere i n
general o exprimare mai comode ale unor idei i rezultate legate de conceptul de
eveniment. Astfel, vom nelege evenimentul sigur ca mulime a tuturor
evenimentelor elementare, adic: 1 , 2 ,..., n i orice eveniment compus
ca o submulime a lui . De asemenea, putem vorbi despre mulimea tuturor
prilor lui pe care o notm prin P( ), astfel c pentru un eveniment compus
A putem scrie, n contextul analogiei dintre evenimente i mulimi, c A
sau A P() .
Exemplul 1.1.10. Fie un zar, care are cele ase fee marcate prin puncte de la 1
la 6. Se arunc zarul pe o suprafa plan neted. Dac notm cu i =
evenimentul "apariia feei cu i puncte", i 1,6 , atunci spaiul evenimentelor
elementare ataat experimentului cu un zar este dat prin ={ 1 , 2 , 3 ,
4 , 5 , 6 }.
Evenimentul sigur este "apariia feei cu un numr de puncte 6".
Evenimentul imposibil este "apariia feei cu 7 puncte".
12
3. Dac A, B K i A BAB B (evident A ,
A A , i A A ).
13
Definiia 1.2.12. Evenimentele A i B sunt dependente dac realizarea unuia
depinde de realizarea celuilalt i sunt independente dac realizarea unuia nu
depinde de realizarea celuilalt.
O mulime de evenimente sunt independente n totalitatea lor dac sunt
independente cte dou, cte trei etc.
Pentru evenimentele independente n totalitatea lor vom folosi i
denumirea de evenimente independente.
Observaia 1.3.2.
1. ntr-un cmp finit de evenimente ( , K) sunt adevrate afirmaiile:
a. A, B K A B K
b. Evident K i K .
c. Dac A, B K atunci A B K .
2. Dac mulimea evenimentelor elementare este numrabil, o mulime
K P() se numete corp borelian (sau -corp, sau -algebr) pe , n
condiiile:
i) A K A K ,
ii) dac I N, I i Ai K, i I , atunci Ai K ,
iI
iii) K .
Perechea ( , K) n care K este un -corp se numete cmp borelian
(cmp infinit) de evenimente.
ii) A i A j i j, i, j 1, n
14
Observaia 1.3.4. Evenimentele elementare i , i 1, n , corespunztoare unei
probe formeaz un sistem complet de evenimente care se mai numete sistem
complet elementar.
Demonstraie
Pentru un experiment de n rezultate elementare i prin urmare pentru un
eveniment sigur compus din n evenimente elementare, vom avea diverse
evenimente compuse din acestea dup cum urmeaz:
evenimente compuse din cte zero evenimente elementare Cn0
evenimente compuse din cte un eveniment elementar Cn1
evenimente compuse din cte dou evenimente elementare Cn2
----------------
evenimente compuse din cte k evenimente elementare Cnk
evenimente compuse din cte n evenimente elementare Cnn
i prin urmare, numrul total de evenimente ale lui K este egal cu
C n0 C n1 ... C nk ... C nn 2 n
15
iii) P A i PA i dac Ai A j i j, i, j I, A i K ,
iI iI
I-o mulime de indici cel mult numrabil.
Demonstraie
1) Din relaiile = i = aplicnd axioma iii) din
definiia probabilitii avem P( ) = P( ) = P() + P( ) i rezult P() =
0
2) Din relaiile A A i A A aplicnd axioma iii) din
definiia probabilitii avem P ( A A) P ( A) P ( A) adic
P () P ( A) P ( A) i rezult P ( A) 1 P ( A)
3) Demonstrm prin inducie matematic
n1
dac s-a folosit ipoteza de inducie i s-a inut seama c Ai An .
i 1
Observaia 1.4.6.
1) Conform acestei definiii nu putem stabili probabilitatea unui
eveniment ce aparine unui cmp infinit de evenimente.
2) Definiia clasic se aplic numai atunci cnd evenimentele
elementare sunt egal posibile.
16
Exemplul 1.4.7. Considerm experiena de aruncare a unui zar. Evenimentele
elementare sunt egal posibile i avem 6 cazuri posibile. Notm cu A evenimentul
"apariia unei fee cu numr par de puncte 6 " numrul cazurilor favorabile
3 1
evenimentului A este 3. Deci P(A ) .
6 2
Rezolvare
n aceast experien aleatoare numrul total al cazurilor posibile este
15.
Pentru A numrul cazurilor favorabile este 6, adic {2, 3, 5, 7, 11, 13},
6 2
deci P(A ) .
15 5
Pentru B numrul cazurilor favorabile este 7, adic {2, 4, 6, 8, 10, 12,
7
14}, deci P(B) .
15
Pentru C, numrul cazurilor favorabile este 5, adic { 3, 6, 9, 12, 15},
5 1
deci P(C) .
15 3
Demonstraie
Din relaiile B = A (B - A) i A (B - A) = aplicnd axioma iii)
avem P( B) P A ( B A) P( A) P( B A)
P2) Probabilitatea reunirii (formula lui Poincar):
Dac A, B K atunci P( A B) P( A) P( B) P( A B) .
Demonstraie
Din relaiile A B A B ( A B) i A B ( A B)
aplicnd axioma iii) avem
P( A B) P( A) PB ( A B) P( A) P( B) P( A B)
17
dac s-a folosit P1.
Generalizare:
Dac A1,A2,An sunt evenimente compatibile atunci
n n n n
P Ai P( Ai ) P ( Ai A j ) P ( Ai A j Ak ) ... ( 1) n 1 P Ai
i 1 i 1 i , j 1 i j k i 1
i j
P(A B)
P3) Probabiliti condiionate: Dac P(B) 0 atunci raportul l
P(B)
numim probabilitatea lui A condiionat de B i notm PB(A) sau P(A B) .
Demonstraie
Artm c PB ( A) satisface axiomele probabilitii:
i) PB ( A) 0 deoarece P( A B) 0 i P( B) 0
P( B E ) P( B)
ii) PB ( E ) 1
P( B) P( B)
iii) Fie A1 i A2 K i A1 A2 . Avem
PB ( A1 A2 ) P( B A1 ) ( B A2 )
PB ( A1 A2 )
P( B) P( B )
,
P( B A1 ) P( B A2 ) P( B A1 ) P( B A2 )
PB ( A1 ) PB ( A2 )
P( B) P( B) P( B)
dac ( B A1 ) ( B A2 ) .
Observaia 1.5.1.
1) Oricrui cmp de evenimente ( ,K) i putem ataa un cmp de
probabilitate condiionat { , K, PB}.
2) P(A B) P(B) PB (A) - formula de calcul a interseciei a dou
evenimente dependente. Are loc o generalizare: dac A1, A2, An sunt
evenimente dependente atunci
n
P A i P(A 1 ) PA1 (A 2 ) PA1 A 2 (A 3 )....Pn 1 (A n ).
i 1 Ai
i 1
Generalizare:
Dac A1, A2, An sunt evenimente independente atunci
n
n
P A i P(A i ) .
i 1 i 1
18
4) Dac evenimentele A i B se condiioneaz reciproc i
P(A) 0, P(B) 0 atunci P(A ) PA (B) P(B) PB (A) .
Demonstraie
n n
Folosind relaiile lui De Morgan Ai Ai i faptul c Ai sunt
i 1 i 1
evenimente independente implic
n n n n n
P Ai 1 P Ai 1 P Ai 1 P( Ai ) 1 1 P( Ai )
i 1 i 1 i 1
i 1 i 1
P5) Inegalitatea lui Boole: A1, A2, An, sunt evenimente dependente atunci
n n n
P Ai P( Ai ) (n 1) 1 P( Ai )
i 1 i 1 i 1
Demonstraie
Verificm inegalitatea din enun prin inducie matematic.
Pentru n = 2 avem P( A1 A2 ) P( A1 ) P( A2 ) P( A1 A2 ) dac
P( A1 A2 ) 1 i rezult P( A1 A2 ) P( A1 ) P( A2 ) 1 relaia este adevrat.
Presupunem inegalitatea adevrat pentru n-1 adic
n 1 n1
P Ai P( Ai ) (n 2) i demonstrm pentru n.
i 1 i 1
Avem succesiv
n n1 n1
P Ai P Ai An P Ai P( An ) 1
i 1 i 1 i 1
n 1 n
P( Ai ) (n 2) P( An ) 1 P( Ai ) (n 1)
i 1 i 1
dac s-a inut seama de ipoteza de inducie.
19
Demonstraie
Din ipoteza c Ai, i 1, n este un sistem complet de evenimente rezult
c X ( A1 X ) ( A2 X ) ... ( An X )
Deoarece Ai A j , i j , i, j 1, n avem c
( X Ai ) ( X A j ) , i j, i, j 1, n
Avem succesiv
n n n
P( X ) P ( Ai X ) P( Ai X ) P( Ai ) PAi ( X )
i 1 i 1 i 1
P7) Formula lui Bayes: Dac A1, A2, An este un sistem complet de evenimente
al cmpului ( , K) i X K atunci:
P(A i ) PA i (X)
PX(Ai)= n , i 1, n
P(A i ) PAi (X)
i 1
Demonstraie
Deoarece P( X Ai ) P( X ) PX ( Ai ) i
P ( X Ai ) P ( Ai ) PAi ( X ) avem P ( X ) PX ( Ai ) P ( Ai ) PAi ( X ) , deci
P( Ai ) PAi ( X ) P( Ai ) PAi ( X )
PX ( Ai ) n
dac s-a folosit formula
P( X )
P( A ) P
i 1
i Ai (X )
probabilitii totale.
Rezolvare
Notm prin X evenimentul cutat, deci de a obine prin extrageri
succesive cuvntul LUCIA, de asemenea notm prin A1 = evenimentul ca la
prima extragere s obinem litera L; A2 = evenimentul ca la a doua extragere s
obinem litera U; A3 = evenimentul ca la a treia extragere s obinem litera C; A4
= evenimentul ca la a patra extragere s obinem litera I; A5 = evenimentul ca la a
cincea extragere s obinem litera A.
Atunci evenimentul X are loc dac avem
X A1 A 2 A 3 A 4 A 5 .
Rezult:
20
P( X ) P( A1 ) P( A2 A1 ) P( A3 A1 A2 ) P( A4 A1 A2 A3 )
1 1 1 1 1
P( A5 A1 A2 A3 A4 ) .
26 25 24 23 22
Rezolvare
Dac notm prin A1 i A2 evenimentele ca primul respectiv, al doilea
automobil s plece n curs i prin X evenimentul cutat, deci ca cel puin unul
dintre automobile s plece n curs, avem: X A 1 A 2 , iar
P(X ) P(A1 A 2 ) P(A 1 ) P(A 2 ) P( A1 A 2 ), deoarece evenimentele A 1
i A 2 sunt compatibile (cele dou automobile pot s plece n curs deodat).
Cum P( A 1 ) = P( A 2 ) = 0,6, iar evenimentele A 1 i A 2 sunt independente ntre
ele (plecarea unui automobil nu depinde de plecarea sau neplecarea celuilalt),
deci P( A1 A 2 ) = P( A1 )P(A 2 ) = (0,6) 2 . Se obine c P(X) = 0,6 + 0,6 - (0,6) 2
= 0,84.
Rezolvare
Fie A i evenimentul ca secia Si s depeasc planul de producie.
Avem: A = A1 A 2 A 3 , deci
P(A) = P (A 1 A 2 A 3 ) 1 P( A1 A 2 A 3 ) = 1 P(A 1 ) P(A 2 ) P(A 3 ) =
1- (1-0,7)(1-0,8)(1-0,6) = 1 0,3 0,2 0,4 0,976 .
B = A1 A 2 A 3 i innd seama de independena evenimentelor, avem:
P(B) = P(A 1 A 2 A 3 ) P(A 1 ) P(A 2 ) P(A 3 ) 0,7 0,8 0,6 0,336 .
21
P( A B C) 1 P(A) P(B) P( C ) , adic
1 4 1 229
P( A B C) 1 .
10 11 12 660
Rezolvare
a) Notm cu A1 , A 2 i A 3 evenimentele ca produsul cumprat s fie de
la prima, a doua, respectiv a treia fabric. Aceste trei evenimente formeaz un
1 1
sistem complet de evenimente i au probabilitile P( A1 ) , P(A 2 ) i
3 6
1
P( A3 ) . Dac A este evenimentul c produsul cumprat de client satisface
2
standardele de fabricaie, atunci P(A A1 ) 0,90, P( A A 2 ) 0,95 i
P( A A 3 ) 0,92 . Folosind formula probabilitii totale se obine:
P( A) P( A1 ) P( A A1 ) P( A2 ) P( A A2 ) P( A3 ) P( A A3 )
1 1 1 5,51
0,90 0,95 0,92 0,918
9 6 2 6
b) Folosind formula lui Bayes, avem:
P(A 1 )P( A A 1 )
P( A1 A)
P ( A1 ) P ( A A 1 ) P ( A 2 ) P ( A A 2 ) P ( A 3 ) P ( A A 3 )
1
0,10
3 0, 2
= 0,408.
1 1 1 0,49
0,10 0,05 0,08
3 6 2
22
b) primete cel mult o burs;
c) primete cel puin o burs;
d) primete cel puin dou burse.
Rezolvare
a) Bursa primit poate fi de la prima universitate, caz n care celelalte
nu-i acord burs, sau de la a doua, caz n care prima i a treia nu-i acord burs,
sau de la a treia, caz n care primele dou nu-i acord burs. Avem astfel
evenimentul
A (U1 U 2 U 3 ) (U1 U 2 U 3 ) (U1 U 2 U 3 ) .
b) Avem dou variante : studentul nu primete nici o burs sau studentul
primete o burs. Obinem evenimentul
B (U1 U 2 U 3 ) A .
c) Evenimentul poate fi scris ca reuniunea a trei evenimente : studentul
primete o burs, dou burse, trei burse. Astfel C A E F , unde
E (U 1 U 2 U 3 ) (U 1 U 2 U 3 ) (U 1 U 2 U 3 ) ,
iar F U 1 U 2 U 3 .
d) Avem D E F . Altfel, evenimentul D este contrar evenimentului
B, deci D B (U 1 U 2 U 3 ) A .
Rezolvare
Notm cu A1 i A2 evenimentele alegerii unui biat la prima, respectiv a
doua alegere. La primul punct avem de calculat probabilitatea P( A1 A2 ) .
ntruct a doua alegere depinde de prima avem :
9 8 12
P( A1 A2 ) P( A1 ) P( A2 A1 ) ,
15 14 35
deoarece alegnd un biat mai rmn n grup 14 studeni ntre care 8 biei.
Evenimentul de la punctul b) se scrie astfel : B A1 A2 . Deci
6 5 1
P( B) P( A1 A2 ) P( A1 ) P( A2 A1 ) .
15 14 7
23
Evenimentul de la punctul c) este C ( A1 A2 ) ( A2 A1 ) aadar
P (C ) P ( A1 A2 ) P ( A2 A1 ) , ( A1 A2 , A2 A1 sunt incompatibile)
9 6
Dar P( A1 A2 ) P( A1 ) P( A2 / A1 ) ,
15 14
6 9
iar P( A2 A1 ) P( A1 ) P( A2 / A1 )
15 14
9 6 18
de unde P(C ) 2 .
15 14 35
Am obinut i probabilitatea evenimentului de la punctul e) P ( A1 A2 ) .
Evenimentul de la punctul d) se exprim astfel : D A1 A2 .
El este contrar evenimentului : B A1 A2 , prin urmare
1 6
P( D) 1 P( B) 1 . Evenimentul de la ultimul punct f) este
7 7
F ( A1 A2 ) ( A1 A2 ) . Cum ( A1 A2 ) ( A1 A2 ) cele dou
evenimente sunt incompatibile i deci
12 1 17
P( F ) P( A1 A2 ) P( A1 A2 ) .
35 7 35
Rezolvare
Fie Ai evenimentul promovrii examenului de ctre studentul i, i=1,2,3.
Evenimentul de la punctul a) este A A1 A2 A3 , iar de la punctul b) este
B A1 A2 A3 . Evenimentele Ai sunt independente (rezultatele celor 3
studeni nedepinznd unul de celelalte), deci
3 4 5 1
P( A) P( A1 ) P( A2 ) P( A3 ) .
4 5 6 2
P( B) P( A1 A2 A3 ) P( A1 A2 ) P( A3 ) P(( A1 A2 ) A3 )
P( A1 ) P( A2 ) P( A1 A2 ) P( A3 ) P(( A1 A3 ) ( A2 A3 ))
24
P( A1 ) P( A2 ) P( A1 A2 ) P( A3 ) [ P( A1 A3 ) P( A2 A3 )
P(( A1 A3 ) ( A2 A3 )) P( A1 ) P( A2 ) P( A3 )
P( A1 A2 ) P( A1 A3 ) P( A2 A3 ) P( A1 A2 A3 ).
P ( B ) P ( A1 ) P ( A2 ) P ( A3 ) P ( A1 ) P ( A2 ) P ( A1 ) P ( A3 ) P ( A2 ) P ( A3 )
3 4 5 3 4 3 5 4 5 3 4 5 119
P ( A1 ) P ( A2 ) P ( A3 ) .
4 5 6 4 5 4 6 5 6 4 5 6 120
Exemplul 1.5.10. Din mai multe controale asupra activitilor a trei magazine
se apreciaz c n proporie de 90%, 80%, 70%, cele trei magazine au declarat
marfa vndut. La un nou control, comisia de control solicit 50 de documente
privind activitatea comercial: 20 de la primul magazin, 15 de la al doilea, 15
de la al treilea. Dintre acestea se alege unul la ntmplare pentru a fi verificat:
a) Cu ce probabilitate documentul ales este corect (nregistrat)?
b) Constatnd c este corect, cu ce probabilitate el aparine primului
magazin?
Rezolvare
a) Notm cu A1, A2, A3 evenimentul ca documentul controlat s provin
de la primul, al doilea i respectiv al treilea magazin. Avem astfel
20 15 15
P( A1 ) ; P( A2 ) ; P( A3 ) .
50 50 50
A1 A2 A3 E , A1 A2 A1 A3 A2 A3
P ( A) P ( A1 ) P ( A / A1 ) P ( A2 ) P( A / A2 ) P ( A3 ) P( A / A3 )
20 15 15
0,90 0,80 0,70 0,81.
50 50 50
25
20
0,90
P( A1 ) P( A / A1 ) 0,36 4
P( A1 / A) 3 50 .
0,81 0,81 9
P( Ai ) P( A / Ai )
i 1
(A1/A reprezint evenimentul ca documentul controlat s provin de la
primul magazin tiind c a fost corect).
26
Capitolul 2
Variabile aleatoare
Observaia 2.1.2.
1) Dac K = P() atunci ii) este automat ndeplinit;
2) O variabil aleatoare de tip discret este deci o funcie univoc de
forma
X : {x1, x2, xn, } R;
3) Se obinuiete ca valorile variabilei s se noteze n ordine
cresctoare adic x 1 x 2 x 3 ... x n .... , xi R, i = 1, 2,
4) Evenimentele Ai = X-1(xi) = { / X() = xi } K, oricare ar fi i
= 1, 2, 3, ,
X-1 : {x1, x2, xn, } K este inversa funciei X.
Observaia 2.1.4.
1) Evenimentele (X = xi ), i I formeaz un sistem complet de
evenimente i pi 1 .
iI
2) Variabila aleatoare pentru care mulimea valorilor este un interval
finit sau infinit pe axa numerelor reale este variabil aleatoare continu.
3) Forma cea mai general a unei variabile aleatoare aparinnd unei
clase de variabile aleatoare de tip discret se numete lege de probabilitate
discret.
28
Definiia 2.1.6. Fie variabilele aleatoare X, Y care au respectiv distribuiile
xi yj
X i Y atunci variabila aleatoare sum X+Y, produs X Y i ct
p
iI
i q
jJ
j
X xi y j
(dac y j 0, j J ) vor avea distribuiile X Y ,
Y p
ij ( i , j )IxJ
xiy j
X Y xi
p X
ij (i , j)IxJ , respectiv yj unde pij = P(X = xi, Y = yj)
Y
pij ( i , j )IxJ
(i,j) IxJ.
29
P(a X b) F (b) P X b F (a ) P X a
P(a X b) F (b) F (a ) P( X b)
P(a X b) F (b) F (a )
P(a X b) F (b) F (a ) P X a
Demonstraie
Avem succesiv
P (a X b) P ( X b, X a ) P( X b) ( X a)
P ( X b) P ( X a ) F (b) P X b F (a ) P X a
dac s-a inut seama de relaia ( X a ) ( X b) i s-a folosit probabilitatea
diferenei.
P ( a X b) P(a X b) ( X a) P (a X b) P ( X a)
F (b) P X b F (a) P X a P ( X a) F (b) P X b F (a)
dac s-a folosit relaia demonstrat anterior.
2. F este nedescresctoare pe R,
adic x1 , x 2 R, x1 x 2 F ( x1 ) F ( x 2 )
Demonstraie
0 P( x 1 X x 2 ) F ( x2 ) F ( x1 ) F ( x1 ) F ( x 2 )
3. lim F ( x) 0, lim F ( x) 1
x x
Demonstraie
lim F ( x ) lim P ( X x) P( ) 0
x x
lim F ( x) lim P ( X x) P ( E ) 1
x x
4. x R , F( x a ) F( x ) (F este continu la stnga n fiecare punct
x R)
Rezolvare
Pentru ca X s fie o variabil aleatoare trebuie ca p0
2 7 1 1 1
i p p 1 . Se obine soluia acceptabil p . Se calculeaz
4 3 6 4
30
probabilitatea cerut prin intermediul evenimentului contrar i anume
1 5
P( X 3) 1 P(X 4) 1 sau
6 6
1 7 1 5
P( X 3) P( X 1) P( X 2) P(X 3) .
16 16 3 6
Rezolvare
Pentru ca X i Y s fie variabile aleatoare se impun condiiile:
1 1 1
p q 1
1 1 6 3 3
p 0; q 0;2p q 0 i apoi : , rezult valorile
6 3 1 2p q 12p 2 1
3
1
acceptabile p i q = 0. Deci variabilele aleatoare au repartiiile:
6
1 0 1 1 0 1
X : 1 1 1 ; Y : 1 1 1 . Avem :
3 3 3 3 3 3
2 0 2
a) 2 XY : 2 5 2
9 9 9
2 1 0 1 2
b) X Y : 1 2 3 2 1 , deci P(X + Y = c)> 2 corespunde
9
9 9 9 9 9
3 2
situaiei P(X + Y = 0) = adic c = 0.
9 9
31
1
0, dac x ,
2
1
1 2 1 1
, dac x 1,
X:2 , are funcia de repartiie: F ( x ) P ( X x ) 6 2
1 1 1 2
6 2 3 , dac 1 x 2,
3
1, dac x 2
Graficul funciei de repartiie este:
F(x)
1
2/3
1/6
1/2 1 2 x
Definiia 2.2.2. Numim distribuia sau repartiia vectorului aleator (X,Y) de tip
discret tabloul:
Y y1yj
X
x1 p11p1j unde ( xi , y j ) sunt valorile
(X,Y), iar
p ij P ( X xi , Y y j ).
xi pi1pij
..
..
..
.
.
32
Evident p
i , j I J
ij = 1.
Y 2 6
X
1 0,20 0,10
3 0,05 0,15
4 0,45 0,05
Rezolvare
a) Variabila X are repartiia:
33
p1 p11 p12 0,20 0,10 0,30
1 3 4
X: , unde p 2 p 21 p 22 0,05 0,15 0, 20 , adic
p1 p 2 p 3
p 3 p 31 p 32 0, 45 0,05 0,50
1 3 4
X: .
0,30 0,20 0,50
2 6
Analog, variabila Y are repartiia Y: , unde
q 1 q 2
q 1 p11 p 21 p 31 0,20 0,05 0,45 0,70 2 6
, adic Y: .
q 2 p12 p 22 p 32 0,10 0,15 0,05 0,30 0,70 0,30
3 4 6 7 8 10
Avem: X+Y: .
0, 20 0,05 0,45 0,10 0,15 0,05
b) Pentru verificarea independenei variabilelor X,Y, efectum un
control, de exemplu:
P(X=1) P(Y=2) = 0,30 0,70 0,21 , iar P[(X=1) (Y=2)] = p11 0,20 .
Cum 0,21 0,20, deducem c X i Y sunt dependente.
7 7
c) F( ,5) P( X , Y 5) P[( X 1, Y 2) ( X 3, Y 2)]
2 2
=P(X=1,Y=2) +P(X=3,Y=2) = 0,20+0,05 = 0,25.
Observaia 2.2.9.
1. Pentru o variabil de tip continuu P(X=a)= 0, deci P(a X<b) =
b
P(a<X<b) = P(a X b) = P(a<X<b) = ( x )dx .
a
34
F ( x x ) F ( x ) P( x X x x )
2. ( x) F ' ( x ) lim lim , deci
x 0 x x 0 x
cnd x este mic avem P(x X x x ) ( x ) x .
4) ( x, y) dx dy 1 .
R2
5) X ( x ) ( x , y)dy, x R ; Y ( y ) ( x, y )dx, y R .
1 ( x 2 1) , dac y 1, 2 i y 3
2
1 , dac x 2 i y 3
35
i deducem de asemenea c funciile de repartiie marginale sunt, respectiv,
0 , x 1 0 , y 1
1 2 1 2
FX ( x ) ( x 1) , x 1, 2 ; FY ( y ) ( x 1) , y 1,3
3 3
1 , x 2 1 , y3
Demonstraie
36
a) Fie variabilele aleatoare de tip discret X, Y avnd repartiiile
x yj
X i , Y
pi iI q j jJ
1. Avem E(aX b) (axi b) pi axi pi bpi aE( X ) b
iI iI iI
ax b
dac variabila aX b are repartiia aX b i i p i 1.
pi iI iI
xi y j
2. Variabila X+Y are repartiia X Y
,
pij (i , j )I J
pij P( X xi , Y y j )
Rezult
E ( X Y ) ( xi y i ) pij xi pij y j p ij
iI jJ iI jJ iI jJ
xi pi y j q j E ( X ) E (Y )
iI jJ
xi y j
3. Variabila XY are repartiia XY
dac X i Y sunt
pi q j (i , j )I J
independente.
Avem E ( XY ) xi y j pi q j x i p i y j q j E ( X ) E (Y )
iI jJ iI jJ
37
Schimbm ordinea de integrare, apoi schimbarea de variabil
x u = t, dx = dt, i obinem
E( X Y ) ( x (u, x u )dx)du
( (t u ) (u, t )dt )du
t ( (u, t ) du ) dt u ( (u , t ) dt )du t X (t ) dt u Z (u ) du E (Y ) E ( X )
Dispersia
2
n mod explicit, dispersia are expresia Var ( X ) x i E ( X ) pi ,
iI
I N , dac X este o variabil aleatoare discret sau
2
Var ( X ) x M ( X ) ( x )dx , dac X este o variabil aleatoare
R
continu.
Dispersia este un indicator numeric al gradului de mprtiere (sau de
dispersare) a valorilor unei variabile aleatoare n jurul valorii medii a acesteia.
Demonstraie
38
a)
Var ( X ) E X E ( X ) E X 2 2 E ( X ) X E ( X )
2 2
E ( X 2 ) 2 E ( X ) E ( X ) E ( X ) E ( X 2 ) E ( X )
2 2
Var ( X ) Var (Y )
dac s-a inut seama c E X E ( X ) 0
Demonstraie
Presupunem c X este o variabil aleatoare de tip continuu, avnd
densitatea de probabilitate (x) . Atunci
Var ( X ) ( x E ( X )) 2 ( x )dx ( x E ( X )) 2 p ( x )dx
D
39
2 1 0 1 2 3
X : 1 2 2 5 1 1
12 12 12 12 12 12
atunci deducem c:
1 2 2 5 1 1 1
E ( X ) 2 1 0 1 2 3
12 12 12 12 12 12 2
1 2 2 5 1 1
E( X 2 ) 4 1 0 1 4 9 2
12 12 12 12 12 12
1 7
Var ( X ) E ( X 2 ) E ( X ) 2
2
4 4
7
( X ) Var ( X )
2
Aplicaia 2.3.9. Dac X este variabil aleatoare continu
x
x , x 1,3
X : , ( x ) 4
( x) 0, n rest
atunci deducem c:
3 3
3 x3 13 3 x4
E( X ) x ( x )dx , E ( X 2 ) x 2 ( x)dx 5
1 12 1 6 1 16 1
169 11
Var ( X ) E ( X 2 ) E ( X ) 5
2
36 36
11
( X ) Var ( X )
6
Momente
40
x
c) Dac X este variabil de tip continuu X : atunci
( x ) x R
mk x k ( x)dx
R
41
xi E ( X ) r y j E (Y )s pij , ( X , Y ) discret
iI jJ
rs
x E ( X ) y E (Y ) ( x, y )dxdy , (X, Y) continuu
r s
R2
Observaia 2.3.18.
m1 o E ( X ), m0 1 E (Y ), 2 0 Var ( X ), 0 2 Var (Y )
Observaia 2.3.20.
1) C ( X , Y ) E ( XY ) E ( X ) E (Y ), C(X, Y) m11 m10 m01
Dac X, Y independente C(X, Y) 0 , dar nu i reciproc.
C ( X , X ) Var ( X )
m n m n
C ai X i , b jY j a b C X i j i , Y j , oricare ar fi variabilele
i 1 j 1 i 1 j 1
Observaia 2.3.22.
1) X, Y independente r(X, Y) 0 reciproc nu este adevrat;
2) Spunem c X,Y sunt necorelate dac r(X,Y) =0
Proprieti:
a) r ( X, Y) 1
b) r ( X , Y ) 1 Y a X b, a 0
c) r ( X , Y ) 1 Y aX b, a 0
42
0,75 r ( X , Y ) 1 (sau 1 r ( X , Y ) 0,75 );
4) X i Y sunt slab pozitiv (sau negativ) corelate dac 0 r ( X , Y ) 0, 25
(sau 0,25 r ( X , Y ) 0 );
Marginile valorice decizionale fiind alese convenional.
Rezolvare
Pe baza formulelor corespunztoare, deducem imediat:
9 8 7 2 1
E ( X ) 1 0 1
24 24 24 24 12
9 8 7 16 2
E( X 2 ) 1 0 1
24 24 24 24 3
2 1 95
Var ( X ) E ( X 2 ) [ E ( X )]2
3 144 144
6 7 8 3 8 1
E (Y ) 1 0 1 2
24 24 24 24 24 3
6 7 1 3 26 13
E (Y 2 ) 1 0 1 4
24 24 24 24 24 12
13 1 35
Var (Y ) E (Y 2 ) [ E (Y )]2
12 9 36
1 1 1 1 1 1 1 1
E ( XY ) 1 1 0 1 2 0 1 0 1 2
6 12 12 24 24 6 12 24
1 1 1 1 5
1 1 0 1 2
24 24 6 24 24
5 1 17
C ( X , Y ) E ( XY ) E ( X ) E (Y )
24 36 72
17
C( X , Y ) 12
r( X , Y ) 0,295
Var ( X )Var (Y ) 95 35
144 36
43
Observaia 2.3.25. Coeficientul de corelaie r ( X ,Y ) reprezint prima msur a
corelaiei sau gradului de dependen n sens clasic. Introdus de ctre
statisticianul englez K. Pearson n anul 1901 ca rod al colaborrii acestuia cu
antropologul englez F. Galton (care a avut prima idee de msurare a corelaiei
sub denumirea de variaie legat), aceast msur a gradului de dependen a
fost criticat nc de la apariiei ei pentru diverse motive, printre care i aceea
c:
1) este dependent de valorile vectorului aleator ( X , Y ) i ca urmare nu
este aplicabil pentru cazul variabilelor aleatoare necantitative;
2) nu este precis n cazul independenei i al necorelrii deoarece
dac r ( X ,Y ) 0 nu exist un rspuns categoric (n sensul
independenei sau necorelrii);
3) nu poate fi extins la mai mult de dou variabile aleatoare sau chiar
la doi sau mai muli vectori aleatori, fapte cerute de practic.
Dac la prima obiecie a dat chiar K. Pearson un rspuns, pentru
celelalte dou obiecii nu s-au dat rspunsuri clare dect dup apariia n 1948
a teoriei matematice a informaiei, rezultate remarcabile n acest sens obinnd
coala romneasc de matematic sub conducerea lui Silviu Guiau introducnd
msurile entropice ale dependenei dintre variabile aleatoare i vectori aleatori
(n anii 1974-1978) cu o larg aplicabilitate teoretic i practic.
n ciuda tuturor criticilor ce i s-au adus, coeficientul de corelaie clasic
(sau coeficientul Galton-Pearson) este cel mai frecvent utilizat n practic i,
pentru c este cel mai simplu n utilizare.
Observaia 2.3.27.
a) Pentru cazul unui vector aleator bidimensional, a nu se face confuzie
ntre media produsului componentelor X i Y, care este E ( XY ) i
media vectorului ( X , Y ) care este E ( X , Y ) .
b) Uneori matricea de corelaie C (Z ) se mai noteaz i cu (Z ) .
c) Desfurat matricea de covarian C (Z ) are forma:
44
Var ( X 1 ) C ( X 1 , X 2 ) ... C ( X 1 , X n )
C ( X 2 , X 1 ) Var ( X 2 ) ... C ( X 2 , X n )
C (Z )
... ... ... ...
C ( X , X ) C ( X , X ) ... Var ( X )
n 1 n 2 n
i ca urmare a proprietilor corelaiei, constatm c matricea C (Z ) este
simetric.
d) Pornind de la definiia coeficientului de corelaie i de la matricea
de corelaie, dac toate componentele lui Z sunt neconstante, atunci
putem introduce matricea coeficienilor de corelaie R(Z ) a crei
form dezvoltat este:
1 r ( X 1 , X 2 ) ... r ( X 1, X n )
r ( X 2 , X1 ) 1 ... r ( X 2 , X n )
R( Z )
... ... ... ...
r ( X , X ) r ( X , X ) ... 1
n 1 n 2
Ambele forme ale matricei de corelaie a vectorului aleatoriu Z
reprezint de fapt tabele ale msurrii gradului de dependen dintre
componentele lui Z, considerate dou cte dou.
46
Observaia 2.3.30. 1. Dac F este funcia de repartiie i este continu atunci
1
M e se determin din ecuaia F(Me) .
2
ab
2. Dac M e (a, b] atunci se ia M e
2
Observaia 2.3.32. Dac exist un singur punct de maxim local spunem c legea
lui X este unimodal altfel o numim plurimodal.
Observaia 2.3.35.
1) Dac e<0 atunci graficul distribuiei are un aspect turtit i legea se
numete platicurtic.
2) Dac e>0 atunci graficul distribuiei are un aspect ascuit i legea va
fi numit leptocurtic.
3) Dac e = 0 atunci repartiiile sunt mezocurtice.
1 0 2
Exemplul 2.3.37. Se consider variabila aleatoare X : .
0,2 0,3 0,5
S se calculeze: E(X), E(3X), E(4X-2), Var ( X ), X .
47
Rezolvare
3
E ( X ) xi p i 1 0,2 0 0,3 2 0,5 0,8
i 1
E (3 X ) 3E ( X ) 3 0,8 3,4 ; E (4 X 2) 4 E ( X ) 2 4 0,8 2 1,2
Var ( X ) E ( X ) E ( X ) 2,2 0,64 1,56 ;
2 2
6 6
Rezolvare
a) din condiiile ( x , y) 0 k 0
1 2
( x, y )dxdy k dx ( x y 1)dy 1 k 1 5 .
0 0
1
(x y 1), x [0,1], y [0,2]
Deci ( x , y) 5
0, n rest
48
1 2 2x 4
b) X ( x ) ( x, y)dy ( x y 1)dy , x [0,1]
5 0 5
2x 4
, x [0,1]
X (x ) 5
0, altfel
1 1 2y 3
y ( y) (x , y)dx ( x y 1)dx , y [0,2]
5 0 10
2y 3
, y [0,2]
Y ( y) 10
0, altfel
c) X i Y nu sunt independente deoarece: ( x , y) X ( x ) Y ( y)
1 1 8
d) E ( X ) x ( x, y )dxdy x X ( x)dx x(2 x 4)dx
5 0 15
1 2 17
E (Y ) ( x, y )dxdy y Y ( y )dy y (2 y 3)dy
10 0 15
1 1 11
m2 ( X ) E ( X 2 ) x 2 X ( x )dx x 2 (2 x 4)dx
5 0 30
1 2 8
m2 (Y ) E (Y 2 ) y 2 Y ( y )dy y 2 (2 y 3)dy
10 0 15
11 64 37
Var ( X ) E ( X 2 ) E ( X )
2
Deci
30 225 450
8 289 71
Var (Y ) E (Y 2 ) E (Y )
2
5 225 225
1 1 2
E ( X Y ) xy (x, y)dxdy dx xy ( x y 1)dy
5 0 0
1 1 14 9
2x 2 x dx C ( X , Y ) E ( XY ) E ( X ) E (Y ) .
5 0 3 15
9 8 12 1
15 15 15 225
1
C( X ,Y ) 225
Se obine: r ( X , Y ) 0,02758
X Y 37 71
450 225
49
Y
X -1 1 2
0 1 2 3
16 16 16
1 2 0 2
16 16
1 2 3
2 16 16 16
Rezolvare
Calculm repartiiile marginale:
0 1 2 1 1 2
X : ; Y :
6 16 4 16 6 16 4 16 4 16 8 16
7 3 3
Avem: E ( X ) 1; E ( X 2 ) ; Var ( X ) ; X
4 4 2
5 3 10
E (Y ) 1; E (Y 2 ) ; Var (Y ) ; Y
2 2 2
2 1 0 2 4
XY : 1 2 6 4
3 , E(XY)=1
16 16 16 16 16
E(X Y) - E(X)E(Y) 11
r 0
X Y 3 10
2 2
Rezolvare
a) Conform definiiei, M0 este valoarea pentru care ( x ) max . adic
M 0 (0,2) adic exist o infinitate de valori modale situate pe segmentul (0,2).
1
Me se determin din ecuaia F ( M e ) .
2
50
Me Me
Cum F ( M e ) P ( X M e ) ( x )dx M e 1.
0 2
1 2k
b) mk ( X ) E ( X k ) x k dx .
2 k 1
Demonstraie
51
1) (0) E (1) 1 i
itx k
(t ) p e k p k eitx p k 1 dac X este de tip discret i
k K k K k K
Aplicaia 2.4.6.
1 0 1
1) Dac X : atunci
1 6 1 2 1 3
1 1 1 2eit eit 3
(t ) eit eit
6 2 3 6
1
x 2 2ix itx
2) Dac X : , x 0,1 atunci (t ) 2 xeitx dx e
2x 0
e2
x 1 it
3) Dac X : x , x 0 atunci (t ) e x eitx dx
e 0
1 t2
52
1) G (0) 1
2) Dac Xj, 1 j m , sunt independente n totalitate i au funciile
generatoare G j (t ) , j 1, m , atunci funcia generatoare a variabilei aleatoare
X X 1 X 2 ... X m este
m
G X (t ) G j (t )
j 1
3) Dac Y aX b , a i b R, atunci
GY (t ) G X (at ) etb
4) Dac X admite momente iniiale de orice ordin, atunci funcia
generatoare admite derivate de orice ordin n punctul zero i
G X( r ) (0) E ( X r ) mr ( X ) , r 1, 2, ...
Aplicaia 2.4.9.
1 0 1
1) Dac X : atunci
1 6 1 12 2 3
1 1 1 2e t e t 3
G (t ) e t e t
6 2 3 6
x
2) Dac X : x , x 0 , 0 atunci
e
G (t ) e x etx dx , dac t
0
t
iar n caz contrar nu exist.
k
3) Dac X : k k n k , p, q 0 , p q 1 , atunci
Cn p q k 0 , n
n
G (t ) Cnk p k q n k e tk ( pet q) n
k 0
Rezolvare
53
Probabilitile corespunztoare valorilor lui 2X, Y2, X sunt aceleai
cu cele corespunztoare lui X i respectiv Y. Avem:
0 2 4 0 1 2 1 4
2X : , X : , Y 2 : .
1 / 2 1 / 4 1 / 4 1 / 2 1 / 4 1 / 4 1 / 2 1 / 2
1 1 1
P(Y 2 1) P(Y 1 Y 1) P(Y 1) P(Y 1) .
3 6 2
Deoarece X i Y sunt independente avem c pij = piqj,1 i, j 3 . De exemplu
1 1 1
p12 P( X 0, Y 1) P( X 0) P(Y 1) . Obinem
2 6 12
0 1 0 1 0 2 11 11 1 2 2 1 2 1 2 2
X Y :
1 / 6 1 / 12 1 / 4 1 / 12 1 / 24 1 / 8 1 / 12 1 / 24 1 / 8
adic
1 0 1 2 3 4
X Y : .
1 / 6 1 / 12 1 / 6 7 / 24 1 / 6 1 / 8
Analog
0 (1) 0 1 0 2 1 (1) 1 1 1 2 2 (1) 2 1 2 2
X Y :
1 / 6 1 / 12 1 / 4 1 / 12 1 / 24 1 / 8 1 / 12 1 / 24 1 / 8
de unde
2 1 0 1 2 4
X Y : .
1 / 12 1 / 12 1 / 2 1 / 24 1 / 6 1 / 8
Cum 2X i 3Y au repartiiile
0 2 4 3 3 6
2X : , 3Y : ,
1 / 2 1 / 4 1 / 4 1 / 3 1 / 6 1 / 2
obinem repartiia lui 2X + 3Y :
3 1 1 3 5 6 7 8 10
2 X 3Y : .
1 / 6 1 / 12 1 / 12 1 / 12 1 / 24 1 / 4 1 / 24 1 / 8 1 / 8
La fel obinem:
X 2 1 0 1/ 2 1 2
: ,
Y 1 / 12 1 / 12 1 / 2 1 / 8 1 / 6 1 / 24
0 1 2
max( X , Y ) : .
1 / 6 5 / 24 5 / 8
Aplicaia 2.5.2. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comun (pij ) i marginale (pi) i (qj) sunt date n tabelul urmtor :
X\Y -1 0 1 pi
-1 1/8 1/12 1/6 3/8
1 1/24 1/4 1/3 5/8
qj 1/6 1/3 1/2 1
54
a) S se scrie variabilele aleatoare X i Y.
b) S se precizeze dac X i Y sunt independente.
c) S se scrie variabilele X + Y , X Y, X2, Y2, Y/X .
Rezolvare
a)Din tabelul de repartiie de mai sus deducem c
1 1 1 0 1
X : i Y : .
3 / 8 5 / 8 1 / 6 1 / 3 1 / 2
b)Dac X i Y ar fi independente atunci
p11 P( X 1, Y 1) p1q1 P( X 1) P(Y 1) ,
1 3 1
ceea ce nu are loc ntruct .
8 8 6
c)Deoarece
1 1 1 1 1 1
p11 , p12 , p13 , p21 , p22 , p23 ,
8 12 6 24 4 3
obinem
2 1 0 1 2
X Y : ,
1 / 8 1 / 12 1 / 6 1 / 24 1 / 4 1 / 3
1 0 1
X Y : ,
1 / 6 1 / 24 1 / 12 1 / 4 1 / 8 1 / 3
X 1 0 1
: .
Y 1 / 24 1 / 6 1 / 12 1 / 4 1 / 8 1 / 3
Repartiiile lui X2 i Y2 rezult imediat din cele ale lui X i Y:
1 0 1
X 2 : , Y 2 : .
1 1 / 3 2 / 3
1 2 3 3 3
Aplicaia 2.5.3. Fie variabila aleatoare discret X : .
p p
2
p p2 p 2
a) S se determine p.
b) S se calculeze funcia de repartiie a lui X.
c) S se calculeze probabilitile:
P ( X 1), P ( X 3), P ( X 4), P (1,5 X 3,2), P ( X 2,1),
P (3,1 X X 2,8), P (1,5 X 3 2 X 4).
Rezolvare
a) Trebuie s avem p + p2 + p + p2 + p2 = 1 i p 0. Rezult
3p2 + 2p = 1 i p 0, adic p = 1/3.
b) Cum F(x) = P(X x) rezult c F(x) = 0 dac x 1,
F(x) = p = 1/3 dac x (1,2] ,
F(x) = P(X=1) + P(X=2) = p + p2 = 4/9 dac x ( 2,3] ,
55
F(x) = P(X=1) + P(X=2) + P(X=3) = p + p2 + p = 7/9 dac x (3,4] ,
F(x) = P(X=1) + P(X=2) + P(X=3) + P(X=4) = p + p2 + p + p2 = 8/9
dac x (4,5] i F(x) = 1 dac x > 5 .
Deci :
0, x 1;
1
3 , 1 x 2;
4
, 2 x 3;
F ( x) 9
7
, 3 x 4;
9
8 , 4 x 5;
9
1, x 5.
c) Avem
P(X<1) = P() = 0, P(X<3)=P(X=1)+P(X=2)=4/9,
P(X>4)=P(X=5)=1/9, P(1,5<X<3,2)=P(X=2)+P(X=3)=4/9,
P(X2,1)=P(X=3)+P(X=4)+P(X=5)=5/9,
P(3,1 X , X 2,8) P( X 3,1) 2 p2 2
P(3,1 X X 2,8) 2
P( X 2,8) P( X 2,8) p 2 p 5
P(1,5<X3/2<X<4)=P(X=2 sau X=3 / X=3) = P(X=3/X=3) =1.
Rezolvare
1/ 2 2 2x
Avem ( x)dx 1 , de unde xdx a dx 1 sau
0 1/ 2
3
x2
x 2 10/ 2 ax 12/ 2 1 . Rezult a = 4/3 i deci
3
0, x0 0, x0
2 2
x , x [0,1 / 2]
x x , x [0,1 / 2]
F ( x) (t )dt 1 x 4 2t 4x x2 1
4 1 / 2 3 dt, x (1/ 2,2]
, x (1 / 2,2]
3
1, x2 1, x2
56
ntruct F este continu vom avea F(x) = F(x+0) , x , deci
1 1 1
F ( M e ( X )) i F ( M e ( X )) , adic F ( M e ( X )) . Aceasta se
2 2 2
2
4x x 1 1 3
realizeaz pentru , de unde x 2 (1 / 2,2] .
3 2 2
3 1
Aadar M e ( X ) 2 c2 . Se observ c F(1/2)=1/4 deci c1 c3
2 2
4x x2 1 3 3
rezult din F(x)=3/4, adic , de unde c3 2 .
3 4 2
Deoarece este cresctoare pe [0,1/2] i descresctoare pe (1/2,2],
1
x=1/2 este punct de maxim (singurul), prin urmare M o ( X ) .
2
Rezolvare
Deoarece X este o variabil aleatoare trebuie s avem p+2p+3p+4p=1,
adic p=1/10. Atunci
E(X) = xp+(x+1)2p+(x+2)3p+(x+3)4p = 10px+20p = x+2.
Cum E(X) = 2 rezult c x = 0.
Analog q+q2+q2=1, adic 2q2+q-1=0, de unde q=1/2. Rezult c
7
E(Y)=yq+2yq2+3yq2= y . Cum E(Y) = 7 avem c y=4. Tablourile de
4
repartiie ale lui X i Y vor fi
0 1 2 3 4 8 12
X : 1 1 3 2 , Y : 1 1 1 .
10 5 10 5 2 4 4
Folosind proprietile mediei avem
E(2X+3Y) = E(2X)+E(3Y) = 2E(X)+3E(Y) = 22+37 = 25.
Pentru calcularea dispersiilor avem nevoie s calculm mediile lui X2 i
2
Y . Acestea au tablourile de repartiie
0 1 4 9 16 64 144
X 2 : 1 1 3 2 , Y : 1 1 1 , astfel c
2
10 5 10 5 2 4 4
1 1 3 2
E( X 2 ) 0 1 4 9 5 i
10 5 10 5
57
1 1 1
E (Y 2 ) 16
64 144 60 . Atunci
2 4 4
Var(X) = E(X2)-E(X)2 = 5-4 = 1 i Var(Y) = E(Y2)-E(Y)2 = 60-49 = 11.
Cum X i Y sunt independente, rezult c i 2X i 3Y sunt independente
i avem
Var(2X+3Y) = Var(2X)+Var(3Y) = 4Var(X)+9Var(Y) = 41+911 =
103.
X\Y -b 0 b pi
a 1/5 1/10
a2 2/5 3/5
qj 1/5
Rezolvare
3 2
Deoarece p1+p2=1 rezult c p1 1 . Mai departe
5 5
1 1 2 1
p11+p12+p13=p1, adic p13 , deci p13 . Cum
5 10 5 10
1 1 1
p13+p23=q3 rezult c p23 . Dar p21+p22+p23=p2, adic
5 10 10
3 2 1 1 3
p21 . Din p11+p21=q1 i p22+p12=q2, rezult c q1 i
5 5 10 10 10
1
q2 . Obinem astfel
2
a a2 b 0 b 2 3
X : 2 3 , Y : 3 1 1 . Astfel E ( X ) a a 2 17 ,
5 5
5 5 10 2 5
adic 3a2+2a-85=0, de unde a1=5, a2=-17/3. Deoarece
3b 1 b b
E (Y ) 0 i
10 2 5 10
3 1 1 b2
E (Y 2 ) (b) 2 0 2 b 2 , rezult c
10 2 5 2
b2 b2 49b 2
Var (Y ) E (Y 2 ) E (Y ) 2 . Din ipotez Var(Y)=1,
2 100 100
100 10
astfel c b 2 , adic b . Din tabloul repartiiei comune (pij) avem
49 7
58
a 2b ab 0 ab a2b a b a2 b a a2 a b a2 b
XY : 1 1 1 1 1 i X Y : 1 1 1 2 1 1
10 5 2 10 10 10 10 10 5 5 10
a 2 b ab ab a 2 b ab a
Astfel E ( XY ) .
10 5 10 10 10 7
Dac a=5, E(XY)=-5/7, iar dac a=-17/3, E(XY)=17/21. Pentru
calcularea dispersiei lui X-Y, avem nevoie de:
a b a 2 b a 2a 2 a b a 2 b 6a 2 4a b
E( X Y )
10 10 10 5 5 10 10
2 2 2 2 4 2
2 ( a b) ( a b) a 2a ( a b) ( a b) 2
2
E[( X Y ) ]
10 10 10 5 5 10
6a 4 4a 2 2ab 5b 2
10
120 18985
Pentru a=5, b=10/7 avem E(X-Y)= i E[( X Y ) 2 ] ,
7 49
18985 14400 4585
deci Var ( X Y ) .
49 49 49
Aplicaia 2.5.7. S se determine parametrii care apar n repartiiile urmtoare
i s se calculeze apoi E(X) i Var(X), X fiind o variabil aleatoare, avnd
repartiia respectiv:
n
a) X : 1 n , n N , q 0 ;
q
4
x
b) X : 2
, x [0,1], a 0 ;
a( x 2 x )
a 2 x 3 , x [0,1]
x 1
c) X : , ( x ) ax, x (1,2]
( x) 2
0, altfel.
Rezolvare
1 n 1 1 1 3
a)Din condiia 4q
n 0
1 rezult c
4 1 q
1 1 q q
4 4
'
1 1 1 1
E ( X ) n q n q n q n 1 q (q n )' q q n
n 0 4 4 n 0 4 n 0 4 n 0
Atunci '
1 1 1 1 1 3 1
q q 2
3
4 1 q 4 (1 q) 4 4 1
16
59
' '
1 1 1 1
E ( X ) n q n q n(q n )' q nq n q nq n
2 2
n 0 4 4 n 0 4 n 0 4 n 0
'
1 1 1 2
q 2
q 24.
4 (1 q ) 4 (1 q ) 3
Astfel Var(X) = E(X2)-E(X)2 = 24-9 = 15.
1
2
b) Din condiia a( x 2 x)dx 1 rezult c
0
x3 4 3
a x 2 10 1 a 1 a . Atunci
3 3 4
1 1 3 3 x 4 2 x 3 1 11
E ( X ) x ( x)dx x ( x 2 2 x )dx 0 ,
0 0 4 4 4 3 16
2
1
2
1
2 3 2 3 x 5 2 x 4 1 21
E ( X ) x ( x )dx x ( x 2 x)dx 0 .
0 0 4 4 5 4 40
2
21 11 67
Astfel Var ( X ) E ( X 2 ) E ( X ) 2 .
40 16 1280
2
c) Din condiia ( x)dx 1 rezult c
0
4
1 ax 2
2 x 1 x2 2 a 2 3a a 1
0 a 2 x 3dx dx 1 a 0 a 1 1 1 Cum
1 2 4 4 4 4 a 4
( x) 0 numai a=1 convine, astfel c :
2 1 2 x x5 x3 1 7 41
E ( X ) x ( x )dx x x 3 dx x dx 1
0 2
1
0 0 1 2 5 6 5 6 30
2 1 2 x x6 x4 49
E ( X 2 ) x 2 ( x)dx x 2 x 3 dx x 2 dx 1
0 2
1 ,
0 0 1 2 6 8 24
2
2 2 49 41 313
Var ( X ) E ( X ) E ( X ) .
24 30 1800
Aplicaia 2.5.8. Fie vectorul aleator (X,Y) cu X, Y variabile aleatoare
independente, a crui densitate de probabilitate este
a
( x, y ) . S se determine:
(1 x )(1 y 2 )
2
Rezolvare
60
a
a) Avem ( x, y )dxdy 1 , deci dxdy 1 . Rezult
R 2
(1 x )(1 y 2 ) 2
dx dy 1
c a 2 2
1 a arctgx arctgy 1 a 2 .
1 x 1 y
1 x y dudv 1 x du y dv
F ( x, y ) 2 2
(1 u )(1 v ) 1 u 2 1 v 2
2 2
Atunci
1 1 1 1
arctgx arctgy
2 2
1 1 1 dudv
P(( X , Y ) D ) 2
0 0 (1 u 2 )(1 v 2 )
b)
1
F (1,1) F (1,0) F (0,1) F (0,0)
16
Rezolvare
1 2 1 2
a) Avem ( x, y )dxdy 1 , adic a x 2 dx ydy 1 , rezult c
0 0 0 0
2a 3
1 de unde a .
3 2
x y
b) Avem F ( x, y ) ( x, y )dxdy .
Dac x < 0 sau y < 0, atunci f(x,y)=0 i deci F(x,y)=0.
Dac x > 1 i y > 2, atunci F(x,y)=1.
Dac (x,y) [0,1] [0,2] avem
3 2
x y 3 x 2 y x3 y 2
F ( x, y ) u vdudv u du vdv
0 0 2 2 0 0 .
4
Dac x [0,1] i y > 2 avem
x 23 3 x 2
F ( x, y ) u 2 vdudv u 2 du vdv x 3 .
0 0 2 2 0 0
61
0, x 0 sauy 0
x3 y 2
, ( x, y ) [0,1] [0,2]
43
Astfel F ( x, y ) x , x [0,1], y 2
y 2
, x 1, y [0,2]
4
1, x 1, y 2
Funciile de repartiie marginale sunt
0, x0
3
FX ( x ) F ( x, ) x , x [0,1]
1, x 1
0, y0
y 2
FY ( y ) F (, y ) , y [0,2]
4
1, y2
Aplicaia 2.5.10. Fie vectorul aleator (X,Y) avnd densitatea de probabilitate
e ( x y ) , x 0, y 0
( x, y )
0, altfel
S se calculeze:
a) P(X<1,Y<1), P(X+Y<1), P(X+Y2), P(X1/Y1), P(X<2Y),
P(X=n) ;
b) Funcia de repartiie F(x,y) i funciile de repartiie marginale FX(x),
FY(y);
c) Densitile de repartiie marginale X(x), Y(y);
d) Momentele obinuite de ordin (k,s) ;
e) Corelaia variabilelor X i Y.
Rezolvare
1 1
a) P ( X 1, Y 1) ( x, y )dxdy
1 1
x y
e dxdy (e x ) 10 (e y ) 10 (1 e 1 ) 2
0 0
1 1 x 1
P ( X Y 1) ( x, y)dxdy e x y dxdy e x ( e y ) 10 x dx
0 0 0
x y 1
1
(e x e 1 )dx (e x ) 10 e 1 1 2e 1 ,
0
P ( X Y 2) 1 P ( X Y 2) 1 ( x, y)dxdy
x y2
2 2 x 2 2
1 e x y dxdy 1 e x (e y ) 02 x dx 1 (e x e 2 )dx 3e 2
0 0 0 0
62
P( X 1, Y 1)
P( X 1 / Y 1)
P(Y 1)
2
P ( X 1, Y 1)
1 1
1
e x y dxdy e x dx (e x ) 1
e
2 2
P (Y 1) e x y dxdy e x
0 (e y ) 1 e 1
0 1
P( X 1, Y 1) e 1
x
x y
P ( X 2Y ) e dxdy 2 e x e y dydx e x (e y ) 0x / 2 dx
0 0 0
0 x 2 y
3 x
x
x 2 32 x 2 1
(e e 2
)dx e e 0 1 , P(X=Y)=0.
0
3 3 3
x y
b) Avem F ( x, y ) (u , v)dudv .
Dac x > 0 sau y < 0 (x,y)=0, deci F(x,y)=0. Dac x 0 i y 0 avem
x y x y
F ( x, y ) e u v dudv e u du e v dv (1 e x )(1 e y ) .
0 0 0 0
Funciile de repartiie marginale sunt
FX ( x ) F ( x, ) 1 e x i FY ( y ) F (, y ) 1 e y .
c) Densitile de probabilitate marginale X (x ) i Y ( y ) sunt
derivatele funciilor de repartiie marginale:
0, x 0 0, y 0
X ( x) x , Y ( y ) y .
e , x 0 e , y 0
d) k , s M ( X kY s ) x k y s e x y dxdy
0 0
x k e x dx y s e y dy (k 1)( s 1) k! s! ,
0 0
unde ( p ) x p1e x dx este funcia gama a lui Euler i are
0
proprietatea c ( p 1) p! pentru p N .
e) Avem
cov( X , Y ) E ( XY ) E ( X ) E (Y ) m11 xe x dx ye y dy
0 0
1 ( 2) 2 1 1 0 .
Aplicaia 2.5.11. Fie (X,Y) un vector aleator discret a crui repartiie
probabilist este dat n tabelul de mai jos. S se calculeze coeficientul de
corelaie r(X,Y) i s se scrie ecuaiile dreptelor de regresie.
X\Y -1 0 1 2 pi
-1 1/10 1/5 1/10 0 2/5
0 1/20 0 1/10 1/20 1/5
1 1/10 1/10 1/20 3/20 2/5
qj 1/4 3/10 1/4 1/5 1
63
Rezolvare
Pe baza formulelor corespunztoare, deducem imediat:
2 1 2 1 3 1 1 2
E ( X ) 1 0 1 0 , E (Y ) 1 0 1 2 ,
5 5 5 4 10 4 5 5
2 1 2 4
E ( X 2 ) (1) 2 0 2 12 ,
5 5 5 5
1 3 1 1 13
E (Y 2 ) (1) 2 0 2 12 2 2 ,
4 10 4 5 10
4
Var ( X ) E ( X 2 ) E ( X ) 2 ,
5
13 4 57
Var (Y ) E (Y 2 ) E (Y ) 2
10 25 50
1 1 1 1
E ( XY ) (1) (1) (1) 0 (1) 1 (1) 2 0 0 (1)
10 5 10 20
1 1 1 1 1 3 1
0 0 0 0 1 0 2 1 (1) 1 0 1 1 1 2
10 20 10 10 20 20 4
1
cov( X , Y ) E ( XY ) E ( X ) E (Y ) ,
4
cov( X , Y ) 0,25
r( X , Y ) .
Var ( X )Var (Y ) 2 57
5 50
Ecuaiile dreptelor de regresie sunt :
2 2
y y
x0 5 , 5 0,25 x 0 .
0,25
4 57 57 4
5 50 50 5
Aplicaia 2.5.12. S se determine funcia caracteristic i funcia generatoare de
momente i apoi s se calculeze, pornind de la acestea, momentele m1 i m2 ,
pentru urmtoarele variabile aleatoare:
0 1 2
a) X : 1 1 1 ;
2 4 4
x
b) X : x , x 0 .
e
Rezolvare
a) Avem
0it 1 1it 1 2it 1 2 e it e 2it
X (t ) e e e i
2 4 4 4
64
1 0t 1 1t 1 2t 2 e t e 2t
G X (t ) e e e .
2 4 4 4
Primele dou derivate ale acestor funcii sunt:
i 1
'X (t ) (eit 2e 2it ) , "X (t ) (e it 4e 2it ) ,
4 4
1 1
G X' (t ) (e t 2e 2t ) , G "X (t ) (e t 4e 2t ) .
4 4
Obinem
3i 5 3 5
'X (0) , "X (0) , G X' (0) , G "X (0) , de unde
4 4 4 4
'
(0) 3
1 ( X ) E(X ) X G X' (0) i
i 4
" (0) 5
2 ( X ) E ( X 2 ) X 2 G "X (0) .
i 4
b) X (t ) e itx e x dx (cos tx i sin tx) e x dx
0 0
cos tx e dx i sin tx e x dx A iB
x
0 0
A cos tx e x dx cos tx ( e x )' dx
0 0
x
cos tx e 0 t sin tx e x dx 1 tB ,
0
B sin tx (e x )dx sin tx e x
0 t cos tx e x dx tA .
0 0
1 t
Obinem A = 1 - t2A, adic A = 2
i B = .
1 t 1 t2
1 it
Astfel X (t ) .
1 t2
e x (t 1) 1
Apoi G X (t ) e tx e x dx e x (t 1) dx
0 ,t 1 .
0 0 t 1 1 t
Primele dou derivate sunt
i 2t it 2 6it 3 14t 2 10it 2
'X (t ) , "
X (t ) ,
(1 t 2 ) 4 (1 t 2 ) 5
1 2
G X' (t ) 2
, G "X (t ) .
(1 t ) (1 t )3
Obinem
' (0)
m1 ( X ) E ( X ) X G X' (0) 1 i
i
2 "X (0)
m2 ( X ) E ( X ) 2
G "X (0) 2 .
i
65
2.6. Probleme propuse
Aplicaia 2.6.2. La patru uniti alimentare din ora se poate gsi zilnic pine
proaspt cu probabilitile p1=0.8, p2=0.9, p3=0.95 i respectiv p4=0.85. Fie X
numrul unitilor alimentare din cele patru la care se gsete pine proaspt
ntr-o zi fixat. S se determine:
a) distribuia variabilei aleatoare X;
b) valoarea medie, dispersia, abaterea medie ptratic, mediana i
modul variabilei aleatoare X.
Aplicaia 2.6.3. Fie (X,Y) coordonatele unui punct luminos ce reprezint o int
pe un ecran radar circular i care urmeaz legea uniform pe domeniul
D = (x,y)R2x2+y2 r2 . S se determine valoarea medie i dispersia
distanei Z = X 2 Y 2 de la centrul ecranului pn la punctul luminos.
Aplicaia 2.6.7. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comune ( pij ) i unidimensionale ( pi ) i (q j ) sunt date n tabelul
de mai jos:
Y
-1 0 1 2 pi
X
-1 1/12 1/24 1/24 1/48 3/16
1 1/48 1/24 1/48 1/24 1/8
2 1/48 1/3 1/6 1/6 11/16
qj 1/8 5/12 11/48 11/48 1
67
x x
e) X : a x , aR, xR, f) X : , xR,
e ( x)
ax , x 0,1
a 2 x 2
( x) , x 1,2 , aR
2
0 , n rest
0 1
Aplicaia 2.6.9. Fie variabilele aleatoare discrete: X :1 2 i
3 3
0 1 2 1
Y : 1 1 1 . Dac P( X 0, Y 0) i P( X 1, Y 1) , s se
3
6 2 3
determine repartiia comun a vectorului aleatoriu (X,Y) n funcie de R .
Calculai apoi coeficientul de corelaie r ( X ,Y ) i precizai dac exist valori
ale lui pentru care X i Y s fie independente.
Aplicaia 2.6.12. Verificai dac funciile urmtoare definesc repartiii ale unor
variabile aleatoare discrete i apoi calculai E(X) i Var(X) pentru fiecare dintre
ele.
1
1 (ln )k 1
a) P(k ) , k N , 1 , b) P(k ) k e , k N , 0 ,
k! k!
c) P(k ) k (1 )1 k , k 0,1,0 1
68
Capitolul 3
Introducere
x1 x 2 ... x n 1
X : , unde pk , k 1, 2, ...n , n * . (3.1.1)
p1 p 2 ... p n n
n n
1
pk
k 1 k 1 n
1.
2
1 n 1 n 1 n
E ( X ) x k , Var ( X ) x k2 2 xk . (3.1.2)
n k 1 n k 1 n k 1
Demonstraie
Din formulele de calcul ale mediei i dispersiei obinem
69
n n
1 1 n
E ( X ) xk pk xk xk ,
k 1 k 1 n n k 1
n 2
2 2 n 2
Var ( X ) E ( X ) [ E ( X )] x p k xk pk
k
k 1 k 1
2 2
n
1 n 1 1 n 1 n
x xk x k2 2 x k .
2
k
k 1 n k 1 n n k 1 n k 1
q.e.d.
n 2
n 2
n x x k ,
k
k 1 k 1
relaie util n diverse aplicaii practice, i care rezult direct i din inegalitatea
lui Cauchy-Buniakovski-Schwarz.
1 n itxk
(t ) e , t R.
n k 1
(3.1.3)
Demonstraie
Conform formulei de calcul pentru funcia caracteristic, avem
n
1 n itxk
(t ) pk e itxk e , t R. q.e.d.
k 1 n k 1
1 2 n
X : 1 1 1 ,
n n n
atunci
70
n 1 n2 1
E( X ) , Var ( X ) ,
12 12
nt
sin i ( n 1) t
(t ) 2 e 2 , t R, t 2k , k Z ; (t ) 1, t 2k , k Z .
t
n sin
2
Demonstraie
Din formulele (3.1.2), pentru x k k , k 1, 2, ..., n , obinem
1 n 1 n n 1
E( X )
n k 1
xk k
n k 1 2
,
2 2
1 n 1 n 1 n 1 n
Var ( X ) xk2 2 xk k 2 2 k
n k 1 n k 1 n k 1 n k 1
1 n(n 1)(2n 1) 1 n 2 (n 1) 2 n 2 1
2 .
n 6 n 4 12
71
P ( X k ) C nk p k q n k , k 0,1, 2,..., n, (3.2.1)
unde q 1 p .
Tabloul repartiiei variabilei aleatoare X este
0 1 2 ... n
X : 0 0 n 1 n1 2 2 n 2 n n 0
.
C
n p q C n pq C n p q ... C n p q
n n
Se observ c C k
n p k q n k C nk p nk q k ( p q) n 1.
k 0 k 0
Demonstraie
Valoare medie a variabilei aleatoare X este
n
E ( X ) 0 C n0 p 0 q n 1 C n1 pq n1 2 C n2 p 2 q n2 n C nn p n q 0 kC nk p k q nk .
k 0
P( x) ( px q ) n C n0 p n x n C n1 p n1qx n1 C nn1 pq n1 x C nn q n
n n
C nk p nk q k x nk C nk p k q nk x k .
k 0 k 0
72
Derivnd polinomul de mai sus obinem
n
Lund x 1 n relaia (3.2.3), obinem kC k
n p k q nk np ( p q) n1 , de unde
k 0
rezult c E ( X ) np .
Pentru a calcula dispersia lui X vom folosi formula
Var ( X ) E ( X 2 ) [ E ( X )]2 .
n
Media variabilei X 2 este E ( X 2 ) k 2 C nk p k q n k .
k 0
n
P' ( x) xP' ' ( x ) np ( px q ) n1 n(n 1) p 2 x ( px q) n2 k 2 C nk p k q n k x k 1 .
k 0
Propoziia 3.2.5. Dac este modulul (valoarea cea mai probabil) a unei
variabile aleatoare X cu repartiie binomial cu parametrii n i p, atunci
np q np p,
unde q 1 p.
73
Demonstraie
Dac este modulul variabilei X atunci
P( X 1) P( X ), P ( X 1) P( X ).
q p
1
C p q
n
1 n 1
C p q
n
n
n 1 np p
1 1 n 1
C n p q C n p q n p q np q,
1 n
(t ) ( pe it q) n , t R. (3.2.4)
Demonstraie
Conform formulei pentru funcia caracteristic avem
n n
n k
(t ) C p q k
n
k
e itk
C nk ( pe it ) k q n k ( pe it q ) n , t R.
k 0 k 0
q.e.d.
Demonstraie
Deoarece X ia valorile 0,1,, n, iar Y ia valorile 0,1,, m, rezult c variabila
X+Y va lua valorile 0,1,, n m. Variabila X+Y are valoarea k
( k 0,1,, n m) dac (X=0 i Y=k) sau (X=1 i Y=k-1) sau ... sau (X=k i
Y=0). Atunci vom obine
74
k k
P( X Y k ) P { X j , Y k j} P( X j , Y k j )
j 0 j 0
k k
P( X j ) P(Y k j ) C nj p j q n j C mk j p k j q mk j
j 0 j 0
k
p k q m n k C nj C mk j C mk n p k q m nk .
j 0
Deci am obinut
P ( X Y k ) C mk n p k q m n k , k 0,1, , n m,
(t ) pe it q pe it q pe it q
n m mn
, t R.
Din expresia de mai sus a funciei c tragem concluzia c variabila aleatoare X+Y
are repartiie binomial cu parametrii m+n i p. q.e.d.
lim P n p 0, (3.2.5)
n
n
oricare ar fi 0.
Demonstraie
Variabila aleatoare n care are ca valori numrul de realizri ale evenimentului
din problem are repartiie binomial cu parametrii n i p. Conform Teoremei
75
n
3.2.2 avem E ( n ) np i Var ( n ) npq . Variabila aleatoare va avea atunci
n
valoarea medie, dispersia i abaterea medie ptratic
1 np
m E n E ( n ) p,
n n n
1 pq pq
Var n 2 Var ( n ) , X .
n n n n
n
Vom folosi acum Inegalitatea lui Cebev pentru variabila i a .
n
Obinem
2 pq
P n p 2 2 .
n n
pq
Deoarece lim 0 , din inegalitatea de mai sus rezult inegalitatea (3.2.5).
n n 2
q.e.d.
P n p 1.
n
Rezolvare
S notm cu X variabila aleatoare care are ca valori numrul de
evenimente care se realizeaz n cadrul experienei. Valorile variabilei X sunt
0,1, 2,, n. Probabilitatea ca X s ia valoarea k ( k 0,1, 2,, n) este, conform
schemei lui Poisson (schema binomial generalizat) coeficientul lui x k din
polinomul
Q ( x) ( p1 x q1 )( p 2 x q 2 ) ( p n x qn ) , (3.2.6)
76
Q ( x) a0 a1 x a2 x 2 an x n , (3.2.7)
0 1 2 n
X : .
a0 a1 a2 a n
Suma tuturor elementelor de pe linia a doua a tabloului de mai sus este 1. ntr-
adevr
a0 a1 an Q(1) ( p1 q1 )( p 2 q 2 ) ( p n q n ) 1.
n
Valoarea medie a variabilei X este E ( X ) ka k . Ideea de demonstraie a
k 0
teoremei este asemntoare cu cea a Teoremei 3.2.4. Vom deriva polinomul Q,
scris sub cele dou forme de mai sus (3.2.6) i (3.2.7). Derivnd relaia (3.2.7)
obinem
de unde rezult
n
Q ' (1) a1 2a 2 3a3 na n kak M ( X ).
k 1
Q ' ( x ) p1 ( p k x q k ) p2 ( pk x qk ) p n ( pk x qk ) , (3.2.9)
k 1 k 2 k n
n
E ( X ) pk . (3.2.10)
k 1
n
Pentru a calcula dispersia, vom calcula mai nti E ( X 2 ) k 2 a k . nmulim
k 0
relaia (3.2.8) cu x i obinem
xQ' ( x) a1 x 2a 2 x 2 3a3 x 3 na n x n .
77
Derivnd egalitatea de mai sus rezult
n
Pentru x 1 deducem din relaia de mai sus Q' (1) Q' ' (1) k 2 a k . Deci
k 1
n
E ( X 2 ) Q ' (1) Q' ' (1) p k Q' ' (1). (3.2.11)
k 1
Q ' ' ( x) p1 p 2 ( p j x q j ) p3 ( p j x q j ) pn ( p j x q j )
j 1, 2 j 1,3 j 1, n
p n p1 ( p j x q j ) p 2 ( p j x q j ) pn1 ( p j x q j ).
j 1,n j 2,n j 1,n 1
pn [ E ( X ) p n ] E ( X )( p1 p2 p n ) ( p12 p 22 p n2 )
n
[ E ( X )]2 p k2 .
k 1
n n
E ( X 2 ) pk [ E ( X )]2 p k2 . (3.2.12)
k 1 k 1
n n
Var ( X ) E ( X 2 ) [ E ( X )]2 p k [ E ( X )]2 p k2 [ E ( X )]2
k 1 k 1
n n n n
p k p k2 pk (1 p k ) p k q k .
k 1 k 1 k 1 k 1
O alt metod mai simpl pentru calculul mediei i dispersiei variabilei X este
urmtoarea: s notm cu X k variabila aleatoare care are ca valori pe 1 dac Ak se
78
realizeaz, i pe 0 dac Ak nu se realizeaz, pentru k 1, 2,, n. Tablourile de
repartiie pentru variabilele X k sunt
1 0
X k : , k 1, 2, , n.
pk q k
n n
E ( X ) E( X k ) pk .
k 1 k 1
n n n n
Var ( X ) Var ( X k ) E ( X k2 ) [ E ( X k )]2 ( p k pk2 ) p k q k .
k 1 k 1 k 1 k 1
q.e.d.
0 1
X : , q 1 p.
q p
P ( X k ) C km11 p m q k m , k m, (3.3.1)
79
unde q=1-p.
m m 1 m2
X : m1 m 0 .
C m 1 p q C mm 1 p m q C mm11 p m q 2
m mq
E( X ) , Var ( X ) 2 . (3.3.2)
p p
Demonstraie
Valoarea medie a variabilei aleatoare X este
m m(m 1) 2
(1 x) m 1 x x , x (1,1).
1! 2!
80
(1 x) m C m0 1 C m1 x C m2 1 x 2 C kk1m x k m , x (1,1)
k m
sau
(1 x) m C mm11 C mm 1 x C mm11 x 2 C km11 x k m , x (1,1). (3.3.3)
k m
Folosind seria de mai sus (cu x=q), observm c suma tuturor probabilitilor
de pe linia a doua a tabloului repartiiei variabilei X este 1. ntr-adevr
m
m 1 m k m m m 1 k m m m 1 q
C k 1 p q p C k 1 q p (1 q) 1.
k m k m p p
xm
m
C km11 x k (3.3.4)
(1 x) k m
mx m1
m 1
kC km11 x k 1 , x (1,1). (3.3.5)
(1 x) k m
mq m1
kCkm11q k 1.
p m1 k m
(3.3.6)
mq m 1 m
E ( X ) kC km11 p m q k m p m q m1 kC km11q k 1 p m q m 1 .
k m k m p m 1 p
81
E ( X 2 ) k 2C km11 p m q k m p m q1 m k 2C km11q k 1.
k m k m
mx m
m 1
kC km11 x k , x (1,1).
(1 x) k m
x m1m(m x ) 2 m1 k 1
k C k 1 x , x (1,1).
(1 x) m 2 k m
q m1m(m q)
k 2Ckm11q k 1
k m p m2
.
q m 1m(m q ) m(m q)
E ( X 2 ) p m q1m ,
p m 2 p2
m 2 mq m 2 mq
Var ( X ) E ( X 2 ) [ E ( X )]2 2 2.
p2 p p
q.e.d.
m
pe it
(t ) it
, t R. (3.3.7)
1 qe
Demonstraie
Conform formulei pentru funcia caracteristic avem
82
(t ) C km11 p m q k m e itk p m e itm C km11 (qe it ) k m
k m k m
m
pe it
p m e itm (1 qe it ) m , t R,
it
1 qe
conform relaiei (3.3.3), care este adevrat i pentru numere complexe
x C , | x | 1. q.e.d.
1 2 3
X : m 0 ,
p q pmq pmq2
1 q pe it
E ( X ) , Var ( X ) 2 , (t ) , t R.
p p 1 qe it
C ak Cbn k
P( X k ) , k [max( 0, n b), min( n, a )]. (3.4.1)
C anb
0 1 2 n
n 1 n 2
X : C a0 Cbn CC1
C C2
C C .n 0
Cn
a b a b
a b
a b C an b C anb C
n
a b
83
Se observ c suma probabilitilor de pe linia a doua a tabloului de mai sus este
1. ntr-adevr avem
n
C ak C bnk 1 n
1
n
n C k
a C bnk n
C anb 1.
k 0 C a b Ca b k 0 C a b
Exemplul 3.4.2. Dac dintr-o urn care conine a bile albe i b bile negre se
extrag n bile una cte una, fr ntoarcerea bilei extrase n urn (sau se extrag n
bile simultan), iar X este numrul de bile albe extrase, atunci X are repartiie
hipergeometric cu parametrii a, b i n, conform schemei hipergeometrice
(schema bilei nentoarse).
abn
E ( X ) ap , Var ( X ) npq , (3.4.2)
a b 1
a b
unde p , q 1 p .
a b a b
Demonstraie
Valoarea medie a variabilei aleatoare X este
n
C ak C bn k a n
k 1 a an
E( X ) k n
n C a 1 Cbn k n
C anb11 ap .
k 0 C a b C a b k 1 C a b ab
Pentru calculul dispersiei, vom calcula mai nti media variabilei X 2 ; avem
n
C ak Cbn k n
C ak Cbnk n
C ak Cbnk
E( X 2 ) k 2 k ( k 1) k
k 0 C anb k 1 C anb k 0 C anb
a (a 1) n k 2 n k a (a 1) n2 an an(a 1)(n 1)
n
C a b k 2
C a 2 C b E ( X ) n
C a b
C a b 2
a b (a b)(a b 1)
an
.
ab
84
an(a 1)(n 1) an a 2n2
Var ( X ) E ( X 2 ) [ E ( X )]2
(a b)(a b 1) a b (a b) 2
abn(a b n) abn
2
npq .
(a b) (a b 1) a b 1
a b
P( X 1 1) , P ( X 1 0) .
a b ab
1 0
Deci tabloul repartiiei variabilei X 1 este X 1 : a b . Pentru variabila
a b a b
X 2 obinem (n urn au rmas a+b-1 bile)
P( X 2 1) P( X 2 1 / X 1 1) P( X 1 1) P( X 2 1 / X 1 0) P( X 1 0)
a 1 a a b a (a b 1) a
,
a b 1 a b a b 1 a b a b 1)(a b) a b
P( X 2 0) P( X 2 0 / X 1 1) P( X 1 1) P( X 2 0 / X 1 0) P( X 1 0)
b a b 1 b b(a b 1) b
.
a b 1 a b a b 1 a b (a b)(a b 1) a b
1 0
Deci tabloul repartiiei variabilei X 2 este X 2 : a b . Pentru variabila
ab a b
X 3 avem (n urn au rmas a+b-2 bile)
P( X 3 1) P( X 3 1 / X 2 1) P( X 2 1) P( X 3 1 / X 2 0) P( X 2 0)
[ P(( X 3 1 / X 2 1) / X 1 1) P( X 1 1) P(( X 3 1 / X 2 1) / X 1
0) P( X 1 0)]P( X 2 1) [ P(( X 3 1 / X 2 0) / X 1 1) P( X 1 1)
P(( X 3 1 / X 2 0) / X 1 0) P( X 1 0)]P( X 2 0)
85
a2 a a 1 b a a 1 a
a b2 a b a b2 a b a b a b2 a b
a b b (a 2)a 2 2(a 1)ab ab 2
a b2 a b a b (a b 2)(a b) 2
a (a b)(a b 2) a
2
.
(a b 2)(a b) ab
b
Asemntor se arat c P( X 3 0) ( 1 P( X 3 1)). Deci tabloul
a b
1 0
repartiiei variabilei X 3 este X 3 : a b .
a b a b
n n
a na
E ( X ) E( X k ) np .
k 1 k 1 a b ab
n
Pentru dispersie nu mai putem scrie c Var ( X ) este egal cu Var ( X
k 1
k ),
k
P( X k ) e , k 0,1, 2, (3.5.1)
k!
86
Tabloul repartiiei variabilei X este
0 1 2 k
X : 0 1
2
k
.
e e e e
0! 1! 2! k!
x x2 xk
ex 1 , x R . (3.5.2)
1! 2! k!
k
P( X k ) e k! e e 1.
k 0
k 0
E ( X ) , Var ( X ) . (3.5.3)
Demonstraie
Valoarea medie a variabilei X este
k
k 1
E( X ) k e e e e .
k 0 k! k 1 ( k 1)!
k 2 k
k
k
E( X 2 ) k 2 e (k k ) e k e k (k 1) e
k 0 k! k 1 k! k 1 k! k 2 k!
2 k 2
E( X ) e E ( X ) 2 e e 2 .
k 2 ( k 2)!
87
Propoziia 3.5.3. Dac variabila aleatoare X are repartiie Poisson cu
parametrul , atunci funcia sa caracteristic este
it
(t ) e (e 1)
, t R. (3.5.4)
Demonstraie
Folosind formula de calcul de la funcia caracteristic, avem
k itk
k itk
(e it ) k it it
(t ) e e e e e e e e e (e 1) , t R.
k 0 k! k 0 k! k 0 k!
q.e.d.
Demonstraie
Variabila aleatoare X 1 X 2 are ca valori pe 0,1, 2, Fie k 0 ntreg.
Atunci avem
k
P ( X 1 X 2 k ) P j 0 ( X 1 j , X 2 k j ) P ( X 1 j , X 2 k j )
k
j 0
k
1 k
2 e ( 1 2 )
j k j k
P( X 1 j ) P( X 2 k j ) e e 1 2
C k
j
1j k2 j
j 0 j 0 j! (k j )! k! j 0
k
(1 2 ) ( 1 2 )
e .
k!
Deducem astfel c variabila aleatoare X 1 X 2 are repartiie Poisson cu
parametrul 1 2 . Folosind funciile caracteristice ale variabilelor X 1 , X 2 ,
exprimate cu ajutorul formulei (3.5.4), i anume
1 ( eit 1) 2 ( e it 1)
1 (t ) e , 2 (t ) e , t R , deducem c funcia caracteristic a
variabilei X 1 X 2 este
it it it
(t ) 1 (t ) 2 (t ) e 1 ( e 1)
e 2 (e 1)
e ( 1 2 )(e 1)
, t R.
88
Teorema 3.5.5. Fie k N fixat, iar pentru n k considerm variabilele X n care
au repartiii binomiale cu parametrii n i p n , astfel nct toate s aib aceeai
valoare medie . Atunci are loc relaia
k
lim P( X n k ) e . (3.5.5)
n k!
Rezolvare
Deoarece variabilele X n , n k au aceeai valoare medie , deducem
conform primei relaii din (3.5.3) c valoarea medie a acestor variabile este
E ( X n ) np n . Deci pn / n . Atunci obinem
k n k
n(n 1)(n k 1)
lim P( X n k ) lim C nk p nk qnn k lim 1
n n n k! n n
n k
k n(n 1) (n k 1) k
lim k
lim 1 e ,
k ! n n n
n k!
adic relaia (3.5.5). q.e.d.
Rezolvare
Din demonstraia teoremei 3.5.2 tim c m1 ( X ) E ( X ) , iar
m2 ( X ) E ( X 2 ) 2 . Momentul iniial de ordinul al treilea al variabilei X
k
este m3 ( X ) E ( X 3 ) k 3 e .
k 0 k!
Deoarece k 3 k (k 1)(k 2) 3k (k 1) k , vom scrie pe m3 ( X ) astfel
89
k
k
k
m3 ( X ) k (k 1)(k 2) e 3 k (k 1) e k e
k 2 k! k 1 k! k 1 k!
k 3
k 2
k 1
3e 32 e e 3e e
k 3 ( k 3)! k 2 ( k 2)! k 1 ( k 1)!
32 e e e e 3 32 .
3 ( X ) E ( X ) 3 E ( X 3 3X 2 32 X 3 ) E ( X 3 ) 3E ( X 2 )
32 E ( X ) 3 m3 3 m2 32 m1 3 3 32 3 (2 )
33 3 .
k
k
m4 ( X ) k (k 1)(k 2)(k 3) e 6 k (k 1)(k 2) e
k 3 k! k 2 k!
k k
k 4
k 3
7 k (k 1) e k e 4 e 63e
k 1 k! k 1 k! k 4 ( k 4)! k 3 ( k 3)!
k 2 k 1
72 e e 4 e e 63e e 72 e e
k 2 ( k 2)! k 1 ( k 1)!
e e 4 63 72 .
4 ( X ) E ( X ) 4 E ( X 4 4X 3 62 X 2 43 X 4 ) E ( X 4 )
4E ( X 3 ) 62 E ( X 2 ) 43 E ( X ) 4 m4 4m3 62 m2 43 m1 4
4 63 72 4 (3 32 ) 62 (2 ) 44 4 32 .
90
Capitolul 4
Introducere
Vom prezenta n acest capitol principalele legi de probabilitate ale
variabilelor aleatoare continue, i anume: legea continu uniform (rectangular),
legea normal (Gauss-Laplace), legea log-normal, legea gamma, legea beta,
legea 2 (Helmert-Pearson), legea Student (t) i cazul su particular legea
Cauchy, legea Snedecor i legea Fisher, legea Weibull i cazul su particular
legea exponenial.
1
, x 2 , 2 ,
f ( x) (4.1.1)
0, x , , .
2 2
1 x
2
f ( x ) dx
2 dx 1.
2
2
91
0, x , ,
2
1
F ( x) x , x , , (4.1.2)
2 2 2
1, x , .
2
2
E ( X ) , Var ( X ) . (4.1.3)
12
Demonstraie
Valoarea medie a variabilei X este
x 1 2
2
E ( X ) xf ( x ) dx
2 dx x ,
2
2
2
1 1 2
Var ( X ) ( x ) 2 f ( x ) dx
2 (x )2 dx ( x )3 2
.
2
3
2
12
q.e.d.
92
i it it
e e 2 , t R * ,
2
(t ) t (4.1.4)
1, t 0.
Demonstraie
Pentru t 0, avem
i it 2 it
1 1 itx
2
(t ) e f ( x) dx 2 e itx dx
itx
e 2
e e
,
2 it
2
t
iar (0) f ( x ) dx 1. q.e.d.
Rezolvare
Momentul iniial de ordinul al doilea este
3
1 2 1 3 1
m2 ( X ) x 2 f ( x ) dx
2
x dx x 2
2
3
2
3 2
3
1 2 3 2
3 2 .
2 3 4 12
4
3
31 1 4
2
1
m3 ( X ) x f ( x) dx
2
x dx x
2
4
2
4 2
4
1 3 3 3 2
( 4 ) ,
2 4 4
3
31 1
3 ( X ) ( x ) f ( x ) dx
2 (x ) dx ( x )4 2
0.
2
4
2
93
Aplicaia 4.1.5. Variabilele aleatoare X i Y sunt independente. X are repartiie
uniform pe intervalul [0,1], iar Y are repartiie uniform pe intervalul [0,2]. S
se calculeze densitatea de probabilitate a variabilei X+Y.
Rezolvare
Dac f1 i f 2 sunt densitile de probabilitate ale variabilelor aleatoare X
i respectiv Y, atunci f1 ( x) dx 1 i f 2 ( x) dx 1. Deducem din aceste
1
relaii c parametrii variabilei X sunt 1 1 i 1 , iar parametrii variabilei Y
2
sunt 2 2 i 2 1. Atunci densitile de probabilitate vor avea forma
1
1, x [0,1], , x [0,2],
f 1 ( x) f 2 ( x) 2
0, x [0,1], 0, x [0,2].
f ( x) f1 ( x y ) f 2 ( y ) dy .
x x 1 x
f ( x) f1 ( x y ) f 2 ( y ) dy dy .
0 0 2 2
x x 1 1
f ( x) f1 ( x y ) f 2 ( y ) dy dy .
x 1 x 1 2 2
2 2 1 3 x
f ( x) f1 ( x y ) f 2 ( y ) dy dy .
x 1 x 1 2 2
94
Deci densitatea de probabilitate a variabilei X+Y este funcia
x / 2, x [0,1),
1 / 2, x [1,2),
f ( x)
(3 x ) / 2 , x [2,3],
0, x [0,3].
( x m )2
1
2 2
f ( x; m, ) e , x R. (4.2.1)
2
1 2 2 2
f ( x ) dx e y dy e y dy 1.
0
2
Am folosit mai sus integrala lui Euler-Poisson e y dy / 2 .
0
Graficul funciei f are form de clopot (vezi Figura 4.2.1). Dreapta de
ecuaie x m este ax de simetrie pentru acest grafic, iar pentru x m se obine
1
valoarea maxim a funciei f, i anume . Punctele x m i x m
2
sunt puncte de inflexiune.
95
Figura 4.2.1
x2
1
2
f ( x; 0,1) e , x R. (4.2.2)
2
x 0 x 1
F ( x; 0,1) f (t;0,1) dt f (t; 0,1) dt f (t ; 0,1) dt ( x) , (4.2.3)
0 2
1 x t 2 / 2
unde ( x) e dt . Funcia de mai sus se numete funcia
2 0
integral a lui Laplace, pentru valorile creia sunt ntocmite tabele.
Dac variabila aleatoare X urmeaz legea normal cu parametrii m i
1
, atunci variabila aleatoare Y ( X m) urmeaz legea normal cu parametrii
0 i 1. ntr-adevr, dac F1 este funcia de repartiie a variabilei Y, atunci
F1 ( x) P(Y x) P( X m x) F (m x; m, ) , (4.2.4)
96
1 x2 / 2
f1 ( x) F1' ( x) f (m x; m, ) e f ( x; 0,1), x R .
2
F ( x; 0,1) F (m x; m, ), x R. (4.2.5)
xm 1 xm
F ( x; m, ) F ; 0,1 . (4.2.6)
2
E ( X ) m , Var ( X ) 2 . (4.2.7)
Demonstraie
Valoarea medie a variabilei aleatoare X este
( x m )2
1
2 2
E ( X ) xf ( x; m, ) dx xe dx .
2
xm
n integrala de mai sus vom face schimbarea de variabil y , de unde
rezult dx dy ; pentru x rezult y , iar pentru x rezult
y . Deci obinem
1 2 2
E( X ) (y m)e y / 2 dy ye y /2
dy
2 2
m 2
ey /2
dy m f ( y; 0,1) dy m .
2
( x m )2
2 1
2
2 2
Var ( X ) ( x m) f ( x; m, ) dx ( x m) e dx .
2
97
Folosind schimbarea de variabil de mai sus, obinem
1
2 2 y2 / 2 2 2 y2 / 2
Var ( X ) y e dy y e dy
2 2
2 2 '
2
2 y ye y2 / 2
dy
2
y e y2 / 2
dy
2
2
ye y / 2
2 y2 / 2
e dy 2 .
2
2t 2
imt
(t ) e 2
, t R.
(4.2.8)
Demonstraie
Funcia caracteristic a variabilei X este
( x m )2 x 2 2 mx m 2 2 2itx
itx 1
itx
2 2 1
2 2
(t ) e f ( x ) dx e e dx e dx
2 2
x 2 2 x ( m 2it ) ( m 2it ) 2 m 2 ( m 2it ) 2
1
2 2
2 2
e e dx
2
m 2 4i 2t 2 2 mit 2 m 2 [ x ( m 2it )]2
1 2 2
2 2
e e dx , t R .
2
x (m 2 it )
Folosind schimbarea de variabil u , obinem
2
2t 2 2t 2
1 imt
2
u 2
imt
2
(t ) e e du e , t R . q.e.d.
98
Demonstraie
a) Din relaia (4.2.6) i continuitatea funciei F deducem c
1 b m 1 a m
P(a X b) F (b; m, ) F (a; m, )
2 2
bm am
.
P(| X m | k ) P(m k X m k ) (k ) (k ) 2 (k ) ,
2 p 1 ( X ) 0, 2 p ( X ) (2 p 1)!! 2 p , p N * , (4.2.12)
Demonstraie
Momentul centrat de ordinul k este
( x m )2
k 1
k
2 2
k ( X ) ( x m) f ( x) dx ( x m) e dx . (4.2.13)
2
Obinem astfel
0 ( X ) f ( x ) dx 1, 1 ( X ) ( x m) f ( x ) dx 0, 2 ( X ) Var ( X ) 2 .
99
Pentru k 2 , n integrala din relaia (4.2.13) vom face schimbarea de variabil
xm
y , de unde deducem c dx 2 dy ; apoi pentru x rezult
2
y , iar pentru x rezult y . Obinem atunci
( 2 ) k ( 2 ) k
k ( X )
k
y e y2
dy
2
dy
y k 1 e y
2 '
( 2 ) k 2 ( 2 ) k 2
y k 1e y
(k 1) y k 2 e y dy
2 2
( 2 ) 2 ( 2 ) k 2 2
(k 1) y k 2 e y dy (k 1) 2 k 2 .
2
Demonstraie
Vom calcula mai nti densitile de probabilitate pentru variabilele X+Y
i X-Y, pentru cazul particular m1 m2 0 i 1 2 1. Dac notm cu f i g
densitile de probabilitate ale variabilelor X i Y, atunci conform relaiei (4.2.2)
avem
1 x2 / 2
f ( x) g ( x) e , x R.
2
100
( x y )2 y2
x2
y 2 xy
1
2
2
1
2
h( x ) f ( x y ) g ( y ) dy e e dy e dy
2 2
2
x x2 y x / 2 z x2 x2
1 y
2
4
1 4
z2 1 4
e e dy e e dz e
2 2
2
x2
1 2 )2
e 2( , x R.
2 2
( x y )2 y2
x2
y 2 xy
1
2
2
1
2
k ( x) f ( x y ) g ( y ) dy e e dy e dy
2 2
2
x x2 y x / 2 z x2 x2
1 y
2
4
1 4
z2 1 4
e e dy e e dz e
2 2
2
x2
1 2 )2
e 2( , x R.
2 2
12t 2 22t 2
im1t im2t
1 (t ) e 2
, 2 (t ) e 2
, t R .
i ( m1 m2 ) t
2 2
1 2 t 2
(t ) 1 (t ) 2 (t ) e 2
, t R .
101
i ( m1 m2 ) t
2 2
1 2 t 2
~ (t ) 1 (t ) 2 (t ) e 2
, t R.
X
n ipotezele Teoremei 4.2.8 se mai spune c variabila aleatoare este
asimptotic normal.
X np 1 b
x2 / 2
lim P a n b P ( a X b) e dx . (4.2.14)
n npq 2 a
Teorema 4.2.9 ne spune c pentru valori mari ale lui n putem folosi tabelele
legii normale pentru studiul variabilelor aleatoare cu repartiii binomiale. Pentru
n 30 , exist urmtoarea regul practic care ne permite s aproximm repartiia
binomial prin cea normal:
- Dac min (np, nq ) 10, atunci aproximarea este foarte bun.
- Dac min (np, nq ) (5,10), atunci aproximarea este acceptabil, dac nu
este nevoie de mare precizie.
- Dac min (np, nq ) 5, atunci nu se folosete aceast aproximare.
Teorema lui Moivre-Laplace este un caz particular al aa numitei Teorema
limit central, care spune c funcia de repartiie a unei sume de variabile
aleatoare independente tinde n condiii destul de generale ctre funcia de
102
repartiie normal. De fapt, prin Teorema limit central se nelege un grup de
teoreme care trateaz problema repartiiei limit a sumelor de variabile aleatoare
(nu ntotdeauna independente). Rezultatul cel mai general n cazul variabilelor
aleatoare independente este teorema lui Lindeberg-Fellar. n aplicaii este foarte
util un caz particular al acestei teoreme, prezentat mai jos.
1 n
de repartiie a variabilei aleatoare X ( X k mk ) .
(n) k 1
Rezolvare
S notm cu X variabila aleatoare care are ca valori numrul de apariii
ale stemei, atunci cnd se arunc moneda de 256 de ori. Variabila X are
repartiia binomial cu parametrii n=256 i p=1/2 (probabilitatea ca la o aruncare
s apar stema). n aceast aplicaie trebuie s calculm P(112<X<144).
Deoarece E(X)=np=128, iar X npq 8 , atunci are loc relaia
X 128
P(112 X 144) P 2 2 .
8
X 128
P 2 2 P(2 Y 2) (2) (2) 2 (2) 0,95 .
8
Aplicaia 4.2.12. De cte ori trebuie s aruncm un zar corect astfel nct
probabilitatea ca abaterea frecvenei relative a feei 1 de la numrul p=1/6 s
fie cuprins ntre -0,03 i 0,03, este 0,95.
Rezolvare
103
Dac n n aruncri faa 1 apare de n ori, vom determina pe n astfel nct
s aib loc relaia
P 0,03 n p 0,03 0,95. (4.2.15)
n
np 0,03 n
P n 0,95 , q 1 p 5 . (4.2.16)
npq pq 6
0,03 n
Folosind relaiile (4.2.14) i (4.2.9) (cu m 0, 1 ) pentru b a ,
pq
din relaia (4.2.16) deducem c
0,03 n
2 0,95 0,18 n 0,475
pq 5
0,18 n 1
F 0,18 n 0,975.
5 2 5
Aplicaia 4.2.13. O main produce o pies circular. Piesa este bun dac
diametrul su d este cuprins ntre 3,99 cm i 4,01 cm. Care este probabilitatea
producerii unei piese defecte de ctre maina respectiv, tiind c d are
repartiie normal cu media 4,002 cm i abaterea medie ptratic 0,005 cm ?
Rezolvare
Conform formulei (4.2.9), probabilitatea ca o pies s fie bun este
bm am 4,01 4,002
P(3,99 d 4,01)
0,005
3,99 4,002
(1,6) (2,4) (1,6) (2,4) 0,937 .
0,005
104
Aplicaia 4.2.14. O main produce o pies circular. Cnd maina este bine
reglat, diametrul d al pieselor are repartiie normal cu media 10 cm i
abaterea medie ptratic 0,08 cm. Se iau la ntmplare 4 piese fabricate de
main i se constat c media aritmetic a diametrelor acestor piese este 10,14
cm. Se poate afirma c maina s-a dereglat ?
Rezolvare
Fie d1 , d 2 , d 3 , d 4 diametrele celor 4 piese alese la ntmplare. Acestea sunt
4 variabile aleatoare indepedente cu repartiii normale cu media 10 cm i
abaterea medie ptratic 0,08. Atunci variabila d (d1 d 2 d 3 d 4 ) / 4 are de
asemenea repartiie normal cu media 10 cm i abaterea medie ptratic 0,04 cm.
ntr-adevr, avem
d d 2 d3 d 4 1 4
m E (d ) E 1 E (d i ) 10,
4 4 i 1
d d 2 d3 d 4 1 4
Var (d ) Var 1 Var (d i ) 0,0016, d 0,04.
4 16 i 1
2
1
(ln x m )
2
e 2 , x 0,
f ( x; m, ) x 2 (4.3.1)
0, x 0.
105
ln x m
(ln x m ) 2 t t2
1 1 2 2
1
2
f ( x ) dx e dx e dt 1.
2 0 x 2
unde F(x;0,1) este funcia de repartiie normal standard. Deducem din ultima
ln X m
relaie c pentru valorile pozitive ale lui X, variabila Y urmeaz legea
normal standard.
2k 2
mk
mk ( X ) e 2,
, k N *. (4.3.2)
Demonstraie
Conform formulei pentru momentele iniiale de ordinul k, avem
(ln x m ) 2 ln x y
k
1 k
2 2
mk ( X ) x f ( x ) dx x e dx
0
x 2
2
( y m ) y 2 2 my m 2 2 2 yk
1
ky
2 2
1
2 2
e e dy e dy
2 2
y 2 2 y ( m 2 k ) ( m 2 k ) 2 ( m 2 k ) 2 m 2
1
2 2
e dy
2
[ y ( m 2 k )]2 4 k 2 2 m 2 k 4k 2 2 mk 2 [ y ( m 2k )]2
1
2 2 1 2 2
2 2
2
e dy
2
e
e dy.
Notm ( y m 2 k ) /( 2 ) u i obinem
2 k 2 2 mk 2k 2
1 2
u 2
mk
2
mk ( X ) e e 2 du e . q.e.d.
2
106
Din relaia (4.3.2) deducem c media i dispersia variabilei X cu repartiie
log-normal cu parametrii m i sunt
2
m 2 2
E ( X ) m1 ( X ) e 2
, Var ( X ) m2 ( X ) [m1 ( X )]2 e 2 m (e 1) . (4.3.3)
x p1e x
, x 0,
f ( x) ( p) (4.4.1)
0, x 0,
unde ( p ) x p 1e x dx , p 0 este integrala lui Euler de al doilea tip sau
0
funcia gamma a lui Euler.
1 p 1 x
f ( x ) dx x e dx 1.
( p ) 0
Propoziia 4.4.2. Integrala (funcia) lui Euler ( p ) x p 1e x dx , p R
0
verific urmtoarele proprieti:
a) ( p ) este convergent pentru p>0 i divergent pentru p 0 ;
b) ( p 1) p( p ), p 0;
c) (n) (n 1)!, n N * ;
d) 1 / 2 .
107
mk ( X ) p ( p 1) ( p k 1), k N * . (4.4.2)
Demonstraie
Momentul iniial de ordinul k este
1 k p1 x ( k p )
mk ( X ) x k f ( x) dx x e dx
( p ) 0 ( p )
(k p 1)(k p 1) (k p 1) ( p 1) p( p)
( p) ( p )
(k p 1)(k p 2) ( p 1) p.
p x p 1e x
, x 0,
f ( x ) ( p) (4.4.4)
0, x 0,
p ( p 1) ( p k 1)
mk ( X ) k
, k N*, (4.4.5)
p p
E ( X ) m1 ( X ) , Var ( X ) m2 ( X ) [m1 ( X )]2 2 . (4.4.6)
108
Propoziia 4.4.6. Dac variabila aleatoare X are repartiie gamma generalizat
cu parametrii p 0 i 0 , atunci funcia sa caracteristic este
p
it
(t ) 1 , t R . (4.4.7)
Demonstraie
Pentru determinarea funciei caracteristice a variabilei X vom folosi formula care
d momentul de ordinul k al variabilei X n funcie de derivatele funciei
caracteristice c n punctul 0, i anume mk ( k ) (0) i k , ( m0 1 ), precum i
dezvoltarea n serie de puteri a funciei care are forma urmtoare
( k ) (0) k mk i k k (it ) k
(t ) t t mk .
k 0 k! k 0 k! k 0 k!
(it ) k
(it ) k p( p 1) ( p k 1)
(t ) mk
k 0 k! k 0 k! k
k p
p ( p 1)( p k 1) it it
1 , t R.
k 0 k!
q.e.d.
p
(t ) 1 it , t R . (4.4.8)
Demonstraie
S notm cu f i g densitile de probabilitate pentru variabilele X i Y.
Deci
109
1
x p 1e x , x 0,
f ( x) g ( x) ( p )
0, x 0.
Densitatea de probabilitate h a variabilei X+Y este h( x) f ( x y ) g ( y ) dy.
Dac x 0 atunci
0
h( x) f ( x y ) g ( y ) dy f ( x y ) g ( y ) dy 0,
0
x x 1 1
h( x) f ( x y ) g ( y ) dy ( x y ) p1 e x y y q1e y dy
0 0 ( p) ( q)
ex x
( x y ) p 1 y q1 dy.
( p ) ( q ) 0
Pentru calculul ultimei integrale de mai sus facem schimbarea de variabil y=tx,
deci dy=xdt; pentru y 0 rezult t 0, iar pentru y x rezult
t 1. Obinem astfel
ex 1
p 1 q 1 e x x p q1 1 q 1
h( x ) ( x tx ) ( tx ) x dt x (1 x) p1 dt
( p ) ( q ) 0 ( p ) ( q ) 0
B ( q, p ) e x x p q 1
e x x p q 1 .
( p ) ( q ) ( p q )
p
1 (t ) 1 it , 2 (t ) (1 it ) q , t R .
( pq)
(t ) 1 (t ) 2 (t ) 1 it , t R.
110
Deducem din relaia obinut c X+Y are repartiie gamma cu parametrul p+q.
q.e.d.
Demonstraie
S notm cu G(x) funcia de repartiie a variabilei Y. Deoarece Y 0 ,
atunci pentru x 0 rezult c F ( x ) P(Y x ) 0 . Pentru x 0 avem
( X m) 2 X m
G ( x) P(Y x) P 2
x P x x
2 2
m 2x m m 2x m
P (m 2 x X m 2 x )
2 2x 2
2 ( 2 x ) e t /2
dt.
0
1 x 1 1 / 2 x
g ( x) G' ( x) e x e ,
x
1
x 1/ 2 e x , x 0,
g ( x ) (1 / 2)
0, x 0,
Rezolvare
Momentul centrat de ordinul al treilea este
111
3 ( X ) ( x p ) 3 f ( x) dx x 3 f ( x) dx 3 p x 2 f ( x ) dx 3 p 2 xf ( x) dx
p 3 f ( x ) dx m3 3 pm2 3 p 2 m1 p3 p ( p 1)( p 2) 3 p 2 ( p 1)
3 p p 3 2 p,
3
4 ( X ) ( x p ) 4 f ( x ) dx x 4 f ( x) dx 4 p x 3 f ( x ) dx 6 p 2 x 2 f ( x) dx
4 p 3 xf ( x ) dx p 4 f ( x) dx m4 4 pm3 6 p 2 m2 4 p 3 m1 p 4
1
x p 1 (1 x) q 1 , x (0,1),
f ( x) B ( p, q ) (4.5.1)
0, x (0,1),
1
unde B ( p, q ) x p 1 (1 x) q 1 dx , p, q 0 este integrala lui Euler de primul tip
0
sau funcia beta a lui Euler.
1 1
f ( x ) dx x p1 (1 x ) q1 dx 1.
B ( p, q) 0
1
Propoziia 4.5.2. Integrala lui Euler B ( p, q ) x p 1 (1 x) q 1 dx , p, q R
0
verific urmtoarele proprieti
a) B( p, q ) este convergent pentru p>0 i q>0, i n rest este divergent;
112
b) B( p, q ) B(q, p ), p, q 0;
p 1
c) B( p, q ) B( p 1, q ), p 1, q 0;
p q 1
q 1
d) B( p, q ) B( p, q 1), p 0, q 1;
p q 1
( p 1)(q 1)
e) B( p, q ) B( p 1, q 1), p 1, q 1;
( p q 1)( p q 2)
(n 1)!
f) B( p, n) B(n, p) , n N * , p 0;
p ( p 1)( p n 1)
(m 1)!(n 1)!
g) B(m, n) , m, n N * ;
(m n 1)!
h) B( p 1, q ) B( p, q 1) B( p, q), p, q 0;
t p 1
j) B ( p, q ) dt , p, q 0;
0 (1 t ) p q
( p ) ( q )
k) B( p, q ) , p, q 0;
( p q )
l) B( p,1 p) ( p) (1 p ) , p (0,1).
sin( p )
p ( p 1) ( p k 1)
mk ( X ) , k N *. (4.5.2)
( p q)( p q 1)( p q k 1)
Demonstraie
Momentul iniial de ordinul k este
113
1 1 B ( k p, q )
mk ( X ) x k f ( x) dx x k p 1 (1 x) q 1 dx
B ( p, q ) 0 B ( p, q)
k p 1 B(k p 1, q) (k p 1) ( p 1) p B( p, q )
p q k 1 B ( p, q) ( p q k 1)( p q) B( p, q )
p ( p 1) ( p k 1)
,
( p q )( p q 1) ( p q k 1)
p pq
E ( X ) m1 ( X ) , Var ( X ) m2 ( X ) [m1 ( X )]2 2
.
pq ( p q) ( p q 1)
(4.5.3)
n x
1 2
1
2
n x e , x 0,
2 n
f ( x) 2 (4.6.1)
2
0, x 0.
n x
1
2
1
2
f ( x) dx n x e dx 1.
0
2 n
2
2
114
Pentru verificarea relaiei de mai sus , facem n integrala dat schimbarea de
variabil x/2=y, de unde rezult dx=2dy; dac x 0 atunci y 0 , iar dac
x atunci y . Obinem astfel
n
n
1 n
1 22 1
f ( x) dx
n
n 0 2 y 2
0
e y 2 dy n
n
y 2 e y dy
2 2
2 2
2 2
1 n
1.
n 2
2
n Figura 4.6.1 sunt reprezentate grafic funciile f pentru diverse valori ale
parametrului n.
Figura 4.6.1
Demonstraie
Momentul iniial de ordinul k este
n x
1 k 1
mk ( X ) x k f ( x ) dx n x2 e 2
dx.
0
2n
2
2
115
Cu aceeai schimbare de variabil de mai sus folosit pentru calculul integralei
f ( x ) dx , obinem
n
n k n
1
2
k 1
y 22
2
k 1
y
mk ( X ) n (2 y) e 2 dy n n 0 y e dy
n 0
2
2 2 2
2 2
n
2 k k
2 2 k n n 1 n k 1 n(n 2) (n 2k 2).
n 2 2 2
2
q.e.d.
n x
1 1 2
2 2
x e , x 0,
n n
f ( x) ( 2 ) (4.6.4)
2
0, x 0.
mk ( X ) n(n 2) (n 2k 2) 2 k , k N * , (4.6.5)
116
Propoziia 4.6.5. Dac variabila aleatoare X are repartiie 2 generalizat cu
parametrii n i ( n N * , 0 ), atunci funcia sa caracteristic este
n
(t ) (1 2it 2 ) 2 , t R . (4.6.7)
Demonstraie
Folosind formula din demonstaia Propoziiei 4.4.6, obinem
(it ) k
(it ) k nn n
(t ) mk (2 2 ) k 1 k 1
k 0 k! k 0 k! 2 2 2
nn n q.e.d.
1 k 1 n
2 2 2 (1 2it 2 ) 2 , t R.
(2it 2 ) k
k 0 k!
n
(t ) 1 2it 2 , t R . (4.6.8)
Demonstraie
S notm cu f i g densitile de probabilitate ale variabilelor X i Y, adic avem
117
m x n x
1 2
1
2
1 2
1
2
m x e , x 0, n x e , x 0,
2 m 2 n
f ( x) 2 g ( x ) 2
2 2
0, x 0, 0, x 0.
h( x) f ( x y ) g ( y ) dy.
m x y n y
x 1 1 1 1
h( x ) m
( x y) 2 e 2
n
y2 e 2
dy
0
m 2 n
2
2 2
2 2
x
m n
2
e x
2
1
2
1
mn ( x y) y dy.
0
2 m n
2
2 2
x
m n
2
e 1 1 1
h( x) mn ( x tx ) 2 (tx) 2 x dt
0
2 m n
2
2 2
x x m n
mn m n 1
2
e 2
1 1
2
1
2
1 e 2x 2 m n
mn
x (1 t ) t dt m n B ,
2 m n 0
m n 2 2
2 2 2
2 2 2 2
m n x
1 2
1
2
mn x e , x 0.
2 mn
2
2
118
Concluzia acestei propoziii o putem obine mai direct folosind funciile
caracteristice. Fie 1 i 2 funciile caracteristice ale variabilelor X i Y, i
anume
m n
1 (t ) 1 2it 2 , 2 (t ) (1 2it ) 2 , t R .
mn
(t ) 1 (t ) 2 (t ) 1 2it 2 , t R.
Deducem din relaia obinut c X+Y are repartiie 2 cu m+n grade de libertate.
q.e.d.
n 1 n 1
2 2
2 x
f ( x) 1 , x R. (4.7.1)
n n
n
2
f ( x ) 0, x R i f ( x ) dx 1.
n 1 n 1 n 1 n 1
2 2 2
2 x 2 x2 2
f ( x) dx 1 dx 1 dx.
n n n 0 n
n n
2 2
119
n ultima integrala de mai sus facem schimbarea de variabil x 2 / n y, x 0, de
unde rezult
n
dx dy.
2 y
n 1 n 1
1 / 2
2 y 2 1 n
f ( x) dx n 0 n 1
dy B ,
n 2 2
(1 y ) 2 2
2 2
n 1 1 n
2 2 2
1.
n n 1
2 2
m2 k 1 ( X ) 0, 2k 1 n,
n k (2k 1)!! (4.7.2)
m2 k ( X ) , 2 k n, k N * .
(n 2)(n 4)(n 2k )
Demonstraie
Pentru 2k 1 n , momentele de ordin impar sunt nule. ntr-adevr
n 1 n 1
2 2
2 x
m2 k 1 ( X )
x 2 k 1 1 dx 0, (4.7.3)
n
n
n
2
deoarece funcia f este impar (integrala de mai sus este convergent). Dac
2k 1 n integrala din (4.7.3) este divergent, deci X nu are momente iniiale de
ordinul 2k 1.
Pentru momentul de ordin par m2 k ( X ), cu 2k n avem
120
n 1 n 1
2 2 2
2 x 2 k 1 x
m2 k ( X ) dx. (4.7.4)
n 0
n
n
2
n
x 2 / n y, x 0, de unde rezult dx dy. Intervalul [0, ) se transform n
2 y
intervalul [0, ) i astfel obinem
n 1 n 1
2 n 1 n k 1 n 1
2 (ny ) k (1 y ) 2 n 2 y k 2 (1 y ) 2 dy
m2 k ( X ) dy
n 0 2 y n 0
n
2 2
n 1
n k 1 1 n
k k
2 k 2 1
y (1 y ) 2 2 dy.
n 0
2
n 1 n 1 1 n
n k n k k k
m2 k ( X ) 2 B k 1 , n k 2 2 2
n 2 2 n n 1
2 2 2
1 n 1 1 n
k
k k k k k k
n 2 2 n 2 2 2
n n n
1 1
2 2 2
121
1 3 3 n
k k k k k
n 2 2 2 2
n n n
1 2 2
2 2 2
1 3 1 1 n
k k k k
n 2 2 2 2 2 n k (2k 1)!!
.
n 1 n 2 n k n k (n 2)(n 4)(n 2k )
2 2 2 2
Dac 2k n integrala din relaia (4.7.4) este divergent, deci variabila X nu are
momente iniiale de ordinul 2k. q.e.d.
Din relaiile (4.7.2) deducem c dac n>1 atunci media variabilei X este
n
E ( X ) 0 , iar dac n>2 atunci dispersia variabilei X este Var ( X ) .
n2
Legturile dintre repartiia Student i repartiia normal sunt prezentate n
urmtoarele dou teoreme.
lim f n ( x) f ( x; 0,1), x R,
n
X n1
X n
X 12 X n2
1
f ( x) , x R.
(1 x 2 )
122
Din observaiile fcute dup demonstaia Teoremei 4.7.2 , deducem c variabila
aleatoare X cu repartiia Cauchy nu are nici valoare medie i nici dispersie.
n n2
n
n1
1 n
n1 n2
2
2 21 1 n1 2
1 x 1 x , x 0,
f ( x) n2 n1 n2 n2 (4.8.1)
2 2
0, x 0.
n n2
n1
1 n
n1 n2
n 2
2 21 1 n1 2
f ( x ) dx 1 x 1 x dx.
n2 n1 n2 0 n2
2 2
123
n n2
1
n1
n1
1
n1 2
2 n2 y 2 1 2 n2
n n
f ( x ) dx
n
0 n
1 y 2 dy
n n
2 1 2 1 n1
2 2
n n2 n n2
1 n1 n1 n2 1
2 2 1
2 2 n1 n2
y (1 y ) dy B , 1.
n1 n2 0 n1 n2 2 2
2 2 2 2
Demonstaie
Variabila X are momente iniiale de ordinul k pentru 2k n2 . Avem
n n2
n1
1 n1
n1 n2
n1 2
2 x k 2 1 1 n1 2
mk ( X ) x k f ( x) dx n x dx.
0
n2 n n
1 2 2
2 2
n n2
n1
1 n
k 1 1 n n
n 2
2 n2 y 2 1 2 n
mk ( X ) 1 (1 y ) 2 2 dy
n2 n n 0 n n1
1 2 1
2 2
124
n n2
k 1 n1 n1 n2
n 2 y k 2 1 (1 y ) 2 dy
2
n1 n n 0
1 2
2 2
n n2
k 1
n 2 B k n1 , n2 k
2
n1 n1 n2 2 2
2
2
n n2 n n
k 1 k 1 2 k
n 2 2 2
2
n1 n
n n n 2
1 2 1
2 2 2
n n n
k k 1 1 1 k 1 2 k
n 2 2 2
2
n1 n n n
1 2 1 2 1
2 2 2
n n n n n
k k 1 1 k 1 2 1 1 2 k
n 2 2 2 2 2
2
n1 n n n n n
1 2 1 2 2 2 k 2 k
2 2 2 2 2
k
n n1 (n1 2) (n1 2k 2)
2 .
n1 (n2 2)(n2 4)(n2 2k )
q.e.d.
2n22 (n1 n2 2)
Var ( X ) .
n1 (n2 4)(n2 2) 2
n n2
n1
1 n n
1 2
n 2
2 e n1x 1 n1 e 2 x 2 ,
f ( x) 2 1 n x R. (4.8.3)
n2 n n
1 2 2
2
2
Demonstraie
Dac notm funcia de repartiie X cu F, atunci funcia de repartiie G a variabilei
Y este
1
G ( x) P(Y x) P ln X x P (ln X 2 x)
2
2x 2x
P( X e ) F (e ), x R.
g ( x ) G ' ( x) 2e 2 x F ' (e 2 x ) 2e 2 x f (e 2 x )
n n2
n1
1 n n
1 2
n
2e n1x 1
2
2 1 n1 e 2 x 2 , x R. q.e.d.
n2 n n n2
1 2
2
2
126
4.9. Legea Weibull. Legea exponenial
Definiia 4.9.1. Variabila aleatoare X urmeaz legea Weibull (X are
repartiieWeibull) cu parametrii i ( 0, 0) dac densitatea sa de
probabilitate (repartiie) este funcia
x 1e x , x 0,
f ( x) (4.9.1)
0, x 0.
1 2
1 2 2 1
E( X ) 1 , Var ( X ) 1 1. (4.9.2)
Demonstraie
Folosind schimbarea de variabil de mai sus, obinem pentru media variabilei X
1
x
y y 1 1
E ( X ) x e dx e 1 y dy
0 0
1 1
1 1
1 y e y dy 1.
0
1
1 2
y 1 1 2
E ( X 2 ) x 1e x dx e y 1
y dy 1.
0 0
127
Atunci dispersia lui X este
2
2 2 1
Var ( X ) 1 1 .
q.e.d.
e x , x 0,
f ( x)
0, x 0.
Demonstraie
Din Observaia 4.9.3 i relaia (4.4.7) din Propoziia 4.4.6, deducem c funcia
caracteristic a variabilei X este dat de expresia din (4.9.3).
Funcia caracteristic se poate calcula i direct folosind formula din
definiia sa. Avem
(t ) E e itX e itx f ( x) dx e itx e x dx e ( it ) x dx
0 0
e x [cos(tx) i sin( tx)] dx e x cos(tx ) dx i e x sin( tx) dx.
0
0
0
I1 I2
Pentru I1 obinem
128
1 x ' 1
I1 e x cos(tx) dx
0 0
e
cos(tx) dx e x cos(tx) 0
t 1 t 1 t
0 0
'
e x sin( tx) dx 2 e x sin( tx ) dx 2 e x sin( tx)
0
2
1 t
t e x cos(tx) dx 2 e x cos(tx) dx.
0 0
1 t2
Rezult astfel relaia I1 2 I1 , de unde obinem c I1 2 2 . Pentru
t
t
I 2 din relaiile de mai sus deducem I 2 2 2 . Obinem astfel pentru (t )
t
1
it
expresia (t ) 1 , t R. q.e.d.
Rezolvare
S notm cu f1 i f 2 densitile de probabilitate ale variabilelor X 1 i
X 2 , adic
e 1 x , x 0, e 2 x , x 0,
f 1 ( x) 1 f 2 ( x) 2
0, x 0, 0, x 0.
x
f ( x) f1 ( x y ) f 2 ( y ) dy 1e 1 ( x y ) 2 e 2 y dy
0
x 12 1 x ( 1 2 ) y 1 2 2 x 1x
12 e 1x e ( 1 2 ) y dy
0 1 2
e e x
0
1 2
e e .
12
e 2 x e 1 x , x 0,
Deci funcia f are forma f ( x) 1 2
0, x 0.
129
Dac 1 2 atunci f ( x) 0, x 0, iar pentru x 0 obinem
x x
f ( x) e ( x y ) e y dy 2 e x dy 2 xe x .
0 0
2 xe x , x 0,
f ( x)
0, x 0.
x x 3 2 x
h( x) 2 ( x y )e ( x y ) e y dy 3 e x ( x y ) dy x e .
0 0 2
Deci
3 2 x
x e , x 0,
h( x) 2
0, x 0.
Prin inducie matematic se arat c pentru variabilele aleatoare
independente X 1 , X 2 ,..., X n cu repartiii exponeniale cu parametrul ,
densitatea de probabilitate a variabilei X X 1 X 2 X n este funcia
n
x n1e x , x 0,
k ( x ) (n 1)!
0, x 0.
130
Capitolul 5
131
j n : X j ri
p1 ,..., p k . Pentru aceasta calculm valorile Yn,i i ne gndim
n
c, poate, Yn,i converge la pi dac n .
Aceasta este problema de baz.
Nu ne putem atepta ca Yn,i s convearg la pi n sensul obinuit al
cuvntului, adic s aib loc convergena pentru orice scenariu : de
exemplu, s-ar putea ca rezultatul ri s apar mereu sau nici mcar s nu apar,
dei pi 0 .
Dar poate c Yn,i converge la pi n majoritatea covritoare a cazurilor?
ntr-adevr, aa se ntmpl dac se mai adaug nite ipoteze. Aceasta este
legea numerelor mari.
Mai nti s lmurim ce nseamn n majoritatea covritoare a cazurilor:
nseamn aproape sigur.
a .s . a .s
Observaia 5.1.5. La fel de evident este c X n X X n X 0,
deoarece
P(lim sup X n lim inf X n X ) P(lim sup( X n X ) lim inf( X n X ) 0) .
lim inf An d [a n k , a n k 1 ) = )
n k
Exemplul 5.1.7 este unul extrem, n care limita superioar i cea
inferioar nu coincid nicieri.
Cum putem decide dac X n X ? n cazul cel mai simplu, un rspuns este dat
de
1A a
.s.
0 .
n
Demonstraie
133
Fie Bn An An1 ... . Cum P( Bn ) P A
k 0
nk i seria P A
n este
a.s.
De aici rezult un criteriu important cu care putem verifica dac X n X
Demonstraie
Fie B = : X n () nu converge la 0. Atunci B = B N unde
N
Observaia 5.1.11. Condiia din propoziia de mai sus nu este dect suficient,
nu i necesar. De exemlu dac avem un ir descresctor de mulimi A1A2......
cu P(An) = 1/n, atunci 1A este un ir descresctor, deci are o limit de forma 1 A
n
a.s.
1 0.
An
134
exist un > 0 i un subir (k n ) n astfel ca d( X k n , X ) , deci din subirul
( X kn )n nu putem extrage nici un sub-subir care s tind la . Spunem c aceste
convergene sunt topologice. Convergena aproape sigur nu este topologic.
ntr-adevr, dac ne uitm la exemplul extrem 1.1.7, n care irul nu are absolut
nici o limit aproape sigur, vedem c el are proprietatea ciudat c din orice
subir al su se poate extrage un sub-subir care converge la 0. Motivul este c
P( An ) 0 . Altfel zis, irul 1An converge totui la 0, dar n probabilitate.
Propoziia 5.1.14. Fie X,Y dou variabile aleatoare. Definim d(X,Y) = E(X Y
1). Atunci funcia d este o semidistan pe spaiul L(,K) al tuturor variabilelor
P.
aleatoare i, n plus, avem echivalena Xn X d(X,Xn) 0
Demonstraie
Cum este evident c a,b 0 a1 + b1 (a+b) 1 , este clar c d
este o semidistan: d(X,Y) + d(Y,Z) = E[(X Y 1) + (Y Z 1)] E(X Z
1).
Pe de alt parte, dac notm cu Z variabila aleatoare X Y , observm c
dac (0,1), putem scrie E(Z 1) = E(Z 1; Z ) + E(Z 1; Z > ) P(Z ) +
P(Z > ) de unde
E(Z 1) + P(Z > ) (5.1.1)
Apoi E(Z 1; Z ) + E(Z 1; Z > ) E(Z 1; Z > ) E(; Z > ) de unde
E(Z 1) P(Z > ) (5.1.2)
Din (5.1.1) i (5.1.2) deducem cletele
P(Z > ) E(Z1) + P(Z > ) (5.1.3)
S presupunem acum c d(X,Xn) 0. Din prima inegalitate de la (5.1.3)
E | X X n | 1
deducem inegalitatea P(X Xn > ) , adic P(X Xn > )
d X , X n P
limn P(X Xn > ) = 0; aadar d(X,Xn) 0 Xn X
Reciproc, dac pentru orice > 0 avem c limn P(X Xn > ) = 0, din a doua
inegalitate de la (5.1.3) rezult c lim supn d(X,Xn) pentru orice >0. Dar
este arbitrar, deci lim d(X,Xn) = 0. q.e.d.
135
Un caz care implic imediat convergena n probabilitate este
convergena n Lp..
p
L P
Propoziia 5.1.16. Dac Xn X pentru un anumit p 1, atunci Xn
X.
Demonstraie
p
Z p 2
Pentru p [1,) folosim inegalitatea evident P(Z > ) : ntr-adevr,
p
p
X Xn
Lp p
dac Xn X, atunci limn P(X - Xn > ) limn = 0 . Iar dac p = ,
p
p
atunci este i mai evident: Xn LX Xn
L
X Xn
P
X. q.e.d.
P
Observaia 5.1.17. Totui, dac Xn X, din orice subir al su se poate
extrage un sub-subir care converge la X aproape sigur. ntr-adevr, aplicm
Propoziia 5.1.10 Prin procedeul diagonal, putem alege un subir (kn)n n aa fel
nct seria P| X kn | s fie convergent pentru orice >0.
1
Amintim c dac X este o variabil aleatoare, i p [1,] atunci
1
Xp := E | X | p
dac p < iar X := limp Xp = ess sup X . Inegalitatea
p
136
p'
L
0 pentru p < p dar Xn nu converge nicieri dac p p. De exemplu n =
1
p
n .
Demonstraie
Y1 Y2 ... Yn
Centrm variabilele: fie Yn = Xn - . Atunci X n - = .
n
1
Urmeaz X n - 22 = E( X n - )2 = EYiY j . Dar EYiYj = cov(Xi,Xj) = 0
n 2 1i, j n
3
abreviere internaional: Weak Law of Large Numbers
4
Se mai numete i media de selecie
137
2 1 2 n 2 2 L2
dac i j . Deci E( X n - ) = EYi . Concluzie: X n deci,
n 2 1i n n2 n
P
conform cu Propoziia 1.1.16, X n . q.e.d.
Observaia 5.2.2. Legea slab se mai numete Teorema lui Bernoulli. Ea a dat
primul rspuns la ntrebarea: putem aproxima empiric probabilitile? Forma
sa verbal repetat de sute de ani este: Frecvenele relative converg n
probabilitate la adevrata probabilitate.
5
Aici e de fapt o problem de filosofie a satisticii: decretm c evenimentele de probabilitate 0
nu se ntmpl. E o discuie fascinant, dar mai complicat.
138
Fie atunci X: vectorul cu componentele X = (X1,X2,....). Componentele
sale Xj sunt proieciile prj(X). n loc s scriem X n , scriem
1
( pr1 ( X ) ... prn ( X )) . Avantajul este c acum avem o singur variabil,
n
anume X. Introducem i funcia t: definit prin
t(x1,x2,.....) = (x2,x3,....) prj(t(x)) = prj+1(x) j 1 (5.2.1)
care se numete shiftul canonic. Dac notm cu f: prima proiecie ( f =
pr1) atunci putem scrie
1
Xn=
n
f f t f t 2 ... f t n1 ( X ) (5.2.2)
unde prin tk nelegem tt...t, compunerea de n ori a lui t cu ea nsi.
Scrierea are avantajul c ne permite s ne concentrm asupra unui ir
Cesaro n care apar doar dou variabile: funcia f i shiftul t. Cu studiul unor
asemenea iruri se ocup o disciplin matematic numit teorie ergodic.
Ca s putem aplica rezultatele din teoria ergodic, ar trebui verificat c
shiftul invariaz msura.
Este vorba despre repartiia P1 = PX-1 a vectorului X. Ea este o
probabilitate pe spaiul produs (,B()) 6 n general nu tim s o calculm, dar
dac facem ipoteza suplimentar c variabilele Xn sunt independente i identic
repartizate, atunci este uor de vzut c P1 = F , unde F este repartiia comun a
variabilelor aleatoare Xn.7
Demonstraie
(i) Trebuie artat c P1(t-1(A)) = P1(A) A B(). Din motive elementare8 este
suficient s verificm acest lucru pentru un bloc de lungime n, A =
B1B2...Bn...
6
-algebra produs se definete ca fiind cea mai mic -algebr generat de blocuri. Un bloc de
lungime n este o mulime de forma B1B2...Bn....... unde mulimile Bn sunt boreliene.
Mulimea D a blocurilor este n mod evident stabil la intersecii finite, deci B () coincide cu
U-sistemul generat de D.
7
Amintim c dac j sunt o probabilitate pe un spaiu msurabil (E,E), atunci P = 12....
este probabilitatea pe E cu proprietatea c P(B1B2...BnEE.....) = 1(B1)2(B2)...n(Bn).
C o asemenea probabilitate (numit probabilitate produs) exist, nu este evident: existena ei
este dat de teorema lui Kolmogorov. Dac 1 = 2 = ....= , atunci probabilitatea produs se
noteaz cu . Acesta este cazul nostru.
8
Motivul elementar este c dac dou probabiliti definite pe o aceeai -algebr coincid pe un
sistem de generatori nchis la intersecii finite al -algebrei , atunci ele coincid. n cazul de fa
acest sistem de generatori este mulimea D a blocurilor.
139
S remarcm c t -1(A) = A. ntr-adevr, x t -1(A) t(x) A (x2,x3,.....)
B1B2...Bn.. x2 B1, x3 B2,...,xn+1 Bn x
B1B2...Bn.. = A. Deci P1(t -1(A)) = F( B1B2...Bn..) =
F()F(B1)...F(Bn) = F(B1)...F(Bn) = P1(A). Adic t invariaz probabilitatea P1.
(ii) Lucrm cu indicatori, cci este mai comod. Ipoteza t -1(A) = A devine 1At = 1A
. Dac punem f n loc de 1A se pune ntrebarea ce putem spune despre o funcie f
care are proprietatea c f = ft. Aplicm aceast funcie vectorului X i avem c
f(X) = f(t(X)) = f(t(t(X))) = .... sau, scris explicit, c f(X1,X2,...) = f(X2,X3,...) =
f(X3,X4,...) = .......
Aici intervine n for ipoteza independenei.
Deci variabila aleatoare Y = f(X) este independent de X1 (de vreme ce Y =
f(X2,X3,...) !) i de X2 (de vreme ce Y = f(X3,X4,...) !), i de X3, adic de toate
variabilele aleatoare Xn. Deci f(X) este independent de X, adic i de f(X).
nseamn c Y este independent de ea nsi. Dar atunci ea este constant
aproape sigur.
Concluzie: dac 1At = 1A, atunci 1A = constant (mod P1). Aceast constant,
firete, nu poate fi dect 0 sau 1: deci P(A) 0,1. q.e.d.
1
n
f f t f t 2 ... f t n1 a
.s.
Ef = fdP
9
Cititorul interesat poate gsi multe despre aceast teorem aici:
http://en.wikipedia.org/wiki/Ergodic_theory. O demonstraie frumoas se poate gsi in
cursul lui I. Cuculescu (1974) sau Tudor. Demonstraia original a autorului (Birkhoff
1931) este aici: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1076138/?page=1
140
Demonstraie
Nu avem dect s aplicm teorema ergodic pe spaiul (E,E,PX-1).
q.e.d.
Avantajul este c acum chiar putem calcula membrul drept, folosind formula
de transport.
Dac PXn-1 = F, atunci Ef(X1,...,Xk) = fdF k .
Dac, de exemplu, F are o densitate fa de msura Lebesgue, atunci
Ef(X1,...,Xk) = f x1 , x2 ,..., xk x1 x 2 ...xk dx1dx2 ...dxk .
O particularizare i mai mare este cea cu care am nceput: dac f = pr1.
10
abreviere internaional: Strong Law of Large Numbers
141
1
logaritmnd expresia avem ln X1 ln X 2 ... ln X n ElnX1). Dac P(Xn= 0) > 0,
n
atunci limita este 0.
1
Exemplul 5.2.11. Media lor armonic converge la 1 / E . ntr-adevr,
X1
n 1
.
1 1 1 1
... E
X1 X 2 Xn X1
142
Definiia 5.2.15. Fie (Xn)n un ir de variabile aletoare i.i.d. irul de variabile
1
aleatoare Fn(x) =
n
j n : X j x se numete funcia de repartiie empiric
calculat n x.
Demonstraie
Fie Zj = 1X j x . Variabilele Zj sunt i.i.d. repartizate Binomial(1,F(x)) iar
Z1 Z 2 ... Z n
Fn(x) nu este altcineva dect care, conform SLLN converge a.s.
n
la EZ1 = F(x). q.e.d.
Teorema 5.2.17. (Teorema lui Glivenko) Fie n() = sup Fn(x)() F(x)
distana uniform dintre funcia de repartiie empiric dup n observaii i
adevrata funcie de repartiie. Atunci n a
.s.
0
Funcia de repartiie empiric converge aproape sigur uniform la
adevrata funcie de repartiie.
11
Cititorul interesat poate consulta Teoria probabilitilor de Cuculescu (1974) sau Tudor (1980).
Sau poate vedea mai multe referine aici
http://en.wikipedia.org/wiki/Glivenko%E2%80%93Cantelli_theoremhttp://en.wikipedia.org/wiki
/Glivenko%E2%80%93Cantelli_theorem
143
2i 12 2
2 8x2
limnP( n n x) = e
x i 1
Metoda se folosete ntr-o serie de probleme unde apar calcule prea grele
pentru a fi abordate determinist. Ele sunt de dou tipuri: calcul de integrale sau
probleme de optimizare.
Calcul de integrale.
S presupunem c vrem s calculm o integral de forma
k
I = f x1 ,..., xk dx1dx2 ...dxk f 1C d
C
(5.2.5)
unde C este un compact de msur Lebesgue pozitiv i f o funcie
integrabil pe acel compact. Ideea este s generm un ir de vectori aleatori
independeni Xn repartizai uniform n compactul C. Atunci
1
f X 1 ... f X n a . s.
Ef X 1 . Dar, conform formulei de transport, Ef(X1) =
n
1
fdU C k C f x1 ,..., xk dx1dx2 ...dxk .Deci algoritmul este
C
1
f x1 ,..., xk dx1dx2 ...dxk = (C)[a.s. limn f X 1 ... f X n ]
k
C n
(5.2.6)
A simula un vector aleator repartizat uniform ntr-un compact nu este un
lucru simplu. Uneori ns, este simplu: dac C = [a1,b1][a2,b2]...[ak,bk]. Atunci
Xn = (Xn,1,...,Xn,k) este uor de simulat: componentele sale sunt variabile aleatoare
independente repartizate Uniform(ai,bi). Toate mediile de programare (R, C++,
Java, R, Matlab, Excel etc) au n dotare cel puin generatoare de numere
pseudoaleatoare, repartizate Uniform(0,1)
Revenind la Exemplul 1.1.11. Urmtoarea secvena (sau, cum i se mai
spune, script) din mediul de programare R:
segment1<-function(n)
{xa=runif(n);xb=runif(n);ya=runif(n);yb=runif(n)
d=sqrt((xa-xb)^2+(ya-yb)^2)
d}
face n simulari (instruciunea xa=runif(n) produce un vector de lungime
n cu componentele variabile aleatoare repartizate Uniform(0,1)
Cu instruciunea
> d<-segment1(1000000);summary(d)
generm 1000000 de segmente crora le calculm lungimea. Apoi ni se
furnizeaz minimul, maximul, prima cuantil, mediana, media i cuantila a treia.
144
Sigur c este vorba de cuantilele de selecie (se poate arta, tot pe baza
SLLN c i cuantilele de selecie converg la adevratele cuantile). Conform
SLLN ne ateptm ca aceste variaile aleatoare (cci asta sunt!) s nu oscileze
prea tare i s ne dea informaii despre repartiia variabilei aleatoare X = A-B.
Iat rezultatul a 10 simulri de cte 1 milion de segmente
145
EX = 01 01 01 01 x A xB 2 y A yB 2 dx AdxB dy Ady B
Prima cantitate se poate calcula exact, cu mult efort; pentru al doua, nu exist
formule prin cuadraturi.
Ca s avem o idee de puterea metodei, o putem compara cu metodele
deterministe de calcul ale integralelor multiple. Tot o sum avem de fcut, dup
ce lum cte o diviziune pe fiecare ax. Dac diviziunea este echidistant cu 20
de puncte, vom avea de calculat valoarea funciei de integrat n 204 = 160.000 de
puncte. Nu e sigur c eroarea va fi mai mic!
Putem concluziona c X este o variabil aleatoare cu media 0.521 i
mediana.512
De curiozitate, prezentm i graficul unei funcii de repartiie empirice dup
100.000 de probe.
Calcul de maxime-minime.
Demonstraie
Fie F funcia de repartiie a variabilei aleatoare f(X) unde X
Uniform(C). Deci F(x) = P(f(X) x) = P(X f-1(-,x]) = k(f-1(-,x])/k(C).
Fie M = ess inf f. Atunci P(Yn M - ) = P(max(f(X1),...,f(Xn)) M - ). Dar
variabilele f(Xk) sunt independente, deci
P(max(f(X1),...,f(Xn)) M - ) = P(f(X1) M - , f(X2) M - ,... f(Xn)) M - )
= P(f(X1) M - )P(f(X2) M - ,)...P(f(Xn)) M - ) = Fn(M - ). Cum M este
supremul esenial, F(M - ) < 1, deci F n(M - ) 0. Deci P(Yn M - ) 0. Dar
irul Yn, fiind cresctor, are o limit, Y. Rezult c P(Y M - ) = 0 . Deci Y
M. Pe de alt parte, Yn M deoarece toate variabilele aleatoare f(Xj) au aceast
proprietate. nseamn c Y = M P-a.s. Y = M (k a.p.t.).
Dac funcia este continu, nu mai este nevoie de precauia ca ea s fie
mrginit: sigur c este, deoarece orice funcie continu duce compacte n
compacte. Mai mult, atunci maximul ei coincide cu supremul esenial din
urmtorul motiv: fie M = max f. Atunci mulimea x C f(x) > M - este
deschis n C, deci are interior nevid. Orice mulime de interior nevid are msur
pozitiv. Adic M are proprietatea care definete supremul esenial.
Demonstrarea afirmaiilor legate de minim sau infimul esenial este analog.
q.e.d.
Observaia 5.2.20. Acesta este cel mai simplu algoritm, deoarece lucreaz n
orb, fr memorie. Perfecionarea lui duce la algoritmii genetici. Dac
apelm i la un minimum de memorie, reinnd punctele de minim i maxim
gsite, atunci putem avea o idee despre Argmin f i Argmax f 13
12
Supremul esenial al unei funcii definite pe un compact de interior nevid C este un numr M
cu proprietatea c f(x) M pentru aproape toi x M i msura Lebesgue a mulimii x C f(x)
> M - este pozitiv >0. Similar, infimul esenial este un numr m cu proprietatea c f(x)
M pentru aproape toi x M i msura Lebesgue a mulimii x C f(x) < M + este pozitiv
>0. A nu se confunda cu supremul i infimul De exemplu, dac f = 1 1 cu diagonala
ptratului unitate din plan, i cealalt diagonal atunci sup f = 1, inf f = -1, dar ess sup f = ess
inf f = 0.
13
O notaie pentru punctele n care se gsete maximul sau minimul.
147
10000 de simulri, obinem minf =9.063544e-09, max f = 0.2499187, Argmax(f)
= (0.4966409, 0.4967819), Argmin(f) =(0.9999011, 9.165588e-05) .
Convergena tare
Cele mai folosite distane sunt date de norme: d(F,G) =F - G.
Repartiiile variabilelor aleatoare sunt probabiliti pe dreapt. Probabilitile
sunt msuri finite pe (, B()). Diferena a dou msuri finite este o msur cu
semn.
Aici trebuie amintite unele lucruri elementare: msurile finite cu semn pe un
spaiu msurabil (E,E) formeaz spaiu vectorial. O msur cu semn : E
se poate ntotdeauna scrie sub forma = + - - unde + i - reprezint partea
pozitiv i partea negativ a msurii. Aceasta este descompunerea Hahn
Jordan.14
Mai mult, exist o mulime H E 15 cu proprietatea +(E) = (H) i -(E) =
(E \ H). Ea are proprietatea c (AH) 0 , (A \ H) 0 pentru orice A E .
Msura := + + - se numete variaia lui iar funcia definit prin
= (E) = 2(H) - (E) este o norm: = 0 = 0 i 1 + 2 1 + 2
1,2 msuri cu semn.
14
Vezi orice manual de teoria msurii sau, de exemplu aici:
http://www.math.purdue.edu/~zhang24/SignedMeasure.pdf
15
Ea se numete mulimea Hahn ataat lui . Dac, de exemplu, = , unde este o msur
oarecare, atunci H = > 0
148
Norma se calculeaz uor dac are o densitate fa de o msur adevrat,
: mai precis, dac = , atunci = d 16.
De exemplu dac F i G sunt dou repartiii discrete cu acelai suport, F =
p j x j , G = q j x j , atunci = x j , densitatea lui F ar fi (pj)j , cea a lui G ar
j j j
Definiia 5.3.1. Fie (E,E) un spaiu msurabil. Fie (Fn)n i F probabiliti pe el.
Spunem c Fn converge tare la F dac F Fn 0. Notm acest lucru prin
Fn s
F.
Demonstraie
(i). Fie = F G.Deci (E) = F(E) G(E) = 1 1 = 0. Fie H mulimea Hahn
ataat lui . Atunci = 2(H) - (E) = 2(H). Dac = 2, atunci (H) = 1
F(H) G(H) = 1. Dar F i G sunt probabiliti, deci F(H) = 1 i G(H) = 0.
s L1 E,E,
(ii). Fn F = f f n d , deci e clar echivalena Fn
F fn f.
Interesant este cealalt afirmaie, deoarece n general nu este adevrat c dac fn
converge la f aproape sigur, converge i n L1 (vezi exemplul 1.1.8). Dar la noi
exist condiia foarte tare ca fn s convearg la o densitate de probabilitate.
Folosind egalitatea x = 2x+ - x i avem
16
Notaia = . este acceptat de majoritatea matematicienilor pentru a desemna msura de
densitate i baz . Precis, sensul este ()(A) = 1A d pentru orice A E. Ali autori
folosesc n acelai scop notaia d = d, care are avantajele ei, deoarece atunci cnd calculm
integrala, densitatea iese n fa: fd fd .
17
Se obinuiete notaia F(x) n loc de F((-,x]). Dac suntem ateni, nu este nici un pericol de
confuzie: dac A este o mulime, F(A) nseamn probabilitatea lui A i dac x e punct, F(x)
nseamn F((-,x]).
149
f f n d 2 f f n d f f n d = 2 f f n d . irul (f fn)+ tinde -a.s.
la 0 este dominat de f care este n L1. Teorema de convergen dominat ne spune
atunci c putem comuta limita cu integrala: limn f f n d = lim | f f n | d = 0.
n
(iii). Fn(A) F(A) Fn F (A) Fn F . Pentru a doua afirmaie, vezi
exemplul 1.3.7 de mai jos.
Exemple de aplicare
1 1
s
Exemplul 5.3.4. Fie Fn = 1 0 n Atunci Fn 0 .
n n
2 n 1 1
2k 2 k 1
Exemplul 5.3.7. Fie An = ( n
, n ] i Fn = 2 1An , unde este msura
k 0 2 2
Lebesgue. Fie f = Uniform(0,1) = 1(0,1). Atunci Fn F = 1 (ntr-adevr,
1 dac x An
norma este egal cu 1An 1(0,1) d iar 1An 1( 0,1) x 1 dac x (0,1) \ An ).
0 n rest
Totui, Fn(A) F(A) pentru orice mulime borelian A din urmtorul
motiv:remarcm c Fn(A) 2F(A) pentru orice A B (). Fie atunci C =A B
(): Fn(A) F(A). Familia C este un u-sistem (singurul lucru cu probleme este
s artm c dac (Ak) este un ir de mulimi disjuncte cu proprietatea c Fn(Ak)
F(Ak), atunci i Fn( Ak ) F( Ak ) Fn Ak F Ak ceea ce rezult din
k k k k
faptul c seriile Fn Ak sunt dominate de 2 F Ak ). Acest u-sistem conine
k k
intervalele A = (-,x]. ntr-adevr, pentru x 0 sau x 1 funciile de repartiie
150
chiar coincide: Fn(x) = F(x). Dac 0 < x < 1 se arat imediat prin inducie c
1
| [2 n 1 x ] 2 n1 x |
Fn(x) = x + 2 deci 0 Fn F 2-n.
n 1
2
Deci funciile de repartiie converg uniform, (Fn - F)(A) converge la 0 pentru orice
A i totui Fn nu converge tare la F.
Convergena slab
18
Cititorul poate consulta, de exemplu, Ioan Cuculescu, Teoria Probabilitilor, Bucureti, All,
1998, pg 281-368.
151
0, dar funciile de repartiie sunt Fn(x) = 1 1 (x) 1(0,)(x) ; limita nu este o
[ , )
n
funcie de repartiie fiindc nu este continu la dreapta. Am fi vrut s convearg
la funcia de repartiie a lui 0, care este 1[0,).
n al doilea rnd, ar fi preferabil o definiie care s se poat extinde i la alte
spaii msurabile, nu numai la dreapt. Am vrea s dm un sens, de exemplu, i
noiunii de convergen dac avem de a face cu repartiii n plan sau n spaiu.
De aceea s-a ales alt definiie. Ea are sens pe spaii mai generale, dar ne
mulumim aici cu spaiile euclidiene, care sunt cel mai bine cunoscute.
Definiia 5.3.10. Fie (Fn)n, F repartiii pe spaiul euclidian (d, B(d)). Spunem
c Fn converge slab la F dac fdFn fdF pentru orice funcie continu i
mrginit f. 19
Notm acest fapt prin Fn F
Dac Xn ,X sunt vectori aleatori cu repartiiile Fn i F, n locul notaiei Fn
D
F se folosete, prin abuz de limbaj, notaia Xn X care se citete Xn
D
converge n repartiie la X. Se admite i notaia Xn F , care se citete
Xn converge n repartiie la F.
Nu vom demonstra aceast teorem. Unele implicaii sunt simple, altele mai
laborioase.20
19
Mulimea funciilor reale continue i mrginite pe d se noteaz cu Cb(d).
20
Ioan Cuculescu, Teoria Probabilitilor sau
http://en.wikipedia.org/wiki/Convergence_of_measures. Sunt sute de cri care conin
demonstraia.
152
Observaia 5.3.12. Toate punctele teoremei de mai sus pot scrise n termini de
variabile aleatoare. Dac n loc de Fn i F punem Xn i X obinem urmtoarele
D
caracterizri echivalente ale faptului c Xn X:
(i) Ef(Xn) Ef(X) pentru orice f continu i mrginit
(ii) Ef(Xn) Ef(X) pentru orice f uniform continu i mrginit
(iii) limsup P(Xn C) P(X C) pentru orice mulime nchis din E
(iv) liminf P(Xn D) P(X D pentru orice mulime deschis din E
(v) lim P(Xn A) = P(X A) pentru orice mulime A cu frontier F-
neglijabil
P D
Corolarul 5.3.15. Fie Xn.X vectori aleatori. Dac Xn X, atunci Xn X.
Convergena n probabilitate implic convergena n repartiie.
Demonstraie
P
Dac Xn X, atunci conine un subir care converge a.s. la X. Dac f
este o funcie continu, atunci f(Xn) converge aproape sigur la f(X). Dac f este i
mrginit, teorema de convergen dominat arat c Ef(Xn) Ef(X).
21
De exemplu http://en.wikipedia.org/wiki/Prokhorov%27s_theorem
153
Definiia 5.3.16. Fie F o repartiie pe (d,B(d)). Funcia F: d C definit
prin
it ' x
F(t) = e dF x
(5.3.1)
se numete funcia caracteristic a lui F. (Un punct x din d este un vector
coloan; t este transpusul lui t deci tx este produsul scalar dintre t i x : tx =
t1x1 + t2x2 + ...+ tdxd). Dac F este repartiia unui vector aleator d-dimensional, X,
atunci scriem X n loc de F i, pe baza formulei de transport, avem
X(t) = EeitX
(5.3.2)
Propoziia 5.3.17.
(i) Fie F i G dou repartiii pe (d,B(d)) cu proprietatea c F = G. Atunci F =
G (Teorema de unicitate).
(ii) Presupunem c (Fn)n este un ir de repartiii cu proprietatea c irul Fn este
convergent i limita sa, , este continu n 0. Atunci exist o repartiie F cu
proprietatea c F = i Fn F. Sau, n termeni de variabile aleatoare: dac
(Xn)n sunt vectori aleatori d-dimensionali independeni i X n , continu n
D
0, atunci exist o repartiie F ca Xn F.
Propoziia 5.3.18.
(i). Dac Fn F i Gn G, atunci FnGn FG (sau, acelai lucru n
D D
termeni de variabile aleatoare dac Xn X, Yn Y ,Xn independent de Yn,
D
atunci (Xn,Yn) (X,Y))
(ii). Dac Fn F i Gn G, atunci FnGn FG ( n termeni de variabile
D D
aleatoare : dac Xn X, Yn Y ,Xn independent de Yn, atunci Xn+Yn
D
X+Y)
22
Ioan Cuculescu, Teoria Probabilitilor sau Lukacs, E. (1970). Characteristic functions.
London: Griffin.
154
Demonstraia se reduce la verificarea faptului banal c FG = FG i FG =
FG. q.e.d.
155
1 k k n
Fn(x) = C n 1 x k (5.4.3)
n! k 0
unde x+ este partea pozitiv a lui x. Derivnd (sumele sunt, totui, finite) gsim
densitile
1
k k n 1
fn(x) = C n 1 x k (5.4.4)
n 1! k 0
n figura de mai jos am fcut graficele densitilor fj cu 2 j 6.
Se observ cum ele capt o form specific, de clopot.
1.0
y
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4 5 6
x
Obinem cinci grafice care se pot compara mai bine, fiindc au aceeai ax de
simetrie.
156
1.0
y
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
-3 -2 -1 0 1 2 3
x
i densitile
Mai jos am fcut graficele celor cinci densiti centrate i normate. Se observ
cum se stabilizeaz.
157
0.5
y
0.4
0.3
0.2
0.1
-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5
x
xn x
fn+1(x) = e 1(0,) ( x) (5.4.9)
n!
n+1(x) = n 1
n 1 e
n
n 1x n1 n 1x 1
( 0, ) ( n 1 n 1x ) (5.4.10)
n!
n n n
n 1 n 1 n 1x n n1 n 1x = n 1 n 1 n 1x n 1 1 n 1x .
e e
2n n 2n n 1 n
n
n 1 x
lim n x
1 n 1 n 1 n
e
n 1 n 1x
lim e n 1 x lim 1 e n 1x
2n n n 1 2 n 1
n = lim =
1
= 2 L
158
x
Logaritmm: lnL = lim n ln 1 x n 1 . Dezvoltm logaritmul n serie
n 1
2 3 4
(ln(1+t) = t t /2 + t /3 t /4 + ....) i avem
n x x2 x3 x4
lnL = lim n 1
... x n 1
n 1 2n 1 3n 1 n 1 4n 1
n 1 2
x2 x3 x4
= lim x n 1 ... x n 1 = - x2/2.
2 3 n 1 4n 1
Concluzie
irul densitilor centrate i normate converge, n cazul n care Xn sunt
x2
1
repartizate Exp(1) la funcia (x) = e 2 . Aceasta chiar este o densitate, este
2
densitate repartiiei noemale standard N(0,1)! (Atenie: limita unui ir de
densiti nu este obligatoriu o densitate, dup cum ne putem convinge cu
densitile fn = 1[0,n](x)/n care converg la 0! )
S n n s
N 0,1
(5.4.11)
n
Afirmaia este valabil ntr-un context i mai general, anume dac putem
demonstra c exist un n ncepnd de la care n este o mrginit. Demonstraia
depete cu mult cadrul acestui manual. Cine chiar este interesat o poate gsi de
exemplu, n Y. Ptohorov, Y. Rozanov, Probability Theory, Springer 1969, pp
190-194. Alte demonstraii, mai recente se pot gsi pe Internet, cu Google.
Dar dac variabilele aleatoare Xn sunt discrete, atunci problema local nu are
sens. Se poate demonstra un rezultat mai slab.
159
Teorema 5.4.2.(Teorema Limit Central (TLC))
Fie (Xn)n un ir de variabile aleatoare i.i.d. din L2. Fie = EX1 i 2 = Var(X1).
Atunci
X 1 X 2 ... X n n D
N 0,1
n
Scris explicit, afirmaia este c
t2
X ... X n n 1 x 2
limn P 1 x e dt
n 2
Demonstraie
Dac acceptm teorema de convergen a funciilor caracteristice, demonstraia
este simpl. Fie Yn = Xn - variabilele centrate i (t) = EeitY funcia lor
caracteristic. tim de la proprietile funciilor caracteristice c dac Yn sunt din
L2, atunci este derivabil de dou ori. Ne intereseaz c e derivabil de dou
t2
ori n 0: deci putem scrie (t) = (0) + t(0)+ (0) + o(t)t2 unde o(t) este o
2
funcie continu i o(0) = 0. Dar (0) = 1, (0) = EYn = 0 i (0) = - EYn2 = - 2.
t 22
Deci (t) = 1 + o(t).
2
Calculm funcia caracteristic a lui sn, notat cu n:
it n
Y1 ...Yn t 22 t t 2
n t
n(t) = Ee n = = 1 o 2 .
n 2 n
n n
Atunci
2
t
t2 t2 t t2 t2 t
limnn(t) = exp[ lim n 2 o ]= exp 2 lim o = e 2 .
2n n n
2 n
160
t2
Dar funcia (t) = e 2
este funcia caracteristic a repartiiei normale standard.
Teorema este demonstrat. q.e.d.
Exemplu de aplicare:
0 1
Exemplul 5.4.4. Repartiia binomial. Dac Xn , atunci Sn
q p
Binomial(n,p). Dac n este destul de mare putem aproxima P(Sn a) cu TLC
astfel: Avem = p, = pq . Deci
S n np a np a np
P(Sn a) = P( ) .
npq npq npq
Se tie c dac npq 20, aproximarea este foarte bun. Prezentm un grafic cu
diferenele dintre funcia de repartiie a repartiiei Binomial(100,0.42) i cea a
2
repartiiei N(np, npq 2) = N(42, 24.36 ) calculate pentru x [0,100]
Pe axa Ox sunt valorile lui x iar pe axa Oy valorile diferenei dintre cele dou
funcii de repartiie. Maximul este maimic de 0.05. Daca ns luam un caz
extrem, cu p =0.042, situaia se schimba
161
Diferena dintre probabiliti poate depi 0.12, ceea ce este imens. Explicaia
este c acum =4.2 i probabilitatea ca X Binomial(100,0.042) s ia valorile 4
sau 5 este mare : 0.3653754. Ca s fie aplicabil aproximarea normal trebuie
ca toate probabilitile P(X = k) s fie mici. Dac produsul np este mic, dei n
este mare, atunci este preferabil aproximarea cu repartiia Poisson(np).
162
Capitolul 6
1
Extragem k bile dintr-o urn cu a bile albe i n bile negre; X este numrul de bile albe.
2 1
Repartiia logistic are funcia de repartiie x
. Este mai rar folosit..
1 e
3
n codificarea R, x=rnorm(1,,) produce o variabila aleatoare X N(,2). Parametrul al
doilea reprezint abaterea medie ptratic i nu variana. Uneori se face confuzie.
163
Student t n
uniform unif a,b
Weibull weibull k,
Wilcoxon wilcox m, n
4
Dac vrem s le calculm funcia de repartiie punem p, pentru densitate punem d iar pentru
cuantile (vezi mai jos) punem Q. De exemplu
x=pnorm(1,0,1);y=dnorm(1,0,1);z=Qnorm(0.01,0,1) va produce numerele x = 0.8413447 (cci
1 2
(1) = 0.8413447), y = 0.2419707 = ex /2
cu x = 1 i z = -2.326348 = -1(0.02)
2
164
Observaia fundamental este c variabila aleatoare X = F-1(U) are exact
funcia de repartiie F. Acesta este algoritmul inversei funciei de repartiie.
ntr-adevr, dac x [0,1], atunci , innd seama de ipoteza c U Uniform (0,1)
P(U x) = x x [0,1], avem P(X x) = P(F -1(U) x) = P(F(F -1(U)) F(x)) deci
P(X x) = P(U F(x)) = F(x). (6.1.1)
n general, funciile de repartiie nu sunt bijective. Dac, de exemplu, X
x
Uniform(1,2,...,n), atunci F(x) = 1 ia doar valorile k/n cu 0 k 1. Este o
n
situaie tipic pentru repartiiile discrete. Dar, chiar dac repartiia este continu,
e posibil ca F s nu fie injectiv. De exemplu, dac X Uniform([0,1][2,3]),
atunci FX este constant pe intervalul [1,2](verificai: F(x) = (x+1 + (x-2)+1)/2 ).
Ce se mai poate salva n acest caz din algoritmul anterior?
Ideea este s nlocuim inversa cu cuantila.
Demonstraie
Observm c orice cuantil este o funcie cresctoare. ntr-adevr, dac
u<v , atunci Q(u) Q(v) deoarece n caz contrar, Q(u) > Q(v) F(Q(u) 0)
F(Q(v)) u F(Q(u)-0) F(Q(v)) v u v.
Artm c U < F(x) Q(U) x U F(x) i va fi suficient, pentru c
atunci rezult c P(U < F(x)) P(Q(U) x) P(U F(x)) de unde, cum U
Uniform(0,1), deducem c P(Q(U) x) = F(x).
Presupunem Q(U) x. Atunci F(Q(U)) F(x). Dar, din definiia cuantilei, U
F(Q(U)), deci U F(x). Am demonstrat c
Q(U) x U F(x) (6.1.2)
S presupunem acum c Q(U) > x. Atunci F(Q(U) 0 ) F(x) . Dar, tot din
definiia cuantilei. U F(Q(U) 0) , deci U F(x).Aadar Q(U) > x U F(x)
Trecnd la complementar,avem c
Q(U) x U < F(x) (6.1.3)
Din (6.1.2) i (6.1.3) deducem c U < F(x) Q(U) x U F(x).
q.e.d..
165
Dou sunt cazurile extreme care intereseaz n calcule: cuantil inferioar i
cuantila superioar.
Cuantila inferioar, notat cu Q -, se definete prin relaia
Q (u) = supF < u = infF u (6.1.4)
iar cea superioar, notat cu Q + se definete prin
Q + (u) = supF u = infF > u (6.1.5)
Propoziia 6.1.3. Funciile definite prin relaiile (6.1.4) i (6.1.5) sunt cuantile.
Orice alt cuantil Q este cuprins ntre ele: Q Q Q + .
Demonstraie
Din definiia supremului avem urmtoarele lucruri evidente
F(Q (u) ) < u , F(Q (u) + ) u > 0
F(Q+(u) ) u , F(Q+(u) + ) > u > 0
Trecnd la limit cu 0, deducem c F(Q (u) 0) u , F(Q (u) + 0) u i
F(Q+(u) 0) u , F(Q+(u) + 0) u. Dar F este continu la dreapta, deci
ambele funcii verific definiia cuantilei.q.e.d.
166
Deci variabila aleatoare X = sk 1sk 1 , sk U are exact repartiia F .
k 1
cuantila<-function(u,a,p)
{o=order(a) #sortez pe a, pentru ca se poate sa
nu fie in ordine
F=rbind(a[o],p[o]); a=F[1,]; p=F[2,]
#calculez sumele partiale
s=p; for (i in 1:length(a)){s[i]=sum(p[1:i])}
#caut locul lui u
v=which(s>=u);i=min(v); q=a[i]
q}
table(x)
x
-6 0 1 2 3
195 99 190 98 418
167
Valorile frecvenelor absolute corespund celor teoretice, care ar fi trebuit s fie
200,100, 200,100,400. Deci ese plauzibil. Exist metode de verificare a
acurateei modelulului dat de o repartiie : de exemplu metoda qqplot.5
Pentru valori relativ mici ale lungimii k a vectorilor a i p algoritmul este
satisfctor i rapid. Poate fi folosit pn la k 1000.
Dac, ns, vectorii au lungime prea mare ncep s apar erori de main
i, pe de alt parte, viteza lui scade. Este i normal. De aceea, dac se poate, ar fi
bine s fie folosii algoritmi rapizi bazai pe diverse le repartiii care se pot obine
din repartiia uniform.
Problema este de a calcula cuantila dac repartiia F nu este neaprat
discret i cu suportul format dintr-o mulime cu numr mic de elemente.
Chiar dac avem funcia de repartiie F dat printr-o formul analitic (de
exemplu F(x) = pF1 + qF2 cu F1 = Exp(1), F2 = Gamma(2,1) F(x) = 1 (1 + qx)e-x )
nu avem formule pentru a calcula inversa F -1(u) (n cazul de mai sus ar trebui
rezolvat ecuaia 1 (1 + qx)e-x = u , 0<u<1, care este o ecuaie transcendent).
Pentru a iei din dilem ar trebui s facem o discretizare a lui F. nlocuim funcia
de repartiie F cu repartiia Fd = a1 a2 ... ak unde este
F (a ) F(a ) F a ... F (a ) F a 1 F a
1 2 1 k k 1 k
5
Chiar n R exist instruciunea qqplot.
168
Propoziia 6.1.10. Fie Xj Fj cu 1 j n i fie J o variabil aleatoare
1 2 ... ... n
independent de (Xj)j cu repartiia J . Atunci variabila X := XJ
p1 p2 ... ... pn
n
are repartiia F = p j F j .
j 1
Demonstraie
n n n
P(X x) = P(XJ x) = P X J x; J j P X j x PJ j F j x p j q.e.d.
j 1 j 1 j 1
Deci, revenind la exemplul nostru cu F = pGamma(1,1) + qGamma(2,1)
1 2
algoritmul exact este: simulm variabila J . Dac J = 1, simulm X
p q
Exp(1) = Gamma(1,1) iar dac J=2 simulm X = Gamma(2,1). Dup cum se
vede n scriptul urmtor, care folosete funcia cuantila din paragraful anterior
t=1:5000;t=t/5000
xo=mixtura(5000,0);xo=sort(xo)
xm=mixtura(5000,0.5);xm=sort(xm)
xu=mixtura(5000,1);xu=sort(xu)
plot(xo,t,type="l");lines(xm,t,col="red");
lines(xu,t,col="blue")
169
Exemplul 6.1.11. S presupunem c nu avem acces la un software performant,
dar vrem s simulm o variabil aleatoare X Gamma(n,) cu n numr ntreg.
Cum facem?
Soluie
Variabilele Xj = (- lnUj)/ sunt repartizate Exp(). Dar Gamma(n,) = Exp()n
n
ln U
j 1
j
Propoziia 6.1.12. Metoda Box Muller. Fie U,V Uniform(0,1) dou variabile
aleatoare independente. Atunci variabilele X = sin(2U) 2 ln V , Y =
cos(2U) 2 ln V sunt dou variabile aleatoare independente repartizate
0 1 0
N(0,1). Deci (X,Y) N( , )
0 0 1
170
Demonstraie
Avem de artat c dac f:2 este o funcie continu i mrginit,
x2 y2
1
atunci Ef(X,Y) = f x, y e 2 dxdy
2
Din formula de transport
1 1
Ef ( X , Y ) f ( 2 ln u cos(2 ), 2 ln u sin( 2 ))dudv (6.1.6)
0 0
Facem schimbarea de variabil
x 2 ln u cos2v , y 2 ln u sin 2v (6.1.7)
2 2
Rezult x + y = 2lnu , de unde
x2 y2
ue 2 (6.1.8)
sin 2v
2 2 ln u cos2v
D x. y 2
Iacobianul este u 2 ln u =
Du , v cos2v 2 2 ln u sin 2v u
u 2 ln u
Imaginea mulimii [0,1] [0,1] prin aceast transformare este 2 \ {0}.Cum
punctul {0}este o mulime neglijabil fa de msura Lebesgue n plan, deducem
din relaia (6.1.8) c
x2 y2
2 u e 2
dxdy = dudv dudv = dxdy = dxdy deci relaia (6.1.6) devine
u 2 2
x2 y2
1
1 1
0 0 f
2 ln u cos2v , 2 ln u sin 2v dudv =
2
f x, y e 2 dxdy
(6.1.9)
exact ceea ce trebuia verificat.q.e.d.
Demonstraie
171
ln U n
Fie n = i Tn = 1 + ...+ n. Atunci n sunt i.i.d. repartizate
Exponential(). Logaritmnd expresia din (6.1.10) avem N = min n : Tn > 1. Deci
P(N = 0) = P(T1>1) = e- iar dac n 1, atunci P(N = n) = P(Tn 1, Tn+1 > 1 = P(Tn
1) P(Tn+1 1) = P(Tn+1 > 1) P(Tn > 1). Dar Tn Gamma(n,1), deci
t 2t 2 n 1t n1 t
P(Tn > t) = 1 .... e (6.1.11)
1! 2! n 1!
nt n t
Rezult c P(Tn+1 > t) P(Tn > t) = e . Am demonstrat chiar mai
n!
mult: c dac punem N(t) = min n : Tn > t, atunci N(t) Poisson(t). 6q.e.d.
Demonstraie
Fie An,k = exact k dintre variabilele aleatoare Uj sunt mai mici dect x
Evident P(An,k) = Cnk x k 1 x n k . S observm c evenimentul (U(k) x) se poate
scrie sub forma An,k An,k+1 ...An,n. Cum mulimile (An,j)0 j n sunt disjuncte,
gsim c funcia de repartiie a lui (U)(k) este P(U(k) x) =
C nk x k 1 x n k + C nk 1 x k 1 1 x n k 1 +....+ C nn x n 1 x nn , care este exact funcia de
repartiie a unei variabile aleatoare Beta(k,n+1 k). Densitatea sa este
fk(x) = kC nk x k 1 1 x n k (6.1.12)
6
Procesul stochastic (N(t))t0 se numete procesul Poisson de intensitate . Se poate demonstra
c el este cu creteri independente, adic dac t1 < t2 < ...< tn, atunci variabilele aleatoare (N(t1),
N (t2) - N(t1),......, N (tn) - N(tn-1) ) sunt independente.
172
Simularea repartiiilor d dimensionale
174
Academiei, Bucureti 1981 sau I. Cuculescu, Teoria Probabilitilor, Editura ALL,
Bucureti 1998. Sau se poate cuta pe internet, Dissintegration Theorem.
Definiia 6.2.3. Fie (E, E) i (F, F) spaii msurabile. O funcie Q:E F [0,1]
se numete probabilitate de trecere de la E la F dac
(i) aplicaia x Q(x, B) este msurabil pentru orice B F
(ii) aplicaia B Q(x, B) este o probabilitate pe F pentru orice x E
Demonstraie
Fie f:EF o funcie msurabil. Avem f x, y d Qx, y =
( f x, y dQx y )d x = h x d x unde h(x) = f x, y dQx y .
175
Cum este repartiia lui X, formula de transport spune c h x d x =
Eh(X) . Dar h(X) = f X , y dQX y = E[f(X,Y) X] (conform cu (2.1.3), deci Eh(X) =
E[E[f(X,Y) X]] = Ef(X,Y) (proprietatea de iterativitate). Aadar Ef(X,Y) =
f x, y d Qx, y . Cum egalitatea este valabil pentru orice f msurabil i
mrginit, rezult c repartiia lui Z = (X,Y) este Q.
176
f X 1 , X 2 x1 , x2
f X1 x1 f x1 , x2 ,..., xd dx2 dx3 ...dxd , f X 2 | X 1 x1 x2
d 1 f X 1 x1
f X 1 , X 2 , X 3 x1, x2 , x3
f X 3 | X1 x1 , X 2 x2 x3 ,... (6.2.10)
f X 1 , X 2 x1 , x2
Soluie
Repartiia multinomial Multinomial (n ; p1,p2,p3,...,pk) este o repartiie k
dimensional discret definit prin densitile discrete
n! i
p(i1,...,ik) = p i1 p i2 ... pkk
i1!i2 !...ik ! 1 2
Aici (i1,...,ik) 0,1,...,nk. n cazul acesta, discret, putem s renunm la
teorie i s simulm vectorul nostru Z ca pe orice variabil aleatoare discret:
codificm cumva vectorul (i1,...,ik) de exemplu l gndim c ar fi un numr scris
n baza (n+1) i apoi aplicm metoda cuantilei. n cazul particular de mai sus,
am avea de a face cu o variabil aleatoare cu (100 +1)3 componente. Se poate, dar
nu v sftuiesc.
Dar, dac inem seama de interpretarea probabilistic a acestei repartiii
(se extrag cu revenire n bile dintr-o urn cu bile de k culori diferite, urn n care
pj este proporia bilelor de culoare j !) se verific imediat c
p2
X1 Binomial(n,p1), (X2 X1 ) Binomial(n X1, ),
p2 ... pk
p3
(X3 X1 ,X2) Binomial(n X1 X2, ), etc
p3 ... pk
n cazul nostru concret X1 Binomial(100, 0.1); (X2 X1) Binomial(100 X1,
0.2/0.9) iar X3 = 100 X1 X2.
Secvena de instruciuni care simuleaz n R N = 10 asemenea vectori este
n=100;p1=.1;p2=.2/(1-p1);N=10
x1=rbinom(N,n,p1);x2=rbinom(N,n-x1,p2);x3=n-x1-
x2;x=cbind(x1,x2,x3);x
x1 x2 x3
[1,] 8 23 69
[2,] 5 23 72
[3,] 8 20 72
[4,] 14 24 62
[5,] 13 23 64
[6,] 8 16 76
[7,] 4 32 64
[8,] 8 25 67
[9,] 10 21 69
[10,] 10 21 69
177
Exemplul 6.2.8. S se simuleze un vector X Uniform(C) unde C este sfera
tridimensional unitar de raz 1: C = (x,y,z) 3 x2 + y2 + z3 1
Soluie
Amintim c un vector X se numete repartizat uniform ntr-un compact din k de
volum nenul dac P(X B) = k(B C) / k(C). O definiie alternativ este c
densitatea sa fX = 1C unde = 1/ k(C). Aici k este msura Lebesgue k
dimensional.
3
n cazul nostru fX(x,y,z) =1C x, y , z - deoarece volumul sferei este 413/ 3.
4
3
Folosim formulele (6.2.10.) Mai nti, f X1 x 1C x, y, z dydz . Integrala
4
aceasta reprezint aria seciunii prin sfer fcut prin punctul (x,0,0); seciunea
are form de cerc cu raza r = 1 x 2 , deci aria este (1 x2), deci
3
3 1 x2 f X 1 , X 2 x, y 1C x, y, z dz
f X1 x . Apoi, 4 ; integrala este lungimea
4
seciunii fcute n sfer (x,y,0) , care este intervalul [- 1 x 2 y 2 1 x 2 y 2 ],
3 1 x2 y 2
deci avem f X 1 , X 2 x, y 1x2 y 2 1 . Deci avem n concluzie
2
f X1 x
3 1 x2
4
2 2
2 1 x y
f X 2 | X1 x y 1 y
1 x2 1 x 2 , 1 x 2
f X 3 | X1 x , X 2 y z
2 1 x2 1 z
1 x 2 y 2 , 1 x 2 y 2
3 1 x y2
2
1 4 3
Exemplul 6.2.9. S se simuleze un vector X N( , )
1 3 9
178
Soluie
2 r
n general, dac X N( 1 , 1 1 2
2
), atunci se demonstreaz uor,
r
2 1 2 2
folosind funcia caracteristic sau ce generatoare de momente, c
2
2
, 2 1 r 2 )
X1 N(1,12) i (X2 X1 ) N( 2 r ( X 1 1 )
1
n cazul nostru 1 = 2 = 1, 1 = 2, 2 = 3, r = 0.5. n R este foarte simplu:
mu1=1;mu2=1;sig1=2;sig2=3;r=.5;N=10
x1=rnorm(N,mu1,sig1);mu2yx=mu2+r*x1*sig2/sig1
x2=rnorm(N,mu2yx,sig2*sqrt(1-r^2));x2
cbind(x1,x2)
x1 x2
[1,] 1.4348022 -0.4392765
[2,] 2.9756048 1.3576312
[3,] 1.4325336 5.1186160
[4,] 3.6110443 0.2845141
[5,] -1.6309399 -0.8586991
[6,] -1.1127450 -3.2264889
[7,] -1.7916329 -3.2797160
[8,] 0.2004633 5.0036828
[9,] 3.4808525 5.0187472
[10,] -0.2603470 2.8354261
Pentru dimensiuni mai mari, algoritmul general nu mai este satisfctor nici
pentru simularea vectorilor aleatori normali, deoarece formulele de calcul pentru
(Xj X1,...,Xj-1) devin tot mai complicate.
179
6.3. Algoritmi speciali: repartiii uniforme
Problema 6.3.1. Fie C k o mulime compact de volum k(C) > 0. S se
simuleze un vector X Uniform(C).
Demonstraie
Fie p = P(Xn C). Atunci P(N = n) = p(1 p)n-1, deci probabilitatea ca nu
nimerim niciodat n C este 0. Fie B C o mulime borelian. Atunci
P(Z B) = P(XN B) = P X N B, N n =
n 1
P X j Cj n, X n B PPXX n BC) PX j Cj n, X n C =
n 1 n n 1
P X n B P X n B k B / k A k B
p 1 p n 1 = , exact ce voiam.
P X n C ) n 1 P X n C ) k C / k A k C
180
N=120;x1=runif(N);x2=runif(N);x3=runif(N);s=x1+x2+x3
v=which(s<1);nf=length(v)
xb1=1:nf;xb2=1:nf;xb3=1:nf
for (i in 1:nf)
{xb1[i]=x1[v[i]];xb2[i]=x2[v[i]];xb3[i]=x3[v[i]]}
x=cbind(xb1,xb2,xb3);x
181
Demonstraie
Fie f : n o funcie msurabil i mrginit. Avem de calculat Ef(Y)
n sperana c rezultatul va fi n! fdn . Din formula de transport, avem
n
x x x
Ef(Y) = f 1 , 2 ,..., n e s 1[0, )n 1 x1 ,..., xn , xn1 dx1dx2 ....dxn1 . Aici s este suma x1
s s s
+ ...+ xn+1
D x1 ,..., xn 1
y1 = x1/s, y2 = x2/s,..., yn = xn/s , yn+1 = s. Jacobianul ei este sn ,
D y1 ,... y n 1
n s
f y1 , y 2 ,..., yn 1 n y1,..., yn dy1dy 2 ....dy n s e ds , adic exact ce doream cci a
0
doua integral este n!. q.e.d.
aX 1 bX 2 cX 3
X= unde Xj sunt i.i.d i Exponential(1).
X1 X 2 X 3
182
Mai exist un caz n care suntem norocoi: dac X N(,C). Atunci
folosim urmtorul truc:
Demonstraie
Evident. X este normal , EX = i cov(X) = cov(AY + ) = Acov(Y)A = AA =
A2. q.e.d.
x=normal(mu,c)
4 1 1
=(1,2,3) i C = 1 9 2 .
1 2 16
184
Capitolul 7
Statistic descriptiv
Introducere
Statistica descriptiv este ramura statisticii ce se ocup cu prezentarea,
organizarea i interpretarea unei colectii de date. Descrierea acestor informaii se
poate face grafic (prin liste, grafice liniare, de distribuie etc.), sau prin indicatori
statistici (medie, median, abatere etc.).
185
Anul Durata medie
de viata
1998 69,24
1999 69,74
2000 70,53
2001 71,19
2002 71,18
2003 71,01
2004 71,32
2005 71.76
2006 72,22
2007 72,61
Tabelul 7.1.1
73
72
71
70
69
68
67
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Figura 7.1.1
186
Reprezentarea cu batoane orizontale prezint variante adaptate, de exemplu
reprezentarea pe componente. Diagrama cu batoane grupate furnizeaz o metod
de prezentare a prilor componente ale unui ntreg, fr realizarea unei
comparaii cu ntregul.
Dac ne referim la datele din Tabelul 7.1.2, privind structura populatiei
pe medii (urban, rural), data furnizate de
Tabelul 7.1.2
2008
2006
2004
Rural(%)
2002
Urban(%)
2000
1980
1960
0 10 20 30 40 50 60 70 80
Figura 7.1.2
187
Graficul liniar pe poriuni este format din segmente de dreapt ce se obin
prin unirea perechilor de valori corespunztoare ale unei perechi de variabile
diferite.
n tabelul 7.1.3, sunt prezentate datele furnizate de Institutul Naional de
Statistic privind totalul numrului de imigrani, n perioada 2003-2008.
Total
Anul imigrani
2003 3267
2004 2987
2005 3704
2006 7714
2007 9575
2008 10030
Tabelul 7.1.3
Pentru acest tabel, am realizat graficul liniar pe poriuni din figura 7.1.3.
Total imigrani
12000
10000
8000
6000
4000
2000
0
2003 2004 2005 2006 2007 2008
Figura 7.1.3
188
Alte surse
1%
Fonduri externe
8%
Uniti economice
Uniti economice
Fonduri de la buget
48%
Fonduri externe
Fonduri de la buget
Alte surse
43%
Figura 7.1.4
Tabelul 7.1.4
O descriere precis a seriei statistice obinute se realizeaz prin
construirea unui tabel al frecvenelor, n care observaiile sunt clasificate n
raport cu numrul unitilor statistice care se afl ntre anumite limite. Tabelul
7.1.5 prezint frecvenele pentru datele anterioare, privind salariile. Astfel,
marginile claselor de valori (0,8; 0.95 ...) din tabelul 7.1.5 sunt limitele sau
marginile clasei de valori. Media aritmetic a limitelor unei clase se numete
189
mijlocul sau valoarea central a clasei. Diferena dintre cea mai mare i cea mai
mic margine se numete domeniu sau amplitudine. Frecvena absolut este dat
35
30
25
20
15
10
0
Figura 7.1.5.
190
Poligonul frecvenelor este un grafic liniar pe poriuni, mijloacele claselor
fiind reprezentate pe axa orizontal i frecvenele pe cea vertical. Fiecare mijloc
are o frecven, marcat printr-un punct. Punctele consecutive se unesc prin
segmente de dreapt, rezultnd poligonul frecvenelor.
Figura 7.1.6 prezint poligonul frecvenelor pentru datele din tabelul
7.1.4 (pe axa absciselor s-au folosit rotunjiri, pentru a da doar dou zecimale).
35
30
25
Frecvena(%)
20
15
10
0
0.875 1.025 1.175 1.325 1.475 1.625 1.775 1.925
Figura 7.1.6
Definiia 7.2.1. Pentru cazul discret, mediana unei mulimi x 1 , x2 ,..., x m (datele
de selecie sunt ordonate cresctor) este valoarea de mijloc, x(m+1)/2 , dac m este
1
impar, i media celor dou valori de mijloc, (xm/2 +xm/2+1), dac m este par.
2
191
De exemplu, media mulimii 5,6,8,9,12 este 8, iar pentru 15, 18, 20, 14,
1
28, 30 se obine mediana (20+24)=22.
2
Definiia 7.2.2. Pentru o variabil continu, clasa cu frecvena cea mai mic ce
m
are proprietatea c frecvena cumulat asociat este mai mare dect , m fiind
2
numrul total de clase, se numete clasa medianei.
Pentru datele din tabelul 8.1.5, clasa median este [1,1;1,25), iar mediana
0,5 0,4
este md=1,1+1,5 =1,122.
0,125
192
m
1
x
m i 1
xi .
Definiia 7.2.5. Considerm un tabel al frecvenelor cu k clase. Dac x 1*, x2* ,...,
x m* sunt mijloacele claselor, n1, n2, ..., nk frecvenele lor absolute i f1, f2, ..., fk
frecvenele lor relative, atunci media distribuiei este
k
ni x*i
x i i ,
k
ni
i i
mai precis
k
x f i xi * .
i 1
1,3175.
Se observ c media nu d o imagine complet a datelor de selecie sau a
distribuiei. De exemplu, mulimile {2, 2, 2, 5, 8, 8, 8}, {3, 3, 5, 5, 5, 7, 7}, {4, 4,
4, 5, 6, 6, 6} au aceeai medie, dar au structuri diferite. Acesta este motivul
193
pentru care sunt introduse msuri ale variaiei, care s arate gradul de mprtiere
a datelor n jurul mediei.
Definiia 7.2.6. Pentru o variabil discret, diferena dintre cea mai mare i cea
mai mic valoare a seleciei se numete amplitudine.
Pntru o variabil continu, amplitudinea este diferena dintre limita
superioar a clasei cu cele mai mari margini i limita inferioar a clasei cu cele
mai mici margini.
S considerm urmtoarele date de selecie: 12, 15, 13, 20, 13. Media lor
1
este x 12 15 13 20 13 14,6 , n timp ce abaterea medie are valoarea
5
1
a.m. | 12 14,6 | | 15 14,6 | | 13 14,6 | | 20 14,6 | | 13 14,6 |
5
2,32.
Altfel spus, valorile de selecie difer n medie cu 2,32 fa de media
14,6.
Fie x 1 , x2 ,..., x k valorile distincte ale lui X, avnd media x , iar ni
frecvena lui xi . Atunci
k
ni | xi x |
a.m. i i .
k
ni
i i
k
n
Notnd cu fi= i frecvena relativ, rezult x
f i | xi x | .
m
i 1
Pentru datele din tabelul 7.2.1, abaterea medie este a.m. 1,3.
194
k
ni | x*i x |
a.m. i i ,
k
ni
i i
adic
k
a.m. f i |xi* x | .
i 1
2 i 1 i 1 .
k m
ni
i 1
k
n 2
Dac frecvena relativ este fi= i , rezult 2
m
f i xi x .
i 1
Dispersia corespunztoare datelor din tabelul 7.2.1 este
2
1
20
1 (3 7) 2 1 (4 7) 2 2 (5 7) 2 2 (6 7) 2 5 (7 7) 2
6 (8 7) 2 2 (9 7) 2 1 (10 7) 2 2,8 ,
n timp ce abaterea standard este 1,673 .
195
Definiia 7.2.10. Fie o variabil continu cu un tabel al frecvenelor cu k clase.
Dac x 1*, x2* ,..., x k* sunt mijloacele claselor, n1, n2, ..., nk frecvenele lor
absolute i f1, f2, ..., fk frecvenele lor relative, atunci media distribuiei este
k
ni x*i x
2
2 i i ,
k
ni
i i
mai precis
k
f i xi* x
2
.
i 1
445,2750
Pentru datele din tabelul 7.1.5, dispersia este 2 1,114 , iar
40
abaterea este 1,055 .
Tabelul 7.3.1
196
Vom reorganiza datele de mai sus sub forma unui tabel cu dou intrri,
astfel: notele la algebr sunt reprezentate pe axa absciselor, iar cele la geometrie
pe cea a ordonatelor.
5 6 7 8 9 10 mY
10 9,5
9 9
8 8
7 7,5
6 6
5 5
mX 5,5 6 6,5 7,5 9,5 10
Tabelul 7.3.2
12
10
0
0 2 4 6 8 10 12
Figura 7.3.1
197
10
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10 12
Figura 7.3.2
b1 b2 bn Y
a1 p1
a2 p2
am p m1 pm2 p mn pm
X p1 p2 pn
Tabelul 7.3.3
199
Se poate caracteriza aceast variaie pintr-o relaie X f Y , astfel ca
m2 X f (b j ) | Y b j s fie minim, m2 fiind momentul de ordinul al doilea.
n general, se ncearc o exprimare de forma Y x , astfel ca
E Y X 2 s fie minim. Avnd n vedere c
m n 2
2
E Y X pij b j ai ,
i 1 j 1
i derivnd n raport cu , se obine dreapta de regresie
y m2
2
x m1 . Am notat prin E X m1 Y m2 coeficientul
1 E X m1 2 Y m2 2
de corelaie.
200
Capitolul 8
Teoria seleciei
Introducere
Teoria seleciei s-a dezvoltat datorit necesitilor practice. n multe situaii,
apare necesitatea de a obine informaii relevante despre mulimi cu numr mare
de elemente, neexistnd posibilitatea real de a studia fiecare element n parte. n
aceste cazuri, se poate examina o selecie (eantion) din mulime, n ideea ce
informaia obinut este util pentru ntreaga populaie studiat. Numeroase
aplicaii au condus la axioma potrivit creia un eantion d informaii utile
despre ntreaga mulime i c, pe msur ce selecia crete ca volum, datele
obinute sunt din ce n ce mai fidele.
201
unde f : I k I .
Este comod s alegem funcia liniar
f xn k ,..., x n 1 a1 x n 1 ... a k x n k c, a1, ...ak, c fiind valori ntregi.
Metoda genereaz valori cuprinse ntre 0 i m-1, motiv pentru care m se
alege ct mai mare. Pentru k=0, avem generatori de ordinul nti. n acest caz,
a=16807, c=0, m= 231 1 sau a=24298, c=99991, m=199017 sunt cteva seturi de
valori adecvate.
Variabile aleatoare continue. Simularea unei variabile aleatoare continue
uniforme pe [0,1] se realizeaz prin generarea de valori ntregi uniform
repartizate pe mulimea {0, 1, ..., m-1} i prin mprirea lor prin m-1. Pentru o
variabil aleatoare uniform repartizat pe (0,1) se genereaz valori din mulimea
{1, ..., m-1}, care se mpart la m. O variabil aleatoare X, uniform repartizat pe
(a,b) se genereaz cu ajutorul unei variabile aleatoare Y, uniform repartizat pe
(0,1) dup care se efectueaz schimbarea de variabil X (b a )Y a .
n cele ce urmeaz, ne vom referi la metoda inversrii funciei de
repartiie.
Fie X o variabil aleatoare avnd drept funcie de repartiie F : R [0,1],
atunci inversa ei se definete ca F-1(y)={x R F(x) u}, ( ) u [0,1],
rezultnd astfel o posibilitate de algoritmizare n vederea simulrii variabilei.
Pentru diverse repartiii concrete, se obin diveri algoritmi.
x
Repartiii discrete. Fie X o variabil aleatoare discret, X: i , i 1, n ,
pi
n
pi , pi 0 . Aceast variabil are funcia de repartiie
i 1
F1 0, x xi ;
...
n 1
F ( x)
i
F p k , xi 1 x xi ;
k 1
1, x x n .
202
0, x 0;
k i i
F ( x ) C n p (1 p) n1 , k 1 x k
i0
1, x n.
0, x 0;
k
F ( x ) pq k , k 1 x k ,
i 0
1, x n
unde p q 1, p (0,1) .
X poate fi simulat prin aplicarea modelului clasic de cutare sau prin
simularea variabilei aleatoare cu ajutorul monedei trucate n aa fel nct
probabilitatea apariiei valorii sa fie p, iar cea a stemei sa fie q. Astfel, variabila
X arat la a cta ncercare se obine stema prima dat.
203
Exemplul 8.1.4 Fie X o variabil aleatoare Weibull, cu funcia de repartiie
b
F ( x ) 1 e ax , a, b 0. Algoritmul de simulare se dudcce uor, pe baza faptului
1
1 1 b
c inversa funciei F este F (u ) ln(1 u ) .
a
8. 2. Variabile de eantionare
Fenomenele din natur, studiile sociologice au consacrat metoda sondajului.
Problema care se pune este de a determina caracteristica unei populaii format
din N indivizi, prin prisma rezultatelor x1, x2, ... , xn obinute prin n experiene
indepenente. xi se numesc valori de eantionare, iar populaia este distribuia
teoretic. Dac populaia este infinit, sau poate fi considerat infinit, singura
metod de cercetare pentru determinarea caracteristicilor distribuiei teoretice
este metoda seleciei (sondajele de opinie). Acelai lucru se realizeaz i pentru
un numr finit de indivizi (controlul antidoping realizat pe un numr mic de
componeni ai unei echipe).
Definiia 8.2.2. Valorile obinute pentru indivizii care intr n selecie privind
caracteristica X de numesc date de selecie relative la caracteristica X.
Pentru o selecie de volum n vom nota datele de selecie cu x1, x2, ..., xn.
204
Definiia 8.2.3. Datele de selecie x1, x2, ..., xn sunt valorile unor variabile
aleatoare X1, X2, ..., Xn , care se vor numi variabile de selecie.
Pe parcursul ntregului capitol vom avea n vedere notaiile menionate
n definiia anterioar.
205
valorilor xi corespunztoare, iar f i sunt frecvenele relative, cel de al doilea ar fi
n
x1 x2 ... xn , ni 1 , f i i , i 1, k .
n
S presupunem acum c msurtorile pot fi grupate n k intervale de
valori, de lungime egal, fiecrui interval corespunzndu-i un reprezentant xi ,
i 1, k . n aceast situaie, frecvenele absolute asociate fiecrui interval sunt
egale cu numrul de valori ale caracteristicii msurate n intervalul respectiv.
Apare astfel cel de al treilea tip de serie statistic, i anume
n
x1 x 2 ... x k , ni 1 , f i i , i 1, k .
n
Deosebirea fa de cel de al doilea tip const n faptul c n serie apar
reprezentanii intervalelor.
Fie X caracteristica examinat. Ea poate fi caracterizat prin
xi n
X : , f i 1,
f i i 1
sau prin funcia empiric de repartiie, notat Fn* . Pentru seriile din primele dou
categorii, aceasta are forma
0, x x1 ,
* i 1
Fn ( x )
f j , x i 1 x xi , i 1, k 1.
j 1
206
n
1
xn
n j 1
x j.
207
Pentru momentele centrate de selecie de ordinul al doilea, obinem:
20
2 (X )
1
20 j 1
(x j X )2
1
20
4 (1 2,85) 2 6 (2 2,85) 2 4 (3 2,85) 2
20
2 (Y )
1
20 j 1
yk Y
2 1
20
2 (75 98,5) 2 4 (85 98,5) 2 4 (95 98,5) 2
6 (105 98,5) 2 3 (115 98,5) 2 1 (125 98,5) 2 182,5.
0, x 1;
1
, 1 x 2;
5
1
, 2 x 3;
2
* 7
F20 , X ( x) , 3 x 4; ,
10
17
20 , 4 x 5;
9 , 5 x 6;
10
1, x 6
respectiv
208
0, y 1;
1
, 75 y 85;
10
3
, 85 y 95;
10
* 1
F20, Y ( y ) , 95 y 105;
2
4
5 , 105 y 115;
19 , 115 y 125;
20
1, y 6.
f ij r s
sunt
n
1,
i 1 j 1
f ij n , i sunt trecute ntr-un tabel de corelaie, asemntor
209
r s
mhk f ij xih y kj .
i 1 j 1
Momentele centrate hk se definesc n mod asemntor.
Demonstraie
Deoarece an nf n , an este o variabil binomial, aadar E (a n ) np i
Var (a n ) np (1 p). Au loc urmtoarele relaii, avnd n vedere inegalitatea lui
Cebev:
P f n1 p P an np n
D( an )
P an M (an ) n 1
n 2 2
p (1 p )
1 .
n 2
De aici rezult c lim P f n p 1, q.e.d.
n
210
Aceast teorem permite doar evaluarea direct a probabilitii p de producere a
unui eveniment. Cnd ne referim la o variabil aleatoare, pentru obinerea de
informaii globale trebuie s facem apel la teorema lui Glivenko.
Demonstraie
Variabilele de selecie sunt independente i normal repartizate. Folosind
k
notaiile anunate la nceputul paragrafului, media de selecie, X fi X i ,
i 1
este o combinaie liniar de variabile repartizate normal, aadar are tot repartiie
normal, parametrii fiind ns urmtorii:
k k k
M (X ) M fi X i M (Xi ) f i ;
i 1 i 1 i 1
211
k k
Var ( X ) Var fi X i 2 f i2 , q.e.d.
i 1 i 1
Observaia 8.3.4. n cazul unei serii statistice din primul tip descris anterior,
2
dispersia mediei are valoarea .
n
Teorema 8.3.5. Fie X j1 , X j 2 ,..., X jn j , j 1, k , selecii independente din
Demonstraie
2j
Aplicnd teorema precedent, rezult c X j N j , . Variabila Y, fiind
nj
combinaie liniar de variabile normal repartizate, este tot normal repartizat,
calcule asemntoare celor din teorema anterioar conducnd la determinarea
parametrilor si. q.e.d.
Demonstraie
Considerm Yi X i2 i X i N (0, 2 ), i 1, n . Au loc relaiile:
FYi ( x) P(Yi x ) P( X i2 x) P( x X i x ), 0.
x u 2 x2
1 2 2 du i 1 2 2 , rezult
Deoarece FYi ( x)
2 e fYi ( x )
2x
e
x
2
c Yi (n, ) . Funcia caracteristic a lui Y arat c ea este variabil din
2 (n, ) , q.e.d.
212
Teorema 8.3.7. Fie X X 1 , X 2 ,..., X n t o selecie obinut prin sondaj pur
aleator dintr-o populaie caracterizat de o repartiie normal redus i
n
1i, j n
A aij o martice ortonormal. Atunci variabilele V j a jk X k ,
k 1
j 1, n , sunt independente i normal repartizate, de parametri 0 i 1.
Demonstraie
Dac V (V1 ,V2 ,...,Vn ) t , deoarece V AX i matricea A este ortonormal, au
loc relaiile:
n n
V j V V X A AX X X V j2 .
2 t t t t
j 1 j 1
Funcia caracteristic a vectorului V devine, succesiv:
i nt v n it k x k 1 x k2
k k 1 2 dx ...dx
V ( t1 , t 2 ,..., t n ) E e k 1
2 n k 1
e
1 n
n it x 1 x 2 n t2 n n
k
1 k k
2 k dx
2 k 1
e k e 2 X k (t k ) X k
(t ).
k 1 k 1 k 1
Variabilei V j i se asociaz funcia caracteristic urmtoare
it n a x
jk k
V j (t ) E e k 1
t 2 a 2jk t2 n 2 t2
n n a
2 k 1 jk
X k (ta jk ) e 2 e e 2 X k (t ).
k 1 k 1
Acest lucru arat c V j sunt normal redus repartizate. Avnd n vedere c
funcia caracteristic a vectorului V este chiar produsul funciilor caracteristice
ale variabilelor componente, rezult c V j sunt variabile independente, q.e.d.
213
n n n 2
1
X i X
2
V X i2 Xi
n i 1
i 1 i 1
sunt independente. n plus, U N 0,1 i V 2 (n 1,1).
Demonstraie
U este o combinaie liniar de variabile independente identic repartizate,
aadar U este normal repartizat, cu parametrii:
E (U ) 0,
1 n 1
Var (U ) Var X i nVar ( X i ) 1.
n n
i 1
1
S considerm acum o matrice ortonormal A, n care a1k , k , i
n
V AX (V1 , V2 ,...Vn ) . Avnd n vedere teorema anterioar, V j N (0,1) .
Egalitile
n n 2 2
1 n n n
2 1
V j2 X i2
Xi
Xi Xi V
n n i 1
j 2 i 1 i 1 i 1
conduc la concluzia c V 2 (n 1,1), q.e.d.
Demonstraie
Xi
Notnd Yi , i 1, n, rezult c Yi N (0,1) . Concluzia rezult
uor, verificnd condiiile din teorema anterioar prin intermediul variabilelor
ajuttoare abia introduse, q.e.d.
214
Capitolul 9
Teoria estimaiei
Exemplul 9.1.3. Fie media lui X i 2 dispersia lui X. Pentru un n fixat, notm
1
X X 1 ... X n .
n
Am vzut n exemplul anterior c X este un estimator nedeplasat al mediei
. n calitate de estimator al dispersiei lui X putem alege pe
1
S 2 X 12 ... X n2 X 2 .
n
Un calcul algebric elementar ne convinge c media variabilei aleatoare S 2
este egal cu n 1 2 . Aceasta arat c S 2 nu este estimator nedeplasat; deducem
n
ns imediat c media lui
n
S2
n 1
215
este egal cu 2 , deci n
S2 este estimator nedeplasat pentru dispersia 2 .
n 1
Cu alte cuvinte, dac dispunem de valorile experimentale x1 , ..., x n vom estima
dispersia 2 prin
2
n x 2 ... x 2 x1 ... x n
1 n
.
n 1 n n
L e
x 1
... e
x n
n e
x 1 ... x n .
Derivata lui L ca funcie de este egal cu
x 1 ... x n
n1 e n x1 ... xn .
Deducem imediat c L i atinge maximumul pentru
n
.
x1 ... x n
Aadar, estimatorul de maxim verosimilitate al parametrului din legea
exponenial este
n
.
X 1 ... X n
216
Exemplul 9.2.4. S considerm variabila X cu densitatea uniform
1
, 0 x ;
f x ;
0 , in rest .
L x1 , ..., x n ; 1 n x1 ... x n .
Derivata lui L ca funcie de este egal cu
1 n1 x1 ... xn n 1 ln x1 ... xn .
Funcia L i atinge maximumul pentru
n
1,
ln x1 ... ln x n
deci estimatorul de maxim verosimilitate este n acest caz
n
1.
ln X 1 ... ln X n
217
L
1
e
x 1 2 ... x n 2 / 2 .
2 n
Se constat imediat c ea i atinge maximumul pentru
x1 ... x n
.
n
Deci, estimatorul de maxim verosimilitate este
X 1 ... X n
.
n
S observm c coincide cu media variabilei X, deci, estimatorul de
maxim verosimilitate este tocmai estimatorul nedeplasat despre care a fost
vorba n Exemplul 9.1.2.
e x 1
1 1 2
... x 2n / 2 2
L .
2 n
n
218
Capitolul 10
Introducere
219
Dup observarea statistic a eantionului (seleciei), cele dou limite ale
intervalului mai sus menionat pot fi determinate numeric. Intervalul care
ncadreaz parametrul are proprietatea c acoper valoarea n 1001 din
cazuri. Cu ct nivelul de semnificaie este mai mic cu att are anse mai
mari de a se afla n acel interval (de regul 0,05 ). Probabilitatea 1 este
probabilitatea de garantare a intervalului, valorile acceptate fiind de regul peste
0,95.
a2 ( )
P(a1 ( ) a 2 ( )) f ( )d 1 , (10.1.2)
a1 ( )
a2 ( )
P(h1 ( ( X 1 ...., X n )) h2 ( ( X 1 ,...X n ))) f ( )d 1 . (10.1.3)
a1 ( )
.
Observaia 10.1.3. Dac estimatorul este un estimator centrat (nedeplasat),
deci E intervalul de ncredere este simetric n raport cu , vom avea
h1 i h2 unde reprezint eroarea limit de
estimare sub form absolut. Astfel intervalul de ncredere se poate scrie:
a 2 ( )
P( ) f ( )d 1 (10.1.4)
a1 ( )
R 100 5% i 5% . (10.1.5)
220
Pe baza acestor parametri ai peciziei va rezulta dimensiunea eantionului prin
care se asigur precizia dorit, folosind n acest scop formula z n
care se va vedea c dispersia estimatorului depinde i de volumul n al
seleciei, iar z depinde de nivelul de semnificaie stabilit i de legea de
probabilitate implicat.
P( X z X z ) 1 (10.2.1)
1
2 n 1
2 n
X 1 X 2 ... X n
unde X este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente, 0,1 este nivelul de
semnificaie iar z este cuantila de ordin 1 a repartiiei normale standard
1
2
2
dat prin funcia de repartiie (funcia integral Laplace - Gauss),
x t2
1
x e 2
dt .
2
Demonstraie
ntruct X N , 2 , iar media de selecie este de forma
X X 2 ... X n
X 1 , extragerile fiind independente, urmeaz c
n
2
X N , i mai departe, avem c variabila
n
221
X
Z
n
t2
X 1 z2
2
P ( z1 z2) e dt ( z 2 ) ( z1 ) 1
2 z1
t2
1 z2
2
P( X z 2 X z1 ) e dt ( z 2 ) ( z1 ) 1 .
z1
n n 2
t2
1 z2
2
P( X z 2 X z2 ) e dt ( z 2 ) ( z 2 ) 1 .
z2
n n 2
cunatila de ordin 1 , a repartiiei normale standard.
2
Prin urmare, intervalul este dat prin formula
P( X z X z ) 1 . q.e.d.
1
2 n 1
2 n
222
Observaia 10.2.2. Valorile funciei de repartiie Laplace - Gauss,
x t2
1
x e 2
dt sunt tabelate, adic pentru probabilitatea auxiliar 1 ,
2 2
vom gsi n tabel valoarea cuantilei z 2 z ns exist i tabele, care prezint
1
2
x t2
~ 1
valorile funciei x e 2
dt , x 0, caz n care z2 este
2 0
1
corespunztoare valorii .
2
Observaia 10.2.3. Folosind notaia: X z , se poate scrie intervalul
n 1
2
P( X X X X ) 1 .
Soluie
ntruct 0,05 , obinem din Anexa 1, z 1,96 i mai departe,
1
2
pentru 95% din cazuri,
2 2
55 1,96 55 1,96 .
25 25
223
Prin urmare, n 95% din cazuri, intervalul (54,216 - 55,784) va acoperi valoarea
necunoscut a parametrului .
s s
P( X t X t ) 1 (10.2.2)
n 1, 1
2 n n 1, 1
2 n
X 1 X 2 ... X n
unde X este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente,
2
s
X 1 X X 2 X ... X n X
2 2 2
1 a repartiiei Student cu n-1 grade de libertate.
2
Demonstraie
Conform legilor de probabilitate ale variabilelor de eantionare, atunci
X
cnd x N , 2 , variabila T
s
urmeaz legea Student cu n-1 grade de
n
libertate, ntruct se obine ca raport ntre dou variabile independente, o
variabil ce urmeaz legea normal standard i radicalul unei alte variabile de tip
2 raportat la numrul gradelor de libertate. Procednd ca n cazul cnd 2
este cunoscut se obine intervalul de ncredere corespunztor. q.e.d.
Soluie
ntruct 0,02 , n 6 , obinem din Anexa 2, t 3,365 . Pe baza
n 1,1
2
seleciei avem x 7,5 , s 1,87 i mai departe, n 98% din cazuri,
224
1,87 1,87
7,5 3,365 7,5 3,365 .
6 6
Prin urmare, n 98% din cazuri, intervalul (4,93 - 10) va acoperi valoarea
necunoscut a parametrului .
corect 2
s
X 1 X X 2 X ... X n X
2 2 2
i estimatorul
n 1
2
X 1 X X 2 X ... X n X
2 2 2
p 1 p p 1 p
( p z , p z ) (10.2.3)
1
2 n 1
2 n
X 1 X 2 ... X n
unde p este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente, 0,1 este nivelul de
semnificaie iar z este cuantila de ordin 1 a repartiiei normale standard.
1
2
2
Demonstraie
Media unei variabile aleatoare ce urmeaz legea Bernoulli de parametru
necunoscut p, are pentru selecii de volum mare, conform Observaiei 10.2.4, o
repartiie aproximativ normal cu media egal cu p i abaterea medie ptratic
p 1 p
aproximativ egal cu , prin urmare aplicnd Propoziia 10.2.1 se
n
obine intervalul dorit. q.e.d.
225
Exemplul 10.2.10. La un sondaj electoral, 40 din 100 de persoane chestionate s-
au pronunat n favoarea unui candidat, scopul fiind determinarea unui interval
de ncredere de tip 95% pentru procentul de alegtori favorabil acelui candidat.
Soluie
n 95% din cazuri intervalul va fi
40 0,4 0,6 40 0,4 0,6
1,96 p 1,96 , adic (0,304- 0,496), prin
100 100 100 100
urmare n 95% din cazuri, procentul favorabil candidatului va fi aproximativ
ntre 30% i 50%.
2 2 2 2
X1 X 2 z 1 2 1 2 X 1 X 2 z 1 2 (10.3.1)
1
2
n1 n2 1
2
n1 n2
unde z este cuantila de ordin 1 a repartiiei normale standard.
1
2
2
Demonstraie
Variabila aleatoare Z
X 1 X 2 1 2
urmeaz legea normal
2 2
1 2
n1 n2
standard. q.e.d.
Soluie
n 95% din cazuri intervalul va fi
4 9 4 9
(22 20) 1,96 1 2 (22 20) 1,96 .
7 8 7 8
1 1 1 1
X1 X 2 t S 1 2 X 1 X 2 t S (10.3.2)
,1
2
n1 n 2 ,1
2
n1 n 2
unde t este cuantila de ordin 1 a repartiiei Student cu n1 n 2 2
,1
2
2
Demonstraie
Variabila aleatoare T
X 1 X 2 1 2
urmeaz legea Student cu
1 1
S
n1 n2
n1 n2 2 grade de libertate. q.e.d.
227
dou populaii, pornind de la dou seturi de date de volum 10 i 12 cu mediile
2 2
x1 2,5 i x 2 2 , respectiv s1 0,2 i s 2 0,22 .
Soluie
n 95% din cazuri intervalul va fi
(2,5 2) t S 1 1 1 2 (2,5 2) t S 1 1 ,
,1 10 12 ,1 10 12
2 2
2 2 2 2
s s s s
X1 X 2 t 1 2 1 2 X 1 X 2 t 1 2 (10.3.3)
,1
2
n1 n2 ,1
2
n1 n2
unde t este cuantila de ordin 1 a repartiiei Student cu grade de
,1
2
2
2
s1
2
1
libertate unde
c2
1 c iar c .
n1 1
2 2
n1 1 n2 1 s1 s2
n1 1 n2 1
Demonstraie
Variabila aleatoare T
X 1 X 2 1 2
urmeaz legea Student cu
2 2
s1 s
2
n1 n2
grade de libertate. q.e.d.
228
Exemplul 10.3.6. n vederea comparrii comportamentului unei variabile n
dou populaii normale, avnd dispersii diferite, se pune problema determinrii
unui interval de ncredere de tip 95% pentru diferena mediilor variabilei n cele
dou populaii, pornind de la dou seturi de date de volum 10 i 12 cu mediile
2 2
x1 2,5 i x 2 2 , respectiv s1 0,2 i s 2 0,22 .
Soluie
n 95% din cazuri intervalul va fi
(2,5 2) t 0,2 0,22 1 2 (2,5 2) t S 0,2 0,22 ,
,1 10 12 ,1 10 12
2 2
cu t determinat din Anexa 2, pentru 1 0,975 i determinat din
,1
2
2
0,2
2
1 c 2 1 c 9
relaia cu c .
9 11 0, 2 0, 22
9 11
229
n s2 2 n s2
(10.4.1)
2 2
n 1,1 n 1,
2 2
unde
s 2
X 1 X X 2 X ... X n X
2 2 2
n 1
2 sunt cuantilele de ordin 1 i ale repartiiei 2 cu n-1 grade de
n 1,
2
2 2
libertate.
Demonstraie
ntruct, conform legilor de probabilitate ale variabilelor de eantionare,
cum o sum de ptrate de n variabile aleatoare independente, de medie 0 i
repartiie normal are o repartiie de tip 2 cu n-1 grade de libertate, avem c
variabila 2
n 1 s 2 urmeaz legea 2 cu n-1 grade de libertate, prin
2
urmare pentru un nivel de semnificaie , gsim dou numere 12 i 22 , astfel
nct P 12 2 22 1 . Dac alegem 12 2 i 22 2
n 1, n 1,1
2 2
cuantilele de ordin 1 i ale repartiiei 2 cu n-1 grade de libertate,
2 2
obinem 2
n 1 s 2 , de unde prin artificii de calcul, rezult
2
n 1,
2
2 n 1,1
2
intervalul dorit. q.e.d.
230
Soluie
5 2 52
n 98% din cazuri intervalul va fi 2
2 2 , unde
4, 0.99 4, 0.01
42, 0.99 13,28 i 42, 0.01 0, 297 rezult din Anexa 3, cu valorile tabelate ale legii
2.
2 2 2
1 s1 1 s1
2
12 2
(10.4.2)
f s2 2 f s2
n1 1, n2 1,1 n1 1, n2 1,
2 2
unde f i f sunt cuantilele de ordin 1 i ale
n1 1,n2 1,1
2
n1 1,n2 1,
2
2 2
repartiiei Fisher-Snedecor cu n1 1 i n2 1 grade de libertate.
Demonstraie
Cum raportul a dou variabile de tip 2 este o variabil de tip Fisher,
2
s1
2
1
avem c variabila F 2
urmeaz legea Fisher cu n1 1 i n2 1 grade de
s2
2
2
libertate i raionand ca n propoziia anterioar, se obine intervalul dorit. q.e.d.
231
Soluie
2
1 0, 2 1 1 0, 2
n 95% din cazuri intervalul este 2 ,
f 9,11, 0.975 0,22 2 f 9,11,0.025 0,22
cu f 9,11,0.975 3,59 determinat din Anexa 4, cu valorile tabelate ale legii Fisher
1
i f 9,11,0.025 0,278 .
f 9,11, 0.975
232
Capitolul 11
Teoria deciziei
233
n cele ce urmeaz, vom prezenta anumite metode de a calcula astfel de
probabiliti obiective i implicit de a aprecia gradul de risc asociat unei
decizii. Metode de acest tip vor fi aplicate la testarea irurilor binare cu scopul de
a decide dac sunt aleatoare.
234
Cealalt eroare posibil este de a accepta ipoteza H0 cnd n realitate ea
este fals; aceasta se ntmpl cnd, dei H0 este fals, valoarea lui X n urma
experimentului se plaseaz n afara zonei critice. n acest caz avem de a face cu o
eroare de tip II.
P x K | H 0 este adevarata P x K | 0
ntruct distribuia de probabilitate este complet specificat, probabilitatea
de mai sus poate fi calculat.
i. Fie H1 : = 1.
Atunci
P x K | H 0 este falsa P x K | H1 este adevarata P x K | 1
Din nou distribuia de probabilitate este complet specificat, deci
probabilitatea poate fi i ea calculat.
235
11.7. Un exemplu
Notm cu X timpul dintre dou semnalizri succesive ale unui contor
Geiger. Din studiul dezintegrrii radioactive se tie c variabila aleatoare X are
densitatea exponenial:
e t , t 0
f t
0 , in rest .
unde este un parametru care depinde de natura materialului radioactiv.
Un fizician dorete s testeze valoarea lui pentru un anumit material
radioactiv.
Din anumite considerente teoretice sau experimentale, el tie c poate lua
fie valoarea 1, fie valoarea 2; intuiia fizicianului favorizeaz valoarea 2.
Aadar se testeaz ipoteza:
H0 : 2
n prezena ipotezei alternative:
H1 : 1 .
Pentru simplitatea exprimrii, vom presupune c se face o singur
observaie asupra variabilei X, cu alte cuvinte, se msoar lungimea unui singur
interval de timp dintre dou scintilaii consecutive ale contorului Geiger; desigur
c n practic testarea se va baza pe mai multe astfel de observaii.
Notm cu x valoarea msurat a lui X. Alegem drept zon critic a testului
intervalul (1, +). Aceasta nseamn c:
Dac x > 1, vom respinge ipoteza H0 i vom accepta ipoteza H1;
Dac 0 < x 1, vom accepta ipoteza H0 i vom respinge ipoteza H1.
S calculm nivelul de semnificaie al testului. Avem
P x 1 | H 0 adevarata P x 1 | 2 .
Pentru =2, densitatea de probabilitate este
f t 2 e 2 t , t 0
i deci
2t
1 f t dt 2 1 e dt 0.13 .
P 0 x 1 | H 1 adevarata P 0 x 1 | 1 .
Pentru =1, densitatea de probabilitate este
236
f t e t , t 0 ,
i atunci avem
237
Zona necritic este intervalul (0,1], iar probabilitatea este egal cu aria
delimitat de grafic i axa deasupra zonei necritice.
S construim acum alt test, cu acelai nivel de semnificaie, dar n care
regiunea critic s fie un interval de forma (0,a). Aceasta nseamn s
determinm numrul a>0 astfel nct
P 0 x a | 2 0.13 .
Condiia de mai sus se transcrie n forma echivalent:
238
Nivelul de semnificaie este egal cu aria suprafeei situate deasupra zonei
critice Graficul corespunde valorii =2.
239
n aceast figur este trasat graficul densitii pentru =2. Nivelul de
semnificaie coincide cu aria de sub grafic, la dreapta lui c.
240
Vom testa ipoteza
H 0 : 2 ;
241
11.10. nc un exemplu
35 40 45 50 55 60 65
242
nseamn c zona necritic va fi intervalul [40,60], iar cea critic exteriorul
acestui interval.
Aadar testul nostru poate fi rezumat astfel:
1. Dac faa A apare de un numr de ori mai mic dect 40 sau mai mare
dect 60, moneda este trucat. Probabilitatea ca aceast concluzie s
fie greit este mai mic dect 0.05.
2. Dac faa A apare de un numr de ori cuprins ntre 40 i 60, nu exist
suspiciuni (la nivelul de semnificaie 0.05) c moneda ar fi trucat.
S presupunem acum c n realitate p = 0.7, dar noi nu tim asta. Atunci
distribuia real a lui X va fi aproximativ normal cu media 70 i dispersia 21.
Atunci probabilitatea pentru testul nostru va fi
Cu alte cuvinte, dac p=0.3 testul nostru va respinge ipoteza greit p=0.5 cu
probabilitatea 0.98.
243
Alegem un nivel de semnificaie , adic probabilitatea de a comite o
eroare de tip I. O valoare mare a lui indic un risc mare ca testul s resping
ipoteza H0 cnd ea este n realitate adevrat; cu alte cuvinte, un risc mare ca
testul s declare drept nealeatoare iruri care au fost produse n mod aleator.
O eroare de tip II nseamn n cazul de fa s acceptm drept aleator un ir
produs de un generator imperfect. Probabilitatea de a comite o astfel de eroare
depinde de natura imperfeciunii generatorului, i este dificil de estimat n
practic. n mod curent se consider c o valoare prea mic a lui mrete riscul
unei erori de tip II, cu alte cuvinte mrete riscul de a accepta drept aleatoare
iruri produse de un generator imperfect.
Este deci important s alegem nivelul de semnificaie adecvat problemei
concrete pe care o avem de rezolvat. n practic se folosete un nivel de
semnificaie cuprins ntre 0.001 i 0.05; se alege de multe ori = 0.01.
Fiecare test se bazeaz pe o statistic X a crei valoare numeric se
calculeaz pornind de la irul considerat. De obicei se aleg statistici care pot fi
calculate n mod eficient i care urmeaz o lege normal sau .
Valoarea x a statisticii X pentru irul dat se compar cu valoarea ateptat
de la un ir aleator.
a. S presupunem c statistica X cu care lucrm este distribuit N(0,1), i c
ia fie valori foarte mici, fie valori foarte mari pentru irurile nealeatoare.
Folosind tabele pentru legea normal fixm un prag x astfel nct
244
11.13. Noiunea de P-valoare
Uneori nu se lucreaz cu pragul x, ci se prefer folosirea aa-numitei P-
valori. Vom prezenta aceast noiune n cadrul exemplelor (a) i (b) de mai sus.
a. Fie x valoarea numeric a lui X pentru irul testat. Probabilitatea
se numete P-valoare.
245
x x
246
Iat, n rezumat, dou concluzii.
1. Dac testul a fost proiectat pentru nivelul de semnificaie =0.001, din
1000 de iruri produse aleator, el va respinge, n medie, unul singur ca fiind
nealeator. Dac pentru un ir dat P-valoarea este mai mic dect 0.001,
irul va fi declarat nealeator, iar probabilitatea ca aceast decizie s fie
greit este 0.001.
2. Din 1000 de iruri aleatoare, un test cu nivelul de semnificaie =0.01 va
respinge, n media, 10 iruri ca fiind nealeatoare. Un ir cu P-valoarea mai
mic dect 0.01 va fi declarat nealeator, iar nivelul nostru de ncredere n
corectitudinea acestei decizii este 99%.
, k = 0,1,2,,n.
Notm
Atunci X este repartizat aproximativ N(0,1), adic
unde
z>0.
247
De exemplu, x0.05 = 1.96, iar x0.01 = 2.58.
248
P-valoarea calculat pentru acest ir este
irul trece (aproape la limit) testul cu nivelul de semnificaie 0.01, dar este
respins de testul cu nivelul de semnificaie 0.05.
249
Aceast variabil aleatoare cu N grade de libertate poate fi folosit la
testarea irului, aa cum se arat n exemplul de mai sus.
Cu scop ilustrativ, s considerm irul
011001101
Alegem M=3, N=3, i considerm blocurile
011, 001, 101
Cu notaiile anterioare,
250
Capitolul 12
Analiza regresiei
Introducere
Analiza de regresie i are originile n nenumratele probleme practice,
care apar atunci cnd dorim s nelegem i s cuantificm aspectul cauz-efect,
n studiul a dou sau mai multe fenomene, de natur divers. Principala noiune
cu care opereaz acest capitol este noiunea de model de regresie. Vom vedea n
cele ce urmeaz cteva generaliti ale problemei regresiei, prezentndu-se
principalele tipuri de modele de regresie, apoi se va fundamenta modelul liniar
multiplu, incluznd particularitile modelului liniar simplu, estimarea
coeficienilor modelului prin metoda celor mai mici ptrate, inferena asupra
modelului n ipotezele Gauss-Markov, precum i aspecte privind previziunea pe
baza modelului de regresie.
f x E Y x , x D . (12.1.1)
Y f X 1 , X 2 ,..., X p , (12.1.3)
252
Plecnd de la definiie, se observ c un model de regresie parametric
presupune cunoscut forma funciei de regresie, f (mai bine zis a estimatorului
cutat), excepie fcnd un numr finit de parametri necunoscui, adic
f f , , cu 1 ,..., q B IR q . Evident, dac f , este
cunoscut, estimarea lui f, ntr-un model de regresie parametric, revine la
estimarea lui . Folosind metode de estimare adecvate bazate pe minimizarea
erorii din model, cum ar fi criteriul celor mai mici ptrate, e posibil s se
estimeze, din date, vectorul i implicit f. Reprezentarea grafic a estimatorului
funciei f, obinut prin astfel de metode, va fi o curb care ajusteaz, cel mai bine
datele, din mulimea de curbe permise, prin specificarea modelului.
Modelele de regresie parametric pot depinde, ntr-o manier liniar sau
neliniar, de parametri.
Definiia 12.1.4. Vom spune c avem o regresie liniar, dac funcia f este
liniar n variabilele X 1 , X 2 ,..., X p adic asupra funciei de regresie facem
presupunerea c are forma
p
f X 1 , X 2 ,..., X p ; 1 , 2 ,..., p k X k . (12.1.5)
k 1
q
f X , X
1 2 ,..., X p ; 1 , 2 ,..., q X , X
k k 1 2 ,..., X p , (12.1.6)
k 1
i din care pentru q=1 deriv modelul de regresie liniar simpl, dat prin
f X ; 0 , 1 0 1 X . (12.1.8)
254
12.2. Modelul liniar. Estimarea parametrilor modelului prin
metoda celor mai mici ptrate
p
Y k X k . (12.2.1)
k 1
p
y i k xik i , (12.2.4)
k 1
255
ceea ce, pentru i 1, n , duce la forma matriceal a modelului liniar
observaional,
y x , (12.2.5)
n
i2 . (12.2.6)
i 1
Definiia 12.2.2. Se numete model liniar, ajustat prin criteriul celor mai mici
ptrate, modelul
y xa e , (12.2.7)
x xa x y (12.2.8)
Teorema 12.2.3. Dac rang x p , atunci soluia ajustrii prin criteriul celor
mai mici ptrate este dat de formula
1
a x x x y . (12.2.9)
256
Condiia rang x p revine la independena liniar a vectorilor
x1 , x 2 ,..., x p . Amintim n continuare, cteva noiuni utilizate i n teoria
modelelor de regresie oarecare.
y x0 0 u p , (12.2.10)
cu notaiile p IR , x0 x1 ,..., x p1 M n, p 1 , 0 1 , 2 ,..., p 1 IR p 1 ,
u 1,...,1 IR n . Dac notm x x0 : u , 0 , p , modelul poate fi scris
n forma modelului liniar oarecare, y x . O teorem similar cu Teorema
12.2.3 are loc i n cazul modelului liniar cu termen constant.
1
Teorema 12.2.6. Fie matricea de centrare, P I uu . Notm cu ~z , vectorul
n
centrat corespunztor lui z IR n , adic ~
z Pz z z , z z ,..., z z , cu
1 2 n
z , media de selecie. Dac rang x p i x x 0 : u , ajustarea prin metoda
celor mai mici ptrate are soluia unic dat de
a0 a1 , a 2 ,..., a p 1 ~
x 0 ~
x0 ~ x 0 ~
1
y,
(12.2.11)
p 1
a p y a k xk ,
k 1
257
unde ~
x0 este matricea obinut din matricea x0 , prin centrarea vectorilor de pe
coloan, iar y i x k , noteaz mediile de selecie corespunztoare valorilor y i
respectiv, xik , i 1, n .
Y X , (12.2.12)
y i xi i , i 1, n, y i , xi , i , , IR .
x
i 1
i
x yi y cov x, y
a n
,
S x2
x
2
i x
i 1
(12.2.13)
b y ax ,
Y(%): -2,8; 0,2; 1,6; 3,9; 0,2; 2,4; 4,4; 18,6; 1,5; -17,9; 0,5; 0; 0,8; 0,1; -0,8
X(%): -0,5; 1,5; 3,2; 5,8; 3,3; 7,4; 5,8; 16,0; -2,0; -13,1; 0,7; 0,9; 2,9; 1,8; 1,1.
Soluie
Pe baza eantionului, obinem y 0,85, x 2,32 , cov x, y 41 ,
2
S 36 , prin urmare, conform formulelor de calcul pentru a i b , avem
x
258
41 41
a 1,13 i b 0,85 2,32 1,76 i modelul ajustat este
36 36
Y 1,76 1,13 X .
E , 0,0,...,0 IR n , (12.3.1)
Var E 2 I , (12.3.2)
N (12.3.3)
N , 2 I . (12.3.4)
Var i 2 , i 1, n , (12.3.5)
cov i , j 0, i j, i, j 1, n . (12.3.6)
Condiiile puse asupra erorii se transfer asupra variabilei aleatoare, adic avem
y N x , 2 I .
259
Definiia 12.3.1. Ipotezele (12.3.1) i (12.3.2) sunt cunoscute i sub denumirea
de ipoteze Gauss-Markov, modelul liniar sub aceste ipoteze, numindu-se
modelul liniar Gauss-Markov. Pentru eroarea care satisface aceste ipoteze se
folosete i denumirea de zgomot alb. Datorit ipotezei (12.3.5), modelul se
numete homoscedastic, iar datorit ipotezei (12.3.6), model cu erori
necorelate. Dac la ipotezele Gauss-Markov, se adaug i ipoteza normalitii
(12.3.3), atunci modelul liniar este cunoscut i sub denumirea de model liniar
clasic, cele trei ipoteze fiind apelate ca ipotezele liniaritii modelului, dei
acestea nu in neaprat de un model liniar. Un model clasic (liniar sau nu) este
de fapt, un model cu erori normale ((12.3.3)), independente ((12.3.6)) i identic
distribuite ((12.3.1) i (12.3.5)) sau prescurtat i.i.d.
1 n 2 1
s2 ei e e ,
n p i 1 n p
(12.3.7)
1
S s x x
2
Propoziia 12.3.5. ntr-un model liniar clasic (cu erori normale i i.i.d.-
(12.3.4)), estimatorul obinut prin metoda celor mai mici ptrate este un
estimator eficient pentru .
1 n 2 1 n p 2
S y2 / x ei e e s . (12.3.8)
n i 1 n n
Propoziia 12.3.6. Dac N , 2 I , atunci avem
i)Estimatorii a i s sunt independeni i a N , 2 x x
2
1
.
2 n
s 1
ii) 2 n p 2
2 e 2
i 2 n p .
i 1
a
iii)Fie U , 1 ,..., p IR p . Oricare ar fi IR p , U i s 2
1
x x
sunt independente i U N 0,1 . Mai mult,
a
T T n p , IR p .
1
s x x
261
1
Q2 Q , r rang Q , L M n, n ( IR ) , Q 2 r ,
LQ . Atunci,
2
1
L N i vectorul aleator L , mpreun cu variabila aleatoare 2 Q , sunt
independeni.
ak k
Tk , (12.3.9)
sk
P a k s k t k ak sk t
1 , (12.3.10)
n p ,1 n p ,1
2 2
unde t este cuantila de ordin 1
, a unei variabile Student, cu n p
n p ,1
2
2
grade de libertate, care rezult pentru un nivel de semnificaie , fixat, din
relaia
P Tk t
1 ,
(12.3.11)
n p ,1
2
s2 s2
P n p 2 2 n p 2 1 , (12.3.12)
n p ,1 n p,
2 2
unde 2 i 2 sunt cuantilele de ordin 1 , respectiv , ale unei
n p ,1
2
n p ,
2
2 2
2
variabile , cu n p grade de libertate, determinate astfel nct pentru un nivel
de semnificaie , fixat, s aib loc relaia
P 2 2 2
1 . (12.3.13)
n p , n p ,1
2 2
P Tk t
H0 1 .
n p ,1
2
a k k0
Se calculeaz valoarea t k , a statisticii Tk , pe baza datelor de
sk
selecie i se respinge ipoteza nul, dac t k t .
n p ;1
2
263
Un caz particular al acestui test este cel al semnificaiei coeficientului k ,
test bazat pe ipotezele H 0 : k 0 i H 1 : k 0 .
Urmtoarele dou teste clasice, pe care le vom prezenta, se bazeaz pe o
statistic de tip Fisher-Snedecor, furnizat de urmtorul rezultat din teoria
probabilitilor ([19]).
Q0 Q Q
F (12.3.14)
rang Q0 rang Q rang Q
S 02 Q0 i S12 Q . (12.3.15)
264
P F f H 0 1 .
n p S 02 S12
Ipoteza nul se va respinge, dac f c f , unde f c este
q 1 S12
o valoare calculat a statisticii F din Lema 12.3.8, pe baza datelor de selecie.
P F f H 0 1 .
n p S 02 S12
Ipoteza nul se va respinge, dac f c f , unde f c este
q S12
o valoare a statisticii F din Lema 12.3.8, calculat pe baza datelor de selecie.
Soluie
Aplicnd formula (12.3.10), intervalele de ncredere de tip 95% pentru
coeficienii modelului estimai n Exemplul 12.2.8, vor fi (0.9156, 1.336) pentru
a i (-3.086, -0.4451) pentru b.
Ipoteza normalitii
ei
ti , (12.4.1)
s 1 hi
ei
ti T n p 1 , (12.4.2)
s i 1 hi
unde
267
2
2
e ei2
s i (12.4.3)
n p 1 n p 11 hi
este estimatorul varianei erorilor 2 , obinut prin omiterea datei a i-a,
n 1 p , fiind astfel, numrul gradelor de libertate din model.
Acelai program folosete urmtorul interval de ncredere pentru media
erorii, precizat prin limitele sale,
ei t s i 1 hi , i 1, n , (12.4.4)
n p 1;1
2
unde t este cuantila de ordin 1 , a variabilei Student, cu n p 1
n p 1;1
2
2
grade de libertate, iar s i este cel din (12.4.3). Aceste intervale pot fi
reprezentate printr-un grafic cu bare, mpreun cu reziduurile ei . Intervalele de
ncredere care nu-l includ pe 0 sunt echivalente cu respingerea ipotezei c
E 0 , respingere fcut pentru pragul de semnificaie . n cazul respingerii
ipotezei de zgomot alb asupra erorii, se elimin acest neajuns, prin scoaterea din
model a acelor observaii pentru care intervalul de ncredere (12.4.4) nu-l conine
pe 0.
cov X , Y E XY E X E Y
r X , Y . (12.4.5)
X Y X Y
268
n
x i
x yi y
r x, y i 1
, (12.4.6)
n n
x y
2 2
i x i y
i 1 i 1
r 2
T n 2 (12.4.7)
1 r 2
269
Pentru testarea homoscedasticitii, se cunosc mai multe metode. Una
dintre ele apeleaz la un test de comparare a mai multor dispersii, cum ar fi testul
lui Bartlet (vezi [15]), bazat pe legea 2 . Ipoteza H 0 de egalitate a dispersiilor
se va respinge, dac valoarea calculat a statisticii aferente testului depete
cuantila corespunztoare unui anumit prag de semnificaie i legii 2 . De
asemenea, se poate face un test de ipotez bazat pe reziduuri. Pentru n mare
(dup [29]), reziduul studentizat t i trebuie s fie cuprins ntre 2 i 2. Se
compar t i calculat cu valoarea critic a distribuiei, precizate n formula
(12.4.2). Cazul cnd reziduul t i este mare genereaz ndoieli asupra faptului c
reziduul are aceeai varian ca i celelalte, ceea ce duce la nesigurana ipotezei
V i2 2 , i 1, n .
Pentru corectarea heteroscedasticitii se utilizez n general, rescalarea
modelului. Spre exemplu, pentru un model de forma
y i a1 x1i a 2 x 2i i , i 1, n ,
dac
V i i2 x12i x 22i ,
yi 1 1
a1 a2 i
x1i x 2i x 2i x1i x1i x 2i
i atunci, V i , i 1, n .
x1i x 2i
V 2 I
sau
cov i , j 0, i j , i, j 1, n .
270
Autocorelaia erorilor presupune cov i , j 0, i j . Ipoteza de independen
este necesar n obinerea estimatorilor de varian minim (optimali), prin
metoda celor mai mici ptrate, dar nu i n obinerea estimatorilor nedeplasai.
Autocorelaia erorilor se regsete n principal, n cazul modelelor
dinamice (serii de timp). ntr-un astfel de model, din cauza proastei specificri,
influena erorii unei perioade asupra alteia devine plauzibil. Dup [15],
autocorelaia erorilor poate aprea n modelele statistice, doar dac rezultatele
observrii au fost aranjate n prealabil, cresctor sau descresctor, n raport cu
variabila endogen Y. Pentru validarea ipotezei de independen a erorilor, se
poate folosi, att metoda bazat pe analiza graficului reziduurilor, ct i un test
de corelare. Din punct de vedere grafic, se cerceteaz comportarea empiric a
reziduurilor e1 ,..., en , care nu trebuie s dea impresia unei tendine. Altfel spus,
reziduurile nu trebuie s aib pentru mai multe observaii consecutive aceeai
comportare, spre exemplu, nu trebuie s fie numai pozitive sau numai negative.
Pentru necorelaie, ele trebuie s fie mprtiate aleatoriu n jurul axei absciselor.
Din punct de vedere cantitativ, se poate folosi testul Durbin-Watson (vezi
[29]), care verific ipotezele H 0 : i necorelate i
n
2
e i ei 1
d i2
n
0, 4 . (12.4.8)
2
e
i 1
i
Pentru a admite ipoteza necorelrii, trebuie ca valoarea lui d s fie n jurul lui 2.
n cazul n care se depisteaz o autocorelaie, se corecteaz calitatea
estimatorilor, folosind metoda celor mai mici ptrate generalizate ([30]).
Odat validate sau corectate ipotezele liniaritii modelului, avem
asigurate pentru estimatorii de cele mai mici ptrate, calitile discutate n
paragraful 12.3. Un alt aspect n analiza rezultatelor regresiei ine de calitatea
ajustrii.
Calitatea ajustrii
Influena observaiilor
ei
y i y i ,
1 hi
aadar observaiile pentru care hi e mare i/sau reziduurile sunt mari (observaii
aberante), duc la previziuni suspecte, cci y i y i va fi mult diferit de zero. Ca
o msur a puterii de prezicere a modelului, se cunoate statistica
2
n
e
PRESS i . (12.4.9)
i 1 1 hi
272
a a x x a a
2
i i 1 h y y i
Di ei2 i . (12.4.10)
ps 2 p 1 hi ps 2
p
r X 1 , X 2 ,..., X p , Y sup r ai X i , Y , (12.4.11)
ai i 1
p
rx1 , x 2 ,..., x p , y sup r ai xi , y . (12.4.12)
ai i 1
273
Altfel spus, metoda celor mai mici ptrate determin acea combinaie liniar
ntre variabilele exogene, pentru care corelaia cu variabila endogen este
maximal. n plus, se poate demonstra c
y y
rx1 , x 2 ,..., x p , y , (12.4.14)
y y
2
2
y y y y
r x1 , x 2 ,..., x p , y
2
2
1 2
. (12.4.15)
y y y y
r 2 n p
F (12.4.16)
1 r 2 p 1
274
Testul bazat pe r 2 , prezentat mai sus, este unul de semnificaie al
coeficienilor de regresie n ansamblul lor i n acelai timp(prin r ), al
semnificaiei regresiei liniare cu termen constant, test folosit n analiza
rezultatelor regresiei. Spre exemplu, n Matlab, se ntoarce ca i informaie de
regresie, valoarea calculat a statisticii F i p valoarea asociat acestei statistici,
adic probabilitatea critic,
1
F 2
a x x a .
ps
S R2
R2y , y 1 , (12.4.18)
S T2
unde
n 2
2
S y i y , sum de ptrate total,
T
i 1
(12.4.19)
n
2
S R2 y i y i , sum de ptrate rezidual (indus de reziduuri),
i 1
275
Aadar, coeficientul de corelaie multipl se calculeaz cu formula
n
2
y i y i
S2 S2 y y y y
2 2
R2 1 i 1
n
T 2 R 2
. (12.4.20)
ST
y
2
i y y y
i 1
n n n
y y
2 2 2
i y i y i y i y (12.4.21)
i 1 i 1 i 1
sau altfel,
2 2 2
yy y y y y (12.4.22)
sau nc,
2
S T2 S R2 y y (sum indus de model). (12.4.23)
276
n general, aceast regul nu are loc, de aceea prima parte a formulei
(12.4.15) nu este valabil pentru R 2 i deci, R 2 r 2 , diferen confirmat i de
faptul c n general, R 2 poate lua valori negative (mai precis pentru modele fr
termen constant), n timp ce r 2 nu poate. Totui R 2 i r 2 au aceeai
S T2 S R2
semnificaie i anume, precizeaz proporia, 2
, n care un model
ST
explic bine datele, numai c r 2 se refer strict la modelul liniar cu termen
constant. Spre exemplu, o valoare de 0,97 a lui R 2 ne arat, c modelul din care
rezult y acoper variabilitatea observaiilor, n proporie de 97%.
O mrime asemntoare cu R 2 este i raportul de determinaie(corelaie),
V Y X
0 , care coincide cu R 2 i cu r 2 (a se vedea [29]), pentru regresia
V X
liniar simpl. n general, raportul de corelaie arat proporia n care factorul X
explic variabila Y , nepreciznd forma corelaiei, n timp ce coeficientul de
corelaie arat proporia n care factorul X (unidimensional) explic variabila Y,
prin intermediul unui anumit model de regresie.
Pe lng R 2 , tot ca i msur a calitii ajustrii, se folosete o variant
ajustat a sa. Necesitatea acestei ajustri rezid n faptul c R 2 nu este un criteriu
absolut al calitii ajustrii, n cazul cnd se compar dou modele cu un numr
diferit de parametrii. Astfel, dac p crete n regresia liniar, spre exemplu,
implic faptul c n model s-a inclus o nou variabil, ceea ce face ca S R2 s
scad i implicit, R s creasc artificial.
n 1
2
R 1
n p
1 R2 . (12.4.24)
Presupunem c modelul y x , N , 2 I , a fost validat i c
ne intereseaz estimaii asupra unei noi valori, y 0 , a variabilei Y, date fiind
valorile x 01 , x 02 ,..., x0 p , ale variabilelor X 1 , X 2 ,..., X p , adic ne intereseaz s
previzionm o valoare a lui y(necunoscut). Avem
y 0 a1 x 01 ... a p x 0 p e0 x 0 a e0 .
Apar aadar, dou tipuri de erori n estimarea previziunii. Una se datoreaz noii
erori 0 , cu care valoarea y 0 intr n model, iar alta se datoreaz erorii cu care s-
a estimat . Sigur, n cazul n care dorim s estimm media
E Y X x 0 f x0 x 0 , atunci eroarea este mai mic i se reduce la eroarea
indus de . Folosim notaia
y 0 x 0 a , (12.4.26)
y 0 x0 0 (previziune),
respectiv pentru
f x0 E Y X x 0 x 0 (medie).
278
Interval de ncredere pentru previziune:
P y 0 st 1
1 x 0 x x x 0 y 0 y 0 st
1
1 x0 x x x0 1 .
n p ,1 n p ,1
2 2
(12.4.27)
1 1
P y 0 st x 0 x x x0 f x 0 y 0 st x 0 x x x0 1 .
n p ,1 n p ,1
2 2
(12.4.28)
y
y=ax+b
medie
previziune
Figura 12.4.1
279
simultane sunt asemntoare celor nesimultane, diferena fiind c se utilizeaz
distribuia Fisher-Snedecor, n loc de distribuia Student.
Soluie
Calculnd previziunea punctual obinut pe baza modelului din
Exemplul 12.2.8, avem y 2 1,76 1,13 2 0,5 , n timp ce o evaluare a
formulei (12.4.27) duce la intervalul de ncredere de tip 95% pentru previziune,
(-4,42; 5,39).
280
Capitolul 13
281
Desigur c apar unele probleme tehnice: va trebui ca spaiul parametrilor
E s fie organizat ca un spaiu msurabil (E,E). De obicei aceasta nu este o
problem, n cazurile clasice. De exemplu, n cazul repartiiei Poisson sau
exponeniale E = 0,); la binomial este 0,1 care se organizeaz n mod
natural ca spaii msurabile cu -algebra mulimilor boreliene B(0,)) n
primele dou cazuri sau cu P(N)B(0,1) n al doilea. La repartiia normal
N(,2), E = (0,), etc.
Putem avea o idee despre repartiia factorului de risc, o credin. Aceasta
se numete repartiia apriori a factorului de risc . n limbaj matematic,
repartiia apriori este repartiia iniial a lui . n cele ce urmeaz ea va fi notat
cu U. Deci U (B)= P( B).
Dac parametrul ia valoarea , atunci repartiia seleciei noastre X ar
trebui s fie Q(). Acesta se numete modelul. Deci pentru fiecare E , Q()
este o repartiie pe t. Aceasta este n definitiv repartiia condiionat a lui X
tiind c = .
Pe scurt o abordare Bayesian nseamn o repartiie apriori a
parametrului i un model. Ideea este s obinem din experien o ajustare a
repartiiei apriori, numit repartiia aposteriori a parametrului .
Modelul este de fapt o probabilitate de trecere de la mulimea E a
parametrilor la mulimea t a rezultatelor. Atunci tim de la capitolul privind
simularea variabilelor aleatoare c repartiia vectorului (,X) este UQ iar
repartiia lui X este UQ. Amintim c cele dou operaii se definesc astfel
UQ(C) = Q , C dU C E t msurabil (13.1.1)
Def
UQ(B) UQ(EB) = Q , B dU (13.1.2)
282
unde Z2t iar S = (1,)este definit n Exemplul 13.1.1. Funcia este funcia
m 1 n 1 m!n!
a lui Euler , (m+1,n+1) = = . Rezult c P(X = ) =
( m 1) (n 1) ( m n 1)!
S!(t S ))!
.
(t 1)!
n Exemplul 13.1.2 diferena este c X este U(0,1)Q unde Q() =
Binomial(n,)t deci
1
P(X = x) = Cnx1 Cnx2 ...Cnxt S (1 )ntS d = Cnx1 Cnx2 ...Cnxt (S+1, nt -S+1) (13.1.4)
0
283
atunci densitatea lui X fa de ar trebui s fie fX = . Atunci densitatea comun
a vectorului (, X) fa de este f, X iar densitatea parametrului n ipoteza
c c X = x este f X = x . Reformulnd cu aceste notaii standard avem
densitatea lui (,X) este f,X (, x) = fX = (x)f() (13.1.8)
densitatea lui X este fX ( x) = f , X x, d (13.1.9)
densitatea aposteriori a lui dat de rezultatul x este
f , X , x
f X = x() = (13.1.10)
f X x
Demontraia se poate gsi, de exemplu, n Gheorghi Zbganu, Metode
matematice n teoria i actuariat, Bucureti, Editura Universitii 2004, pp 236.
284
... ...
are repartiia 1 2 n
. Atunci Q ar fi devenit o matrice
p
1 p 2 ... ... n
C C ... C nx t
n
x1 x2
n
(dac U(0,1) atunci fX (x) = n ) iar din (13.1.13)
n x*
( nt 1 ) C ntS
285
( p) n C ( x, n) p tM ( x ) (1 p ) t ( n M ( x ))
fX = x (n,p) =
(13.1.14)
tM ( x ) t ( k M ( x ))
C ( x, k ) p
k x*
k (1 p) ( p)dp
n C ( x, n) p S (1 p ) tnS
(dac U(0,1) atunci fX = x (n,p) =
C x1 C x2 ...Ckxt
k x*
k k k
( kt 1)CntS
Observm ceva de bun sim, pentru care nu avem nevoie de mult tiin
de carte: dac n x*, atunci din (13.1.17), fX = x (n,p) = 0. Nu o s considerm
posibil ca N s ia valori mai mici dect x*!
Propoziia 13.1.3 are drept corolar o formul de calcul pentru E(()X), evident
datorit formulei de transport:
() f X | ( x )u ()d()
E(()X= x) = (13.1.15)
f X | ( x )u ()d()
() = E(Xr) (13.1.16)
Aceasta este cea mai bun aproximare pe care o putem face pentru Xr n
sensul celor mai mici ptrate. n cele ce urmeaz nu vom modifica notaia: ()
va avea mereu aceeai semnificaie.
Sensul precis este c dintre toate funciile () cu care am dori s
aproximm pe Xr n spaiul L2, cea pentru care distana este minim este ().
Ceea ce ne intereseaz n actuariat este mrimea
Este mai puin evident c, n anumite ipoteze, g(X) este i cea mai bun
aproximare pe care o putem face asupra premiului brut de asigurare viitor (adic
286
pentru Xt+1 ) innd seama de modelul nostru bayesian i de experiena acumulat,
X.
n consecin
Demonstraie
Este de fapt relaia (13.1.19) unde n loc de Y avem Xt+1 iar n loc de X avem
vectorul X = (Xr)1rt .
287
n( S 1)
g(X) = (13.1.20)
nt 2
nt
unde z = . q.e.d.
nt 2
288
x* 1
2 daca x* 1
*
x x*
g(X) = daca x* 1 x * . (13.1.23)
*2
x 1 daca x* 1
2
289
Xt+1 g(X)2 = min Xt+1 h(X)2 h L (13.2.3)
adic
E(Xt+1 g(X))2 = min E(Xt+1 h(X))2 h L (13.2.4)
De data aceasta problema este simpl. Este vorba de a gsi minimul unei
forme ptratice convexe. Fiind strict convex, are optim unic.
Derivm h dup c0 i punem condiia ca derivata s se anuleze. Gsim
(am derivat sub integral, deoarece putem aplica criteriul lui Lebesgue de
dominare: variabilele noastre sunt n L2. Rezult
Gradientul ei este
290
Grad (c ) = (-2E(Yr(Yt+1 c1 Y1 c2Y2 - - ct Yt)))1 r t. (13.2.12)
c
j 1
j E(YrYj) = E(YrYt+1) (1.2.13)
c j (a + j,rs2) = a (13.2.16)
j 1
care se rezolv foarte simplu. Adunnd toate ecuaiile rezult (ta + s2)(c1 + + ct)
ta
= ta de unde suma coeficienilor S = c1 + + ct = . Cum sistemul se mai
ta s 2
scrie crs2 + aS = a , urmeaz c
a
c1 = c2 = = ct = . (13.2.17)
ta s 2
Concluzia final este
291
at
z= 2
, a = Var (), s2 = E(Var(Xr)) (13.2.18)
ta s
g(X) = E(()X) =
() f X
( X )u ()d()
= E(Xt+1X) (13.2.19)
f X ( X )u ()d()
at
m = EXr, M = (X1 + + Xt)/t, z = 2
, a = Var (), s2 = E(Var(X1))
at s
(13.2.20)
Un caz particular este dac modelul este Poisson: repartiia Poisson este
de forma (13.2.21). Aici msura este msura cardinal pe mulimea numerelor
naturale.
Se punem acum problema de a estima pe baza datelor de observaie X cei
trei parametri m, a i s2. Acum este o problem de statistic obinuit: cutm trei
estimatori nedeplasai pentru aceste cantiti. Ideea lui Buhlman a fost de a se
apela la mai multe contracte independente de acelai tip.
Un rspuns este urmtorul:
k ( X j ,r M j ) 2 X 2
j ,r tM 2j
1
s 2 = s 2
j , s 2j = r 1
= r 1
(13.2.26)
k j 1 t 1 t 1
k
(M j M 0 )2
j 1 s 2
a = - (13.2.27)
k 1 t
Prin Mj am notat mediile de selecie ale vectorilor Xj.
293
at
Corolarul 13.2.7. Variabila aleatoare z = este un estimator pentru
2
a t s
coeficientul de credibilitate z care este consistent n k : adic k z z .
294
Bibliografie
296
ANEXE
297
Anexa 1
Valorile funciei Laplace - Gauss
u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7290 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9779 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
Anexa 2
Cuantilele repartiiei Student
grade\prob.
0.75 0.90 0.95 0.975 0.99 0.995
1 1.000 3.078 6.314 12.706 31.821 63.657
2 0.816 1.886 2.920 4.303 6.695 9.925
3 0.765 1.638 2.353 3.182 4.541 5.841
4 0.741 1.533 2.132 2.776 3.474 4.604
5 0.727 1.476 2.015 2.571 3.365 4.032
6 0.718 1.440 1.943 2.447 3.143 3.707
7 0.711 1.415 1.895 2.365 2.998 3.499
8 0.706 1.397 1.860 2.306 2.896 3.355
9 0.703 1.383 1.833 2.262 2.821 3.250
10 0.700 1.372 1.812 2.228 2.764 3.169
11 0.697 1.363 1.796 2.201 2.718 3.106
12 0.695 1.356 1.782 2.179 2.681 3.055
13 0.694 1.350 1.771 2.160 2.650 3.012
14 0.692 1.345 1.761 2.145 2.624 2.977
15 0.691 1.341 1.753 2.131 2.602 2.947
16 0.690 1.337 1.746 2.120 2.583 2.921
17 0.689 1.333 1.740 2.110 2.567 2.898
18 0.688 1.330 1.734 2.101 2.552 2.878
19 0.688 1.328 1.729 2.093 2.539 2.861
20 0.687 1.325 1.725 2.086 2.528 2.845
21 0.686 1.323 1.721 2.080 2.518 2.831
22 0.686 1.321 1.717 2.074 2.508 2.819
23 0.685 1.319 1.714 2.069 2.500 2.807
24 0.685 1.318 1.711 2.064 2.492 2.797
25 0.684 1.316 1.708 2.060 2.485 2.787
26 0.684 1.315 1.706 2.056 2.479 2.779
27 0.684 1.314 1.703 2.052 2.473 2.771
28 0.683 1.313 1.701 2.048 2.467 2.763
29 0.683 1.311 1.699 2.045 2.462 2.756
30 0.683 1.310 1.697 2.042 2.457 2.750
35 0.681 1.306 1.690 2.030 2.438 2.724
40 0.681 1.303 1.684 2.021 2.423 2.704
80 0.679 1.291 1.671 2.000 2.390 2.660
120 0.677 1.289 1.658 1.980 2.358 2.617
n>120 0.674 1.282 1.645 1.960 2.326 2.576
Anexa 3
Cuantilele repartiiei 2
grade\prob. 0.005 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99
1 0.000 0.000 0.001 0.004 0.016 2.71 3.84 5.02 6.63
2 0.010 0.020 0.051 0.103 0.211 4.60 5.99 7.38 9.21
3 0.072 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34
4 0.207 0.297 0.484 0.711 1.06 7.78 9.48 11.1 13.28
5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.8 15.09
6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.4 16.81
7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.0 18.47
8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.5 20.09
9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.0 21.66
10 2.16 2.56 3.25 3.94 4.87 16.99 18.31 20.5 23.21
11 2.60 3.05 3.82 4.57 5.58 17.27 19.67 21.9 24.72
12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.3 26.22
13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.7 27.69
14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.1 29.14
15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.6 30.58
16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.8 32.00
17 5.70 6.41 7.56 8.67 10.08 24.77 27.59 30.2 33.41
18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.3 34.80
19 6.84 7.63 8.91 10.1 11.65 27.20 30.14 32.9 36.19
20 7.43 8.26 9.59 10.9 12.44 28.41 31.41 34.2 37.57
21 8.03 8.90 10.3 11.6 13.24 29.61 32.67 35.5 38.93
22 8.64 9.54 11.0 12.3 14.04 30.81 33.92 36.8 40.29
23 9.26 10.2 11.7 13.1 14.85 32.01 35.17 38.1 41.64
24 9.89 10.9 12.4 13.8 15.66 33.20 36.41 39.4 42.98
25 10.5 11.5 13.1 14.6 16.47 34.38 37.65 40.6 44.31
26 11.2 12.2 13.8 15.4 17.29 35.56 38.88 41.9 45.64
27 11.8 12.9 14.6 16.2 18.11 36.74 40.11 43.2 46.96
28 12.5 13.6 15.3 16.9 18.94 37.92 41.34 44.5 48.28
29 13.1 14.3 16.0 17.7 19.77 39.09 42.56 45.7 49.59
30 13.8 15.0 16.8 18.5 20.60 40.26 43.77 47.0 50.89
35 17.2 18.5 20.6 22.5 24.8 46.1 49.8 53.2 57.3
40 20.7 22.2 24.4 26.5 29.1 51.8 55.8 59.3 63.7
60 35.5 37.5 40.5 43.2 46.5 74.4 79.1 83.3 88.4
Anexa 4
Cuantilele repartiiei Fisher - Snedecor
Gr2\Gr1 Prob. 1 2 3 4 5 6 7 8
0.95 161.4 199.5 216 225 230 234 237 239
1 0.975 648 800 864 900 922 937 948 957
0.99 4052 4999 5403 5625 5764 5859 5930 5981
0.95 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37
2 0.975 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4
0.99 98.49 99.00 99.17 99.25 99.30 99.33 99.35 99.36
0.95 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85
3 0.975 17.4 16.0 15.1 15.4 14.9 14.7 14.6 14.5
0.99 34.12 30.84 29.46 28.71 28.24 27.91 27.7 27.49
0.95 17.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04
4 0.975 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98
0.99 21.20 18.00 16.69 15.98 15.52 15.21 15.0 14.80
0.95 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82
5 0.975 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76
0.99 16.26 13.27 12.06 11.39 10.97 10.67 10.5 8.10
0.95 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15
6 0.975 8.07 7.26 6.60 6.23 5.99 5.82 5.70 5.60
0.99 12.25 10.91 9.78 9.15 8.75 8.47 8.26 8.10
0.95 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73
7 0.975 8.07 9.54 5.89 5.52 5.29 5.12 4.99 4.90
0.99 12.25 9.55 8.45 7.85 7.45 7.19 6.99 6.84
0.95 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44
8 0.975 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43
0.99 11.26 8.65 7.59 1.01 6.63 6.37 6.18 6.03
0.95 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23
9 0.975 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10
0.99 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47
0.95 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07
10 0.975 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85
0.99 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06
0.95 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95
11 0.975 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66
0.99 9.65 7.20 6.22 5.67 5.32 5.07 4.89 4.74
0.95 4.75 3.88 3.49 3.26 3.11 3.00 2.91 2.85
12 0.975 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51
0.99 9.33 6.93 5.95 5.41 5.06 4.82 4.54 4.50
0.95 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77
13 0.975 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39
0.99 9.07 6.70 5.74 5.221 4.86 4.62 4.44 4.30
0.95 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70
14 0.975 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29
0.99 8.86 6.51 5.56 5.04 4.70 4.46 4.28 4.14
0.95 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64
15 0.975 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20
0.99 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00
0.95 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59
16 0.975 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12
0.99 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89
0.95 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55
17 0.975 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06
0.99 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79
0.95 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51
18 0.975 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01
0.99 8.29 7.01 5.09 4.58 4.25 4.01 3.84 3.71
0.95 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48
19 0.975 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96
0.99 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63
0.95 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45
20 0.975 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91
0.99 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56
0.95 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42
21 0.975 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87
0.99 8.02 5.78 4.87 4.37 4.04 3.84 3.64 3.51
0.95 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40
22 0.975 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84
0.99 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45
0.95 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37
23 0.975 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81
0.99 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41
0.95 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36
24 0.975 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78
0.99 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36
Anexa 4 (continuare)
Gr2\Gr1 Prob. 9 10 11 12 13 14 15 16
0.95 19.4 19.4 19.4 19.4 19.4 19.4 19.4 19.4
2 0.975 39.4 39.4 39.4 39.4 39.4 39.4 39.4 39.4
0.99 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.4
0.95 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69
3 0.975 14.5 14.4 14.4 14.3 14.3 14.3 14.3 14.2
0.99 27.3 27.1 27.1 27.1 27.0 26.9 26.9 26.8
0.95 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84
4 0.975 8.90 8.84 8.79 8.75 8.72 8.69 8.66 8.64
0.99 14.7 14.5 14.4 14.4 14.3 14.2 14.2 14.2
0.95 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60
5 0.975 6.68 6.62 6.57 6.52 6.49 6.46 6.43 6.41
0.99 10.2 10.1 9.96 9.89 9.82 9.77 9.72 9.68
0.95 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92
6 0.975 5.52 5.46 5.41 5.37 5.33 5.30 5.27 5.25
0.99 7.98 7.89 7.79 7.72 7.66 7.60 7.56 7.52
0.95 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49
7 0.975 4.82 4.76 4.71 4.67 4.63 4.60 4.57 4.54
0.99 6.72 6.62 6.54 6.47 6.41 6.36 6.31 6.27
0.95 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20
8 0.975 4.36 4.30 4.24 4.20 4.16 4.13 4.10 4.08
0.99 5.91 5.81 5.73 5.67 5.61 5.56 5.52 5.48
0.95 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99
9 0.975 4.03 3.96 3.91 3.87 3.83 3.80 3.77 3.74
0.99 5.35 5.26 5.18 5.11 5.05 5.00 4.96 4.90
0.95 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83
10 0.975 3.78 3.72 3.66 3.62 3.58 3.55 3.52 3.50
0.99 4.94 4.85 4.77 4.71 4.65 4.60 4.56 4.52
0.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70
11 0.975 3.59 3.53 3.47 3.43 3.39 3.36 3.33 3.30
0.99 4.63 4.54 4.46 4.40 4.34 4.29 4.25 4.21
0.95 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60
12 0.975 3.44 3.37 3.32 3.28 3.24 3.21 3.18 3.15
0.99 4.39 4.30 4.22 4.16 4.10 4.05 4.01 3.97
0.95 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51
13 0.975 3.31 3.25 3.20 3.15 3.12 3.08 3.05 3.03
0.99 4.19 4.10 4.02 3.96 3.91 3.86 3.82 3.78
0.95 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44
14 0.975 3.21 3.15 3.09 3.05 3.01 2.98 2.95 2.92
0.99 4.03 3.94 3.86 3.80 3.75 3.70 3.66 3.62
0.95 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38
15 0.975 3.12 3.06 3.01 2.96 2.92 2.89 2.86 2.84
0.99 3.89 3.80 3.73 3.67 3.61 3.56 3.52 3.49
0.95 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33
16 0.975 3.05 2.99 2.93 2.89 2.85 2.82 2.79 2.76
0.99 3.78 3.69 3.62 3.55 3.50 3.45 3.41 3.37
0.95 2.49 2.45 2.41 2.38 2.35 2.33 2.29 2.27
17 0.975 2.98 2.92 2.87 2.82 2.79 2.75 2.72 2.70
0.99 3.68 3.59 3.52 3.46 3.40 3.35 3.31 3.27
0.95 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25
18 0.975 2.93 2.87 2.81 2.77 2.73 2.70 2.67 2.64
0.99 3.60 3.51 3.43 3.37 3.32 3.27 3.23 3.19
0.95 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21
19 0.975 2.88 2.82 2.76 2.72 2.68 2.65 2.62 2.59
0.99 3.52 3.43 3.36 3.30 3.24 3.19 3.15 3.12
0.95 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.19
20 0.975 2.84 2.77 2.72 2.68 2.64 2.60 2.57 2.55
0.99 3.46 3.37 3.29 3.23 3.18 3.13 3.09 3.05
0.95 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16
21 0.975 2.80 2.73 2.68 2.64 2.60 2.56 2.53 2.51
0.99 3.40 3.31 3.24 3.17 3.12 3.07 3.03 2.99
0.95 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13
22 0.975 2.76 2.70 2.65 2.60 2.56 2.53 2.50 2.47
0.99 3.35 3.26 3.18 3.12 3.07 .302 2.98 2.94
0.95 2.32 2.27 2.23 2.20 2.18 2.15 2.13 2.11
23 0.975 2.73 2.67 2.62 2.57 2.53 2.50 2.47 2.44
0.99 3.30 3.21 3.14 3.07 3.02 2.97 2.93 2.89
0.95 2.30 2.25 2.21 2.18 2.15 2.13 2.11 2.09
24 0.975 2.70 2.64 2.69 2.54 2.50 2.47 2.44 2.41
0.99 3.26 3.17 3.09 3.03 2.98 2.93 2.89 2.85