Documente Academic
Documente Profesional
Documente Cultură
Probabilitati Si Statistica
Probabilitati Si Statistica
statistic
CUPRINS
Introducere...........................................................................................................7
Capitolul 1. Teoria probabilitilor...................................................................11
1.1. Formalizarea experienelor aleatoare..............................................11
1.1.1. Evenimente...........................................................................11
1.2. Relaii ntre evenimente...................................................................12
1.3. Cmp de evenimente........................................................................14
1.4. Cmp de probabilitate......................................................................15
1.5. Reguli de calcul cu probabiliti......................................................17
Capitolul 2. Variabile aleatoare.........................................................................27
2.1. Variabile aleatoare discrete..............................................................27
2.2. Vector aleator bidimensional...........................................................32
2.3. Caracteristici numerice asociate variabilelor aleatoare....................36
2.4. Funcia caracteristic. Funcia generatoare de momente.................51
2.5. Probleme rezolvate...........................................................................53
2.6. Probleme propuse.............................................................................66
Capitolul 3. Legi clasice de probabilitate (repartiii) ale variabilelor
aleatoare discrete.............................................................................69
3.1. Legea discret uniform...................................................................69
3.2. Legea binomial. Legea Bernoulli...................................................71
3.3. Legea binomial cu exponent negativ. Legea geometric...............79
3.4. Legea hipergeometric.....................................................................83
3.5. Legea Poisson (legea evenimentelor rare) ......................................86
Capitolul 4. Legi clasice de probabilitate (repartiii) ale variabilelor
aleatoare continue..........................................................................91
4.1. Legea continu uniform (rectangular).........................................91
4.2. Legea normal (Gauss-Laplace). Legea normal standard (legea
normal centrat redus).................................................................95
4.3. Legea log-normal........................................................................105
4.4. Legea gamma.................................................................................107
4.5. Legea beta.....................................................................................112
4.6. Legea 2 (Helmert-Pearson) ........................................................114
4.7. Legea Student (t). Legea Cauchy..................................................119
4.8. Legea Snedecor. Legea Fisher......................................................123
4.9. Legea Weibull. Legea exponenial..............................................127
3
11.10. nc un exemplu.........................................................................242
11.11. Testarea irurilor binare.............................................................243
11.12. Testarea statistic a irurilor binare...........................................243
11.13. Noiunea de P-valoare................................................................245
11.14. Un exemplu: statistic repartizat normal..................................247
11.15. Alt exemplu: statistic repartizat 2.........................................249
Capitolul 12. Analiza regresiei.........................................................................251
12.1. Modele de regresie.......................................................................251
12.2. Modelul liniar. Estimarea parametrilor modelului prin metoda
celor mai mici ptrate...................................................................255
12.3. Modelul liniar clasic Gauss - Markov. Inferene asupra
estimatorilor unui model liniar.....................................................259
12.4. Previziunea i analiza rezultatelor unei regresii liniare................265
Capitolul 13. Statistic Bayesian i noiuni de teoria credibilitii.............281
13.1. Statistic Bayesian......................................................................281
13.2. Modelul de credibilitate Bhlmann..............................................289
Bibliografie........................................................................................................295
Anexe.................................................................................................................297
Introducere
Teoria probabilitilor i statistica matematic se aplic n majoritatea
domeniilor tiinei, ncepnd cu tiinele exacte i inginereti i finaliznd cu
tiinele socio-economice, n special acolo unde exist condiii de risc i
incertitudine i unde este necesar adoptarea unor decizii riguros argumentate.
Una dintre construciile de baz n fundamentele statisticii i teoriei
probabilitilor, precum i n justificarea aplicrii acestora n alte domenii, este
dat de legea numerelor mari teorem binecunoscut care i aparine
matematicianului Jakob Bernoulli (1654-1705), fiind aprut n lucrarea postum
Ars conjectandi (1713). Printre ali matematicieni care au rmas celebri n
teoria probabilitilor i statistic, i amintim pe: de Moivre, Laplace, Gauss,
Bertrand, Poincar, Cebev, Liapunov, Markov, Borel, Kolmogorov, Glivenko.
De asemenea, coala romneasc de probabiliti, fondat de Octav Onicescu, i
reprezentat de nume precum Gheorghe Mihoc i Marius Iosifescu, a adus
contribuii semnificative n dezvoltarea acestui domeniu.
Cartea de fa i propune s vin n sprijinul studenilor care au ca
disciplin de studiu, n cadrul a diferite specializri, disciplina Probabiliti i
statistic, oferindu-le acestora o gam larg de aspecte teoretice, nsoite de
exemple i aplicaii. Ca structur, cartea se fundamenteaz pe baza a treisprezece
capitole, ase dintre acestea fiind dedicate Teoriei probabilitilor, respectiv
apte capitole, Statisticii matematice.
n Capitolul 1, sunt prezentate concepte de baz ale teoriei
probabilitilor, mai precis, experiene aleatoare, evenimente, probabilitate,
reguli de calcul cu probabiliti, n timp ce n Capitolul 2, sunt abordate noiuni
precum variabile aleatoare, caracteristici numerice ale variabilelor aleatoare,
funcia caracteristic, funcia generatoare de momente. n Capitolul 3 sunt
prezentate principalele legi de probabilitate ale variabilelor aleatoare discrete i
anume: legea discret uniform, legea binomial i cazul su particular legea
Bernoulli, legea binomial cu exponent negativ i cazul particular legea
geometric, legea hipergeometric i legea Poisson (legea evenimentelor rare),
iar n Capitolul 4 sunt prezentate principalele legi de probabilitate ale
variabilelor aleatoare continue, i anume: legea continu uniform
(rectangular), legea normal (Gauss-Laplace), legea log-normal, legea
gamma, legea beta, legea 2 (Helmert-Pearson), legea Student (t) i cazul su
particular legea Cauchy, legea Snedecor i legea Fisher, legea Weibull i cazul
su particular, legea exponenial. Capitolul 5 se construiete n jurul
convergenei, de diferite tipuri, a variabilelor aleatoare, fiind menionate
convergena aproape sigur, convergena n probabilitate, convergena n
repartiie, precum i legile numerelor mari i teorema limit central. Partea
aferent teoriei probabilitilor se ncheie cu Capitolul 6, dedicat algoritmilor de
simulare a variabilelor aleatoare. n Capitolul 7, se studiaz elemente de
7
10
Capitolul 1
Teoria probabilitilor
1.1. Formalizarea experienelor aleatoare
1.1.1. Evenimente
Definiia 1.1.1. Realizarea practic a unui ansamblu de condiii bine precizat
poart numele de experien sau prob.
Definiia 1.1.2. Prin eveniment vom nelege orice rezultat al unei experiene
despre care putem spune c s-a realizat sau c nu s-a realizat, dup efectuarea
experimentului considerat. Evenimentele se pot clasifica n: evenimente sigure;
evenimente imposibile, evenimente aleatoare.
Definiia 1.1.3. Evenimentul sigur este evenimentul care se produce n mod
obligatoriu la efectuarea unei probe i se noteaz cu .
Definiia 1.1.4. Evenimentul imposibil este evenimentul care n mod obligatoriu
nu se produce la efectuarea unei probe i se noteaz cu .
Definiia 1.1.5. Evenimentul aleator este evenimentul care poate sau nu s se
realizeze la efectuarea unei probe i se noteaz prin litere mari A, B, C, , sau
prin litere mari urmate de indici Ai, Bi,.
Definiia 1.1.6. Evenimentul contrar evenimentului A se noteaz i este
evenimentul ce se realizeaz numai atunci cnd nu se realizeaz evenimentul A.
Definiia 1.1.7. Un eveniment se numete:
1) elementar dac se realizeaz ca rezultat al unei singure probe; se
noteaz cu .
2) compus dac acesta apare cu dou sau mai multe rezultate ale
probei considerate.
Definiia 1.1.8. Mulimea tuturor evenimentelor elementare generate de un
experiment aleator se numete spaiul evenimentelor elementare (spaiul de
selecie) i se noteaz cu . Acesta poate fi finit sau infinit.
11
rezult
AC
- proprietatea de
3.
Dac
A, B K i
A BAB B
(evident
A ,
A A , i A A ).
Definiia 1.2.6. Prin intersecia evenimentelor A i B vom nelege evenimentul
notat A B care const n realizarea simultan a ambelor evenimente.
Intersecia evenimentelor A i B poate fi scris sub forma:
A B / A i B
A A ; A A
i
iI
iI
iI
iI
13
iii) K .
Perechea ( , K) n care K este un -corp se numete cmp borelian
(cmp infinit) de evenimente.
Definiia 1.3.3. ntr-un cmp finit de evenimente ( , K), evenimentele A i K ,
i 1, n , formeaz un sistem complet de evenimente (sau o partiie a cmpului)
dac:
n
i)
i 1
ii)
A i A j i j, i, j 1, n
14
15
P A i PA i dac Ai A j i j, i, j I, A i K ,
iI iI
I-o mulime de indici cel mult numrabil.
iii)
2. P A 1 PA
n
n
3. P A i PA i dac Ai A j i j, i, j 1, n
i 1 i 1
Demonstraie
1) Din relaiile = i = aplicnd axioma iii) din
definiia probabilitii avem P( ) = P( ) = P() + P( ) i rezult P() =
0
2) Din relaiile A A i A A aplicnd axioma iii) din
definiia probabilitii avem P ( A A) P ( A) P ( A) adic
P () P ( A) P ( A) i rezult P ( A) 1 P ( A)
3) Demonstrm prin inducie matematic
n1
P Ai P Ai An P Ai P ( An ) P ( Ai ) P ( An ) P( Ai )
i 1
i 1
i 1
i 1
i 1
n1
dac s-a folosit ipoteza de inducie i s-a inut seama c Ai An .
i 1
Definiia 1.4.5. (clasic a probabilitii) Probabilitatea unui eveniment A este
egal cu raportul dintre numrul evenimentelor egal probabile favorabile
evenimentului A i numrul total al evenimentelor egal probabile.
Alt formulare: probabilitatea unui eveniment este raportul ntre
numrul cazurilor favorabile evenimentului i numrul cazurilor posibile.
Observaia 1.4.6.
1) Conform acestei definiii nu putem stabili probabilitatea unui
eveniment ce aparine unui cmp infinit de evenimente.
2) Definiia clasic se aplic numai atunci cnd evenimentele
elementare sunt egal posibile.
16
sunt
evenimente
compatibile
atunci
P Ai P( Ai ) P ( Ai A j ) P ( Ai A j Ak ) ... ( 1) n 1 P Ai
i , j 1
i j k
i 1 i 1
i 1
i j
P(A B)
l
P(B)
numim probabilitatea lui A condiionat de B i notm PB(A) sau P(A B) .
P3) Probabiliti condiionate: Dac P(B) 0 atunci raportul
Demonstraie
Artm c PB ( A) satisface axiomele probabilitii:
i)
PB ( A) 0 deoarece P( A B) 0 i P( B) 0
P( B E ) P( B)
PB ( E )
1
ii)
P( B)
P( B)
iii)
Fie A1 i A2 K i A1 A2 . Avem
PB ( A1 A2 ) P( B A1 ) ( B A2 )
PB ( A1 A2 )
P( B)
P( B )
,
P( B A1 ) P( B A2 ) P( B A1 ) P( B A2 )
PB ( A1 ) PB ( A2 )
P( B)
P( B)
P( B)
dac ( B A1 ) ( B A2 ) .
Observaia 1.5.1.
1) Oricrui cmp de evenimente ( ,K) i putem ataa un cmp de
probabilitate condiionat { , K, PB}.
2) P(A B) P(B) PB (A) - formula de calcul a interseciei a dou
evenimente dependente. Are loc o generalizare: dac A1, A2, An sunt
evenimente dependente atunci
n
n
P A i P(A i ) .
i 1 i 1
An
sunt
18
evenimente
independente
atunci
i 1
i 1
Ai Ai i faptul c Ai sunt
P5) Inegalitatea lui Boole: A1, A2, An, sunt evenimente dependente atunci
n
n
n
P Ai P( Ai ) (n 1) 1 P( Ai )
i 1
i 1 i 1
Demonstraie
Verificm inegalitatea din enun prin inducie matematic.
Pentru n = 2 avem P( A1 A2 ) P( A1 ) P( A2 ) P( A1 A2 ) dac
P( A1 A2 ) 1 i rezult P( A1 A2 ) P( A1 ) P( A2 ) 1 relaia este adevrat.
Presupunem inegalitatea adevrat pentru n-1 adic
n 1 n1
P Ai P( Ai ) (n 2) i demonstrm pentru n.
i 1 i 1
Avem succesiv
n1
n1
P Ai P Ai An P Ai P( An ) 1
i 1
i 1
i 1
n 1
P( Ai ) (n 2) P( An ) 1 P( Ai ) (n 1)
i 1
i 1
19
Demonstraie
Din ipoteza c Ai, i 1, n este un sistem complet de evenimente rezult
c X ( A1 X ) ( A2 X ) ... ( An X )
Deoarece Ai A j , i j , i, j 1, n avem c
( X Ai ) ( X A j ) , i j, i, j 1, n
Avem succesiv
n
n
n
P( X ) P ( Ai X ) P( Ai X ) P( Ai ) PAi ( X )
i 1
i 1
i 1
P7) Formula lui Bayes: Dac A1, A2, An este un sistem complet de evenimente
al cmpului ( , K) i X K atunci:
P(A i ) PA i (X)
PX(Ai)= n
, i 1, n
P(A i ) PAi (X)
i 1
Demonstraie
Deoarece P( X Ai ) P( X ) PX ( Ai ) i
P ( X Ai ) P ( Ai ) PAi ( X )
avem
P ( X ) PX ( Ai ) P ( Ai ) PAi ( X ) ,
PX ( Ai )
P( Ai ) PAi ( X )
P( X )
P( Ai ) PAi ( X )
n
P( A ) P
i
Ai
dac
s-a
folosit
deci
formula
(X )
i 1
probabilitii totale.
Exemplul 1.5.2. Cele 26 de litere ale alfabetului, scrise fiecare pe un cartona,
sunt introduse ntr-o urn. Se cere probabilitatea ca extrgnd la ntmplare de
5 ori cte un cartona i aezndu-le n ordinea extragerii s obinem cuvntul
LUCIA.
Rezolvare
Notm prin X evenimentul cutat, deci de a obine prin extrageri
succesive cuvntul LUCIA, de asemenea notm prin A1 = evenimentul ca la
prima extragere s obinem litera L; A2 = evenimentul ca la a doua extragere s
obinem litera U; A3 = evenimentul ca la a treia extragere s obinem litera C; A4
= evenimentul ca la a patra extragere s obinem litera I; A5 = evenimentul ca la a
cincea extragere s obinem litera A.
Atunci evenimentul X are loc dac avem
X A1 A 2 A 3 A 4 A 5 .
Rezult:
20
P( X ) P( A1 ) P( A2 A1 ) P( A3 A1 A2 ) P( A4 A1 A2 A3 )
P( A5 A1 A2 A3 A4 )
1 1 1 1 1
.
26 25 24 23 22
P( A) P( A1 ) P( A A1 ) P( A2 ) P( A A2 ) P( A3 ) P( A A3 )
1
1
1
5,51
0,90 0,95 0,92
0,918
9
6
2
6
b) Folosind formula lui Bayes, avem:
P(A 1 )P( A A 1 )
P( A1 A)
P ( A1 ) P ( A A 1 ) P ( A 2 ) P ( A A 2 ) P ( A 3 ) P ( A A 3 )
1
0,10
0, 2
3
=
0,408.
1
1
1
0,49
0,10 0,05 0,08
3
6
2
23
12 1 17
.
35 7 35
3 4 5 1
.
4 5 6 2
P( A1 ) P( A2 ) P( A1 A2 ) P( A3 ) [ P( A1 A3 ) P( A2 A3 )
P(( A1 A3 ) ( A2 A3 )) P( A1 ) P( A2 ) P( A3 )
P( A1 A2 ) P( A1 A3 ) P( A2 A3 ) P( A1 A2 A3 ).
innd seama de independena evenimentelor Ai , i=1,2,3, avem:
P ( B ) P ( A1 ) P ( A2 ) P ( A3 ) P ( A1 ) P ( A2 ) P ( A1 ) P ( A3 ) P ( A2 ) P ( A3 )
P ( A1 ) P ( A2 ) P ( A3 )
3 4 5 3 4 3 5 4 5 3 4 5 119
.
4 5 6 4 5 4 6 5 6 4 5 6 120
Exemplul 1.5.10. Din mai multe controale asupra activitilor a trei magazine
se apreciaz c n proporie de 90%, 80%, 70%, cele trei magazine au declarat
marfa vndut. La un nou control, comisia de control solicit 50 de documente
privind activitatea comercial: 20 de la primul magazin, 15 de la al doilea, 15
de la al treilea. Dintre acestea se alege unul la ntmplare pentru a fi verificat:
a) Cu ce probabilitate documentul ales este corect (nregistrat)?
b) Constatnd c este corect, cu ce probabilitate el aparine primului
magazin?
Rezolvare
a) Notm cu A1, A2, A3 evenimentul ca documentul controlat s provin
de la primul, al doilea i respectiv al treilea magazin. Avem astfel
P( A1 )
20
15
15
; P( A2 ) ; P( A3 )
.
50
50
50
20
15
15
0,90 0,80 0,70 0,81.
50
50
50
20
0,90
P( A1 ) P( A / A1 )
0,36 4
P( A1 / A) 3
50
.
0,81
0,81 9
P( Ai ) P( A / Ai )
i 1
26
Capitolul 2
Variabile aleatoare
Variabila aleatoare este una din noiunile fundamentale ale teoriei
probabilitilor i a statisticii matematice. n cadrul unei cercetri experimentale
se constat c ntre valorile numerice msurate exist diferene chiar dac rmn
neschimbate condiiile de desfurare ale experimentului.
Dac ne referim la o singur msurtoare, variabila aleatoare este acea
mrime care n cadrul unui experiment poate lua o valoare necunoscut aprioric.
Pentru un ir de msurtori, variabila aleatoare este o noiune care-l
caracterizeaz din dou puncte de vedere:
- caracterizare din punct de vedere cantitativ variabila ne d informaii
privind valoarea numeric a mrimii msurate;
- caracterizare din punct de vedere calitativ variabila aleatoare ne d
informaii privind frecvena de apariie a unei valori numerice ntr-un ir.
Dac valorile numerice ale unui ir de date aparin mulimii numerelor
ntregi sau raionale atunci se definete o variabil aleatoare discret, iar n cazul
aparteneei valorilor la mulimea numerelor reale se definete o variabil
aleatoare continu.
xi
28
(dac
xi y j
X Y
,
p
ij
( i , j )IxJ
xiy j
X Y
xi
p
X
ij
(i , j)IxJ , respectiv
yj
Y
pij
(i,j) IxJ.
( i , j )IxJ
ij
p i , i I i
ij
q j , j J .
iI
jJ
P(a
P(a
P(a
P(a
X
X
X
X
b)
b)
b)
b)
F (b) P X b F (a ) P X a
F (b) F (a ) P( X b)
F (b) F (a )
F (b) F (a ) P X a
Demonstraie
Avem succesiv
P (a X b) P ( X b, X a ) P( X b) ( X a)
P ( X b) P ( X a ) F (b) P X b F (a ) P X a
dac s-a inut seama de relaia ( X a ) ( X b) i s-a folosit probabilitatea
diferenei.
P ( a X b) P(a X b) ( X a) P (a X b) P ( X a)
Demonstraie
lim F ( x ) lim P ( X x) P( ) 0
x
lim F ( x) lim P ( X x) P ( E ) 1
4
3 6
sau egal cu 3?
Rezolvare
Pentru ca X s fie o variabil aleatoare trebuie ca
2
i p
p0
1
7
1 1
p 1 . Se obine soluia acceptabil p . Se calculeaz
4
3 6
4
30
P( X 3) P( X 1) P( X 2) P(X 3)
1
7 1 5
.
16 16 3 6
1
1
X :
p
6
0
1
q
3
1
0
1
1
1 ; Y : 1
2 .
2
p
q
12
p
3
3
2
?
9
Rezolvare
Pentru ca X i Y s fie variabile aleatoare se impun condiiile:
1
1 1
6
3 3
1
1
p 0; q 0;2p q 0 i apoi :
, rezult valorile
6
3
1 2p q 12p 2 1
3
acceptabile p
1
i q = 0. Deci variabilele aleatoare au repartiiile:
6
1 0 1
1
1 ; Y : 1 1 1 . Avem :
3
3 3 3
2 0 2
2 5 2
2
XY
:
a)
9 9 9
2 1 0 1 2
2 3 2 1 , deci P(X + Y = c)> 2 corespunde
b) X Y : 1
9
9 9 9 9
9
3 2
situaiei P(X + Y = 0) = adic c = 0.
9 9
1 0
X : 1 1
3 3
31
0, dac x ,
1
1
1 2
, dac x 1,
1
2/3
1/6
1/2
y1yj
x1
p11p1j
pi1pij
..
.
..
.
..
.
xi
32
Evident
ij
= 1.
i , j I J
x
y
x
y
0,20
0,10
0,05
0,15
0,45
0,05
33
p 3 p 31 p 32 0, 45 0,05 0,50
3
4
1
.
X:
0,30 0,20 0,50
2 6
, unde
Analog, variabila Y are repartiia Y:
q
q
1
2
( t )dt, x R .
( x)dx .
a
( x )dx 1 .
Observaia 2.2.9.
1. Pentru o variabil de tip continuu P(X=a)= 0, deci P(a X<b) =
P(a<X<b) = P(a X b) = P(a<X<b) =
34
b
a
( x )dx .
F ( x x ) F ( x )
P( x X x x )
lim
, deci
x 0
x 0
x
x
cnd x este mic avem P(x X x x ) ( x ) x .
2. ( x) F ' ( x ) lim
2 F( x, y)
( x, y) a.p.t. pe R 2 .
xy
2
3) P((X,Y) D ) ( x, y ) dx dy , D R .
D
4)
R2
( x, y) dx dy 1 .
5) X ( x ) ( x , y)dy, x R ; Y ( y ) ( x, y )dx, y R .
Definiia 2.2.12. Spunem c variabilele aleatoare de tip continuu X i Y sunt
independente dac F(x,y) = FX ( x ) FY ( y) , ( x , y) R 2 .
kxy 2 , ( x, y ) 1,2 1,3
Aplicaia 2.2.13. Funcia ( x, y )
este densitate de
0
,
n
rest
ecuaia n k, k
1
.
13
, dac x 1 sau y 1
, dac x , y 1, 2 1,3
, dac y 1,3 i x 2
, dac y 1, 2 i y 3
, dac x 2 i y 3
2
, y3
Observaia 2.3.2.
1) Dac I este finit, valoarea medie exist.
2) Dac I este infinit numrabil, E(X) exist cnd seria care o
definete este absolut convergent.
Definiia 2.3.3. Fie{, K, P} un cmp borelian de probabilitate i variabila
x
, x R . Se numete valoarea
aleatoare X : R de tip continuu X
(
x
)
medie exist atunci cnd integrala improprie care o definete este convergent.
Propoziia 2.3.4.(proprietile valorii medii) Au loc afirmaiile :
1) E (a X b) a E(X) b, a, b R
2) E(X + Y) = E(X) + E(Y)
3) X,Y independente E(X Y) = E(X) E(Y)
Demonstraie
36
iI
iI
ax b
i
dac variabila aX b are repartiia aX b i
pi iI
2. Variabila
X+Y
are
1.
iI
xi y j
X Y
,
pij (i , j )I J
repartiia
pij P( X xi , Y y j )
Rezult
E ( X Y ) ( xi y i ) pij xi pij y j p ij
iI jJ
iI jJ
iI jJ
xi pi y j q j E ( X ) E (Y )
iI
jJ
ij
q j i
iI
ij
pi
jJ
xi y j
pi q j (i , j )I J
independente.
Avem E ( XY ) xi y j pi q j x i p i y j q j E ( X ) E (Y )
iI jJ
iI
jJ
1
xb
x Y (
)dx de unde prin
a
a
Avem: E (aX b) E (Y )
x Y ( x)dx
E ( aX b )
E ( X Y ) E (Z )
( x) dx x ( (u , x u ) du ) dx
37
E( X Y )
( x (u, x u )dx)du
t ( (u, t ) du ) dt u ( (u , t ) dt )du t X (t ) dt u Z (u ) du E (Y ) E ( X )
E ( XY ) E (V )
x dx
x V ( x ) dx x ( (u , u ) u ) dx
E ( XY )
x
x
(u , ) dx )du ( tu (u , t )dt )du
u
u
Dispersia
Definiia 2.3.5. Fie {, K, P} un cmp borelian de probabilitate i variabila
aleatoare X : R. Se numete dispersia (variana) variabilei aleatoare X,
2
caracteristica numeric Var ( X ) E X E ( X ) iar ( X ) Var ( X ) se
numete abatere medie ptratic.
continu.
Dispersia este un indicator numeric al gradului de mprtiere (sau de
dispersare) a valorilor unei variabile aleatoare n jurul valorii medii a acesteia.
Propoziia 2.3.6.(proprietile dispersiei)
a) Var ( X ) E ( X 2 ) E ( X )2
b) Var (aX b) a 2Var ( X ), a, b R
c) X,Y independente Var ( X Y ) Var ( X ) Var (Y )
Demonstraie
38
a)
Var ( X ) E X E ( X ) E X 2 2 E ( X ) X E ( X )
2
E ( X 2 ) 2 E ( X ) E ( X ) E ( X ) E ( X 2 ) E ( X )
dac s-a fcut un calcul formal.
b) Folosind proprietile valorii medii i definiia dispersiei avem:
2
Var (aX b) E (aX b aE ( X ) b) 2 E a 2 X E ( X )
2
a E X E ( X ) a Var ( X )
c) Dac X, Y sunt independente avem E ( XY ) E ( X ) E (Y ) . Calculm
2
Var ( X Y ) E X Y E ( X Y ) E X E ( X ) Y E (Y )
2
E X E ( X ) E Y E (Y ) 2 E X E ( X ) E Y E (Y )
E X E ( X ) Y E (Y ) 2 X E ( X ) Y E (Y )
2
Var ( X ) Var (Y )
dac s-a inut seama c E X E ( X ) 0
Propoziia 2.3.7.(Inegalitatea lui Cebev) Dac variabila aleatoare X are
valoare medie i dispersie atunci 0 are loc inegalitatea
Var ( X )
P( X E ( X ) ) 1
sau inegalitatea echivalent cu aceasta
2
Var ( X )
P( X E ( X ) )
.
2
Demonstraie
Presupunem c X este o variabil aleatoare de tip continuu, avnd
densitatea de probabilitate (x) . Atunci
D
2
2 1 0 1
2
2
5
X : 1
12 12 12 12
atunci deducem c:
2
3
1
1
12 12
1
2
2
5
1
1 1
1 0 1 2 3
12 12
12 12
12
12 2
1
2
2
5
1
1
E( X 2 ) 4 1 0 1 4 9 2
12 12
12 12
12
12
1 7
2
Var ( X ) E ( X 2 ) E ( X ) 2
4 4
7
( X ) Var ( X )
2
Aplicaia 2.3.9. Dac X este variabil aleatoare continu
x
x
, x 1,3
, ( x ) 4
X :
( x)
0,
n rest
atunci deducem c:
E ( X ) 2
E( X )
3
x3
13
x4
x ( x )dx
, E ( X 2 ) x 2 ( x)dx
5
1
12 1 6
16 1
Var ( X ) E ( X 2 ) E ( X ) 5
2
( X ) Var ( X )
169 11
36 36
11
6
Momente
Definiia 2.3.10. Fie {, K, P} un cmp borelian de probabilitate i variabila
aleatoare X : R. Se numete moment iniial (obinuit) de ordin k al
variabilei aleatoare X, caracteristica numeric mk E ( X k )
Observaia 2.3.11. a) Pentru k=1 avem
Var ( X ) m2 m12
x
b) Dac X este variabil de tip discret avnd repartiia X : i ,
pi iI
pi 1 atunci mk xik pi
i I
iI
40
x
atunci
X :
( x ) x R
mk x k ( x)dx
R
xi E ( X ) k pi
, X discret
iI
k
k
xi E ( X ) ( x )dx , X continu
R
Observaia 2.3.13. Pentru k=1 avem 1 0 , iar pentru k=2, 2 Var ( X )
Teorema 2.3.14. ntre momentele centrate i momentele iniiale exist
k
Demonstraie
Avem
k
k
k
k E X E ( X ) E X m1 E C ki X k i ( m1 ) i
i 0
k
k
k
E (1) i C ki X k i m1i (1) i C ki E ( X k i )m1i (1) i C ki mk i m1i
i 0
i 0
i 0
xir y sj p ij
, ( X , Y ) discret
iI jJ
mrs
r s
2 x y ( x, y )dxdy , (X, Y) continuu
R
Definiia 2.3.17. Se numete moment centrat de ordin (r,s) al vectorului aleator
(X,Y), caracteristica numeric
rs E ( X E ( X )) r (Y E (Y ) s , adic
41
xi E ( X ) r y j E (Y )s pij
, ( X , Y ) discret
iI jJ
rs
r
s
x E ( X ) y E (Y ) ( x, y )dxdy , (X, Y) continuu
R2
Observaia 2.3.18.
m1 o E ( X ), m0 1 E (Y ), 2 0 Var ( X ), 0 2 Var (Y )
Corelaie sau covarian
Definiia 2.3.19. Se numete corelaia sau covariana variabilelor aleatoare X i
Y, caracteristica numeric
C ( X , Y ) E X E ( X )Y E (Y ) adic C(X, Y) 11
Observaia 2.3.20.
1) C ( X , Y ) E ( XY ) E ( X ) E (Y ), C(X, Y) m11 m10 m01
Dac X, Y independente C(X, Y) 0 , dar nu i reciproc.
C ( X , X ) Var ( X )
n
m
C ai X i , b jY j
j 1
i 1
a b C X
i
, Y j , oricare ar fi variabilele
i 1 j 1
r(X, Y)=
Var ( X ) Var (Y )
Observaia 2.3.22.
1) X, Y independente r(X, Y) 0 reciproc nu este adevrat;
2) Spunem c X,Y sunt necorelate dac r(X,Y) =0
Proprieti:
a) r ( X, Y) 1
b) r ( X , Y ) 1 Y a X b, a 0
c) r ( X , Y ) 1 Y aX b, a 0
Observaia 2.3.23. n practic se mai spune c:
1) X i Y sunt pozitiv perfect corelate dac r ( X , Y ) 1 ;
2) X i Y sunt negativ perfect corelate dac r ( X , Y ) 1 ;
3) X i Y sunt puternic pozitiv (sau negativ) corelate dac
42
24
24
24
24
12
9
8
7 16 2
E( X 2 ) 1 0 1
24
24
24 24 3
2
1
95
Var ( X ) E ( X 2 ) [ E ( X )]2
3 144 144
6
7
8
3
8 1
E (Y ) 1 0 1 2
24
24
24
24 24 3
6
7
1
3 26 13
E (Y 2 ) 1 0 1 4
24
24
24
24 24 12
13 1 35
Var (Y ) E (Y 2 ) [ E (Y )]2
12 9 36
1
1
1
1
1
1
1
1
E ( XY ) 1 1 0 1 2 0 1 0 1 2
12 12
24
6 12
24
6
24
1
1
1
1 5
1 1 0 1 2
24
6
24 24
24
5
1 17
24 36 72
17
C( X , Y )
12
r( X , Y )
0,295
Var ( X )Var (Y )
95 35
144 36
C ( X , Y ) E ( XY ) E ( X ) E (Y )
43
Observaia 2.3.27.
a) Pentru cazul unui vector aleator bidimensional, a nu se face confuzie
ntre media produsului componentelor X i Y, care este E ( XY ) i
media vectorului ( X , Y ) care este E ( X , Y ) .
b) Uneori matricea de corelaie C (Z ) se mai noteaz i cu (Z ) .
c) Desfurat matricea de covarian C (Z ) are forma:
44
C ( X 1 , X 2 ) ... C ( X 1 , X n )
Var ( X 1 )
... C ( X 2 , X n )
C ( X 2 , X 1 ) Var ( X 2 )
C (Z )
...
...
...
...
C ( X , X ) C ( X , X ) ... Var ( X )
n
1
n
2
n
1
... r ( X 2 , X n )
r ( X 2 , X1 )
R( Z )
...
...
...
...
r ( X , X ) r ( X , X ) ...
n
1
n
2
X 1 :
p1 p2
q1 q2
r1 r2
a cror repartiie comun notat ( pijk ) , 1 i, j, k 2 , este:
1
1
1
3
; p112 ; p121 ; p122
;
16
16
32
32
1
1
1
5
p211 ; p212 ; p221 ; p222 .
8
4
16
16
S se determine repartiiile bidimensionale i unidimensionale ale
vectorului aleator tridimensional Z X 1, X 2 , X 3 i matricele de corelaie
C (Z ) i R(Z ) .
Rezolvare
Avem imediat repartiiile bidimensionale
1
1
1
2
3
3
p21 p211 p212
p22 p221 p222
8
8
3
5
p1 2 p112 p122
p11 p111 p121 32
32 pentru X , X
;
1
3
8
9
p21 p211 p221
p2 2 p212 p222
16
16
p111
45
3
5
2
3
3
13
p 21 p121 p221
p 22 p122 p222
32
32
C (Z ) 0
1
3 16 i R (Z ) 0
1
0,21
3 32 3 16 207 256
0,12 0,21 1
46
Observaia 2.3.35.
1) Dac e<0 atunci graficul distribuiei are un aspect turtit i legea se
numete platicurtic.
2) Dac e>0 atunci graficul distribuiei are un aspect ascuit i legea va
fi numit leptocurtic.
3) Dac e = 0 atunci repartiiile sunt mezocurtice.
Definiia 2.3.36. Dac X este o variabil aleatoare cu funcia de repartiie
F (x) , se numesc cuartile (n numr de trei) ale lui X (sau ale repartiiei lui X)
numerele q1 , q2 i q3 cu proprietile:
1
F (q1 ) 4
1
F (q1 0)
4
Observm c q2
F ( q2 ) 2
1
F ( q2 0)
2
Me .
F (q3 ) 4
3
F (q3 0)
2
1 0
.
Exemplul 2.3.37. Se consider variabila aleatoare X :
0,2 0,3 0,5
S se calculeze: E(X), E(3X), E(4X-2), Var ( X ), X .
47
Rezolvare
3
E (3 X ) 3E ( X ) 3 0,8 3,4 ;
E (4 X 2) 4 E ( X ) 2 4 0,8 2 1,2
Observm c: ( x ) 2 - x, dac 1 x 2
0, altfel
1
2
x3 1
x3 2
2 2
E ( X ) x (x)dx x 2 dx x(2 x)dx
1
1
0
1
3 0
3 1
1
2
x4 1
x3 2 x4 2 7
E ( X 2 ) x 2 ( x)dx x 3 dx x 2 (2 x)dx
0
1
4 0
3 1
4 1 6
7
1
2
Var ( X ) E ( X 2 ) E ( X ) 1
6
6
Exemplul 2.3.39. Fie vectorul aleator (X,Y) cu densitatea de probabilitate
k ( x y 1), x [0,1], y [0,2]
Se cere:
( x , y)
0, n rest
a) s se determine constanta k;
b) s se determine densitile marginale;
c) s se cerceteze dac X i Y sunt independente sau nu;
d) s se calculeze coeficientul de corelaie ntre X i Y.
Rezolvare
a) din condiiile ( x , y) 0 k 0
( x, y )dxdy k dx ( x y 1)dy 1 k 1 5 .
1
(x y 1), x [0,1], y [0,2]
Deci ( x , y) 5
0, n rest
48
b) X ( x ) ( x, y)dy
1 2
2x 4
( x y 1)dy
, x [0,1]
5 0
5
2x 4
, x [0,1]
X (x ) 5
0, altfel
1 1
2y 3
y ( y) (x , y)dx ( x y 1)dx
, y [0,2]
0
5
10
2y 3
, y [0,2]
Y ( y) 10
0, altfel
c) X i Y nu sunt independente deoarece: ( x , y) X ( x ) Y ( y)
1 1
8
d) E ( X ) x ( x, y )dxdy x X ( x)dx x(2 x 4)dx
5 0
15
2
1
17
E (Y ) ( x, y )dxdy y Y ( y )dy y (2 y 3)dy
0
10
15
1
1
11
m2 ( X ) E ( X 2 ) x 2 X ( x )dx x 2 (2 x 4)dx
0
5
30
2
1
8
m2 (Y ) E (Y 2 ) y 2 Y ( y )dy y 2 (2 y 3)dy
10 0
15
11
64
37
2
Deci
Var ( X ) E ( X 2 ) E ( X )
30 225 450
8 289
71
2
Var (Y ) E (Y 2 ) E (Y )
5 225 225
2
1 1
E ( X Y ) xy (x, y)dxdy dx xy ( x y 1)dy
0
5 0
1 1
14
9
2x 2
x dx C ( X , Y ) E ( XY ) E ( X ) E (Y ) .
5 0
3
15
9
8 12 1
15 15 15 225
1
C( X ,Y )
225
Se obine: r ( X , Y )
0,02758
X Y
37 71
450 225
Exemplul 2.3.40. Se tie c, dac dou variabile aleatoare X i Y sunt
independente, atunci coeficientul lor de corelaie este nul. Reciproca nu este
adevrat. Iat un vector aleator discret (X,Y), n care X i Y sunt dependente i
totui r 0 .
49
-1
1
16
1
16
1
2
2
3
16
16
2
16
16
16
16
Rezolvare
Calculm repartiiile marginale:
1
2
1
2
0
1
; Y :
X :
6 16 4 16 6 16
4 16 4 16 8 16
7
3
3
; Var ( X ) ; X
4
4
2
5
3
10
E (Y ) 1; E (Y 2 ) ; Var (Y ) ; Y
2
2
2
0
2
4
2 1
XY : 1
2
6
4
3 , E(XY)=1
16 16
16 16 16
E(X Y) - E(X)E(Y)
11
r
0
X Y
3 10
2
2
Avem:
E ( X ) 1; E ( X 2 )
50
Cum F ( M e ) P ( X M e )
b) mk ( X ) E ( X k )
Me
0
( x )dx
Me
M e 1.
2
1
2k
x k dx
.
2
k 1
X (t ) 1 (t ) 2 (t ) ... m (t ) j (t )
j 1
1) (0) E (1) 1 i
(t )
p e
itx k
k K
k K
eitx
k K
itX j
) j (t )
j 1
j 1
rezult
x
1 it
3) Dac X : x , x 0 atunci (t ) e x eitx dx
1 t2
e
0
1) G (0) 1
2) Dac Xj, 1 j m , sunt independente n totalitate i au funciile
generatoare G j (t ) , j 1, m , atunci funcia generatoare a variabilei aleatoare
X X 1 X 2 ... X m este
m
G X (t ) G j (t )
j 1
3) Dac Y aX b , a i b R, atunci
GY (t ) G X (at ) etb
4) Dac X admite momente iniiale de orice ordin, atunci funcia
generatoare admite derivate de orice ordin n punctul zero i
G X( r ) (0) E ( X r ) mr ( X ) , r 1, 2, ...
Aplicaia 2.4.9.
1
1 0
atunci
1) Dac X :
1 6 1 12 2 3
1
1 1
2e t e t 3
G (t ) e t e t
6
2 3
6
x
2) Dac X : x , x 0 , 0 atunci
e
, dac t
G (t ) e x etx dx
t
0
iar n caz contrar nu exist.
k
3) Dac X : k k n k
, p, q 0 , p q 1 , atunci
Cn p q k 0 , n
n
G (t ) Cnk p k q n k e tk ( pet q) n
k 0
1 / 2 1 / 4 1 / 4
1 / 2 1 / 2
1 / 2 1 / 4 1 / 4
1 1 1
P(Y 2 1) P(Y 1 Y 1) P(Y 1) P(Y 1) .
3 6 2
Deoarece X i Y sunt independente avem c pij = piqj,1 i, j 3 . De exemplu
1 1 1
p12 P( X 0, Y 1) P( X 0) P(Y 1)
. Obinem
2 6 12
0 1 0 1 0 2 11 11 1 2 2 1 2 1 2 2
X Y :
1 / 6 1 / 12 1 / 4 1 / 12 1 / 24 1 / 8 1 / 12 1 / 24 1 / 8
adic
0
1
2
3
4
1
.
X Y :
1
/
6
1
/
12
1
/
6
7
/
24
1
/
6
1
/
8
Analog
0 (1) 0 1 0 2 1 (1) 1 1 1 2 2 (1) 2 1 2 2
X Y :
1 / 6 1 / 12 1 / 4 1 / 12 1 / 24 1 / 8 1 / 12 1 / 24 1 / 8
de unde
1
0
1
2
4
2
.
X Y :
1 / 12 1 / 12 1 / 2 1 / 24 1 / 6 1 / 8
Cum 2X i 3Y au repartiiile
2
4
6
0
3 3
, 3Y :
,
2X :
1 / 2 1 / 4 1 / 4
1 / 3 1 / 6 1 / 2
obinem repartiia lui 2X + 3Y :
1
3
5
6
7
8
10
3 1
.
2 X 3Y :
1 / 6 1 / 12 1 / 12 1 / 12 1 / 24 1 / 4 1 / 24 1 / 8 1 / 8
La fel obinem:
1
0 1/ 2 1
2
X 2
,
:
Y 1 / 12 1 / 12 1 / 2 1 / 8 1 / 6 1 / 24
1
2
0
.
max( X , Y ) :
1 / 6 5 / 24 5 / 8
Aplicaia 2.5.2. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comun (pij ) i marginale (pi) i (qj) sunt date n tabelul urmtor :
X\Y
-1
0
1
pi
-1
1/8
1/12
1/6
3/8
1
1/24
1/4
1/3
5/8
qj
1/6
1/3
1/2
1
54
,
X Y :
1 / 6 1 / 24 1 / 12 1 / 4 1 / 8 1 / 3
1
0
1
X
.
:
Y 1 / 24 1 / 6 1 / 12 1 / 4 1 / 8 1 / 3
Repartiiile lui X2 i Y2 rezult imediat din cele ale lui X i Y:
1
1
0
.
X 2 : , Y 2 :
1
1 / 3 2 / 3
1 2 3 3
Aplicaia 2.5.3. Fie variabila aleatoare discret X :
2
p p2
p p
a) S se determine p.
b) S se calculeze funcia de repartiie a lui X.
c) S se calculeze probabilitile:
P ( X 1), P ( X 3), P ( X 4), P (1,5 X 3,2), P ( X 2,1),
P (3,1 X X 2,8), P (1,5 X 3 2 X 4).
Rezolvare
a) Trebuie s avem p + p2 + p + p2 + p2 = 1 i p 0. Rezult
3p2 + 2p = 1 i p 0, adic p = 1/3.
b) Cum F(x) = P(X x) rezult c F(x) = 0 dac x 1,
F(x) = p = 1/3 dac x (1,2] ,
F(x) = P(X=1) + P(X=2) = p + p2 = 4/9 dac x ( 2,3] ,
55
3
.
p 2
F ( x) 9
7
, 3 x 4;
9
8 , 4 x 5;
9
1,
x 5.
c) Avem
P(X<1) = P() = 0, P(X<3)=P(X=1)+P(X=2)=4/9,
P(X>4)=P(X=5)=1/9, P(1,5<X<3,2)=P(X=2)+P(X=3)=4/9,
P(X2,1)=P(X=3)+P(X=4)+P(X=5)=5/9,
P(3,1 X , X 2,8) P( X 3,1)
2 p2
2
P(3,1 X X 2,8)
2
P( X 2,8)
P( X 2,8) p 2 p
5
P(1,5<X3/2<X<4)=P(X=2 sau X=3 / X=3) = P(X=3/X=3) =1.
Aplicaia 2.5.4. Determinai constanta a R pentru ca funcia f dat mai jos s
fie densitate de repartiie i apoi s se determine funcia de repartiie
corespunztoare. S se calculeze mediana, cuantilele i valoarea modal a
variabilei aleatoare X avnd densitatea de probabilitate (x):
x [0,1 / 2]
2 x,
2x
( x ) a , x (1 / 2,2]
3
0
,
altfel.
Rezolvare
Avem
( x)dx 1 , de unde
1/ 2
2
2x
xdx a dx 1 sau
1/ 2
3
x2
x 2 10/ 2 ax 12/ 2 1 . Rezult a = 4/3 i deci
3
0,
x0
0,
x0
2
x ,
x [0,1 / 2]
x ,
x [0,1 / 2]
x
F ( x) (t )dt 1
4x x2 1
x 4 2t
, x (1 / 2,2]
4 1 / 2 3 dt, x (1/ 2,2]
3
1,
x2
1,
x2
56
3
1
c2 . Se observ c F(1/2)=1/4 deci c1 c3
2
2
4x x2 1 3
3
rezult din F(x)=3/4, adic
, de unde c3 2
.
3
4
2
Deoarece este cresctoare pe [0,1/2] i descresctoare pe (1/2,2],
1
x=1/2 este punct de maxim (singurul), prin urmare M o ( X ) .
2
Aplicaia 2.5.5. S se determine variabilele aleatoare independente
x x 1 x 2 x 3
y 2y 3y
i Y :
,
X :
2
3p
4p
q 2
p 2p
q q
tiind c E(X)=2 i E(Y)=7. S se calculeze apoi E(2X+3Y), Var(X),
Var(Y) i Var(2X+3Y).
Rezolvare
Deoarece X este o variabil aleatoare trebuie s avem p+2p+3p+4p=1,
adic p=1/10. Atunci
E(X) = xp+(x+1)2p+(x+2)3p+(x+3)4p = 10px+20p = x+2.
Cum E(X) = 2 rezult c x = 0.
Analog q+q2+q2=1, adic 2q2+q-1=0, de unde q=1/2. Rezult c
7
E(Y)=yq+2yq2+3yq2= y . Cum E(Y) = 7 avem c y=4. Tablourile de
4
repartiie ale lui X i Y vor fi
0
X : 1
10
1 2
1 3
5 10
3
4
2 , Y : 1
5
2
8 12
1 1 .
4 4
2 4
4
10 5 10 5
E( X 2 ) 0
1
1
3
2
1 4 9 5 i
10
5
10
5
57
1
1
1
64 144 60 . Atunci
2
4
4
Var(X) = E(X2)-E(X)2 = 5-4 = 1 i Var(Y) = E(Y2)-E(Y)2 = 60-49 = 11.
Cum X i Y sunt independente, rezult c i 2X i 3Y sunt independente
E (Y 2 ) 16
i avem
Var(2X+3Y) = Var(2X)+Var(3Y) = 4Var(X)+9Var(Y) = 41+911 =
103.
Aplicaia 2.5.6. S se determine variabilele aleatoare X i Y ale cror repartiii
sunt date incomplet n tabelul de mai jos, tiind c E(X)=17 i Var(Y)=1. S se
calculeze apoi E(XY) i Var(X-Y).
X\Y
a
a2
qj
-b
1/5
0
1/10
2/5
pi
3/5
1/5
Rezolvare
3 2
. Mai departe
5 5
1 1
2
1
p11+p12+p13=p1, adic p13 , deci p13
. Cum
5 10
5
10
1 1
1
p13+p23=q3 rezult c p23
. Dar p21+p22+p23=p2, adic
5 10 10
3 2 1
1
3
p21
. Din p11+p21=q1 i p22+p12=q2, rezult c q1
i
5 5 10 10
10
1
q2 . Obinem astfel
2
a a2
b 0 b
2
3
X : 2 3 , Y : 3 1 1 . Astfel E ( X ) a a 2 17 ,
5
5
10 2 5
5 5
adic
3a2+2a-85=0,
de
unde
a1=5,
a2=-17/3.
Deoarece
3b
1 b
b
E (Y ) 0
i
10
2 5
10
3
1
1 b2
E (Y 2 ) (b) 2 0 2 b 2
, rezult c
10
2
5 2
b2 b2
49b 2
Var (Y ) E (Y 2 ) E (Y ) 2
58
a 2b ab 0 ab a2b
a b a2 b a a2 a b a2 b
1
1 1
1 i X Y : 1
XY : 1
1
1 2
1
1
5
2 10 10
10
10
10 5
5
10
10
a 2 b ab ab a 2 b
ab
a
.
10
5 10 10
10
7
Dac a=5, E(XY)=-5/7, iar dac a=-17/3, E(XY)=17/21. Pentru
calcularea dispersiei lui X-Y, avem nevoie de:
a b a 2 b a 2a 2 a b a 2 b 6a 2 4a b
E( X Y )
10
10
10
5
5
10
10
2
2
2
2
4
2
2
( a b)
( a b)
a
2a
( a b)
( a b) 2
2
E[( X Y ) ]
10
10
10
5
5
10
6a 4 4a 2 2ab 5b 2
10
120
18985
Pentru a=5, b=10/7 avem E(X-Y)=
i E[( X Y ) 2 ]
,
7
49
18985 14400 4585
deci Var ( X Y )
.
49
49
49
Aplicaia 2.5.7. S se determine parametrii care apar n repartiiile urmtoare
i s se calculeze apoi E(X) i Var(X), X fiind o variabil aleatoare, avnd
repartiia respectiv:
n
a) X : 1 n , n N , q 0 ;
q
4
x
, x [0,1], a 0 ;
b) X :
2
a( x 2 x )
Astfel E ( XY )
a 2 x 3 , x [0,1]
1
x
, ( x ) ax, x (1,2]
c) X :
( x)
2
altfel.
0,
Rezolvare
a)Din condiia
n 0
1 1
1
3
1 1 q q
4 1 q
4
4
'
4q
1 rezult c
1
1
1
1
E ( X ) n q n q n q n 1 q (q n )' q q n
4
4 n 0
4 n 0
4 n 0
n 0
Atunci
'
1 1 1
1
1 3 1
q
q
3
2
4 1 q 4 (1 q)
4 4 1
16
59
'
'
1
1
1
E ( X ) n q n q n(q n )' q nq n q nq n
4
4 n 0
4 n 0
n 0
4 n 0
'
1 1 1
2
q
q
24.
2
4 (1 q ) 4 (1 q ) 3
Astfel Var(X) = E(X2)-E(X)2 = 24-9 = 15.
b) Din condiia
a( x
0
2 x)dx 1 rezult c
x3
4
3
a x 2 10 1 a 1 a . Atunci
3
4
3
1
1
3
3 x 4 2 x 3 1 11
0
,
E ( X ) x ( x)dx x ( x 2 2 x )dx
0
0
4
4 4
3
16
1
1
3 x 5 2 x 4 1 21
2
2
2 3
2
0
.
E ( X ) x ( x )dx x ( x 2 x)dx
0
0
4
4 5
4
40
Astfel Var ( X ) E ( X 2 ) E ( X ) 2
c) Din condiia
21 11
67
.
40 16
1280
( x)dx 1 rezult c
4
a 1
ax
x2 2
a 2 3a
2 x 1
Cum
dx
1
0
1
0
1 2
4
4
4
4
a 4
( x) 0 numai a=1 convine, astfel c :
1
a 2 x 3dx
2
1
2
x
x5
E ( X ) x ( x )dx x x 3 dx x dx
0
0
1
2
5
1
0
x3
6
2
1
2
x
x6
E ( X 2 ) x 2 ( x)dx x 2 x 3 dx x 2 dx
0
0
1
2
6
1
0
1 7 41
5 6 30
2
1
x4
8
2
1
49
,
24
49 41
313
Var ( X ) E ( X ) E ( X )
.
24 30
1800
Aplicaia 2.5.8. Fie vectorul aleator (X,Y) cu X, Y variabile aleatoare
independente, a crui densitate de probabilitate este
a
( x, y )
. S se determine:
2
(1 x )(1 y 2 )
a) funcia de repartiie corespunztoare;
b) P(( X , Y ) [0,1) [0,1)) .
2
Rezolvare
60
a
dxdy 1 . Rezult
(1 x )(1 y 2 )
R
dx
dy
1
1 a arctgx arctgy 1 a 2 .
c a
2
2
1 x 1 y
1 x y
dudv
1 x du y dv
F ( x, y ) 2
2
2
2
(1 u )(1 v ) 1 u 2 1 v 2
Atunci
1 1
1
1
arctgx arctgy
2
2
1
1
1
dudv
P(( X , Y ) D ) 2
0
0
(1 u 2 )(1 v 2 )
b)
1
F (1,1) F (1,0) F (0,1) F (0,0)
16
a) Avem
( x, y )dxdy 1 , deci
a) Avem
0 0
2a
3
1 de unde a .
3
2
b) Avem F ( x, y )
( x, y )dxdy .
u
du
vdv
.
0
0 0 2
2 0
4
Dac x [0,1] i y > 2 avem
x 23
2
3 x
F ( x, y ) u 2 vdudv u 2 du vdv x 3 .
0 0 2
0
2 0
Dac x > 1 i y [0,2] obinem
x
F ( x, y )
F ( x, y )
0 0
y
3 2
3 1
y2
u vdudv u 2 du vdv
.
0
2
2 0
4
61
x 0 sauy 0
0,
x3 y 2
, ( x, y ) [0,1] [0,2]
43
Astfel F ( x, y ) x ,
x [0,1], y 2
2
y
,
x 1, y [0,2]
4
x 1, y 2
1,
Funciile de repartiie marginale sunt
x0
0,
3
FX ( x ) F ( x, ) x , x [0,1]
1,
x 1
y0
0,
y 2
FY ( y ) F (, y ) , y [0,2]
4
y2
1,
Aplicaia 2.5.10. Fie vectorul aleator (X,Y) avnd densitatea de probabilitate
e ( x y ) , x 0, y 0
( x, y )
altfel
0,
S se calculeze:
a) P(X<1,Y<1), P(X+Y<1), P(X+Y2), P(X1/Y1), P(X<2Y),
P(X=n) ;
b) Funcia de repartiie F(x,y) i funciile de repartiie marginale FX(x),
FY(y);
c) Densitile de repartiie marginale X(x), Y(y);
d) Momentele obinuite de ordin (k,s) ;
e) Corelaia variabilelor X i Y.
Rezolvare
1
a) P ( X 1, Y 1)
1 1
x y
0 0
( x, y )dxdy
dxdy (e x ) 10 (e y ) 10 (1 e 1 ) 2
P ( X Y 1)
1 1 x
( x, y)dxdy
0 0
e x y dxdy e x ( e y ) 10 x dx
0
x y 1
(e x e 1 )dx (e x ) 10 e 1 1 2e 1 ,
0
P ( X Y 2) 1 P ( X Y 2) 1
( x, y)dxdy
x y2
2 x
e x y dxdy 1 e x (e y ) 02 x dx 1 (e x e 2 )dx 3e 2
62
P( X 1 / Y 1)
P( X 1, Y 1)
P(Y 1)
P ( X 1, Y 1)
P (Y 1)
e x y dxdy e x dx (e x ) 1
1
e x y dxdy e x
e
2
(e y ) 1 e 1
P( X 1, Y 1) e 1
P ( X 2Y )
x y
0 x 2 y
(e e
3 x
2
dxdy
x
2
0
e x e y dydx e x (e y ) 0x / 2 dx
0
x 2 32 x
2 1
)dx e e 0 1 , P(X=Y)=0.
3
3 3
b) Avem F ( x, y )
(u , v)dudv .
e u v dudv e u du e v dv (1 e x )(1 e y ) .
x k e x dx
x k y s e x y dxdy
y s e y dy (k 1)( s 1) k! s! ,
proprietatea c ( p 1) p! pentru p N .
e) Avem
cov( X , Y ) E ( XY ) E ( X ) E (Y ) m11 xe x dx
ye y dy
1 ( 2) 2 1 1 0 .
Aplicaia 2.5.11. Fie (X,Y) un vector aleator discret a crui repartiie
probabilist este dat n tabelul de mai jos. S se calculeze coeficientul de
corelaie r(X,Y) i s se scrie ecuaiile dreptelor de regresie.
X\Y
-1
0
1
2
pi
-1
1/10
1/5
1/10
0
2/5
0
1/20
0
1/10
1/20
1/5
1
1/10
1/10
1/20
3/20
2/5
qj
1/4
3/10
1/4
1/5
1
63
Rezolvare
Pe baza formulelor corespunztoare, deducem imediat:
2
1
2
1
3
1
1 2
E ( X ) 1 0 1 0 , E (Y ) 1 0 1 2 ,
5
5
5
4
10
4
5 5
2
1
2
4
E ( X 2 ) (1) 2 0 2 12 ,
5
5
5 5
1
3
1
1 13
E (Y 2 ) (1) 2 0 2 12 2 2
,
4
10
4
5 10
4
Var ( X ) E ( X 2 ) E ( X ) 2 ,
5
13 4 57
Var (Y ) E (Y 2 ) E (Y ) 2
10 25 50
1
1
1
1
E ( XY ) (1) (1) (1) 0 (1) 1 (1) 2 0 0 (1)
10
5
10
20
1
1
1
1
1
3 1
0 0 0 0 1 0 2
1 (1) 1 0 1 1
1 2
10
20
10
10
20
20 4
1
cov( X , Y ) E ( XY ) E ( X ) E (Y ) ,
4
cov( X , Y )
0,25
r( X , Y )
.
Var ( X )Var (Y )
2
57
5 50
Ecuaiile dreptelor de regresie sunt :
2
2
y
y
x0
5 ,
5 0,25 x 0 .
0,25
4
57
57
4
5
50
50
5
Aplicaia 2.5.12. S se determine funcia caracteristic i funcia generatoare de
momente i apoi s se calculeze, pornind de la acestea, momentele m1 i m2 ,
pentru urmtoarele variabile aleatoare:
0 1 2
a) X : 1 1 1 ;
2 4 4
x
b) X : x , x 0 .
e
Rezolvare
a) Avem
X (t ) e
0it
1 0t 1 1t 1 2t 2 e t e 2t
e e e
.
2
4
4
4
Primele dou derivate ale acestor funcii sunt:
i
1
'X (t ) (eit 2e 2it ) , "X (t ) (e it 4e 2it ) ,
4
4
1
1
G X' (t ) (e t 2e 2t ) , G "X (t ) (e t 4e 2t ) .
4
4
Obinem
3i
5
3
5
'X (0) , "X (0) , G X' (0) , G "X (0) , de unde
4
4
4
4
'
(0)
3
1 ( X ) E(X ) X
G X' (0)
i
i
4
" (0)
5
2 ( X ) E ( X 2 ) X 2 G "X (0) .
4
i
G X (t )
cos tx e dx i sin tx e x dx A iB
0
cos tx e
x
0
t sin tx e x dx 1 tB ,
0
t cos tx e x dx tA .
0
1
t
i B =
.
2
1 t
1 t2
1 it
.
1 t2
Apoi G X (t ) e tx e x dx e x (t 1) dx
e x (t 1)
t 1
(
t
)
,
X
(1 t 2 ) 4
(1 t 2 ) 5
1
2
G X' (t )
, G "X (t )
.
2
(1 t )
(1 t )3
Obinem
' (0)
m1 ( X ) E ( X ) X
G X' (0) 1 i
i
"X (0)
2
m2 ( X ) E ( X )
G "X (0) 2 .
2
i
65
1
,t 1 .
1 t
a) constanta real A;
b) densitile de probabilitate X, Y pentru variabilele aleatoare X,
Y;
1
1
1
1
c) probabilitile P(0 X , 0 Y ) i P(X Y ).
2
2
2
2
Aplicaia 2.6.2. La patru uniti alimentare din ora se poate gsi zilnic pine
proaspt cu probabilitile p1=0.8, p2=0.9, p3=0.95 i respectiv p4=0.85. Fie X
numrul unitilor alimentare din cele patru la care se gsete pine proaspt
ntr-o zi fixat. S se determine:
a) distribuia variabilei aleatoare X;
b) valoarea medie, dispersia, abaterea medie ptratic, mediana i
modul variabilei aleatoare X.
Aplicaia 2.6.3. Fie (X,Y) coordonatele unui punct luminos ce reprezint o int
pe un ecran radar circular i care urmeaz legea uniform pe domeniul
D = (x,y)R2x2+y2 r2 . S se determine valoarea medie i dispersia
distanei Z =
m
,
m 1
( x ) m! e , daca x 0 .
0, daca x 0
1
2
1
2
0
1 0
i Y :
X :
1 6 1 2 1 3
1 8 1 2 1 4 1 8
S determine variabilele aleatoare: X+Y; X-Y; XY; X2; Y2; X3; Y3; 2X; 3Y;
2X+3Y; 3Y-2X; X .
Aplicaia 2.6.7. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comune ( pij ) i unidimensionale ( pi ) i (q j ) sunt date n tabelul
de mai jos:
Y
-1
0
1
2
pi
X
-1
1/12 1/24 1/24 1/48 3/16
1
1/48 1/24 1/48 1/24 1/8
2
1/48 1/3
1/6
1/6 11/16
qj
1/8
5/12 11/48 11/48
1
a) Scriei variabilele aleatoare X i Y;
b) Precizai dac variabilele aleatore X i Y sunt independente sau
nu i justificai rspunsul;
Y
c) Scriei variabilele aleatoare: X+Y; X-Y; XY;
; X2; Y3;
X
3X-2Y;
Aplicaia 2.6.7. Fie variabilele aleatoare independente:
2 1 0 1 2
0 1 2 3 4 5
1 2 1 1 i Y : 1
1 1 1 1
1
X : 1
10 5 5 10 5
12 12 2 6 12 12
a) Calculai E(X), E(X2), Var(X), E(Y), E(Y2) i Var(Y);
b) Care dintre urmtoarele mrimi pot fi calculate i care nu i de
ce?
E(2X+3Y); Var(2X+3Y); E(X2+Y); Var(X2+Y);
E(X2+Y2); Var(X2+Y2); E(XY).
c) Calculai mrimile de la punctul b) pentru care rspunsul este
favorabil.
Aplicaia 2.6.8. S se determine, n fiecare caz, variabila aleatoare X i apoi s
se calculeze E(X) i Var(X).
x
x
a) X : x , xN, p > 0, q > 0, b) X : ax , xN, a > 0, b > 0
b
pq
x!
x
x
, x[0,1], aR
c) X : , x[0,1], aR, d) X :
2
ax
a (3 x 2 x )
67
x
x
, xR,
e) X : a x , aR, xR, f) X :
e
( x)
, x 0,1
ax
a 2 x 2
( x)
, x 1,2 , aR
2
, n rest
0
Aplicaia
2.6.9.
Fie
variabilele
aleatoare
discrete:
0
X :1
1
2
0 1 2
1
Y : 1 1 1 . Dac P( X 0, Y 0) i P( X 1, Y 1) , s se
3
6 2 3
determine repartiia comun a vectorului aleatoriu (X,Y) n funcie de R .
Calculai apoi coeficientul de corelaie r ( X ,Y ) i precizai dac exist valori
ale lui pentru care X i Y s fie independente.
, n rest
0
6 3 2
10 5 5 5 10
x
x
c) X : 2 , x 0,1 , d) X : x , x 0
3x
xe
i apoi verificai dac momentele obinute pe cale direct coincid cu cele
obinute cu ajutorul acestor funcii.
Aplicaia 2.6.12. Verificai dac funciile urmtoare definesc repartiii ale unor
variabile aleatoare discrete i apoi calculai E(X) i Var(X) pentru fiecare dintre
ele.
1
1 (ln )k
1
a) P(k )
, k N , 1 , b) P(k ) k
e , k N , 0 ,
k!
k!
c) P(k ) k (1 )1 k , k 0,1,0 1
68
Capitolul 3
Legi clasice de probabilitate (repartiii) ale
variabilelor aleatoare discrete
Introducere
Vom prezenta n acest capitol principalele legi de probabilitate ale
variabilelor aleatoare discrete, i anume: legea discret uniform, legea
binomial i cazul su particular legea Bernoulli, legea binomial cu exponent
negativ i cazul particular legea geometric, legea hipergeometric i legea
Poisson (legea evenimentelor rare).
x1 x 2 ... x n
1
, unde pk , k 1, 2, ...n , n * .
X :
n
p1 p 2 ... p n
(3.1.1)
1
1.
k 1 n
pk
k 1
1 n
1 n
1 n
E ( X ) x k , Var ( X ) x k2 2 xk .
n k 1
n k 1
n k 1
Demonstraie
Din formulele de calcul ale mediei i dispersiei obinem
69
(3.1.2)
E ( X ) xk pk xk
k 1
k 1
1 1 n
xk ,
n n k 1
Var ( X ) E ( X ) [ E ( X )] x p k xk pk
k 1
k 1
2
k
1 n
1
1 n
1 n
x xk x k2 2 x k .
n k 1
n
n k 1
n k 1
k 1
2
k
q.e.d.
Observaia 3.1.3. Deoarece Var ( X ) 0 , din relaia a doua (3.1.2) avem
2
n x x k ,
k 1
k 1
2
k
relaie util n diverse aplicaii practice, i care rezult direct i din inegalitatea
lui Cauchy-Buniakovski-Schwarz.
Propoziia 3.1.4. Dac variabila aleatoare discret X are repartiie uniform
cu tabloul repartiiei (3.1.1), atunci funcia sa caracteristic este
(t )
1 n itxk
e , t R.
n k 1
(3.1.3)
Demonstraie
Conform formulei de calcul pentru funcia caracteristic, avem
n
(t ) pk e itxk
k 1
1 n itxk
e , t R. q.e.d.
n k 1
1 2 n
X : 1 1
1 ,
n
n n
atunci
70
n 1
n2 1
, Var ( X )
,
12
12
nt
sin
i ( n 1) t
2
(t )
e 2 , t R, t 2k , k Z ; (t ) 1, t 2k , k Z .
t
n sin
2
E( X )
Demonstraie
Din formulele (3.1.2), pentru x k k , k 1, 2, ..., n , obinem
E( X )
1 n
1 n
n 1
xk k
,
n k 1
n k 1
2
2
1 n
1 n
1 n
1 n
Var ( X ) xk2 2 xk k 2 2 k
n k 1
n k 1
n k 1
n k 1
1 n(n 1)(2n 1) 1 n 2 (n 1) 2 n 2 1
2
.
n
6
4
12
n
(t )
nt
nt
nt
nt
nt
nt
sin cos i sin
2i sin cos
it
e
2
2
2
2
2
2 e
t
t
t
t
t
t
n
n
2 sin 2 2i sin cos
sin cos i sin
2
2
2
2
2
2
nt
nt
e it sin
sin
i ( n 1) t
(
n
1
)
t
(
n
1
)
t
2 cos
2 e 2 , t R, t 2k , k Z ,
i sin
t
t
2
2
n sin
n sin
2
2
(t ) 1, t 2k , k Z .
q.e.d.
it
2 sin 2
P ( X k ) C nk p k q n k , k 0,1, 2,..., n,
(3.2.1)
unde q 1 p .
Tabloul repartiiei variabilei aleatoare X este
1
2
...
n
0
.
X : 0 0 n 1 n1 2 2 n 2
n n 0
C
p
q
C
pq
C
p
q
...
C
p
q
n
n
n
n
Se observ c
C
k 0
n
k
n
p k q n k C nk p nk q k ( p q) n 1.
k 0
Exemplul 3.2.2.
Dac A1 , A2 , ..., An sunt evenimente independente i
P( Ai ) p, i 1, 2, ..., n , iar X reprezint numrul evenimentelor care se
realizeaz n cadrul unei experiene , atunci X are repartiie binomial cu
parametrii n i p (conform schemei lui Bernoulli).
Exemplul 3.2.3. Dac A este un eveniment legat de o anumit experien i
probabilitatea ca A s se produc cnd efectum o singur dat experiena este
P( A) p , atunci variabila aleatoare care are ca valori numrul realizrilor lui
A cnd efectum de n ori experiena are repartiie binomial cu parametrii n i
p.
Teorema 3.2.4. Dac variabila aleatoare X are repartiie binomial cu
parametrii n i p, atunci valoarea medie i dispersia sa sunt
(3.2.2)
Demonstraie
Valoare medie a variabilei aleatoare X este
n
E ( X ) 0 C n0 p 0 q n 1 C n1 pq n1 2 C n2 p 2 q n2 n C nn p n q 0 kC nk p k q nk .
k 0
C nk p nk q k x nk C nk p k q nk x k .
k 0
k 0
72
C nn1 pq n1 0 C nn q n kC nk p k q nk x k 1.
k 0
kC
k
n
p k q nk np ( p q) n1 , de unde
k 0
rezult c E ( X ) np .
Pentru a calcula dispersia lui X vom folosi formula
Var ( X ) E ( X 2 ) [ E ( X )]2 .
n
0 C nn q n kC nk p k q nk x k .
k 0
np q np p,
unde q 1 p.
73
Demonstraie
Dac este modulul variabilei X atunci
P( X 1) P( X ), P ( X 1) P( X ).
Inegalitile de mai sus ne conduc la sistemul
1
n
n 1
C p q
C p q
1 1 n 1
C n p q
C n p q n
p
q
n 1
p q
1 n
np p
np q,
q.e.d.
(t ) ( pe it q) n , t R.
(3.2.4)
Demonstraie
Conform formulei pentru funcia caracteristic avem
n
n
k
n
(t ) C p q
k 0
n k
itk
C nk ( pe it ) k q n k ( pe it q ) n , t R.
k 0
q.e.d.
Teorema 3.2.7. Dac variabilele independente X i Y au repartiii binomiale cu
parametrii n i p, respectiv m i p, atunci variabila X+Y are repartiie binomial
cu parametrii m+n i p.
Demonstraie
Deoarece X ia valorile 0,1,, n, iar Y ia valorile 0,1,, m, rezult c variabila
X+Y va lua valorile 0,1,, n m. Variabila X+Y are valoarea k
( k 0,1,, n m) dac (X=0 i Y=k) sau (X=1 i Y=k-1) sau ... sau (X=k i
Y=0). Atunci vom obine
74
k
k
P( X Y k ) P { X j , Y k j} P( X j , Y k j )
j 0
j 0
k
P( X j ) P(Y k j ) C nj p j q n j C mk j p k j q mk j
j 0
j 0
p k q m n k C nj C mk j C mk n p k q m nk .
j 0
j
n
j 0
P ( X Y k ) C mk n p k q m n k , k 0,1, , n m,
(t ) pe it q pe it q pe it q
n
mn
, t R.
Din expresia de mai sus a funciei c tragem concluzia c variabila aleatoare X+Y
are repartiie binomial cu parametrii m+n i p.
q.e.d.
Teorema 3.2.8. (Bernoulli) Un eveniment are probabilitatea de realizare p
atunci cnd facem o singur dat experiena de care este legat. Dac n este
numrul de realizri ale evenimentului cnd repetm experiena de n ori,atunci
lim P n p 0,
n
n
(3.2.5)
oricare ar fi 0.
Demonstraie
Variabila aleatoare n care are ca valori numrul de realizri ale evenimentului
din problem are repartiie binomial cu parametrii n i p. Conform Teoremei
75
n
va avea atunci
n
pq
.
n
n
i a .
n
Obinem
2
pq
P n p 2 2 .
n
n
Deoarece lim
pq
0 , din inegalitatea de mai sus rezult inegalitatea (3.2.5).
n 2
q.e.d.
Observaia 3.2.9. O mbuntire a inegalitii (3.2.5) este dat de teorema lui
Borel, care spune c n condiiile Teoremei 3.2.8 are loc relaia
P n p 1.
n
(3.2.6)
76
Q ( x) a0 a1 x a2 x 2 an x n ,
(3.2.7)
Suma tuturor elementelor de pe linia a doua a tabloului de mai sus este 1. ntradevr
a0 a1 an Q(1) ( p1 q1 )( p 2 q 2 ) ( p n q n ) 1.
n
(3.2.8)
de unde rezult
n
Q ' ( x ) p1 ( p k x q k ) p2 ( pk x qk ) p n ( pk x qk ) ,
k 1
k 2
(3.2.9)
k n
E ( X ) pk .
(3.2.10)
k 1
77
Pentru x 1 deducem din relaia de mai sus Q' (1) Q' ' (1) k 2 a k . Deci
k 1
(3.2.11)
k 1
Q ' ' ( x) p1 p 2 ( p j x q j ) p3 ( p j x q j ) pn ( p j x q j )
j 1,3
j 1, n
j 1, 2
p n p1 ( p j x q j ) p 2 ( p j x q j ) pn1 ( p j x q j ).
j 2,n
j 1,n 1
j 1,n
k 2
k n
pn [ E ( X ) p n ] E ( X )( p1 p2 p n ) ( p12 p 22 p n2 )
n
[ E ( X )]2 p k2 .
k 1
E ( X 2 ) pk [ E ( X )]2 p k2 .
k 1
(3.2.12)
k 1
k 1
p k p k2 pk (1 p k ) p k q k .
k 1
k 1
k 1
k 1
O alt metod mai simpl pentru calculul mediei i dispersiei variabilei X este
urmtoarea: s notm cu X k variabila aleatoare care are ca valori pe 1 dac Ak se
78
E ( X ) E( X k ) pk .
k 1
k 1
k 1
k 1
k 1
q.e.d.
Pentru n 1, legea binomial este cunoscut i sub numele de legea
Bernoulli cu parametrul p. Variabila aleatoare X care urmeaz legea Bernoulli
cu parametrul p admite doar dou valori posibile 0 i 1 cu probabilitile de
realizare q=1-p i p, avnd tabloul repartiiei
0
X :
q
1
, q 1 p.
p
79
(3.3.1)
unde q=1-p.
Tabloul repartiiei variabilei aleatoare X este
m
X : m1 m 0
C m 1 p q
m 1
m2
C mm 1 p m q C mm11 p m q 2
E( X )
m
mq
, Var ( X ) 2 .
p
p
(3.3.2)
Demonstraie
Valoarea medie a variabilei aleatoare X este
E ( X ) mC mm11 p m q 0 (m 1)C mm1 p m q (m 2)C mm11 p m q 2
kC km11 p m q k m .
k m
m
m(m 1) 2
x
x ,
1!
2!
x (1,1).
(1 x) m C m0 1 C m1 x C m2 1 x 2 C kk1m x k m ,
x (1,1)
k m
sau
x (1,1).
(3.3.3)
k m
Folosind seria de mai sus (cu x=q), observm c suma tuturor probabilitilor
de pe linia a doua a tabloului repartiiei variabilei X este 1. ntr-adevr
m 1
k 1
p q
k m
k m
m 1
k 1
k m
p (1 q)
k m
1 q
p p
1.
1 q
.
p p
Relaia (3.3.3) se scrie echivalent astfel
xm
C km11 x k
m
(1 x)
k m
(3.3.4)
mx m1
kC km11 x k 1 ,
m 1
(1 x)
k m
(3.3.5)
x (1,1).
mq m1
kCkm11q k 1.
p m1 k m
(3.3.6)
E ( X ) kC km11 p m q k m p m q m1 kC km11q k 1 p m q m 1
k m
k m
mq m 1 m
.
p
p m 1
81
E ( X 2 ) k 2C km11 p m q k m p m q1 m k 2C km11q k 1.
k m
k m
mx m
kC km11 x k ,
m 1
(1 x)
k m
x (1,1).
x (1,1).
k 2Ckm11q k 1
k m
q m1m(m q)
.
p m2
q m 1m(m q ) m(m q)
,
p m 2
p2
m 2 mq m 2 mq
2 2.
p2
p
p
q.e.d.
Propoziia 3.3.4. Dac variabila aleatoare X are repartiie binomial cu
exponent negativ cu parametrii n i p, atunci funcia sa caracteristic este
pe it
(t )
it
1 qe
, t R.
Demonstraie
Conform formulei pentru funcia caracteristic avem
82
(3.3.7)
k m
pe it
, t R,
p m e itm (1 qe it ) m
it
1 qe
conform relaiei (3.3.3), care este adevrat i pentru numere complexe
x C , | x | 1.
q.e.d.
pmq
pmq2
(3.4.1)
X : C a0 Cbn
Cn
a b
1
1
a
2
n 1
b
CC
C an b
2
a
n 2
b
C C
C anb
83
C C .
n 0
a b
n
a b
n
Ca b
k 0 C a b
n
k
a
C bnk
k 0
1
C anb 1.
n
C a b
Exemplul 3.4.2. Dac dintr-o urn care conine a bile albe i b bile negre se
extrag n bile una cte una, fr ntoarcerea bilei extrase n urn (sau se extrag n
bile simultan), iar X este numrul de bile albe extrase, atunci X are repartiie
hipergeometric cu parametrii a, b i n, conform schemei hipergeometrice
(schema bilei nentoarse).
Teorema 3.4.3. Dac variabila aleatoare X are repartiie hipergeometric cu
parametrii a, b i n, cu n b i n a , atunci valoarea medie i dispersia sa
sunt
E ( X ) ap , Var ( X ) npq
unde p
abn
,
a b 1
(3.4.2)
a
b
, q 1 p
.
a b
a b
Demonstraie
Valoarea medie a variabilei aleatoare X este
C ak C bn k
a
E( X ) k
n
n
C a b
C a b
k 0
n
k 1
a 1
Cbn k
k 1
a
an
C anb11
ap .
n
ab
C a b
Pentru calculul dispersiei, vom calcula mai nti media variabilei X 2 ; avem
n
E( X 2 ) k 2
k 0
n
n
C ak Cbn k
C ak Cbnk
C ak Cbnk
k
(
k
1
)
C anb
C anb
C anb
k 1
k 0
a (a 1) n k 2 n k
a (a 1) n2
an
an(a 1)(n 1)
C a 2 C b E ( X )
C a b 2
n
n
a b (a b)(a b 1)
C a b k 2
C a b
an
.
ab
84
an(a 1)(n 1)
an
a 2n2
(a b)(a b 1) a b (a b) 2
abn(a b n)
abn
npq
.
2
(a b) (a b 1)
a b 1
Var ( X ) E ( X 2 ) [ E ( X )]2
a
b
, P ( X 1 0)
.
a b
ab
0
1
a b a b
X 2 obinem (n urn au rmas a+b-1 bile)
P( X 2 1) P( X 2 1 / X 1 1) P( X 1 1) P( X 2 1 / X 1 0) P( X 1 0)
a 1
a
a
b
a (a b 1)
a
,
a b 1 a b a b 1 a b a b 1)(a b) a b
P( X 2 0) P( X 2 0 / X 1 1) P( X 1 1) P( X 2 0 / X 1 0) P( X 1 0)
b
a
b 1
b
b(a b 1)
b
.
a b 1 a b a b 1 a b (a b)(a b 1) a b
0
1
ab a b
X 3 avem (n urn au rmas a+b-2 bile)
P( X 3 1) P( X 3 1 / X 2 1) P( X 2 1) P( X 3 1 / X 2 0) P( X 2 0)
[ P(( X 3 1 / X 2 1) / X 1 1) P( X 1 1) P(( X 3 1 / X 2 1) / X 1
0) P( X 1 0)]P( X 2 1) [ P(( X 3 1 / X 2 0) / X 1 1) P( X 1 1)
P(( X 3 1 / X 2 0) / X 1 0) P( X 1 0)]P( X 2 0)
85
a
a 1
b a
a
a2
a 1
a b2 a b a b2 a b a b a b2 a b
a
b b
(a 2)a 2 2(a 1)ab ab 2
a b2 a b a b
(a b 2)(a b) 2
a (a b)(a b 2)
a
.
2
(a b 2)(a b)
ab
b
( 1 P( X 3 1)). Deci tabloul
a b
0
1
a b a b
Asemntor se arat c P( X 3 0)
0
1
de repartiie X k : a
b ,
ab a b
dependente).
a
na
np .
ab
k 1 a b
E ( X ) E( X k )
k 1
Var ( X
),
k 1
q.e.d.
P( X k )
k
e , k 0,1, 2,
k!
86
(3.5.1)
X : 0
e
0!
e
1!
k
k
e
2!
e
k!
ex 1
x x2
xk
, x R .
1! 2!
k!
(3.5.2)
P( X k ) e k! e e 1.
k 0
k 0
E ( X ) , Var ( X ) .
(3.5.3)
Demonstraie
Valoarea medie a variabilei X este
E( X ) k
k 0
k
k 1
e e
e e .
k!
k 1 ( k 1)!
E( X 2 ) k 2
k 0
k 2
k
k
k
e (k k ) e k e k (k 1) e
k!
k!
k!
k!
k 1
k 1
k 2
k 2
E( X ) e
E ( X ) 2 e e 2 .
k 2 ( k 2)!
(t ) e (e
it
1)
, t R.
(3.5.4)
Demonstraie
Folosind formula de calcul de la funcia caracteristic, avem
it
it
k itk
k itk
(e it ) k
(t ) e e e e e
e e e e (e 1) , t R.
k!
k 0 k!
k 0 k!
k 0
q.e.d.
P ( X 1 X 2 k ) P j 0 ( X 1 j , X 2 k j ) P ( X 1 j , X 2 k j )
j 0
1
e ( 1 2 )
2
P( X 1 j ) P( X 2 k j ) e
e
(k j )!
k!
j 0
j 0 j!
k
k j
2
j
1
j
k
1j k2 j
j 0
(1 2 ) ( 1 2 )
e
.
k!
Deducem astfel c variabila aleatoare X 1 X 2 are repartiie Poisson cu
parametrul 1 2 . Folosind funciile caracteristice ale variabilelor X 1 , X 2 ,
exprimate
cu
ajutorul
formulei
(3.5.4),
i
anume
1 ( eit 1)
2 ( e it 1)
1 (t ) e
, 2 (t ) e
, t R , deducem c funcia caracteristic a
variabilei X 1 X 2 este
(t ) 1 (t ) 2 (t ) e 1 ( e
it
1)
e 2 (e
it
1)
e ( 1 2 )(e
it
1)
, t R.
lim P( X n k )
n
k
e .
k!
(3.5.5)
Rezolvare
Deoarece variabilele X n , n k au aceeai valoare medie , deducem
conform primei relaii din (3.5.3) c valoarea medie a acestor variabile este
E ( X n ) np n . Deci pn / n . Atunci obinem
n(n 1)(n k 1)
n
k!
n
k
n(n 1) (n k 1)
lim
lim 1
k
n
k ! n
n
n
adic relaia (3.5.5).
n k
1
n
n k
k
e ,
k!
q.e.d.
k
e .
k!
k 0
Deoarece k 3 k (k 1)(k 2) 3k (k 1) k , vom scrie pe m3 ( X ) astfel
este m3 ( X ) E ( X 3 ) k 3
89
m3 ( X ) k (k 1)(k 2)
k 2
k
k
k
e 3 k (k 1) e k e
k!
k!
k!
k 1
k 1
k 3
k 2
k 1
32 e
e
3e e
k 3 ( k 3)!
k 2 ( k 2)!
k 1 ( k 1)!
3e
32 e e e e 3 32 .
3 ( X ) E ( X ) 3 E ( X 3 3X 2 32 X 3 ) E ( X 3 ) 3E ( X 2 )
32 E ( X ) 3 m3 3 m2 32 m1 3 3 32 3 (2 )
33 3 .
Pentru
momentul
iniial
de
ordinul
al
patrulea
avem
e . Deoarece
k!
k 0
k 4 k (k 1)(k 2)(k 3) 6k (k 1)(k 2) 7k (k 1) k , momentul m4 ( X ) se
scrie astfel
m4 ( X ) E ( X 4 ) k 4
m4 ( X ) k (k 1)(k 2)(k 3)
k 3
k
k
e 6 k (k 1)(k 2) e
k!
k!
k 2
k k
k 4
k 3
e k e 4 e
63e
k!
k!
k 1
k 1
k 4 ( k 4)!
k 3 ( k 3)!
k 2
k 1
72 e
e
4 e e 63e e 72 e e
k 2 ( k 2)!
k 1 ( k 1)!
7 k (k 1)
e e 4 63 72 .
Apoi momentul centrat de ordinul al patrulea este
4 ( X ) E ( X ) 4 E ( X 4 4X 3 62 X 2 43 X 4 ) E ( X 4 )
4E ( X 3 ) 62 E ( X 2 ) 43 E ( X ) 4 m4 4m3 62 m2 43 m1 4
4 63 72 4 (3 32 ) 62 (2 ) 44 4 32 .
90
Capitolul 4
Legi clasice de probabilitate (repartiii) ale
variabilelor aleatoare continue
Introducere
Vom prezenta n acest capitol principalele legi de probabilitate ale
variabilelor aleatoare continue, i anume: legea continu uniform (rectangular),
legea normal (Gauss-Laplace), legea log-normal, legea gamma, legea beta,
legea 2 (Helmert-Pearson), legea Student (t) i cazul su particular legea
Cauchy, legea Snedecor i legea Fisher, legea Weibull i cazul su particular
legea exponenial.
, x 2 , 2 ,
f ( x)
0, x , , .
2
2
f ( x ) dx
1
x
dx
91
1.
(4.1.1)
x , ,
0,
2
F ( x) x , x , ,
2
2
2
x , .
1,
2
(4.1.2)
Figura 4.1.1
Figura 4.1.2
E ( X ) , Var ( X )
2
.
12
(4.1.3)
Demonstraie
Valoarea medie a variabilei X este
E ( X ) xf ( x ) dx
x
1 2
dx
x
Var ( X ) ( x ) 2 f ( x ) dx
(x )2
1
1
dx
( x )3
2
.
12
q.e.d.
Propoziia 4.1.3. Funcia caracteristic a unei variabile aleatoare X cu
repartiie uniform cu parametrii i este
92
i it it
2
e 2 , t R * ,
e
(t ) t
1,
t 0.
(4.1.4)
Demonstraie
Pentru t 0, avem
1
1 itx
(t ) e f ( x) dx 2 e itx dx
e
2
it
itx
it
i it 2
2
e
e
,
iar (0) f ( x ) dx 1.
q.e.d.
m2 ( X ) x 2 f ( x ) dx
1 2
1 3
x dx
x
4
2
3
2
3
1 2
3
2
3
2
.
2 3
4
12
m3 ( X ) x f ( x) dx
1
1 4
x
dx
x
4
3
1
2
3
3
3
(
4
4
4
3 ( X ) ( x ) f ( x ) dx
1
1
(x )
dx
( x )4
4
3
93
0.
f1 ( x) dx 1 i
1
relaii c parametrii variabilei X sunt 1 1 i 1 , iar parametrii variabilei Y
2
sunt 2 2 i 2 1. Atunci densitile de probabilitate vor avea forma
1, x [0,1],
f 1 ( x)
0, x [0,1],
1
,
f 2 ( x) 2
0,
x [0,2],
x [0,2].
f ( x) f1 ( x y ) f 2 ( y ) dy .
f ( x) f1 ( x y ) f 2 ( y ) dy
1
x
dy .
2
2
x 1
1
1
dy .
x 1 2
2
f1 ( x y ) f 2 ( y ) dy
f ( x)
x 1
1
3 x
dy
.
x 1 2
2
f1 ( x y ) f 2 ( y ) dy
94
x / 2,
1 / 2,
f ( x)
(3 x ) / 2 ,
0,
1
f ( x; m, )
e
2
( x m )2
2 2
, x R.
(4.2.1)
f ( x) 0, x R i
xm
y . Rezult c
2
dx 2 dy . Dac x atunci y , iar dac x atunci y .
Obinem astfel
n integrala de mai sus facem schimbarea de variabil
f ( x ) dx
e y dy
e y dy 1.
e y dy / 2 .
95
Figura 4.2.1
Pentru m 0 i 1 funcia f dat de relaia (4.2.1) devine
f ( x; 0,1)
1
2
x2
2
x R.
(4.2.2)
1
( x) ,
2
(4.2.3)
1 x t 2 / 2
e
dt . Funcia de mai sus se numete funcia
2 0
integral a lui Laplace, pentru valorile creia sunt ntocmite tabele.
Dac variabila aleatoare X urmeaz legea normal cu parametrii m i
1
, atunci variabila aleatoare Y ( X m) urmeaz legea normal cu parametrii
( x)
F1 ( x) P(Y x) P( X m x) F (m x; m, ) ,
iar densitatea de probabilitate a variabilei Y este
96
(4.2.4)
f1 ( x) F1' ( x) f (m x; m, )
1 x2 / 2
e
f ( x; 0,1), x R .
2
F ( x; 0,1) F (m x; m, ), x R.
(4.2.5)
xm
1
xm
F ( x; m, ) F
; 0,1
.
2
(4.2.6)
(4.2.7)
Demonstraie
Valoarea medie a variabilei aleatoare X este
1
E ( X ) xf ( x; m, ) dx
xe
( x m )2
2 2
dx .
xm
y , de unde
E( X )
ey
/2
(y m)e y / 2 dy
ye y
/2
dy
dy m f ( y; 0,1) dy m .
97
( x m) e
( x m )2
2 2
dx .
1
2 2 y2 / 2
2 2 y2 / 2
Var ( X )
y
e
dy
y e dy
2
2
'
2
2
2
2
y2 / 2
y2 / 2
y
ye
dy
y
e
dy
ye y / 2
2
2
2
2 y2 / 2
e
dy 2 .
2
(t ) e
imt
2t 2
2
, t R.
(4.2.8)
Demonstraie
Funcia caracteristic a variabilei X este
(t ) e f ( x ) dx
2
1
itx
itx
2 2
2 2
2 2
(t )
imt
2t 2
2
dx
x 2 2 mx m 2 2 2itx
2 2
dx
dx
[ x ( m 2it )]2
dx , t R .
( m 2it ) 2
( x m )2
e e
x 2 2 x ( m 2it ) ( m 2it ) 2 m 2
m 2 4i 2t 2 2 mit 2 m 2
x (m 2 it )
u , obinem
2
e
u 2
du e
imt
2t 2
2
, t R . q.e.d.
Demonstraie
a) Din relaia (4.2.6) i continuitatea funciei F deducem c
1
b m 1
a m
P(a X b) F (b; m, ) F (a; m, )
2
2
bm
am
.
b) Conform relaiei (4.2.9) obinem
P(| X m | k ) P(m k X m k ) (k ) (k ) 2 (k ) ,
deoarece funcia este impar ( (k ) (k ) ).
q.e.d.
(4.2.11)
2 p 1 ( X ) 0, 2 p ( X ) (2 p 1)!! 2 p , p N * ,
(4.2.12)
( x m) e
( x m )2
2 2
dx .
(4.2.13)
Obinem astfel
0 ( X ) f ( x ) dx 1, 1 ( X ) ( x m) f ( x ) dx 0, 2 ( X ) Var ( X ) 2 .
99
k ( X )
( 2 ) k
( 2 ) k
2
(k 1)
y k 1e y
y e
y2
dy
(k 1)
( 2 ) 2 ( 2 ) k 2
( 2 ) k
( 2 ) k
dy
y k 1 e y
'
y k 2 e y dy
y k 2 e y dy (k 1) 2 k 2 .
Deci
am
dedus
relaia
de
recuren
2
k ( X ) (k 1) k 2 ( X ) . Deoarece 0 ( X ) 1, 1 ( X ) 0 , din relaia de mai
sus rezult relaiile (4.2.12).
q.e.d.
Propoziia 4.2.7. Dac variabiele aleatoare indepedente X i Y au repartiii
normale cu parametrii m1 i 1 , respectiv m2 i 2 , atunci variabilele X+Y i
X-Y au repartiii
normale cu parametrii m m1 m2 i 12 22 ,
respectiv m m1 m2 i 12 22 .
Demonstraie
Vom calcula mai nti densitile de probabilitate pentru variabilele X+Y
i X-Y, pentru cazul particular m1 m2 0 i 1 2 1. Dac notm cu f i g
densitile de probabilitate ale variabilelor X i Y, atunci conform relaiei (4.2.2)
avem
f ( x) g ( x)
1 x2 / 2
e
, x R.
2
100
h( x )
1
f ( x y ) g ( y ) dy
2
x
y
2
e 2(
2 2
x2
4
( x y )2
2
x2
y x / 2 z
1 4
e
2
dy
y2
2
1
dy
2
x2
y 2 xy
dy
x2
z2
1 4
dz
e
2
x2
2 )2
, x R.
k ( x)
1
f ( x y ) g ( y ) dy
2
x
y
2
e 2(
2 2
x2
4
y x / 2 z
dy
( x y )2
2
x2
1 4
e
2
y2
2
1
dy
2
x2
y 2 xy
dy
x2
1 4
dz
e
2
z2
x2
2 )2
, x R.
1 (t ) e
im1t
12t 2
2
, 2 (t ) e
im2t
22t 2
2
, t R .
(t ) 1 (t ) 2 (t ) e
i ( m1 m2 ) t
2
2
1 2
, t R .
101
i ( m1 m2 ) t
~ (t ) 1 (t ) 2 (t ) e
2
2
1 2
, t R.
q.e.d.
este
asimptotic normal.
Legtura dintre repartiia binomial i repartiia normal este dat n
urmtoarea teorem.
Teorema 4.2.9. (Moivre-Laplace) Dac variabila aleatoare X n are repartiie
binomial cu parametrii n i p (p nu depinde de n), iar X are repartiie normal
standard, atunci
X np
1
lim P a n
b P ( a X b)
n
npq
2
e
a
x2 / 2
dx .
(4.2.14)
Teorema 4.2.9 ne spune c pentru valori mari ale lui n putem folosi tabelele
legii normale pentru studiul variabilelor aleatoare cu repartiii binomiale. Pentru
n 30 , exist urmtoarea regul practic care ne permite s aproximm repartiia
binomial prin cea normal:
- Dac min (np, nq ) 10, atunci aproximarea este foarte bun.
- Dac min (np, nq ) (5,10), atunci aproximarea este acceptabil, dac nu
este nevoie de mare precizie.
- Dac min (np, nq ) 5, atunci nu se folosete aceast aproximare.
Teorema lui Moivre-Laplace este un caz particular al aa numitei Teorema
limit central, care spune c funcia de repartiie a unei sume de variabile
aleatoare independente tinde n condiii destul de generale ctre funcia de
102
1 n
( X k mk ) .
(n) k 1
X 128
P(112 X 144) P 2
2 .
8
X 128
P 2
2 P(2 Y 2) (2) (2) 2 (2) 0,95 .
8
Aplicaia 4.2.12. De cte ori trebuie s aruncm un zar corect astfel nct
probabilitatea ca abaterea frecvenei relative a feei 1 de la numrul p=1/6 s
fie cuprins ntre -0,03 i 0,03, este 0,95.
Rezolvare
103
(4.2.15)
npq
6
pq
(4.2.16)
0,03 n
,
pq
0,03 n
pq
5
0,18 n 1
0,18 n 0,975.
F
5 2
5
0,005
3,99 4,002
(1,6) (2,4) (1,6) (2,4) 0,937 .
0,005
Rezult atunci c probabilitatea ca piesa s fie defect este 1-0,937=0,063.
104
Aplicaia 4.2.14. O main produce o pies circular. Cnd maina este bine
reglat, diametrul d al pieselor are repartiie normal cu media 10 cm i
abaterea medie ptratic 0,08 cm. Se iau la ntmplare 4 piese fabricate de
main i se constat c media aritmetic a diametrelor acestor piese este 10,14
cm. Se poate afirma c maina s-a dereglat ?
Rezolvare
Fie d1 , d 2 , d 3 , d 4 diametrele celor 4 piese alese la ntmplare. Acestea sunt
4 variabile aleatoare indepedente cu repartiii normale cu media 10 cm i
abaterea medie ptratic 0,08. Atunci variabila d (d1 d 2 d 3 d 4 ) / 4 are de
asemenea repartiie normal cu media 10 cm i abaterea medie ptratic 0,04 cm.
ntr-adevr, avem
d d 2 d3 d 4 1 4
m E (d ) E 1
E (d i ) 10,
4
4 i 1
d d 2 d3 d 4 1 4
Var (d ) Var 1
Var (d i ) 0,0016, d 0,04.
4
16 i 1
Conform regulei celor ase (relaia (4.2.11)), avem
(ln x m )
1
e 2 , x 0,
f ( x; m, ) x 2
0,
x 0.
Funcia
(4.3.1)
f ( x) 0, x R i
105
1
f ( x ) dx
2
1
e
x
ln x m
t
(ln x m ) 2
2
1
2
dx
t2
2
dt 1.
2
ln x m
F
; 0,1,
1
0 t e
ln t m
u
(ln t m ) 2
2
dt
1
2
ln x m
u2
2
du
unde F(x;0,1) este funcia de repartiie normal standard. Deducem din ultima
ln X m
relaie c pentru valorile pozitive ale lui X, variabila Y
urmeaz legea
normal standard.
Teorema 4.3.2. Dac variabila aleatoare X are repartiie log-normal cu
parametrii m i , atunci momentele iniiale de ordinul k sunt
mk
mk ( X ) e
2k 2
2,
, k N *.
(4.3.2)
Demonstraie
Conform formulei pentru momentele iniiale de ordinul k, avem
mk ( X ) x f ( x ) dx
2
1
2
1
ky
e e
( y m )
2 2
x 2
(ln x m ) 2
dy
dx
y 2 2 my m 2 2 2 yk
2 2
ln x y
2 2
x e
dy
y 2 2 y ( m 2 k ) ( m 2 k ) 2 ( m 2 k ) 2 m 2
2 2
dy
[ y ( m 2 k )]2 4 k 2 2 m 2 k
dy
4k 2 2 mk 2
2 2
[ y ( m 2k )]2
2 2
Notm ( y m 2 k ) /( 2 ) u i obinem
mk ( X )
2 k 2 2 mk
2
106
u 2
2 du e
mk
2k 2
2
. q.e.d.
dy.
E ( X ) m1 ( X ) e
2
2
f ( x) ( p)
0,
x 0,
(4.4.1)
x 0,
f ( x ) dx
1 p 1 x
x e dx 1.
( p ) 0
107
mk ( X ) p ( p 1) ( p k 1), k N * .
(4.4.2)
Demonstraie
Momentul iniial de ordinul k este
mk ( X ) x k f ( x) dx
1 k p1 x
( k p )
x
e dx
0
( p )
( p )
(k p 1)(k p 1)
(k p 1) ( p 1) p( p)
( p)
( p )
(k p 1)(k p 2) ( p 1) p.
q.e.d.
(4.4.3)
f ( x ) ( p)
0,
x 0,
(4.4.4)
x 0,
p ( p 1) ( p k 1)
, k N*,
k
(4.4.5)
p
p
, Var ( X ) m2 ( X ) [m1 ( X )]2 2 .
108
(4.4.6)
it
(t ) 1 , t R .
(4.4.7)
Demonstraie
Pentru determinarea funciei caracteristice a variabilei X vom folosi formula care
d momentul de ordinul k al variabilei X n funcie de derivatele funciei
caracteristice c n punctul 0, i anume mk ( k ) (0) i k , ( m0 1 ), precum i
dezvoltarea n serie de puteri a funciei care are forma urmtoare
( k ) (0) k mk i k k (it ) k
t
t
mk .
k!
k 0
k 0 k!
k 0 k!
(t )
(it ) k
(it ) k p( p 1) ( p k 1)
(t )
mk
k
k 0 k!
k 0 k!
k 0
p ( p 1)( p k 1) it it
1 , t R.
k!
q.e.d.
Din relaia (4.4.7) pentru 1, deducem c funcia caracteristic a unei
variabile X cu repartiie gamma cu parametrul p este
p
(t ) 1 it , t R .
(4.4.8)
109
1
x p 1e x , x 0,
f ( x) g ( x) ( p )
0,
x 0.
Dac x 0 atunci
0
h( x) f ( x y ) g ( y ) dy f ( x y ) g ( y ) dy 0,
h( x) f ( x y ) g ( y ) dy
1
1
( x y ) p1 e x y
y q1e y dy
( p)
( q)
x
ex
( x y ) p 1 y q1 dy.
0
( p ) ( q )
Pentru calculul ultimei integrale de mai sus facem schimbarea de variabil y=tx,
deci dy=xdt; pentru y 0 rezult t 0, iar pentru y x rezult
t 1. Obinem astfel
h( x )
1
ex
e x x p q1 1 q 1
p 1
q 1
(
x
tx
)
(
tx
)
x
dt
x (1 x) p1 dt
0
0
( p ) ( q )
( p ) ( q )
e x x p q 1
B ( q, p )
e x x p q 1
.
( p ) ( q ) ( p q )
1 (t ) 1 it , 2 (t ) (1 it ) q , t R .
Atunci funcia caracteristic a variabilei aleatoare X+Y este
( pq)
(t ) 1 (t ) 2 (t ) 1 it
110
, t R.
Deducem din relaia obinut c X+Y are repartiie gamma cu parametrul p+q.
q.e.d.
Propoziia 4.4.8. Dac variabila aleatoare X urmeaz legea normal cu
1
parametrii m i , atunci variabila aleatoare Y
( X m) 2 are o repartiie
2
2
gamma cu parametrul 1/2.
Demonstraie
S notm cu G(x) funcia de repartiie a variabilei Y. Deoarece Y 0 ,
atunci pentru x 0 rezult c F ( x ) P(Y x ) 0 . Pentru x 0 avem
( X m) 2
X m
G ( x) P(Y x) P
x P x
x
2
2
m 2x m
m 2x m
P (m 2 x X m 2 x )
2 ( 2 x )
2x
e t
/2
dt.
g ( x) G' ( x)
1 x
1 1 / 2 x
e
x e ,
x
g ( x ) (1 / 2)
0,
x 0,
q.e.d.
3 ( X ) ( x p ) 3 f ( x) dx x 3 f ( x) dx 3 p x 2 f ( x ) dx 3 p 2 xf ( x) dx
p 3 f ( x ) dx m3 3 pm2 3 p 2 m1 p3 p ( p 1)( p 2) 3 p 2 ( p 1)
3 p p 3 2 p,
iar momentul centrat de ordinul al patrulea este
4 ( X ) ( x p ) 4 f ( x ) dx x 4 f ( x) dx 4 p x 3 f ( x ) dx 6 p 2 x 2 f ( x) dx
4 p 3 xf ( x ) dx p 4 f ( x) dx m4 4 pm3 6 p 2 m2 4 p 3 m1 p 4
p ( p 1)( p 2)( p 3) 4 p 2 ( p 1)( p 2) 6 p 3 ( p 1) 4 p 4 p 4 3 p 2 6 p.
f ( x) B ( p, q )
0,
x (0,1),
(4.5.1)
x (0,1),
f ( x ) dx
1
1
x p1 (1 x ) q1 dx 1.
0
B ( p, q)
b) B( p, q ) B(q, p ), p, q 0;
c) B( p, q )
p 1
B( p 1, q ), p 1, q 0;
p q 1
d) B( p, q )
q 1
B( p, q 1), p 0, q 1;
p q 1
e) B( p, q )
( p 1)(q 1)
B( p 1, q 1), p 1, q 1;
( p q 1)( p q 2)
f) B( p, n) B(n, p)
g) B(m, n)
(n 1)!
, n N * , p 0;
p ( p 1)( p n 1)
(m 1)!(n 1)!
, m, n N * ;
(m n 1)!
h) B( p 1, q ) B( p, q 1) B( p, q), p, q 0;
i)
j)
B ( p, q )
k) B( p, q )
l)
t p 1
dt , p, q 0;
(1 t ) p q
( p ) ( q )
, p, q 0;
( p q )
B( p,1 p) ( p) (1 p )
, p (0,1).
sin( p )
mk ( X )
p ( p 1) ( p k 1)
, k N *.
( p q)( p q 1)( p q k 1)
Demonstraie
Momentul iniial de ordinul k este
113
(4.5.2)
1
1
B ( k p, q )
x k p 1 (1 x) q 1 dx
B ( p, q ) 0
B ( p, q)
k p 1 B(k p 1, q)
(k p 1) ( p 1) p B( p, q )
p q k 1
B ( p, q)
( p q k 1)( p q) B( p, q )
p ( p 1) ( p k 1)
,
( p q )( p q 1) ( p q k 1)
mk ( X ) x k f ( x) dx
q.e.d.
E ( X ) m1 ( X )
p
pq
, Var ( X ) m2 ( X ) [m1 ( X )]2
.
2
pq
( p q) ( p q 1)
(4.5.3)
0,
x 0,
(4.6.1)
x 0.
f ( x) dx
1
n
2
n
2
2
114
n
x
1
2
2
dx 1.
f ( x) dx
0 2 y
n
2
n
1
2
e y 2 dy
22
n
2
y 2 e y dy
0
n
2
2
2
2
1
n
1.
n 2
2
n Figura 4.6.1 sunt reprezentate grafic funciile f pentru diverse valori ale
parametrului n.
Figura 4.6.1
Teorema 4.6.2. Dac variabila aleatoare X are repartiie 2 cu n grade de
libertate, atunci momentele iniiale de ordinul k sunt
mk ( X ) n(n 2) (n 2k 2), k N * .
(4.6.2)
Demonstraie
Momentul iniial de ordinul k este
1
mk ( X ) x k f ( x ) dx
n
2
n
2
2
115
x2
k 1
x
2
dx.
f ( x ) dx , obinem
n
mk ( X )
n
k 1
2
22
n
k 1
y
2
(2 y) e 2 dy n n 0 y e dy
n 0
2
2 2
2
2
n
2 k k
2
2 k n n 1 n k 1 n(n 2) (n 2k 2).
2 2 2
n
2
q.e.d.
n
2
(4.6.3)
1 2
1
2
2
x
e
, x 0,
n n
f ( x) ( 2 )
2
0,
x 0.
(4.6.4)
(4.6.5)
(4.6.6)
(t ) (1 2it 2 ) 2 , t R .
(4.6.7)
Demonstraie
Folosind formula din demonstaia Propoziiei 4.4.6, obinem
(it ) k
(it ) k
nn n
mk
(2 2 ) k 1 k 1
2 2 2
k 0 k!
k 0 k!
q.e.d.
nn n
2 2 2
(1 2it 2 ) 2 , t R.
(2it 2 ) k
k!
k 0
(t )
(t ) 1 2it 2 , t R .
(4.6.8)
X n n
2n
tinde pentru
117
m
x
1
1
2
2
x e , x 0,
m
2 m
f ( x) 2
2
0,
x 0,
n
x
1
1
2
2
x e ,
n
2 n
g ( x ) 2
2
0,
x 0,
x 0.
h( x) f ( x y ) g ( y ) dy.
m
2
m
2
2
e
mn
2
( x y) 2 e
x
2
m n
2 2
( x y)
0
m
1
2
x y
2
n
2
n
2
2
n
1
2
y2 e
y
2
dy
dy.
h( x)
2
mn
2
mn
2
x
2
m
2 2
x
2
m n
2 2
1
mn
x
mn
2
2
( x tx ) 2 (tx) 2 x dt
mn
1 1
2
0
(1 t )
m n
x
1
2
2
e ,
m
n
1
1
2
2
m n
x 0.
118
e 2x 2
m n
dt m n
B ,
m n 2 2
2 2
2 2
1 (t ) 1 2it 2 , 2 (t ) (1 2it ) 2 , t R .
Atunci funcia caracteristic a variabilei aleatoare X+Y este
(t ) 1 (t ) 2 (t ) 1 2it
mn
2
, t R.
Deducem din relaia obinut c X+Y are repartiie 2 cu m+n grade de libertate.
q.e.d.
2 2
x
2
1 ,
f ( x)
n
n
n
2
x R.
(4.7.1)
f ( x ) 0, x R i
f ( x ) dx 1.
n 1
n 1
n 1
n 1
2 2
2 x
2 x2 2
1
1
f ( x) dx
dx
dx.
n
n
n
n 0
n
n
2
2
119
dx
n
dy.
2 y
n 1
n 1
1 / 2
y
2
2 1 n
dy
B ,
n 1
f ( x) dx
n 0
n 2 2
2
2
(1 y )
2
2
n 1 1 n
2 2 2
1.
n
n 1
2
2
n k (2k 1)!!
, 2 k n, k N * .
(n 2)(n 4)(n 2k )
(4.7.2)
Demonstraie
Pentru 2k 1 n , momentele de ordin impar sunt nule. ntr-adevr
n 1
n 1
2 2
x
2
m2 k 1 ( X )
x 2 k 1 1
dx 0,
n
n
n
2
(4.7.3)
deoarece funcia f este impar (integrala de mai sus este convergent). Dac
2k 1 n integrala din (4.7.3) este divergent, deci X nu are momente iniiale de
ordinul 2k 1.
Pentru momentul de ordin par m2 k ( X ), cu 2k n avem
120
n 1
n 1
2
2 2
2 x 2 k 1 x
m2 k ( X )
dx.
n
n 0
n
2
(4.7.4)
mai
sus
pentru
verificarea
x 2 / n y, x 0, de unde rezult dx
relaiei
f ( x) dx 1.
Notm
n
dy. Intervalul [0, ) se transform n
2 y
n 1
n 1
2
n k
n 1
1
n 1
n
2 (ny ) k (1 y ) 2
2 y k 2 (1 y ) 2 dy
m2 k ( X )
dy
n 0
n 0
2 y
n
2
2
n 1
n k
1 n
1
k k
2 k 2 1
y
(1 y ) 2 2 dy.
0
n
2
Folosind proprietile funciei B din Propoziia 4.5.2 deducem din relaia de
mai sus
1 n
n 1
n 1
n k
n k
k k
2 2
2 B k 1 , n k
2
m2 k ( X )
2 2
n
n
n 1
2
2
2
1 n
1
1 n
k k
k k k
k
k
n
n
2 2
2
2 2
n
n n
1 1
2
2 2
121
1
3
3 n
k k k k
n
2
2
2 2
n n
n
1 2 2
2 2
2
1
3 1 1 n
k k k
n
n k (2k 1)!!
2
2 2 2 2
.
n 1 n 2 n k n k (n 2)(n 4)(n 2k )
2 2
2
2
Dac 2k n integrala din relaia (4.7.4) este divergent, deci variabila X nu are
momente iniiale de ordinul 2k.
q.e.d.
Din relaiile (4.7.2) deducem c dac n>1 atunci media variabilei X este
n
E ( X ) 0 , iar dac n>2 atunci dispersia variabilei X este Var ( X )
.
n2
Legturile dintre repartiia Student i repartiia normal sunt prezentate n
urmtoarele dou teoreme.
Teorema 4.7.3. Dac f n este densitatea de probabilitate a unei repartiii
Student cu n grade de libertate atunci
lim f n ( x) f ( x; 0,1), x R,
n
X n1
X 12 X n2
f ( x)
1
,
(1 x 2 )
122
x R.
n
1
f ( x) n2
n1
2
n n2
1
n
2 21 1 n1
x 1
n1 n2
n2
2 2
0,
n1 n2
2
x 0,
(4.8.1)
x 0.
f ( x ) 0, x R i
n
f ( x ) dx 1
n2
n1
2
n n2
1
n
2 21 1 n1
x 1
n1 n2 0
n2
2 2
n1 n2
2
dx.
123
n n2
n1
1
1
n n
n1
n2 y 2
2
1 2 n2
f
(
x
)
dx
dy
n
0 n
n
n
n1
2 1 2 1
2 2
n n2
n n2
1
1
n1
n1 n2
2 2
2 n1 n2
y (1 y )
dy
B , 1.
n1 n2 0
n1 n2 2 2
2 2
2 2
n1
2
, 2k n2 , k N * .
k
n1 (n2 2)(n2 4)(n2 2k )
(4.8.2)
Demonstaie
Variabila X are momente iniiale de ordinul k pentru 2k n2 . Avem
mk ( X ) x k f ( x) dx
n1
n2
n1
2
n n2
1
n1
2 x k 2 1 1 n1
n
n n
2
1 2
2 2
n1 n2
2
dx.
f ( x) dx 1. Notm n1 x / n2 y
i obinem
n
mk ( X ) 1
n2
n1
2
n n2
n
1
k 1 1
n n
1 2 n
n2 y 2
2
(1 y ) 2 2 dy
0
n
n1
n n
1 2 1
2 2
124
n
2
n1
n
2
n1
n
2
n1
n
2
n1
n
2
n1
n n2
1
n1
n1 n2
2 y k 2 1 (1 y ) 2 dy
n n 0
1 2
2 2
n n2
1
2 B k n1 , n2 k
2 2
n1 n2
2
2
n n
n n2
1
k 1 2 k
2 2
2
n
n
n
2
1 2
1
2 2
2
n
n
n
k 1 1 1 k 1 2 k
2
2
2
n n
n
1 2 1 2 1
2 2
2
n
n
n n n
k 1 1 k 1 2 1 1 2 k
2
2
2 2 2
n n
n
n
n
1 2 1 2 2 2 k 2 k
2 2
2
2
2
n n1 (n1 2) (n1 2k 2)
2
.
n1 (n2 2)(n2 4)(n2 2k )
q.e.d.
Din relaia (4.8.3) deducem c pentru n2 2 media variabilei X este
n2
E( X )
, iar pentru n2 4 dispersia variabilei X este
n2 2
2n22 (n1 n2 2)
Var ( X )
.
n1 (n2 4)(n2 2) 2
Legtura dintre repartiia normal i repartiia Snedecor este dat n
urmtoarea teorem.
Teorema 4.8.3. Dac variabilele aleatoare independente X 1 , X 2 ,..., X n1 , X n1 1 ,...
X n1 n2 urmeaz legea normal cu parametrii 0 i atunci variabila aleatoare
125
X 12 X n21
n2
2
n1 X n1 1 X n21 n2
n
f ( x) 2 1
n2
n1
2
n n2
n n
1
1 2
2 e n1x 1 n1 e 2 x 2 ,
n
n n
2
1 2
2
2
x R.
(4.8.3)
G ( x) P(Y x) P ln X x P (ln X 2 x)
2
2x
2x
P( X e ) F (e ), x R.
Deci densitatea de probabilitate a variabilei Y este
g ( x ) G ' ( x) 2e 2 x F ' (e 2 x ) 2e 2 x f (e 2 x )
n
2e n1x 1
n2
n1
2
n n2
n n
1
1 2
2 1 n1 e 2 x 2 , x R. q.e.d.
n n n2
1 2
2
2
126
x 1e x , x 0,
f ( x)
0,
x 0.
(4.9.1)
f ( x) 0, x R
f ( x ) dx x 1e x dx 1.
0
ntr-devr
pentru
rezult
dx
f ( x ) dx
1
1
1
1
dy .
Atunci
dy e y dy 1.
0
E( X )
1 , Var ( X )
2 1
1 1.
(4.9.2)
Demonstraie
Folosind schimbarea de variabil de mai sus, obinem pentru media variabilei X
E ( X ) x e
1
1
dx
y y 1 1
e 1 y dy
1
y e y dy 1.
E ( X 2 ) x 1e x dx
0
127
e y
2
y dy 1.
2 1
1 1 .
q.e.d.
Pentru 1 legea (repartiia) Weibull se mai numete legea exponenial
(repartiia exponenial) de parametru . Deci densitatea de probabilitate a
unei variabile aleatoare X cu repartiie exponenial cu parametrul este
e x ,
f ( x)
0,
x 0,
x 0.
it
(t ) 1 , t R .
(4.9.3)
Demonstraie
Din Observaia 4.9.3 i relaia (4.4.7) din Propoziia 4.4.6, deducem c funcia
caracteristic a variabilei X este dat de expresia din (4.9.3).
Funcia caracteristic se poate calcula i direct folosind formula din
definiia sa. Avem
I1
Pentru I1 obinem
128
I2
1 x '
1
e
cos(tx) dx e x cos(tx) 0
'
t
1 t
1 t
e x sin( tx) dx 2 e x sin( tx ) dx 2 e x sin( tx)
0
0
2
1 t
t e x cos(tx) dx 2 e x cos(tx) dx.
0
0
I1 e x cos(tx) dx
0
1 t2
e 2 x , x 0,
f 2 ( x) 2
x 0.
0,
f ( x) f1 ( x y ) f 2 ( y ) dy 1e 1 ( x y ) 2 e 2 y dy
x
12 e 1x e ( 1 2 ) y dy
0
12 1 x ( 1 2 ) y
e e
1 2
x
0
1 2 2 x 1x
e e .
1 2
12
e 2 x e 1 x ,
f ( x) 1 2
0,
129
x 0,
x 0.
f ( x) e ( x y ) e y dy 2 e x dy 2 xe x .
x 0,
x 0.
h( x) 2 ( x y )e ( x y ) e y dy 3 e x ( x y ) dy
3 2 x
x e .
2
Deci
3 2 x
x e , x 0,
h( x) 2
0,
x 0.
k ( x ) (n 1)!
0,
x 0,
x 0.
130
Capitolul 5
Convergena variabilelor aleatoare
5.1.Convergena aproape sigur i convergena n probabilitate
Fie (,K,P) un spaiu probabilizat i ( X n )n un ir de variabile aleatoare. Fie
de asemenea X o alt variabil aleatoare. Ce nseamn c X n tinde la X ?
Desigur, variabilele aleatoare sunt funcii Xn: . Pentru funcii se tie
deja ce nseamn c X n converge la X : c X n () X() pentru orice .
u
Mai exist i noiunea de convergen uniform: X n X dac sup
0.
X n () X()
n teoria probabilitilor aceste dou tipuri de convergen nu prea sunt de
folos. Situaia tipic ntlnit n practica statistic este urmtoarea: se face un
experiment cu rezultatele posibile r1,,rk . Rezultatul obinut la al n-ulea
experiment este X n .
(De exemplu se arunc un zar despre care nu tim dac este corect sau
falsificat; n acest caz rezultatele sunt 1,2,3,4,5,6)
Nu avem cum s prezicem rezultatul X n , dar putem spera s aproximm
probabilitile pi de apariie a rezultatului ri, dac facem unele ipoteze
acceptabile. De exemplu, dac acceptm c toate variabilele aleatoare X n au
aceeai repartiie, F. Am putea numra procentajele fi de apariie a rezultatului ri
i spera c ele nu difer mult de adevratele probabiliti pi.
r1
F
p1
r2
p2
...
rk
. Vrem s gsim numerele
... p k
131
j n : X
n
ri
i ne gndim
(sau
Xn X
(mod
P))
dac
P(lim sup X n lim inf X n X ) 1 .
Dac P(lim sup X n lim inf X n ) 1 ,
spunem c ( X n ) n este un ir P- convergent aproape sigur.
Observaia 5.1.2. Dac probabilitatea P se subnelege, putem renuna la litera
a. s .
P i scriem doar X n
X
Observaia 5.1.3. Evident c dac X n converge la X punctual - n sensul
a. s .
obinuit al cuvntului - atunci X n
X . La fel de evident este c diferena
ntre convergena punctual i cea aproape sigur poate fi foarte mare.
a .s .
a .s
Observaia 5.1.5. La fel de evident este c X n
X X n X
0,
deoarece
P(lim sup X n lim inf X n X ) P(lim sup( X n X ) lim inf( X n X ) 0) .
5.1.6.
Fie = , K = B(), Xn() = sin(n),
0
. irul X n este divergent, singurele puncte n care el
P ( 0 )
.5 .5
Exemplu
132
a .s.
converge sunt cele de forma = k. Totui, X n P
0, deoarece
aceasta, P ( / 2 5 / 2 )
d [ank , ank 1)
n k
lim inf An
n k
n
iar
d [a n k , a n k 1 ) = )
n k
Cum putem decide dac X n X ? n cazul cel mai simplu, un rspuns este dat
de
Propoziia 5.1.9. Fie (,K,P) un spaiu probabilizat i ( An ) n un ir de
Demonstraie
133
P A
n
P A
nk
i seria
k 0
P A
n
este
( Bn ) n este monoton
Bn
1B cu B = Bn i P( B ) lim P ( Bn ) 0 .
n 1
An k
n k
a.s.
De aici rezult un criteriu important cu care putem verifica dac X n
X
P| X
a.s.
| este convergent. Atunci X n
0.
Demonstraie
Fie B = : X n () nu converge la 0. Atunci B =
unde
P| X
n
a.s.
An
0.
E | X X n | 1
, adic P(X Xn > )
d X , X n
P
limn P(X Xn > ) = 0; aadar d(X,Xn) 0 Xn X
Reciproc, dac pentru orice > 0 avem c limn P(X Xn > ) = 0, din a doua
inegalitate de la (5.1.3) rezult c lim supn d(X,Xn) pentru orice >0. Dar
este arbitrar, deci lim d(X,Xn) = 0. q.e.d.
135
L
X (i notm acest lucru cu Xn
X) dac limnXn Xp= 0.1
p
L
P
Propoziia 5.1.16. Dac Xn
X pentru un anumit p 1, atunci Xn
X.
Demonstraie
Z
X Xn
p
p
p
p 2
: ntr-adevr,
= 0 . Iar dac p = ,
L
P
atunci este i mai evident: Xn LX Xn
X Xn
X. q.e.d.
P
Observaia 5.1.17. Totui, dac Xn
X, din orice subir al su se poate
extrage un sub-subir care converge la X aproape sigur. ntr-adevr, aplicm
Propoziia 5.1.10 Prin procedeul diagonal, putem alege un subir (kn)n n aa fel
nct seria P| X kn | s fie convergent pentru orice >0.
L
P
a.s.
P
Xn LX Xn
X (p< ) Xn
X i Xn
X Xn
X
.s.
X kn a
X
Xp := E | X | p
1
p
p
p
E | Z | p E | Z | p ; | Z | p P| Z |
136
p'
L
0 pentru p < p dar Xn nu converge nicieri dac p p. De exemplu n =
1
p
n .
5.2.
X 1 X 2 ... X n
P
media empiric4. Atunci X n
.
n
j n : X j 1
1
, atunci X n
p
n
Demonstraie
Centrm variabilele: fie Yn = Xn - . Atunci X n - =
Urmeaz X n - 22 = E( X n - )2 =
3
4
Y1 Y2 ... Yn
.
n
137
dac i j . Deci E( X n - ) =
2
EYi
n 2
n 2 1i n
n2
P
conform cu Propoziia 1.1.16, X n
. q.e.d.
2
L2
. Concluzie: X n
deci,
n
X Y
, care nu numai c nu coincide cu media, dar
2
138
Xn=
(5.2.2)
P1t -1 = P1
Dac A B() are proprietatea c t -1(A) = A, atunci P1(A) 0,1
Demonstraie
(i) Trebuie artat c P1(t-1(A)) = P1(A) A B(). Din motive elementare8 este
suficient s verificm acest lucru pentru un bloc de lungime n, A =
B1B2...Bn...
-algebra produs se definete ca fiind cea mai mic -algebr generat de blocuri. Un bloc de
lungime n este o mulime de forma B1B2...Bn....... unde mulimile Bn sunt boreliene.
Mulimea D a blocurilor este n mod evident stabil la intersecii finite, deci B () coincide cu
U-sistemul generat de D.
7
139
L1(,K,P).
Atunci
1
f f t f t 2 ... f t n1 ( X ) converge P aproape sigur la Ef(X).
n
140
Demonstraie
Nu avem dect s aplicm teorema ergodic pe spaiul (E,E,PX-1).
q.e.d.
Avantajul este c acum chiar putem calcula membrul drept, folosind formula
de transport.
Dac PXn-1 = F, atunci Ef(X1,...,Xk) = fdF k .
Dac, de exemplu, F are o densitate fa de msura Lebesgue, atunci
Ef(X1,...,Xk) =
xdF x . Atunci X n
X 1 X 2 ... X n
converge a.s. la ..
n
10
141
1
ln X1 ln X 2 ... ln X n ElnX1). Dac P(Xn= 0) > 0,
n
.
1
1
1
1
...
E
X1 X 2
Xn
X1
Atunci
1
j n : X j x se numete funcia de repartiie empiric
n
calculat n x.
Propoziia 5.2.16. Pentru orice n 1, Yn := nFn(x) sunt variabile aleatoare
repartizate Binomial(n, F(x)). Deci EYn = F(x), Var(Yn) = nF(x)(1 F(x)). n plus,
.s.
Fn(x) a
F(x)
Z1 Z 2 ... Z n
care, conform SLLN converge a.s.
n
Cititorul interesat poate consulta Teoria probabilitilor de Cuculescu (1974) sau Tudor (1980).
Sau poate vedea mai multe referine aici
http://en.wikipedia.org/wiki/Glivenko%E2%80%93Cantelli_theoremhttp://en.wikipedia.org/wiki
/Glivenko%E2%80%93Cantelli_theorem
143
2
limnP( n n x) =
e
x i 1
2i 12 2
8x2
k
f x1 ,..., xk dx1dx2 ...dxk f 1C d
(5.2.5)
unde C este un compact de msur Lebesgue pozitiv i f o funcie
integrabil pe acel compact. Ideea este s generm un ir de vectori aleatori
independeni Xn
repartizai
uniform
n
compactul
C.
Atunci
1
. s.
f X 1 ... f X n a
Ef X 1 . Dar, conform formulei de transport, Ef(X1) =
n
1
fdU C k
C f x1 ,..., xk dx1dx2 ...dxk .Deci algoritmul este
C
1
k
f X 1 ... f X n ]
f x1 ,..., xk dx1dx2 ...dxk = (C)[a.s. limn
n
C
(5.2.6)
A simula un vector aleator repartizat uniform ntr-un compact nu este un
lucru simplu. Uneori ns, este simplu: dac C = [a1,b1][a2,b2]...[ak,bk]. Atunci
Xn = (Xn,1,...,Xn,k) este uor de simulat: componentele sale sunt variabile aleatoare
independente repartizate Uniform(ai,bi). Toate mediile de programare (R, C++,
Java, R, Matlab, Excel etc) au n dotare cel puin generatoare de numere
pseudoaleatoare, repartizate Uniform(0,1)
Revenind la Exemplul 1.1.11. Urmtoarea secvena (sau, cum i se mai
spune, script) din mediul de programare R:
segment1<-function(n)
{xa=runif(n);xb=runif(n);ya=runif(n);yb=runif(n)
d=sqrt((xa-xb)^2+(ya-yb)^2)
d}
face n simulari (instruciunea xa=runif(n) produce un vector de lungime
n cu componentele variabile aleatoare repartizate Uniform(0,1)
Cu instruciunea
> d<-segment1(1000000);summary(d)
generm 1000000 de segmente crora le calculm lungimea. Apoi ni se
furnizeaz minimul, maximul, prima cuantil, mediana, media i cuantila a treia.
144
Sigur c este vorba de cuantilele de selecie (se poate arta, tot pe baza
SLLN c i cuantilele de selecie converg la adevratele cuantile). Conform
SLLN ne ateptm ca aceste variaile aleatoare (cci asta sunt!) s nu oscileze
prea tare i s ne dea informaii despre repartiia variabilei aleatoare X = A-B.
Iat rezultatul a 10 simulri de cte 1 milion de segmente
Min.
1st Qu.
Median
Mean
0.0007994
0.3276000
0.5118000
1.3560000
0.0002333
0.3278000
0.5116000
1.4010000
0.0003137
0.3284000
0.5117000
1.3670000
0.0005139
0.3279000
0.5119000
1.3760000
0.0006177
0.3277000
0.5117000
1.3880000
0.0008395
0.3284000
0.5119000
1.3860000
0.0004015
0.3283000
0.5123000
1.3860000
0.0008071
0.3279000
0.5113000
1.3790000
0.0006265
0.3282000
0.5113000
1.3820000
0.0005321
0.3284000
0.5126000
1.3800000
3rd Qu.
0.5214000
Max.
0.7049000
0.5211000
0.7043000
0.5214000
0.7043000
0.5213000
0.7044000
0.5210000
0.7043000
0.5212000
0.7041000
0.5215000
0.7046000
0.5209000
0.7039000
0.5213000
0.7045000
0.5215000
0.7046000
pare a fi 0.
Calculul exact este aproape imposibil de fcut.
urmtoarele
F(x)
P(X
x)
P((xA
xB)2
(yA
yB)2
x2)
(5.2.7)
EX
x A xB 2 y A yB 2
(5.2.8)
unde A(xA,yA), B(xB,yB) sunt punctele aleatoare repartizate uniform n ptratul
unitate.
Formal, se dau patru variabile aleatoare independente: xA, xB, yA, yB i se cere s se
calculeze cantitile (5.2.7) i (5.2.8). Prima revine la a calcula msura Lebesgue
4-dimensional 4 a mulimii Mx = xA, xB, yA, yB [0,1]: (xA xB)2 + (yA yB)2 x2
Iar a doua, pe baza formulei de transport, la a calcula integrala
145
EX = 01 01 01 01
x A xB 2 y A yB 2 dx AdxB dy Ady B
Prima cantitate se poate calcula exact, cu mult efort; pentru al doua, nu exist
formule prin cuadraturi.
Ca s avem o idee de puterea metodei, o putem compara cu metodele
deterministe de calcul ale integralelor multiple. Tot o sum avem de fcut, dup
ce lum cte o diviziune pe fiecare ax. Dac diviziunea este echidistant cu 20
de puncte, vom avea de calculat valoarea funciei de integrat n 204 = 160.000 de
puncte. Nu e sigur c eroarea va fi mai mic!
Putem concluziona c X este o variabil aleatoare cu media 0.521 i
mediana.512
De curiozitate, prezentm i graficul unei funcii de repartiie empirice dup
100.000 de probe.
Calcul de maxime-minime.
O problem fundamental n matematica aplicat este de a gsi maximele i
minimele unei funcii f:C unde C este un domeniu din kk. Exist multe
metode deterministe de a face acest lucru acesta este domeniul teoriei
optimizrii. Exist dou tipuri de agoritmi : determiniti i probabiliti.
Ideea de baz a algoritmilor probabiliti este de a arunca o ploaie de puncte
la ntmplare cu mai mult sau mai puin inteligen .
Propoziia 5.2.19. Fie f:C o funcie mrginit definit pe compactul cu
interior nevid C k. Fie (Xn)n un ir de variabile aleatoare repartizate uniform
n C i Yn = max(f(X1),...,f(Xn)), Zn = min(f(X1),..,f(Xn)). Atunci (Yn)n este un ir
cresctor de variabile aleatoare, (Yn)n este un ir descresctor . Primul
146
12
Dac f este
Demonstraie
Fie F funcia de repartiie a variabilei aleatoare f(X) unde X
Uniform(C). Deci F(x) = P(f(X) x) = P(X f-1(-,x]) = k(f-1(-,x])/k(C).
Fie M = ess inf f. Atunci P(Yn M - ) = P(max(f(X1),...,f(Xn)) M - ). Dar
variabilele f(Xk) sunt independente, deci
P(max(f(X1),...,f(Xn)) M - ) = P(f(X1) M - , f(X2) M - ,... f(Xn)) M - )
= P(f(X1) M - )P(f(X2) M - ,)...P(f(Xn)) M - ) = Fn(M - ). Cum M este
supremul esenial, F(M - ) < 1, deci F n(M - ) 0. Deci P(Yn M - ) 0. Dar
irul Yn, fiind cresctor, are o limit, Y. Rezult c P(Y M - ) = 0 . Deci Y
M. Pe de alt parte, Yn M deoarece toate variabilele aleatoare f(Xj) au aceast
proprietate. nseamn c Y = M P-a.s. Y = M (k a.p.t.).
Supremul esenial al unei funcii definite pe un compact de interior nevid C este un numr M
cu proprietatea c f(x) M pentru aproape toi x M i msura Lebesgue a mulimii x C f(x)
> M - este pozitiv >0. Similar, infimul esenial este un numr m cu proprietatea c f(x)
M pentru aproape toi x M i msura Lebesgue a mulimii x C f(x) < M + este pozitiv
>0. A nu se confunda cu supremul i infimul De exemplu, dac f = 1 1 cu diagonala
ptratului unitate din plan, i cealalt diagonal atunci sup f = 1, inf f = -1, dar ess sup f = ess
inf f = 0.
13
O notaie pentru punctele n care se gsete maximul sau minimul.
147
14
148
| p j q j | .
j
Definiia 5.3.1. Fie (E,E) un spaiu msurabil. Fie (Fn)n i F probabiliti pe el.
Spunem c Fn converge tare la F dac F Fn 0. Notm acest lucru prin
s
Fn
F.
n
F fn
n L1 este ca fn s convearga la f - aproape sigur.
s
(iii). Dac Fn
F, atunci Fn(A) F(A) A E. Reciproca nu este
adevrat. Ca un caz particular, dac Fn i F sunt repartiii de pe dreapta real,
atunci funciile lor de repartiie converg: Fn((-,x]) F((-,x]). 17
Demonstraie
(i). Fie = F G.Deci (E) = F(E) G(E) = 1 1 = 0. Fie H mulimea Hahn
ataat lui . Atunci = 2(H) - (E) = 2(H). Dac = 2, atunci (H) = 1
F(H) G(H) = 1. Dar F i G sunt probabiliti, deci F(H) = 1 i G(H) = 0.
s
L1 E,E,
(ii). Fn F = f f n d , deci e clar echivalena Fn
F fn f.
Interesant este cealalt afirmaie, deoarece n general nu este adevrat c dac fn
converge la f aproape sigur, converge i n L1 (vezi exemplul 1.1.8). Dar la noi
16
149
1
n
i
. Verificai c fn f.
i!
1
n
s
Exemplul 5.3.4. Fie Fn = 1 0 n Atunci Fn
0 .
2k 2 k 1
, n ] i Fn = 2 1An , unde este msura
n
k 0 2
2
Lebesgue. Fie f = Uniform(0,1) = 1(0,1). Atunci Fn F = 1 (ntr-adevr,
dac x An
1
norma este egal cu 1An 1(0,1) d iar 1An 1( 0,1) x 1 dac x (0,1) \ An ).
0
n rest
150
chiar coincide: Fn(x) = F(x). Dac 0 < x < 1 se arat imediat prin inducie c
1
| [2 n 1 x ] 2 n1 x |
2
Fn(x) = x +
deci 0 Fn F 2-n.
n 1
2
Deci funciile de repartiie converg uniform, (Fn - F)(A) converge la 0 pentru orice
A i totui Fn nu converge tare la F.
n
s
1 , X = 0 0, vedem c dei Fn
F, EXn
n n
= 1 nu converge la EX = 0. Problema convergenei momentelor este dificil.18
lum, de exemplu, Xn Fn := 1 1
Convergena slab
Convergena tare, dei cea mai natural, nu rspunde satisfctor problemelor
de statistic. Toate repartiiile vizibile n statistic sunt repartiii empirice, deci
sunt discrete. Exemplul 5.3.7 ne arat c nu se pot aproxima repartiiile continui
cu repartiii discrete. Ce puin nu n sensul tare.
Teorema lui Glivenko ne spune c (uneori, vezi mai sus) funciile de
repartiie empirice converg la adevrata funcie de repartiie. O idee ar fi s
decretm c
Definiia 5.3.9.(Definiie intermediar) Fie (Fn)n un ir de repartiii pe dreapt.
Fie F o alt repartiie. Spunem c Fn F dac Fn(x) F(x) pentru orice x .
Dar aceast definiie are dou neajunsuri. Amndou serioase.
n primul rnd, ca s fie ceva care corespunde intuiiei, ar trebui ca, dac xn
x , atunci i xn s convearg la x. i nu este aa. De exemplu, dac xn =
18
1
, xn
n
Cititorul poate consulta, de exemplu, Ioan Cuculescu, Teoria Probabilitilor, Bucureti, All,
1998, pg 281-368.
151
[ , )
n
19
20
152
Observaia 5.3.12. Toate punctele teoremei de mai sus pot scrise n termini de
variabile aleatoare. Dac n loc de Fn i F punem Xn i X obinem urmtoarele
D
caracterizri echivalente ale faptului c Xn
X:
(i)
Ef(Xn) Ef(X) pentru orice f continu i mrginit
(ii) Ef(Xn) Ef(X) pentru orice f uniform continu i mrginit
(iii) limsup P(Xn C) P(X C) pentru orice mulime nchis din E
(iv)
liminf P(Xn D) P(X D pentru orice mulime deschis din E
(v)
lim P(Xn A) = P(X A) pentru orice mulime A cu frontier Fneglijabil
Observaia 5.3.13. Nu trebuie s credem c dac Fn sunt funcii de repartiie i
Fn F, atunci i F este funcie de repartiie. Exemplele sunt nenumrate: 1[n,)
sunt funcii de repartiie care converg la 0, la fel i funciile de repartiie pentru
Uniform(0,n) (adic Fn(x) = min(
x
,1) ) etc. Este fenomenul cunoscut ca escape
n
Demonstraie
P
Dac Xn
X, atunci conine un subir care converge a.s. la X. Dac f
este o funcie continu, atunci f(Xn) converge aproape sigur la f(X). Dac f este i
mrginit, teorema de convergen dominat arat c Ef(Xn) Ef(X).
Ce avem de fcut dac dorim s verificm o conjectur de tipul Fn F?
Nici una din reetele din Teorema Portmanteau nu pare s funcioneze. Nici
mcar n cazul unidimensional: este uor de zis verific dac Fn(x) converge la
F(x) pe o mulime dens, dar e mai greu de fcut.
Exist un instrument care ajut n multe cazuri, anume funcia
caracteristic.
21
De exemplu http://en.wikipedia.org/wiki/Prokhorov%27s_theorem
153
it ' x
dF x
(5.3.1)
se numete funcia caracteristic a lui F. (Un punct x din d este un vector
coloan; t este transpusul lui t deci tx este produsul scalar dintre t i x : tx =
t1x1 + t2x2 + ...+ tdxd). Dac F este repartiia unui vector aleator d-dimensional, X,
atunci scriem X n loc de F i, pe baza formulei de transport, avem
X(t)
=
EeitX
(5.3.2)
Funcia caracteristic are proprietatea de a fi multiplicativ: dac X i Y sunt
vectori independeni, atunci X+Y = XY . Dac este de clas C, atunci X are
toate momentele finite i ele se pot calcula prin derivri. Ea are ns o
proprietate suplimentar pe care analogul su real (funcia generatoare de
momente mX(t) = EetX) nu o are: aceea c domeniul su de definiie este acelai
indiferent de repartiia F i c ea caracterizeaz astfel, repartiia. Mai precis,
avem
Propoziia 5.3.17.
(i) Fie F i G dou repartiii pe (d,B(d)) cu proprietatea c F = G. Atunci F =
G (Teorema de unicitate).
(ii) Presupunem c (Fn)n este un ir de repartiii cu proprietatea c irul Fn este
convergent i limita sa, , este continu n 0. Atunci exist o repartiie F cu
proprietatea c F = i Fn F. Sau, n termeni de variabile aleatoare: dac
(Xn)n sunt vectori aleatori d-dimensionali independeni i X n , continu n
D
0, atunci exist o repartiie F ca Xn
F.
X+Y)
22
154
(5.4.1)
j 1
1 n
x C 1n x 1n C n2 x 2n .....
n!
(5.4.2)
Fn(x) =
1 k
k
n
C n 1 x k
n! k 0
(5.4.3)
unde x+ este partea pozitiv a lui x. Derivnd (sumele sunt, totui, finite) gsim
densitile
1
k
n 1
k
C n 1 x k
n 1! k 0
fn(x) =
(5.4.4)
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0
(5.4.5)
Obinem cinci grafice care se pot compara mai bine, fiindc au aceeai ax de
simetrie.
156
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
-3
-2
-1
sn =
(5.4.6)
(5.4.7)
i densitile
n(x) = n(x) = n fn(n+ n x)
(5.4.8)
Mai jos am fcut graficele celor cinci densiti centrate i normate. Se observ
cum se stabilizeaz.
157
0.5
0.4
0.3
0.2
0.1
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
xn x
e 1(0,) ( x)
n!
(5.4.9)
n 1
n 1x n1
e
n!
n 1x
( 0, ) ( n 1
n 1 n 1 n 1x n n1
e
2n
n
(5.4.10)
n 1x )
n 1x
2n i avem n+1(x)
n
n
n 1 n 1 n 1x n 1 1
e
n
2n
n 1
n 1x
= lim
n
1 n 1 n 1 n
n 1 n 1x
e
e
lim
2n n
n 1
1
= 2 L
158
n 1 x
1
lim 1
e
n 1
x
n 1x
2
3
4
(ln(1+t) = t t /2 + t /3 t /4 + ....) i avem
n
x2
x3
x4
n 1
... x n 1
2
n 1
n 1 2n 1 3n 1 n 1 4n 1
lnL = lim
x2
x3
x4
= lim x n 1
... x n 1 = - x2/2.
2 3 n 1 4n 1
Concluzie
irul densitilor centrate i normate converge, n cazul n care Xn sunt
repartizate Exp(1) la funcia (x) =
1
2
x2
2
1
2
S n n
n
x2
2
5.3.2.(ii)
S n n
n
N 0,1
(5.4.11)
Afirmaia este valabil ntr-un context i mai general, anume dac putem
demonstra c exist un n ncepnd de la care n este o mrginit. Demonstraia
depete cu mult cadrul acestui manual. Cine chiar este interesat o poate gsi de
exemplu, n Y. Ptohorov, Y. Rozanov, Probability Theory, Springer 1969, pp
190-194. Alte demonstraii, mai recente se pot gsi pe Internet, cu Google.
Dar dac variabilele aleatoare Xn sunt discrete, atunci problema local nu are
sens. Se poate demonstra un rezultat mai slab.
159
N 0,1
X ... X n n
1 x 2
limn P 1
x
e dt
n
2
(x) =
x t
e 2
dt
Demonstraie
Dac acceptm teorema de convergen a funciilor caracteristice, demonstraia
este simpl. Fie Yn = Xn - variabilele centrate i (t) = EeitY funcia lor
caracteristic. tim de la proprietile funciilor caracteristice c dac Yn sunt din
L2, atunci este derivabil de dou ori. Ne intereseaz c e derivabil de dou
t2
(0) + o(t)t2 unde o(t) este o
2
funcie continu i o(0) = 0. Dar (0) = 1, (0) = EYn = 0 i (0) = - EYn2 = - 2.
t 22
Deci (t) = 1
+ o(t).
2
Calculm funcia caracteristic a lui sn, notat cu n:
n(t) =
it
Y1 ...Yn
Ee n
=
=
n
t
t 22
t t 2
1
o
2 .
2 n
n n
Atunci
t2
t2
limnn(t) = exp[ lim n
2
2n n
t2 t2
]= exp 2 lim o
o
= e 2 .
160
t2
2
Exemplu de aplicare:
0
, atunci Sn
Exemplul 5.4.4. Repartiia binomial. Dac Xn
q p
Binomial(n,p). Dac n este destul de mare putem aproxima P(Sn a) cu TLC
astfel: Avem = p, = pq . Deci
P(Sn a) = P(
S n np
npq
a np
.
)
npq
npq
a np
Se tie c dac npq 20, aproximarea este foarte bun. Prezentm un grafic cu
diferenele dintre funcia de repartiie a repartiiei Binomial(100,0.42) i cea a
2
Pe axa Ox sunt valorile lui x iar pe axa Oy valorile diferenei dintre cele dou
funcii de repartiie. Maximul este maimic de 0.05. Daca ns luam un caz
extrem, cu p =0.042, situaia se schimba
161
Diferena dintre probabiliti poate depi 0.12, ceea ce este imens. Explicaia
este c acum =4.2 i probabilitatea ca X Binomial(100,0.042) s ia valorile 4
sau 5 este mare : 0.3653754. Ca s fie aplicabil aproximarea normal trebuie
ca toate probabilitile P(X = k) s fie mici. Dac produsul np este mic, dei n
este mare, atunci este preferabil aproximarea cu repartiia Poisson(np).
162
Capitolul 6
Simularea variabilelor aleatoare
n dotarea calculatoarelor exist de mult generatoare de numere aleatoare,
care simuleaz destul de bine un ir de variabile aleatoare repartizate
Uniform(0,1). A simula o variabil aleatoare nseamn ca, pe baza acestui
generator de numere aleatoare s se construiasc variabile aleatoare avnd o
repartiie dat.
Formal, problema s-ar pune aa: se d o variabil aleatoare
UUniform(0,1) i o funcie de repartiie, F. S se construiasc o funcie f astfel
ca funcia de repartiie a variabilei aleatoare X = f(U) s fie F.
Sau, mai general, se dau k variabile aleatoare (Uj)1jk i.i.d., repartizate
Uniform(0,1) i se cere s se construiasc o funcie f:k ca n aa fel nct
variabila aleatoare X = f(U1,...,Uk) s aib funcia de repartiie F.
Exist mai multe medii de programare care fac acest lucru n cazul
repartiiilor clasice. De exemplu, n R, mediu de programare gratuit, care se
poate descrca de pe internet exist posibilitatea simulrii (i nu numai) cel puin
a urmtoarelor repartiii
Repartiia
Numele ei n R
Parametri
beta
beta
,
binomial
binom
k,p
Cauchy
cauchy
m,a
2
chisQ
n
exponential
exp
F
f
m,n
gamma
gamma
,
geometric
geom
p
hipergeometric
hyper
a, n, k1
log-normal
lnorm
,
logistic
logis
, 2
negativ binomial
nbinom
k,p
normal
norm
,3
Poisson
pois
Extragem k bile dintr-o urn cu a bile albe i n bile negre; X este numrul de bile albe.
1
1 e
163
Student
uniform
Weibull
Wilcoxon
t
unif
weibull
wilcox
n
a,b
k,
m, n
Dac vrem s le calculm funcia de repartiie punem p, pentru densitate punem d iar pentru
cuantile (vezi mai jos) punem Q. De exemplu
x=pnorm(1,0,1);y=dnorm(1,0,1);z=Qnorm(0.01,0,1) va produce numerele x = 0.8413447 (cci
(1) = 0.8413447), y = 0.2419707 =
ex
/2
164
cu x = 1 i z = -2.326348 = -1(0.02)
(6.1.1)
Trecnd la complementar,avem c
Q(U) x U < F(x)
(6.1.3)
Din (6.1.2) i (6.1.3) deducem c U < F(x) Q(U) x U F(x).
q.e.d..
165
ln u
ln u
166
cuantila<-function(u,a,p)
{o=order(a)
#sortez pe a, pentru ca se poate sa
nu fie in ordine
F=rbind(a[o],p[o]); a=F[1,]; p=F[2,]
#calculez sumele partiale
s=p; for (i in 1:length(a)){s[i]=sum(p[1:i])}
#caut locul lui u
v=which(s>=u);i=min(v); q=a[i]
q}
Apelarea funciei se face cu instruciunea q=cuantila(u,a,p)
Un exemplu concret: s se simuleze n =1000 variabile aleatoare avnd repartiia
F=
1 6 0 1 2 3
10 2 1 2 1 4
n=1000;a=c(6,0,1,2,3);p=c(2,1,2,1,4)/10;u=runif(n,0,1)
x=u;for (i in 1:n) {x[i]=cuantila(u[i],a,p)}
Pentru a verifica dac e bine, folosim instruciunea table(x) care arat
repartiia empiric a unui vector x : sub fiecare valoare diferit pe care o ia
vectorul se scrie numrul de apariii a acelei valori (frecvena absolut). n cazul
nostru avem:
table(x)
x
-6
0
1
195 99 190
2
3
98 418
167
F (a ) F(a ) F a ... F (a ) F a 1 F a
2
1
k
k 1
k
1
168
are repartiia F = p j F j .
j 1
Demonstraie
n
j 1
j 1
. Dac J = 1, simulm X
algoritmul exact este: simulm variabila J
p q
Exp(1) = Gamma(1,1) iar dac J=2 simulm X = Gamma(2,1). Dup cum se
vede n scriptul urmtor, care folosete funcia cuantila din paragraful anterior
169
ln U
exponeniala convolutat cu ea nsi de n ori. Deci soluia este X
j 1
)
N(0,1). Deci (X,Y) N( ,
0 0 1
170
Demonstraie
Avem de artat c dac f:2 este o funcie continu i mrginit,
1
atunci Ef(X,Y) =
f x, y e
2
x2 y2
2 dxdy
(6.1.6)
0 0
(6.1.7)
ue
sin 2v
D x. y
Iacobianul este
u 2 ln u
Du , v cos2v
u 2 ln u
x2 y2
2
(6.1.8)
2 2 ln u cos2v
=
2 2 ln u sin 2v
2
u
dxdy =
1 1
0 0
x2 y2
2
2
u
e
dudv dudv =
dxdy =
u
2
2
1
2 ln u cos2v , 2 ln u sin 2v dudv =
f x, y e
2
x2 y2
2 dxdy
(6.1.9)
exact ceea ce trebuia verificat.q.e.d.
Prin metoda Box Muller se genereaz variabile aleatoare normale
folosind doar dou variabile uniform repartizate. Este evident o mare
simplificare.
Exist i o metod exact de a simula repartiia Poisson(), fr a calcula
cuantilele. Uneori ea este mai rapid.
Propoziia 6.1.13. Fie (Un)n Uniform(0,1) un ir de variabile aleatoare i.i.d.
Fie
N = minn 1 : U1U2...Un < e - 1
(6.1.10)
Atunci N Poison().
Demonstraie
171
Fie n =
ln U n
1
!
2
!
nt n t
Rezult c P(Tn+1 > t) P(Tn > t) =
e . Am demonstrat chiar mai
n!
mult: c dac punem N(t) = min n : Tn > t, atunci N(t) Poisson(t). 6q.e.d.
(6.1.12)
172
1 0 1 2 1 i 2i 1 i i 1
1
1
1 1
8 1 1 1 1
1 1 0 1 2
. Dac X = -1, atunci Y poate lua dou valori,
Atunci X
8 2 3 2 1
1 0 1
1 0 1 2
. Analog, avem (Y X = 0)
, (Y X = 1)
2 1 1
3 1 1 1
1 0 1
i, n sfrit, (Y X = 2) 0.
2 1 1
(6.2.1)
Un alt mod de a scrie acelai lucru (de multe ori mai comod) este
E[h(Y) X] = h( y )Q ( X , dy )
(6.2. 2)
Relaia (2.1.1) se poate prelungi la funcii de dou variabile
E[h(X,Y) X ] = h X , y Q X , dy
(6.2.3)
174
... z
2
3
n
unde
S se simuleze un vector aleator Z 1
p1 p2 p3 ... pn
z j z j ,1 ,..., z j , d sunt vectori d dimensionali. Atunci formula (6.2.8) revine la
(6.2.9)
f X1 , X 2 X 1 , x2
f X 2 | X 1 x2
f X 3 | X1 , X 2 x3
f X1 X1
f X 1 , X 2 , X 3 X 1, X 2 , x3
f X1, X 2 X 1 , X 2
......................
176
f X 3 | X1 x1 , X 2 x2 x3
f X 1 , X 2 , X 3 x1, x2 , x3
f X 1 , X 2 x1 , x2
f X 1 , X 2 x1 , x2
f X 1 x1
(6.2.10)
,...
p(i1,...,ik) =
p2
),
p2 ... pk
p3
), etc
p3 ... pk
177
aceasta reprezint aria seciunii prin sfer fcut prin punctul (x,0,0); seciunea
1 x 2 , deci aria este (1 x2), deci
3
f X 1 , X 2 x, y
1C x, y, z dz
4
. Apoi,
; integrala este lungimea
3 1 x2
4
3 1 x2
4
f X 2 | X1 x y
1 x 2 y 2 ],
3 1 x2 y 2
1x2 y 2 1 . Deci avem n concluzie
2
2
2
2 1 x y
1
1 x2
f X 3 | X1 x , X 2 y z
2 1 x2
2
3 1 x y2
1 x 2 , 1 x 2
1 x 2 y 2 , 1 x 2 y 2
)
Exemplul 6.2.9. S se simuleze un vector X N( ,
1 3 9
178
Soluie
2
1 2
n general, dac X N( 1 , 1
), atunci se demonstreaz uor,
2
2 1 2
2
folosind funcia caracteristic sau ce generatoare de momente, c
2
2
, 2 1 r 2 )
1
n cazul nostru 1 = 2 = 1, 1 = 2, 2 = 3, r = 0.5. n R este foarte simplu:
X1 N(1,12) i (X2 X1 ) N( 2 r ( X 1 1 )
mu1=1;mu2=1;sig1=2;sig2=3;r=.5;N=10
x1=rnorm(N,mu1,sig1);mu2yx=mu2+r*x1*sig2/sig1
x2=rnorm(N,mu2yx,sig2*sqrt(1-r^2));x2
cbind(x1,x2)
x1
x2
[1,] 1.4348022 -0.4392765
[2,] 2.9756048 1.3576312
[3,] 1.4325336 5.1186160
[4,] 3.6110443 0.2845141
[5,] -1.6309399 -0.8586991
[6,] -1.1127450 -3.2264889
[7,] -1.7916329 -3.2797160
[8,] 0.2004633 5.0036828
[9,] 3.4808525 5.0187472
[10,] -0.2603470 2.8354261
n figura alturat vedem rezultatul a 5000 de simulri.
Pentru dimensiuni mai mari, algoritmul general nu mai este satisfctor nici
pentru simularea vectorilor aleatori normali, deoarece formulele de calcul pentru
(Xj X1,...,Xj-1) devin tot mai complicate.
179
21 x y
1 x 2
a doua e greu.
Algoritmul acceptare / respingere. Ideea este s generm vectori
aleatori unifom repartizai ntr-o mulime mai mare, unde este comod de fcut
aceasta, i s reinem doar acei vectori care sunt C. Cel mai comod este s
includem C ntr-un hiperparalelipiped [a1,b1]...[ak,bk]
Formal, rezultatul este urmtorul:
Propoziia 6.3.2 Fie C A k dou compacte de msur pozitiv i fie (Xn)n un
ir de vectori aleatori i.i.d. repartizai Uniform(C). Fie N = inf n : Xn C i Z =
XN.
Atunci Z Uniform(C).
Demonstraie
Fie p = P(Xn C). Atunci P(N = n) = p(1 p)n-1, deci probabilitatea ca nu
nimerim niciodat n C este 0. Fie B C o mulime borelian. Atunci
P(Z B) = P(XN B) = P X N B, N n =
n 1
PPXX n BC) PX j Cj n, X n C =
n 1
n
P X j Cj n, X n B
n 1
P X n B
P X n B k B / k A k B
n 1 =
p
1
, exact ce voiam.
P X n C ) n 1
P X n C ) k C / k A k C
180
N=120;x1=runif(N);x2=runif(N);x3=runif(N);s=x1+x2+x3
v=which(s<1);nf=length(v)
xb1=1:nf;xb2=1:nf;xb3=1:nf
for
(i
in
1:nf)
{xb1[i]=x1[v[i]];xb2[i]=x2[v[i]];xb3[i]=x3[v[i]]}
x=cbind(xb1,xb2,xb3);x
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[7,]
[8,]
[9,]
[10,]
[11,]
[12,]
[13,]
[14,]
[15,]
[16,]
[17,]
[18,]
[19,]
[20,]
[21,]
[22,]
[23,]
xb1
0.261076623
0.329976494
0.070146402
0.551778257
0.229001845
0.145313528
0.019184817
0.180765220
0.619285529
0.012022830
0.420006088
0.042866380
0.394432793
0.342567456
0.439633231
0.002924559
0.442618400
0.055533753
0.102202073
0.101106154
0.458446015
0.067286825
0.229641613
xb2
0.001725541
0.618442961
0.406062445
0.067009293
0.150103106
0.550778716
0.133237032
0.394726553
0.085581634
0.403672086
0.054411151
0.024161682
0.135697418
0.325553098
0.135284625
0.660988999
0.198682676
0.397702978
0.703533423
0.433682927
0.205739238
0.133509017
0.620405543
xb3
0.59342688
0.02125208
0.41304084
0.28671116
0.29779559
0.19904163
0.68866607
0.23718938
0.19468893
0.19543799
0.36632268
0.77753557
0.09784523
0.11622695
0.04868877
0.21707588
0.14334936
0.21110361
0.04253352
0.38915822
0.10033640
0.29028897
0.06375227
Xj
181
Demonstraie
Fie f : n o funcie msurabil i mrginit. Avem de calculat Ef(Y)
n sperana c rezultatul va fi n! fdn . Din formula de transport, avem
n
x
x x
Ef(Y) = f 1 , 2 ,..., n e s 1[0, )n 1 x1 ,..., xn , xn1 dx1dx2 ....dxn1 . Aici s este suma x1
s
s s
+ ...+ xn+1
D x1 ,..., xn 1
sn ,
D y1 ,... y n 1
n s
f y1 , y 2 ,..., yn 1 n y1,..., yn dy1dy 2 ....dy n s e ds , adic exact ce doream cci a
0
(6.3.1)
aX 1 bX 2 cX 3
unde Xj sunt i.i.d i Exponential(1).
X1 X 2 X 3
182
=(1,2,3) i C = 1 9 2 .
1 2 16
[,1]
[,2]
[1,] 1.3356960 2.7749180
[2,] 2.3000149 1.3544057
[3,] -1.3323644 0.8461128
[4,] 0.9394982 0.8378104
[5,] 2.0869182 0.7712231
[6,] 0.2167368 1.6627487
[7,] 0.7415051 3.6121115
[8,] 0.5663550 1.6125076
[9,] 0.6628614 -1.1853937
[10,] 5.2891190 0.4922314
184
[,3]
15.06867494
-1.01883329
10.02604282
7.92561663
-7.01464171
0.05478921
3.01237874
-1.61308129
12.85524488
0.82281214
Capitolul 7
Statistic descriptiv
Introducere
Statistica descriptiv este ramura statisticii ce se ocup cu prezentarea,
organizarea i interpretarea unei colectii de date. Descrierea acestor informaii se
poate face grafic (prin liste, grafice liniare, de distribuie etc.), sau prin indicatori
statistici (medie, median, abatere etc.).
185
Anul
Durata medie
de viata
69,24
69,74
70,53
71,19
71,18
71,01
71,32
71.76
72,22
72,61
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
Tabelul 7.1.1
Reprezentarea grafic realizat pentru studierea schimbrilor sau pentru
compararea variabilelor statistice se numete grafic. Exist mai multe astfel de
reprezentri.
Reprezentarea cu batoane folosete batoane verticale sau orizontale, a
cror lungime simbolizeaz valorile variabilei statistice. Batoanele verticale se
folosesc, de obicei, pentru caracteristici care variaz n timp. ntre batoanele
consecutive se las, de regul, un spaiu de jumtate de unitate.
Figura 7.1.1 este reprezentarea cu batoane pentru datele din tabelul 7.1.1.
73
72
71
70
69
68
67
1998
1999
2000
2001
2002
2003
Figura 7.1.1
186
2004
2005
2006
2007
Urban(%) Rural(%)
32,1
67,9
36,9
63,1
45,8
54,2
54,3
45,7
54,6
45,4
54,6
45,4
53,3
46,7
53,4
46,6
54,9
45,1
54,9
45,1
55,2
44,8
55,1
44,9
55,0
45,0
2008
2006
2004
Rural(%)
2002
Urban(%)
2000
1980
1960
0
10
20
30
40
50
Figura 7.1.2
187
60
70
80
Anul
2003
2004
2005
2006
2007
2008
Tabelul 7.1.3
Pentru acest tabel, am realizat graficul liniar pe poriuni din figura 7.1.3.
Total imigrani
12000
10000
8000
6000
4000
2000
0
2003
2004
2005
2006
2007
2008
Figura 7.1.3
188
Alte surse
1%
Fonduri externe
8%
Uniti economice
Uniti economice
48%
Fonduri de la buget
43%
Fonduri de la buget
Fonduri externe
Alte surse
Figura 7.1.4
n continuare, ne vom referi la distribuii i reprezentarea lor prin
diagrame i tabele.
Definiia 7.1.2. O variabil statistic se numete discret dac ea nu poate lua
dect valori izolate n intervalul su de variaie. Ea se numete continu dac
poate lua toate valorile posibile n intervalul su de variaie.
Ca exemplu de variabil discret, ne putem referi la numrul capitolelor
unei cri, numrul articolelor produse de o fabric etc.. Pentru cazul continuu,
putem da ca exemplu nlimea unei persoane, ora sosirii unui tren etc..
Ne referim n continuare la cazul variabilei continue.
S considerm un eantion de 40 de angajai al cror salariu brut
exprimat n mii lei, la nceputul lunii ianuarie, conduce la datele din tabelul
7.1.4.
0,831
0,956
1,587
0,82
1,805
1,091
1,605
1,594
0,904
1,705
0,991
1,141
1,052
1,201
0,989
1,354
0,896
1,591
1,981
1,452
1,731
1,895
1,858
1,946
0,961
1,156
1,459
1,344
1,75
0,972
1,081
1,671
0,981
1,221
1,861
1,42
0,976
1,071
1,492
1,057
Tabelul 7.1.4
O descriere precis a seriei statistice obinute se realizeaz prin
construirea unui tabel al frecvenelor, n care observaiile sunt clasificate n
raport cu numrul unitilor statistice care se afl ntre anumite limite. Tabelul
7.1.5 prezint frecvenele pentru datele anterioare, privind salariile. Astfel,
marginile claselor de valori (0,8; 0.95 ...) din tabelul 7.1.5 sunt limitele sau
marginile clasei de valori. Media aritmetic a limitelor unei clase se numete
189
mijlocul sau valoarea central a clasei. Diferena dintre cea mai mare i cea mai
mic margine se numete domeniu sau amplitudine. Frecvena absolut este dat
Limitele
clasei
Mijlocul
clasei
[0,8;0,95)
[0,95;1,1)
[1,1;1,25)
[1,25;1,4)
[1,4;1,55)
[1,55;1,7)
[1,7;1,85)
[1,85;2)
0,875
1,025
1,175
1,325
1,475
1,625
1,775
1,925
Frecvena
absolut
Frecvena
relativ(%)
Frecvena
cumulat
absolut
4
16
21
23
28
33
37
40
Frecvena
cumulat
relativ(%)
10
40
52,5
57,5
70
82,5
92,5
100
4
10
12
30
5
12,5
2
5
5
12,5
5
12,5
4
10
3
7,5
Tabelul 7.1.5
de numrul unitilor statistice aflate ntre limitele unei clase, iar cea relativ este
raportul dintre frecvena absolut i numrul total al unitilor statistice. n cazul
n care nu este precizat, prin frecven se nelege frecven relativ. Mulimea
frecvenelor (absolute sau relative), mpreun cu clasele lor formeaz frecvena
distribuiei. Frecvena cumulat a unei clase este suma frecvenelor pn la clasa
respectiv, clasele fiind ordonate cresctor.
n general, este indicat utilizarea a 10-20 clase de valori.
Histograma este o reprezentare cu batoane, fr spaiu ntre acestea. Ea
prezint marginile claselor pe axa orizontal i frecvenele pe cea vertical.
Histograma pentru datele din tabelul 7.1.4 este prezentat in figura 7.1.5.
35
30
25
20
15
10
5
0
Figura 7.1.5.
190
Frecvena(%)
30
25
20
15
10
5
0
0.875
1.025
1.175
1.325
1.475
1.625
1.775
1.925
Figura 7.1.6
De exemplu, media mulimii 5,6,8,9,12 este 8, iar pentru 15, 18, 20, 14,
1
28, 30 se obine mediana (20+24)=22.
2
Nota
3
4
5
6
7
8
9
10
Frecvena
absolut
1
1
2
2
5
6
2
1
Tabelul 7.2.1
Frecvena
relativ(%)
5
5
10
10
25
30
10
5
Definiia 7.2.2. Pentru o variabil continu, clasa cu frecvena cea mai mic ce
m
are proprietatea c frecvena cumulat asociat este mai mare dect
, m fiind
2
numrul total de clase, se numete clasa medianei.
Notnd cu m numrul total de clase, md mediana distribuiei, fi frecvena
pentru clasa [xi-1,xi), Fi frecvena cumulat pentru clasa [xi-1,xi) i [xj-1,xj) clasa
modal. Efectund o interpolare, obinem urmtoarea
Definiia 7.2.3. ntr-o distribuie, valoarea medianei este dat de relaia
0,5 Fi 1
md=xi+hi
fi
192
1
xi .
m i 1
ni xi
x i i
ni
i i
k
n
Notnd fi= i , rezult x
f i xi , ("media ponderat").
m
i 1
Definiia 7.2.5. Considerm un tabel al frecvenelor cu k clase. Dac x 1*, x2* ,...,
x m* sunt mijloacele claselor, n1, n2, ..., nk frecvenele lor absolute i f1, f2, ..., fk
frecvenele lor relative, atunci media distribuiei este
k
ni x*i
x i i
ni
i i
mai precis
k
f i xi * .
i 1
1,3175.
Se observ c media nu d o imagine complet a datelor de selecie sau a
distribuiei. De exemplu, mulimile {2, 2, 2, 5, 8, 8, 8}, {3, 3, 5, 5, 5, 7, 7}, {4, 4,
4, 5, 6, 6, 6} au aceeai medie, dar au structuri diferite. Acesta este motivul
193
pentru care sunt introduse msuri ale variaiei, care s arate gradul de mprtiere
a datelor n jurul mediei.
Definiia 7.2.6. Pentru o variabil discret, diferena dintre cea mai mare i cea
mai mic valoare a seleciei se numete amplitudine.
Pntru o variabil continu, amplitudinea este diferena dintre limita
superioar a clasei cu cele mai mari margini i limita inferioar a clasei cu cele
mai mici margini.
Definiia 7.2.7. Fie x 1 , x2 ,..., x m date de selecie avnd media x . Abaterea
medie se definete prin relaia
m
a.m.
1
| xi x | .
m i 1
S considerm urmtoarele date de selecie: 12, 15, 13, 20, 13. Media lor
1
este x 12 15 13 20 13 14,6 , n timp ce abaterea medie are valoarea
5
1
a.m. | 12 14,6 | | 15 14,6 | | 13 14,6 | | 20 14,6 | | 13 14,6 |
5
2,32.
Altfel spus, valorile de selecie difer n medie cu 2,32 fa de media
14,6.
Fie x 1 , x2 ,..., x k valorile distincte ale lui X, avnd media x , iar ni
frecvena lui xi . Atunci
k
ni | xi x |
a.m. i i
ni
i i
k
n
Notnd cu fi= i frecvena relativ, rezult x
f i | xi x | .
m
i 1
Pentru datele din tabelul 7.2.1, abaterea medie este a.m. 1,3.
Definiia 7.2.8. Fie o variabil continu cu un tabel al frecvenelor cu k clase.
Dac x 1*, x2* ,..., x m* sunt mijloacele claselor, n1, n2, ..., nk frecvenele lor
absolute i f1, f2, ..., fk frecvenele lor relative, atunci abaterea medie este
194
ni | x*i x |
a.m. i i
ni
i i
adic
k
a.m.
f i |xi* x | .
i 1
i obinem valoarea
m
2
1
xi x .
m i 1
m
2
1
xi x este abaterea de selecie (empiric) standard.
m i 1
2
2
xi x xi x
2 i 1
i 1
ni
i 1
k
n
2
Dac frecvena relativ este fi= i , rezult 2
f i xi x .
m
i 1
Dispersia corespunztoare datelor din tabelul 7.2.1 este
1
2
1 (3 7) 2 1 (4 7) 2 2 (5 7) 2 2 (6 7) 2 5 (7 7) 2
20
6 (8 7) 2 2 (9 7) 2 1 (10 7) 2 2,8 ,
n timp ce abaterea standard este 1,673 .
195
ni x*i x
2 i i
ni
i i
mai precis
k
f i xi* x
i 1
445,2750
1,114 , iar
40
Nota
algebr
5
6
6
6
7
7
8
9
10
10
Nota
geometrie
5
5
6
7
7
8
8
9
9
10
Tabelul 7.3.1
196
Vom reorganiza datele de mai sus sub forma unui tabel cu dou intrri,
astfel: notele la algebr sunt reprezentate pe axa absciselor, iar cele la geometrie
pe cea a ordonatelor.
10
9
8
7
6
5
mX
10
5,5
6,5
7,5
9,5
10
mY
9,5
9
8
7,5
6
5
Tabelul 7.3.2
Vom indica existena unui student ce ia note corespunztoare unui ptrat
printr-un punct situat n interiorul acestuia. De exemplu, studentul cu notele 7 i
8 se va regsi n ptratul (7,8). Acest tablou se numete tablou de corelaie.
Observm c, n general, creterea notelor la algebr este nsoit de
creterea notelor la geometrie. Astfel, ntre aceste variabile exist o corelaie
pozitiv. Punctele din interiorul tabloului de corelaie se grupeaz n jurul unei
diagonale a ptratului, deci se poate afirma c avem o corelaie liniar.
n figurile 7.3.1 i 7.3.2, am reprezentat grafic pe mX n raport cu x i pe
mY n raport cu y.
12
10
8
6
4
2
0
0
6
Figura 7.3.1
197
10
12
10
9
8
7
6
5
4
3
2
1
0
0
10
12
Figura 7.3.2
componentele
m
a j , bk .
Notnd
P V v jk p jk , avem
p jk 0
j 1k 1
b1
b2
bn
a1
a2
p1
p2
...
...
...
...
...
...
...
...
...
...
...
...
am
p m1
pm2
p mn
pm
p1
p2
pn
Tabelul 7.3.3
p jk pk ,
p jk p j , j 1, m;
k 1, n;
j 1
k 1
n
p j 1.
p k 1,
j 1
k 1
variabile.
Similar cu valorile medii pentru variabilele unidimensionale se definesc
cele pentru variabilele bidimensionale. Dac notm
m
mrs
p jk a rj bks ,
j 1k 1
m10
p jk a j
a j
j 1k 1
j 1
m01
p jk bk ,
j 1k 1
rs E X m1 r Y m2 s
a j m1 r bk m2 s .
j 1k 1
pij ai
pj
199
E Y X
pij b j ai
i 1 j 1
200
Capitolul 8
Teoria seleciei
Introducere
Teoria seleciei s-a dezvoltat datorit necesitilor practice. n multe situaii,
apare necesitatea de a obine informaii relevante despre mulimi cu numr mare
de elemente, neexistnd posibilitatea real de a studia fiecare element n parte. n
aceste cazuri, se poate examina o selecie (eantion) din mulime, n ideea ce
informaia obinut este util pentru ntreaga populaie studiat. Numeroase
aplicaii au condus la axioma potrivit creia un eantion d informaii utile
despre ntreaga mulime i c, pe msur ce selecia crete ca volum, datele
obinute sunt din ce n ce mai fidele.
unde f : I k I .
Este
comod
s
alegem
funcia
liniar
f xn k ,..., x n 1 a1 x n 1 ... a k x n k c, a1, ...ak, c fiind valori ntregi.
Metoda genereaz valori cuprinse ntre 0 i m-1, motiv pentru care m se
alege ct mai mare. Pentru k=0, avem generatori de ordinul nti. n acest caz,
a=16807, c=0, m= 231 1 sau a=24298, c=99991, m=199017 sunt cteva seturi de
valori adecvate.
Variabile aleatoare continue. Simularea unei variabile aleatoare continue
uniforme pe [0,1] se realizeaz prin generarea de valori ntregi uniform
repartizate pe mulimea {0, 1, ..., m-1} i prin mprirea lor prin m-1. Pentru o
variabil aleatoare uniform repartizat pe (0,1) se genereaz valori din mulimea
{1, ..., m-1}, care se mpart la m. O variabil aleatoare X, uniform repartizat pe
(a,b) se genereaz cu ajutorul unei variabile aleatoare Y, uniform repartizat pe
(0,1) dup care se efectueaz schimbarea de variabil X (b a )Y a .
n cele ce urmeaz, ne vom referi la metoda inversrii funciei de
repartiie.
Fie X o variabil aleatoare avnd drept funcie de repartiie F : R [0,1],
atunci inversa ei se definete ca F-1(y)={x R F(x) u}, ( ) u [0,1],
rezultnd astfel o posibilitate de algoritmizare n vederea simulrii variabilei.
Pentru diverse repartiii concrete, se obin diveri algoritmi.
x
Repartiii discrete. Fie X o variabil aleatoare discret, X: i , i 1, n ,
pi
n
pi ,
i 1
F1 0, x xi ;
...
n 1
F ( x)
F
p k , xi 1 x xi ;
i
k 1
1, x x n .
0, x 0;
k i i
F ( x ) C n p (1 p) n1 , k 1 x k
i0
1, x n.
0, x 0;
k
F ( x ) pq k , k 1 x k ,
i 0
1, x n
unde p q 1, p (0,1) .
X poate fi simulat prin aplicarea modelului clasic de cutare sau prin
simularea variabilei aleatoare cu ajutorul monedei trucate n aa fel nct
probabilitatea apariiei valorii sa fie p, iar cea a stemei sa fie q. Astfel, variabila
X arat la a cta ncercare se obine stema prima dat.
Repartiiile continue. n situaia n care se cunoate expresia inversei
funciei de repartiie, se poate utiliza forma general a algoritmului. n caz
contrar, se utilizeaz algoritmul specific repartiiilor discrete. n prealabil se
determin intervalul Fi 1 , Fi ce conine pe u, calculndu-se
x * xi 1 ( xi x i 1 )
u Fi 1
.
Fi Fi 1
203
1
b
c inversa funciei F este F (u ) ln(1 u ) .
a
1
este convergent n repartiie ctre Z N (0,1). S considerm
i
2
n
X 1 ... X n
1
2.
2 . Atunci obinem Z n
12
n
12
Pentru
n 12,
algoritmul de simulare devine simplu, ntruct
Z n X 1 ... X 12 6 .
Exemplul 8.1.6. Generarea variabilelor 2 i Student se bazeaz pe legtura
lor cu repartiia normal standard.
8. 2. Variabile de eantionare
Fenomenele din natur, studiile sociologice au consacrat metoda sondajului.
Problema care se pune este de a determina caracteristica unei populaii format
din N indivizi, prin prisma rezultatelor x1, x2, ... , xn obinute prin n experiene
indepenente. xi se numesc valori de eantionare, iar populaia este distribuia
teoretic. Dac populaia este infinit, sau poate fi considerat infinit, singura
metod de cercetare pentru determinarea caracteristicilor distribuiei teoretice
este metoda seleciei (sondajele de opinie). Acelai lucru se realizeaz i pentru
un numr finit de indivizi (controlul antidoping realizat pe un numr mic de
componeni ai unei echipe).
Definiia 8.2.1. O subcolectivitate a unei colectiviti cercetate se numete
selecie sau sondaj. Numrul elementelor seleciei este volumul seleciei.
Definiia 8.2.2. Valorile obinute pentru indivizii care intr n selecie privind
caracteristica X de numesc date de selecie relative la caracteristica X.
Pentru o selecie de volum n vom nota datele de selecie cu x1, x2, ..., xn.
204
Definiia 8.2.3. Datele de selecie x1, x2, ..., xn sunt valorile unor variabile
aleatoare X1, X2, ..., Xn , care se vor numi variabile de selecie.
Pe parcursul ntregului capitol vom avea n vedere notaiile menionate
n definiia anterioar.
Definiia 8.2.4. O funcie de variabile de selecie a crei valoare devine
cunoscut cnd variabilele de selecie sunt nlocuite prin valorile de selecie se
numete statistic.
Sondajul este operaia de colectare a elementelor unui eantion din
populaia statistic examinat. Exist sondaje cu revenire (bernoulliene), cnd
elementul extras din populaia considerat este reintrodus n colectiv nainte de
efectuarea unei noi extrageri, sau sondaje fr revenire.
Colectarea elementelor din eantion conduce la realizarea mai multor
tipuri de sondaje. Sondajul pur aleator se obine cand unitile statistice au
aceeai probabilitate de a fi alese din eantion (sunt echiprobabile). Dac se
prestabilete un principiu, se efectueaz un sondaj dirijat. n cazul n care
populaia examinat este mprit n grupuri (straturi) n raport cu o
caracteristic prestabilit, avem un sondaj mixt. Acestea pot fi de mai multe
feluri: sondaje stratificate simple fr revenire, sondaje stratificate (tipice) n
dou faze (se aleg mai nti r straturi din cele deja existente, iar dup aceea se fac
extrageri aleatoare din fiecare strat). Dac din fiecare start tipic se extrage un
numr de uniti ales astfel nct raportul dintre volumul eantionului de strat i
volumul stratului s coincid cu raportul dintre volumul eantionului general i
volumul total al populaiei, se realizeaz un sondaj stratificat proporional. Un
sondaj n care volumul eantionului nu este fixat iniial i prelucrarea continu
pn cnd un anumit eveniment se realizeaz se numete sondaj secvenial.
Cercetarea i perfecionarea metodelor de analiz a datelor experimentale
privind un anumit fenomen depind de volumul eantionului ales. Datele pot fi
ordonate dup anumite criterii, spre exemplu: momentul din timp i locul n care
s-a produs fenomenul frecvena apariiei acestuia.
Definiie 8.2.5. Frecvena absolut ni reprezint numrul de apariii ale unui
rezultat n cele n experimente efectuate asupra eantionului, n timp ce frecvena
relativ f i este raportul dintre frecvena absolut i volumul eantionului.
Exist trei moduri n care pot fi organizate rezultatele x1 , x2 ,..., x n ale
1
msurtorilor. Primul dintre acestea este x1 x 2 ... x n , unde ni 1, f i ,
n
i 1, n , n fiind volumul eantionului, ni frecvenele absolute ale apariiei
205
sau prin funcia empiric de repartiie, notat Fn* . Pentru seriile din primele dou
categorii, aceasta are forma
0, x x1 ,
i 1
*
Fn ( x )
f j , x i 1 x xi , i 1, k 1.
j 1
Pentru ultimul tip, funcia empiric de repartiie este dat de
0, x l 0 ,
i 1
*
x l i 1
Fn ( x)
fj
f i , l i 1 x li , i 1, k 1,
d
j 1
k fiind numrul intervalelor ( li 1 , l i ), iar d lungimea acestor intervale.
Este uor de remarcat faptul c funcia empiric de repartiie este
analogul funciei de repartiie a unei variabile aleatoare discrete finite.
Datorit diversitii mrimilor obinute, i aici sunt necesare analiza i
organizarea datelor. Tendinele de grupare i mprtiere n jurul unei tendine
maxime se msoar cu indicatori care se definesc similar cu cei definii in
capitolul 8, de aceea nu i vom reaminti.
Definiia 8.2.6. Media de selecie (momentul de ordin 1) este definit prin
relaia
n
1
X j.
n j 1
Dac xj reprezint valoarea observat a variabilei Xj, valoarea numeric a
acestei statistici este
Xn
206
1
x j.
n j 1
xn
1
( X j X )r ,
n j 1
notaie pe care o vom folosi i pentru valoarea momentului de selecie de ordin
r,
r
1
( x j x)r .
n j 1
Rezult de aici valoarea dispersiei de selecie,
r
1
( x j x) 2 .
n j 1
n paragraful urmtor vom demonstra proprieti privind media de
selecie i dispersia.
s2
Y : 90,9,101,88,85,77,102,100,86,97,76,121,113,110,96,9,2,108,112,109,103.
Datele de selecie pentru caracteristica X au n 6 valori distincte, rezultnd,
astfel, pentru aceasta, distribuia empiric
1 2 3 4 5 6
.
X :
4 6 4 3 1 2
n cazul lui Y, vom face o grupare a datelor de selecie corespunztoare, n
intervalele 70,80 , 80,90 , ..., rezultnd, n acest mod, urmtoarea distribuie
75 85 95 105 115 125
.
empiric Y :
4
4
6 3
1
2
Mediile de selecie ale celor dou caracteristici sunt:
1
X
4 1 6 2 4 3 3 4 1 5 2 6 2,85
20
1
Y
2 75 4 85 4 95 6 105 3 115 1 125 98,5.
20
207
2 (X )
20
2 (Y )
1
1
(x j X )2
4 (1 2,85) 2 6 (2 2,85) 2 4 (3 2,85) 2
20 j 1
20
3 (4 2,85) 2 1 (5 2,85) 2 2 (6 2,85) 2 2,3275.
1
2
1
yk Y
2 (75 98,5) 2 4 (85 98,5) 2 4 (95 98,5) 2
20 j 1
20
6 (105 98,5) 2 3 (115 98,5) 2 1 (125 98,5) 2 182,5.
0, x 1;
1
, 1 x 2;
5
1
, 2 x 3;
2
7
*
F20
, X ( x) , 3 x 4; ,
10
17
20 , 4 x 5;
9 , 5 x 6;
10
1, x 6
respectiv
208
0, y 1;
1
, 75 y 85;
10
3
, 85 y 95;
10
1
*
F20
, Y ( y ) , 95 y 105;
2
4
5 , 105 y 115;
19 , 115 y 125;
20
1, y 6.
ij
n . Frecvenele relative
i 1 j 1
f ij
n
i 1 j 1
unei matrice cu r linii i s coloane.
sunt
1,
mk 0
f ij xik
i 1 j 1
r
m0k
f i0 xik x,
i 1
f ij yik
i 1 j 1
s
f 0 j xik y,
i 1
unde f i 0 f ij i f 0i f ij .
j 1
i 1
209
mhk
f ij xih y kj .
i 1 j 1
11
f ij ( xi x)( y j y) ,
i 1 j 1
P an M (an ) n 1
p (1 p )
.
n 2
De aici rezult c lim P f n p 1, q.e.d.
1
210
D( an )
n 2 2
fi X i ,
i 1
este o combinaie liniar de variabile repartizate normal, aadar are tot repartiie
normal, parametrii fiind ns urmtorii:
k
k
k
M (X ) M
fi X i
M (Xi )
f i ;
i 1
i 1
i 1
211
k
k
Var ( X ) Var
fi X i 2
f i2 , q.e.d.
i 1
i 1
Observaia 8.3.4. n cazul unei serii statistice din primul tip descris anterior,
2
.
n
Teorema 8.3.5. Fie X j1 , X j 2 ,..., X jn j , j 1, k , selecii independente din
dispersia mediei are valoarea
variabila Y
respectiv
a j X j
j 1
2
k
2 j
aj
nj
j 1
a j j ,
j 1
Demonstraie
2j
nj
X i2 2 (n, ).
i 1
Demonstraie
Considerm Yi X i2 i X i N (0, 2 ), i 1, n . Au loc relaiile:
FYi ( x) P(Yi x ) P( X i2 x) P( x X i x ), 0.
1
Deoarece FYi ( x)
2
x u 2
2 2 du i
1
fYi ( x )
e
2x
x2
2 2 , rezult
2 (n, ) , q.e.d.
212
1i, j n
A aij
a jk X k ,
k 1
n
2
t
t t
t
V j V V X A AX X X V j2 .
j 1
j 1
1
n
2 n k 1
it x 1 x 2
k k
2 k dx
e
2 k 1
t2
k
n
k
k 1
n
2
X k (t k )
k 1
(t ).
k 1
X k (ta jk ) e
k 1
t 2 a 2jk
2
t2 n 2
a
2 k 1 jk
t2
e 2
X k (t ).
k 1
1
Xi n X ,
n i 1
213
X i X
2
i 1
X i2
i 1
1
Xi
n i 1
i 1
1
, k , i
n
V AX (V1 , V2 ,...Vn ) . Avnd n vedere teorema anterioar, V j N (0,1) .
Egalitile
V j2
j 2
X i2
i 1
n
1 n
2 1
Xi
Xi
Xi V
n
n i 1
i 1
i 1
U
V
X
n N (0,1),
Xi X
i 1
X i X
2 i 1
2 (n 1,1).
Demonstraie
Xi
, i 1, n, rezult c Yi N (0,1) . Concluzia rezult
Notnd Yi
214
Capitolul 9
Teoria estimaiei
215
n
S2
n 1
2
x 2 ... x 2
x1 ... x n
n
1
n
n
L e
x 1
... e
x n
n e
x 1 ... x n
n1 e
x 1 ... x n
n x1 ... xn .
f x ;
, in rest .
0
L x1 , ..., x n ;
x1 , ..., xn
f x ;
0
, in rest .
L x1 , ..., x n ; 1 n x1 ... x n .
Derivata lui L ca funcie de este egal cu
1 n1 x1 ... xn n 1 ln x1 ... xn .
Funcia L i atinge maximumul pentru
n
1,
ln x1 ... ln x n
1.
ln X 1 ... ln X n
Exemplul 9.2.6. Fie X o variabil normal cu densitatea
f x ;
1
2
e x
/2
x 1 2 ... x n
2 / 2
f x ;
ex
/ 2 2
e x 1
... x 2n / 2 2
1/ 2
x12 ... x n2
n
1/ 2
1
2
2
X 1 ... X n
n
218
Capitolul 10
Estimarea prin interval de ncredere
Introducere
Estimaia punctual a unui parametru , necunoscut la nivelul unei
populaii, dei constituie o informaie n legtur cu acesta, nu poate fi utilizat
fr a avea o imagine i asupra mrimii probabilistice a erorii de estimare. Apare
astfel necesitatea estimrii unui parametru prin aa numitul, interval de ncredere.
n capitolul de fa vom prezenta forma general a intervalului de ncredere,
expresia intervalului de ncredere pentru medie inclusiv cazul particular al unei
proporii, interval de ncredere pentru diferena a dou medii, interval de
ncredere pentru dispersie i respectiv interval de ncredere pentru raportul a
dou dispersii. Pe tot parcursul capitolului va fi prezentat doar cazul cnd
eantionul se formeaz pe baza unei selecii simple aleatoare format prin
extrageri independente.
(10.1.1)
219
P(a1 ( ) a 2 ( ))
a2 ( )
a1 ( )
f ( )d 1 ,
(10.1.2)
a2 ( )
a1 ( )
f ( )d 1 . (10.1.3)
.
Observaia 10.1.3. Dac estimatorul este un estimator centrat (nedeplasat),
deci E intervalul de ncredere este simetric n raport cu , vom avea
h1 i h2 unde reprezint eroarea limit de
estimare sub form absolut. Astfel intervalul de ncredere se poate scrie:
P( )
a 2 ( )
a1 ( )
f ( )d 1
(10.1.4)
100 5% i 5% .
220
(10.1.5)
este de forma ( X z
,X z
) , cu
1
1
n
n
2
2
P( X z
1
2
X z
) 1
1
n
n
2
(10.2.1)
X 1 X 2 ... X n
este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente, 0,1 este nivelul de
unde X
1
2
t2
2
dt .
Demonstraie
ntruct X N , 2 , iar media de selecie este de forma
X X 2 ... X n
X 1
, extragerile fiind independente, urmeaz c
n
2
i mai departe, avem c variabila
X N ,
n
221
X
P ( z1
z2)
1
2
z2
z1
t2
2
dt ( z 2 ) ( z1 ) 1
t2
2
1
P( X z 2
X z1
)
n
n
2
z2
z1
t2
2
dt ( z 2 ) ( z1 ) 1 .
1
P( X z 2
X z2
)
n
n
2
z2
z2
t2
2
dt ( z 2 ) ( z 2 ) 1 .
n acest caz
z2
cunatila de ordin 1
P( X z
1
2
X z
) 1 . q.e.d.
1
n
n
2
222
t2
2
2
vom gsi n tabel valoarea cuantilei z 2 z
valorile
funciei
,
2
ns exist i tabele, care prezint
~
x
corespunztoare valorii
1
2
t2
2
dt ,
x 0,
caz
care
z2
este
1
.
2
P( X X X X ) 1 .
Determinarea efectiv a celor dou limite presupune cunoaterea expresiei
matematice a estimatorului X i a erorii medii ptratice de estimare X , fiecare
variind de la un tip de sondaj la altul, aici fiind prezentat doar cazul unui sondaj
aleator simplu cu extrageri independente. Cu ct lungimea X a intervalul de
ncredere, respectiv nivelul de semnificaie sunt mai mici, cu att estimaia
parametrului necunoscut este mai bun.
Observaia 10.2.4. Pentru selecii de volum mare, intervalul de ncredere pentru
medie, precizat n Propoziia 10.2.1 este valabil i pentru cazul n care
variabila X urmeaz o lege oarecare de probabilitate, datorit Teoremei limit
central.
Exemplul 10.2.5. S presupunem c dispunem de valorile unei variabile
X N ,2 2 , obinute printr-o selecie simpl cu extrageri independente, de
volum 25 i de medie x 55 , obiectivul fiind acela de a estima media la nivelul
populaiei, , necunoscut, printr-un interval de ncredere de 95%.
Soluie
ntruct 0,05 , obinem din Anexa 1, z
1
55 1,96
2
25
55 1,96
223
2
25
Prin urmare, n 95% din cazuri, intervalul (54,216 - 55,784) va acoperi valoarea
necunoscut a parametrului .
Propoziia 10.2.6. Intervalul de ncredere de tip 1 , pentru media unei
variabile X ce urmeaz legea normal N , 2 cu IR necunoscut i
s
s
2 0 necunoscut este de forma ( X t
,X t
) , cu
n 1, 1
n
1
,
1
n
n
2
2
P( X t
n 1, 1
unde X
s
s
X t
) 1
n
1
,
1
n
n
2
(10.2.2)
X 1 X 2 ... X n
este media de selecie corespunztoare unui
n
obinut
prin
extrageri
aleatoare
independente,
eantion
2
2
2
X 1 X X 2 X ... X n X
2
s
este estimaia absolut corect a lui
n 1
2 , 0,1 este nivelul de semnificaie iar t
este cuantila de ordin
n 1,1
n 1,1
3,365 . Pe baza
7,5 3,365
1,87
6
7,5 3,365
1,87
6
Prin urmare, n 98% din cazuri, intervalul (4,93 - 10) va acoperi valoarea
necunoscut a parametrului .
Observaia 10.2.8. Pentru selecii de volum mare, diferena ntre valorile
cuantilelor repartiiei Student i cele ale repartiiei normale standard este
neglijabil. De asemenea este neglijabil i diferena dintre estimatorul absolut
2
2
2
X 1 X X 2 X ... X n X
2
corect
s
i
estimatorul
n 1
2
2
2
X 1 X X 2 X ... X n X
2
, prin urmare, se poate utiliza
n
formula (10.2.1) cu 2 nlocuit de 2 .
Propoziia 10.2.9. Pentru selecii de volum mare, intervalul de ncredere de tip
1 , pentru media unei variabile X ce urmeaz legea Bernoulli de parametru
necunsocut p este de forma
( p z
1
2
p 1 p
n
, p z
1
2
p 1 p
n
(10.2.3)
X 1 X 2 ... X n
este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente, 0,1 este nivelul de
unde p
Demonstraie
Media unei variabile aleatoare ce urmeaz legea Bernoulli de parametru
necunoscut p, are pentru selecii de volum mare, conform Observaiei 10.2.4, o
repartiie aproximativ normal cu media egal cu p i abaterea medie ptratic
p 1 p
aproximativ egal cu
, prin urmare aplicnd Propoziia 10.2.1 se
n
obine intervalul dorit. q.e.d.
O astfel de medie exprim de fapt proporia p de indivizi dintr-o
populaie care au o anumit caracteristic i este tratat ca media unei variabile X
cu valorile 0 i 1, prin valoarea 1 notnd valoarea variabilei X pentru indivizii
care au aceast caracteristic.
225
Exemplul 10.2.10. La un sondaj electoral, 40 din 100 de persoane chestionate sau pronunat n favoarea unui candidat, scopul fiind determinarea unui interval
de ncredere de tip 95% pentru procentul de alegtori favorabil acelui candidat.
Soluie
n
95%
din
cazuri
intervalul
va
fi
40
0,4 0,6
40
0,4 0,6
1,96
p
1,96
, adic
(0,304- 0,496), prin
100
100
100
100
urmare n 95% din cazuri, procentul favorabil candidatului va fi aproximativ
ntre 30% i 50%.
X1 X 2 z
unde z
1
2
1 2 1 2 X 1 X 2 z 1 2 (10.3.1)
1
n1
n2
n1
n2
2
Demonstraie
Variabila aleatoare Z
X 2 1 2
2
1 2
n1
n2
standard. q.e.d.
4 9
4 9
(22 20) 1,96
1 2 (22 20) 1,96
.
7 8
7 8
X1 X 2 t
unde t
,1
2
,1
2
1
1
1
1
1 2 X 1 X 2 t S
(10.3.2)
,1
n1 n 2
n1 n 2
2
a repartiiei Student cu n1 n 2 2
2
n1 1s1 2 n2 1s2 2
n1 n2 2
Demonstraie
Variabila aleatoare T
X 2 1 2
1
1
S
n1 n2
227
(2,5 2) t S 1 1 1 2 (2,5 2) t S 1 1 ,
,1
,1
10 12
10 12
2
2
cu t
,1
2
10 1 0,2 12 1 0,22 .
10 12 2
X1 X 2 t
unde t
,1
2
,1
s
s
s
s
1 2 1 2 X 1 X 2 t 1 2
,1
n1
n2
n1
n2
2
(10.3.3)
s1
n1 1
1
c2
1 c iar c
libertate unde
.
2
2
n1 1 n2 1
s1
s2
n1 1 n2 1
Demonstraie
Variabila aleatoare T
X 2 1 2
2
s1
s
2
n1
n2
,1
,1
10
12
10
12
2
2
cu t
,1
2
0,2
2
1 c 2 1 c
9
relaia
cu c
.
0
,
2
0, 22
9
11
9
11
229
n s2
n s2
2
2
2
n 1,1
n 1,
(10.4.1)
unde
X X 2 X ... X n X
n 1
2
n 1 s 2
2
n 1,
n 1,1
i
ale repartiiei 2 cu n-1 grade de libertate,
2
2
2
n 1 s 2 , de unde prin artificii de calcul, rezult
obinem 2
n 1,
n 1,1
2
2
2
intervalul dorit. q.e.d.
cuantilele de ordin 1
230
Soluie
5 2
52
2 2
, unde
2
4, 0.99
4, 0.01
42, 0.99 13,28 i 42, 0.01 0, 297 rezult din Anexa 3, cu valorile tabelate ale legii
2.
Propoziia 10.4.3. Fie dou populaii studiate n raport cu variabila X, pentru
2
prima populaie variabila fiind de tipul N 1 , 1
iar pentru a doua, de tipul
1
f
unde f
n1 1,n2 1,1
n1 1, n2 1,1
2
f
n1 1,n2 1,
s1
s2
12
f
2
n1 1, n2 1,
2
s1
s2
(10.4.2)
i
ale
2
2
2
2
1
urmeaz legea Fisher cu n1 1 i n2 1 grade de
2
s2
2
2
libertate i raionand ca n propoziia anterioar, se obine intervalul dorit. q.e.d.
avem c variabila F
231
Soluie
n 95% din cazuri intervalul este
1
f 9,11, 0.975
0, 2 1
1
0, 2
,
2
0,22 2
f 9,11,0.025 0,22
cu f 9,11,0.975 3,59 determinat din Anexa 4, cu valorile tabelate ale legii Fisher
i f 9,11,0.025
1
f 9,11, 0.975
0,278 .
232
Capitolul 11
Teoria deciziei
233
P x K | H 0 este adevarata P x K | 0
ntruct distribuia de probabilitate este complet specificat, probabilitatea
de mai sus poate fi calculat.
i.
Fie H1 : = 1.
Atunci
P x K | H 0 este falsa P x K | H1 este adevarata P x K | 1
Din nou distribuia de probabilitate este complet specificat, deci
probabilitatea poate fi i ea calculat.
ii.
Fie H1 : 0. Acum
P x K | 0 .
De data aceasta, parametrul nu mai este specificat, deci calculul lui este
dificil sau chiar imposibil.
235
11.7. Un exemplu
Notm cu X timpul dintre dou semnalizri succesive ale unui contor
Geiger. Din studiul dezintegrrii radioactive se tie c variabila aleatoare X are
densitatea exponenial:
e t , t 0
f t
0 , in rest .
unde este un parametru care depinde de natura materialului radioactiv.
Un fizician dorete s testeze valoarea lui pentru un anumit material
radioactiv.
Din anumite considerente teoretice sau experimentale, el tie c poate lua
fie valoarea 1, fie valoarea 2; intuiia fizicianului favorizeaz valoarea 2.
Aadar se testeaz ipoteza:
H0 : 2
n prezena ipotezei alternative:
H1 : 1 .
Pentru simplitatea exprimrii, vom presupune c se face o singur
observaie asupra variabilei X, cu alte cuvinte, se msoar lungimea unui singur
interval de timp dintre dou scintilaii consecutive ale contorului Geiger; desigur
c n practic testarea se va baza pe mai multe astfel de observaii.
Notm cu x valoarea msurat a lui X. Alegem drept zon critic a testului
intervalul (1, +). Aceasta nseamn c:
Dac x > 1, vom respinge ipoteza H0 i vom accepta ipoteza H1;
Dac 0 < x 1, vom accepta ipoteza H0 i vom respinge ipoteza H1.
S calculm nivelul de semnificaie al testului. Avem
P x 1 | H 0 adevarata P x 1 | 2 .
Pentru =2, densitatea de probabilitate este
f t 2 e 2 t , t 0
i deci
f t dt 2
2t
dt 0.13 .
P 0 x 1 | H 1 adevarata P 0 x 1 | 1 .
Pentru =1, densitatea de probabilitate este
236
f t e t , t 0 ,
i atunci avem
237
Zona necritic este intervalul (0,1], iar probabilitatea este egal cu aria
delimitat de grafic i axa
deasupra zonei necritice.
S construim acum alt test, cu acelai nivel de semnificaie, dar n care
regiunea critic s fie un interval de forma (0,a). Aceasta nseamn s
determinm numrul a>0 astfel nct
P 0 x a | 2 0.13 .
Condiia de mai sus se transcrie n forma echivalent:
P x a | 1
0.07 e
dt 0.93 .
238
239
unde
H 1 : 2 .
care va nlocui ipoteza alternativ =1 considerat anterior. Considerm drept zon
critic intervalul
, ceea ce nseamn ca nivelul de semnificaie este =0.13.
De data aceasta, ipoteza alternativ H1 nu mai specific o valoare cunoscut
a lui , aa nct nu mai putem indica o valoare numeric a probabilitii ;
putem ns determina expresia lui ca funcie de variabila 0, 2 .
ntr-adevr este probabilitatea ca s aparin zonei necritice cnd
valoarea parametrului este
0 e
dt e t |10 1 e .
11.10. nc un exemplu
Ni se d o moned i ni se cere s decidem dac este sau nu trucat. Avem
de testat ipoteza
H0 : moneda nu este trucat
n prezena ipotezei alternative
H1 : moneda este trucat
Astfel formulate, ipotezele H0 i H1 sunt de natur calitativ; le putem
transcrie sub o form cantitativ, numeric, dac notm cu p probabilitatea de a
obine faa A la o aruncare a monedei ( i deci q = 1 - p va fi probabilitatea de a
obine faa B).
Atunci putem scrie:
H0 :
,
H1 :
Testul va consta din a arunca moneda de 100 de ori. S notm prin X
numrul de apariii ale feei A n cele 100 de aruncri. Sub ipoteza H0, X este o
variabil aleatoare repartizat binomial cu parametrii
i
. Media lui
X va fi np = 50, iar dispersia npq = 25.
Aproximnd distribuia binomial printr-o distribuie normal cu media 50
i dispersia 25, densitatea lui X va fi aproximativ cea schiat in figura
urmtoare.
35
40
45
50
55
60
65
242
Cu alte cuvinte, dac p=0.3 testul nostru va respinge ipoteza greit p=0.5 cu
probabilitatea 0.98.
243
b.
244
se numete P-valoare.
245
246
1.
2.
k = 0,1,2,,n.
Notm
Atunci X este repartizat aproximativ N(0,1), adic
unde
z>0.
Fixnd nivelul de semnificaie , vom determina pragul x din relaia
247
248
irul trece (aproape la limit) testul cu nivelul de semnificaie 0.01, dar este
respins de testul cu nivelul de semnificaie 0.05.
249
250
Capitolul 12
Analiza regresiei
Introducere
Analiza de regresie i are originile n nenumratele probleme practice,
care apar atunci cnd dorim s nelegem i s cuantificm aspectul cauz-efect,
n studiul a dou sau mai multe fenomene, de natur divers. Principala noiune
cu care opereaz acest capitol este noiunea de model de regresie. Vom vedea n
cele ce urmeaz cteva generaliti ale problemei regresiei, prezentndu-se
principalele tipuri de modele de regresie, apoi se va fundamenta modelul liniar
multiplu, incluznd particularitile modelului liniar simplu, estimarea
coeficienilor modelului prin metoda celor mai mici ptrate, inferena asupra
modelului n ipotezele Gauss-Markov, precum i aspecte privind previziunea pe
baza modelului de regresie.
(12.1.1)
Y f X ,
(12.1.2)
(12.1.3)
f X 1 , X 2 ,..., X p ; 1 , 2 ,..., p k X k .
(12.1.5)
k 1
f X , X
1
,..., X p ; 1 , 2 ,..., q
X , X
k
,..., X p , (12.1.6)
k 1
k X 1 , X 2 ,..., X p Z k , k 1, q,
un exemplu fiind modelul de regresie polinomial, n care
f X ; 0 , 1 ,..., q 0 1 X ... q X q
(12.1.7)
i din care pentru q=1 deriv modelul de regresie liniar simpl, dat prin
f X ; 0 , 1 0 1 X .
(12.1.8)
1
f X ; 1 , 2 1 2 , liniarizabil prin substituia
Z . Tot din grupa
X
X
modelelor neliniare, dar liniarizabile, fac parte i modelele care se reduc la
modelul liniar, n urma mai multor operaii: logaritmare, substituie, etc. Un
X
exemplu este modelul exponenial, dat de funcia f X ; 1 , 2 1 2 , care
se liniarizeaz prin logaritmarea log f X ; 1 , 2 log 1 X log 2 i
substituiile F X , A, B log f X ; 1 , 2 i A log 1 , B log 2 , obinnduse modelul liniar dat prin F ( X , A, B) A X B . Exist ns i alte modele
neliniare, care nu pot fi liniarizate, cum ar fi de exemplu, modelul
Y 0 1 X 2 . Este deja bine cunoscut formularea, c modelele neliniare,
liniarizabile prin substituie, adic acelea n care se presupune c funcia de
regresie este liniar n parametri, in de regresia liniar, deoarece studiul lor se
face cu tehnicile acesteia. Modelele neliniare n parametri, dar liniarizabile n
urma unor operaii, cum ar fi logaritmarea, pot fi tratate, att cu tehnici ale
regresiei liniare, ct i cu cele ale regresiei neliniare. Aplicarea regresiei liniare
pe modelul transformat are avantajul c estimatorii se bucur de proprieti mai
bune i dezavantajul c modelul obinut este doar o aproximare a celui iniial (a
se vedea cazul modelului exponenial, n care erorile intr aditiv n modelul
iniial). Modelele neliniarizabile in exclusiv de regresia neliniar, regresie n
care tehnicile nu mai pot fi fundamentate, pe avantajele obinute din liniaritate.
Pentru modelele neliniare, sistemul care deriv din criteriul celor mai
mici ptrate fiind neliniar, se ntmpin de cele mai multe ori, dificulti de
rezolvare, motiv pentru care, atunci cnd modelul este liniarizabil, se prefer mai
nti liniarizarea lui, care va duce la un sistem liniar de ecuaii normale i nu
aplicarea direct a criteriului, dei n acest fel, se obine doar o aproximare
rezonabil a modelului iniial. n cazul modelelor care nu pot fi liniarizate, se
aplic tehnici ale regresiei neliniare, bazate n special pe metode iterative, cum ar
fi metoda iterativ Gauss - Newton.
254
Y k X k .
(12.2.1)
k 1
x 21
n
y y1 , y 2 ,..., y n IR , x x1 ,..., x p
...
x
n1
x12
x 22
...
xn 2
... x1 p
... x 2 p
, n p . (12.2.2)
... ...
... x np
1 , 2 ,..., p IR p , 1 , 2 ,..., n IR n .
(12.2.3)
y i k xik i ,
k 1
255
(12.2.4)
(12.2.5)
i2 .
(12.2.6)
i 1
Definiia 12.2.2. Se numete model liniar, ajustat prin criteriul celor mai mici
ptrate, modelul
y xa e ,
(12.2.7)
x xa x y
(12.2.8)
a x x x y .
256
(12.2.9)
Condiia rang x p
revine la independena liniar a vectorilor
x1 , x 2 ,..., x p . Amintim n continuare, cteva noiuni utilizate i n teoria
modelelor de regresie oarecare.
Definiia 12.2.4. Se numete valoare ajustat a lui y (n modelul liniar),
valoarea y y1 , y 2 ,..., y n IR n , definit de y xa . Se numete matrice de
influen a modelului, matricea H care transform valoarea y, n valoarea
ajustat y , adic, y Hy , matricea de influen n modelul liniar fiind de
1
(12.2.10)
1
a0 a1 , a 2 ,..., a p 1 ~
x 0 ~
x0 ~
x 0 ~
y,
(12.2.11)
p 1
a p y a k xk ,
k 1
257
unde ~
x0 este matricea obinut din matricea x0 , prin centrarea vectorilor de pe
coloan, iar y i x k , noteaz mediile de selecie corespunztoare valorilor y i
respectiv, xik , i 1, n .
Observaia 12.2.7. Dac n Definiia 12.2.5, se consider p 2 , obinem
modelul de regresie liniar simpl,
Y X ,
(12.2.12)
x
a
x yi y
i 1
cov x, y
,
S x2
i 1
(12.2.13)
b y ax ,
258
41
41
1,13 i b 0,85 2,32 1,76
36
36
Y 1,76 1,13 X .
a
modelul
ajustat
este
E , 0,0,...,0 IR n ,
Var E 2 I ,
(12.3.1)
(12.3.2)
(12.3.3)
N , 2 I .
(12.3.4)
(12.3.5)
cov i , j 0, i j, i, j 1, n .
(12.3.6)
Condiiile puse asupra erorii se transfer asupra variabilei aleatoare, adic avem
y N x , 2 I .
259
s2
1 n 2
1
ei
e e ,
n p i 1
n p
(12.3.7)
1
S s x x
2
S y2 / x
1 n 2 1
n p 2
ei e e
s .
n i 1
n
n
(12.3.8)
s
1
2
2
ii) 2 n p
iii)Fie U
n
2
i
2 n p .
i 1
, 1 ,..., p IR p . Oricare ar fi IR p , U i s 2
x x
sunt
independente
i
a
T
T n p , IR p .
1
s x x
U N 0,1 .
Mai
mult,
1
Q 2 r ,
2
1
L N i vectorul aleator L , mpreun cu variabila aleatoare 2 Q , sunt
independeni.
Q2 Q ,
r rang Q ,
LQ . Atunci,
L M n, n ( IR ) ,
Tk
ak k
,
sk
(12.3.9)
xx 1 .
P a k s k t
k ak sk t
1 ,
n p ,1
n p ,1
2
2
(12.3.10)
n p ,1
P Tk t
n p ,1
1 ,
(12.3.11)
s2
s2
P n p 2
2 n p 2
n p ,1
n p,
2
2
unde 2
n p ,1
2
2
i 2
n p ,
2
1 ,
(12.3.12)
P 2 2 2
1 .
n p ,
n p ,1
2
2
(12.3.13)
rezult cuantila t
, a unei variabile Student, cu n p
, de ordin 1
n p ,1
2
2
grade de libertate aa nct,
P Tk t
H0 1 .
n p ,1
Se calculeaz valoarea t k
a k k0
, a statisticii Tk , pe baza datelor de
sk
n p ;1
N , 2 I
fie
x0 xA M n, q ( IR) .
matricele
Dac
se
x M n, p ( IR) ,
A M p, q ( IR ) ,
1
Q I x x x x
noteaz
Q0 I x0 x0 x 0 x 0 , atunci statistica
Q0 Q
Q
rang Q0 rang Q rang Q
(12.3.14)
rang Q0 rang Q i
S12 Q .
(12.3.15)
e0 e0 i S12 e
ee . n cazul formulrii
unei ipoteze H 0 , asupra coeficienilor unui model liniar, ipotez n cadrul creia
matricea datelor de selecie devine de forma X 0 din lem, notaiile S 02 i S12
reprezint suma ptratelor reziduurilor, n modelul redus (obinut n ipoteza H 0 ),
respectiv suma ptratelor reziduurilor, n modelul complet (obinut n ipoteza
H 1 ).
Testul F al egalitii ntre q coeficieni
Se testeaz ipoteza nul,
H 0 : 1 ... q , q p , cu alternativa,
264
P F f H 0 1 .
n p S 02 S12
este
q 1
S12
o valoare calculat a statisticii F din Lema 12.3.8, pe baza datelor de selecie.
Ipoteza nul se va respinge, dac f c f , unde f c
n p S 02 S12
este
q
S12
o valoare a statisticii F din Lema 12.3.8, calculat pe baza datelor de selecie.
Ipoteza nul se va respinge, dac f c f , unde f c
ei
s 1 hi
(12.4.1)
ei
s i 1 hi
T n p 1 ,
unde
267
(12.4.2)
2
i
ei2
n p 1 n p 11 hi
e
(12.4.3)
unde t
n p 1;1
2
n p 1;1
s i 1 hi , i 1, n ,
(12.4.4)
, a variabilei Student, cu n p 1
2
grade de libertate, iar s i este cel din (12.4.3). Aceste intervale pot fi
reprezentate printr-un grafic cu bare, mpreun cu reziduurile ei . Intervalele de
ncredere care nu-l includ pe 0 sunt echivalente cu respingerea ipotezei c
E 0 , respingere fcut pentru pragul de semnificaie . n cazul respingerii
ipotezei de zgomot alb asupra erorii, se elimin acest neajuns, prin scoaterea din
model a acelor observaii pentru care intervalul de ncredere (12.4.4) nu-l conine
pe 0.
Ipoteza necorelaiei erorilor cu variabilele exogene
Ipoteza inexistenei unei corelaii ntre eroare i cte o variabil exogen
X k , k 1, p , asigur obinerea de estimatori optimali, prin metoda celor mai
mici ptrate. Dac exist corelaie ntre acestea, atunci estimatorul a va fi doar
asimptotic nedeplasat. S-a constatat c deplasarea asimptotic obinut pentru a
este mic, atunci cnd coeficientul de corelaie liniar simpl, ntre i X k , este
mic ([15]). Amintim aici, definiia coeficientului de corelaie liniar simpl.
Definiia 12.4.2. Numim coeficient de corelaie liniar simpl (BravaisPearson), ntre dou variabile aleatoare, X i Y, parametrul
r X , Y
cov X , Y E XY E X E Y
.
X Y
X Y
(12.4.5)
268
r x, y
x yi y
i 1
i 1
y
2
(12.4.6)
i 1
r 2
n 2
1 r 2
sunt normale i r 0 ,
(12.4.7)
269
dac
V i i2 x12i x 22i ,
yi
1
1
a1
a2
i
x1i x 2i
x 2i
x1i x1i x 2i
i atunci, V i , i 1, n .
x1i x 2i
sau
cov i , j 0, i j , i, j 1, n .
270
ei 1
0, 4 .
i2
(12.4.8)
2
i
i 1
Pentru a admite ipoteza necorelrii, trebuie ca valoarea lui d s fie n jurul lui 2.
n cazul n care se depisteaz o autocorelaie, se corecteaz calitatea
estimatorilor, folosind metoda celor mai mici ptrate generalizate ([30]).
Odat validate sau corectate ipotezele liniaritii modelului, avem
asigurate pentru estimatorii de cele mai mici ptrate, calitile discutate n
paragraful 12.3. Un alt aspect n analiza rezultatelor regresiei ine de calitatea
ajustrii.
Calitatea ajustrii
Pentru a analiza calitatea ajustrii se pot folosi, att metode numerice, ct
i metode grafice. Metodele grafice (folosite n special n cazul unui singur
predictor) se refer, n mare parte, la analiza reziduurilor, analiz care aa cum sa vzut n prima parte a acestui paragraf, se poate realiza i numeric. Metodele
numerice utilizate n analiza calitii ajustrii se bazeaz pe interpretarea ctorva
statistici.
271
Analiza reziduurilor
Pe lng verificarea ipotezelor liniaritii, studiul reziduurilor poate fi
folosit i n cadrul altor modele de regresie, n vederea reperrii observaiilor
aberante(outlieri). n prima parte a paragrafului, s-a vzut deja instrumentarul
folosit n analiza reziduurilor.
Astfel, dintre mai multe ajustri (n regresii cu un singur predictor, liniare
sau nu), se va prefera aceea n care reziduurile sunt aleator mprtiate n jurul lui
zero, fr a comporta o tendin.
n acelai sens, se poate face i comparaia curbelor ajustate, n raport cu
norul statistic. Pentru eliminarea observaiilor aberante, se poate folosi, de
exemplu, testul fundamentat pe reziduurile studentizate i pe statistica (12.4.1)
sau (12.4.2). Un reziduu prea mare poate indica o valoare aberant, dar o valoare
aberant nu are neaprat reziduul mare. Un alt criteriu care s desemneze valorile
aberante ar fi cel bazat pe intervalul de ncredere (12.4.4). Reziduul pentru care
intervalul nu conine valoarea zero indic o valoare aberant.
Influena observaiilor
Am vzut cum poate fi eliminat o observaie aberant. S vedem acum
care ar fi influena unei astfel de observaii, n cazul n care ea ar rmne n
model.
Definiia 12.4.3. Dac notm cu y i , valoarea ajustat(prezis) pentru y i
(definit n formula (2.1.10), care se obine atunci cnd este omis observaia a
i-a, vom numi reziduu prezis, valoarea y i y i .
Conform cu [29], se poate arta c
y i y i
ei
,
1 hi
aadar observaiile pentru care hi e mare i/sau reziduurile sunt mari (observaii
aberante), duc la previziuni suspecte, cci y i y i va fi mult diferit de zero. Ca
o msur a puterii de prezicere a modelului, se cunoate statistica
n
e
PRESS i .
i 1 1 hi
(12.4.9)
Di
a a x x a a
i
ps 2
y y i
h
1
ei2 i
p 1 hi
ps 2
. (12.4.10)
r X 1 , X 2 ,..., X p , Y sup r ai X i , Y ,
ai
i 1
(12.4.11)
(12.4.12)
273
(12.4.13)
Altfel spus, metoda celor mai mici ptrate determin acea combinaie liniar
ntre variabilele exogene, pentru care corelaia cu variabila endogen este
maximal. n plus, se poate demonstra c
rx1 , x 2 ,..., x p , y
y y
,
(12.4.14)
y y
r x1 , x 2 ,..., x p , y
2
y y
y y
y y
y y
2
2
(12.4.15)
r 2 n p
F
1 r 2 p 1
(12.4.16)
ryx. z
(12.4.17)
1
a x x a .
2
ps
S R2
,
S T2
(12.4.18)
unde
n
2
T
(12.4.19)
n
2
S R2 y i y i , sum de ptrate rezidual (indus de reziduuri),
i 1
R2 1
y i
i 1
n
y y y y
S2 S2
T 2 R
2
ST
y y
(12.4.20)
i 1
y
i 1
y
2
i 1
2
y i y i y
(12.4.21)
i 1
sau altfel,
yy
y y
y y
(12.4.22)
sau nc,
2
276
(12.4.23)
R 1
n 1
1 R2 .
n p
(12.4.24)
arta o bun ajustare, R fiind un criteriu bun pentru modele cu un numr diferit
de parametri.
Alte statistici care msoar numeric calitatea ajustrii (pe lng R 2 i
2
(12.4.25)
Apar aadar, dou tipuri de erori n estimarea previziunii. Una se datoreaz noii
erori 0 , cu care valoarea y 0 intr n model, iar alta se datoreaz erorii cu care sa estimat . Sigur, n cazul n care dorim s estimm media
E Y X x 0 f x0 x 0 , atunci eroarea este mai mic i se reduce la eroarea
indus de . Folosim notaia
y 0 x 0 a ,
(12.4.26)
278
1
P y 0 st
1 x 0 x x x 0 y 0 y 0 st
1 x0 x x x0 1 .
n p ,1
n p ,1
2
2
(12.4.27)
1
1
P y 0 st
x 0 x x x0 f x 0 y 0 st
x 0 x x x0 1 .
n p ,1
n p ,1
2
2
(12.4.28)
n ambele intervale, s, x, i t au semnificaia precizat deja n acest
capitol. Se observ c intervalul pentru previziune este mai larg, datorit erorii
suplimentare care intervine prin 0 . n cazul modelului liniar cu termen
constant, intervalele sunt aceleai, difer doar forma lui x0 i x, care vor conine
i un 1, respectiv o coloan de 1 (a se vedea [29], [30]). n cazul regresiei liniare
simple, cnd funcia ajustat i intervalele pot fi vizualizate grafic, avem
urmtoarea situaie:
y
y=ax+b
medie
previziune
x
Figura 12.4.1
280
Capitolul 13
Statistic Bayesian i noiuni de teoria
credibilitii
281
(13.1.1)
Def
UQ(B) UQ(EB) = Q , B dU
(13.1.2)
P(X = ) =
S(1-)t-Sd = (S + 1,t S + 1)
282
(13.1.3)
unde Z2t iar S = (1,)este definit n Exemplul 13.1.1. Funcia este funcia
a lui Euler , (m+1,n+1) =
m 1 n 1
m!n!
=
. Rezult c P(X = ) =
( m 1) (n 1)
( m n 1)!
S!(t S ))!
.
(t 1)!
P(X = x) =
(13.1.4)
q(, x )u ()
(13.1.7)
q(, x )u () d()
Notaii standard. O notaie mai sugestiv pentru q() este cea folosit n
statistic: fX = . Deci modelul este c, dac parametrul ar lua valoarea ,
283
f , X , x
(13.1.10)
f X x
Atunci
-
fX (x) =
f X = x() =
q (,x)u()d()
= (S+1,t-S+1) =
S!(t S )!
(t 1)!
(t 1)! S
(1-)t-S
S!(t S )!
284
... ...
2
n
. Atunci Q ar fi devenit o matrice
are repartiia 1
p
p
...
...
2
n
1
stocastic cu n linii i 2t coloane: Q(j,x) = jM(x)(1-j)t-M(x) . Cu notaiile din
Propoziia 13.1.3 am avea E =1,,n 0,1, = Card(E) , u(j) = pj, =
(13.1.11)
i 1
densitate . Dac nu are nici o idee despre p- lucru destul de neverosimil - va lua
= 1(0,1)
Deci
E = N0,1, = (N,) ,
= CardN,
= (n,p), f(n,p) = n(p) , (repartiia apriori)
fX =(n,p) (x) = nC(x , )pS(1-p)tn-S cu C(x , ) =C(x,n) = C nx1 C nx2 ...C nxt
fX (x) =
q (,x)u()d() =
n x*
C C ... C nx t
(dac U(0,1) atunci fX (x) = n
) iar din (13.1.13)
( nt 1 ) C ntS
n x*
x1
n
285
x2
n
fX = x (n,p) =
( p) n C ( x, n) p tM ( x ) (1 p ) t ( n M ( x ))
C ( x, k ) p
tM ( x )
(1 p)
t ( k M ( x ))
(13.1.14)
( p)dp
k x*
n C ( x, n) p S (1 p ) tnS
C x1 C x2 ...Ckxt
k k k
( kt 1)CntS
k x*
Observm ceva de bun sim, pentru care nu avem nevoie de mult tiin
de carte: dac n x*, atunci din (13.1.17), fX = x (n,p) = 0. Nu o s considerm
posibil ca N s ia valori mai mici dect x*!
Definiia 13.1.6. Dac :E este o funcie msurabil, variabila aleatoare
E(()X) se numete n limbaj bayesian estimatorul Bayesian cu cele mai mici
ptrate al lui ().
Propoziia 13.1.3 are drept corolar o formul de calcul pentru E(()X), evident
datorit formulei de transport:
() f X | ( x )u ()d()
f X | ( x )u ()d()
(13.1.15)
(13.1.16)
Aceasta este cea mai bun aproximare pe care o putem face pentru Xr n
sensul celor mai mici ptrate. n cele ce urmeaz nu vom modifica notaia: ()
va avea mereu aceeai semnificaie.
Sensul precis este c dintre toate funciile () cu care am dori s
aproximm pe Xr n spaiul L2, cea pentru care distana este minim este ().
Ceea ce ne intereseaz n actuariat este mrimea
E(()X) notat cu g(X) .
(13.1.17)
Este mai puin evident c, n anumite ipoteze, g(X) este i cea mai bun
aproximare pe care o putem face asupra premiului brut de asigurare viitor (adic
286
(13.1.18)
E(f(Y)X) = E(E(f(Y))X)
(13.1.19)
n consecin
287
m
de unde obinem
mn
g(X) =
n( S 1)
nt 2
(13.1.20)
(13.1.21)
nt
. q.e.d.
nt 2
uniform! ) . n concluzie
288
x* 1
2
*
x x*
g(X) =
*2
x 1
2
daca
x* 1
daca
x* 1 x * .
daca
x* 1
(13.1.23)
(13.2.2)
289
(13.2.3)
(13.2.4)
adic
(13.2.5)
(13.2.6)
De data aceasta problema este simpl. Este vorba de a gsi minimul unei
forme ptratice convexe. Fiind strict convex, are optim unic.
Derivm h dup c0 i punem condiia ca derivata s se anuleze. Gsim
-2E(Xt+1 c0 c1X1 c2X2 - - ctXt) = 0
(13.2.7)
(am derivat sub integral, deoarece putem aplica criteriul lui Lebesgue de
dominare: variabilele noastre sunt n L2. Rezult
c0 = E(Xt+1 c1X1 c2X2 - - ctXt).
(13.2.8)
(13.2.9)
(13.2.10)
Gradientul ei este
290
(13.2.11)
(13.2.12)
(1.2.13)
E(YrYj) = E(YrYt+1)
j 1
(13.2.14)
(13.2.15)
concluzie
E(YjYr) = a + j,rs2 j,r 1,,t
(13.2.15)
(a + j,rs2) = a
(13.2.16)
j 1
care se rezolv foarte simplu. Adunnd toate ecuaiile rezult (ta + s2)(c1 + + ct)
= ta de unde suma coeficienilor S = c1 + + ct =
ta
. Cum sistemul se mai
ta s 2
a
.
ta s 2
(13.2.17)
291
at
z=
ta s
(13.2.18)
g(X) = E(()X) =
() f
f
( X )u ()d()
= E(Xt+1X)
(13.2.19)
X ( X )u ()d()
at
at s
(13.2.20)
Tot demersul de pn acum ar fi inutil dac nu ar exista cazuri ntlnite n
statistic care estimatorul Buhlman h(X) ar coincide cu g(X) . Dm acum o
generalizare a exemplului 1, unde cele dou chiar coincid.
Definiia 13.2.4. Densitatea fX= se numete familie exponenial dac este de
forma
fX = (x) = p(x)e-x/q()
(13.2.21)
unde se subnelege c spaiul parametrilor E = [0,). Se presupune c funcia
q() este derivabil.
n acest caz densitatea vectorului X este
fX = (x) =
p ( x1 ) p( x2 )... p( xt ) S
e unde S = x1 + + xt
q t ()
(13.2.22)
q() e
unde , [0,) iar C(,) este o constant de normare.
C (, )
(13.2.23)
292
= x
()=
f X ( x )u ()
= A(,,x)e-(+S) / qt+()
(13.2.24)
f X y ( x )u ( y )d( y )
M0 =
(13.2.25)
t
1
s 2 =
k
2
j
, s 2j =
( X j ,r M j ) 2
r 1
t 1
j 1
X
=
2
j ,r
tM 2j
r 1
t 1
(13.2.26)
(M
a =
M 0 )2
j 1
k 1
s 2
t
(13.2.27)
Var ( M j )
1
s2
Var ( s12 ) , Var(Mj) = a +
, Var(M0) =
k
t
k
(13.2.28)
at
a t s
X
EX
=
ar putea fi adevrat,
X Y EX EY
294
Bibliografie
296
ANEXE
297
Anexa 1
Valorile funciei Laplace - Gauss
u
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7290
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9779
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
Anexa 2
Cuantilele repartiiei Student
grade\prob.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
80
120
n>120
0.75
0.90
0.95
0.975
0.99
0.995
1.000
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.681
0.681
0.679
0.677
0.674
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.306
1.303
1.291
1.289
1.282
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.690
1.684
1.671
1.658
1.645
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.030
2.021
2.000
1.980
1.960
31.821
6.695
4.541
3.474
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.438
2.423
2.390
2.358
2.326
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.724
2.704
2.660
2.617
2.576
Anexa 3
Cuantilele repartiiei 2
grade\prob. 0.005
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
60
0.000
0.010
0.072
0.207
0.412
0.676
0.989
1.34
1.73
2.16
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
8.03
8.64
9.26
9.89
10.5
11.2
11.8
12.5
13.1
13.8
17.2
20.7
35.5
0.01
0.025
0.05
0.1
0.9
0.95
0.975
0.99
0.000
0.020
0.115
0.297
0.554
0.872
1.24
1.65
2.09
2.56
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
8.90
9.54
10.2
10.9
11.5
12.2
12.9
13.6
14.3
15.0
18.5
22.2
37.5
0.001
0.051
0.216
0.484
0.831
1.24
1.69
2.18
2.70
3.25
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.59
10.3
11.0
11.7
12.4
13.1
13.8
14.6
15.3
16.0
16.8
20.6
24.4
40.5
0.004
0.103
0.352
0.711
1.15
1.64
2.17
2.73
3.33
3.94
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.1
10.9
11.6
12.3
13.1
13.8
14.6
15.4
16.2
16.9
17.7
18.5
22.5
26.5
43.2
0.016
0.211
0.584
1.06
1.61
2.20
2.83
3.49
4.17
4.87
5.58
6.30
7.04
7.79
8.55
9.31
10.08
10.86
11.65
12.44
13.24
14.04
14.85
15.66
16.47
17.29
18.11
18.94
19.77
20.60
24.8
29.1
46.5
2.71
4.60
6.25
7.78
9.24
10.64
12.02
13.36
14.68
16.99
17.27
18.55
19.81
21.06
22.31
23.54
24.77
25.99
27.20
28.41
29.61
30.81
32.01
33.20
34.38
35.56
36.74
37.92
39.09
40.26
46.1
51.8
74.4
3.84
5.99
7.81
9.48
11.07
12.59
14.07
15.51
16.92
18.31
19.67
21.03
22.36
23.68
25.00
26.30
27.59
28.87
30.14
31.41
32.67
33.92
35.17
36.41
37.65
38.88
40.11
41.34
42.56
43.77
49.8
55.8
79.1
5.02
7.38
9.35
11.1
12.8
14.4
16.0
17.5
19.0
20.5
21.9
23.3
24.7
26.1
27.6
28.8
30.2
31.3
32.9
34.2
35.5
36.8
38.1
39.4
40.6
41.9
43.2
44.5
45.7
47.0
53.2
59.3
83.3
6.63
9.21
11.34
13.28
15.09
16.81
18.47
20.09
21.66
23.21
24.72
26.22
27.69
29.14
30.58
32.00
33.41
34.80
36.19
37.57
38.93
40.29
41.64
42.98
44.31
45.64
46.96
48.28
49.59
50.89
57.3
63.7
88.4
Anexa 4
Cuantilele repartiiei Fisher - Snedecor
Gr2\Gr1
1
10
11
12
13
14
Prob.
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
161.4
648
4052
18.51
38.5
98.49
10.13
17.4
34.12
17.71
12.2
21.20
6.61
10.0
16.26
5.99
8.07
12.25
5.59
8.07
12.25
5.32
7.57
11.26
5.12
7.21
10.56
4.96
6.94
10.04
4.84
6.72
9.65
4.75
6.55
9.33
4.67
6.41
9.07
4.60
6.30
8.86
199.5
800
4999
19.00
39.0
99.00
9.55
16.0
30.84
6.94
10.6
18.00
5.79
8.43
13.27
5.14
7.26
10.91
4.74
9.54
9.55
4.46
6.06
8.65
4.26
5.71
8.02
4.10
5.46
7.56
3.98
5.26
7.20
3.88
5.10
6.93
3.81
4.97
6.70
3.74
4.86
6.51
216
864
5403
19.16
39.2
99.17
9.28
15.1
29.46
6.59
9.98
16.69
5.41
7.76
12.06
4.76
6.60
9.78
4.35
5.89
8.45
4.07
5.42
7.59
3.86
5.08
6.99
3.71
4.83
6.55
3.59
4.63
6.22
3.49
4.47
5.95
3.41
4.35
5.74
3.34
4.24
5.56
225
900
5625
19.25
39.2
99.25
9.12
15.4
28.71
6.39
9.60
15.98
5.19
7.39
11.39
4.53
6.23
9.15
4.12
5.52
7.85
3.84
5.05
1.01
3.63
4.72
6.42
3.48
4.47
5.99
3.36
4.28
5.67
3.26
4.12
5.41
3.18
4.00
5.221
3.11
3.89
5.04
230
922
5764
19.30
39.3
99.30
9.01
14.9
28.24
6.26
9.36
15.52
5.05
7.15
10.97
4.39
5.99
8.75
3.97
5.29
7.45
3.69
4.82
6.63
3.48
4.48
6.06
3.33
4.24
5.64
3.20
4.04
5.32
3.11
3.89
5.06
3.03
3.77
4.86
2.96
3.66
4.70
234
937
5859
19.33
39.3
99.33
8.94
14.7
27.91
6.16
9.20
15.21
4.95
6.98
10.67
4.28
5.82
8.47
3.87
5.12
7.19
3.58
4.65
6.37
3.37
4.32
5.80
3.22
4.07
5.39
3.09
3.88
5.07
3.00
3.73
4.82
2.92
3.60
4.62
2.85
3.50
4.46
237
948
5930
19.35
39.4
99.35
8.89
14.6
27.7
6.09
9.07
15.0
4.88
6.85
10.5
4.21
5.70
8.26
3.79
4.99
6.99
3.50
4.53
6.18
3.29
4.20
5.61
3.14
3.95
5.20
3.01
3.76
4.89
2.91
3.61
4.54
2.83
3.48
4.44
2.76
3.38
4.28
239
957
5981
19.37
39.4
99.36
8.85
14.5
27.49
6.04
8.98
14.80
4.82
6.76
8.10
4.15
5.60
8.10
3.73
4.90
6.84
3.44
4.43
6.03
3.23
4.10
5.47
3.07
3.85
5.06
2.95
3.66
4.74
2.85
3.51
4.50
2.77
3.39
4.30
2.70
3.29
4.14
15
16
17
18
19
20
21
22
23
24
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
4.54
6.20
8.68
4.49
6.12
8.53
4.45
6.04
8.40
4.41
5.98
8.29
4.38
5.92
8.18
4.35
5.87
8.10
4.32
5.83
8.02
4.30
5.79
7.95
4.28
5.75
7.88
4.26
5.72
7.82
3.68
4.76
6.36
3.63
4.69
6.23
3.59
4.62
6.11
3.55
4.56
7.01
3.52
4.51
5.93
3.49
4.46
5.85
3.47
4.42
5.78
3.44
4.38
5.72
3.42
4.35
5.66
3.40
4.32
5.61
3.29
4.15
5.42
3.24
4.08
5.29
3.20
4.01
5.18
3.16
3.95
5.09
3.13
3.90
5.01
3.10
3.86
4.94
3.07
3.82
4.87
3.05
3.78
4.82
3.03
3.75
4.76
3.01
3.72
4.72
3.06
3.80
4.89
3.01
3.73
4.77
2.96
3.66
4.67
2.93
3.61
4.58
2.90
3.56
4.50
2.87
3.51
4.43
2.84
3.48
4.37
2.82
3.44
4.31
2.80
3.41
4.26
2.78
3.38
4.22
2.90
3.58
4.56
2.85
3.50
4.44
2.81
3.44
4.34
2.77
3.38
4.25
2.74
3.33
4.17
2.71
3.29
4.10
2.68
3.25
4.04
2.66
3.22
3.99
2.64
3.18
3.94
2.62
3.15
3.90
2.79
3.41
4.32
2.74
3.34
4.20
2.70
3.28
4.10
2.66
3.22
4.01
2.63
3.17
3.94
2.60
3.13
3.87
2.57
3.09
3.84
2.55
3.05
3.76
2.53
3.02
3.71
2.51
2.99
3.67
2.71
3.29
4.14
2.66
3.22
4.03
2.61
3.16
3.93
2.58
3.10
3.84
2.54
3.05
3.77
2.51
3.01
3.70
2.49
2.97
3.64
2.46
2.93
3.59
2.44
2.90
3.54
2.42
2.87
3.50
2.64
3.20
4.00
2.59
3.12
3.89
2.55
3.06
3.79
2.51
3.01
3.71
2.48
2.96
3.63
2.45
2.91
3.56
2.42
2.87
3.51
2.40
2.84
3.45
2.37
2.81
3.41
2.36
2.78
3.36
Anexa 4 (continuare)
Gr2\Gr1 Prob.
2
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
10
11
12
13
14
15
16
19.4
39.4
99.4
8.81
14.5
27.3
6.00
8.90
14.7
19.4
39.4
99.4
8.79
14.4
27.1
5.96
8.84
14.5
19.4
39.4
99.4
8.76
14.4
27.1
5.94
8.79
14.4
19.4
39.4
99.4
8.74
14.3
27.1
5.91
8.75
14.4
19.4
39.4
99.4
8.73
14.3
27.0
5.89
8.72
14.3
19.4
39.4
99.4
8.71
14.3
26.9
5.87
8.69
14.2
19.4
39.4
99.4
8.70
14.3
26.9
5.86
8.66
14.2
19.4
39.4
99.4
8.69
14.2
26.8
5.84
8.64
14.2
10
11
12
13
14
15
16
17
18
19
20
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
4.77
6.68
10.2
4.10
5.52
7.98
3.68
4.82
6.72
3.39
4.36
5.91
3.18
4.03
5.35
3.02
3.78
4.94
2.90
3.59
4.63
2.80
3.44
4.39
2.71
3.31
4.19
2.65
3.21
4.03
2.59
3.12
3.89
2.54
3.05
3.78
2.49
2.98
3.68
2.46
2.93
3.60
2.42
2.88
3.52
2.39
2.84
3.46
4.74
6.62
10.1
4.06
5.46
7.89
3.64
4.76
6.62
3.35
4.30
5.81
3.14
3.96
5.26
2.98
3.72
4.85
2.85
3.53
4.54
2.75
3.37
4.30
2.67
3.25
4.10
2.60
3.15
3.94
2.54
3.06
3.80
2.49
2.99
3.69
2.45
2.92
3.59
2.41
2.87
3.51
2.38
2.82
3.43
2.35
2.77
3.37
4.70
6.57
9.96
4.03
5.41
7.79
3.60
4.71
6.54
3.31
4.24
5.73
3.10
3.91
5.18
2.94
3.66
4.77
2.82
3.47
4.46
2.72
3.32
4.22
2.63
3.20
4.02
2.57
3.09
3.86
2.51
3.01
3.73
2.46
2.93
3.62
2.41
2.87
3.52
2.37
2.81
3.43
2.34
2.76
3.36
2.31
2.72
3.29
4.68
6.52
9.89
4.00
5.37
7.72
3.57
4.67
6.47
3.28
4.20
5.67
3.07
3.87
5.11
2.91
3.62
4.71
2.79
3.43
4.40
2.69
3.28
4.16
2.60
3.15
3.96
2.53
3.05
3.80
2.48
2.96
3.67
2.42
2.89
3.55
2.38
2.82
3.46
2.34
2.77
3.37
2.31
2.72
3.30
2.28
2.68
3.23
4.66
6.49
9.82
3.98
5.33
7.66
3.55
4.63
6.41
3.26
4.16
5.61
3.05
3.83
5.05
2.89
3.58
4.65
2.76
3.39
4.34
2.66
3.24
4.10
2.58
3.12
3.91
2.51
3.01
3.75
2.45
2.92
3.61
2.40
2.85
3.50
2.35
2.79
3.40
2.31
2.73
3.32
2.28
2.68
3.24
2.25
2.64
3.18
4.64
6.46
9.77
3.96
5.30
7.60
3.53
4.60
6.36
3.24
4.13
5.56
3.03
3.80
5.00
2.86
3.55
4.60
2.74
3.36
4.29
2.64
3.21
4.05
2.55
3.08
3.86
2.48
2.98
3.70
2.42
2.89
3.56
2.37
2.82
3.45
2.33
2.75
3.35
2.29
2.70
3.27
2.26
2.65
3.19
2.22
2.60
3.13
4.62
6.43
9.72
3.94
5.27
7.56
3.51
4.57
6.31
3.22
4.10
5.52
3.01
3.77
4.96
2.85
3.52
4.56
2.72
3.33
4.25
2.62
3.18
4.01
2.53
3.05
3.82
2.46
2.95
3.66
2.40
2.86
3.52
2.35
2.79
3.41
2.29
2.72
3.31
2.27
2.67
3.23
2.23
2.62
3.15
2.20
2.57
3.09
4.60
6.41
9.68
3.92
5.25
7.52
3.49
4.54
6.27
3.20
4.08
5.48
2.99
3.74
4.90
2.83
3.50
4.52
2.70
3.30
4.21
2.60
3.15
3.97
2.51
3.03
3.78
2.44
2.92
3.62
2.38
2.84
3.49
2.33
2.76
3.37
2.27
2.70
3.27
2.25
2.64
3.19
2.21
2.59
3.12
2.19
2.55
3.05
21
22
23
24
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
0.95
0.975
0.99
2.37
2.80
3.40
2.34
2.76
3.35
2.32
2.73
3.30
2.30
2.70
3.26
2.32
2.73
3.31
2.30
2.70
3.26
2.27
2.67
3.21
2.25
2.64
3.17
2.28
2.68
3.24
2.26
2.65
3.18
2.23
2.62
3.14
2.21
2.69
3.09
2.25
2.64
3.17
2.23
2.60
3.12
2.20
2.57
3.07
2.18
2.54
3.03
2.22
2.60
3.12
2.20
2.56
3.07
2.18
2.53
3.02
2.15
2.50
2.98
2.20
2.56
3.07
2.17
2.53
.302
2.15
2.50
2.97
2.13
2.47
2.93
2.18
2.53
3.03
2.15
2.50
2.98
2.13
2.47
2.93
2.11
2.44
2.89
2.16
2.51
2.99
2.13
2.47
2.94
2.11
2.44
2.89
2.09
2.41
2.85