Documente Academic
Documente Profesional
Documente Cultură
Probabilit
a
ti
1
1.1
Cmp de probabilitate
n teoria probabilit
atilor consider
am un experiment cu un rezultat dependent
de sans
a, care e numit experiment aleator. Se presupune c
a toate rezultatele
posibile ale unui experiment aleator sunt cunoscute si ele sunt elemente ale unei
multimi fundamentale denumit
a ca spatiul probelor. Fiecare rezultat posibil este
numit proba si un eveniment este o submultime a spatiului probelor.
Nota
tii. Fie multime.
P ( ) := fAjA
g:
Fie A
:
A = CA := fa 2 ja 2
= Ag :
Deni
tia 1.1. Fie
multime. K P ( ) se numeste corp borelian sau
-algebra pe dac
a si numai dac
a
1) K 6= ;
2) A 2 K =) A 2 K
[
3) A1 ; A2 ; :::; An ; ::: 2 K =)
An 2 K.
n
i=1
arabil
a (i.e. nit
a sau num
arabil
a), Ai 2 K; 8i 2 I =)
\ d) I cel mult num
Ai 2 K
i2I
e) A; B 2 K =) AnB 2 K.
Demonstra
tie. a) K 6= ; =) 9A 2 K =) A 2 K =)
A [ ::: 2 K.
b) ; = 2 K.
n
n
[
[
c)
Ai =
Ai [ ; [ ; [ ::: 2 K.
i=1
i=1
=A[A[A[
d)
i2I
Ai =
i2I
Ai 2 K.
e) AnB = A \ B 2 K.
Consider
am un corp borelian pe K pe un spatiu de elemente a; b; c; ::: cu
fag ; fbg ; fcg ; ::: 2 K si cu submultimile A; B; C; ::: 2 K. Unele dintre corespondentele dintre teoria multimilor si teoria probabilit
atilor sunt date n urm
atorul
tabel:
Teoria multimilor Teoria probabilit
atilor
Spatiu,
Spatiul probelor, eveniment sigur
Multimea vid
a, ; Eveniment imposibil
Elemente a; b; :::
Probe a; b; ::: (sau evenimente simple)
Multimi A; B; :::
Evenimente A; B; :::
A
Evenimentul A apare
A
Evenimentul A nu apare
A[B
Cel putin unul dintre A si B apare
A\B
Ambele A si B apar
A B
A este un subeveniment al lui B (i.e. aparitia lui A implic
a aparitia lui B)
A\B =;
A si B sunt mutual exclusive (i.e. ele nu pot ap
area simultan)
; este considerat
a un eveniment imposibil deoarece niciun rezultat posibil
nu este element al ei. Prin "aparitia unui eveniment" ntelegem c
a rezultatul
observat este un element al acelei multimi. Spunem c
a mai multe evenimente
sunt mutual exclusive dac
a multimile corespunz
atoare sunt disjuncte dou
a cte
dou
a.
Exemplul 1.1. Consider
am un experiment de calculare a num
arului de
masini care vireaz
a la stnga la o intersectie dintr-un grup de 100 de masini.
Rezultatele posibile (numerele posibile de masini care vireaz
a la stnga) sunt
0; 1; 2; :::; 100: Atunci, spatiul probelor este = f0; 1; 2; :::; 100g si K = P ( ) :
A = f0; 1; 2; :::; 50g este evenimentul "cel mult 50 de masini vireaz
a la stnga".
B = f40; 41; :::; 60g este evenimentul "ntre 40 si 60 (inclusiv) de masini vireaz
a
la stnga". A [ B este evenimentul "cel mult 60 de masini vireaz
a la stnga".
A \ B este evenimentul "ntre 40 si 50 (inclusiv) de masini vireaz
a la stnga".
Fie C = f81; 82; :::; 100g. Evenimentele A si C sunt mutual exclusive.
Deni
tia 1.2. Fie ( ; K) spatiu m
asurabil. Functia P : K ! R se numeste
probabilitate pe ( ; K) dac
a si numai dac
a are urm
atoarele propriet
ati (numite
axiomele probabilit
atii):
Axioma 1: P (A) 0; 8A 2 K (nenegativ
a).
Axioma 2: P ( ) = 1 (normat
a).
Axioma 3: pentru orice colectie num
arabil
a de evenimente mutual exclusive
(multimi
disjuncte
dou
a
cte
dou
a
)
A
;
A
;
:::
2 K,
1
2
0
1
[
X
P @ Aj A =
P (Aj ) (num
arabil aditiv
a).
j
1.2
Opera
tii cu evenimente
si formule de calcul pentru
probabilit
a
tile acestora
Propriet
a
ti. Dac
a ( ; K; P ) este cmp de probabilitate, atunci:
1) P (;) = 0:
2) pentru orice colectie nit
a de evenimente mutual exclusive (multimi disjuncte0dou
a cte
dou
a
)
A
;
A
;
:::;
An 2 K,
1
2
1
n
n
[
X
Aj A =
P (Aj ) (P este aditiv
a).
P@
j=1
j=1
3) A C; A; C 2 K =) P (A)
4) A; B 2 K =)
P (C) :
P (A [ B) = P (A) + P (B)
P (A \ B) :
P@
n
[
j=1
Aj A =
n
X
P (Aj )
j=1
1 i<j n
P (Ai \ Aj )+
n 1
1 i<j<k n
n particular, A; B; C 2 K =)
P (A [ B [ C) = P (A) + P (B) + P (C)
P (A \ B \ C):
6) A 2 K =) P A = 1 P (A) :
P (A \ B)
P (Ai \ Aj \ Ak ) :::+( 1)
P (A \ C)
P@
n
\
j=1
P (B \ C) +
A3
Demonstra
tie. 1) P ( ) = P ( [ ; [ ; [ :::) = P ( ) + P (;) + P (;) +
A2
::: =) 10= 1 + P1(;) + P
0(;) + ::: =) P (;)1+ P (;) + ::: = 0 =) P (;) = 0:
n
n
n
[
[
X
A3
2) P @
Aj A = P @
Aj [ ; [ ; [ :::A =
P (Aj ) + P (;) + P (;) +
j=1
1)
::: =
n
X
j=1
j=1
P (Aj ) + 0 + 0 + ::: =
j=1
n
X
P (Aj ) :
j=1
2)
P (A) :
2)
2)
j=1
j=1
j=1
Aj A :
n
X
P (Aj )
j=1
1 i<j n
P (An+1 )
n+1
X
P (Aj )
j=1
n
X
j=1
j=1
i<j<k n
P (Ai \ Aj )+
1 i<j n
1 i<j<k n
1 i<j n
P (Ai \ Aj )
P (Ai \ Aj \ An+1 )
P (Aj )
P@
n 1
P (Ai \ Aj \ Ak ) :::+( 1)
1 i<j n
j=1
n 1
P (Ai \ Aj \ Ak ) :::+( 1)
n 1
P (Aj )
11
ip. ind.
(Aj \ An+1 )A =
P (Aj \ An+1 )
j=1
n+1
X
P@
n
[
1 i<j n
1 i<j<k n
n+1
X
P (Ai \ Aj )+
1 i<j n+1
n
X
j=1
P (Aj \ An+1 )+
0
n
::: + ( 1) P @
P (Ai \ Aj )+
1 i<j<k n
n+1
\
j=1
1 i<j<k n+1
2)
P@
n
\
j=1
P@
n
\
j=1
Aj A+
1
Aj A
1
P (Ai \ Aj \ Ak )+
Aj A =
n+1
\
n
P (Ai \ Aj \ Ak ) :::+( 1) P @
Evenimente independente
Deni
tia 1.3. Fie ( ; K; P ) cmp de probabilitate. Dou
a evenimente A; B 2 K
se numesc independente dac
a si numai dac
a
P (A \ B) = P (A) P (B) :
Observa
tie. Dac
a A si B sunt evenimente independente, atunci:
P A \ B = P (A)P B ;
4
j=1
6) 1 = P ( ) = P A [ A = P (A) + P A :
Exemplul 1.2. n exemplul 1.1, presupunem c
a probabilit
atile P (A) ; P (B)
si P (C) sunt cunoscute. Vrem s
a calcul
am P (A [ B) (probabilitatea ca cel mult
60 de masini s
a vireze la stnga) si P (A [ C) (probabilitatea ca cel mult 50 de
masini sau ntre 80 si 100 de masini s
a vireze la stnga). Deoarece A si C sunt
mutual exclusive avem
P (A [ C) = P (A) + P (C) :
Dar
P (A [ B) = P (A) + P (B) P (A \ B) :
Informatia dat
a este insucient
a pentru a determina P (A [ B) si avem
nevoie de informatia aditional
a P (A \ B), care este probabilitatea ca ntre 40
si 50 de masini s
a vireze la stnga.
1.3
n
\
j=1
Aj A :
P A \ B = P A P (B) ;
P A\B =P A P B :
Demonstra
tie. P (A) = P (A \ B) [ A \ B = P (A \ B)+P A \ B =)
P A \ B = P (A) P (A \ B) = P (A) P (A) P (B) = P (A) (1 P (B)) =
P (A)P B :
Analog pentru celelalte relatii.
Exemplul 1.3. n lansarea unui satelit, probabilitatea unui insucces este q.
Care este probabilitatea ca dou
a lans
ari succesive s
a esueze?
Presupunnd c
a lans
arile satelitului sunt evenimente independente, r
aspunsul este q 2 :
Deni
tia 1.4. Fie ( ; K; P ) cmp de probabilitate. Evenimentele A1 ; A2 ; :::; An 2
K sunt independente dac
a si numai dac
a 8m = 2; 3; :::; n; k1 ; k2 ; :::; km 2 N a. .
1 k1 < k2 < ::: < km n;
P (Ak1 \ Ak2 \ ::: \ Akm ) = P (Ak1 ) P (Ak2 ) :::P (Akm ) :
n particular, A1 ; A2 ; A3 sunt independente dac
a si numai dac
a
P (Aj \ Ak ) = P (Aj ) P (Ak ) ; 8j < k; j; k = 1; 2; 3;
si
P (A1 \ A2 \ A3 ) = P (A1 ) P (A2 ) P (A3 ) :
Observa
tii. 1) Num
arul de egalit
ati din denitia independentei a n evenimente este 2n n 1:
2) Independenta dou
a cte dou
a nu conduce n general la independenta.
Contraexemplu. Fie 3 evenimente A1 ; A2 ; A3 denite de
A1 = B1 [ B2 ; A2 = B1 [ B3 ; A3 = B2 [ B3 ;
unde B1 ; B2 si B3 sunt mutual exclusive, ecare avnd probabilitatea 41 :
P (A1 ) = P (B1 [ B2 ) = P (B1 ) + P (B2 ) = 21 :
Analog P (A2 ) = P (A3 ) = 12 :
P (A1 \ A2 ) = P ((B1 [ B2 ) \ (B1 [ B3 )) = P (B1 [ (B2 \ B3 )) = P (B1 [ ;) =
P (B1 ) = 14 = 12 12 = P (A1 ) P (A2 ) :
Analog P (A1 \ A3 ) = P (A1 ) P (A3 ) ; P (A2 \ A3 ) = P (A2 ) P (A3 ) :
P (A1 \ A2 \ A3 ) = P ((B1 [ B2 ) \ (B1 [ B3 ) \ (B2 [ B3 )) = P ((B1 [ (B2 \ B3 )) \ (B2 [ B3 )) =
P (B1 \ (B2 [ B3 )) = P ((B1 \ B2 ) [ (B1 \ B3 )) = P (; [ ;) = P (;) = 0:
P (A1 ) P (A2 ) P (A3 ) = 81 :
Deci P (A1 \ A2 \ A3 ) 6= P (A1 ) P (A2 ) P (A3 ) :
Evenimentele A1 ; A2 ; A3 sunt independente dou
a cte dou
a, dar nu sunt
independente.
3) Dac
a evenimentele A1 ; A2 ; :::; An sunt independente, atunci nlocuind oricare din Akj cu complementara Akj n ambii membri din relatiile din denitia
independentei, relatiile obtinute r
amn valabile.
Exemplul 1.4. Un sistem compus din 5 componente merge exact atunci
cnd ecare component
a e bun
a. Fie Si ; i = 1; :::; 5; evenimentul "componenta
i e bun
a" si presupunem P (Si ) = pi . Care e probabilitatea q ca sistemul s
a nu
mearg
a?
Presupunnd c
a cele 5 componente merg ntr-o manier
a independent
a, e p
probabilitatea de succes.
5
q=1
p=1
5
\
i=1
1.4
Si
=1
5
Y
P (Si ) = 1
i=1
5
Y
pi :
i=1
Probabilitatea condi
tionat
a
Deni
tia 1.5. Fie ( ; K; P ) cmp de probabilitate si A; B 2 K a. . P (B) 6= 0:
Probabilitatea conditionata de B a lui A este dat
a de
P (AjB) =
P (A \ B)
:
P (B)
Observa
tie. n ipotezele denitiei 1.5, A si B sunt independente ()
P (AjB) = P (A) :
Demonstra
tie. A si B sunt independente () P (A \ B) = P (A) P (B) ()
P (A\B)
=
P
(A)
() P (AjB) = P (A) :
P (B)
Propozi
tie. Fie ( ; K; P ) cmp de probabilitate si B 2 K a. . P (B) 6= 0:
Atunci functia PB : K ! R; PB (A) = P (AjB) este probabilitate pe( ; K) :
Demonstra
tie. Veric
am cele 3 axiome ale probabilit
atii:
1) PB (A) = P P(A\B)
0;
8A
2
K,
deoarece
P
(A
\
B)
0 si P (B) > 0:
(B)
\B)
P (B)
2) PB ( ) = P P( (B)
=P
(B) = 1:
3) A1 ; A2 ; ::: 2 K colectie num
arabil
a de evenimente mutual exclusive =)
2 [:::)\B)
A1 \B; A2 \B; ::: 2 K mutual exclusive =) PB (A1 [ A2 [ :::) = P ((A1 [A
=
P (B)
P ((A1 \B)[(A2 \B)[:::)
P (B)
((A2 \B))+:::
1 \B)
2 \B)
= P (A1 \B)+P
= P (A
+ P (A
+ ::: =
P (B)
P (B)
P (B)
PB (A1 ) + PB (A2 ) + ::::
Exemplul 1.5. Reconsider
am exemplul 1.4 presupunnd p1 > 0. Care este
probabilitatea conditionat
a ca primele dou
a componente s
a e bune dat ind
c
a:
a) prima component
a este bun
a;
b) cel putin una dintre cele dou
a este bun
a?
Evenimentul S1 \ S2 nseamn
a c
a ambele componente sunt bune, iar S1 [ S2
c
a cel putin una e bun
a. Datorit
a independentei lui S1 si S2 ; avem:
)P (S2 )
1 \S2 \S1 )
1 \S2 )
a) P (S1 \ S2 jS1 ) = P (SP
= P (S
= P (SP1(S
= P (S2 ) = p2 .
(S1 )
P (S1 )
1)
(S1 \S2 )
P (S1 )P (S2 )
1 [S2 ))
b) P (S1 \ S2 jS1 [ S2 ) = P (S1P\S(S21\(S
=P
[S2 )
P (S1 [S2 ) = P (S1 )+P (S2 ) P (S1 \S2 ) =
p1 p2
p1 +p2 p1 p2 :
Exemplul 1.6. Determinati probabilitatea de a trage, f
ar
a nlocuire, 2 asi
succesiv dintr-un pachet de c
arti de joc f
ar
a jokeri.
Fie A1 evenimentul "prima carte tras
a este un as" si similar A2 . Se cere
P (A1 \ A2 ).
4
(sunt 4 asi n cele 52 de c
arti din pachet).
P (A1 ) = 52
3
P (A2 jA1 ) = 51
(dac
a prima carte tras
a este un as, au r
amas 51 de c
arti
dintre care 3 sunt asi).
4
3
1 \A2 )
P (A2 jA1 ) = P (A
=) P (A1 \ A2 ) = P (A1 ) P (A2 jA1 ) = 52
P (A1 )
51 =
1
1
1
13 17 = 221 :
Propozi
tie. Fie ( ; K; P ) cmp de probabilitate si A1 ; A2 ; :::; An 2 K a. .
P (A1 \ A2 \ ::: \ An 1 ) > 0. Atunci
P (A1 \ A2 \ ::: \ An ) = P (A1 ) P (A2 jA1 )P (A3 jA1 \ A2 ) :::P (An jA1 \ A2 \ ::: \ An
Demonstra
tie. A1 A1 \ A2 ::: A1 \ A2 \ ::: \ An 1 =) P (A1 )
P (A1 \ A2 ) ::: P (A1 \ A2 \ ::: \ An 1 ) > 0 =) probabilit
atile
conditionate din membrul drept au sens.
1 \A2 )
P (A1 ) P (A2 jA1 )P (A3 jA1 \ A2 ) :::P (An jA1 \ A2 \ ::: \ An 1 ) = P (A1 ) P (A
P (A1 )
1 \A2 \:::\An )
::: PP(A(A1 \A
= P (A1 \ A2 \ ::: \ An ) :
2 \:::\An 1 )
Deni
tia 1.6. Fie Bi
; 8i 2 I: (Bi )i2I se numeste partitie a lui
[
si numai dac
a (Bi )i2I sunt disjuncte dou
a cte dou
a si
Bi = :
dac
a
i2I
Teorema probabilit
a
tii totale. Fie ( ; K; P ) cmp de probabilitate si
(Bi )i2I
K partitie cel mult num
arabil
a a lui
a. . P (Bi ) > 0; 8i 2 I:
Atunci, 8A 2 K,
X
P (A) =
P (AjBi ) P (Bi ) :
i2I
Demonstra
tie. (Bi )i2I mutual exclusive, A \ Bi
Bi ; 8i 2 I =)
X
X P (A\B
i)
(A \ Bi )i2I mutual exclusive =)
P (AjBi ) P (Bi ) =
P (Bi ) =
P (Bi )
i2I
i2I
!
!!
X
[
[
P (A \ Bi ) = P
(A \ Bi ) = P A \
Bi
= P (A \ ) = P (A) :
i2I
i2I
i2I
Exemplul 1.7. S
a se determine probabilitatea ca un nivel critic al curgerii
s
a e atins n timpul furtunilor ntr-un sistem de canalizare pe baza m
asur
atorilor meteorologice si hidrologice.
Fie Bi ; i = 1; 2; 3 diferitele nivele (mic, mediu si mare) de precipitatii cauzate
de o furtun
a si Aj ; j = 1; 2 nivelele critic, respectiv necritic al curgerii.
Probabilit
atile P (Bi ) pot estimate din nregistr
arile meteorologice, iar P (Aj jBi )
din analiza curgerii. Presupunem c
a:
P (B1 ) = 0; 5; P (B2 ) = 0; 3; P (B3 ) = 0; 2;
P (A1 jB1 ) = 0; P (A1 jB2 ) = 0; 2; P (A1 jB3 ) = 0; 6;
P (A2 jB1 ) = 1; P (A2 jB2 ) = 0; 8; P (A2 jB3 ) = 0; 4:
Deoarece B1 ; B2 ; B3 constituie o partitie, din teorema probabilit
atii totale
avem:
P (A1 ) = P (A1 jB1 ) P (B1 )+P (A1 jB2 ) P (B2 )+P (A1 jB3 ) P (B3 ) = 0 0; 5+
0; 2 0; 3 + 0; 6 0; 2 = 0; 18:
1.5
P (AjB) P (B)
:
P (A)
7
1) :
P (A\B)
P (B)
(B)
= P (B)
= P P(B\A)
Demonstra
tie. P (AjB)P
P (A)
P (A)
(A) = P (BjA) :
Formula lui Bayes. Fie ( ; K; P ) cmp de probabilitate si (Bi )i2I
K
partitie cel mult num
arabil
a a lui a. . P (Bi ) > 0; 8i 2 I: Atunci, 8A 2 K a.
. P (A) 6= 0; 8i 2 I;
P (Bi jA) = XP (AjBi )P (Bi ) :
[P (AjBj )P (Bj )]
j2I
Demonstra
tie. XP (AjBi )P (Bi )
[P (AjBj )P (Bj )]
P (Bi jA) :
j2I
12
41
= 0; 293:
Exemplul 1.9. Un canal de comunicare binar simplu transmite mesaje
folosind doar 2 semnale, s
a spunem 0 si 1. Presupunem c
a, pentru un canal
binar dat, 40%din timp e transmis un 1; probabilitatea ca un 0 transmis s
a
e corect receptionat este 0,9 si probabilitatea ca un 1 transmis s
a e corect
receptionat este 0,95. Determinati:
a) probabilitatea ca un 1 s
a e primit;
b) dat ind c
a un 1 este primit, probabilitatea ca un 1 s
a fost transmis.
Fie
A = "1 este transmis"
A = "0 este transmis"
B = "1 este primit"
B = "0 este primit".
Din ipoteze
P (A) = 0; 4; P A = 0; 6;
P (BjA) = 0; 95; P BjA = 0; 05;
P BjA = 0; 9; P BjA = 0; 1:
a) Deoarece A si A formeaz
a o partitie, din teorema probabilit
atii totale
rezult
a c
a
P (B) = P (BjA) P (A) + P BjA P A = 0; 95 0; 4 + 0; 1 0; 6 = 0; 38 +
0; 06 = 0; 44:
b) Din teorema lui Bayes,
(A)
0;4
0;38
19
= 0;95
P (AjB) = P (BjA)P
P (B)
0;44 = 0;44 = 22 = 0; 864:
2.1
Consider
am un experiment aleator ale c
arui rezultate sunt elemente ale spatiului
probelor din cmpul de probabilitate ( ; K; P ) : Pentru a construi un model
pentru o variabil
a aleatoare, presupunem c
a e posibil s
a asociem un num
ar real
X (!) pentru ecare rezultat !, urmnd un anumit set de reguli.
Deni
tia 2.1. Functia X se numeste variabila aleatoare dac
a si numai dac
a
a) X : ! R, unde ( ; K; P ) este cmp de probabilitate si
b) 8x 2 R; f! 2 jX (!) xg 2 K.
Conditia b) din denitie e asa-numita "conditie de m
asurabilitate". Ea ne
asigur
a c
a are sens s
a consider
am probabilitatea evenimentului f! 2 jX (!) xg,
notat mai simplu X
x pentru orice x 2 R, sau, mai general, probabilitatea
oric
arei combinatii nite sau num
arabile de astfel de evenimente.
n continuare, dac
a nu e specicat altfel, variabilele aleatoare sunt
considerate pe un cmp de probabilitate ( ; K; P ) :
2.2
Deni
tia 2.2. O variabil
a aleatoare se numeste discreta dac
a si numai dac
a
ia numai valori izolate. Multimea valorilor unei variabile aleatoare discrete este
cel mult num
arabil
a.
Deni
tia 2.3. O variabil
a aleatoare se numeste continua dac
a valorile ei
umplu un interval.
Deni
tia 2.4. Fie X, variabil
a aleatoare
a. O functie fX : R ! R
Z continu
x
a. . fX (x)
0; 8x 2 R si P (X
x) =
2.3
Func
tie de reparti
tie
Deni
tia 2.5. Fie X variabil
a aleatoare. Functia FX : R ! R;
FX (x) = P (X
x) ;
Propriet
a
ti ale func
tiei de reparti
tie. 1) Exist
a si are valori ntre 0 si
1:
2) E continu
a la dreapta si cresc
atoare. Mai mult, avem:
FX ( 1) := lim FX (x) = 0 si FX (1) := lim FX (x) = 1:
x! 1
x!1
3) Dac
a a; b 2 R a. . a < b, atunci
P (a < X b) := P (f! 2 ja < X (!) bg) = FX (b) FX (a) :
Aceast
a relatie rezult
a din
P (X b) = P (X a) + P (a < X b) :
Exemplul 2.1. Fie X o variabil
a aleatoare discret
a cu valorile 1; 1; 2; 3
1 1 2 3
am X
luate cu probabilit
atile 41 ; 18 ; 18 , respectiv 21 . Pe scurt not
1
1
1
1
Avem
8
0, pentru x < 1;
>
>
>
>
1 x < 1;
< 14 , pentru
3
,
pentru
1
x < 2;
FX (x) =
8
>
1
>
,
pentru
2
x < 3;
>
>
: 2
1, pentru x 3:
Gracul lui FX este dat mai jos.
FX (x) =
3)
fX (u) du; 8x 2 R:
fX (x) dx = 1:
4) Dac
a a; b 2 R a. . a < b, atunci
P (a < X
b) = FX (b)
FX (a) =
fX (x) dx:
a
11
Dup
a cum indic
a propriet
atile 3) si 4), aria total
a de sub curb
a este 1 si
suprafata hasurat
a de la a la b e egal
a cu P (a < X b).
Observa
tie. Cunoasterea densit
atii sau a functiei de repartitie
caracterizeaz
a complet o variabil
a aleatoare continu
a.
Exemplul 2.4. Fie a > 0. O variabil
a aleatoare X a c
arei densitate este
ae ax , pentru x > 0;
fX (x) =
0, altfel,
se numeste repartizata exponential (de parametru a). Avem fX (x) 0; 8x 2
R siZ
Z
Z
1
fX (x) dx =
0dx +
ae
ax
dx = 0
ax 1
j0
= 1;
deci fX veric
a proprietatea 3).
Dac
a
x
<
0,
atunci
Z x
Z x
fX (u) du =
0du = 0:
Dac
Z x a x 0, atunciZ
fX (u) du =
1
0du +
1
ae
0
au
du = 0
au x
j0
=1
ax
12
Calcul
am unele probabilit
ati folosind fX .
P (0 < X 1) e egal
a cu aria de sub gracul lui fX de la x = 0 la x = 1,
dup
a cum se arat
a n gura (a). Avem
Z 1
P (0 < X 1) =
fX (x) dx = e ax j10 = 1 e a :
0
13
P (X > 3) e obtinut
a calculnd aria de sub gracul lui fX la dreapta lui
x = 3, deci
Z 1
3a
fX (x) dx = e ax j1
P (X > 3) =
:
3 =e
3
Aceleasi probabilit
ati pot obtinute din FX astfel:
P (0 < X 1) = FX (1) FX (0) = 1 e a 0 = 1 e a ;
P (X > 3) = FX (1) FX (3) = 1
1 e 3a = e 3a :
Mai observ
am c
a P (0 < X 1) = P (0 X 1) pentru variabile aleatoare
continue, deoarece P (X = 0) = 0:
Deni
tia 2.6. Fie X variabil
a aleatoare discret
a. Functia pX : R !
R; pX (x) = P (X = x) := P (f! 2 jX (!) = xg) se numeste functia masa de
probabilitate a lui X, sau, pe scurt, masa lui X.
Din nou indicele X e folosit pentru a identica variabila aleatoare asociat
a.
Exemplul 2.5. Functia mas
a de probabilitate a variabilei aleatoare X
1 1 2 3
din exemplul 2.1 e reprezentat
a mai jos.
1
1
1
1
4
Observa
tii. 1) Dac
a X e variabil
a aleatoare discret
a cu multimea cel mult
num
arabil
a de valori fx1 ; x2 ; :::g luate cu probabilit
ati nenule, atunci:
0 < pX (xi ) 1; 8i;
X
pX (xi ) = 1;
i
pX (x) = 0; 8x 2
= fx1 ; x2 ; :::g :
14
2.4
Fie X variabil
a aleatoare discret
a cu valorile x1 ; x2 ; ::: si functia mas
a de
probabilitate pX sau continu
a cu densitatea fX .
Deni
tia 2.7. Num
arul real
8 X
>
xi pX (xi ) , pentru X discret
a;
>
<
Zi 1
E (X) :=
>
>
xfX (x) dx, pentru X continu
a,
:
1
dac
a exist
a, se numeste media lui X si se mai noteaz
a mX sau simplu m:
Deni
tia 2.8. Fie n 2 N . Num
arul real
8 X
>
xni pX (xi ) , pentru X discret
a;
>
<
n
i
Z
1
n := E (X ) =
>
>
xn fX (x) dx, pentru X continu
a,
:
1
dac
a exist
a, se numeste momentul de ordinul n al lui X:
Observa
tie. Media este momentul de ordinul 1.
1 1 2 3
Exemplul 2.6. Fie X
din exemplul 2.1.
1
1
1
1
4
E (X) = ( 1) 14 + 1 18 + 2 18 + 3 21 = 41 + 18 + 14 + 32 = 18 + 23 = 13
8 :
Exemplul 2.7. Timpul de asteptare X (n minute) al unui client la un
automat de bilete are densitatea
2e 2x , pentru x > 0;
fX (x) =
0, altfel.
Determinati timpul mediu de asteptare.
IntegrndZprin p
arti avem Z
Z
Z
1
E (X) =
xe
2x 1
j0
xfX (x) dx =
1
1
0dx+
2x
dx = 0
x 2e
1
2x 1
j0
2e
1
2
2x
dx = 0
x e
2x 0
dx =
minut.
Propriet
a
ti ale mediei. Dac
a c 2 R este o constant
a si X si Y sunt
variabile aleatoare pe acelasi cmp de probabilitate ( ; K; P ), atunci:
15
E (c) = c;
E (cX) = cE (X) ;
E (X + Y ) = E (X) + E (Y ),
E (X) E (Y ), dac
a X Y (i.e. X (!) Y (!) ; 8! 2 ).
Deni
tia 2.9. Fie X variabil
a aleatoare. Se numeste mediana a lui X o
a o astfel de valoare nu exist
a,
valoare x0 a lui X a. . P (X x0 ) = 21 sau, dac
valoarea x0 a lui X a. . P (X < x0 ) < 21 si P (X x0 ) > 21 .
Media lui X poate s
a nu existe, dar exist
a cel putin o median
a.
n comparatie cu media, mediana e uneori preferat
a ca m
asur
a a tendintei
centrale cnd repartitia e asimetric
a, n particular cnd sunt un num
ar mic de
valori extreme n repartitie. De exemplu, vorbim de mediana veniturilor ca
o bun
a m
asur
a a tendintei centrale a venitului personal pentru o populatie.
Aceasta e o m
asur
a mai bun
a dect media, deoarece mediana nu e asa sensibil
a
la un num
ar mic de venituri extrem de mari sau venituri extrem de mici ca
media.
Exemplul 2.8. Fie T timpul dintre emisiile de particule la un atom radioactiv. Este stabilit c
a T e o variabil
a aleatoare cu repartitie exponential
a,
adic
a
e t , pentru t > 0;
fT (t) =
0, altfel,
unde e o constant
a pozitiv
a. Variabila aleatoare T se numeste timpul de
viata al atomului si o m
asur
a medie a acestui timp de viata este timpul de
njum
at
atire, denit ca mediana lui T . Astfel, timpul de njum
at
atire e g
asit
din
Z
= 12 () e
=
fT (t) dt = 21 () 1 e
P (T
) = 21 ()
1
2
() = ln 2 :
Observ
am
a viata medie E (T ) este
Z c
E (T ) =
tfT (t) dt =
(se calculeaz
a analog ca la exemplul 2.7).
Deni
tia 2.10. Fie X variabil
a aleatoare. Se numeste modul sau moda a
lui X
a) o valoare xi luat
a de X a. . pX (xi ) > pX (xi+1 ) si pX (xi ) > pX (xi 1 ),
dac
a X e discret
a cu valorile x1 < x2 < :::;
b) un punct de maxim local al lui fX , dac
a X e continu
a.
Un modul este astfel o valoare a lui X corespunz
atoare unui vrf n functia
mas
a de probabilitate sau n densitate.
Termenul distributie unimodala se refer
a la o functie de repartitie a unei
variabile aleatoare care are un modul unic.
Media, mediana si modulul coincid atunci cnd o repartitie unimodal
a este
simetric
a.
Deni
tia 2.11. Fie n 2 N si X variabil
a aleatoare de medie m. Momentul
centrat de ordinul n al lui X este
16
8 X
n
>
(xi m) pX (xi ) , pentru X discret
a;
>
<
n
i
Z
m) ) =
1
n
>
>
(x m) fX (x) dx, pentru X continu
a.
:
= E ((X
Deni
tia 2.12. Fie X variabil
a aleatoare.Varianta sau dispersia lui X este
momentul centrat de ordinul 2 al lui X; 2 . Se noteaz
a cu 2X sau simplu 2
sau var (X).
Valori mari ale lui 2X implic
a o ntindere mare a valorilor lui X n jurul
mediei. Reciproc, valori mici ale lui 2X implic
a o concentrare a valorilor lui
X n jurul mediei. n cazul extrem cnd 2X = 0, X = m cu probabilitatea 1
(ntreaga mas
a a distributiei e concentrat
a n medie).
Propozi
tie. Relatia dintre dispersia si momentele lui X este
2
= 2 m2 :
2
Demonstra
tie. 2 = E (X m) = E X 2 2mX + m2 = E X 2
2mE (X) + m2 = 2 2m2 + m2 = 2 m2 :
Alte propriet
a
ti ale dispersiei. var (X) 0;
var (X + c) = var (X) ; 8c 2 R;
var (cX) = c2 var (X) ; 8c 2 R:
Fie X r
variabil
a aleatoare de medie m. Se numeste deviatie standard a lui X
X
E (X
m)
1
1
4
mX
1
8
1
8
1
2
min
am 2X .
n exemplul 2.6 am v
azut c
a mX = 13
8 . Avem
2
1
2
2 1
2 1
E X = ( 1) 4 + 1 8 + 2 8 + 32 12 = 41 +
169
344 169
2
2
m2X = 43
= 175
X =E X
8
64 =
64
64 :
1
8
1
2
9
2
3
8
+5=
43
8 :
2e 2x , pentru x 0;
:
0, altfel.
1
n exemplul 2.7 am v
azut c
a mX = 2 : Avem, integrnd prin p
arti
Z 1
Z 0
Z 1
Z 1
0
x2 fX (x) dx =
0dx+
x2 2e 2x dx = 0
x2 e 2x dx =
E X2 =
1
0
0
Z 11
1
1
2
2x 1
2x
x e
j0 +
2xe
dx = 0 + 2 = 2 , ultima integral
a ind calculat
a la
Exemplul 2.10. Determin
am dispersia lui X cu fX (x) =
17
exemplul 2.7.
Deci
2
2
m2X = 12 41 = 14 :
X =E X
Coecientul de asimetrie denit de
3
1 = 3
d
a o m
asur
a a simetriei unei distributii. Este pozitiv cnd o distributie
unimodal
a are o coad
a dominant
a la dreapta (adic
a modulul este la stnga
mediei) si negativ n caz contrar. Este 0 cnd o distributie e simetric
a n jurul
mediei. De fapt, o distributie simetric
a n jurul mediei are toate momentele
centrate de ordin impar 0. n gurile (a), (b) si (c) sunt reprezentate densit
ati
cu 1 > 0; 1 = 0; respectiv 1 < 0:
18
P (jX
mX j
X)
1
;
k2
(2.1)
Rezult
a relatia (2.1). Demonstratia este similar
a cnd X este discret
a.
20
3.1
Independen
ta variabilelor aleatoare. Densitate de reparti
tie condi
tionat
a
si formula lui
Bayes pentru densit
a
ti de reparti
tie. Covarian
ta
si corela
tie
Independen
ta variabilelor aleatoare
x\Y
y) :
x1 \ X2
x2 \ ::: \ Xn
xn ) :
Propriet
a
ti 3.1. a) FXY (x; y) 0; 8x; y 2 R:
b) FXY e cresc
atoare n x si y.
c) FXY e continu
a la dreapta n raport cu x si y.
d) FXY ( 1; 1) = FXY ( 1; y) = FXY (x; 1) = 0; 8x; y 2 R:
e) FXY (1; 1) = 1:
f) FXY (x; 1) = FX (x) ; 8x 2 R:
g) FXY (1; y) = FY (y) ; 8y 2 R:
h) 8x1 ; x2 ; y1 ; y2 2 R a. . x1 < x2 si y1 < y2 ;
P (x1 < X x2 \ y1 < Y
y2 ) = FXY (x2 ; y2 ) FXY (x1 ; y2 ) FXY (x2 ; y1 )+
FXY (x1 ; y1 ) :
Demonstr
am de exemplu f):
FXY (x; 1) = P (X x \ Y
1) = P (X x \ ) = P (X x) = FX (x) ; 8x 2
R:
Propriet
ati similare se pot deduce pentru FX1 X2 :::Xn :
Forma general
a a lui FXY poate vizualizat
a din propriet
atile d)-g). n cazul
cnd X si Y sunt discrete FXY seam
an
a cu un colt al unor trepte neregulate,
ca n gura de mai jos.
21
Creste de la 0 la n
altimea de 1 n directia dinspre cadranul 3 spre cadranul
1. Cnd X si Y sunt continue FXY este o suprafata neted
a cu aceleasi tr
as
aturi.
Propriet
atile f) si g) arat
a c
a functiile de repartitie ale variabilelor aleatoare
individuale, numite functii de repartitie marginale, pot calculate din functia
de repartitie comun
a a lor. Reciproca nu este n general adev
arat
a. O situatie
important
a cnd reciproca este adev
arat
a este cnd X si Y sunt independente.
Deni
tia 3.2. a) Variabilele aleatoare X si Y sunt independente dac
a si
numai dac
a P (X x \ Y
y) = P (X x) P (Y
y) ; 8x; y 2 R:
b) Variabilele aleatoare X1 ; X2 ; :::; Xn sunt independente dac
a si numai dac
a
P (X1 x1 \ X2 x2 \ ::: \ Xn xn ) = P (X1 x1 ) P (X2 x2 ) :::P (Xn xn ) ; 8x1 ; x2 ; :::; xn 2
R:
c) Fie I multime innit
a. Variabilele aleatoare (Xi )i2I sunt independente
() (Xi )i2J sunt independente, 8J I nit
a.
Observa
tii. a) X si Y sunt independente ()
FXY (x; y) = FX (x) FY (y) ; 8x; y 2 R:
b) X1 ; X2 ; :::; Xn sunt independente ()
FX1 X2 :::Xn (x1 ; x2 ; :::; xn ) = FX1 (x1 ) FX2 (x2 ) :::FXn (xn ) ; 8x1 ; x2 ; :::; xn 2 R:
c) X si Y sunt independente =)
22
i=1
i
X
i
X
f) FXY (x; y) =
ijxi x jjyj
@ 2 FXY
(x; y) ;
@x@y
dac
a exist
a.
23
@ n FX
(x) ;
@x1 @x2 :::@xn
dac
a derivatele partiale indicate exist
a.
Propriet
a
ti 3.3. a) fXY (x; y) 0 deoarece FXY este cresc
atoare n x si y.
b) Din denitie,
Z y Z x
fXY (u; v) dudv:
FXY (x; y) = P (X x \ Y
y) =
1
c) Dac
a x1 < x2 si y1 < y2 , atunci Z
P (x1 < X x2 \ y1 < Y
y2 ) =
y2
y1
x2
24
e)
1
1
Aceast
a proprietate rezult
a din proprietatea b) punnd x ! 1 si y ! 1 si
arat
aZ
c
a volumul total de sub suprafata fXY este 1:
1
f)
fXY (x; y) dy = fX (x) :
1
Aceasta rezult
a din
1
1
derivnd
Z 1 n raport cu x:
g)
fXY (x; y) dx = fY (y) :
Densit
atile fX si fY din propriet
atile f) si g) se numesc densitati marginale
ale lui X, respectiv Y:
3.2
Densitate de reparti
tie condi
tionat
a
si formula lui Bayes
pentru densit
a
ti de reparti
tie
FXY (xjy) = P (X
xjY = y) :
x2
fXY (u;v)dudv
P (x1 < X
x2 jy1 < Y
y2 ) =
y2 )
y1
x1
y2
fY (v)dv
y1
fXY (u;y)du
1
FXY (xjy) =
;
fY (y)
cu conditia ca fY (y) 6= 0:
Mai departe obtinem
(x;y)
(3.1) fXY (xjy) = dFXYdx(xjy) = fXY
a fY (y) 6= 0:
fY (y) , dac
Pentru functia de repartitie conditionat
a nu e valabil
a o formul
a asem
an
a(x;y)
:
toare, adic
a FXY (xjy) 6= FXY
FY (y)
Cnd X si Y sunt independente avem FXY (xjy) = FX (x) si din relatia (3.1)
obtinem
fXY (xjy) = fX (x)
si
fXY (x; y) = fX (x) fY (y) ;
adic
a densitatea comun
a e egal
a cu produsul densit
atilor marginale cnd X
si Y sunt independente.
Mai avem si Z
FXY (xjy) =
la
P (A \ B \ C) = P (AjB \ C) P (BjC) P (C)
pentru trei evenimente A; B si C, avem n cazul a trei variabile aleatoare
continue X; Y si Z;
fXY Z (x; y; z) = fXY Z (xjy; z) fY Z (yjz) fZ (z) :
Pentru cazul a n variabile aleatoare continue X1 ; X2 ; :::; Xn , componente ale
vectorului aleator X, putem scrie
fX (x) = fX1 X2 :::Xn (x1 jx2 ; :::; xn ) fX2 :::Xn (x2 jx3 ; :::; xn ) :::fXn 1 Xn (xn 1 jxn ) fXn (xn ) :
Dac
a X1 ; X2 ; :::; Xn sunt independente, obtinem
fX (x) = fX1 (x1 ) fX2 (x2 ) :::fXn (xn ) :
Formula lui Bayes pentru densit
a
ti de reparti
tie. Dac
a X si Y sunt
variabile aleatoare continue, atunci
26
fXY (xjy) =
fY X (yjx)fX (x)
fY (y)
dac
a fY (y) 6= 0:
3.3
=Z
fY X (yjx)fX (x)
fY X (yj )fX ( )d
1
Covarian
ta
si corela
tie
Fie X si Y variabile aleatoare discrete care iau o multime cel mult num
arabil
a
de perechi de valori (xi ; yj ) ; i; j = 1; 2; ::: cu probabilit
ati nenule sau variabile
aleatoare continue.
Deni
tia 3.5. Fie n; m 2 N:
a) Momentele comune nm ale variabilelor aleatoare X si Y sunt date de,
dac
a exist
a,
8 XX
n
>
xm
a X si Y sunt discrete,
>
i yj pXY (xi ; yj ) , dac
<
i
jZ
n m
Z
1
1
nm = E (X Y ) =
>
>
xn y m fXY (x; y) dxdy, dac
a X si Y sunt continue.
:
1
de
= E ((X mX ) (Y mY ) ) :
Observa
tii. Cu notatiile folosite aici, mediile lui X si Y sunt 10 , respectiv,
.
De
exemplu,
folosind
obtinem
01
Z
Z denitia 3.5 a) pentru XZ si Y continue,
Z
nm
10
= E (X) =
s
i
pot
g
a
site
din
denitia 3.5 b) cu nlocuiri corespunz
atoare
20
02
pentru n si m. Ca si n cazul unei singure variabile aleatoare avem
2
2
m2X ;
20 = 20
10 sau X = 20
respectiv
2
2
m2Y :
02 = 02
01 sau Y = 02
Deni
tia 3.6. Se numeste covarianta a lui X si Y
=
cov
(X; Y ) = E ((X mX ) (Y mY )) :
11
Covarianta e o m
arime a interdependentei lui X si Y:
Proprietatea 3.4. Covarianta e legat
a de nm prin
=
=
m
m
:
11
10 01
11
X Y
11
Demonstra
tie. 11 = E ((X mX ) (Y mY )) = E (XY mY X mX Y + mX mY ) =
E (XY ) mY E (X) mX E (Y ) + mX mY = 11
10 01
10 01 + 10 01 =
11
10 01 :
Deni
tia 3.7. Coecientul de corelatie al lui X si Y este
= (X; Y ) = p
27
11
20 02
11
X
Proprietatea 3.5. j j 1:
Demonstra
tie. [t (X mX ) + Y
20 t
mY ]
0; 8t 2 R =) E [t (X
2
11
mX ) + Y
mY ]
2
11
+ 2 11 t + 02
0; 8t 2 R =)
=4
4 20 02
0 =)
=) j j 1:
Coecientul de corelatie este f
ar
a dimensiune. El este si independent de
origine, adic
a 8a1 ; a2 ; b1 ; b2 2 R cu a1 ; a2 > 0 se poate demonstra c
a
(a1 X + b1 ; a2 Y + b2 ) = (X; Y ) :
Proprietatea 3.6. Dac
a X si Y sunt independente, atunci
si = 0:
11 = 0
Demonstra
tie. Fie
Z
Z
Z X Zsi Y continue.
20 02
indep.
11
11
mX mY = 0 =)
= 0:
Similar se poate demonstra dac
a X si Y sunt discrete.
Dac
a X si Y sunt independente, atunci
(3.2) E (g (X) h (Y )) = E (g (X)) E (h (Y )) ;
dac
a mediile exist
a.
Cnd coecientul de corelatie al dou
a variabile aleatoare se anuleaz
a, spunem
c
a ele sunt necorelate.
Observa
tii. 1) X si Y sunt necorelate () E (XY ) = E (X) E (Y ).
(Rezult
a din denitii si proprietatea 3.4.)
2) X, Y independente =) X, Y necorelate. (Rezult
a din denitie si
proprietatea 3.6.)
3) Reciproca nu e adev
arat
a.
2
1 1 2
Exemplul 3.1. Fie X
si Y = X 2 :
1
1
1
1
4
Avem Y
1
2
82
>
>
<
1
4,
1
4,
1
4,
1
4,
pentru (x; y) = ( 2; 4) ;
pentru (x; y) = ( 1; 1) ;
pXY (x; y) =
pentru (x; y) = (1; 1) ;
>
>
:
pentru (x; y) = (2; 4) ;
mX = ( 2) 14 + ( 1) 14 + 1 14 + 2 14 = 0;
mY = 1 21 + 4 12 = 52 ;
1
1
1
1
11 = ( 2) 4 4 + ( 1) 1 4 + 1 1 4 + 2 4 4 = 0:
Deci
mX mY = 0 =) = X11Y = 0 =) X si Y sunt necorelate.
11 = 11
Pe de alt
a parte,
P (X
2\Y
1) = FXY ( 2; 1) = 0;
iar
P (X
2) P (Y
1) = FX ( 2) FY (1) = 41 12 = 81 ;
deci
28
P (X
2\Y
1) 6= P (X
2) P (Y
1) =) X si Y nu sunt independente.
Coecientul de corelatie m
asoar
a interdependenta liniar
a a variabilelor aleatoare,
adic
a acuratetea cu care o variabil
a aleatoare poate aproximat
a printr-o
functie liniar
a de cealalt
a. Pentru a vedea asta, consider
am problema
aproxim
arii unei variabile aleatoare X printr-o functie liniar
a de o a doua variabil
a aleatoare Y , aY + b, unde a si b sunt alese a. . eroarea medie p
atratic
ae
denit
a de
2
(3.3) e = E [X (aY + b)]
este minim
a. Avem
e = E X 2 + a2 Y 2 + b2 2aXY 2bX + 2abY = E X 2 + a2 E Y 2 +
b2 2aE (XY ) 2bmX + 2abmY ;
@e
2
2E (XY ) + 2bmY ;
@a = 2aE Y
@e
=
2b
2m
+
2amY :
X
@b
Rezolvnd sistemul
@e
@a = 0;
@e
@b = 0;
obtinem c
a minimul e atins cnd
a = XY
si
b = mX amY :
nlocuind aceste valori n relatia (3.3) obtinem eroarea medie p
atratic
a
2
minim
a 2X 1
. Vedem c
a o potrivire exact
a n sensul mediei p
atratice e
atins
a cnd j j = 1 si aproximarea liniar
a este cea mai rea cnd = 0: Cnd
= 1, X si Y se numesc pozitiv perfect corelate, n sensul c
a valorile pe care le
iau sunt pe o dreapt
a cu pant
a pozitiv
a; ele sunt negativ perfect corelate cnd
= 1 si valorile lor se aa pe o dreapt
a cu pant
a negativ
a. Aceste dou
a cazuri
extreme sunt ilustrate n gura de mai jos.
29
E X2 E Y 2 :
Ultimele dou
a relatii sunt inegalitatile lui Schwarz.
Deni
tia 3.8. Fie X un vector coloan
a aleator cu componentele X1 ; X2 ; :::; Xn
si mX vectorul coloan
a avnd componente mediile lui X1 ; X2 ; :::; Xn : Matricea
de covarianta este
0
var (X1 )
cov (X1 ; X2 ) ::: cov (X1 ; Xn )
B cov (X2 ; X1 )
var (X2 )
::: cov (X2 ; Xn )
B
T
= E (X mX ) (X mX )
=B
..
..
..
.
..
@
.
.
.
cov (Xn ; X1 ) cov (Xn ; X2 ) :::
var (Xn )
este o matrice n n cu avnd pe diagonal
a variante si n afara diagonalei
covariante. Deoarece cov (Xi ; Xj ) = cov (Xj ; Xi ), matricea de covarianta este
simetric
a.
Urm
atorul rezultat este o generalizare a relatiei (3.2).
Teorem
a. Dac
a X1 ; X2 ; :::; Xn sunt independente, atunci
E (g1 (X1 ) g2 (X2 ) :::gn (Xn )) = E (g1 (X1 )) E (g2 (X2 )) :::E (gn (Xn )) ;
unde gj (Xj ) este o functie arbitrar
a de Xj . Se presupune c
a toate mediile
care sunt scrise exist
a.
n
X
Propozi
tie. Fie X1 ; X2 ; :::; Xn variabile aleatoare si Y =
Xi : Atunci
i=1
30
C
C
C:
A
2
Y
n
X
i=1
2
Xi
+2
cov (Xi ; Xj ) :
1 i<j n
n particular, dac
a X1 ; X2 ; :::; Xn sunt independente, atunci
n
X
2
2
Y =
Xi :
i=1
31
Principalele reparti
tii discrete
si propriet
a
tile
lor
4.1
Reparti
tia binomial
a
O succesiune de probe e f
acut
a astfel nct
a) pentru ecare prob
a sunt doar dou
a rezultate posibile, s
a spunem succes
si esec;
b) probabilit
atile aparitiei acestor rezultate r
amn aceleasi pe durata probelor;
c) probele sunt independente.
Probele f
acute n aceste conditii se numesc probe Bernoulli.
Not
am evenimentul "succes" cu S si evenimentul "esec" cu F . Fie P (S) = p
si P (F ) = q, unde p + q = 1: Rezultate posibile din efectuarea unei succesiuni
de probe Bernoulli pot reprezentate simbolic prin
S \ S \ F \ F \ S \ F \ S \ S \ S \ ::: \ F \ F
F \ S \ F \ S \ S \ F \ F \ F \ S \ ::: \ S \ F
..
.
si, datorit
a independentei, probabilit
atile acestor rezultate posibile sunt usor
de calculat. De exemplu,
P (S \ S \ F \ F \ S \ F \ :::F \ F ) = P (S) P (S) P (F ) P (F ) P (S) P (F ) :::P (F ) P (F ) =
ppqqpq:::qq:
Repartitia unei variabile aleatoare X reprezentnd num
arul de succese
dintr-o succesiune de n probe Bernoulli, indiferent de ordinea n care apar este
frecvent de interes considerabil. E clar c
a X e o variabil
a aleatoare discret
a
care ia valorile 0; 1; 2; :::; n. Pentru a determina functia mas
a de probabilitate,
consider
am pX (k), probabilitatea de a avea exact k succese n n probe. Acest
eveniment poate ap
area n la fel de multe moduri precum num
arul de submultimi
de k elemente ale unei multimi de n elemente. De aici, num
arul de moduri n
care k succese se pot ntmpla n n probe este
Cnk = k!(nn! k)!
si probabilitatea asociat
a cu ecare mod este pk q n k : Din acest motiv avem
pX (k) = Cnk pk q n
; k = 0; 1; 2; :::; n:
Datorit
a similarit
atii cu termenii binomului lui Newton
n
X
n
(a + b) =
Cnk ak bn k ;
(4.1)
k=0
repartitia denit
a de relatia (4.1) se numeste repartitie binomiala. Ea are
doi parametri, anume n si p. O variabil
a aleatoare X avnd repartitie binomial
a
se noteaz
a X B (n; p).
Forma unei repartitii binomiale e determinat
a de valorile celor doi parametri
ai ei, n si p. n general, n se d
a ca o parte a problemei si p trebuie estimat din
observatii.
32
pX (k)
pX (k 1)
k
Cn
n!
p
k!(n k)!
n!
q
1)!(n k+1)!
(n k+1)p
kq
= 1 + (n
k+1)p kq
kq
1+
Observ
am c
a pX (k) > pX (k 1) () k < (n + 1) p si pX (k) < pX (k 1) ()
k > (n + 1) p: Deci, dac
a denim k 2 Z prin
(n + 1) p 1 < k
(n + 1) p;
valoarea lui pX (k) creste de la k = 0 si si atinge valoarea maxim
a cnd
k = k , apoi descreste. Dac
a (n + 1) p 2 Z, valoarea maxim
a se atinge n
ambele pX (k
1) si pX (k ). k este astfel un modul al acestei repartitii si se
numeste adesea "cel mai probabil num
ar de succese".
pX (k) este tabelat
a ca o functie de n si p. Tabelul A.1 din gurile de mai
jos d
a valorile ei pentru n = 2; 3; :::; 10 si p = 0; 01; 0; 05; :::; 0; 5:
33
34
Calculul lui pX (k) devine greu cnd n devine mare; se foloseste aproximarea
Poisson a repartitiei binomiale.
Functia de repartitie FX (x) pentru o repartitie binomial
a este dat
a de
[x]
X
Cnk pk q n k ;
FX (x) =
k=0
n
X
(n 1)!
k n k
(k 1)!(n 1 (k 1))! p q
= np
k=1
k=1
n
X
Cnk
n
X
n 1
1 k 1 n 1 (k 1) k 1=i
q
=
1p
k=1
k=1
1 n 1 (k 1)
n
X
k=1
35
np
n
X1
Cni
1p
Cnk
= np
n
X
i n 1 i
i=0
= np:
n
n
X
X
=
k 2 pX (k) =
k 2 Cnk pk q n
b) E X 2
k=0
" n
X
np
(k 1) Cnk 11 pk
n!
k n k
k!(n k)! p q
k=1
k=1
np (p + q)
kCnk
1 k 1 n 1 (k 1)
q
1p
k=1
1 k 1 n 1 (k 1)
q
1p
k 1=i; a)
n
X1
np
iCni 1 pi q n 1 i
i=0
+1
a)
= np (mY + 1) = np [(n
1) p + 1] ;
unde Y
B (n 1; p) :
2
2
=
E
X
m2X = np [(n 1) p + 1] n2 p2 = n2 p2 np2 + np n2 p2 =
X
np (1 p) = npq:
Faptul c
a mX = np sugereaz
a c
a parametrul p poate estimat pe baza
valorii medii a datelor observate.
O alt
a formulare care duce la repartitia binomial
a este denirea variabilei
aleatoare Xj ; j = 1; 2; :::; n, reprezentnd rezultatul celei de-a j-a probe Bernoulli.
Dac
a punem
0, dac
a proba j este un esec,
Xj =
1; dac
a proba j este un succes,
atunci
X = X1 + X2 + ::: + Xn
d
a num
arul de succese n n probe. Din denitie, X1 ; X2 ; :::; Xn sunt variabile
aleatoare independente.
Deoarece
E (Xj ) = 0 q + 1 p = p; j = 1; 2; :::; n;
rezult
a c
a
E (X) = E (X1 + X2 + ::: + Xn ) = E (X1 )+E (X2 )+:::+E (Xn ) = p + p + ::: + p =
{z
}
|
n
np;
4.2
Reparti
tia hipergeometric
a
4.3
Reparti
tia geometric
a
Fie X num
arul de probe Bernoulli pn
a la (si incluznd) prima aparitie a succesului. X e variabil
a aleatoare discret
a avnd ca valori toate numerele naturale.
Functia ei mas
a0de probabilitate este1
pX (k) = P @|F \ F {z
\ ::: \ F} \ S A = P (F ) P (F ) :::P (F )P (S) = q k
|
{z
}
k 1
p; k =
k 1
1; 2; ::::
Aceast
a repartitie este cunoscut
a ca repartitia geometrica cu parametrul p,
unde numele provine de la similaritatea cu termenii progresiei geometrice. O
reprezentare a lui pX (k) e dat
a mai jos.
k=1
= (1
q)
k=1
k=1
k=1
k=1
n+1
q
1 q+q
d
q lim 1 1q q
= p dq
=
p
= p1 :
1 q
(1 q)2
n!1
"
1
1
1
X
X
X
2
2 k 1
k 1
E X
k q
k=1
p=p
kq
+q
k=1
k (k
k=2
37
qk
=1
q [x] ,
k=1
dac
ax 1
si
FX (x) = 0; dac
a x < 1:
Media si dispersia lui X se calculeaz
a astfel:
1
1
1
X
X
X
d
d
d
k
E (X) =
kq k 1 p = p
q
=
p
q k = p dq
dq
dq
d
p dq
[x]
X
1) q
q lim
n!1
k 2
n
X
k 1
k=1
1
p +pq
1
X
k=2
d2
dq 2
qk =
1
p +pq
d2
dq 2
1
X
k=2
1
p
1
p
d
+ pq dq
4.4
2q q 2
(1 q)2
2q
:
(1 q)2
2
X =E
X2
1
p
+ pq
1 q
d
q = p1 +pq dq
2
[E (X)] =
1
p
q2
1 q
d
= p1 +pq dq
2
2q
p2
1
p2
p+2q 1
p2
1
p
q
p2
d
= p1 +pq dq
+q
=
2q(1 q)+q 2
(1 q)2
1 p
p2 :
Reparti
tia binomial
a negativ
a
1 r k r
;k
1p q
= r; r + 1; ::::
(4.2)
Repartitia denit
a de relatia (4.2) se numeste repartitie binomiala negativa
sau Pascal si are parametrii r si p. Este adesea notat
a prin N B (r; p). Observ
am
c
a ea se reduce la repartitia geometric
a cnd r = 1:
O variant
a a acestei repartitii se obtine punnd Y = X
r: Variabila
aleatoare Y este num
arul de probe Bernoulli dincolo de r necesare pentru realizarea celui de-al r-lea succes, sau poate interpretat
a ca num
arul de esecuri
nainte de cel de-al r-lea succes.
Functia mas
a de probabilitate a lui Y , pY (m), e obtinut
a din relatia (4.2)
nlocuind k prin m + r :
r 1
r m
m
r m
pY (m) = Cm+r
= Cm+r
1 p q ; m = 0; 1; 2; ::::
1p q
Variabila aleatoare Y are p;roprietatea convenabil
a c
a valorile ei ncep de la
0 si nu de la r ca valorile lui X:
Reamintind o denitie mai general
a a coecientului binomial
j+1)
Caj = a(a 1):::(a
;
8a
2
R;
j
2
N
;
j!
avem
m
(m+r 1)!
(m+r 1)(m+r 2):::r
r m+1)
m
Cm+r
= ( 1) ( r)( r 1):::(
=
1 = m!(r 1)! =
m!
m!
m m
( 1) C r :
De aici,
m
pY (m) = C mr pr ( q) ; m = 0; 1; 2; :::;
38
4.5
Reparti
tia multinomial
a
n!
pk1 pk2 :::pkr r ;
k1 !k2 !:::kr ! 1 2
(4.3)
si probabilitatea asociat
a cu ecare mod, datorit
a independentei, este pk11 pk22 :::pkr r :
Relatia (4.3) deneste functia mas
a de probabilitate comun
a a repartitiei
multinomiale, numit
a asa deoarece are forma temenului general din expansiunea
n
multinomial
a a lui (p1 + p2 + ::: + pr ) . Repartitia multinomial
a se reduce la
repartitia binomial
a cnd r = 2, si cu p1 = p; p2 = q; k1 = k si k2 = n k:
Deoarece Xi B (n; pi ), avem
mXi = npi ; 2Xi = np1 (1 pi ) ;
si se poate ar
ata c
a avem
cov (Xi ; Xj ) = npi pj ;
i; j = 1; 2; :::; r;
i 6= j:
39
4.6
Reparti
tia Poisson
Aceast
a repartitie este folosit
a n modelele matematice pentru a descrie, ntr-un
interval de timp specic, evenimente ca emisia de particule dintr-o substanta
radioactiv
a, sosirile de pasageri la un aeroport, distributia particulelor de praf
ntr-un anumit spatiu, sosirile de masini la o intersectie, si alte fenomene similare.
Pentru a xa ideile, consider
am problema sosirii pasagerilor la o statie de
autobuz ntr-un interval de timp specicat. Not
am X (0; t) num
arul de sosiri
din intervalul de timp [0; t); X (0; t) e o variabil
a aleatoare discret
a lund valori
posibile 0; 1; 2; :::, iar repartitia ei depinde de t. Functia ei mas
a de probabilitate
se scrie
pk (0; t) = P [X (0; t) = k] ;
k = 0; 1; 2; :::;
(4.4)
pentru a ar
ata dependenta ei explicit
a de t.
Facem urm
atoarele ipoteze de baz
a:
1) Dac
a t1 < t2 < ::: < tn , atunci variabilele aleatoare X (t1 ; t2 ) ; X (t2 ; t3 ) ; :::; X (tn
sunt independente, adic
a, numerele de pasageri care sosesc n intervale de timp
care nu se suprapun sunt independente unul de cel
alalt.
2) Pentru t sucient de mic,
p1 (t; t +
t) =
t + o ( t) ;
(4.5)
t!0
1
X
pk (t; t +
t) = o ( t) :
(4.7)
k=2
Aceast
a conditie implic
a faptul c
a probabilitatea de a avea dou
a sau mai
multe sosiri ntr-un interval sucient de mic este neglijabil
a.
Din relatiile (4.5) si (4.7) rezult
a
p0 (t; t +
t) = 1
1
X
pk (t; t +
t) = 1
t + o ( t) :
(4.8)
k=1
Determin
am p0 (0; t). Pentru a nu avea nicio sosire n intervalul [0; t + t),
trebuie s
a nu avem nicio sosire n ambele subintervale [0; t) si [t; t + t). Datorit
a independentei sosirilor n intervale nesuprapuse avem
40
1 ; tn )
p0 (0; t +
t) = p0 (0; t) p0 (t; t +
t) = p0 (0; t) [1
t + o ( t)] :
(4.9)
t obtinem
dp0 (0; t)
=
p0 (0; t) :
dt
Solutia ei satisf
acnd conditia initial
a p0 (0; 0) = 1 este
t
p0 (0; t) = e
(4.10)
t) = p0 (0; t) p1 (t; t +
t) + p1 (0; t) p0 (t; t +
t) :
o( t)
t
+
Punnd
+ p1 (0; t)
t ! 0, obtinem
dp1 (0; t)
=
dt
ceea ce conduce la
o( t)
t
(4.11)
p1 (0;t+ t) p1 (0;t)
t
p1 (0; t) + e
p1 (0; t) = te
p1 (0; 0) = 0;
(4.12)
(4.13)
( t) e t
;
k = 0; 1; 2; ::::
(4.14)
k!
Relatia (4.14) d
a functia mas
a de probabilitate a lui X (0; t), num
arul de
sosiri n intervalul de timp [0; t) cu conditiile de mai sus si deneste o repartitie
Poisson cu parametrii si t. Parametrii si t pot nlocuiti de un singur
parametru = t si astfel putem scrie
pk (0; t) =
pk (0; t) =
e
k!
41
k = 0; 1; 2; ::::
(4.15)
E (X (0; t)) =
1
X
kpk (0; t) = e
k=0
1
X
k
k=2
= e
k!
k=0
Calcul
am si dispersia:
1
X
E X 2 (0; t) =
k 2 pk (0; t) = e
k=0
"
#
1
1
X
X
k 2
k 1
2
(k 2)! +
(k 1)! = e
1
X
k=1
1
X
k!
=e
(k
1)!
e + e
= e
e = :
(4.16)
1
X
k
(k 1)!
k=1
k=0
2
k 1
=e
"
1
X
(k
1) k
(k 1)!
k=1
+ :
k=1
2
X(0;t)
= E X 2 (0; t)
[E (X (0; t))] = :
(4.17)
42
1
X
k=1
(k 1)!
n general, dac
a examin
am raportul pkpk (0;t)
, cum am f
acut la repartitia
1 (0;t)
binomial
a, se arat
a c
a pk (0; t) creste si apoi descreste cnd k creste,
atingndu-si maximul cnd k = [ ] :
43
44
r=k
pk (1 p)n n+k e
k
Cn+k
(n+k)!
(p )k e
k!
n=0
1
X
r=k
[(1 p) ]n
n!
(p )k e
e(1
k!
p)
(p )k e
k!
n=0
0; 1; 2; ::::
Aceast
a propozitie poate folosit
a, de exemplu, pentru situatii n care Y e
num
arul de urmasi ai unei insecte cnd X e num
arul de ou
a depuse, sau Y e
num
arul de uragane dezastruoase cnd X e num
arul total de uragane care apar
ntr-un an dat, sau Y e num
arul pasagerilor care nu pot urca la bordul unui
zbor dat din cauza suprarezerv
arilor, cnd X este num
arul de sosiri de pasageri.
4.6.1
Reparti
tii spa
tiale
k=
si este rezonabil s
a presupunem c
a probabilitatea de a g
asi k defecte n orice
regiune depinde numai de volum si nu de forma regiunii.
Alte situatii zice n care repartitia Poisson e folosit
a includ num
arul de
bacterii pe o plac
a Petri, repartitia fertilizatoarelor mpr
astiate cu avionul pe
un cmp si repartitia poluantilor industriali ntr-o regiune dat
a.
4.6.2
pX (k) =
(2 ) 2 e
k!(2
Deoarece
lim 1 +
n!1
avem
lim
n!1
n
n k
1
)2
c n
n
nn+ 2
n+k (n
k)
k
k+ 1
2
n k
k!ek
n
n k
n k+ 12
= ec ;
n k+ 21
=
lim
n!1
n k
(1
k
n
k+ 1
2
lim
i
n
lim
n!1
k
n
(1
k
n
lim
n n!1
k+ 1
2
n
1
e
n!1
lim 1 n
= lim 1 n
=e :
n!1
Obtinem
k
e
pX (k) = k!
;
k = 0; 1; ::::
Aceast
a aproximare Poisson a repartitiei binomiale usureaz
a calculele si se
foloseste n practic
a atunci cnd n > 10 si p < 0; 1. Repartitia Poisson si
g
aseste aplicabilitate n acest caz n probleme n care probabilitatea aparitiei
unui eveniment este mic
a. De aceea, repartitia Poisson se mai numeste adesea
repartitia evenimentelor rare.
n!1
46
n k
n
Principalele reparti
tii continue, cu densit
a
ti
de reparti
tie
si propriet
a
tile lor
5.1
Reparti
tia uniform
a
O variabil
a aleatoare continu
a X are repartitie uniforma pe un interval de la
a la b (b > a) dac
a este egal probabil s
a ia orice valoare din acest interval.
Densitatea lui X este constant
a pe intervalul [a; b] si are forma
c; dac
a x 2 [a; b] ;
fX (x) =
0; altfel.
Deoarece
Z 1
Z b
Z a
Z 1
0dx = 0 + cxjba + 0 = c (b a) ;
cdx +
0dx +
fX (x) dx =
1
din conditia
Z
1
fX (x) dx = 1
obtinem
c = b 1a :
Deci
fX (x) =
1
b a;
dac
a x 2 [a; b] ;
0; altfel.
(5.1)
Dup
a cum vedem din gura de mai jos, este constant
a pe [a; b] si n
altimea
trebuie s
a e b 1 a pentru ca aria de sub densitate s
a e 1:
47
FX (x) =
8 Z
>
>
>
>
>
>
< Z
0du = 0; dac
a x < a;
Z
x
x
u x
x a
1
a x 2 [a; b] ;
0du +
fX (u) du =
b a du = 0 + b a ja = b a , dac
>
1
a
1
>
Z
Z
Z
> a
b
x
>
>
1
>
:
0du +
du
+
0du = 0 + 1 + 0 = 1, dac
a x > b:
b a
a
Deci
8
a x < a;
< 0; dac
x a
,
dac
a x 2 [a; b] ;
FX (x) =
: b a
1, dac
a x > b;
(5.2)
0=
Z
b2 a2
2(b a)
2
X
hb
=
Z
1
a+b
2 :
1
(x
0dx = 0+ b 1 a
b a 2
2
mX ) fX (x) dx =
(x mX )3 b
ja +0
3
b a 2
2
0dx +
i
2
Z
Z
b
x
a
a dx +
0dx +
1
(b mX )3 (a mX )3
3(b a)
2
1
b
0dx = 0 + 2(bx
Z
b
a) ja +
2
(x mX ) dx +
a
(b a)[(b mX )2 +(b mX )(a mX )+(a mX )2 ]
3(b a)
1
b a
+ b 2a
= (b 12a) :
Repartitia uniform
a e una dintre cele mai simple repartitii si e folosit
a de
obicei n situatii unde nu este niciun motiv de a da probabilit
ati inegale la valori
posibile luate de variabila aleatoare pe un interval dat. De exemplu, timpul de
sosire a unui zbor poate considerat uniform repartizat pe un anumit interval
de timp, sau repartitia distantei de la locul nc
arc
aturilor vii pe un pod la
un suport terminal poate reprezentat
a adecvat printr-o repartitie uniform
a
1
3
48
Reparti
tia uniform
a bivariat
a
1
(b1 a1 )(b2 a2 ) ,
0, altfel.
(5.3)
Ia forma unei suprafete plate m
arginit
a de [a1 ; b1 ] de-a lungul axei Ox si
[a2 ; b2 ] de-a lungul axei Oy.
5.2
Reparti
tia Gaussian
a sau normal
a
FX (x) =
1
p
2
exp
1
"
(u
m)
2
du;
1 < x < 1:
(5.5)
Ea nu poate exprimat
a analitic, dar poate evaluat
a numeric pentru orice
x.
Densitatea si functia de repartitie din relatiile (5.4) si (5.5) sunt reprezentate
grac n gurile (a), respectiv (b) urm
atoare, pentru m = 0 si = 1:
49
Gracul densit
atii fX n acest caz particular este o curb
a n form
a de clopot,
simetric
a n jurul originii.
Calcul
amZmedia si dispersia lui X.Z
1
1
i
h
x m
=u
(x m)2
E (X) =
dx =
xfX (x) dx = p12
x exp
2 2
1
1 2
p1
2
( u + m) exp
u2
2
du =
p1
2
6 Z
6
6
4
u2
u exp
du + m
2
1
{z
}
|
p
0 + m 2 = m:
Z 1
Z
2
1
p
var (X) =
[x E (X)] fX (x) dx =
2
1
Z 1
Z 1
2
2
u
2 2
p1
u exp
du = p2
u2 exp
2
2
1
1
Z 1
2
u2
u2
1
p
u
exp
j
exp
du =
1
2
2
2
p1
2
1
1
im par
a
(x
m) exp
u2
2
du =
0
(x m)2
2 2
dx
u exp
Vedem astfel c
a cei doi parametri m si din repartitie sunt media si respectiv deviatia standard a lui X. Aceast
a observatie justic
a alegerea noastr
a
a acestor simboluri speciale pentru ei si de asemenea pune n evidenta o proprietate important
a a repartitiei normale - cunoasterea mediei si dispersiei ei
50
u2
2
exp
7
7
du7 =
5
=u
u2
2
du =
caracterizeaz
a complet repartitia normal
a. Deoarece ne vom referi frecvent la
repartitia normal
a, o not
am cu N m; 2 : De exemplu, X N (0; 9) nseamn
a
c
a X are densitatea dat
a de relatia (5.4) cu m = 0 si = 3.
Se poate ar
ata c
a momentele centrate ale lui X N m; 2 sunt
n
0, dac
a n e impar,
1 3 ::: (n 1) n , dac
a n e par.
(5.6)
a. De
Coecientul de exces 2 = 44 3 este 0 pentru o repartitie normal
aceea ea este folosit
a ca repartitie de referinta pentru 2 .
5.2.1
Teorema limit
a central
a
n
X
Xj ;
j=1
nm
p :
n
51
5.2.2
Tabele de probabilit
a
ti
Datorit
a importantei sale, suntem adesea pusi n situatia s
a evalu
am probabilit
atile asociate cu o variabil
a aleatoare normal
a X N m; 2 , ca
"
#
Z b
2
(x m)
1
exp
dx:
(5.7)
P (a < X b) = p
2 2
2
a
Integrala de mai sus nu poate calculat
a analitic si este n general calculat
a numeric. Pentru comoditate sunt date tabele care ne permit s
a calcul
am
probabilit
ati ca cea din relatia (5.7).
Tabelarea functiei de repartitie pentru repartitia normal
a cu m = 0 si = 1
este dat
a n tabelul A.3 din gura urm
atoare.
O variabil
a aleatoare cu repartitia N (0; 1) se numeste variabil
a aleatoare
normal
a standardizata si o vom nota cu U . Tabelul al
aturat d
a FU (u) doar
pentru punctele din partea dreapt
a a repartitiei (adic
a pentru u 0). Valorile
corespunz
atoare pentru u < 0 sunt obtinute din proprietatea de simetrie a
repartitiei normale standardizate, din relatia
FU ( u) = 1
52
FU (u) :
(5.8)
tab el
P (a < X
b) = P (a < U + m
b) = P
(5.9)
N m;
a
, atunci
<U
(5.10)
P (m
k <X
(5.10)
m+k ) = P ( k <U
(5.8)
53
Reparti
tia normal
a multivariat
a
Dou
a variabile aleatoare X si Y se numesc comun normale dac
a densitatea
comun
a a lor are forma
fXY (x; y) =
1
p
exp
1
2 (1
2)
"
mX
X
(x
mX ) (y
X
(5.12)
unde ( 1; 1) < (x; y) < (1; 1). Relatia (5.12) descrie repartitia normala bivariata. Sunt cinci parametri asociati cu ea: mX ; mY ; X (> 0) ; Y
(> 0) ; si (j j
1). O reprezentare grac
a tipic
a a acestei densit
ati, pentru
mX = mY = 0 si X = Y este n gura urm
atoare.
54
mY )
mY
Y
#)
Densitatea marginal
a a variabilei aleatoare X este
fX (x) =
fXY (x; y) dy =
1
p
exp
"
(x
mX )
2
2
X
1 < x < 1:
Astfel, X
N mX ; 2X . Similar, Y
N mY ; 2Y si
= XXYY este
coecientul de corelatie al lui X si Y . Vedem astfel c
a cei cinci parametri
continuti n densitatea bivariat
a fXY (x; y) reprezint
a cinci momente importante
asociate cu variabilele aleatoare. De asemenea observ
am c
a repartitia normal
a
bivariat
a este complet caracterizat
a de momentele comune de ordinul 1 si 2 ale
lui X si Y .
Teorema 5.3. Corelatie zero implic
a independenta cnd variabilele aleatoare
sunt comun normale.
Demonstra
tie. Punnd = 0 n relatia (5.12), obtinem
fXY (x; y) =
1
p
exp
"
(x
mX )
2
2
X
adic
a X si Y sunt independente.
55
#) (
1
p
exp
"
(x
mY )
2
2
Y
#)
= fX (x) fY (y) ;
Aceast
a proprietate nu este valabil
a n general.
Avem repartitie normala multivariata cnd cazul a dou
a variabile aleatoare
e extins la cel implicnd n variabile aleatoare.
Fie n variabile aleatoare, X1 ; X2 ; :::; Xn . Ele se numesc comun normale dac
a
densitatea lor comun
a e de forma
n
2
j j
1
2
exp
1
(x
2
m)
= E ((Xi
mi ) (Xj
(x
ij i;j=1;n
mj )) ;
m1 ;:::;mn
n
2
perechi de n
Teorema 5.4. Fie X1 ; X2 ; :::; Xn n variabile aleatoare repartizate comun normal (nu necesar independente). Atunci variabila aleatoare
Y = c1 X1 + c2 X2 + ::: + cn Xn
este repartizat
a normal, unde c1 ; c2 ; :::; cn sunt constante.
Teorema 5.5. Fie X1 ; X2 ; :::; Xn n variabile aleatoare repartizate normal
(nu necesar independente). Atunci variabilele aleatoare Y1 ; Y2 ; :::; Ym , unde
Yj =
n
X
cjk Xk ;
j = 1; 2; :::; m;
k=1
56
m) ;
1 < x < 1;
5.3
Reparti
tia lognormal
a
Am v
azut c
a repartitii normale rezult
a din sume de multe actiuni aleatoare.
Consider
am acum un alt fenomen obisnuit care este rezultanta multor efecte
aleatoare multiplicative. Un exemplu de fenomen multiplicativ este studiul de
oboseal
a a materialelor unde avaria intern
a a materialului la o anumit
a etap
a de
nc
arcare este o proportie aleatoare din avaria de la etapa precedent
a. n biologie, repartitia m
arimii unui organism este alt exemplu pentru care cresterea este
subiectul multor impulsuri, ecare dintre acestea ind proportional cu m
arimea
momentan
a. Alte exemple includ repartitia m
arimii particulelor sub forte de
impact sau impulsive, repartitia vietii componentelor mecanice, repartitia veniturilor personale datorit
a ajust
arilor anuale, si alte fenomene similare.
S
a consider
am
Y = X1 X2 :::Xn :
(5.13)
(5.14)
fY (y) =
1p
exp
y X 2
0, altfel.
1
2
2
X
(ln y
mX )
, pentru y > 0;
(5.15)
57
X:
Deoarece, datorit
a simetriei repartitiei normale,
=
m
;
X
X
putem scrie
mX = ln
Scriind
ln Y
58
fY (y) =
n termeni de
(
Y
1p
ln Y
exp
0, altfel.
si
ln Y
1
2
2
ln Y
y
Y
, pentru y > 0;
mY = Y exp
2
2
Y = mY exp
5.3.1
ln2
2
2
ln Y
;
1 :
Tabele de probabilit
a
ti
Datorit
a leg
aturii dintre repartitia normal
a si repartitia lognormal
a prin relatia (5.14), calculele de probabilit
ati implicnd o variabil
a aleatoare repartizat
a
lognormal pot f
acute cu ajutorul tabelului de probabilit
ati pentru variabile
aleatoare normale.
Consider
am functia de repartitie a lui Y . Avem
FY (y) = P (Y
y) = P (X
FY (y) = FU
ln y
ln
ln y) = FX (ln y) ;
= FU
ln Y
ln
ln Y
y > 0:
2
ln Y
, avem
y > 0:
(5.16)
5.4
Reparti
tia gamma
si reparti
tii n leg
atur
a cu aceasta
( )x
, pentru x > 0;
0, altfel,
(5.17)
(n) = (n
du;
1)!; 8n 2 N :
Observ
am din aceste guri c
a determin
a forma repartitiei n timp ce
este un parametru de scar
a pentru repartitie. n general, densitatea gamma
este unimodal
a, cu vrful n x = 0 pentru
1 si n x = 1 pentru > 1:
Se poate ar
ata c
a repartitia gamma este un model pentru timpul cerut pentru un total de exact sosiri Poisson. Datorit
a largii aplicabilit
ati a sosirilor
Poisson, repartitia gamma are de asemenea numeroase aplicatii.
Functia de repartitie a variabilei aleatoare X avnd repartitia gamma este
FX (x) =
8 Z
<
:
fX (u) du =
0
( )
0, altfel.
du =
( ; x)
( ) ,
pentru x > 0;
(5.18)
dx;
2
X
60
2:
(5.19)
5.4.1
Reparti
tia exponen
tial
a
fX (x) =
(5.20)
unde
> 0 este parametrul repartitiei. Functia de repartitie, media si
dispersia ei se obtin din relatiile (5.18) si (5.19) punnd = 1:
FX (x) =
1 e x , pentru x
0, altfel,
mX =
2
X
0;
(5.21)
2:
(5.22)
t) =
1 P (T > t) , pentru t
0, altfel.
0;
1 e t , pentru t
0, altfel.
0;
Comparnd aceast
a expresie cu relatia (5.21), putem stabili c
a timpul ntre 2
sosiri Poisson succesive are o repartitie exponential
a; parametrul din repartitia
lui T este rata medie a sosirilor Poisson.
Deoarece timpurile ntre sosiri Poisson sunt independente, timpul cerut pentru un total de n sosiri Poisson este o sum
a de n variabile aleatoare independente
si repartizate exponential. Fie Tj ; j = 1; 2; :::; n, timpul ntre sosirile j 1 si j.
Timpul cerut pentru un total de n sosiri, notat cu Xn este
Xn = T1 + T2 + ::: + Tn ;
unde Tj ; j = 1; 2; :::; n, sunt independente si repartizate exponential cu acelasi parametru . Se poate ar
ata c
a Xn este gamma repartizat
a cu = n si
= . Astfel, repartitia gamma este potrivit
a pentru a descrie timpul cerut
pentru un total de sosiri Poisson.
61
Fiabilitatea
si legea de defectare exponen
tial
a n studiile de abilitate,
timpul pn
a la defectarea unui component zic sau un sistem este repartizat
exponential, dac
a unitatea se defecteaz
a imediat ce un singur eveniment, ca defectarea unui component, apare, presupunnd c
a astfel de fenomene se ntmpl
a
independent.
Fie variabila aleatoare T , timpul pn
a la defectarea unui component sau
sistem. Functia care d
a probabilitatea de defectiune n timpul unei cresteri mici
de timp, presupunnd c
a nicio defectiune nu a ap
arut nainte de acel timp e
notat
a cu h (t) si se numeste functia hazard sau rata defectarii si este denit
a
de
h (t) dt = P (t < T
t + dtjT
t) ;
ceea ce d
a
h (t) =
fT (t)
:
1 FT (t)
(5.23)
Portiunea initial
a a curbei reprezint
a "mortalitatea infantil
a", atribuibil
a
defectelor componente si imperfectiunilor de fabricare. Portiunea relativ constant
a a curbei h (t) reprezint
a perioada "n uz", n care defectiunea este ntmpl
atoare. Defectiunea din uzur
a de lng
a sfrsitul vietii componentului este
ar
atat
a ca portiunea cresc
atoare a curbei h (t). Fiabilitatea sistemului poate
62
optimizat
a prin testarea initial
a a defectelor, nainte punerea n functiune, pn
a
la timpul t1 , pentru a evita defectarea prematur
a, si prin nlocuirea partial
a la
timpul t2 pentru a evita uzura.
Ar
at
am c
a legea de defectare exponential
a este potrivit
a n timpul perioadei
"n uz" a vietii normale a unui sistem. nlocuind
fT (t) = e t
si
FT (t) = 1 e t
n relatia (5.23) avem
h (t) = :
Observ
am c
a parametrul din repartitia exponential
a joac
a rolul unei rate
de defectare constante.
Am v
azut c
a repartitia gamma este potrivit
a pentru a descrie timpul pentru
un total de sosiri Poisson. n contextul legilor de defectare, repartitia gamma
poate gndit
a ca o generalizare a legii de defectare exponential
a pentru sisteme
ce se defecteaz
a imediat de evenimente esueaz
a, presupunnd c
a evenimentele
au loc n concordanta cu legea Poisson. Astfel, repartitia gamma este potrivit
a
ca model al timpului pn
a la defectare pentru sisteme care au o unitate care
functioneaz
a si
1 unit
ati n standby; aceste unit
ati intr
a n functionare pe
rnd, pe m
asur
a ce se defecteaz
a celelalte si ecare are o repartitie exponential
a
a timpului pn
a la defectare.
5.4.2
Reparti
tia chi-p
atrat
(5.25)
are o repartitie
cu n grade de libertate.
Datorit
a acestei relatii, repartitia 2 este una dintre principalele unelte n
inferenta statistic
a si testarea ipotezelor.
Densitatea din relatia (5.24) este reprezentat
a n gura urm
atoare pentru
cteva valori ale lui n:
63
Se observ
a c
a, cnd n creste, forma lui fX (x) devine mai simetric
a. Din
relatia (5.25), deoarece X poate exprimat
a ca o sum
a de variabile aleatoare
identic repartizate, ne astept
am ca repartitia 2 s
a tind
a la o repartitie normal
a
cnd n ! 1 pe baza teoremei limit
a central
a.
Media si dispersia unei variabile aleatoare X avnd o repartitie 2 cu n grade
de libertate se obtin din relatia (5.19):
2
X
mX = n;
5.5
= 2n:
Reparti
tia beta
si reparti
tii n leg
atur
a cu aceasta
fX (x) =
unde parametrii
beta denit
a prin
( + )
( ) ( )x
(1
x)
0, altfel,
si
(5.26)
B( ; ) =
64
( ) ( )
:
( + )
+ )2 ( + +1)
(5.27)
Datorit
a versatilit
atii ei ca o repartitie pe un interval nit, repartitia beta
este folosit
a pentru a reprezenta un mare num
ar de cantit
ati zice pentru care
valorile sunt restrictionate la un interval identicabil. Cteva din ariile de aplicare sunt limitele de toleranta, controlul calit
atii si abilitatea.
Presupunem c
a un fenomen aleator Y poate observat independent de n
ori si dup
a ce aceste n observatii independente sunt ordonate cresc
ator, e
y1 y2 ::: yn valorile lor. Dac
a variabila aleatoare X este folosit
a pentru a
nota proportia din Y care ia valori ntre yr si yn s+1 , se poate ar
ata c
a X are
o repartitie beta cu = n r s + 1 si = r + s, adic
a
65
fX (x) =
5.5.1
(n+1)
n r s
(n r s+1) (r+s) x
r+s 1
(1
x)
0, altfel.
Tabele de probabilit
a
ti
FX (x) =
8
0, pentruZ x
>
>
<
x
>
>
:
( + )
( ) ( )
1, pentru x
0;
1
(1
u)
(5.28)
1:
Are de asemenea forma unei functii beta incomplete pentru care valorile
pentru valori date ale lui si pot g
asite din tabele matematice. Functia
beta incomplet
a e notat
a de obicei cu Ix ( ; ). Notnd FX (x) cu parametrii
si cu F (x; ; ), dac
a
, atunci
F (x; ; ) = Ix ( ; ) :
Dac
a
< , atunci
F (x; ; ) = 1
I(1
x)
( ; ):
O alt
a metod
a de evaluare a lui FX (x) din relatia (5.28) este de a observa
similaritatea n form
a dintre fX (x) si pY (k) a unei variabile aleatoare binomiale
Y , pentru cazul cnd ; 2 N . Din relatia (4.1),
n!
pk q n k ;
k! (n k)!
Din relatia (5.26), pentru cazul cnd ;
pY (k) =
fX (x) =
( +
1)!
x
1)! (
1)!
(1
x)
k = 0; 1; 2; :::; n:
(5.29)
2 N , obtinem
;
= 1; 2; :::;
= 1; 2; :::;
0 < x < 1;
si stabilim relatia
fX (x) = ( +
1) pY (k) ;
0 < x < 1;
FY (k) ;
= 1; 2; :::;
0 < x < 1;
cu k =
1, n = +
2 si p = x. Functia de repartitie FY a unei
variabile aleatoare binomiale Y este de asemenea tabelat
a si poate folosit
a
pentru a avantaja aici evaluarea lui FX (x) asociat
a cu repartitia beta.
66
5.5.2
Reparti
tia beta generalizat
a
a) X + a;
(5.30)
fY (y) =
(b a)
( + )
1
( ) ( )
(y
a)
(b
y)
0, altfel.
(5.31)
5.6
Reparti
tii de valori extreme
y \ ::: \ Xn
indep.
y) = P (X1
y) P (X2
y) :::P (Xn
y) =
Dac
a Xj sunt continue, densitatea lui Yn este
fYn (y) =
dFYn (y)
n
= n [FX (y)]
dy
fX (y) :
Deci
FZn (z) = 1
[1
FX (z)] :
Dac
a Xj sunt continue, densitatea lui Zn este
n 1
fZn (z) = n [1
5.6.1
FX (z)]
fX (z) :
Reparti
tii asimptotice de tip I ale valorilor extreme
Repartitia asimptotic
a de tip I a valorilor maxime este repartitia limitei lui
Yn (cnd n ! 1) dintr-o repartitie initial
a FX (x) a c
arei coad
a dreapt
a este
nem
arginit
a si este de tip exponential. Pentru acest caz, putem exprima FX (x)
n forma
FX (x) = 1
exp [ g (x)] ;
(5.32)
n!1
Teorema 5.6. Fie variabilele aleatoare X1 ; X2 ; :::; Xn independente si identic repartizate cu aceeasi functie de repartitie FX (x). Dac
a FX (x) e de forma
dat
a de relatia (5.32), avem
FY (y) = exp f exp [
(y
u)]g ;
1 < y < 1;
:
6 2
u este parametru de locatie si este parametru de scal
a al repartitiei. Coecientul de asimetrie este n acest caz 1 ' 1; 1396 si e independent de si
u. Acest rezultat arat
a c
a repartitia valorii maxime de tip I are o form
a x
a cu
o coad
a dominant
a spre dreapta. O form
a tipic
a pentru fY (y) este aratat
a n
gura urm
atoare.
68
Repartitia asimptotic
a de tip I pentru valori minime este repartitia limitei
lui Zn cnd n ! 1 dintr-o repartitie initial
a FX (x) a c
arei coad
a stng
a este
nem
arginit
a si este de tip exponential cnd descreste la 0 spre stnga. Un
exemplu de FX (x) care apartine acestei clase este repartitia normal
a.
Dac
a punem
lim Zn = Z;
n!1
exp f exp [ (z
u)]g ;
1 < z < 1;
Reparti
tii asimptotice de tip II ale valorilor extreme
Repartitia asimptotic
a de tip II a valorilor maxime apare ca repartitia limitei
lui Yn cnd n ! 1 dintr-o repartitie initial
a de tip Pareto, adic
a, FX (x) e
limitat
a la stnga n 0 si coada ei dreapt
a este nem
arginit
a si se apropie de 1
conform
FX (x) = 1
ax
Pentru aceast
a clas
a
69
a; k; x > 0:
(5.33)
y
v
FY (y) = exp
v; k; y > 0:
1
k
= v2
2
k
1
k
Fie YI si YII variabile aleatoare avnd repartitii asimptotice de tip I, respectiv II ale valorilor maxime. Atunci ele sunt legate prin
FYII (y) = FYI (ln y) ;
iar parametrii
prin
y > 0;
u = ln v si
= k:
Dac
a YI si YII sunt continue, densit
atile lor sunt n relatia
fYII (y) =
1
fY (ln y) ;
y I
y > 0:
Repartitia asimptotic
a de tip II a valorilor minime apare n conditii analoage.
Cu FX (x) limitat
a la dreapta n 0 si apropiindu-se de 0 la stnga ntr-o manier
a
analoag
a relatiei (5.33), avem
FZ (z) = 1
exp
z
v
v; k > 0;
z < 0:
Nu e asa util
a ca omoloagele de tip I si III, deoarece n practic
a repartitiile
initiale cerute nu sunt frecvent ntlnite.
5.6.3
Reparti
tii asimptotice de tip III ale valorilor extreme
") ;
70
c; k > 0;
":
Aceast
a clas
a de repartitii este m
arginit
a la stnga n x = ". Repartitia
gamma este o astfel de repartitie cu " = 0.
Se poate ar
ata c
a functia de repartitie asimptotic
a de tip III a valorii minime
este
"
#
k
z "
FZ (z) = 1 exp
;
k > 0; w; z > ";
(5.34)
w "
si, dac
a Z e continu
a,
fZ (z) =
k
w
"
z
w
"
"
k 1
exp
"
z
w
"
"
k > 0;
w; z > ":
(5.35)
1
k
;
2
1+
1
k
Am v
azut c
a repartitia exponential
a e folosit
a ca o lege a defect
arii n studii
de abilitate, corespunznd unei functii hazard constante. Repartitia dat
a de
relatiile (5.34) si (5.35) este frecvent folosit
a ca un model generalizat al timpului
pn
a la defectare pentru cazurile n care functia hazard variaz
a cu timpul. Se
poate ar
ata c
a functia hazard
h (t) =
k
w
t
w
k 1
t > 0;
") si
")] ;
z > ";
= k. Dac
a sunt continue,
fZIII (z) =
72
Func
tii (transform
ari) de variabile aleatoare
6.1
Func
tii de o variabil
a aleatoare
Fie
Y = g (X) ;
(6.1)
Reparti
tia
Dac
a X este variabil
a aleatoare, atunci Y , ind o functie de X denit
a de relatia
(6.1), este de asemenea o variabil
a aleatoare. Fie RX , multimea valorilor lui X;
si RY multimea valorilor lui Y:
Pentru ecare rezultat X = x, rezult
a din relatia (6.1) c
a Y = y = g (x).
Relatia (6.1) deneste si o functie de la RX la RY . Probabilit
atile asociate cu
ecare punct (n cazul unei variabile aleatoare discrete X) sau ecare regiune (n
cazul unei variabile aleatoare continue X) din RX sunt transportate n punctul
sau regiunea corespunz
atoare din RY . Repartitia lui Y este determinat
a prin
completarea acestui proces de transfer pentru ecare punct (dac
a X e discret
a)
sau ecare regiune de tipul Y
y (dac
a X e continu
a) din RY . Este posibil ca
g s
a duc
a mai multe puncte din RX ntr-un singur punct din RY . Determinarea
repartitiei lui Y depinde astfel de forma lui g din relatia (6.1).
Variabile aleatoare discrete Fie X variabil
a aleatoare discret
a cu functia
mas
a de probabilitate pX . Functia mas
a de probabilitate a lui Y este
X
pY (y) =
pX (x) ; 8y 2 RY ;
x2g
unde g
1 (y)
1
8
1
8
Y = 2X + 1:
2
Valorile lui Y sunt g ( 1) = 2 ( 1) + 1 = 3; g (0) = 1; g (1) = 3; g (2) = 9.
1
1
Avem g (1) = f0g ; g (3) = f 1; 1g ; g 1 (9) = f2g, deci pY (1) = pX (0) =
73
1
4 ; pY
(3) = pX ( 1) + pX (1) =
1 3 9
:
1
5
1
4
1
2
1
8
5
8 ; pY
(9) = pX (2) =
1
8.
De aici,
Dac
a g : RX ! RY este injectiv
a, valorile posibile luate de X sunt x1 ; x2 ; :::,
valorile luate de Y sunt y1 = g (x1 ) ; y2 = g (x2 ) ; ::: si
pX (xi ) = pi ;
i = 1; 2; :::;
atunci
pY (yi ) = pY (g (xi )) = pi ;
Exemplul 6.2. Fie X
1
1
2
i = 1; 2; ::::
1
4
1
8
1
8
Y = 2X + 1:
Valorile lui Y sunt g ( 1) = 2 ( 1) + 1 = 1; g (0) = 1; g (1) = 3; g (2) = 5.
1 1 3 5
Functia g este injectiv
a, deci Y
:
1
1
1
1
2
74
(6.2)
y) :
Regiunea denit
a de Y
y din RY acoper
a portiunea ngrosat
a a curbei
de transformare, dup
a cum e ar
atat n gura al
aturat
a, care, n RX corespunde
regiunii g (X) y, sau X g 1 (y), unde
1
2
este functia invers
a a lui g, sau solutia x n functie de y a ecuatiei (6.2). De
aici,
g
FY (y) = P (Y
y) = P (g (X)
(y) =
y) = P X
(y) = FX g
(y) :
(6.3)
fY (y) =
d
dFY (y)
=
FX g
dy
dy
(y)
= fX g
(y)
dg
(y)
:
dy
(6.4)
2X + 1:
g
76
(6.5)
(y) +
FY (y) = P (Y
d
dFY (y)
=
1
dy
dy
(y) = 1 P X
FX g
(y)
fX g
(y) = 1 FX g
(y) :
(6.6)
n comparatie cu relatia (6.3), relatia (6.6) d
a o leg
atur
a diferit
a ntre functiile de repartitie ale lui X si Y , datorit
a unui g diferit.
Derivnd n relatia (6.6) n raport cu y obtinem relatia dintre densit
atile lui
X si Y :
fY (y) =
y) = P X > g
(y)
dg
(y)
:
dy
(6.7)
(y)
dg
(y)
:
dy
(6.8)
a
;
(x2 + a2 )
1 < x < 1;
Consider
am acum cazul cnd g nu este strict monoton
a. n gura urm
atoare,
pentru y < y1 si y > y2 , ecuatia g (x) = y are solutie unic
a si relatia (6.8) poate
folosit
a pentru a determina densitatea lui Y n aceste intervale.
77
Pentru y1 y y2 , trebuie s
a plec
am de la nceput si consider
am FY (y) =
P (Y
y). Regiunea denit
a de Y
y n RY acoper
a portiunile ngrosate ale
curbei y = g (x), dup
a cum este ar
atat n gur
a. Astfel,
FY (y) = P (Y
y) = P X g1 1 (y) + P g2 1 (y) < X g3 1 (y) =
1
P X g1 (y) + P X g3 1 (y)
P X g2 1 (y) =
1
1
1
FX g1 (y) + FX g3 (y)
FX g2 (y) ; y1 < y < y2 ;
(6.9)
unde x1 = g1 1 (y) ; x2 = g2 1 (y) ; x3 = g3 1 (y) sunt r
ad
acinile ecuatiei
g (x) = y n termeni de y.
Ca mai sus, relatia ntre densit
atile lui X si Y e g
asit
a derivnd n relatia
(6.9) n raport cu y:
dg1 1 (y)
dg3 1 (y)
dg2 1 (y)
+fX g3 1 (y)
fX g2 1 (y)
; y 1 < y < y2 :
dy
dy
dy
(6.10)
fY (y) = fX g1 1 (y)
Deoarece derivata
(6.10) ia forma
dg2 1 (y)
dy
fY (y) =
3
X
j=1
e negativ
a n timp ce celelalte sunt pozitive, relatia
fX gj 1 (y)
dgj 1 (y)
;
dy
78
y 1 < y < y2 :
(6.11)
Figura urm
atoare reprezint
a transformarea y = sin x; aceast
a ecuatie are o
innitate num
arabil
a de r
ad
acini, x1 = g1 1 (y) ; x2 = g2 1 (y) ; ::: 8y 2 [ 1; 1] :
Urmnd procedura de mai sus se poate stabili pentru FY (y) o relatie similar
a
cu (6.9) (dar cu o innitate de termeni) si, precum n relatia (6.11), densitatea
lui Y are acum forma
fY (y) =
1
X
fX gj 1 (y)
j=1
dgj 1 (y)
;
dy
1 < y < 1:
(6.12)
Se observ
a c
a fY (y) = 0 pentru y 2
= [ 1; 1], deoarece FY (y) = 0, 8y
1
si FY (y) = 1; 8y 1:
Relatiile (6.11) si (6.12) conduc la urm
atorul rezultat:
Teorema 6.2. Fie X o variabil
a aleatoare continu
a si Y = g (X), unde
g este continu
a, si g (x) = y are un num
ar cel mult num
arabil de r
ad
acini
x1 = g1 1 (y) ; x2 = g2 1 (y2 ) ; :::. Atunci:
fY (y) =
r
X
fX gj 1 (y)
j=1
dgj 1 (y)
;
dy
79
(6.13)
x2
2
1 < x < 1:
Y
0 =) FY (y) = P (Y
y) = P (;) = 0; 8y < 0 =) fY (y) = FY0 (y) =
0; 8y < 0. Pentru y > 0, r
ad
acinile lui x2 = y sunt
p
y:
1
p
2 y
+ fX
1
p
2 y
j=1
y
2
p1 e
2 y
deci
p1 e
2 y
fY (y) =
y
2
, pentru y > 0;
0, altfel.
6.1.2
Momente
E (Y ) = E (g (X)) =
Zi 1
(6.14)
g n (x) fX (x) dx, dac
a X e continu
a.
1
2
1
4
1
8
1
8
sia lui Y = 2X + 1:
Folosim prima relatie (6.14).
X
E (Y ) = E (2X + 1) =
(2xi + 1) pX (xi ) = ( 1)
i
E Y
= E (2X + 1)
(2xi + 1) pX (xi ) = 1
5:
2
Y
=E Y2
E 2 (Y ) = 5
1
1
1
1
2 +1 4 +3 8 +5 8
3 2
4
=
80
71
16 :
= 34 :
1
1
1
1
2 +1 4 +9 8 +25 8
6.2
Func
tii de dou
a sau mai multe variabile aleatoare
Consider
am transformarea
Y = g (X1 ; X2 ; :::; Xn ) ;
(6.15)
1 (y)
y) = P (g (X)
y) = FX (x : g (x)
y) :
(6.16)
unde Rn = fx 2 R jg (x)
din relatia (6.17).
6.2.1
Consider
am suma
Y = g (X1 ; X2 ; :::; Xn ) = X1 + X2 + ::: + Xn :
E sucient s
a determin
am fY (y) pentru n = 2. Rezulatatul pentru acest caz
poate apoi aplicat succesiv pentru a da repartitia sumei oric
arui num
ar de
variabile aleatoare. Pentru Y = X1 + X2 , relatiile (6.16) si (6.17) dau
ZZ
FY (y) =
fX1 X2 (x1 ; x2 ) dx1 dx2 ;
(R2 :x1 +x2 y)
si, dup
a cum se observ
a din gura urm
atoare, n care este reprezentat
a R2 =
2
x 2 R jx1 + x2 y , avem
81
FY (y) =
1
1
y x2
(6.18)
(6.19)
(6.20)
Integrala din relatia (6.20) se numeste convolutia functiilor fX1 (x1 ) si fX2 (x2 ) :
Teorema 6.3. Fie X1 si X2 variabile aleatoare continue independente si
Y = X1 + X2 . Atunci densitatea lui Y este convolutia densit
atilor lui X1 si X2 ,
adic
a
fY (y) =
fX1 (y
82
1
1
fX2 (y
6.3
m func
tii de n variabile aleatoare
Fie
Yj = gj (X1 ; :::; Xn ) ;
j = 1; 2; :::; m;
n:
(6.22)
Vrem s
a obtinem repartitia comun
a a variabilelor aleatoare Yj ; j = 1; 2; :::; m,
stiind repartitia comun
a a variabilelor aleatoare Xk ; k = 1; 2; :::; n.
Dac
a X1 ; X2 ; :::; Xn sunt discrete cu masa comun
a pX (x), atunci masa comun
a a variabilelor aleatoare Y1 ; :::; Ym este
X
pY (y) =
pX (x) ; 8y 2 RY ;
x2g
1 (y)
(6.23)
(Y) ;
exist
a si sunt unice. Au de asemenea derivate partiale continue.
Pentru a determina fY (y) n termeni de fX (x), observ
am c
a, dac
a o regiune
n
n
nchis
a RX
din multimea valorilor lui X este dus
a ntr-o regiune nchis
a RY
din
multimea valorilor lui Y prin transformerea g, conservarea probabilit
atii d
a
Z
Z
Z
Z
fY (y) dy =
fX (x) dx;
(6.24)
n
RY
n
RX
n
RY
83
J=
@g1 1
@y1
@g1 1
@y2
..
.
@gn
@y1
:::
..
.
@g1 1
@yn
..
.
@gn
@y2
:::
(6.26)
@gn
@yn
(y) jJj ;
(6.27)
@g1 1
@y1
@g2 1
@y1
@g1 1
@y2
@g2 1
@y2
1
2
1
2
1
2
1
2
1
:
2
Datorit
a independentei, relatia (6.27) conduce la
2
2
) p1
( y1 +y
2
fY1 Y2 (y1 ; y2 ) = fX1 g1 1 (y) fX2 g2 1 (y) jJj = p12 exp
exp
2
2
h
i
h
i
y12 +y22
(y1 +y2 )2
(y1 y2 )2
1
1
exp
= 41 exp
; y1 ; y2 2 R:
2 = 4 exp
8
8
4
Observ
am c
a rezultatul poate scris sub forma
y12
4
y1 2 R;
1
fY2 (y2 ) = p exp
4
y22
4
y2 2 R;
implicnd c
a, desi Y1 si Y2 sunt ambele functii de X1 si X2 , ele sunt independente
si identic repartizate N (0; 2).
Relatia (6.27) este o extindere a relatiei (6.8), care este pentru cazul special
n = 1. Similar, o extindere este de asemenea posibil
a pentru relatia (6.13)
pentru cazul n = 1 cnd ecuatia are mai mult de o r
ad
acin
a.
84
( y1 2 y2 )
2
r
X
j=1
fX gj 1 (y) jJj j ;
(6.28)
Jj =
@gj11
@y1
@gj11
@y2
@gjn1
@gjn1
@y1
@y2
..
.
:::
..
.
@gj11
@yn
..
.
:::
@gjn1
@yn
Aici
sunt componentele lui gj 1 .
Rezultatele prezentate mai sus pot de asemenea aplicate n cazul cnd
dimensiunea lui Y este mai mic
a dect cea a lui X. Consider
am transformarea
(6.22) n care m < n. Pentru a folosi formulele de mai sus, nti complet
am
vectorul aleator m-dimensional Y cu un alt vector aleator (n m)-dimensional
Z. Vectorul Z poate construit ca o functie simpl
a de X, n forma
Z = h (X) ;
(6.29)
85
Part II
Statistic
a
7
7.1
Statistic
a descriptiv
a pentru date unudimensionale (reprezent
ari grace, func
tie de reparti
tie de selec
tie, momente de selec
tie)
Histograme
si diagrame de frecven
te
86
87
Se observ
a c
a proiecteaz
a o impresie vizual
a mult diferit
a si cu o mai mic
a
acuratete a comportamentului datelor. Astfel, e important s
a e ales num
arul
de intervale n concordanta cu informatia care se vrea extras
a din modelul
matematic. Ca un ghid practic, Sturges a sugerat n 1926 ca o valoare aproximativ
a pentru num
arul de intervale k s
a e dat
a de
k ' 1 + 3; 3 lg n;
unde n este num
arul de date.
Din punctul de vedere al model
arii, este rezonabil s
a alegem o repartitie
normal
a ca model probabilistic pentru randamentul procentual X observnd
c
a variatiile aleatoare ale ei sunt rezultanta a numeroase surse aleatoare independente n procesul chimic de fabricare. Dac
a aceasta este sau nu o alegere
rezonabil
a poate evaluat intr-un mod subiectiv folosind diagrama frecventelor
din gura al
aturat
a. Densitatea repartitiei normale de medie 70 si dispersie 4
este trasat
a punctat pe diagrama frecventelor, ar
atnd o potrivire rezonabil
a.
Bazndu-ne pe aceast
a repartitie normal
a, putem calcula probabilit
atile de mai
89
mX '
1X
xj ;
n j=1
2
X
'
1X
(xj
n j=1
mX ) :
Bazat
a pe acest set de observatii, histograma are forma dat
a n gura urm
atoare.
90
7.2
Selec
tii
si statistici
91
(7.1)
7.2.1
Media de selec
tie
Statistica
X=
1X
Xi
n i=1
e numit
a media de selectie a populatiei X. Fie media si dispersia populatiei
E(X) = m;
var(X) = 2 :
(7.2)
E(X) =
1X
1
E (Xi ) = (nm) = m:
n i=1
n
1
n2 E
1
n2
0"
@
0
@
n
X
(Xi
i=1
n
X
(Xi
m) + 2
i=1
2
n
X
4
E (Xi
1
n2
1
n2
i=1
+2
m)
deci
(Xi
m) (Xj
+2
E ((Xi
1 i<j n
E ((Xi
m)A =
m) (Xj
3
7
7
E ((Xi m))E ((Xj m))7
=
|
{z
}|
{z
}7
5
n
=0
m))5 =
indep endenta
m))5
=
m) (Xj
1 i<j n
6 n
X
6X 2
6
+2
6
4 i=1
1 i<j
| {z }
=n
1 i<j n
i=1
2
n
X
4
i=1
#2 1
m) A =
#2 1
m) A =
1
n2
=0
var(X) =
;
n
care este invers proportional
a cu m
arimea selectiei n. Cnd n creste, dispersia
lui X descreste si repartitia lui X devine ascutit
a cu vrful n E(X) = m. De
aici, este clar intuitiv c
a statistica X d
a o bun
a procedur
a de estimare a mediei
populatiei m.
a de variabile aleatoare independente, pe baza teoDeoarece X este o sum
remei limit
a central
a, media de selectie X tinde la o repartitie normal
a cnd
93
Dispersia de selec
tie
Statistica
1
S2 =
n
X
Xi
(7.3)
i=1
n
X
i=1
2 i=1
4(Xi
1
n
m)
n
X
m)
2
n
(Xi
(Xi
m)
m)
m)
(Xj
m) +
2
n
1
n
1
n
"
"
n
X
#2
"
1
n2
(Xi
m)
i=1
n
X
(Xi
2
n
X
4
(Xi
m)
2
n(n 1)
1
n
#2 9
=
m)
=
;
i=1
32 9
>
=
5
m)
=
>
;
2
n
X
4
(Xj
j=1
m) + 2
i=1
i=1
n
X
(Xi
i=1
(Xi
#2 9
=
m)
=
;
39
=
m)5 =
;
m) (Xj
1 i<j n
(Xi
m) (Xj
m) :
1 i<j n
m)
n
X
j=1
i=1
n
X
m)5 =
(Xj
j=1
8
n >
<
X
1
(X
n 1
> i
i=1 :
8
n
<X
1
(Xi
n 1 :
i=1
8
n
<X
1
(Xi
n 1 :
i=1
8
n
<X
1
(Xi
n 1 :
1
n
32
i=1
n
X
E (Xi m)
{z
}
i=1 |
=
1)
E ((Xi
m) (Xj
m))
indep endenta
1 i<j n
2
n(n 1)
1 i<j n
Deci
E(S 2 ) =
m) =
=0
unde m si
sunt denite de (7.2). Motivul folosirii lui n 1 1 n loc de n1 n (7.3)
este de a face media lui S 2 egal
a cu 2 . Aceasta este o proprietate de dorit
2
pentru S dac
a aceasta este folosit
a la estimarea lui 2 , adev
arata dispersie a
lui X.
2
94
2 2
S2
Se obtine
var(S 2 ) =
unde
1
n
n
n
3
1
= E (X
m)
Momente de selec
tie
Mk =
1X k
X :
n i=1 i
Observ
am c
a media de selectie se obtine pentru k = 1:
Se poate ar
ata c
a
E (Mk ) = k ;
var (Mk ) = n1
2
k
2k
Mkc =
7.2.4
1X
Xi
n i=1
Statistici de ordine
si func
tia de reparti
tie de selec
tie
X(2)
:::
X(n) ;
95
8
a x < X(1) ;
< 0, dac
j
Fbn (x) =
,
dac
a X(j) x < X(j+1) ;
: n
1, dac
a x X(n) :
96
8.1
Statistica
b = h (X1 ; X2 ; :::; Xn )
Nedeplasare
Deni
tie. Un estimator b se numeste estimator nedeplasat pentru
dac
a
E b = ;
1
n
n
X
i=1
i=1
1
n
deoarece E S 2 =
n
X
Xi
i=1
1
n
Dispersie minim
a
Deni
tie. Fie b un estimator nedeplasat pentru . El este un estimator
nedeplasat de dispersie minima dac
a pentru toti ceilalti estimatori nedeplasati
pentru din aceeasi selectie avem
97
var b
var (
):
var X =
;
n
si descreste cnd n creste. Pe baza criteriului dispersiei minime, calitatea
lui X ca estimator pentru m creste cnd n creste.
Teorema 8.1 (inegalitatea Rao-Cramer). Fie X1 ; X2 ; :::; Xn o selectie
de m
arime n din o populatie X cu densitatea f (x; ), unde este parametrul
necunoscut, si e b = h (X1 ; X2 ; :::; Xn ) un estimator nedeplasat pentru .
Atunci, dispersia lui b satisface inegalitatea
var b
nE
@ ln f (X; )
@
!!
(R.C.)
dac
a media si derivata partial
a scrise exist
a. Presupunem c
a se poate deriva in
raport cu sub integral
a. Un rezultat analog se obtine dac
a X este discret
a
nlocuind f (X; ) cu p (X; ), unde p (x; ) este masa populatiei X:
nedeplasare
X1 ;:::;Xn indep endente
Demonstra
tie.
=
E b = E (h (X1 ; X2 ; :::; Xn ))
=
Z 1
Z 1
@
@
:::
h (x1 ; :::; xn ) f (x1 ; ) :::f (xn ; ) dx1 :::dxn =)
1
1=
Z 1
Z
:::
1
1
:::
1
1
1
1
2
n
X
1
h (x1 ; :::; xn ) 4
f (xj ;
j=1
2
3
n
X
@
ln
f
(x
;
)
j
5 f (x1 ; ) :::f (xn ; ) dx1 :::dxn :
h (x1 ; :::; xn ) 4
@
j=1
f (x; ) densitate ) 1 =
Z 1
Z
@f (xi ; )
0=
dx
=
i
@
1
@f (xj ; ) 5
f
)
@
@
@
@ ln f (xi ; )
f
@
98
(8.1)
Fie Y =
E (Y ) =
n
X
@ ln f (X
j;
j=1
n
X
@ ln f (Xj ; )
@
j=1
1
n Z
X
@ ln f (xj ; )
f (xj ; ) dxj = 0:
@
j=1 1
{z
}
|
=0
n
X
j=1
02
B6 @ ln f (Xj ;
6
EB
@
@4
n
X
j=1
(8.1)
@ ln f (X; )
@
E
|
i2
n
h
i2
C X
@ ln f (Xj ; ) 7
@ ln f (Xj ; )
7 C=
E
@
5 A
@
j=1
{z
}
=0
= nE
=0
2
Y
2
b
2
Y
2
bY
independente )
32 1
1 = E( b Y ) = E b E (Y ) +
| {z }
2
b
1)
h
i2
@ ln f (X; )
nE
@
@ ln f (X; )
@
bY
i2
bY
Deni
tie. Marginea inferioar
a a dispersiei oric
arui estimator nedeplasat
dat
a de inegalitatea (RC) este n general o functie de si o numim marginea
inferioara Rao-Cramer. Notatie
1
h
i2
@ ln f (X; )
MIRC = nE
:
@
Observa
tie. MIRC =
nE
@ 2 ln f (X; )
@ 2
@
Demonstra
tie. f (x; ) densitate ) 1 =
f (x; ) dx =)
1
Z 1
Z 1
@
@f (x; )
@ ln f (x; )
@
0=
dx
=
f (x; ) dx =)
@
@
12
1
3
0=
Z
E
6 2
6 @ ln f (x; )
f (x; ) +
6 @ 2
14
1
1
1
1
@ 2 ln f (x; )
f
@ 2
@ ln f (x; )
@
@ ln f (X; )
@
i2
i2
(x; ) +
@ ln f (x; )
@
f (x; ) dx =
=
@ ln f (x; )
@
i2
@ 2 ln f (X; )
@ 2
99
@f (x; )
| @{z }
@ ln f (x; )
f (x;
@
f (x; ) dx =)
@ 2 ln f (x; )
f
@ 2
=)
7
7
7 dx =
5
(x; ) dx =)
MIRC =
nE
@ ln f (X; )
@
i2
@ 2 ln f (X; )
@ 2
nE
Deni
tie. Fie b estimator nedeplasat pentru parametrul . Ecienta lui
b este e b = M IRC :
var ( b )
Observa
tie. Ecienta oric
arui estimator nedeplasat este 1:
Deni
tie. Un estimator nedeplasat cu ecienta 1 se numeste estimator
ecient.
Observatie. Din inegalitatea Rao-Cramer rezult
a c
a orice estimator ecient
este estimator nedeplasat de dispersie minim
a.
Reciproc este adev
arat doar dac
a exist
a un estimator ecient.
Exemple. 1) Fie X N m; 2 . Pe baza unei selectii xate de m
arime n,
este X estimator ecient pentru m?
Am v
azut c
a X este estimator nedeplasat pentru m. Calcul
am MIRC pentru
dispersia oric
arui estimator
nedeplasat
pentru
m:
i
h
(X m)2
(X m)2
f (X; m) = p21 exp
=) ln f (X; m) = ln p21
=)
2 2
2 2
@ ln f (X;m)
@m
X m
2
@ ln f (X;m)
@m
MIRC =
)
i2
h
nE
Dar var X =
1
4
@ ln f (X; )
@
2
E (X
m)
i2
1
2
=)
m:
2) Fie X
N 0; 2 , unde 2 este un parametru necunoscut ce trebuie
estimat dintr-o selectie de m
arime n > 1.
a) S
a se determine MIRC pentru dispersia oric
arui estimator nedeplasat
pentru 2 .
b) Este dispersia de selectie S 2 un estimator ecient pentru 2 ?
X2
R. a) Not
am = 2 =) f (X; ) = 1 1 exp
=)
2
(2
ln f (X; ) =
X2
2
2
@ ln f (X; )
= 2X 2
@
2
)
E @ ln@f (X;
2
1
2
1
2
ln 2
MIRC =
nE
=)
2
)
=) @ ln@f (X;
2
2
1
+ 212
3E X
| {z }
=
)2
X2
1
=)
2 2
1
= 212
2 2
@ 2 ln f (X; )
@ 2
2
2 2
n :
b) Am v
azut c
a S este un estimator
nedeplasat pentru
)
1
n 3 4
2
var S = n 4 n 1
=)
X N 0; 2 =) 4 = 3 4
1
n 3
4
n 3
n 1
M IRC
n 1
=
var(S 2 )
n :
var S 2 =
e S2 =
=)
2 4
n 1
100
2 2
n 1
=)
si
Observ
am c
a S 2 nu este un estimator ecient pentru
M IRC
asimptotic ecient n sensul c
a lim var(S
2 ) = 1:
n!1
8.1.3
Consisten
ta
Deni
tie. Un estimator b bazat pe o selectie de m
arime n este estimator
consistent pentru dac
a
" = 0, 8" > 0:
lim P b
n!1
n!1
si lim var b = 0;
n!1
= b
E b
n (")
P b
"
E b
2 :
Obtinem, pentru n n (")
"
; 8n
2
"
E b
+ E b
n!1
Sucien
ta
" =P
4var b
"2
n (") ;
+ E b
E b
"2
rezult
a c
a 9n (") 2 N a..
n!1
4var b
"
2
E b
E b +E b
E b
" = 0:
"
E b
repartitia conditionat
a a lui Z, dat ind c
a Y = y; nu depinde de , atunci Y
e numit
a statistica sucienta pentru . Dac
a n plus E (Y ) = , atunci Y se
numeste estimator sucient pentru .
Teorema 8.3. (criteriul de factorizare Fisher-Neymann). Fie
Y = h (X1 ; X2 ; :::; Xn )
o statistic
a bazat
a pe o selectie de m
arime n a populatiei continue X. Atunci
Y este o statistic
a sucient
a pentru dac
a si numai dac
a densitatea comun
aa
lui X1 ; X2 ; :::; Xn poate factorizat
a sub forma
n
Y
j=1
Dac
a X este discret
a, conditia este
n
Y
j=1
8.2
Metoda verosimilit
a
tii maxime
Introdus
a de Fischer n 1922 a devenit cea mai important
a metod
a general
a de
estimare din punct de vedere teoretic.
Fie f (x; ) densitatea populatiei X, unde este unicul parametru care trebuie estimat dintr-un set de valori de selectie x1 ; x2 ; :::; xn :
Deni
tie. Functia de verosimilitate a unui set de n valori de selectie din
populatie este
L (x1 ; x2 ; :::; xn ; ) = f (x1 ; ) f (x2 ; ) :::f (xn ; ) :
n cazul n care X este discret
a cu masa p (x; ), avem
L (x1 ; x2 ; :::; xn ; ) = p (x1 ; ) p (x2 ; ) :::p (xn ; ) :
Cnd valorile de selectie sunt date, functia de verosimilitate L devine o
functie de o singur
a variabil
a . Procedura de estimare pentru bazat
a pe
metoda verosimilit
atii maxime const
a n alegerea, ca o estimare pentru , a
valorii particulare care maximizeaz
a L. Maximul lui L ( ) apare in cele mai
)
= 0. De aici, ntr-un mare num
ar de
multe cazuri la valoarea lui unde dL(
d
b
cazuri, estimarea de verosimilitate maxima (EVM) a lui bazat
a pe valorile
de selectie x1 ; x2 ; :::; xn poate determinat
a din
dL x1 ; x2 ; :::; xn ; b
db
102
= 0:
Dup
a cum am v
azut mai sus, functia L este n forma unui produs de functii
de . Deoarece L este ntotdeauna nenegativ
a si si atinge maximul pentru
aceeasi valoare a lui b ca ln L, iar ln L este n form
a de sum
a, este n general
mai usor s
a obtinem EVM b rezolvnd
d ln L x1 ; x2 ; :::; xn ; b
= 0;
db
numit
a ecuatia de verosimilitate.
Solutia dorit
a este una unde r
ad
acina b este o functie de x1 ; x2 ; :::; xn ,
dac
a astfel de r
ad
acin
a exist
a. Cnd exist
a mai multe r
ad
acini ale ecuatiei
de verosimilitate, EVM este r
ad
acina corespunz
atoare maximului global al lui
L sau ln L.
n cazul a m parametri, functia de verosimilitate devine
L (x1 ; x2 ; :::; xn ;
si EVM pentru
verosimilitate
1 ; :::; m
1 ; :::; m ) ;
@ ln L
= 0; j = 1; 2; :::; m:
@bj
(2 ) 2
103
(xj m)2
2 2
=m
exp 4
1
1
(2 ) 2
ln L =
n
X
1
2
n
X
2
m) 5 =)
(xj
j=1
(xj
1
2 n ln 2
1
2 n ln 2
1
2 n ln 2
1
2 n ln
m)
j=1
Fie
= m,
ln L =
1
2 2
@ ln L
@ 1
@ ln L
@ 2
=
=
1
2
2
=)
2 =
n
X
2
(xj
1)
j=1
n
X
(xj
j=1
n
X
1
2 22
1) ;
2
1)
(xj
n
2 2:
j=1
Sistemul de verosimilitate
este
8
n
n
X
X
>
1
1
>
b
b
>
( @ ln L
x
=
0
=)
=
xj ;
j
1
1
>
n
< b2
=0
b
j=1
j=1
@ 1
()
n
n
@ ln L
X
X
2
=0
>
>
n
@b2
b2 = 1
b1
> 12
=
0
=)
xj
x
>
j
n
: 2b2
2b2
j=1
j=1
b1
j=1
b2 =
1
n
n
X
Xj
n 1 2
n S :
j=1
E b2
n!1
var b 2 =
n 1 2
n
var S
lim
=
2
2 4
n
2 4 (n 1)
n2
n 1 2 2 4
n
n 1
= lim
n!1 n 1
9
>
=
=1 >
;
(n 1)
!
n2
n!1
9
=
0 ;
teorem a 8.2
=)
=) b 2 estimator asimp-
104
Avem
1
f (x; ) =
, pentru 0
0, altfel.
(8.2)
xi
; 8i:
(8.3)
Observ
am c
a toate valorile selectiei xi trebuie s
a e mai mici sau egale cu
, implicnd c
a doar portiunea curbei de la dreapta lui max (x1 ; x2 ; :::; xn ) este
aplicabil
a. De aici, maximul lui L apare n = max (x1 ; x2 ; :::; xn ), sau EVM
pentru este
b = max (x1 ; x2 ; :::; xn ) ;
(8.4)
(8.5)
este
Observ
am c
a nu am obtinut relatia (8.4) rezolvnd ecuatia de verosimilitate.
Ecuatia de verosimilitate nu se aplic
a n acest caz deoarece maximul lui L apare
la frontier
a si derivata nu este 0 acolo.
105
(x) fX (x) :
, pentru 0
0, altfel.
n
n+1
var b
Z
x2
n+2
2n
(n+1)2
E b =
E b
n
n+1
n!1h
var b =
E b
n
x+
2 n+1
n
(n+1)2
6=
n
n+1
=n
f b (x) =
nxn
dx =
0
2
xn
h
f b (x) dx =
1
dx =
1
n+2
n
(n+1)2
xn dx =
xn+2
n+2
n
n+1
n
2 n+1
n
(n+1)2 (n+2)
xn+1
n+1 j0
nxn
xn+1
n+1
dx =
n
n+1
=) b este deplasat.
9
=
teorem a 8.2 b
i
=)
estimator consistent.
2
n
;
!
0
2
(n+1) (n+2)
n!1
106
xn
n
j0 =
9.1
n sectiunea precedent
a am considerat estimarea parametrilor repartitiei normale prin metoda verosimilit
atii maxime.
9.1.1
Metoda momentelor
( 1;
2 ; :::; m ) :
Mi =
1X i
X ;
n j=1 j
i = 1; 2; :::.
b 1 ; :::; b m = Mi ;
i = 1; 2; :::; m.
(9.1)
Pasul 2: rezolv
a acest sistem de ecuatii, determinnd b 1 ; :::; b m , numiti
estimatorii de moment pentru 1 ; :::; m .
Nu este necesar s
a consider
am m ecuatii de moment consecutive ca n relatia
(9.1); orice m ecuatii de moment convenabile care conduc la b 1 ; :::; b m sunt
suciente. Ecuatiile momentelor de ordin mai mic sunt totusi preferate deoarece
cer o mai mic
a manipulare a datelor observate.
107
):
= M1 = X;
si
2
= M2 :
Avem
=
1:
X
b1 = X = 1
Xj :
n j=1
(9.2)
Propriet
atile acestui estimator au fost discutate n capitolul precedent. El este
nedeplasat si are dispersie minim
a ntre toti estimatorii nedeplasati pentru m.
Ecuatia momentului de ordinul 2 d
a
n
X
b 21 + b 2 = M2 = 1
X 2;
n j=1 j
sau
b 2 = M2
M12 =
j=1
1
n
j=1
Deci
n
X
Xj2
X :
j=1
Pe de alt
a parte
n
X
1
Xj X
n
0
n
X
@
Xj2
1
n
1
n
n
X
Xj2
2Xj X + X
j=1
2
2XnX + nX A =
1
n
n
X
Xj2
1
n
0
@
n
X
j=1
Xj2
2X
n
X
j=1
Xj + nX A =
X :
j=1
X
b2 = 1
Xj
n j=1
108
(9.3)
Acesta, dup
a cum am ar
atat, este un estimator deplasat pentru 2 .
Estim
arile b1 si b2 ale lui 1 = m si 2 = 2 pe baza valorilor selectiei date
de tabel sunt, urmnd relatiile (9.2) si (9.3)
200
b1
unde xj ;
9.2
b2
1 X
xj ' 70;
200 j=1
200
1 X
xj
200 j=1
b1
' 4;
Intervale de ncredere
1
fU (x) = p e
2
x2
2
(9.6)
Presupunem c
a cerem ca P ( u1 < U < u1 ) = 0; 95: Determin
am u1 .
Z u1
Z u1
Z
0; 95 = P ( u1 < U < u1 ) =
fU (x) dx =
fU (x) dx
u1
(u1 )
( u1 ) =
(u1 ) (1
(u1 )) = 2 (u1 ) 1 )
= 0; 975:
(u1 ) = 0;95+1
2
Din tabelul valorilor functiei rezult
a u1 = 1; 96 si
P ( 1; 96 < U < 1; 96) =
109
u1
fU (x) dx =
1
1;96
fU (x) dx = 0; 95
1;96
(9.7)
)P
1; 96 <
0; 95 )
P
2; 63 < X
5(X m)
3
< 1; 96
= 0; 95 ) P
m < 2; 63 = 0; 95 ) P
P X
5; 88 <
2; 63 < m
5 X
m < 5; 88 =
X < 2; 63 = 0; 95 )
(9.8)
Intervalul de 95% ncredere pentru m este X 2; 63; X + 2; 63 : Folosind relatia (9.4), intervalul de 95% ncredere pentru m estimat pe baza observatiilor
este (m
b 2; 63; m
b + 2; 63) = (1; 82 2; 63; 1; 82 + 2; 63) = ( 0; 81; 4; 45), adic
a
P ( 0; 81 < m < 4; 45) = 0; 95:
(9.9)
< L2 ) = 1
(9.10)
=2
<U <u
110
=2
=1
(9.11)
u
p
=2
u
<m<X+ p
=2
=1
(9.12)
Acest rezultat poate de asemenea folosit pentru a estima medii ale populatiilor
nenormale cu dispersii cunoscute dac
a m
arimea selectiei este sucient de mare
pentru a justica folosirea teoremei limit
a central
a.
n acest caz, pozitia intervalului este o functie de X si de aceea este o functie
de selectie. n contrast, m
arimea intervalului,
este o functie doar de m
arimea
p
selectiei n, ind invers proportional
a cu n.
Intervalul de ncredere [100 (1
)] % pentru m dat de relatia (9.12) d
a de
asemenea o estimare a acuratetei estimatorului punctual X pentru m. Dup
a
cum vedem din gura urm
atoare, adev
arata medie m se aa n intervalul indicat
cu [100 (1
)] % ncredere.
111
=2
=2
u =2
"
(9.13)
U= X
S
p
n
(9.14)
112
n+1
2
n
2
n+1
2
t2
n
1+
t 2 R:
(9.16)
Aceast
a repartitie este cunoscut
a ca repartitia t a lui Student cu n grade de
libertate; este numit
a dup
a W. S. Gosset, care a folosit pseudonimul "Student"
n publicatiile sale de cercetare.
Dup
a cum se vede din relatia (9.16), repartitia t este simetric
a n jurul
originii. Cnd n creste, ea tinde la o repartitie normal
a standard.
ntorcndu-ne la variabila aleatoare Y denit
a de relatia (9.14), e
1
U= X
si
V =
1) S 2
(n
Atunci
Y =U
1
2
V
n
(9.17)
unde U
N (0; 1), iar V are repartitia 2 cu (n 1) grade de libertate (vezi
teorema 7.1). Mai departe, se poate ar
ata c
a X si S 2 sunt independente, deci
si U si V sunt independente. Din teorema 9.2, variabila aleatoare Y are astfel
o repartitie t cu (n 1) grade de libertate.
Variabila aleatoare Y poate folosit
a pentru a stabili intervale de ncredere
pentru media m. Valoarea lui Y depinde de media necunoscut
a m, dar repartitia
lui Y nu depinde de m.
Repartitia t este tabelat
a n tabelul A.4 urm
ator.
113
Fie tn;
=2
=2
cu n reprezentnd num
arul de grade de libertate (vezi gura urm
atoare).
114
Avem
P
tn
1; =2
< Y < tn
1; =2
=1
(9.18)
tn
1; =2 S
<m<X+
tn
1; =2 S
=1
(9.19)
115
)] %
n acest exemplu
1
(120:5 + 97 + ::: + 97:3) = 112:4;
10
si dispersia de selectie observat
a este
i
h
1
2
2
2
s2 =
(120:5 112:4) + (97 112:4) + ::: + (97:3 112:4) = 1414:3:
9
x=
1) S 2
(n
(9.20)
<D<
2
n 1; =2
=1
(9.21)
care d
a, nlocuind D din relatia (9.20),
P
(n
1) S 2
2
n 1; =2
<
<
(n
1) S 2
2
n 1;1 ( =2)
116
=1
(9.22)
Tabelul A.5 d
a valori ale lui
2
n;
117
118
2
9;0:025
= 2:7;
= 19:023;
= 0:05 conduc la
< 4714:33 = 0:95
si
P
2
9;0:05
119
= 16:919:
pentru
10
10.1
Presupunem c
a variabila aleatoare Y este o functie de o variabil
a independent
a
si relatia lor este liniar
a, adic
a
E (Y ) =
+ x:
(10.1)
+ xi :
(10.2)
( + x) :
(10.3)
+ x + E;
(10.4)
Estim
arile b si b prin metoda celor mai mici p
atrate pentru parametrii de
regresie si sunt alese astfel nct suma p
atratelor diferentelor dintre valorile
de selectie observate yi si b + b xi , valoarea medie estimat
a a lui Y , este minim
a.
Fie
ei = yi
b + b xi ; i = 1; n:
Estim
arile b si b sunt g
asite minimiznd
Q=
n
X
i=1
e2i =
n h
X
yi
i=1
b + b xi
(10.5)
i2
(10.6)
120
Vedem c
a reziduurile sunt distantele verticale dintre yi , valorile observate ale
lui Y , si estimarea b + b x a adev
aratei drepte de regresie + x.
Teorema 10.1. Fie modelul de regresie liniar
a simpl
a dat de relatia (10.4).
Fie (x1 ; y1 ) ; (x2 ; y2 ) ; :::; (xn ; yn ) valorile de selectie observate ale lui Y cu valorile
asociate ale lui x. Presupunem c
a cel putin 2 dintre x1 ; :::; xn sunt distincte.
Atunci estim
arile prin metoda celor mai mici p
atrate ale lui si sunt
b=y
b=
unde
n
X
(xi
b x;
(10.7)
x) (yi
y)
i=1
n
X
;
(xi
i=1
121
x)
(10.8)
1X
x=
xi
n i=1
si
1X
y=
yi :
n i=1
Demonstra
tie. Fie
n h
X
Q b; b =
yi
@Q
@b
@Q
@b
i=1
n
X
i=1
n
X
i=1
@2Q
@ b2
@2Q
@ b@ b
n
X
4n
i=1
x2i
(xi
0
HQ = @
=)
b + b xi
2xi ( 1) = 2
2xi ( xi ) = 2
n
X
i=1
n
X
xi = 2nx;
x2i ;
i=1
@2Q
@ b@ b
@2Q
2
@b
2nx
i=1
n
X
b + b xi
i2
2 ( 1) = 2n > 0;
i=1
n
X
D=
4n
h
2xi yi
@2Q
@ b@ b
@2Q
2
@b
h
2 yi
i=1
n
X
@2Q
@ b2
i=1
n
X
b + b xi
= 4n
1
n
n
X
@2 Q
>0
@ b2
x2i
i=1
n
X
xi +
i=1
n
X
nx
x2
i=1
= 4n
= 4n
n
X
x2i
2nx + nx
i=1
n
X
x2i
2xxi + x2 =
i=1
x) > 0 =)
1
2
2
@ Q
@ b2
@2Q
@ b@ b
@ Q
@ b@ b
@2Q
2
@b
A pozitiv denit
a =) Q (strict) convex
a =) b si b
care minimizeaz
a pe Q sunt solutia sistemului
8
n
n
X
X
>
b
>
(
nb
+
x
=
yi
>
i
@Q
<
@b = 0
i=1
i=1
()
()
@Q
n
n
n
X
X
X
=0
>
>
@b
>
xi + b
x2i =
xi yi
: b
i=1
i=1
i=1
nb + nx b = ny
nxb + b
n
X
x2i =
i=1
122
n
X
i=1
xi yi :
(10.9)
(10.10)
b = i=1n
X
X
xi yi x
x2i
i=1
i=1
i=1
(xi x)
xy
i=1
(xi x)(yi y)
i=1
(xi x)2
xi +
i=1
i=1
nx2
yi y
i=1
n
i=1
n
X
:
(xi x)2
i=1
Din (10.9) )
b = y xb:
Restabilim rezultalele de mai sus folosind o notatie matriceal
a care usureaz
a
calculele si permite generaliz
ari cnd consider
am modele mai generale de regresie.
n termeni de valori de selectie observate (x1 ; y1 ) ; (x2 ; y2 ) ; :::; (xn ; yn ), avem
sistemul de ecuatii de regresie observate
yi =
Fie
si
B
B
C=B
@
1
1
..
.
x1
x2
..
.
1 xn
+ xi + ei ;
1
C
C
C;
A
B
B
y=B
@
=
i = 1; 2; :::; n:
1
y1
y2
..
.
C
C
C;
A
yn
B
B
e=B
@
(10.11)
e1
e2
..
.
en
C
C
C;
A
(10.12)
Suma p
atratelor reziduurilor dat
a de relatia (10.6) este acum
Q ( ) = eT e = (y
C ) (y
C ):
(10.13)
CT y
sau
(10.14)
C T C b = C T y;
care d
a
b = CT C
C T y:
(10.15)
1 xn
CT C
1
CT C
det C T C
=
n
n
X
1
x1
1
x2
0
B
B
B
@
::: 1
::: xn
si
b = CT C
0
n
X
C y=
n@
xi yi nxy
B
i=1
B y
x
n
B
X
B
2 nx2
x
B
i
B
i=1
B X
n
B
B
(x x)(yi y)
B i=1 i
B
n
X
@
(xi x)2
i=1
n
X
i=1
B
1 @
x2i nx2 A
n
X
nx2
x2i
i=1
CT y =
y1
y2
..
.
yn
124
nx
nx C
A;
n
B
B
B
B
ny
B
n
nx C B X
C B
=B
A@
A
xi yi
B
B
n
i=1
B
B
@
nx
y)
i=1
i=1
10
i=1
C 0
C
y bx
C
n
C B X
C B
(xi x)(yi
C B
C = B i=1
C B
n
X
C @
C
(xi x)2
C
i=1
A
x2i
1
0
ny
C
n
C
C B X
C=@
xi yi A
A
x2i
!B
@
n
X
C
C
C
C:
C
A
n
X
x2i x
i=1
n
X
n
X
xi yi
i=1
x2i nx2
i=1
n
xi yi nxy
i=1
n
X
i=1
x2i nx2
C
C
C
C
C
C
C=
C
C
C
C
A
1
45
43
2
50
45
3
55
48
4
60
51
5
65
55
6
70
57
7
75
59
8
80
63
9
85
66
10
90
68
x=
1X
1
5 135
xi =
(45 + 50 + ::: + 90) =
= 67; 5;
n i=1
10
10
n
y=
1
1X
yi =
(43 + 45 + ::: + 68) = 55; 5;
n i=1
10
n
X
(xi
x) = 2062; 5;
i=1
n
X
(xi
x) (yi
y) = 1182; 5:
i=1
b=
n
X
(xi
x) (yi
y)
i=1
b=y
n
X
=
(xi
x)
1182; 5
' 0; 57;
2062; 5
i=1
b x ' 55; 5
125
Relatiile de regresie sunt valabile doar pentru intervalul valorilor x reprezentate de date. Astfel, dreapta de regresie estimat
a n exemplul 10.1 e valabil
a
doar pentru temperaturi ntre 45 C si 90 C. Extrapolarea rezultatului n afara
acestui interval poate conduce la greseli si nu este valabil
a n general.
Analiza regresiei liniare ca cea f
acut
a n exemplul 10.1 este bazat
a pe presupunerea c
a adev
arata relatie ntre E (Y ) si x este liniar
a. Dac
a relatia este
neliniar
a sau inexistent
a, regresia liniar
a produce rezultate f
ar
a sens, chiar dac
a
o linie dreapt
a pare s
a dea o bun
a potrivire a datelor.
10.1.2
Propriet
a
tile estimatorilor prin metoda celor mai mici p
atrate
b si B,
b estimatorii prin metoda celor mai mici p
Fie A
atrate pentru , respectiv
si e
!
b
A
b =
:
(10.16)
b
B
Din relatia (10.15) avem
unde
b = CT C
C T Y;
(10.17)
1
Y1
B
C
Y = @ ... A ;
(10.18)
Yn
si Yj ; j = 1; 2; :::; n, sunt independente si identic repartizate n concordanta cu
relatia (10.4). Astfel, dac
a scriem
Y =C + E;
126
(10.19)
= CT C
C T E (Y) = C T C
C T [C +E (E)] = C T C
I,
CT C =
(10.20)
b si B
b pentru , respectiv , sunt nedeplasati.
De aici, estimatorii A
Matricea de covarianta asociat
a cu b este dat
a de, dup
a cum rezult
a din
1
T
este simetric
a,
relatia (10.17) si lema 3.1, deoarece C C
cov b
=E
= CT C
C T cov (Y) C C T C
I; astfel, avem
CT C
CT C CT C
CT C
(10.21)
b si
Elementele de pe diagonala matricei din relatia (10.21) dau dispersiile lui A
b n termeni de elementele lui C, putem scrie
B.
2
b =
var A
n
X
x2i
i=1
n
X
(xi
(10.22)
x)
i=1
b =
var B
2
n
X
(10.23)
(xi
x)
i=1
Se vede c
a aceste dispersii descresc cnd m
arimea selectiei n creste. Astfel,
rezult
a din capitolul 8 c
a acesti estimatori sunt consistenti. Pentru un n xat,
b poate redus
dispersia lui B
a selectnd xi -urile astfel nct numitorul relatiei
(10.23) este maximizat; asta poate f
acut mpr
astiind xi -urile ct mai departe
posibil. n exemplul 10.1, presupunnd c
a suntem liberi s
a alegem valorile lui
xi , calitatea lui b este mbun
at
atit
a dac
a jum
atate din citirile x sunt luate la
o extrem
a a intervalului temperaturii si cealalt
a jum
atate la cealalt
a extrem
a.
b pentru un n xat este de a
Strategia de selectie pentru minimizarea var A
face x pe ct posibil ct mai aproape de 0.
Sunt dispersiile date de relatiile (10.22) si (10.23) dispersii minime ntre
dispersiile estimatorilor nedeplasati pentru si ? Un r
aspuns la aceast
a ntrebare poate aat comparnd rezultatele date de relatiile (10.22) si (10.23)
cu marginile inferioare Rao-Cramer denite n sectiunea 8.1.2. Pentru a evalua
aceste margini, repartitia lui Y trebuie s
a e cunoscut
a. Totusi, f
ar
a a cunoaste
repartitia lui Y , se poate ar
ata c
a tehnica celor mai mici p
atrate conduce la
127
(10.25)
Consider
am acum matricea de covarianta
cov (
)=E (
)(
(10.26)
(10.27)
128
11
Regresie liniar
a simpl
a. Estimarea parametrilor
prin metoda celor mai mici p
atrate. Intervale de ncredere pentru parametrii de regresie
11.1
n h
X
i2
b + Bx
b i
A
Yi
i=1
(11.1)
unde coecientul k este ales astfel nct c2 este nedeplasat. Pentru a calcula
media lui c2 , observ
am c
a (vezi relatia (10.7))
Yi
b
A
b i = Yi
Bx
b
Bx
n
X
De aici rezult
a
n
X
Yi
i=1
b
A
b i
Bx
b i = Yi
Bx
Y
Yi
b2
B
i=1
(xi
b
Y =B
x) Yi
i=1
Se poate ar
ata c
a
E c2 = kE
n
X
Yi
i=1
n h
X
b2
B
129
x) :
(11.2)
(xi
x) ;
(11.3)
i=1
(xi
x) :
(11.4)
i=1
(xi
x)
= k (n
2)
ind dat de
b + Bx
b i
A
Yi
n
X
i=1
1
n 2,
i=1
sau, datorit
a relatiei (11.3),
" n
X
c2 = 1
Yi
n 2 i=1
n
X
n
X
b (xi
B
b2
B
n
X
i=1
i2
(xi
(11.5)
x)
(11.6)
x) = 2062; 5;
(xi
i=1
n plus, obtinem
n
X
b = 0; 57:
(yi
y) = 680; 5:
i=1
Relatia (11.6) d
a
c2 = 1 680; 5
8
0; 572 2062; 5 = 1; 3:
a),
Presupunnd c
a E (Y ) este legat
a liniar de x si c
a 2Y = 2 (o constant
determinati estim
arile prin metoda celor mai mici p
atrate pentru coecientii de
regresie si o estimare nedeplasat
a pentru 2 .
n acest caz avem n = 14. Cantit
atile care ne intereseaz
a sunt
n
x=
1X
1
xi =
(2 + 2; 5 + ::: + 20) = 11; 11;
n i=1
14
n
y=
1X
1
yi =
(9; 1 + 19; 2 + ::: + 130; 8) = 57; 59;
n i=1
14
n
X
(xi
x) = 546; 09;
i=1
n
X
(yi
y) = 17179; 54;
i=1
130
n
X
(xi
x) (yi
y) = 2862; 12:
i=1
b = 57; 59
5; 24 11; 11 =
0; 63
11.2
b B
b si A
b + Bx
b sunt
Presupunem c
aY
N
+ x; 2 . Deoarece estimatorii A;
functii liniare de selectia Y , ei sunt de asemenea variabile aleatoare normale.
131
b B
b si A
b + Bx
b au o repartitie normal
Cnd m
arimea selectiei n este mare, A;
a pe
baza teoremei limit
a central
a, indiferent de repartitia lui Y .
Urm
am calea din sectiunea 9.2 pentru a stabili limite de ncredere. Se pot
verica urm
atoarele rezultate:
i) Fie c2 estimatorul nedeplasat pentru 2 denit de relatia (11.6) si e
D=
2) c2
(n
Rezult
a din sectiunea 9.2 c
a D este o variabil
a aleatoare repartizat
a
grade de libertate.
ii) Consider
am variabilele aleatoare
(11.7)
cu n
b
A
v
u
n
u c2 X 2
u
xi
u
u n i=1
u X
tn
(x x)2
(11.8)
i=1
si
b
B
v
u
u n c2
uX
t
(x
i
(11.9)
x)2
i=1
unde, dup
a cum se observ
a din relatiile (10.20), (10.22) si (10.23), si sunt
b respectiv B,
b iar numitorii sunt deviatiile standard ale lui A,
b
mediile lui A,
2
b cu
respectiv B,
estimat de c2 . Din sectiunea 9.2 rezult
a c
a ecare dintre
aceste variabile aleatoare are o repartitie t cu n 2 grade de libertate.
\
iii) Estimatorul E
(Y ) pentru media lui Y este repartizat normal cu media
+ x si dispersia
n
X
1
n
\
b +2xcov A;
b B
b =
b + Bx
b = var A
b +x2 var B
var E
(Y ) = var A
2
6
61
(x
6n + X
n
4
x)2
(xi x)
i=1
7
7
7 : (11.10)
5
2
132
i=1
n
X
i=1
=
(xi x)2
(11.11)
i=1
i=1
2) Un interval de [100 (1
relatia (9.19))
b
L1;2 = B
)] % ncredere pentru
tn
v
u
c2
u
:
=2 u
n
uX
2
t
(xi x)
2;
(11.13)
i=1
3) Un interval de [100 (1
)] % ncredere pentru E (Y ) = + x este determinat de (vezi relatia (9.19))
v 2
3
u
u
u 6
7
u 6
2
7
(x x)
u c2 6 1
\
7
(11.14)
L1;2 = E (Y ) tn 2; =2 u 6 + n
7
u 4n X
5
2
t
(xi x)
i=1
4) Un interval de [100 (1
)] % ncredere pentru
este determinat de (vezi relatia (9.22))
L1 =
L2 =
(n 2) c2
2
n
(n
2
n
(11.15)
:
=2
Un interval de [100 (1
)] % ncredere pentru
terminat de (vezi relatia (9.23))
L1 =
(n
2) c2
2
n 1;
133
2; =2
2) c2
2;1
cu o margine nit
a este de-
(11.16)
tn
\
E
(Y ) = b + b x =
2; =2
0; 63 + 5; 24x;
(xi
x) = 546; 09;
i=1
134
c2 = 182; 1:
135
12
Regresie liniar
a multipl
a.
regresie
12.1
Alte modele de
Regresie liniar
a multipl
a
n regresia liniar
a multipl
a, modelul ia forma
E (Y ) =
1 x1
2 x2
+ ::: +
m xm :
(12.1)
1 x1
2 x2
+ ::: +
m xm
+ E:
(12.2)
2
Fiind date seturile de valori de selectie observate (x1i ; x2i ; :::; xmi ; yi ) ; i = 1; 2; :::; n,
sistemul de ecuatii de regresie observate este
yi =
Dac
a not
am
0
si
B
B
C=B
@
1
1
..
.
1 x1i
2 x2i
+ ::: +
x11
x12
..
.
x21
x22
..
.
:::
:::
..
.
1 x1n
x2n
::: xmn
xm1
xm2
..
.
m xmi
B
B
y=B
@
C
C
C;
A
B
B
=B
@
+ ei ;
0
1
..
.
i = 1; 2; :::; n:
y1
y2
..
.
yn
C
C
C;
A
B
B
e=B
@
(12.3)
e1
e2
..
.
en
1
C
C
C
A
C
C
C;
A
y = C + e:
(12.4)
regresiei liniare simple bazate pe relatia (10.12) sunt din nou valabile n cazul
regresiei liniare multiple. Astfel, f
ar
a alt
a demonstratie, avem pentru solutia
estim
arii prin metoda celor mai mici p
atrate b a lui (vezi relatia (10.15))
1
b = CT C
C T y:
(12.5)
cere ca s
a existe cel putin (m + 1) seturi distincte
Existenta matricei C T C
de valori (x1i ; x2i ; :::; xmi ) n selectie. C T C este o matrice (m + 1) (m + 1)
simetric
a.
Exemplul 12.1. Consumul lunar mediu de putere electric
a (Y ) ntr-o anumit
a fabric
a este considerat a liniar dependent de temperatura mediului
ambiant (x1 , n F ) si num
arul de zile lucr
atoare din lun
a (x2 ). Consider
am
datele lunare pe un an din tabelul urm
ator.
Determinati estim
arile prin metoda celor mai
regresie liniar
a asociati.
n acest caz, C este o matrice 12 3 si
0
12
626
C T C = @ 626 36776
290 15336
0
2974
C T y = @ 159011
72166
Astfel avem
sau
b = CT C
b =
0
33; 84;
CT y = @
b = 0; 39;
1
mici p
atrate ai coecientilor de
1
290
15336 A ;
7028
1
A:
1
33; 84
0; 39 A ;
10; 80
b = 10; 8:
2
Deoarece relatia (12.4) coincide cu cea din cazul regresiei liniare simple,
multe din rezultatele obtinute acolo privind propriet
atile estimatorilor prin
metoda celor mai mici p
atrate pot duplicate aici tinnd cont doar de noile
denitii ale matricei C si vectorului .
Scriem estimatorul b pentru n forma
Observ
am c
a
E b
b = CT C
= CT C
C T Y:
(12.6)
C T E (Y) = :
(12.7)
12.2
1 x1
2 x2
exp (
2
11 x1
Y =
x
0 1
1x
+ E) ;
2
22 x2
+ E:
(12.10)
12 x1 x2
+ E;
(12.11)
(12.12)
138
1x
2
2x ;
calculati estim
arile prin metoda celor mai mici p
atrate pentru
baza datelor din tabelul urm
ator.
Fie x1 = x, x2 = x2 si
=@
0
1
2
si
B
B
B
y=B
B
B
@
Astfel,
b = CT C
sau
6
C T y = @ 15
55
b = 1; 07;
0
15
55
225
1; 03
1; 32
1; 57
1; 75
1; 83
2; 33
si
pe
A:
p
atrate pentru
0
1
2
3
4
5
0;
este dat
a de relatia
0
1
4
9
16
25
C
C
C
C
C
C
A
C
C
C
C:
C
C
A
1
55
225 A
979
1 0
1
9; 83
1; 07
@ 28; 68 A = @ 0; 2 A ;
110; 88
0; 01
b = 0; 2 si b = 0; 01:
1
2
Observ
am n acest exemplu c
a, deoarece x2 = x21 , n matricea C elementele
de pe coloana a treia sunt p
atratele elementelor corespunz
atoare de pe coloana
a doua. Pentru modele de regresie polinomial
a de ordin superior, situatii de
acest tip pot conduce la dicult
ati n inversarea matricei C T C.
139
13
13.1
Erori de tipul I
si de tipul II
13.2
Testul chi-p
atrat al bun
at
a
tii de potrivire
140
Ni
;
n
i = 1; 2; :::; k:
(13.1)
Probabilit
atile teoretice P (Ai ) pot obtinute din repartitia presupus
a a populatiei. Le not
am cu
P (Ai ) teoretic
a = pi ;
i = 1; 2; :::; k:
(13.2)
O alegere logic
a a statisticii dnd o m
asur
a a deviatiei este
k
X
ci
i=1
Ni
n
pi
(13.3)
care este o m
asur
a natural
a a deviatiei de tipul celor mai mici p
atrate. Peara prin
son (1900) a ar
atat c
a, dac
a lu
am coecientul ci = pni , statistica denit
expresia (13.3) are propriet
ati convenabile. De aici, alegem ca m
asura deviatiei
D=
k
X
n
p
i=1 i
Ni
n
pi
k
X
(Ni
i=1
X N2
npi )
i
=
npi
np
i
i=1
2
n:
(13.4)
D este o statistic
a deoarece este o functie de Ni , care sunt, la rndul lor,
functii de selectia X1 ; X2 ; :::; Xn . Repartitia statisticii D este dat
a n teorema
urm
atoare, datorat
a lui Pearson (1900).
Teorema 13.1. Presupunnd c
a ipoteza H este adev
arat
a, repartitia lui
D denit
a de relatia (13.4) tinde la o repartitie chi-p
atrat cu (k 1) grade de
libertate cnd n ! 1. Densitatea ei este dat
a de (vezi relatia (5.24))
8
k 3
< d 2 e d2 ; pentru d 0;
k 1
fD (d) =
(13.5)
2 2
( k2 1 )
:
0, altfel.
Aceast
a repartitie este independent
a de repartitia presupus
a.
Cu ajutorul teoremei 13.1 poate construit un test al ipotezei H considerat
a
mai sus pe baza atribuirii unei probabilit
ati erorii de tipul I. Presupunem c
a
vrem s
a obtinem probabilitatea pentru eroarea de tipul I. Testul 2 sugereaz
a
c
a ipoteza H ori de cte ori
d=
k
X
n2i
npi
i=1
n>
2
k 1;
(13.6)
si este acceptat
a altfel, unde d este valoarea de selectie a lui D bazat
a pe
valorile de selectie xi ; i = 1; :::; n si 2k 1; este valoarea astfel nct (vezi gura
urm
atoare)
P D > 2k 1; = :
(13.7)
141
142
Pasul 2: calculeaz
a probabilit
atile teoretice P (Ai ) = pi ; i = 1; 2; :::; k, cu
ajutorul repartitiei presupuse.
Pasul 3: construieste d dat de relatia (13.6).
Pasul 4: alege o valoare a lui si determin
a din tabelul A.5 pentru repartitia 2 cu (k 1) grade de libertate valoarea lui 2k 1; .
Pasul 5: respinge ipoteza H dac
ad>
2
k 1;
. Altfel, accept
a H.
Presupunem c
a timpul aleator de ardere este presupus a repartizat exponential
a = 0; 005 pe or
a si
cu timpul mediu de ardere 1 = 200 de ore, adic
fT (t) = 0; 005e
Testati aceast
a ipotez
a folosind testul
Pasii necesari n efectuarea testului
0;005t
2
0:
(13.8)
Prima coloan
a d
a intervalele Ai , care sunt alese n acest caz s
a e intervalele
pentru t date n tabelul anterior. Probabilit
atile teoretice P (Ai ) = pi din
coloana a treia sunt calculate folosind relatia (13.8). De exemplu,
Z 100
p1 = P (A1 ) =
0; 005e 0;005t dt = e 0;005t j100
= 1 e 0;5 = 0; 39;
0
0
143
p2 = P (A2 ) =
200
0; 005e
0;005t
dt =
100
0;005t 200
j100
=e
0;5
= 0; 24:
k
X
n2i
npi
i=1
n = 301; 7
300 = 1; 7:
144
( t) e
x!
pX (x) =
(0; 48) e
x!
5 dac
a num
arul n7 ar fost mai
0;48
x = 0; 1; 2; ::::
(13.9)
Astfel avem
i 1
pi = P (Ai ) =
(0; 48)
(i
e
1)!
0;48
p7 = P (A7 ) = 1
;
6
X
i = 1; 2; :::; 6:
pi :
i=1
k
X
n2i
npi
i=1
2
k 1;
n = 8413
2
6;0:01
2
6;0:01
Deoarece d >
13.2.2
2
6;0:01 ,
7842 = 571:
este g
asit
a din tabelul A.5
= 16; 812:
Consider
am acum situatia n care parametrii din repartitia presupus
a trebuie de
asemenea estimati din date. O procedur
a pentru un test de bun
atatea potrivirii
145
n acest caz este nti estimarea parametrilor si apoi efectuarea testului 2 pentru parametri cunoscuti. Apare o complicatie n aceea c
a probabilit
atile teoretice pi denite de relatia (13.2) sunt, ind functii de parametrii repartitiei,
functii de selectie. Statistica D ia acum forma
D=
k
X
n
Pbi
i=1
Ni
n
Pbi
k
X
Ni2
nPbi
n;
(13.10)
i=1
2
k r 1;
. Altfel, accept
a H.
Exemplul 13.3. Sosirile vehiculelor ntr-un anumit punct au fost nregistrate. Numerele de vehicule sosite n interval de un minut au fost luate pentru
106 minute si sunt date n tabelul urm
ator.
146
pX (x) =
e
x!
x = 0; 1; 2; :::;
(13.11)
147
De aici k = 11.
Estimarea de verosimilitate maxim
a pentru
este dat
a de
X
b=x= 1
xj = 9; 09:
n j=1
4
X
pX (j) = 0; 052;
j=0
p2 = pX (5) = 0; 058:
Aceste probabilit
ati teoretice sunt date n a treia coloan
a a tabelului.
Din coloana 5 a tabelului obtinem
d=
Tabelul A.5 cu
k
X
n2i
npi
i=1
= 0; 05 si k
n = 119; 56
r
1 = 9 grade de libertate d
a
2
9;0:05
= 16; 919:
= 9; 09 este acceptat
a la
Repartitia asumat
a pentru X, c
aderea anual
a de z
apad
a, este N m; 2
2
unde m si
trebuie s
a e esimate din date. Doarece estimatorii de verosimilic = X, respectiv c2 = n 1 S 2 , avem
tate maxim
a pentru m si 2 sunt M
n
70
m
b =x=
1 X
xj = 83; 6;
70 j=1
70
X
c2 = 69 s2 = 1
(xj
70
70 j=1
83; 6) = 777; 4:
149
Num
arul de grade de libertate n acest caz este k
A.5 d
a astfel
2
3;0:05 = 7; 815:
r 1 = 6 2 1 = 3. Tabelul
13.3
Testul Kolmogorov-Smirnov
Asa-numitul test de bunatatea potrivirii Kolmogorov-Smirnov, prescurtat testul K-S, este bazat pe o statistic
a m
asurnd deviatia histogramei cumulative
observate de la functia de repartitie cumulativ
a presupus
a.
Fiind dat un set de valori de selectie x1 ; x2 ; :::; xn observate dintro populatie
X, o histogram
a cumulativ
a poate construit
a prin
(a) aranjarea valorilor de selectie n ordine cresc
atoare, notate cu x(1) ; x(2) ; :::; x(n) ,
(b) determinarea functiei de repartitie observat
a a lui X n x(1) ; x(2) ; :::,
notate prin F 0 x(1) ; F 0 x(2) ; :::, din relatiile F 0 x(i) = ni si
(c) conectarea valorilor lui F 0 x(i) prin segmente de dreapt
a.
150
D2 = max
i=1
F 0 X(i)
FX X(i)
= max
i=1
i
n
FX X(i)
(13.12)
151
Pasul 1: rearanjeaz
a valorile selectiei x1 ; x2 ; :::; xn n ordine cresc
atoare si
noteaz
a-le x(1) ; x(2) ; :::; x(n) .
Pasul 2: determin
a functia de repartitie observat
a F 0 (x) n ecare x(i)
i
0
folosind F x(i) = n .
Pasul 3: determin
a functia de repartitie teoretic
a FX (x) n ecare x(i)
folosind repartitia presupus
a. Parametrii repartitiei sunt estimati din date
dac
a este necesar.
Pasul 4: formeaz
a diferentele F 0 x(i)
FX x(i)
pentru i = 1; 2; :::; n.
Pasul 5: calculeaz
a
n
d2 = max
i=1
F 0 x(i)
FX x(i)
si determin
a din tabelul A.6 valoarea lui cn; .
c2 =
1
n
10
s2 =
1 X
(xj
10 j=1
30:3) = 3:14:
27:4
p
30:3
3:14
FX (28:7) = FU
28:7
p
30:3
3:14
FX x(4)
153
= 0:4
0:2483 = 0:1517:
Cu
154