Sunteți pe pagina 1din 154

Part I

Probabilit
a
ti
1

Cmp de probabilitate. Opera


tii cu evenimente
si formule de calcul pentru
probabilit
a
tile acestora. Evenimente independente. Probabilitatea condi
tionat
a. Formula
lui Bayes

1.1

Cmp de probabilitate

n teoria probabilit
atilor consider
am un experiment cu un rezultat dependent
de sans
a, care e numit experiment aleator. Se presupune c
a toate rezultatele
posibile ale unui experiment aleator sunt cunoscute si ele sunt elemente ale unei
multimi fundamentale denumit
a ca spatiul probelor. Fiecare rezultat posibil este
numit proba si un eveniment este o submultime a spatiului probelor.
Nota
tii. Fie multime.
P ( ) := fAjA
g:
Fie A
:
A = CA := fa 2 ja 2
= Ag :
Deni
tia 1.1. Fie
multime. K P ( ) se numeste corp borelian sau
-algebra pe dac
a si numai dac
a
1) K 6= ;
2) A 2 K =) A 2 K
[
3) A1 ; A2 ; :::; An ; ::: 2 K =)
An 2 K.
n

( ; K) se numeste spatiu masurabil cnd K este corp borelian pe


Propriet
a
ti. Dac
a ( ; K) este spatiu masurabil atunci:
a) 2 K
b) ; 2 K
n
[
c) A1 ; A2 ; :::; An 2 K =)
Ai 2 K.

i=1

arabil
a (i.e. nit
a sau num
arabil
a), Ai 2 K; 8i 2 I =)
\ d) I cel mult num
Ai 2 K

i2I

e) A; B 2 K =) AnB 2 K.
Demonstra
tie. a) K 6= ; =) 9A 2 K =) A 2 K =)
A [ ::: 2 K.
b) ; = 2 K.
n
n
[
[
c)
Ai =
Ai [ ; [ ; [ ::: 2 K.
i=1

i=1

=A[A[A[

d)

i2I

Ai =

i2I

Ai 2 K.

e) AnB = A \ B 2 K.
Consider
am un corp borelian pe K pe un spatiu de elemente a; b; c; ::: cu
fag ; fbg ; fcg ; ::: 2 K si cu submultimile A; B; C; ::: 2 K. Unele dintre corespondentele dintre teoria multimilor si teoria probabilit
atilor sunt date n urm
atorul
tabel:
Teoria multimilor Teoria probabilit
atilor
Spatiu,
Spatiul probelor, eveniment sigur
Multimea vid
a, ; Eveniment imposibil
Elemente a; b; :::
Probe a; b; ::: (sau evenimente simple)
Multimi A; B; :::
Evenimente A; B; :::
A
Evenimentul A apare
A
Evenimentul A nu apare
A[B
Cel putin unul dintre A si B apare
A\B
Ambele A si B apar
A B
A este un subeveniment al lui B (i.e. aparitia lui A implic
a aparitia lui B)
A\B =;
A si B sunt mutual exclusive (i.e. ele nu pot ap
area simultan)
; este considerat
a un eveniment imposibil deoarece niciun rezultat posibil
nu este element al ei. Prin "aparitia unui eveniment" ntelegem c
a rezultatul
observat este un element al acelei multimi. Spunem c
a mai multe evenimente
sunt mutual exclusive dac
a multimile corespunz
atoare sunt disjuncte dou
a cte
dou
a.
Exemplul 1.1. Consider
am un experiment de calculare a num
arului de
masini care vireaz
a la stnga la o intersectie dintr-un grup de 100 de masini.
Rezultatele posibile (numerele posibile de masini care vireaz
a la stnga) sunt
0; 1; 2; :::; 100: Atunci, spatiul probelor este = f0; 1; 2; :::; 100g si K = P ( ) :
A = f0; 1; 2; :::; 50g este evenimentul "cel mult 50 de masini vireaz
a la stnga".
B = f40; 41; :::; 60g este evenimentul "ntre 40 si 60 (inclusiv) de masini vireaz
a
la stnga". A [ B este evenimentul "cel mult 60 de masini vireaz
a la stnga".
A \ B este evenimentul "ntre 40 si 50 (inclusiv) de masini vireaz
a la stnga".
Fie C = f81; 82; :::; 100g. Evenimentele A si C sunt mutual exclusive.
Deni
tia 1.2. Fie ( ; K) spatiu m
asurabil. Functia P : K ! R se numeste
probabilitate pe ( ; K) dac
a si numai dac
a are urm
atoarele propriet
ati (numite
axiomele probabilit
atii):
Axioma 1: P (A) 0; 8A 2 K (nenegativ
a).
Axioma 2: P ( ) = 1 (normat
a).
Axioma 3: pentru orice colectie num
arabil
a de evenimente mutual exclusive
(multimi
disjuncte
dou
a
cte
dou
a
)
A
;
A
;
:::
2 K,
1
2
0
1
[
X
P @ Aj A =
P (Aj ) (num
arabil aditiv
a).
j

( ; K; P ) se numeste cmp de probabilitate dac


a si numai dac
a P este
probabilitate pe spatiul m
asurabil ( ; K) :

1.2

Opera
tii cu evenimente
si formule de calcul pentru
probabilit
a
tile acestora

Propriet
a
ti. Dac
a ( ; K; P ) este cmp de probabilitate, atunci:
1) P (;) = 0:
2) pentru orice colectie nit
a de evenimente mutual exclusive (multimi disjuncte0dou
a cte
dou
a
)
A
;
A
;
:::;
An 2 K,
1
2
1
n
n
[
X
Aj A =
P (Aj ) (P este aditiv
a).
P@
j=1

j=1

3) A C; A; C 2 K =) P (A)
4) A; B 2 K =)

P (C) :

P (A [ B) = P (A) + P (B)

P (A \ B) :

5) (Formula lui Poincare) A1 ; A2 ; :::; An 2 K =)


0

P@

n
[

j=1

Aj A =

n
X

P (Aj )

j=1

1 i<j n

P (Ai \ Aj )+

n 1

1 i<j<k n

n particular, A; B; C 2 K =)
P (A [ B [ C) = P (A) + P (B) + P (C)
P (A \ B \ C):
6) A 2 K =) P A = 1 P (A) :

P (A \ B)

P (Ai \ Aj \ Ak ) :::+( 1)

P (A \ C)

P@

n
\

j=1

P (B \ C) +

A3

Demonstra
tie. 1) P ( ) = P ( [ ; [ ; [ :::) = P ( ) + P (;) + P (;) +
A2
::: =) 10= 1 + P1(;) + P
0(;) + ::: =) P (;)1+ P (;) + ::: = 0 =) P (;) = 0:
n
n
n
[
[
X
A3
2) P @
Aj A = P @
Aj [ ; [ ; [ :::A =
P (Aj ) + P (;) + P (;) +
j=1

1)

::: =

n
X

j=1

j=1

P (Aj ) + 0 + 0 + ::: =

j=1

n
X

P (Aj ) :

j=1
2)

3) P (C) = P (A [ (CnA)) = P (A) + P (CnA) =) P (C)


| {z }

P (A) :

2)

2)

4) P (A [ B) = P (A [ (BnA)) = P (A) + P (BnA) = P (A) + P (B)


P (A \ B) :
5) Inductie.
Pentru n = 1 e evident.
Presupunem adev
arat pentru n:
Fie0A1 ; A2 ;1
:::; An ;0
An+1 2 K.
1
0
1
00
1
1
n+1
n
n
n
[
[
[
[
4)
ip. ind.
P@
Aj A = P @
Aj [ An+1 A = P @
Aj A+P (An+1 ) P @@
Aj A \ An+1 A =
j=1

j=1

j=1

j=1

Aj A :

n
X

P (Aj )

j=1

1 i<j n

P (An+1 )
n+1
X

P (Aj )

j=1
n
X

j=1

j=1

i<j<k n

P (Ai \ Aj )+

1 i<j n

1 i<j<k n

1 i<j n

P ((Ai \ An+1 ) \ (Aj \ An+1 )) +

P (Ai \ Aj )

P (Ai \ Aj \ An+1 )

P (Aj )

P@

n 1

P (Ai \ Aj \ Ak ) :::+( 1)

P ((Ai \ An+1 ) \ (Aj \ An+1 ) \ (Ak \ An+1 )) :::+( 1)

1 i<j n

j=1

n 1

P (Ai \ Aj \ Ak ) :::+( 1)

n 1

P (Aj )

11

ip. ind.
(Aj \ An+1 )A =

P (Aj \ An+1 )

j=1

n+1
X

P@

n
[

1 i<j n

1 i<j<k n
n+1
X

P (Ai \ Aj )+

1 i<j n+1

n
X
j=1

P (Aj \ An+1 )+
0

n
::: + ( 1) P @

P (Ai \ Aj )+

1 i<j<k n

n+1
\
j=1

1 i<j<k n+1

2)

P@

n
\

j=1

P@

n
\

j=1

Aj A+
1

Aj A
1

(Aj \ An+1 )A] =

P (Ai \ Aj \ Ak )+

Aj A =

n+1
\

n
P (Ai \ Aj \ Ak ) :::+( 1) P @

Evenimente independente

Deni
tia 1.3. Fie ( ; K; P ) cmp de probabilitate. Dou
a evenimente A; B 2 K
se numesc independente dac
a si numai dac
a
P (A \ B) = P (A) P (B) :
Observa
tie. Dac
a A si B sunt evenimente independente, atunci:
P A \ B = P (A)P B ;
4

j=1

6) 1 = P ( ) = P A [ A = P (A) + P A :
Exemplul 1.2. n exemplul 1.1, presupunem c
a probabilit
atile P (A) ; P (B)
si P (C) sunt cunoscute. Vrem s
a calcul
am P (A [ B) (probabilitatea ca cel mult
60 de masini s
a vireze la stnga) si P (A [ C) (probabilitatea ca cel mult 50 de
masini sau ntre 80 si 100 de masini s
a vireze la stnga). Deoarece A si C sunt
mutual exclusive avem
P (A [ C) = P (A) + P (C) :
Dar
P (A [ B) = P (A) + P (B) P (A \ B) :
Informatia dat
a este insucient
a pentru a determina P (A [ B) si avem
nevoie de informatia aditional
a P (A \ B), care este probabilitatea ca ntre 40
si 50 de masini s
a vireze la stnga.

1.3

n
\

j=1

Aj A :

P A \ B = P A P (B) ;
P A\B =P A P B :
Demonstra
tie. P (A) = P (A \ B) [ A \ B = P (A \ B)+P A \ B =)
P A \ B = P (A) P (A \ B) = P (A) P (A) P (B) = P (A) (1 P (B)) =
P (A)P B :
Analog pentru celelalte relatii.
Exemplul 1.3. n lansarea unui satelit, probabilitatea unui insucces este q.
Care este probabilitatea ca dou
a lans
ari succesive s
a esueze?
Presupunnd c
a lans
arile satelitului sunt evenimente independente, r
aspunsul este q 2 :
Deni
tia 1.4. Fie ( ; K; P ) cmp de probabilitate. Evenimentele A1 ; A2 ; :::; An 2
K sunt independente dac
a si numai dac
a 8m = 2; 3; :::; n; k1 ; k2 ; :::; km 2 N a. .
1 k1 < k2 < ::: < km n;
P (Ak1 \ Ak2 \ ::: \ Akm ) = P (Ak1 ) P (Ak2 ) :::P (Akm ) :
n particular, A1 ; A2 ; A3 sunt independente dac
a si numai dac
a
P (Aj \ Ak ) = P (Aj ) P (Ak ) ; 8j < k; j; k = 1; 2; 3;
si
P (A1 \ A2 \ A3 ) = P (A1 ) P (A2 ) P (A3 ) :
Observa
tii. 1) Num
arul de egalit
ati din denitia independentei a n evenimente este 2n n 1:
2) Independenta dou
a cte dou
a nu conduce n general la independenta.
Contraexemplu. Fie 3 evenimente A1 ; A2 ; A3 denite de
A1 = B1 [ B2 ; A2 = B1 [ B3 ; A3 = B2 [ B3 ;
unde B1 ; B2 si B3 sunt mutual exclusive, ecare avnd probabilitatea 41 :
P (A1 ) = P (B1 [ B2 ) = P (B1 ) + P (B2 ) = 21 :
Analog P (A2 ) = P (A3 ) = 12 :
P (A1 \ A2 ) = P ((B1 [ B2 ) \ (B1 [ B3 )) = P (B1 [ (B2 \ B3 )) = P (B1 [ ;) =
P (B1 ) = 14 = 12 12 = P (A1 ) P (A2 ) :
Analog P (A1 \ A3 ) = P (A1 ) P (A3 ) ; P (A2 \ A3 ) = P (A2 ) P (A3 ) :
P (A1 \ A2 \ A3 ) = P ((B1 [ B2 ) \ (B1 [ B3 ) \ (B2 [ B3 )) = P ((B1 [ (B2 \ B3 )) \ (B2 [ B3 )) =
P (B1 \ (B2 [ B3 )) = P ((B1 \ B2 ) [ (B1 \ B3 )) = P (; [ ;) = P (;) = 0:
P (A1 ) P (A2 ) P (A3 ) = 81 :
Deci P (A1 \ A2 \ A3 ) 6= P (A1 ) P (A2 ) P (A3 ) :
Evenimentele A1 ; A2 ; A3 sunt independente dou
a cte dou
a, dar nu sunt
independente.
3) Dac
a evenimentele A1 ; A2 ; :::; An sunt independente, atunci nlocuind oricare din Akj cu complementara Akj n ambii membri din relatiile din denitia
independentei, relatiile obtinute r
amn valabile.
Exemplul 1.4. Un sistem compus din 5 componente merge exact atunci
cnd ecare component
a e bun
a. Fie Si ; i = 1; :::; 5; evenimentul "componenta
i e bun
a" si presupunem P (Si ) = pi . Care e probabilitatea q ca sistemul s
a nu
mearg
a?
Presupunnd c
a cele 5 componente merg ntr-o manier
a independent
a, e p
probabilitatea de succes.
5

q=1

p=1

5
\

i=1

1.4

Si

=1

5
Y

P (Si ) = 1

i=1

5
Y

pi :

i=1

Probabilitatea condi
tionat
a

Deni
tia 1.5. Fie ( ; K; P ) cmp de probabilitate si A; B 2 K a. . P (B) 6= 0:
Probabilitatea conditionata de B a lui A este dat
a de
P (AjB) =

P (A \ B)
:
P (B)

Observa
tie. n ipotezele denitiei 1.5, A si B sunt independente ()
P (AjB) = P (A) :
Demonstra
tie. A si B sunt independente () P (A \ B) = P (A) P (B) ()
P (A\B)
=
P
(A)
() P (AjB) = P (A) :
P (B)
Propozi
tie. Fie ( ; K; P ) cmp de probabilitate si B 2 K a. . P (B) 6= 0:
Atunci functia PB : K ! R; PB (A) = P (AjB) este probabilitate pe( ; K) :
Demonstra
tie. Veric
am cele 3 axiome ale probabilit
atii:
1) PB (A) = P P(A\B)
0;
8A
2
K,
deoarece
P
(A
\
B)
0 si P (B) > 0:
(B)

\B)
P (B)
2) PB ( ) = P P( (B)
=P
(B) = 1:
3) A1 ; A2 ; ::: 2 K colectie num
arabil
a de evenimente mutual exclusive =)
2 [:::)\B)
A1 \B; A2 \B; ::: 2 K mutual exclusive =) PB (A1 [ A2 [ :::) = P ((A1 [A
=
P (B)
P ((A1 \B)[(A2 \B)[:::)
P (B)

((A2 \B))+:::
1 \B)
2 \B)
= P (A1 \B)+P
= P (A
+ P (A
+ ::: =
P (B)
P (B)
P (B)
PB (A1 ) + PB (A2 ) + ::::
Exemplul 1.5. Reconsider
am exemplul 1.4 presupunnd p1 > 0. Care este
probabilitatea conditionat
a ca primele dou
a componente s
a e bune dat ind
c
a:
a) prima component
a este bun
a;
b) cel putin una dintre cele dou
a este bun
a?
Evenimentul S1 \ S2 nseamn
a c
a ambele componente sunt bune, iar S1 [ S2
c
a cel putin una e bun
a. Datorit
a independentei lui S1 si S2 ; avem:
)P (S2 )
1 \S2 \S1 )
1 \S2 )
a) P (S1 \ S2 jS1 ) = P (SP
= P (S
= P (SP1(S
= P (S2 ) = p2 .
(S1 )
P (S1 )
1)

(S1 \S2 )
P (S1 )P (S2 )
1 [S2 ))
b) P (S1 \ S2 jS1 [ S2 ) = P (S1P\S(S21\(S
=P
[S2 )
P (S1 [S2 ) = P (S1 )+P (S2 ) P (S1 \S2 ) =
p1 p2
p1 +p2 p1 p2 :
Exemplul 1.6. Determinati probabilitatea de a trage, f
ar
a nlocuire, 2 asi
succesiv dintr-un pachet de c
arti de joc f
ar
a jokeri.
Fie A1 evenimentul "prima carte tras
a este un as" si similar A2 . Se cere
P (A1 \ A2 ).
4
(sunt 4 asi n cele 52 de c
arti din pachet).
P (A1 ) = 52
3
P (A2 jA1 ) = 51
(dac
a prima carte tras
a este un as, au r
amas 51 de c
arti
dintre care 3 sunt asi).
4
3
1 \A2 )
P (A2 jA1 ) = P (A
=) P (A1 \ A2 ) = P (A1 ) P (A2 jA1 ) = 52
P (A1 )
51 =
1
1
1
13 17 = 221 :

Propozi
tie. Fie ( ; K; P ) cmp de probabilitate si A1 ; A2 ; :::; An 2 K a. .
P (A1 \ A2 \ ::: \ An 1 ) > 0. Atunci
P (A1 \ A2 \ ::: \ An ) = P (A1 ) P (A2 jA1 )P (A3 jA1 \ A2 ) :::P (An jA1 \ A2 \ ::: \ An
Demonstra
tie. A1 A1 \ A2 ::: A1 \ A2 \ ::: \ An 1 =) P (A1 )
P (A1 \ A2 ) ::: P (A1 \ A2 \ ::: \ An 1 ) > 0 =) probabilit
atile
conditionate din membrul drept au sens.
1 \A2 )
P (A1 ) P (A2 jA1 )P (A3 jA1 \ A2 ) :::P (An jA1 \ A2 \ ::: \ An 1 ) = P (A1 ) P (A
P (A1 )

1 \A2 \:::\An )
::: PP(A(A1 \A
= P (A1 \ A2 \ ::: \ An ) :
2 \:::\An 1 )
Deni
tia 1.6. Fie Bi
; 8i 2 I: (Bi )i2I se numeste partitie a lui
[
si numai dac
a (Bi )i2I sunt disjuncte dou
a cte dou
a si
Bi = :

P (A1 \A2 \A3 )


P (A1 \A2 )

dac
a

i2I

Teorema probabilit
a
tii totale. Fie ( ; K; P ) cmp de probabilitate si
(Bi )i2I
K partitie cel mult num
arabil
a a lui
a. . P (Bi ) > 0; 8i 2 I:
Atunci, 8A 2 K,
X
P (A) =
P (AjBi ) P (Bi ) :
i2I

Demonstra
tie. (Bi )i2I mutual exclusive, A \ Bi
Bi ; 8i 2 I =)
X
X P (A\B
i)
(A \ Bi )i2I mutual exclusive =)
P (AjBi ) P (Bi ) =
P (Bi ) =
P (Bi )
i2I
i2I
!
!!
X
[
[
P (A \ Bi ) = P
(A \ Bi ) = P A \
Bi
= P (A \ ) = P (A) :
i2I

i2I

i2I

Exemplul 1.7. S
a se determine probabilitatea ca un nivel critic al curgerii
s
a e atins n timpul furtunilor ntr-un sistem de canalizare pe baza m
asur
atorilor meteorologice si hidrologice.
Fie Bi ; i = 1; 2; 3 diferitele nivele (mic, mediu si mare) de precipitatii cauzate
de o furtun
a si Aj ; j = 1; 2 nivelele critic, respectiv necritic al curgerii.
Probabilit
atile P (Bi ) pot estimate din nregistr
arile meteorologice, iar P (Aj jBi )
din analiza curgerii. Presupunem c
a:
P (B1 ) = 0; 5; P (B2 ) = 0; 3; P (B3 ) = 0; 2;
P (A1 jB1 ) = 0; P (A1 jB2 ) = 0; 2; P (A1 jB3 ) = 0; 6;
P (A2 jB1 ) = 1; P (A2 jB2 ) = 0; 8; P (A2 jB3 ) = 0; 4:
Deoarece B1 ; B2 ; B3 constituie o partitie, din teorema probabilit
atii totale
avem:
P (A1 ) = P (A1 jB1 ) P (B1 )+P (A1 jB2 ) P (B2 )+P (A1 jB3 ) P (B3 ) = 0 0; 5+
0; 2 0; 3 + 0; 6 0; 2 = 0; 18:

1.5

Formula lui Bayes

Thomas Bayes a fost un lozof englez.


Teorema lui Bayes. Fie ( ; K; P ) cmp de probabilitate si A; B 2 K a. .
P (A) 6= 0 si P (B) 6= 0. Atunci:
P (BjA) =

P (AjB) P (B)
:
P (A)
7

1) :

P (A\B)

P (B)

(B)
= P (B)
= P P(B\A)
Demonstra
tie. P (AjB)P
P (A)
P (A)
(A) = P (BjA) :
Formula lui Bayes. Fie ( ; K; P ) cmp de probabilitate si (Bi )i2I
K
partitie cel mult num
arabil
a a lui a. . P (Bi ) > 0; 8i 2 I: Atunci, 8A 2 K a.
. P (A) 6= 0; 8i 2 I;
P (Bi jA) = XP (AjBi )P (Bi ) :
[P (AjBj )P (Bj )]

j2I

Demonstra
tie. XP (AjBi )P (Bi )

[P (AjBj )P (Bj )]

TPT P (AjBi )P (Bi ) TB


=
=
P (A)

P (Bi jA) :

j2I

Exemplul 1.8. n exemplul 1.7, s


a se determine P (B2 jA2 ), probabilitatea
ca, dat ind c
a s-a atins un nivel necritic al curgerii, el s
a fost datorat unei
furtuni de nivel mediu. Din formula lui Bayes rezult
a
P (A2 jB2 )P (B2 )
0;8 0;3
0;24
0;24
= 1 0;5+0;8
P (B2 jA2 ) = X
3
0;3+0;4 0;2 = 0;5+0;24+0;08 = 0;82 =
j=1

[P (A2 jBj )P (Bj )]

12
41

= 0; 293:
Exemplul 1.9. Un canal de comunicare binar simplu transmite mesaje
folosind doar 2 semnale, s
a spunem 0 si 1. Presupunem c
a, pentru un canal
binar dat, 40%din timp e transmis un 1; probabilitatea ca un 0 transmis s
a
e corect receptionat este 0,9 si probabilitatea ca un 1 transmis s
a e corect
receptionat este 0,95. Determinati:
a) probabilitatea ca un 1 s
a e primit;
b) dat ind c
a un 1 este primit, probabilitatea ca un 1 s
a fost transmis.
Fie
A = "1 este transmis"
A = "0 este transmis"
B = "1 este primit"
B = "0 este primit".
Din ipoteze
P (A) = 0; 4; P A = 0; 6;
P (BjA) = 0; 95; P BjA = 0; 05;
P BjA = 0; 9; P BjA = 0; 1:
a) Deoarece A si A formeaz
a o partitie, din teorema probabilit
atii totale
rezult
a c
a
P (B) = P (BjA) P (A) + P BjA P A = 0; 95 0; 4 + 0; 1 0; 6 = 0; 38 +
0; 06 = 0; 44:
b) Din teorema lui Bayes,
(A)
0;4
0;38
19
= 0;95
P (AjB) = P (BjA)P
P (B)
0;44 = 0;44 = 22 = 0; 864:

2.1

Variabile aleatoare. Variabile aleatoare discrete


si variabile aleatoare continue, cu densitate de reparti
tie. Func
tie de reparti
tie. Momentele unei variabile aleatoare
Variabile aleatoare

Consider
am un experiment aleator ale c
arui rezultate sunt elemente ale spatiului
probelor din cmpul de probabilitate ( ; K; P ) : Pentru a construi un model
pentru o variabil
a aleatoare, presupunem c
a e posibil s
a asociem un num
ar real
X (!) pentru ecare rezultat !, urmnd un anumit set de reguli.
Deni
tia 2.1. Functia X se numeste variabila aleatoare dac
a si numai dac
a
a) X : ! R, unde ( ; K; P ) este cmp de probabilitate si
b) 8x 2 R; f! 2 jX (!) xg 2 K.
Conditia b) din denitie e asa-numita "conditie de m
asurabilitate". Ea ne
asigur
a c
a are sens s
a consider
am probabilitatea evenimentului f! 2 jX (!) xg,
notat mai simplu X
x pentru orice x 2 R, sau, mai general, probabilitatea
oric
arei combinatii nite sau num
arabile de astfel de evenimente.
n continuare, dac
a nu e specicat altfel, variabilele aleatoare sunt
considerate pe un cmp de probabilitate ( ; K; P ) :

2.2

Variabile aleatoare discrete


si variabile aleatoare continue, cu densitate de reparti
tie

Deni
tia 2.2. O variabil
a aleatoare se numeste discreta dac
a si numai dac
a
ia numai valori izolate. Multimea valorilor unei variabile aleatoare discrete este
cel mult num
arabil
a.
Deni
tia 2.3. O variabil
a aleatoare se numeste continua dac
a valorile ei
umplu un interval.
Deni
tia 2.4. Fie X, variabil
a aleatoare
a. O functie fX : R ! R
Z continu
x

a. . fX (x)

0; 8x 2 R si P (X

x) =

fX (u) du; 8x 2 R se numeste

functie densitate de repartitie sau functie densitate de probabilitate sau simplu


densitate a lui X:

2.3

Func
tie de reparti
tie

Deni
tia 2.5. Fie X variabil
a aleatoare. Functia FX : R ! R;
FX (x) = P (X

x) ;

se numeste functia de repartitie de probabilitate sau simplu functia de repartitie a lui X.


Indicele X identic
a variabila aleatoare. Acest indice e uneori omis cnd nu
e pericol de confuzie.

Propriet
a
ti ale func
tiei de reparti
tie. 1) Exist
a si are valori ntre 0 si
1:
2) E continu
a la dreapta si cresc
atoare. Mai mult, avem:
FX ( 1) := lim FX (x) = 0 si FX (1) := lim FX (x) = 1:
x! 1

x!1

3) Dac
a a; b 2 R a. . a < b, atunci
P (a < X b) := P (f! 2 ja < X (!) bg) = FX (b) FX (a) :
Aceast
a relatie rezult
a din
P (X b) = P (X a) + P (a < X b) :
Exemplul 2.1. Fie X o variabil
a aleatoare discret
a cu valorile 1; 1; 2; 3
1 1 2 3
am X
luate cu probabilit
atile 41 ; 18 ; 18 , respectiv 21 . Pe scurt not
1
1
1
1
Avem

8
0, pentru x < 1;
>
>
>
>
1 x < 1;
< 14 , pentru
3
,
pentru
1
x < 2;
FX (x) =
8
>
1
>
,
pentru
2
x < 3;
>
>
: 2
1, pentru x 3:
Gracul lui FX este dat mai jos.

Este tipic pentru functia de repartitie a unei variabile aleatoare discrete s


a
creasc
a de la 0 la 1 "n trepte".
10

Exemplul 2.2. O functie de repartitie tipic


a pentru o variabil
a aleatoare
continu
a este reprezentat
a grac mai jos.

Ea nu are salturi sau discontinuit


ati ca n cazul unei variabile aleatoare
discrete. Probabilitatea ca X s
a aib
a o valoare ntr-un anumit interval este
dat
a de proprietatea 3) a functiei de repartitie. Din grac
P ( 1 < X 1) = FX (1) FX ( 1) = 0; 8 0; 4 = 0; 4:
Avem P (X = a) = 0; 8a 2 R:
Observa
tie. Se poate deni functia de repartitie si ca FX : R ! R; FX (x) =
P (X < x). n acest caz propriet
atile 1) si 2) r
amn valabile cu exceptia faptului
c
a functia de repartitie este continu
a la stnga si nu la dreapta, iar proprietatea
3) devine
3) Dac
a a; b 2 R a. . a < b, atunci
P (a X < b) = FX (b) FX (a) :
0
Propriet
a
ti ale densit
a
tii. 1) fX (x) = FX
(x) ; 8x n care FX este
derivabil
a.
2)
Z
x

FX (x) =

3)

fX (u) du; 8x 2 R:

fX (x) dx = 1:

4) Dac
a a; b 2 R a. . a < b, atunci
P (a < X

b) = FX (b)

FX (a) =

fX (x) dx:
a

Exemplul 2.3. Un exemplu de densitate e reprezentat


a grac mai jos.

11

Dup
a cum indic
a propriet
atile 3) si 4), aria total
a de sub curb
a este 1 si
suprafata hasurat
a de la a la b e egal
a cu P (a < X b).
Observa
tie. Cunoasterea densit
atii sau a functiei de repartitie
caracterizeaz
a complet o variabil
a aleatoare continu
a.
Exemplul 2.4. Fie a > 0. O variabil
a aleatoare X a c
arei densitate este
ae ax , pentru x > 0;
fX (x) =
0, altfel,
se numeste repartizata exponential (de parametru a). Avem fX (x) 0; 8x 2
R siZ
Z
Z
1

fX (x) dx =

0dx +

ae

ax

dx = 0

ax 1
j0

= 1;

deci fX veric
a proprietatea 3).
Dac
a
x
<
0,
atunci
Z x
Z x
fX (u) du =
0du = 0:
Dac
Z x a x 0, atunciZ
fX (u) du =
1

0du +
1

ae
0

au

du = 0

au x
j0

=1

ax

Deci, din proprietatea 2) avem


0, pentru x < 0;
FX (x) =
1 e ax , pentru x 0:
Gracul densit
atii e dat n gura (a), iar al functiei de repartitie n gura
(b) de mai jos.

12

Calcul
am unele probabilit
ati folosind fX .
P (0 < X 1) e egal
a cu aria de sub gracul lui fX de la x = 0 la x = 1,
dup
a cum se arat
a n gura (a). Avem
Z 1
P (0 < X 1) =
fX (x) dx = e ax j10 = 1 e a :
0

13

P (X > 3) e obtinut
a calculnd aria de sub gracul lui fX la dreapta lui
x = 3, deci
Z 1
3a
fX (x) dx = e ax j1
P (X > 3) =
:
3 =e
3

Aceleasi probabilit
ati pot obtinute din FX astfel:
P (0 < X 1) = FX (1) FX (0) = 1 e a 0 = 1 e a ;
P (X > 3) = FX (1) FX (3) = 1
1 e 3a = e 3a :
Mai observ
am c
a P (0 < X 1) = P (0 X 1) pentru variabile aleatoare
continue, deoarece P (X = 0) = 0:
Deni
tia 2.6. Fie X variabil
a aleatoare discret
a. Functia pX : R !
R; pX (x) = P (X = x) := P (f! 2 jX (!) = xg) se numeste functia masa de
probabilitate a lui X, sau, pe scurt, masa lui X.
Din nou indicele X e folosit pentru a identica variabila aleatoare asociat
a.
Exemplul 2.5. Functia mas
a de probabilitate a variabilei aleatoare X
1 1 2 3
din exemplul 2.1 e reprezentat
a mai jos.
1
1
1
1
4

Observa
tii. 1) Dac
a X e variabil
a aleatoare discret
a cu multimea cel mult
num
arabil
a de valori fx1 ; x2 ; :::g luate cu probabilit
ati nenule, atunci:
0 < pX (xi ) 1; 8i;
X
pX (xi ) = 1;
i

pX (x) = 0; 8x 2
= fx1 ; x2 ; :::g :

14

2) Ca si FX , specicarea lui pX caracterizeaz


a complet variabila aleatoare
discret
a X. Mai mult, presupunnd x1 < x2 < :::, relatiile dintre FX si pX sunt
pX (x1 ) = FX (x1 ) ;
pX (xi ) = FX (xi ) FX (xi 1 ) ; 8i > 1;
X
FX (x) =
pX (xi ) ; 8x 2 R:
ijxi x

3) Specicarea lui pX se face de obicei dnd numai valorile pozitive, n restul


punctelor subntelegndu-se c
a e 0:

2.4

Momentele unei variabile aleatoare

Fie X variabil
a aleatoare discret
a cu valorile x1 ; x2 ; ::: si functia mas
a de
probabilitate pX sau continu
a cu densitatea fX .
Deni
tia 2.7. Num
arul real
8 X
>
xi pX (xi ) , pentru X discret
a;
>
<
Zi 1
E (X) :=
>
>
xfX (x) dx, pentru X continu
a,
:
1

dac
a exist
a, se numeste media lui X si se mai noteaz
a mX sau simplu m:
Deni
tia 2.8. Fie n 2 N . Num
arul real
8 X
>
xni pX (xi ) , pentru X discret
a;
>
<
n
i
Z
1
n := E (X ) =
>
>
xn fX (x) dx, pentru X continu
a,
:
1

dac
a exist
a, se numeste momentul de ordinul n al lui X:
Observa
tie. Media este momentul de ordinul 1.
1 1 2 3
Exemplul 2.6. Fie X
din exemplul 2.1.
1
1
1
1
4

E (X) = ( 1) 14 + 1 18 + 2 18 + 3 21 = 41 + 18 + 14 + 32 = 18 + 23 = 13
8 :
Exemplul 2.7. Timpul de asteptare X (n minute) al unui client la un
automat de bilete are densitatea
2e 2x , pentru x > 0;
fX (x) =
0, altfel.
Determinati timpul mediu de asteptare.
IntegrndZprin p
arti avem Z
Z
Z
1

E (X) =

xe

2x 1
j0

xfX (x) dx =

1
1

0dx+

2x

dx = 0

x 2e

1
2x 1
j0
2e

1
2

2x

dx = 0

x e

2x 0

dx =

minut.

Propriet
a
ti ale mediei. Dac
a c 2 R este o constant
a si X si Y sunt
variabile aleatoare pe acelasi cmp de probabilitate ( ; K; P ), atunci:
15

E (c) = c;
E (cX) = cE (X) ;
E (X + Y ) = E (X) + E (Y ),
E (X) E (Y ), dac
a X Y (i.e. X (!) Y (!) ; 8! 2 ).
Deni
tia 2.9. Fie X variabil
a aleatoare. Se numeste mediana a lui X o
a o astfel de valoare nu exist
a,
valoare x0 a lui X a. . P (X x0 ) = 21 sau, dac
valoarea x0 a lui X a. . P (X < x0 ) < 21 si P (X x0 ) > 21 .
Media lui X poate s
a nu existe, dar exist
a cel putin o median
a.
n comparatie cu media, mediana e uneori preferat
a ca m
asur
a a tendintei
centrale cnd repartitia e asimetric
a, n particular cnd sunt un num
ar mic de
valori extreme n repartitie. De exemplu, vorbim de mediana veniturilor ca
o bun
a m
asur
a a tendintei centrale a venitului personal pentru o populatie.
Aceasta e o m
asur
a mai bun
a dect media, deoarece mediana nu e asa sensibil
a
la un num
ar mic de venituri extrem de mari sau venituri extrem de mici ca
media.
Exemplul 2.8. Fie T timpul dintre emisiile de particule la un atom radioactiv. Este stabilit c
a T e o variabil
a aleatoare cu repartitie exponential
a,
adic
a
e t , pentru t > 0;
fT (t) =
0, altfel,
unde e o constant
a pozitiv
a. Variabila aleatoare T se numeste timpul de
viata al atomului si o m
asur
a medie a acestui timp de viata este timpul de
njum
at
atire, denit ca mediana lui T . Astfel, timpul de njum
at
atire e g
asit
din
Z
= 12 () e
=
fT (t) dt = 21 () 1 e
P (T
) = 21 ()
1
2

() = ln 2 :
Observ
am
a viata medie E (T ) este
Z c
E (T ) =

tfT (t) dt =

(se calculeaz
a analog ca la exemplul 2.7).

Deni
tia 2.10. Fie X variabil
a aleatoare. Se numeste modul sau moda a
lui X
a) o valoare xi luat
a de X a. . pX (xi ) > pX (xi+1 ) si pX (xi ) > pX (xi 1 ),
dac
a X e discret
a cu valorile x1 < x2 < :::;
b) un punct de maxim local al lui fX , dac
a X e continu
a.
Un modul este astfel o valoare a lui X corespunz
atoare unui vrf n functia
mas
a de probabilitate sau n densitate.
Termenul distributie unimodala se refer
a la o functie de repartitie a unei
variabile aleatoare care are un modul unic.
Media, mediana si modulul coincid atunci cnd o repartitie unimodal
a este
simetric
a.
Deni
tia 2.11. Fie n 2 N si X variabil
a aleatoare de medie m. Momentul
centrat de ordinul n al lui X este

16

8 X
n
>
(xi m) pX (xi ) , pentru X discret
a;
>
<
n
i
Z
m) ) =
1
n
>
>
(x m) fX (x) dx, pentru X continu
a.
:

= E ((X

Deni
tia 2.12. Fie X variabil
a aleatoare.Varianta sau dispersia lui X este
momentul centrat de ordinul 2 al lui X; 2 . Se noteaz
a cu 2X sau simplu 2
sau var (X).
Valori mari ale lui 2X implic
a o ntindere mare a valorilor lui X n jurul
mediei. Reciproc, valori mici ale lui 2X implic
a o concentrare a valorilor lui
X n jurul mediei. n cazul extrem cnd 2X = 0, X = m cu probabilitatea 1
(ntreaga mas
a a distributiei e concentrat
a n medie).
Propozi
tie. Relatia dintre dispersia si momentele lui X este
2
= 2 m2 :
2
Demonstra
tie. 2 = E (X m) = E X 2 2mX + m2 = E X 2
2mE (X) + m2 = 2 2m2 + m2 = 2 m2 :
Alte propriet
a
ti ale dispersiei. var (X) 0;
var (X + c) = var (X) ; 8c 2 R;
var (cX) = c2 var (X) ; 8c 2 R:
Fie X r
variabil
a aleatoare de medie m. Se numeste deviatie standard a lui X
X

E (X

m)

a X are aceeasi unitate


Un avantaj al folosirii lui X n locul lui 2X este c
de m
asur
a ca media. De aceea poate comparat
a cu media pe aceeasi scal
a
pentru a obtine o m
asur
a a gradului de mpr
astiere.
Un num
ar adimensional (f
ar
a unitate de m
asur
a) care caracterizeaz
a mpr
astierea relativ la medie si care faciliteaz
a compararea variabilelor aleatoare
de unit
ati diferite este coecientul de variatie denit de
vX =
Exemplul 2.9. Fie X

1
1
4

mX

1
8

1
8

1
2

din exemplul 2.1. S


a deter-

min
am 2X .
n exemplul 2.6 am v
azut c
a mX = 13
8 . Avem
2
1
2
2 1
2 1
E X = ( 1) 4 + 1 8 + 2 8 + 32 12 = 41 +
169
344 169
2
2
m2X = 43
= 175
X =E X
8
64 =
64
64 :

1
8

1
2

9
2

3
8

+5=

43
8 :

2e 2x , pentru x 0;
:
0, altfel.
1
n exemplul 2.7 am v
azut c
a mX = 2 : Avem, integrnd prin p
arti
Z 1
Z 0
Z 1
Z 1
0
x2 fX (x) dx =
0dx+
x2 2e 2x dx = 0
x2 e 2x dx =
E X2 =
1
0
0
Z 11
1
1
2
2x 1
2x
x e
j0 +
2xe
dx = 0 + 2 = 2 , ultima integral
a ind calculat
a la
Exemplul 2.10. Determin
am dispersia lui X cu fX (x) =

17

exemplul 2.7.
Deci
2
2
m2X = 12 41 = 14 :
X =E X
Coecientul de asimetrie denit de
3
1 = 3
d
a o m
asur
a a simetriei unei distributii. Este pozitiv cnd o distributie
unimodal
a are o coad
a dominant
a la dreapta (adic
a modulul este la stnga
mediei) si negativ n caz contrar. Este 0 cnd o distributie e simetric
a n jurul
mediei. De fapt, o distributie simetric
a n jurul mediei are toate momentele
centrate de ordin impar 0. n gurile (a), (b) si (c) sunt reprezentate densit
ati
cu 1 > 0; 1 = 0; respectiv 1 < 0:

18

Gradul de aplatizare a distributiei lng


a vrfuri poate m
asurat de coecientul de exces denit de
4
3:
2 = 4
Un 2 > 0 implic
a un vrf ascutit n vecin
atatea modulului unei distributii
unimodale, iar 2 < 0 implic
a, de regul
a, un vrf turtit.
2.4.1

Inegalitatea lui Ceb


sev

Teorema 2.1. (Inegalitatea lui Ceb


sev) Fie X variabil
a aleatoare cu media
mX si deviatia standard X 6= 0. Atunci
19

P (jX

mX j

X)

1
;
k2

(2.1)

pentru orice k > 0:


Demonstra
Z 1 tie. Presupunem X continu
Z a. Din denitie avem
2
2
2
(x mX ) fX (x) dx
(x mX ) fX (x) dx
X =
1
jx
m
j
k
X
X
Z
2 2
2 2
k X
fX (x) dx = k X P (jX mX j k X ) :
jx mX j k

Rezult
a relatia (2.1). Demonstratia este similar
a cnd X este discret
a.

20

3.1

Independen
ta variabilelor aleatoare. Densitate de reparti
tie condi
tionat
a
si formula lui
Bayes pentru densit
a
ti de reparti
tie. Covarian
ta
si corela
tie

Independen
ta variabilelor aleatoare

Toate variabilele aleatoare sunt considerate pe acelasi cmp de probabilitate


( ; K; P ), dac
a nu se specic
a altfel.
Deni
tia 3.1. a) Functia de repartitie comuna a variabilelor aleatoare X
si Y este denit
a de
FXY (x; y) = P (X

x\Y

y) :

b) Functia de repartitie comuna a variabilelor aleatoare X1 ; X2 ; :::; Xn este


denit
a de
FX1 X2 :::Xn (x1 ; x2 ; :::; xn ) = P (X1

x1 \ X2

x2 \ ::: \ Xn

xn ) :

Propriet
a
ti 3.1. a) FXY (x; y) 0; 8x; y 2 R:
b) FXY e cresc
atoare n x si y.
c) FXY e continu
a la dreapta n raport cu x si y.
d) FXY ( 1; 1) = FXY ( 1; y) = FXY (x; 1) = 0; 8x; y 2 R:
e) FXY (1; 1) = 1:
f) FXY (x; 1) = FX (x) ; 8x 2 R:
g) FXY (1; y) = FY (y) ; 8y 2 R:
h) 8x1 ; x2 ; y1 ; y2 2 R a. . x1 < x2 si y1 < y2 ;
P (x1 < X x2 \ y1 < Y
y2 ) = FXY (x2 ; y2 ) FXY (x1 ; y2 ) FXY (x2 ; y1 )+
FXY (x1 ; y1 ) :
Demonstr
am de exemplu f):
FXY (x; 1) = P (X x \ Y
1) = P (X x \ ) = P (X x) = FX (x) ; 8x 2
R:
Propriet
ati similare se pot deduce pentru FX1 X2 :::Xn :
Forma general
a a lui FXY poate vizualizat
a din propriet
atile d)-g). n cazul
cnd X si Y sunt discrete FXY seam
an
a cu un colt al unor trepte neregulate,
ca n gura de mai jos.

21

Creste de la 0 la n
altimea de 1 n directia dinspre cadranul 3 spre cadranul
1. Cnd X si Y sunt continue FXY este o suprafata neted
a cu aceleasi tr
as
aturi.
Propriet
atile f) si g) arat
a c
a functiile de repartitie ale variabilelor aleatoare
individuale, numite functii de repartitie marginale, pot calculate din functia
de repartitie comun
a a lor. Reciproca nu este n general adev
arat
a. O situatie
important
a cnd reciproca este adev
arat
a este cnd X si Y sunt independente.
Deni
tia 3.2. a) Variabilele aleatoare X si Y sunt independente dac
a si
numai dac
a P (X x \ Y
y) = P (X x) P (Y
y) ; 8x; y 2 R:
b) Variabilele aleatoare X1 ; X2 ; :::; Xn sunt independente dac
a si numai dac
a
P (X1 x1 \ X2 x2 \ ::: \ Xn xn ) = P (X1 x1 ) P (X2 x2 ) :::P (Xn xn ) ; 8x1 ; x2 ; :::; xn 2
R:
c) Fie I multime innit
a. Variabilele aleatoare (Xi )i2I sunt independente
() (Xi )i2J sunt independente, 8J I nit
a.
Observa
tii. a) X si Y sunt independente ()
FXY (x; y) = FX (x) FY (y) ; 8x; y 2 R:
b) X1 ; X2 ; :::; Xn sunt independente ()
FX1 X2 :::Xn (x1 ; x2 ; :::; xn ) = FX1 (x1 ) FX2 (x2 ) :::FXn (xn ) ; 8x1 ; x2 ; :::; xn 2 R:
c) X si Y sunt independente =)

22

P (x1 < X x2 \ y1 < Y


y2 ) = P (x1 < X x2 ) P (y1 < Y
y2 ) ; 8x1 ; x2 ; y1 ; y2 2
R a. . x1 < x2 si y1 < y2 :
Demonstra
tie. a), b) Evident.
c) P (x1 < X x2 \ y1 < Y
y2 ) =
FXY (x2 ; y2 ) FXY (x1 ; y2 ) FXY (x2 ; y1 ) + FXY (x1 ; y1 ) =
FX (x2 ) FY (y2 ) FX (x1 ) FY (y2 ) FX (x2 ) FY (y1 ) + FX (x1 ) FY (y1 ) =
(FX (x2 ) FX (x1 )) (FY (y2 ) FY (y1 )) = P (x1 < X x2 ) P (y1 < Y
y2 ) :
n general:
!
n
n
\
Y
X1 ; X2 ; :::; Xn sunt independente () P
Xi 2 Ai =
P (Xi 2 Ai ) ; 8A1 ; :::; An
i=1

i=1

intervale sau multimi cu un singur element din R:


Aici Xi 2 Ai = f! 2 jXi (!) 2 Ai g.
Deni
tia 3.3. a) Functia masa de probabilitate comuna a variabilelor
aleatoare discrete X si Y este denit
a de
pXY (x; y) = P (X = x \ Y = y) ; 8x; y 2 R:
b) Fie n variabile aleatoare discrete X1 ; X2 ; :::; Xn : Functia masa de probabilitate comuna a lor este denit
a de

pX1 X2 :::Xn (x1 ; x2 ; :::xn ) = P (X1 = x1 \ X2 = x2 \ ::: \ Xn = xn ) ; 8x1 ; x2 ; :::; xn 2 R:


Propriet
a
ti 3.2. Fie X si Y variabile aleatoare discrete care iau o multime
cel mult num
arabil
a de perechi de valori (xi ; yj ) ; i; j = 1; 2; ::: cu probabilit
ati
nenule.
a) pXY (x; y) = 0 peste tot, exceptnd punctele (xi ; yj ) ; i; j = 1; 2; ::: unde
ia valori egale cu probabilitatea comun
a P (X = xi \ Y = yj ) :
b) X
0 <X
pXY (xi ; yj ) 1;
c)
pXY (xi ; yj ) = 1;
d)
e)

i
X

i
X

pXY (xi ; y) = pY (y) ;

pXY (x; yj ) = pX (x) ;

f) FXY (x; y) =

ijxi x jjyj

pXY (xi ; yj ) ; 8x; y 2 R:

Acum pX (x) si pY (y) sunt numite functii masa de probabilitate marginale.


Propriet
ati similare pot scrise pentru pX1 X2 :::Xn :
Deni
tia 3.4. a) Functia densitate de probabilitate comuna a dou
a variabile
aleatoare continue X si Y este denit
a de derivata partial
a
fXY (x; y) =

@ 2 FXY
(x; y) ;
@x@y

dac
a exist
a.

23

b) Fie vectorul aleator X cu componente variabilele aleatoare continue X1 ; X2 ; :::; Xn


care au functia de repartitie comun
a
FX (x) = P (X1 x1 \ X2 x2 \ ::: \ Xn xn ) ;
unde x este vectorul cu componentele x1 ; x2 ; :::; xn :
Functia densitate comuna corespunz
atoare este
fX (x) =

@ n FX
(x) ;
@x1 @x2 :::@xn

dac
a derivatele partiale indicate exist
a.
Propriet
a
ti 3.3. a) fXY (x; y) 0 deoarece FXY este cresc
atoare n x si y.
b) Din denitie,
Z y Z x
fXY (u; v) dudv:
FXY (x; y) = P (X x \ Y
y) =
1

c) Dac
a x1 < x2 si y1 < y2 , atunci Z
P (x1 < X x2 \ y1 < Y
y2 ) =

y2
y1

x2

fXY (x; y) dxdy:


x1

d) fXY deneste o suprafata deasupra planului (x; y). Dup


a cum indic
a
proprietatea 3.3 c), probabilitatea ca variabilele aleatoare X si Y s
a se ae
ntr-o anumit
a suprafata R este egal
a cu volumul de sub suprafata fXY m
arginit
de acea regiune, ca n gura de mai jos.

24

e)

1
1

fXY (x; y) dxdy = 1:

Aceast
a proprietate rezult
a din proprietatea b) punnd x ! 1 si y ! 1 si
arat
aZ
c
a volumul total de sub suprafata fXY este 1:
1
f)
fXY (x; y) dy = fX (x) :
1

Aceasta rezult
a din

FX (x) = FXY (x; 1) =

1
1

derivnd
Z 1 n raport cu x:
g)
fXY (x; y) dx = fY (y) :

fXY (u; y) dudy;


1

Densit
atile fX si fY din propriet
atile f) si g) se numesc densitati marginale
ale lui X, respectiv Y:

3.2

Densitate de reparti
tie condi
tionat
a
si formula lui Bayes
pentru densit
a
ti de reparti
tie

Functia de repartitie conditionata a variabilei aleatoare X dat ind c


a alt
a
variabil
a aleatoare Y ia valoarea y este denit
a de
25

FXY (xjy) = P (X

xjY = y) :

Fie X si Y variabile aleatoare continue. Functia densitate de repartitie


conditionata (pe scurt densitate conditionata ) a lui X dat ind Y = y, notat
a fXY (xjy) este derivata functiei de repartitie conditionat
a corespunz
atoare
ei, adic
a
fXY (xjy) = dFXYdx(xjy) :
Avem, pentru x1 < x2 si y1 < y2 :
Z Z
y2

x2

fXY (u;v)dudv

P (x1 < X

x2 jy1 < Y

y2 ) =

P (x1 <X x2 \y1 <Y


P (y1 <Y y2 )

Punnd x1 !Z 1; x2 = x; y2 & y1 = y, obtinem:


x

y2 )

y1

x1
y2

fY (v)dv
y1

fXY (u;y)du

1
FXY (xjy) =
;
fY (y)
cu conditia ca fY (y) 6= 0:
Mai departe obtinem
(x;y)
(3.1) fXY (xjy) = dFXYdx(xjy) = fXY
a fY (y) 6= 0:
fY (y) , dac
Pentru functia de repartitie conditionat
a nu e valabil
a o formul
a asem
an
a(x;y)
:
toare, adic
a FXY (xjy) 6= FXY
FY (y)
Cnd X si Y sunt independente avem FXY (xjy) = FX (x) si din relatia (3.1)
obtinem
fXY (xjy) = fX (x)
si
fXY (x; y) = fX (x) fY (y) ;
adic
a densitatea comun
a e egal
a cu produsul densit
atilor marginale cnd X
si Y sunt independente.
Mai avem si Z

FXY (xjy) =

fXY (ujy) du:

Extinderile pentru mai multe variabile aleatoare sunt imediate. Plecnd de

la
P (A \ B \ C) = P (AjB \ C) P (BjC) P (C)
pentru trei evenimente A; B si C, avem n cazul a trei variabile aleatoare
continue X; Y si Z;
fXY Z (x; y; z) = fXY Z (xjy; z) fY Z (yjz) fZ (z) :
Pentru cazul a n variabile aleatoare continue X1 ; X2 ; :::; Xn , componente ale
vectorului aleator X, putem scrie
fX (x) = fX1 X2 :::Xn (x1 jx2 ; :::; xn ) fX2 :::Xn (x2 jx3 ; :::; xn ) :::fXn 1 Xn (xn 1 jxn ) fXn (xn ) :
Dac
a X1 ; X2 ; :::; Xn sunt independente, obtinem
fX (x) = fX1 (x1 ) fX2 (x2 ) :::fXn (xn ) :
Formula lui Bayes pentru densit
a
ti de reparti
tie. Dac
a X si Y sunt
variabile aleatoare continue, atunci

26

fXY (xjy) =

fY X (yjx)fX (x)
fY (y)

dac
a fY (y) 6= 0:

3.3

=Z

fY X (yjx)fX (x)

fY X (yj )fX ( )d
1

Covarian
ta
si corela
tie

Fie X si Y variabile aleatoare discrete care iau o multime cel mult num
arabil
a
de perechi de valori (xi ; yj ) ; i; j = 1; 2; ::: cu probabilit
ati nenule sau variabile
aleatoare continue.
Deni
tia 3.5. Fie n; m 2 N:
a) Momentele comune nm ale variabilelor aleatoare X si Y sunt date de,
dac
a exist
a,
8 XX
n
>
xm
a X si Y sunt discrete,
>
i yj pXY (xi ; yj ) , dac
<
i
jZ
n m
Z
1
1
nm = E (X Y ) =
>
>
xn y m fXY (x; y) dxdy, dac
a X si Y sunt continue.
:
1

b) Similar, momentele centrate comune ale lui X si Y , cnd exist


a, sunt date

de

= E ((X mX ) (Y mY ) ) :
Observa
tii. Cu notatiile folosite aici, mediile lui X si Y sunt 10 , respectiv,
.
De
exemplu,
folosind
obtinem
01
Z
Z denitia 3.5 a) pentru XZ si Y continue,
Z
nm

10

= E (X) =

xfXY (x; y) dxdy =

fXY (x; y) dydx =

xfX (x) dx;

unde fX este densitatea marginal


a a lui X. Astfel vedem c
a acest rezultat
e identic cu cel din cazul unei singure variabile aleatoare.
Aceast
a observatie este adev
arat
a si pentru dispersiile individuale. Ele sunt
,
respectiv
;

s
i
pot

g
a
site
din
denitia 3.5 b) cu nlocuiri corespunz
atoare
20
02
pentru n si m. Ca si n cazul unei singure variabile aleatoare avem
2
2
m2X ;
20 = 20
10 sau X = 20
respectiv
2
2
m2Y :
02 = 02
01 sau Y = 02
Deni
tia 3.6. Se numeste covarianta a lui X si Y
=
cov
(X; Y ) = E ((X mX ) (Y mY )) :
11
Covarianta e o m
arime a interdependentei lui X si Y:
Proprietatea 3.4. Covarianta e legat
a de nm prin
=
=
m
m
:
11
10 01
11
X Y
11
Demonstra
tie. 11 = E ((X mX ) (Y mY )) = E (XY mY X mX Y + mX mY ) =
E (XY ) mY E (X) mX E (Y ) + mX mY = 11
10 01
10 01 + 10 01 =
11
10 01 :
Deni
tia 3.7. Coecientul de corelatie al lui X si Y este
= (X; Y ) = p

27

11
20 02

11
X

Proprietatea 3.5. j j 1:
Demonstra
tie. [t (X mX ) + Y
20 t

mY ]

0; 8t 2 R =) E [t (X

2
11

mX ) + Y

mY ]

2
11

+ 2 11 t + 02
0; 8t 2 R =)
=4
4 20 02
0 =)
=) j j 1:
Coecientul de corelatie este f
ar
a dimensiune. El este si independent de
origine, adic
a 8a1 ; a2 ; b1 ; b2 2 R cu a1 ; a2 > 0 se poate demonstra c
a
(a1 X + b1 ; a2 Y + b2 ) = (X; Y ) :
Proprietatea 3.6. Dac
a X si Y sunt independente, atunci
si = 0:
11 = 0
Demonstra
tie. Fie
Z
Z
Z X Zsi Y continue.
20 02

indep.

xyfXY (x; y) dxdy =


= E (XY ) =
1
1
Z 1
xfX (x) dx
yfY (y) dy = mX mY =) 11 =

11

11

xyfX (x) fY (y) dxdy =

mX mY = 0 =)

= 0:
Similar se poate demonstra dac
a X si Y sunt discrete.
Dac
a X si Y sunt independente, atunci
(3.2) E (g (X) h (Y )) = E (g (X)) E (h (Y )) ;
dac
a mediile exist
a.
Cnd coecientul de corelatie al dou
a variabile aleatoare se anuleaz
a, spunem
c
a ele sunt necorelate.
Observa
tii. 1) X si Y sunt necorelate () E (XY ) = E (X) E (Y ).
(Rezult
a din denitii si proprietatea 3.4.)
2) X, Y independente =) X, Y necorelate. (Rezult
a din denitie si
proprietatea 3.6.)
3) Reciproca nu e adev
arat
a.
2
1 1 2
Exemplul 3.1. Fie X
si Y = X 2 :
1
1
1
1
4

Avem Y

1
2

82
>
>
<

1
4,
1
4,
1
4,
1
4,

pentru (x; y) = ( 2; 4) ;
pentru (x; y) = ( 1; 1) ;
pXY (x; y) =
pentru (x; y) = (1; 1) ;
>
>
:
pentru (x; y) = (2; 4) ;
mX = ( 2) 14 + ( 1) 14 + 1 14 + 2 14 = 0;
mY = 1 21 + 4 12 = 52 ;
1
1
1
1
11 = ( 2) 4 4 + ( 1) 1 4 + 1 1 4 + 2 4 4 = 0:
Deci
mX mY = 0 =) = X11Y = 0 =) X si Y sunt necorelate.
11 = 11
Pe de alt
a parte,
P (X
2\Y
1) = FXY ( 2; 1) = 0;
iar
P (X
2) P (Y
1) = FX ( 2) FY (1) = 41 12 = 81 ;
deci

28

P (X
2\Y
1) 6= P (X
2) P (Y
1) =) X si Y nu sunt independente.
Coecientul de corelatie m
asoar
a interdependenta liniar
a a variabilelor aleatoare,
adic
a acuratetea cu care o variabil
a aleatoare poate aproximat
a printr-o
functie liniar
a de cealalt
a. Pentru a vedea asta, consider
am problema
aproxim
arii unei variabile aleatoare X printr-o functie liniar
a de o a doua variabil
a aleatoare Y , aY + b, unde a si b sunt alese a. . eroarea medie p
atratic
ae
denit
a de
2
(3.3) e = E [X (aY + b)]
este minim
a. Avem
e = E X 2 + a2 Y 2 + b2 2aXY 2bX + 2abY = E X 2 + a2 E Y 2 +
b2 2aE (XY ) 2bmX + 2abmY ;
@e
2
2E (XY ) + 2bmY ;
@a = 2aE Y
@e
=
2b
2m
+
2amY :
X
@b
Rezolvnd sistemul
@e
@a = 0;
@e
@b = 0;
obtinem c
a minimul e atins cnd
a = XY
si
b = mX amY :
nlocuind aceste valori n relatia (3.3) obtinem eroarea medie p
atratic
a
2
minim
a 2X 1
. Vedem c
a o potrivire exact
a n sensul mediei p
atratice e
atins
a cnd j j = 1 si aproximarea liniar
a este cea mai rea cnd = 0: Cnd
= 1, X si Y se numesc pozitiv perfect corelate, n sensul c
a valorile pe care le
iau sunt pe o dreapt
a cu pant
a pozitiv
a; ele sunt negativ perfect corelate cnd
= 1 si valorile lor se aa pe o dreapt
a cu pant
a negativ
a. Aceste dou
a cazuri
extreme sunt ilustrate n gura de mai jos.

29

Valoarea lui j j descreste cnd mpr


astierea valorilor n jurul dreptelor creste.
n demonstratia faptului c
a j j 1; am obtinut
2
20 02 :
11
Folosind un procedeu similar, putem ar
ata de asemenea c
a
E 2 (XY )

E X2 E Y 2 :

Ultimele dou
a relatii sunt inegalitatile lui Schwarz.
Deni
tia 3.8. Fie X un vector coloan
a aleator cu componentele X1 ; X2 ; :::; Xn
si mX vectorul coloan
a avnd componente mediile lui X1 ; X2 ; :::; Xn : Matricea
de covarianta este
0
var (X1 )
cov (X1 ; X2 ) ::: cov (X1 ; Xn )
B cov (X2 ; X1 )
var (X2 )
::: cov (X2 ; Xn )
B
T
= E (X mX ) (X mX )
=B
..
..
..
.
..
@
.
.
.
cov (Xn ; X1 ) cov (Xn ; X2 ) :::
var (Xn )
este o matrice n n cu avnd pe diagonal
a variante si n afara diagonalei
covariante. Deoarece cov (Xi ; Xj ) = cov (Xj ; Xi ), matricea de covarianta este
simetric
a.
Urm
atorul rezultat este o generalizare a relatiei (3.2).
Teorem
a. Dac
a X1 ; X2 ; :::; Xn sunt independente, atunci
E (g1 (X1 ) g2 (X2 ) :::gn (Xn )) = E (g1 (X1 )) E (g2 (X2 )) :::E (gn (Xn )) ;
unde gj (Xj ) este o functie arbitrar
a de Xj . Se presupune c
a toate mediile
care sunt scrise exist
a.
n
X
Propozi
tie. Fie X1 ; X2 ; :::; Xn variabile aleatoare si Y =
Xi : Atunci
i=1

30

C
C
C:
A

2
Y

n
X
i=1

2
Xi

+2

cov (Xi ; Xj ) :

1 i<j n

n particular, dac
a X1 ; X2 ; :::; Xn sunt independente, atunci
n
X
2
2
Y =
Xi :
i=1

Lema 3.1. Dac


a X e un vector aleator si Y =AX, atunci
cov (Y) = Acov (X) AT :

31

Principalele reparti
tii discrete
si propriet
a
tile
lor

4.1

Reparti
tia binomial
a

O succesiune de probe e f
acut
a astfel nct
a) pentru ecare prob
a sunt doar dou
a rezultate posibile, s
a spunem succes
si esec;
b) probabilit
atile aparitiei acestor rezultate r
amn aceleasi pe durata probelor;
c) probele sunt independente.
Probele f
acute n aceste conditii se numesc probe Bernoulli.
Not
am evenimentul "succes" cu S si evenimentul "esec" cu F . Fie P (S) = p
si P (F ) = q, unde p + q = 1: Rezultate posibile din efectuarea unei succesiuni
de probe Bernoulli pot reprezentate simbolic prin
S \ S \ F \ F \ S \ F \ S \ S \ S \ ::: \ F \ F
F \ S \ F \ S \ S \ F \ F \ F \ S \ ::: \ S \ F
..
.
si, datorit
a independentei, probabilit
atile acestor rezultate posibile sunt usor
de calculat. De exemplu,
P (S \ S \ F \ F \ S \ F \ :::F \ F ) = P (S) P (S) P (F ) P (F ) P (S) P (F ) :::P (F ) P (F ) =
ppqqpq:::qq:
Repartitia unei variabile aleatoare X reprezentnd num
arul de succese
dintr-o succesiune de n probe Bernoulli, indiferent de ordinea n care apar este
frecvent de interes considerabil. E clar c
a X e o variabil
a aleatoare discret
a
care ia valorile 0; 1; 2; :::; n. Pentru a determina functia mas
a de probabilitate,
consider
am pX (k), probabilitatea de a avea exact k succese n n probe. Acest
eveniment poate ap
area n la fel de multe moduri precum num
arul de submultimi
de k elemente ale unei multimi de n elemente. De aici, num
arul de moduri n
care k succese se pot ntmpla n n probe este
Cnk = k!(nn! k)!
si probabilitatea asociat
a cu ecare mod este pk q n k : Din acest motiv avem
pX (k) = Cnk pk q n

; k = 0; 1; 2; :::; n:

Datorit
a similarit
atii cu termenii binomului lui Newton
n
X
n
(a + b) =
Cnk ak bn k ;

(4.1)

k=0

repartitia denit
a de relatia (4.1) se numeste repartitie binomiala. Ea are
doi parametri, anume n si p. O variabil
a aleatoare X avnd repartitie binomial
a
se noteaz
a X B (n; p).
Forma unei repartitii binomiale e determinat
a de valorile celor doi parametri
ai ei, n si p. n general, n se d
a ca o parte a problemei si p trebuie estimat din
observatii.

32

O reprezentare a functiei mas


a de probabilitate pX (k) pentru n = 10 si
p = 0; 2 este n gura de mai jos.

Vrful repartitiei se va muta spre dreapta cnd p creste, atingnd o repartitie


simetric
a cnd p = 0; 5. Consider
am raportul
k k n k
Cn
p q
1 k 1 n k+1 =
p
q
(k
(n+1)p k(p+q)
(n+1)p k
=
1
+
:
kq
kq

pX (k)
pX (k 1)

k
Cn

n!
p
k!(n k)!
n!
q
1)!(n k+1)!

(n k+1)p
kq

= 1 + (n

k+1)p kq
kq

1+
Observ
am c
a pX (k) > pX (k 1) () k < (n + 1) p si pX (k) < pX (k 1) ()
k > (n + 1) p: Deci, dac
a denim k 2 Z prin
(n + 1) p 1 < k
(n + 1) p;
valoarea lui pX (k) creste de la k = 0 si si atinge valoarea maxim
a cnd
k = k , apoi descreste. Dac
a (n + 1) p 2 Z, valoarea maxim
a se atinge n
ambele pX (k
1) si pX (k ). k este astfel un modul al acestei repartitii si se
numeste adesea "cel mai probabil num
ar de succese".
pX (k) este tabelat
a ca o functie de n si p. Tabelul A.1 din gurile de mai
jos d
a valorile ei pentru n = 2; 3; :::; 10 si p = 0; 01; 0; 05; :::; 0; 5:

33

34

Calculul lui pX (k) devine greu cnd n devine mare; se foloseste aproximarea
Poisson a repartitiei binomiale.
Functia de repartitie FX (x) pentru o repartitie binomial
a este dat
a de
[x]
X
Cnk pk q n k ;
FX (x) =
k=0

unde [x] este partea ntreag


a a lui x.
Propriet
a
ti 4.1. Fie X B (n; p). Atunci
a) mX = np;
b) 2X = npq:
n
n
X
X
Demonstra
tie. a) mX =
kpX (k) =
kCnk pk q n
k=0

n
X

(n 1)!
k n k
(k 1)!(n 1 (k 1))! p q

= np

k=1

k=1

n
X

Cnk

n
X

n 1

1 k 1 n 1 (k 1) k 1=i
q
=
1p

k=1

k=1

1 n 1 (k 1)

n
X

k=1

35

np

n
X1

Cni

1p

Cnk

= np

n
X

i n 1 i

i=0

= np:
n
n
X
X
=
k 2 pX (k) =
k 2 Cnk pk q n

b) E X 2
k=0
" n
X
np
(k 1) Cnk 11 pk

n!
k n k
k!(n k)! p q

k=1

k=1

np (p + q)

kCnk

1 k 1 n 1 (k 1)
q
1p

k=1
1 k 1 n 1 (k 1)
q
1p

k 1=i; a)

n
X1

np

iCni 1 pi q n 1 i

i=0

+1

a)

= np (mY + 1) = np [(n

1) p + 1] ;

unde Y
B (n 1; p) :
2
2
=
E
X
m2X = np [(n 1) p + 1] n2 p2 = n2 p2 np2 + np n2 p2 =
X
np (1 p) = npq:
Faptul c
a mX = np sugereaz
a c
a parametrul p poate estimat pe baza
valorii medii a datelor observate.
O alt
a formulare care duce la repartitia binomial
a este denirea variabilei
aleatoare Xj ; j = 1; 2; :::; n, reprezentnd rezultatul celei de-a j-a probe Bernoulli.
Dac
a punem
0, dac
a proba j este un esec,
Xj =
1; dac
a proba j este un succes,
atunci
X = X1 + X2 + ::: + Xn
d
a num
arul de succese n n probe. Din denitie, X1 ; X2 ; :::; Xn sunt variabile
aleatoare independente.
Deoarece
E (Xj ) = 0 q + 1 p = p; j = 1; 2; :::; n;
rezult
a c
a
E (X) = E (X1 + X2 + ::: + Xn ) = E (X1 )+E (X2 )+:::+E (Xn ) = p + p + ::: + p =
{z
}
|
n

np;

ceea ce coincide cu proprietatea 4.1 a).


Analog, deoarece
E Xj2 = 02 q + 12 p = p; j = 1; 2; :::; n;
2
2
2
[E (Xj )] = p p2 = p (1 p) = pq; j = 1; 2; :::; n;
Xj = E Xj
din independenta lui X1 ; X2 ; :::; Xn rezult
a c
a
n
X
2
2
+ pq + ::: + pq = npq;
X =
Xj = pq
|
{z
}
j=1

ceea ce coincide cu proprietatea 4.1 b).


Teorema 4.1. Fie X1
B (n1 ; p) si X2
B (n2 ; p) variabile aleatoare
independente si Y = X1 + X2 : Atunci Y
B (n1 + n2 ; p) :

4.2

Reparti
tia hipergeometric
a

Fie Z variabila aleatoare care d


a num
arul de bile negre care sunt extrase cnd
un esantion de m bile este extras (f
ar
a revenire) dintr-un lot de n bile avnd
n1 bile negre si n2 bile albe (n1 + n2 = n). Functia mas
a de probabilitate a
variabilei aleatoare
Z
este
Ck Cm k
pZ (k) = n1 C mn n1 ; k = 0; 1; :::; min (n1 ; m) :
n
Spunem c
a Z are repartitie hipergeometrica.
Se poate ar
ata c
a
1
mZ = mn
;
n
mn1 (n n1 )(n m)
2
=
:
Z
n2 (n 1)
36

4.3

Reparti
tia geometric
a

Fie X num
arul de probe Bernoulli pn
a la (si incluznd) prima aparitie a succesului. X e variabil
a aleatoare discret
a avnd ca valori toate numerele naturale.
Functia ei mas
a0de probabilitate este1
pX (k) = P @|F \ F {z
\ ::: \ F} \ S A = P (F ) P (F ) :::P (F )P (S) = q k
|
{z
}
k 1

p; k =

k 1

1; 2; ::::
Aceast
a repartitie este cunoscut
a ca repartitia geometrica cu parametrul p,
unde numele provine de la similaritatea cu termenii progresiei geometrice. O
reprezentare a lui pX (k) e dat
a mai jos.

Functia de repartitie corespunz


atoare este
[x]
[x]
[x]
X
X
X
k 1
FX (x) =
pX (k) =
q
p=p
qk
k=1

k=1

= (1

q)

k=1

k=1
k=1
k=1
n+1
q
1 q+q
d
q lim 1 1q q
= p dq
=
p
= p1 :
1 q
(1 q)2
n!1
"
1
1
1
X
X
X
2
2 k 1
k 1

E X

k q

k=1

p=p

kq

+q

k=1

k (k

k=2

37

qk

=1

q [x] ,

k=1

dac
ax 1
si
FX (x) = 0; dac
a x < 1:
Media si dispersia lui X se calculeaz
a astfel:
1
1
1
X
X
X
d
d
d
k
E (X) =
kq k 1 p = p
q
=
p
q k = p dq
dq
dq
d
p dq

[x]
X

1) q

q lim

n!1

k 2

n
X

k 1

k=1

1
p +pq

1
X

k=2

d2
dq 2

qk =

1
p +pq

d2
dq 2

1
X

k=2
1
p
1
p

d
+ pq dq

4.4

2q q 2
(1 q)2

2q
:
(1 q)2
2
X =E

X2

1
p

+ pq

1 q

d
q = p1 +pq dq
2

(2 2q)(1 q)2 +(2q q 2 )2(1 q)


(1 q)4

[E (X)] =

1
p

q2
1 q

d
= p1 +pq dq
2

2q
p2

1
p2

p+2q 1
p2

1
p

q
p2

d
= p1 +pq dq

+q
=

2q(1 q)+q 2
(1 q)2

2((1 q)2 +2q q 2 )


(1 q)2

1 p
p2 :

Reparti
tia binomial
a negativ
a

O generalizare a repartitiei geometrice este repartitia variabilei aleatoare X


reprezentnd num
arul de probe Bernoulli necesare pentru aparitia celui de-al
r-lea succes, unde r 2 N este dat.
Pentru a determina pX (k) n acest caz, e A evenimentul ca primele k 1
probe s
a dea exact r 1 succese, indiferent de ordinea lor, si B evenimentul ca
un succes s
a apar
a la proba k. Atunci, datorit
a independentei,
pX (k) = P (A \ B) = P (A) P (B) :
Avem
P (B) = p
si
P (A) = pZ (r 1) = Ckr 11 pr 1 q k r ;
unde Z B (k 1; p) :
Obtinem
pX (k) = Ckr

1 r k r
;k
1p q

= r; r + 1; ::::

(4.2)

Repartitia denit
a de relatia (4.2) se numeste repartitie binomiala negativa
sau Pascal si are parametrii r si p. Este adesea notat
a prin N B (r; p). Observ
am
c
a ea se reduce la repartitia geometric
a cnd r = 1:
O variant
a a acestei repartitii se obtine punnd Y = X
r: Variabila
aleatoare Y este num
arul de probe Bernoulli dincolo de r necesare pentru realizarea celui de-al r-lea succes, sau poate interpretat
a ca num
arul de esecuri
nainte de cel de-al r-lea succes.
Functia mas
a de probabilitate a lui Y , pY (m), e obtinut
a din relatia (4.2)
nlocuind k prin m + r :
r 1
r m
m
r m
pY (m) = Cm+r
= Cm+r
1 p q ; m = 0; 1; 2; ::::
1p q
Variabila aleatoare Y are p;roprietatea convenabil
a c
a valorile ei ncep de la
0 si nu de la r ca valorile lui X:
Reamintind o denitie mai general
a a coecientului binomial
j+1)
Caj = a(a 1):::(a
;
8a
2
R;
j
2
N
;
j!
avem
m
(m+r 1)!
(m+r 1)(m+r 2):::r
r m+1)
m
Cm+r
= ( 1) ( r)( r 1):::(
=
1 = m!(r 1)! =
m!
m!
m m
( 1) C r :
De aici,
m

pY (m) = C mr pr ( q) ; m = 0; 1; 2; :::;

38

acesta ind motivul pentru numele "repartitie binomial


a negativ
a".
Media si dispersia variabilei aleatoare X pot determinate observnd c
aX
poate reprezentat
a prin
X = X1 + X2 + ::: + Xr ;
unde Xj este num
arul de probe dintre cel de-al (j 1)-lea si (inclusiv) cel
de-al j-lea succes. Aceste variabile aleatoare sunt independente, ecare avnd
repartitie geometric
a n care media este p1 si dispersia 1p2p . De aceea media
sumei este suma mediilor si, din independenta, dispersia sumei este suma dispersiilor, adic
a:
mX = pr ; 2X = r(1p2 p) :
Deoarece Y = X r, avem:
mY = pr r; 2Y = r(1p2 p) :

4.5

Reparti
tia multinomial
a

O generalizare a probelor Bernoulli este s


a relax
am cererea s
a e doar dou
a
rezultate posibile pentru ecare prob
a. Fie r rezultate posibile pentru ecare
prob
a, notate cu E1 ; E2; :::; Er si e P (Ei ) = pi ; i = 1; 2; :::; r cu p1 +p2 +:::+pr =
1:
Dac
a variabila aleatoare Xi ; i = 1; 2; :::; r; reprezint
a num
arul de Ei ntr-o
succesiune de n probe, functia mas
a de probabilitate comun
a a lui X1 ; X2 ; :::; Xr
este dat
a de
pX1 X2 :::Xr (k1 ; k2 ; :::; kr ) =

n!
pk1 pk2 :::pkr r ;
k1 !k2 !:::kr ! 1 2

(4.3)

unde kj = 0; 1; 2; :::; j = 1; 2; :::; r; si k1 + k2 + ::: + kr = n:


Demonstra
tia formulei 4.3. Consider
am evenimentul de a avea exact k1
rezultate E1 ; k2 rezultate E2 ; :::; kr rezultate Er n n probe. Acest eveniment
poate ap
area n la fel de multe moduri precum num
arul de moduri de a plasa
k1 litere E1 ; k2 litere E2 ; :::; kr litere Er n n cutii a. . ecare cutie s
a aib
a
exact o liter
a. De aici, num
arul de moduri c
autat este produsul dintre num
arul
de moduri de a plasa k1 litere E1 n n cutii, num
arul de moduri de a plasa k2
litere n cele n k1 cutii r
amase neocupate, s.a.m.d., adic
a
(n k1 k2 ::: kr 1 )!
(n k1 )!
Cnk1 Cnk2 k1 :::Cnkr k1 k2 ::: kr 1 = k1 !(nn! k1 )! k2 !(n
=
k1 k2 )! :::
kr !0!
n!
k1 !k2 !:::kr !

si probabilitatea asociat
a cu ecare mod, datorit
a independentei, este pk11 pk22 :::pkr r :
Relatia (4.3) deneste functia mas
a de probabilitate comun
a a repartitiei
multinomiale, numit
a asa deoarece are forma temenului general din expansiunea
n
multinomial
a a lui (p1 + p2 + ::: + pr ) . Repartitia multinomial
a se reduce la
repartitia binomial
a cnd r = 2, si cu p1 = p; p2 = q; k1 = k si k2 = n k:
Deoarece Xi B (n; pi ), avem
mXi = npi ; 2Xi = np1 (1 pi ) ;
si se poate ar
ata c
a avem
cov (Xi ; Xj ) = npi pj ;
i; j = 1; 2; :::; r;
i 6= j:

39

4.6

Reparti
tia Poisson

Aceast
a repartitie este folosit
a n modelele matematice pentru a descrie, ntr-un
interval de timp specic, evenimente ca emisia de particule dintr-o substanta
radioactiv
a, sosirile de pasageri la un aeroport, distributia particulelor de praf
ntr-un anumit spatiu, sosirile de masini la o intersectie, si alte fenomene similare.
Pentru a xa ideile, consider
am problema sosirii pasagerilor la o statie de
autobuz ntr-un interval de timp specicat. Not
am X (0; t) num
arul de sosiri
din intervalul de timp [0; t); X (0; t) e o variabil
a aleatoare discret
a lund valori
posibile 0; 1; 2; :::, iar repartitia ei depinde de t. Functia ei mas
a de probabilitate
se scrie
pk (0; t) = P [X (0; t) = k] ;

k = 0; 1; 2; :::;

(4.4)

pentru a ar
ata dependenta ei explicit
a de t.
Facem urm
atoarele ipoteze de baz
a:
1) Dac
a t1 < t2 < ::: < tn , atunci variabilele aleatoare X (t1 ; t2 ) ; X (t2 ; t3 ) ; :::; X (tn
sunt independente, adic
a, numerele de pasageri care sosesc n intervale de timp
care nu se suprapun sunt independente unul de cel
alalt.
2) Pentru t sucient de mic,
p1 (t; t +

t) =

t + o ( t) ;

(4.5)

unde o ( t) este o functie a. .


o ( t)
= 0:
(4.6)
t
Aceast
a ipotez
a spune c
a, pentru t sucient de mic, probabilitatea de a
avea exact o sosire este proportional
a cu lungimea t. Parametrul din relatia
(4.5) este numit densitatea medie sau rata medie a sosirilor.
3) Pentru t sucient de mic,
lim

t!0

1
X

pk (t; t +

t) = o ( t) :

(4.7)

k=2

Aceast
a conditie implic
a faptul c
a probabilitatea de a avea dou
a sau mai
multe sosiri ntr-un interval sucient de mic este neglijabil
a.
Din relatiile (4.5) si (4.7) rezult
a
p0 (t; t +

t) = 1

1
X

pk (t; t +

t) = 1

t + o ( t) :

(4.8)

k=1

Determin
am p0 (0; t). Pentru a nu avea nicio sosire n intervalul [0; t + t),
trebuie s
a nu avem nicio sosire n ambele subintervale [0; t) si [t; t + t). Datorit
a independentei sosirilor n intervale nesuprapuse avem

40

1 ; tn )

p0 (0; t +

t) = p0 (0; t) p0 (t; t +

t) = p0 (0; t) [1

t + o ( t)] :

Rearanjnd relatia (4.9) si mp


membri prin
i
h artind ambii
p0 (0;t+ t) p0 (0;t)
o( t)
:
= p0 (0; t)
t
t
Punnd t ! 0, obtinem ecuatia diferential
a

(4.9)

t obtinem

dp0 (0; t)
=
p0 (0; t) :
dt
Solutia ei satisf
acnd conditia initial
a p0 (0; 0) = 1 este
t

p0 (0; t) = e

(4.10)

Determinarea lui p1 (0; t) este similar


a. O sosire n intervalul [0; t + t) poate
ndeplinit
a doar avnd 0 sosiri n subintervalul [0; t) si o sosire n [t; t + t),
sau o sosire n [0; t) si nicio sosire n [t; t + t). De aici avem
p1 (0; t +

t) = p0 (0; t) p1 (t; t +

t) + p1 (0; t) p0 (t; t +

t) :

nlocuind relatiile (4.5), (4.8) si (4.10) n relatia (4.11) obtinem


p1 (0; t + t) = e t ( t + o ( t))+p1 (0; t) (1
t + o ( t)) =)
e

o( t)
t

+
Punnd

+ p1 (0; t)
t ! 0, obtinem

dp1 (0; t)
=
dt
ceea ce conduce la

o( t)
t

(4.11)
p1 (0;t+ t) p1 (0;t)
t

p1 (0; t) + e

p1 (0; t) = te

p1 (0; 0) = 0;

(4.12)

(4.13)

Continund n acest fel, g


asim pentru termenul general
k

( t) e t
;
k = 0; 1; 2; ::::
(4.14)
k!
Relatia (4.14) d
a functia mas
a de probabilitate a lui X (0; t), num
arul de
sosiri n intervalul de timp [0; t) cu conditiile de mai sus si deneste o repartitie
Poisson cu parametrii si t. Parametrii si t pot nlocuiti de un singur
parametru = t si astfel putem scrie
pk (0; t) =

pk (0; t) =

e
k!

Media lui X (0; t) este

41

k = 0; 1; 2; ::::

(4.15)

E (X (0; t)) =

1
X

kpk (0; t) = e

k=0

1
X
k

k=2

= e

k!

k=0

Calcul
am si dispersia:
1
X
E X 2 (0; t) =
k 2 pk (0; t) = e
k=0
"
#
1
1
X
X
k 2
k 1
2
(k 2)! +
(k 1)! = e

1
X

k=1

1
X

k!

=e

(k

1)!

e + e

= e

e = :
(4.16)

1
X

k
(k 1)!

k=1

k=0
2

k 1

=e

"

1
X
(k

1) k
(k 1)!

k=1

+ :

k=1

2
X(0;t)

= E X 2 (0; t)

[E (X (0; t))] = :

(4.17)

Din relatia (4.16) se vede c


a parametrul este egal cu media num
arului de
sosiri pe unitatea de timp; numele "rata medie a sosirilor" pentru este astfel
justicat. n determinarea valorii acestui parametru ntr-o problem
a dat
a, el
poate estimat din observatii prin m
,
unde
m
este
num
a
rul
observat
de
sosiri
n
n n unit
ati de timp. Similar, deoarece = t, reprezint
a num
arul mediu de
sosiri n intervalul de timp [0; t) :
Din relatiile (4.16) si (4.17) se vede c
a media si dispersia cresc cnd rata
medie creste. n gura al
aturat
a e reprezentat
a functia mas
a de probabilitate
pentru repartitia Poisson pentru
a) = 0; 5;
b) = 1;
c) = 4:

42

1
X

k=1

(k 1)!

n general, dac
a examin
am raportul pkpk (0;t)
, cum am f
acut la repartitia
1 (0;t)
binomial
a, se arat
a c
a pk (0; t) creste si apoi descreste cnd k creste,
atingndu-si maximul cnd k = [ ] :

43

Tabelul A.2 din gurile de mai jos d


a functia mas
a de probabilitate a repartitiei Poisson pentru anumite valori ale lui dintre 0; 1 si 10. Pentru = 10,
avem p23 (0; t) = 0; 0002 si p24 (0; t) = 0; 0001. n loc de " t" n tabelul A.2 se
va citi " ".

44

Teorema 4.2. Dac


a X si Y sunt variabile aleatoare independente avnd
repartitii Poisson cu parametrii 1 , respectiv 2 , atunci variabila aleatoare Y =
X1 + X2 are repartitie Poisson cu parametrul 1 + 2 .
Propozi
tie. Dac
a o variabil
a aleatoare X este repartizat
a Poisson cu parametrul , atunci o variabil
a aleatoare Y , care este obtinut
a din X selectnd
doar cu probabilitatea p ecare din itemii num
arati de X, este de asemenea
repartizat
a Poisson cu parametrul p :
Demonstra
tie. Dat ind c
a X = r, repartitia lui Y este binomial
a cu
parametrii r si p, deci:
r k
;
k = 0; 1; 2; :::; r:
P (Y = kjX = r) = Crk pk (1 p)
Din teorema probabilit
atii totale avem
1
1
X
X
k
r k r
r=n+k
e
P (Y = k) =
P (Y = kjX = r) P (X = r) =
Crk p (1 p) r!
=
1
X

r=k

pk (1 p)n n+k e
k
Cn+k
(n+k)!

(p )k e
k!

n=0

1
X

r=k

[(1 p) ]n
n!

(p )k e

e(1

k!

p)

(p )k e
k!

n=0

0; 1; 2; ::::
Aceast
a propozitie poate folosit
a, de exemplu, pentru situatii n care Y e
num
arul de urmasi ai unei insecte cnd X e num
arul de ou
a depuse, sau Y e
num
arul de uragane dezastruoase cnd X e num
arul total de uragane care apar
ntr-un an dat, sau Y e num
arul pasagerilor care nu pot urca la bordul unui
zbor dat din cauza suprarezerv
arilor, cnd X este num
arul de sosiri de pasageri.
4.6.1

Reparti
tii spa
tiale

Repartitia Poisson a fost dat


a pe baza sosirilor n timp, dar acelasi argument se
aplic
a la repartitia punctelor n spatiu. Consider
am repartitia defectelor
ntr-un material. Num
arul de defecte ntr-un anumit volum are o repartitie
Poisson dac
a ipotezele 1-3 sunt valide, cu intervalele de timp nlocuite de volume,
45

k=

si este rezonabil s
a presupunem c
a probabilitatea de a g
asi k defecte n orice
regiune depinde numai de volum si nu de forma regiunii.
Alte situatii zice n care repartitia Poisson e folosit
a includ num
arul de
bacterii pe o plac
a Petri, repartitia fertilizatoarelor mpr
astiate cu avionul pe
un cmp si repartitia poluantilor industriali ntr-o regiune dat
a.
4.6.2

Aproximarea Poisson a reparti


tiei binomiale

Fie X B (n; p).


n k
pX (k) = Cnk pk (1 p)
;
k = 0; 1; 2; :::; n:
Consider
am cazul cnd n ! 1 si p ! 0 a. . np =
r
amne xat.
Observ
am c
a este media lui X, care e presupus
a a r
amne constant
a. Atunci
k
n k
1 n
;
k = 0; 1; 2; :::; n:
pX (k) = Cnk n
Deoarece n ! 1, factorialele n! si (n k)! care apar n Cnk = k!(nn! k)! pot
aproximate prin formula lui Stirling
1
1
n! = (2 ) 2 e n nn+ 2 :
Obtinem
1

pX (k) =

(2 ) 2 e
k!(2

Deoarece
lim 1 +
n!1
avem
lim

n!1

n
n k

1
)2

c n
n

nn+ 2

n+k (n

k)

k
k+ 1
2

n k

k!ek

n
n k

n k+ 12

= ec ;

n k+ 21

=
lim

n!1

n k

(1

k
n

k+ 1
2

lim

i
n

lim

n!1
k
n

(1

k
n

lim
n n!1

k+ 1
2
n

1
e

n!1
lim 1 n
= lim 1 n
=e :
n!1
Obtinem
k
e
pX (k) = k!
;
k = 0; 1; ::::
Aceast
a aproximare Poisson a repartitiei binomiale usureaz
a calculele si se
foloseste n practic
a atunci cnd n > 10 si p < 0; 1. Repartitia Poisson si
g
aseste aplicabilitate n acest caz n probleme n care probabilitatea aparitiei
unui eveniment este mic
a. De aceea, repartitia Poisson se mai numeste adesea
repartitia evenimentelor rare.

n!1

46

n k
n

Principalele reparti
tii continue, cu densit
a
ti
de reparti
tie
si propriet
a
tile lor

5.1

Reparti
tia uniform
a

O variabil
a aleatoare continu
a X are repartitie uniforma pe un interval de la
a la b (b > a) dac
a este egal probabil s
a ia orice valoare din acest interval.
Densitatea lui X este constant
a pe intervalul [a; b] si are forma
c; dac
a x 2 [a; b] ;
fX (x) =
0; altfel.
Deoarece
Z 1
Z b
Z a
Z 1
0dx = 0 + cxjba + 0 = c (b a) ;
cdx +
0dx +
fX (x) dx =
1

din conditia
Z
1
fX (x) dx = 1

obtinem
c = b 1a :
Deci

fX (x) =

1
b a;

dac
a x 2 [a; b] ;
0; altfel.

(5.1)

Dup
a cum vedem din gura de mai jos, este constant
a pe [a; b] si n
altimea
trebuie s
a e b 1 a pentru ca aria de sub densitate s
a e 1:

Functia de repartitie a lui X este

47

FX (x) =

8 Z
>
>
>
>
>
>
< Z

0du = 0; dac
a x < a;
Z
x
x
u x
x a
1
a x 2 [a; b] ;
0du +
fX (u) du =
b a du = 0 + b a ja = b a , dac
>
1
a
1
>
Z
Z
Z
> a
b
x
>
>
1
>
:
0du +
du
+
0du = 0 + 1 + 0 = 1, dac
a x > b:
b a
a

Deci

8
a x < a;
< 0; dac
x a
,
dac
a x 2 [a; b] ;
FX (x) =
: b a
1, dac
a x > b;

(5.2)

ceea ce este prezentat grac n gura urm


atoare.

Media si dispersia lui X sunt


Z 1
Z a
mX =
xfX (x) dx =

0=
Z

b2 a2
2(b a)
2
X

hb

=
Z

1
a+b
2 :
1

(x

0dx = 0+ b 1 a
b a 2
2

mX ) fX (x) dx =

(x mX )3 b
ja +0
3

b a 2
2

0dx +

i
2

Z
Z

b
x
a

a dx +

0dx +
1

(b mX )3 (a mX )3
3(b a)
2

1
b

0dx = 0 + 2(bx
Z

b
a) ja +

2
(x mX ) dx +
a
(b a)[(b mX )2 +(b mX )(a mX )+(a mX )2 ]
3(b a)
1

b a

+ b 2a
= (b 12a) :
Repartitia uniform
a e una dintre cele mai simple repartitii si e folosit
a de
obicei n situatii unde nu este niciun motiv de a da probabilit
ati inegale la valori
posibile luate de variabila aleatoare pe un interval dat. De exemplu, timpul de
sosire a unui zbor poate considerat uniform repartizat pe un anumit interval
de timp, sau repartitia distantei de la locul nc
arc
aturilor vii pe un pod la
un suport terminal poate reprezentat
a adecvat printr-o repartitie uniform
a
1
3

48

pe ntinderea podului. Adesea se ataseaz


a o repartitie uniform
a unei anumite
variabile aleatoare din cauza unei lipse de informatie, dincolo de cunoasterea
intervalului de valori.
5.1.1

Reparti
tia uniform
a bivariat
a

Fie variabila aleatoare X repartizat


a uniform pe un interval [a1 ; b1 ] si variabila
aleatoare Y repartizat
a uniform pe un interval [a2 ; b2 ]. Mai mult, presupunem
c
a sunt independente. Atunci densitatea comun
a a lui X si Y este

fXY (x; y) = fX (x) fY (y) =

1
(b1 a1 )(b2 a2 ) ,

0, altfel.

pentru x 2 [a1 ; b1 ] si y 2 [a2 ; b2 ] ;

(5.3)
Ia forma unei suprafete plate m
arginit
a de [a1 ; b1 ] de-a lungul axei Ox si
[a2 ; b2 ] de-a lungul axei Oy.

5.2

Reparti
tia Gaussian
a sau normal
a

Cea mai important


a repartitie n teorie ca si n aplicatii este repartitia Gaussiana
sau normala. O variabil
a aleatoare X este Gaussiana sau normala dac
a are
densitatea de forma
#
"
2
(x m)
1
;
1 < x < 1;
(5.4)
fX (x) = p exp
2 2
2
unde m si
sunt doi parametri, cu
> 0. Alegerea acestor simboluri
particulare ca parametri va deveni clar
a imediat.
Functia de repartitie corespunz
atoare este

FX (x) =

1
p
2

exp
1

"

(u

m)
2

du;

1 < x < 1:

(5.5)

Ea nu poate exprimat
a analitic, dar poate evaluat
a numeric pentru orice
x.
Densitatea si functia de repartitie din relatiile (5.4) si (5.5) sunt reprezentate
grac n gurile (a), respectiv (b) urm
atoare, pentru m = 0 si = 1:

49

Gracul densit
atii fX n acest caz particular este o curb
a n form
a de clopot,
simetric
a n jurul originii.
Calcul
amZmedia si dispersia lui X.Z
1
1
i
h
x m
=u
(x m)2
E (X) =
dx =
xfX (x) dx = p12
x exp
2 2
1
1 2
p1
2

( u + m) exp

u2
2

du =

p1
2

6 Z
6
6
4

u2
u exp
du + m
2
1
{z
}
|

p
0 + m 2 = m:
Z 1
Z
2
1
p
var (X) =
[x E (X)] fX (x) dx =
2
1
Z 1
Z 1
2
2
u
2 2
p1
u exp
du = p2
u2 exp
2
2
1
1
Z 1
2
u2
u2
1
p
u
exp
j
exp
du =
1
2
2
2

p1
2

1
1

im par
a

(x

m) exp

u2
2

du =
0

(x m)2
2 2

dx

u exp

Vedem astfel c
a cei doi parametri m si din repartitie sunt media si respectiv deviatia standard a lui X. Aceast
a observatie justic
a alegerea noastr
a
a acestor simboluri speciale pentru ei si de asemenea pune n evidenta o proprietate important
a a repartitiei normale - cunoasterea mediei si dispersiei ei
50

u2
2

exp

7
7
du7 =
5

=u

u2
2

du =

caracterizeaz
a complet repartitia normal
a. Deoarece ne vom referi frecvent la
repartitia normal
a, o not
am cu N m; 2 : De exemplu, X N (0; 9) nseamn
a
c
a X are densitatea dat
a de relatia (5.4) cu m = 0 si = 3.
Se poate ar
ata c
a momentele centrate ale lui X N m; 2 sunt
n

0, dac
a n e impar,
1 3 ::: (n 1) n , dac
a n e par.

(5.6)

a. De
Coecientul de exces 2 = 44 3 este 0 pentru o repartitie normal
aceea ea este folosit
a ca repartitie de referinta pentru 2 .
5.2.1

Teorema limit
a central
a

Marea importanta practic


a a repartitiei normale provine din teorema limit
a
central
a.
Teorema 5.1 (Teorema limit
a central
a) (Lindberg 1922). Fie fXn g
un sir de variabile aleatoare independente si identic repartizate cu mediile m si
dispersiile 2 . Fie
Y =

n
X

Xj ;

j=1

si e variabila aleatoare normalizat


a Z denit
a ca
Z=

nm
p :
n

Atunci functia de repartitie a lui Z, FZ (z), converge la N (0; 1) cnd n ! 1


pentru orice z xat.
Acest rezultat poate extins n cteva directii, incluznd cazurile n care Y
este o sum
a de variabile aleatoare dependente si neidentic repartizate.
Teorema limit
a central
a descrie o clas
a foarte general
a de fenomene aleatoare
pentru care repartitiile pot aproximate cu repartitia normal
a. Cnd proprietatea de a aleator a unui fenomen zic este cumularea a multor efecte
aleatoare aditive mici, el tinde la o repartitie normal
a, indiferent de repartitiile
efectelor individuale. De exemplu, consumul de combustibil la toate automobilele unei anumite m
arci, presupus fabricate prin procese identice, difer
a de
la un automobil la altul. Aceast
a proprietate de a aleator provine de la o
larg
a varietate de surse, incluznd, printre alte lucruri: inexactit
atile inerente
n procesele de fabricare, neuniformit
atile n materialele folosite, diferentele n
greutate si alte specicatii, diferente n calitatea combustibilului si diferente
n comportamentul soferilor. Dac
a se accept
a faptul c
a ecare dintre aceste
diferente contribuie la proprietatea de a aleator a consumului de combustibil,
teorema limit
a central
a ne spune c
a el tinde la o repartitie normal
a. Din acelasi
motiv, variatiile de temperatur
a dintr-o camer
a, erorile de citire asociate cu un
instrument, erorile de tintire ale unei anumite arme, s.a.m.d. pot aproximate
rezonabil prin repartitii normale.

51

5.2.2

Tabele de probabilit
a
ti

Datorit
a importantei sale, suntem adesea pusi n situatia s
a evalu
am probabilit
atile asociate cu o variabil
a aleatoare normal
a X N m; 2 , ca
"
#
Z b
2
(x m)
1
exp
dx:
(5.7)
P (a < X b) = p
2 2
2
a
Integrala de mai sus nu poate calculat
a analitic si este n general calculat
a numeric. Pentru comoditate sunt date tabele care ne permit s
a calcul
am
probabilit
ati ca cea din relatia (5.7).
Tabelarea functiei de repartitie pentru repartitia normal
a cu m = 0 si = 1
este dat
a n tabelul A.3 din gura urm
atoare.

O variabil
a aleatoare cu repartitia N (0; 1) se numeste variabil
a aleatoare
normal
a standardizata si o vom nota cu U . Tabelul al
aturat d
a FU (u) doar
pentru punctele din partea dreapt
a a repartitiei (adic
a pentru u 0). Valorile
corespunz
atoare pentru u < 0 sunt obtinute din proprietatea de simetrie a
repartitiei normale standardizate, din relatia
FU ( u) = 1
52

FU (u) :

(5.8)

Mai nti, tabelul mpreun


a cu relatia (5.8) pot folosite pentru a determina
P (a < U b) pentru orice a si b. De exemplu,
(5.8)

tab el

P ( 1; 5 < U 2; 5) = FU (2; 5) FU ( 1; 5) = FU (2; 5) [1 FU (1; 5)] =


0; 9938 1 + 0; 9332 = 0; 927:
Mai important, tabelul si relatia (5.8) sunt de asemenea suciente pentru a
determina probabilit
atile asociate cu variabilele aleatoare normale cu medii si
dispersii arbitrare.
Teorema 5.2. Fie X N m; 2 . Atunci X m N (0; 1), adic
a
U=

Teorema 5.2 implic


a faptul c
a, dac
aX

P (a < X

b) = P (a < U + m

b) = P

(5.9)

N m;
a

, atunci

<U

(5.10)

Valoarea din membrul drept poate g


asit
a acum din tabel cu ajutorul relatiei (5.8), dac
a este necesar.
Exemplul 5.1. S
a calcul
am P (m k < X m + k ), unde X N m; 2 .

P (m

k <X

(5.10)

m+k ) = P ( k <U

(5.8)

k) = FU (k) FU ( k) = 2FU (k) 1:


(5.11)
Observ
am c
a rezultatul din exemplul 5.1 este independent de m si
si
este functie doar de k. Astfel, probabilitatea ca X s
a ia valori ntre k deviatii
standard n jurul mediei sale depinde numai de k si este dat
a de ecuatia (5.11).
Se vede din tabel c
a aproximativ 68; 3%; 95; 5% si 99; 7% din aria de sub o
densitate normal
a se aa n zonele m
; m 2 , respectiv m 3 , dup
a cum
se vede din gurile (a)-(c) urm
atoare.

53

De exemplu, sansele sunt de aproximativ 99; 7% ca o mostr


a selectat
a aleator
dintr-o repartitie normal
a s
a e n regiunea m 3 (gura (c)).
5.2.3

Reparti
tia normal
a multivariat
a

Dou
a variabile aleatoare X si Y se numesc comun normale dac
a densitatea
comun
a a lor are forma

fXY (x; y) =

1
p

exp

1
2 (1

2)

"

mX
X

(x

mX ) (y
X

(5.12)
unde ( 1; 1) < (x; y) < (1; 1). Relatia (5.12) descrie repartitia normala bivariata. Sunt cinci parametri asociati cu ea: mX ; mY ; X (> 0) ; Y
(> 0) ; si (j j
1). O reprezentare grac
a tipic
a a acestei densit
ati, pentru
mX = mY = 0 si X = Y este n gura urm
atoare.

54

mY )

mY
Y

#)

Densitatea marginal
a a variabilei aleatoare X este

fX (x) =

fXY (x; y) dy =

1
p

exp

"

(x

mX )
2

2
X

1 < x < 1:

Astfel, X
N mX ; 2X . Similar, Y
N mY ; 2Y si
= XXYY este
coecientul de corelatie al lui X si Y . Vedem astfel c
a cei cinci parametri
continuti n densitatea bivariat
a fXY (x; y) reprezint
a cinci momente importante
asociate cu variabilele aleatoare. De asemenea observ
am c
a repartitia normal
a
bivariat
a este complet caracterizat
a de momentele comune de ordinul 1 si 2 ale
lui X si Y .
Teorema 5.3. Corelatie zero implic
a independenta cnd variabilele aleatoare
sunt comun normale.
Demonstra
tie. Punnd = 0 n relatia (5.12), obtinem

fXY (x; y) =

1
p

exp

"

(x

mX )
2

2
X

adic
a X si Y sunt independente.
55

#) (

1
p

exp

"

(x

mY )
2

2
Y

#)

= fX (x) fY (y) ;

Aceast
a proprietate nu este valabil
a n general.
Avem repartitie normala multivariata cnd cazul a dou
a variabile aleatoare
e extins la cel implicnd n variabile aleatoare.
Fie n variabile aleatoare, X1 ; X2 ; :::; Xn . Ele se numesc comun normale dac
a
densitatea lor comun
a e de forma

fX1 X2 :::Xn (x1 ; x2 ; :::; xn ) = fX (x) = (2 )

n
2

j j

1
2

exp

1
(x
2

m)

unde mT = (m1 ; m2 ; :::; mn ) = (E (X1 ) ; E (X2 ) ; :::; E (Xn )),


este matricea de covarianta a lui X, cu
ij

= E ((Xi

mi ) (Xj

(x

ij i;j=1;n

mj )) ;

iar j j este determinantul lui . Din nou vedem c


a o repartitie normal
a
comun
a este complet specicat
a de momentele comune de ordinul 1 si 2, aceste
momente determinnd de asemenea momentele comune de ordine mai mari ca 2:
Se poate ar
ata c
a, n cazul cnd variabilele aleatoare X1 ; X2 ; :::; Xn au mediile
0, toate momentele de ordin impar ale lor sunt 0, si, pentru n par
E (X1 X2 :::Xn ) =

E (Xm1 Xm2 ) E (Xm2 Xm3 ) :::E Xmn 1 Xmn :

m1 ;:::;mn

Suma de mai sus e luat


a dup
a toate combinatiile posibile de
variabile aleatoare si are 1 3 5 ::: (n 3) (n 1) termeni.
5.2.4

n
2

perechi de n

Sume de variabile aleatoare normale

Teorema 5.4. Fie X1 ; X2 ; :::; Xn n variabile aleatoare repartizate comun normal (nu necesar independente). Atunci variabila aleatoare
Y = c1 X1 + c2 X2 + ::: + cn Xn
este repartizat
a normal, unde c1 ; c2 ; :::; cn sunt constante.
Teorema 5.5. Fie X1 ; X2 ; :::; Xn n variabile aleatoare repartizate normal
(nu necesar independente). Atunci variabilele aleatoare Y1 ; Y2 ; :::; Ym , unde
Yj =

n
X

cjk Xk ;

j = 1; 2; :::; m;

k=1

sunt repartizate comun normal.

56

m) ;

1 < x < 1;

5.3

Reparti
tia lognormal
a

Am v
azut c
a repartitii normale rezult
a din sume de multe actiuni aleatoare.
Consider
am acum un alt fenomen obisnuit care este rezultanta multor efecte
aleatoare multiplicative. Un exemplu de fenomen multiplicativ este studiul de
oboseal
a a materialelor unde avaria intern
a a materialului la o anumit
a etap
a de
nc
arcare este o proportie aleatoare din avaria de la etapa precedent
a. n biologie, repartitia m
arimii unui organism este alt exemplu pentru care cresterea este
subiectul multor impulsuri, ecare dintre acestea ind proportional cu m
arimea
momentan
a. Alte exemple includ repartitia m
arimii particulelor sub forte de
impact sau impulsive, repartitia vietii componentelor mecanice, repartitia veniturilor personale datorit
a ajust
arilor anuale, si alte fenomene similare.
S
a consider
am
Y = X1 X2 :::Xn :

(5.13)

Suntem interesati de repartitia lui Y cnd n devine mare, iar variabilele


aleatoare Xj ;
j = 1; 2; :::; n, pot lua numai valori pozitive.
Logaritmnd ambii membri, relatia (5.13) devine
ln Y = ln X1 + ln X2 + ::: + ln Xn :
Din teorema limit
a central
a rezult
a c
a ln Y tinde la o repartitie normal
a
cnd n ! 1. Repartitia lui Y este astfel determinat
a din
Y = eX ;

(5.14)

unde X este o variabil


a aleatoare normal
a.
Deni
tia 5.1. Fie X N mX ; 2X . Variabila aleatoare Y = eX se spune
c
a are repartitie lognormala.
Densitatea lui Y este

fY (y) =

1p

exp
y X 2
0, altfel.

1
2

2
X

(ln y

mX )

, pentru y > 0;

(5.15)

Relatia (5.15) arat


a c
a Y are o repartitie unilateral
a (adic
a ia valori numai
n zona pozitiv
a a lui y). Aceast
a proprietate o face atractiv
a pentru cantit
ati
zice care sunt restrictionate s
a aib
a doar valori pozitive. n plus, fY (y) ia multe
forme diferite pentru valori diferite ale lui mX si X ( X > 0). Dup
a cum se
vede din gura urm
atoare, care d
a gracele lui fY pentru mX = 0 si 3 valori
ale lui 2X , densitatea lui Y este asimetric
a spre dreapta, aceast
a caracteristic
a
devenind mai pronuntat
a cnd X creste.

57

Parametrii mX si X care apar n densitatea lui Y sunt media si deviatia


standard a lui X, sau ln Y , dar nu ale lui Y . Pentru a obtine o pereche mai
natural
a de parametri pentru fY (y), observ
am c
a, dac
a medianele lui X si Y
sunt notate cu X , respectiv Y , denitia medianei unei variabile aleatoare d
a
1
=
P
(Y
)
=
P
(X
ln
)
=
P
(X
)
;
Y
Y
X
2
de unde
ln

X:

Deoarece, datorit
a simetriei repartitiei normale,
=
m
;
X
X
putem scrie
mX = ln
Scriind

ln Y

, densitatea lui Y poate scris


a

58

fY (y) =
n termeni de

(
Y

1p

ln Y

exp

0, altfel.
si

ln Y

1
2

2
ln Y

y
Y

, pentru y > 0;

, media si dispersia lui Y sunt


2
ln Y

mY = Y exp
2
2
Y = mY exp
5.3.1

ln2

2
2
ln Y

;
1 :

Tabele de probabilit
a
ti

Datorit
a leg
aturii dintre repartitia normal
a si repartitia lognormal
a prin relatia (5.14), calculele de probabilit
ati implicnd o variabil
a aleatoare repartizat
a
lognormal pot f
acute cu ajutorul tabelului de probabilit
ati pentru variabile
aleatoare normale.
Consider
am functia de repartitie a lui Y . Avem
FY (y) = P (Y

y) = P (X

Deoarece media lui X este ln

FY (y) = FU

ln y

ln

ln y) = FX (ln y) ;

si dispersia lui X este

= FU

ln Y

ln

ln Y

y > 0:
2
ln Y

, avem

y > 0:

(5.16)

Deoarece FU este tabelat


a, relatia (5.16) poate folosit
a pentru calcule de
probabilit
ati asociate cu Y , cu ajutorul tabelului probabilit
atii normale.

5.4

Reparti
tia gamma
si reparti
tii n leg
atur
a cu aceasta

Repartitia gamma este unilateral


a si densitatea asociat
a cu ea este
fX (x) =
unde

( )x

, pentru x > 0;

0, altfel,

(5.17)

( ) este functia gamma:


( )=

care este tabelat


a, si

(n) = (n

du;

1)!; 8n 2 N :

Parametrii distributiei gamma sunt si ; ambii sunt pozitivi. Deoarece


repartitia gamma este unilateral
a, cantit
atile zice care pot lua doar valori pozitive sunt frecvent modelate de ea, servind ca model util datorit
a versatilit
atii
ei n sensul c
a o varietate larg
a de forme ale densit
atii gamma poate obtinut
a
variind valorile lui si , dup
a cum arat
a gurile (a) si (b) urm
atoare.
59

Observ
am din aceste guri c
a determin
a forma repartitiei n timp ce
este un parametru de scar
a pentru repartitie. n general, densitatea gamma
este unimodal
a, cu vrful n x = 0 pentru
1 si n x = 1 pentru > 1:
Se poate ar
ata c
a repartitia gamma este un model pentru timpul cerut pentru un total de exact sosiri Poisson. Datorit
a largii aplicabilit
ati a sosirilor
Poisson, repartitia gamma are de asemenea numeroase aplicatii.
Functia de repartitie a variabilei aleatoare X avnd repartitia gamma este

FX (x) =

8 Z
<
:

fX (u) du =
0

( )

0, altfel.

du =

( ; x)
( ) ,

pentru x > 0;
(5.18)

( ; u) este functia gamma incomplet


a,
Z u
( ; u) =
x

dx;

care este de asemenea tabelat


a.
Media si dispersia variabilei aleatoare gamma repartizate X sunt
mX =

2
X

60

2:

(5.19)

5.4.1

Reparti
tia exponen
tial
a

Cnd = 1, densitatea gamma dat


a de relatia (5.17) se reduce la forma exponential
a
e x , pentru x > 0;
0, altfel,

fX (x) =

(5.20)

unde
> 0 este parametrul repartitiei. Functia de repartitie, media si
dispersia ei se obtin din relatiile (5.18) si (5.19) punnd = 1:
FX (x) =

1 e x , pentru x
0, altfel,

mX =

2
X

0;

(5.21)

2:

(5.22)

Timpul ntre sosiri Fie variabila aleatoare X (0; t), num


arul de sosiri n
intervalul de timp [0; t) si presupunem c
a este repartizat
a Poisson. Fie T variabila aleatoare care d
a intervalul de timp dintre 2 sosiri succesive. Functia ei
de repartitie este, din denitie
FT (t) = P (T

t) =

1 P (T > t) , pentru t
0, altfel.

0;

Evenimentul T > t e echivalent cu evenimentul c


a nu e nicio sosire n intervalul de timp [0; t), sau X (0; t) = 0. Deoarece, din relatia (4.10), P (X (0; t) = 0) =
e t , avem
FT (t) =

1 e t , pentru t
0, altfel.

0;

Comparnd aceast
a expresie cu relatia (5.21), putem stabili c
a timpul ntre 2
sosiri Poisson succesive are o repartitie exponential
a; parametrul din repartitia
lui T este rata medie a sosirilor Poisson.
Deoarece timpurile ntre sosiri Poisson sunt independente, timpul cerut pentru un total de n sosiri Poisson este o sum
a de n variabile aleatoare independente
si repartizate exponential. Fie Tj ; j = 1; 2; :::; n, timpul ntre sosirile j 1 si j.
Timpul cerut pentru un total de n sosiri, notat cu Xn este
Xn = T1 + T2 + ::: + Tn ;
unde Tj ; j = 1; 2; :::; n, sunt independente si repartizate exponential cu acelasi parametru . Se poate ar
ata c
a Xn este gamma repartizat
a cu = n si
= . Astfel, repartitia gamma este potrivit
a pentru a descrie timpul cerut
pentru un total de sosiri Poisson.

61

Fiabilitatea
si legea de defectare exponen
tial
a n studiile de abilitate,
timpul pn
a la defectarea unui component zic sau un sistem este repartizat
exponential, dac
a unitatea se defecteaz
a imediat ce un singur eveniment, ca defectarea unui component, apare, presupunnd c
a astfel de fenomene se ntmpl
a
independent.
Fie variabila aleatoare T , timpul pn
a la defectarea unui component sau
sistem. Functia care d
a probabilitatea de defectiune n timpul unei cresteri mici
de timp, presupunnd c
a nicio defectiune nu a ap
arut nainte de acel timp e
notat
a cu h (t) si se numeste functia hazard sau rata defectarii si este denit
a
de
h (t) dt = P (t < T

t + dtjT

t) ;

ceea ce d
a
h (t) =

fT (t)
:
1 FT (t)

(5.23)

n studiile de abilitate, o functie hazard potrivit


a pentru multe fenomene
ia asa numita "form
a de cad
a", ar
atat
a n gura urm
atoare.

Portiunea initial
a a curbei reprezint
a "mortalitatea infantil
a", atribuibil
a
defectelor componente si imperfectiunilor de fabricare. Portiunea relativ constant
a a curbei h (t) reprezint
a perioada "n uz", n care defectiunea este ntmpl
atoare. Defectiunea din uzur
a de lng
a sfrsitul vietii componentului este
ar
atat
a ca portiunea cresc
atoare a curbei h (t). Fiabilitatea sistemului poate
62

optimizat
a prin testarea initial
a a defectelor, nainte punerea n functiune, pn
a
la timpul t1 , pentru a evita defectarea prematur
a, si prin nlocuirea partial
a la
timpul t2 pentru a evita uzura.
Ar
at
am c
a legea de defectare exponential
a este potrivit
a n timpul perioadei
"n uz" a vietii normale a unui sistem. nlocuind
fT (t) = e t
si
FT (t) = 1 e t
n relatia (5.23) avem
h (t) = :
Observ
am c
a parametrul din repartitia exponential
a joac
a rolul unei rate
de defectare constante.
Am v
azut c
a repartitia gamma este potrivit
a pentru a descrie timpul pentru
un total de sosiri Poisson. n contextul legilor de defectare, repartitia gamma
poate gndit
a ca o generalizare a legii de defectare exponential
a pentru sisteme
ce se defecteaz
a imediat de evenimente esueaz
a, presupunnd c
a evenimentele
au loc n concordanta cu legea Poisson. Astfel, repartitia gamma este potrivit
a
ca model al timpului pn
a la defectare pentru sisteme care au o unitate care
functioneaz
a si
1 unit
ati n standby; aceste unit
ati intr
a n functionare pe
rnd, pe m
asur
a ce se defecteaz
a celelalte si ecare are o repartitie exponential
a
a timpului pn
a la defectare.
5.4.2

Reparti
tia chi-p
atrat

Alt caz special important al repartitiei gamma este repartitia chi-p


atrat ( 2 ),
n
1
obtinut
a punnd = 2 si = 2 n relatia (5.17), unde n 2 N . Repartitia 2
contine astfel un parametru n si are densitatea de forma
(
n
x
1
x 2 1 e 2 , pentru x > 0;
n
2 (n)
2
2
fX (x) =
(5.24)
0, altfel.
Parametrul n este num
arul de grade de libertate. Utilitatea acestei repartitii
provine din faptul c
a o sum
a de p
atrate de n variabile aleatoare normale standardizate are o repartitie 2 cu n grade de libertate; adic
a, dac
a U1 ; U2 ; :::; Un
sunt independente si repartizate N (0; 1), atunci suma
X = U12 + U22 + ::: + Un2
2

(5.25)

are o repartitie
cu n grade de libertate.
Datorit
a acestei relatii, repartitia 2 este una dintre principalele unelte n
inferenta statistic
a si testarea ipotezelor.
Densitatea din relatia (5.24) este reprezentat
a n gura urm
atoare pentru
cteva valori ale lui n:

63

Se observ
a c
a, cnd n creste, forma lui fX (x) devine mai simetric
a. Din
relatia (5.25), deoarece X poate exprimat
a ca o sum
a de variabile aleatoare
identic repartizate, ne astept
am ca repartitia 2 s
a tind
a la o repartitie normal
a
cnd n ! 1 pe baza teoremei limit
a central
a.
Media si dispersia unei variabile aleatoare X avnd o repartitie 2 cu n grade
de libertate se obtin din relatia (5.19):
2
X

mX = n;

5.5

= 2n:

Reparti
tia beta
si reparti
tii n leg
atur
a cu aceasta

Repartitia beta este caracterizat


a de densitatea

fX (x) =

unde parametrii
beta denit
a prin

( + )
( ) ( )x

(1

x)

, pentru 0 < x < 1;

0, altfel,
si

(5.26)

sunt pozitivi. Numele repartitiei vine de la functia

B( ; ) =

64

( ) ( )
:
( + )

Ambii parametri si dau forma repartitiei; diferite combinatii ale valorilor


lor permit densit
atii s
a ia o larg
a varietate de forme. Cnd ; > 1, repartitia
este unimodal
a, cu vrful n x = + 1 2 : Devine n form
a de U cnd ; < 1;
este n form
a de J cnd
1 si < 1; ia forma unui J ntors cnd < 1
si
1. n sfrsit, ca un caz special, repartitia uniform
a pe intervalul (0; 1)
rezult
a cnd = = 1. Unele din aceste forme posibile sunt n gurile (a),
pentru = 2, si (b) urm
atoare.

Media si dispersia unei variabile aleatoare beta repartizate X sunt


mX =
2
X = (

+ )2 ( + +1)

(5.27)

Datorit
a versatilit
atii ei ca o repartitie pe un interval nit, repartitia beta
este folosit
a pentru a reprezenta un mare num
ar de cantit
ati zice pentru care
valorile sunt restrictionate la un interval identicabil. Cteva din ariile de aplicare sunt limitele de toleranta, controlul calit
atii si abilitatea.
Presupunem c
a un fenomen aleator Y poate observat independent de n
ori si dup
a ce aceste n observatii independente sunt ordonate cresc
ator, e
y1 y2 ::: yn valorile lor. Dac
a variabila aleatoare X este folosit
a pentru a
nota proportia din Y care ia valori ntre yr si yn s+1 , se poate ar
ata c
a X are
o repartitie beta cu = n r s + 1 si = r + s, adic
a
65

fX (x) =
5.5.1

(n+1)
n r s
(n r s+1) (r+s) x

r+s 1

(1

x)

, pentru 0 < x < 1;

0, altfel.

Tabele de probabilit
a
ti

Functia de repartitie asociat


a repartitiei beta este

FX (x) =

8
0, pentruZ x
>
>
<
x
>
>
:

( + )
( ) ( )

1, pentru x

0;
1

(1

u)

(5.28)

du, pentru 0 < x < 1;

1:

Are de asemenea forma unei functii beta incomplete pentru care valorile
pentru valori date ale lui si pot g
asite din tabele matematice. Functia
beta incomplet
a e notat
a de obicei cu Ix ( ; ). Notnd FX (x) cu parametrii
si cu F (x; ; ), dac
a
, atunci
F (x; ; ) = Ix ( ; ) :
Dac
a

< , atunci
F (x; ; ) = 1

I(1

x)

( ; ):

O alt
a metod
a de evaluare a lui FX (x) din relatia (5.28) este de a observa
similaritatea n form
a dintre fX (x) si pY (k) a unei variabile aleatoare binomiale
Y , pentru cazul cnd ; 2 N . Din relatia (4.1),
n!
pk q n k ;
k! (n k)!
Din relatia (5.26), pentru cazul cnd ;
pY (k) =

fX (x) =

( +
1)!
x
1)! (
1)!

(1

x)

k = 0; 1; 2; :::; n:

(5.29)

2 N , obtinem
;

= 1; 2; :::;

= 1; 2; :::;

0 < x < 1;

si stabilim relatia
fX (x) = ( +

1) pY (k) ;

0 < x < 1;

unde pY (k) este evaluat


a n k =
1, cu n = +
2 si p = x. De
exemplu, valoarea fX (0; 5) cu = 2 si = 1 este egal
a cu 2pY (1) cu n = 1 si
p = 0; 5; aici pY (1) = 0; 5 din relatia (5.29), deci fX (0; 5) = 1:
Similar avem
FX (x) = 1

FY (k) ;

= 1; 2; :::;

0 < x < 1;

cu k =
1, n = +
2 si p = x. Functia de repartitie FY a unei
variabile aleatoare binomiale Y este de asemenea tabelat
a si poate folosit
a
pentru a avantaja aici evaluarea lui FX (x) asociat
a cu repartitia beta.
66

5.5.2

Reparti
tia beta generalizat
a

Repartitia beta poate generalizat


a de la una restrictionat
a la intervalul (0; 1)
la una acoperind un interval arbitrar (a; b). Fie Y o variabil
a aleatoare beta
generalizat
a. Avem
Y = (b

a) X + a;

(5.30)

unde X este beta repartizat


a n conformitate cu relatia (5.26). Deoarece
relatia (5.30) este o transformare monoton
a de la X la Y , avem

fY (y) =

(b a)

( + )
1
( ) ( )

(y

a)

(b

y)

, pentru a < y < b;

0, altfel.
(5.31)

5.6

Reparti
tii de valori extreme

Cineva preocupat de siguranta unei structuri este adesea interesat de nc


arc
atura maxima si stresul maxim n membrii structurii. n studiile de abilitate,
repartitia vietii unui sistem avnd n componente n serie (cnd sistemul se defecteaz
a dac
a o component
a se defecteaz
a) este o functie de minimul timpilor
pn
a la defectarea componentelor, n timp ce pentru un sistem cu aranjament
paralel (unde sistemul se defecteaz
a cnd toate componentele se defecteaz
a) e
determinat
a de repartitia maximului timpilor pn
a la defectarea componentelor.
Aceste exemple puncteaz
a preocuparea cu repartitiile maximului sau minimului
valorilor unui num
ar de variabile aleatoare.
Fie Xj , j = 1; 2; :::; n, variabile aleatoare independente si identic repartizate
cu functia de repartitie FX (x) si densitatea fX (x) sau masa pX (x) si
Yn = max (X1 ; X2 ; :::; Xn ) ;
Zn = min (X1 ; X2 ; :::; Xn ) :
Functia de repartitie a lui Yn este
FYn (y) = P (Yn y) = P (X1 y \ X2
n
FX1 (y) FX2 (y) :::FXn (y) = [FX (y)] :
Deci

y \ ::: \ Xn

indep.

y) = P (X1

y) P (X2

y) :::P (Xn

y) =

FYn (y) = [FX (y)]

Dac
a Xj sunt continue, densitatea lui Yn este
fYn (y) =

dFYn (y)
n
= n [FX (y)]
dy

fX (y) :

Functia de repartitie a lui Zn este


indep.
FZn (z) = P (Zn z) = P (X1 z [ X2 z [ ::: [ Xn z) = 1 P (X1 > z \ X2 > z \ ::: \ Xn > z) =
1 P (X1 > z) P (X2 > z) :::P (Xn > z) = 1 [1 FX1 (z)] [1 FX2 (z)] ::: [1 FXn (z)] =
n
1 [1 FX (z)] :
67

Deci
FZn (z) = 1

[1

FX (z)] :

Dac
a Xj sunt continue, densitatea lui Zn este
n 1

fZn (z) = n [1
5.6.1

FX (z)]

fX (z) :

Reparti
tii asimptotice de tip I ale valorilor extreme

Repartitia asimptotic
a de tip I a valorilor maxime este repartitia limitei lui
Yn (cnd n ! 1) dintr-o repartitie initial
a FX (x) a c
arei coad
a dreapt
a este
nem
arginit
a si este de tip exponential. Pentru acest caz, putem exprima FX (x)
n forma
FX (x) = 1

exp [ g (x)] ;

(5.32)

unde g (x) este o functie strict cresc


atoare de x. n aceast
a categorie intr
a,
printre altele, repartitiile normal
a, lognormal
a si gamma.
Fie
lim Yn = Y:

n!1

Teorema 5.6. Fie variabilele aleatoare X1 ; X2 ; :::; Xn independente si identic repartizate cu aceeasi functie de repartitie FX (x). Dac
a FX (x) e de forma
dat
a de relatia (5.32), avem
FY (y) = exp f exp [

(y

u)]g ;

1 < y < 1;

unde > 0 si u sunt 2 parametri ai repartitiei.


u este modulul repartitiei, adic
a valoarea lui y n care fY (y) este maxim
a.
Media lui Y este
mY = u +
unde

' 0; 577 este constanta lui Euler. Dispersia lui Y este


2
Y

:
6 2
u este parametru de locatie si este parametru de scal
a al repartitiei. Coecientul de asimetrie este n acest caz 1 ' 1; 1396 si e independent de si
u. Acest rezultat arat
a c
a repartitia valorii maxime de tip I are o form
a x
a cu
o coad
a dominant
a spre dreapta. O form
a tipic
a pentru fY (y) este aratat
a n
gura urm
atoare.

68

Repartitia asimptotic
a de tip I pentru valori minime este repartitia limitei
lui Zn cnd n ! 1 dintr-o repartitie initial
a FX (x) a c
arei coad
a stng
a este
nem
arginit
a si este de tip exponential cnd descreste la 0 spre stnga. Un
exemplu de FX (x) care apartine acestei clase este repartitia normal
a.
Dac
a punem
lim Zn = Z;

n!1

functia de repartitie a lui Z are forma


FZ (z) = 1

exp f exp [ (z

u)]g ;

1 < z < 1;

unde > 0 si u sunt din nou cei 2 parametri ai repartitiei.


Repartitiile asimptotice de tip I pentru valori maxime si minime sunt imagini
n oglind
a una celeilalte. Modulul lui Z este u si media, dispersia si coecientul
lui de asimetrie sunt
mY = u
;
2
2
=
;
Y
6 2
1; 1396:
1 '
Datorit
a largii aplicabilit
ati, repartitia valorii maxime de tip I este uneori
numit
a simplu repartitia valorii extreme.
5.6.2

Reparti
tii asimptotice de tip II ale valorilor extreme

Repartitia asimptotic
a de tip II a valorilor maxime apare ca repartitia limitei
lui Yn cnd n ! 1 dintr-o repartitie initial
a de tip Pareto, adic
a, FX (x) e
limitat
a la stnga n 0 si coada ei dreapt
a este nem
arginit
a si se apropie de 1
conform
FX (x) = 1

ax

Pentru aceast
a clas
a

69

a; k; x > 0:

(5.33)

y
v

FY (y) = exp

v; k; y > 0:

Cu FX (x) dat n relatia (5.33), ecare Xj are momente doar pn


a la ordinul
r, unde r este cel mai mare ntreg mai mic dect k. Cnd k > 1, media lui Y
este
mY = v

1
k

si, cnd k > 2, dispersia are forma


2
Y

= v2

2
k

1
k

Fie YI si YII variabile aleatoare avnd repartitii asimptotice de tip I, respectiv II ale valorilor maxime. Atunci ele sunt legate prin
FYII (y) = FYI (ln y) ;
iar parametrii
prin

y > 0;

si u din FYI (y) sunt legati de parametrii k si v din FYII (y)

u = ln v si

= k:

Dac
a YI si YII sunt continue, densit
atile lor sunt n relatia
fYII (y) =

1
fY (ln y) ;
y I

y > 0:

Repartitia asimptotic
a de tip II a valorilor minime apare n conditii analoage.
Cu FX (x) limitat
a la dreapta n 0 si apropiindu-se de 0 la stnga ntr-o manier
a
analoag
a relatiei (5.33), avem
FZ (z) = 1

exp

z
v

v; k > 0;

z < 0:

Nu e asa util
a ca omoloagele de tip I si III, deoarece n practic
a repartitiile
initiale cerute nu sunt frecvent ntlnite.
5.6.3

Reparti
tii asimptotice de tip III ale valorilor extreme

Deoarece repartitia asimptotic


a de tip III a valorii maxime este de interes practic
limitat, discut
am doar repartitia valorilor minime.
Repartitia asimptotic
a de tip III a valorii minime este repartitia limitei lui
Zn cnd n ! 1 pentru o repartitie initial
a n care coada stng
a creste de la 0
lng
a x = " n maniera
FX (x) = c (x

") ;

70

c; k > 0;

":

Aceast
a clas
a de repartitii este m
arginit
a la stnga n x = ". Repartitia
gamma este o astfel de repartitie cu " = 0.
Se poate ar
ata c
a functia de repartitie asimptotic
a de tip III a valorii minime
este
"
#
k
z "
FZ (z) = 1 exp
;
k > 0; w; z > ";
(5.34)
w "
si, dac
a Z e continu
a,

fZ (z) =

k
w

"

z
w

"
"

k 1

exp

"

z
w

"
"

k > 0;

w; z > ":
(5.35)

Media si dispersia lui Z sunt


mZ = " + (w ") 1 +
2
2
")
1 + k2
Z = (w

1
k

;
2

1+

1
k

Am v
azut c
a repartitia exponential
a e folosit
a ca o lege a defect
arii n studii
de abilitate, corespunznd unei functii hazard constante. Repartitia dat
a de
relatiile (5.34) si (5.35) este frecvent folosit
a ca un model generalizat al timpului
pn
a la defectare pentru cazurile n care functia hazard variaz
a cu timpul. Se
poate ar
ata c
a functia hazard
h (t) =

k
w

t
w

k 1

t > 0;

poate avea o larg


a varietate de forme, si densitatea asociat
a cu ea pentru T ,
timpul pn
a la defectare, este dat
a de
"
#
k 1
k
t
k t
exp
; w; k; t > 0:
(5.36)
fT (t) =
w w
w
Aceasta este repartitia Weibull, numit
a dup
a Weibull care a descoperit-o n
1939. Relatia (5.36) este un caz special al relatiei (5.35), cu " = 0:
Fie ZI si ZIII variabile aleatoare avnd repartitii asimptotice de tipul I,
respectiv III, ale valorilor minime. Atunci
FZIII (z) = FZI [ln (z
cu u = ln (w

") si

")] ;

z > ";

= k. Dac
a sunt continue,

fZIII (z) =

fZ [ln (z ")] ; z > ":


z " I
Repartitiile asimptotice ale valorilor maxime si minime din aceeasi repartitie
initial
a pot s
a nu e de acelasi tip. De exemplu, pentru o repartitie initial
a
gamma, repartitia ei asimptotic
a a valorii maxime este de tipul I, n timp ce
71

a valorii minime este de tipul III. Un sistem avnd n componente n serie cu


repartitii de viata gamma independente pentru componentele lui are o repartitie
a timpului pn
a la defectare apartinnd repartitiei asimptotice de tip III a valorii
minime, cnd n devine mare. Modelul corespunz
ator pentru un sistem avnd n
componente n paralel este repartitia asimptotic
a de tip I a valorii maxime.

72

Func
tii (transform
ari) de variabile aleatoare

n stiinta si inginerie, multe fenomene sunt bazate pe relatii functionale n care


una sau mai multe variabile dependente sunt exprimate n termeni de una sau
mai multe variabile independente. De exemplu, distanta parcurs
a ntr-un interval de timp este o functie de vitez
a, s.a.m.d.

6.1

Func
tii de o variabil
a aleatoare

Fie
Y = g (X) ;

(6.1)

unde g este o functie continu


a. Dat
a ind repartitia lui X n termeni de
functia ei de repartitie, functia mas
a de probabilitate sau densitate, suntem
interesati de repartitia corespunz
atoare pentru Y si propriet
atile momentelor
lui Y .
6.1.1

Reparti
tia

Dac
a X este variabil
a aleatoare, atunci Y , ind o functie de X denit
a de relatia
(6.1), este de asemenea o variabil
a aleatoare. Fie RX , multimea valorilor lui X;
si RY multimea valorilor lui Y:
Pentru ecare rezultat X = x, rezult
a din relatia (6.1) c
a Y = y = g (x).
Relatia (6.1) deneste si o functie de la RX la RY . Probabilit
atile asociate cu
ecare punct (n cazul unei variabile aleatoare discrete X) sau ecare regiune (n
cazul unei variabile aleatoare continue X) din RX sunt transportate n punctul
sau regiunea corespunz
atoare din RY . Repartitia lui Y este determinat
a prin
completarea acestui proces de transfer pentru ecare punct (dac
a X e discret
a)
sau ecare regiune de tipul Y
y (dac
a X e continu
a) din RY . Este posibil ca
g s
a duc
a mai multe puncte din RX ntr-un singur punct din RY . Determinarea
repartitiei lui Y depinde astfel de forma lui g din relatia (6.1).
Variabile aleatoare discrete Fie X variabil
a aleatoare discret
a cu functia
mas
a de probabilitate pX . Functia mas
a de probabilitate a lui Y este
X
pY (y) =
pX (x) ; 8y 2 RY ;
x2g

unde g

1 (y)

(y) = fx 2 RX jg (x) = yg.


1 0
Exemplul 6.1. Fie X
1
1
2

1
8

1
8

. Determinati repartitia lui

Y = 2X + 1:
2
Valorile lui Y sunt g ( 1) = 2 ( 1) + 1 = 3; g (0) = 1; g (1) = 3; g (2) = 9.
1
1
Avem g (1) = f0g ; g (3) = f 1; 1g ; g 1 (9) = f2g, deci pY (1) = pX (0) =

73

1
4 ; pY

(3) = pX ( 1) + pX (1) =
1 3 9
:
1
5
1
4

1
2

1
8

5
8 ; pY

(9) = pX (2) =

1
8.

De aici,

Dac
a g : RX ! RY este injectiv
a, valorile posibile luate de X sunt x1 ; x2 ; :::,
valorile luate de Y sunt y1 = g (x1 ) ; y2 = g (x2 ) ; ::: si
pX (xi ) = pi ;

i = 1; 2; :::;

atunci
pY (yi ) = pY (g (xi )) = pi ;
Exemplul 6.2. Fie X

1
1
2

i = 1; 2; ::::

1
4

1
8

1
8

. Determinati repartitia lui

Y = 2X + 1:
Valorile lui Y sunt g ( 1) = 2 ( 1) + 1 = 1; g (0) = 1; g (1) = 3; g (2) = 5.
1 1 3 5
Functia g este injectiv
a, deci Y
:
1
1
1
1
2

Variabile aleatoare continue Consider


am cazul cnd X este o variabil
a
aleatoare continu
a cu functie de repartitie FX (x) sau densitate fX (x) cunoscute.
ncepem considernd relatia
Y = g (X) = 2X + 1:
Transformarea y = g (x) este prezentat
a grac n gura urm
atoare.

74

(6.2)

Functia de repartitie a lui Y este denit


a de
FY (y) = P (Y

y) :

Regiunea denit
a de Y
y din RY acoper
a portiunea ngrosat
a a curbei
de transformare, dup
a cum e ar
atat n gura al
aturat
a, care, n RX corespunde
regiunii g (X) y, sau X g 1 (y), unde
1
2
este functia invers
a a lui g, sau solutia x n functie de y a ecuatiei (6.2). De
aici,
g

FY (y) = P (Y

y) = P (g (X)

(y) =

y) = P X

(y) = FX g

(6.3) este relatia dintre functiile de repartitie ale lui Y si X.


75

(y) :
(6.3)

Relatia dintre densit


atile lui Y si X se obtine derivnd n raport cu y n
(6.3):

fY (y) =

d
dFY (y)
=
FX g
dy
dy

(y)

= fX g

(y)

dg

(y)
:
dy

(6.4)

Relatiile (6.3) si (6.4) au loc nu doar pentru transformarea particular


a dat
a
prin relatia (6.2) dar si pentru toate functiile continue g care sunt strict cresc
atoare.
Consider
am acum situatia n care transformarea e dat
a de
Y = g (X) =
Plecnd din nou cu FY (y) = P (Y
Y
y din RY corespunde regiunii X
toare.

2X + 1:
g

y) si rationnd ca mai sus, regiunea


1
(y), dup
a cum arat
a gura urm
a-

Deoarece X este continu


a, avem
P X g 1 (y) = P X > g 1 (y) [ X = g 1 (y) = P X > g
P X = g 1 (y) = P X > g 1 (y) + 0 = P X > g 1 (y) :
De aici, avem n acest caz

76

(6.5)

(y) +

FY (y) = P (Y

d
dFY (y)
=
1
dy
dy

(y) = 1 P X

FX g

(y)

fX g

(y) = 1 FX g

(y) :
(6.6)
n comparatie cu relatia (6.3), relatia (6.6) d
a o leg
atur
a diferit
a ntre functiile de repartitie ale lui X si Y , datorit
a unui g diferit.
Derivnd n relatia (6.6) n raport cu y obtinem relatia dintre densit
atile lui
X si Y :

fY (y) =

y) = P X > g

(y)

dg

(y)
:
dy

(6.7)

Din nou observ


am c
a relatiile (6.6) si (6.7) au loc pentru toate functiile
continue g care sunt strict descresc
atoare.
1
a n relatia (6.4) (pentru c
a
Deoarece derivata dg dy(y) este totdeauna pozitiv
g e strict cresc
atoare) si este totdeauna negativ
a n relatia (6.7) (pentru c
ag
e strict descresc
atoare), rezultatele exprimate de aceste relatii pot combinate
n urm
atoarea teorem
a:
Teorema 6.1. Fie X o variabil
a aleatoare continu
a si Y = g (X), unde g
este continu
a si strict monoton
a. Atunci
fY (y) = fX g

(y)

dg

(y)
:
dy

(6.8)

Exemplul 6.3. Densitatea lui X este dat


a de
fX (x) =

a
;
(x2 + a2 )

1 < x < 1;

unde a > 0 (repartitia Cauchy). Determinati densitatea lui Y = 2X + 1:


Deoarece g (x) = 2x + 1 este continu
a si strict monoton
a, aplic
am relatia
(6.8).
1
y = 2x + 1 () x = y 2 1 =) g 1 (y) = y 2 1 =) dg dy(y) = 21 .
Din relatia (6.8),
2a
fY (y) = fX y 2 1 12 = h y 1a 2 2 i 21 = (y 1)
;
1 < y < 1:
2
+4a2 ]
[
( 2 ) +a

Consider
am acum cazul cnd g nu este strict monoton
a. n gura urm
atoare,
pentru y < y1 si y > y2 , ecuatia g (x) = y are solutie unic
a si relatia (6.8) poate
folosit
a pentru a determina densitatea lui Y n aceste intervale.

77

Pentru y1 y y2 , trebuie s
a plec
am de la nceput si consider
am FY (y) =
P (Y
y). Regiunea denit
a de Y
y n RY acoper
a portiunile ngrosate ale
curbei y = g (x), dup
a cum este ar
atat n gur
a. Astfel,
FY (y) = P (Y
y) = P X g1 1 (y) + P g2 1 (y) < X g3 1 (y) =
1
P X g1 (y) + P X g3 1 (y)
P X g2 1 (y) =
1
1
1
FX g1 (y) + FX g3 (y)
FX g2 (y) ; y1 < y < y2 ;
(6.9)
unde x1 = g1 1 (y) ; x2 = g2 1 (y) ; x3 = g3 1 (y) sunt r
ad
acinile ecuatiei
g (x) = y n termeni de y.
Ca mai sus, relatia ntre densit
atile lui X si Y e g
asit
a derivnd n relatia
(6.9) n raport cu y:
dg1 1 (y)
dg3 1 (y)
dg2 1 (y)
+fX g3 1 (y)
fX g2 1 (y)
; y 1 < y < y2 :
dy
dy
dy
(6.10)

fY (y) = fX g1 1 (y)
Deoarece derivata
(6.10) ia forma

dg2 1 (y)
dy

fY (y) =

3
X
j=1

e negativ
a n timp ce celelalte sunt pozitive, relatia

fX gj 1 (y)

dgj 1 (y)
;
dy
78

y 1 < y < y2 :

(6.11)

Figura urm
atoare reprezint
a transformarea y = sin x; aceast
a ecuatie are o
innitate num
arabil
a de r
ad
acini, x1 = g1 1 (y) ; x2 = g2 1 (y) ; ::: 8y 2 [ 1; 1] :

Urmnd procedura de mai sus se poate stabili pentru FY (y) o relatie similar
a
cu (6.9) (dar cu o innitate de termeni) si, precum n relatia (6.11), densitatea
lui Y are acum forma
fY (y) =

1
X

fX gj 1 (y)

j=1

dgj 1 (y)
;
dy

1 < y < 1:

(6.12)

Se observ
a c
a fY (y) = 0 pentru y 2
= [ 1; 1], deoarece FY (y) = 0, 8y
1
si FY (y) = 1; 8y 1:
Relatiile (6.11) si (6.12) conduc la urm
atorul rezultat:
Teorema 6.2. Fie X o variabil
a aleatoare continu
a si Y = g (X), unde
g este continu
a, si g (x) = y are un num
ar cel mult num
arabil de r
ad
acini
x1 = g1 1 (y) ; x2 = g2 1 (y2 ) ; :::. Atunci:
fY (y) =

r
X

fX gj 1 (y)

j=1

dgj 1 (y)
;
dy

unde r este num


arul de r
ad
acini ale ecuatiei g (x) = y.

79

(6.13)

Relatia (6.8) este continut


a n aceast
a teorem
a ca un caz special (r = 1).
Exemplul 6.4. Determinati densitatea lui Y = X 2 , unde X N (0; 1).
Avem
1
fX (x) = p e
2

x2
2

1 < x < 1:

Y
0 =) FY (y) = P (Y
y) = P (;) = 0; 8y < 0 =) fY (y) = FY0 (y) =
0; 8y < 0. Pentru y > 0, r
ad
acinile lui x2 = y sunt
p

x1;2 = g1;21 (y) =

De aici, folosind relatia (6.13),


2
X
dgj 1 (y)
p
= fX
y
fY (y) =
fX gj 1 (y)
dy

y:

1
p
2 y

+ fX

1
p
2 y

j=1

y
2

p1 e
2 y

deci
p1 e
2 y

fY (y) =

y
2

, pentru y > 0;

0, altfel.

Am obtinut repartitia 2 cu un grad de libertate (vezi relatia (5.24)), deoarece


Z 1
Z 1
Z 1
2
p
p
u= x2 p
1
x2
x2
1
u
1
2
2
2
xdx = 2
u e du =
x e
e 2 dx = 2
2 =
0
0
0
Z 1
p
p
x2
1
1
p
2
dx = 2 2 =
e
:
2
1

6.1.2

Momente

Fie Y = g (X) si presupunem c


a toate momentele dorite ale lui Y exist
a. Momentul de ordinul n al lui Y este
E (Y n ) = E (g n (X)) =
n

E (Y ) = E (g (X)) =

g n (xi ) pX (xi ) , dac


a X e discret
a,

Zi 1

(6.14)
g n (x) fX (x) dx, dac
a X e continu
a.

Exemplul 6.5. Fie X

1
2

1
4

1
8

1
8

. Determinati media si disper-

sia lui Y = 2X + 1:
Folosim prima relatie (6.14).
X
E (Y ) = E (2X + 1) =
(2xi + 1) pX (xi ) = ( 1)
i

E Y

= E (2X + 1)

(2xi + 1) pX (xi ) = 1

5:
2
Y

=E Y2

E 2 (Y ) = 5

1
1
1
1
2 +1 4 +3 8 +5 8

3 2
4

=
80

71
16 :

= 34 :

1
1
1
1
2 +1 4 +9 8 +25 8

6.2

Func
tii de dou
a sau mai multe variabile aleatoare

Consider
am transformarea
Y = g (X1 ; X2 ; :::; Xn ) ;

(6.15)

unde X1 ; X2 ; :::; Xn sunt variabile aleatoare a c


aror repartitie comun
a se cunoaste.
Vrem s
a determin
am repartitia lui Y .
Fie X vectorul aleator n-dimensional cu componentele X1 ; X2 ; :::; Xn si x
vectorul n-dimensional cu componentele x1 ; x2 ; :::; xn .
Dac
a X1 ; X2 ; :::; Xn sunt discrete cu masa comun
a pX (x), atunci masa lui
Y este
X
pY (y) =
pX (x) ; 8y 2 RY ;
x2g

1 (y)

unde g 1 (y) = fx 2 RX jg (x) = yg, iar RX este multimea valorilor lui X.


Presupunem acum c
a X1 ; X2 ; :::; Xn sunt continue si cunoastem densitatea
comun
a fX (x) sau functia de repartitie comun
a FX (x). Avem
FY (y) = P (Y

y) = P (g (X)

y) = FX (x : g (x)

y) :

(6.16)

Ultima expresie din relatia (6.16) reprezint


a functia de repartitie comun
a a lui
X pentru care argumentul x satisface g (x) y. n termeni de fX (x) este dat
a
de
Z
Z
FX (x : g (x) y) =
fX (x) dx;
(6.17)
(Rn :g(x) y)

unde Rn = fx 2 R jg (x)
din relatia (6.17).
6.2.1

yg. FY (y) poate determinat


a evalund integrala

Sume de variabile aleatoare

Consider
am suma
Y = g (X1 ; X2 ; :::; Xn ) = X1 + X2 + ::: + Xn :
E sucient s
a determin
am fY (y) pentru n = 2. Rezulatatul pentru acest caz
poate apoi aplicat succesiv pentru a da repartitia sumei oric
arui num
ar de
variabile aleatoare. Pentru Y = X1 + X2 , relatiile (6.16) si (6.17) dau
ZZ
FY (y) =
fX1 X2 (x1 ; x2 ) dx1 dx2 ;
(R2 :x1 +x2 y)

si, dup
a cum se observ
a din gura urm
atoare, n care este reprezentat
a R2 =
2
x 2 R jx1 + x2 y , avem
81

FY (y) =

1
1

y x2

fX1 X2 (x1 ; x2 ) dx1 dx2 :

(6.18)

Derivnd n relatia (6.18) n raport cu y, obtinem


Z 1
fY (y) =
fX1 X2 (y x2 ; x2 ) dx2 :

(6.19)

Cnd X1 si X2 sunt independente, relatia (6.19) devine


Z 1
fY (y) =
fX1 (y x2 ) fX2 (x2 ) dx2 :

(6.20)

Integrala din relatia (6.20) se numeste convolutia functiilor fX1 (x1 ) si fX2 (x2 ) :
Teorema 6.3. Fie X1 si X2 variabile aleatoare continue independente si
Y = X1 + X2 . Atunci densitatea lui Y este convolutia densit
atilor lui X1 si X2 ,
adic
a

fY (y) =

fX1 (y

x2 ) fX2 (x2 ) dx2 =

82

1
1

fX2 (y

x1 ) fX1 (x1 ) dx1 :


(6.21)

6.3

m func
tii de n variabile aleatoare

Fie
Yj = gj (X1 ; :::; Xn ) ;

j = 1; 2; :::; m;

n:

(6.22)

Vrem s
a obtinem repartitia comun
a a variabilelor aleatoare Yj ; j = 1; 2; :::; m,
stiind repartitia comun
a a variabilelor aleatoare Xk ; k = 1; 2; :::; n.
Dac
a X1 ; X2 ; :::; Xn sunt discrete cu masa comun
a pX (x), atunci masa comun
a a variabilelor aleatoare Y1 ; :::; Ym este
X
pY (y) =
pX (x) ; 8y 2 RY ;
x2g

1 (y)

unde g are componentele g1 ; g2 ; :::; gm , g 1 (y) = fx 2 RX jg (x) = yg, iar RX


si RY sunt multimile valorilor lui X, respectiv Y.
Presupunem acum c
a X1 ; X2 ; :::; Xn sunt continue.
Consider
am mai nti cazul m = n.
Fie X si Y vectori aleatori n-dimensionali cu componentele X1 ; :::; Xn , respectiv Y1 ; :::; Yn . Relatia (6.22) se scrie vectorial
Y = g (X) ;

(6.23)

unde g (X) are componentele g1 (X) ; g2 (X) ; :::; gn (X). Consider


am nti cazul
n care functiile gj din g sunt continue n raport cu ecare argument, au derivate
partiale continue si sunt bijective. Atunci rezult
a c
a functiile inverse gj 1 din
g 1 denit
a de
X=g

(Y) ;

exist
a si sunt unice. Au de asemenea derivate partiale continue.
Pentru a determina fY (y) n termeni de fX (x), observ
am c
a, dac
a o regiune
n
n
nchis
a RX
din multimea valorilor lui X este dus
a ntr-o regiune nchis
a RY
din
multimea valorilor lui Y prin transformerea g, conservarea probabilit
atii d
a
Z
Z
Z
Z
fY (y) dy =
fX (x) dx;
(6.24)
n
RY

n
RX

unde integralele reprezint


a n integrale n raport cu componentele lui x, respectiv
y. Urmnd regula uzual
a de schimbare de variabile n integrale multiple, putem
scrie
Z
Z
Z
Z
fX (x) dx =
fX g 1 (y) jJj dy;
(6.25)
n
RX

n
RY

unde J este Jacobianul transform


arii, denit ca determinantul

83

J=

@g1 1
@y1

@g1 1
@y2

..
.

@gn
@y1

:::

..
.

@g1 1
@yn

..
.

@gn
@y2

:::

(6.26)

@gn
@yn

Relatiile (6.24) si (6.25) conduc la urm


atorul rezultat.
Teorema 6.4. Pentru transformarea dat
a de relatia (6.23), unde X este
un vector aleator continuu si g este continu
a cu derivate partiale continue si
bijectiv
a, densitatea comun
a a lui Y este
fY (y) = fX g

(y) jJj ;

(6.27)

unde J este denit de relatia (6.26).


Exemplul 6.6. Fie X1 si X2 variabile aleatoare independente identic repartizate N (0; 1). S
a se determine densitatea comun
a a lui Y1 = X1 + X2 si
Y2 = X1 X2 :
x1 + x2 = y1
Deoarece sistemul
are solutia unic
a
x1 x2 = y2
y 1 + y2
y 1 y2
x1 = g1 1 (y) =
; x2 = g2 1 (y) =
;
2
2
g este bijectiv
a si se poate aplica teorema 6.4. Jacobianul este
J=

@g1 1
@y1
@g2 1
@y1

@g1 1
@y2
@g2 1
@y2

1
2
1
2

1
2
1
2

1
:
2

Datorit
a independentei, relatia (6.27) conduce la
2

2
) p1
( y1 +y
2
fY1 Y2 (y1 ; y2 ) = fX1 g1 1 (y) fX2 g2 1 (y) jJj = p12 exp
exp
2
2
h
i
h
i
y12 +y22
(y1 +y2 )2
(y1 y2 )2
1
1
exp
= 41 exp
; y1 ; y2 2 R:
2 = 4 exp
8
8
4
Observ
am c
a rezultatul poate scris sub forma

fY1 Y2 (y1 ; y2 ) = fY1 (y1 ) fY2 (y2 ) ;


unde
1
fY1 (y1 ) = p exp
4

y12
4

y1 2 R;

1
fY2 (y2 ) = p exp
4

y22
4

y2 2 R;

implicnd c
a, desi Y1 si Y2 sunt ambele functii de X1 si X2 , ele sunt independente
si identic repartizate N (0; 2).
Relatia (6.27) este o extindere a relatiei (6.8), care este pentru cazul special
n = 1. Similar, o extindere este de asemenea posibil
a pentru relatia (6.13)
pentru cazul n = 1 cnd ecuatia are mai mult de o r
ad
acin
a.
84

( y1 2 y2 )
2

Teorema 6.5. n transformarea dat


a de relatia (6.23), presupunem c
a
ecuatia g (x) = y are un num
ar cel mult num
arabil de r
ad
acini x1 = g1 1 (y) ; x2 =
g2 1 (y) ; :::. Atunci
fY (y) =

r
X
j=1

fX gj 1 (y) jJj j ;

(6.28)

unde r este num


arul de r
ad
acini ale ecuatiei g (x) = y si

Jj =

@gj11
@y1

@gj11
@y2

@gjn1

@gjn1

@y1

@y2

..
.

:::

..
.

@gj11
@yn

..
.

:::

@gjn1
@yn

gj11 ; gj21 ; :::; gjn1

Aici
sunt componentele lui gj 1 .
Rezultatele prezentate mai sus pot de asemenea aplicate n cazul cnd
dimensiunea lui Y este mai mic
a dect cea a lui X. Consider
am transformarea
(6.22) n care m < n. Pentru a folosi formulele de mai sus, nti complet
am
vectorul aleator m-dimensional Y cu un alt vector aleator (n m)-dimensional
Z. Vectorul Z poate construit ca o functie simpl
a de X, n forma
Z = h (X) ;

(6.29)

unde h este continu


a si are derivate partiale continue. Combinnd relatiile (6.22)
si (6.29), avem o transformare de la n variabile aleatoare la n variabile aleatoare,
si densitatea comun
a a lui Y si Z poate obtinut
a cu relatia (6.27) sau relatia
(6.28). Densitatea comun
a a lui Y singur se g
aseste apoi prin integrare n raport
cu componentele lui Z.

85

Part II

Statistic
a
7

7.1

Statistic
a descriptiv
a pentru date unudimensionale (reprezent
ari grace, func
tie de reparti
tie de selec
tie, momente de selec
tie)
Histograme
si diagrame de frecven
te

Fiind dat un set de observatii independente x1 ; x2 ; :::; xn , ale unei variabile


aleatoare X, un prim pas util este organizarea si prezentarea lor adecvat
a astfel
nct ele s
a poat
a usor inerpretate si evaluate. Cnd exist
a un num
ar mare
de date observate, o histograma este o reprezentare grac
a excelent
a a datelor,
facilitnd
a) o evaluare a adecv
arii modelului presupus,
b) estimarea percentilelor repartitiei,
c) estimarea parametrilor repartitiei.
Consider
am, de exemplu, un proces chimic care este producerea de loturi
(batches) dintr-un material; 200 de valori observate ale randamentului procentual (percentage yield), X, reprezentnd un esantion relativ mare sunt date n
tabelul urm
ator.

86

Valorile esantionului variaz


a de la 64 la 76. mp
artind acest interval n 12
intervale egale si reprezentnd num
arul total de randamente observate n ecare
interval ca n
altimea dreptunghiului de deasupra intervalului rezult
a histograma
dup
a cum e ar
atat n gura urm
atoare.

87

O diagrama de frecvente este obtinut


a dac
a ordonata histogramei este mp
artit
a la num
arul total de observatii, 200 n acest caz, si la l
atimea
intervalului
(care se ntmpl
a s
a e 1 n acest exemplu). n dreapta gurii
este reprezentat
a ordonata diagramei de frecvente. Vedem c
a histograma sau
diagrama frecventelor d
a o impresie imediat
a asupra valorilor, frecventei relative
si mpr
astierii asociate datelor.
Diagrama frecventelor din gur
a are propriet
atile unei densit
ati (suma ariilor dreptunghiurilor este 1). De aici pot estimate probabilit
atile asociate
cu diverse evenimente. De exemplu, probabilitatea unui lot avnd randament
mai mic dect 68% poate calculat
a din diagrama frecventelor adunnd ariile
de la stnga lui 68% si obtinnd 0; 13 (0; 02 + 0; 01 + 0:025 + 0:075). Similar, probabilitatea unui lot avnd un randament mai mare de 72% este 0; 18
(0; 105 + 0; 035 + 0; 03 + 0; 01). Acestea sunt probabilit
ati calculate pe baza
datelor observate. Un set diferit de date obtinute din acelasi proces chimic ar
conduce n general la o diagram
a de frecvente diferit
a si deci la valori diferite
pentru aceste probabilit
ati. n consecinta, ele sunt estim
ari ale probabilit
atilor
P (X < 68) si P (X > 72) asociate cu variabila aleatoare X.
88

Pentru acest exemplu, alegerea a 12 intervale este convenabil


a datorit
a intervalului de valori luate de observatii si faptului c
a rezolutia rezultat
a este
adecvat
a pentru calculele de probabilit
ati de mai sus. n gura urm
atoare este
construit
a o histogram
a folosind 4 intervale n loc de 12 pentru acelasi exemplu.

Se observ
a c
a proiecteaz
a o impresie vizual
a mult diferit
a si cu o mai mic
a
acuratete a comportamentului datelor. Astfel, e important s
a e ales num
arul
de intervale n concordanta cu informatia care se vrea extras
a din modelul
matematic. Ca un ghid practic, Sturges a sugerat n 1926 ca o valoare aproximativ
a pentru num
arul de intervale k s
a e dat
a de
k ' 1 + 3; 3 lg n;
unde n este num
arul de date.
Din punctul de vedere al model
arii, este rezonabil s
a alegem o repartitie
normal
a ca model probabilistic pentru randamentul procentual X observnd
c
a variatiile aleatoare ale ei sunt rezultanta a numeroase surse aleatoare independente n procesul chimic de fabricare. Dac
a aceasta este sau nu o alegere
rezonabil
a poate evaluat intr-un mod subiectiv folosind diagrama frecventelor
din gura al
aturat
a. Densitatea repartitiei normale de medie 70 si dispersie 4
este trasat
a punctat pe diagrama frecventelor, ar
atnd o potrivire rezonabil
a.
Bazndu-ne pe aceast
a repartitie normal
a, putem calcula probabilit
atile de mai
89

sus, dnd o alt


a evaluare a adecv
arii modelului. De exemplu, cu ajutorul tabelului valorilor repartitiei N (0; 1) ;
P (X < 68) = FU 68 2 70 = FU ( 1) = 1 FU (1) = 1 0; 8413 = 0; 1587;
care se compar
a cu 0; 13 obtinut
a folosind diagrama frecventelor.
n cele de mai sus, alegerile lui 70 si 4 ca estim
ari pentru media, respectiv dispersia lui X, sunt f
acute observnd c
a media repartitiei ar trebui s
a e
aproape de media aritmetic
a a selectiei, adic
a
n

mX '

1X
xj ;
n j=1

si dispersia poate aproximat


a prin
n

2
X

'

1X
(xj
n j=1

mX ) :

n cazul unei variabile aleatoare discrete, histograma si diagrama de frecvente


obtinute din datele observate iau forma unei reprezent
ari n batoane, spre deosebire de dreptunghiurile conectate din cazul continuu. Consider
am, de exemplu,
repartitia num
arului de accidente pe sofer de-a lungul unei perioade de timp de
6 ani n California. Datele din tabelul urm
ator sunt nregistr
arile accidentelor
pe 6 ani ale 7842 de soferi californieni.

Bazat
a pe acest set de observatii, histograma are forma dat
a n gura urm
atoare.

90

Diagrama frecventelor este obtinut


a n acest caz prin mp
artirea ordonatei histogramei la num
arul total de observatii, care este 7842.

7.2

Selec
tii
si statistici

n cele mai multe cazuri este imposibil sau nerealist s


a se observe ntreaga
populatie. Unele populatii au membri care nc
a nu exist
a (de exemplu, loturile
viitoare din productia de ciment), sau populatia este prea mare (de exemplu,
toate femeile ns
arcinate). De aceea cercet
atorii m
asoar
a doar o parte a populatiei tint
a, numit
a selectie sau esantion. Dac
a facem deductii despre populatie
folosind informatia obtinut
a dintr-o selectie, atunci este important ca selectia
s
a e reprezentativ
a pentru populatie, ceea ce poate atins dac
a toate selectiile
posibile sunt egal probabil s
a e alese.
Uneori scopul statisticii este utilizarea selectiei pentru a estima sau a face
unele armatii despre un parametru al populatiei. Un parametru este o m
asur
a
descriptiv
a pentru o populatie sau pentru o repartitie a variabilelor aleatoare.

91

De exemplu, parametrii populatiei care pot de interes includ media, deviatia


standard, cuantile, proportii, coecienti de corelatie, etc.
Presupunem c
a un model probabilistic, reprezentat de densitatea f (x), a
fost ales pentru un fenomen zic sau natural pentru care parametrii 1 ; 2 ; :::
trebuie estimati din datele observate independent x1 ; x2; :::; xn . Consider
am pentru moment un singur parametru pentru simplitate si scriem f (x; ) pentru
o densitate specicat
a unde este parametrul necunoscut care trebuie estimat.
Problema estim
arii parametrului este atunci una a determin
arii unei functii
corespunz
atoare de x1 ; x2; :::; xn , s
a spunem h (x1 ; x2; :::; xn ), care d
a "cea mai
bun
a" estimare a lui .
Fiind dat un set de date independente x1 ; x2; :::; xn , e
b = h(x1 ; x2; :::; xn )

o estimare a parametrului . Dac


a experimentul care a dat setul de date sar repeta, am obtine valori diferite pentru x1 ; x2; :::; xn . Functia h(x1 ; x2; :::; xn )
aplicat
a la noul set de date ar da o valoare diferit
a pentru b. Vedem astfel c
a esb
timarea este ea ns
asi o variabil
a aleatoare avand o densitate, care depinde att
de forma functiei h ct si de densitatea variabilei aleatoare X. Reprezentarea
corespunz
atoare a lui b e astfel
b = h(X1 ; X2 ; :::; Xn );

(7.1)

unde X1 ; X2 ; :::; Xn sunt variabile aleatoare reprezentnd o selectie din variabila


aleatoare X, care este numit
a n acest context populatie.
Presupunem c
a selectia X1 ; X2 ; :::; Xn are urm
atoarele propriet
ati:
Proprietatea 1: X1 ; X2 ; :::; Xn sunt independente.
Proprietatea 2: fXj (x) = fX (x), 8x; j = 1; 2; :::; n:
Variabilele aleatoare X1 ; X2 ; :::; Xn satisf
acnd aceste conditii se numesc o
selectie aleatore de m
arime n. Cuvntul "aleatore" din aceast
a denitie este de
obicei omis pentru scurtime. Daca X este o variabil
a aleatoare discret
a cu masa
pX (x), atunci pXj (x) = pX (x), 8j:
Un set specic de valori observate (x1 ; x2 ; :::; xn ) este un set de valori ale
selectiei.
Datorit
a propriet
atilor 1 si 2, densitatea comun
a este dat
a de
fX1 X2 :::Xn (x1 ; x2 ; :::; xn ) = fX (x1 ) fX (x2 ) :::fX (xn ) :
O statistica este o functie de o selectie dat
a X1 ; X2 ; :::; Xn care nu depinde
de parametrul necunoscut. Functia h (X1 ; X2 ; :::; Xn ) din (7.1) este o statistic
a
pentru care valoarea poate determinat
a odat
a ce valorile selectiei au fost
observate. O statistic
a, ind o functie de variabile aleatoare, este o variabil
a
aleatoare. Adesea o statistic
a este folosit
a pentru urm
atoarele scopuri
- ca o estimare punctual
a pentru un parametru al populatiei,
- pentru a obtine o estimare a intervalului de ncredere pentru un parametru,
sau,
- ca un test statistic n testarea ipotezelor.
92

7.2.1

Media de selec
tie

Statistica

X=

1X
Xi
n i=1

e numit
a media de selectie a populatiei X. Fie media si dispersia populatiei
E(X) = m;
var(X) = 2 :

(7.2)

Media mediei de selectie X este


n

E(X) =

1X
1
E (Xi ) = (nm) = m:
n i=1
n

Dispersia mediei de selectie X 0


este
" n
X
2
var(X) = E X m
= E @ n1
(Xi
1
n2 E

1
n2 E

1
n2

0"
@
0
@

n
X

(Xi

i=1

n
X

(Xi

m) + 2

i=1

2
n
X
4
E (Xi

1
n2

1
n2

i=1

+2

m)

deci

(Xi

m) (Xj

+2

E ((Xi

1 i<j n

E ((Xi

m)A =

m) (Xj
3

7
7
E ((Xi m))E ((Xj m))7
=
|
{z
}|
{z
}7
5
n
=0

m))5 =

indep endenta
m))5
=

m) (Xj

1 i<j n

6 n
X
6X 2
6
+2
6
4 i=1
1 i<j
| {z }
=n

1 i<j n

i=1

2
n
X
4

i=1

#2 1
m) A =

#2 1
m) A =

1
n2

=0

var(X) =

;
n
care este invers proportional
a cu m
arimea selectiei n. Cnd n creste, dispersia
lui X descreste si repartitia lui X devine ascutit
a cu vrful n E(X) = m. De
aici, este clar intuitiv c
a statistica X d
a o bun
a procedur
a de estimare a mediei
populatiei m.
a de variabile aleatoare independente, pe baza teoDeoarece X este o sum
remei limit
a central
a, media de selectie X tinde la o repartitie normal
a cnd

93

n ! 1. Mai precis, variabila aleatoare X


n ! 1.
7.2.2

tinde la N (0; 1) cnd

Dispersia de selec
tie

Statistica
1

S2 =

n
X

Xi

(7.3)

i=1

se numeste dispersia de selectie a populatiei X.


(7.3))
n
X
2
1
2
(Xi m)
S =n 1
=
X m
1
n 1

n
X
i=1

2 i=1
4(Xi

1
n

m)

n
X

m)

2
n

(Xi

(Xi

m)

m)

m)

(Xj

m) +

2
n

1
n

1
n

"
"

n
X

#2

"

1
n2

(Xi

m)

i=1

n
X

(Xi

2
n
X
4
(Xi

m)

2
n(n 1)

1
n

#2 9
=
m)
=
;

i=1

32 9
>
=
5
m)
=
>
;

2
n
X
4
(Xj
j=1

m) + 2

i=1

i=1

n
X

(Xi

i=1

(Xi

#2 9
=
m)
=
;

39
=
m)5 =
;

m) (Xj

1 i<j n

(Xi

m) (Xj

m) :

1 i<j n

De aici, media lui S 2 este


E(S 2 ) =
n
X
2
1
2
E (Xi m)
n
n(n
1
n

m)

n
X
j=1

i=1

n
X

m)5 =

(Xj

j=1

8
n >
<
X
1
(X
n 1
> i
i=1 :
8
n
<X
1
(Xi
n 1 :
i=1
8
n
<X
1
(Xi
n 1 :
i=1
8
n
<X
1
(Xi
n 1 :
1
n

32

i=1
n
X

E (Xi m)
{z
}
i=1 |
=

1)

E ((Xi

m) (Xj

m))

indep endenta

1 i<j n

2
n(n 1)

1 i<j n

Deci

E(S 2 ) =

E (Xi m)E (Xj


|
{z
}

m) =

=0

unde m si
sunt denite de (7.2). Motivul folosirii lui n 1 1 n loc de n1 n (7.3)
este de a face media lui S 2 egal
a cu 2 . Aceasta este o proprietate de dorit
2
pentru S dac
a aceasta este folosit
a la estimarea lui 2 , adev
arata dispersie a
lui X.
2

94

Dispersia lui S 2 este aat


a din
var(S 2 ) = E

2 2

S2

Se obtine
var(S 2 ) =
unde

1
n

n
n

3
1

este momentul centrat de ordinul 4 al lui X, adic


a
4

= E (X

m)

Teorema 7.1. Dac


a S 2 este dispersia de selectie de m
arime n a unei
(n 1)S 2
2
2
are o repartitie
cu (n 1) grade de
populatii X N m;
, atunci
2
libertate.
7.2.3

Momente de selec
tie

Momentul de selectie de ordinul k este


n

Mk =

1X k
X :
n i=1 i

Observ
am c
a media de selectie se obtine pentru k = 1:
Se poate ar
ata c
a
E (Mk ) = k ;
var (Mk ) = n1

2
k

2k

unde k este momentul de ordinul k al lui X.


Momentul centrat de selectie de ordinul k este
n

Mkc =
7.2.4

1X
Xi
n i=1

Statistici de ordine
si func
tia de reparti
tie de selec
tie

O selectie X1 ; X2 ; :::; Xn poate pus


a n ordine cresc
atoare. Astfel, pentru
aceast
a selectie, statisticile de ordine sunt denite ca
X(1)

X(2)

:::

X(n) ;

cu X(i) ind a i-a statistic


a de ordine.
Functia de repartitie de selectie Fbn (x) este denit
a ca num
arul de date mai
mic sau egal cu x mp
artit la m
arimea selectiei n. Ea poate exprimat
a n
termeni de statistici de ordine astfel:

95

8
a x < X(1) ;
< 0, dac
j
Fbn (x) =
,
dac
a X(j) x < X(j+1) ;
: n
1, dac
a x X(n) :

Functia de repartitie de selectie estimeaz


a neparametric functia de repartitie
a populatiei X. n gura urm
atoare sunt reprezentate o functie de repartitie de
selectie si functia de repartitie pentru normala standard.

96

Estimarea parametrilor unor reparti


tii prin metoda
verosimilit
a
tii maxime

8.1

Criterii de calitate pentru estim


ari

Statistica
b = h (X1 ; X2 ; :::; Xn )

se numeste un estimator pentru :


Odat
a ce am observat valorile selectiei x1 ; x2 ; :::; xn , estimatorul observat,
b = h (x1 ; x2 ; :::; xn ) ;

are o valoare numeric


a si va numit o estimare a parametrului .
8.1.1

Nedeplasare

Deni
tie. Un estimator b se numeste estimator nedeplasat pentru

dac
a

E b = ;

si deplasat n caz contrar.


Deplasarea estimatorului b este denit
a ca
bias b = E b

Exemple. 1) Media de selectie X =

1
n

n
X

Xi este estimator nedeplasat

i=1

pentru media populatiei m deoarece E X = m.


n
X
1
2
2) Dispersia de selectie S = n 1
Xi X

este estimator nedeplasat

i=1

pentru dispersia populatiei


3) Estimatorul S 2 =

1
n

deoarece E S 2 =

n
X

Xi

este estimator deplasat pentru

i=1

deoarece E S 2 = nn 1 2 . De aceea pentru denirea dispersiei de selectie se


prefer
a coecientul n 1 1 in locul alegerii mai naturale n1 . Deplasarea lui S 2 este
bias S 2
8.1.2

1
n

Dispersie minim
a

Deni
tie. Fie b un estimator nedeplasat pentru . El este un estimator
nedeplasat de dispersie minima dac
a pentru toti ceilalti estimatori nedeplasati
pentru din aceeasi selectie avem

97

var b

var (

):

Fiind dati 2 estimatori nedeplasati pentru un parametru dat, cel cu dispersie


mai mic
a este preferat deoarece dispersia mai mic
a implic
a faptul c
a valorile observate ale estimatorului tind sa e mai aproape de media lui, valoarea adevarat
a
a parametrului.
arime n este un
Exemplu. Am v
azut c
a X obtinut dintr-o selectie de m
estimator nedeplasat pentru media populatiei m. Creste calitatea lui X cnd n
creste?
a de volumul esantionului. Deci X r
amne
E X = m si este independent
nedeplasat cnd n creste. Pe de alt
a parte
2

var X =

;
n
si descreste cnd n creste. Pe baza criteriului dispersiei minime, calitatea
lui X ca estimator pentru m creste cnd n creste.
Teorema 8.1 (inegalitatea Rao-Cramer). Fie X1 ; X2 ; :::; Xn o selectie
de m
arime n din o populatie X cu densitatea f (x; ), unde este parametrul
necunoscut, si e b = h (X1 ; X2 ; :::; Xn ) un estimator nedeplasat pentru .
Atunci, dispersia lui b satisface inegalitatea
var b

nE

@ ln f (X; )
@

!!

(R.C.)

dac
a media si derivata partial
a scrise exist
a. Presupunem c
a se poate deriva in
raport cu sub integral
a. Un rezultat analog se obtine dac
a X este discret
a
nlocuind f (X; ) cu p (X; ), unde p (x; ) este masa populatiei X:
nedeplasare
X1 ;:::;Xn indep endente
Demonstra
tie.
=
E b = E (h (X1 ; X2 ; :::; Xn ))
=
Z 1
Z 1
@
@
:::
h (x1 ; :::; xn ) f (x1 ; ) :::f (xn ; ) dx1 :::dxn =)
1

1=
Z 1
Z

:::

1
1

:::

1
1
1
1

2
n
X
1
h (x1 ; :::; xn ) 4
f (xj ;
j=1

(x1 ; ) :::f (xn ; ) dx1 :::dxn =

2
3
n
X
@
ln
f
(x
;
)
j
5 f (x1 ; ) :::f (xn ; ) dx1 :::dxn :
h (x1 ; :::; xn ) 4
@
j=1

f (x; ) densitate ) 1 =
Z 1
Z
@f (xi ; )
0=
dx
=
i
@
1

@f (xj ; ) 5
f
)
@

@
@

f (xi ; ) dxi , i = 1; 2; :::; n =)

@ ln f (xi ; )
f
@

98

(xi ; ) dxi , i = 1; 2; :::; n:

(8.1)

Fie Y =

E (Y ) =

n
X
@ ln f (X

j;

j=1
n
X

@ ln f (Xj ; )
@

j=1

1
n Z
X
@ ln f (xj ; )
f (xj ; ) dxj = 0:
@
j=1 1
{z
}
|
=0

X1 ; :::; Xn independente ) @ ln f@(X1 ; ) ; :::; @ ln f@(Xn ;


n
X
@ ln f (Xj ; )
2
=
=
var
Y
@
j=1

n
X
j=1

02

B6 @ ln f (Xj ;
6
EB
@
@4

n
X

j=1
(8.1)

@ ln f (X; )
@

E
|

i2

n
h
i2
C X
@ ln f (Xj ; ) 7
@ ln f (Xj ; )
7 C=
E
@
5 A
@
j=1
{z
}
=0

= nE

=0

2
Y

2
b

2
Y

2
bY

independente )

32 1

1 = E( b Y ) = E b E (Y ) +
| {z }
2
b

1)
h
i2
@ ln f (X; )
nE
@

@ ln f (X; )
@

bY

i2

bY

Deni
tie. Marginea inferioar
a a dispersiei oric
arui estimator nedeplasat
dat
a de inegalitatea (RC) este n general o functie de si o numim marginea
inferioara Rao-Cramer. Notatie
1
h
i2
@ ln f (X; )
MIRC = nE
:
@
Observa
tie. MIRC =

nE

@ 2 ln f (X; )
@ 2

@
Demonstra
tie. f (x; ) densitate ) 1 =
f (x; ) dx =)
1
Z 1
Z 1
@
@f (x; )
@ ln f (x; )
@
0=
dx
=
f (x; ) dx =)
@
@
12
1
3

0=

Z
E

6 2
6 @ ln f (x; )
f (x; ) +
6 @ 2
14

1
1
1
1

@ 2 ln f (x; )
f
@ 2

@ ln f (x; )
@

@ ln f (X; )
@

i2

i2

(x; ) +

@ ln f (x; )
@

f (x; ) dx =
=

@ ln f (x; )
@

i2

@ 2 ln f (X; )
@ 2

99

@f (x; )
| @{z }

@ ln f (x; )
f (x;
@

f (x; ) dx =)
@ 2 ln f (x; )
f
@ 2

=)

7
7
7 dx =
5

(x; ) dx =)

MIRC =

nE

@ ln f (X; )
@

i2

@ 2 ln f (X; )
@ 2

nE

Deni
tie. Fie b estimator nedeplasat pentru parametrul . Ecienta lui
b este e b = M IRC :
var ( b )
Observa
tie. Ecienta oric
arui estimator nedeplasat este 1:
Deni
tie. Un estimator nedeplasat cu ecienta 1 se numeste estimator
ecient.
Observatie. Din inegalitatea Rao-Cramer rezult
a c
a orice estimator ecient
este estimator nedeplasat de dispersie minim
a.
Reciproc este adev
arat doar dac
a exist
a un estimator ecient.
Exemple. 1) Fie X N m; 2 . Pe baza unei selectii xate de m
arime n,
este X estimator ecient pentru m?
Am v
azut c
a X este estimator nedeplasat pentru m. Calcul
am MIRC pentru
dispersia oric
arui estimator
nedeplasat
pentru
m:
i
h
(X m)2
(X m)2
f (X; m) = p21 exp
=) ln f (X; m) = ln p21
=)
2 2
2 2
@ ln f (X;m)
@m

X m
2

@ ln f (X;m)
@m

MIRC =

)
i2
h

nE

Dar var X =

1
4

@ ln f (X; )
@
2

E (X

m)

i2

1
2

=)

=) var X = MIRC =) X estimator ecient pentru

m:
2) Fie X
N 0; 2 , unde 2 este un parametru necunoscut ce trebuie
estimat dintr-o selectie de m
arime n > 1.
a) S
a se determine MIRC pentru dispersia oric
arui estimator nedeplasat
pentru 2 .
b) Este dispersia de selectie S 2 un estimator ecient pentru 2 ?
X2
R. a) Not
am = 2 =) f (X; ) = 1 1 exp
=)
2
(2

ln f (X; ) =

X2
2

2
@ ln f (X; )
= 2X 2
@
2
)
E @ ln@f (X;
2

1
2

1
2

ln 2

MIRC =

nE

=)

2
)
=) @ ln@f (X;
2
2
1
+ 212
3E X

| {z }
=

)2

X2

1
=)
2 2
1
= 212
2 2

@ 2 ln f (X; )
@ 2
2

2 2
n :

b) Am v
azut c
a S este un estimator
nedeplasat pentru
)
1
n 3 4
2
var S = n 4 n 1
=)
X N 0; 2 =) 4 = 3 4
1
n 3
4
n 3
n 1
M IRC
n 1
=
var(S 2 )
n :

var S 2 =
e S2 =

=)

2 4
n 1

100

2 2
n 1

=)

si

Observ
am c
a S 2 nu este un estimator ecient pentru
M IRC
asimptotic ecient n sensul c
a lim var(S
2 ) = 1:

n acest caz, dar este

n!1

8.1.3

Consisten
ta

Deni
tie. Un estimator b bazat pe o selectie de m
arime n este estimator
consistent pentru dac
a
" = 0, 8" > 0:
lim P b
n!1

Teorema 8.2. Fie b un estimator bazat pe o selectie de m


arime n. Dac
a
lim E b =

n!1

si lim var b = 0;
n!1

atunci b este un estimator consistent pentru .


Demonstra
tie. Fie " > 0. Din inegalitatea lui Cebsev (vezi teorema 2.1),
obtinem
P
Deoarece
b

= b

E b

n (")
P b

"
E b
2 :
Obtinem, pentru n n (")

"
; 8n
2

"

de unde, trecnd la limit


a rezult
a lim P
8.1.4

E b

+ E b

n!1

Sucien
ta

" =P

4var b
"2

n (") ;

+ E b

E b

"2

rezult
a c
a 9n (") 2 N a..

n!1

4var b

"
2

E b

E b +E b

si, din lim E b =


avem pentru n
"
P b

E b

" = 0:

Fie X1 ; X2 ; :::; Xn o selectie a populatiei X a c


arei repartitie depinde de parametrul necunoscut . Dac
a Y = h (X1 ; X2 ; :::; Xn ) este o statistic
a a. ., pentru
orice alt
a statistic
a
Z = g (X1 ; X2 ; :::; Xn ) ;
101

"

E b

repartitia conditionat
a a lui Z, dat ind c
a Y = y; nu depinde de , atunci Y
e numit
a statistica sucienta pentru . Dac
a n plus E (Y ) = , atunci Y se
numeste estimator sucient pentru .
Teorema 8.3. (criteriul de factorizare Fisher-Neymann). Fie
Y = h (X1 ; X2 ; :::; Xn )
o statistic
a bazat
a pe o selectie de m
arime n a populatiei continue X. Atunci
Y este o statistic
a sucient
a pentru dac
a si numai dac
a densitatea comun
aa
lui X1 ; X2 ; :::; Xn poate factorizat
a sub forma
n
Y

fX (xj ; ) = g1 (h (x1 ; :::; xn ) ; ) g2 (x1 ; :::; xn ) :

j=1

Dac
a X este discret
a, conditia este
n
Y

pX (xj ; ) = g1 (h (x1 ; :::; xn ) ; ) g2 (x1 ; :::; xn ) :

j=1

Sucienta a fost demonstrat


a de Fisher n 1922, iar necesitatea de Neymann
n 1935.

8.2

Metoda verosimilit
a
tii maxime

Introdus
a de Fischer n 1922 a devenit cea mai important
a metod
a general
a de
estimare din punct de vedere teoretic.
Fie f (x; ) densitatea populatiei X, unde este unicul parametru care trebuie estimat dintr-un set de valori de selectie x1 ; x2 ; :::; xn :
Deni
tie. Functia de verosimilitate a unui set de n valori de selectie din
populatie este
L (x1 ; x2 ; :::; xn ; ) = f (x1 ; ) f (x2 ; ) :::f (xn ; ) :
n cazul n care X este discret
a cu masa p (x; ), avem
L (x1 ; x2 ; :::; xn ; ) = p (x1 ; ) p (x2 ; ) :::p (xn ; ) :
Cnd valorile de selectie sunt date, functia de verosimilitate L devine o
functie de o singur
a variabil
a . Procedura de estimare pentru bazat
a pe
metoda verosimilit
atii maxime const
a n alegerea, ca o estimare pentru , a
valorii particulare care maximizeaz
a L. Maximul lui L ( ) apare in cele mai
)
= 0. De aici, ntr-un mare num
ar de
multe cazuri la valoarea lui unde dL(
d
b
cazuri, estimarea de verosimilitate maxima (EVM) a lui bazat
a pe valorile
de selectie x1 ; x2 ; :::; xn poate determinat
a din
dL x1 ; x2 ; :::; xn ; b
db

102

= 0:

Dup
a cum am v
azut mai sus, functia L este n forma unui produs de functii
de . Deoarece L este ntotdeauna nenegativ
a si si atinge maximul pentru
aceeasi valoare a lui b ca ln L, iar ln L este n form
a de sum
a, este n general
mai usor s
a obtinem EVM b rezolvnd
d ln L x1 ; x2 ; :::; xn ; b

= 0;
db
numit
a ecuatia de verosimilitate.
Solutia dorit
a este una unde r
ad
acina b este o functie de x1 ; x2 ; :::; xn ,
dac
a astfel de r
ad
acin
a exist
a. Cnd exist
a mai multe r
ad
acini ale ecuatiei
de verosimilitate, EVM este r
ad
acina corespunz
atoare maximului global al lui
L sau ln L.
n cazul a m parametri, functia de verosimilitate devine
L (x1 ; x2 ; :::; xn ;
si EVM pentru
verosimilitate

1 ; :::; m

1 ; :::; m ) ;

sunt obtinuti rezolvnd sistemul de ecuatii de

@ ln L
= 0; j = 1; 2; :::; m:
@bj

Revenind la cazul unui singur parametru, s


a reprezent
am solutia ecuatiei de
verosimilitate prin
b = h (x1 ; x2 ; :::; xn ) :
Atunci estimatorul de verosimilitate maxima (EVM) b pentru este
b = h (X1 ; X2 ; :::; Xn ) :
Proprietatea 1: consistenta si ecienta asimptotica. Fie b EVM pentru
din densitatea f (x; ) pe baza unei selectii de m
arime n. Atunci EVM b este
consistent si asimptotic ecient.
Un rezultat analog se obtine cnd populatia X este discret
a. Mai mult,
repartitia lui b tinde la o repartitie normal
a cnd n ! 1.
Proprietatea 2: proprietatea de invarianta. Dac
a b este EVM pentru ,
atunci EVM pentru g ( ) este g b , unde g este presupus
a bijectiv
a si derivabil
a
n raport cu .
P
De exemplu, dac
a c este EVM pentru deviatia standard n o repartitie,
P2
atunci EVM pentru dispersia 2 este c :

Exemplu. Pentru repartitia N (m; 2 ), s


a se determine EVM pentru
si 2 = 2 .
R. Avem
h
i
(x m)2
1
f x; m; 2 =
exp
, x 2 R:
1
2 2
(2 ) 2

Functia de verosimilitate este


n
h
Y
1
L x1 ; :::; xn ; m; 2 =
exp
1
j=1

(2 ) 2

103

(xj m)2
2 2

=m

exp 4

1
1

(2 ) 2

ln L =

n
X

1
2

n
X

2
m) 5 =)

(xj

j=1

(xj

1
2 n ln 2

1
2 n ln 2

1
2 n ln 2

1
2 n ln

m)

j=1

Fie

= m,

ln L =

1
2 2

@ ln L
@ 1
@ ln L
@ 2

=
=

1
2

2
=)
2 =
n
X
2
(xj
1)

j=1
n
X

(xj

j=1
n
X

1
2 22

1) ;

2
1)

(xj

n
2 2:

j=1

Sistemul de verosimilitate
este
8
n
n
X
X
>
1
1
>
b
b
>
( @ ln L
x
=
0
=)
=
xj ;
j
1
1
>
n
< b2
=0
b
j=1
j=1
@ 1
()
n
n
@ ln L
X
X
2
=0
>
>
n
@b2
b2 = 1
b1
> 12
=
0
=)
xj
x
>
j
n
: 2b2
2b2
j=1

j=1

EVM pentru m si 2 sunt


n
X
b1 = 1
Xj = X;
n

b1

j=1

b2 =

1
n

n
X

Xj

n 1 2
n S :

j=1

X estimator ecient pentru m =) b 1 estimator ecient pentru m =) b 1


asimptotic ecient pentru m.
9
=
E b1 = E X = m ! m
teorem a 8.2 b
n!1
=)
1 estimator consistent pen2
b
;
var
! 0
1 = var X = n
n!1
tru m.
E b 2 = nn 1 E S 2 = nn 1 2 6= 2 =) b 2 este estimator deplasat pentru
2

E b2

n!1

var b 2 =

n 1 2
n

var S

b 2 estimator consistent pentru


E b2 ! 2
n!1
M IRC
= lim
n!1 var ( b 2 )
n!1
2

lim

=
2

2 4
n
2 4 (n 1)
n2

n 1 2 2 4
n
n 1

= lim

n!1 n 1

9
>
=

=1 >
;

(n 1)
!
n2
n!1

9
=

0 ;

teorem a 8.2

=)

=) b 2 estimator asimp-

totic ecient pentru :


Exemplu. Presupunem c
a populatia X are o repartitie uniform
a pe intervalul (0; ). Vrem s
a determin
am EVM pentru .

104

Avem
1

f (x; ) =

, pentru 0
0, altfel.

(8.2)

Functia de verosimilitate devine


L (x1 ; x2 ; :::; xn ; ) =

xi

; 8i:

(8.3)

Gracul lui L este dat n gura urm


atoare.

Observ
am c
a toate valorile selectiei xi trebuie s
a e mai mici sau egale cu
, implicnd c
a doar portiunea curbei de la dreapta lui max (x1 ; x2 ; :::; xn ) este
aplicabil
a. De aici, maximul lui L apare n = max (x1 ; x2 ; :::; xn ), sau EVM
pentru este
b = max (x1 ; x2 ; :::; xn ) ;

(8.4)

b = max (X1 ; X2 ; :::; Xn ) = X(n) :

(8.5)

si estimatorul de verosimilitate maxim


a pentru

este

Observ
am c
a nu am obtinut relatia (8.4) rezolvnd ecuatia de verosimilitate.
Ecuatia de verosimilitate nu se aplic
a n acest caz deoarece maximul lui L apare
la frontier
a si derivata nu este 0 acolo.
105

Studiem unele propriet


ati ale lui b dat de relatia (8.5). Densitatea lui b
este (vezi subsectiunea 5.6)
n
f b (x) = nFX

(x) fX (x) :

Cu fX (x) din relatia (8.2) si (din relatia (5.2), pentru a = 0 si b = )


8
< 0, pentru x < 0;
x
, pentru 0 x
;
FX (x) =
:
1, pentru x > ;
avem
nxn

, pentru 0
0, altfel.

Media si dispersia lui b sunt


Z 1
Z
E b =
xf b (x) dx =

n
n+1

var b
Z
x2

n+2

2n
(n+1)2

E b =
E b

n
n+1

n!1h

var b =

E b

n
x+
2 n+1

n
(n+1)2

6=

n
n+1

=n

f b (x) =

nxn

dx =

0
2

xn
h

f b (x) dx =
1

dx =

1
n+2

n
(n+1)2

xn dx =

xn+2
n+2

n
n+1

n
2 n+1
n
(n+1)2 (n+2)

xn+1
n+1 j0

nxn

xn+1
n+1

dx =

n
n+1

=) b este deplasat.
9
=
teorem a 8.2 b
i
=)
estimator consistent.
2
n
;
!
0
2

(n+1) (n+2)

n!1

106

xn
n

j0 =

9.1

Estimarea parametrilor reparti


tiei normale N (m;
estimatori punctuali, intervale de estimare (de
ncredere)
Estimatori punctuali

n sectiunea precedent
a am considerat estimarea parametrilor repartitiei normale prin metoda verosimilit
atii maxime.
9.1.1

Metoda momentelor

Metoda momentelor a fost propus


a de Pearson n 1894.
Consider
am o densitate f (x; 1 ; 2 ; :::; m ) pentru care parametrii j ; j =
1; 2; :::; m sunt de estimat pe baza unei selectii X1 ; X2 ; :::; Xn a lui X. Momentele
teoretice ale populatiei X sunt
Z 1
xi f (x; 1 ; :::; m ) dx; i = 1; 2; :::.
i =
1

Ele sunt, n general, functii de parametrii necunoscuti, adic


a
i

( 1;

2 ; :::; m ) :

Momentele de selectie sunt


n

Mi =

1X i
X ;
n j=1 j

i = 1; 2; :::.

Metoda momentelor sugereaz


a c
a, pentru a determina estimatorii b 1 ; :::; b m
din selectie, egal
am un num
ar sucient de momente de selectie cu momentele
corespunz
atoare ale populatiei. Procedura determin
arii lui b 1 ; :::; b m const
a n
urm
atorii pasi:
Pasul 1: e

b 1 ; :::; b m = Mi ;

i = 1; 2; :::; m.

(9.1)

Acestea sunt m ecuatii de moment cu m necunoscute b 1 ; :::; b m .

Pasul 2: rezolv
a acest sistem de ecuatii, determinnd b 1 ; :::; b m , numiti
estimatorii de moment pentru 1 ; :::; m .

Nu este necesar s
a consider
am m ecuatii de moment consecutive ca n relatia
(9.1); orice m ecuatii de moment convenabile care conduc la b 1 ; :::; b m sunt
suciente. Ecuatiile momentelor de ordin mai mic sunt totusi preferate deoarece
cer o mai mic
a manipulare a datelor observate.

107

):

Exemplul 9.1. Alegem repartitia normal


a ca model pentru randamentul
procentual discutat n capitolul 7, adic
a
#
"
2
1
(x m)
2
f x; m;
= p exp
; x 2 R:
2 2
2
Estim
am parametrii 1 = m si 2 = 2 pe baza celor 200 de valori ale selectiei
date n tabel.
Urmnd metoda momentelor, avem nevoie de 2 ecuatii de moment, si cele
mai convenabile sunt
1

= M1 = X;

si
2

= M2 :

Avem
=

1:

De aici, prima dintre aceste ecuatii de moment d


a
n

X
b1 = X = 1
Xj :
n j=1

(9.2)

Propriet
atile acestui estimator au fost discutate n capitolul precedent. El este
nedeplasat si are dispersie minim
a ntre toti estimatorii nedeplasati pentru m.
Ecuatia momentului de ordinul 2 d
a
n

X
b 21 + b 2 = M2 = 1
X 2;
n j=1 j

sau
b 2 = M2

M12 =

j=1

1
n

j=1

Deci

n
X

Xj2

X :

j=1

Pe de alt
a parte
n
X
1
Xj X
n
0
n
X
@
Xj2

1
n

1
n

n
X

Xj2

2Xj X + X

j=1

2
2XnX + nX A =

1
n

n
X

Xj2

1
n

0
@

n
X
j=1

Xj2

2X

n
X
j=1

Xj + nX A =

X :

j=1

X
b2 = 1
Xj
n j=1
108

(9.3)

Acesta, dup
a cum am ar
atat, este un estimator deplasat pentru 2 .
Estim
arile b1 si b2 ale lui 1 = m si 2 = 2 pe baza valorilor selectiei date
de tabel sunt, urmnd relatiile (9.2) si (9.3)
200

b1

unde xj ;

9.2

b2

1 X
xj ' 70;
200 j=1
200

1 X
xj
200 j=1

b1

' 4;

j = 1; 2; :::; 200 sunt valorile de selectie din tabelul din capitolul 7.

Intervale de ncredere

Exemplul 9.2. 5 valori de selectie 3; 2; 1; 5; 0; 5; 2; 1 sunt observate dintr-o


repartitie normal
a avnd o medie necunoscut
a m si o dispersie cunoscut
a 2 = 9.
EVM al lui m este media de selectie X si deci,
1
(3 + 2 + 1; 5 + 0; 5 + 2; 1) = 1; 82:
(9.4)
5
Vrem s
a determin
am margini ale unui interval astfel nct, cu un nivel de
ncredere specicat, media adevarat
a m s
a e n acest interval. X, ind sum
a
de variabile aleatoare normale, este normal
a cu
E X = m;
2
var X = n = 59 :
Variabila aleatoare standardizat
a
p
X E X
5 X m
U= q
=
(9.5)
3
var X
m
b =

este N (0; 1) si are densitatea

1
fU (x) = p e
2

x2
2

(9.6)

Presupunem c
a cerem ca P ( u1 < U < u1 ) = 0; 95: Determin
am u1 .
Z u1
Z u1
Z
0; 95 = P ( u1 < U < u1 ) =
fU (x) dx =
fU (x) dx
u1

(u1 )
( u1 ) =
(u1 ) (1
(u1 )) = 2 (u1 ) 1 )
= 0; 975:
(u1 ) = 0;95+1
2
Din tabelul valorilor functiei rezult
a u1 = 1; 96 si
P ( 1; 96 < U < 1; 96) =

109

u1

fU (x) dx =
1

1;96

fU (x) dx = 0; 95
1;96

(9.7)

)P

1; 96 <

0; 95 )
P
2; 63 < X

5(X m)
3

< 1; 96

= 0; 95 ) P

m < 2; 63 = 0; 95 ) P
P X

5; 88 <

2; 63 < m

2; 63 < m < X + 2; 63 = 0; 95:

5 X

m < 5; 88 =

X < 2; 63 = 0; 95 )
(9.8)

Intervalul de 95% ncredere pentru m este X 2; 63; X + 2; 63 : Folosind relatia (9.4), intervalul de 95% ncredere pentru m estimat pe baza observatiilor
este (m
b 2; 63; m
b + 2; 63) = (1; 82 2; 63; 1; 82 + 2; 63) = ( 0; 81; 4; 45), adic
a
P ( 0; 81 < m < 4; 45) = 0; 95:

(9.9)

Probabilitatea ca intervalul aleator X 2; 63; X + 2; 63 s


a contin
a adev
arata medie m a repartitiei este 0; 95, iar relatia (9.9) d
a intervalul observat
bazat pe valorile date ale selectiei.
Deni
tie. Presupunem c
a o selectie X1 ; X2 ; :::; Xn este extras
a dintr-o
populatie avnd densitatea f (x; ), ind parametrul de estimat. Mai departe
presupunem c
a L1 (X1 ; :::; Xn ) si L2 (X1 ; :::; Xn ) sunt dou
a statistici astfel nct
L1 < L2 cu probabilitatea 1. Intervalul (L1 ; L2 ) este numit un interval de
ncredere [100 (1
)] % pentru dac
a L1 si L2 pot alese astfel nct
P (L1 <

< L2 ) = 1

(9.10)

Limitele L1 si L2 sunt numite, respectiv, limitele inferioara si superioara de


ncredere pentru , si 1
este numit coecientul de ncredere. Valoarea lui
1
este luat
a n general 0; 9; 0; 95; 0; 99; 0; 995 sau 0; 999.
Interval de ncredere pentru m n N m; 2 cu 2 cunoscut Intervalul
de ncredere dat de relatia (9.8) estimeaz
a media unei populatii normale cu
dispersie cunoscut
a. n termeni generali, procedura arat
a c
a nti determin
am
un interval simetric n U pentru a obtine un coecient de ncredere de 1
.
Notnd cu u =2 valoarea lui U de la care aria de sub fU (u) este =2, adic
a
P U > u =2 = =2 (vezi gura urm
atoare), avem
P

=2

<U <u

110

=2

=1

(9.11)

De aici, folosind transformarea dat


a de relatia (9.5), avem rezultatul general
P

u
p

=2

u
<m<X+ p

=2

=1

(9.12)

Acest rezultat poate de asemenea folosit pentru a estima medii ale populatiilor
nenormale cu dispersii cunoscute dac
a m
arimea selectiei este sucient de mare
pentru a justica folosirea teoremei limit
a central
a.
n acest caz, pozitia intervalului este o functie de X si de aceea este o functie
de selectie. n contrast, m
arimea intervalului,
este o functie doar de m
arimea
p
selectiei n, ind invers proportional
a cu n.
Intervalul de ncredere [100 (1
)] % pentru m dat de relatia (9.12) d
a de
asemenea o estimare a acuratetei estimatorului punctual X pentru m. Dup
a
cum vedem din gura urm
atoare, adev
arata medie m se aa n intervalul indicat
cu [100 (1
)] % ncredere.

111

Deoarece X este centrul intervalului, distanta dintre X si m poate cel mult


egal
a cu jum
atate din m
arimea intervalului.
Teorema 9.1. Cu [100 (1
)] % ncredere, eroarea folosirii estimatorului
X pentru m este mai mic
a dect
u
p

=2

Exemplul 9.3. Fie populatia X repartizat


a normal cu dispersia cunoscut
a
. Determinati m
arimea minim
a n a selectiei de care e nevoie, astfel nct
eroarea estim
arii mediei m prin X s
a e mai mic
a dect o cantitate specicat
a
" cu [100 (1
)] % ncredere.
2

Folosind teorema 9.1, m


arimea minim
a a selectiei trebuie s
a satisfac
a
u
"= p

=2

De aici, solutia este


n=

u =2
"

(9.13)

Interval de ncredere pentru m n N m; 2 cu 2 necunoscut Diferenta


dintre aceast
a problem
a si precedenta este c
a, deoarece nu este cunoscut, nu
mai putem folosi
1

U= X

ca variabila aleatoare pentru calculul limitelor de ncredere privind media m.


Folosim dispersia de selectie S 2 ca un estimator nedeplasat pentru 2 si
consider
am variabila aleatoare
Y = X

S
p
n

(9.14)

Variabila aleatoare Y este acum o functie de variabilele aleatoare X si S. Determin


am repartitia lui Y:

112

Teorema 9.2. (Reparti


tia t a lui Student) Consider
am o variabil
a
aleatoare T denit
a prin
1
2
V
T =U
:
(9.15)
n
Dac
aU
N (0; 1), V este repartizat
a 2 cu n grade de libertate, iar U si V
sunt independente, atunci densitatea lui T are forma
fT (t) =

n+1
2
n
2

n+1
2

t2
n

1+

t 2 R:

(9.16)

Aceast
a repartitie este cunoscut
a ca repartitia t a lui Student cu n grade de
libertate; este numit
a dup
a W. S. Gosset, care a folosit pseudonimul "Student"
n publicatiile sale de cercetare.
Dup
a cum se vede din relatia (9.16), repartitia t este simetric
a n jurul
originii. Cnd n creste, ea tinde la o repartitie normal
a standard.
ntorcndu-ne la variabila aleatoare Y denit
a de relatia (9.14), e
1

U= X

si
V =

1) S 2

(n

Atunci
Y =U

1
2

V
n

(9.17)

unde U
N (0; 1), iar V are repartitia 2 cu (n 1) grade de libertate (vezi
teorema 7.1). Mai departe, se poate ar
ata c
a X si S 2 sunt independente, deci
si U si V sunt independente. Din teorema 9.2, variabila aleatoare Y are astfel
o repartitie t cu (n 1) grade de libertate.
Variabila aleatoare Y poate folosit
a pentru a stabili intervale de ncredere
pentru media m. Valoarea lui Y depinde de media necunoscut
a m, dar repartitia
lui Y nu depinde de m.
Repartitia t este tabelat
a n tabelul A.4 urm
ator.

113

Fie tn;

=2

valoarea astfel nct


P T > tn;

=2

cu n reprezentnd num
arul de grade de libertate (vezi gura urm
atoare).

114

Avem
P

tn

1; =2

< Y < tn

1; =2

=1

(9.18)

nlocuind Y din relatia (9.14) n relatia (9.18), un interval de ncredere [100 (1


pentru media m este dat de
P

tn

1; =2 S

<m<X+

tn

1; =2 S

=1

(9.19)

Deoarece X si S sunt functii de selectie, att pozitia ct si m


arimea intervalului
dat mai sus variaz
a de la selectie la selectie.
Exemplul 9.4. Presupunem c
a nivelul anual al c
aderilor de z
apad
a n zona
Bufallo este repartizat normal. Folosind nregistr
arile c
aderilor de z
apad
a din
1969-1970 pn
a n 1978-1979 din tabelul urm
ator, s
a se determine un interval
de ncredere 95% pentru media m.

115

)] %

n acest exemplu

= 0:05, n = 10, media de selectie observat


a este

1
(120:5 + 97 + ::: + 97:3) = 112:4;
10
si dispersia de selectie observat
a este
i
h
1
2
2
2
s2 =
(120:5 112:4) + (97 112:4) + ::: + (97:3 112:4) = 1414:3:
9
x=

Din tabelul A.4 g


asim t9;0:025 = 2:262. nlocuind aceste valori n relatia (9.19),
obtinem
P (85:5 < m < 139:3) = 0:95:

Interval de ncredere pentru 2 n N m; 2


Un estimator punctual nedeplasat pentru dispersia 2 a populatiei este S 2 . Pentru construirea intervalelor
de ncredere pentru 2 , folosim variabila aleatoare
D=

1) S 2

(n

(9.20)

care are repartitie chi-p


atrat cu (n 1) grade de libertate (teorema 7.1). Notnd
2
valoarea
astfel
nct P D > 2n; =2 = =2 cu n grade de libertate,
n; =2
putem scrie (vezi gura urm
atoare)
2
n 1;1 ( =2)

<D<

2
n 1; =2

=1

(9.21)

care d
a, nlocuind D din relatia (9.20),
P

(n

1) S 2

2
n 1; =2

<

<

(n

1) S 2

2
n 1;1 ( =2)

116

=1

(9.22)

Tabelul A.5 d
a valori ale lui

2
n;

pentru diferite valori ale lui n si .

117

Relatia (9.22) este folosit


a pentru construirea intervalelor de ncredere pentru 2
cu ambele margini nite pentru o populatie normal
a. Un interval de ncredere
pentru 2 cu o singur
a margine nit
a este dat de (vezi gura urm
atoare)
!
(n 1) S 2
2
P
>
=1
:
(9.23)
2
n 1;

118

Exemplul 9.5. Determin


am intervalele de ncredere 95% pentru
datele din exemplul 9.4.
Am v
azut n exemplul 9.4 c
a dispersia de selectie observat
a este
s2 = 1414:3:
Din tabelul A.5 obtinem
2
9;0:975

2
9;0:025

= 2:7;

= 19:023;

Relatiile (9.22) si (9.23) cu n = 10 si


P 669:12 <

= 0:05 conduc la
< 4714:33 = 0:95

si
P

2
9;0:05

> 752:3 = 0:95:

119

= 16:919:

pentru

10

10.1

Modele liniare. Estimarea parametrilor prin


metoda celor mai mici p
atrate. Elemente de
analiz
a discriminant
a liniar
a
Regresie liniar
a

Presupunem c
a variabila aleatoare Y este o functie de o variabil
a independent
a
si relatia lor este liniar
a, adic
a
E (Y ) =

+ x:

(10.1)

Constantele si sunt necunoscute si trebuie estimate dintr-o selectie de


valori ale lui Y cu valorile asociate lor ale lui x. ntr-un singur experiment, x
va avea o anumit
a valoare xi si media lui Y va lua valoarea
E (Yi ) =

+ xi :

(10.2)

Denim variabila aleatoare E prin


E=Y

( + x) :

(10.3)

Modelul de regresie liniara simpla este


Y =

+ x + E;

(10.4)

unde E are media 0 si dispersia 2 , care coincide cu dispersia lui Y . Valoarea


lui 2 este necunoscut
a n general, dar este presupus
a a constant
a si nu o
functie de x.
Parametrii necunoscuti si sunt numiti coecienti de regresie, iar variabila
aleatoare E reprezint
a deviatia lui Y n jurul mediei.
10.1.1

Estimarea prin metoda celor mai mici p


atrate

Estim
arile b si b prin metoda celor mai mici p
atrate pentru parametrii de
regresie si sunt alese astfel nct suma p
atratelor diferentelor dintre valorile
de selectie observate yi si b + b xi , valoarea medie estimat
a a lui Y , este minim
a.
Fie
ei = yi

b + b xi ; i = 1; n:

Estim
arile b si b sunt g
asite minimiznd
Q=

n
X
i=1

e2i =

n h
X

yi

i=1

b + b xi

(10.5)

i2

(10.6)

Perechile valorilor de selectie sunt (x1 ; y1 ) ; :::; (xn ; yn ), iar ei , i = 1; 2; :::; n se


numesc reziduuri. Figura urm
atoare d
a o prezentare grac
a a acestei proceduri.

120

Vedem c
a reziduurile sunt distantele verticale dintre yi , valorile observate ale
lui Y , si estimarea b + b x a adev
aratei drepte de regresie + x.
Teorema 10.1. Fie modelul de regresie liniar
a simpl
a dat de relatia (10.4).
Fie (x1 ; y1 ) ; (x2 ; y2 ) ; :::; (xn ; yn ) valorile de selectie observate ale lui Y cu valorile
asociate ale lui x. Presupunem c
a cel putin 2 dintre x1 ; :::; xn sunt distincte.
Atunci estim
arile prin metoda celor mai mici p
atrate ale lui si sunt
b=y

b=
unde

n
X

(xi

b x;

(10.7)

x) (yi

y)

i=1

n
X

;
(xi

i=1

121

x)

(10.8)

1X
x=
xi
n i=1

si

1X
y=
yi :
n i=1

Demonstra
tie. Fie
n h
X
Q b; b =
yi
@Q
@b
@Q
@b

i=1
n
X

i=1
n
X

i=1
@2Q
@ b2
@2Q
@ b@ b

n
X

4n

i=1

x2i

(xi
0

HQ = @

=)

b + b xi

2xi ( 1) = 2
2xi ( xi ) = 2

n
X

i=1
n
X

xi = 2nx;
x2i ;

i=1

@2Q
@ b@ b
@2Q
2
@b

2nx

i=1

n
X

b + b xi

i2

2 ( 1) = 2n > 0;

i=1
n
X

D=
4n

h
2xi yi

@2Q
@ b@ b

@2Q
2
@b

h
2 yi

i=1
n
X

@2Q
@ b2

i=1

n
X

b + b xi

= 4n
1
n

n
X

@2 Q
>0
@ b2

x2i

i=1
n
X

xi +

i=1

n
X

nx

x2

i=1

= 4n

= 4n

n
X

x2i

2nx + nx

i=1

n
X

x2i

2xxi + x2 =

i=1

x) > 0 =)
1
2
2

@ Q
@ b2
@2Q
@ b@ b

@ Q
@ b@ b
@2Q
2
@b

A pozitiv denit
a =) Q (strict) convex
a =) b si b

care minimizeaz
a pe Q sunt solutia sistemului
8
n
n
X
X
>
b
>
(
nb
+
x
=
yi
>
i
@Q
<
@b = 0
i=1
i=1
()
()
@Q
n
n
n
X
X
X
=0
>
>
@b
>
xi + b
x2i =
xi yi
: b
i=1

i=1

i=1

nb + nx b = ny

nxb + b

n
X

x2i =

i=1

122

n
X
i=1

xi yi :

(10.9)
(10.10)

Ecuatiile din ultimul sistem se numesc ecuatii normale. nmultind (10.9) cu


x si sc
aznd-o din (10.10) )
n
n
n
n
n
X
X
X
X
X
xi yi nxy

b = i=1n
X
X

xi yi x

vezi calculul lui D

x2i

i=1

i=1

i=1

(xi x)

xy

i=1

(xi x)(yi y)

i=1

(xi x)2

xi +

i=1

i=1

[yi (xi x) y(xi x)]


n
X

nx2

yi y

i=1
n

i=1

n
X

:
(xi x)2

i=1

Din (10.9) )
b = y xb:
Restabilim rezultalele de mai sus folosind o notatie matriceal
a care usureaz
a
calculele si permite generaliz
ari cnd consider
am modele mai generale de regresie.
n termeni de valori de selectie observate (x1 ; y1 ) ; (x2 ; y2 ) ; :::; (xn ; yn ), avem
sistemul de ecuatii de regresie observate
yi =
Fie

si

B
B
C=B
@

1
1
..
.

x1
x2
..
.

1 xn

+ xi + ei ;
1

C
C
C;
A

B
B
y=B
@
=

i = 1; 2; :::; n:
1

y1
y2
..
.

C
C
C;
A

yn

B
B
e=B
@

(10.11)
e1
e2
..
.
en

C
C
C;
A

Ecuatiile (10.11) se scriu echivalent


y = C + e:

(10.12)

Suma p
atratelor reziduurilor dat
a de relatia (10.6) este acum
Q ( ) = eT e = (y

C ) (y

C ):

(10.13)

Estimarea prin metoda celor mai mici p


atrate a lui , b, este g
asit
a minimiznd Q. Deoarece
rQ ( ) = 2C T (y C )
si
HQ ( ) = 2C T C
este pozitiv denit
a, solutia b este obtinut
a din
rQ b = 0;
123

deci din ecuatia normal


a
C b = 0;

CT y
sau

(10.14)

C T C b = C T y;

care d
a

b = CT C

C T y:

(10.15)

n cele de mai sus, matricea HQ ( ) este pozitiv denit


a si inversa matricei C T C
exist
a dac
a sunt cel putin 2 valori distincte xi n selectie.
Veric
am c
a relatia (10.15) este identic
a cu relatiile (10.7) si (10.8) observnd
c
a
0
1
1
0
1 x1
n
nx
B 1 x2 C
n
1
1 ::: 1
C
B
C B
CT C =
B ..
C = @ nx X x2 A ;
.
.
x1 x2 ::: xn @ .
i
. A
i=1

1 xn

CT C

1
CT C
det C T C

=
n

n
X

1
x1

1
x2

0
B
B
B
@

::: 1
::: xn

si

b = CT C
0

n
X

C y=

n@

xi yi nxy

B
i=1
B y
x
n
B
X
B
2 nx2
x
B
i
B
i=1
B X
n
B
B
(x x)(yi y)
B i=1 i
B
n
X
@
(xi x)2

i=1

n
X
i=1

B
1 @

x2i nx2 A

n
X

nx2

x2i

i=1

CT y =

y1
y2
..
.
yn

124

nx

nx C
A;
n

B
B
B
B
ny
B
n
nx C B X
C B
=B
A@
A
xi yi
B
B
n
i=1
B
B
@

nx

y)

i=1

i=1

10

i=1

C 0
C
y bx
C
n
C B X
C B
(xi x)(yi
C B
C = B i=1
C B
n
X
C @
C
(xi x)2
C
i=1
A

x2i

1
0
ny
C
n
C
C B X
C=@
xi yi A
A

x2i

!B
@

n
X

C
C
C
C:
C
A

n
X

x2i x

i=1

n
X

n
X

xi yi

i=1

x2i nx2

i=1
n

xi yi nxy

i=1
n

X
i=1

x2i nx2

C
C
C
C
C
C
C=
C
C
C
C
A

Exemplul 10.1. Este de asteptat ca randamentul procentual mediu, Y ,


dintr-un proces chimic s
a e legat liniar de temperatura procesului, x, n C.
Determinati prin metoda celor mai mici p
atrate dreapta de regresie pentru E (Y )
pe baza a 10 observatii date n tabelul
i
x ( C)
y

1
45
43

2
50
45

3
55
48

4
60
51

5
65
55

6
70
57

7
75
59

8
80
63

9
85
66

10
90
68

R. Pentru a folosi relatiile (10.7) si (10.8) avem nevoie de urm


atoarele cantit
ati
n

x=

1X
1
5 135
xi =
(45 + 50 + ::: + 90) =
= 67; 5;
n i=1
10
10
n

y=

1
1X
yi =
(43 + 45 + ::: + 68) = 55; 5;
n i=1
10
n
X

(xi

x) = 2062; 5;

i=1

n
X

(xi

x) (yi

y) = 1182; 5:

i=1

nlocuirea acestor valori n relatiile (10.7) si (10.8) d


a

b=

n
X

(xi

x) (yi

y)

i=1

b=y

n
X

=
(xi

x)

1182; 5
' 0; 57;
2062; 5

i=1

b x ' 55; 5

0; 57 67; 5 ' 17; 03:

Deci dreapta de regresie estimat


a are ecuatia y = 17; 03 + 0; 57x si este
ar
atat
a mpreun
a cu valorile selectiei observate n gura urm
atoare.

125

Relatiile de regresie sunt valabile doar pentru intervalul valorilor x reprezentate de date. Astfel, dreapta de regresie estimat
a n exemplul 10.1 e valabil
a
doar pentru temperaturi ntre 45 C si 90 C. Extrapolarea rezultatului n afara
acestui interval poate conduce la greseli si nu este valabil
a n general.
Analiza regresiei liniare ca cea f
acut
a n exemplul 10.1 este bazat
a pe presupunerea c
a adev
arata relatie ntre E (Y ) si x este liniar
a. Dac
a relatia este
neliniar
a sau inexistent
a, regresia liniar
a produce rezultate f
ar
a sens, chiar dac
a
o linie dreapt
a pare s
a dea o bun
a potrivire a datelor.
10.1.2

Propriet
a
tile estimatorilor prin metoda celor mai mici p
atrate

b si B,
b estimatorii prin metoda celor mai mici p
Fie A
atrate pentru , respectiv
si e
!
b
A
b =
:
(10.16)
b
B
Din relatia (10.15) avem

unde

b = CT C

C T Y;

(10.17)

1
Y1
B
C
Y = @ ... A ;
(10.18)
Yn
si Yj ; j = 1; 2; :::; n, sunt independente si identic repartizate n concordanta cu
relatia (10.4). Astfel, dac
a scriem
Y =C + E;
126

(10.19)

atunci E este un vector aleator cu media 0 si matricea de covarianta


I ind matricea unitate de ordinul n.
Din relatiile (10.17) si (10.19), avem
E b

= CT C

C T E (Y) = C T C

C T [C +E (E)] = C T C

I,

CT C =
(10.20)

b si B
b pentru , respectiv , sunt nedeplasati.
De aici, estimatorii A
Matricea de covarianta asociat
a cu b este dat
a de, dup
a cum rezult
a din
1
T
este simetric
a,
relatia (10.17) si lema 3.1, deoarece C C
cov b

=E

Dar cov (Y) =


cov b

= CT C

C T cov (Y) C C T C

I; astfel, avem

CT C

CT C CT C

CT C

(10.21)

b si
Elementele de pe diagonala matricei din relatia (10.21) dau dispersiile lui A
b n termeni de elementele lui C, putem scrie
B.
2

b =
var A

n
X

x2i

i=1

n
X

(xi

(10.22)

x)

i=1

b =
var B

2
n
X

(10.23)
(xi

x)

i=1

Se vede c
a aceste dispersii descresc cnd m
arimea selectiei n creste. Astfel,
rezult
a din capitolul 8 c
a acesti estimatori sunt consistenti. Pentru un n xat,
b poate redus
dispersia lui B
a selectnd xi -urile astfel nct numitorul relatiei
(10.23) este maximizat; asta poate f
acut mpr
astiind xi -urile ct mai departe
posibil. n exemplul 10.1, presupunnd c
a suntem liberi s
a alegem valorile lui
xi , calitatea lui b este mbun
at
atit
a dac
a jum
atate din citirile x sunt luate la
o extrem
a a intervalului temperaturii si cealalt
a jum
atate la cealalt
a extrem
a.
b pentru un n xat este de a
Strategia de selectie pentru minimizarea var A
face x pe ct posibil ct mai aproape de 0.
Sunt dispersiile date de relatiile (10.22) si (10.23) dispersii minime ntre
dispersiile estimatorilor nedeplasati pentru si ? Un r
aspuns la aceast
a ntrebare poate aat comparnd rezultatele date de relatiile (10.22) si (10.23)
cu marginile inferioare Rao-Cramer denite n sectiunea 8.1.2. Pentru a evalua
aceste margini, repartitia lui Y trebuie s
a e cunoscut
a. Totusi, f
ar
a a cunoaste
repartitia lui Y , se poate ar
ata c
a tehnica celor mai mici p
atrate conduce la
127

estimatori liniari nedeplasati de dispersie minima, adic


a, dintre toti estimatorii
nedeplasati care sunt liniari n Y, estimatorii prin metoda celor mai mici p
atrate
au dispersie minim
a.
Teorema 10.2. Fie variabila aleatoare Y denit
a n relatia (10.4). Fiind
dat
a o selectie (x1 ; Y1 ) ; (x2 ; Y2 ) ; :::; (xn ; Yn ) a lui Y cu valorile x asociate, estib si B
b dati de relatia (10.17) sunt
matorii prin metoda celor mai mici p
atrate A
estimatori liniari nedeplasati de dispersie minima pentru , respectiv .
Demonstra
tie. Consider
am un estimator liniar nedeplasat de forma
h
i
1 T
= CT C
C + G Y:
(10.24)
Vrem s
a ar
at
am c
a dac
a
are dispersie minim
a, atunci G = 0.
Datorit
a relatiei (10.19), cerinta de nedeplasare conduce la
GC = 0:

(10.25)

Consider
am acum matricea de covarianta
cov (

)=E (

)(

(10.26)

Folosind relatiile (10.19), (10.24), (10.25) si lema 3.1, avem


h
i
1
cov ( ) = 2 C T C
+ GGT :

Pentru a minimiza dispersiile asociate cu componentele lui


, trebuie s
a
minimiz
am ecare element diagonal al lui GGT . Deoarece elementul diagonal
ii al lui GGT este dat de
n
X
2
GGT ii =
gij
;
j=1

unde gij este elementul ij al lui G, trebuie s


a avem
gij = 0; 8i; j
si obtinem
G = 0:

(10.27)

Teorema de mai sus este un caz special al teoremei Gauss-Markov.


Alt
a comparatie interesant
a este cea dintre estimatorii prin metoda celor
mai mici p
atrate pentru si si estimatorii lor de verosimilitate maxim
a cu o
repartitie cunoscut
a pentru variabila aleatoare Y . Se poate ar
ata c
a estimatorii
de verosimilitate maxim
a pentru si sunt identici cu cei prin metoda celor
mai mici p
atrate sub ipoteza suplimentar
a c
a Y este repartizat
a normal.

128

11

Regresie liniar
a simpl
a. Estimarea parametrilor
prin metoda celor mai mici p
atrate. Intervale de ncredere pentru parametrii de regresie

11.1

Estimator nedeplasat pentru

Metoda celor mai mici p


atrate nu conduce la un estimator pentru dispersia 2
a lui Y , care este n general de asemenea o cantitate necunoscut
a n modelele
de regresie liniar
a. O alegere intuitiv
a pentru un estimator pentru 2 este
c2 = k

n h
X

i2

b + Bx
b i
A

Yi

i=1

(11.1)

unde coecientul k este ales astfel nct c2 este nedeplasat. Pentru a calcula
media lui c2 , observ
am c
a (vezi relatia (10.7))
Yi

b
A

b i = Yi
Bx

b
Bx

n
X

De aici rezult
a
n
X

Yi

i=1

b
A

b i
Bx

b i = Yi
Bx
Y

Yi

b2
B

i=1

deoarece (vezi relatia (10.8))


n
X

(xi

b
Y =B

x) Yi

i=1

Se poate ar
ata c
a
E c2 = kE

n
X

Yi

i=1

De aici, c2 este nedeplasat pentru k =


c2 =

n h
X

b2
B

129

x) :

(11.2)

(xi

x) ;

(11.3)

i=1

(xi

x) :

(11.4)

i=1

(xi

x)

= k (n

2)

ind dat de
b + Bx
b i
A

Yi

n
X

i=1

1
n 2,

i=1

sau, datorit
a relatiei (11.3),
" n
X
c2 = 1
Yi
n 2 i=1

n
X

n
X

b (xi
B

b2
B

n
X
i=1

i2

(xi

(11.5)

x)

(11.6)

Exemplul 11.1. Pentru datele din exemplul 10.1, s


a se determine o estimare
nedeplasat
a pentru 2 .
Am obtinut n exemplul 10.1
n
X

x) = 2062; 5;

(xi

i=1

n plus, obtinem

n
X

b = 0; 57:
(yi

y) = 680; 5:

i=1

Relatia (11.6) d
a

c2 = 1 680; 5
8

0; 572 2062; 5 = 1; 3:

Exemplul 11.2. Se face un experiment pe elasticitatea tesutului pl


amnului
ca o functie de propriet
atile de extindere ale pl
amnului si m
asur
atorile din
tabelul urm
ator sunt cele ale modulului lui Young al tesutului (Y ), n g=cm2 ,
la diferite valori ale extinderii pl
amnului n termeni de tensiune (x), n g=cm2 .

a),
Presupunnd c
a E (Y ) este legat
a liniar de x si c
a 2Y = 2 (o constant
determinati estim
arile prin metoda celor mai mici p
atrate pentru coecientii de
regresie si o estimare nedeplasat
a pentru 2 .
n acest caz avem n = 14. Cantit
atile care ne intereseaz
a sunt
n

x=

1X
1
xi =
(2 + 2; 5 + ::: + 20) = 11; 11;
n i=1
14
n

y=

1X
1
yi =
(9; 1 + 19; 2 + ::: + 130; 8) = 57; 59;
n i=1
14
n
X

(xi

x) = 546; 09;

i=1

n
X

(yi

y) = 17179; 54;

i=1

130

n
X

(xi

x) (yi

y) = 2862; 12:

i=1

nlocuirea acestor valori n relatiile (10.8), (10.7) si (11.6) d


a
b = 2862; 12 = 5; 24;
546; 09

b = 57; 59

5; 24 11; 11 =

0; 63

c2 = 1 17179; 54 5; 242 546; 09 = 182; 1:


12
Dreapta de regresie estimat
a mpreun
a cu datele sunt ar
atate n gura urm
atoare.

Deviatia standard estimat


a este b =
asemenea ar
at
a n gur
a.

11.2

182; 1 = 13; 49g=cm2 si -banda este de

Intervale de ncredere pentru coecien


tii de regresie

b B
b si A
b + Bx
b sunt
Presupunem c
aY
N
+ x; 2 . Deoarece estimatorii A;
functii liniare de selectia Y , ei sunt de asemenea variabile aleatoare normale.
131

b B
b si A
b + Bx
b au o repartitie normal
Cnd m
arimea selectiei n este mare, A;
a pe
baza teoremei limit
a central
a, indiferent de repartitia lui Y .
Urm
am calea din sectiunea 9.2 pentru a stabili limite de ncredere. Se pot
verica urm
atoarele rezultate:
i) Fie c2 estimatorul nedeplasat pentru 2 denit de relatia (11.6) si e
D=

2) c2

(n

Rezult
a din sectiunea 9.2 c
a D este o variabil
a aleatoare repartizat
a
grade de libertate.
ii) Consider
am variabilele aleatoare

(11.7)

cu n

b
A
v
u
n
u c2 X 2
u
xi
u
u n i=1
u X
tn
(x x)2

(11.8)

i=1

si

b
B
v
u
u n c2
uX
t
(x
i

(11.9)

x)2

i=1

unde, dup
a cum se observ
a din relatiile (10.20), (10.22) si (10.23), si sunt
b respectiv B,
b iar numitorii sunt deviatiile standard ale lui A,
b
mediile lui A,
2
b cu
respectiv B,
estimat de c2 . Din sectiunea 9.2 rezult
a c
a ecare dintre
aceste variabile aleatoare are o repartitie t cu n 2 grade de libertate.
\
iii) Estimatorul E
(Y ) pentru media lui Y este repartizat normal cu media
+ x si dispersia
n
X
1
n

\
b +2xcov A;
b B
b =
b + Bx
b = var A
b +x2 var B
var E
(Y ) = var A
2

6
61
(x
6n + X
n
4

x)2

(xi x)

i=1

7
7
7 : (11.10)
5
2

132

x2i +x2 2xx

i=1
n

X
i=1

=
(xi x)2

De aici, urmnd argumentarea din sectiunea 9.2, variabila aleatoare


\
E
(Y ) ( + x)
v 2
3
u
u
u 6
7
u 6
u c2 6 1 + n(x x)2 7
7
u 4n X
5
t
(x x)2

(11.11)

i=1

este de asemenea t-repartizat


a cu n 2 grade de libertate.
Pe baza rezultatelor prezentate mai sus putem stabili limite de ncredere
pentru toti parametrii de interes. Rezultatele de mai jos sunt o consecinta
direct
a a celor din sectiunea 9.2.
1) Un interval de [100 (1
)] % ncredere pentru este determinat de (vezi
relatia (9.19))
v
u
n
u c2 X
u
x2i
u
u
i=1
b tn 2; =2 u
L1;2 = A
:
(11.12)
n
u X
2
tn
(x
x)
i

i=1

2) Un interval de [100 (1
relatia (9.19))

b
L1;2 = B

)] % ncredere pentru

tn

este determinat de (vezi

v
u
c2
u
:
=2 u
n
uX
2
t
(xi x)

2;

(11.13)

i=1

3) Un interval de [100 (1
)] % ncredere pentru E (Y ) = + x este determinat de (vezi relatia (9.19))
v 2
3
u
u
u 6
7
u 6
2
7
(x x)
u c2 6 1
\
7
(11.14)
L1;2 = E (Y ) tn 2; =2 u 6 + n
7
u 4n X
5
2
t
(xi x)
i=1

4) Un interval de [100 (1
)] % ncredere pentru
este determinat de (vezi relatia (9.22))
L1 =
L2 =

(n 2) c2
2
n

(n
2
n

(11.15)
:

=2

Un interval de [100 (1
)] % ncredere pentru
terminat de (vezi relatia (9.23))
L1 =

(n

2) c2

2
n 1;

133

cu ambele margini nite

2; =2
2) c2

2;1

cu o margine nit
a este de-

(11.16)

n ecare caz, att pozitia ct si m


arimea intervalului variaz
a de la selectie
la selectie. n plus, intervalul de ncredere pentru + x este o functie de x.
Dac
a se reprezint
a valorile observate ale lui L1 si L2 , ele formeaz
a o banda de
ncredere n jurul dreptei de regresie estimate, dup
a cum este ar
atat n gura
urm
atoare.

Relatia (11.14) arat


a c
a cea mai ngust
a l
atime a bandei apare n x = x. Banda
devine mai larg
a cnd x de misc
a din x n orice directie.
Exemplul 11.3. n exemplul 11.2, presupunnd c
a Y este repartizat
a normal, s
a se determine o band
a de 95% ncredere pentru + x.
Relatia (11.14) d
a limitele de ncredere dorite, cu n = 14; = 0; 05 si

tn

\
E
(Y ) = b + b x =

2; =2

0; 63 + 5; 24x;

= t12;0:025 = 2; 179, din tabelul A.4,


x = 11; 11;
n
X

(xi

x) = 546; 09;

i=1

134

c2 = 182; 1:

Limitele de ncredere observate sunt date de


v
"
#
u
2
u
1
(x 11; 11)
t
l1;2 = 0; 63 + 5; 24x 2; 179 182; 1
+
:
14
546; 09
Rezultatul este ar
atat grac n gura urm
atoare.

135

12

Regresie liniar
a multipl
a.
regresie

12.1

Alte modele de

Regresie liniar
a multipl
a

n regresia liniar
a multipl
a, modelul ia forma
E (Y ) =

1 x1

2 x2

+ ::: +

m xm :

(12.1)

Din nou, presupunem c


a dispersia lui Y este 2 si este independent
a de x1 ; x2 ; :::; xm .
Ca la regresia liniar
a simpl
a suntem interesati s
a estim
am cei m + 1 coecienti de regresie 0 ; 1 ; :::; m pe baza unei selectii a valorilor lui Y cu valorile lor asociate ale lui (x1 ; x2 ; :::; xm ). O selectie de m
arime n n acest caz
ia forma (x11 ; x21 ; :::; xm1 ; Y1 ) ; (x12 ; x22 ; :::; xm2 ; Y2 ) ; :::; (x1n ; x2n ; :::; xmn ; Yn ).
Pentru ecare set de valori xki ; k = 1; 2; :::; m, Yi este o observatie independent
a din populatia Y denit
a prin
Y =

1 x1

2 x2

+ ::: +

m xm

+ E:

(12.2)
2

Ca mai nainte, E este eroarea aleatoare, cu media 0 si dispersia


12.1.1

Estimarea prin metoda celor mai mici p


atrate

Fiind date seturile de valori de selectie observate (x1i ; x2i ; :::; xmi ; yi ) ; i = 1; 2; :::; n,
sistemul de ecuatii de regresie observate este
yi =
Dac
a not
am
0

si

B
B
C=B
@

1
1
..
.

1 x1i

2 x2i

+ ::: +

x11
x12
..
.

x21
x22
..
.

:::
:::
..
.

1 x1n

x2n

::: xmn

relatia (12.3) poate scris


a

xm1
xm2
..
.

m xmi

B
B
y=B
@

C
C
C;
A

B
B
=B
@

+ ei ;

0
1

..
.

i = 1; 2; :::; n:

y1
y2
..
.
yn

C
C
C;
A

B
B
e=B
@

(12.3)

e1
e2
..
.
en

1
C
C
C
A

C
C
C;
A

y = C + e:

(12.4)

Comparnd relatia (12.4) cu relatia (10.12) din regresia liniar


a simpl
a, ecuatiile de regresie observate n ambele cazuri sunt identice cu exceptia faptului c
a
C este acum o matrice n (m + 1) si este un vector (m + 1)-dimensional.
P
astrnd aceast
a diferenta de dimensiune n minte, rezultatele obtinute n cazul
136

regresiei liniare simple bazate pe relatia (10.12) sunt din nou valabile n cazul
regresiei liniare multiple. Astfel, f
ar
a alt
a demonstratie, avem pentru solutia
estim
arii prin metoda celor mai mici p
atrate b a lui (vezi relatia (10.15))
1

b = CT C

C T y:

(12.5)

cere ca s
a existe cel putin (m + 1) seturi distincte
Existenta matricei C T C
de valori (x1i ; x2i ; :::; xmi ) n selectie. C T C este o matrice (m + 1) (m + 1)
simetric
a.
Exemplul 12.1. Consumul lunar mediu de putere electric
a (Y ) ntr-o anumit
a fabric
a este considerat a liniar dependent de temperatura mediului
ambiant (x1 , n F ) si num
arul de zile lucr
atoare din lun
a (x2 ). Consider
am
datele lunare pe un an din tabelul urm
ator.

Determinati estim
arile prin metoda celor mai
regresie liniar
a asociati.
n acest caz, C este o matrice 12 3 si
0
12
626
C T C = @ 626 36776
290 15336
0
2974
C T y = @ 159011
72166
Astfel avem

sau

b = CT C
b =
0

33; 84;

CT y = @
b = 0; 39;
1

mici p
atrate ai coecientilor de

1
290
15336 A ;
7028
1
A:

1
33; 84
0; 39 A ;
10; 80
b = 10; 8:
2

Ecuatia de regresie estimat


a bazat
a pe date este astfel
[
E
(y) = b 0 + b 1 x1 + b 2 x2 =
137

33; 84 + 0; 39x1 + 10; 8x2 :

Deoarece relatia (12.4) coincide cu cea din cazul regresiei liniare simple,
multe din rezultatele obtinute acolo privind propriet
atile estimatorilor prin
metoda celor mai mici p
atrate pot duplicate aici tinnd cont doar de noile
denitii ale matricei C si vectorului .
Scriem estimatorul b pentru n forma
Observ
am c
a

E b

b = CT C
= CT C

C T Y:

(12.6)

C T E (Y) = :

(12.7)

De aici, estimatorul prin metoda celor mai mici p


atrate b este din nou nedeplasat. De asemenea, din relatia (10.21) rezult
a c
a matricea de covarianta pentru
b este
1
:
(12.8)
cov b = 2 C T C

Intervale de ncredere pentru parametrii de regresie n acest caz pot de


asemenea stabilite urmnd proceduri similare celor din cazul regresiei liniare
simple.

12.2

Alte modele de regresie

n stiinta si inginerie e adesea necesar s


a se considere modele de regresie care
sunt neliniare n variabilele independente. Exemple de aceste clase de modele
sunt
Y = 0 + 1 x + 2 x2 + E;
(12.9)
Y =
Y =

1 x1

2 x2

exp (

2
11 x1

Y =

x
0 1

1x

+ E) ;

2
22 x2

+ E:

(12.10)
12 x1 x2

+ E;

(12.11)
(12.12)

Modele polinomiale ca relatiile (12.9) sau (12.11) sunt nc


a modele de regresie
liniar
a, deoarece sunt liniare n parametrii necunoscuti 0 ; 1 ; 2 ; ::: De aceea,
parametrii pot estimati folosind tehnici de regresie liniar
a multipl
a. ntradev
ar, punnd x1 = x si x2 = x2 n relatia (12.9), aceasta ia forma unui model
de regresie liniar
a multipl
a cu 2 variabile independente si poate analizat ca
atare. O echivalenta similar
a poate stabilit
a ntre relatia (12.11) si un model
de regresie liniar
a multipl
a cu 5 variabile independente.
Consider
am modelul exponential dat de relatia (12.10). Logaritmnd ambii
membri, avem
ln Y = ln 0 + 1 x + E:
(12.13)
n termeni de variabila aleatoare ln Y , relatia (12.13) reprezint
a o ecuatie de
regresie liniar
a cu coecientii de regresie ln 0 si 1 . Tehnici de regresie liniar
a
se aplic
a din nou n acest caz. Relatia (12.12) nu poate pus
a convenabil ntr-o
form
a de regresie liniar
a.

138

Exemplul 12.2. n medie, rata cresterii populatiei (Y ) asociat


a cu un oras
dat variaz
a cu x, num
arul de ani dup
a 1970. Presupunnd c
a
E (Y ) =

1x

2
2x ;

calculati estim
arile prin metoda celor mai mici p
atrate pentru
baza datelor din tabelul urm
ator.

Fie x1 = x, x2 = x2 si

=@

0
1
2

Estimarea prin metoda celor mai mici


(12.5) cu
0
1
B 1
B
B 1
C=B
B 1
B
@ 1
1

si

B
B
B
y=B
B
B
@

Astfel,
b = CT C

sau

6
C T y = @ 15
55
b = 1; 07;
0

15
55
225

1; 03
1; 32
1; 57
1; 75
1; 83
2; 33

si

pe

A:

p
atrate pentru
0
1
2
3
4
5

0;

este dat
a de relatia

0
1
4
9
16
25

C
C
C
C
C
C
A

C
C
C
C:
C
C
A

1
55
225 A
979

1 0
1
9; 83
1; 07
@ 28; 68 A = @ 0; 2 A ;
110; 88
0; 01

b = 0; 2 si b = 0; 01:
1
2

Observ
am n acest exemplu c
a, deoarece x2 = x21 , n matricea C elementele
de pe coloana a treia sunt p
atratele elementelor corespunz
atoare de pe coloana
a doua. Pentru modele de regresie polinomial
a de ordin superior, situatii de
acest tip pot conduce la dicult
ati n inversarea matricei C T C.

139

13
13.1

Estimatori neparametrici ai unei densit


a
ti de
reparti
tie
Preliminarii

Fie X1 ; X2 ; :::; Xn o selectie independent


a de m
arime n dintr-o populatie X cu
o presupus
a densitate f (x; ) sau mas
a p(x; ), unde poate specicat sau
nu. Not
am cu ipoteza H ipoteza c
a selectia reprezint
a n valori ale unei variabile
aleatoare cu densitatea f (x; ) sau masa p(x; ). Aceast
a ipotez
a este numit
a
ipoteza simpla cnd repartitia este complet specicat
a, adic
a valorile parametrului sunt specicate mpreun
a cu forma functional
a a densit
atii sau masei; altfel
este o ipoteza compusa. Pentru a construi un criteriu pentru testarea ipotezelor
este necesar s
a e stabilit
a o ipotez
a alternativ
a mpotriva c
areia ipoteza H
poate testat
a. Un exemplu de ipotez
a alternativ
a este alt
a repartitie presupus
a sau, ca alt exemplu, ipoteza H poate testat
a mpotriva ipotezei alternative c
a ipoteza H nu este adev
arat
a. Vom considera n continuare ultima
alegere.
13.1.1

Erori de tipul I
si de tipul II

Ca si n estimarea parametrilor, erorile sau riscurile sunt inerente n decizia dac


a
o ipotez
a H ar trebui s
a e acceptat
a sau respins
a pe baza informatiei dat
a de
selectie.
Deni
tia 13.1. n testarea ipotezei H, o eroare de tipul I e comis
a cnd
H este respins
a cnd de fapt H este adev
arat
a; o eroare de tipul II este comis
a
cnd H este acceptat
a cnd de fapt H este fals
a.
n cele ce urmeaz
a, metodele de testare a ipotezelor sunt discutate doar pe
baza erorilor de tipul I.

13.2

Testul chi-p
atrat al bun
at
a
tii de potrivire

Problema este testarea ipotezei H care specic


a repartitia unei populatii X
comparat
a cu alternativa c
a repartitia lui X nu este de tipul specicat pe baza
unei selectii de m
arime n din populatia X. Testul chi-p
atrat ( 2 ) al bun
at
atii
de potrivire a fost elaborat pentru acest scop de Pearson n 1900.
13.2.1

Cazul parametrilor cunoscu


ti

Presupunem mai nti c


a repartitia presupus
a este complet specicat
a, f
ar
a
parametri necunoscuti. Pentru a testa ipoteza H este folosit
a o statistic
a
h (X1 ; X2 ; :::; Xn ) a selectiei, care d
a o m
asur
a a deviatiei repartitiei observate
construit
a din selectie de la repartitia presupus
a.
n testul 2 , statistica utilizat
a este legat
a de diferenta dintre diagrama
frecventelor construit
a din selectie si o diagram
a corespunz
atoare construit
a din
repartitia presupus
a. Se mparte spatiul valorilor lui X n k intervale disjuncte

140

2 cte 2 A1 ; A2 ; :::; Ak si e Ni num


arul Xj -urilor din Ai ; i = 1; 2; :::; k. Atunci
probabilit
atile observate P (Ai ) sunt date de
P (Ai ) observat
a =

Ni
;
n

i = 1; 2; :::; k:

(13.1)

Probabilit
atile teoretice P (Ai ) pot obtinute din repartitia presupus
a a populatiei. Le not
am cu
P (Ai ) teoretic
a = pi ;

i = 1; 2; :::; k:

(13.2)

O alegere logic
a a statisticii dnd o m
asur
a a deviatiei este
k
X

ci

i=1

Ni
n

pi

(13.3)

care este o m
asur
a natural
a a deviatiei de tipul celor mai mici p
atrate. Peara prin
son (1900) a ar
atat c
a, dac
a lu
am coecientul ci = pni , statistica denit
expresia (13.3) are propriet
ati convenabile. De aici, alegem ca m
asura deviatiei
D=

k
X
n
p
i=1 i

Ni
n

pi

k
X
(Ni
i=1

X N2
npi )
i
=
npi
np
i
i=1
2

n:

(13.4)

D este o statistic
a deoarece este o functie de Ni , care sunt, la rndul lor,
functii de selectia X1 ; X2 ; :::; Xn . Repartitia statisticii D este dat
a n teorema
urm
atoare, datorat
a lui Pearson (1900).
Teorema 13.1. Presupunnd c
a ipoteza H este adev
arat
a, repartitia lui
D denit
a de relatia (13.4) tinde la o repartitie chi-p
atrat cu (k 1) grade de
libertate cnd n ! 1. Densitatea ei este dat
a de (vezi relatia (5.24))
8
k 3
< d 2 e d2 ; pentru d 0;
k 1
fD (d) =
(13.5)
2 2
( k2 1 )
:
0, altfel.

Aceast
a repartitie este independent
a de repartitia presupus
a.
Cu ajutorul teoremei 13.1 poate construit un test al ipotezei H considerat
a
mai sus pe baza atribuirii unei probabilit
ati erorii de tipul I. Presupunem c
a
vrem s
a obtinem probabilitatea pentru eroarea de tipul I. Testul 2 sugereaz
a
c
a ipoteza H ori de cte ori
d=

k
X
n2i
npi
i=1

n>

2
k 1;

(13.6)

si este acceptat
a altfel, unde d este valoarea de selectie a lui D bazat
a pe
valorile de selectie xi ; i = 1; :::; n si 2k 1; este valoarea astfel nct (vezi gura
urm
atoare)
P D > 2k 1; = :
(13.7)
141

Deoarece D are o repartitie chi-p


atrat cu (k 1) grade de libertate pentru n
mare, o valoare aproximativ
a pentru 2k 1; poate g
asit
a din tabelul A.5 din
cursul 9 pentru repartitia 2 cnd este specicat.
Probabilitatea a erorii de tipul I se numeste nivel de semnicatie n acest
context. Dup
a cum vedem din gura de mai sus, reprezint
a aria de sub fD de
la dreapta lui 2k 1; . Punnd = 0; 05, de exemplu, criteriul dat de relatia
(13.6) implic
a faptul c
a respingem ipoteza H ori de cte ori m
asura deviatiei d
calculat
a dintr-un set dat de valori de selectie pic
a n regiunea de 5%. Cu alte
cuvinte, ne astept
am s
a respingem H n aproximativ 5% din timpul cnd de fapt
H este adev
arat
a. Ce nivel de semnicatie trebuie adoptat ntr-o situatie dat
a
depinde de cazul particular implicat. n practic
a, valori obisnuite pentru sunt
0; 001; 0; 01 si 0; 05; o valoare a lui ntre 1% si 5% este aproape semnicativa ;
o valoare ntre 0; 1% si 1% este semnicativa, iar o valoare sub 0; 1% este nalt
semnicativa.
D
am acum procedura pas cu pas pentru efectuarea testului 2 cnd repartitia
unei populatii X este complet specicat
a.
Pasul 1: mparte spatiul de valori ale lui X n k intervale convenabile
numeric si disjuncte 2 cte 2 Ai ; i = 1; 2; :::; k. Fie ni , num
arul de valori
ale selectiei din Ai . De regul
a, dac
a ni < 5, combin
a intervalul Ai cu Ai 1
sau Ai+1 .

142

Pasul 2: calculeaz
a probabilit
atile teoretice P (Ai ) = pi ; i = 1; 2; :::; k, cu
ajutorul repartitiei presupuse.
Pasul 3: construieste d dat de relatia (13.6).
Pasul 4: alege o valoare a lui si determin
a din tabelul A.5 pentru repartitia 2 cu (k 1) grade de libertate valoarea lui 2k 1; .
Pasul 5: respinge ipoteza H dac
ad>

2
k 1;

. Altfel, accept
a H.

Exemplul 13.1. 300 de becuri sunt testate pentru timpul de ardere t (n


ore) si rezultatul este ar
atat n tabelul urm
ator.

Presupunem c
a timpul aleator de ardere este presupus a repartizat exponential
a = 0; 005 pe or
a si
cu timpul mediu de ardere 1 = 200 de ore, adic
fT (t) = 0; 005e
Testati aceast
a ipotez
a folosind testul
Pasii necesari n efectuarea testului

0;005t
2

0:

(13.8)

la nivelul de semnicatie de 5%.


sunt indicati n tabelul urm
ator.

Prima coloan
a d
a intervalele Ai , care sunt alese n acest caz s
a e intervalele
pentru t date n tabelul anterior. Probabilit
atile teoretice P (Ai ) = pi din
coloana a treia sunt calculate folosind relatia (13.8). De exemplu,
Z 100
p1 = P (A1 ) =
0; 005e 0;005t dt = e 0;005t j100
= 1 e 0;5 = 0; 39;
0
0

143

p2 = P (A2 ) =

200

0; 005e

0;005t

dt =

100

0;005t 200
j100

=e

0;5

= 0; 24:

Numerele teoretice de aparitii prezise de model sunt date n coloana a patra a


tabelului, care, cnd este comparat
a cu coloana a doua, d
a o m
asur
a a bun
at
atii
n2i
de potrivire a modelului cu datele. Coloana 5 ( npi ) este inclus
a pentru a facilita
calcularea lui d. Astfel, din relatia (13.6) avem
d=

k
X
n2i
npi
i=1

n = 301; 7

300 = 1; 7:

k = 4. Din tabelul A.5 pentru repartitia 2 cu 3 grade de libertate (vezi cursul


9) g
asim
2
3;0:05 = 7; 815:
Deoarece d < 23;0:05 , accept
am la un nivel de semnicatie de 5% ipoteza c
a
datele observate reprezint
a o selectie dintr-o repartitie exponential
a cu
=
0; 005.
Exemplul 13.2. nregistrarea num
arului de accidente din 6 ani ale 7842
de soferi californieni este dat
a n tabelul urm
ator.

Pe baza acestor valori de selectie, testati ipoteza c


a X, num
arul de accidente din
6 ani pe sofer, este repartizat Poisson cu rata medie = 0; 08 pe an la nivelul
de semnicatie de 1%.
Deoarece X este discret
a, alegem intervalele Ai ca n prima coloan
a a tabelului urm
ator.

144

Intervalul x > 5 ar fost combinat cu 4 < x


mic dect 5.
Repartitia presupus
a pentru X este
x

( t) e
x!

pX (x) =

(0; 48) e
x!

5 dac
a num
arul n7 ar fost mai

0;48

x = 0; 1; 2; ::::

(13.9)

Astfel avem
i 1

pi = P (Ai ) =

(0; 48)
(i

e
1)!

0;48

p7 = P (A7 ) = 1

;
6
X

i = 1; 2; :::; 6:

pi :

i=1

Aceste valori sunt indicate n coloana a treia a tabelului.


Coloana 5 a tabelului d
a
d=
Cu k = 7, valoarea lui

k
X
n2i
npi
i=1
2
k 1;

n = 8413
2
6;0:01
2
6;0:01

Deoarece d >
13.2.2

2
6;0:01 ,

7842 = 571:

este g
asit
a din tabelul A.5

= 16; 812:

ipoteza este respins


a la nivelul de semnicatie 1%.

Cazul parametrilor estima


ti

Consider
am acum situatia n care parametrii din repartitia presupus
a trebuie de
asemenea estimati din date. O procedur
a pentru un test de bun
atatea potrivirii

145

n acest caz este nti estimarea parametrilor si apoi efectuarea testului 2 pentru parametri cunoscuti. Apare o complicatie n aceea c
a probabilit
atile teoretice pi denite de relatia (13.2) sunt, ind functii de parametrii repartitiei,
functii de selectie. Statistica D ia acum forma
D=

k
X
n
Pbi
i=1

Ni
n

Pbi

k
X
Ni2
nPbi

n;

(13.10)

i=1

unde Pbi este un estimator pentru pi si astfel o statistic


a. D este acum o functie
mult mai complicat
a de X1 ; X2 ; :::; Xn . Care este noua repartitie a lui D?
Problema determin
arii repartitiei limit
a a lui D n aceast
a situatie a fost
mai nti considerat
a de Fischer (1922, 1924), care a ar
atat c
a, cnd n ! 1,
repartitia lui D trebuie modicat
a, si modicarea depinde de metoda de estimare
a parametrilor folosit
a. Din fericire, pentru o clas
a de metode importante de
estimare, ca matoda verosimilit
atii maxime, modicarea cerut
a este simpl
a, si
anume, statistica D tinde la o repartitie chi p
atrat cnd n ! 1, dar acum cu
(k r 1) grade de libertate, unde r este num
arul de parametri de estimat din
repartitia presupus
a. Cu alte cuvinte, este doar necesar de a reduce num
arul de
grade de libertate n repartitia limit
a denit
a de relatia (13.5) cu unu pentru
ecare parametru estimat din selectie.
D
am acum procedura pas cu pas pentru cazul cnd r parametri din repartitie
trebuie estimati din date.
Pasul 1: mparte spatiul de valori ale lui X n k intervale convenabile
numeric si disjuncte 2 cte 2 Ai ; i = 1; 2; :::; k. Fie ni , num
arul de valori
ale selectiei din Ai . De regul
a, dac
a ni < 5, combin
a intervalul Ai cu Ai 1
sau Ai+1 .
Pasul 2: estimeaz
a cei r parametri prin metoda verosimilit
atii maxime din
date.
Pasul 3: calculeaz
a probabilit
atile teoretice P (Ai ) = pi ; i = 1; 2; :::; k, cu
ajutorul repartitiei presupuse cu valorile parametrilor estimate.
Pasul 4: construieste d dat de relatia (13.6).
Pasul 5: alege o valoare a lui si determin
a din tabelul A.5 pentru repartitia 2 cu (k r 1) grade de libertate valoarea lui 2k r 1; . Se presupune c
a k r 1 > 0.
Pasul 6: respinge ipoteza H dac
ad>

2
k r 1;

. Altfel, accept
a H.

Exemplul 13.3. Sosirile vehiculelor ntr-un anumit punct au fost nregistrate. Numerele de vehicule sosite n interval de un minut au fost luate pentru
106 minute si sunt date n tabelul urm
ator.

146

Pe baza acestor observatii, determinati dac


a o repartitie Poisson este potrivit
a
pentru X, num
arul de sosiri pe minut, la nivelul de semnicatie de 5%.
Repartitia presupus
a este
x

pX (x) =

e
x!

x = 0; 1; 2; :::;

(13.11)

unde parametrul trebuie s


a e estimat din date. Astfel, r = 1.
nti determin
am intervale corespunz
atoare Ai astfel nct ni 5; 8i; acestea
sunt ar
atate n prima coloan
a a tabelului urm
ator.

147

De aici k = 11.
Estimarea de verosimilitate maxim
a pentru

este dat
a de

X
b=x= 1
xj = 9; 09:
n j=1

nlocuirea acestei valori pentru parametrul n relatia (13.11) ne permite s


a
calcul
am probabilit
atile P (Ai ) = pi . De exemplu,
p1 =

4
X

pX (j) = 0; 052;

j=0

p2 = pX (5) = 0; 058:
Aceste probabilit
ati teoretice sunt date n a treia coloan
a a tabelului.
Din coloana 5 a tabelului obtinem
d=
Tabelul A.5 cu

k
X
n2i
npi
i=1

= 0; 05 si k

n = 119; 56
r

106 = 13; 56:

1 = 9 grade de libertate d
a

2
9;0:05

= 16; 919:

Deoarece d < 29;0:05 , repartitia presupus


a cu
nivelul de semnicatie de 5%.
148

= 9; 09 este acceptat
a la

Exemplul 10.4. Pe baza datelor c


aderilor de z
apad
a dintre 1909 si 1979 din
tabelul urm
ator, testati ipoteza: c
aderea anual
a de z
apad
a poate modelat
a
printr-o repartitie normal
a la nivelul de semnicatie de 5%.

Repartitia asumat
a pentru X, c
aderea anual
a de z
apad
a, este N m; 2
2
unde m si
trebuie s
a e esimate din date. Doarece estimatorii de verosimilic = X, respectiv c2 = n 1 S 2 , avem
tate maxim
a pentru m si 2 sunt M
n
70

m
b =x=

1 X
xj = 83; 6;
70 j=1
70

X
c2 = 69 s2 = 1
(xj
70
70 j=1

83; 6) = 777; 4:

Cu intervalele Ai denite dup


a cum se arat
a n prima coloan
a a tabelului urm
ator, probabilit
atile teoretice P (Ai ) pot calculate cu ajutorul tabelului A.3.

149

De exemplu, primele dou


a dintre aceste probabilit
ati sunt
56
p 83;6
P (A1 ) = P (X 56) = P U
=
F
(
0; 99) = 1 FU (0; 99) =
U
777;4
1 0; 8389 ' 0; 161;
P (A2 ) = P (56 < X 72) = P ( 0; 99 < U
0; 416) = [1 FU (0; 416)]
[1 FU (0; 99)] = 0; 339 0; 161 = 0; 178:
Informatia dat
a mai sus ne permite s
a construim restul tabelului. De aici,
avem
k
X
n2i
d=
n = 72; 4 70 = 2; 4:
npi
i=1

Num
arul de grade de libertate n acest caz este k
A.5 d
a astfel
2
3;0:05 = 7; 815:

r 1 = 6 2 1 = 3. Tabelul

Deoarece d < 23;0:05 repartitia normal


a N (83:6; 777:4) este acceptabil
a la nivelul
de semnicatie de 5%.
Statistica D din testul 2 este repartizat
a 2 doar cnd n ! 1. Astfel,
2
testul
este un test de selectie mare. Ca regul
a, n > 50 este considerat
satisf
ac
ator pentru a ndeplini cerinta de selectie mare.

13.3

Testul Kolmogorov-Smirnov

Asa-numitul test de bunatatea potrivirii Kolmogorov-Smirnov, prescurtat testul K-S, este bazat pe o statistic
a m
asurnd deviatia histogramei cumulative
observate de la functia de repartitie cumulativ
a presupus
a.
Fiind dat un set de valori de selectie x1 ; x2 ; :::; xn observate dintro populatie
X, o histogram
a cumulativ
a poate construit
a prin
(a) aranjarea valorilor de selectie n ordine cresc
atoare, notate cu x(1) ; x(2) ; :::; x(n) ,
(b) determinarea functiei de repartitie observat
a a lui X n x(1) ; x(2) ; :::,
notate prin F 0 x(1) ; F 0 x(2) ; :::, din relatiile F 0 x(i) = ni si
(c) conectarea valorilor lui F 0 x(i) prin segmente de dreapt
a.

150

Statistica test folosit


a n acest caz este
n

D2 = max
i=1

F 0 X(i)

FX X(i)

= max
i=1

i
n

FX X(i)

(13.12)

unde X(i) este a i-a statistic


a de ordine a selectiei. Statistica D2 m
asoar
a
astfel maximul valorilor absolute ale celor n diferente dintre functia de repartitie observat
a si functia de repartitie presupus
a evaluat
a pentru selectia observat
a. n cazul cnd trebuie estimati parametri din repartitia presupus
a, valorile
FX X(i) sunt obtinute folosind estim
arile.
n timp ce repartitia lui D2 este dicil de obtinut analitic, functia ei de
repartitie poate calculat
a numeric si tabelat
a. Se poate ar
ata repartitia lui D2
este independent
a de repartitia presupus
a si este o functie doar de n, m
arimea
selectiei.
Efectuarea testului K-S este asem
an
atoare cu cea a testului 2 . La un nivel
de semnicatie specicat , regula este s
a se resping
a ipoteza H dac
a d2 > cn; ;
altfel, se accept
a H. Aici, d2 este valoarea de selectie a lui D2 , si valoarea cn;
este denit
a prin
P (D2 > cn; ) = :
(13.13)
Valorile cn; pentru
functii de n.

= 0:01; 0:05 si 0:1 sunt date n tabelul A.6 urm


ator ca

151

Sunt si diferente importante ntre acest test si testul 2 . n timp ce testul


este un test de selectie mare, testul K-S este valabil pentru toate valorile
lui n. Mai departe, testul K-S foloseste valorile selectiei n forma lor nealterat
a
si neagregat
a, n timp ce prelucrarea datelor este necesar
a n efectarea testului
2
. Ca dezavantaje, testul K-S este valabil doar pentru repartitii continue. De
asemenea, valorile lui cn; din tabelul A.6 sunt bazate pe o repartitie presupus
a specicat
a complet. Cnd valorile parametrilor trebuie estimate, nu este
disponibil
a o metod
a riguroas
a de ajustare. n aceste cazuri poate specicat
doar c
a valorile lui cn; trebuie reduse putin.
Procedura pas cu pas pentru efectuarea testului K-S este:
2

Pasul 1: rearanjeaz
a valorile selectiei x1 ; x2 ; :::; xn n ordine cresc
atoare si
noteaz
a-le x(1) ; x(2) ; :::; x(n) .
Pasul 2: determin
a functia de repartitie observat
a F 0 (x) n ecare x(i)
i
0
folosind F x(i) = n .
Pasul 3: determin
a functia de repartitie teoretic
a FX (x) n ecare x(i)
folosind repartitia presupus
a. Parametrii repartitiei sunt estimati din date
dac
a este necesar.
Pasul 4: formeaz
a diferentele F 0 x(i)

FX x(i)

pentru i = 1; 2; :::; n.

Pasul 5: calculeaz
a
n

d2 = max
i=1

F 0 x(i)

FX x(i)

Determinarea acestei valori maxime cere enumerarea a n cantit


ati. Aceast
a
munc
a poate redus
a putin reprezentnd grac F 0 (x) si FX (x) ca functii
de x si notnd locatia maximului prin inspectie.
Pasul 6: alege valoarea lui

si determin
a din tabelul A.6 valoarea lui cn; .

Pasul 7: respinge ipoteza H dac


a d2 > cn; . Altfel, accept
a H.
Exemplul 13.5. Se fac 10 m
asur
atori ale rezistentei la ntindere a unui
material. Ele sunt 30:1; 30:5; 28:7; 31:6; 32:5; 29; 27:4; 29:1; 33:5 si 31. Pe baza
acestui set de date, testati ipoteza c
a rezistenta la ntindere are o repartitie
normal
a la nivelul de semnicatie de 5%.
Reordonarea datelor d
a x(1) = 27:4; x(2) = 28:7; :::; x(10) = 33:5. Avem
F 0 (27:4) = 0:1; F 0 (28:7) = 0:2; :::; F 0 (33:5) = 1:
Cu privire la functia de repartitie teoretic
a, sunt mai nti obtinute estim
arile
mediei si dispersiei
10
1 X
m
b =x=
xj = 30:3:
10 j=1
152

c2 =

1
n

10

s2 =

1 X
(xj
10 j=1

30:3) = 3:14:

Valorile lui FX x(i) pot g


asite acum pe baza repartitiei N (30:3; 3:14) pentru
X. De exemplu, cu ajutorul tabelului A.3 pentru variabila aleatoare normal
a
standardizat
a U , avem
FX (27:4) = FU

27:4
p

30:3
3:14

= FU ( 1:64) = 1 FU (1:64) = 1 0:9495 = 0:0505;

FX (28:7) = FU

28:7
p

30:3
3:14

= FU ( 0:9) = 1 FU (0:9) = 1 0:8159 = 0:1841;

si asa mai departe.


Pentru a determina d2 este constructiv s
a reprezent
am grac F 0 (x) si FX (x)
ca functii de x, ca n gura urm
atoare.

Se vede din gur


a c
a maximul diferentelor dintre F 0 (x) si FX (x) apare n
x = x(4) = 29:1. De aici,
d2 = F 0 x(4)

FX x(4)
153

= 0:4

0:2483 = 0:1517:

Cu

= 0:05 si n = 10, tabelul A.6 d


a
c10;0:05 = 0:41:

Deoarece d2 < c10;0:05 , accept


am repartitia normal
a N (30:3; 3:14) la nivelul de
semnicatie de 5%.
Deoarece valorile parametrilor au fost de asemenea estimate din date, este
mai adecvat s
a compar
am d2 cu o valoare putin mai mic
a dect 0:41. Datorit
a
faptului c
a valoarea lui d2 este mult sub 0:41, concluzia de mai sus este sigur
a.

154

S-ar putea să vă placă și