Sunteți pe pagina 1din 158

Probabilit ati si statistic a

Conf. dr. Cristian Niculescu,


Facultatea de Matematic a si Informatic a,
Universitatea din Bucuresti
January 14, 2014
Part I
Probabilit ati
1 Cmp de probabilitate. Operatii cu eveni-
mente si formule de calcul pentru
probabilit atile acestora. Evenimente indepen-
dente. Probabilitatea conditionat a. Formula
lui Bayes
1.1 Cmp de probabilitate
n teoria probabilit atilor consider am un experiment cu un rezultat dependent
de sans a, care e numit experiment aleator. Se presupune c a toate rezultatele
posibile ale unui experiment aleator sunt cunoscute si ele sunt elemente ale unei
multimi fundamentale denumit a ca spa tiul probelor. Fiecare rezultat posibil este
numit proba si un eveniment este o submultime a spatiului probelor.
Notatii. Fie \ multime.
T (\) := [ _ \ .
Fie _ \.
= ( := a \[a , .
Denitia 1.1. Fie \ multime. / _ T (\) se numeste corp borelian sau
o-algebra pe \ dac a si numai dac a
1) / ,= O
2) / == /
3)
l
,
2
, ...,
n
, ... / ==
_
n

n
/.
(\, /) se numeste spa tiu masurabil cnd / este corp borelian pe \.
Propriet ati. Dac a (\, /) este spa tiu masurabil atunci:
1
a) \ /
b) O /
c)
l
,
2
, ...,
n
/ ==
n
_
I=l

I
/.
d) 1 cel mult num arabil a (i.e. nit a sau num arabil a),
I
/, \i 1 ==

I1

I
/
e) , 1 / == 1 /.
Demonstratie. a) / ,= O == / == / == \ = ' ' '
' ... /.
b) O = \ /.
c)
n
_
I=l

I
=
n
_
I=l

I
' O ' O ' ... /.
d)

I1

I
=
_
I1

I
/.
e) 1 = 1 /.
Consider am un corp borelian pe / pe un spatiu \ de elemente a, /, c, ... cu
a , / , c , ... / si cu submultimile , 1, C, ... /. Unele dintre corespon-
dentele dintre teoria multimilor si teoria probabilit atilor sunt date n urm atorul
tabel:
Teoria multimilor Teoria probabilit atilor
Spatiu, \ Spatiul probelor, eveniment sigur
Multimea vid a, O Eveniment imposibil
Elemente a, /, ... Probe a, /, ... (sau evenimente simple)
Multimi , 1, ... Evenimente , 1, ...
Evenimentul apare
Evenimentul nu apare
' 1 Cel putin unul dintre si 1 apare
1 Ambele si 1 apar
_ 1 este un subeveniment al lui 1 (i.e. aparitia lui implic a aparitia lui 1)
1 = O si 1 sunt mutual exclusive (i.e. ele nu pot ap area simultan)
O este considerat a un eveniment imposibil deoarece niciun rezultat posibil
nu este element al ei. Prin "aparitia unui eveniment" ntelegem c a rezultatul
observat este un element al acelei multimi. Spunem c a mai multe evenimente
sunt mutual exclusive dac a multimile corespunz atoare sunt disjuncte dou a cte
dou a.
Exemplul 1.1. Consider am un experiment de calculare a num arului de
masini care vireaz a la stnga la o intersectie dintr-un grup de 100 de masini.
Rezultatele posibile (numerele posibile de masini care vireaz a la stnga) sunt
0, 1, 2, ..., 100. Atunci, spatiul probelor este \ = 0, 1, 2, ..., 100 si / = T (\) .
= 0, 1, 2, ..., 0 este evenimentul "cel mult 50 de masini vireaz a la stnga".
1 = 40, 41, ..., 60 este evenimentul "ntre 40 si 60 (inclusiv) de masini vireaz a
la stnga". ' 1 este evenimentul "cel mult 60 de masini vireaz a la stnga".
1 este evenimentul "ntre 40 si 0 (inclusiv) de masini vireaz a la stnga".
2
Fie C = 81, 82, ..., 100. Evenimentele si C sunt mutual exclusive.
Denitia 1.2. Fie (\, /) spatiu m asurabil. Functia 1 : / R se numeste
probabilitate pe (\, /) dac a si numai dac a are urm atoarele propriet ati (numite
axiomele probabilit atii):
Axioma 1: 1 () _ 0, \ / (nenegativ a).
Axioma 2: 1 (\) = 1 (normat a).
Axioma 3: pentru orice colectie num arabil a de evenimente mutual exclusive
(multimi disjuncte dou a cte dou a)
l
,
2
, ... /,
1
_
_
_

_
_
=

1 (

) (num arabil aditiv a).


(\, /, 1) se numeste cmp de probabilitate dac a si numai dac a 1 este
probabilitate pe spatiul m asurabil (\, /) .
1.2 Operatii cu evenimente si formule de calcul pentru
probabilit atile acestora
Propriet ati. Dac a (\, /, 1) este cmp de probabilitate, atunci:
1) 1 (O) = 0.
2) pentru orice colectie nit a de evenimente mutual exclusive (multimi dis-
juncte dou a cte dou a)
l
,
2
, ...,
n
/,
1
_
_
n
_
=l

_
_
=
n

=l
1 (

) (1 este aditiv a).


3) _ C; , C / ==1 () _ 1 (C) .
4) , 1 / ==
1 (' 1) = 1 () 1 (1) 1 ( 1) .
5) (Formula lui Poincare)
l
,
2
, ...,
n
/ ==
1
_
_
n
_
=l

_
_
=
n

=l
1 (

)

lI<n
1 (
I

)

lI<<|n
1 (
I


|
)...(1)
nl
1
_
_
n

=l

_
_
.
n particular, , 1, C / ==
1('1'C) = 1() 1(1) 1(C) 1(1) 1(C) 1(1C)
1( 1 C).
6) / == 1
_

_
= 1 1 () .
Demonstratie. 1) 1(\) = 1 (\ ' O ' O ' ...)
.3
= 1 (\) 1 (O) 1 (O)
...
.2
== 1 = 1 1 (O) 1 (O) ... == 1 (O) 1 (O) ... = 0 == 1 (O) = 0.
2) 1
_
_
n
_
=l

_
_
= 1
_
_
n
_
=l

' O ' O ' ...


_
_
.3
=
n

=l
1 (

) 1 (O) 1 (O)
3
...
l)
=
n

=l
1 (

) 0 0 ... =
n

=l
1 (

) .
3) 1 (C) = 1(' (C))
2)
= 1 () 1 (C)
. .
0
== 1 (C) _ 1 () .
4) 1 (' 1) = 1 (' (1))
2)
= 1 () 1 (1)
2)
= 1 () 1 (1)
1 ( 1) .
5) Inductie.
Pentru : = 1 e evident.
Presupunem adev arat pentru :.
Fie
l
,
2
, ...,
n
,
nl
/.
1
_
_
nl
_
=l

_
_
= 1
_
_
n
_
=l

'
nl
_
_
d)
= 1
_
_
n
_
=l

_
_
1 (
nl
)1
_
_
_
_
n
_
=l

_
_

nl
_
_
ip. ind.
=
n

=l
1 (

)

lI<n
1 (
I

)

lI<<|n
1 (
I


|
)...(1)
nl
1
_
_
n

=l

_
_

1 (
nl
) 1
_
_
n
_
=l
(


nl
)
_
_
ip. ind.
=
nl

=l
1 (

)

lI<n
1 (
I

)

lI<<|n
1 (
I


|
)...(1)
nl
1
_
_
n

=l

_
_

[
n

=l
1 (


nl
)

lI<n
1 ((
I

nl
) (


nl
))

lI<<|n
1 ((
I

nl
) (


nl
) (
|

nl
))...(1)
nl
1
_
_
n

=l
(


nl
)
_
_
[ =
nl

=l
1 (

)

lI<n
1 (
I

)
n

=l
1 (


nl
)

lI<<|n
1 (
I


|
)

lI<n
1 (
I


nl
) ... (1)
n
1
_
_
nl

=l

_
_
=
nl

=l
1 (

)

lI<nl
1 (
I

)

lI<<|nl
1 (
I


|
)...(1)
n
1
_
_
nl

=l

_
_
.
6) 1 = 1 (\) = 1
_
'
_
2)
= 1 () 1
_

_
.
Exemplul 1.2. n exemplul 1.1, presupunem c a probabilit atile 1 () , 1 (1)
si 1 (C) sunt cunoscute. Vrem s a calcul am 1('1) (probabilitatea ca cel mult
60 de masini s a vireze la stnga) si 1(' C) (probabilitatea ca cel mult 0 de
masini sau ntre 80 si 100 de masini s a vireze la stnga). Deoarece si C sunt
mutual exclusive avem
4
1(' C) = 1 () 1 (C) .
Dar
1 (' 1) = 1 () 1 (1) 1 ( 1) .
Informatia dat a este insucient a pentru a determina 1 (' 1) si avem
nevoie de informatia aditional a 1 ( 1), care este probabilitatea ca ntre 40
si 0 de masini s a vireze la stnga.
1.3 Evenimente independente
Denitia 1.3. Fie (\, /, 1) cmp de probabilitate. Dou a evenimente , 1 /
se numesc independente dac a si numai dac a
1 ( 1) = 1 () 1 (1) .
Observatie. Dac a si 1 sunt evenimente independente, atunci:
1
_
1
_
= 1()1
_
1
_
,
1
_
1
_
= 1
_

_
1 (1) ,
1
_
1
_
= 1
_

_
1
_
1
_
.
Demonstratie. 1() = 1
_
( 1) '
_
1
__
= 1 ( 1)1
_
1
_
==
1
_
1
_
= 1() 1 ( 1) = 1() 1 () 1 (1) = 1() (1 1 (1)) =
1()1
_
1
_
.
Analog pentru celelalte relatii.
Exemplul 1.3. n lansarea unui satelit, probabilitatea unui insucces este .
Care este probabilitatea ca dou a lans ari succesive s a esueze?
Presupunnd c a lans arile satelitului sunt evenimente independente, r aspun-
sul este
2
.
Denitia 1.4. Fie (\, /, 1) cmp de probabilitate. Evenimentele
l
,
2
, ...,
n

/ sunt independente dac a si numai dac a \: = 2, 8, ..., :; /
l
, /
2
, ..., /
n
N a. .
1 _ /
l
< /
2
< ... < /
n
_ :,
1 (
|1

|2
...
|r
) = 1 (
|1
) 1 (
|2
) ...1 (
|r
) .
n particular,
l
,
2
,
3
sunt independente dac a si numai dac a
1 (


|
) = 1 (

) 1 (
|
) , \, < /; ,, / = 1, 2, 8,
si
1(
l

2

3
) = 1 (
l
) 1 (
2
) 1 (
3
) .
Observatii. 1) Num arul de egalit ati din denitia independentei a : eveni-
mente este 2
n
: 1.
2) Independenta dou a cte dou a nu conduce n general la independent a.
Contraexemplu. Fie 3 evenimente
l
,
2
,
3
denite de

l
= 1
l
' 1
2
,
2
= 1
l
' 1
3
,
3
= 1
2
' 1
3
,
unde 1
l
, 1
2
si 1
3
sunt mutual exclusive, ecare avnd probabilitatea
l
d
.
1 (
l
) = 1 (1
l
' 1
2
) = 1 (1
l
) 1 (1
2
) =
l
2
.
Analog 1 (
2
) = 1 (
3
) =
l
2
.
1 (
l

2
) = 1 ((1
l
' 1
2
) (1
l
' 1
3
)) = 1 (1
l
' (1
2
1
3
)) = 1 (1
l
' O) =
1 (1
l
) =
l
d
=
l
2

l
2
= 1 (
l
) 1 (
2
) .
5
Analog 1 (
l

3
) = 1 (
l
) 1 (
3
) , 1 (
2

3
) = 1 (
2
) 1 (
3
) .
1 (
l

2

3
) = 1 ((1
l
' 1
2
) (1
l
' 1
3
) (1
2
' 1
3
)) = 1 ((1
l
' (1
2
1
3
)) (1
2
' 1
3
)) =
1 (1
l
(1
2
' 1
3
)) = 1 ((1
l
1
2
) ' (1
l
1
3
)) = 1 (O ' O) = 1 (O) = 0.
1 (
l
) 1 (
2
) 1 (
3
) =
l
S
.
Deci 1 (
l

2

3
) ,= 1 (
l
) 1 (
2
) 1 (
3
) .
Evenimentele
l
,
2
,
3
sunt independente dou a cte dou a, dar nu sunt
independente.
3) Dac a evenimentele
l
,
2
, ...,
n
sunt independente, atunci nlocuind ori-
care din
|
cu complementara
|
n ambii membri din relatiile din denitia
independentei, relatiile obtinute r amn valabile.
Exemplul 1.4. Un sistem compus din 5 componente merge exact atunci
cnd ecare component a e bun a. Fie o
I
, i = 1, ..., , evenimentul "componenta
i e bun a" si presupunem 1 (o
I
) = j
I
. Care e probabilitatea ca sistemul s a nu
mearg a?
Presupunnd c a cele 5 componente merg ntr-o manier a independent a, e j
probabilitatea de succes.
= 1 j = 1 1
_
5

I=l
o
I
_
= 1
5

I=l
1 (o
I
) = 1
5

I=l
j
I
.
1.4 Probabilitatea conditionat a
Denitia 1.5. Fie (\, /, 1) cmp de probabilitate si , 1 / a. . 1 (1) ,= 0.
Probabilitatea condi tionata de 1 a lui este dat a de
1 ([1) =
1 ( 1)
1 (1)
.
Observatie. n ipotezele denitiei 1.5, si 1 sunt independente ==
1 ([1) = 1 () .
Demonstratie. si 1 sunt independente == 1 ( 1) = 1 () 1 (1) ==
1(.|1)
1(1)
= 1 () == 1 ([1) = 1 () .
Propozitie. Fie (\, /, 1) cmp de probabilitate si 1 / a. . 1 (1) ,= 0.
Atunci functia 1
1
: / R, 1
1
() = 1 ([1) este probabilitate pe(\, /) .
Demonstratie. Veric am cele 3 axiome ale probabilit atii:
1) 1
1
() =
1(.|1)
1(1)
_ 0, \ /, deoarece 1 ( 1) _ 0 si 1 (1) 0.
2) 1
1
(\) =
1(:|1)
1(1)
=
1(1)
1(1)
= 1.
3)
l
,
2
, ... / colectie num arabil a de evenimente mutual exclusive ==

l
1,
2
1, ... / mutual exclusive == 1
1
(
l
'
2
' ...) =
1((.1|.2|...)|1)
1(1)
=
1((.1|1)|(.2|1)|...)
1(1)
=
1(.1|1)1((.2|1))...
1(1)
=
1(.1|1)
1(1)

1(.2|1)
1(1)
... =
1
1
(
l
) 1
1
(
2
) ....
Exemplul 1.5. Reconsider am exemplul 1.4 presupunnd j
l
0. Care este
probabilitatea conditionat a ca primele dou a componente s a e bune dat ind
c a:
a) prima component a este bun a;
6
b) cel putin una dintre cele dou a este bun a?
Evenimentul o
l
o
2
nseamn a c a ambele componente sunt bune, iar o
l
'o
2
c a cel putin una e bun a. Datorit a independentei lui o
l
si o
2
, avem:
a) 1 (o
l
o
2
[o
l
) =
1(S1|S2|S1)
1(S1)
=
1(S1|S2)
1(S1)
=
1(S1)1(S2)
1(S1)
= 1 (o
2
) = j
2
.
b) 1 (o
l
o
2
[o
l
' o
2
) =
1(S1|S2|(S1|S2))
1(S1|S2)
=
1(S1|S2)
1(S1|S2)
=
1(S1)1(S2)
1(S1)1(S2)1(S1|S2)
=
12
1212
.
Exemplul 1.6. Determinati probabilitatea de a trage, f ar a nlocuire, 2 asi
succesiv dintr-un pachet de c arti de joc f ar a jokeri.
Fie
l
evenimentul "prima carte tras a este un as" si similar
2
. Se cere
1 (
l

2
).
1 (
l
) =
d
52
(sunt 4 asi n cele 52 de c arti din pachet).
1(
2
[
l
) =
3
5l
(dac a prima carte tras a este un as, au r amas 51 de c arti
dintre care 3 sunt asi).
1(
2
[
l
) =
1(.1|.2)
1(.1)
== 1 (
l

2
) = 1 (
l
) 1(
2
[
l
) =
d
52

3
5l
=
l
l3

l
l7
=
l
22l
.
Propozitie. Fie (\, /, 1) cmp de probabilitate si
l
,
2
, ...,
n
/ a. .
1 (
l

2
...
nl
) 0. Atunci
1 (
l

2
...
n
) = 1 (
l
) 1(
2
[
l
)1 (
3
[
l

2
) ...1 (
n
[
l

2
...
nl
) .
Demonstratie.
l
_
l

2
_ ... _
l

2
...
nl
== 1 (
l
) _
1 (
l

2
) _ ... _ 1 (
l

2
...
nl
) 0 == probabilit atile
conditionate din membrul drept au sens.
1 (
l
) 1(
2
[
l
)1 (
3
[
l

2
) ...1 (
n
[
l

2
...
nl
) = 1 (
l
)
1(.1|.2)
1(.1)

1(.1|.2|.3)
1(.1|.2)
...
1(.1|.2|...|.r)
1(.1|.2|...|.r1)
= 1 (
l

2
...
n
) .
Denitia 1.6. Fie 1
I
_ \, \i 1. (1
I
)
I1
se numeste parti tie a lui \ dac a
si numai dac a (1
I
)
I1
sunt disjuncte dou a cte dou a si
_
I1
1
I
= \.
Teorema probabilit atii totale. Fie (\, /, 1) cmp de probabilitate si
(1
I
)
I1
/ partitie cel mult num arabil a a lui \ a. . 1 (1
I
) 0, \i 1.
Atunci, \ /,
1 () =

I1
1 ([1
I
) 1 (1
I
) .
Demonstratie. (1
I
)
I1
mutual exclusive, 1
I
_ 1
I
, \i 1 ==
( 1
I
)
I1
mutual exclusive ==

I1
1 ([1
I
) 1 (1
I
) =

I1
1(.|11)
1(11)
1 (1
I
) =

I1
1 ( 1
I
) = 1
_
_
I1
( 1
I
)
_
= 1
_

_
_
I1
1
I
__
= 1 ( \) = 1 () .
Exemplul 1.7. S a se determine probabilitatea ca un nivel critic al curgerii
s a e atins n timpul furtunilor ntr-un sistem de canalizare pe baza m asur ato-
rilor meteorologice si hidrologice.
Fie 1
I
, i = 1, 2, 8 diferitele nivele (mic, mediu si mare) de precipitatii cauzate
de o furtun a si

, , = 1, 2 nivelele critic, respectiv necritic al curgerii.


7
Probabilit atile 1 (1
I
) pot estimate din nregistr arile meteorologice, iar 1 (

[1
I
)
din analiza curgerii. Presupunem c a:
1 (1
l
) = 0, ; 1 (1
2
) = 0, 8; 1 (1
3
) = 0, 2;
1 (
l
[1
l
) = 0; 1 (
l
[1
2
) = 0, 2; 1 (
l
[1
3
) = 0, 6;
1 (
2
[1
l
) = 1; 1 (
2
[1
2
) = 0, 8; 1 (
2
[1
3
) = 0, 4.
Deoarece 1
l
, 1
2
, 1
3
constituie o partitie, din teorema probabilit atii totale
avem:
1(
l
) = 1 (
l
[1
l
) 1 (1
l
)1 (
l
[1
2
) 1 (1
2
)1 (
l
[1
3
) 1 (1
3
) = 00,
0, 2 0, 8 0, 6 0, 2 = 0, 18.
1.5 Formula lui Bayes
Thomas Bayes a fost un lozof englez.
Teorema lui Bayes. Fie (\, /, 1) cmp de probabilitate si , 1 / a. .
1 () ,= 0 si 1 (1) ,= 0. Atunci:
1 (1[) =
1 ([1) 1 (1)
1 ()
.
Demonstratie.
1(.]1)1(1)
1(.)
=
T(.\T)
T(T)
1(1)
1(.)
=
1(1|.)
1(.)
= 1 (1[) .
Formula lui Bayes. Fie (\, /, 1) cmp de probabilitate si (1
I
)
I1
/
partitie cel mult num arabil a a lui \ a. . 1 (1
I
) 0, \i 1. Atunci, \ / a.
. 1 () ,= 0, \i 1,
1 (1
I
[) =
1(.]11)1(11)

21
|1(.]1)1(1)|
.
Demonstratie.
1(.]11)1(11)

21
|1(.]1)1(1)|
TPT
=
1(.]11)1(11)
1(.)
TB
= 1 (1
I
[) .
Exemplul 1.8. n exemplul 1.7, s a se determine 1 (1
2
[
2
), probabilitatea
ca, dat ind c a s-a atins un nivel necritic al curgerii, el s a fost datorat unei
furtuni de nivel mediu. Din formula lui Bayes rezult a
1 (1
2
[
2
) =
1(.2]12)1(12)
3

=1
|1(.2]1)1(1)|
=
0,S0,3
l0,50,S0,30,d0,2
=
0,2d
0,50,2d0,0S
=
0,2d
0,S2
=
l2
dl
~
= 0, 208.
Exemplul 1.9. Un canal de comunicare binar simplu transmite mesaje
folosind doar 2 semnale, s a spunem 0 si 1. Presupunem c a, pentru un canal
binar dat, 40%din timp e transmis un 1; probabilitatea ca un 0 transmis s a
e corect receptionat este 0,9 si probabilitatea ca un 1 transmis s a e corect
receptionat este 0,95. Determinati:
a) probabilitatea ca un 1 s a e primit;
b) dat ind c a un 1 este primit, probabilitatea ca un 1 s a fost transmis.
Fie
= "1 este transmis"
= "0 este transmis"
8
1 = "1 este primit"
1 = "0 este primit".
Din ipoteze
1 () = 0, 4; 1
_

_
= 0, 6;
1 (1[) = 0, 0; 1
_
1[
_
= 0, 0;
1
_
1[
_
= 0, 0; 1
_
1[
_
= 0, 1.
a) Deoarece si formeaz a o partitie, din teorema probabilit atii totale
rezult a c a
1 (1) = 1 (1[) 1 () 1
_
1[
_
1
_

_
= 0, 0 0, 4 0, 1 0, 6 = 0, 88
0, 06 = 0, 44.
b) Din teorema lui Bayes,
1 ([1) =
1(1].)1(.)
1(1)
=
0,950,d
0,dd
=
0,3S
0,dd
=
l9
22
~
= 0, 864.
9
2 Variabile aleatoare. Variabile aleatoare dis-
crete si variabile aleatoare continue, cu densi-
tate de repartitie. Functie de repartitie. Mo-
mentele unei variabile aleatoare
2.1 Variabile aleatoare
Consider am un experiment aleator ale c arui rezultate sunt elemente ale spatiului
probelor \ din cmpul de probabilitate (\, /, 1) . Pentru a construi un model
pentru o variabil a aleatoare, presupunem c a e posibil s a asociem un num ar real
A (.) pentru ecare rezultat ., urmnd un anumit set de reguli.
Denitia 2.1. Functia A se numeste variabila aleatoare dac a si numai dac a
a) A : \ R, unde (\, /, 1) este cmp de probabilitate si
b) \r R, . \[A (.) _ r /.
Conditia b) din denitie e asa-numita "conditie de m asurabilitate". Ea ne
asigur a c a are sens s a consider am probabilitatea evenimentului . \[A (.) _ r,
notat mai simplu A _ r pentru orice r R, sau, mai general, probabilitatea
oric arei combinatii nite sau num arabile de astfel de evenimente.
n continuare, dac a nu e specicat altfel, variabilele aleatoare sunt
considerate pe un cmp de probabilitate (\, /, 1) .
2.2 Variabile aleatoare discrete si variabile aleatoare con-
tinue, cu densitate de repartitie
Denitia 2.2. O variabil a aleatoare se numeste discreta dac a si numai dac a
ia numai valori izolate. Multimea valorilor unei variabile aleatoare discrete este
cel mult num arabil a.
Denitia 2.3. O variabil a aleatoare se numeste continua dac a valorile ei
umplu un interval.
Denitia 2.4. Fie A, variabil a aleatoare continu a. O functie )

: R R
a. . )

(r) _ 0, \r R si 1 (A _ r) =
_
r
o
)

(n) dn, \r R se numeste


func tie densitate de reparti tie sau func tie densitate de probabilitate sau simplu
densitate a lui A.
2.3 Functie de repartitie
Denitia 2.5. Fie A variabil a aleatoare. Functia 1

: R R,
1

(r) = 1 (A _ r) ,
se numeste func tia de reparti tie de probabilitate sau simplu func tia de repar-
ti tie a lui A.
Indicele A identic a variabila aleatoare. Acest indice e uneori omis cnd nu
e pericol de confuzie.
10
Propriet ati ale functiei de repartitie. 1) Exist a si are valori ntre 0 si
1.
2) E continu a la dreapta si cresc atoare. Mai mult, avem:
1

() := lim
ro
1

(r) = 0 si 1

() := lim
ro
1

(r) = 1.
3) Dac a a, / R a. . a < /, atunci
1 (a < A _ /) := 1 (. \[a < A (.) _ /) = 1

(/) 1

(a) .
Aceast a relatie rezult a din
1 (A _ /) = 1 (A _ a) 1 (a < A _ /) .
Exemplul 2.1. Fie A o variabil a aleatoare discret a cu valorile 1, 1, 2, 8
luate cu probabilit atile
l
d
,
l
S
,
l
S
, respectiv
l
2
. Pe scurt not amA ~
_
1 1 2 8
l
d
l
S
l
S
l
2
_
.
Avem
1

(r) =
_

_
0, pentru r < 1;
l
d
, pentru 1 _ r < 1;
3
S
, pentru 1 _ r < 2;
l
2
, pentru 2 _ r < 8;
1, pentru r _ 8.
Gracul lui 1

este dat mai jos.


Este tipic pentru functia de repartitie a unei variabile aleatoare discrete s a
creasc a de la 0 la 1 "n trepte".
11
Exemplul 2.2. O functie de repartitie tipic a pentru o variabil a aleatoare
continu a este reprezentat a grac mai jos.
Ea nu are salturi sau discontinuit ati ca n cazul unei variabile aleatoare
discrete. Probabilitatea ca A s a aib a o valoare ntr-un anumit interval este
dat a de proprietatea 3) a functiei de repartitie. Din grac
1 (1 < A _ 1) = 1

(1) 1

(1) = 0, 8 0, 4 = 0, 4.
Avem 1 (A = a) = 0, \a R.
Observatie. Se poate deni functia de repartitie si ca 1

: R R, 1

(r) =
1 (A < r). n acest caz propriet atile 1) si 2) r amn valabile cu exceptia faptului
c a functia de repartitie este continu a la stnga si nu la dreapta, iar proprietatea
3) devine
3) Dac a a, / R a. . a < /, atunci
1 (a _ A < /) = 1

(/) 1

(a) .
Propriet ati ale densit atii. 1) )

(r) = 1
t

(r) , \r n care 1

este
derivabil a.
2)
1

(r) =
_
r
o
)

(n) dn, \r R.
3)
_
o
o
)

(r) dr = 1.
4) Dac a a, / R a. . a < /, atunci
1 (a < A _ /) = 1

(/) 1

(a) =
_
b
o
)

(r) dr.
Exemplul 2.3. Un exemplu de densitate e reprezentat a grac mai jos.
12
Dup a cum indic a propriet atile 3) si 4), aria total a de sub curb a este 1 si
suprafata hasurat a de la a la / e egal a cu 1 (a < A _ /).
Observatie. Cunoasterea densit atii sau a functiei de repartitie
caracterizeaz a complet o variabil a aleatoare continu a.
Exemplul 2.4. Fie a 0. O variabil a aleatoare A a c arei densitate este
)

(r) =
_
ac
or
, pentru r 0;
0, altfel,
se numeste repartizata exponen tial (de parametru a). Avem )

(r) _ 0, \r
R si
_
o
o
)

(r) dr =
_
0
o
0dr
_
o
0
ac
or
dr = 0 c
or
[
o
0
= 1,
deci )

veric a proprietatea 3).


Dac a r < 0, atunci
_
r
o
)

(n) dn =
_
r
o
0dn = 0.
Dac a r _ 0, atunci
_
r
o
)

(n) dn =
_
0
o
0dn
_
r
0
ac
ou
dn = 0 c
ou
[
r
0
= 1 c
or
.
Deci, din proprietatea 2) avem
1

(r) =
_
0, pentru r < 0;
1 c
or
, pentru r _ 0.
Gracul densit atii e dat n gura (a), iar al functiei de repartitie n gura
(b) de mai jos.
13
Calcul am unele probabilit ati folosind )

.
1 (0 < A _ 1) e egal a cu aria de sub gracul lui )

de la r = 0 la r = 1,
dup a cum se arat a n gura (a). Avem
1 (0 < A _ 1) =
_
l
0
)

(r) dr = c
or
[
l
0
= 1 c
o
.
14
1 (A 8) e obtinut a calculnd aria de sub gracul lui )

la dreapta lui
r = 8, deci
1 (A 8) =
_
o
3
)

(r) dr = c
or
[
o
3
= c
3o
.
Aceleasi probabilit ati pot obtinute din 1

astfel:
1 (0 < A _ 1) = 1

(1) 1

(0) = 1 c
o
0 = 1 c
o
,
1 (A 8) = 1

() 1

(8) = 1
_
1 c
3o
_
= c
3o
.
Mai observ am c a 1 (0 < A _ 1) = 1 (0 _ A _ 1) pentru variabile aleatoare
continue, deoarece 1 (A = 0) = 0.
Denitia 2.6. Fie A variabil a aleatoare discret a. Functia j

: R
R, j

(r) = 1 (A = r) := 1 (. \[A (.) = r) se numeste func tia masa de


probabilitate a lui A, sau, pe scurt, masa lui A.
Din nou indicele A e folosit pentru a identica variabila aleatoare asociat a.
Exemplul 2.5. Functia mas a de probabilitate a variabilei aleatoare A ~
_
1 1 2 8
l
d
l
S
l
S
l
2
_
din exemplul 2.1 e reprezentat a mai jos.
Observatii. 1) Dac a A e variabil a aleatoare discret a cu multimea cel mult
num arabil a de valori r
l
, r
2
, ... luate cu probabilit ati nenule, atunci:
0 < j

(r
I
) _ 1, \i;

I
j

(r
I
) = 1;
j

(r) = 0, \r , r
l
, r
2
, ... .
15
2) Ca si 1

, specicarea lui j

caracterizeaz a complet variabila aleatoare


discret a A. Mai mult, presupunnd r
l
< r
2
< ..., relatiile dintre 1

si j

sunt
j

(r
l
) = 1

(r
l
) ,
j

(r
I
) = 1

(r
I
) 1

(r
Il
) , \i 1,
1

(r) =

I]r1r
j

(r
I
) , \r R.
3) Specicarea lui j

se face de obicei dnd numai valorile pozitive, n restul


punctelor subntelegndu-se c a e 0.
2.4 Momentele unei variabile aleatoare
Fie A variabil a aleatoare discret a cu valorile r
l
, r
2
, ... si functia mas a de
probabilitate j

sau continu a cu densitatea )

.
Denitia 2.7. Num arul real
1 (A) :=
_

I
r
I
j

(r
I
) , pentru A discret a;
_
o
o
r)

(r) dr, pentru A continu a,


dac a exist a, se numeste media lui A si se mai noteaz a :

sau simplu :.
Denitia 2.8. Fie : N
+
. Num arul real
c
n
:= 1 (A
n
) =
_

I
r
n
I
j

(r
I
) , pentru A discret a;
_
o
o
r
n
)

(r) dr, pentru A continu a,


dac a exist a, se numeste momentul de ordinul : al lui A.
Observatie. Media este momentul de ordinul 1.
Exemplul 2.6. Fie A ~
_
1 1 2 8
l
d
l
S
l
S
l
2
_
din exemplul 2.1.
1 (A) = (1)
l
d
1
l
S
2
l
S
8
l
2
=
l
d

l
S

l
d

3
2
=
l
S

3
2
=
l3
S
.
Exemplul 2.7. Timpul de asteptare A (n minute) al unui client la un
automat de bilete are densitatea
)

(r) =
_
2c
2r
, pentru r 0;
0, altfel.
Determinati timpul mediu de asteptare.
Integrnd prin p arti avem
1 (A) =
_
o
o
r)

(r) dr =
_
0
o
0dr
_
o
0
r2c
2r
dr = 0
_
o
0
r
_
c
2r
_
t
dr =
rc
2r
[
o
0

_
o
0
c
2r
dr = 0
l
2
c
2r
[
o
0
=
l
2
minut.
Propriet ati ale mediei. Dac a c R este o constant a si A si 1 sunt
variabile aleatoare pe acelasi cmp de probabilitate (\, /, 1), atunci:
16
1 (c) = c,
1 (cA) = c1 (A) ,
1 (A 1 ) = 1 (A) 1 (1 ),
1 (A) _ 1 (1 ), dac a A _ 1 (i.e. A (.) _ 1 (.) , \. \).
Denitia 2.9. Fie A variabil a aleatoare. Se numeste mediana a lui A o
valoare r
0
a lui A a. . 1 (A _ r
0
) =
l
2
sau, dac a o astfel de valoare nu exist a,
valoarea r
0
a lui A a. . 1 (A < r
0
) <
l
2
si 1 (A _ r
0
)
l
2
.
Media lui A poate s a nu existe, dar exist a cel putin o median a.
n comparatie cu media, mediana e uneori preferat a ca m asur a a tendintei
centrale cnd repartitia e asimetric a, n particular cnd sunt un num ar mic de
valori extreme n repartitie. De exemplu, vorbim de mediana veniturilor ca
o bun a m asur a a tendintei centrale a venitului personal pentru o populatie.
Aceasta e o m asur a mai bun a dect media, deoarece mediana nu e asa sensibil a
la un num ar mic de venituri extrem de mari sau venituri extrem de mici ca
media.
Exemplul 2.8. Fie T timpul dintre emisiile de particule la un atom ra-
dioactiv. Este stabilit c a T e o variabil a aleatoare cu repartitie exponential a,
adic a
)
T
(t) =
_
`c
X|
, pentru t 0;
0, altfel,
unde ` e o constant a pozitiv a. Variabila aleatoare T se numeste timpul de
viat a al atomului si o m asur a medie a acestui timp de viat a este timpul de
njum at atire, denit ca mediana lui T. Astfel, timpul de njum at atire t e g asit
din
1 (T _ t) =
l
2
==
_
r
o
)
T
(t) dt =
l
2
== 1 c
Xr
=
l
2
== c
Xr
=
l
2
== t =
In 2
X
.
Observ am c a viata medie 1 (T) este
1 (T) =
_
o
o
t)
T
(t) dt =
l
X
(se calculeaz a analog ca la exemplul 2.7).
Denitia 2.10. Fie A variabil a aleatoare. Se numeste modul sau moda a
lui A
a) o valoare r
I
luat a de A a. . j

(r
I
) j

(r
Il
) si j

(r
I
) j

(r
Il
),
dac a A e discret a cu valorile r
l
< r
2
< ...;
b) un punct de maxim local al lui )

, dac a A e continu a.
Un modul este astfel o valoare a lui A corespunz atoare unui vrf n functia
mas a de probabilitate sau n densitate.
Termenul distribu tie unimodala se refer a la o functie de repartitie a unei
variabile aleatoare care are un modul unic.
Media, mediana si modulul coincid atunci cnd o repartitie unimodal a este
simetric a.
Denitia 2.11. Fie : N
+
si A variabil a aleatoare de medie :. Momentul
centrat de ordinul : al lui A este
17
j
n
= 1 ((A :)
n
) =
_

I
(r
I
:)
n
j

(r
I
) , pentru A discret a;
_
o
o
(r :)
n
)

(r) dr, pentru A continu a.


Denitia 2.12. Fie A variabil a aleatoare.Varian ta sau dispersia lui A este
momentul centrat de ordinul 2 al lui A, j
2
. Se noteaz a cu o
2

sau simplu o
2
sau ar (A).
Valori mari ale lui o
2

implic a o ntindere mare a valorilor lui A n jurul


mediei. Reciproc, valori mici ale lui o
2

implic a o concentrare a valorilor lui


A n jurul mediei. n cazul extrem cnd o
2

= 0, A = : cu probabilitatea 1
(ntreaga mas a a distributiei e concentrat a n medie).
Propozitie. Relatia dintre dispersia si momentele lui A este
o
2
= c
2
:
2
.
Demonstratie. o
2
= 1
_
(A :)
2
_
= 1
_
A
2
2:A :
2
_
= 1
_
A
2
_

2:1 (A) :
2
= c
2
2:
2
:
2
= c
2
:
2
.
Alte propriet ati ale dispersiei. ar (A) _ 0,
ar (A c) = ar (A) , \c R,
ar (cA) = c
2
ar (A) , \c R.
Fie A variabil a aleatoare de medie :. Se numeste devia tie standard a lui A
o

=
_
1
_
(A :)
2
_
.
Un avantaj al folosirii lui o

n locul lui o
2

este c a o

are aceeasi unitate


de m asur a ca media. De aceea poate comparat a cu media pe aceeasi scal a
pentru a obtine o m asur a a gradului de mpr astiere.
Un num ar adimensional (f ar a unitate de m asur a) care caracterizeaz a m-
pr astierea relativ la medie si care faciliteaz a compararea variabilelor aleatoare
de unit ati diferite este coecientul de varia tie denit de

=
o

.
Exemplul 2.9. Fie A ~
_
1 1 2 8
l
d
l
S
l
S
l
2
_
din exemplul 2.1. S a deter-
min am o
2

.
n exemplul 2.6 am v azut c a :

=
l3
S
. Avem
1
_
A
2
_
= (1)
2

l
d
1
2

l
S
2
2

l
S
8
2

l
2
=
l
d

l
S

l
2

9
2
=
3
S
=
d3
S
.
o
2

= 1
_
A
2
_
:
2

=
d3
S

l69
6d
=
3ddl69
6d
=
l75
6d
.
Exemplul 2.10. Determin am dispersia lui A cu )

(r) =
_
2c
2r
, pentru r _ 0;
0, altfel.
.
n exemplul 2.7 am v azut c a :

=
l
2
. Avem, integrnd prin p arti
1
_
A
2
_
=
_
o
o
r
2
)

(r) dr =
_
0
o
0dr
_
o
0
r
2
2c
2r
dr = 0
_
o
0
r
2
_
c
2r
_
t
dr =
r
2
c
2r
[
o
0

_
o
0
2rc
2r
dr = 0
l
2
=
l
2
, ultima integral a ind calculat a la
18
exemplul 2.7.
Deci
o
2

= 1
_
A
2
_
:
2

=
l
2

l
d
=
l
d
.
Coecientul de asimetrie denit de

l
=

3
c
3
d a o m asur a a simetriei unei distributii. Este pozitiv cnd o distributie
unimodal a are o coad a dominant a la dreapta (adic a modulul este la stnga
mediei) si negativ n caz contrar. Este 0 cnd o distributie e simetric a n jurul
mediei. De fapt, o distributie simetric a n jurul mediei are toate momentele
centrate de ordin impar 0. n gurile (a), (b) si (c) sunt reprezentate densit ati
cu
l
0,
l
= 0, respectiv
l
< 0.
19
Gradul de aplatizare a distributiei lng a vrfuri poate m asurat de coe-
cientul de exces denit de

2
=

4
c
4
8.
Un
2
0 implic a un vrf ascutit n vecin atatea modulului unei distributii
unimodale, iar
2
< 0 implic a, de regul a, un vrf turtit.
2.4.1 Inegalitatea lui Cebsev
Teorema 2.1. (Inegalitatea lui Cebsev) Fie A variabil a aleatoare cu media
:

si deviatia standard o

,= 0. Atunci
20
1 ([A :

[ _ /o

) _
1
/
2
, (2.1)
pentru orice / 0.
Demonstratie. Presupunem A continu a. Din denitie avem
o
2

=
_
o
o
(r :

)
2
)

(r) dr _
_
]rn

]|c

(r :

)
2
)

(r) dr _
/
2
o
2

_
]rn

]|c

(r) dr = /
2
o
2

1 ([A :

[ _ /o

) .
Rezult a relatia (2.1). Demonstratia este similar a cnd A este discret a.
21
3 Independenta variabilelor aleatoare. Densi-
tate de repartitie conditionat a si formula lui
Bayes pentru densit ati de repartitie. Covari-
ant a si corelatie
3.1 Independenta variabilelor aleatoare
Toate variabilele aleatoare sunt considerate pe acelasi cmp de probabilitate
(\, /, 1), dac a nu se specic a altfel.
Denitia 3.1. a) Func tia de reparti tie comuna a variabilelor aleatoare A
si 1 este denit a de
1
Y
(r, j) = 1 (A _ r 1 _ j) .
b) Func tia de reparti tie comuna a variabilelor aleatoare A
l
, A
2
, ..., A
n
este
denit a de
1
12...r
(r
l
, r
2
, ..., r
n
) = 1 (A
l
_ r
l
A
2
_ r
2
... A
n
_ r
n
) .
Propriet ati 3.1. a) 1
Y
(r, j) _ 0, \r, j R.
b) 1
Y
e cresc atoare n r si j.
c) 1
Y
e continu a la dreapta n raport cu r si j.
d) 1
Y
(, ) = 1
Y
(, j) = 1
Y
(r, ) = 0, \r, j R.
e) 1
Y
(, ) = 1.
f) 1
Y
(r, ) = 1

(r) , \r R.
g) 1
Y
(, j) = 1
Y
(j) , \j R.
h) \r
l
, r
2
, j
l
, j
2
R a. . r
l
< r
2
si j
l
< j
2
,
1 (r
l
< A _ r
2
j
l
< 1 _ j
2
) = 1
Y
(r
2
, j
2
)1
Y
(r
l
, j
2
)1
Y
(r
2
, j
l
)
1
Y
(r
l
, j
l
) .
Demonstr am de exemplu f):
1
Y
(r, ) = 1 (A _ r 1 _ ) = 1 (A _ r \) = 1 (A _ r) = 1

(r) , \r
R.
Propriet ati similare se pot deduce pentru 1
12...r
.
Forma general a a lui 1
Y
poate vizualizat a din propriet atile d)-g). n cazul
cnd A si 1 sunt discrete 1
Y
seam an a cu un colt al unor trepte neregulate,
ca n gura de mai jos.
22
Creste de la 0 la n altimea de 1 n directia dinspre cadranul 3 spre cadranul
1. Cnd A si 1 sunt continue 1
Y
este o suprafat a neted a cu aceleasi tr as aturi.
Propriet atile f) si g) arat a c a functiile de repartitie ale variabilelor aleatoare
individuale, numite func tii de reparti tie marginale, pot calculate din functia
de repartitie comun a a lor. Reciproca nu este n general adev arat a. O situatie
important a cnd reciproca este adev arat a este cnd A si 1 sunt independente.
Denitia 3.2. a) Variabilele aleatoare A si 1 sunt independente dac a si
numai dac a 1 (A _ r 1 _ j) = 1 (A _ r) 1 (1 _ j) , \r, j R.
b) Variabilele aleatoare A
l
, A
2
, ..., A
n
sunt independente dac a si numai dac a
1 (A
l
_ r
l
A
2
_ r
2
... A
n
_ r
n
) = 1 (A
l
_ r
l
) 1 (A
2
_ r
2
) ...1 (A
n
_ r
n
) , \r
l
, r
2
, ..., r
n

R.
c) Fie 1 multime innit a. Variabilele aleatoare (A
I
)
I1
sunt independente
== (A
I
)
I
sunt independente, \J 1 nit a.
Observatii. a) A si 1 sunt independente ==
1
Y
(r, j) = 1

(r) 1
Y
(j) , \r, j R.
b) A
l
, A
2
, ..., A
n
sunt independente ==
1
12...r
(r
l
, r
2
, ..., r
n
) = 1
1
(r
l
) 1
2
(r
2
) ...1
r
(r
n
) , \r
l
, r
2
, ..., r
n
R.
c) A si 1 sunt independente ==
23
1 (r
l
< A _ r
2
j
l
< 1 _ j
2
) = 1 (r
l
< A _ r
2
) 1 (j
l
< 1 _ j
2
) , \r
l
, r
2
, j
l
, j
2

R a. . r
l
< r
2
si j
l
< j
2
.
Demonstratie. a), b) Evident.
c) 1 (r
l
< A _ r
2
j
l
< 1 _ j
2
) =
1
Y
(r
2
, j
2
) 1
Y
(r
l
, j
2
) 1
Y
(r
2
, j
l
) 1
Y
(r
l
, j
l
) =
1

(r
2
) 1
Y
(j
2
) 1

(r
l
) 1
Y
(j
2
) 1

(r
2
) 1
Y
(j
l
) 1

(r
l
) 1
Y
(j
l
) =
(1

(r
2
) 1

(r
l
)) (1
Y
(j
2
) 1
Y
(j
l
)) = 1 (r
l
< A _ r
2
) 1 (j
l
< 1 _ j
2
) .
n general:
A
l
, A
2
, ..., A
n
sunt independente == 1
_
n

I=l
A
I

I
_
=
n

I=l
1 (A
I

I
) , \
l
, ...,
n
intervale sau multimi cu un singur element din R.
Aici A
I

I
= . \[A
I
(.)
I
.
Denitia 3.3. a) Func tia masa de probabilitate comuna a variabilelor
aleatoare discrete A si 1 este denit a de
j
Y
(r, j) = 1 (A = r 1 = j) , \r, j R.
b) Fie : variabile aleatoare discrete A
l
, A
2
, ..., A
n
. Func tia masa de proba-
bilitate comuna a lor este denit a de
j
12...r
(r
l
, r
2
, ...r
n
) = 1 (A
l
= r
l
A
2
= r
2
... A
n
= r
n
) , \r
l
, r
2
, ..., r
n
R.
Propriet ati 3.2. Fie A si 1 variabile aleatoare discrete care iau o multime
cel mult num arabil a de perechi de valori (r
I
, j

) , i, , = 1, 2, ... cu probabilit ati


nenule.
a) j
Y
(r, j) = 0 peste tot, exceptnd punctele (r
I
, j

) , i, , = 1, 2, ... unde
ia valori egale cu probabilitatea comun a 1 (A = r
I
1 = j

) .
b) 0 < j
Y
(r
I
, j

) _ 1;
c)

I

j
Y
(r
I
, j

) = 1;
d)

I
j
Y
(r
I
, j) = j
Y
(j) ;
e)

j
Y
(r, j

) = j

(r) ;
f) 1
Y
(r, j) =

I]r1r

]
j
Y
(r
I
, j

) , \r, j R.
Acum j

(r) si j
Y
(j) sunt numite func tii masa de probabilitate marginale.
Propriet ati similare pot scrise pentru j
12...r
.
Denitia 3.4. a) Func tia densitate de probabilitate comuna a dou a variabile
aleatoare continue A si 1 este denit a de derivata partial a
)
Y
(r, j) =
0
2
1
Y
0r0j
(r, j) ,
dac a exist a.
24
b) Fie vectorul aleator Xcu componente variabilele aleatoare continue A
l
, A
2
, ..., A
n
care au functia de repartitie comun a
1
X
(x) = 1 (A
l
_ r
l
A
2
_ r
2
... A
n
_ r
n
) ,
unde x este vectorul cu componentele r
l
, r
2
, ..., r
n
.
Func tia densitate comuna corespunz atoare este
)
X
(x) =
0
n
1
X
0r
l
0r
2
...0r
n
(x) ,
dac a derivatele partiale indicate exist a.
Propriet ati 3.3. a) )
Y
(r, j) _ 0 deoarece 1
Y
este cresc atoare n r si j.
b) Din denitie,
1
Y
(r, j) = 1 (A _ r 1 _ j) =
_

o
_
r
o
)
Y
(n, ) dnd.
c) Dac a r
l
< r
2
si j
l
< j
2
, atunci
1 (r
l
< A _ r
2
j
l
< 1 _ j
2
) =
_
2
1
_
r2
r1
)
Y
(r, j) drdj.
d) )
Y
deneste o suprafat a deasupra planului (r, j). Dup a cum indic a
proprietatea 3.3 c), probabilitatea ca variabilele aleatoare A si 1 s a se ae
ntr-o anumit a suprafat a 1 este egal a cu volumul de sub suprafata )
Y
m arginit
de acea regiune, ca n gura de mai jos.
25
e)
_
o
o
_
o
o
)
Y
(r, j) drdj = 1.
Aceast a proprietate rezult a din proprietatea b) punnd r si j si
arat a c a volumul total de sub suprafata )
Y
este 1.
f)
_
o
o
)
Y
(r, j) dj = )

(r) .
Aceasta rezult a din
1

(r) = 1
Y
(r, ) =
_
o
o
_
r
o
)
Y
(n, j) dndj,
derivnd n raport cu r.
g)
_
o
o
)
Y
(r, j) dr = )
Y
(j) .
Densit atile )

si )
Y
din propriet atile f) si g) se numesc densita ti marginale
ale lui A, respectiv 1.
3.2 Densitate de repartitie conditionat a si formula lui Bayes
pentru densit ati de repartitie
Func tia de reparti tie condi tionata a variabilei aleatoare A dat ind c a alt a
variabil a aleatoare 1 ia valoarea j este denit a de
26
1
Y
(r[j) = 1 (A _ r[1 = j) .
Fie A si 1 variabile aleatoare continue. Func tia densitate de reparti tie
condi tionata (pe scurt densitate condi tionata) a lui A dat ind 1 = j, no-
tat a )
Y
(r[j) este derivata functiei de repartitie conditionat a corespunz atoare
ei, adic a
)
Y
(r[j) =
JJ
`
(r])
Jr
.
Avem, pentru r
l
< r
2
si j
l
< j
2
:
1 (r
l
< A _ r
2
[j
l
< 1 _ j
2
) =
1(r1<r2|1<Y 2)
1(1<Y 2)
=
_

2

1
_
o
2
o
1
}
`
(u,u)JuJu
_

2

1
}
`
(u)Ju
.
Punnd r
l
, r
2
= r, j
2
j
l
= j, obtinem:
1
Y
(r[j) =
_
o
1
}
`
(u,)Ju
}
`
()
,
cu conditia ca )
Y
(j) ,= 0.
Mai departe obtinem
(3.1) )
Y
(r[j) =
JJ
`
(r])
Jr
=
}
`
(r,)
}
`
()
, dac a )
Y
(j) ,= 0.
Pentru functia de repartitie conditionat a nu e valabil a o formul a asem an a-
toare, adic a 1
Y
(r[j) ,=
J
`
(r,)
J
`
()
.
Cnd A si 1 sunt independente avem 1
Y
(r[j) = 1

(r) si din relatia (3.1)


obtinem
)
Y
(r[j) = )

(r)
si
)
Y
(r, j) = )

(r) )
Y
(j) ,
adic a densitatea comun a e egal a cu produsul densit atilor marginale cnd A
si 1 sunt independente.
Mai avem si
1
Y
(r[j) =
_
r
o
)
Y
(n[j) dn.
Extinderile pentru mai multe variabile aleatoare sunt imediate. Plecnd de
la
1 ( 1 C) = 1 ([1 C) 1 (1[C) 1 (C)
pentru trei evenimente , 1 si C, avem n cazul a trei variabile aleatoare
continue A, 1 si 7,
)
Y 2
(r, j, .) = )
Y 2
(r[j, .) )
Y 2
(j[.) )
2
(.) .
Pentru cazul a : variabile aleatoare continue A
l
, A
2
, ..., A
n
, componente ale
vectorului aleator X, putem scrie
)
X
(x) = )
12...r
(r
l
[r
2
, ..., r
n
) )
2...r
(r
2
[r
3
, ..., r
n
) ...)
r1r
(r
nl
[r
n
) )
r
(r
n
) .
Dac a A
l
, A
2
, ..., A
n
sunt independente, obtinem
)
X
(x) = )
1
(r
l
) )
2
(r
2
) ...)
r
(r
n
) .
Formula lui Bayes pentru densit ati de repartitie. Dac a A si 1 sunt
variabile aleatoare continue, atunci
27
)
Y
(r[j) =
}
`
(]r)}

(r)
}
`
()
=
}
`
(]r)}

(r)
_
1
1
}
`
(])}

()J
,
dac a )
Y
(j) ,= 0.
3.3 Covariant a si corelatie
Fie A si 1 variabile aleatoare discrete care iau o multime cel mult num arabil a
de perechi de valori (r
I
, j

) , i, , = 1, 2, ... cu probabilit ati nenule sau variabile


aleatoare continue.
Denitia 3.5. Fie :, : N.
a) Momentele comune c
nn
ale variabilelor aleatoare A si 1 sunt date de,
dac a exist a,
c
nn
= 1 (A
n
1
n
) =
_

r
n
I
j
n

j
Y
(r
I
, j

) , dac a A si 1 sunt discrete,


_
o
o
_
o
o
r
n
j
n
)
Y
(r, j) drdj, dac a A si 1 sunt continue.
b) Similar, momentele centrate comune ale lui A si 1 , cnd exist a, sunt date
de
j
nn
= 1 ((A :

)
n
(1 :
Y
)
n
) .
Observatii. Cu notatiile folosite aici, mediile lui A si 1 sunt c
l0
, respectiv,
c
0l
. De exemplu, folosind denitia 3.5 a) pentru A si 1 continue, obtinem
c
l0
= 1 (A) =
_
o
o
_
o
o
r)
Y
(r, j) drdj =
_
o
o
r
_
o
o
)
Y
(r, j) djdr =
_
o
o
r)

(r) dr,
unde )

este densitatea marginal a a lui A. Astfel vedem c a acest rezultat


e identic cu cel din cazul unei singure variabile aleatoare.
Aceast a observatie este adev arat a si pentru dispersiile individuale. Ele sunt
j
20
, respectiv j
02
, si pot g asite din denitia 3.5 b) cu nlocuiri corespunz atoare
pentru : si :. Ca si n cazul unei singure variabile aleatoare avem
j
20
= c
20
c
2
l0
sau o
2

= c
20
:
2

,
respectiv
j
02
= c
02
c
2
0l
sau o
2
Y
= c
02
:
2
Y
.
Denitia 3.6. Se numeste covarian ta a lui A si 1
j
ll
= co (A, 1 ) = 1 ((A :

) (1 :
Y
)) .
Covarianta e o m arime a interdependentei lui A si 1.
Proprietatea 3.4. Covarianta e legat a de c
nn
prin
j
ll
= c
ll
c
l0
c
0l
= c
ll
:

:
Y
.
Demonstratie. j
ll
= 1 ((A :

) (1 :
Y
)) = 1 (A1 :
Y
A :

1 :

:
Y
) =
1 (A1 ) :
Y
1 (A) :

1 (1 ) :

:
Y
= c
ll
c
l0
c
0l
c
l0
c
0l
c
l0
c
0l
=
c
ll
c
l0
c
0l
.
Denitia 3.7. Coecientul de corela tie al lui A si 1 este
j = j (A, 1 ) =
j
ll
_
j
20
j
02
=
j
ll
o

o
Y
.
28
Proprietatea 3.5. [j[ _ 1.
Demonstratie. [t (A :

) 1 :
Y
[
2
_ 0, \t R == 1
_
[t (A :

) 1 :
Y
[
2
_
=
j
20
t
2
2j
ll
t j
02
_ 0, \t R == ^ = 4j
2
ll
4j
20
j
02
_ 0 == j
2
ll
_
j
20
j
02
== [j[ _ 1.
Coecientul de corelatie este f ar a dimensiune. El este si independent de
origine, adic a \a
l
, a
2
, /
l
, /
2
R cu a
l
, a
2
0 se poate demonstra c a
j (a
l
A /
l
, a
2
1 /
2
) = j (A, 1 ) .
Proprietatea 3.6. Dac a A si 1 sunt independente, atunci
j
ll
= 0 si j = 0.
Demonstratie. Fie A si 1 continue.
c
ll
= 1 (A1 ) =
_
o
o
_
o
o
rj)
Y
(r, j) drdj
indep.
=
_
o
o
_
o
o
rj)

(r) )
Y
(j) drdj =
_
o
o
r)

(r) dr
_
o
o
j)
Y
(j) dj = :

:
Y
== j
ll
= c
ll
:

:
Y
= 0 ==
j = 0.
Similar se poate demonstra dac a A si 1 sunt discrete.
Dac a A si 1 sunt independente, atunci
(3.2) 1 (q (A) /(1 )) = 1 (q (A)) 1 (/(1 )) ,
dac a mediile exist a.
Cnd coecientul de corelatie al dou a variabile aleatoare se anuleaz a, spunem
c a ele sunt necorelate.
Observatii. 1) A si 1 sunt necorelate == 1 (A1 ) = 1 (A) 1 (1 ).
(Rezult a din denitii si proprietatea 3.4.)
2) A, 1 independente == A, 1 necorelate. (Rezult a din denitie si
proprietatea 3.6.)
3) Reciproca nu e adev arat a.
Exemplul 3.1. Fie A ~
_
2 1 1 2
l
d
l
d
l
d
l
d
_
si 1 = A
2
.
Avem 1 ~
_
1 4
l
2
l
2
_
,
j
Y
(r, j) =
_

_
l
d
, pentru (r, j) = (2, 4) ;
l
d
, pentru (r, j) = (1, 1) ;
l
d
, pentru (r, j) = (1, 1) ;
l
d
, pentru (r, j) = (2, 4) ,
:

= (2)
l
d
(1)
l
d
1
l
d
2
l
d
= 0,
:
Y
= 1
l
2
4
l
2
=
5
2
,
c
ll
= (2) 4
l
d
(1) 1
l
d
1 1
l
d
2 4
l
d
= 0.
Deci
j
ll
= c
ll
:

:
Y
= 0 == j =

11
c

c
`
= 0 == A si 1 sunt necorelate.
Pe de alt a parte,
1 (A _ 2 1 _ 1) = 1
Y
(2, 1) = 0,
iar
1 (A _ 2) 1 (1 _ 1) = 1

(2) 1
Y
(1) =
l
d

l
2
=
l
S
,
deci
29
1 (A _ 2 1 _ 1) ,= 1 (A _ 2) 1 (1 _ 1) == A si 1 nu sunt inde-
pendente.
Coecientul de corelatie m asoar a interdependenta liniar a a variabilelor aleatoare,
adic a acuratetea cu care o variabil a aleatoare poate aproximat a printr-o
functie liniar a de cealalt a. Pentru a vedea asta, consider am problema
aproxim arii unei variabile aleatoare A printr-o functie liniar a de o a doua vari-
abil a aleatoare 1 , a1 /, unde a si / sunt alese a. . eroarea medie p atratic a c
denit a de
(3.3) c = 1
_
[A (a1 /)[
2
_
este minim a. Avem
c = 1
_
A
2
a
2
1
2
/
2
2aA1 2/A 2a/1
_
= 1
_
A
2
_
a
2
1
_
1
2
_

/
2
2a1 (A1 ) 2/:

2a/:
Y
,
Jt
Jo
= 2a1
_
1
2
_
21 (A1 ) 2/:
Y
,
Jt
Jb
= 2/ 2:

2a:
Y
.
Rezolvnd sistemul
_
Jt
Jo
= 0,
Jt
Jb
= 0,
obtinem c a minimul e atins cnd
a =
c

c
`
si
/ = :

a:
Y
.
nlocuind aceste valori n relatia (3.3) obtinem eroarea medie p atratic a
minim a o
2

_
1 j
2
_
. Vedem c a o potrivire exact a n sensul mediei p atratice e
atins a cnd [j[ = 1 si aproximarea liniar a este cea mai rea cnd j = 0. Cnd
j = 1, A si 1 se numesc pozitiv perfect corelate, n sensul c a valorile pe care le
iau sunt pe o dreapt a cu pant a pozitiv a; ele sunt negativ perfect corelate cnd
j = 1 si valorile lor se a a pe o dreapt a cu pant a negativ a. Aceste dou a cazuri
extreme sunt ilustrate n gura de mai jos.
30
Valoarea lui [j[ descreste cnd mpr astierea valorilor n jurul dreptelor creste.
n demonstratia faptului c a [j[ _ 1, am obtinut
j
2
ll
_ j
20
j
02
.
Folosind un procedeu similar, putem ar ata de asemenea c a
1
2
(A1 ) _ 1
_
A
2
_
1
_
1
2
_
.
Ultimele dou a relatii sunt inegalita tile lui Schwarz.
Denitia 3.8. Fie Xun vector coloan a aleator cu componentele A
l
, A
2
, ..., A
n
si m
X
vectorul coloan a avnd componente mediile lui A
l
, A
2
, ..., A
n
. Matricea
de covarian ta este
= 1
_
(Xm
X
) (Xm
X
)
T
_
=
_
_
_
_
_
ar (A
l
) co (A
l
, A
2
) ... co (A
l
, A
n
)
co (A
2
, A
l
) ar (A
2
) ... co (A
2
, A
n
)
.
.
.
.
.
.
.
.
.
.
.
.
co (A
n
, A
l
) co (A
n
, A
2
) ... ar (A
n
)
_
_
_
_
_
.
este o matrice :: cu avnd pe diagonal a variante si n afara diagonalei
covariante. Deoarece co (A
I
, A

) = co (A

, A
I
), matricea de covariant a este
simetric a.
Urm atorul rezultat este o generalizare a relatiei (3.2).
Teorem a. Dac a A
l
, A
2
, ..., A
n
sunt independente, atunci
1 (q
l
(A
l
) q
2
(A
2
) ...q
n
(A
n
)) = 1 (q
l
(A
l
)) 1 (q
2
(A
2
)) ...1 (q
n
(A
n
)) ,
unde q

(A

) este o functie arbitrar a de A

. Se presupune c a toate mediile


care sunt scrise exist a.
Propozitie. Fie A
l
, A
2
, ..., A
n
variabile aleatoare si 1 =
n

I=l
A
I
. Atunci
31
o
2
Y
=
n

I=l
o
2
1
2

lI<n
co (A
I
, A

) .
n particular, dac a A
l
, A
2
, ..., A
n
sunt independente, atunci
o
2
Y
=
n

I=l
o
2
1
.
Lema 3.1. Dac a X e un vector aleator si Y =X, atunci
co (Y) = co (X)
T
.
32
4 Principalele repartitii discrete si propriet atile
lor
4.1 Repartitia binomial a
O succesiune de probe e f acut a astfel nct
a) pentru ecare prob a sunt doar dou a rezultate posibile, s a spunem succes
si esec;
b) probabilit atile aparitiei acestor rezultate r amn aceleasi pe durata pro-
belor;
c) probele sunt independente.
Probele f acute n aceste conditii se numesc probe Bernoulli.
Not am evenimentul "succes" cu o si evenimentul "esec" cu 1. Fie 1 (o) = j
si 1 (1) = , unde j = 1. Rezultate posibile din efectuarea unei succesiuni
de probe Bernoulli pot reprezentate simbolic prin
o o 1 1 o 1 o o o ... 1 1
1 o 1 o o 1 1 1 o ... o 1
.
.
.
si, datorit a independentei, probabilit atile acestor rezultate posibile sunt usor
de calculat. De exemplu,
1 (o o 1 1 o 1 ...1 1) = 1 (o) 1 (o) 1 (1) 1 (1) 1 (o) 1 (1) ...1 (1) 1 (1) =
jjj....
Repartitia unei variabile aleatoare A reprezentnd num arul de succese
dintr-o succesiune de : probe Bernoulli, indiferent de ordinea n care apar este
frecvent de interes considerabil. E clar c a A e o variabil a aleatoare discret a
care ia valorile 0, 1, 2, ..., :. Pentru a determina functia mas a de probabilitate,
consider am j

(/), probabilitatea de a avea exact / succese n : probe. Acest


eveniment poate ap area n la fel de multe moduri precum num arul de submultimi
de / elemente ale unei multimi de : elemente. De aici, num arul de moduri n
care / succese se pot ntmpla n : probe este
C
|
n
=
n!
|!(n|)!
si probabilitatea asociat a cu ecare mod este j
|

n|
. Din acest motiv avem
j

(/) = C
|
n
j
|

n|
, / = 0, 1, 2, ..., :. (4.1)
Datorit a similarit atii cu termenii binomului lui Newton
(a /)
n
=
n

|=0
C
|
n
a
|
/
n|
,
repartitia denit a de relatia (4.1) se numeste reparti tie binomiala. Ea are
doi parametri, anume : si j. O variabil a aleatoare A avnd repartitie binomial a
se noteaz a A ~ 1(:, j).
Forma unei repartitii binomiale e determinat a de valorile celor doi parametri
ai ei, : si j. n general, : se d a ca o parte a problemei si j trebuie estimat din
observatii.
33
O reprezentare a functiei mas a de probabilitate j

(/) pentru : = 10 si
j = 0, 2 este n gura de mai jos.
Vrful repartitiei se va muta spre dreapta cnd j creste, atingnd o repartitie
simetric a cnd j = 0, . Consider am raportul

(|)

(|l)
=
c
!
r

!
j
r!
c
!1
r

!1
j
r!+1
=
r!
!!(r!)!

r!
(!1)!(r!+1)!
j
=
(n|l)
|j
= 1
(n|l)|j
|j
=
1
(nl)|(j)
|j
= 1
(nl)|
|j
.
Observ am c a j

(/) j

(/ 1) == / < (: 1) j si j

(/) < j

(/ 1) ==
/ (: 1) j. Deci, dac a denim /
+
Z prin
(: 1) j 1 < /
+
_ (: 1) j,
valoarea lui j

(/) creste de la / = 0 si si atinge valoarea maxim a cnd


/ = /
+
, apoi descreste. Dac a (: 1) j Z, valoarea maxim a se atinge n
ambele j

(/
+
1) si j

(/
+
). /
+
este astfel un modul al acestei repartitii si se
numeste adesea "cel mai probabil num ar de succese".
j

(/) este tabelat a ca o functie de : si j. Tabelul A.1 din gurile de mai


jos d a valorile ei pentru : = 2, 8, ..., 10 si j = 0, 01; 0, 0; ...; 0, .
34
35
Calculul lui j

(/) devine greu cnd : devine mare; se foloseste aproximarea


Poisson a repartitiei binomiale.
Functia de repartitie 1

(r) pentru o repartitie binomial a este dat a de


1

(r) =
|r|

|=0
C
|
n
j
|

n|
,
unde [r[ este partea ntreag a a lui r.
Propriet ati 4.1. Fie A ~ 1(:, j). Atunci
a) :

= :j;
b) o
2

= :j.
Demonstratie. a) :

=
n

|=0
/j

(/) =
n

|=l
/C
|
n
j
|

n|
=
n

|=l
/
n!
|!(n|)!
j
|

n|
=
n

|=l
:
(nl)!
(|l)!(nl(|l))!
j
|

n|
= :j
n

|=l
C
|l
nl
j
|l

nl(|l)
|l=I
= :j
nl

I=0
C
I
nl
j
I

nlI
=
:j (j )
nl
= :j.
b) 1
_
A
2
_
=
n

|=0
/
2
j

(/) =
n

|=l
/
2
C
|
n
j
|

n|
= :j
n

|=l
/C
|l
nl
j
|l

nl(|l)
=
:j
_
n

|=l
(/ 1) C
|l
nl
j
|l

nl(|l)

|=l
C
|l
nl
j
|l

nl(|l)
_
|l=I, a)
=
36
:j
_
nl

I=0
iC
I
nl
j
I

nlI
1
_
= :j (:
Y
1)
a)
= :j [(: 1) j 1[ ,
unde 1 ~ 1(: 1, j) .
o
2

= 1
_
A
2
_
:
2

= :j [(: 1) j 1[ :
2
j
2
= :
2
j
2
:j
2
:j :
2
j
2
=
:j (1 j) = :j.
Faptul c a :

= :j sugereaz a c a parametrul j poate estimat pe baza


valorii medii a datelor observate.
O alt a formulare care duce la repartitia binomial a este denirea variabilei
aleatoare A

, , = 1, 2, ..., :, reprezentnd rezultatul celei de-a ,-a probe Bernoulli.


Dac a punem
A

=
_
0, dac a proba , este un esec,
1, dac a proba , este un succes,
atunci
A = A
l
A
2
... A
n
d a num arul de succese n : probe. Din denitie, A
l
, A
2
, ..., A
n
sunt variabile
aleatoare independente.
Deoarece
1 (A

) = 0 1 j = j, , = 1, 2, ..., :,
rezult a c a
1 (A) = 1 (A
l
A
2
... A
n
) = 1 (A
l
)1 (A
2
)...1 (A
n
) = j j ... j
. .
n
=
:j,
ceea ce coincide cu proprietatea 4.1 a).
Analog, deoarece
1
_
A
2

_
= 0
2
1
2
j = j, , = 1, 2, ..., :,
o
2

= 1
_
A
2

_
[1 (A

)[
2
= j j
2
= j (1 j) = j, , = 1, 2, ..., :,
din independenta lui A
l
, A
2
, ..., A
n
rezult a c a
o
2

=
n

=l
o
2

= j j ... j
. .
n
= :j,
ceea ce coincide cu proprietatea 4.1 b).
Teorema 4.1. Fie A
l
~ 1(:
l
, j) si A
2
~ 1(:
2
, j) variabile aleatoare
independente si 1 = A
l
A
2
. Atunci 1 ~ 1(:
l
:
2
, j) .
4.2 Repartitia hipergeometric a
Fie 7 variabila aleatoare care d a num arul de bile negre care sunt extrase cnd
un esantion de : bile este extras (f ar a revenire) dintr-un lot de : bile avnd
:
l
bile negre si :
2
bile albe (:
l
:
2
= :). Functia mas a de probabilitate a
variabilei aleatoare 7 este
j
2
(/) =
c
!
r
1
c
r!
rr
1
c
r
r
, / = 0, 1, ..., min(:
l
, :) .
Spunem c a 7 are reparti tie hipergeometrica.
Se poate ar ata c a
:
2
=
nn1
n
,
o
2
2
=
nn1(nn1)(nn)
n
2
(nl)
.
37
4.3 Repartitia geometric a
Fie A num arul de probe Bernoulli pn a la (si incluznd) prima aparitie a succe-
sului. A e variabil a aleatoare discret a avnd ca valori toate numerele naturale.
Functia ei mas a de probabilitate este
j

(/) = 1
_
_
1 1 ... 1
. .
|l
o
_
_
= 1 (1) 1 (1) ...1 (1)
. .
|l
1 (o) =
|l
j, / =
1, 2, ....
Aceast a repartitie este cunoscut a ca reparti tia geometrica cu parametrul j,
unde numele provine de la similaritatea cu termenii progresiei geometrice. O
reprezentare a lui j

(/) e dat a mai jos.


Functia de repartitie corespunz atoare este
1

(r) =
|r|

|=l
j

(/) =
|r|

|=l

|l
j = j
|r|

|=l

|l
= (1 )
|r|

|=l

|l
= 1
|r|
,
dac a r _ 1
si
1

(r) = 0, dac a r < 1.


Media si dispersia lui A se calculeaz a astfel:
1 (A) =
o

|=l
/
|l
j = j
o

|=l
J
Jj
_

|
_
= j
J
Jj
o

|=l

|
= j
J
Jj
_
lim
no
n

|=l

|l
_
=
j
J
Jj
_
lim
no
lj
r+1
lj
_
= j
J
Jj
_
j
lj
_
= j
ljj
(lj)
2
=
l

.
1
_
A
2
_
=
o

|=l
/
2

|l
j = j
_
o

|=l
/
|l

|=2
/ (/ 1)
|2
_
=
l

j
o

|=2
J
2
Jj
2
_

|
_
=
38
l

j
_
J
2
Jj
2
o

|=2

|
_
=
l

j
J
2
Jj
2
_
j
lj

_
=
l

j
J
2
Jj
2
_
j
2
lj
_
=
l

j
J
Jj
_
2j(lj)j
2
(lj)
2
_
=
l

j
J
Jj
_
2jj
2
(lj)
2
_
=
l

j
(22j)(lj)
2
(2jj
2
)2(lj)
(lj)
4
=
l


2((lj)
2
2jj
2
)
(lj)
2
=
l


2j
(lj)
2
.
o
2

= 1
_
A
2
_
[1 (A)[
2
=
l


2j

2

l

2
=
2jl

2
=
j

2
=
l

2
.
4.4 Repartitia binomial a negativ a
O generalizare a repartitiei geometrice este repartitia variabilei aleatoare A
reprezentnd num arul de probe Bernoulli necesare pentru aparitia celui de-al
r-lea succes, unde r N
+
este dat.
Pentru a determina j

(/) n acest caz, e evenimentul ca primele / 1


probe s a dea exact r 1 succese, indiferent de ordinea lor, si 1 evenimentul ca
un succes s a apar a la proba /. Atunci, datorit a independentei,
j

(/) = 1 ( 1) = 1 () 1 (1) .
Avem
1 (1) = j
si
1 () = j
2
(r 1) = C
:l
|l
j
:l

|:
,
unde 7 ~ 1(/ 1, j) .
Obtinem
j

(/) = C
:l
|l
j
:

|:
, / = r, r 1, .... (4.2)
Repartitia denit a de relatia (4.2) se numeste repartitie binomiala negativa
sau Pascal si are parametrii r si j. Este adesea notat a prin 1(r, j). Observ am
c a ea se reduce la repartitia geometric a cnd r = 1.
O variant a a acestei repartitii se obtine punnd 1 = A r. Variabila
aleatoare 1 este num arul de probe Bernoulli dincolo de r necesare pentru re-
alizarea celui de-al r-lea succes, sau poate interpretat a ca num arul de esecuri
nainte de cel de-al r-lea succes.
Functia mas a de probabilitate a lui 1 , j
Y
(:), e obtinut a din relatia (4.2)
nlocuind / prin :r :
j
Y
(:) = C
:l
n:l
j
:

n
= C
n
n:l
j
:

n
, : = 0, 1, 2, ....
Variabila aleatoare 1 are p;roprietatea convenabil a c a valorile ei ncep de la
0 si nu de la r ca valorile lui A.
Reamintind o denitie mai general a a coecientului binomial
C

o
=
o(ol)...(ol)
!
, \a R, , N
+
,
avem
C
n
n:l
=
(n:l)!
n!(:l)!
=
(n:l)(n:2)...:
n!
= (1)
n (:)(:l)...(:nl)
n!
=
(1)
n
C
n
:
.
De aici,
j
Y
(:) = C
n
:
j
:
()
n
, : = 0, 1, 2, ...,
39
acesta ind motivul pentru numele "repartitie binomial a negativ a".
Media si dispersia variabilei aleatoare A pot determinate observnd c a A
poate reprezentat a prin
A = A
l
A
2
... A
:
,
unde A

este num arul de probe dintre cel de-al (, 1)-lea si (inclusiv) cel
de-al ,-lea succes. Aceste variabile aleatoare sunt independente, ecare avnd
repartitie geometric a n care media este
l

si dispersia
l

2
. De aceea media
sumei este suma mediilor si, din independent a, dispersia sumei este suma dis-
persiilor, adic a:
:

=
:

, o
2

=
:(l)

2
.
Deoarece 1 = A r, avem:
:
Y
=
:

r, o
2
Y
=
:(l)

2
.
4.5 Repartitia multinomial a
O generalizare a probelor Bernoulli este s a relax am cererea s a e doar dou a
rezultate posibile pentru ecare prob a. Fie r rezultate posibile pentru ecare
prob a, notate cu 1
l
, 1
2,
..., 1
:
si e 1 (1
I
) = j
I
, i = 1, 2, ..., r cu j
l
j
2
...j
:
=
1.
Dac a variabila aleatoare A
I
, i = 1, 2, ..., r, reprezint a num arul de 1
I
ntr-o
succesiune de : probe, functia mas a de probabilitate comun a a lui A
l
, A
2
, ..., A
:
este dat a de
j
12...r
(/
l
, /
2
, ..., /
:
) =
:!
/
l
!/
2
!.../
:
!
j
|1
l
j
|2
2
...j
|r
:
, (4.3)
unde /

= 0, 1, 2, ...; , = 1, 2, ..., r, si /
l
/
2
... /
:
= :.
Demonstratia formulei 4.3. Consider am evenimentul de a avea exact /
l
rezultate 1
l
, /
2
rezultate 1
2
, ..., /
:
rezultate 1
:
n : probe. Acest eveniment
poate ap area n la fel de multe moduri precum num arul de moduri de a plasa
/
l
litere 1
l
, /
2
litere 1
2
, ..., /
:
litere 1
:
n : cutii a. . ecare cutie s a aib a
exact o liter a. De aici, num arul de moduri c autat este produsul dintre num arul
de moduri de a plasa /
l
litere 1
l
n : cutii, num arul de moduri de a plasa /
2
litere n cele : /
l
cutii r amase neocupate, s.a.m.d., adic a
C
|1
n
C
|2
n|1
...C
|r
n|1|2...|r1
=
n!
|1!(n|1)!

(n|1)!
|2!(n|1|2)!
...
(n|1|2...|r1)!
|r!0!
=
n!
|1!|2!...|r!
si probabilitatea asociat a cu ecare mod, datorit a independentei, este j
|1
l
j
|2
2
...j
|r
:
.
Relatia (4.3) deneste functia mas a de probabilitate comun a a reparti tiei
multinomiale, numit a asa deoarece are forma temenului general din expansiunea
multinomial a a lui (j
l
j
2
... j
:
)
n
. Repartitia multinomial a se reduce la
repartitia binomial a cnd r = 2, si cu j
l
= j, j
2
= , /
l
= / si /
2
= : /.
Deoarece A
I
~ 1(:, j
I
), avem
:
1
= :j
I
, o
2
1
= :j
l
(1 j
I
) ,
si se poate ar ata c a avem
co (A
I
, A

) = :j
I
j

, i, , = 1, 2, ..., r, i ,= ,.
40
4.6 Repartitia Poisson
Aceast a repartitie este folosit a n modelele matematice pentru a descrie, ntr-un
interval de timp specic, evenimente ca emisia de particule c dintr-o substant a
radioactiv a, sosirile de pasageri la un aeroport, distributia particulelor de praf
ntr-un anumit spatiu, sosirile de masini la o intersectie, si alte fenomene simi-
lare.
Pentru a xa ideile, consider am problema sosirii pasagerilor la o statie de
autobuz ntr-un interval de timp specicat. Not am A (0, t) num arul de sosiri
din intervalul de timp [0, t); A (0, t) e o variabil a aleatoare discret a lund valori
posibile 0, 1, 2, ..., iar repartitia ei depinde de t. Functia ei mas a de probabilitate
se scrie
j
|
(0, t) = 1 [A (0, t) = /[ , / = 0, 1, 2, ..., (4.4)
pentru a ar ata dependenta ei explicit a de t.
Facem urm atoarele ipoteze de baz a:
1) Dac a t
l
< t
2
< ... < t
n
, atunci variabilele aleatoare A (t
l
, t
2
) , A (t
2
, t
3
) , ..., A (t
nl
, t
n
)
sunt independente, adic a, numerele de pasageri care sosesc n intervale de timp
care nu se suprapun sunt independente unul de cel alalt.
2) Pentru ^t sucient de mic,
j
l
(t, t ^t) = i^t o (^t) , (4.5)
unde o (^t) este o functie a. .
lim
.|0
o (^t)
^t
= 0. (4.6)
Aceast a ipotez a spune c a, pentru ^t sucient de mic, probabilitatea de a
avea exact o sosire este proportional a cu lungimea ^t. Parametrul i din relatia
(4.5) este numit densitatea medie sau rata medie a sosirilor.
3) Pentru ^t sucient de mic,
o

|=2
j
|
(t, t ^t) = o (^t) . (4.7)
Aceast a conditie implic a faptul c a probabilitatea de a avea dou a sau mai
multe sosiri ntr-un interval sucient de mic este neglijabil a.
Din relatiile (4.5) si (4.7) rezult a
j
0
(t, t ^t) = 1
o

|=l
j
|
(t, t ^t) = 1 i^t o (^t) . (4.8)
Determin am j
0
(0, t). Pentru a nu avea nicio sosire n intervalul [0, t ^t),
trebuie s a nu avem nicio sosire n ambele subintervale [0, t) si [t, t ^t). Da-
torit a independentei sosirilor n intervale nesuprapuse avem
41
j
0
(0, t ^t) = j
0
(0, t) j
0
(t, t ^t) = j
0
(0, t) [1 i^t o (^t)[ . (4.9)
Rearanjnd relatia (4.9) si mp artind ambii membri prin ^t obtinem
0(0,|.|)0(0,|)
.|
= j
0
(0, t)
_
i
o(.|)
.|
_
.
Punnd ^t 0, obtinem ecuatia diferential a
dj
0
(0, t)
dt
= ij
0
(0, t) .
Solutia ei satisf acnd conditia initial a j
0
(0, 0) = 1 este
j
0
(0, t) = c
i|
. (4.10)
Determinarea lui j
l
(0, t) este similar a. O sosire n intervalul [0, t ^t) poate
ndeplinit a doar avnd 0 sosiri n subintervalul [0, t) si o sosire n [t, t ^t),
sau o sosire n [0, t) si nicio sosire n [t, t ^t). De aici avem
j
l
(0, t ^t) = j
0
(0, t) j
l
(t, t ^t) j
l
(0, t) j
0
(t, t ^t) . (4.11)
nlocuind relatiile (4.5), (4.8) si (4.10) n relatia (4.11) obtinem
j
l
(0, t ^t) = c
i|
(i^t o (^t))j
l
(0, t) (1 i^t o (^t)) ==
1(0,|.|)1(0,|)
.|
=
c
i|
_
i
o(.|)
.|
_
j
l
(0, t)
_
i
o(.|)
.|
_
.
Punnd ^t 0, obtinem
dj
l
(0, t)
dt
= ij
l
(0, t) ic
i|
, j
l
(0, 0) = 0, (4.12)
ceea ce conduce la
j
l
(0, t) = itc
i|
. (4.13)
Continund n acest fel, g asim pentru termenul general
j
|
(0, t) =
(it)
|
c
i|
/!
, / = 0, 1, 2, .... (4.14)
Relatia (4.14) d a functia mas a de probabilitate a lui A (0, t), num arul de
sosiri n intervalul de timp [0, t) cu conditiile de mai sus si deneste o reparti tie
Poisson cu parametrii i si t. Parametrii i si t pot nlocuiti de un singur
parametru ` = it si astfel putem scrie
j
|
(0, t) =
`
|
c
X
/!
, / = 0, 1, 2, .... (4.15)
Media lui A (0, t) este
42
1 (A (0, t)) =
o

|=0
/j
|
(0, t) = c
X
o

|=0
/`
|
/!
= `c
X
o

|=l
`
|l
(/ 1)!
= `c
X
c
X
= `.
(4.16)
Calcul am si dispersia:
1
_
A
2
(0, t)
_
=
o

|=0
/
2
j
|
(0, t) = c
X
o

|=0
|
2
X
!
|!
= c
X
o

|=l
|X
!
(|l)!
= c
X
_
o

|=l
(|l)X
!
(|l)!

o

|=l
X
!
(|l)!
_
=
c
X
_
`
2
o

|=2
X
!2
(|2)!
`
o

|=l
X
!1
(|l)!
_
= c
X
_
`
2
c
X
`c
X

= `
2
`.
o
2
(0,|)
= 1
_
A
2
(0, t)
_
[1 (A (0, t))[
2
= `. (4.17)
Din relatia (4.16) se vede c a parametrul i este egal cu media num arului de
sosiri pe unitatea de timp; numele "rata medie a sosirilor" pentru i este astfel
justicat. n determinarea valorii acestui parametru ntr-o problem a dat a, el
poate estimat din observatii prin
n
n
, unde : este num arul observat de sosiri
n : unit ati de timp. Similar, deoarece ` = it, ` reprezint a num arul mediu de
sosiri n intervalul de timp [0, t) .
Din relatiile (4.16) si (4.17) se vede c a media si dispersia cresc cnd rata
medie creste. n gura al aturat a e reprezentat a functia mas a de probabilitate
pentru repartitia Poisson pentru
a) ` = 0, ,
b) ` = 1,
c) ` = 4.
43
n general, dac a examin am raportul

!
(0,|)

!1
(0,|)
, cum am f acut la repartitia
binomial a, se arat a c a j
|
(0, t) creste si apoi descreste cnd / creste,
atingndu-si maximul cnd / = [`[ .
44
Tabelul A.2 din gurile de mai jos d a functia mas a de probabilitate a repar-
titiei Poisson pentru anumite valori ale lui ` dintre 0, 1 si 10. Pentru ` = 10,
avem j
23
(0, t) = 0, 0002 si j
2d
(0, t) = 0, 0001. n loc de "`t" n tabelul A.2 se
va citi "`".
45
Teorema 4.2. Dac a A si 1 sunt variabile aleatoare independente avnd
repartitii Poisson cu parametrii `
l
, respectiv `
2
, atunci variabila aleatoare 1 =
A
l
A
2
are repartitie Poisson cu parametrul `
l
`
2
.
Propozitie. Dac a o variabil a aleatoare A este repartizat a Poisson cu para-
metrul `, atunci o variabil a aleatoare 1 , care este obtinut a din A selectnd
doar cu probabilitatea j ecare din itemii num arati de A, este de asemenea
repartizat a Poisson cu parametrul j`.
Demonstratie. Dat ind c a A = r, repartitia lui 1 este binomial a cu
parametrii r si j, deci:
1 (1 = /[A = r) = C
|
:
j
|
(1 j)
:|
, / = 0, 1, 2, ..., r.
Din teorema probabilit atii totale avem
1 (1 = /) =
o

:=|
1 (1 = /[A = r) 1 (A = r) =
o

:=|
C
|
:

!
(l)
r!
X
r
t

:!
:=n|
=
o

n=0
C
|
n|

!
(l)
r
X
r+!
t

(n|)!
=
(X)
!
t

|!
o

n=0
|(l)X|
r
n!
=
(X)
!
t

t
(1)
|!
=
(X)
!
t

|!
, / =
0, 1, 2, ....
Aceast a propozitie poate folosit a, de exemplu, pentru situatii n care 1 e
num arul de urmasi ai unei insecte cnd A e num arul de ou a depuse, sau 1 e
num arul de uragane dezastruoase cnd A e num arul total de uragane care apar
ntr-un an dat, sau 1 e num arul pasagerilor care nu pot urca la bordul unui
zbor dat din cauza suprarezerv arilor, cnd A este num arul de sosiri de pasageri.
4.6.1 Repartitii spatiale
Repartitia Poisson a fost dat a pe baza sosirilor n timp, dar acelasi argument se
aplic a la repartitia punctelor n spatiu. Consider am repartitia defectelor
ntr-un material. Num arul de defecte ntr-un anumit volum are o repartitie
Poisson dac a ipotezele 1-3 sunt valide, cu intervalele de timp nlocuite de volume,
46
si este rezonabil s a presupunem c a probabilitatea de a g asi / defecte n orice
regiune depinde numai de volum si nu de forma regiunii.
Alte situatii zice n care repartitia Poisson e folosit a includ num arul de
bacterii pe o plac a Petri, repartitia fertilizatoarelor mpr astiate cu avionul pe
un cmp si repartitia poluantilor industriali ntr-o regiune dat a.
4.6.2 Aproximarea Poisson a repartitiei binomiale
Fie A ~ 1(:, j).
j

(/) = C
|
n
j
|
(1 j)
n|
, / = 0, 1, 2, ..., :.
Consider am cazul cnd : si j 0 a. . :j = ` r amne xat.
Observ am c a ` este media lui A, care e presupus a a r amne constant a. Atunci
j

(/) = C
|
n
_
X
n
_
|
_
1
X
n
_
n|
, / = 0, 1, 2, ..., :.
Deoarece : , factorialele :! si (: /)! care apar n C
|
n
=
n!
|!(n|)!
pot
aproximate prin formula lui Stirling
:!
~
= (2)
1
2
c
n
:
n
1
2
.
Obtinem
j

(/)
~
=
(2t)
1
2 t
r
n
r+
1
2
|!(2t)
1
2 t
r+!
(n|)
r!+
1
2
_
X
n
_
|
_
1
X
n
_
n|
=
X
!
|!t
!
_
n
n|
_
n|
1
2
_
1
X
n
_
n|
.
Deoarece
lim
no
_
1
c
n
_
n
= c
c
,
avem
lim
no
_
n
n|
_
n|
1
2
=
l
IIn
r!1
(l
!
r
)
r!+
1
2
=
l

IIn
r!1
(l
!
r
)
r

lim
r!1
r!+
1
2
r
=
l
t
!
,
lim
no
_
1
X
n
_
n|
=
_
lim
no
_
1
X
n
_
n
_
IIn
r!1
r!
r
= c
X
.
Obtinem
j

(/)
~
=
X
!
t

|!
, / = 0, 1, ....
Aceast a aproximare Poisson a repartitiei binomiale usureaz a calculele si se
foloseste n practic a atunci cnd : 10 si j < 0, 1. Repartitia Poisson si
g aseste aplicabilitate n acest caz n probleme n care probabilitatea aparitiei
unui eveniment este mic a. De aceea, repartitia Poisson se mai numeste adesea
reparti tia evenimentelor rare.
47
5 Principalele repartitii continue, cu densit ati
de repartitie si propriet atile lor
5.1 Repartitia uniform a
O variabil a aleatoare continu a A are reparti tie uniforma pe un interval de la
a la / (/ a) dac a este egal probabil s a ia orice valoare din acest interval.
Densitatea lui A este constant a pe intervalul [a, /[ si are forma
)

(r) =
_
c, dac a r [a, /[ ,
0, altfel.
Deoarece
_
o
o
)

(r) dr =
_
o
o
0dr
_
b
o
cdr
_
o
b
0dr = 0 cr[
b
o
0 = c (/ a) ,
din conditia
_
o
o
)

(r) dr = 1
obtinem
c =
l
bo
.
Deci
)

(r) =
_
l
bo
, dac a r [a, /[ ,
0, altfel.
(5.1)
Dup a cum vedem din gura de mai jos, este constant a pe [a, /[ si n altimea
trebuie s a e
l
bo
pentru ca aria de sub densitate s a e 1.
Functia de repartitie a lui A este
48
1

(r) =
_
r
o
)

(n) dn =
_

_
_
r
o
0dn = 0, dac a r < a;
_
o
o
0dn
_
r
o
l
bo
dn = 0
u
bo
[
r
o
=
ro
bo
, dac a r [a, /[ ,
_
o
o
0dn
_
b
o
l
bo
dn
_
r
b
0dn = 0 1 0 = 1, dac a r /.
Deci
1

(r) =
_
_
_
0, dac a r < a;
ro
bo
, dac a r [a, /[ ,
1, dac a r /,
(5.2)
ceea ce este prezentat grac n gura urm atoare.
Media si dispersia lui A sunt
:

=
_
o
o
r)

(r) dr =
_
o
o
0dr
_
b
o
r
bo
dr
_
o
b
0dr = 0
r
2
2(bo)
[
b
o

0 =
b
2
o
2
2(bo)
=
ob
2
.
o
2

=
_
o
o
(r :

)
2
)

(r) dr =
_
o
o
0dr
l
bo
_
b
o
(r :

)
2
dr
_
o
b
0dr = 0
l
bo

(rn

)
3
3
[
b
o
0 =
(bn

)
3
(on

)
3
3(bo)
=
(bo)[(bn

)
2
(bn

)(on

)(on

)
2
[
3(bo)
=
l
3
_
_
bo
2
_
2

_
bo
2
_
2

_
bo
2
_
2
_
=
(bo)
2
l2
.
Repartitia uniform a e una dintre cele mai simple repartitii si e folosit a de
obicei n situatii unde nu este niciun motiv de a da probabilit ati inegale la valori
posibile luate de variabila aleatoare pe un interval dat. De exemplu, timpul de
sosire a unui zbor poate considerat uniform repartizat pe un anumit interval
de timp, sau repartitia distantei de la locul nc arc aturilor vii pe un pod la
un suport terminal poate reprezentat a adecvat printr-o repartitie uniform a
49
pe ntinderea podului. Adesea se ataseaz a o repartitie uniform a unei anumite
variabile aleatoare din cauza unei lipse de informatie, dincolo de cunoasterea
intervalului de valori.
5.1.1 Repartitia uniform a bivariat a
Fie variabila aleatoare A repartizat a uniform pe un interval [a
l
, /
l
[ si variabila
aleatoare 1 repartizat a uniform pe un interval [a
2
, /
2
[. Mai mult, presupunem
c a sunt independente. Atunci densitatea comun a a lui A si 1 este
)
Y
(r, j) = )

(r) )
Y
(j) =
_
l
(b1o1)(b2o2)
, pentru r [a
l
, /
l
[ si j [a
2
, /
2
[ ,
0, altfel.
(5.3)
Ia forma unei suprafete plate m arginit a de [a
l
, /
l
[ de-a lungul axei Or si
[a
2
, /
2
[ de-a lungul axei Oj.
5.2 Repartitia Gaussian a sau normal a
Cea mai important a repartitie n teorie ca si n aplicatii este repartitia Gaussiana
sau normala. O variabil a aleatoare A este Gaussiana sau normala dac a are
densitatea de forma
)

(r) =
1
o
_
2
oxp
_

(r :)
2
2o
2
_
, < r < , (5.4)
unde : si o sunt doi parametri, cu o 0. Alegerea acestor simboluri
particulare ca parametri va deveni clar a imediat.
Functia de repartitie corespunz atoare este
1

(r) =
1
o
_
2
_
r
o
oxp
_

(n :)
2
2o
2
_
dn, < r < . (5.5)
Ea nu poate exprimat a analitic, dar poate evaluat a numeric pentru orice
r.
Densitatea si functia de repartitie din relatiile (5.4) si (5.5) sunt reprezentate
grac n gurile (a), respectiv (b) urm atoare, pentru : = 0 si o = 1.
50
Gracul densit atii )

n acest caz particular este o curb a n form a de clopot,


simetric a n jurul originii.
Calcul am media si dispersia lui A.
1 (A) =
_
o
o
r)

(r) dr =
l
c
_
2t
_
o
o
roxp
_

(rn)
2
2c
2
_
dr
or
o
=u
=
l
c
_
2t
_
o
o
(on :) oxp
_

u
2
2
_
odn =
l
_
2t
_

_
o
_
o
o
noxp
_

n
2
2
_
. .
impar a
dn :
_
o
o
oxp
_

u
2
2
_
dn
_

_
=
l
_
2t
_
o 0 :
_
2
_
= :.
ar (A) =
_
o
o
[r 1 (A)[
2
)

(r) dr =
l
c
_
2t
_
o
o
(r :)
2
oxp
_

(rn)
2
2c
2
_
dr
or
o
=u
=
l
c
_
2t
_
o
o
o
2
n
2
oxp
_

u
2
2
_
odn =
c
2
_
2t
_
o
o
n
2
oxp
_

u
2
2
_
dn =
c
2
_
2t
_
o
o
n
_
oxp
_

u
2
2
__
t
dn =

c
2
_
2t
_
noxp
_

u
2
2
_
[
o
o

_
o
o
oxp
_

u
2
2
_
dn
_
=
c
2
_
2t
_
0
_
2
_
= o
2
.
Vedem astfel c a cei doi parametri : si o din repartitie sunt media si re-
spectiv deviatia standard a lui A. Aceast a observatie justic a alegerea noastr a
a acestor simboluri speciale pentru ei si de asemenea pune n evident a o pro-
prietate important a a repartitiei normale - cunoasterea mediei si dispersiei ei
51
caracterizeaz a complet repartitia normal a. Deoarece ne vom referi frecvent la
repartitia normal a, o not am cu
_
:, o
2
_
. De exemplu, A ~ (0, 0) nseamn a
c a A are densitatea dat a de relatia (5.4) cu : = 0 si o = 8.
Se poate ar ata c a momentele centrate ale lui A ~
_
:, o
2
_
sunt
j
n
=
_
0, dac a : e impar,
1 8 ... (: 1) o
n
, dac a : e par.
(5.6)
Coecientul de exces
2
=

4
c
4
8 este 0 pentru o repartitie normal a. De
aceea ea este folosit a ca repartitie de referint a pentru
2
.
5.2.1 Teorema limit a central a
Marea important a practic a a repartitiei normale provine din teorema limit a
central a.
Teorema 5.1 (Teorema limit a central a) (Lindberg 1922). Fie A
n

un sir de variabile aleatoare independente si identic repartizate cu mediile : si


dispersiile o
2
. Fie
1 =
n

=l
A

,
si e variabila aleatoare normalizat a 7 denit a ca
7 =
1 ::
o
_
:
.
Atunci functia de repartitie a lui 7, 1
2
(.), converge la (0, 1) cnd :
pentru orice . xat.
Acest rezultat poate extins n cteva directii, incluznd cazurile n care 1
este o sum a de variabile aleatoare dependente si neidentic repartizate.
Teorema limit a central a descrie o clas a foarte general a de fenomene aleatoare
pentru care repartitiile pot aproximate cu repartitia normal a. Cnd pro-
prietatea de a aleator a unui fenomen zic este cumularea a multor efecte
aleatoare aditive mici, el tinde la o repartitie normal a, indiferent de repartitiile
efectelor individuale. De exemplu, consumul de combustibil la toate automo-
bilele unei anumite m arci, presupus fabricate prin procese identice, difer a de
la un automobil la altul. Aceast a proprietate de a aleator provine de la o
larg a varietate de surse, incluznd, printre alte lucruri: inexactit atile inerente
n procesele de fabricare, neuniformit atile n materialele folosite, diferentele n
greutate si alte specicatii, diferente n calitatea combustibilului si diferente
n comportamentul soferilor. Dac a se accept a faptul c a ecare dintre aceste
diferente contribuie la proprietatea de a aleator a consumului de combustibil,
teorema limit a central a ne spune c a el tinde la o repartitie normal a. Din acelasi
motiv, variatiile de temperatur a dintr-o camer a, erorile de citire asociate cu un
instrument, erorile de tintire ale unei anumite arme, s.a.m.d. pot aproximate
rezonabil prin repartitii normale.
52
5.2.2 Tabele de probabilit ati
Datorit a importantei sale, suntem adesea pusi n situatia s a evalu am probabil-
it atile asociate cu o variabil a aleatoare normal a A ~
_
:, o
2
_
, ca
1 (a < A _ /) =
1
o
_
2
_
b
o
oxp
_

(r :)
2
2o
2
_
dr. (5.7)
Integrala de mai sus nu poate calculat a analitic si este n general calcu-
lat a numeric. Pentru comoditate sunt date tabele care ne permit s a calcul am
probabilit ati ca cea din relatia (5.7).
Tabelarea functiei de repartitie pentru repartitia normal a cu : = 0 si o = 1
este dat a n tabelul A.3 din gura urm atoare.
O variabil a aleatoare cu repartitia (0, 1) se numeste variabil a aleatoare
normal a standardizata si o vom nota cu l. Tabelul al aturat d a 1
I
(n) doar
pentru punctele din partea dreapt a a repartitiei (adic a pentru n _ 0). Valorile
corespunz atoare pentru n < 0 sunt obtinute din proprietatea de simetrie a
repartitiei normale standardizate, din relatia
1
I
(n) = 1 1
I
(n) . (5.8)
53
Mai nti, tabelul mpreun a cu relatia (5.8) pot folosite pentru a determina
1 (a < l _ /) pentru orice a si /. De exemplu,
1 (1, < l _ 2, ) = 1
I
(2, )1
I
(1, )
(5.8)
= 1
I
(2, )[1 1
I
(1, )[
tabel
=
0, 0088 1 0, 0882 = 0, 027.
Mai important, tabelul si relatia (5.8) sunt de asemenea suciente pentru a
determina probabilit atile asociate cu variabilele aleatoare normale cu medii si
dispersii arbitrare.
Teorema 5.2. Fie A ~
_
:, o
2
_
. Atunci
n
c
~ (0, 1), adic a
l =
A :
o
. (5.9)
Teorema 5.2 implic a faptul c a, dac a A ~
_
:, o
2
_
, atunci
1 (a < A _ /) = 1 (a < ol : _ /) = 1
_
a :
o
< l _
/ :
o
_
. (5.10)
Valoarea din membrul drept poate g asit a acum din tabel cu ajutorul re-
latiei (5.8), dac a este necesar.
Exemplul 5.1. S a calcul am1 (:/o < A _ :/o), unde A ~
_
:, o
2
_
.
1 (:/o < A _ :/o)
(5.10)
= 1 (/ < l _ /) = 1
I
(/)1
I
(/)
(5.8)
= 21
I
(/)1.
(5.11)
Observ am c a rezultatul din exemplul 5.1 este independent de : si o si
este functie doar de /. Astfel, probabilitatea ca A s a ia valori ntre / deviatii
standard n jurul mediei sale depinde numai de / si este dat a de ecuatia (5.11).
Se vede din tabel c a aproximativ 68, 8/, 0, / si 00, 7/ din aria de sub o
densitate normal a se a a n zonele :o, :2o, respectiv :8o, dup a cum
se vede din gurile (a)-(c) urm atoare.
54
De exemplu, sansele sunt de aproximativ 00, 7/ ca o mostr a selectat a aleator
dintr-o repartitie normal a s a e n regiunea :8o (gura (c)).
5.2.3 Repartitia normal a multivariat a
Dou a variabile aleatoare A si 1 se numesc comun normale dac a densitatea
comun a a lor are forma
)
Y
(r, j) =
1
2o

o
Y
_
1 j
2
oxp
_

1
2 (1 j
2
)
_
_
r :

_
2
2j
(r :

) (j :
Y
)
o

o
Y

_
j :
Y
o
Y
_
2
__
,
(5.12)
unde (, ) < (r, j) < (, ). Relatia (5.12) descrie reparti tia nor-
mala bivariata. Sunt cinci parametri asociati cu ea: :

, :
Y
, o

( 0) , o
Y
( 0) , si j ([j[ _ 1). O reprezentare grac a tipic a a acestei densit ati, pentru
:

= :
Y
= 0 si o

= o
Y
este n gura urm atoare.
55
Densitatea marginal a a variabilei aleatoare A este
)

(r) =
_
o
o
)
Y
(r, j) dj =
1
o

_
2
oxp
_

(r :

)
2
2o
2

_
, < r < .
Astfel, A ~
_
:

, o
2

_
. Similar, 1 ~
_
:
Y
, o
2
Y
_
si j =

`
c

c
`
este
coecientul de corelatie al lui A si 1 . Vedem astfel c a cei cinci parametri
continuti n densitatea bivariat a )
Y
(r, j) reprezint a cinci momente importante
asociate cu variabilele aleatoare. De asemenea observ am c a repartitia normal a
bivariat a este complet caracterizat a de momentele comune de ordinul 1 si 2 ale
lui A si 1 .
Teorema 5.3. Corelatie zero implic a independent a cnd variabilele aleatoare
sunt comun normale.
Demonstratie. Punnd j = 0 n relatia (5.12), obtinem
)
Y
(r, j) =
_
1
o

_
2
oxp
_

(r :

)
2
2o
2

___
1
o
Y
_
2
oxp
_

(r :
Y
)
2
2o
2
Y
__
= )

(r) )
Y
(j) ,
adic a A si 1 sunt independente.
56
Aceast a proprietate nu este valabil a n general.
Avem reparti tie normala multivariata cnd cazul a dou a variabile aleatoare
e extins la cel implicnd : variabile aleatoare.
Fie : variabile aleatoare, A
l
, A
2
, ..., A
n
. Ele se numesc comun normale dac a
densitatea lor comun a e de forma
)
12...r
(r
l
, r
2
, ..., r
n
) = )
X
(x) = (2)

r
2
[A[

1
2
oxp
_

1
2
(x m)
T
A
l
(x m)
_
, < x < ,
unde m
T
= (:
l
, :
2
, ..., :
n
) = (1 (A
l
) , 1 (A
2
) , ..., 1 (A
n
)), A =
_
j
I
_
I,=l,n
este matricea de covariant a a lui X, cu
j
I
= 1 ((A
I
:
I
) (A

)) ,
iar [A[ este determinantul lui A. Din nou vedem c a o repartitie normal a
comun a este complet specicat a de momentele comune de ordinul 1 si 2, aceste
momente determinnd de asemenea momentele comune de ordine mai mari ca 2.
Se poate ar ata c a, n cazul cnd variabilele aleatoare A
l
, A
2
, ..., A
n
au mediile
0, toate momentele de ordin impar ale lor sunt 0, si, pentru : par
1 (A
l
A
2
...A
n
) =

n1,...,nr
1 (A
n1
A
n2
) 1 (A
n2
A
n3
) ...1
_
A
nr1
A
nr
_
.
Suma de mai sus e luat a dup a toate combinatiile posibile de
n
2
perechi de :
variabile aleatoare si are 1 8 ... (: 8) (: 1) termeni.
5.2.4 Sume de variabile aleatoare normale
Teorema 5.4. Fie A
l
, A
2
, ..., A
n
: variabile aleatoare repartizate comun nor-
mal (nu necesar independente). Atunci variabila aleatoare
1 = c
l
A
l
c
2
A
2
... c
n
A
n
este repartizat a normal, unde c
l
, c
2
, ..., c
n
sunt constante.
Teorema 5.5. Fie A
l
, A
2
, ..., A
n
: variabile aleatoare repartizate normal
(nu necesar independente). Atunci variabilele aleatoare 1
l
, 1
2
, ..., 1
n
, unde
1

=
n

|=l
c
|
A
|
, , = 1, 2, ..., :,
sunt repartizate comun normal.
57
5.3 Repartitia lognormal a
Am v azut c a repartitii normale rezult a din sume de multe actiuni aleatoare.
Consider am acum un alt fenomen obisnuit care este rezultanta multor efecte
aleatoare multiplicative. Un exemplu de fenomen multiplicativ este studiul de
oboseal a a materialelor unde avaria intern a a materialului la o anumit a etap a de
nc arcare este o proportie aleatoare din avaria de la etapa precedent a. n biolo-
gie, repartitia m arimii unui organism este alt exemplu pentru care cresterea este
subiectul multor impulsuri, ecare dintre acestea ind proportional cu m arimea
momentan a. Alte exemple includ repartitia m arimii particulelor sub forte de
impact sau impulsive, repartitia vietii componentelor mecanice, repartitia ven-
iturilor personale datorit a ajust arilor anuale, si alte fenomene similare.
S a consider am
1 = A
l
A
2
...A
n
. (5.13)
Suntem interesati de repartitia lui 1 cnd : devine mare, iar variabilele
aleatoare A

, , = 1, 2, ..., :, pot lua numai valori pozitive.


Logaritmnd ambii membri, relatia (5.13) devine
ln1 = lnA
l
lnA
2
... lnA
n
.
Din teorema limit a central a rezult a c a ln1 tinde la o repartitie normal a
cnd : . Repartitia lui 1 este astfel determinat a din
1 = c

, (5.14)
unde A este o variabil a aleatoare normal a.
Denitia 5.1. Fie A ~
_
:

, o
2

_
. Variabila aleatoare 1 = c

se spune
c a are repartitie lognormala.
Densitatea lui 1 este
)
Y
(j) =
_
l
c

_
2t
oxp
_

l
2c
2

(lnj :

)
2
_
, pentru j 0;
0, altfel.
(5.15)
Relatia (5.15) arat a c a 1 are o repartitie unilateral a (adic a ia valori numai
n zona pozitiv a a lui j). Aceast a proprietate o face atractiv a pentru cantit ati
zice care sunt restrictionate s a aib a doar valori pozitive. n plus, )
Y
(j) ia multe
forme diferite pentru valori diferite ale lui :

si o

(o

0). Dup a cum se


vede din gura urm atoare, care d a gracele lui )
Y
pentru :

= 0 si 8 valori
ale lui o
2

, densitatea lui 1 este asimetric a spre dreapta, aceast a caracteristic a


devenind mai pronuntat a cnd o

creste.
58
Parametrii :

si o

care apar n densitatea lui 1 sunt media si deviatia


standard a lui A, sau ln1 , dar nu ale lui 1 . Pentru a obtine o pereche mai
natural a de parametri pentru )
Y
(j), observ am c a, dac a medianele lui A si 1
sunt notate cu 0

, respectiv 0
Y
, denitia medianei unei variabile aleatoare d a
l
2
= 1 (1 _ 0
Y
) = 1 (A _ ln0
Y
) = 1 (A _ 0

) ,
de unde
ln0
Y
= 0

.
Deoarece, datorit a simetriei repartitiei normale,
0

= :

,
putem scrie
:

= ln0
Y
.
Scriind o

= o
In Y
, densitatea lui 1 poate scris a
59
)
Y
(j) =
_
l
c
ln `
_
2t
oxp
_

l
2c
2
ln `
ln
2
_

0
`
__
, pentru j 0;
0, altfel.
n termeni de 0
Y
si o
In Y
, media si dispersia lui 1 sunt
:
Y
= 0
Y
oxp
_
c
2
ln `
2
_
,
o
2
Y
= :
2
Y
_
oxp
_
o
2
In Y
_
1

.
5.3.1 Tabele de probabilit ati
Datorit a leg aturii dintre repartitia normal a si repartitia lognormal a prin re-
latia (5.14), calculele de probabilit ati implicnd o variabil a aleatoare repartizat a
lognormal pot f acute cu ajutorul tabelului de probabilit ati pentru variabile
aleatoare normale.
Consider am functia de repartitie a lui 1 . Avem
1
Y
(j) = 1 (1 _ j) = 1 (A _ lnj) = 1

(lnj) , j 0.
Deoarece media lui A este ln0
Y
si dispersia lui A este o
2
In Y
, avem
1
Y
(j) = 1
I
_
lnj ln0
Y
o
In Y
_
= 1
I
_
1
o
In Y
ln
_
j
0
Y
__
, j 0. (5.16)
Deoarece 1
I
este tabelat a, relatia (5.16) poate folosit a pentru calcule de
probabilit ati asociate cu 1 , cu ajutorul tabelului probabilit atii normale.
5.4 Repartitia gamma si repartitii n leg atur a cu aceasta
Repartitia gamma este unilateral a si densitatea asociat a cu ea este
)

(r) =
_
X
_
I(q)
r
ql
c
Xr
, pentru r 0;
0, altfel,
(5.17)
unde I(j) este functia gamma:
I(j) =
_
o
0
n
ql
c
u
dn,
care este tabelat a, si
I(:) = (: 1)!, \: N
+
.
Parametrii distributiei gamma sunt j si `; ambii sunt pozitivi. Deoarece
repartitia gamma este unilateral a, cantit atile zice care pot lua doar valori poz-
itive sunt frecvent modelate de ea, servind ca model util datorit a versatilit atii
ei n sensul c a o varietate larg a de forme ale densit atii gamma poate obtinut a
variind valorile lui j si `, dup a cum arat a gurile (a) si (b) urm atoare.
60
Observ am din aceste guri c a j determin a forma repartitiei n timp ce `
este un parametru de scar a pentru repartitie. n general, densitatea gamma
este unimodal a, cu vrful n r = 0 pentru j _ 1 si n r =
ql
X
pentru j 1.
Se poate ar ata c a repartitia gamma este un model pentru timpul cerut pen-
tru un total de exact j sosiri Poisson. Datorit a largii aplicabilit ati a sosirilor
Poisson, repartitia gamma are de asemenea numeroase aplicatii.
Functia de repartitie a variabilei aleatoare A avnd repartitia gamma este
1

(r) =
_
_
_
_
r
0
)

(n) dn =
X
_
I(q)
_
r
0
n
ql
c
Xu
dn =
I(q,Xr)
I(q)
, pentru r 0;
0, altfel.
(5.18)
I(j, n) este functia gamma incomplet a,
I(j, n) =
_
u
0
r
ql
c
r
dr,
care este de asemenea tabelat a.
Media si dispersia variabilei aleatoare gamma repartizate A sunt
:

=
j
`
, o
2

=
j
`
2
. (5.19)
61
5.4.1 Repartitia exponential a
Cnd j = 1, densitatea gamma dat a de relatia (5.17) se reduce la forma expo-
nential a
)

(r) =
_
`c
Xr
, pentru r 0;
0, altfel,
(5.20)
unde ` 0 este parametrul repartitiei. Functia de repartitie, media si
dispersia ei se obtin din relatiile (5.18) si (5.19) punnd j = 1:
1

(r) =
_
1 c
Xr
, pentru r _ 0;
0, altfel,
(5.21)
:

=
1
`
, o
2

=
1
`
2
. (5.22)
Timpul ntre sosiri Fie variabila aleatoare A (0, t), num arul de sosiri n
intervalul de timp [0, t) si presupunem c a este repartizat a Poisson. Fie T vari-
abila aleatoare care d a intervalul de timp dintre 2 sosiri succesive. Functia ei
de repartitie este, din denitie
1
T
(t) = 1 (T _ t) =
_
1 1 (T t) , pentru t _ 0;
0, altfel.
Evenimentul T t e echivalent cu evenimentul c a nu e nicio sosire n inter-
valul de timp [0, t), sau A (0, t) = 0. Deoarece, din relatia (4.10), 1 (A (0, t) = 0) =
c
i|
, avem
1
T
(t) =
_
1 c
i|
, pentru t _ 0;
0, altfel.
Comparnd aceast a expresie cu relatia (5.21), putem stabili c a timpul ntre 2
sosiri Poisson succesive are o repartitie exponential a; parametrul i din repartitia
lui T este rata medie a sosirilor Poisson.
Deoarece timpurile ntre sosiri Poisson sunt independente, timpul cerut pen-
tru un total de : sosiri Poisson este o sum a de : variabile aleatoare independente
si repartizate exponential. Fie T

, , = 1, 2, ..., :, timpul ntre sosirile , 1 si ,.


Timpul cerut pentru un total de : sosiri, notat cu A
n
este
A
n
= T
l
T
2
... T
n
,
unde T

, , = 1, 2, ..., :, sunt independente si repartizate exponential cu ace-


lasi parametru i. Se poate ar ata c a A
n
este gamma repartizat a cu j = : si
` = i. Astfel, repartitia gamma este potrivit a pentru a descrie timpul cerut
pentru un total de j sosiri Poisson.
62
Fiabilitatea si legea de defectare exponential a n studiile de abilitate,
timpul pn a la defectarea unui component zic sau un sistem este repartizat
exponential, dac a unitatea se defecteaz a imediat ce un singur eveniment, ca de-
fectarea unui component, apare, presupunnd c a astfel de fenomene se ntmpl a
independent.
Fie variabila aleatoare T, timpul pn a la defectarea unui component sau
sistem. Functia care d a probabilitatea de defectiune n timpul unei cresteri mici
de timp, presupunnd c a nicio defectiune nu a ap arut nainte de acel timp e
notat a cu /(t) si se numeste func tia hazard sau rata defectarii si este denit a
de
/(t) dt = 1 (t < T _ t dt[T _ t) ,
ceea ce d a
/(t) =
)
T
(t)
1 1
T
(t)
. (5.23)
n studiile de abilitate, o functie hazard potrivit a pentru multe fenomene
ia asa numita "form a de cad a", ar atat a n gura urm atoare.
Portiunea initial a a curbei reprezint a "mortalitatea infantil a", atribuibil a
defectelor componente si imperfectiunilor de fabricare. Portiunea relativ con-
stant a a curbei /(t) reprezint a perioada "n uz", n care defectiunea este n-
tmpl atoare. Defectiunea din uzur a de lng a sfrsitul vietii componentului este
ar atat a ca portiunea cresc atoare a curbei /(t). Fiabilitatea sistemului poate
63
optimizat a prin testarea initial a a defectelor, nainte punerea n functiune, pn a
la timpul t
l
, pentru a evita defectarea prematur a, si prin nlocuirea partial a la
timpul t
2
pentru a evita uzura.
Ar at am c a legea de defectare exponential a este potrivit a n timpul perioadei
"n uz" a vietii normale a unui sistem. nlocuind
)
T
(t) = `c
X|
si
1
T
(t) = 1 c
X|
n relatia (5.23) avem
/(t) = `.
Observ am c a parametrul ` din repartitia exponential a joac a rolul unei rate
de defectare constante.
Am v azut c a repartitia gamma este potrivit a pentru a descrie timpul pentru
un total de j sosiri Poisson. n contextul legilor de defectare, repartitia gamma
poate gndit a ca o generalizare a legii de defectare exponential a pentru sisteme
ce se defecteaz a imediat de j evenimente esueaz a, presupunnd c a evenimentele
au loc n concordant a cu legea Poisson. Astfel, repartitia gamma este potrivit a
ca model al timpului pn a la defectare pentru sisteme care au o unitate care
functioneaz a si j 1 unit ati n standby; aceste unit ati intr a n functionare pe
rnd, pe m asur a ce se defecteaz a celelalte si ecare are o repartitie exponential a
a timpului pn a la defectare.
5.4.2 Repartitia chi-p atrat
Alt caz special important al repartitiei gamma este repartitia chi-p atrat (
2
),
obtinut a punnd ` =
l
2
si j =
n
2
n relatia (5.17), unde : N
+
. Repartitia
2
contine astfel un parametru : si are densitatea de forma
)

(r) =
_
l
2
r
2 I(
r
2
)
r
r
2
l
c

o
2
, pentru r 0;
0, altfel.
(5.24)
Parametrul : este num arul de grade de libertate. Utilitatea acestei repartitii
provine din faptul c a o sum a de p atrate de : variabile aleatoare normale stan-
dardizate are o repartitie
2
cu : grade de libertate; adic a, dac a l
l
, l
2
, ..., l
n
sunt independente si repartizate (0, 1), atunci suma
A = l
2
l
l
2
2
... l
2
n
(5.25)
are o repartitie
2
cu : grade de libertate.
Datorit a acestei relatii, repartitia
2
este una dintre principalele unelte n
inferenta statistic a si testarea ipotezelor.
Densitatea din relatia (5.24) este reprezentat a n gura urm atoare pentru
cteva valori ale lui :.
64
Se observ a c a, cnd : creste, forma lui )

(r) devine mai simetric a. Din


relatia (5.25), deoarece A poate exprimat a ca o sum a de variabile aleatoare
identic repartizate, ne astept am ca repartitia
2
s a tind a la o repartitie normal a
cnd : pe baza teoremei limit a central a.
Media si dispersia unei variabile aleatoare A avnd o repartitie
2
cu : grade
de libertate se obtin din relatia (5.19):
:

= :, o
2

= 2:.
5.5 Repartitia beta si repartitii n leg atur a cu aceasta
Repartitia beta este caracterizat a de densitatea
)

(r) =
_
I(oo)
I(o)I(o)
r
ol
(1 r)
ol
, pentru 0 < r < 1,
0, altfel,
(5.26)
unde parametrii c si , sunt pozitivi. Numele repartitiei vine de la functia
beta denit a prin
B(c, ,) =
I(c) I(,)
I(c ,)
.
65
Ambii parametri c si , dau forma repartitiei; diferite combinatii ale valorilor
lor permit densit atii s a ia o larg a varietate de forme. Cnd c, , 1, repartitia
este unimodal a, cu vrful n r =
ol
oo2
. Devine n form a de U cnd c, , < 1;
este n form a de J cnd c _ 1 si , < 1; ia forma unui J ntors cnd c < 1
si , _ 1. n sfrsit, ca un caz special, repartitia uniform a pe intervalul (0, 1)
rezult a cnd c = , = 1. Unele din aceste forme posibile sunt n gurile (a),
pentru , = 2, si (b) urm atoare.
Media si dispersia unei variabile aleatoare beta repartizate A sunt
:

=
o
oo
,
o
2

=
oo
(oo)
2
(ool)
.
(5.27)
Datorit a versatilit atii ei ca o repartitie pe un interval nit, repartitia beta
este folosit a pentru a reprezenta un mare num ar de cantit ati zice pentru care
valorile sunt restrictionate la un interval identicabil. Cteva din ariile de apli-
care sunt limitele de tolerant a, controlul calit atii si abilitatea.
Presupunem c a un fenomen aleator 1 poate observat independent de :
ori si dup a ce aceste : observatii independente sunt ordonate cresc ator, e
j
l
_ j
2
_ ... _ j
n
valorile lor. Dac a variabila aleatoare A este folosit a pentru a
nota proportia din 1 care ia valori ntre j
:
si j
nsl
, se poate ar ata c a A are
o repartitie beta cu c = : r : 1 si , = r :, adic a
66
)

(r) =
_
I(nl)
I(n:sl)I(:s)
r
n:s
(1 r)
:sl
, pentru 0 < r < 1,
0, altfel.
5.5.1 Tabele de probabilit ati
Functia de repartitie asociat a repartitiei beta este
1

(r) =
_

_
0, pentru r _ 0,
I(oo)
I(o)I(o)
_
r
0
n
ol
(1 n)
ol
dn, pentru 0 < r < 1,
1, pentru r _ 1.
(5.28)
Are de asemenea forma unei functii beta incomplete pentru care valorile
pentru valori date ale lui c si , pot g asite din tabele matematice. Functia
beta incomplet a e notat a de obicei cu I
r
(c, ,). Notnd 1

(r) cu parametrii c
si , cu 1 (r; c, ,), dac a c _ ,, atunci
1 (r; c, ,) = I
r
(c, ,) .
Dac a c < ,, atunci
1 (r; c, ,) = 1 I
(lr)
(,, c) .
O alt a metod a de evaluare a lui 1

(r) din relatia (5.28) este de a observa


similaritatea n form a dintre )

(r) si j
Y
(/) a unei variabile aleatoare binomiale
1 , pentru cazul cnd c, , N
+
. Din relatia (4.1),
j
Y
(/) =
:!
/! (: /)!
j
|

n|
, / = 0, 1, 2, ..., :. (5.29)
Din relatia (5.26), pentru cazul cnd c, , N
+
, obtinem
)

(r) =
(c , 1)!
(c 1)! (, 1)!
r
ol
(1 r)
ol
, c, , = 1, 2, ..., 0 < r < 1,
si stabilim relatia
)

(r) = (c , 1) j
Y
(/) , c, , = 1, 2, ..., 0 < r < 1,
unde j
Y
(/) este evaluat a n / = c 1, cu : = c , 2 si j = r. De
exemplu, valoarea )

(0, ) cu c = 2 si , = 1 este egal a cu 2j


Y
(1) cu : = 1 si
j = 0, ; aici j
Y
(1) = 0, din relatia (5.29), deci )

(0, ) = 1.
Similar avem
1

(r) = 1 1
Y
(/) , c, , = 1, 2, ..., 0 < r < 1,
cu / = c 1, : = c , 2 si j = r. Functia de repartitie 1
Y
a unei
variabile aleatoare binomiale 1 este de asemenea tabelat a si poate folosit a
pentru a avantaja aici evaluarea lui 1

(r) asociat a cu repartitia beta.


67
5.5.2 Repartitia beta generalizat a
Repartitia beta poate generalizat a de la una restrictionat a la intervalul (0, 1)
la una acoperind un interval arbitrar (a, /). Fie 1 o variabil a aleatoare beta
generalizat a. Avem
1 = (/ a) A a, (5.30)
unde A este beta repartizat a n conformitate cu relatia (5.26). Deoarece
relatia (5.30) este o transformare monoton a de la A la 1 , avem
)
Y
(j) =
_
I(oo)
(bo)
c+{1
I(o)I(o)
(j a)
ol
(/ j)
ol
, pentru a < j < /,
0, altfel.
(5.31)
5.6 Repartitii de valori extreme
Cineva preocupat de siguranta unei structuri este adesea interesat de nc arc a-
tura maxima si stresul maxim n membrii structurii. n studiile de abilitate,
repartitia vietii unui sistem avnd : componente n serie (cnd sistemul se de-
fecteaz a dac a o component a se defecteaz a) este o functie de minimul timpilor
pn a la defectarea componentelor, n timp ce pentru un sistem cu aranjament
paralel (unde sistemul se defecteaz a cnd toate componentele se defecteaz a) e
determinat a de repartitia maximului timpilor pn a la defectarea componentelor.
Aceste exemple puncteaz a preocuparea cu repartitiile maximului sau minimului
valorilor unui num ar de variabile aleatoare.
Fie A

, , = 1, 2, ..., :, variabile aleatoare independente si identic repartizate


cu functia de repartitie 1

(r) si densitatea )

(r) sau masa j

(r) si
1
n
= max (A
l
, A
2
, ..., A
n
) ,
7
n
= min(A
l
, A
2
, ..., A
n
) .
Functia de repartitie a lui 1
n
este
1
Yr
(j) = 1 (1
n
_ j) = 1 (A
l
_ j A
2
_ j ... A
n
_ j)
indep.
= 1 (A
l
_ j) 1 (A
2
_ j) ...1 (A
n
_ j) =
1
1
(j) 1
2
(j) ...1
r
(j) = [1

(j)[
n
.
Deci
1
Yr
(j) = [1

(j)[
n
Dac a A

sunt continue, densitatea lui 1


n
este
)
Yr
(j) =
d1
Yr
(j)
dj
= :[1

(j)[
nl
)

(j) .
Functia de repartitie a lui 7
n
este
1
2r
(.) = 1 (7
n
_ .) = 1 (A
l
_ . ' A
2
_ . ' ... ' A
n
_ .) = 11 (A
l
. A
2
. ... A
n
.)
indep.
=
11 (A
l
.) 1 (A
2
.) ...1 (A
n
.) = 1[1 1
1
(.)[ [1 1
2
(.)[ ... [1 1
r
(.)[ =
1 [1 1

(.)[
n
.
68
Deci
1
2r
(.) = 1 [1 1

(.)[
n
.
Dac a A

sunt continue, densitatea lui 7


n
este
)
2r
(.) = :[1 1

(.)[
nl
)

(.) .
5.6.1 Repartitii asimptotice de tip I ale valorilor extreme
Repartitia asimptotic a de tip I a valorilor maxime este repartitia limitei lui
1
n
(cnd : ) dintr-o repartitie initial a 1

(r) a c arei coad a dreapt a este


nem arginit a si este de tip exponential. Pentru acest caz, putem exprima 1

(r)
n forma
1

(r) = 1 oxp[q (r)[ , (5.32)


unde q (r) este o functie strict cresc atoare de r. n aceast a categorie intr a,
printre altele, repartitiile normal a, lognormal a si gamma.
Fie
lim
no
1
n
= 1.
Teorema 5.6. Fie variabilele aleatoare A
l
, A
2
, ..., A
n
independente si iden-
tic repartizate cu aceeasi functie de repartitie 1

(r). Dac a 1

(r) e de forma
dat a de relatia (5.32), avem
1
Y
(j) = oxpoxp[c(j n)[ , < j < ,
unde c 0 si n sunt 2 parametri ai repartitiei.
n este modulul repartitiei, adic a valoarea lui j n care )
Y
(j) este maxim a.
Media lui 1 este
:
Y
= n

c
,
unde 0, 77 este constanta lui Euler. Dispersia lui 1 este
o
2
Y
=

2
6c
2
.
n este parametru de locatie si c este parametru de scal a al repartitiei. Co-
ecientul de asimetrie este n acest caz
l
1, 1806 si e independent de c si
n. Acest rezultat arat a c a repartitia valorii maxime de tip I are o form a x a cu
o coad a dominant a spre dreapta. O form a tipic a pentru )
Y
(j) este aratat a n
gura urm atoare.
69
Repartitia asimptotic a de tip I pentru valori minime este repartitia limitei
lui 7
n
cnd : dintr-o repartitie initial a 1

(r) a c arei coad a stng a este


nem arginit a si este de tip exponential cnd descreste la 0 spre stnga. Un
exemplu de 1

(r) care apartine acestei clase este repartitia normal a.


Dac a punem
lim
no
7
n
= 7,
functia de repartitie a lui 7 are forma
1
2
(.) = 1 oxpoxp[c(. n)[ , < . < ,
unde c 0 si n sunt din nou cei 2 parametri ai repartitiei.
Repartitiile asimptotice de tip I pentru valori maxime si minime sunt imagini
n oglind a una celeilalte. Modulul lui 7 este n si media, dispersia si coecientul
lui de asimetrie sunt
:
Y
= n
~
o
,
o
2
Y
=
t
2
6o
2
,

l
1, 1806.
Datorit a largii aplicabilit ati, repartitia valorii maxime de tip I este uneori
numit a simplu reparti tia valorii extreme.
5.6.2 Repartitii asimptotice de tip II ale valorilor extreme
Repartitia asimptotic a de tip II a valorilor maxime apare ca repartitia limitei
lui 1
n
cnd : dintr-o repartitie initial a de tip Pareto, adic a, 1

(r) e
limitat a la stnga n 0 si coada ei dreapt a este nem arginit a si se apropie de 1
conform
1

(r) = 1 ar
|
, a, /, r 0. (5.33)
Pentru aceast a clas a
70
1
Y
(j) = oxp
_

_
j

_
|
_
, , /, j 0.
Cu 1

(r) dat n relatia (5.33), ecare A

are momente doar pn a la ordinul


r, unde r este cel mai mare ntreg mai mic dect /. Cnd / 1, media lui 1
este
:
Y
= I
_
1
1
/
_
,
si, cnd / 2, dispersia are forma
o
2
Y
=
2
_
I
_
1
2
/
_
I
2
_
1
1
/
__
.
Fie 1
1
si 1
11
variabile aleatoare avnd repartitii asimptotice de tip I, respec-
tiv II ale valorilor maxime. Atunci ele sunt legate prin
1
Y
11
(j) = 1
Y
1
(lnj) , j 0,
iar parametrii c si n din 1
Y
1
(j) sunt legati de parametrii / si din 1
Y
11
(j)
prin
n = ln si c = /.
Dac a 1
1
si 1
11
sunt continue, densit atile lor sunt n relatia
)
Y
11
(j) =
1
j
)
Y
1
(lnj) , j 0.
Repartitia asimptotic a de tip II a valorilor minime apare n conditii analoage.
Cu 1

(r) limitat a la dreapta n 0 si apropiindu-se de 0 la stnga ntr-o manier a


analoag a relatiei (5.33), avem
1
2
(.) = 1 oxp
_

|
_
, , / 0, . < 0.
Nu e asa util a ca omoloagele de tip I si III, deoarece n practic a repartitiile
initiale cerute nu sunt frecvent ntlnite.
5.6.3 Repartitii asimptotice de tip III ale valorilor extreme
Deoarece repartitia asimptotic a de tip III a valorii maxime este de interes practic
limitat, discut am doar repartitia valorilor minime.
Repartitia asimptotic a de tip III a valorii minime este repartitia limitei lui
7
n
cnd : pentru o repartitie initial a n care coada stng a creste de la 0
lng a r = - n maniera
1

(r) = c (r -)
|
, c, / 0, r _ -.
71
Aceast a clas a de repartitii este m arginit a la stnga n r = -. Repartitia
gamma este o astfel de repartitie cu - = 0.
Se poate ar ata c a functia de repartitie asimptotic a de tip III a valorii minime
este
1
2
(.) = 1 oxp
_

_
. -
n -
_
|
_
, / 0, n, . -, (5.34)
si, dac a 7 e continu a,
)
2
(.) =
/
n -
_
. -
n -
_
|l
oxp
_

_
. -
n -
_
|
_
, / 0, n, . -.
(5.35)
Media si dispersia lui 7 sunt
:
2
= - (n -) I
_
1
l
|
_
,
o
2
2
= (n -)
2
_
I
_
1
2
|
_
I
2
_
1
l
|
_
.
Am v azut c a repartitia exponential a e folosit a ca o lege a defect arii n studii
de abilitate, corespunznd unei functii hazard constante. Repartitia dat a de
relatiile (5.34) si (5.35) este frecvent folosit a ca un model generalizat al timpului
pn a la defectare pentru cazurile n care functia hazard variaz a cu timpul. Se
poate ar ata c a functia hazard
/(t) =
/
n
_
t
n
_
|l
, t 0,
poate avea o larg a varietate de forme, si densitatea asociat a cu ea pentru T,
timpul pn a la defectare, este dat a de
)
T
(t) =
/
n
_
t
n
_
|l
oxp
_

_
t
n
_
|
_
, n, /, t 0. (5.36)
Aceasta este repartitia Weibull, numit a dup a Weibull care a descoperit-o n
1939. Relatia (5.36) este un caz special al relatiei (5.35), cu - = 0.
Fie 7
1
si 7
111
variabile aleatoare avnd repartitii asimptotice de tipul I,
respectiv III, ale valorilor minime. Atunci
1
2
111
(.) = 1
2
1
[ln (. -)[ , . -,
cu n = ln(n -) si c = /. Dac a sunt continue,
)
2
111
(.) =
1
. -
)
2
1
[ln(. -)[ , . -.
Repartitiile asimptotice ale valorilor maxime si minime din aceeasi repartitie
initial a pot s a nu e de acelasi tip. De exemplu, pentru o repartitie initial a
gamma, repartitia ei asimptotic a a valorii maxime este de tipul I, n timp ce
72
a valorii minime este de tipul III. Un sistem avnd : componente n serie cu
repartitii de viat a gamma independente pentru componentele lui are o repartitie
a timpului pn a la defectare apartinnd repartitiei asimptotice de tip III a valorii
minime, cnd : devine mare. Modelul corespunz ator pentru un sistem avnd :
componente n paralel este repartitia asimptotic a de tip I a valorii maxime.
73
6 Functii (transform ari) de variabile aleatoare
n stiint a si inginerie, multe fenomene sunt bazate pe relatii functionale n care
una sau mai multe variabile dependente sunt exprimate n termeni de una sau
mai multe variabile independente. De exemplu, distanta parcurs a ntr-un inter-
val de timp este o functie de vitez a, s.a.m.d.
6.1 Functii de o variabil a aleatoare
Fie
1 = q (A) , (6.1)
unde q este o functie continu a. Dat a ind repartitia lui A n termeni de
functia ei de repartitie, functia mas a de probabilitate sau densitate, suntem
interesati de repartitia corespunz atoare pentru 1 si propriet atile momentelor
lui 1 .
6.1.1 Repartitia
Dac a A este variabil a aleatoare, atunci 1 , ind o functie de A denit a de relatia
(6.1), este de asemenea o variabil a aleatoare. Fie 1

, mul timea valorilor lui A,


si 1
Y
multimea valorilor lui 1.
Pentru ecare rezultat A = r, rezult a din relatia (6.1) c a 1 = j = q (r).
Relatia (6.1) deneste si o functie de la 1

la 1
Y
. Probabilit atile asociate cu
ecare punct (n cazul unei variabile aleatoare discrete A) sau ecare regiune (n
cazul unei variabile aleatoare continue A) din 1

sunt transportate n punctul


sau regiunea corespunz atoare din 1
Y
. Repartitia lui 1 este determinat a prin
completarea acestui proces de transfer pentru ecare punct (dac a A e discret a)
sau ecare regiune de tipul 1 _ j (dac a A e continu a) din 1
Y
. Este posibil ca
q s a duc a mai multe puncte din 1

ntr-un singur punct din 1


Y
. Determinarea
repartitiei lui 1 depinde astfel de forma lui q din relatia (6.1).
Variabile aleatoare discrete Fie A variabil a aleatoare discret a cu functia
mas a de probabilitate j

. Functia mas a de probabilitate a lui 1 este


j
Y
(j) =

r
1
()
j

(r) , \j 1
Y
,
unde q
l
(j) = r 1

[q (r) = j.
Exemplul 6.1. Fie A ~
_
1 0 1 2
l
2
l
d
l
S
l
S
_
. Determinati repartitia lui
1 = 2A
2
1.
Valorile lui 1 sunt q (1) = 2 (1)
2
1 = 8, q (0) = 1, q (1) = 8, q (2) = 0.
Avem q
l
(1) = 0 , q
l
(8) = 1, 1 , q
l
(0) = 2, deci j
Y
(1) = j

(0) =
74
l
d
, j
Y
(8) = j

(1) j

(1) =
l
2

l
S
=
5
S
, j
Y
(0) = j

(2) =
l
S
. De aici,
1 ~
_
1 8 0
l
d
5
S
l
S
_
.
Dac a q : 1

1
Y
este injectiv a, valorile posibile luate de A sunt r
l
, r
2
, ...,
valorile luate de 1 sunt j
l
= q (r
l
) , j
2
= q (r
2
) , ... si
j

(r
I
) = j
I
, i = 1, 2, ...,
atunci
j
Y
(j
I
) = j
Y
(q (r
I
)) = j
I
, i = 1, 2, ....
Exemplul 6.2. Fie A ~
_
1 0 1 2
l
2
l
d
l
S
l
S
_
. Determinati repartitia lui
1 = 2A 1.
Valorile lui 1 sunt q (1) = 2 (1) 1 = 1, q (0) = 1, q (1) = 8, q (2) = .
Functia q este injectiv a, deci 1 ~
_
1 1 8
l
2
l
d
l
S
l
S
_
.
Variabile aleatoare continue Consider am cazul cnd A este o variabil a
aleatoare continu a cu functie de repartitie 1

(r) sau densitate )

(r) cunos-
cute.
ncepem considernd relatia
1 = q (A) = 2A 1. (6.2)
Transformarea j = q (r) este prezentat a grac n gura urm atoare.
75
Functia de repartitie a lui 1 este denit a de
1
Y
(j) = 1 (1 _ j) .
Regiunea denit a de 1 _ j din 1
Y
acoper a portiunea ngrosat a a curbei
de transformare, dup a cum e ar atat n gura al aturat a, care, n 1

corespunde
regiunii q (A) _ j, sau A _ q
l
(j), unde
q
l
(j) =
j 1
2
este functia invers a a lui q, sau solutia r n functie de j a ecuatiei (6.2). De
aici,
1
Y
(j) = 1 (1 _ j) = 1 (q (A) _ j) = 1
_
A _ q
l
(j)
_
= 1

_
q
l
(j)
_
.
(6.3)
(6.3) este relatia dintre functiile de repartitie ale lui 1 si A.
76
Relatia dintre densit atile lui 1 si A se obtine derivnd n raport cu j n
(6.3):
)
Y
(j) =
d1
Y
(j)
dj
=
d
dj
_
1

_
q
l
(j)
_
= )

_
q
l
(j)
_
dq
l
(j)
dj
. (6.4)
Relatiile (6.3) si (6.4) au loc nu doar pentru transformarea particular a dat a
prin relatia (6.2) dar si pentru toate functiile continue q care sunt strict cresc a-
toare.
Consider am acum situatia n care transformarea e dat a de
1 = q (A) = 2A 1. (6.5)
Plecnd din nou cu 1
Y
(j) = 1 (1 _ j) si rationnd ca mai sus, regiunea
1 _ j din 1
Y
corespunde regiunii A _ q
l
(j), dup a cum arat a gura urm a-
toare.
Deoarece A este continu a, avem
1
_
A _ q
l
(j)
_
= 1
_
A q
l
(j) ' A = q
l
(j)
_
= 1
_
A q
l
(j)
_

1
_
A = q
l
(j)
_
= 1
_
A q
l
(j)
_
0 = 1
_
A q
l
(j)
_
.
De aici, avem n acest caz
77
1
Y
(j) = 1 (1 _ j) = 1
_
A q
l
(j)
_
= 11
_
A _ q
l
(j)
_
= 11

_
q
l
(j)
_
.
(6.6)
n comparatie cu relatia (6.3), relatia (6.6) d a o leg atur a diferit a ntre functi-
ile de repartitie ale lui A si 1 , datorit a unui q diferit.
Derivnd n relatia (6.6) n raport cu j obtinem relatia dintre densit atile lui
A si 1 :
)
Y
(j) =
d1
Y
(j)
dj
=
d
dj
_
1 1

_
q
l
(j)
_
= )

_
q
l
(j)
_
dq
l
(j)
dj
. (6.7)
Din nou observ am c a relatiile (6.6) si (6.7) au loc pentru toate functiile
continue q care sunt strict descresc atoare.
Deoarece derivata
J
1
()
J
este totdeauna pozitiv a n relatia (6.4) (pentru c a
q e strict cresc atoare) si este totdeauna negativ a n relatia (6.7) (pentru c a q
e strict descresc atoare), rezultatele exprimate de aceste relatii pot combinate
n urm atoarea teorem a:
Teorema 6.1. Fie A o variabil a aleatoare continu a si 1 = q (A), unde q
este continu a si strict monoton a. Atunci
)
Y
(j) = )

_
q
l
(j)
_

dq
l
(j)
dj

. (6.8)
Exemplul 6.3. Densitatea lui A este dat a de
)

(r) =
a
(r
2
a
2
)
, < r < ,
unde a 0 (repartitia Cauchy). Determinati densitatea lui 1 = 2A 1.
Deoarece q (r) = 2r 1 este continu a si strict monoton a, aplic am relatia
(6.8).
j = 2r 1 == r =
l
2
== q
l
(j) =
l
2
==
J
1
()
J
=
l
2
.
Din relatia (6.8),
)
Y
(j) = )

_
l
2
_

l
2

=
o
t
h
(
1
2
)
2
o
2
i

l
2
=
2o
t[(l)
2
do
2
[
, < j < .
Consider am acum cazul cnd q nu este strict monoton a. n gura urm atoare,
pentru j < j
l
si j j
2
, ecuatia q (r) = j are solutie unic a si relatia (6.8) poate
folosit a pentru a determina densitatea lui 1 n aceste intervale.
78
Pentru j
l
_ j _ j
2
, trebuie s a plec am de la nceput si consider am 1
Y
(j) =
1 (1 _ j). Regiunea denit a de 1 _ j n 1
Y
acoper a portiunile ngrosate ale
curbei j = q (r), dup a cum este ar atat n gur a. Astfel,
1
Y
(j) = 1 (1 _ j) = 1
_
A _ q
l
l
(j)
_
1
_
q
l
2
(j) < A _ q
l
3
(j)
_
=
1
_
A _ q
l
l
(j)
_
1
_
A _ q
l
3
(j)
_
1
_
A _ q
l
2
(j)
_
=
1

_
q
l
l
(j)
_
1

_
q
l
3
(j)
_
1

_
q
l
2
(j)
_
, j
l
< j < j
2
,
(6.9)
unde r
l
= q
l
l
(j) , r
2
= q
l
2
(j) , r
3
= q
l
3
(j) sunt r ad acinile ecuatiei
q (r) = j n termeni de j.
Ca mai sus, relatia ntre densit atile lui A si 1 e g asit a derivnd n relatia
(6.9) n raport cu j:
)
Y
(j) = )

_
q
l
l
(j)
_
dq
l
l
(j)
dj
)

_
q
l
3
(j)
_
dq
l
3
(j)
dj
)

_
q
l
2
(j)
_
dq
l
2
(j)
dj
, j
l
< j < j
2
.
(6.10)
Deoarece derivata
J
1
2
()
J
e negativ a n timp ce celelalte sunt pozitive, relatia
(6.10) ia forma
)
Y
(j) =
3

=l
)

_
q
l

(j)
_

dq
l

(j)
dj

, j
l
< j < j
2
. (6.11)
79
Figura urm atoare reprezint a transformarea j = sinr; aceast a ecuatie are o
innitate num arabil a de r ad acini, r
l
= q
l
l
(j) , r
2
= q
l
2
(j) , ... \j [1, 1[ .
Urmnd procedura de mai sus se poate stabili pentru 1
Y
(j) o relatie similar a
cu (6.9) (dar cu o innitate de termeni) si, precum n relatia (6.11), densitatea
lui 1 are acum forma
)
Y
(j) =
o

=l
)

_
q
l

(j)
_

dq
l

(j)
dj

, 1 < j < 1. (6.12)


Se observ a c a )
Y
(j) = 0 pentru j , [1, 1[, deoarece 1
Y
(j) = 0, \j _ 1
si 1
Y
(j) = 1, \j _ 1.
Relatiile (6.11) si (6.12) conduc la urm atorul rezultat:
Teorema 6.2. Fie A o variabil a aleatoare continu a si 1 = q (A), unde
q este continu a, si q (r) = j are un num ar cel mult num arabil de r ad acini
r
l
= q
l
l
(j) , r
2
= q
l
2
(j
2
) , .... Atunci:
)
Y
(j) =
:

=l
)

_
q
l

(j)
_

dq
l

(j)
dj

, (6.13)
unde r este num arul de r ad acini ale ecuatiei q (r) = j.
80
Relatia (6.8) este continut a n aceast a teorem a ca un caz special (r = 1).
Exemplul 6.4. Determinati densitatea lui 1 = A
2
, unde A ~ (0, 1).
Avem
)

(r) =
1
_
2
c

o
2
2
, < r < .
1 _ 0 == 1
Y
(j) = 1 (1 _ j) = 1 (O) = 0, \j < 0 == )
Y
(j) = 1
t
Y
(j) =
0, \j < 0. Pentru j 0, r ad acinile lui r
2
= j sunt
r
l,2
= q
l
l,2
(j) =
_
j.
De aici, folosind relatia (6.13),
)
Y
(j) =
2

=l
)

_
q
l

(j)
_

J
1

()
J

= )

_
_
j
_

l
2
_

_
j
_

l
2
_

=
l
_
2t
c

2
,
deci
)
Y
(j) =
_
l
_
2t
c

2
, pentru j 0,
0, altfel.
Am obtinut repartitia
2
cu un grad de libertate (vezi relatia (5.24)), deoarece
I
_
l
2
_
=
_
o
0
n

1
2
c
u
dn
u=
o
2
2
=
_
2
_
o
0
r
l
c

o
2
2
rdr =
_
2
_
o
0
c

o
2
2
dr =
_
2
l
2
_
o
o
c

o
2
2
dr =
l
_
2
_
2 =
_
.
6.1.2 Momente
Fie 1 = q (A) si presupunem c a toate momentele dorite ale lui 1 exist a. Mo-
mentul de ordinul : al lui 1 este
1 (1
n
) = 1 (q
n
(A)) =

I
q
n
(r
I
) j

(r
I
) , dac a A e discret a,
1 (1
n
) = 1 (q
n
(A)) =
_
o
o
q
n
(r) )

(r) dr, dac a A e continu a.


(6.14)
Exemplul 6.5. Fie A ~
_
1 0 1 2
l
2
l
d
l
S
l
S
_
. Determinati media si disper-
sia lui 1 = 2A 1.
Folosim prima relatie (6.14).
1 (1 ) = 1 (2A 1) =

I
(2r
I
1) j

(r
I
) = (1)
l
2
1
l
d
8
l
S

l
S
=
3
d
.
1
_
1
2
_
= 1
_
(2A 1)
2
_
=

I
(2r
I
1)
2
j

(r
I
) = 1
l
2
1
l
d
0
l
S
2
l
S
=
.
o
2
Y
= 1
_
1
2
_
1
2
(1 ) =
_
3
d
_
2
=
7l
l6
.
81
6.2 Functii de dou a sau mai multe variabile aleatoare
Consider am transformarea
1 = q (A
l
, A
2
, ..., A
n
) , (6.15)
unde A
l
, A
2
, ..., A
n
sunt variabile aleatoare a c aror repartitie comun a se cunoaste.
Vrem s a determin am repartitia lui 1 .
Fie X vectorul aleator :-dimensional cu componentele A
l
, A
2
, ..., A
n
si x
vectorul :-dimensional cu componentele r
l
, r
2
, ..., r
n
.
Dac a A
l
, A
2
, ..., A
n
sunt discrete cu masa comun a j
X
(x), atunci masa lui
1 este
j
Y
(j) =

x
1
()
j
X
(x) , \j 1
Y
,
unde q
l
(j) = x 1
X
[q (x) = j, iar 1
X
este multimea valorilor lui X.
Presupunem acum c a A
l
, A
2
, ..., A
n
sunt continue si cunoastem densitatea
comun a )
X
(x) sau functia de repartitie comun a 1
X
(x). Avem
1
Y
(j) = 1 (1 _ j) = 1 (q (X) _ j) = 1
X
(x : q (x) _ j) . (6.16)
Ultima expresie din relatia (6.16) reprezint a functia de repartitie comun a a lui
X pentru care argumentul x satisface q (x) _ j. n termeni de )
X
(x) este dat a
de
1
X
(x : q (x) _ j) =
_

_
(1
r
.(x))
)
X
(x) dx, (6.17)
unde 1
n
= x R
n
[q (x) _ j. 1
Y
(j) poate determinat a evalund integrala
din relatia (6.17).
6.2.1 Sume de variabile aleatoare
Consider am suma
1 = q (A
l
, A
2
, ..., A
n
) = A
l
A
2
... A
n
.
E sucient s a determin am )
Y
(j) pentru : = 2. Rezulatatul pentru acest caz
poate apoi aplicat succesiv pentru a da repartitia sumei oric arui num ar de
variabile aleatoare. Pentru 1 = A
l
A
2
, relatiile (6.16) si (6.17) dau
1
Y
(j) =
__
(1
2
.r1r2)
)
12
(r
l
, r
2
) dr
l
dr
2
,
si, dup a cum se observ a din gura urm atoare, n care este reprezentat a 1
2
=
_
x R
2
[r
l
r
2
_ j
_
, avem
82
1
Y
(j) =
_
o
o
_
r2
o
)
12
(r
l
, r
2
) dr
l
dr
2
. (6.18)
Derivnd n relatia (6.18) n raport cu j, obtinem
)
Y
(j) =
_
o
o
)
12
(j r
2
, r
2
) dr
2
. (6.19)
Cnd A
l
si A
2
sunt independente, relatia (6.19) devine
)
Y
(j) =
_
o
o
)
1
(j r
2
) )
2
(r
2
) dr
2
. (6.20)
Integrala din relatia (6.20) se numeste convolu tia functiilor )
1
(r
l
) si )
2
(r
2
) .
Teorema 6.3. Fie A
l
si A
2
variabile aleatoare continue independente si
1 = A
l
A
2
. Atunci densitatea lui 1 este convolutia densit atilor lui A
l
si A
2
,
adic a
)
Y
(j) =
_
o
o
)
1
(j r
2
) )
2
(r
2
) dr
2
=
_
o
o
)
2
(j r
l
) )
1
(r
l
) dr
l
.
(6.21)
83
6.3 m functii de n variabile aleatoare
Fie
1

= q

(A
l
, ..., A
n
) , , = 1, 2, ..., :, : _ :. (6.22)
Vrem s a obtinem repartitia comun a a variabilelor aleatoare 1

, , = 1, 2, ..., :,
stiind repartitia comun a a variabilelor aleatoare A
|
, / = 1, 2, ..., :.
Dac a A
l
, A
2
, ..., A
n
sunt discrete cu masa comun a j
X
(x), atunci masa co-
mun a a variabilelor aleatoare 1
l
, ..., 1
n
este
j
Y
(y) =

xg
1
(y)
j
X
(x) , \y 1
Y
,
unde g are componentele q
l
, q
2
, ..., q
n
, g
l
(y) = x 1
X
[g (x) = y, iar 1
X
si 1
Y
sunt multimile valorilor lui X, respectiv Y.
Presupunem acum c a A
l
, A
2
, ..., A
n
sunt continue.
Consider am mai nti cazul : = :.
Fie X si Y vectori aleatori :-dimensionali cu componentele A
l
, ..., A
n
, re-
spectiv 1
l
, ..., 1
n
. Relatia (6.22) se scrie vectorial
Y = g (X) , (6.23)
unde g (X) are componentele q
l
(X) , q
2
(X) , ..., q
n
(X). Consider am nti cazul
n care functiile q

din g sunt continue n raport cu ecare argument, au derivate


partiale continue si sunt bijective. Atunci rezult a c a functiile inverse q
l

din
g
l
denit a de
X = g
l
(Y) ,
exist a si sunt unice. Au de asemenea derivate partiale continue.
Pentru a determina )
Y
(y) n termeni de )
X
(x), observ am c a, dac a o regiune
nchis a 1
n
X
din multimea valorilor lui X este dus a ntr-o regiune nchis a 1
n
Y
din
multimea valorilor lui Y prin transformerea g, conservarea probabilit atii d a
_

_
1
r
Y
)
Y
(y) dy =
_

_
1
r
X
)
X
(x) dx, (6.24)
unde integralele reprezint a : integrale n raport cu componentele lui x, respectiv
y. Urmnd regula uzual a de schimbare de variabile n integrale multiple, putem
scrie
_

_
1
r
X
)
X
(x) dx =
_

_
1
r
Y
)
X
_
g
l
(y)
_
[J[ dy, (6.25)
unde J este Jacobianul transform arii, denit ca determinantul
84
J =

J
1
1
J1
J
1
1
J2
...
J
1
1
Jr
.
.
.
.
.
.
.
.
.
J
1
r
J1
J
1
r
J2
...
J
1
r
Jr

. (6.26)
Relatiile (6.24) si (6.25) conduc la urm atorul rezultat.
Teorema 6.4. Pentru transformarea dat a de relatia (6.23), unde X este
un vector aleator continuu si g este continu a cu derivate partiale continue si
bijectiv a, densitatea comun a a lui Y este
)
Y
(y) = )
X
_
g
l
(y)
_
[J[ , (6.27)
unde J este denit de relatia (6.26).
Exemplul 6.6. Fie A
l
si A
2
variabile aleatoare independente identic repar-
tizate (0, 1). S a se determine densitatea comun a a lui 1
l
= A
l
A
2
si
1
2
= A
l
A
2
.
Deoarece sistemul
_
r
l
r
2
= j
l
r
l
r
2
= j
2
are solutia unic a
r
l
= q
l
l
(j) =
j
l
j
2
2
, r
2
= q
l
2
(j) =
j
l
j
2
2
,
g este bijectiv a si se poate aplica teorema 6.4. Jacobianul este
J =

J
1
1
J1
J
1
1
J2
J
1
2
J1
J
1
2
J2

l
2
l
2
l
2

l
2

=
1
2
.
Datorit a independentei, relatia (6.27) conduce la
)
Y1Y2
(j
l
, j
2
) = )
1
_
q
l
l
(j)
_
)
2
_
q
l
2
(j)
_
[J[ =
l
_
2t
oxp
_

1
+
2
2
)
2
2
_

l
_
2t
oxp
_

2
2
)
2
2
_

l
2

=
l
dt
oxp
_

(12)
2
S
_
oxp
_

(12)
2
S
_
=
l
dt
oxp
_

2
1

2
2
d
_
, j
l
, j
2
R.
Observ am c a rezultatul poate scris sub forma
)
Y1Y2
(j
l
, j
2
) = )
Y1
(j
l
) )
Y2
(j
2
) ,
unde
)
Y1
(j
l
) =
1
_
4
oxp
_

j
2
l
4
_
, j
l
R,
)
Y2
(j
2
) =
1
_
4
oxp
_

j
2
2
4
_
, j
2
R,
implicnd c a, desi 1
l
si 1
2
sunt ambele functii de A
l
si A
2
, ele sunt independente
si identic repartizate (0, 2).
Relatia (6.27) este o extindere a relatiei (6.8), care este pentru cazul special
: = 1. Similar, o extindere este de asemenea posibil a pentru relatia (6.13)
pentru cazul : = 1 cnd ecuatia are mai mult de o r ad acin a.
85
Teorema 6.5. n transformarea dat a de relatia (6.23), presupunem c a
ecuatia g (x) = y are un num ar cel mult num arabil de r ad acini x
l
= g
l
l
(y) , x
2
=
g
l
2
(y) , .... Atunci
)
Y
(y) =
:

=l
)
X
_
g
l

(y)
_
[J

[ , (6.28)
unde r este num arul de r ad acini ale ecuatiei g (x) = y si
J

J
1
1
J1
J
1
1
J2
...
J
1
1
Jr
.
.
.
.
.
.
.
.
.
J
1
r
J1
J
1
r
J2
...
J
1
r
Jr

.
Aici q
l
l
, q
l
2
, ..., q
l
n
sunt componentele lui g
l

.
Rezultatele prezentate mai sus pot de asemenea aplicate n cazul cnd
dimensiunea lui Y este mai mic a dect cea a lui X. Consider am transformarea
(6.22) n care : < :. Pentru a folosi formulele de mai sus, nti complet am
vectorul aleator :-dimensional Y cu un alt vector aleator (: :)-dimensional
Z. Vectorul Z poate construit ca o functie simpl a de X, n forma
Z = h(X) , (6.29)
unde h este continu a si are derivate partiale continue. Combinnd relatiile (6.22)
si (6.29), avem o transformare de la : variabile aleatoare la : variabile aleatoare,
si densitatea comun a a lui Y si Z poate obtinut a cu relatia (6.27) sau relatia
(6.28). Densitatea comun a a lui Y singur se g aseste apoi prin integrare n raport
cu componentele lui Z.
86
Part II
Statistic a
7 Statistic a descriptiv a pentru date unudimen-
sionale (reprezent ari grace, functie de repar-
titie de selectie, momente de selectie)
7.1 Histograme si diagrame de frecvente
Fiind dat un set de observatii independente r
l
, r
2
, ..., r
n
, ale unei variabile
aleatoare A, un prim pas util este organizarea si prezentarea lor adecvat a astfel
nct ele s a poat a usor inerpretate si evaluate. Cnd exist a un num ar mare
de date observate, o histograma este o reprezentare grac a excelent a a datelor,
facilitnd
a) o evaluare a adecv arii modelului presupus,
b) estimarea percentilelor repartitiei,
c) estimarea parametrilor repartitiei.
Consider am, de exemplu, un proces chimic care este producerea de loturi
(batches) dintr-un material; 200 de valori observate ale randamentului procen-
tual (percentage yield), A, reprezentnd un esantion relativ mare sunt date n
tabelul urm ator.
87
Valorile esantionului variaz a de la 64 la 76. mp artind acest interval n 12
intervale egale si reprezentnd num arul total de randamente observate n ecare
interval ca n altimea dreptunghiului de deasupra intervalului rezult a histograma
dup a cum e ar atat n gura urm atoare.
88
O diagrama de frecven te este obtinut a dac a ordonata histogramei este m-
p artit a la num arul total de observatii, 200 n acest caz, si la l atimea
intervalului ^ (care se ntmpl a s a e 1 n acest exemplu). n dreapta gurii
este reprezentat a ordonata diagramei de frecvente. Vedem c a histograma sau
diagrama frecventelor d a o impresie imediat a asupra valorilor, frecventei relative
si mpr astierii asociate datelor.
Diagrama frecventelor din gur a are propriet atile unei densit ati (suma ari-
ilor dreptunghiurilor este 1). De aici pot estimate probabilit atile asociate
cu diverse evenimente. De exemplu, probabilitatea unui lot avnd randament
mai mic dect 68/ poate calculat a din diagrama frecventelor adunnd ariile
de la stnga lui 68/ si obtinnd 0, 18 (0, 02 0, 01 0.02 0.07). Simi-
lar, probabilitatea unui lot avnd un randament mai mare de 72/ este 0, 18
(0, 10 0, 08 0, 08 0, 01). Acestea sunt probabilit ati calculate pe baza
datelor observate. Un set diferit de date obtinute din acelasi proces chimic ar
conduce n general la o diagram a de frecvente diferit a si deci la valori diferite
pentru aceste probabilit ati. n consecint a, ele sunt estim ari ale probabilit atilor
1 (A < 68) si 1 (A 72) asociate cu variabila aleatoare A.
89
Pentru acest exemplu, alegerea a 12 intervale este convenabil a datorit a in-
tervalului de valori luate de observatii si faptului c a rezolutia rezultat a este
adecvat a pentru calculele de probabilit ati de mai sus. n gura urm atoare este
construit a o histogram a folosind 4 intervale n loc de 12 pentru acelasi exemplu.
Se observ a c a proiecteaz a o impresie vizual a mult diferit a si cu o mai mic a
acuratete a comportamentului datelor. Astfel, e important s a e ales num arul
de intervale n concordant a cu informatia care se vrea extras a din modelul
matematic. Ca un ghid practic, Sturges a sugerat n 1926 ca o valoare aproxi-
mativ a pentru num arul de intervale / s a e dat a de
/ 1 8, 8 lg :,
unde : este num arul de date.
Din punctul de vedere al model arii, este rezonabil s a alegem o repartitie
normal a ca model probabilistic pentru randamentul procentual A observnd
c a variatiile aleatoare ale ei sunt rezultanta a numeroase surse aleatoare inde-
pendente n procesul chimic de fabricare. Dac a aceasta este sau nu o alegere
rezonabil a poate evaluat intr-un mod subiectiv folosind diagrama frecventelor
din gura al aturat a. Densitatea repartitiei normale de medie 70 si dispersie 4
este trasat a punctat pe diagrama frecventelor, ar atnd o potrivire rezonabil a.
Bazndu-ne pe aceast a repartitie normal a, putem calcula probabilit atile de mai
90
sus, dnd o alt a evaluare a adecv arii modelului. De exemplu, cu ajutorul tabelu-
lui valorilor repartitiei (0, 1) ,
1 (A < 68) = 1
I
_
6S70
2
_
= 1
I
(1) = 1 1
I
(1) = 1 0, 8418 = 0, 187,
care se compar a cu 0, 18 obtinut a folosind diagrama frecventelor.
n cele de mai sus, alegerile lui 70 si 4 ca estim ari pentru media, respec-
tiv dispersia lui A, sunt f acute observnd c a media repartitiei ar trebui s a e
aproape de media aritmetic a a selectiei, adic a
:


1
:
n

=l
r

,
si dispersia poate aproximat a prin
o
2


1
:
n

=l
(r

)
2
.
n cazul unei variabile aleatoare discrete, histograma si diagrama de frecvente
obtinute din datele observate iau forma unei reprezent ari n batoane, spre deose-
bire de dreptunghiurile conectate din cazul continuu. Consider am, de exemplu,
repartitia num arului de accidente pe sofer de-a lungul unei perioade de timp de
6 ani n California. Datele din tabelul urm ator sunt nregistr arile accidentelor
pe 6 ani ale 7842 de soferi californieni.
Bazat a pe acest set de observatii, histograma are forma dat a n gura ur-
m atoare.
91
Diagrama frecventelor este obtinut a n acest caz prin mp artirea ordonatei his-
togramei la num arul total de observatii, care este 7842.
7.2 Selectii si statistici
n cele mai multe cazuri este imposibil sau nerealist s a se observe ntreaga
populatie. Unele populatii au membri care nc a nu exist a (de exemplu, loturile
viitoare din productia de ciment), sau populatia este prea mare (de exemplu,
toate femeile ns arcinate). De aceea cercet atorii m asoar a doar o parte a popu-
latiei tint a, numit a selectie sau esantion. Dac a facem deductii despre populatie
folosind informatia obtinut a dintr-o selectie, atunci este important ca selectia
s a e reprezentativ a pentru populatie, ceea ce poate atins dac a toate selectiile
posibile sunt egal probabil s a e alese.
Uneori scopul statisticii este utilizarea selectiei pentru a estima sau a face
unele armatii despre un parametru al populatiei. Un parametru este o m asur a
descriptiv a pentru o populatie sau pentru o repartitie a variabilelor aleatoare.
92
De exemplu, parametrii populatiei care pot de interes includ media, deviatia
standard, cuantile, proportii, coecienti de corelatie, etc.
Presupunem c a un model probabilistic, reprezentat de densitatea )(r), a
fost ales pentru un fenomen zic sau natural pentru care parametrii 0
l
, 0
2
, ...
trebuie estimati din datele observate independent r
l
, r
2,
..., r
n
. Consider am pen-
tru moment un singur parametru 0 pentru simplitate si scriem )(r; 0) pentru
o densitate specicat a unde 0 este parametrul necunoscut care trebuie estimat.
Problema estim arii parametrului este atunci una a determin arii unei functii
corespunz atoare de r
l
, r
2,
..., r
n
, s a spunem /(r
l
, r
2,
..., r
n
), care d a "cea mai
bun a" estimare a lui 0.
Fiind dat un set de date independente r
l
, r
2,
..., r
n
, e

0 = /(r
l
, r
2,
..., r
n
)
o estimare a parametrului 0. Dac a experimentul care a dat setul de date s-
ar repeta, am obtine valori diferite pentru r
l
, r
2,
..., r
n
. Functia /(r
l
, r
2,
..., r
n
)
aplicat a la noul set de date ar da o valoare diferit a pentru

0. Vedem astfel c a es-


timarea

0 este ea ns asi o variabil a aleatoare avand o densitate, care depinde att


de forma functiei / ct si de densitatea variabilei aleatoare A. Reprezentarea
corespunz atoare a lui

0 e astfel

O = /(A
l
, A
2
, ..., A
n
), (7.1)
unde A
l
, A
2
, ..., A
n
sunt variabile aleatoare reprezentnd o selec tie din variabila
aleatoare A, care este numit a n acest context popula tie.
Presupunem c a selectia A
l
, A
2
, ..., A
n
are urm atoarele propriet ati:
Proprietatea 1: A
l
, A
2
, ..., A
n
sunt independente.
Proprietatea 2: )

(r) = )

(r), \r, , = 1, 2, ..., :.


Variabilele aleatoare A
l
, A
2
, ..., A
n
satisf acnd aceste conditii se numesc o
selec tie aleatore de m arime :. Cuvntul "aleatore" din aceast a denitie este de
obicei omis pentru scurtime. Daca A este o variabil a aleatoare discret a cu masa
j

(r), atunci j

(r) = j

(r), \,.
Un set specic de valori observate (r
l
, r
2
, ..., r
n
) este un set de valori ale
selec tiei.
Datorit a propriet atilor 1 si 2, densitatea comun a este dat a de
)
12...r
(r
l
, r
2
, ..., r
n
) = )

(r
l
) )

(r
2
) ...)

(r
n
) .
O statistica este o functie de o selectie dat a A
l
, A
2
, ..., A
n
care nu depinde
de parametrul necunoscut. Functia /(A
l
, A
2
, ..., A
n
) din (7.1) este o statistic a
pentru care valoarea poate determinat a odat a ce valorile selectiei au fost
observate. O statistic a, ind o functie de variabile aleatoare, este o variabil a
aleatoare. Adesea o statistic a este folosit a pentru urm atoarele scopuri
- ca o estimare punctual a pentru un parametru al populatiei,
- pentru a obtine o estimare a intervalului de ncredere pentru un parametru,
sau,
- ca un test statistic n testarea ipotezelor.
93
7.2.1 Media de selectie
Statistica
A =
1
:
n

I=l
A
I
e numit a media de selec tie a populatiei A. Fie media si dispersia populatiei
1(A) = :,
ar(A) = o
2
.
(7.2)
Media mediei de selectie A este
1(A) =
1
:
n

I=l
1 (A
I
) =
1
:
(::) = :.
Dispersia mediei de selectie A este
ar(A) = 1
_
_
A :
_
2
_
= 1
_
_
_
l
n
n

I=l
(A
I
:)
_
2
_
_
=
l
n
2
1
_
_
_
n

I=l
(A
I
:)
_
2
_
_
=
l
n
2
1
_
_
n

I=l
(A
I
:)
2
2

lI<n
(A
I
:) (A

:)
_
_
=
l
n
2
_
_
n

I=l
1
_
(A
I
:)
2
_
2

lI<n
1 ((A
I
:) (A

:))
_
_
=
l
n
2
_
_
n

I=l
o
2
2

lI<n
1 ((A
I
:) (A

:))
_
_
independent a
=
l
n
2
_

_
n

I=l
o
2
. .
=nc
2
2

lI<n
1 ((A
I
:))
. .
=0
1 ((A

:))
. .
=0
_

_
=
l
n
2
_
:o
2
_
=
c
2
n
,
deci
ar(A) =
o
2
:
,
care este invers proportional a cu m arimea selectiei :. Cnd : creste, dispersia
lui A descreste si repartitia lui A devine ascutit a cu vrful n 1(A) = :. De
aici, este clar intuitiv c a statistica A d a o bun a procedur a de estimare a mediei
populatiei :.
Deoarece A este o sum a de variabile aleatoare independente, pe baza teo-
remei limit a central a, media de selectie A tinde la o repartitie normal a cnd
94
: . Mai precis, variabila aleatoare
_
A :
_
_
c
_
n
_
l
tinde la (0, 1) cnd
: .
7.2.2 Dispersia de selectie
Statistica
o
2
=
1
: 1
n

I=l
_
A
I
A
_
2
(7.3)
se numeste dispersia de selec tie a populatiei A.
(7.3)=
o
2
=
l
nl
n

I=l
_
(A
I
:)
_
A :
_
2
=
l
nl
n

I=l
_
_
(A
I
:)
l
n
n

=l
(A

:)
_
_
2
=
l
nl
n

I=l
_

_
(A
I
:)
2

2
n
(A
I
:)
n

=l
(A

:)
l
n
2
_
_
n

=l
(A

:)
_
_
2
_

_
=
l
nl
_
_
_
n

I=l
(A
I
:)
2

2
n
_
n

I=l
(A
I
:)
_
2

l
n
_
n

I=l
(A
I
:)
_
2
_
_
_
=
l
nl
_
_
_
n

I=l
(A
I
:)
2

l
n
_
n

I=l
(A
I
:)
_
2
_
_
_
=
l
nl
_
_
_
n

I=l
(A
I
:)
2

l
n
_
_
n

I=l
(A
I
:)
2
2

lI<n
(A
I
:) (A

:)
_
_
_
_
_
=
l
n
n

I=l
(A
I
:)
2

2
n(nl)

lI<n
(A
I
:) (A

:) .
De aici, media lui o
2
este
1(o
2
) =
l
n
n

I=l
1
_
(A
I
:)
2
_

2
n(nl)

lI<n
1 ((A
I
:) (A

:))
independent a
=
l
n
n

I=l
1
_
(A
I
:)
2
_
. .
=c
2

2
n(nl)

lI<n
1 (A
I
:)
. .
=0
1 (A

:) = o
2
.
Deci
1(o
2
) = o
2
,
unde : si o
2
sunt denite de (7.2). Motivul folosirii lui
l
nl
n loc de
l
n
n (7.3)
este de a face media lui o
2
egal a cu o
2
. Aceasta este o proprietate de dorit
pentru o
2
dac a aceasta este folosit a la estimarea lui o
2
, adev arata dispersie a
lui A.
95
Dispersia lui o
2
este aat a din
ar(o
2
) = 1
_
_
o
2
o
2
_
2
_
.
Se obtine
ar(o
2
) =
1
:
_
j
d

: 8
: 1
o
d
_
,
unde j
d
este momentul centrat de ordinul 4 al lui A, adic a
j
d
= 1
_
(A :)
d
_
.
Teorema 7.1. Dac a o
2
este dispersia de selectie de m arime : a unei
populatii A ~
_
:, o
2
_
, atunci
(nl)S
2
c
2
are o repartitie
2
cu (: 1) grade de
libertate.
7.2.3 Momente de selectie
Momentul de selectie de ordinul / este
'
|
=
1
:
n

I=l
A
|
I
.
Observ am c a media de selectie se obtine pentru / = 1.
Se poate ar ata c a
1 ('
|
) = c
|
,
ar ('
|
) =
l
n
_
c
2|
c
2
|
_
,
unde c
|
este momentul de ordinul / al lui A.
Momentul centrat de selectie de ordinul / este
'
c
|
=
1
:
n

I=l
_
A
I
A
_
|
.
7.2.4 Statistici de ordine si functia de repartitie de selectie
O selectie A
l
, A
2
, ..., A
n
poate pus a n ordine cresc atoare. Astfel, pentru
aceast a selectie, statisticile de ordine sunt denite ca
A
(l)
_ A
(2)
_ ... _ A
(n)
,
cu A
(I)
ind a i-a statistic a de ordine.
Functia de repartitie de selectie

1
n
(r) este denit a ca num arul de date mai
mic sau egal cu r mp artit la m arimea selectiei :. Ea poate exprimat a n
termeni de statistici de ordine astfel:
96

1
n
(r) =
_
_
_
0, dac a r < A
(l)
,

n
, dac a A
()
_ r < A
(l)
,
1, dac a r _ A
(n)
.
Functia de repartitie de selectie estimeaz a neparametric functia de repartitie
a populatiei A. n gura urm atoare sunt reprezentate o functie de repartitie de
selectie si functia de repartitie pentru normala standard.
97
8 Estimarea parametrilor unor repartitii prin metoda
verosimilit atii maxime
8.1 Criterii de calitate pentru estim ari
Statistica

O = /(A
l
, A
2
, ..., A
n
)
se numeste un estimator pentru 0.
Odat a ce am observat valorile selectiei r
l
, r
2
, ..., r
n
, estimatorul observat,

0 = /(r
l
, r
2
, ..., r
n
) ,
are o valoare numeric a si va numit o estimare a parametrului 0.
8.1.1 Nedeplasare
Denitie. Un estimator

O se numeste estimator nedeplasat pentru 0 dac a
1
_

O
_
= 0,
si deplasat n caz contrar.
Deplasarea estimatorului

O este denit a ca
/ia:
_

O
_
= 1
_

O
_
0.
Exemple. 1) Media de selectie A =
l
n
n

I=l
A
I
este estimator nedeplasat
pentru media populatiei : deoarece 1
_
A
_
= :.
2) Dispersia de selectie o
2
=
l
nl
n

I=l
_
A
I
A
_
2
este estimator nedeplasat
pentru dispersia populatiei o
2
deoarece 1
_
o
2
_
= o
2
.
3) Estimatorul o
2+
=
l
n
n

I=l
_
A
I
A
_
2
este estimator deplasat pentru o
2
deoarece 1
_
o
2+
_
=
nl
n
o
2
. De aceea pentru denirea dispersiei de selectie se
prefer a coecientul
l
nl
in locul alegerii mai naturale
l
n
. Deplasarea lui o
2+
este
/ia:
_
o
2+
_
=
: 1
:
o
2
o
2
=
o
2
:
.
8.1.2 Dispersie minim a
Denitie. Fie

O un estimator nedeplasat pentru 0. El este un estimator
nedeplasat de dispersie minima dac a pentru toti ceilalti estimatori nedeplasati
O
+
pentru 0 din aceeasi selectie avem
98
ar
_

O
_
_ ar (O
+
) .
Fiind dati 2 estimatori nedeplasati pentru un parametru dat, cel cu dispersie
mai mic a este preferat deoarece dispersia mai mic a implic a faptul c a valorile ob-
servate ale estimatorului tind sa e mai aproape de media lui, valoarea adevarat a
a parametrului.
Exemplu. Am v azut c a A obtinut dintr-o selectie de m arime : este un
estimator nedeplasat pentru media populatiei :. Creste calitatea lui A cnd :
creste?
1
_
A
_
= : si este independent a de volumul esantionului. Deci A r amne
nedeplasat cnd : creste. Pe de alt a parte
ar
_
A
_
=
o
2
:
,
si descreste cnd : creste. Pe baza criteriului dispersiei minime, calitatea
lui A ca estimator pentru : creste cnd : creste.
Teorema 8.1 (inegalitatea Rao-Cramer). Fie A
l
, A
2
, ..., A
n
o selectie
de m arime : din o populatie A cu densitatea ) (r; 0), unde 0 este parametrul
necunoscut, si e

O = /(A
l
, A
2
, ..., A
n
) un estimator nedeplasat pentru 0.
Atunci, dispersia lui

O satisface inegalitatea
ar
_

O
_
_
_
:1
_
_
0 ln) (A; 0)
00
_
2
__
l
, (R.C.)
dac a media si derivata partial a scrise exist a. Presupunem c a se poate deriva in
raport cu 0 sub integral a. Un rezultat analog se obtine dac a A este discret a
nlocuind ) (A; 0) cu j (A; 0), unde j (r; 0) este masa populatiei A.
Demonstratie. 0
nedeplasare
= 1
_

O
_
= 1 (/(A
l
, A
2
, ..., A
n
))
1,...,r independente
=
_
o
o
...
_
o
o
/(r
l
, ..., r
n
) ) (r
l
; 0) ...) (r
n
; 0) dr
l
...dr
n
O
O0
==
1 =
_
o
o
...
_
o
o
/(r
l
, ..., r
n
)
_
_
n

=l
l
}(r,0)
J}(r,0)
J0
_
_
) (r
l
; 0) ...) (r
n
; 0) dr
l
...dr
n
=
_
o
o
...
_
o
o
/(r
l
, ..., r
n
)
_
_
n

=l
J In }(r,0)
J0
_
_
) (r
l
; 0) ...) (r
n
; 0) dr
l
...dr
n
.
(8.1)
) (r; 0) densitate =1 =
_
o
o
) (r
I
; 0) dr
I
, i = 1, 2, ..., :
O
O0
==
0 =
_
o
o
J}(r1,0)
J0
dr
I
=
_
o
o
J In }(r1,0)
J0
) (r
I
; 0) dr
I
, i = 1, 2, ..., :.
99
Fie 1 =
n

=l
J In }(,0)
J0
=
1 (1 ) =
n

=l
1
_
J In }(,0)
J0
_
=
n

=l
o
_
o
0 ln) (r

; 0)
00
) (r

; 0) dr

. .
=0
= 0.
A
l
, ..., A
n
independente =
J In }(1,0)
J0
, ...,
J In }(r,0)
J0
independente =
o
2
Y
=
n

=l
ar
_
J In }(,0)
J0
_
=
n

=l
1
_
_
_
_
_

_
J In }(,0)
J0
1
_
0 ln) (A

; 0)
00
_
. .
=0
_

_
2
_
_
_
_
=
n

=l
1
_
_
J In }(,0)
J0
_
2
_
=
n

=l
1
_
_
J In }(,0)
J0
_
2
_
= :1
_
_
J In }(,0)
J0
_
2
_
.
1
(8.1)
= 1(

O1 ) = 1
_

O
_
1 (1 )
. .
=0
j
b
CY
o
b
C
o
Y
= j
b
CY
o
b
C
o
Y
=
l
c
2
b

c
2
`
= j
2
b
CY
_ 1 =
o
2
b
C
_
l
c
2
`
=
_
:1
_
_
J In }(,0)
J0
_
2
__
l
.
Denitie. Marginea inferioar a a dispersiei oric arui estimator nedeplasat
dat a de inegalitatea (RC) este n general o functie de 0 si o numim marginea
inferioara Rao-Cramer. Notatie
MIRC =
_
:1
_
_
J In }(,0)
J0
_
2
__
l
.
Observatie. MIRC =
_
:1
_
J
2
In }(,0)
J0
2
__
l
.
Demonstratie. ) (r; 0) densitate =1 =
_
o
o
) (r; 0) dr
O
O0
==
0 =
_
o
o
J}(r,0)
J0
dr =
_
o
o
J In }(r,0)
J0
) (r; 0) dr
O
O0
==
0 =
_
o
o
_

_
J
2
In }(r,0)
J0
2
) (r; 0)
J In }(r,0)
J0

0) (r; 0)
00
. .
=
O ln j(o;0)
O0
}(r,0)
_

_
dr =
_
o
o
_
J
2
In }(r,0)
J0
2
) (r; 0)
_
J In }(r,0)
J0
_
2
) (r; 0)
_
dr ==
_
o
o
_
J In }(r,0)
J0
_
2
) (r; 0) dr =
_
o
o
J
2
In }(r,0)
J0
2
) (r; 0) dr ==
1
_
_
J In }(,0)
J0
_
2
_
= 1
_
J
2
In }(,0)
J0
2
_
==
100
MIRC =
_
:1
_
_
J In }(,0)
J0
_
2
__
l
=
_
:1
_
J
2
In }(,0)
J0
2
__
l
.
Denitie. Fie

O estimator nedeplasat pentru parametrul 0. Ecien ta lui

O este c
_

O
_
=
MIRC
uo:(
b
C)
.
Observatie. Ecienta oric arui estimator nedeplasat este _ 1.
Denitie. Un estimator nedeplasat cu ecienta 1 se numeste estimator
ecient.
Observatie. Din inegalitatea Rao-Cramer rezult a c a orice estimator ecient
este estimator nedeplasat de dispersie minim a.
Reciproc este adev arat doar dac a exist a un estimator ecient.
Exemple. 1) Fie A ~
_
:, o
2
_
. Pe baza unei selectii xate de m arime :,
este A estimator ecient pentru :?
Am v azut c a A este estimator nedeplasat pentru :. Calcul am MIRC pentru
dispersia oric arui estimator nedeplasat pentru :.
) (A; :) =
l
_
2tc
oxp
_

(n)
2
2c
2
_
==ln) (A; :) = ln
_
l
_
2tc
_

(n)
2
2c
2
==
J In }(,n)
Jn
=
n
c
2
=
1
_
_
J In }(,n)
Jn
_
2
_
=
l
c
4
1
_
(A :)
2
_
=
c
2
c
4
=
l
c
2
==
MIRC =
_
:1
_
_
J In }(,0)
J0
_
2
__
l
=
c
2
n
.
Dar ar
_
A
_
=
c
2
n
== ar
_
A
_
= MIRC == A estimator ecient pentru
:.
2) Fie A ~
_
0, o
2
_
, unde o
2
este un parametru necunoscut ce trebuie
estimat dintr-o selectie de m arime : 1.
a) S a se determine MIRC pentru dispersia oric arui estimator nedeplasat
pentru o
2
.
b) Este dispersia de selectie o
2
un estimator ecient pentru o
2
?
R. a) Not am 0 = o
2
==) (A; 0) =
l
(2t0)
1
2
oxp
_

2
20
_
==
ln) (A; 0) =

2
20

l
2
ln20 ==
J In }(,0)
J0
=

2
20
2

l
20
==
J
2
In }(,0)
J0
2
=

2
0
3

l
20
2
==
1
_
J
2
In }(,0)
J0
2
_
=
l
0
3
1
_
A
2
_
. .
=c
2

l
20
2
=
0
0
3

l
20
2
=
l
20
2
==
MIRC =
_
:1
_
J
2
In }(,0)
J0
2
__
l
=
20
2
n
.
b) Am v azut c a o
2
este un estimator nedeplasat pentru 0 si
ar
_
o
2
_
=
l
n
_
j
d

n3
nl
o
d
_
A ~
_
0, o
2
_
==j
d
= 8o
d
_
==
ar
_
o
2
_
=
l
n
_
8o
d

n3
nl
o
d
_
=
2c
4
nl
=
20
2
nl
==
c
_
o
2
_
=
MIRC
uo:(S
2
)
=
nl
n
.
101
Observ am c a o
2
nu este un estimator ecient pentru 0 n acest caz, dar este
asimptotic ecient n sensul c a lim
no
MIRC
uo:(S
2
)
= 1.
8.1.3 Consistent a
Denitie. Un estimator

O bazat pe o selectie de m arime : este estimator
consistent pentru 0 dac a
lim
no
1
_

O0

_ -
_
= 0, \- 0.
Teorema 8.2. Fie

O un estimator bazat pe o selectie de m arime :. Dac a
lim
no
1
_

O
_
= 0 si lim
no
ar
_

O
_
= 0,
atunci

O este un estimator consistent pentru 0.
Demonstratie. Fie - 0. Din inegalitatea lui Cebsev (vezi teorema 2.1),
obtinem
1
_

O1
_

O
_

_
-
2
_
_
4ar
_

O
_
-
2
.
Deoarece

O0

O1
_

O
_
1
_

O
_
0

O1
_

O
_

1
_

O
_
0

,
si, din lim
no
1
_

O
_
= 0 rezult a c a :(-) N a..

1
_

O
_
0

_
-
2
, \: _ :(-) ,
avem pentru : _ :(-)
1
_

O0

_ -
_
_ 1
_

O1
_

O
_

1
_

O
_
0

_ -
_
= 1
_

O1
_

O
_

_ -

1
_

O
_
0

_
_
1
_

O1
_

O
_

_
:
2
_
.
Obtinem, pentru : _ :(-)
0 _ 1
_

O0

_ -
_
_
4ar
_

O
_
-
2
,
de unde, trecnd la limit a rezult a lim
no
1
_

O0

_ -
_
= 0.
8.1.4 Sucient a
Fie A
l
, A
2
, ..., A
n
o selectie a populatiei A a c arei repartitie depinde de para-
metrul necunoscut 0. Dac a 1 = /(A
l
, A
2
, ..., A
n
) este o statistic a a. ., pentru
orice alt a statistic a
7 = q (A
l
, A
2
, ..., A
n
) ,
102
repartitia conditionat a a lui 7, dat ind c a 1 = j, nu depinde de 0, atunci 1
e numit a statistica sucienta pentru 0. Dac a n plus 1 (1 ) = 0, atunci 1 se
numeste estimator sucient pentru 0.
Teorema 8.3. (criteriul de factorizare Fisher-Neymann). Fie
1 = /(A
l
, A
2
, ..., A
n
)
o statistic a bazat a pe o selectie de m arime : a populatiei continue A. Atunci
1 este o statistic a sucient a pentru 0 dac a si numai dac a densitatea comun a a
lui A
l
, A
2
, ..., A
n
poate factorizat a sub forma
n

=l
)

(r

; 0) = q
l
(/(r
l
, ..., r
n
) , 0) q
2
(r
l
, ..., r
n
) .
Dac a A este discret a, conditia este
n

=l
j

(r

; 0) = q
l
(/(r
l
, ..., r
n
) , 0) q
2
(r
l
, ..., r
n
) .
Sucienta a fost demonstrat a de Fisher n 1922, iar necesitatea de Neymann
n 1935.
8.2 Metoda verosimilit atii maxime
Introdus a de Fischer n 1922 a devenit cea mai important a metod a general a de
estimare din punct de vedere teoretic.
Fie ) (r; 0) densitatea populatiei A, unde 0 este unicul parametru care tre-
buie estimat dintr-un set de valori de selectie r
l
, r
2
, ..., r
n
.
Denitie. Func tia de verosimilitate a unui set de : valori de selectie din
populatie este
1(r
l
, r
2
, ..., r
n
; 0) = ) (r
l
; 0) ) (r
2
; 0) ...) (r
n
; 0) .
n cazul n care A este discret a cu masa j (r; 0), avem
1(r
l
, r
2
, ..., r
n
; 0) = j (r
l
; 0) j (r
2
; 0) ...j (r
n
; 0) .
Cnd valorile de selectie sunt date, functia de verosimilitate 1 devine o
functie de o singur a variabil a 0. Procedura de estimare pentru 0 bazat a pe
metoda verosimilit atii maxime const a n alegerea, ca o estimare pentru 0, a
valorii particulare care maximizeaz a 1. Maximul lui 1(0) apare in cele mai
multe cazuri la valoarea lui 0 unde
JJ(0)
J0
= 0. De aici, ntr-un mare num ar de
cazuri, estimarea de verosimilitate maxima (EVM)

0 a lui 0 bazat a pe valorile
de selectie r
l
, r
2
, ..., r
n
poate determinat a din
d1
_
r
l
, r
2
, ..., r
n
;

0
_
d

0
= 0.
103
Dup a cum am v azut mai sus, functia 1 este n forma unui produs de functii
de 0. Deoarece 1 este ntotdeauna nenegativ a si si atinge maximul pentru
aceeasi valoare a lui

0 ca ln1, iar ln1 este n form a de sum a, este n general
mai usor s a obtinem EVM

0 rezolvnd
d ln1
_
r
l
, r
2
, ..., r
n
;

0
_
d

0
= 0,
numit a ecua tia de verosimilitate.
Solutia dorit a este una unde r ad acina

0 este o functie de r
l
, r
2
, ..., r
n
,
dac a astfel de r ad acin a exist a. Cnd exist a mai multe r ad acini ale ecuatiei
de verosimilitate, EVM este r ad acina corespunz atoare maximului global al lui
1 sau ln1.
n cazul a : parametri, functia de verosimilitate devine
1(r
l
, r
2
, ..., r
n
; 0
l
, ..., 0
n
) ,
si EVM pentru 0
l
, ..., 0
n
sunt obtinuti rezolvnd sistemul de ecuatii de
verosimilitate
0 ln1
0

= 0, , = 1, 2, ..., :.
Revenind la cazul unui singur parametru, s a reprezent am solutia ecuatiei de
verosimilitate prin

0 = /(r
l
, r
2
, ..., r
n
) .
Atunci estimatorul de verosimilitate maxima (EVM)

O pentru 0 este

O = /(A
l
, A
2
, ..., A
n
) .
Proprietatea 1: consisten ta si ecien ta asimptotica. Fie

O EVM pentru
0 din densitatea ) (r; 0) pe baza unei selectii de m arime :. Atunci EVM

O este
consistent si asimptotic ecient.
Un rezultat analog se obtine cnd populatia A este discret a. Mai mult,
repartitia lui

O tinde la o repartitie normal a cnd : .
Proprietatea 2: proprietatea de invarian ta. Dac a

O este EVM pentru 0,
atunci EVM pentru q (0) este q
_

O
_
, unde q este presupus a bijectiv a si derivabil a
n raport cu 0.
De exemplu, dac a

este EVM pentru deviatia standard o n o repartitie,


atunci EVM pentru dispersia o
2
este

2
.
Exemplu. Pentru repartitia (:, o
2
), s a se determine EVM pentru 0
l
= :
si 0
2
= o
2
.
R. Avem
)
_
r; :, o
2
_
=
l
(2t)
1
2 c
oxp
_

(rn)
2
2c
2
_
, r R.
Functia de verosimilitate este
1
_
r
l
, ..., r
n
; :, o
2
_
=
n

=l
l
(2t)
1
2 c
oxp
_

(rn)
2
2c
2
_
=
104
_
l
(2t)
1
2 c
_
n
oxp
_
_

l
2c
2
n

=l
(r

:)
2
_
_
==
ln1 =
l
2c
2
n

=l
(r

:)
2

l
2
:lno
2

l
2
:ln2.
Fie 0
l
= :, 0
2
= o
2
==
ln1 =
l
202
n

=l
(r

0
l
)
2

l
2
:ln0
2

l
2
:ln2,
J In J
J01
=
l
02
n

=l
(r

0
l
) ,
J In J
J02
=
l
20
2
2
n

=l
(r

0
l
)
2

n
202
.
Sistemul de verosimilitate este
_
J In J
J
b
01
= 0
J In J
J
b
02
= 0
==
_

_
l
b
02
n

=l
_
r

0
l
_
= 0 ==

0
l
=
l
n
n

=l
r

,
l
2
b
0
2
2
n

=l
_
r

0
l
_
2

n
2
b
02
= 0 ==

0
2
=
l
n
n

=l
_
r

0
l
_
2
.
EVM pentru : si o
2
sunt

O
l
=
l
n
n

=l
A

= A,

O
2
=
l
n
n

=l
_
A

A
_
2
=
nl
n
o
2
.
A estimator ecient pentru : ==

O
l
estimator ecient pentru : ==

O
l
asimptotic ecient pentru :.
1
_

O
l
_
= 1
_
A
_
= :
no
:
ar
_

O
l
_
= ar
_
A
_
=
c
2
n

no
0
_
_
_
teorema 8.2
==

O
l
estimator consistent pen-
tru :.
1
_

O
2
_
=
nl
n
1
_
o
2
_
=
nl
n
o
2
,= o
2
==

O
2
este estimator deplasat pentru
o
2
.
1
_

O
2
_

no
o
2
ar
_

O
2
_
=
_
nl
n
_
2
ar
_
o
2
_
=
_
nl
n
_
2
2c
4
nl
=
2c
4
(nl)
n
2

no
0
_
_
_
teorema 8.2
==

O
2
estimator consistent pentru o
2
.
1
_

O
2
_

no
o
2
lim
no
MIRC
uo:(
b
C2)
= lim
no
2o
4
r
2o
4
(r1)
r
2
= lim
no
n
nl
= 1
_

_
==

O
2
estimator asimp-
totic ecient pentru o
2
.
Exemplu. Presupunem c a populatia A are o repartitie uniform a pe inter-
valul (0, 0). Vrem s a determin am EVM pentru 0.
105
Avem
) (r; 0) =
_
l
0
, pentru 0 _ r _ 0
0, altfel.
(8.2)
Functia de verosimilitate devine
1(r
l
, r
2
, ..., r
n
; 0) =
_
1
0
_
n
, 0 _ r
I
_ 0, \i. (8.3)
Gracul lui 1 este dat n gura urm atoare.
Observ am c a toate valorile selectiei r
I
trebuie s a e mai mici sau egale cu
0, implicnd c a doar portiunea curbei de la dreapta lui max (r
l
, r
2
, ..., r
n
) este
aplicabil a. De aici, maximul lui 1 apare n 0 = max (r
l
, r
2
, ..., r
n
), sau EVM
pentru 0 este

0 = max (r
l
, r
2
, ..., r
n
) , (8.4)
si estimatorul de verosimilitate maxim a pentru 0 este

O = max (A
l
, A
2
, ..., A
n
) = A
(n)
. (8.5)
Observ am c a nu am obtinut relatia (8.4) rezolvnd ecuatia de verosimilitate.
Ecuatia de verosimilitate nu se aplic a n acest caz deoarece maximul lui 1 apare
la frontier a si derivata nu este 0 acolo.
106
Studiem unele propriet ati ale lui

O dat de relatia (8.5). Densitatea lui

O
este (vezi subsectiunea 5.6)
)
b
C
(r) = :1
nl

(r) )

(r) .
Cu )

(r) din relatia (8.2) si (din relatia (5.2), pentru a = 0 si / = 0)


1

(r) =
_
_
_
0, pentru r < 0;
r
0
, pentru 0 _ r _ 0;
1, pentru r 0,
avem
)
b
C
(r) =
_
nr
r1
0
r
, pentru 0 _ r _ 0;
0, altfel.
Media si dispersia lui

O sunt
1
_

O
_
=
_
o
o
r)
b
C
(r) dr =
_
0
0
r
nr
r1
0
r
dr =
n
0
r
_
0
0
r
n
dr =
n
0
r

r
r+1
nl
[
0
0
=
n
nl
0,
ar
_

O
_
=
_
o
o
_
r 1
_

O
__
2
)
b
C
(r) dr =
_
0
0
_
r
n
nl
0
_
2
nr
r1
0
r
dr =
n
0
r
_
0
0
_
r
2
2
n
nl
0r
_
n
nl
0
_
2
_
r
nl
dr =
n
0
r
_
r
r+2
n2
2
n
nl
0
r
r+1
nl

_
n
nl
0
_
2
r
r
n
_
[
0
0
=
:
_
0
2
n2

2n0
2
(nl)
2

n0
2
(nl)
2
_
= :0
2
_
l
n2

n
(nl)
2
_
=
_
n
(nl)
2
(n2)
_
0
2
.
1
_

O
_
=
n
nl
0 ,= 0 ==

O este deplasat.
1
_

O
_

no
0
ar
_

O
_
=
_
n
(nl)
2
(n2)
_
0
2

no
0
_
_
_
teorema 8.2
==

O estimator consistent.
107
9 Estimarea parametrilor repartitiei normale N(m;
2
):
estimatori punctuali, intervale de estimare (de
ncredere)
9.1 Estimatori punctuali
n sectiunea precedent a am considerat estimarea parametrilor repartitiei nor-
male prin metoda verosimilit atii maxime.
9.1.1 Metoda momentelor
Metoda momentelor a fost propus a de Pearson n 1894.
Consider am o densitate ) (r; 0
l
, 0
2
, ..., 0
n
) pentru care parametrii 0

, , =
1, 2, ..., :sunt de estimat pe baza unei selectii A
l
, A
2
, ..., A
n
a lui A. Momentele
teoretice ale populatiei A sunt
c
I
=
_
o
o
r
I
) (r; 0
l
, ..., 0
n
) dr, i = 1, 2, ....
Ele sunt, n general, functii de parametrii necunoscuti, adic a
c
I
= c
I
(0
l
, 0
2
, ..., 0
n
) .
Momentele de selectie sunt
'
I
=
1
:
n

=l
A
I

, i = 1, 2, ....
Metoda momentelor sugereaz a c a, pentru a determina estimatorii

O
l
, ...,

O
n
din selectie, egal am un num ar sucient de momente de selectie cu momentele
corespunz atoare ale populatiei. Procedura determin arii lui

O
l
, ...,

O
n
const a n
urm atorii pasi:
Pasul 1: e
c
I
_

O
l
, ...,

O
n
_
= '
I
, i = 1, 2, ..., :. (9.1)
Acestea sunt : ecuatii de moment cu : necunoscute

O
l
, ...,

O
n
.
Pasul 2: rezolv a acest sistem de ecuatii, determinnd

O
l
, ...,

O
n
, numiti
estimatorii de moment pentru 0
l
, ..., 0
n
.
Nu este necesar s a consider am : ecuatii de moment consecutive ca n relatia
(9.1); orice : ecuatii de moment convenabile care conduc la

O
l
, ...,

O
n
sunt
suciente. Ecuatiile momentelor de ordin mai mic sunt totusi preferate deoarece
cer o mai mic a manipulare a datelor observate.
108
Exemplul 9.1. Alegem repartitia normal a ca model pentru randamentul
procentual discutat n capitolul 7, adic a
)
_
r; :, o
2
_
=
1
o
_
2
oxp
_

(r :)
2
2o
2
_
, r R.
Estim am parametrii 0
l
= : si 0
2
= o
2
pe baza celor 200 de valori ale selectiei
date n tabel.
Urmnd metoda momentelor, avem nevoie de 2 ecuatii de moment, si cele
mai convenabile sunt
c
l
= '
l
= A,
si
c
2
= '
2
.
Avem
c
l
= 0
l
.
De aici, prima dintre aceste ecuatii de moment d a

O
l
= A =
1
:
n

=l
A

. (9.2)
Propriet atile acestui estimator au fost discutate n capitolul precedent. El este
nedeplasat si are dispersie minim a ntre toti estimatorii nedeplasati pentru :.
Ecuatia momentului de ordinul 2 d a

O
2
l


O
2
= '
2
=
1
:
n

=l
A
2

,
sau

O
2
= '
2
'
2
l
=
l
n
n

=l
A
2

A
2
.
Pe de alt a parte
l
n
n

=l
_
A

A
_
2
=
l
n
n

=l
_
A
2

2A

A A
2
_
=
l
n
_
_
n

=l
A
2

2A
n

=l
A

:A
2
_
_
=
l
n
_
_
n

=l
A
2

2A:A :A
2
_
_
=
l
n
n

=l
A
2

A
2
.
Deci

O
2
=
1
:
n

=l
_
A

A
_
2
. (9.3)
109
Acesta, dup a cum am ar atat, este un estimator deplasat pentru o
2
.
Estim arile

0
l
si

0
2
ale lui 0
l
= : si 0
2
= o
2
pe baza valorilor selectiei date
de tabel sunt, urmnd relatiile (9.2) si (9.3)

0
l
=
1
200
200

=l
r

70,

0
2
=
1
200
200

=l
_
r

0
l
_
2
4,
unde r

, , = 1, 2, ..., 200 sunt valorile de selectie din tabelul din capitolul 7.


9.2 Intervale de ncredere
Exemplul 9.2. 5 valori de selectie 8; 2; 1, ; 0, ; 2, 1 sunt observate dintr-o
repartitie normal a avnd o medie necunoscut a :si o dispersie cunoscut a o
2
= 0.
EVM al lui : este media de selectie A si deci,
: =
1

(8 2 1, 0, 2, 1) = 1, 82. (9.4)
Vrem s a determin am margini ale unui interval astfel nct, cu un nivel de
ncredere specicat, media adevarat a : s a e n acest interval. A, ind sum a
de variabile aleatoare normale, este normal a cu
1
_
A
_
= :,
ar
_
A
_
=
c
2
n
=
9
5
.
Variabila aleatoare standardizat a
l =
A 1
_
A
_
_
ar
_
A
_
=
_

_
A :
_
8
(9.5)
este (0, 1) si are densitatea
)
I
(r) =
1
_
2
c

o
2
2
. (9.6)
Presupunem c a cerem ca 1 (n
l
< l < n
l
) = 0, 0. Determin am n
l
.
0, 0 = 1 (n
l
< l < n
l
) =
_
u1
u1
)
I
(r) dr =
_
u1
o
)
I
(r) dr
_
u1
o
)
I
(r) dr =
1(n
l
) 1(n
l
) =
1(n
l
) (1 1(n
l
)) = 21(n
l
) 1 =
1(n
l
) =
0,95l
2
= 0, 07.
Din tabelul valorilor functiei 1 rezult a n
l
= 1, 06 si
1 (1, 06 < l < 1, 06) =
_
l,96
l,96
)
I
(r) dr = 0, 0 (9.7)
110
=1
_
1, 06 <
_
5(n)
3
< 1, 06
_
= 0, 0 =1
_
, 88 <
_

_
A :
_
< , 88
_
=
0, 0 =
1
_
2, 68 < A : < 2, 68
_
= 0, 0 =1
_
2, 68 < :A < 2, 68
_
= 0, 0 =
1
_
A 2, 68 < : < A 2, 68
_
= 0, 0. (9.8)
Intervalul de 0/ ncredere pentru : este
_
A 2, 68; A 2, 68
_
. Folosind re-
latia (9.4), intervalul de 0/ ncredere pentru : estimat pe baza observatiilor
este ( :2, 68; : 2, 68) = (1, 82 2, 68; 1, 82 2, 68) = (0, 81; 4, 4), adic a
1 (0, 81 < : < 4, 4) = 0, 0. (9.9)
Probabilitatea ca intervalul aleator
_
A 2, 68; A 2, 68
_
s a contin a ade-
v arata medie : a repartitiei este 0, 0, iar relatia (9.9) d a intervalul observat
bazat pe valorile date ale selectiei.
Denitie. Presupunem c a o selectie A
l
, A
2
, ..., A
n
este extras a dintr-o
populatie avnd densitatea ) (r; 0), 0 ind parametrul de estimat. Mai departe
presupunem c a 1
l
(A
l
, ..., A
n
) si 1
2
(A
l
, ..., A
n
) sunt dou a statistici astfel nct
1
l
< 1
2
cu probabilitatea 1. Intervalul (1
l
, 1
2
) este numit un interval de
ncredere [100 (1 c)[ / pentru 0 dac a 1
l
si 1
2
pot alese astfel nct
1 (1
l
< 0 < 1
2
) = 1 c. (9.10)
Limitele 1
l
si 1
2
sunt numite, respectiv, limitele inferioara si superioara de
ncredere pentru 0, si 1 c este numit coecientul de ncredere. Valoarea lui
1 c este luat a n general 0, 0; 0, 0; 0, 00; 0, 00 sau 0, 000.
Interval de ncredere pentru : n
_
:, o
2
_
cu o
2
cunoscut Intervalul
de ncredere dat de relatia (9.8) estimeaz a media unei populatii normale cu
dispersie cunoscut a. n termeni generali, procedura arat a c a nti determin am
un interval simetric n l pentru a obtine un coecient de ncredere de 1 c.
Notnd cu n
o/2
valoarea lui l de la care aria de sub )
I
(n) este c,2, adic a
1
_
l n
o/2
_
= c,2 (vezi gura urm atoare), avem
1
_
n
o/2
< l < n
o/2
_
= 1 c. (9.11)
111
De aici, folosind transformarea dat a de relatia (9.5), avem rezultatul general
1
_
A
on
o/2
_
:
< : < A
on
o/2
_
:
_
= 1 c. (9.12)
Acest rezultat poate de asemenea folosit pentru a estima medii ale populatiilor
nenormale cu dispersii cunoscute dac a m arimea selectiei este sucient de mare
pentru a justica folosirea teoremei limit a central a.
n acest caz, pozitia intervalului este o functie de A si de aceea este o functie
de selectie. n contrast, m arimea intervalului, este o functie doar de m arimea
selectiei :, ind invers proportional a cu
_
:.
Intervalul de ncredere [100 (1 c)[ / pentru : dat de relatia (9.12) d a de
asemenea o estimare a acuratetei estimatorului punctual A pentru :. Dup a
cum vedem din gura urm atoare, adev arata medie : se a a n intervalul indicat
cu [100 (1 c)[ / ncredere.
112
Deoarece A este centrul intervalului, distanta dintre A si : poate cel mult
egal a cu jum atate din m arimea intervalului.
Teorema 9.1. Cu [100 (1 c)[ / ncredere, eroarea folosirii estimatorului
A pentru : este mai mic a dect
on
o/2
_
:
.
Exemplul 9.3. Fie populatia A repartizat a normal cu dispersia cunoscut a
o
2
. Determinati m arimea minim a : a selectiei de care e nevoie, astfel nct
eroarea estim arii mediei : prin A s a e mai mic a dect o cantitate specicat a
- cu [100 (1 c)[ / ncredere.
Folosind teorema 9.1, m arimea minim a a selectiei trebuie s a satisfac a
- =
on
o/2
_
:
.
De aici, solutia este
: =
_
on
o/2
-
_
2
. (9.13)
Interval de ncredere pentru : n
_
:, o
2
_
cu o
2
necunoscut Diferenta
dintre aceast a problem a si precedenta este c a, deoarece o nu este cunoscut, nu
mai putem folosi
l =
_
A :
_
_
o
_
:
_
l
ca variabila aleatoare pentru calculul limitelor de ncredere privind media :.
Folosim dispersia de selectie o
2
ca un estimator nedeplasat pentru o
2
si
consider am variabila aleatoare
1 =
_
A :
_
_
o
_
:
_
l
. (9.14)
Variabila aleatoare 1 este acum o functie de variabilele aleatoare A si o. De-
termin am repartitia lui 1.
113
Teorema 9.2. (Repartitia t a lui Student) Consider am o variabil a
aleatoare T denit a prin
T = l
_
\
:
_

1
2
. (9.15)
Dac a l ~ (0, 1), \ este repartizat a
2
cu : grade de libertate, iar l si \
sunt independente, atunci densitatea lui T are forma
)
T
(t) =
I
_
nl
2
_
I
_
n
2
_ _
:
_
1
t
2
:
_

r+1
2
, t R. (9.16)
Aceast a repartitie este cunoscut a ca reparti tia t a lui Student cu : grade de
libertate; este numit a dup a W. S. Gosset, care a folosit pseudonimul "Student"
n publicatiile sale de cercetare.
Dup a cum se vede din relatia (9.16), repartitia t este simetric a n jurul
originii. Cnd : creste, ea tinde la o repartitie normal a standard.
ntorcndu-ne la variabila aleatoare 1 denit a de relatia (9.14), e
l =
_
A :
_
_
o
_
:
_
l
si
\ =
(: 1) o
2
o
2
.
Atunci
1 = l
_
\
: 1
_

1
2
, (9.17)
unde l ~ (0, 1), iar \ are repartitia
2
cu (: 1) grade de libertate (vezi
teorema 7.1). Mai departe, se poate ar ata c a A si o
2
sunt independente, deci
si l si \ sunt independente. Din teorema 9.2, variabila aleatoare 1 are astfel
o repartitie t cu (: 1) grade de libertate.
Variabila aleatoare 1 poate folosit a pentru a stabili intervale de ncredere
pentru media :. Valoarea lui 1 depinde de media necunoscut a :, dar repartitia
lui 1 nu depinde de :.
Repartitia t este tabelat a n tabelul A.4 urm ator.
114
Fie t
n,o/2
valoarea astfel nct
1
_
T t
n,o/2
_
=
c
2
,
cu : reprezentnd num arul de grade de libertate (vezi gura urm atoare).
115
Avem
1
_
t
nl,o/2
< 1 < t
nl,o/2
_
= 1 c. (9.18)
nlocuind 1 din relatia (9.14) n relatia (9.18), un interval de ncredere [100 (1 c)[ /
pentru media : este dat de
1
_
A
t
nl,o/2
o
_
:
< : < A
t
nl,o/2
o
_
:
_
= 1 c. (9.19)
Deoarece A si o sunt functii de selectie, att pozitia ct si m arimea intervalului
dat mai sus variaz a de la selectie la selectie.
Exemplul 9.4. Presupunem c a nivelul anual al c aderilor de z apad a n zona
Bufallo este repartizat normal. Folosind nregistr arile c aderilor de z apad a din
1969-1970 pn a n 1978-1979 din tabelul urm ator, s a se determine un interval
de ncredere 0/ pentru media :.
116
n acest exemplu c = 0.0, : = 10, media de selectie observat a este
r =
1
10
(120. 07 ... 07.8) = 112.4,
si dispersia de selectie observat a este
:
2
=
1
0
_
(120. 112.4)
2
(07 112.4)
2
... (07.8 112.4)
2
_
= 1414.8.
Din tabelul A.4 g asim t
9,0.025
= 2.262. nlocuind aceste valori n relatia (9.19),
obtinem
1 (8. < : < 180.8) = 0.0.
Interval de ncredere pentru o
2
n
_
:, o
2
_
Un estimator punctual nede-
plasat pentru dispersia o
2
a populatiei este o
2
. Pentru construirea intervalelor
de ncredere pentru o
2
, folosim variabila aleatoare
1 =
(: 1) o
2
o
2
, (9.20)
care are repartitie chi-p atrat cu (: 1) grade de libertate (teorema 7.1). Notnd

2
n,o/2
valoarea astfel nct 1
_
1
2
n,o/2
_
= c,2 cu : grade de libertate,
putem scrie (vezi gura urm atoare)
1
_

2
nl,l(o/2)
< 1 <
2
nl,o/2
_
= 1 c, (9.21)
care d a, nlocuind 1 din relatia (9.20),
1
_
(: 1) o
2

2
nl,o/2
< o
2
<
(: 1) o
2

2
nl,l(o/2)
_
= 1 c. (9.22)
117
Tabelul A.5 d a valori ale lui
2
n,o
pentru diferite valori ale lui : si c.
118
Relatia (9.22) este folosit a pentru construirea intervalelor de ncredere pentru o
2
cu ambele margini nite pentru o populatie normal a. Un interval de ncredere
pentru o
2
cu o singur a margine nit a este dat de (vezi gura urm atoare)
1
_
o
2

(: 1) o
2

2
nl,o
_
= 1 c. (9.23)
119
Exemplul 9.5. Determin am intervalele de ncredere 0/ pentru o
2
pentru
datele din exemplul 9.4.
Am v azut n exemplul 9.4 c a dispersia de selectie observat a este
:
2
= 1414.8.
Din tabelul A.5 obtinem

2
9,0.975
= 2.7,
2
9,0.025
= 10.028,
2
9,0.05
= 16.010.
Relatiile (9.22) si (9.23) cu : = 10 si c = 0.0 conduc la
1
_
660.12 < o
2
< 4714.88
_
= 0.0
si
1
_
o
2
72.8
_
= 0.0.
120
10 Modele liniare. Estimarea parametrilor prin
metoda celor mai mici p atrate. Elemente de
analiz a discriminant a liniar a
10.1 Regresie liniar a
Presupunem c a variabila aleatoare 1 este o functie de o variabil a independent a
si relatia lor este liniar a, adic a
1 (1 ) = c ,r. (10.1)
Constantele c si , sunt necunoscute si trebuie estimate dintr-o selectie de
valori ale lui 1 cu valorile asociate lor ale lui r. ntr-un singur experiment, r
va avea o anumit a valoare r
I
si media lui 1 va lua valoarea
1 (1
I
) = c ,r
I
. (10.2)
Denim variabila aleatoare 1 prin
1 = 1 (c ,r) . (10.3)
Modelul de regresie liniara simpla este
1 = c ,r 1, (10.4)
unde 1 are media 0 si dispersia o
2
, care coincide cu dispersia lui 1 . Valoarea
lui o
2
este necunoscut a n general, dar este presupus a a constant a si nu o
functie de r.
Parametrii necunoscuti c si , sunt numiti coecien ti de regresie, iar variabila
aleatoare 1 reprezint a deviatia lui 1 n jurul mediei.
10.1.1 Estimarea prin metoda celor mai mici p atrate
Estim arile c si

, prin metoda celor mai mici p atrate pentru parametrii de
regresie c si , sunt alese astfel nct suma p atratelor diferentelor dintre valorile
de selectie observate j
I
si c

,r
I
, valoarea medie estimat a a lui 1 , este minim a.
Fie
c
I
= j
I

_
c

,r
I
_
, i = 1, :. (10.5)
Estim arile c si

, sunt g asite minimiznd
Q =
n

I=l
c
2
I
=
n

I=l
_
j
I

_
c

,r
I
__
2
. (10.6)
Perechile valorilor de selectie sunt (r
l
, j
l
) , ..., (r
n
, j
n
), iar c
I
, i = 1, 2, ..., : se
numesc reziduuri. Figura urm atoare d a o prezentare grac a a acestei proceduri.
121
Vedem c a reziduurile sunt distantele verticale dintre j
I
, valorile observate ale
lui 1 , si estimarea c

,r a adev aratei drepte de regresie c ,r.


Teorema 10.1. Fie modelul de regresie liniar a simpl a dat de relatia (10.4).
Fie (r
l
, j
l
) , (r
2
, j
2
) , ..., (r
n
, j
n
) valorile de selectie observate ale lui 1 cu valorile
asociate ale lui r. Presupunem c a cel putin 2 dintre r
l
, ..., r
n
sunt distincte.
Atunci estim arile prin metoda celor mai mici p atrate ale lui c si , sunt
c = j

,r, (10.7)

, =
n

I=l
(r
I
r) (j
I
j)
n

I=l
(r
I
r)
2
, (10.8)
unde
122
r =
1
:
n

I=l
r
I
si
j =
1
:
n

I=l
j
I
.
Demonstratie. Fie
Q
_
c,

,
_
=
n

I=l
_
j
I

_
c

,r
I
__
2
==
JQ
Jb o
=
n

I=l
2
_
j
I

_
c

,r
I
__
,
JQ
J
b
o
=
n

I=l
2r
I
_
j
I

_
c

,r
I
__
,
J
2
Q
Jb o
2
=
n

I=l
2 (1) = 2: 0,
J
2
Q
Jb oJ
b
o
=
n

I=l
2r
I
(1) = 2
n

I=l
r
I
= 2:r,
J
2
Q
J
b
o
2
=
n

I=l
2r
I
(r
I
) = 2
n

I=l
r
2
I
,
1 =

J
2
Q
Jb o
2
J
2
Q
Jb oJ
b
o
J
2
Q
Jb oJ
b
o
J
2
Q
J
b
o
2

= 4:
_
n

I=l
r
2
I
:r
2
_
= 4:
_
n

I=l
r
2
I
2:r
2
:r
2
_
=
4:
_
n

I=l
r
2
I
2:r
l
n
n

I=l
r
I

n

I=l
r
2
_
= 4:
n

I=l
_
r
2
I
2rr
I
r
2
_
=
4:
n

I=l
(r
I
r)
2
0
O
2

Ob c
2
,0
==
HQ =
_
_
J
2
Q
Jb o
2
J
2
Q
Jb oJ
b
o
J
2
Q
Jb oJ
b
o
J
2
Q
J
b
o
2
_
_
pozitiv denit a ==Q (strict) convex a == c si

,
care minimizeaz a pe Q sunt solutia sistemului
_
JQ
Jb o
= 0
JQ
J
b
o
= 0
==
_

_
: c

,
n

I=l
r
I
=
n

I=l
j
I
c
n

I=l
r
I

,
n

I=l
r
2
I
=
n

I=l
r
I
j
I
==
: c :r

, = :j (10.9)
:r c

,
n

I=l
r
2
I
=
n

I=l
r
I
j
I
. (10.10)
123
Ecuatiile din ultimul sistem se numesc ecuatii normale. nmultind (10.9) cu
r si sc aznd-o din (10.10) =

, =
r

1=1
r11nr
r

1=1
r
2
1
nr
2
vezi calculul lui 1
=
r

1=1
r11r
r

1=1
1
r

1=1
r1
r

1=1
r
r

1=1
(r1r)
2
=
r

1=1
|1(r1r)(r1r)|
r

1=1
(r1r)
2
=
r

1=1
(r1r)(1)
r

1=1
(r1r)
2
.
Din (10.9) =
c = j r

,.
Restabilim rezultalele de mai sus folosind o notatie matriceal a care usureaz a
calculele si permite generaliz ari cnd consider am modele mai generale de regre-
sie.
n termeni de valori de selectie observate (r
l
, j
l
) , (r
2
, j
2
) , ..., (r
n
, j
n
), avem
sistemul de ecuatii de regresie observate
j
I
= c ,r
I
c
I
, i = 1, 2, ..., :. (10.11)
Fie
C =
_
_
_
_
_
1 r
l
1 r
2
.
.
.
.
.
.
1 r
n
_
_
_
_
_
, y =
_
_
_
_
_
j
l
j
2
.
.
.
j
n
_
_
_
_
_
, e =
_
_
_
_
_
c
l
c
2
.
.
.
c
n
_
_
_
_
_
,
si
=
_
c
,
_
.
Ecuatiile (10.11) se scriu echivalent
y = C e. (10.12)
Suma p atratelor reziduurilor dat a de relatia (10.6) este acum
Q() = e
T
e =(y C)
T
(y C) . (10.13)
Estimarea prin metoda celor mai mici p atrate a lui ,

, este g asit a mini-
miznd Q. Deoarece
\Q() = 2C
T
(y C)
si
HQ() = 2C
T
C
este pozitiv denit a, solutia

este obtinut a din
\Q
_

_
= 0,
124
deci din ecuatia normal a
C
T
_
y C

_
= 0, (10.14)
sau
C
T
C

= C
T
y,
care d a

=
_
C
T
C
_
l
C
T
y. (10.15)
n cele de mai sus, matricea HQ() este pozitiv denit a si inversa matricei C
T
C
exist a dac a sunt cel putin 2 valori distincte r
I
n selectie.
Veric am c a relatia (10.15) este identic a cu relatiile (10.7) si (10.8) observnd
c a
C
T
C =
_
1 1 ... 1
r
l
r
2
... r
n
_
_
_
_
_
_
1 r
l
1 r
2
.
.
.
.
.
.
1 r
n
_
_
_
_
_
=
_
_
_
: :r
:r
n

I=l
r
2
I
_
_
_,
_
C
T
C
_
l
=
1
ool C
T
C
_
C
T
C
_
+
=
1
:
_
n

I=l
r
2
I
:r
2
_
_
_
_
n

I=l
r
2
I
:r
:r :
_
_
_,
C
T
y =
_
1 1 ... 1
r
l
r
2
... r
n
_
_
_
_
_
_
j
l
j
2
.
.
.
j
n
_
_
_
_
_
=
_
_
_
:j
n

I=l
r
I
j
I
_
_
_
si

=
_
C
T
C
_
l
C
T
y =
l
n
0
@
r

1=1
r
2
1
nr
2
1
A
_
_
_
n

I=l
r
2
I
:r
:r :
_
_
_
_
_
_
:j
n

I=l
r
I
j
I
_
_
_ =
_
_
_
_
_
_
_
_
_
_
_
_
_

1=1
r
2
1
r
r

1=1
r11
r

1=1
r
2
1
nr
2
r

1=1
r11nr
r

1=1
r
2
1
nr
2
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
j
r

1=1
r11nr
r

1=1
r
2
1
nr
2
r
r

1=1
(r1r)(1)
r

1=1
(r1r)
2
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
j

,r
r

1=1
(r1r)(1)
r

1=1
(r1r)
2
_
_
_
_
_
_
_
.
125
Exemplul 10.1. Este de asteptat ca randamentul procentual mediu, 1 ,
dintr-un proces chimic s a e legat liniar de temperatura procesului, r, n

C.
Determinati prin metoda celor mai mici p atrate dreapta de regresie pentru 1 (1 )
pe baza a 10 observatii date n tabelul
i 1 2 3 4 5 6 7 8 9 10
r(

C) 45 50 55 60 65 70 75 80 85 90
j 43 45 48 51 55 57 59 63 66 68
R. Pentru a folosi relatiile (10.7) si (10.8) avem nevoie de urm atoarele can-
tit ati
r =
1
:
n

I=l
r
I
=
1
10
(4 0 ... 00) =
18
10
= 67, ,
j =
1
:
n

I=l
j
I
=
1
10
(48 4 ... 68) = , ,
n

I=l
(r
I
r)
2
= 2062, ,
n

I=l
(r
I
r) (j
I
j) = 1182, .
nlocuirea acestor valori n relatiile (10.7) si (10.8) d a

, =
n

I=l
(r
I
r) (j
I
j)
n

I=l
(r
I
r)
2
=
1182,
2062,
0, 7,
c = j

,r , 0, 7 67, 17, 08.


Deci dreapta de regresie estimat a are ecuatia j = 17, 08 0, 7r si este
ar atat a mpreun a cu valorile selectiei observate n gura urm atoare.
126
Relatiile de regresie sunt valabile doar pentru intervalul valorilor r reprezen-
tate de date. Astfel, dreapta de regresie estimat a n exemplul 10.1 e valabil a
doar pentru temperaturi ntre 4

C si 00

C. Extrapolarea rezultatului n afara


acestui interval poate conduce la greseli si nu este valabil a n general.
Analiza regresiei liniare ca cea f acut a n exemplul 10.1 este bazat a pe pre-
supunerea c a adev arata relatie ntre 1 (1 ) si r este liniar a. Dac a relatia este
neliniar a sau inexistent a, regresia liniar a produce rezultate f ar a sens, chiar dac a
o linie dreapt a pare s a dea o bun a potrivire a datelor.
10.1.2 Propriet atile estimatorilor prin metoda celor mai mici p a-
trate
Fie

si

1, estimatorii prin metoda celor mai mici p atrate pentru c, respectiv
, si e

=
_

1
_
. (10.16)
Din relatia (10.15) avem

=
_
C
T
C
_
l
C
T
Y, (10.17)
unde
Y =
_
_
_
1
l
.
.
.
1
n
_
_
_, (10.18)
si 1

, , = 1, 2, ..., :, sunt independente si identic repartizate n concordant a cu


relatia (10.4). Astfel, dac a scriem
Y =C E, (10.19)
127
atunci E este un vector aleator cu media 0 si matricea de covariant a =
2
I,
I ind matricea unitate de ordinul :.
Din relatiile (10.17) si (10.19), avem
1
_

_
=
_
C
T
C
_
l
C
T
1 (Y) =
_
C
T
C
_
l
C
T
[C1 (E)[ =
_
C
T
C
_
l
C
T
C =
(10.20)
De aici, estimatorii

si

1 pentru c, respectiv ,, sunt nedeplasati.
Matricea de covariant a asociat a cu

este dat a de, dup a cum rezult a din
relatia (10.17) si lema 3.1, deoarece
_
C
T
C
_
l
este simetric a,
co
_

_
= 1
_
_

__

_
T
_
=
_
C
T
C
_
l
C
T
co (Y) C
_
C
T
C
_
l
.
Dar co (Y) =
2
I; astfel, avem
co
_

_
=
2
_
C
T
C
_
l
C
T
C
_
C
T
C
_
l
=
2
_
C
T
C
_
l
. (10.21)
Elementele de pe diagonala matricei din relatia (10.21) dau dispersiile lui

si

1. n termeni de elementele lui C, putem scrie


ar
_

_
=

2
n

I=l
r
2
I
:
n

I=l
(r
I
r)
2
, (10.22)
ar
_

1
_
=

2
n

I=l
(r
I
r)
2
(10.23)
Se vede c a aceste dispersii descresc cnd m arimea selectiei : creste. Astfel,
rezult a din capitolul 8 c a acesti estimatori sunt consistenti. Pentru un : xat,
dispersia lui

1 poate redus a selectnd r
I
-urile astfel nct numitorul relatiei
(10.23) este maximizat; asta poate f acut mpr astiind r
I
-urile ct mai departe
posibil. n exemplul 10.1, presupunnd c a suntem liberi s a alegem valorile lui
r
I
, calitatea lui

, este mbun at atit a dac a jum atate din citirile r sunt luate la
o extrem a a intervalului temperaturii si cealalt a jum atate la cealalt a extrem a.
Strategia de selectie pentru minimizarea ar
_

_
pentru un : xat este de a
face r pe ct posibil ct mai aproape de 0.
Sunt dispersiile date de relatiile (10.22) si (10.23) dispersii minime ntre
dispersiile estimatorilor nedeplasati pentru c si ,? Un r aspuns la aceast a n-
trebare poate aat comparnd rezultatele date de relatiile (10.22) si (10.23)
cu marginile inferioare Rao-Cramer denite n sectiunea 8.1.2. Pentru a evalua
aceste margini, repartitia lui 1 trebuie s a e cunoscut a. Totusi, f ar a a cunoaste
repartitia lui 1 , se poate ar ata c a tehnica celor mai mici p atrate conduce la
128
estimatori liniari nedeplasa ti de dispersie minima, adic a, dintre toti estimatorii
nedeplasati care sunt liniari n Y, estimatorii prin metoda celor mai mici p atrate
au dispersie minim a.
Teorema 10.2. Fie variabila aleatoare 1 denit a n relatia (10.4). Fiind
dat a o selectie (r
l
, 1
l
) , (r
2
, 1
2
) , ..., (r
n
, 1
n
) a lui 1 cu valorile r asociate, esti-
matorii prin metoda celor mai mici p atrate

si

1 dati de relatia (10.17) sunt
estimatori liniari nedeplasa ti de dispersie minima pentru c, respectiv ,.
Demonstratie. Consider am un estimator liniar nedeplasat de forma

+
=
_
_
C
T
C
_
l
C
T
G
_
Y. (10.24)
Vrem s a ar at am c a dac a
+
are dispersie minim a, atunci G = 0.
Datorit a relatiei (10.19), cerinta de nedeplasare conduce la
GC = 0. (10.25)
Consider am acum matricea de covariant a
co (
+
) = 1
_
(
+
) (
+
)
T
_
. (10.26)
Folosind relatiile (10.19), (10.24), (10.25) si lema 3.1, avem
co (
+
) = o
2
_
_
C
T
C
_
l
GG
T
_
.
Pentru a minimiza dispersiile asociate cu componentele lui
+
, trebuie s a
minimiz am ecare element diagonal al lui GG
T
. Deoarece elementul diagonal
ii al lui GG
T
este dat de
_
GG
T
_
II
=
n

=l
q
2
I
,
unde q
I
este elementul i, al lui G, trebuie s a avem
q
I
= 0, \i, ,
si obtinem
G = 0. (10.27)

Teorema de mai sus este un caz special al teoremei Gauss-Markov.


Alt a comparatie interesant a este cea dintre estimatorii prin metoda celor
mai mici p atrate pentru c si , si estimatorii lor de verosimilitate maxim a cu o
repartitie cunoscut a pentru variabila aleatoare 1 . Se poate ar ata c a estimatorii
de verosimilitate maxim a pentru c si , sunt identici cu cei prin metoda celor
mai mici p atrate sub ipoteza suplimentar a c a 1 este repartizat a normal.
129
11 Regresie liniar a simpl a. Estimarea parametrilor
prin metoda celor mai mici p atrate. Inter-
vale de ncredere pentru parametrii de re-
gresie
11.1 Estimator nedeplasat pentru
2
Metoda celor mai mici p atrate nu conduce la un estimator pentru dispersia o
2
a lui 1 , care este n general de asemenea o cantitate necunoscut a n modelele
de regresie liniar a. O alegere intuitiv a pentru un estimator pentru o
2
este

2
= /
n

I=l
_
1
I


1r
I
__
2
, (11.1)
unde coecientul / este ales astfel nct

2
este nedeplasat. Pentru a calcula
media lui

2
, observ am c a (vezi relatia (10.7))
1
I


1r
I
= 1
I

_
1

1r
_


1r
I
=
_
1
I
1
_


1(r
I
r) . (11.2)
De aici rezult a
n

I=l
_
1
I


1r
I
_
2
=
n

I=l
_
1
I
1
_
2


1
2
n

I=l
(r
I
r)
2
, (11.3)
deoarece (vezi relatia (10.8))
n

I=l
(r
I
r)
_
1
I
1
_
=

1
n

I=l
(r
I
r)
2
. (11.4)
Se poate ar ata c a
1
_

2
_
= /1
_
n

I=l
_
1
I
1
_
2


1
2
n

I=l
(r
I
r)
2
_
= / (: 2) o
2
.
De aici,

2
este nedeplasat pentru / =
l
n2
, ind dat de

2
=
1
: 2
n

I=l
_
1
I


1r
I
__
2
, (11.5)
sau, datorit a relatiei (11.3),

2
=
1
: 2
_
n

I=l
_
1
I
1
_
2


1
2
n

I=l
(r
I
r)
2
_
. (11.6)
130
Exemplul 11.1. Pentru datele din exemplul 10.1, s a se determine o estimare
nedeplasat a pentru o
2
.
Am obtinut n exemplul 10.1
n

I=l
(r
I
r)
2
= 2062, ,

, = 0, 7.
n plus, obtinem
n

I=l
(j
I
j)
2
= 680, .
Relatia (11.6) d a

o
2
=
1
8
_
680, 0, 7
2
2062,

= 1, 8.
Exemplul 11.2. Se face un experiment pe elasticitatea tesutului pl amnului
ca o functie de propriet atile de extindere ale pl amnului si m asur atorile din
tabelul urm ator sunt cele ale modulului lui Young al tesutului (1 ), n q,c:
2
,
la diferite valori ale extinderii pl amnului n termeni de tensiune (r), n q,c:
2
.
Presupunnd c a 1 (1 ) este legat a liniar de r si c a o
2
Y
= o
2
(o constant a),
determinati estim arile prin metoda celor mai mici p atrate pentru coecientii de
regresie si o estimare nedeplasat a pentru o
2
.
n acest caz avem : = 14. Cantit atile care ne intereseaz a sunt
r =
1
:
n

I=l
r
I
=
1
14
(2 2, ... 20) = 11, 11,
j =
1
:
n

I=l
j
I
=
1
14
(0, 1 10, 2 ... 180, 8) = 7, 0,
n

I=l
(r
I
r)
2
= 46, 00,
n

I=l
(j
I
j)
2
= 17170, 4,
131
n

I=l
(r
I
r) (j
I
j) = 2862, 12.
nlocuirea acestor valori n relatiile (10.8), (10.7) si (11.6) d a

, =
2862, 12
46, 00
= , 24,
c = 7, 0 , 24 11, 11 = 0, 68

o
2
=
1
12
_
17170, 4 , 24
2
46, 00

= 182, 1.
Dreapta de regresie estimat a mpreun a cu datele sunt ar atate n gura ur-
m atoare.
Deviatia standard estimat a este o =
_
182, 1 = 18, 40q,c:
2
si o-banda este de
asemenea ar at a n gur a.
11.2 Intervale de ncredere pentru coecientii de regresie
Presupunem c a 1 ~
_
c ,r, o
2
_
. Deoarece estimatorii

,

1 si


1r sunt
functii liniare de selectia 1 , ei sunt de asemenea variabile aleatoare normale.
132
Cnd m arimea selectiei : este mare,

,

1 si


1r au o repartitie normal a pe
baza teoremei limit a central a, indiferent de repartitia lui 1 .
Urm am calea din sectiunea 9.2 pentru a stabili limite de ncredere. Se pot
verica urm atoarele rezultate:
i) Fie

2
estimatorul nedeplasat pentru o
2
denit de relatia (11.6) si e
1 =
(: 2)

2
o
2
. (11.7)
Rezult a din sectiunea 9.2 c a 1 este o variabil a aleatoare repartizat a
2
cu :2
grade de libertate.
ii) Consider am variabilele aleatoare

_
c
`
2
r

1=1
r
2
1
n
r

1=1
(r1r)
2
(11.8)
si

1 ,

_
c
`
2
r

1=1
(r1r)
2
, (11.9)
unde, dup a cum se observ a din relatiile (10.20), (10.22) si (10.23), c si , sunt
mediile lui

, respectiv

1, iar numitorii sunt deviatiile standard ale lui

,
respectiv

1, cu o
2
estimat de

2
. Din sectiunea 9.2 rezult a c a ecare dintre
aceste variabile aleatoare are o repartitie t cu : 2 grade de libertate.
iii) Estimatorul
\
1 (1 ) pentru media lui 1 este repartizat normal cu media
c ,r si dispersia
ar
_
\
1 (1 )
_
= ar
_


1r
_
= ar
_

_
r
2
ar
_

1
_
2rco
_

,

1
_
= o
2
1
r
r

1=1
r
2
1
r
2
2rr
r

1=1
(r1r)
2
=
o
2
_

_
l
n

(rr)
2
r

1=1
(r1r)
2
_

_
. (11.10)
133
De aici, urmnd argumentarea din sectiunea 9.2, variabila aleatoare
\
1 (1 ) (c ,r)

2
_

_
l
n

(rr)
2
r

1=1
(r1r)
2
_

_
(11.11)
este de asemenea t-repartizat a cu : 2 grade de libertate.
Pe baza rezultatelor prezentate mai sus putem stabili limite de ncredere
pentru toti parametrii de interes. Rezultatele de mai jos sunt o consecint a
direct a a celor din sectiunea 9.2.
1) Un interval de [100 (1 )[ / ncredere pentru c este determinat de (vezi
relatia (9.19))
1
l,2
=

(t
n2,~/2

2
n

I=l
r
2
I
:
n

I=l
(r
I
r)
2
. (11.12)
2) Un interval de [100 (1 )[ / ncredere pentru , este determinat de (vezi
relatia (9.19))
1
l,2
=

1 (t
n2,~/2

2
n

I=l
(r
I
r)
2
. (11.13)
3) Un interval de [100 (1 )[ / ncredere pentru 1 (1 ) = c ,r este de-
terminat de (vezi relatia (9.19))
1
l,2
=
\
1 (1 ) (t
n2,~/2

2
_

_
1
:

(r r)
2
n

I=l
(r
I
r)
2
_

_
(11.14)
4) Un interval de [100 (1 )[ / ncredere pentru o
2
cu ambele margini nite
este determinat de (vezi relatia (9.22))
1
l
=
(n2)
c
`
2
_
2
r22
,
1
2
=
(n2)
c
`
2
_
2
r212
.
(11.15)
Un interval de [100 (1 )[ / ncredere pentru o
2
cu o margine nit a este de-
terminat de (vezi relatia (9.23))
1
l
=
(: 2)

2
nl,~
. (11.16)
134
n ecare caz, att pozitia ct si m arimea intervalului variaz a de la selectie
la selectie. n plus, intervalul de ncredere pentru c ,r este o functie de r.
Dac a se reprezint a valorile observate ale lui 1
l
si 1
2
, ele formeaz a o banda de
ncredere n jurul dreptei de regresie estimate, dup a cum este ar atat n gura
urm atoare.
Relatia (11.14) arat a c a cea mai ngust a l atime a bandei apare n r = r. Banda
devine mai larg a cnd r de misc a din r n orice directie.
Exemplul 11.3. n exemplul 11.2, presupunnd c a 1 este repartizat a nor-
mal, s a se determine o band a de 0/ ncredere pentru c ,r.
Relatia (11.14) d a limitele de ncredere dorite, cu : = 14, = 0, 0 si
\
1 (1 ) = c

,r = 0, 68 , 24r,
t
n2,~/2
= t
l2,0.025
= 2, 170, din tabelul A.4,
r = 11, 11,
n

I=l
(r
I
r)
2
= 46, 00,
135

o
2
= 182, 1.
Limitele de ncredere observate sunt date de
|
l,2
= 0, 68 , 24r (2, 170

_
182, 1
_
1
14

(r 11, 11)
2
46, 00
_
.
Rezultatul este ar atat grac n gura urm atoare.
136
12 Regresie liniar a multipl a. Alte modele de
regresie
12.1 Regresie liniar a multipl a
n regresia liniar a multipl a, modelul ia forma
1 (1 ) = ,
0
,
l
r
l
,
2
r
2
... ,
n
r
n
. (12.1)
Din nou, presupunem c a dispersia lui 1 este o
2
si este independent a de r
l
, r
2
, ..., r
n
.
Ca la regresia liniar a simpl a suntem interesati s a estim am cei : 1 coe-
cienti de regresie ,
0
, ,
l
, ..., ,
n
pe baza unei selectii a valorilor lui 1 cu val-
orile lor asociate ale lui (r
l
, r
2
, ..., r
n
). O selectie de m arime : n acest caz
ia forma (r
ll
, r
2l
, ..., r
nl
, 1
l
) , (r
l2
, r
22
, ..., r
n2
, 1
2
) , ..., (r
ln
, r
2n
, ..., r
nn
, 1
n
).
Pentru ecare set de valori r
|I
, / = 1, 2, ..., :, 1
I
este o observatie indepen-
dent a din populatia 1 denit a prin
1 = ,
0
,
l
r
l
,
2
r
2
... ,
n
r
n
1. (12.2)
Ca mai nainte, 1 este eroarea aleatoare, cu media 0 si dispersia o
2
.
12.1.1 Estimarea prin metoda celor mai mici p atrate
Fiind date seturile de valori de selectie observate (r
lI
, r
2I
, ..., r
nI
, j
I
) , i = 1, 2, ..., :,
sistemul de ecuatii de regresie observate este
j
I
= ,
0
,
l
r
lI
,
2
r
2I
... ,
n
r
nI
c
I
, i = 1, 2, ..., :. (12.3)
Dac a not am
C =
_
_
_
_
_
1 r
ll
r
2l
... r
nl
1 r
l2
r
22
... r
n2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 r
ln
r
2n
... r
nn
_
_
_
_
_
, y =
_
_
_
_
_
j
l
j
2
.
.
.
j
n
_
_
_
_
_
, e =
_
_
_
_
_
c
l
c
2
.
.
.
c
n
_
_
_
_
_
si
=
_
_
_
_
_
,
0
,
l
.
.
.
,
n
_
_
_
_
_
,
relatia (12.3) poate scris a
y = C e. (12.4)
Comparnd relatia (12.4) cu relatia (10.12) din regresia liniar a simpl a, ecuati-
ile de regresie observate n ambele cazuri sunt identice cu exceptia faptului c a
C este acum o matrice : (: 1) si este un vector (: 1)-dimensional.
P astrnd aceast a diferent a de dimensiune n minte, rezultatele obtinute n cazul
137
regresiei liniare simple bazate pe relatia (10.12) sunt din nou valabile n cazul
regresiei liniare multiple. Astfel, f ar a alt a demonstratie, avem pentru solutia
estim arii prin metoda celor mai mici p atrate

a lui (vezi relatia (10.15))

=
_
C
T
C
_
l
C
T
y. (12.5)
Existenta matricei
_
C
T
C
_
l
cere ca s a existe cel putin (: 1) seturi distincte
de valori (r
lI
, r
2I
, ..., r
nI
) n selectie. C
T
C este o matrice (: 1) (: 1)
simetric a.
Exemplul 12.1. Consumul lunar mediu de putere electric a (1 ) ntr-o an-
umit a fabric a este considerat a liniar dependent de temperatura mediului
ambiant (r
l
, n

1) si num arul de zile lucr atoare din lun a (r
2
). Consider am
datele lunare pe un an din tabelul urm ator.
Determinati estim arile prin metoda celor mai mici p atrate ai coecientilor de
regresie liniar a asociati.
n acest caz, C este o matrice 12 8 si
C
T
C =
_
_
12 626 200
626 86776 1886
200 1886 7028
_
_
,
C
T
y =
_
_
2074
10011
72166
_
_
.
Astfel avem

=
_
C
T
C
_
l
C
T
y =
_
_
88, 84
0, 80
10, 80
_
_
,
sau

,
0
= 88, 84,

,
l
= 0, 80,

,
2
= 10, 8.
Ecuatia de regresie estimat a bazat a pe date este astfel
[
1 (j) =

,
0

,
l
r
l

,
2
r
2
= 88, 84 0, 80r
l
10, 8r
2
.
138
Deoarece relatia (12.4) coincide cu cea din cazul regresiei liniare simple,
multe din rezultatele obtinute acolo privind propriet atile estimatorilor prin
metoda celor mai mici p atrate pot duplicate aici tinnd cont doar de noile
denitii ale matricei C si vectorului .
Scriem estimatorul

pentru n forma

=
_
C
T
C
_
l
C
T
Y. (12.6)
Observ am c a
1
_

_
=
_
C
T
C
_
l
C
T
1 (Y) = . (12.7)
De aici, estimatorul prin metoda celor mai mici p atrate

este din nou nede-
plasat. De asemenea, din relatia (10.21) rezult a c a matricea de covariant a pentru

este
co
_

_
= o
2
_
C
T
C
_
l
. (12.8)
Intervale de ncredere pentru parametrii de regresie n acest caz pot de
asemenea stabilite urmnd proceduri similare celor din cazul regresiei liniare
simple.
12.2 Alte modele de regresie
n stiint a si inginerie e adesea necesar s a se considere modele de regresie care
sunt neliniare n variabilele independente. Exemple de aceste clase de modele
sunt
1 = ,
0
,
l
r ,
2
r
2
1, (12.9)
1 = ,
0
oxp(,
l
r 1) , (12.10)
1 = ,
0
,
l
r
l
,
2
r
2
,
ll
r
2
l
,
22
r
2
2
,
l2
r
l
r
2
1, (12.11)
1 = ,
0
,
r
l
1. (12.12)
Modele polinomiale ca relatiile (12.9) sau (12.11) sunt nc a modele de regresie
liniar a, deoarece sunt liniare n parametrii necunoscuti ,
0
, ,
l
, ,
2
, ... De aceea,
parametrii pot estimati folosind tehnici de regresie liniar a multipl a. ntr-
adev ar, punnd r
l
= r si r
2
= r
2
n relatia (12.9), aceasta ia forma unui model
de regresie liniar a multipl a cu 2 variabile independente si poate analizat ca
atare. O echivalent a similar a poate stabilit a ntre relatia (12.11) si un model
de regresie liniar a multipl a cu variabile independente.
Consider am modelul exponential dat de relatia (12.10). Logaritmnd ambii
membri, avem
ln1 = ln,
0
,
l
r 1. (12.13)
n termeni de variabila aleatoare ln1 , relatia (12.13) reprezint a o ecuatie de
regresie liniar a cu coecientii de regresie ln,
0
si ,
l
. Tehnici de regresie liniar a
se aplic a din nou n acest caz. Relatia (12.12) nu poate pus a convenabil ntr-o
form a de regresie liniar a.
139
Exemplul 12.2. n medie, rata cresterii populatiei (1 ) asociat a cu un oras
dat variaz a cu r, num arul de ani dup a 1970. Presupunnd c a
1 (1 ) = ,
0
,
l
r ,
2
r
2
,
calculati estim arile prin metoda celor mai mici p atrate pentru ,
0
, ,
l
si ,
2
pe
baza datelor din tabelul urm ator.
Fie r
l
= r, r
2
= r
2
si
=
_
_
,
0
,
l
,
2
_
_
.
Estimarea prin metoda celor mai mici p atrate pentru este dat a de relatia
(12.5) cu
C =
_
_
_
_
_
_
_
_
1 0 0
1 1 1
1 2 4
1 8 0
1 4 16
1 2
_
_
_
_
_
_
_
_
si
j =
_
_
_
_
_
_
_
_
1, 08
1, 82
1, 7
1, 7
1, 88
2, 88
_
_
_
_
_
_
_
_
.
Astfel,

=
_
C
T
C
_
l
C
T
j =
_
_
6 1
1 22
22 070
_
_
l
_
_
0, 88
28, 68
110, 88
_
_
=
_
_
1, 07
0, 2
0, 01
_
_
,
sau

,
0
= 1, 07,

,
l
= 0, 2 si

,
2
= 0, 01.
Observ am n acest exemplu c a, deoarece r
2
= r
2
l
, n matricea C elementele
de pe coloana a treia sunt p atratele elementelor corespunz atoare de pe coloana
a doua. Pentru modele de regresie polinomial a de ordin superior, situatii de
acest tip pot conduce la dicult ati n inversarea matricei C
T
C.
140
13 Estimatori neparametrici ai unei densit ati de
repartitie
13.1 Preliminarii
Fie A
l
, A
2
, ..., A
n
o selectie independent a de m arime : dintr-o populatie A cu
o presupus a densitate )(r; ) sau mas a j(r; ), unde poate specicat sau
nu. Not am cu ipoteza H ipoteza c a selectia reprezint a : valori ale unei variabile
aleatoare cu densitatea )(r; ) sau masa j(r; ). Aceast a ipotez a este numit a
ipoteza simpla cnd repartitia este complet specicat a, adic a valorile parametru-
lui sunt specicate mpreun a cu forma functional a a densit atii sau masei; altfel
este o ipoteza compusa. Pentru a construi un criteriu pentru testarea ipotezelor
este necesar s a e stabilit a o ipotez a alternativ a mpotriva c areia ipoteza H
poate testat a. Un exemplu de ipotez a alternativ a este alt a repartitie presu-
pus a sau, ca alt exemplu, ipoteza H poate testat a mpotriva ipotezei alter-
native c a ipoteza H nu este adev arat a. Vom considera n continuare ultima
alegere.
13.1.1 Erori de tipul I si de tipul II
Ca si n estimarea parametrilor, erorile sau riscurile sunt inerente n decizia dac a
o ipotez a H ar trebui s a e acceptat a sau respins a pe baza informatiei dat a de
selectie.
Denitia 13.1. n testarea ipotezei H, o eroare de tipul I e comis a cnd
H este respins a cnd de fapt H este adev arat a; o eroare de tipul II este comis a
cnd H este acceptat a cnd de fapt H este fals a.
n cele ce urmeaz a, metodele de testare a ipotezelor sunt discutate doar pe
baza erorilor de tipul I.
13.2 Testul chi-p atrat al bun at atii de potrivire
Problema este testarea ipotezei H care specic a repartitia unei populatii A
comparat a cu alternativa c a repartitia lui A nu este de tipul specicat pe baza
unei selectii de m arime : din populatia A. Testul chi-p atrat (
2
) al bun at atii
de potrivire a fost elaborat pentru acest scop de Pearson n 1900.
13.2.1 Cazul parametrilor cunoscuti
Presupunem mai nti c a repartitia presupus a este complet specicat a, f ar a
parametri necunoscuti. Pentru a testa ipoteza H este folosit a o statistic a
/(A
l
, A
2
, ..., A
n
) a selectiei, care d a o m asur a a deviatiei repartitiei observate
construit a din selectie de la repartitia presupus a.
n testul
2
, statistica utilizat a este legat a de diferenta dintre diagrama
frecventelor construit a din selectie si o diagram a corespunz atoare construit a din
repartitia presupus a. Se mparte spatiul valorilor lui A n / intervale disjuncte
141
2 cte 2
l
,
2
, ...,
|
si e
I
num arul A

-urilor din
I
, i = 1, 2, ..., /. Atunci
probabilit atile observate 1 (
I
) sunt date de
1 (
I
) observat a =

I
:
, i = 1, 2, ..., /. (13.1)
Probabilit atile teoretice 1 (
I
) pot obtinute din repartitia presupus a a popu-
latiei. Le not am cu
1 (
I
) teoretic a = j
I
, i = 1, 2, ..., /. (13.2)
O alegere logic a a statisticii dnd o m asur a a deviatiei este
|

I=l
c
I
_

I
:
j
I
_
2
, (13.3)
care este o m asur a natural a a deviatiei de tipul celor mai mici p atrate. Pear-
son (1900) a ar atat c a, dac a lu am coecientul c
I
=
n
1
, statistica denit a prin
expresia (13.3) are propriet ati convenabile. De aici, alegem ca m asura deviatiei
1 =
|

I=l
:
j
I
_

I
:
j
I
_
2
=
|

I=l
(
I
:j
I
)
2
:j
I
=
|

I=l

2
I
:j
I
:. (13.4)
1 este o statistic a deoarece este o functie de
I
, care sunt, la rndul lor,
functii de selectia A
l
, A
2
, ..., A
n
. Repartitia statisticii 1 este dat a n teorema
urm atoare, datorat a lui Pearson (1900).
Teorema 13.1. Presupunnd c a ipoteza H este adev arat a, repartitia lui
1 denit a de relatia (13.4) tinde la o repartitie chi-p atrat cu (/ 1) grade de
libertate cnd : . Densitatea ei este dat a de (vezi relatia (5.24))
)
1
(d) =
_
_
_
J
!3
2 t

d
2
2
!1
2 I(
!1
2
)
, pentru d _ 0;
0, altfel.
(13.5)
Aceast a repartitie este independent a de repartitia presupus a.
Cu ajutorul teoremei 13.1 poate construit un test al ipotezei H considerat a
mai sus pe baza atribuirii unei probabilit ati erorii de tipul I. Presupunem c a
vrem s a obtinem probabilitatea c pentru eroarea de tipul I. Testul
2
sugereaz a
c a ipoteza H este respins a ori de cte ori
d =
|

I=l
:
2
I
:j
I
:
2
|l,o
, (13.6)
si este acceptat a altfel, unde d este valoarea de selectie a lui 1 bazat a pe
valorile de selectie r
I
, i = 1, ..., : si
2
|l,o
este valoarea astfel nct (vezi gura
urm atoare)
1
_
1
2
|l,o
_
= c. (13.7)
142
Deoarece 1 are o repartitie chi-p atrat cu (/ 1) grade de libertate pentru :
mare, o valoare aproximativ a pentru
2
|l,o
poate g asit a din tabelul A.5 din
cursul 9 pentru repartitia
2
cnd c este specicat.
Probabilitatea c a erorii de tipul I se numeste nivel de semnica tie n acest
context. Dup a cum vedem din gura de mai sus, reprezint a aria de sub )
1
de
la dreapta lui
2
|l,o
. Punnd c = 0, 0, de exemplu, criteriul dat de relatia
(13.6) implic a faptul c a respingem ipoteza H ori de cte ori m asura deviatiei d
calculat a dintr-un set dat de valori de selectie pic a n regiunea de /. Cu alte
cuvinte, ne astept am s a respingem H n aproximativ / din timpul cnd de fapt
H este adev arat a. Ce nivel de semnicatie trebuie adoptat ntr-o situatie dat a
depinde de cazul particular implicat. n practic a, valori obisnuite pentru c sunt
0, 001, 0, 01 si 0, 0; o valoare a lui c ntre 1/ si / este aproape semnicativa;
o valoare ntre 0, 1/ si 1/ este semnicativa, iar o valoare sub 0, 1/ este nalt
semnicativa.
D am acum procedura pas cu pas pentru efectuarea testului
2
cnd repartitia
unei populatii A este complet specicat a.
Pasul 1: mparte spatiul de valori ale lui A n / intervale convenabile
numeric si disjuncte 2 cte 2
I
, i = 1, 2, ..., /. Fie :
I
, num arul de valori
ale selectiei din
I
. De regul a, dac a :
I
< , combin a intervalul
I
cu
Il
sau
Il
.
143
Pasul 2: calculeaz a probabilit atile teoretice 1 (
I
) = j
I
, i = 1, 2, ..., /, cu
ajutorul repartitiei presupuse.
Pasul 3: construieste d dat de relatia (13.6).
Pasul 4: alege o valoare a lui c si determin a din tabelul A.5 pentru repar-
titia
2
cu (/ 1) grade de libertate valoarea lui
2
|l,o
.
Pasul 5: respinge ipoteza H dac a d
2
|l,o
. Altfel, accept a H.
Exemplul 13.1. 300 de becuri sunt testate pentru timpul de ardere t (n
ore) si rezultatul este ar atat n tabelul urm ator.
Presupunem c a timpul aleator de ardere este repartizat exponential cu timpul
mediu de ardere
l
X
= 200 de ore, adic a ` = 0, 00 pe or a si
)
T
(t) = 0, 00c
0,005|
, t _ 0. (13.8)
Testati aceast a ipotez a folosind testul
2
la nivelul de semnicatie de /.
Pasii necesari n efectuarea testului
2
sunt indicati n tabelul urm ator.
Prima coloan a d a intervalele
I
, care sunt alese n acest caz s a e intervalele
pentru t date n tabelul anterior. Probabilit atile teoretice 1 (
I
) = j
I
din
coloana a treia sunt calculate folosind relatia (13.8). De exemplu,
j
l
= 1 (
l
) =
_
l00
0
0, 00c
0,005|
dt = c
0,005|
[
l00
0
= 1 c
0,5
= 0, 80;
144
j
2
= 1 (
2
) =
_
200
l00
0, 00c
0,005|
dt = c
0,005|
[
200
l00
= c
0,5
c
l
= 0, 24.
Numerele teoretice de aparitii prezise de model sunt date n coloana a patra a
tabelului, care, cnd este comparat a cu coloana a doua, d a o m asur a a bun at atii
de potrivire a modelului cu datele. Coloana 5 (
n
2
1
n1
) este inclus a pentru a facilita
calcularea lui d. Astfel, din relatia (13.6) avem
d =
|

I=l
:
2
I
:j
I
: = 801, 7 800 = 1, 7.
/ = 4. Din tabelul A.5 pentru repartitia
2
cu 3 grade de libertate (vezi cursul
9) g asim

2
3,0.05
= 7, 81.
Deoarece d <
2
3,0.05
, accept am la un nivel de semnicatie de / ipoteza c a
datele observate reprezint a o selectie dintr-o repartitie exponential a cu ` =
0, 00.
Exemplul 13.2. nregistrarea num arului de accidente din 6 ani ale 7842
de soferi californieni este dat a n tabelul urm ator.
Pe baza acestor valori de selectie, testati ipoteza c a A, num arul de accidente din
6 ani pe sofer, este repartizat Poisson cu rata medie i = 0, 08 pe an la nivelul
de semnicatie de 1/.
Deoarece A este discret a, alegem intervalele
I
ca n prima coloan a a tabelu-
lui urm ator.
145
Intervalul r ar fost combinat cu 4 < r _ dac a num arul :
7
ar fost mai
mic dect .
Repartitia presupus a pentru A este
j

(r) =
(it)
r
c
i|
r!
=
(0, 48)
r
c
0,dS
r!
, r = 0, 1, 2, .... (13.9)
Astfel avem
j
I
= 1 (
I
) =
(0, 48)
Il
c
0,dS
(i 1)!
, i = 1, 2, ..., 6.
j
7
= 1 (
7
) = 1
6

I=l
j
I
.
Aceste valori sunt indicate n coloana a treia a tabelului.
Coloana 5 a tabelului d a
d =
|

I=l
:
2
I
:j
I
: = 8418 7842 = 71.
Cu / = 7, valoarea lui
2
|l,o
=
2
6,0.0l
este g asit a din tabelul A.5

2
6,0.0l
= 16, 812.
Deoarece d
2
6,0.0l
, ipoteza este respins a la nivelul de semnicatie 1/.
13.2.2 Cazul parametrilor estimati
Consider am acum situatia n care parametrii din repartitia presupus a trebuie de
asemenea estimati din date. O procedur a pentru un test de bun atatea potrivirii
146
n acest caz este nti estimarea parametrilor si apoi efectuarea testului
2
pen-
tru parametri cunoscuti. Apare o complicatie n aceea c a probabilit atile teo-
retice j
I
denite de relatia (13.2) sunt, ind functii de parametrii repartitiei,
functii de selectie. Statistica 1 ia acum forma
1 =
|

I=l
:

1
I
_

I
:


1
I
_
2
=
|

I=l

2
I
:

1
I
:, (13.10)
unde

1
I
este un estimator pentru j
I
si astfel o statistic a. 1 este acum o functie
mult mai complicat a de A
l
, A
2
, ..., A
n
. Care este noua repartitie a lui 1?
Problema determin arii repartitiei limit a a lui 1 n aceast a situatie a fost
mai nti considerat a de Fischer (1922, 1924), care a ar atat c a, cnd : ,
repartitia lui 1 trebuie modicat a, si modicarea depinde de metoda de estimare
a parametrilor folosit a. Din fericire, pentru o clas a de metode importante de
estimare, ca matoda verosimilit atii maxime, modicarea cerut a este simpl a, si
anume, statistica 1 tinde la o repartitie chi p atrat cnd : , dar acum cu
(/ r 1) grade de libertate, unde r este num arul de parametri de estimat din
repartitia presupus a. Cu alte cuvinte, este doar necesar de a reduce num arul de
grade de libertate n repartitia limit a denit a de relatia (13.5) cu unu pentru
ecare parametru estimat din selectie.
D am acum procedura pas cu pas pentru cazul cnd r parametri din repartitie
trebuie estimati din date.
Pasul 1: mparte spatiul de valori ale lui A n / intervale convenabile
numeric si disjuncte 2 cte 2
I
, i = 1, 2, ..., /. Fie :
I
, num arul de valori
ale selectiei din
I
. De regul a, dac a :
I
< , combin a intervalul
I
cu
Il
sau
Il
.
Pasul 2: estimeaz a cei r parametri prin metoda verosimilit atii maxime din
date.
Pasul 3: calculeaz a probabilit atile teoretice 1 (
I
) = j
I
, i = 1, 2, ..., /, cu
ajutorul repartitiei presupuse cu valorile parametrilor estimate.
Pasul 4: construieste d dat de relatia (13.6).
Pasul 5: alege o valoare a lui c si determin a din tabelul A.5 pentru repar-
titia
2
cu (/ r 1) grade de libertate valoarea lui
2
|:l,o
. Se pre-
supune c a / r 1 0.
Pasul 6: respinge ipoteza H dac a d
2
|:l,o
. Altfel, accept a H.
Exemplul 13.3. Sosirile vehiculelor ntr-un anumit punct au fost nregis-
trate. Numerele de vehicule sosite n interval de un minut au fost luate pentru
106 minute si sunt date n tabelul urm ator.
147
Pe baza acestor observatii, determinati dac a o repartitie Poisson este potrivit a
pentru A, num arul de sosiri pe minut, la nivelul de semnicatie de /.
Repartitia presupus a este
j

(r) =
`
r
c
X
r!
, r = 0, 1, 2, ..., (13.11)
unde parametrul ` trebuie s a e estimat din date. Astfel, r = 1.
nti determin am intervale corespunz atoare
I
astfel nct :
I
_ , \i; acestea
sunt ar atate n prima coloan a a tabelului urm ator.
148
De aici / = 11.
Estimarea de verosimilitate maxim a pentru ` este dat a de

` = r =
1
:
n

=l
r

= 0, 00.
nlocuirea acestei valori pentru parametrul ` n relatia (13.11) ne permite s a
calcul am probabilit atile 1 (
I
) = j
I
. De exemplu,
j
l
=
d

=0
j

(,) = 0, 02,
j
2
= j

() = 0, 08.
Aceste probabilit ati teoretice sunt date n a treia coloan a a tabelului.
Din coloana 5 a tabelului obtinem
d =
|

I=l
:
2
I
:j
I
: = 110, 6 106 = 18, 6.
Tabelul A.5 cu c = 0, 0 si / r 1 = 0 grade de libertate d a

2
9,0.05
= 16, 010.
Deoarece d <
2
9,0.05
, repartitia presupus a cu ` = 0, 00 este acceptat a la
nivelul de semnicatie de /.
149
Exemplul 10.4. Pe baza datelor c aderilor de z apad a dintre 1909 si 1979 din
tabelul urm ator, testati ipoteza: c aderea anual a de z apad a poate modelat a
printr-o repartitie normal a la nivelul de semnicatie de /.
Repartitia asumat a pentru A, c aderea anual a de z apad a, este
_
:, o
2
_
unde : si o
2
trebuie s a e esimate din date. Doarece estimatorii de verosimili-
tate maxim a pentru : si o
2
sunt

' = A, respectiv

2
=
nl
n
o
2
, avem
: = r =
1
70
70

=l
r

= 88, 6,

o
2
=
60
70
:
2
=
1
70
70

=l
(r

88, 6)
2
= 777, 4.
Cu intervalele
I
denite dup a cum se arat a n prima coloan a a tabelului urm a-
tor, probabilit atile teoretice 1 (
I
) pot calculate cu ajutorul tabelului A.3.
150
De exemplu, primele dou a dintre aceste probabilit ati sunt
1 (
l
) = 1 (A _ 6) = 1
_
l _
56S3,6
_
777,d
_
= 1
I
(0, 00) = 1 1
I
(0, 00) =
1 0, 8880 0, 161;
1 (
2
) = 1 (6 < A _ 72) = 1 (0, 00 < l _ 0, 416) = [1 1
I
(0, 416)[
[1 1
I
(0, 00)[ = 0, 880 0, 161 = 0, 178.
Informatia dat a mai sus ne permite s a construim restul tabelului. De aici,
avem
d =
|

I=l
:
2
I
:j
I
: = 72, 4 70 = 2, 4.
Num arul de grade de libertate n acest caz este /r1 = 621 = 8. Tabelul
A.5 d a astfel

2
3,0.05
= 7, 81.
Deoarece d <
2
3,0.05
repartitia normal a (88.6, 777.4) este acceptabil a la nivelul
de semnicatie de /.
Statistica 1 din testul
2
este repartizat a
2
doar cnd : . Astfel,
testul
2
este un test de selec tie mare. Ca regul a, : 0 este considerat
satisf ac ator pentru a ndeplini cerinta de selectie mare.
13.3 Testul Kolmogorov-Smirnov
Asa-numitul test de bunatatea potrivirii Kolmogorov-Smirnov, prescurtat tes-
tul K-S, este bazat pe o statistic a m asurnd deviatia histogramei cumulative
observate de la functia de repartitie cumulativ a presupus a.
Fiind dat un set de valori de selectie r
l
, r
2
, ..., r
n
observate dintro populatie
A, o histogram a cumulativ a poate construit a prin
(a) aranjarea valorilor de selectie n ordine cresc atoare, notate cu r
(l)
, r
(2)
, ..., r
(n)
,
(b) determinarea functiei de repartitie observat a a lui A n r
(l)
, r
(2)
, ...,
notate prin 1
0
_
r
(l)
_
, 1
0
_
r
(2)
_
, ..., din relatiile 1
0
_
r
(I)
_
=
I
n
si
(c) conectarea valorilor lui 1
0
_
r
(I)
_
prin segmente de dreapt a.
151
Statistica test folosit a n acest caz este
1
2
=
n
max
I=l
_

1
0
_
A
(I)
_
1

_
A
(I)
_

_
=
n
max
I=l
_

i
:
1

_
A
(I)
_

_
, (13.12)
unde A
(I)
este a i-a statistic a de ordine a selectiei. Statistica 1
2
m asoar a
astfel maximul valorilor absolute ale celor : diferente dintre functia de repar-
titie observat a si functia de repartitie presupus a evaluat a pentru selectia obser-
vat a. n cazul cnd trebuie estimati parametri din repartitia presupus a, valorile
1

_
A
(I)
_
sunt obtinute folosind estim arile.
n timp ce repartitia lui 1
2
este dicil de obtinut analitic, functia ei de
repartitie poate calculat a numeric si tabelat a. Se poate ar ata c a repartitia
lui 1
2
este independent a de repartitia presupus a si este o functie doar de :,
m arimea selectiei.
Efectuarea testului K-S este asem an atoare cu cea a testului
2
. La un nivel
de semnicatie specicat c, regula este s a se resping a ipoteza H dac a d
2
c
n,o
;
altfel, se accept a H. Aici, d
2
este valoarea de selectie a lui 1
2
, si valoarea c
n,o
este denit a prin
1 (1
2
c
n,o
) = c. (13.13)
Valorile c
n,o
pentru c = 0.01, 0.0 si 0.1 sunt date n tabelul A.6 urm ator ca
functii de :.
152
Sunt si diferente importante ntre acest test si testul
2
. n timp ce testul

2
este un test de selectie mare, testul K-S este valabil pentru toate valorile
lui :. Mai departe, testul K-S foloseste valorile selectiei n forma lor nealterat a
si neagregat a, n timp ce prelucrarea datelor este necesar a n efectarea testului

2
. Ca dezavantaje, testul K-S este valabil doar pentru repartitii continue. De
asemenea, valorile lui c
n,o
din tabelul A.6 sunt bazate pe o repartitie presu-
pus a specicat a complet. Cnd valorile parametrilor trebuie estimate, nu este
disponibil a o metod a riguroas a de ajustare. n aceste cazuri poate specicat
doar c a valorile lui c
n,o
trebuie reduse putin.
Procedura pas cu pas pentru efectuarea testului K-S este:
Pasul 1: rearanjeaz a valorile selectiei r
l
, r
2
, ..., r
n
n ordine cresc atoare si
noteaz a-le r
(l)
, r
(2)
, ..., r
(n)
.
Pasul 2: determin a functia de repartitie observat a 1
0
(r) n ecare r
(I)
folosind 1
0
_
r
(I)
_
=
I
n
.
Pasul 3: determin a functia de repartitie teoretic a 1

(r) n ecare r
(I)
folosind repartitia presupus a. Parametrii repartitiei sunt estimati din date
dac a este necesar.
Pasul 4: formeaz a diferentele

1
0
_
r
(I)
_
1

_
r
(I)
_

pentru i = 1, 2, ..., :.
Pasul 5: calculeaz a
d
2
=
n
max
I=l
_

1
0
_
r
(I)
_
1

_
r
(I)
_

_
.
Determinarea acestei valori maxime cere enumerarea a : cantit ati. Aceast a
munc a poate redus a putin reprezentnd grac 1
0
(r) si 1

(r) ca functii
de r si notnd locatia maximului prin inspectie.
Pasul 6: alege valoarea lui c si determin a din tabelul A.6 valoarea lui c
n,o
.
Pasul 7: respinge ipoteza H dac a d
2
c
n,o
. Altfel, accept a H.
Exemplul 13.5. Se fac 10 m asur atori ale rezistentei la ntindere a unui
material. Ele sunt 80.1, 80., 28.7, 81.6, 82., 20, 27.4, 20.1, 88. si 81. Pe baza
acestui set de date, testati ipoteza c a rezistenta la ntindere are o repartitie
normal a la nivelul de semnicatie de /.
Reordonarea datelor d a r
(l)
= 27.4, r
(2)
= 28.7, ..., r
(l0)
= 88.. Avem
1
0
(27.4) = 0.1, 1
0
(28.7) = 0.2, ..., 1
0
(88.) = 1.
Cu privire la functia de repartitie teoretic a, sunt mai nti obtinute estim arile
mediei si dispersiei
: = r =
1
10
l0

=l
r

= 80.8.
153

o
2
=
_
: 1
:
_
:
2
=
1
10
l0

=l
(r

80.8)
2
= 8.14.
Valorile lui 1

_
r
(I)
_
pot g asite acum pe baza repartitiei (80.8, 8.14) pentru
A. De exemplu, cu ajutorul tabelului A.3 pentru variabila aleatoare normal a
standardizat a l, avem
1

(27.4) = 1
I
_
27.4 80.8
_
8.14
_
= 1
I
(1.64) = 11
I
(1.64) = 10.040 = 0.00,
1

(28.7) = 1
I
_
28.7 80.8
_
8.14
_
= 1
I
(0.0) = 11
I
(0.0) = 10.810 = 0.1841,
si asa mai departe.
Pentru a determina d
2
este constructiv s a reprezent am grac 1
0
(r) si 1

(r)
ca functii de r, ca n gura urm atoare.
Se vede din gur a c a maximul diferentelor dintre 1
0
(r) si 1

(r) apare n
r = r
(d)
= 20.1. De aici,
d
2
=

1
0
_
r
(d)
_
1

_
r
(d)
_

= 0.4 0.2488 = 0.117.


154
Cu c = 0.0 si : = 10, tabelul A.6 d a
c
l0,0.05
= 0.41.
Deoarece d
2
< c
l0,0.05
, accept am repartitia normal a (80.8, 8.14) la nivelul de
semnicatie de /.
Deoarece valorile parametrilor au fost de asemenea estimate din date, este
mai adecvat s a compar am d
2
cu o valoare putin mai mic a dect 0.41. Datorit a
faptului c a valoarea lui d
2
este mult sub 0.41, concluzia de mai sus este sigur a.
155
14 Introducere n metoda MCMC
n multe aplicatii ale model arii statistice, analistul de date vrea s a foloseasc a
un model mai complex pentru un set de date, dar este fortat s a recurg a la
un model suprasimplicat pentru a folosi tehnicile disponibile. Metoda MCMC
(prescurtare de la Markov chain Monte Carlo) este bazat a pe simulare si permite
statisticianului sau inginerului s a examineze datele folosind modele statistice
realiste.
14.1 Inferent a bayesian a
Incertitudinea despre valorile parametrilor necunoscuti se poate reprezenta prin
repartitii de probabilitate si se poate proceda ca si cum parametrii ar can-
tit ati aleatoare. Dac a 1 reprezint a datele care sunt observate si parametrii
modelului, atunci, pentru a face orice inferent a, trebuie s a stim repartitia de
probabilitate comun a 1 (1, ) peste toate cantit atile aleatoare. Permitem lui
s a e multidimensional. Repartitia comun a poate scris a
1 (1, ) = 1 () 1 (1[) ,
unde 1 () este numit a a priori si 1 (1[) este numit a verosimilitate. O dat a ce
observ am datele 1, putem utiliza teorema lui Bayes pentru a obtine reparti tia
a posteriori dup a cum urmeaz a
1 ([1) =
1 () 1 (1[)
_
1 () 1 (1[) d
. (14.1)
Relatia (14.1) d a repartitia lui conditionat a de datele observate 1. Deoarece
numitorul relatiei (14.1) nu este o functie de (pentru c a integr am n raport cu
), putem scrie proportionalitatea
1 ([1) 1 () 1 (1[) = 1 () 1(; 1) .
ntelegerea si folosirea repartitiei a posteriori este inima inferentei bayesiene,
unde este de interes a face deductii folosind diferite tr as aturi caracteristice ale
repartitiei a posteriori (de exemplu momente, quantile, etc.). Aceste cantit ati
pot scrise ca medii a posteriori ale functiilor de parametrii modelului dup a
cum urmeaz a
1 () () [1) =
_
) () 1 () 1 (1[) d
_
1 () 1 (1[) d
. (14.2)
Numitorul din relatiile (14.1) si (14.2) este o constant a de proportionalitate.
Uneori, acesta poate foarte dicil, dac a nu imposibil, de obtinut. Aceasta este
adev arat n special cnd problema este nalt dimensional a, deoarece trebuie
integrat n raport cu o multime de parametri. Integrarea analitic a n aceste
expresii a fost o surs a de dicultate n aplicatiile inferentei bayesiene, si adesea
au fost folosite modele mai simple pentru a face posibil a analiza. Integrarea
Monte Carlo folosind MCMC este un r aspuns la aceast a problem a.
156
Schimb am notatia pentru a o face mai general a. Fie X un vector de d
variabile aleatoare, cu repartitia notat a (x). Scopul este de a obtine media
1 () (X)) =
_
) (x) (x) dx
_
(x) dx
. (14.3)
Cu metoda MCMC trebuie s a stim doar repartitia lui X pn a la constanta
de normalizare. Aceasta nseamn a c a numitorul din relatia (14.3) poate ne-
cunoscut. n cele ce urmeaz a presupunem c a X ia valori n R
J
. Metoda poate
aplicat a la variabile aleatoare discrete cu schimb ari corespunz atoare.
14.2 Integrarea Monte Carlo
Cele mai multe metode din inferenta statistic a care folosesc simularea pot
reduse la problema a arii integralelor. Aceasta este o parte fundamental a a
metodologiei MCMC.
Integrarea Monte Carlo estimeaz a integrala 1 () (X)) din relatia (14.3) obtinnd
selectia X
|
, t = 1, ..., : din repartitia (x) si calculnd
1 () (X)) -
1
:
n

|=l
) (X
|
) . (14.4)
Cnd X
|
sunt independente, aproximarea poate f acut a orict de bun a crescnd
pe :. n metoda MCMC, selectia nu este independent a n cele mai multe cazuri.
Aceasta nu limiteaz a utilizarea ei n aarea integralelor folosind aproximari ca
cea din relatia (14.4). Totusi, trebuie avut a grij a din cauza dependentei cnd
se determin a dispersia estim arii din relatia (14.4).
Exemplul 14.1. Pentru o repartitie exponential a cu ` = 1 a am 1
_
_
A
_
folosind relatia (14.4). Gener am 00 de variabile aleatoare din repartitia dat a,
lu am radical din ecare si apoi a am media acestor valori. S-a obtinut o estimare
de 0, 880. Valoarea obtinut a folosind integrarea numeric a este 0, 886, destul de
aproape de cea obtinut a prin metoda Monte Carlo.
X
|
nu trebuie s a e independente att timp ct sunt generate din "ntregul"
domeniu al lui (x) n proportiile corecte. Aceast proces de generare poate
f acut construind un lant Markov care are (x) ca repartitie stationar a.
14.3 Lanturi Markov
Un lant Markov este un sir de variabile aleatoare astfel nct urm atoarea val-
oare sau stare a sirului depinde doar de precedenta. Astfel, gener am un sir de
variabile aleatoare X
0
, X
l
, ... astfel nct urm atoarea stare X
|l
cu t _ 0 este
repartizat a conform cu 1 (X
|l
[X
|
), care este numit nucleul de tranzi tie. O
realizare a acestui sir este numit a de asemenea un lant Markov. Presupunem c a
nucleul de tranzitie nu depinde de t, f acnd lantul omogen n raport cu timpul.
O chestiune care trebuie abordat a este ct de sensibil este lantul fat a de
starea sa de start X
0
. n anumite conditii, lantul va uita starea sa initial a si
157
va converge la o repartitie stationar a, care este notat a cu c. Cnd t creste, X
|
devin dependente de c.
S a presupunem c a X
|
, t = : 1, ..., :, au repartitia stationar a c. Putem
ndep arta primele : iterate si folosi pe cele : : r amase mpreun a cu relatia
(14.4) pentru a obtine o estimare a mediei dup a cum urmeaz a
1 () (X)) -
1
: :
n

|=nl
) (X
|
) . (14.5)
Geyer a sugerat n 1992 c a : poate ntre 1/ si 2/ din :, unde : este sucient
de mare pentru a obtine precizie adecvat a n estimarea dat a de relatia (14.5).
Ct de mare ar trebui s a e : pentru a obtine precizia cerut a n estimare?
Calculul dispersiei estim arii date de relatia (14.5) este dicil, deoarece X
|
nu
sunt independente. Un mod de a determina : prin simulare este de a genera
cteva lanturi Markov n paralel, ecare cu o valoare de start diferit a. Estim arile
din relatia (14.5) sunt comparate si dac a diferenta dintre ele este prea mare,
atunci lungimea lanturilor trebuie crescut a.
14.4 Analiza rezultatelor
Un analist poate interesat n calculul mediilor, dispersiilor marginale, etc.
pentru componentele lui X. Dac a A
|,
reprezint a componenta , a lui X
|
la pasul
t al lantului, atunci, folosind relatia (14.5), putem obtine mediile si dispersiile
marginale din
A
,
=
1
: :
n

|=nl
A
|,
,
si
o
2
,
=
1
: :1
n

|=nl
_
A
|,
A
,
_
2
.
Se pot construi lanturi Markov cu o anumit a repartitie stationar a de care
suntem interesati (x), numit a adesea reparti tie tinta.
BIBLIOGRAFIE
1. Dumitrescu M., B at atorescu A., Applied statistics using the R System,
Editura Universitatii Bucuresti, 2006.
2. Martinez W.L., Martinez A.R., Computational Statistics Handbook with
MATLAB, Chapman & Hall, 2002.
3. Saporta G., Probabilit, analyse des donnes et statistique, Edition Tech-
nip, Paris, 1990.
4. Soong, T.T., Fundamentals of probability and statistics for engineers,
Wiley, 2004.
5. Tudor C., Teoria Probabilit atilor, Editura Universit atii Bucuresti, 2004.
158

S-ar putea să vă placă și