Sunteți pe pagina 1din 302

Probabiliti i

statistic



3
CUPRINS



Introducere...........................................................................................................7

Capitolul 1. Teoria probabilitilor...................................................................11
1.1. Formalizarea experienelor aleatoare..............................................11
1.1.1. Evenimente...........................................................................11
1.2. Relaii ntre evenimente...................................................................12
1.3. Cmp de evenimente........................................................................14
1.4. Cmp de probabilitate......................................................................15
1.5. Reguli de calcul cu probabiliti......................................................17

Capitolul 2. Variabile aleatoare.........................................................................27
2.1. Variabile aleatoare discrete..............................................................27
2.2. Vector aleator bidimensional...........................................................32
2.3. Caracteristici numerice asociate variabilelor aleatoare....................36
2.4. Funcia caracteristic. Funcia generatoare de momente.................51
2.5. Probleme rezolvate...........................................................................53
2.6. Probleme propuse.............................................................................66

Capitolul 3. Legi clasice de probabilitate (repartiii) ale variabilelor
aleatoare discrete.............................................................................69
3.1. Legea discret uniform...................................................................69
3.2. Legea binomial. Legea Bernoulli...................................................71
3.3. Legea binomial cu exponent negativ. Legea geometric...............79
3.4. Legea hipergeometric.....................................................................83
3.5. Legea Poisson (legea evenimentelor rare) ......................................86

Capitolul 4. Legi clasice de probabilitate (repartiii) ale variabilelor
aleatoare continue..........................................................................91
4.1. Legea continu uniform (rectangular).........................................91
4.2. Legea normal (Gauss-Laplace). Legea normal standard (legea
normal centrat redus).................................................................95
4.3. Legea log-normal........................................................................105
4.4. Legea gamma.................................................................................107
4.5. Legea beta.....................................................................................112
4.6. Legea
2
(Helmert-Pearson) ........................................................114
4.7. Legea Student (t). Legea Cauchy..................................................119
4.8. Legea Snedecor. Legea Fisher......................................................123
4.9. Legea Weibull. Legea exponenial..............................................127
4
Capitolul 5. Convergena variabilelor aleatoare............................................131
5.1. Convergena aproape sigur i convergena n probabilitate..........131
5.2. Legi ale numerelor mari i aplicaii ...............................................137
5.2.1. Legea slab............................................................................137
5.2.2. Legea tare..............................................................................138
5.3. Convergena n repartiie................................................................148
5.4. Teorema limit central ................................................................155

Capitolul 6. Simularea variabilelor aleatoare ...............................................163
6.1. Simularea repartiiilor pe dreapt..................................................164
6.2. Algoritmul general: teorema de descompunere.............................173
6.3. Algoritmi speciali: repartiii uniforme...........................................180

Capitolul 7. Statistic descriptiv....................................................................185
7.1. Prezentarea datelor statistice..........................................................185
7.2. Caracteristici numerice..................................................................191
7.3. Corelaie. Regresie.........................................................................196

Capitolul 8. Teoria seleciei..............................................................................201
8.1. Generarea valorilor particulare ale unei variabile aleatoare..........201
8.2. Variabile de eantionare................................................................204
8.3. Legi de probabilitate ale variabilelor de eantionare....................210

Capitolul 9. Teoria estimaiei...........................................................................215
9.1. Estimatori nedeplasai...................................................................215
9.2. Estimatori de maxim verosimilitate.............................................216

Capitolul 10. Estimarea prin intervale de ncredere......................................219
10.1. Forma general a intervalului de ncredere .................................219
10.2. Interval de ncredere pentru medie...............................................221
10.3. Interval de ncredere pentru diferena a dou medii.....................226
10.4. Interval de ncredere pentru dispersie i raportul a dou
dispersii........................................................................................229

Capitolul 11. Teoria deciziei.............................................................................233
11.1. Decizii empirice .......................................................................233
11.2. Decizii statistice...........................................................................233
11.3. Ipoteze statistice...........................................................................234
11.4. Teste statistice..............................................................................234
11.5. Tipuri de erori..............................................................................234
11.6. Nivel de semnificaie ..................................................................235
11.7. Un exemplu..................................................................................236
11.8. Relaia dintre probabilitile i ..............................................239
11.9. Puterea unui test...........................................................................240
5
11.10. nc un exemplu.........................................................................242
11.11. Testarea irurilor binare.............................................................243
11.12. Testarea statistic a irurilor binare...........................................243
11.13. Noiunea de P-valoare................................................................245
11.14. Un exemplu: statistic repartizat normal..................................247
11.15. Alt exemplu: statistic repartizat 2.........................................249

Capitolul 12. Analiza regresiei.........................................................................251
12.1. Modele de regresie.......................................................................251
12.2. Modelul liniar. Estimarea parametrilor modelului prin metoda
celor mai mici ptrate...................................................................255
12.3. Modelul liniar clasic Gauss - Markov. Inferene asupra
estimatorilor unui model liniar.....................................................259
12.4. Previziunea i analiza rezultatelor unei regresii liniare................265

Capitolul 13. Statistic Bayesian i noiuni de teoria credibilitii.............281
13.1. Statistic Bayesian......................................................................281
13.2. Modelul de credibilitate Bhlmann..............................................289

Bibliografie........................................................................................................295
Anexe.................................................................................................................297












7
Introducere


Teoria probabilitilor i statistica matematic se aplic n majoritatea
domeniilor tiinei, ncepnd cu tiinele exacte i inginereti i finaliznd cu
tiinele socio-economice, n special acolo unde exist condiii de risc i
incertitudine i unde este necesar adoptarea unor decizii riguros argumentate.
Una dintre construciile de baz n fundamentele statisticii i teoriei
probabilitilor, precum i n justificarea aplicrii acestora n alte domenii, este
dat de legea numerelor mari teorem binecunoscut care i aparine
matematicianului Jakob Bernoulli (1654-1705), fiind aprut n lucrarea postum
Ars conjectandi (1713). Printre ali matematicieni care au rmas celebri n
teoria probabilitilor i statistic, i amintim pe: de Moivre, Laplace, Gauss,
Bertrand, Poincar, Cebev, Liapunov, Markov, Borel, Kolmogorov, Glivenko.
De asemenea, coala romneasc de probabiliti, fondat de Octav Onicescu, i
reprezentat de nume precum Gheorghe Mihoc i Marius Iosifescu, a adus
contribuii semnificative n dezvoltarea acestui domeniu.
Cartea de fa i propune s vin n sprijinul studenilor care au ca
disciplin de studiu, n cadrul a diferite specializri, disciplina Probabiliti i
statistic, oferindu-le acestora o gam larg de aspecte teoretice, nsoite de
exemple i aplicaii. Ca structur, cartea se fundamenteaz pe baza a treisprezece
capitole, ase dintre acestea fiind dedicate Teoriei probabilitilor, respectiv
apte capitole, Statisticii matematice.
n Capitolul 1, sunt prezentate concepte de baz ale teoriei
probabilitilor, mai precis, experiene aleatoare, evenimente, probabilitate,
reguli de calcul cu probabiliti, n timp ce n Capitolul 2, sunt abordate noiuni
precum variabile aleatoare, caracteristici numerice ale variabilelor aleatoare,
funcia caracteristic, funcia generatoare de momente. n Capitolul 3 sunt
prezentate principalele legi de probabilitate ale variabilelor aleatoare discrete i
anume: legea discret uniform, legea binomial i cazul su particular legea
Bernoulli, legea binomial cu exponent negativ i cazul particular legea
geometric, legea hipergeometric i legea Poisson (legea evenimentelor rare),
iar n Capitolul 4 sunt prezentate principalele legi de probabilitate ale
variabilelor aleatoare continue, i anume: legea continu uniform
(rectangular), legea normal (Gauss-Laplace), legea log-normal, legea
gamma, legea beta, legea
2
(Helmert-Pearson), legea Student (t) i cazul su
particular legea Cauchy, legea Snedecor i legea Fisher, legea Weibull i cazul
su particular, legea exponenial. Capitolul 5 se construiete n jurul
convergenei, de diferite tipuri, a variabilelor aleatoare, fiind menionate
convergena aproape sigur, convergena n probabilitate, convergena n
repartiie, precum i legile numerelor mari i teorema limit central. Partea
aferent teoriei probabilitilor se ncheie cu Capitolul 6, dedicat algoritmilor de
simulare a variabilelor aleatoare. n Capitolul 7, se studiaz elemente de
8
statistic descriptiv i aspecte privind organizarea datelor, ct i analiza
acestora, punndu-se accentul pe modalitile de reprezentare, dar i pe gsirea
diverselor mrimi caracteristice. Noiunile sunt nsoite de exemple adecvate i
actuale. n Capitolul 8 sunt prezentate noiuni de teoria seleciei, ncepnd cu
descrierea generrii unor valori particulare ale variabilelor aleatoare discrete sau
continue i continund cu legi de probabilitate ale variabilelor de eantionare.
Capitolul 9 conine o scurt introducere n teoria estimaiei. Se prezint, cu multe
exemple, conceptele de estimator nedeplasat i estimator de maxim
verosimilitate. n Capitolul 10, sunt prezentate intervalele de ncredere pentru
principalii parametri statistici. Astfel, capitolul debuteaz cu fundamentarea
formei generale a unui interval de ncredere, ca metod de estimare statistic,
dup care sunt prezentate pe rnd, intervalul de ncredere pentru medie,
incluznd cazul cnd dispersia este necunoscut, respectiv cazul particular al
unei proporii, apoi interval de ncredere pentru diferena a dou medii, respectiv,
interval de ncredere pentru dispersie i pentru raportul a dou dispersii, toate
acestea nsoite de exemple practice. Capitolul 11 prezint succint teoria deciziei.
Sunt descrise noiunile de ipotez statistic, test statistic, tipuri de erori, nivel de
semnificaie, putere a unui test, p-valoare. Exemplele sunt luate din practica
testrii irurilor binare n ceea ce privete caracterul aleator. n Capitolul 12, sunt
prezentate tehnici de analiz a regresiei, att prin intermediul aspectelor
teoretice, ct i prin intermediul unor exemple. n primul paragraf sunt trecute n
revist noiunile de baz, fiind definite diverse tipuri de modele de regresie,
urmnd ca n ultimele trei paragrafe spaiul s fie alocat cu precdere modelului
liniar. Astfel, este prezentat metoda celor mai mici ptrate n estimarea
parametrilor necunoscui ai unui model liniar multiplu, sunt realizate inferene
asupra estimatorilor unui model liniar n ipotezele clasice Gauss-Markov,
capitolul ncheindu-se cu aspecte care in de previziunea i analiza rezultatelor
unei regresii liniare. Cartea se ncheie cu Capitolul 13 n care sunt abordate
aspecte care in de statistica bayesian i noiuni de teoria credibilitii.
Cartea de fa a fost elaborat n cadrul proiectului
POSDRU/56/1.2/S/32768, Formarea cadrelor didactice universitare i a
studenilor n domeniul utilizrii unor instrumente moderne de predare-nvare-
evaluare pentru disciplinele matematice, n vederea crerii de competene
performante i practice pentru piaa muncii, de ctre un colectiv de autori, cadre
didactice universitare, astfel: capitolele 1 i 2, Lucia Cbulea, capitolele 3 i 4,
Rodica Luca-Tudorache, capitolele 5, 6 i 13, Gheorghi Zbganu, capitolele 7
i 8, Ariana Pitea, capitolele 9 i 11, Ioan Rasa, respectiv capitolele 10 i 12,
Nicoleta Breaz.
Finanat din Fondul Social European i implementat de ctre Ministerul
Educaiei, Cercetrii, Tineretului i Sportului, n colaborare cu The Red Point,
Oameni i Companii, Universitatea din Bucureti, Universitatea Tehnic de
Construcii din Bucureti, Universitatea Politehnica din Bucureti,
Universitatea din Piteti, Universitatea Tehnic Gheorghe Asachi din Iai,
Universitatea de Vest din Timioara, Universitatea Dunrea de Jos din Galai,
Universitatea Tehnic din Cluj-Napoca, Universitatea 1 Decembrie 1918 din
9
Alba-Iulia, proiectul contribuie n mod direct la realizarea obiectivului general al
Programului Operaional Sectorial de Dezvoltare a Resurselor Umane
POSDRU i se nscrie n domeniul major de intervenie 1.2 Calitate n
nvmntul superior.
Proiectul are ca obiectiv adaptarea programelor de studii ale disciplinelor
matematice la cerinele pieei muncii i crearea de mecanisme i instrumente de
extindere a oportunitilor de nvare.
Evaluarea nevoilor educaionale obiective ale cadrelor didactice i
studenilor legate de utilizarea matematicii n nvmntul superior, masterate i
doctorate precum i analizarea eficacitii i relevanei curriculelor actuale la
nivel de performan i eficien, n vederea dezvoltrii de cunotine i
competene pentru studenii care nva discipline matematice n universiti,
reprezint obiective specifice de interes n cadrul proiectului. Dezvoltarea i
armonizarea curriculelor universitare ale disciplinelor matematice, conform
exigenelor de pe piaa muncii, elaborarea i implementarea unui program de
formare a cadrelor didactice i a studenilor interesai din universitile partenere,
bazat pe dezvoltarea i armonizarea de curriculum, crearea unei baze de resurse
inovative, moderne i funcionale pentru predarea-nvarea-evaluarea n
disciplinele matematice pentru nvmntul universitar sunt obiectivele
specifice care au ca rspuns materialul de fa.
Formarea de competene cheie de matematic i informatic presupune
crearea de abiliti de care fiecare individ are nevoie pentru dezvoltarea
personal, incluziune social i inserie pe piaa muncii. Se poate constata ns c
programele disciplinelor de matematic nu au ntotdeauna n vedere identificarea
i sprijinirea elevilor i studenilor potenial talentai la matematic. Totui,
studiul matematicii a evoluat n exigene pn a ajunge s accepte provocarea de
a folosi noile tehnologii n procesul de predare - nvare - evaluare pentru a face
matematica mai atractiv.
n acest context, analiza flexibilitii curriculei, nsoit de analiza
metodelor i instrumentelor folosite pentru identificarea i motivarea studenilor
talentai la matematic ar putea rspunde deopotriv cerinelor de mas, ct i
celor de elit.
Viziunea pe termen lung a acestui proiect preconizeaz determinarea
unor schimbri n abordarea fenomenului matematic pe mai multe planuri:
informarea unui numr ct mai mare de membri ai societii n legtur cu rolul
i locul matematicii n educaia de baz n instrucie i n descoperirile tiinifice
menite s mbunteasc calitatea vieii, inclusiv popularizarea unor mari
descoperiri tehnice, i nu numai, n care matematica cea mai avansat a jucat un
rol hotrtor. De asemenea, se urmrete evidenierea a noi motivaii solide
pentru nvarea i studiul matematicii la nivelele de baz i la nivel de
performan; stimularea creativitii i formarea la viitorii cercettori
matematicieni a unei atitudini deschise fa de nsuirea aspectelor specifice din
alte tiine, n scopul participrii cu succes n echipe mixte de cercetare sau a
abordrii unei cercetri inter i multidisciplinare; identificarea unor forme de
pregtire adecvat de matematic pentru viitorii studeni ai disciplinelor
10
matematice, n scopul utilizrii la nivel de performan a aparatului matematic n
construirea unei cariere profesionale.




11
Capitolul 1


Teoria probabilitilor


1.1. Formalizarea experienelor aleatoare

1.1.1. Evenimente

Definiia 1.1.1. Realizarea practic a unui ansamblu de condiii bine precizat
poart numele de experien sau prob.

Definiia 1.1.2. Prin eveniment vom nelege orice rezultat al unei experiene
despre care putem spune c s-a realizat sau c nu s-a realizat, dup efectuarea
experimentului considerat. Evenimentele se pot clasifica n: evenimente sigure;
evenimente imposibile, evenimente aleatoare.

Definiia 1.1.3. Evenimentul sigur este evenimentul care se produce n mod
obligatoriu la efectuarea unei probe i se noteaz cu O.

Definiia 1.1.4. Evenimentul imposibil este evenimentul care n mod obligatoriu
nu se produce la efectuarea unei probe i se noteaz cu | .

Definiia 1.1.5. Evenimentul aleator este evenimentul care poate sau nu s se
realizeze la efectuarea unei probe i se noteaz prin litere mari A, B, C, , sau
prin litere mari urmate de indici A
i
, B
i
,.

Definiia 1.1.6. Evenimentul contrar evenimentului A se noteaz i este
evenimentul ce se realizeaz numai atunci cnd nu se realizeaz evenimentul A.

Definiia 1.1.7. Un eveniment se numete:
1) elementar dac se realizeaz ca rezultat al unei singure probe; se
noteaz cu e .
2) compus dac acesta apare cu dou sau mai multe rezultate ale
probei considerate.

Definiia 1.1.8. Mulimea tuturor evenimentelor elementare generate de un
experiment aleator se numete spaiul evenimentelor elementare (spaiul de
selecie) i se noteaz cu O. Acesta poate fi finit sau infinit.


12
Observaia 1.1.9. O analogie ntre evenimente i mulimi permite o scriere i n
general o exprimare mai comode ale unor idei i rezultate legate de conceptul de
eveniment. Astfel, vom nelege evenimentul sigur ca mulime a tuturor
evenimentelor elementare, adic: { }
n
e e e ,..., ,
2 1
= O i orice eveniment compus
ca o submulime a lui O. De asemenea, putem vorbi despre mulimea tuturor
prilor lui O pe care o notm prin P( O), astfel c pentru un eveniment compus
A putem scrie, n contextul analogiei dintre evenimente i mulimi, c O _ A
sau ) (O eP A .

Exemplul 1.1.10. Fie un zar, care are cele ase fee marcate prin puncte de la 1
la 6. Se arunc zarul pe o suprafa plan neted. Dac notm cu e
i
=
evenimentul "apariia feei cu i puncte", 6 , 1 = i , atunci spaiul evenimentelor
elementare ataat experimentului cu un zar este dat prin O={e
1
, e
2
, e
3
,
e
4
, e
5
, e
6
}.
Evenimentul sigur O este "apariia feei cu un numr de puncte s 6".
Evenimentul imposibil | este "apariia feei cu 7 puncte".


1.2. Relaii ntre evenimente

Definiia 1.2.1. Spunem c evenimentul A implic evenimentul B i
scriem
B A c
, dac realizarea evenimentului A atrage dup sine i realizarea
evenimentului B.

Observaia 1.2.2.
B A c
i C B c rezult C A c - proprietatea de
tranzitivitate a relaiei de implicare.

Definiia 1.2.3. Spunem c evenimentele A i B sunt echivalente (egale) dac
avem simultan
B A c
i
A Bc
.

Definiia 1.2.4. Prin reunirea evenimentelor A i B vom nelege evenimentul
notat B A care const n realizarea a cel puin unuia dintre evenimentele A i
B. Deoarece evenimentele A i B sunt submulimi formate cu evenimentele
elementare ale spaiului O, rezult c reunirea evenimentelor poate fi scris
astfel:
{ } B sau A B A e e O e = e e e /

Observaia 1.2.5. Dac notm prin K mulimea tuturor evenimentelor asociate
unui experiment aleator avem:
1. A B B A K B , A = e (comutativitatea);
2. ) C B ( A C ) B A ( K C , B , A = e (asociativitatea);

13
3. Dac K B , A e i B B A B A = c (evident O = O A ,
A A = | , O = O | i O = A A ).

Definiia 1.2.6. Prin intersecia evenimentelor A i B vom nelege evenimentul
notat B A care const n realizarea simultan a ambelor evenimente.
Intersecia evenimentelor A i B poate fi scris sub forma:
{ } B i A B A e e O e = e e e /

Observaia 1.2.7. Au loc relaiile urmtoare:
1. A B B A K B , A = e (comutativitatea)
2. ) C B ( A C ) B A ( K C , B , A = e (asociativitatea)
3. Dac K B , A e i B A c atunci A B A = (evident
A A = O , A = , O = i A A A = ).
4. = e A A K A

Definiia 1.2.8. Spunem c evenimentele A i B sunt incompatibile dac
= B A , adic realizarea lor simultan este imposibil, i spunem c sunt
compatibile dac = B A , adic este posibil realizarea lor simultan.
Evenimentele A i B sunt contrare unul altuia dac O = B A i = B A ,
adic realizarea unuia const din nerealizarea celuilalt.

Definiia 1.2.9. Se numete diferena evenimentelor A i B, evenimentul notat A-
B care se realizeaz atunci cnd se realizeaz evenimentul A i nu se realizeaz
evenimentul B. Diferena evenimentelor poate fi scris sub forma:
{ } B i A B A e e O e = e e e /

Observaia 1.2.10. Evident avem B A B A = i A A E = .
Au loc relaiile lui De Morgan: B A B A = i B A B A = i
respectiv generalizrile

I i
i
I i
i
A A
e e
= ;

I i
i
I i
i
A A
e e
= .

Teorema 1.2.11. Dac evenimentele A, B, C, D e K, atunci sunt adevrate
urmtoarele afirmaii:
i) A B = A (A B)
ii) A B = (A B) B
iii) A = (A B) (A B)
iv) (A B) (B A) = |
v) A B = A [B - (A B)]
vi) A (B C) = (A B) - (A C)
vii) (A B) (C D) = (A C) (B D)

14
Definiia 1.2.12. Evenimentele A i B sunt dependente dac realizarea unuia
depinde de realizarea celuilalt i sunt independente dac realizarea unuia nu
depinde de realizarea celuilalt.
O mulime de evenimente sunt independente n totalitatea lor dac sunt
independente cte dou, cte trei etc.
Pentru evenimentele independente n totalitatea lor vom folosi i
denumirea de evenimente independente.


1.3. Cmp de evenimente

Definiia 1.3.1. O mulime nevid de evenimente ) (O _ P K se numete corp
dac satisface axiomele:
i) K A K A e e
ii) K B A K B , A e e .
Cuplul ( , O K) se numete cmp finit de evenimente, n cazul n care K
este un corp.

Observaia 1.3.2.
1. ntr-un cmp finit de evenimente ( , O K) sunt adevrate afirmaiile:
a. K B A K B A e e ,
b. Evident K e | i K e O .
c. Dac A, B eK atunci K B A e .
2. Dac mulimea evenimentelor elementare este numrabil, o mulime
) (O _ P K se numete corp borelian (sau o -corp, sau o -algebr) pe , O n
condiiile:
i) K A K A e e ,
ii) dac I _N, I | = i A
i
eK, ( ) I i e , atunci K A
I i
i
e
e

,
iii) K e O .
Perechea ( , O K) n care K este un o -corp se numete cmp borelian
(cmp infinit) de evenimente.

Definiia 1.3.3. ntr-un cmp finit de evenimente ( , O K), evenimentele K A
i
e ,
n , 1 i = , formeaz un sistem complet de evenimente (sau o partiie a cmpului)
dac:
i) O =
=

n
i
i
A
1

ii) | =
j i
A A , j i = n , 1 j , i =

15
Observaia 1.3.4. Evenimentele elementare
i
e , , n , 1 i = corespunztoare unei
probe formeaz un sistem complet de evenimente care se mai numete sistem
complet elementar.

Propoziia 1.3.5. Dac { }
n
e e e ,..., ,
2 1
= O atunci cmpul de evenimente
corespunztor conine 2
n
evenimente.

Demonstraie
Pentru un experiment de n rezultate elementare i prin urmare pentru un
eveniment sigur compus din n evenimente elementare, vom avea diverse
evenimente compuse din acestea dup cum urmeaz:
evenimente compuse din cte zero evenimente elementare
0
n
C =
evenimente compuse din cte un eveniment elementar
1
n
C =
evenimente compuse din cte dou evenimente elementare
2
n
C =
- - - - - - - - - - - - - - - -
evenimente compuse din cte k evenimente elementare
k
n
C =
evenimente compuse din cte n evenimente elementare
n
n
C =
i prin urmare, numrul total de evenimente ale lui K este egal cu
n n
n
k
n n n
C C C C 2 ... ...
1 0
= + + + + +


1.4. Cmp de probabilitate

Definiia 1.4.1.(axiomatic a probabilitii) Fie ( , O K) un cmp finit de
evenimente. Se numete probabilitate pe cmpul considerat o funcie R K : P
care satisface axiomele:
i) K A A P e > , 0 ) ( ,
ii) P( O)=1,
iii) ), B ( P ) A ( P ) B A ( P + = A, B , K e i | = B A .

Definiia 1.4.2. Se numete cmp finit de probabilitate tripletul { , O , K, P} unde
cuplul ( , O K) este un cmp finit de probabilitate, iar R K : P este o
probabilitate pe K.

Observaia 1.4.3. n cazul n care cmpul de evenimente ( , O K) este infinit (K
este infinit) probabilitatea P definit pe K satisface axiomele:
i) K A , 0 ) A ( P e >
ii) P( O)=1

16
iii) ( )

e e
=
|
|
.
|

\
|
I i
i
I i
i
A P A P

dac =
j i
A A , j i = , I j , i e , K A
i
e
I-o mulime de indici cel mult numrabil.

Propoziia 1.4.4. Au loc relaiile:
1. ( ) 0 = P
2. ( ) ( ) A P 1 A P =
3. ( )

= =
=
|
|
.
|

\
|
n
1 i
i
n
1 i
i
A P A P

dac =
j i
A A , j i = n , 1 j , i =

Demonstraie
1) Din relaiile O= O i O = aplicnd axioma iii) din
definiia probabilitii avem P( O) = P( O) = P() + P( O) i rezult P() =
0
2) Din relaiile O = A A i = A A aplicnd axioma iii) din
definiia probabilitii avem ) ( ) ( ) ( A P A P A A P + = adic
) ( ) ( ) ( A P A P P + = O i rezult ) ( 1 ) ( A P A P =
3) Demonstrm prin inducie matematic

Pentru n = 2 P(A
1
A
2
) = P(A
1
) + P(A
2
) relaia este adevrat conform
axiomei iii) din definiia probabilitii.
Presupunem relaia adevrat pentru n 1 evenimente, adic

=
=
|
|
.
|

\
|
1
1
1
1
) (
n
i
i
n
i
i
A P A P

i demonstrm pentru n evenimente

=

= =
= + = +
|
|
.
|

\
|
=
(

|
|
.
|

\
|
=
|
|
.
|

\
|
n
i
i
n
i
n i n
n
i
i n
n
i
i
n
i
i
A P A P A P A P A P A A P A P
1
1
1
1
1
1
1 1
) ( ) ( ) ( ) (


dac s-a folosit ipoteza de inducie i s-a inut seama c
1
1
=
|
|
.
|

\
|

=
n
n
i
i
A A

.

Definiia 1.4.5. (clasic a probabilitii) Probabilitatea unui eveniment A este
egal cu raportul dintre numrul evenimentelor egal probabile favorabile
evenimentului A i numrul total al evenimentelor egal probabile.
Alt formulare: probabilitatea unui eveniment este raportul ntre
numrul cazurilor favorabile evenimentului i numrul cazurilor posibile.

Observaia 1.4.6.
1) Conform acestei definiii nu putem stabili probabilitatea unui
eveniment ce aparine unui cmp infinit de evenimente.
2) Definiia clasic se aplic numai atunci cnd evenimentele
elementare sunt egal posibile.

17
Exemplul 1.4.7. Considerm experiena de aruncare a unui zar. Evenimentele
elementare sunt egal posibile i avem 6 cazuri posibile. Notm cu A evenimentul
"apariia unei fee cu numr par de puncte 6 s " numrul cazurilor favorabile
evenimentului A este 3. Deci
2
1
6
3
) A ( P = = .

Exemplul 1.4.8. Dintr-o urn cu 15 bile numerotate de la 1 la 15 se extrage o
bil la ntmplare. Se consider evenimentele:
A = obinerea unui numr prim;
B = obinerea unui numr par;
C =obinerea unui numr divizibil prin 3.
S calculm probabilitile acestor evenimente.

Rezolvare
n aceast experien aleatoare numrul total al cazurilor posibile este
15.
Pentru A numrul cazurilor favorabile este 6, adic {2, 3, 5, 7, 11, 13},
deci
5
2
15
6
) A ( P = = .
Pentru B numrul cazurilor favorabile este 7, adic {2, 4, 6, 8, 10, 12,
14}, deci
15
7
) B ( P = .
Pentru C, numrul cazurilor favorabile este 5, adic { 3, 6, 9, 12, 15},
deci
3
1
15
5
) C ( P = = .


1.5. Reguli de calcul cu probabiliti

P
1
) Probabilitatea diferenei: Dac K B , A e i B A c atunci
P(B-A)=P(B)-P(A)

Demonstraie
Din relaiile B = A (B - A) i A (B - A) = aplicnd axioma iii)
avem | | ) ( ) ( ) ( ) ( A B P A P A B A P B P + = =
P
2
) Probabilitatea reunirii (formula lui Poincar):
Dac K B , A e atunci ) ( ) ( ) ( ) ( B A P B P A P B A P + = .

Demonstraie
Din relaiile | | ) ( B A B A B A = i | | ) ( = B A B A
aplicnd axioma iii) avem
| | ) ( ) ( ) ( ) ( ) ( ) ( B A P B P A P B A B P A P B A P + = + =

18
dac s-a folosit P
1
.
Generalizare:
Dac A
1
,A
2
,A
n
sunt evenimente compatibile atunci
|
|
.
|

\
|
+ + + =
|
|
.
|

\
|
=

= =
=
= = =

n
i
i
n
k j i
k j i
n
j i
j i
j i
n
i
i
n
i
i
A P A A A P A A P A P A P
1
1
1 , 1 1
) 1 ( ... ) ( ) ( ) (

P
3
) Probabiliti condiionate: Dac 0 ) B ( P = atunci raportul
) B ( P
) B A ( P
l
numim probabilitatea lui A condiionat de B i notm P
B
(A) sau ) B A ( P .

Demonstraie
Artm c ) ( A P
B
satisface axiomele probabilitii:
i) 0 ) ( > A P
B
deoarece 0 ) ( > B A P i 0 ) ( > B P
ii) 1
) (
) (
) (
) (
) ( = =

=
B P
B P
B P
E B P
E P
B

iii) Fie A
1
i A
2
e K i
2 1
= A A . Avem

( ) | |
) ( ) (
) (
) (
) (
) (
) (
) ( ) (
) (
) ( ) (
) (
) (
) (
2 1
2 1 2 1
2 1 2 1
2 1
A P A P
B P
A B P
B P
A B P
B P
A B P A B P
B P
A B A B P
B P
A A B P
A A P
B B
B
+ =

=
+
=
=

=

=
,
dac ) ( ) (
2 1
= A B A B .

Observaia 1.5.1.
1) Oricrui cmp de evenimente ( O,K) i putem ataa un cmp de
probabilitate condiionat {O, K, P
B
}.
2) ) A ( P ) B ( P ) B A ( P
B
= - formula de calcul a interseciei a dou
evenimente dependente. Are loc o generalizare: dac A
1
, A
2
, A
n
sunt
evenimente dependente atunci
). A ( P ).... A ( P ) A ( P ) A ( P A P
n
A
3 A A 2 A 1
n
1 i
i
1 n
1 i
i
2 1 1

=
=
|
|
.
|

\
|

3) Dac evenimentele A i B sunt independente atunci P
B
(A)=P(A) i
) B ( P ) A ( P ) B A ( P = - formula de calcul a interseciei a dou evenimente
independente.

Generalizare:
Dac A
1
, A
2
, A
n
sunt evenimente independente atunci
[
= =
=
|
|
.
|

\
|
n
1 i
i
n
1 i
i
) A ( P A P

.

19
4) Dac evenimentele A i B se condiioneaz reciproc i
0 ) B ( P , 0 ) A ( P = = atunci ) A ( P ) B ( P ) B ( P ) A ( P
B A
= .

P
4
) Probabilitatea reunirii evenimentelor independente. Dac A
1
, A
2
, A
n
sunt
evenimente independente, atunci: ( )
[
= =
=
|
|
.
|

\
|
n
1 i
i
n
1 i
i
) A ( P 1 1 A P



Demonstraie
Folosind relaiile lui De Morgan

n
i
i
n
i
i
A A
1 1 = =
= i faptul c A
i
sunt
evenimente independente implic
( )
[ [
= = = = =
= =
|
|
.
|

\
|
=
|
|
.
|

\
|
=
|
|
.
|

\
|
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
A P A P A P A P A P
1 1 1 1 1
) ( 1 1 ) ( 1 1 1



P
5
) Inegalitatea lui Boole: A
1
, A
2
, A
n
, sunt evenimente dependente atunci

= = =
= >
|
|
.
|

\
|
n
i
i
n
i
i
n
i
A P n A P Ai P
1 1 1
) ( 1 ) 1 ( ) (



Demonstraie
Verificm inegalitatea din enun prin inducie matematic.
Pentru n = 2 avem ) ( ) ( ) ( ) (
2 1 2 1 2 1
A A P A P A P A A P + = dac
1 ) (
2 1
s A A P i rezult 1 ) ( ) ( ) (
2 1 2 1
+ > A P A P A A P relaia este adevrat.
Presupunem inegalitatea adevrat pentru n-1 adic
) 2 ( ) (
1
1
1
1
>
|
|
.
|

\
|

=
n A P A P
n
i
i
n
i
i
i demonstrm pentru n.
Avem succesiv
) 1 ( ) ( 1 ) ( ) 2 ( ) (
1 ) (
1
1
1
1
1
1
1 1
= + >
> +
|
|
.
|

\
|
>
(

|
|
.
|

\
|
=
|
|
.
|

\
|

=

= =
n A P A P n A P
A P A P A A P A P
n
i
i n
n
i
i
n
n
i
i n
n
i
i
n
i
i

dac s-a inut seama de ipoteza de inducie.

P
6
) Formula probabilitii totale: Dac A
1
A
2
, A
n
este un sistem complet de
evenimente i X K e atunci P(X)= . ) X ( P ) A ( P
n
1 i
A i
i

=


20

Demonstraie
Din ipoteza c A
i
, n i , 1 = este un sistem complet de evenimente rezult
c ) ( ... ) ( ) (
2 1
X A X A X A X
n
=
Deoarece n j i j i A A
j i
, 1 , , , = = = avem c
n j i j i A X A X
j i
, 1 , , , ) ( ) ( = = =
Avem succesiv


= = =
= =
|
|
.
|

\
|
=
n
i
n
i
A i i
n
i
i
X P A P X A P X A P X P
i
1 1 1
) ( ) ( ) ( ) ( ) (


P
7
) Formula lui Bayes: Dac A
1
, A
2
, A
n
este un sistem complet de evenimente
al cmpului ( O, K) i K Xe atunci:
P
X
(A
i
)=

n
1 i
A i
A i
) X ( P ) A ( P
) X ( P ) A ( P
i
i
, n , 1 i =

Demonstraie
Deoarece ) ( ) ( ) (
i X i
A P X P A X P = i
) ( ) ( ) ( X P A P A X P
i
A i i
= avem ) ( ) ( ) ( ) ( X P A P A P X P
i
A i i X
= , deci

=
n
i
A i
A i A i
i X
X P A P
X P A P
X P
X P A P
A P
i
i i
1
) ( ) (
) ( ) (
) (
) ( ) (
) ( dac s-a folosit formula
probabilitii totale.

Exemplul 1.5.2. Cele 26 de litere ale alfabetului, scrise fiecare pe un cartona,
sunt introduse ntr-o urn. Se cere probabilitatea ca extrgnd la ntmplare de
5 ori cte un cartona i aezndu-le n ordinea extragerii s obinem cuvntul
LUCIA.

Rezolvare
Notm prin X evenimentul cutat, deci de a obine prin extrageri
succesive cuvntul LUCIA, de asemenea notm prin A
1
= evenimentul ca la
prima extragere s obinem litera L; A
2
= evenimentul ca la a doua extragere s
obinem litera U; A
3
= evenimentul ca la a treia extragere s obinem litera C; A
4

= evenimentul ca la a patra extragere s obinem litera I; A
5
= evenimentul ca la a
cincea extragere s obinem litera A.
Atunci evenimentul X are loc dac avem

5 4 3 2 1
A A A A A X = .
Rezult:

21
.
22
1
23
1
24
1
25
1
26
1
) (
) ( ) ( ) ( ) ( ) (
4 3 2 1 5
3 2 1 4 2 1 3 1 2 1
=
=
A A A A A P
A A A A P A A A P A A P A P X P


Exemplul 1.5.3. Dac probabilitatea ca un automobil s plece n curs ntr-o
diminea friguroas este de 0,6 i dispunem de dou automobile de acest fel,
care este probabilitatea ca cel puin unul din automobile s plece n curs ntr-o
diminea friguroas?

Rezolvare
Dac notm prin A
1
i A
2
evenimentele ca primul respectiv, al doilea
automobil s plece n curs i prin X evenimentul cutat, deci ca cel puin unul
dintre automobile s plece n curs, avem:
2 1
A A X = , iar
) A A ( P ) X ( P
2 1
= ( P ) A ( P ) A ( P
2 1
+ =
2 1
A A ), deoarece evenimentele
1
A
i
2
A sunt compatibile (cele dou automobile pot s plece n curs deodat).
Cum P(
1
A ) = P(
2
A ) = 0,6, iar evenimentele
1
A i
2
A sunt independente ntre
ele (plecarea unui automobil nu depinde de plecarea sau neplecarea celuilalt),
deci P(
2 1
A A ) = P( ) A ( P ) A
2 1
=
2
) 6 , 0 ( . Se obine c P(X) = 0,6 + 0,6 -
2
) 6 , 0 (
= 0,84.

Exemplul 1.5.4. Trei secii ale unei ntreprinderi
3 2 1
S , S , S depesc planul
zilnic de producie cu probabilitile de respectiv 0,7; 0,8 i 0,6. S se calculeze
probabilitile evenimentelor:
A - cel puin o secie s depeasc planul de producie.
B - toate seciile s depeasc planul de producie.

Rezolvare
Fie
i
A evenimentul ca secia
i
S s depeasc planul de producie.
Avem: A =
3 2 1
A A A , deci
P(A) = P ) A A A ( P 1 ) A A A (
3 2 1 3 2 1
= = ) A ( P ) A ( P ) A ( P 1
3 2 1
=
1- (1-0,7)(1-0,8)(1-0,6) = 976 , 0 4 , 0 2 , 0 3 , 0 1 = .
B =
3 2 1
A A A i innd seama de independena evenimentelor, avem:
P(B) =
336 , 0 6 , 0 8 , 0 7 , 0 ) A ( P ) A ( P ) A ( P ) A A A ( P
3 2 1 3 2 1
= = = .

Exemplul 1.5.5. O pres este considerat c satisface standardul de fabricaie
dac trei caracteristici sunt satisfcute. Dac aceste caracteristici A, B i C sunt
satisfcute cu probabilitile P(A) =
10
9
, P(B) =
11
7
i P(C) =
12
11
, atunci
probabilitatea ca s fie satisfcute toate trei caracteristicile se poate evalua cu
formula lui Boole. Astfel se poate scrie:

22
P( | |, ) C ( P ) B ( P ) A ( P 1 ) C B A + + > adic
P(
660
229
12
1
11
4
10
1
1 ) C B A = |
.
|

\
|
+ + > .

Exemplul 1.5.6. Un sortiment de marf dintr-o unitate comercial provine de la
trei fabrici diferite n proporii, respectiv
3
1
de la prima fabric,
6
1
de la a doua
fabric i restul de la fabrica a treia. Produsele de la cele trei fabrici satisfac
standardele de fabricaie n proporie de 90%, 95% i respectiv 92%. Un client
ia la ntmplare o bucat din sortimentul de marf respectiv.
a) Care este probabilitatea ca produsul s satisfac standardele de
fabricaie?
b) Care este probabilitatea ca produsul s fie defect i s provin de la
prima fabric?

Rezolvare
a) Notm cu
2 1
A , A i
3
A evenimentele ca produsul cumprat s fie de
la prima, a doua, respectiv a treia fabric. Aceste trei evenimente formeaz un
sistem complet de evenimente i au probabilitile P(
6
1
) A ( P ,
3
1
) A
2 1
= = i
2
1
) (
3
= A P . Dac A este evenimentul c produsul cumprat de client satisface
standardele de fabricaie, atunci P(A , 90 , 0 ) A
1
= P( 95 , 0 ) A A
2
= i
P( 92 , 0 ) A A
3
= . Folosind formula probabilitii totale se obine:
918 , 0
6
51 , 5
92 , 0
2
1
95 , 0
6
1
90 , 0
9
1
) ( ) ( ) ( ) ( ) ( ) ( ) (
3 3
2
2 1 1
= = + + =
= + + = A A P A P A A P A P A A P A P A P

b) Folosind formula lui Bayes, avem:
P( =
+ +
=
) A A ( P ) A ( P ) A A ( P ) A ( P ) A A ( P ) A ( P
) A A ( P ) A ( P
) A A
3 3 2 2
1
1
1 1
1

= . 408 , 0
49 , 0
2 , 0
08 , 0
2
1
05 , 0
6
1
10 , 0
3
1
10 , 0
3
1
= =
+ +



Exemplul 1.5.7. Un student solicit o burs de studii la 3 universiti. Dup
trimiterea actelor necesare, acesta poate obine burs de la universitatea i (U
i
)
sau nu ) (
i
U , 1 i 3 . Scriei evenimentele ce corespund urmtoarelor situaii :
a) primete o burs;

23
b) primete cel mult o burs;
c) primete cel puin o burs;
d) primete cel puin dou burse.

Rezolvare
a) Bursa primit poate fi de la prima universitate, caz n care celelalte
nu-i acord burs, sau de la a doua, caz n care prima i a treia nu-i acord burs,
sau de la a treia, caz n care primele dou nu-i acord burs. Avem astfel
evenimentul
) ( ) ( ) (
3 2 1 3 2 1 3 2 1
U U U U U U U U U A = .
b) Avem dou variante : studentul nu primete nici o burs sau studentul
primete o burs. Obinem evenimentul
A U U U B = ) (
3 2 1
.
c) Evenimentul poate fi scris ca reuniunea a trei evenimente : studentul
primete o burs, dou burse, trei burse. Astfel F E A C = , unde
) ( ) ( ) (
3 2 1 3 2 1 3 2 1
U U U U U U U U U E = ,
iar
3 2 1
U U U F = .
d) Avem F E D = . Altfel, evenimentul D este contrar evenimentului
B, deci A U U U B D = = ) (
3 2 1
.

Exemplul 1.5.8. ntr-un grup de studeni aflai n excursie se gsesc 6 fete i 9
biei. Se aleg la ntmplare doi studeni pentru a cerceta traseul. Care este
probabilitatea ca cei doi s fie :
a) biei;
b) fete;
c) un biat i o fat;
d) cel puin un biat;
e) primul biat i a doua fat;
f) de acelai sex.

Rezolvare
Notm cu A
1
i A
2
evenimentele alegerii unui biat la prima, respectiv a
doua alegere. La primul punct avem de calculat probabilitatea ) (
2 1
A A P .
ntruct a doua alegere depinde de prima avem :
35
12
14
8
15
9
) ( ) ( ) (
1 2 1 2 1
= = = A A P A P A A P ,
deoarece alegnd un biat mai rmn n grup 14 studeni ntre care 8 biei.
Evenimentul de la punctul b) se scrie astfel :
2 1
A A B = . Deci
7
1
14
5
15
6
) ( ) ( ) ( ) (
1 2 1 2 1
= = = = A A P A P A A P B P .

24
Evenimentul de la punctul c) este ) ( ) (
1 2 2 1
A A A A C = aadar
) ( ) ( ) (
1 2 2 1
A A P A A P C P + = ,
1 2 2 1
, ( A A A A sunt incompatibile)
Dar
14
6
15
9
) / ( ) ( ) (
1 2 1 2 1
= = A A P A P A A P ,
iar
14
9
15
6
) / ( ) ( ) (
1 2 1 1 2
= = A A P A P A A P
de unde
35
18
14
6
15
9
2 ) ( = = C P .
Am obinut i probabilitatea evenimentului de la punctul e) ) (
2 1
A A P .
Evenimentul de la punctul d) se exprim astfel :
2 1
A A D = .
El este contrar evenimentului :
2 1
A A B = , prin urmare
7
6
7
1
1 ) ( 1 ) ( = = = B P D P . Evenimentul de la ultimul punct f) este
) ( ) (
2 1 2 1
A A A A F = . Cum u = ) ( ) (
2 1 2 1
A A A A cele dou
evenimente sunt incompatibile i deci

35
17
7
1
35
12
) ( ) ( ) (
2 1 2 1
= + = + = A A P A A P F P .

Exemplul 1.5.9. La un examen de licen particip mai muli absolveni, ntre
care numai trei din strintate. Probabilitatea ca primul student s promoveze
este , probabilitatea ca al doilea s promoveze este 4/5, iar pentru al treilea
5/6. S se determine probabilitile ca :
a) toi cei trei studeni s promoveze;
b) cel puin unul s promoveze examenul.

Rezolvare
Fie A
i
evenimentul promovrii examenului de ctre studentul i, i=1,2,3.
Evenimentul de la punctul a) este
3 2 1
A A A A = , iar de la punctul b) este
3 2 1
A A A B = . Evenimentele A
i
sunt independente (rezultatele celor 3
studeni nedepinznd unul de celelalte), deci

2
1
6
5
5
4
4
3
) ( ) ( ) ( ) (
3 2 1
= = = A P A P A P A P .

Folosind proprietile probabilitii avem :

= + = = ) ) (( ) ( ) ( ) ( ) (
3 2 1 3 2 1 3 2 1
A A A P A P A A P A A A P B P
= + + = )) ( ) (( ) ( ) ( ) ( ) (
3 2 3 1 3 2 1 2 1
A A A A P A P A A P A P A P

25
+ + =
+ + + =
) ( ) ( ) ( )) ( ) ((
) ( ) ( [ ) ( ) ( ) ( ) (
3 2 1 3 2 3 1
3 2 3 1 3 2 1 2 1
A P A P A P A A A A P
A A P A A P A P A A P A P A P

). ( ) ( ) ( ) (
3 2 1 3 2 3 1 2 1
A A A P A A P A A P A A P +

innd seama de independena evenimentelor A
i
, i=1,2,3, avem:

.
120
119
6
5
5
4
4
3
6
5
5
4
6
5
4
3
5
4
4
3
6
5
5
4
4
3
) ( ) ( ) (
) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) (
3 2 1
3 2 3 1 2 1 3 2 1
= + + + = +
+ + + =
A P A P A P
A P A P A P A P A P A P A P A P A P B P


Exemplul 1.5.10. Din mai multe controale asupra activitilor a trei magazine
se apreciaz c n proporie de 90%, 80%, 70%, cele trei magazine au declarat
marfa vndut. La un nou control, comisia de control solicit 50 de documente
privind activitatea comercial: 20 de la primul magazin, 15 de la al doilea, 15
de la al treilea. Dintre acestea se alege unul la ntmplare pentru a fi verificat:
a) Cu ce probabilitate documentul ales este corect (nregistrat)?
b) Constatnd c este corect, cu ce probabilitate el aparine primului
magazin?

Rezolvare
a) Notm cu A
1
, A
2
, A
3
evenimentul ca documentul controlat s provin
de la primul, al doilea i respectiv al treilea magazin. Avem astfel

50
15
) ( ;
50
15
) ( ;
50
20
) (
3 2 1
= = = A P A P A P .

Fie A evenimentul ca documentul controlat s fie corect. Atunci A /
A
1
, A / A
2
, A / A
3
reprezint evenimentul ca documentul controlat s fie corect
tiind c el provine de la primul, al doilea, al treilea magazin. Prin urmare :
P(A/A
1
)=0,90; P(A/A
2
)=0,80; P(A/A
3
)=0,70 . Cum {A
1
, A
2
, A
3
} este un sistem
complet de evenimente

u = = = =
3 2 3 1 2 1 3 2 1
, A A A A A A E A A A

aplicnd formula probabilitii totale avem :

. 81 , 0 70 , 0
50
15
80 , 0
50
15
90 , 0
50
20
) / ( ) ( ) / ( ) ( ) / ( ) ( ) (
3 3 2 2 1 1
= + + =
= + + = A A P A P A A P A P A A P A P A P


b) Aplicnd formula lui Bayes avem :

26
9
4
81 , 0
36 , 0
81 , 0
90 , 0
50
20
) / ( ) (
) / ( ) (
) / (
3
1
1 1
1
= =

= =

= i
i i
A A P A P
A A P A P
A A P .
(A
1
/A reprezint evenimentul ca documentul controlat s provin de la
primul magazin tiind c a fost corect).




























27
Capitolul 2


Variabile aleatoare


Variabila aleatoare este una din noiunile fundamentale ale teoriei
probabilitilor i a statisticii matematice. n cadrul unei cercetri experimentale
se constat c ntre valorile numerice msurate exist diferene chiar dac rmn
neschimbate condiiile de desfurare ale experimentului.
Dac ne referim la o singur msurtoare, variabila aleatoare este acea
mrime care n cadrul unui experiment poate lua o valoare necunoscut aprioric.
Pentru un ir de msurtori, variabila aleatoare este o noiune care-l
caracterizeaz din dou puncte de vedere:
- caracterizare din punct de vedere cantitativ variabila ne d informaii
privind valoarea numeric a mrimii msurate;
- caracterizare din punct de vedere calitativ variabila aleatoare ne d
informaii privind frecvena de apariie a unei valori numerice ntr-un ir.
Dac valorile numerice ale unui ir de date aparin mulimii numerelor
ntregi sau raionale atunci se definete o variabil aleatoare discret, iar n cazul
aparteneei valorilor la mulimea numerelor reale se definete o variabil
aleatoare continu.


2.1. Variabile aleatoare discrete

n ciuda faptului c dup repetarea unui experiment de un numr mare
de ori intervine o anumit regularitate n privina apariiei unor rezultate ale
acestuia, nu se poate preciza niciodat cu certitudine care anume dintre rezultate
va apare ntr-o anumit prob. Din acest motiv cuvntul sau conceptul aleator
trebuie neles sau gndit n sensul c avem de-a face cu experimente sau
fenomene care sunt guvernate de legi statistice (atunci cnd exist un anumit
grad de incertitudine privind apariia unui rezultat sau reapariia lui) i nu de legi
deterministe (cnd tim cu certitudine ce rezultat va apare sau nu). Pentru ca
astfel de experimente sau fenomene s fie cunoscute i prin urmare studiate, sunt
importante i necesare dou lucruri i anume:
1. rezultatele posibile ale experimentului, care pot constitui o mulime
finit, infinit sau numrabil sau infinit i nenumrabil;
2. legea statistic sau probabilitile cu care este posibil apariia
rezultatelor experimentului considerat.
n linii mari i ntr-un neles mai larg, o mrime care ia valori la
ntmplare sau aleatoriu dintr-o mulime oarecare posibil se numete variabil
aleatoare (sau ntmpltoare). Se poate da i o definiie riguroas.

28
Definiia 2.1.1. Fie cmpul de probabilitate {, K, P}. Numim variabil
aleatoare de tip discret o aplicaie X : R care verific condiiile:
i) are o mulime cel mult numrabil de valori;
ii)
R x e
K x X e = ) (

Observaia 2.1.2.
1) Dac K = P() atunci ii) este automat ndeplinit;
2) O variabil aleatoare de tip discret este deci o funcie univoc de
forma
X : {x1, x2, xn, }
c
R;
3) Se obinuiete ca valorile variabilei s se noteze n ordine
cresctoare adic
.... x ... x x x
n 3 2 1
< < < <
, xi
e
R, i = 1, 2,
4) Evenimentele Ai = X-1(xi) = {e / X() = xi }e K, oricare ar fi i
= 1, 2, 3, ,
X-1 : {x1, x2, xn, } K este inversa funciei X.

Definiia 2.1.3. Numim distribuia sau repartiia variabilei aleatoare X de tip
discret, tabloul de forma
I i
i
i
p
x
X
e
|
|
.
|

\
|
: unde xi, , I i e sunt valorile posibile ale
variabilei aleatoare X iar pi este probabilitatea cu care variabila considerat X
ia valoarea xi , adic pi = P(X = xi ),
I i e
mulimea I putnd fi finit sau cel
mult numrabil.

Observaia 2.1.4.
1) Evenimentele (X = xi ), i
e
I formeaz un sistem complet de
evenimente i 1 =

eI i
i
p .
2) Variabila aleatoare pentru care mulimea valorilor este un interval
finit sau infinit pe axa numerelor reale este variabil aleatoare continu.
3) Forma cea mai general a unei variabile aleatoare aparinnd unei
clase de variabile aleatoare de tip discret se numete lege de probabilitate
discret.

Definiia 2.1.5. Spunem c variabilele aleatoare X i Y care au respectiv
distribuiile
I i
i
i
p
x
X
e
|
|
.
|

\
|
i
J j
j
j
q
y
Y
e
|
|
.
|

\
|
sunt independente dac
P(X = xi , Y = yj) = P(X = xi ) P(Y = yj),
. IxJ ) j , i ( e



29
Definiia 2.1.6. Fie variabilele aleatoare X, Y care au respectiv distribuiile
I i
i
i
p
x
X
e
|
|
.
|

\
|
i
J j
j
j
q
y
Y
e
|
|
.
|

\
|
atunci variabila aleatoare sum X+Y, produs
Y X
i ct
Y
X
(dac J j y
j
e = , 0 ) vor avea distribuiile ,
) , ( IxJ j i
ij
j i
p
y x
Y X
e
|
|
.
|

\
| +
+
IxJ ) j , i (
ij
j i
p
y x
Y X
e
|
|
.
|

\
|

, respectiv
IxJ j i
ij
j
i
p
y
x
Y
X
e
|
|
|
.
|

\
|
) , (
unde pij = P(X = xi, Y = yj)
(i,j)
. IxJ e


Definiia 2.1.7. Se numete
a) produs al variabilei aleatoare X prin constanta real a, variabila
aleatoare notat prin
I i
i
i
p
ax
aX
e
|
|
.
|

\
|
:
b) sum a variabilei aleatoare X cu constanta real a, variabila
aleatoare notat prin
I i
i
i
p
x a
X a
e
|
|
.
|

\
| +
+ :
c) putere a variabilei aleatoare X de exponent k, k e Z , variabila
aleatoare
I i
i
k
i k
p
x
X
e
|
|
.
|

\
|
: cu condiia ca operaiile
k
i
x ,
I i e
, s aib
sens.

Observaia 2.1.8. Au loc relaiile I i p p
J j
i ij
e =

e
, i

e
e =
I i
j ij
J j q p . ,
Dac variabilele X,Y sunt independente atunci J I j i q p p
j i ij
e = ) , ( ,

Definiia 2.1.9. Fie { O, K, P} un cmp de probabilitate, iar X : O

R o
variabil aleatoare. Numim funcie de repartiie ataat variabilei aleatoare X
funcia F : R [0, 1], definit prin F(x) = ( ) x X P s , , R x e adic
F(x)= R x p
x x
i
i
e

s
, .
Dac nu exist pericol de confuzie, funcia de repartiie a variabilei
aleatoare X se noteaz prin F.

Propoziia 2.1.10. (proprieti ale funciei de repartiie)
1. , R b , a e b a < avem:

30

( ) ( )
) ( ) ( ) ( ) (
) ( ) ( ) (
b X P a F b F b X a P
a X P a F b X P b F b X a P
= = < <
= + = = < s


( ) a X P a F b F b X a P
a F b F b X a P
= + = s s
= s <
) ( ) ( ) (
) ( ) ( ) (


Demonstraie
Avem succesiv
| |
( ) ( ) a X P a F b X P b F a X P b X P
a X b X P a X b X P b X a P
= + = = < < =
= < < = < < = < s
) ( ) ( ) ( ) (
) ( ) ( ) , ( ) (

dac s-a inut seama de relaia ) ( ) ( b X a X < c < i s-a folosit probabilitatea
diferenei.
| |
( ) ( ) ( ) ) ( ) ( ) ( ) ( ) (
) ( ) ( ) ( ) ( ) (
a F b X P b F a X P a X P a F b X P b F
a X P b X a P a X b X a P b X a P
= = = = + = =
= = < s = = < s = < <

dac s-a folosit relaia demonstrat anterior.
2. F este nedescresctoare pe R,
adic ) ( ) ( , ,
2 1 2 1 2 1
x F x F x x R x x s < e

Demonstraie
) ( ) ( ) ( 0
1 2 2
1
x F x F x X x P = s < s ) ( ) (
2 1
x F x F s
3. 1 ) ( lim , 0 ) ( lim = =

x F x F
x x


Demonstraie
0 ) ( ) ( lim ) ( lim = = s =

| P x X P x F
x x

1 ) ( ) ( lim ) ( lim = = s =
+ +
E P x X P x F
x x

4. ) x ( F ) a x ( F , R x = e (F este continu la stnga n fiecare punct
R x e )

Exemplul 2.1.11. Se consider variabila aleatoare discret
|
|
.
|

\
|
6
1
3
1
p
4
7
p
4 3 2 1
: X 2 . Care este probabilitatea ca X s ia o valoare mai mic
sau egal cu 3?

Rezolvare
Pentru ca X s fie o variabil aleatoare trebuie ca 0 p >
i
1
6
1
3
1
4
7
2
= + + + p p
. Se obine soluia acceptabil
.
4
1
= p
Se calculeaz

31
probabilitatea cerut prin intermediul evenimentului contrar i anume
6
5
6
1
1 ) 4 X ( P 1 ) 3 X ( P = = = = s sau
6
5
3
1
16
7
16
1
) 3 X ( P ) 2 X ( P ) 1 X ( P ) 3 X ( P = + + = = + = + = = s .

Exemplul 2.1.12. Se dau variabilele aleatoare independente:
|
|
.
|

\
|
+ +

3
1
3
1
q
6
1
p
1 0 1
: X
;
|
|
.
|

\
|

2
p 12 q p 2
3
1
1 0 1
: Y
.
a) S se scrie distribuia variabilei 2XY.
b) Pentru ce valori ale lui c avem: ?
9
2
) c Y X ( P > = +

Rezolvare
Pentru ca X i Y s fie variabile aleatoare se impun condiiile:
0 q p 2 ; 0
3
1
q ; 0
6
1
p > > + > + i apoi :

= + +
= + + + +
1 p 12 q p 2
3
1
1
3
1
3
1
q
6
1
p
2
, rezult valorile
acceptabile
6
1
p = i q = 0. Deci variabilele aleatoare au repartiiile:
|
|
.
|

\
|
3
1
3
1
3
1
1 0 1
: X ;
|
|
.
|

\
|
3
1
3
1
3
1
1 0 1
: Y
. Avem :
a)
|
|
.
|

\
|
9
2
9
5
9
2
2 0 2
: XY 2
b)
|
|
.
|

\
|
+
9
1
9
2
9
3
9
2
9
1
2 1 0 1 2
: Y X , deci P(X + Y = c)>
9
2
corespunde
situaiei P(X + Y = 0) =
9
2
9
3
> adic c = 0.

Exemplul 2.1.13. Variabila aleatoare X cu distribuia urmtoare:

32
Y
X
|
|
|
|
.
|

\
|
3
1
2
1
6
1
2 1
2
1
: X , are funcia de repartiie:

>
s <
s <
s
= s =
2 , 1
, 2 1 ,
3
2
, 1
2
1
,
6
1
,
2
1
, 0
) ( ) (
x dac
x dac
x dac
x dac
x X P x F
Graficul funciei de repartiie este:















2.2. Vector aleator bidimensional

Definiia 2.2.1. Fie cmpul de probabilitate {, K, P}. Spunem c U=(X,Y) este
vector aleator bidimensional de tip discret dac aplicaia U :
2
R verific
condiiile:
i) are o mulime cel mult numrabil de valori;
ii) K ) y Y , x X ( , R ) y , x (
2
e = = e .

Definiia 2.2.2. Numim distribuia sau repartiia vectorului aleator (X,Y) de tip
discret tabloul:


unde ( ) ,
j i
y x sunt valorile
pe care le ia vectorul aleator
(X,Y), iar
j i ij
y Y x X P p = = = , ( ).


y
1
y
j

p
11
p
1j

p
i1
p
ij


x
1
x
i
.

.
.
.

.
.
.

.
.
.

F(x)
x 2 1 1/2
1
2/3
1/6

33

Evident
( )

e J I j i
ij
p
,
= 1.

Definiia 2.2.3. Numim funcie de repartiie ataat vectorului aleator
bidimensional funcia F: | | 1 , 0
2
R , definit prin:
F(x,y) = P(Xsx, Ysy),
2
R ) y , x ( e .

Propoziia 2.2.4.(proprietile funciei de repartiie a unui vector aleator
bidimensional de tip discret)
1. dac a<b i c<d, atunci
) , ( ) , ( ) , ( c a F d b F d Y c b X a P = s < s < .
2. F(x,y) este nedescresctoare n raport cu fiecare argument.
3. ; 0 ) y , x ( F lim ) y , x ( F lim ) y , x ( F lim
y
x y x
= = =


1 ) y , x ( F lim
y
x
=


.
4. F(x,y) este continu la stnga n raport cu fiecare argument.

Observaia 2.2.5. Dac (X,Y) are funcia de repartiie F, iar variabilele X i Y
au funciile de repartiie
X
F i respectiv
Y
F , atunci:
) y , x ( F lim ) x ( F
y
X

= i ) y , x ( F lim ) y ( F
x
Y

= .

Exemplul 2.2.6. Se consider vectorul aleator discret (X,Y) cu repartiia dat n
tabelul:











a) s se determine repartiia variabilelor X,Y, X+Y;
b) s se stabileasc dac X i Y sunt independente sau nu;
c) s se calculeze |
.
|

\
|
5 ,
2
7
F .

Rezolvare
a) Variabila X are repartiia:
Y
X
2 6
0,20 0,10
0,05 0,15
0,45 0,05
1
3
4

34
X:
|
|
.
|

\
|
3 2 1
p
4
p
3
p
1
, unde
50 , 0 05 , 0 45 , 0 p p p
20 , 0 15 , 0 05 , 0 p p p
30 , 0 10 , 0 20 , 0 p p p
32 31 3
22 21 2
12 11 1
= + = + =
= + = + =
= + = + =
, adic
X:
|
|
.
|

\
|
50 , 0
4

20 , 0
3

30 , 0
1
.
Analog, variabila Y are repartiia Y:
|
|
.
|

\
|
2 1
q
6
q
2
, unde
30 , 0 05 , 0 15 , 0 10 , 0 p p p q
70 , 0 45 , 0 05 , 0 20 , 0 p p p q
32 22 12 2
31 21 11 1
= + + = + + =
= + + = + + =
, adic Y:
|
|
.
|

\
|
30 , 0
6
70 , 0
2
.
Avem: X+Y:
|
|
.
|

\
|
05 , 0
10
15 , 0 10 , 0
8 7
45 , 0 05 , 0
6 4
20 , 0
3
.
b) Pentru verificarea independenei variabilelor X,Y, efectum un
control, de exemplu:
P(X=1) P(Y=2) = 21 , 0 70 , 0 30 , 0 = , iar P[(X=1) (Y=2)] = 20 , 0 p
11
= .
Cum 0,21 = 0,20, deducem c X i Y sunt dependente.
c) F( = = = = = = s s = )] 2 , 3 ( ) 2 , 1 [( ) 5 ,
2
7
( ) 5 ,
2
7
Y X Y X P Y X P
=P(X=1,Y=2) +P(X=3,Y=2) = 0,20+0,05 = 0,25.

Definiia 2.2.7. Fie variabila aleatoare X avnd funcia de repartiie F, vom
spune c X este variabil aleatoare de tip continuu dac funcia de repartiie se
poate reprezenta sub forma:
F(x) = R x , dt ) t (
x

e
}

.
Funcia R R : se numete densitate de probabilitate a variabilei
aleatoare X.

Propoziia 2.2.8. Au loc afirmaiile:
1) 0 ) x ( , R x > e .
2) F'(x) = ) x ( a.p.t. pe R.
3) P(asX<b) =
}

b
a
dx ) x ( .
4)
}


=

1 dx ) x ( .

Observaia 2.2.9.
1. Pentru o variabil de tip continuu P(X=a)= 0, deci P(a sX<b) =
P(a<X<b) = P(a ) b X s s = P(a<X<b) =
}

b
a
dx ) x ( .

35
2.
x
x x X x P
x
x F x x F
x F x
x x
A
A + < s
=
A
A +
= =
A A
) (
lim
) ( ) (
lim ) ( ' ) (
0 0
, deci
cnd x A este mic avem P(x x ) x ( ) x x X A ~ A + < s .

Definiia 2.2.10. Fie vectorul aleator (X,Y) avnd funcia de repartiie F,
spunem c (X,Y) este un vector aleator de tip continuu, dac funcia de repartiie
F se poate pune sub forma:
F(x,y) =
} }

e
x

y

2
R ) y , x ( , dt ds ) t , s ( , iar funcia R R :
2
se
numete densitate de probabilitate a vectorului aleator (X,Y).

Observaia 2.2.11. Dac este densitate de probabilitate pentru (X,Y), iar
X
i
Y
densiti de probabilitate pentru X, respectiv Y au loc:
1)
2
R ) y , x ( , 0 ) y , x ( e > .
2) ) y , x (
y x
) y , x ( F
2
=
c c
c
a.p.t. pe
2
R .
3) P((X,Y)
2
, ) , ( )
} }
c = e R D dy dx y x D
D
.
4)
} }
=
2
R
1 dy dx ) y , x ( .
5)
}


e =


R x , dy ) y , x ( ) x (
X
; R y dx y x y
Y
e =
}




, ) , ( ) ( .

Definiia 2.2.12. Spunem c variabilele aleatoare de tip continuu X i Y sunt
independente dac F(x,y) = ) y ( F ) x ( F
Y X
,
2
R ) y , x ( e .

Aplicaia 2.2.13. Funcia
| | | |

e
=
rest n , 0
3 , 1 2 , 1 ) , ( ,
) , (
2
y x kxy
y x este densitate de
probabilitate dac 0 ) , ( > y x i
}}
=
2
1 ) , (
R
dxdy y x ceea ce implic
ecuaia n k,
} }
=
2
1
3
1
2
1 dxdy xy k , verificat pentru
13
1
= k .
n acest caz funcia de repartiie va fi
( ) | | | |
| |
| |
} }

> >
> e
> e
e
< <
= =
x y
i x dac
i y dac x
x i y dac y
y x dac y x
y sau x dac
dudv uv y x F
1
2
3
3 2
1
2
3 y 2 , 1
3 y 2 , 1 , ) 1 (
2
1
2 3 , 1 , ) 1 (
26
1
3 , 1 2 , 1 , , ) 1 )( 1 (
78
1
1 1 , 0
) , (

36
i deducem de asemenea c funciile de repartiie marginale sunt, respectiv,
| |

>
e
<
=
2 , 1
2 , 1 , ) 1 (
3
1
1 , 0
) (
2
x
x x
x
x F
X
; | |

>
e
<
=
3 , 1
3 , 1 , ) 1 (
3
1
1 y , 0
) (
2
y
y x y F
Y



2.3. Caracteristici numerice asociate variabilelor aleatoare

Fie { } P K, , O un cmp de probabilitate i R X O : o variabil
aleatoare. n afara informaiilor furnizate de funcia de repartiie ) (x F sau chiar
de repartiia probabilist (discret ( )
i
p sau continu ( ) ) (x ale unei variabile
aleatoare X, de un real folos teoretic i practic sunt i informaiile pe care le
conin anumite caracteristici numerice (valoarea medie, dispersia, abaterea medie
ptratic sau diverse alte momente) ale lui X despre aceast variabil aleatoare.

Valoarea medie (sperana matematic)

Definiia 2.3.1. Fie {, K, P} un cmp borelian de probabilitate i variabila
aleatoare X : R cu distribuia I i
p
x
X
i
i
e
|
|
.
|

\
|
, . Se numete valoare medie,
caracteristica numeric

e
=
I i
i i
p x X E ) ( .
Observaia 2.3.2.
1) Dac I este finit, valoarea medie exist.
2) Dac I este infinit numrabil, E(X) exist cnd seria care o
definete este absolut convergent.

Definiia 2.3.3. Fie{, K, P} un cmp borelian de probabilitate i variabila
aleatoare X : R de tip continuu
|
|
.
|

\
|
) x (
x
X , R x e . Se numete valoarea
medie a variabilei X, caracteristica numeric
}
+

=


(x)dx ) ( x X E . Valoarea
medie exist atunci cnd integrala improprie care o definete este convergent.

Propoziia 2.3.4.(proprietile valorii medii) Au loc afirmaiile :
1) R b a, b, E(X) a b) X ( e + = + a E
2) E(X + Y) = E(X) + E(Y)
3) X,Y independente E(X Y) = E(X) E(Y)

Demonstraie

37
a) Fie variabilele aleatoare de tip discret X, Y avnd repartiiile
J j
j
j
I i
i
i
q
y
Y
p
x
X
e e
|
|
.
|

\
|
|
|
.
|

\
|
,
1. Avem b X aE bp p ax p b ax b aX E
I i
i
I i
i i
I i
i i
+ = + = + = +

e e e
) ( ) ( ) (
dac variabila b aX + are repartiia
I i
i
i
p
b ax
b aX
e
|
|
.
|

\
| +
+ i 1 =

eI i
i
p .
2. Variabila X+Y are repartiia
J I j i
ij
j i
p
y x
Y X
e
|
|
.
|

\
| +
+
) , (
,
) , (
j i ij
y Y x X P p = = =
Rezult

) ( ) (
) ( ) (
Y E X E q y p x
p y p x p y x Y X E
J j
j j
I i
i i
I i J j
ij j
I i I i J j
ij i
J j
ij i i
+ = + =
= + = + = +


e e
e e e e e e

dac s-au folosit relaiile
j
I i
ij
q p =

e
i
i
J j
ij
p p =

e

3. Variabila XY are repartiia
J I j i
j i
j i
q p
y x
XY
e
|
|
.
|

\
|
) , (
dac X i Y sunt
independente.
Avem

e e e e
= = =
I i I i J j
j j i i
J j
j i j i
Y E X E q y p x q p y x XY E ) ( ) ( ) (

b) Presupunem ca X i Y sunt variabile aleatoare de tip continuu.
1. Dac notm prin Y = aX + b, a = 0, atunci se obine c
a
a
b x
x
X
Y
) (
) (

=

, pentru orice x e R.
Avem:
} }
+

+

= = = + dx
a
b x
x
a
dx x x Y E b aX E
Y Y
) (
1
) ( ) ( ) ( de unde prin
schimbarea de variabil u = (x b)/a, dx = adu, obinem
} } }
+

+

+

+ = + = + = + b X aE du u b du u u a du u b au b aX E
X X X
) ( ) ( ) ( ) ( ) ( ) (
2. Dac notm prin Z = X + Y, variabila care are densitatea de
probabilitate
Z
, iar densitatea de probabilitate a vectorului (X, Y) o notm prin
, atunci:
} } }
+

+

+

= = = + dx du u x u x dx x s Z E Y X E
Z
) ) , ( ( ) ( ) ( ) (

38
Schimbm ordinea de integrare, apoi schimbarea de variabil
x u = t, dx = dt, i obinem
} } } }
+

+

+

+

= + = = + du dt t u u t du dx u x u x Y X E ) ) , ( ) ( ( ) ) , ( ( ) (
} } } } } }
+

+

+

+

+

+

+ = + = + = ) ( ) ( ) ( ) ( ) ) , ( ( ) ) , ( ( X E Y E du u u dt t t du dt t u u dt du t u t
Z X


3. Dac notm prin V =X Y, care are densitatea de probabilitate
V
, iar
densitatea de probabilitate a vectorului (X, Y) o notam prin , atunci
} } }
+

+

+

= = = dx
u
dx
u
x
u x dx x x V E XY E
V
) ) , ( ( ) ( ) ( ) (

Schimbm ordinea de integrare, apoi facem schimbarea de variabil
x / u = t, dx = udt, i obinem:
} } } }
+

+

+

+

= = = du dt t u tu du dx
u
x
u
u
x
XY E ) ) , ( ( ) ) , ( ( ) (

} } } }
+

+

+

+

= = = ) ( ) ( ) ( ) ( ) ( ) ( Y E X E dt t t du u u dtdu t u tu
Y X Y X


Dispersia

Definiia 2.3.5. Fie {, K, P} un cmp borelian de probabilitate i variabila
aleatoare X : R. Se numete dispersia (variana) variabilei aleatoare X,
caracteristica numeric ( ) | |
2
) ( ) ( X E X E X Var = iar ) ( ) ( X Var X = o se
numete abatere medie ptratic.

n mod explicit, dispersia are expresia ( )

e
=
I i
i i
p X E x X Var
2
) ( ) ( ,
N I c , dac X este o variabil aleatoare discret sau
( )
}
=
R
dx x X M x X Var ) ( ) ( ) (
2
, dac X este o variabil aleatoare
continu.
Dispersia este un indicator numeric al gradului de mprtiere (sau de
dispersare) a valorilor unei variabile aleatoare n jurul valorii medii a acesteia.

Propoziia 2.3.6.(proprietile dispersiei)
a) | |
2 2
) ( ) ( ) ( X E X E X Var =
b) R b a, ), ( ) (
2
e = + X Var a b aX Var
c) X,Y independente ) ( ) ( ) ( Y Var X Var Y X Var + = +

Demonstraie

39
a)
( ) | | ( ) | |
| | | |
2 2 2 2
2 2 2
) ( ) ( ) ( ) ( ) ( 2 ) (
) ( ) ( 2 ) ( ) (
X E X E X E X E X E X E
X E X X E X E X E X E X Var
= + =
+ = =

dac s-a fcut un calcul formal.
b) Folosind proprietile valorii medii i definiia dispersiei avem:
| | ( ) | |
( ) | | ) ( ) (
) ( ) ) ( ( ) (
2 2 2
2 2 2
X Var a X E X E a
X E X a E b X aE b aX E b aX Var
= =
= = + = +

c) Dac X, Y sunt independente avem ) ( ) ( ) ( Y E X E XY E = . Calculm
( ) | | ( ) ( ) ( ) | |
( ) ( ) ( )( ) | |
( ) | | ( ) | | ( ) ( )
) ( ) (
) ( ) ( 2 ) ( ) (
) ( ) ( 2 ) ( ) (
) ( ) ( ) ( ) (
2 2
2 2
2 2
Y Var X Var
Y E Y E X E X E Y E Y E X E X E
Y E Y X E X Y E Y X E X E
Y E Y X E X E Y X E Y X E Y X Var
+ =
= + + =
= + + =
= + = + + = +

dac s-a inut seama c ( ) 0 ) ( = X E X E

Propoziia 2.3.7.(Inegalitatea lui Cebev) Dac variabila aleatoare X are
valoare medie i dispersie atunci 0 > c are loc inegalitatea
2
) (
1 ) ) ( (
c
c
X Var
X E X P > < sau inegalitatea echivalent cu aceasta
2
) (
) ) ( (
c
c
X Var
X E X P s > .

Demonstraie
Presupunem c X este o variabil aleatoare de tip continuu, avnd
densitatea de probabilitate ) (x . Atunci
} }
+

> =
D
dx x p X E x dx x X E x X Var ) ( )) ( ( ) ( )) ( ( ) (
2 2

unde { } c > = ) ( / X E x x D , deoarece c > ) ( X E x , avem c c >
2
)) ( ( X E x .
Deci, avem
} }
> = >
D D
X E X P dx x dx x X E x ) ) ( ( ) ( ) ( )) ( (
2 2 2
c c c
Am obinut c ) ) ( ( ) (
2
c c > > X E X P X Var , rezult
2
) (
) ) ( (
c
c
X Var
X E X P s >
Folosind probabilitatea evenimentului contrar se obine i cealalt form a
inegalitii:
2
) (
1 ) ) ( ( 1 ) ) ( (
c
c c
X Var
X E X P X E X P > > = <

Aplicaia 2.3.8. Dac X este o variabil aleatoare discret

40
|
|
.
|

\
|
12
1
12
1
12
5
12
2
12
2
12
1
3 2 1 0 1 2
: X
atunci deducem c:
2
1
12
1
3
12
1
2
12
5
1
12
2
0
12
2
1
12
1
2 ) ( = + + + + = X E
2
12
1
9
12
1
4
12
5
1
12
2
0
12
2
1
12
1
4 ) (
2
= + + + + + = X E
| |
4
7
4
1
2 ) ( ) ( ) (
2 2
= = = X E X E X Var
2
7
) ( ) ( = = X Var X o
Aplicaia 2.3.9. Dac X este variabil aleatoare continu
|
|
.
|

\
|
) (
:
x
x
X

,
| |

e
=
rest n , 0
3 , 1 ,
4
) (
x
x
x
atunci deducem c:
6
13
12
) ( ) (
3
1
3
3
1
= = =
}
x
dx x x X E , 5
16
) ( ) (
3
1
4
3
1
2 2
= = =
}
x
dx x x X E
| |
36
11
36
169
5 ) ( ) ( ) (
2 2
= = = X E X E X Var
6
11
) ( ) ( = = X Var X o





Momente

Definiia 2.3.10. Fie {, K, P} un cmp borelian de probabilitate i variabila
aleatoare X : R. Se numete moment iniial (obinuit) de ordin k al
variabilei aleatoare X, caracteristica numeric ) (
k
k
X E m =

Observaia 2.3.11. a) Pentru k=1 avem ) (
1
X E m = iar pentru k=2,
2
1 2
) ( m m X Var =
b) Dac X este variabil de tip discret avnd repartiia
I i
i
i
p
x
X
e
|
|
.
|

\
|
: ,

e
=
I i
i
p 1 atunci

e
=
I i
i
k
i k
p x m

41
c) Dac X este variabil de tip continuu
R x
x
x
X
e
|
|
.
|

\
|
) (
:

atunci
}
=
R
k
k
dx x x m ) (

Definiia 2.3.12. Se numete moment centrat de ordin k al variabilei aleatoare
X, caracteristica numeric ( ) | |
k
k
X E X E ) ( = , adic

( )
( )


=
}

e
continu X , ) ( ) (
discret X , ) (
R
k
i
i
k
I i
i
k
dx x X E x
p X E x



Observaia 2.3.13. Pentru k=1 avem 0
1
= , iar pentru k=2, ) (
2
X Var =

Teorema 2.3.14. ntre momentele centrate i momentele iniiale exist
urmtoarea relaie:
i
i k
i
k
k
i
i
k
m m C
1
0
) 1 (

=

= .
Demonstraie
Avem
( ) | | ( ) | |

= =

= =
(

=
= |
.
|

\
|
= = =
k
i
k
i
i
i k
i
k
i i i k i
k
i
k
i
i i k i
k
i
k
i
i i k i
k
k k
k
m m C m X E C m X C E
m X C E m X E X E X E
0 0
1 1
0
1
0
1 1
) 1 ( ) ( ) 1 ( ) 1 (
) ( ) (


Observaia 2.3.15. n statistica matematic se utilizeaz de regul primele patru
momente centrate:
4 3 2 1
, , , .
Definiia 2.3.16. Se numete momentul iniial de ordinul (r,s) al vectorului
aleator (X,Y) caracteristica numeric ) (
s r
rs
Y X E m = , adic

=
}}

e e
continuu Y) (X, , ) , (
discret ) , ( ,
2
r
i
R
s r
I i J j
ij
s
j
rs
dxdy y x y x
Y X p y x
m



Definiia 2.3.17. Se numete moment centrat de ordin (r,s) al vectorului aleator
(X,Y), caracteristica numeric
| |
s r
rs
Y E Y X E X E ) ( ( )) ( ( = , adic


42
( ) ( )
( ) ( )



=
}}

e e
continuu Y) (X, , ) , ( ) ( ) (
discret ) , ( , ) ( ) (
2
R
s r
I i J j
ij
s
j
r
i
rs
dxdy y x Y E y X E x
Y X p Y E y X E x



Observaia 2.3.18.
) ( ), ( ), ( ), (
2 0 0 2 1 0 o 1
Y Var X Var Y E m X E m = = = =

Corelaie sau covarian

Definiia 2.3.19. Se numete corelaia sau covariana variabilelor aleatoare X i
Y, caracteristica numeric
( )( ) | |
1 1
Y) C(X, adic ) ( ) ( ) , ( = = Y E Y X E X E Y X C

Observaia 2.3.20.
1)
01 10 11
Y) C(X, ), ( ) ( ) ( ) , ( m m m Y E X E XY E Y X C = =
Dac X, Y independente 0 ) Y , X ( C = , dar nu i reciproc.
) ( ) , ( X Var X X C =
( )

= = = =
=
|
|
.
|

\
|
m
i
n
j
j i j i
n
j
j j
m
i
i i
Y X C b a Y b X a C
1 1 1 1
, ,
, oricare ar fi variabilele
aleatoare X
i
i Y
j
i oricare ar fi constantele reale a
i
i b
j
, m i s s 1 , n j s s 1
) , ( ) , ( X Y C Y X C = , oricare ar fi X i Y.

Definiia 2.3.21. Se numete coeficient de corelaie relativ la variabilele
aleatoare X i Y caracteristica numeric
r(X, Y)=
) ( ) (
) , (
Y Var X Var
Y X C


Observaia 2.3.22.
1) X, Y independente 0 ) Y , X ( r = reciproc nu este adevrat;
2) Spunem c X,Y sunt necorelate dac r(X,Y) =0
Proprieti:
a) 1 ) Y , X ( r s
b) 0 b, X 1 ) , ( > + = + = a a Y Y X r
c) 0 , 1 ) , ( < + = = a b aX Y Y X r

Observaia 2.3.23. n practic se mai spune c:
1) X i Y sunt pozitiv perfect corelate dac 1 ) , ( = Y X r ;
2) X i Y sunt negativ perfect corelate dac 1 ) , ( = Y X r ;
3) X i Y sunt puternic pozitiv (sau negativ) corelate dac

43
1 ) , ( 75 , 0 < s Y X r (sau 75 , 0 ) , ( 1 s < Y X r );
4) X i Y sunt slab pozitiv (sau negativ) corelate dac 25 , 0 ) , ( 0 < < Y X r
(sau 0 ) , ( 25 , 0 < < Y X r );
Marginile valorice decizionale fiind alese convenional.

Aplicaia 2.3.24. Fie (X,Y) un vector aleator discret a crui repartiie
probabilist este dat de tabelul de mai jos.
Calculai coeficientul de corelaie r(X,Y).
Y
X
-1 0 1 2 p
i
-1 1/6 1/12 1/12 1/24 9/24
0 1/24 1/6 1/12 1/24 8/24
1 1/24 1/24 1/6 1/24 7/24
q
j
6/24 7/24 8/24 3/24 1

Rezolvare
Pe baza formulelor corespunztoare, deducem imediat:
12
1
24
2
24
7
1
24
8
0
24
9
1 ) ( = = + + = X E
3
2
24
16
24
7
1
24
8
0
24
9
1 ) (
2
= = + + = X E
144
95
144
1
3
2
)] ( [ ) ( ) (
2 2
= = = X E X E X Var
3
1
24
8
24
3
2
24
8
1
24
7
0
24
6
1 ) ( = = + + + = Y E
12
13
24
26
24
3
4
24
1
1
24
7
0
24
6
1 ) (
2
= = + + + = Y E
36
35
9
1
12
13
)] ( [ ) ( ) (
2 2
= = = Y E Y E Y Var

24
5
24
1
2
6
1
1
24
1
0
24
1
1 1
24
1
2
12
1
1
6
1
0
24
1
1 0
24
1
2
12
1
1
12
1
0
6
1
1 1 ) (
= |
.
|

\
|
+ + + +
+ |
.
|

\
|
+ + + + |
.
|

\
|
+ + + = XY E

72
17
36
1
24
5
) ( ) ( ) ( ) , ( = + = = Y E X E XY E Y X C
295 , 0
36
35
144
95
12
17
) ( ) (
) , (
) , ( ~

= =
Y Var X Var
Y X C
Y X r


44
Observaia 2.3.25. Coeficientul de corelaie ) , ( Y X r reprezint prima msur a
corelaiei sau gradului de dependen n sens clasic. Introdus de ctre
statisticianul englez K. Pearson n anul 1901 ca rod al colaborrii acestuia cu
antropologul englez F. Galton (care a avut prima idee de msurare a corelaiei
sub denumirea de variaie legat), aceast msur a gradului de dependen a
fost criticat nc de la apariiei ei pentru diverse motive, printre care i aceea
c:
1) este dependent de valorile vectorului aleator ) , ( Y X i ca urmare nu
este aplicabil pentru cazul variabilelor aleatoare necantitative;
2) nu este precis n cazul independenei i al necorelrii deoarece
dac 0 ) , ( = Y X r nu exist un rspuns categoric (n sensul
independenei sau necorelrii);
3) nu poate fi extins la mai mult de dou variabile aleatoare sau chiar
la doi sau mai muli vectori aleatori, fapte cerute de practic.
Dac la prima obiecie a dat chiar K. Pearson un rspuns, pentru
celelalte dou obiecii nu s-au dat rspunsuri clare dect dup apariia n 1948
a teoriei matematice a informaiei, rezultate remarcabile n acest sens obinnd
coala romneasc de matematic sub conducerea lui Silviu Guiau introducnd
msurile entropice ale dependenei dintre variabile aleatoare i vectori aleatori
(n anii 1974-1978) cu o larg aplicabilitate teoretic i practic.
n ciuda tuturor criticilor ce i s-au adus, coeficientul de corelaie clasic
(sau coeficientul Galton-Pearson) este cel mai frecvent utilizat n practic i,
pentru c este cel mai simplu n utilizare.

Definiia 2.3.26. Fiind dat vectorul aleator ( )
n
X X X Z ,..., ,
2 1
=
n
R E Z : , se
numete valoare medie a acestuia i se noteaz cu ) (Z E , dac exist, vectorul
n-dimensional ale crui componente sunt valorile medii ale componentelor lui Z
adic:
( ) ) ( ),..., ( ), ( ) ,..., , ( ) (
2 1 2 1 n n
X E X E X E X X X E Z E = = .
Se numete matrice de covarian (sau de corelaie) a vectorului Z i se
noteaz prin ) (Z C , dac exist, matricea ( ) ( ) ( )
n j i
j i
n j
n i
ij
Y X C c Z C
, 1 ,
, 1
, 1 , ) (
=
=
= = =

Observaia 2.3.27.
a) Pentru cazul unui vector aleator bidimensional, a nu se face confuzie
ntre media produsului componentelor X i Y, care este ) ( XY E i
media vectorului ) , ( Y X care este ) , ( Y X E .
b) Uneori matricea de corelaie ) (Z C se mai noteaz i cu ) (Z I .
c) Desfurat matricea de covarian ) (Z C are forma:

45
|
|
|
|
|
.
|

\
|
=
) ( ... ) , ( ) , (
... ... ... ...
) , ( ... ) ( ) , (
) , ( ... ) , ( ) (
) (
2 1
2 2 1 2
1 2 1 1
n n n
n
n
X Var X X C X X C
X X C X Var X X C
X X C X X C X Var
Z C
i ca urmare a proprietilor corelaiei, constatm c matricea ) (Z C este
simetric.
d) Pornind de la definiia coeficientului de corelaie i de la matricea
de corelaie, dac toate componentele lui Z sunt neconstante, atunci
putem introduce matricea coeficienilor de corelaie ) (Z R a crei
form dezvoltat este:
|
|
|
|
|
.
|

\
|
=
1 ... ) , ( ) , (
... ... ... ...
) , ( ... 1 ) , (
) , ( ... ) , ( 1
) (
2 1
2 1 2
1 2 1
X X r X X r
X X r X X r
X X r X X r
Z R
n n
n
n

Ambele forme ale matricei de corelaie a vectorului aleatoriu Z
reprezint de fapt tabele ale msurrii gradului de dependen dintre
componentele lui Z, considerate dou cte dou.

Aplicaia 2.3.28. Fie variabilele aleatoare:
|
|
.
|

\
|
2 1
1
1 1
:
p p
X ;
|
|
.
|

\
|
2 1
2
3 1
:
q q
X ;
|
|
.
|

\
|
2 1
3
4 2
:
r r
X
a cror repartiie comun notat ) (
ijk
p , 2 , , 1 s s k j i , este:
16
1
111
= p ;
16
1
112
= p ;
32
1
121
= p ;
32
3
122
= p ;
8
1
211
= p ;
4
1
212
= p ;
16
1
221
= p ;
16
5
222
= p .
S se determine repartiiile bidimensionale i unidimensionale ale
vectorului aleator tridimensional ( )
3 2 1
, , X X X Z = i matricele de corelaie
) (Z C i ) (Z R .
Rezolvare
Avem imediat repartiiile bidimensionale

= + =
= + =
-
-
8
3
8
1
212 211 21
112 111 11
p p p
p p p
;

= + =
= + =
-
-
8
3
8
1
222 221 22
122 121 12
p p p
p p p
pentru ( )
2 1
, X X

= + =
= + =
-
-
16
8
32
3
221 211 1 2
121 111 1 1
p p p
p p p
;

= + =
= + =
-
-
16
9
32
5
222 212 2 2
122 112 2 1
p p p
p p p
pentru ( )
3 1
, X X

46

= + =
= + =
-
-
32
3
16
3
221 121 21
211 111 11
p p p
p p p
;

= + =
= + =
-
-
32
13
32
5
222 122 22
212 112 12
p p p
p p p
pentru ( )
3 2
, X X
i ca urmare putem scrie urmtoarele tabele de repartiie bidimensionale:
X
2
X
1
1 3 p
i

X
3
X
1
2 4 p
i

X
3
X
2
2 4 q
i

-1 1/8 1/8 -1 3/32 5/32 1/4 1 3/16 5/16 1/2
1 3/8 3/8 1 3/16 9/16 3/4 3 3/32 13/32 1/2
q
j
1/2 1/2 1 r
k
9/32 23/32 1 r
k
9/32 21/32 1

din care se observ i repartiiile unidimensionale (repartiiile variabilelor
aleatoare considerate X
1
, X
2
, X
3
). Din aceste tabele deducem prin calcul imediat:
2
1
) (
1
= X E ; 1 ) (
2
1
= X E ;
4
3
) (
1
= X Var
2 ) (
2
= X E ; 5 ) (
2
2
= X E ; 1 ) (
2
= X Var
16
55
) (
3
= X E ;
8
101
) (
2
3
= X E ;
256
207
) (
3
= X Var
1 ) (
2 1
= X X E ; 1 ) ( ) (
2 1
= X E X E ; 0 ) , (
2 1
= X X C ; 0 ) , (
2 1
= X X r
16
29
) (
3 1
= X X E ;
32
55
) ( ) (
3 1
= X E X E ;
32
3
) , (
3 1
= X X C ; 12 , 0
207
3
) , (
3 1
~ = X X r
16
113
) (
3 2
= X X E ;
8
55
) ( ) (
3 2
= X E X E ;
16
3
) , (
3 2
= X X C ; 21 , 0
207
3
) , (
3 2
~ = X X r
i ca urmare putem scrie matricele de corelaie:
|
|
|
.
|

\
|
=
256 207 16 3 32 3
16 3 1 0
32 3 0 4 3
) (Z C i
|
|
|
.
|

\
|
=
1 21 , 0 12 , 0
21 , 0 1 0
12 , 0 0 1
) (Z R
constatnd c X
1
i X
2
sunt independente n timp ce ntre X
3
i X
1
sau X
3
i X
2

exist o anumit dependen chiar dac nu este puternic.

Alte caracteristici numerice

Definiia 2.3.29. Se numete mediana unei variabile aleatoare X, caracteristica
numeric M
e
care verific relaia:
) (
2
1
) (
e e
M X P M X P s s > >


47
Observaia 2.3.30. 1. Dac F este funcia de repartiie i este continu atunci
e
M se determin din ecuaia F(M
e
)
2
1
= .
2. Dac ] , ( b a M
e
e atunci se ia
2
b a
M
e
+
=

Definiia 2.3.31. Se numete valoare modal sau modul a variabilei aleatoare X
orice punct de maxim local al distribuiei lui X (n cazul discret) respectiv al
densitii de probabilitate (n cazul continuu).

Observaia 2.3.32. Dac exist un singur punct de maxim local spunem c legea
lui X este unimodal altfel o numim plurimodal.

Definiia 2.3.33. Se numete asimetria (coeficientul lui Fischer) variabilei
aleatoare X caracteristica numeric definit prin
3
3
o

= s .

Definiia 2.3.34. Se numete exces al variabilei aleatoare X, caracteristica
numeric definit prin 3 e
4
4

= .

Observaia 2.3.35.
1) Dac e<0 atunci graficul distribuiei are un aspect turtit i legea se
numete platicurtic.
2) Dac e>0 atunci graficul distribuiei are un aspect ascuit i legea va
fi numit leptocurtic.
3) Dac e = 0 atunci repartiiile sunt mezocurtice.

Definiia 2.3.36. Dac X este o variabil aleatoare cu funcia de repartiie
) (x F , se numesc cuartile (n numr de trei) ale lui X (sau ale repartiiei lui X)
numerele
1
q ,
2
q i
3
q cu proprietile:

> +
s
4
1
) 0 (
4
1
) (
1
1
q F
q F

> +
s
2
1
) 0 (
2
1
) (
2
2
q F
q F

> +
s
4
3
) 0 (
4
3
) (
3
3
q F
q F

Observm c
e
M q =
2
.

Exemplul 2.3.37. Se consider variabila aleatoare
|
|
.
|

\
|
5 , 0 3 , 0 2 , 0
2 0 1
: X .
S se calculeze: E(X), E(3X), E(4X-2),
X
X Var o ), ( .


48
Rezolvare
8 , 0 5 , 0 2 3 , 0 0 2 , 0 1 ) (
3
1
= + + = =

= i
i i
p x X E
4 , 3 8 , 0 3 ) ( 3 ) 3 ( = = = X E X E ; 2 , 1 2 8 , 0 4 2 ) ( 4 ) 2 4 ( = = = X E X E
| | 56 , 1 64 , 0 2 , 2 ) ( ) ( ) (
2 2
= = = X E X E X Var ;
2 , 2 5 , 0 2 3 , 0 0 2 , 0 ) 1 ( ) (
2 2 2 2
= + + = X E ; 24 , 1 56 , 1 ) ( = = = X Var
X
o

Exemplul 2.3.38. S se calculeze valoarea medie i dispersia variabilei
aleatoare care are densitatea de probabilitate

e
=
altfel 0,
(0,2) x dac , x 1 1
) x (
Rezolvare
Observm c:

< <
s <
=
altfel 0,
2 x 1 dac x, - 2
1 x 0 dac , x
) x (
innd seama de definiie avem:
1
3 3
) 2 ( (x)dx ) (
2
1
3
2
1
2
1
0
3
2
1
1
0
2


= + = + = =
} } }
+

x
x
x
dx x x dx x x X E
6
7
4 3
2
4
) 2 ( ) ( ) (
2
1
4
2
1
3
1
0
4
2
1
2
1
0
3


2 2
= + = + = =
} } }
+

x x x
dx x x dx x dx x x X E
| |
6
1
1
6
7
) ( ) ( ) (
2 2
= = = X E X E X Var

Exemplul 2.3.39. Fie vectorul aleator (X,Y) cu densitatea de probabilitate

e e + +
=
rest n , 0
] 2 , 0 [ y ], 1 , 0 [ x ), 1 y x ( k
) y , x ( Se cere:
a) s se determine constanta k;
b) s se determine densitile marginale;
c) s se cerceteze dac X i Y sunt independente sau nu;
d) s se calculeze coeficientul de corelaie ntre X i Y.

Rezolvare
a) din condiiile 0 k 0 ) y , x ( > >
5 1 1 ) 1 ( ) , (
1
0
2
0




= = + + =
} } } }
+

+

k dy y x dx k dxdy y x .
Deci

e e + +
=
rest n 0,
[0,2] y [0,1], x ), 1 y x (
5
1
) y , x (

49
b) ] 1 , 0 [ x ,
5
4 x 2
dy ) 1 y x (
5
1
dy ) y , x ( ) x (
2
0


X
e
+
= + + = =
} }
+

e
+
=
altfel , 0
] 1 , 0 [ x ,
5
4 x 2
) x (
X

] 2 , 0 [ y ,
10
3 y 2
dx ) 1 y x (
5
1
dx ) y , x ( ) y (
1
0


y
e
+
= + + = =
} }
+

e
+
=
altfel , 0
] 2 , 0 [ y ,
10
3 y 2
) y (
Y

c) X i Y nu sunt independente deoarece: ) y ( ) x ( ) y , x (
Y X
=
d)
15
8
) 4 2 (
5
1
) ( ) , ( ) (
1
0






= + = = =
} } } }
+

+

+

dx x x dx x x dxdy y x x X E
X

15
17
) 3 2 (
10
1
) ( ) , ( ) (
2
0






= + = = =
} } } }
+

+

+

dy y y dy y y dxdy y x Y E
Y

30
11
) 4 2 (
5
1
) ( ) ( ) (
1
0
2


2 2
2 X
= + = = =
} }
+

dx x x dx x x X E X m
15
8
) 3 2 (
10
1
) ( ) ( ) (
2
0
2


2 2
2
= + = = =
} }
+

dy y y dy y y Y E Y m
Y

Deci | |
450
37
225
64
30
11
) ( ) ( ) (
2 2
= = = X E X E X Var
| |
225
71
225
289
5
8
) ( ) ( ) (
2 2
= = = Y E Y E Y Var
225
1
15
12
15
8
15
9
) ( ) ( ) ( ) , (
15
9
3
14
2
5
1
) 1 (
5
1
y)dxdy (x, ) (
1
0
2
2
0
1
0



= =
= = = |
.
|

\
|
+ =
= + + = =
}
} } } }
+

+

Y E X E XY E Y X C dx x x
dy y x xy dx xy Y X E
.
Se obine: 02758 , 0
225
71
450
37
225
1
) , (
) , ( =

=
Y X
Y X C
Y X r
o o


Exemplul 2.3.40. Se tie c, dac dou variabile aleatoare X i Y sunt
independente, atunci coeficientul lor de corelaie este nul. Reciproca nu este
adevrat. Iat un vector aleator discret (X,Y), n care X i Y sunt dependente i
totui 0 = r .


50




16
1

16
2

16
3



16
2
0
16
2



16
1

16
2

16
3




Rezolvare
Calculm repartiiile marginale:
|
|
.
|

\
|
16 6 16 4 16 6
2 1 0
: X ;
|
|
.
|

\
|
16 8 16 4 16 4
2 1 1
: Y
Avem:
2
3
;
4
3
) ( ;
4
7
) ( ; 1 ) (
2
= = = =
X
X Var X E X E o
2
10
;
2
3
) ( ;
2
5
) ( ; 1 ) (
2
= = = =
Y
Y Var Y E Y E o
|
|
.
|

\
|

16
3
16
4
16
6
16
2
16
1
4 2 0 1 2
: Y X , E(XY)=1
0
2
10
2
3
1 1 E(X)E(Y) - Y) E(X
=

=
Y X
r
o o


Exemplul 2.3.41. Fie X o variabil aleatoare care are densitatea de
probabilitate definit prin:

e
e
=
) 2 , 0 ( x , 2 / 1
) 2 , 0 ( x , 0
) x ( .
a) S se determine modulul i mediana
b) S se calculeze momentul de ordin k, ) (x m
k
..

Rezolvare
a) Conform definiiei, M
0
este valoarea pentru care . max ) x ( adic
) 2 , 0 ( M
0
e adic exist o infinitate de valori modale situate pe segmentul (0,2).
M
e
se determin din ecuaia
2
1
) ( =
e
M F .
Y
-1 1 2
X
0


1


2

51
Cum 1
2
) ( ) ( ) (

0
= = = s =
}
e
e
M
e e
M
M
dx x M X P M F
e
.
b)
}
+

+
= = =


1
2
2
1
) ( ) (
k
k
dx x X E X m
k k
k
.


2.4. Funcia caracteristic. Funcia generatoare de momente

Definiia 2.4.1. Fie cmpul de probabilitate { } P K, , O i variabilele aleatoare X
i Y definite pe cu valori reale. Se numete variabil aleatoare complex
iY X Z + = , 1
2
= i , iar valoarea medie a acesteia notat cu ) (Z E este dat de
relaia ) ( E ) ( ) ( Y i X E Z E + = dac mediile ) ( X E i ) (Y E exist.

Observaia 2.4.2. Dac X este o variabil aleatoare expresia
tX i tX e
itX
sin cos + = , R t e definete de asemenea o variabil aleatoare i
1 sin cos
2 2
2
= + = tX tX e
itX


Definiia 2.4.3. Fie X o variabil aleatoare real. Se numete funcia
caracteristic a lui X o funcie C R
X
: dat de relaia
) ( ) ( ) (
itX
X
e E t t = = , care explicit poate fi scris sub forma

=
}

e
continuu tip de este , ) (
discret tip de este ,
) (
R
itx
K k
itx
k
X
dx x e
e p
t
k



Propoziia 2.4.4. Funcia caracteristic are urmtoarele proprieti:
1) 1 ) 0 ( = i R t t e s , 1 ) (
2) Dac X
j
, m j , 1 = sunt variabile aleatoare independente n totalitate
cu funciile caracteristice ( ) m 1, j ), ( ) ( = = t t
j X
j
, atunci funcia caracteristic
a variabilei aleatoare sum
m
X X X X + + + = ...
2 1
este
[
=
= =
m
j
j m X
t t t t t
1
2 1
) ( ) ( ... ) ( ) ( ) (
3) Dac b aX Y + = , a i b e R, atunci
itb
X Y
e at t ) ( ) ( =
4) Dac X admite momente iniiale de orice ordine atunci funcia
caracteristic admite derivate de orice ordin i are loc relaia
) 0 (
1
) ( ) (
) (r
X r
r
r
i
X E X m = =

Demonstraie

52
1) 1 ) 1 ( ) 0 ( = = E i
1 ) ( = = s =

e e e K k
k
K k
itx
k
K k
itx
k
p e p e p t
k
dac X este de tip discret i
1 ) ( ) ( ) ( ) ( = = s =
} } }
R R
itx
R
itx
dx x dx x e dx x e t dac X este de tip continuu.
2) Avnd n vedere proprietile valorii medii, putem scrie c
[ [
= =
= = = =
m
j
j
m
j
itX itX itX itX itX
X
t e E e e e E e E t
j m
1 1
) ( ) ( ) ... ( ) ( ) (
2 1

3) Tot ca urmare a proprietilor mediei avem:
) ( ) ( ) ( ) ( ) ( at e t e e e E e E t
X
itb
aX
itb itb itaX itY
Y
= = = =
4) Observm c ) ( ) ( ) (
) ( itX r r r itx r r
X
e X E i i e X E t = = i rezult
) ( ) ( ) 0 (
) (
X m i X E i
r
r r r r
X
= = .q.e.d

Observaia 2.4.5. Folosirea relaiei de la punctul 4) este recomandabil doar
atunci cnd calcularea momentelor este mai comod prin aceast relaie dect
pornind direct de la definiia acestora.

Aplicaia 2.4.6.
1) Dac
|
|
.
|

\
|
3 1 2 1 6 1
1 0 1
: X atunci

6
3 2
3
1
2
1
6
1
) (
+ +
= + + =

it it
it it
e e
e e t
2) Dac
|
|
.
|

\
|
x
x
X
2
: , | | 1 , 0 e x atunci
itx itx
e
e
ix
dx xe t
2
1
0
2 2
2 ) (

= =
}

3) Dac
|
|
.
|

\
|
x
e
x
X : , 0 > x atunci
2
0
1
1
) (
t
it
dx e e t
itx x
+
+
= =
}



Definiia 2.4.7. Fie X o variabil aleatoare real definit pe cmpul de
probabilitate { } P K, , O . Se numete funcie generatoare de momente, dac
exist, funcia R R G : , dat de relaia ) ( ) ( ) (
tX
X
e E t G t G = = care explicit
poate fi scris sub forma

=
}

e
continuu tip de este X , ) (
discret tip de este X ,
) (
R
dx x e
e p
t G
tx
K k
tx
k
k


cu condiia existenei expresiilor corespunztoare.

Propoziia 2.4.8. Funcia generatoare de momente are urmtoarele proprieti:

53
1) 1 ) 0 ( = G
2) Dac X
j
, m j s s 1 , sunt independente n totalitate i au funciile
generatoare ) (t G
j
, m j , 1 = , atunci funcia generatoare a variabilei aleatoare
m
X X X X + + + = ...
2 1
este
[
=
=
m
j
j X
t G t G
1
) ( ) (
3) Dac b aX Y + = , a i b e R, atunci
tb
X Y
e at G t G = ) ( ) (
4) Dac X admite momente iniiale de orice ordin, atunci funcia
generatoare admite derivate de orice ordin n punctul zero i
) ( ) ( ) 0 (
) (
X m X E G
r
r r
X
= = , ... , 2 , 1 = r
Aplicaia 2.4.9.
1) Dac
|
|
.
|

\
|
3 2 12 1 6 1
1 0 1
: X atunci
6
3 2
3
1
2
1
6
1
) (
+ +
= + + =


t t
t t
e e
e e t G
2) Dac
|
|
.
|

\
|
x
e
x
X


: , 0 > x , 0 > atunci
t
dx e e t G
tx x

= =
}


0
) ( , dac < t
iar n caz contrar nu exist.
3) Dac
n k
k n k k
n
q p C
k
X
, 0
:
=
|
|
.
|

\
|
, 0 , > q p , 1 = + q p , atunci
n t
n
k
tk k n k k
n
q pe e q p C t G ) ( ) (
0
+ = =


1 '
) ( ) (

+ =
n t t
q pe npe t G ;
2 2 2 1 ' '
) ( ) 1 ( ) ( ) (

+ + + =
n t t n t t
q pe e p n n q pe npe t G
) ( ) 0 (
'
X E np G = = ; ) ( ) 0 (
2 2 2 ' '
X E npq p n G = + =

2.5. Probleme rezolvate

Aplicaia 2.5.1. Fie variabilele aleatoare independente :
|
|
.
|

\
|
4 / 1 4 / 1 2 / 1
2 1 0
: X i
|
|
.
|

\
|
2 / 1 6 / 1 3 / 1
2 1 1
: Y .
S se scrie variabilele aleatoare : 2X, Y
2
, X+Y, XY, 2X+3Y, X/Y,
max(X,Y), X .

Rezolvare

54
Probabilitile corespunztoare valorilor lui 2X, Y
2
, X sunt aceleai
cu cele corespunztoare lui X i respectiv Y. Avem:
|
|
.
|

\
|
4 / 1 4 / 1 2 / 1
4 2 0
: 2X ,
|
|
.
|

\
|
4 / 1 4 / 1 2 / 1
2 1 0
: X ,
|
|
.
|

\
|
2 / 1 2 / 1
4 1
:
2
Y .
2
1
6
1
3
1
) 1 ( ) 1 ( ) 1 1 ( ) 1 (
2
= + = = + = = = v = = = Y P Y P Y Y P Y P .
Deoarece X i Y sunt independente avem c p
ij
= p
i
q
j
,1 i, j 3 . De exemplu
12
1
6
1
2
1
) 1 ( ) 0 ( ) 1 , 0 (
12
= = = = = = = = Y P X P Y X P p . Obinem

|
|
.
|

\
| + + + + + +
+
8 / 1 24 / 1 12 / 1 8 / 1 24 / 1 12 / 1 4 / 1 12 / 1 6 / 1
2 2 1 2 1 2 2 1 1 1 1 1 2 0 1 0 1 0
: Y X
adic
|
|
.
|

\
|
+
8 / 1 6 / 1 24 / 7 6 / 1 12 / 1 6 / 1
4 3 2 1 0 1
: Y X .
Analog
|
|
.
|

\
|

8 / 1 24 / 1 12 / 1 8 / 1 24 / 1 12 / 1 4 / 1 12 / 1 6 / 1
2 2 1 2 ) 1 ( 2 2 1 1 1 ) 1 ( 1 2 0 1 0 ) 1 ( 0
: Y X
de unde

|
|
.
|

\
|

8 / 1 6 / 1 24 / 1 2 / 1 12 / 1 12 / 1
4 2 1 0 1 2
: Y X .
Cum 2X i 3Y au repartiiile

|
|
.
|

\
|
4 / 1 4 / 1 2 / 1
4 2 0
: 2X ,
|
|
.
|

\
|
2 / 1 6 / 1 3 / 1
6 3 3
: 3Y ,
obinem repartiia lui 2X + 3Y :
|
|
.
|

\
|
+
8 / 1 8 / 1 24 / 1 4 / 1 24 / 1 12 / 1 12 / 1 12 / 1 6 / 1
10 8 7 6 5 3 1 1 3
: 3 2 Y X .
La fel obinem:

|
|
.
|

\
|
24 / 1 6 / 1 8 / 1 2 / 1 12 / 1 12 / 1
2 1 2 / 1 0 1 2
:
Y
X
,

|
|
.
|

\
|
8 / 5 24 / 5 6 / 1
2 1 0
: ) , max( Y X .

Aplicaia 2.5.2. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comun (p
ij
) i marginale (p
i
) i (q
j
) sunt date n tabelul urmtor :
X \ Y -1 0 1 p
i

-1 1/8 1/12 1/6 3/8
1 1/24 1/4 1/3 5/8
q
j
1/6 1/3 1/2 1

55
a) S se scrie variabilele aleatoare X i Y.
b) S se precizeze dac X i Y sunt independente.
c) S se scrie variabilele X + Y , X Y, X
2
, Y
2
, Y/X .

Rezolvare
a)Din tabelul de repartiie de mai sus deducem c
|
|
.
|

\
|
8 / 5 8 / 3
1 1
: X i
|
|
.
|

\
|
2 / 1 3 / 1 6 / 1
1 0 1
: Y .
b)Dac X i Y ar fi independente atunci
) 1 ( ) 1 ( ) 1 , 1 (
1 1 11
= = = = = = = Y P X P q p Y X P p ,
ceea ce nu are loc ntruct
6
1
8
3
8
1
= .
c)Deoarece
3
1
,
4
1
,
24
1
,
6
1
,
12
1
,
8
1
23 22 21 13 12 11
= = = = = = p p p p p p ,
obinem
|
|
.
|

\
|
+

+
3 / 1 4 / 1 24 / 1 6 / 1 12 / 1 8 / 1
2 1 0 1 2
: Y X ,
|
|
.
|

\
|
+ + +

3 / 1 8 / 1 4 / 1 12 / 1 24 / 1 6 / 1
1 0 1
: Y X ,
|
|
.
|

\
|
+ + +

3 / 1 8 / 1 4 / 1 12 / 1 6 / 1 24 / 1
1 0 1
:
Y
X
.
Repartiiile lui X
2
i Y
2
rezult imediat din cele ale lui X i Y:
|
|
.
|

\
|
1
1
:
2
X ,
|
|
.
|

\
|
3 / 2 3 / 1
1 0
:
2
Y .
Aplicaia 2.5.3. Fie variabila aleatoare discret
|
|
.
|

\
|
2 2 2
3 3 3 2 1
:
p p p p p
X .
a) S se determine p.
b) S se calculeze funcia de repartiie a lui X.
c) S se calculeze probabilitile:
). 4 2 3 5 , 1 ( ), 8 , 2 1 , 3 (
), 1 , 2 ( ), 2 , 3 5 , 1 ( ), 4 ( ), 3 ( ), 1 (
< < s < > <
> < < > < <
X X P X X P
X P X P X P X P X P


Rezolvare
a) Trebuie s avem p + p
2
+ p + p
2
+ p
2
= 1 i p 0. Rezult
3p
2
+ 2p = 1 i p 0, adic p = 1/3.
b) Cum F(x) = P(Xsx) rezult c F(x) = 0 dac x 1,
F(x) = p = 1/3 dac x ] 2 , 1 ( e ,
F(x) = P(X=1) + P(X=2) = p + p
2
= 4/9 dac x ] 3 , 2 ( e ,

56
F(x) = P(X=1) + P(X=2) + P(X=3) = p + p
2
+ p = 7/9 dac x ] 4 , 3 ( e ,
F(x) = P(X=1) + P(X=2) + P(X=3) + P(X=4) = p + p
2
+ p + p
2
= 8/9
dac x ] 5 , 4 ( e i F(x) = 1 dac x > 5 .
Deci :

>
s <
s <
s <
s <
s
=
. 5 , 1
; 5 4 ,
9
8
; 4 3 ,
9
7
; 3 2 ,
9
4
; 2 1 ,
3
1
; 1 , 0
) (
x
x
x
x
x
x
x F
c) Avem
P(X<1) = P() = 0, P(X<3)=P(X=1)+P(X=2)=4/9,
P(X>4)=P(X=5)=1/9, P(1,5<X<3,2)=P(X=2)+P(X=3)=4/9,
P(X2,1)=P(X=3)+P(X=4)+P(X=5)=5/9,

5
2
2
2
) 8 , 2 (
) 1 , 3 (
) 8 , 2 (
) 8 , 2 , 1 , 3 (
) 8 , 2 1 , 3 (
2
2
=
+
=
>
>
=
>
> <
= > <
p p
p
X P
X P
X P
X X P
X X P
P(1,5<X3/2<X<4)=P(X=2 sau X=3 / X=3) = P(X=3/X=3) =1.

Aplicaia 2.5.4. Determinai constanta a R e pentru ca funcia f dat mai jos s
fie densitate de repartiie i apoi s se determine funcia de repartiie
corespunztoare. S se calculeze mediana, cuantilele i valoarea modal a
variabilei aleatoare X avnd densitatea de probabilitate (x):

e
e
=
. , 0
] 2 , 2 / 1 ( ,
3
2
] 2 / 1 , 0 [ , 2
) (
altfel
x
x
a
x x
x

Rezolvare
Avem
}
+

=1 ) ( dx x , de unde 1
3
2
2 / 1
0
2
2 / 1
= |
.
|

\
|
+
} }
dx
x
a xdx sau
1
3
2
2 / 1
2
2 / 1
0
2
=
|
|
.
|

\
|
+
x
ax x . Rezult a = 4/3 i deci

>
e

e
<
=

>
e

+
e
<
= =
}
}

2 , 1
] 2 , 2 / 1 ( ,
3
1 4
] 2 / 1 , 0 [ ,
0 , 0
2 , 1
] 2 , 2 / 1 ( ,
3
2 4
4
1
] 2 / 1 , 0 [ ,
0 , 0
) ( ) (
2
2
2 / 1
2
x
x
x x
x x
x
x
x dt
t
x x
x
dt t x F
x
x

57
ntruct F este continu vom avea F(x) = F(x+0) , x , deci
2
1
)) ( ( s X M F
e
i
2
1
)) ( ( > X M F
e
, adic
2
1
)) ( ( = X M F
e
. Aceasta se
realizeaz pentru
2
1
3
1 4
2
=
x x
, de unde ] 2 , 2 / 1 (
2
3
2 e = x .
Aadar
2
2
3
2 ) ( c X M
e
= = . Se observ c F(1/2)=1/4 deci
3 1
2
1
c c =
rezult din F(x)=3/4, adic
4
3
3
1 4
2
=
x x
, de unde
2
3
2
3
= c .
Deoarece este cresctoare pe [0,1/2] i descresctoare pe (1/2,2],
x=1/2 este punct de maxim (singurul), prin urmare
2
1
) ( = X M
o
.

Aplicaia 2.5.5. S se determine variabilele aleatoare independente
|
|
.
|

\
| + + +
p p p p
x x x x
X
4 3 2
3 2 1
: i
|
|
.
|

\
|
2 2
3 2
:
q q q
y y y
Y ,
tiind c E(X)=2 i E(Y)=7. S se calculeze apoi E(2X+3Y), Var(X),
Var(Y) i Var(2X+3Y).

Rezolvare
Deoarece X este o variabil aleatoare trebuie s avem p+2p+3p+4p=1,
adic p=1/10. Atunci
E(X) = xp+(x+1)2p+(x+2)3p+(x+3)4p = 10px+20p = x+2.
Cum E(X) = 2 rezult c x = 0.
Analog q+q
2
+q
2
=1, adic 2q
2
+q-1=0, de unde q=1/2. Rezult c
E(Y)=yq+2yq
2
+3yq
2
= y
4
7
. Cum E(Y) = 7 avem c y=4. Tablourile de
repartiie ale lui X i Y vor fi
|
|
.
|

\
|
5
2
10
3
5
1
10
1
3 2 1 0
: X
,
|
|
.
|

\
|
4
1
4
1
2
1
12 8 4
: Y
.
Folosind proprietile mediei avem
E(2X+3Y) = E(2X)+E(3Y) = 2E(X)+3E(Y) = 22+37 = 25.
Pentru calcularea dispersiilor avem nevoie s calculm mediile lui X
2
i
Y
2
. Acestea au tablourile de repartiie
|
|
.
|

\
|
5
2
10
3
5
1
10
1
9 4 1 0
:
2
X ,
|
|
.
|

\
|
4
1
4
1
2
1
144 64 16
:
2
Y
, astfel c
5
5
2
9
10
3
4
5
1
1
10
1
0 ) (
2
= + + + = X E i

58
60
4
1
144
4
1
64
2
1
16 ) (
2
= + + = Y E . Atunci
Var(X) = E(X
2
)-E(X)
2
= 5-4 = 1 i Var(Y) = E(Y
2
)-E(Y)
2
= 60-49 = 11.
Cum X i Y sunt independente, rezult c i 2X i 3Y sunt independente
i avem
Var(2X+3Y) = Var(2X)+Var(3Y) = 4Var(X)+9Var(Y) = 41+911 =
103.

Aplicaia 2.5.6. S se determine variabilele aleatoare X i Y ale cror repartiii
sunt date incomplet n tabelul de mai jos, tiind c E(X)=17 i Var(Y)=1. S se
calculeze apoi E(XY) i Var(X-Y).


X \ Y -b 0 b pi
a 1/5 1/10
a
2
2/5 3/5
qj 1/5

Rezolvare
Deoarece p
1
+p
2
=1 rezult c
5
2
5
3
1
1
= = p . Mai departe
p
11
+p
12
+p
13
=p
1
, adic
5
2
10
1
5
1
13
= + + p , deci
10
1
13
= p . Cum
p
13
+p
23
=q
3
rezult c
10
1
10
1
5
1
23
= = p . Dar p
21
+p
22
+p
23
=p
2
, adic
10
1
10
1
5
2
5
3
21
= = p . Din p
11
+p
21
=q
1
i p
22
+p
12
=q
2
, rezult c
10
3
1
= q i
2
1
2
= q . Obinem astfel
|
|
.
|

\
|
5
3
5
2 :
2
a a
X ,
|
|
.
|

\
|
5
1
2
1
10
3
0
:
b b
Y . Astfel 17
5
3
5
2
) (
2
= + = a a X E ,
adic 3a
2
+2a-85=0, de unde a
1
=5, a
2
=-17/3. Deoarece
10 5 2
1
0
10
3
) (
b b b
Y E = + + = i

2 5
1
2
1
0
10
3
) ( ) (
2
2 2 2 2
b
b b Y E = + + = , rezult c
100
49
100 2
) ( ) ( ) (
2 2 2
2 2
b b b
Y E Y E Y Var = = = . Din ipotez Var(Y)=1,
astfel c
49
100
2
= b , adic
7
10
= b . Din tabloul repartiiei comune (p
ij
) avem

59
|
|
.
|

\
|
10
1
10
1
2
1
5
1
10
1
0
:
2 2
b a ab ab b a
XY i
|
|
.
|

\
| + +

10
1
5
1
5
2
10
1
10
1
10
1 :
2 2 2
b a b a a a b a b a
Y X

Astfel
7 10 10 10 5 10
) (
2 2
a ab b a ab ab b a
XY E = = + + = .
Dac a=5, E(XY)=-5/7, iar dac a=-17/3, E(XY)=17/21. Pentru
calcularea dispersiei lui X-Y, avem nevoie de:

10
4 6
10 5 5
2
10 10 10
) (
2 2 2 2
b a a b a b a a a b a b a
Y X E
+ +
=
+
+
+
+ + +

=

10
5 2 4 6
10
) (
5
) (
5
2
10 10
) (
10
) (
] ) [(
2 2 4
2 2 2 4 2 2 2 2
2
b ab a a
b a b a a a b a b a
Y X E
+ + +
=
=
+
+
+
+ + +

=

Pentru a=5, b=10/7 avem E(X-Y)=
7
120
i
49
18985
] ) [(
2
= Y X E ,
deci
49
4585
49
14400
49
18985
) ( = = Y X Var .
Aplicaia 2.5.7. S se determine parametrii care apar n repartiiile urmtoare
i s se calculeze apoi E(X) i Var(X), X fiind o variabil aleatoare, avnd
repartiia respectiv:
a) 0 , ,
4
1
: > e
|
|
.
|

\
|
q N n
q
n
X n ;
b) 0 ], 1 , 0 [ ,
) 2 (
:
2
> e
|
|
.
|

\
|
+
a x
x x a
x
X ;
c)

e
e
=
|
|
.
|

\
|
. , 0
] 2 , 1 ( ,
2
1
] 1 , 0 [ ,
) ( ,
) (
:
3 2
altfel
x ax
x x a
x
x
x
X



Rezolvare
a)Din condiia 1
4
1
0
=

=
n
n
q rezult c
4
3
4
1
1 1
1
1
4
1
= = =

q q
q

Atunci
3
16
1
1
4
3
4
1
) 1 (
1
4
1
1
1
4
1
4
1
)' (
4
1
4
1
4
1
) (
2
'
'
0 0 0
1
0
= =

=
|
|
.
|

\
|

=
= |
.
|

\
|
= = = =


=

=
q
q
q
q
q q q q q n q q n X E
n
n
n
n
n
n n
n


60
. 24
) 1 (
2
4
1
) 1 (
1
4
1
4
1
4
1
)' (
4
1
4
1
) (
3
'
2
'
0
'
0 0 0
2 2
=

=
(

=
= |
.
|

\
|
= |
.
|

\
|
= = =


=

=
q
q
q
q
nq q nq q q n q q n X E
n
n
n n
n n n
n

Astfel Var(X) = E(X
2
)-E(X)
2
= 24-9 = 15.
b) Din condiia
}
= +
1
0
2
1 ) 2 ( dx x x a rezult c
4
3
1
3
4
1
3
1
0
2
3
= = =
|
|
.
|

\
|
+ a a x
x
a . Atunci
16
11
3
2
4 4
3
) 2 (
4
3
) ( ) (
1
0
1
0
1
0
3 4
2
=
|
|
.
|

\
|
+ = + = =
} }
x x
dx x x x dx x x X E ,
40
21
4
2
5 4
3
) 2 (
4
3
) ( ) (
1
0
4 5
2
1
0
1
0
2 2 2
=
|
|
.
|

\
|
+ = + = =
} }
x x
dx x x x dx x x X E .
Astfel
1280
67
16
11
40
21
) ( ) ( ) (
2
2 2
= |
.
|

\
|
= = X E X E X Var .
c) Din condiia
}
=
2
0
1 ) ( dx x rezult c

=
=
= + = + = +
} }
4
1
1
4
3
4
1
4 4
1
2
2
2
1
1
0
2
1
2
1
0
4
2 3 2
a
a
a a x
a
x
a dx
ax
dx x a Cum
0 ) ( > x numai a=1 convine, astfel c :
} } }
= + = + = + = =
2
0
1
0
2
1
2
1
3
1
0
5
3
30
41
6
7
5
1
6 5 2
) ( ) (
x x
dx
x
x dx x x dx x x X E
24
49
8 6 2
) ( ) (
2
1
4
1
0
6
2
1
2 3
2
0
1
0
2 2 2
= + = + = =
} } }
x x
dx
x
x dx x x dx x x X E ,
1800
313
30
41
24
49
) ( ) ( ) (
2
2 2
= |
.
|

\
|
= = X E X E X Var .
Aplicaia 2.5.8. Fie vectorul aleator (X,Y) cu X, Y variabile aleatoare
independente, a crui densitate de probabilitate este
) 1 )( 1 (
) , (
2 2
y x
a
y x
+ +
= . S se determine:
a) funcia de repartiie corespunztoare;
b) )) 1 , 0 [ ) 1 , 0 [ ) , (( e Y X P .

Rezolvare

61
a) Avem
}}
=
2
1 ) , (
R
dxdy y x , deci
}
+

=
+ +
1
) 1 )( 1 (
2 2
dxdy
y x
a
. Rezult
c
2 2 2
1
1 1
1 1 t
= = =
+ +
+

+

+

+

} }
a arctgy arctgx a
y
dy
x
dx
a .
Atunci
|
.
|

\
|
+ |
.
|

\
|
+ =
=
+ +
=
+ +
=
} } } }

2
1 1
2
1 1
1 1
1
) 1 )( 1 (
1
) , (
2 2 2 2 2 2
arctgy arctgx
v
dv
u
du
v u
dudv
y x F
y x x y
t t
t t

b)
16
1
) 0 , 0 ( ) 1 , 0 ( ) 0 , 1 ( ) 1 , 1 (
) 1 )( 1 (
1
) ) , ((
1
0
1
0
2 2 2
= + =
=
+ +
= e
} }
F F F F
v u
dudv
D Y X P
t


Aplicaia 2.5.9. Fie vectorul aleator (X,Y) cu densitatea de probabilitate

e
=
. , 0
] 2 , 0 [ ] 1 , 0 [ ) , ( ,
) , (
2
altfel
y x y ax
y x
a) S se determine constanta a.
b) S se calculeze funcia de repartiie F(x,y) i funciile marginale
F
X
(x) i F
Y
(y).

Rezolvare
a) Avem
} }
=
1
0
2
0
1 ) , ( dxdy y x , adic
} }
=
1
0
2
0
2
1 ydy dx x a , rezult c
1
3
2
=
a
de unde
2
3
= a .
b) Avem
} }

=
x y
dxdy y x y x F ) , ( ) , ( .
Dac x < 0 sau y < 0, atunci f(x,y)=0 i deci F(x,y)=0.
Dac x > 1 i y > 2, atunci F(x,y)=1.
Dac (x,y) ] 2 , 0 [ ] 1 , 0 [ e avem
} } } }
= = =
x y x y
y x
vdv du u vdudv u y x F
0 0
2 3
2
0 0
2
4 2
3
2
3
) , ( .
Dac x ] 1 , 0 [ e i y > 2 avem
} } } }
= = =
x x
x vdv du u vdudv u y x F
0
2
0 0
2
0
3 2 2
2
3
2
3
) , ( .
Dac x > 1 i y ] 2 , 0 [ e obinem
} } } }
= = =
1
0 0
1
0 0
2
2 2
4 2
3
2
3
) , (
y y
y
vdv du u vdudv u y x F .

62
Astfel

> >
e >
> e
e
< <
=
2 , 1 , 1
] 2 , 0 [ , 1 ,
4
2 ], 1 , 0 [ ,
] 2 , 0 [ ] 1 , 0 [ ) , ( ,
4
0 0 , 0
) , (
2
3
2 3
y x
y x
y
y x x
y x
y x
sauy x
y x F
Funciile de repartiie marginale sunt

>
e
<
= =
1 , 1
] 1 , 0 [ ,
0 , 0
) , ( ) (
3
x
x x
x
x F x F
X

>
e
<
= =
2 , 1
] 2 , 0 [ ,
4
0 , 0
) , ( ) (
2
y
y
y
y
y F y F
Y

Aplicaia 2.5.10. Fie vectorul aleator (X,Y) avnd densitatea de probabilitate

> >
=
+
altfel
y x e
y x
y x
, 0
0 , 0 ,
) , (
) (

S se calculeze:
a) P(X<1,Y<1), P(X+Y<1), P(X+Y2), P(X1/Y1), P(X<2Y),
P(X=n) ;
b) Funcia de repartiie F(x,y) i funciile de repartiie marginale F
X
(x),
F
Y
(y);
c) Densitile de repartiie marginale
X
(x),
Y
(y);
d) Momentele obinuite de ordin (k,s) ;
e) Corelaia variabilelor X i Y.

Rezolvare
a)
} }

= = < <
1 1
) , ( ) 1 , 1 ( dxdy y x Y X P
} }

= = =
1
0
1
0
2 1 1
0
1
0
) 1 ( ) ( ) ( e e e dxdy e
y x y x

}} } } }
< +


= = = = < +
1
1
0
1
0
1
0
1
0
) ( ) , ( ) 1 (
y x
x
x y x y x
dx e e dxdy e dxdy y x Y X P
}

= = =
1
0
1 1 0
1
1
2 1 ) ( ) ( e e e dx e e
x x
,
}}
< +
= = < + = > +
2
) , ( 1 ) 2 ( 1 ) 2 (
y x
dxdy y x Y X P Y X P
2
2
0
2
0
2
0
2
0
2 2
0
3 ) ( 1 ) ( 1 1


= = = =
} } } }
e dx e e dx e e dxdy e
x
x x y x y x


63
) 1 (
) 1 , 1 (
) 1 / 1 (
>
> >
= > >
Y P
Y X P
Y X P
( )
2
2
1
2
1 1 1
) ( ) 1 , 1 (
+
+ + +

= = |
.
|

\
|
= = > >
} } }
e e dx e dxdy e Y X P
x x y x

1
0 1
1 0
) ( ) 1 (

+ +
+ +
= = = >
} }
e e e dxdy e Y P
y x y x

1
) 1 , 1 (

= > > e Y X P
}} } } }
< <
+ +

= = = = <
y x
x
x y x y x y x
dx e e dydx e e dxdy e Y X P
2 0
0
2
0 0
2 /
0
) ( ) 2 (
3
1
3
2
1
3
2
) (
0
0
2
3
2
3
= =
|
|
.
|

\
|
+ = =
+
+

}
x
x
x
x
e e dx e e , P(X=Y)=0.
b) Avem
} }

=
x y
dudv v u y x F ) , ( ) , ( .
Dac x > 0 sau y < 0 (x,y)=0, deci F(x,y)=0. Dac x 0 i y 0 avem
} } } }

= = =
x y x y
y x v u v u
e e dv e du e dudv e y x F
0 0 0 0
) 1 )( 1 ( ) , ( .
Funciile de repartiie marginale sunt
x
X
e x F x F

= = 1 ) , ( ) ( i
y
Y
e y F y F

= = 1 ) , ( ) ( .
c) Densitile de probabilitate marginale ) (x
X
i ) ( y
Y
sunt
derivatele funciilor de repartiie marginale:

>
<
=

0 ,
0 , 0
) (
x e
x
x
x X
,

>
<
=

0 ,
0 , 0
) (
y e
y
y
y Y
.
d)
} }
+ +

= = =
0 0
,
) ( dxdy e y x Y X M
y x s k s k
s k
o
} }
+ +

= + I + I = =
0 0
! ! ) 1 ( ) 1 ( s k s k dy e y dx e x
y s x k
,
unde
}
+

= I
0
1
) ( dx e x p
x p
este funcia gama a lui Euler i are
proprietatea c ! ) 1 ( p p = + I pentru N pe .
e) Avem
} }
+ +

= = =
0 0
11
) ( ) ( ) ( ) , cov( dy ye dx xe m Y E X E XY E Y X
y x

0 1 1 ) 2 ( 1
2
= = I = .
Aplicaia 2.5.11. Fie (X,Y) un vector aleator discret a crui repartiie
probabilist este dat n tabelul de mai jos. S se calculeze coeficientul de
corelaie r(X,Y) i s se scrie ecuaiile dreptelor de regresie.
X \ Y -1 0 1 2 p
i

-1 1/10 1/5 1/10 0 2/5
0 1/20 0 1/10 1/20 1/5
1 1/10 1/10 1/20 3/20 2/5
q
j
1/4 3/10 1/4 1/5 1

64

Rezolvare
Pe baza formulelor corespunztoare, deducem imediat:
0
5
2
1
5
1
0
5
2
1 ) ( = + + = X E , ,
5
2
5
1
2
4
1
1
10
3
0
4
1
1 ) ( = + + + = Y E
5
4
5
2
1
5
1
0
5
2
) 1 ( ) (
2 2 2 2
= + + = X E ,
10
13
5
1
2
4
1
1
10
3
0
4
1
) 1 ( ) (
2 2 2 2 2
= + + + = Y E ,
50
57
25
4
10
13
) ( ) ( ) (
,
5
4
) ( ) ( ) (
2 2
2 2
= = =
= =
Y E Y E Y Var
X E X E X Var

4
1
20
3
2 1
20
1
1 1
10
1
0 1
10
1
) 1 ( 1
20
1
2 0
10
1
1 0 0 0 0
20
1
) 1 ( 0 0 2 ) 1 (
10
1
1 ) 1 (
5
1
0 ) 1 (
10
1
) 1 ( ) 1 ( ) (
= + + + + + + +
+ + + + + = XY E

4
1
) ( ) ( ) ( ) , cov( = = Y E X E XY E Y X ,
50
57
5
2
25 , 0
) ( ) (
) , cov(
) , (

= =
Y Var X Var
Y X
Y X r .
Ecuaiile dreptelor de regresie sunt :
50
57
5
2
25 , 0
5
4
0

+ =

y
x
,
5
4
0
25 , 0
50
57
5
2

+ =

x
y
.
Aplicaia 2.5.12. S se determine funcia caracteristic i funcia generatoare de
momente i apoi s se calculeze, pornind de la acestea, momentele
1
m i
2
m ,
pentru urmtoarele variabile aleatoare:
a)
|
|
.
|

\
|
4
1
4
1
2
1
2 1 0
: X ;
b) 0 , : >
|
|
.
|

\
|

x
e
x
X
x
.

Rezolvare
a) Avem
4
2
4
1
4
1
2
1
) (
2
2 1 0
it it
it it it
X
e e
e e e t
+ +
= + + =

i

65
4
2
4
1
4
1
2
1
) (
2
2 1 0
t t
t t t
X
e e
e e e t G
+ +
= + + =

.
Primele dou derivate ale acestor funcii sunt:
) 2 (
4
) (
2 ' it it
X
e e
i
t + = , ) 4 (
4
1
) (
2 " it it
X
e e t + = ,
) 2 (
4
1
) (
2 ' t t
X
e e t G + = , ) 4 (
4
1
) (
2 " t t
X
e e t G + = .
Obinem
4
5
) 0 ( ,
4
3
) 0 (
" '
= =
X X
i
,
4
5
) 0 ( ,
4
3
) 0 (
" '
= =
X X
G G , de unde
4
3
) 0 (
) 0 (
) ( ) (
'
'
1
= = = =
X
X
G
i
X E X

o i
4
5
) 0 (
) 0 (
) ( ) (
"
2
"
2
2
= = = =
X
X
G
i
X E X

o .
b)
} }
+ +

= + = =
0 0
) sin (cos ) ( dx e tx i tx dx e e t
x x itx
X

} }
+ +

+ = + =
0 0
sin cos iB A dx e tx i dx e tx
x x

} }
+ +

= = =
0 0
)' ( cos cos dx e tx dx e tx A
x x

}
+
+
= =
0
0
1 sin cos tB dx e tx t e tx
x x
,
} }
+
+
+

= + = =
0
0
0
cos sin ) ( sin tA dx e tx t e tx dx e tx B
x x x
.
Obinem A = 1 - t
2
A, adic A =
2
1
1
t +
i B =
2
1 t
t
+
.
Astfel
2
1
1
) (
t
it
t
X
+
+
= .
Apoi 1 ,
1
1
1
) (
0
0 0
) 1 (
) 1 (
<

= = =
+
+ +


} }
t
t t
e
dx e dx e e t G
t x
t x x tx
X
.
Primele dou derivate sunt
4 2
2
'
) 1 (
2
) (
t
it t i
t
X
+

= ,
5 2
2 3
"
) 1 (
2 10 14 6
) (
t
it t it
t
X
+
+
= ,
2
'
) 1 (
1
) (
t
t G
X

= ,
3
"
) 1 (
2
) (
t
t G
X

= .
Obinem
1 ) 0 (
) 0 (
) ( ) (
'
'
1
= = = =
X
X
G
i
X E X m

i
2 ) 0 (
) 0 (
) ( ) (
"
2
"
2
2
= = = =
X
X
G
i
X E X m

.

66
2.6. Probleme propuse

Aplicaia 2.6.1. Se consider vectorul aleator (X,Y) cu densitatea de
probabilitate: ( )

( ( )
=
altfel
x y y x daca xy A
y x
, 0
1 , 0 , ,
, . S se determine:
a) constanta real A;
b) densitile de probabilitate
X
,
Y
pentru variabilele aleatoare X,
Y;
c) probabilitile P(0 < X <
2
1
, 0 < Y <
2
1
) i P(X <
2
1
Y <
2
1
).

Aplicaia 2.6.2. La patru uniti alimentare din ora se poate gsi zilnic pine
proaspt cu probabilitile p
1
=0.8, p
2
=0.9, p
3
=0.95 i respectiv p
4
=0.85. Fie X
numrul unitilor alimentare din cele patru la care se gsete pine proaspt
ntr-o zi fixat. S se determine:
a) distribuia variabilei aleatoare X;
b) valoarea medie, dispersia, abaterea medie ptratic, mediana i
modul variabilei aleatoare X.

Aplicaia 2.6.3. Fie (X,Y) coordonatele unui punct luminos ce reprezint o int
pe un ecran radar circular i care urmeaz legea uniform pe domeniul
D = {(x,y)eR
2
x
2
+y
2
s r
2
}. S se determine valoarea medie i dispersia
distanei Z =
2 2
Y X + de la centrul ecranului pn la punctul luminos.

Aplicaia 2.6.4. Folosind inegalitatea lui Cebev, s se arate c
P(0<X<2(m+1)) >
1 + m
m
,
dac variabila aleatoare X are densitatea de probabilitate

s
)
=

0 , 0
0 ,
!
) (
x daca
x daca e
m
x
x
x
m

.
Aplicaia 2.6.5. Probabilitatea ca o persoan s gseasc loc la un hotel este p
= 0.8. n decursul unei luni de zile, la hotelul respectiv s-au prezentat 4000 de
persoane. Fie X numrul persoanelor care au gsit loc la hotel din totalul de
4000. S se determine probabilitatea ca:
a) numrul persoanelor care au gsit loc la hotel s fie cuprins ntre
3000 i 3400;
b) numrul persoanelor care au gsit loc la hotel s nu depeasc
3000;
c) numrul persoanelor care nu au gsit loc la hotel s fie mai mic
dect 500.

Aplicaia 2.6.6. Fie variabilele aleatoare independente:

67
|
|
.
|

\
|
3 1 2 1 6 1
2 1 0
: X i
|
|
.
|

\
|
8 1 4 1 2 1 8 1
2 1 0 1
: Y
S determine variabilele aleatoare: X+Y; X-Y; XY; X
2
; Y
2
; X
3
; Y
3
; 2X; 3Y;
2X+3Y; 3Y-2X; X .

Aplicaia 2.6.7. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comune ) (
ij
p i unidimensionale ) (
i
p i ) (
j
q sunt date n tabelul
de mai jos:
Y
X
-1 0 1 2 p
i
-1 1/12 1/24 1/24 1/48 3/16
1 1/48 1/24 1/48 1/24 1/8
2 1/48 1/3 1/6 1/6 11/16
q
j
1/8 5/12 11/48 11/48 1

a) Scriei variabilele aleatoare X i Y;
b) Precizai dac variabilele aleatore X i Y sunt independente sau
nu i justificai rspunsul;
c) Scriei variabilele aleatoare: X+Y; X-Y; XY;
X
Y
; X
2
; Y
3
;
3X-2Y;

Aplicaia 2.6.7. Fie variabilele aleatoare independente:
|
|
.
|

\
|
5
1
10
1
5
2
5
1
10
1
2 1 0 1 2
: X i
|
|
.
|

\
|
12
1
12
1
6
1
2
1
12
1
12
1
5 4 3 2 1 0
: Y
a) Calculai E(X), E(X
2
), Var(X), E(Y), E(Y
2
) i Var(Y);
b) Care dintre urmtoarele mrimi pot fi calculate i care nu i de
ce?
E(2X+3Y); Var(2X+3Y); E(X
2
+Y); Var(X
2
+Y);
E(X
2
+Y
2
); Var(X
2
+Y
2
); E(XY).
c) Calculai mrimile de la punctul b) pentru care rspunsul este
favorabil.

Aplicaia 2.6.8. S se determine, n fiecare caz, variabila aleatoare X i apoi s
se calculeze E(X) i Var(X).
a)
|
|
.
|

\
|
x
pq
x
X : , xeN, p > 0, q > 0, b)
|
|
.
|

\
|
b
x
ax
x
X
!
: , xeN, a > 0, b > 0
c)
|
|
.
|

\
|
ax
x
X : , xe[0,1], aeR, d)
|
|
.
|

\
|
+ ) 2 3 (
:
2
x x a
x
X , xe[0,1], aeR

68
e)
|
|
.
|

\
|
x a
e
x
X : , aeR, xeR, f)
|
|
.
|

\
|
) (
:
x
x
X

, xeR,
| |
| |

e
e
=
rest n , 0
2 , 1 ,
2
1 , 0 ,
) (
2 2
x
x a
x ax
x , aeR

Aplicaia 2.6.9. Fie variabilele aleatoare discrete:
|
|
.
|

\
|
3
2
3
1
1 0
: X i
|
|
.
|

\
|
3
1
2
1
6
1
2 1 0
: Y . Dac = = = ) 0 , 0 ( Y X P i
3
1
) 1 , 1 ( = = = Y X P , s se
determine repartiia comun a vectorului aleatoriu (X,Y) n funcie de R e .
Calculai apoi coeficientul de corelaie ) , ( Y X r i precizai dac exist valori
ale lui pentru care X i Y s fie independente.

Aplicaia 2.6.10. Fie ) , ( Y X un vector aleatoriu continuu cu densitatea de
repartiie
| | | |
|
|
.
|

\
| e +
=
rest n , 0
3 , 2 2 , 1 ) , ( , ) (
) , (
2 2
y x y x xy a
Y X , a > 0
a) Determinai densitatea de repartiie ) , ( Y X i densitile de
repartiie marginale corespunztoare ) (x
X
i ) ( y
Y
;
b) Calculai coeficientul de corelaie ) , ( Y X r .

Aplicaia 2.6.11. Calculai funcia caracteristic i funcia generatoare de
momente pentru fiecare dintre variabilele aleatoare:
a)
|
|
.
|

\
|
2
1
3
1
6
1
3 2 1
: X , b)
|
|
.
|

\
|
10
1
5
1
5
2
5
1
10
1
2 1 0 1 2
: X ,
c) | | 1 , 0 ,
3
:
2
e
|
|
.
|

\
|
x
x
x
X , d)
|
|
.
|

\
|
x
xe
x
X : , 0 > x
i apoi verificai dac momentele obinute pe cale direct coincid cu cele
obinute cu ajutorul acestor funcii.

Aplicaia 2.6.12. Verificai dac funciile urmtoare definesc repartiii ale unor
variabile aleatoare discrete i apoi calculai E(X) i Var(X) pentru fiecare dintre
ele.
a) 1 , ,
!
) (ln 1
) ( > e = u
u
u
N k
k
k P
k
, b) 0 , ,
!
1
) (
1
> e

=

u
u
u
N k e
k
k P
k
,
c) { } 1 0 , 1 , 0 , ) 1 ( ) (
1
< < e =

u u u k k P
k k

69
Capitolul 3


Legi clasice de probabilitate (repartiii) ale
variabilelor aleatoare discrete


Introducere

Vom prezenta n acest capitol principalele legi de probabilitate ale
variabilelor aleatoare discrete, i anume: legea discret uniform, legea
binomial i cazul su particular legea Bernoulli, legea binomial cu exponent
negativ i cazul particular legea geometric, legea hipergeometric i legea
Poisson (legea evenimentelor rare).


3.1. Legea discret uniform

Definiia 3.1.1. Variabila aleatoare discret X urmeaz legea discret
uniform dac are tabloul repartiiei

,
...
...
:
2 1
2 1
|
|
.
|

\
|
n
n
p p p
x x x
X unde . , ... , 2 , 1 ,
1
*
N e = = n n k
n
p
k
(3.1.1)

Vom mai spune c variabila aleatoare X dat de formula (3.1.1) are o
repartiie discret uniform.
Din tabloul repartiiei variabilei aleatoare X se observ c



= =
= =
n
k
n
k
k
n
p
1 1
. 1
1


Teorema 3.1.2. Dac variabila aleatoare X are repartiie discret uniform cu
tabloul repartiiei (3.1.1), atunci valoarea medie i dispersia sa sunt

.
1 1
) ( ,
1
) (
1
2
1
2
2
1

= = =
|
.
|

\
|
= =
n
k
n
k
k k
n
k
k
x
n
x
n
X Var x
n
X E (3.1.2)

Demonstraie
Din formulele de calcul ale mediei i dispersiei obinem
70

,
1 1
) (
1 1 1

= = =
= = =
n
k
k
n
k
n
k
k k k
x
n n
x p x X E



= = = =
= =
|
.
|

\
|
= |
.
|

\
|
=
|
.
|

\
|
= =
n
k
n
k
k
n
k
k
n
k
k k
n
k
n
k
k k k k
x
n
x
n n
x
n
x
p x p x X E X E X Var
1
2
1
2
1
2
2
1
2
2
1 1
2 2 2
.
1 1 1 1
)] ( [ ) ( ) (

q.e.d.

Observaia 3.1.3. Deoarece 0 ) ( > X Var , din relaia a doua (3.1.2) avem

,
2
1 1
2
|
.
|

\
|
>

= =
n
k
k
n
k
k
x x n

relaie util n diverse aplicaii practice, i care rezult direct i din inegalitatea
lui Cauchy-Buniakovski-Schwarz.

Propoziia 3.1.4. Dac variabila aleatoare discret X are repartiie uniform
cu tabloul repartiiei (3.1.1), atunci funcia sa caracteristic este

. ,
1
) (
1
R t e
n
t
n
k
itx
k
e =

=
(3.1.3)

Demonstraie
Conform formulei de calcul pentru funcia caracteristic, avem

. ,
1
) (
1 1
R t e
n
e p t
n
k
itx
n
k
itx
k
k k
e = =

= =
q.e.d.

Propoziia 3.1.5. Dac variabila aleatoare discret X are repartiie uniform i
ia valorile , ..., , 2 , 1 , n k k x
k
= = adic are tabloul repartiiei

,
1 1 1
2 1
:
|
|
|
.
|

\
|
n n n
n
X


atunci
71

. , 2 , 1 ) ( ; , 2 , ,
2
sin
2
sin
) (
,
12
1
) ( ,
12
1
) (
2
) 1 (
2
Z k k t t Z k k t R t e
t
n
nt
t
n
X Var
n
X E
t n i
e = = e = e =

=
+
=
+
t t


Demonstraie
Din formulele (3.1.2), pentru , ..., , 2 , 1 , n k k x
k
= = obinem

,
2
1 1 1
) (
1 1
+
= = =

= =
n
k
n
x
n
X E
n
k
n
k
k


.
12
1
4
) 1 ( 1
6
) 1 2 )( 1 ( 1
1 1 1 1
) (
2 2 2
2
2
1
2
1
2
2
1
2
1
2

=
+

+ +
=
|
.
|

\
|
= |
.
|

\
|
=

= = = =
n n n
n
n n n
n
k
n
k
n
x
n
x
n
X Var
n
k
n
k
n
k
k
n
k
k


Din formula (3.1.3), obinem pentru funcia caracteristic


. , 2 , 1 ) (
, , 2 , ,
2
sin
2
sin
2
) 1 (
sin
2
) 1 (
cos
2
sin
2
sin
2
sin
2
cos
2
sin
2
sin
2
cos
2
sin
2
cos
2
sin 2
2
sin 2
2
cos
2
sin 2
2
sin 2
sin cos 1
sin cos 1
1
1 1
) (
2
) 1 (
2
2
int
1
Z k k t t
Z k k t R t e
t
n
nt
t n
i
t n
t
n
nt
e
t
i
t t
nt
i
nt nt
n
e
t t
i
t
nt nt
i
nt
n
e
t i t
nt i nt
n
e
e
e
n
e
e
n
t
t n i
it
it it
it
it
it n
k
itk
e = =
e = e = |
.
|

\
|
+

=
|
.
|

\
|
+
|
.
|

\
|
+
=

=


=

= =
+
=

t
t

q.e.d.


3.2. Legea binomial. Legea Bernoulli

Definiia 3.2.1. Variabila aleatoare discret X urmeaz legea binomial
( X are o repartiie binomial) cu parametrii n i p ( , N ne 1 0 < < p ) dac ia
valorile n ..., , 2 , 1 , 0 cu probabilitile
72

, ,..., 2 , 1 , 0 , ) ( n k q p C k X P
k n k k
n
= = =

(3.2.1)

unde . 1 p q =
Tabloul repartiiei variabilei aleatoare X este

.
...
... 2 1 0
:
0 2 2 2 1 1 0 0 |
|
.
|

\
|

q p C q p C pq C q p C
n
X
n n
n
n
n
n
n
n
n


Se observ c . 1 ) (
0 0
= + = =

=

=
n
n
k
k k n k
n
n
k
k n k k
n
q p q p C q p C

Exemplul 3.2.2. Dac
n
A A A ..., , ,
2 1
sunt evenimente independente i
, ..., , 2 , 1 , ) ( n i p A P
i
= = iar X reprezint numrul evenimentelor care se
realizeaz n cadrul unei experiene , atunci X are repartiie binomial cu
parametrii n i p (conform schemei lui Bernoulli).

Exemplul 3.2.3. Dac A este un eveniment legat de o anumit experien i
probabilitatea ca As se produc cnd efectum o singur dat experiena este
, ) ( p A P = atunci variabila aleatoare care are ca valori numrul realizrilor lui
Acnd efectum de n ori experiena are repartiie binomial cu parametrii n i
p.

Teorema 3.2.4. Dac variabila aleatoare X are repartiie binomial cu
parametrii n i p, atunci valoarea medie i dispersia sa sunt

. ) ( , ) ( npq X Var np X E = = (3.2.2)

Demonstraie
Valoare medie a variabilei aleatoare X este

. 2 1 0 ) (
0
0 2 2 2 1 1 0 0

=

= + + + + =
n
k
k n k k
n
n n
n
n
n
n
n
n
n
q p kC q p C n q p C pq C q p C X E

Pentru a calcula suma de mai sus vom considera polinomul



= =


= =
+ + + + = + =
n
k
n
k
k k n k k
n
k n k k n k
n
n n
n
n n
n
n n
n
n n
n
n
x q p C x q p C
q C x pq C qx p C x p C q px x P
0 0
1 1 1 1 1 0
.
) ( ) (


73
Derivnd polinomul de mai sus obinem


. 0
) 1 ( ) ( ) ( '
0
1 1 1
2 1 1 1 0 1

=


= + +
+ + = + =
n
k
k k n k k
n
n n
n
n n
n
n n
n
n n
n
n
x q p kC q C pq C
qx p C n x p nC q px np x P
(3.2.3)

Lund 1 = x n relaia (3.2.3), obinem

=

+ =
n
k
n k n k k
n
q p np q p kC
0
1
, ) ( de unde
rezult c . ) ( np X E =
Pentru a calcula dispersia lui X vom folosi formula

. )] ( [ ) ( ) (
2 2
X E X E X Var =

Media variabilei
2
X este . ) (
0
2 2

=
n
k
k n k k
n
q p C k X E

nmulim relaia (3.2.3) cu x i obinem


= +
+ + = + =
n
k
k k n k k
n
n n
n
n n
n
n n
n
n n
n
n
x q p kC q C
x pq C qx p C n x p nC q px npx x xP
0
1 1 1 1 1 0 1
. 0
) 1 ( ) ( ) ( '


Dac derivm relaia de mai sus deducem c

. ) ( ) 1 ( ) ( ) ( ' ' ) ( '
0
1 2 2 2 1

=

= + + + = +
n
k
k k n k k
n
n n
x q p C k q px x p n n q px np x xP x P

Lund 1 = x n relaia de mai sus deducem c . ) 1 ( ) (
2 2
p n n np X E + =
Obinem astfel dispersia lui X

. ) 1 ( ) (
2 2 2 2
npq np np p n p n n np X Var = = + =
q.e.d.

Propoziia 3.2.5. Dac este modulul (valoarea cea mai probabil) a unei
variabile aleatoare X cu repartiie binomial cu parametrii n i p, atunci

, p np q np + s s

unde . 1 p q =

74
Demonstraie
Dac este modulul variabilei X atunci

). ( ) 1 ( ), ( ) 1 ( = s + = = s = X P X P X P X P

Inegalitile de mai sus ne conduc la sistemul

>
+ s

s
+
s
+

s
s
+ +
+
,
1
1
1 1 1
1 1 1
q np
p np
n
q p
p
n
q
q p C q p C
q p C q p C
n
n
n
n
n
n
n
n







de unde rezult concluzia propoziiei. q.e.d.

Propoziia 3.2.6. Dac variabila aleatoare X are repartiie binomial cu
parametrii n i p, atunci funcia sa caracteristic este

. , ) ( ) ( R t q pe t
n it
e + = (3.2.4)

Demonstraie
Conform formulei pentru funcia caracteristic avem

. , ) ( ) ( ) (
0 0
R t q pe q pe C e q p C t
n it
n
k
k n k it k
n
n
k
itk k n k k
n
e + = = =

=


q.e.d.

Teorema 3.2.7. Dac variabilele independente X i Y au repartiii binomiale cu
parametrii n i p, respectiv m i p, atunci variabila X+Y are repartiie binomial
cu parametrii m+n i p.

Demonstraie
Deoarece X ia valorile , , , 1 , 0 n iar Y ia valorile , , , 1 , 0 m rezult c variabila
X+Y va lua valorile . , , 1 , 0 m n + Variabila X+Y are valoarea k
( { } m n k + e , , 1 , 0 ) dac (X=0 i Y=k) sau (X=1 i Y=k-1) sau ... sau (X=k i
Y=0). Atunci vom obine

75

.
) ( ) (
) , ( } , { ) (
0
0 0
0 0
k n m k k
n m
k
j
j k
m
j
n
k n m k
k
j
k
j
j k m j k j k
m
j n j j
n
k
j
k
j
q p C C C q p
q p C q p C j k Y P j X P
j k Y j X P j k Y j X P k Y X P
+
+
=
+
= =
+
= =
= =
= = = =
= = =
|
|
.
|

\
|
= = = = +





Am folosit mai sus faptul c evenimentele X i Y sunt independente, i de
asemenea am utilizat formula ,
0
k
n m
k
j
j k
m
j
n
C C C
+
=

care poate fi dedus egalnd


coeficientul lui
k
x din dezvoltrile
m n
x x ) 1 ( ) 1 ( + + i . ) 1 (
m n
x
+
+
Deci am obinut

, , , 1 , 0 , ) ( m n k q p C k Y X P
k n m k k
n m
+ = = = +
+
+


adic variabila X+Y are o repartiie binomial cu parametrii m+n i p.
Concluzia teoremei mai poate fi obinut folosind proprietatea de la funcii
caracteristice care spune c funcia caracteristic a sumei a dou variabile
aleatoare independente cu funciile caracteristice ) (
1
t i R t t e ), (
2
, are forma
. ), ( ) ( ) (
2 1
R t t t t e = Astfel folosind relaia (3.2.4) deducem c funcia
caracteristic a variabilei X+Y este

( ) ( ) ( ) . , ) ( R t q pe q pe q pe t
n m
it
m
it
n
it
e + = + + =
+


Din expresia de mai sus a funciei c tragem concluzia c variabila aleatoare X+Y
are repartiie binomial cu parametrii m+n i p. q.e.d.

Teorema 3.2.8. (Bernoulli) Un eveniment are probabilitatea de realizare p
atunci cnd facem o singur dat experiena de care este legat. Dac
n
o este
numrul de realizri ale evenimentului cnd repetm experiena de n ori,atunci

, 0 lim =
|
|
.
|

\
|
>

c
o
p
n
P
n
n
(3.2.5)

oricare ar fi . 0 > c

Demonstraie
Variabila aleatoare
n
o care are ca valori numrul de realizri ale evenimentului
din problem are repartiie binomial cu parametrii n i p. Conform Teoremei
76
3.2.2 avem np E
n
= ) (o i . ) ( npq Var
n
= o Variabila aleatoare
n
n
o
va avea atunci
valoarea medie, dispersia i abaterea medie ptratic
, ) (
1
p
n
np
E
n n
E m
n
n
= = = |
.
|

\
|
= o
o


. , ) (
1
2
n
pq
n
pq
Var
n n
Var
X n
n
= = = |
.
|

\
|
o o
o


Vom folosi acum Inegalitatea lui Cebev pentru variabila
n
n
o
i . c = a
Obinem
.
2 2
2
c c
o
c
o
n
pq
p
n
P
n
= s
|
|
.
|

\
|
>
Deoarece , 0 lim
2
=

c n
pq
n
din inegalitatea de mai sus rezult inegalitatea (3.2.5).
q.e.d.

Observaia 3.2.9. O mbuntire a inegalitii (3.2.5) este dat de teorema lui
Borel, care spune c n condiiile Teoremei 3.2.8 are loc relaia

. 1 = |
.
|

\
|
p
n
P
n
o


Aplicaia 3.2.10. n cadrul unei experiene evenimentele independente
n
A A A , ,
2 1
au probabilitile de realizare . , , 2 , 1 , ) ( n k p A P
k k
= = S se
calculeze valoarea medie i dispersia numrului de evenimente care se
realizeaz atunci cnd experiena are loc.

Rezolvare
S notm cu X variabila aleatoare care are ca valori numrul de
evenimente care se realizeaz n cadrul experienei. Valorile variabilei X sunt
. , , 2 , 1 , 0 n Probabilitatea ca X s ia valoarea k ( ) , , 2 , 1 , 0 n k = este, conform
schemei lui Poisson (schema binomial generalizat) coeficientul lui
k
x din
polinomul

, ) ( ) )( ( ) (
2 2 1 1 n n
q x p q x p q x p x Q + + + = (3.2.6)

unde . , , 2 , 1 , 1 n i p q
i i
= = Dac scriem desfurat pe ) (x Q sub forma

77
, ) (
2
2 1 0
n
n
x a x a x a a x Q + + + + = (3.2.7)

atunci tabloul repartiiei variabilei X este

.
2 1 0
:
2 1 0
|
|
.
|

\
|
n
a a a a
n
X



Suma tuturor elementelor de pe linia a doua a tabloului de mai sus este 1. ntr-
adevr

. 1 ) ( ) )( ( ) 1 (
2 2 1 1 1 0
= + + + = = + + +
n n n
q p q p q p Q a a a

Valoarea medie a variabilei X este . ) (
0

=
=
n
k
k
ka X E Ideea de demonstraie a
teoremei este asemntoare cu cea a Teoremei 3.2.4. Vom deriva polinomul Q,
scris sub cele dou forme de mai sus (3.2.6) i (3.2.7). Derivnd relaia (3.2.7)
obinem

, 3 2 ) ( '
1 2
3 2 1

+ + + + =
n
n
x na x a x a a x Q (3.2.8)

de unde rezult

). ( 3 2 ) 1 ( '
1
3 2 1
X M ka na a a a Q
n
k
k n
= = + + + + =

=


Pe de alt parte parte, derivnd relaia (3.2.6) obinem

, ) ( ) ( ) ( ) ( '
2
2
1
1 [ [ [
= = =
+ + + + + + =
n k
k k n
k
k k
k
k k
q x p p q x p p q x p p x Q (3.2.9)

iar pentru 1 = x deducem . ) 1 ( '
2 1 n
p p p Q + + + = Rezult c

. ) (
1

=
=
n
k
k
p X E (3.2.10)
Pentru a calcula dispersia, vom calcula mai nti . ) (
0
2 2

=
=
n
k
k
a k X E nmulim
relaia (3.2.8) cu x i obinem

. 3 2 ) ( '
3
3
2
2 1
n
n
x na x a x a x a x xQ + + + + =

78
Derivnd egalitatea de mai sus rezult

. 3 2 ) ( ' ' ) ( '
1 2 2
3
2
2
2
1

+ + + + = +
n
n
x a n x a x a a x xQ x Q

Pentru 1 = x deducem din relaia de mai sus . ) 1 ( ' ' ) 1 ( '
1
2

=
= +
n
k
k
a k Q Q Deci

). 1 ( ' ' ) 1 ( ' ' ) 1 ( ' ) (
1
2
Q p Q Q X E
n
k
k
+ = + =

=
(3.2.11)

Derivm acum relaia (3.2.9) pentru a determina ) ( ' ' x Q ; obinem


. ) ( ) ( ) (
) ( ) ( ) ( ) ( ' '
1 , 1
1
, 2
2
, 1
1
, 1 3 , 1
3
2 , 1
2 1
(

+ + + + + + + +
(

+ + + + + + =
[ [ [
[ [ [
=

= =
= = =
n j
j j n
n j
j j
n j
j j n
n j
j j n
j
j j
j
j j
q x p p q x p p q x p p p
q x p p q x p p q x p p p x Q



Pentru 1 = x obinem din relaia de mai sus


. )] ( [
) ( ) )( ( ] ) ( [
] ) ( [ ] ) ( [ ) 1 ( ' '
1
2 2
2 2
2
2
1 2 1
2 2 1 1
2
2
1
1


=
= = =
=
+ + + + + + = + +
+ = + + + =
n
k
k
n n n n
n k
k n
k
k
k
k
p X E
p p p p p p X E p X E p
p X E p p X E p p p p p p p Q



Din relaia (3.2.11) i din relaia de mai sus deducem c

. )] ( [ ) (
1
2 2
1
2

= =
+ =
n
k
k
n
k
k
p X E p X E (3.2.12)

Folosind acum relaiile (3.2.10) i (3.2.12) rezult c dispersia lui X este


. ) 1 (
)] ( [ )] ( [ )] ( [ ) ( ) (
1 1 1
2
1
2
1
2 2
1
2 2


= = = =
= =
= = =
+ = =
n
k
n
k
k k k k
n
k
k
n
k
k
n
k
k
n
k
k
q p p p p p
X E p X E p X E X E X Var


O alt metod mai simpl pentru calculul mediei i dispersiei variabilei X este
urmtoarea: s notm cu
k
X variabila aleatoare care are ca valori pe 1 dac
k
A se
79
realizeaz, i pe 0 dac
k
A nu se realizeaz, pentru . , , 2 , 1 n k = Tablourile de
repartiie pentru variabilele
k
X sunt

. , , 2 , 1 ,
0 1
: n k
q p
X
k k
k
=
|
|
.
|

\
|


Atunci numrul evenimentelor care se realizeaz este ,
1 n
X X X + + = deci
media sa va fi

. ) ( ) (
1 1

= =
= =
n
k
k
n
k
k
p X E X E

Deoarece variabilele aleatoare n k X
k
, , 2 , 1 , = sunt independente, atunci
dispersia varaibilei X va fi

{ }

= = = =
= = = =
n
k
n
k
n
k
k k
n
k
k k k k k
q p p p X E X E X Var X Var
1 1 1 1
2 2 2
. ) ( )] ( [ ) ( ) ( ) (
q.e.d.

Pentru , 1 = n legea binomial este cunoscut i sub numele de legea
Bernoulli cu parametrul p. Variabila aleatoare X care urmeaz legea Bernoulli
cu parametrul p admite doar dou valori posibile 0 i 1 cu probabilitile de
realizare q=1-p i p, avnd tabloul repartiiei

. 1 ,
1 0
: p q
p q
X =
|
|
.
|

\
|


Valoarea medie i dispersia variabilei X sunt p X E = ) ( i . ) ( pq X Var =
O variabil aleatoare cu repartiie binomial cu parametrii n i p dat de
Definiia 3.2.1 este suma a n variabile aleatoare independente cu repartiii
Bernoulli cu acelai parametru p.


3.3. Legea binomial cu exponent negativ. Legea geometric

Definiia 3.3.1. Variabila aleatoare X urmeaz legea binomial cu exponent
negativ (X are repartiie binomial cu exponent negativ) cu parametrii m i p
( ,
*
N me 1 0 < < p ) dac ia valorile , 2 , 1 , + + m m m cu probabilitile

, , ) (
1
1
m k q p C k X P
m k m m
k
> = =

(3.3.1)
80
unde q=1-p.

Tabloul repartiiei variabilei aleatoare X este

.
2 1
:
2 1
1
1 0 1
1
|
|
.
|

\
| + +

q p C q p C q p C
m m m
X
m m
m
m m
m
m m
m


Exemplul 3.3.2. O experien se efectueaz pn la cea de-a m-a realizare a
unui eveniment A legat de ea. Dac probabilitatea acestui eveniment cnd se
face o singur dat experiena este p, atunci numrul X de efecturi ale
experienei este variabil aleatoare care are repartiie binomial cu exponent
negativ cu parametrii m i p. ntr-adevr, evenimentul } { k X = se scrie ca
intersecia a dou evenimente: n primele k-1 efecturi ale experienei
evenimentul A se produce de m-1 ori i n a k-a efectuare a experienei se
produce A. Probabilitatea primului din aceste dou evenimente este
m k m m
k
q p C

1 1
1
, conform schemei lui Bernoulli, iar probabilitatea celui de-al
doilea este p. Deci

, 1 , , ) (
1
1
1 1
1
+ = = = =


=
m m k q p C q p pC k X P
m k m m
k
m k m m
k


Teorema 3.3.3. Dac variabila aleatoare X are repartiie binomial cu exponent
negativ cu parametrii m i p, atunci valoarea medie i dispersia sa sunt

. ) ( , ) (
2
p
mq
X Var
p
m
X E = = (3.3.2)

Demonstraie
Valoarea medie a variabilei aleatoare X este


.
) 2 ( ) 1 ( ) (
1
1
2 1
1
1 0 1
1
m k m
m k
m
k
m m
m
m m
m
m m
m
q p kC
q p C m q p C m q p mC X E

=
+ + + + + =


Pentru a calcula suma seriei de mai sus, pornim de la dezvoltarea n serie de
puteri a funciei
m
x

) 1 ( , i anume

). 1 , 1 ( ,
! 2
) 1 (
! 1
1 ) 1 (
2
e +
+
+ + =

x x
m m
x
m
x
m


Pentru
*
N me seria binomial de mai sus se scrie sub forma

81
) 1 , 1 ( , ) 1 (
1
2 2
1
1 0
1
e = + + + =

=

+

x x C x C x C C x
m k
m k m k
k m m m
m

sau
). 1 , 1 ( , ) 1 (
1
1
2 1
1
1 1
1
e = + + + =

x x C x C x C C x
m k
m k m
k
m
m
m
m
m
m
m
(3.3.3)
Folosind seria de mai sus (cu x=q), observm c suma tuturor probabilitilor
de pe linia a doua a tabloului repartiiei variabilei X este 1. ntr-adevr

. 1
1
) 1 (
1
1
1
1
=
|
|
.
|

\
|
= = =

=


m
m m
m k
m k m
k
m
m k
m k m m
k
p
q
p
q p q C p q p C

Numele repartiiei binomiale cu exponent negativ provine din observaia c
termenii m k q p C k X P
m k m m
k
> = =

, ) (
1
1
sunt termenii generali ai dezvoltrii
.
1
m
p
q
p

|
|
.
|

\
|

Relaia (3.3.3) se scrie echivalent astfel

m k
k m
k m
m
x C
x
x
1
1
) 1 (
(3.3.4)

Derivnd relaia (3.3.4) obinem

). 1 , 1 ( ,
) 1 (
1 1
1 1
1
e =

=

+

x x kC
x
mx
m k
k m
k m
m
(3.3.5)

Pentru x=q din relaia (3.3.5) deducem

.
1 1
1 1
1

=

+

=
m k
k m
k m
m
q kC
p
mq
(3.3.6)

Atunci valoarea medie a variabilei X este, folosind relaia (3.3.6)

. ) (
1
1
1 1 1
1
1 1
1
p
m
p
mq
q p q kC q p q p kC X E
m
m
m m
m k
k m
k
m m
m k
m k m m
k
= = = =
+

=




Pentru a calcula dispersia variabilei X, vom calcula mai nti , ) (
2
X E i
anume

82
. ) (
1 1
1
2 1 1
1
2 2


=

= =
m k
k m
k
m m
m k
m k m m
k
q C k q p q p C k X E

nmulim relaia (3.3.5) cu x i obinem

). 1 , 1 ( ,
) 1 (
1
1 1
e =

=
+
x x kC
x
mx
m k
k m
k m
m


Prin derivarea relaiei de mai sus rezult

). 1 , 1 ( ,
) 1 (
) (
1 1
1
2
2
1
e =

=

+

x x C k
x
x m m x
m k
k m
k m
m


Pentru x=q din relaia obinut deducem

.
) (
2
1
1 1
1
2
+

=

+
=

m
m
m k
k m
k
p
q m m q
q C k

Rezult atunci c ) (
2
X E este

,
) ( ) (
) (
2 2
1
1 2
p
q m m
p
q m m q
q p X E
m
m
m m
+
=
+
=
+



iar dispersia varaibilei aleatoare X este

. )] ( [ ) ( ) (
2 2
2
2
2
2 2
p
mq
p
m
p
mq m
X E X E X Var =
+
= =
q.e.d.

Propoziia 3.3.4. Dac variabila aleatoare X are repartiie binomial cu
exponent negativ cu parametrii n i p, atunci funcia sa caracteristic este

. ,
1
) ( R t
qe
pe
t
m
it
it
e
|
|
.
|

\
|

= (3.3.7)

Demonstraie
Conform formulei pentru funcia caracteristic avem

83

, ,
1
) 1 (
) ( ) (
1
1
1
1
R t
qe
pe
qe e p
qe C e p e q p C t
m
it
it
m it itm m
m k
m k it m
k
itm m
m k
itk m k m m
k
e
|
|
.
|

\
|

= =
= =


conform relaiei (3.3.3), care este adevrat i pentru numere complexe
. 1 | | , < e x C x q.e.d.


Pentru 1 = m legea binomial cu exponent negativ cu parametrul p se mai
numete legea geometric cu parametrul p. Tabloul repartiiei unei variabile
aleatoare X cu repartiie geometric cu parametrul p este urmtorul

,
3 2 1
:
2 0 |
|
.
|

\
|

q p q p q p
X
m m m


unde q=1-p. Conform relaiilor (3.3.2) i (3.3.7) media, dispersia i funcia
caracteristic ale lui X sunt

. ,
1
) ( , ) ( ,
1
) (
2
R t
qe
pe
t
p
q
X Var
p
X E
it
it
e

= = =

3.4. Legea hipergeometric

Definiia 3.4.1. Variabila aleatoare X urmeaz legea hipergeometric (X are
repartiie hipergeometric) cu parametrii a, b i n (
*
, , N n b a e , b a n + s ) dac
poate lua orice valoare ntreag ntre ) , 0 max( b n i ) , min( a n i

)]. , min( ), , 0 [max( , ) ( a n b n k
C
C C
k X P
n
b a
k n
b
k
a
e = =
+

(3.4.1)

Pentru calculul mediei i dispersiei variabilei aleatoare X cu repartiie
hipergeometric vom presupune fr a restrnge generalitatea problemei c
b n s i , a n s deci 0 ) , 0 max( = b n i . ) , min( n a n = Atunci tabloul repartiiei
variabilei X este

.
2 1 0
:
0 2 2 1 1 0
|
|
|
.
|

\
|
+ +

+
n
b a
b
n
a
n
b a
n
b a
n
b a
n
b a
n
b a
n
b a
C
C C
C
C C
C
C C
C
C C
n
X



84
Se observ c suma probabilitilor de pe linia a doua a tabloului de mai sus este
1. ntr-adevr avem

. 1
1 1
0 0
= = =
+
+ =

+ = +


n
b a n
b a
n
k
k n
b
k
a n
b a
n
k
n
b a
k n
b
k
a
C
C
C C
C C
C C


Exemplul 3.4.2. Dac dintr-o urn care conine a bile albe i b bile negre se
extrag n bile una cte una, fr ntoarcerea bilei extrase n urn (sau se extrag n
bile simultan), iar X este numrul de bile albe extrase, atunci X are repartiie
hipergeometric cu parametrii a, b i n, conform schemei hipergeometrice
(schema bilei nentoarse).

Teorema 3.4.3. Dac variabila aleatoare X are repartiie hipergeometric cu
parametrii b a, i n, cu b n s i , a n s atunci valoarea medie i dispersia sa
sunt

,
1
) ( , ) (
+
+
= =
b a
n b a
npq X Var ap X E (3.4.2)
unde . 1 ,
b a
b
p q
b a
a
p
+
= =
+
=

Demonstraie
Valoarea medie a variabilei aleatoare X este

. ) (
1
1
1
1
1
0
ap
b a
an
C
C
a
C C
C
a
C
C C
k X E
n
b a n
b a
n
k
k n
b
k
a n
b a
n
k
n
b a
k n
b
k
a
=
+
= = = =

+
+ =

+ = +




Pentru calculul dispersiei, vom calcula mai nti media variabilei ;
2
X avem


.
) 1 )( (
) 1 )( 1 ( ) 1 (
) (
) 1 (
) 1 ( ) (
2
2
2
2
2
0 1 0
2 2
b a
an
b a b a
n a an
b a
an
C
C
a a
X E C C
C
a a
C
C C
k
C
C C
k k
C
C C
k X E
n
b a n
b a
n
k
k n
b
k
a n
b a
n
k
n
b a
k n
b
k
a
n
k
n
b a
k n
b
k
a
n
k
n
b a
k n
b
k
a
+
+
+ +

=
+
+

= +

=
+ = =

+
+ =

+
= +

= +

= +




Deci dispersia lui X este
85

.
1 ) 1 ( ) (
) (
) ( ) 1 )( (
) 1 )( 1 (
)] ( [ ) ( ) (
2
2
2 2
2 2
+
+
=
+ +
+
=
+

+
+
+ +

= =
b a
n b a
npq
b a b a
n b a abn
b a
n a
b a
an
b a b a
n a an
X E X E X Var


Folosind modelul urnei din Exemplul 3.4.2, valoarea medie a variabilei X
din problem se poate calcula i n felul urmtor. Considerm o urn cu a bile
albe i b bile negre din care se extrag una cte una n bile (fr ntoarcerea bilei n
urn) i considerm variabilele aleatoare
k
X , pentru , , , 2 , 1 n k = unde variabila
k
X ( n k , , 2 , 1 = ) are ca valori numrul de bile albe obinute la extragerea k (1
dac obinem bil alb i 0 dac obinem bil neagr). Pentru ,
1
X avem

. ) 0 ( , ) 1 (
1 1
b a
b
X P
b a
a
X P
+
= =
+
= =

Deci tabloul repartiiei variabilei
1
X este .
0 1
:
1
|
|
|
.
|

\
|
+ + b a
b
b a
a
X Pentru variabila
2
X obinem (n urn au rmas a+b-1 bile)


( )
.
) 1 )( (
) 1 (
1
1
1
) 0 ( ) 0 / 0 ( ) 1 ( ) 1 / 0 ( ) 0 (
,
) )( 1
) 1 (
1 1
1
) 0 ( ) 0 / 1 ( ) 1 ( ) 1 / 1 ( ) 1 (
1 1 2 1 1 2 2
1 1 2 1 1 2 2
b a
b
b a b a
b a b
b a
b
b a
b
b a
a
b a
b
X P X X P X P X X P X P
b a
a
b a b a
b a a
b a
b
b a
a
b a
a
b a
a
X P X X P X P X X P X P
+
=
+ +
+
=
+

+
+

+
=
= = = + = = = = =
+
=
+ +
+
=
+

+
+
+

=
= = = + = = = = =


Deci tabloul repartiiei variabilei
2
X este .
0 1
:
2
|
|
|
.
|

\
|
+ + b a
b
b a
a
X Pentru variabila
3
X avem (n urn au rmas a+b-2 bile)


) 0 ( )] 0 ( ) 0 / ) 0 / 1 ((
) 1 ( ) 1 / ) 0 / 1 (( [ ) 1 ( )] 0 ( ) 0
/ ) 1 / 1 (( ) 1 ( ) 1 / ) 1 / 1 (( [
) 0 ( ) 0 / 1 ( ) 1 ( ) 1 / 1 ( ) 1 (
2 1 1 2 3
1 1 2 3 2 1
1 2 3 1 1 2 3
2 2 3 2 2 3 3
= = = = = +
+ = = = = + = = =
= = = + = = = = =
= = = + = = = = =
X P X P X X X P
X P X X X P X P X P
X X X P X P X X X P
X P X X P X P X X P X P

86

.
) )( 2 (
) 2 )( (
) )( 2 (
) 1 ( 2 ) 2 (
2
2
1
2
1
2
2
2
2
2 2
b a
a
b a b a
b a b a a
b a b a
ab ab a a a
b a
b
b a
b
b a
a
b a
a
b a
a
b a
a
b a
b
b a
a
b a
a
b a
a
+
=
+ +
+ +
=
+ +
+ +
=
+
|
.
|
+

+
+

\
|
+

+

+
+
|
.
|

\
|
+

+

+
+

=


Asemntor se arat c )). 1 ( 1 ( ) 0 (
3 3
= =
+
= = X P
b a
b
X P Deci tabloul
repartiiei variabilei
3
X este .
0 1
:
3
|
|
|
.
|

\
|
+ + b a
b
b a
a
X

Se arat n acelai mod c toate variabilele n k X
k
, , 2 , 1 , = au acelai tablou
de repartiie , , , 2 , 1 ,
0 1
: n k
b a
b
b a
a
X
k
=
|
|
|
.
|

\
|
+ +
(dei ele sunt variabile
dependente).
Cu ajutorul variabilelor , , , 2 , 1 , n k X
k
= variabila X se scrie ,
1

=
=
n
k
k
X X
deci media variabilei X este

. ) ( ) (
1 1
np
b a
na
b a
a
X E X E
n
k
n
k
k
=
+
=
+
= =

= =


Pentru dispersie nu mai putem scrie c ) ( X Var este egal cu

=
n
k
k
X Var
1
) ( ,
deoarece variabilele n k X
k
, , 2 , 1 , = nu sunt independente. q.e.d.


3.5. Legea Poisson (legea evenimentelor rare)

Definiia 3.5.1. Variabila aleatoare X urmeaz legea Poisson (X are repartiie
Poisson) cu parametrul ) 0 ( > dac poate lua orice valoare ntreag pozitiv
i

, 2 , 1 , 0 ,
!
) ( = = =

k e
k
k X P
k

(3.5.1)
87

Tabloul repartiiei variabilei X este

.
! ! 2 ! 1 ! 0
2 1 0
:
2 1 0
|
|
|
.
|

\
|





e
k
e e e
k
X
k


Pentru a verifica c suma probabilitilor de pe linia a doua a tabloului de mai
sus este 1, vom folosi dezvoltarea n serie de puteri a funciei , ) (
x
e x f =
i anume

. ,
! ! 2 ! 1
1
2
R x
k
x x x
e
k
x
e + + + + + = (3.5.2)

Folosind relaia (3.5.2) pentru = x , avem

. 1
!
) (
0 0
= = = =

=



e e
k
e k X P
k
k
k


Teorema 3.5.2. Dac variabila aleatoare X are repartiie Poisson cu
parametrul , atunci valoarea medie i dispersia sa sunt

. ) ( , ) ( = = X Var X E (3.5.3)

Demonstraie
Valoarea medie a variabilei X este

.
)! 1 ( !
) (
1
1
0



= =

= =



=

e e
k
e e
k
k X E
k
k
k
k


Pentru dispersie, calculm mai nti media variabilei .
2
X Obinem


. ) (
)! 2 (
) (
!
) 1 (
! !
) (
!
) (
2 2
2
2
2
2 1 1
2
0
2 2




+ = + = +

= +
= + = =


e e X E
k
e X E
e
k
k k e
k
k e
k
k k e
k
k X E
k
k
k
k
k
k
k
k
k
k


Atunci dispersia lui X este

. )] ( [ ) ( ) (
2 2 2 2
= + = = X E X E X Var q.e.d.
88

Propoziia 3.5.3. Dac variabila aleatoare X are repartiie Poisson cu
parametrul , atunci funcia sa caracteristic este

. , ) (
) 1 (
R t e t
it
e
e =

(3.5.4)

Demonstraie
Folosind formula de calcul de la funcia caracteristic, avem

. ,
!
) (
! !
) (
) 1 (
0 0 0
R t e e e
k
e
e e
k
e e e
k
t
it it
e e
k
k it
k
itk
k
k
itk
k
e = = = = =





q.e.d.

Teorema 3.5.4. Variabilele aleatoare independente
1
X i
2
X au repartiii
Poisson cu parametrii
1
i respectiv .
2
Atunci variabila aleatoare
2 1
X X +
are repartiie Poisson cu parametrul .
2 1
+

Demonstraie
Variabila aleatoare
2 1
X X + are ca valori pe , 2 , 1 , 0 Fie 0 > k ntreg.
Atunci avem

( )
.
!
) (
! )! ( !
) ( ) (
) , ( ) , ( ) (
) ( 2 1
0 0
2 1
) (
0
2 1
2 1
0
2 1
0
2 1 2 1
2 1
2 1
2 1






+
= =

+
=

=
=
+
=
=

= = = =
= = = = = = = +

e
k
C
k
e
e
j k
e
j
j k X P j X P
j k X j X P j k X j X P k X X P
k
k
j
k
j
j k j j
k
k
j
j k j
k
j
k
j


Deducem astfel c variabila aleatoare
2 1
X X + are repartiie Poisson cu
parametrul .
2 1
+ Folosind funciile caracteristice ale variabilelor
2 1
, X X ,
exprimate cu ajutorul formulei (3.5.4), i anume
, , ) ( , ) (
) 1 (
2
) 1 (
1
2 1
R t e t e t
it it
e e
e = =

deducem c funcia caracteristic a
variabilei
2 1
X X + este
. , ) ( ) ( ) (
) 1 )( ( ) 1 ( ) 1 (
2 1
2 1 2 1
R t e e e t t t
it it it
e e e
e = = =
+


Din expresia de mai sus a funciei caracteristice rezult c variabila
2 1
X X + are
repartiie Poisson cu parametrul .
2 1
+ q.e.d.

Legtura dintre repartiia binomial i repartiia Poisson este dat de
urmtoarea teorem.

89
Teorema 3.5.5. Fie N k e fixat, iar pentru k n > considerm variabilele
n
X care
au repartiii binomiale cu parametrii n i ,
n
p astfel nct toate s aib aceeai
valoare medie . Atunci are loc relaia

.
!
) ( lim



= = e
k
k X P
k
n
n
(3.5.5)

Rezolvare
Deoarece variabilele k n X
n
> , au aceeai valoare medie , deducem
conform primei relaii din (3.5.3) c valoarea medie a acestor variabile este
. ) ( = =
n n
np X E Deci . / n p
n
= Atunci obinem


,
!
1 lim
) 1 ( ) 1 (
lim
!
1
!
) 1 ( ) 1 (
lim lim ) ( lim


=
|
.
|

\
|

+
=
|
.
|

\
|
|
.
|

\
| +
= = =
e
k n n
k n n n
k
n n k
k n n n
q p C k X P
k
k n
n
k
n
k
k n k
n
k n
n
k
n
k
n
n
n
n


adic relaia (3.5.5). q.e.d.

Observaia 3.5.6. Relaia (3.5.5) ne arat c dac
n
p este suficient de mic i n
suficient de mare, atunci putem aproxima repartiia binomial cu parametrii n i
n
p , prin repartiia Poisson de parametru .
n
np = Din acest motiv repartiia
Poisson se mai numete legea evenimentelor rare. Dac 30 > n i 5 < np atunci
repartiia Poisson cu parametrul np = este o bun aproximare a repartiiei
binomiale cu parametrii n i p.
Aplicaia 3.5.7. S se calculeze momentele iniiale ) (
3
X m i , ) (
4
X m precum i
momentele centrate ) (
3
X i ) (
4
X pentru o variabil aleatoare X cu
repartiie Poisson cu parametrul .

Rezolvare
Din demonstraia teoremei 3.5.2 tim c = = ) ( ) (
1
X E X m , iar
. ) ( ) (
2 2
2
+ = = X E X m Momentul iniial de ordinul al treilea al variabilei X
este .
!
) ( ) (
0
3 3
3

= =
k
k
e
k
k X E X m


Deoarece , ) 1 ( 3 ) 2 )( 1 (
3
k k k k k k k + + = vom scrie pe ) (
3
X m astfel
90

. 3 3
)! 1 ( )! 2 (
3
)! 3 (
! !
) 1 ( 3
!
) 2 )( 1 ( ) (
2 3 2
3
1
1
2
2
2
3
3
3
1 1 2
3





+ + = + +
=

=
+ + =



e e e e
e e
k
e
k
e
k
e
e
k
k e
k
k k e
k
k k k X m
k
k
k
k
k
k
k
k
k
k
k
k


Apoi momentul centrat de ordinul al treilea este


. 3
) ( 3 3 3 3 ) ( 3
) ( 3 ) ( ) 3 3 ( ) ( ) (
3 3
2 2 3 3
1
2
2 3
3 2
2 3 3 2 2 3 3
3



= +
+ + + = + = +
= + = =
m m m X E
X E X E X X X E X E X


Pentru momentul iniial de ordinul al patrulea avem

= =
0
4
4 4
4
.
!
) ( ) (
k
e
k
k X E X m

Deoarece
, ) 1 ( 7 ) 2 )( 1 ( 6 ) 3 )( 2 )( 1 (
4
k k k k k k k k k k k + + + = momentul ) (
4
X m se
scrie astfel



= + +
+ =
3
3
3
4
4
4
1 1
2 3
4
)! 3 (
6
)! 4 ( ! !
) 1 ( 7
!
) 2 )( 1 ( 6
!
) 3 )( 2 )( 1 ( ) (
k
k
k
k
k
k
k
k
k
k
k
k
k
e
k
e e
k
k e
k
k k
e
k
k k k e
k
k k k k X m







. 7 6
7 6
)! 1 ( )! 2 (
7
2 3 4
2 3 4
1
1
2
2
2



+ + + = +
+ + =


e e
e e e e e e
k
e
k
e
k
k
k
k


Apoi momentul centrat de ordinul al patrulea este


. 3 4 ) ( 6 ) 3 ( 4 7 6
4 6 4 ) ( 4 ) ( 6 ) ( 4
) ( ) 4 6 4 ( ) ( ) (
2 4 4 2 2 2 3 2 3 4
4
1
3
2
2
3 4
4 3 2 2 3
4 4 3 2 2 3 4 4
4



+ = + + + + + + + + =
+ + = + +
= + + = =
m m m m X E X E X E
X E X X X X E X E X







91
Capitolul 4


Legi clasice de probabilitate (repartiii) ale
variabilelor aleatoare continue


Introducere
Vom prezenta n acest capitol principalele legi de probabilitate ale
variabilelor aleatoare continue, i anume: legea continu uniform (rectangular),
legea normal (Gauss-Laplace), legea log-normal, legea gamma, legea beta,
legea
2
_ (Helmert-Pearson), legea Student (t) i cazul su particular legea
Cauchy, legea Snedecor i legea Fisher, legea Weibull i cazul su particular
legea exponenial.

4.1. Legea continu uniform (rectangular)

Definiia 4.1.1. Variabila aleatoare X urmeaz legea continu uniform
(rectangular) (X are repartiie uniform) cu parametrii i
e ) 0 , ( > e e R dac densitatea sa de probabilitate (repartiie) este funcia

|
.
|

\
|
+
|
.
|

\
|
e
(

+ e
=
. ,
2 2
, , 0
,
2
,
2
,
1
) (
e

e
x
x
x f (4.1.1)

Observm c funcia f este o densitate de probabilitate, deoarece
, , 0 ) ( R x x f e > i


} }

= = = . 1
1
) (
2
2
2
2
e

e e
x
dx dx x f

Funcia de repartiie a variabilei X este

92

|
.
|

\
|
+ e
(

\
|
+ e
(

+
(

\
|
e
=
. ,
2
, 1
,
2
,
2
,
2
1
,
2
, , 0
) (
e

e
e

x
x x
x
x F (4.1.2)

Graficele funciilor f i F sunt date n Figura 4.1.1 i respectiv Figura 4.1.2.


Figura 4.1.1 Figura 4.1.2

Teorema 4.1.2. Dac variabila aleatoare X are repartiie uniform cu
parametrii i , e atunci valoarea medie i dispersia sa sunt

.
12
) ( , ) (
2
e
= = X Var X E (4.1.3)

Demonstraie
Valoarea medie a variabilei X este

,
2
1
) ( ) (
2
2
2
2
2

e e
e

= = = =
+


} }
x dx
x
dx x xf X E

iar dispersia sa este

.
12
) (
3
1 1
) ( ) ( ) ( ) (
2
2
2
3
2
2
2 2
} }

= = = =
e

e e

e

x dx x dx x f x X Var
q.e.d.

Propoziia 4.1.3. Funcia caracteristic a unei variabile aleatoare X cu
repartiie uniform cu parametrii i e este

93

=
e
|
|
.
|

\
|

=
|
.
|

\
|
+ |
.
|

\
|

. 0 , 1
, ,
) (
* 2 2
t
R t e e
t
i
t
it it
e

e (4.1.4)

Demonstraie
Pentru , 0 = t avem

,
1 1
) ( ) (
2 2
2
2
2
2
|
|
.
|

\
|
= = = =
|
.
|

\
|
+ |
.
|

\
|

+


} }
e

e e e

it it
itx itx itx
e e
t
i
e
it
dx e dx x f e t

iar
}


= = . 1 ) ( ) 0 ( dx x f q.e.d.

Aplicaia 4.1.4. S se calculeze momentele ) ( ), (
3 2
X m X m i ) (
3
X pentru o
variabil aleatoare X cu repartiie uniform cu parametrii i . e

Rezolvare
Momentul iniial de ordinul al doilea este


.
12 4
3
3
1
2
2 3
1
3
1 1
) ( ) (
2
2
3
2
3
3
2
2
3
2
2
2 2
2
e

e
e
e
e

e e e
e

+ =
|
|
.
|

\
|
+ =
(
(

(
|
.
|

\
|

|
.
|

\
|
+ = = = =
} }

x dx x dx x f x X m


Apoi momentul iniial de ordinul al treilea este


,
4
) 4 (
4
1
2
2 4
1
4
1 1
) ( ) (
2
3 3 3
4
4
2
2
4
2
2
3 3
3
e
e e
e
e

e e e
e

+ = + =
(
(

(
|
.
|

\
|

|
.
|

\
|
+ = = = =
+

} }
x dx x dx x f x X m


iar momentul centrat de ordinul al treilea este

. 0 ) (
4
1 1
) ( ) ( ) ( ) (
2
2
4
2
2
3 3
3
= = = =
+

} }
e


e e
x dx x dx x f x X

94
Aplicaia 4.1.5. Variabilele aleatoare X i Y sunt independente. X are repartiie
uniform pe intervalul [0,1], iar Y are repartiie uniform pe intervalul [0,2]. S
se calculeze densitatea de probabilitate a variabilei X+Y.

Rezolvare
Dac
1
f i
2
f sunt densitile de probabilitate ale variabilelor aleatoare X
i respectiv Y, atunci
}


=1 ) (
1
dx x f i . 1 ) (
2
}


= dx x f Deducem din aceste
relaii c parametrii variabilei X sunt 1
1
= e i ,
2
1
1
= iar parametrii variabilei Y
sunt 2
2
= e i . 1
2
= Atunci densitile de probabilitate vor avea forma

e
e
=

e
e
=
]. 2 , 0 [ , 0
], 2 , 0 [ ,
2
1
) (
], 1 , 0 [ , 0
], 1 , 0 [ , 1
) (
2 1
x
x
x f
x
x
x f

Deoarece X i Y sunt independente, densitatea de probabilitate a variabilei
X+Y este dat de formula


}


= . ) ( ) ( ) (
2 1
dy y f y x f x f

Observm c 0 ) (
1
= y x f pentru ] 1 , 0 [ e y x sau echivalent ] , 1 [ x x y e , iar
0 ) (
2
= y f pentru ]. 2 , 0 [ e y Deci 0 ) ( ) (
2 1
= y f y x f pentru . ] 2 , 0 [ ] , 1 [ x x y e
Avem urmtoarele patru cazuri:
a) Dac , ] 3 , 0 [ e x atunci , ] 2 , 0 [ ] , 1 [ u = x x deci . 0 ) ( = x f
b) Dac , ) 1 , 0 [ e x atunci ] , 0 [ ] 2 , 0 [ ] , 1 [ x x x = i

.
2 2
1
) ( ) ( ) (
0 0
2 1
x
dy dy y f y x f x f
x x
= = =
} }


c) Dac , ) 2 , 1 [ e x atunci ] , 1 [ ] 2 , 0 [ ] , 1 [ x x x x = i


} }

= = =
x
x
x
x
dy dy y f y x f x f
1 1
2 1
.
2
1
2
1
) ( ) ( ) (

d) Dac , ] 3 , 2 [ e x atunci ] 2 , 1 [ ] 2 , 0 [ ] , 1 [ = x x x i

.
2
3
2
1
) ( ) ( ) (
2
1
2
1
2 1
x
dy dy y f y x f x f
x x

= = =
} }



95
Deci densitatea de probabilitate a variabilei X+Y este funcia

e
e
e
e
=
]. 3 , 0 [ , 0
], 3 , 2 [ , 2 / ) 3 (
), 2 , 1 [ , 2 / 1
), 1 , 0 [ , 2 /
) (
x
x x
x
x x
x f

4.2. Legea normal (Gauss-Laplace). Legea normal standard
(legea normal centrat redus)

Definiia 4.2.1. Variabila aleatoare X urmeaz legea normal (Gauss-Laplace)
(X are repartiie normal) cu parametrii mi o ) 0 , ( > e o R m dac densitatea
sa de probabilitate (repartiie) este funcia

. ,
2
1
) , ; (
2
2
2
) (
R x e m x f
m x
e =

o
t o
o (4.2.1)

O variabil aleatoare cu repartiie normal cu parametrii mi o se noteaz
cu ). , (
2
o m N
Funcia f de mai sus se numete densitatea de repartiie normal sau
gaussian. Observm c f este o densitate de probabilitate, deoarece
R x x f e > , 0 ) ( i
}


= . 1 ) ( dx x f ntr-adevr, pentru a verifica ultima relaie,
n integrala de mai sus facem schimbarea de variabil .
2
y
m x
=

o
Rezult c
. 2 dy dx o = Dac x atunci , y iar dac x atunci . y
Obinem astfel

. 1
2 1
) (
0
2 2
= = =
} } }


dy e dy e dx x f
y y
t t


Am folosit mai sus integrala lui Euler-Poisson . 2 /
0
2
t =
}


dy e
y

Graficul funciei f are form de clopot (vezi Figura 4.2.1). Dreapta de
ecuaie m x = este ax de simetrie pentru acest grafic, iar pentru m x = se obine
valoarea maxim a funciei f, i anume .
2
1
t o
Punctele o = m x i o + = m x
sunt puncte de inflexiune.


96

Figura 4.2.1

Pentru 0 = m i 1 = o funcia f dat de relaia (4.2.1) devine

. ,
2
1
) 1 , 0 ; (
2
2
R x e x f
x
e =

t
(4.2.2)

Vom spune despre o variabil aleatoare X care are ca densitate de
probabilitate funcia (4.2.2) c urmeaz legea normal standard sau legea
normal centrat redus.
Pentru a determina funcia de repartiie ) , ; ( o m x F a unei variabile aleatoare
X cu repartiie normal cu parametrii mi , o vom determina mai nti funcia de
repartiie pentru o variabil aleatoare cu repartiie normal standard, notat cu
) 1 , 0 ; (x F i numit funcia de repartiie normal standard. Conform relaiei de
legtur dintre f i F, avem

, ) (
2
1
) 1 , 0 ; ( ) 1 , 0 ; ( ) 1 , 0 ; ( ) 1 , 0 ; (
0
0
x dt t f dt t f dt t f x F
x x
u + = + = =
} } }

(4.2.3)

unde .
2
1
) (
0
2 /
2
}

= u
x
t
dt e x
t
Funcia ude mai sus se numete funcia
integral a lui Laplace, pentru valorile creia sunt ntocmite tabele.
Dac variabila aleatoare X urmeaz legea normal cu parametrii mi
, o atunci variabila aleatoare ) (
1
m X Y =
o
urmeaz legea normal cu parametrii
0 i 1. ntr-adevr, dac
1
F este funcia de repartiie a variabilei Y, atunci

, ) , ; ( ) ( ) ( ) (
1
o o o m x m F x m X P x Y P x F + = + s = s = (4.2.4)

iar densitatea de probabilitate a variabilei Y este

97
. ), 1 , 0 ; (
2
1
) , ; ( ) ( ) (
2 / '
1 1
2
R x x f e m x m f x F x f
x
e = = + = =

t
o o o

Deci , ), 1 , 0 ; ( ) (
1
R x x F x F e = adic variabila Y urmeaz legea normal cu
parametrii 0 i 1. Din ultima relaie i relaia (4.2.4) obinem

. ), , ; ( ) 1 , 0 ; ( R x m x m F x F e + = o o (4.2.5)

Rezult astfel c pentru variabila aleatoare X cu repartiie normal cu
parametrii mi , o funcia de repartiie este

.
2
1
1 , 0 ; ) , ; ( |
.
|

\
|
u + = |
.
|

\
|
=
o o
o
m x m x
F m x F (4.2.6)

Teorema 4.2.2. Dac variabila aleatoare X are repartiie normal cu parametrii
mi , o atunci valoarea medie i dispersia sa sunt

. ) ( , ) (
2
o = = X Var m X E (4.2.7)

Demonstraie
Valoarea medie a variabilei aleatoare X este

.
2
1
) , ; ( ) (
2
2
2
) (
} }



= = dx xe dx m x xf X E
m x
o
t o
o

n integrala de mai sus vom face schimbarea de variabil , y
m x
=

o
de unde
rezult ; dy dx o = pentru x rezult , y iar pentru x rezult
. y Deci obinem


} }
} }



= = +
= + =
. ) 1 , 0 ; (
2
2
) (
2
1
) (
2 /
2 / 2 /
2
2 2
m dy y f m dy e
m
dy ye dy e m y X E
y
y y
t
t
o
o o
t o


Dispersia variabilei X este

. ) (
2
1
) , ; ( ) ( ) (
2
2
2
) (
2 2
dx e m x dx m x f m x X Var
m x
} }



= =
o
t o
o

98
Folosind schimbarea de variabil de mai sus, obinem
( ) ( )
.
2
2 2 2
2 2
1
) (
2 2 /
2
2 /
2
'
2 /
2
2 /
2
2 / 2
2
2 / 2 2
2
2 2 2
2 2
o
t
o
t
o
t
o
t
o
t
o
o o
t o
= +
= = =
= =
}
} }
} }



dy e
ye dy e y dy ye y
dy e y dy e y X Var
y
y y y
y y


Deducem de aici c abaterea medie ptratic a variabilei X este . o o =
X
q.e.d.

Propoziia 4.2.3. Dac variabila aleatoare X are repartiie normal cu
parametrii mi , o atunci funcia sa caracteristic este

. , ) (
2
2 2
R t e t
t
imt
e =

o

(4.2.8)

Demonstraie
Funcia caracteristic a variabilei X este


. ,
2
1
2
1
2
1
2
1
) ( ) (
2
2 2
2
2 2 2 2 4 2
2
2 2
2
2 2 2 2 2
2
2 2 2
2
2
2
)] ( [
2
2
2
) (
2
) ( ) ( 2
2
2 2
2
) (
R t dx e e
dx e e
dx e dx e e dx x f e t
it m x m mit t i m
it m m it m it m x x
itx m mx x m x
itx itx
e =
=
= = =
}
}
} } }

+ +


+ + + + +



o
o
o
o o
o
o
o
o o
o
o
o
t o
t o
t o t o



Folosind schimbarea de variabil ,
2
) (
2
u
it m x
=
+
o
o
obinem

. ,
1
) (
2 2
2 2
2
2 2
R t e du e e t
t
imt
u
t
imt
e = =


}
o o
t
q.e.d.

Propoziia 4.2.4. Dac variabila aleatoare X are repartiie normal cu
parametrii mi , o iar , 0 , , , > e k R k b a atunci
a) ; ) ( |
.
|

\
|
u |
.
|

\
|
u = < <
o o
m a m b
b X a P (4.2.9)
b) . ) ( 2 ) | (| k k m X P u = < o (4.2.10)
99
Demonstraie
a) Din relaia (4.2.6) i continuitatea funciei F deducem c


.
2
1
2
1
) , ; ( ) , ; ( ) (
|
.
|

\
|
u |
.
|

\
|
u =
(

|
.
|

\
|
u +
(

|
.
|

\
|
u + = = < <
o o
o o
o o
m a m b
m a m b
m a F m b F b X a P


b) Conform relaiei (4.2.9) obinem

, ) ( 2 ) ( ) ( ) ( ) | (| k k k k m X k m P k m X P u = u u = + < < = < o o o

deoarece funcia u este impar ). ) ( ) ( ( k k u = u q.e.d.

Observaia 4.2.5. Dac lum 3 = k n relaia (4.2.10) rezult

. 9974 , 0 ) 3 ( 2 ) 3 | (| ~ u = < o m X P (4.2.11)

Relaia (4.2.11) ne spune c aproape toate valorile variabilei X sunt situate n
intervalul . ) 3 , 3 ( o o + m m Egalitatea din (4.2.11) este cunoscut sub numele
de regula celor ase . o

Propoziia 4.2.6. Dac variabila aleatoare X are repartiie normal cu
parametrii mi , o atunci momentele sale centrate sunt

, , ! )! 1 2 ( ) ( , 0 ) (
* 2
2 1 2
N p p X X
p
p p
e = =

o (4.2.12)

unde . ) 1 2 ( 5 3 1 ! )! 1 2 ( = p p

Demonstraie
Momentul centrat de ordinul k este


} }

= = . ) (
2
1
) ( ) ( ) (
2
2
2
) (
dx e m x dx x f m x X
m x
k k
k
o
t o
(4.2.13)

Obinem astfel

} }


= = = = = = . ) ( ) ( , 0 ) ( ) ( ) ( , 1 ) ( ) (
2
2 1 0
o X Var X dx x f m x X dx x f X


100
Pentru , 2 > k n integrala din relaia (4.2.13) vom face schimbarea de variabil
,
2
y
m x
=

o
de unde deducem c ; 2 dy dx o = apoi pentru x rezult
, y iar pentru x rezult . y Obinem atunci


( )
. ) 1 (
) 2 (
2
) 2 (
) 1 (
2
) 2 (
) 1 (
2
) 2 (
2
) 2 ( ) 2 (
) (
2
2 2
2 2
2 1
'
1
2
2 2
2 2



= =
+ =
= =
}
}
} }
k
y k
k
y k
k
y k
k
y k
k
y k
k
k
k dy e y k
dy e y k e y
dy e y dy e y X
o
t
o o
t
o
t
o
t
o
t
o



Deci am dedus relaia de recuren
. ) ( ) 1 ( ) (
2
2
X k X
k k
= o Deoarece , 0 ) ( , 1 ) (
1 0
= = X X din relaia de mai
sus rezult relaiile (4.2.12). q.e.d.

Propoziia 4.2.7. Dac variabiele aleatoare indepedente X i Y au repartiii
normale cu parametrii
1
m i ,
1
o respectiv
2
m i ,
2
o atunci variabilele X+Y i
X-Y au repartiii normale cu parametrii
2 1
m m m + = i ,
2
2
2
1
o o o + =
respectiv
2 1
m m m = i .
2
2
2
1
o o o + =

Demonstraie
Vom calcula mai nti densitile de probabilitate pentru variabilele X+Y
i X-Y, pentru cazul particular 0
2 1
= = m m i . 1
2 1
= = o o Dac notm cu f i g
densitile de probabilitate ale variabilelor X i Y, atunci conform relaiei (4.2.2)
avem

. ,
2
1
) ( ) (
2 /
2
R x e x g x f
x
e = =

t


Densitatea de probabilitate a variabilei X+Y este

101

. ,
2 2
1
2
1
2
1
2
1
2
1
2
1
) ( ) ( ) (
2
2
2
2
2 2
2
2
2
2 2
) 2 ( 2
4 4
2 /
4
2
2
2 2
) (
R x e
e dz e e dy e e
dy e dy e e dy y g y x f x h
x
x
z
x
z x y
x
x
y
x
xy y
y y x
e

=
= = =
= = =






=
|
.
|

\
|


|
|
.
|

\
|
+



} }
} } }
t
t t t
t t


Deducem astfel c X+Y urmeaz i ea legea normal cu parametrii 0 = m i
. 2 = o
Asemntor pentru densitatea de probabilitate a variabilei aleatoare X-Y
obinem


. ,
2 2
1
2
1
2
1
2
1
2
1
2
1
) ( ) ( ) (
2
2
2
2
2 2
2
2
2
2 2
) 2 ( 2
4 4
2 /
4
2
2
2 2
) (
R x e
e dz e e dy e e
dy e dy e e dy y g y x f x k
x
x
z
x
z x y
x
x
y
x
xy y
y y x
e

=
= = =
= = + =






= +
|
.
|

\
|
+


|
|
.
|

\
|
+ +

+


} }
} } }
t
t t t
t t


Rezult c X-Y urmeaz legea normal cu parametrii 0 = m i . 2 = o
n cazul general al variabilelor X i Y cu repartiii normale cu parametrii
1
m i
,
1
o respectiv
2
m i ,
2
o putem s facem un calcul asemntor celui de sus, sau se
poate raiona mai simplu folosind funciile caracteristice ale variabilelor.
Conform relaiei (4.2.8) funciile caracteristice ale variabilelor X i Y sunt

. , ) ( , ) (
2
2
2
1
2 2
2
2
2 2
1
1
R t e t e t
t
t im
t
t im
e = =

o o


Atunci funcia caracteristic a variabilei aleatoare X+Y este


( )
. , ) ( ) ( ) (
2
) (
2 1
2 2
2
2
1
2 1
R t e t t t
t
t m m i
e = =
+
+
o o


Se observ c este tocmai funcia caracteristic corespunztoare legii normale
cu parametrii
2 1
m m m + = i .
2
2
2
1
o o o + =
Asemntor funcia caracteristic a variabilei aleatoare X-Y este

102

( )
. , ) ( ) ( ) (
~ 2
) (
2 1
2 2
2
2
1
2 1
R t e t t t
t
t m m i
e = =
+

o o


Se observ c
~
este funcia caracteristic corespunztoare legii normale cu
parametrii
2 1
m m m = i .
2
2
2
1
o o o + = q.e.d.

Legea normal reprezint cazul limit al multor legi de probabilitate.
Astfel menionm urmtorul rezultat de legtur ntre repartiia normal i
repartiia Poisson.

Teorema 4.2.8. Dac variabila aleatoare ) 0 ( >

X are repartiie Poisson cu


parametrul , atunci funcia de repartiie a variabilei aleatoare

X
tinde
ctre funcia de repartiie normal standard, pentru .

n ipotezele Teoremei 4.2.8 se mai spune c variabila aleatoare

X
este
asimptotic normal.

Legtura dintre repartiia binomial i repartiia normal este dat n
urmtoarea teorem.

Teorema 4.2.9. (Moivre-Laplace) Dac variabila aleatoare
n
X are repartiie
binomial cu parametrii n i p (p nu depinde de n), iar X are repartiie normal
standard, atunci

.
2
1
) ( lim
2 /
2
}


= < < =
|
|
.
|

\
|
<

<
b
a
x n
n
dx e b X a P b
npq
np X
a P
t
(4.2.14)

Teorema 4.2.9 ne spune c pentru valori mari ale lui n putem folosi tabelele
legii normale pentru studiul variabilelor aleatoare cu repartiii binomiale. Pentru
, 30 > n exist urmtoarea regul practic care ne permite s aproximm repartiia
binomial prin cea normal:
- Dac , 10 ) , ( min > nq np atunci aproximarea este foarte bun.
- Dac ), 10 , 5 ( ) , ( min e nq np atunci aproximarea este acceptabil, dac nu
este nevoie de mare precizie.
- Dac , 5 ) , ( min s nq np atunci nu se folosete aceast aproximare.
Teorema lui Moivre-Laplace este un caz particular al aa numitei Teorema
limit central, care spune c funcia de repartiie a unei sume de variabile
aleatoare independente tinde n condiii destul de generale ctre funcia de
103
repartiie normal. De fapt, prin Teorema limit central se nelege un grup de
teoreme care trateaz problema repartiiei limit a sumelor de variabile aleatoare
(nu ntotdeauna independente). Rezultatul cel mai general n cazul variabilelor
aleatoare independente este teorema lui Lindeberg-Fellar. n aplicaii este foarte
util un caz particular al acestei teoreme, prezentat mai jos.

Teorema 4.2.10. (Liapunov) Fie variabilele aleatoare independente
1 , > n X
n
cu mediile i dispersiile , 1 , ) ( , ) (
2
> = = n X Var X E m
n n n n
o care au
momente centrate absolute de ordinul al treilea . 1 , ) | (|
3 3
> = n m X E
n n n

Dac , 0
) (
) (
lim =

n
n
n
o

unde
2 2
2
2
1
) (
n
n o o o o + + + = i
, ) (
3
3 3
2
3
1 n
n + + + = atunci , ) 1 , 0 ; ( ) ( lim x F x F
n
n
=

unde
n
F este funcia
de repartiie a variabilei aleatoare

=
=
n
k
k k
m X
n
X
1
. ) (
) (
1
o


Aplicaia 4.2.11. Se arunc o moned de 256 de ori. Care este probabilitatea ca
numrul de apariii ale stemei s fie cuprins ntre 112 i 144?

Rezolvare
S notm cu X variabila aleatoare care are ca valori numrul de apariii
ale stemei, atunci cnd se arunc moneda de 256 de ori. Variabila X are
repartiia binomial cu parametrii n=256 i p=1/2 (probabilitatea ca la o aruncare
s apar stema). n aceast aplicaie trebuie s calculm P(112<X<144).
Deoarece E(X)=np=128, iar , 8 = = npq
X
o atunci are loc relaia

. 2
8
128
2 ) 144 112 ( |
.
|

\
|
<

< = < <


X
P X P

Vom folosi Teorema 4.2.9 (Moivre-Laplace) i vom aproxima repartiia
8
128 X
cu repartiia normal standard Y. Obinem

. 95 , 0 ) 2 ( 2 ) 2 ( ) 2 ( ) 2 2 ( 2
8
128
2 ~ u = u u = < < ~ |
.
|

\
|
<

< Y P
X
P

Aplicaia 4.2.12. De cte ori trebuie s aruncm un zar corect astfel nct
probabilitatea ca abaterea frecvenei relative a feei 1 de la numrul p=1/6 s
fie cuprins ntre -0,03 i 0,03, este 0,95.

Rezolvare
104
Dac n n aruncri faa 1 apare de
n
o ori, vom determina pe n astfel nct
s aib loc relaia

. 95 , 0 03 , 0 03 , 0 = |
.
|

\
|
< < p
n
P
n
o
(4.2.15)

Relaia (4.2.15) se mai poate scrie astfel

.
6
5
1 , 95 , 0
03 , 0
= = =
|
|
.
|

\
|
<

p q
pq
n
npq
np
P
n
o
(4.2.16)
Folosind relaiile (4.2.14) i (4.2.9) (cu 1 , 0 = = o m ) pentru ,
03 , 0
pq
n
a b = =
din relaia (4.2.16) deducem c


. 975 , 0
5
18 , 0
2
1
5
18 , 0
475 , 0
5
18 , 0
95 , 0
03 , 0
2
=
|
|
.
|

\
|
u + =
|
|
.
|

\
|

=
|
|
.
|

\
|
u =
|
|
.
|

\
|
u
n n
F
n
pq
n


Folosind un tabel cu valorile funciei , u rezult c . 96 , 1 5 / 18 , 0 = n Obinem
. 8 , 592 ~ n Deci trebuie s aruncm zarul de 593 de ori pentru a fi verificat
relaia (4.2.15).

Aplicaia 4.2.13. O main produce o pies circular. Piesa este bun dac
diametrul su d este cuprins ntre 3,99 cm i 4,01 cm. Care este probabilitatea
producerii unei piese defecte de ctre maina respectiv, tiind c d are
repartiie normal cu media 4,002 cm i abaterea medie ptratic 0,005 cm ?

Rezolvare
Conform formulei (4.2.9), probabilitatea ca o pies s fie bun este


. 937 , 0 ) 4 , 2 ( ) 6 , 1 ( ) 4 , 2 ( ) 6 , 1 (
005 , 0
002 , 4 99 , 3
005 , 0
002 , 4 01 , 4
) 01 , 4 99 , 3 (
~ u + u = u u = |
.
|

\
|
u
|
.
|

\
|
u = |
.
|

\
|
u |
.
|

\
|
u = < <
o o
m a m b
d P


Rezult atunci c probabilitatea ca piesa s fie defect este 1-0,937=0,063.

105
Aplicaia 4.2.14. O main produce o pies circular. Cnd maina este bine
reglat, diametrul d al pieselor are repartiie normal cu media 10 cm i
abaterea medie ptratic 0,08 cm. Se iau la ntmplare 4 piese fabricate de
main i se constat c media aritmetic a diametrelor acestor piese este 10,14
cm. Se poate afirma c maina s-a dereglat ?

Rezolvare
Fie
4 3 2 1
, , , d d d d diametrele celor 4 piese alese la ntmplare. Acestea sunt
4 variabile aleatoare indepedente cu repartiii normale cu media 10 cm i
abaterea medie ptratic 0,08. Atunci variabila 4 / ) (
4 3 2 1
d d d d d + + + = are de
asemenea repartiie normal cu media 10 cm i abaterea medie ptratic 0,04 cm.
ntr-adevr, avem


. 04 , 0 , 0016 , 0 ) (
16
1
4
) (
, 10 ) (
4
1
4
) (
4
1
4 3 2 1
4
1
4 3 2 1
= = = |
.
|

\
| + + +
=
= = |
.
|

\
| + + +
= =

=
=
d
i
i
i
i
d Var
d d d d
Var d Var
d E
d d d d
E d E m
o


Conform regulei celor ase o (relaia (4.2.11)), avem

, 997 , 0 ) 3 3 ( 997 , 0 ) 3 ( 2 ) 3 | (| ~ + < < ~ u = < o o o m d m P m d P

de unde rezult c . 997 , 0 ) 12 , 10 88 , 9 ( ~ < < d P Din aceast ultim relaie
deducem c d ia valori n afara intervalului (9,88; 10,12) cu o probabilitate mai
mic de 0,003. Deci este aproape sigur c maina s-a defectat.


4.3. Legea log-normal

Definiia 4.3.1. Variabila aleatoare X urmeaz legea log-normal (logaritmic
normal) (X are repartiie log-normal ) cu parametrii mi o ) 0 , ( > e o R m
dac densitatea sa de probabilitate (repartiie) este funcia

s
>
=

. 0 , 0
, 0 ,
2
1
) , ; (
2
2
2
) (ln
x
x e
x
m x f
m x
o
t o
o (4.3.1)

Funcia f din (4.3.1) este o densitate de probabilitate, deoarece
R x x f e > , 0 ) ( i
}


= . 1 ) ( dx x f ntr-adevr pentru ultima relaie avem

106
. 1
2
1 1
2
1
) (
2
ln
0
2
) (ln
2
2
2
= = =
} } }




dt e dx e
x
dx x f
t
t
m x
m x
t t o
o
o


Funcia de repartiie a variabilei log-normale X cu parametrii mi o este
0 ) ( = x F pentru , 0 s x iar pentru x>0 este

, 1 , 0 ;
ln
2
1 1
2
1
) ( ) (
ln
2
ln
0
2
) (ln
2
2
2
|
.
|

\
|
=
= = =
} } }


o
t t o
o
o
o
m x
F
du e dt e
t
dt t f x F
m x u
u
m t
x
m t
x


unde F(x;0,1) este funcia de repartiie normal standard. Deducem din ultima
relaie c pentru valorile pozitive ale lui X, variabila
o
m X
Y

=
ln
urmeaz legea
normal standard.

Teorema 4.3.2. Dac variabila aleatoare X are repartiie log-normal cu
parametrii mi , o atunci momentele iniiale de ordinul k sunt

. , ) (
* , 2
2 2
N k e X m
k
mk
k
e =
+
o
(4.3.2)

Demonstraie
Conform formulei pentru momentele iniiale de ordinul k, avem


.
2
1
2
1
2
1
2
1
2
1
2
1
) ( ) (
2
2 2
2
2 2 4
2
2 2 4 2 2
2
2 2 2 2 2 2 2
2
2 2 2
2
2
2
2
2
)] ( [
2
2
2
2 )] ( [
2
) ( ) ( ) ( 2
2
2 2
2
) (
ln
0
2
) (ln
} }
}
} }
} }


+ + + + +




= =
=
= =
= = =
dy e e dy e
dy e
dy e dy e e
dx e x
x
dx x f x X m
k m y mk k k m k k m y
m k m k m k m y y
yk m my y m y
ky
y x
m x
k k
k
o
o
o
o o
o
o o o
o
o o o
o
o
o
o
t o t o
t o
t o t o
t o


Notm u k m y = ) 2 /( ) (
2
o o i obinem

. 2
2
1
) (
2 2
2
2 2
2
2 2
k
mk
u
mk k
k
e du e e X m
o o
t o
t o
+


+
= =
}
q.e.d.
107

Din relaia (4.3.2) deducem c media i dispersia variabilei X cu repartiie
log-normal cu parametrii mi o sunt

. ) 1 ( )] ( [ ) ( ) ( , ) ( ) (
2 2
2
2 2
1 2
2
1
= = = =
+
+
o o
o
e e X m X m X Var e X m X E
m
m
(4.3.3)


4.4. Legea gamma

Definiia 4.4.1. Variabila aleatoare X urmeaz legea gamma (X are repartiie
gamma ) cu parametrul ) 0 ( > p p dac densitatea sa de probabilitate
(repartiie) este funcia

s
>
I =

, 0 , 0
, 0 ,
) ( ) (
1
x
x
p
e x
x f
x p
(4.4.1)
unde
}


> = I
0
1
0 , ) ( p dx e x p
x p
este integrala lui Euler de al doilea tip sau
funcia gamma a lui Euler.

Funcia f din (4.4.1) este o densitate de probabilitate, deoarece
R x x f e > , 0 ) ( i


} }


=
I
= . 1
) (
1
) (
0
1
dx e x
p
dx x f
x p


n propoziia urmtoare vom prezenta cteva proprieti ale funciei I(pentru
demonstraiile lor vezi [21]).

Propoziia 4.4.2. Integrala (funcia) lui Euler
}


e = I
0
1
, ) ( R p dx e x p
x p

verific urmtoarele proprieti:
a) ) ( p I este convergent pentru p>0 i divergent pentru ; 0 s p
b) ; 0 ), ( ) 1 ( > I = + I p p p p
c) ; , )! 1 ( ) (
*
N n n n e = I
d) ( ) . 2 / 1 t = I

Teorema 4.4.3. Dac variabila aleatoare X are repartiie gamma cu parametrul
p, atunci momentele iniiale de ordinul k sunt

108
. ), 1 ( ) 1 ( ) (
*
N k k p p p X m
k
e + + = (4.4.2)

Demonstraie
Momentul iniial de ordinul k este

) (
) (
) (
1
) ( ) (
0
1
p
p k
dx e x
p
dx x f x X m
x p k k
k
I
+ I
=
I
= =
} }

+




. ) 1 ( ) 2 )( 1 (
) (
) ( ) 1 ( ) 1 (
) (
) 1 ( ) 1 (
p p p k p k
p
p p p p k
p
p k p k
+ + + =
I
I + +
= =
I
+ I +
=



Am folosit mai sus proprietatea b) din Propoziia 4.4.2. q.e.d.

Din relaia (4.4.2) deducem c media i dispersia variabilei X cu repartiie
gamma cu parametrul p sunt

. )] ( [ ) ( ) ( , ) ( ) (
2
1 2 1
p X m X m X Var p X m X E = = = = (4.4.3)

Definiia 4.4.4. Variabila aleatoare X urmeaz legea gamma generalizat (X
are repartiie gamma generalizat ) cu parametrii 0 > p i 0 > dac
densitatea sa de probabilitate (repartiie) este funcia

s
>
I =

, 0 , 0
, 0 ,
) ( ) (
1
x
x
p
e x
x f
x p p

(4.4.4)

ntr-un mod asemntor cu demonstraia Teoremei 4.4.3 se arat urmtoarea
teorem.

Teorema 4.4.5. Dac variabila aleatoare X are repartiie gamma generalizat
cu parametrii 0 > p i 0 > , atunci momentele iniiale de ordinul k sunt

, ,
) 1 ( ) 1 (
) (
*
N k
k p p p
X m
k k
e
+ +
=

(4.4.5)

deci media i dispersia sa sunt

. )] ( [ ) ( ) ( , ) ( ) (
2
2
1 2 1

p
X m X m X Var
p
X m X E = = = = (4.4.6)
109

Propoziia 4.4.6. Dac variabila aleatoare X are repartiie gamma generalizat
cu parametrii 0 > p i 0 > , atunci funcia sa caracteristic este

. , 1 ) ( R t
it
t
p
e |
.
|

\
|
=

(4.4.7)

Demonstraie
Pentru determinarea funciei caracteristice a variabilei X vom folosi formula care
d momentul de ordinul k al variabilei X n funcie de derivatele funciei
caracteristice c n punctul 0, i anume , ) 0 (
) ( k k
k
i m

= ( 1
0
= m ), precum i
dezvoltarea n serie de puteri a funciei care are forma urmtoare

.
!
) (
! !
) 0 (
) (
0 0 0
) (


=

=
= = =
k
k
k
k k
k
k
k k
k
m
k
it
t
k
i m
t
k
t



Folosind formula (4.4.5) pentru momentele iniiale ale variabilei X, obinem
pentru funcia caracteristic formula


. , 1
!
) 1 ( ) 1 (
) 1 ( ) 1 (
!
) (
!
) (
) (
0
0 0
R t
it it
k
k p p p
k p p p
k
it
m
k
it
t
p
k
k
k
k
k
k
k
k
e
|
.
|

\
|
=
|
.
|

\
| + +
=
+ +
= =


q.e.d.

Din relaia (4.4.7) pentru , 1 = deducem c funcia caracteristic a unei
variabile X cu repartiie gamma cu parametrul p este

( ) . , 1 ) ( R t it t
p
e =

(4.4.8)

Propoziia 4.4.7. Dac variabilele aleatoare independente X i Y au repartiii
gamma cu parametrii p i respectiv q, atunci variabila X+Y are repartiie
gamma cu parametrul p+q.

Demonstraie
S notm cu f i g densitile de probabilitate pentru variabilele X i Y.
Deci

110

s
>
I = =

. 0 , 0
, 0 ,
) (
1
) ( ) (
1
x
x e x
p x g x f
x p


Densitatea de probabilitate h a variabilei X+Y este
}


= . ) ( ) ( ) ( dy y g y x f x h
Dac 0 s x atunci


} }


= + =
0
0
, 0 ) ( ) ( ) ( ) ( ) ( dy y g y x f dy y g y x f x h

(n prima integral g(y)=0, iar n a doua integral f(x-y)=0).
Dac , 0 > x atunci 0 ) ( = y x f pentru , 0 x y y x s > iar 0 ) ( = y g pentru
. 0 > y Deci 0 ) ( ) ( = y g y x f dac ] , 0 [ x y e i atunci


. ) (
) ( ) (
) (
1
) (
) (
1
) ( ) ( ) (
0
1 1
0 0
1 1
}
} }

I I
=
I

I
= =
x
q p
x
x x
y q y x p
dy y y x
q p
e
dy e y
q
e y x
p
dy y g y x f x h


Pentru calculul ultimei integrale de mai sus facem schimbarea de variabil y=tx,
deci dy=xdt; pentru 0 y rezult , 0 t iar pentru x y rezult
. 1 t Obinem astfel


.
) ( ) ( ) (
) , (
) 1 (
) ( ) (
) ( ) (
) ( ) (
) (
1
1
1
0
1 1
1
0
1
1 1
q p
x e
q p
p q B
x e
dt x x
q p
x e
dt x tx tx x
q p
e
x h
q p x
q p x
p q
q p x
q p
x
+ I
=
I I
=

I I
=
I I
=
+
+

+

} }


Rezult c variabila X+Y are repartiie gamma cu parametrul p+q.
Concluzia acestei propoziii o putem obine mai direct folosind funciile
caracteristice. Fie
1
i
2
funciile caracteristice ale variabilelor X i Y, i
anume

( ) . , ) 1 ( ) ( , 1 ) (
2 1
R t it t it t
q p
e = =



Atunci funcia caracteristic a variabilei aleatoare X+Y este

( ) . , 1 ) ( ) ( ) (
) (
2 1
R t it t t t
q p
e = =
+


111
Deducem din relaia obinut c X+Y are repartiie gamma cu parametrul p+q.
q.e.d.

Propoziia 4.4.8. Dac variabila aleatoare X urmeaz legea normal cu
parametrii m i , o atunci variabila aleatoare
2
2
) (
2
1
m X Y =
o
are o repartiie
gamma cu parametrul 1/2.

Demonstraie
S notm cu G(x) funcia de repartiie a variabilei Y. Deoarece , 0 > Y
atunci pentru 0 s x rezult c . 0 ) ( ) ( = s = x Y P x F Pentru 0 > x avem


.
2
) 2 ( 2
2 2
) 2 2 (
2 2
) (
) ( ) (
2
0
2 /
2
2
2
}

= u =
|
|
.
|

\
|

u
|
|
.
|

\
|
+
u = + s s =
|
.
|

\
|
s

s =
|
|
.
|

\
|
s

= s =
x
t
dt e x
m x m m x m
x m X x m P
x
m X
x P x
m X
P x Y P x G
t
o
o
o
o
o o
o o


Atunci pentru 0 > x densitatea de probabilitate g a variabilei aleatoare Y este

,
1 1
) ( ' ) (
2 / 1 x x
e x e
x
x G x g

= = =
t t


iar pentru , 0 s x g(x)=0.
Deoarece ) 2 / 1 ( I = t (conform Propoziiei 4.4.2, d)), deducem forma
funciei g, i anume

s
>
I =

, 0 , 0
, 0 ,
) 2 / 1 (
1
) (
2 / 1
x
x e x
x g
x


adic variabila Y are repartiie gamma cu parametrul 1/2. q.e.d.

Aplicaia 4.4.9. S se calculeze momentele centrate ) (
3
X i ) (
4
X pentru o
variabil aleatoare X cu repartiie gamma cu parametrul p.

Rezolvare
Momentul centrat de ordinul al treilea este
112
, 2 3
) 1 ( 3 ) 2 )( 1 ( 3 3 ) (
) ( 3 ) ( 3 ) ( ) ( ) ( ) (
3 3
2
3 1
2
2 3
3
2 2 3 3
3
p p p
p p p p p p m p pm m dx x f p
dx x xf p dx x f x p dx x f x dx x f p x X
= +
+ + + = + =
+ = =
}
} } } }



iar momentul centrat de ordinul al patrulea este

. 6 3 4 ) 1 ( 6 ) 2 )( 1 ( 4 ) 3 )( 2 )( 1 (
4 6 4 ) ( ) ( 4
) ( 6 ) ( 4 ) ( ) ( ) ( ) (
2 4 4 3 2
4
1
3
2
2
3 4
4 3
2 2 3 4 4
4
p p p p p p p p p p p p p
p m p m p pm m dx x f p dx x xf p
dx x f x p dx x f x p dx x f x dx x f p x X
+ = + + + + + + + + =
+ + = +
+ = =
} }
} } } }




4.5. Legea beta

Definiia 4.5.1. Variabila aleatoare X urmeaz legea beta (X are repartiie beta)
cu parametrii p i q ) 0 , ( > q p dac densitatea sa de probabilitate (repartiie)
este funcia

e
e
=

), 1 , 0 ( , 0
), 1 , 0 ( , ) 1 (
) , (
1
) (
1 1
x
x x x
q p B x f
q p
(4.5.1)

unde
}
> =

1
0
1 1
0 , , ) 1 ( ) , ( q p dx x x q p B
q p
este integrala lui Euler de primul tip
sau funcia beta a lui Euler.

Funcia f din relaia (4.5.1) este o densitate de probabilitate, deoarece
R x x f e > , 0 ) ( i


} }



= = . 1 ) 1 (
) , (
1
) (
1
0
1 1
dx x x
q p B
dx x f
q p


n propoziia urmtoare vom prezenta cteva proprieti ale funciei B (pentru
demonstraiile lor vezi [21]).

Propoziia 4.5.2. Integrala lui Euler
}
e =

1
0
1 1
, , ) 1 ( ) , ( R q p dx x x q p B
q p

verific urmtoarele proprieti
a) ) , ( q p B este convergent pentru p>0 i q>0, i n rest este divergent;
113
b) ; 0 , ), , ( ) , ( > = q p p q B q p B

c) ; 0 , 1 ), , 1 (
1
1
) , ( > >
+

= q p q p B
q p
p
q p B

d) ; 1 , 0 ), 1 , (
1
1
) , ( > >
+

= q p q p B
q p
q
q p B

e) ; 1 , 1 ), 1 , 1 (
) 2 )( 1 (
) 1 )( 1 (
) , ( > >
+ +

= q p q p B
q p q p
q p
q p B

f) ; 0 , ,
) 1 ( ) 1 (
)! 1 (
) , ( ) , (
*
> e
+ +

= = p N n
n p p p
n
p n B n p B



g) ; , ,
)! 1 (
)! 1 ( )! 1 (
) , (
*
N n m
n m
n m
n m B e
+

=

h) ; 0 , ), , ( ) 1 , ( ) , 1 ( > = + + + q p q p B q p B q p B

i) ; 0 , ), 1 , ( ) , 1 ( > + = + q p q p pB q p qB

j) ; 0 , ,
) 1 (
) , (
0
1
>
+
=
}

q p dt
t
t
q p B
q p
p


k) ; 0 , ,
) (
) ( ) (
) , ( >
+ I
I I
= q p
q p
q p
q p B

l) ). 1 , 0 ( ,
) sin(
) 1 ( ) ( ) 1 , ( e = I I = p
p
p p p p B
t
t


Teorema 4.5.3. Dac variabila aleatoare X are repartiie beta cu parametrii p i
q ) 0 , ( > q p , atunci momentele iniiale de ordinul k sunt

. ,
) 1 ( ) 1 )( (
) 1 ( ) 1 (
) (
*
N k
k q p q p q p
k p p p
X m
k
e
+ + + + +
+ +
=

(4.5.2)

Demonstraie
Momentul iniial de ordinul k este

114

,
) 1 ( ) 1 )( (
) 1 ( ) 1 (
) , (
) , (
) ( ) 1 (
) 1 ( ) 1 (
) , (
) , 1 (
1
1
) , (
) , (
) 1 (
) , (
1
) ( ) (
1
0
1 1
+ + + + +
+ +
=

+ + +
+ +
= =
+

+ +
+
=
+
= = =
} }
+


k q p q p q p
k p p p
q p B
q p B
q p k q p
p p p k
q p B
q p k B
k q p
p k
q p B
q p k B
dx x x
q p B
dx x f x X m
q p k k
k



conform Propoziiei 4.5.2, c). q.e.d.

Din relaia (4.5.2) deducem c media i dispersia variabilei X cu repartiie
beta cu parametrii p i q sunt

.
) 1 ( ) (
)] ( [ ) ( ) ( , ) ( ) (
2
2
1 2 1
+ + +
= =
+
= =
q p q p
pq
X m X m X Var
q p
p
X m X E
(4.5.3)


4.6. Legea
2
_ (Helmert-Pearson)

Definiia 4.6.1. Variabila aleatoare X urmeaz legea
2
_ (Helmert-Pearson) (X
are repartiie
2
_ ) cu parametrul n (
*
N ne ) dac densitatea sa de probabilitate
(repartiie) este funcia

s
>
|
.
|

\
|
I =

. 0 , 0
, 0 ,
2
2
1
) (
2
1
2
2
x
x e x
n
x f
x n
n
(4.6.1)

Parametrii n din Definiia 4.6.1 se mai numesc grade de libertate, astfel c o
s mai spunem c X are repartiie
2
_ cu n grade de libertate.
Funcia f din relaia (4.6.1) este o densitate de probabilitate deoarece
R x x f e > , 0 ) ( i

. 1
2
2
1
) (
0
2
1
2
2
=
|
.
|

\
|
I
=
} }


dx e x
n
dx x f
x n
n

115
Pentru verificarea relaiei de mai sus , facem n integrala dat schimbarea de
variabil x/2=y, de unde rezult dx=2dy; dac 0 x atunci , 0 y iar dac
x atunci . y Obinem astfel

( )
. 1
2
2
1
2
2
2
2 2
2
2
1
) (
0
1
2
2
2
0
1
2
2
= |
.
|

\
|
I
|
.
|

\
|
I
=
|
.
|

\
|
I
=
|
.
|

\
|
I
=
} } }




n
n
dy e y
n
dy e y
n
dx x f
y
n
n
n
y
n
n

n Figura 4.6.1 sunt reprezentate grafic funciile f pentru diverse valori ale
parametrului n.


Figura 4.6.1

Teorema 4.6.2. Dac variabila aleatoare X are repartiie
2
_ cu n grade de
libertate, atunci momentele iniiale de ordinul k sunt

. ), 2 2 ( ) 2 ( ) (
*
N k k n n n X m
k
e + + = (4.6.2)


Demonstraie
Momentul iniial de ordinul k este

.
2
2
1
) ( ) (
0
2
1
2
2
} }
+

|
.
|

\
|
I
= = dx e x
n
dx x f x X m
x
k
n
n
k
k

116
Cu aceeai schimbare de variabil de mai sus folosit pentru calculul integralei
}


dx x f ) ( , obinem


). 2 2 ( ) 2 ( 1
2
1
2 2
2
2
2
2
2
2
2
2 ) 2 (
2
2
1
) (
0
1
2
2
2
0
1
2
2
+ + = |
.
|

\
|
+ |
.
|

\
|
+ =
|
.
|

\
|
I
|
.
|

\
|
+ I
=
|
.
|

\
|
I
=
|
.
|

\
|
I
=
} }


+
+


+
k n n n k
n n n
n
k
n
dy e y
n
dy e y
n
X m
k
k
y
k
n
n
k
n
y
k
n
n
k


q.e.d.

Din relaia (4.6.2) deducem c media i dispersia variabilei X cu repartiie
2
_ cu n grade de libertate sunt

. 2 )] ( [ ) ( ) ( , ) ( ) (
2
1 2 1
n X m X m X Var n X m X E = = = = (4.6.3)

Definiia 4.6.3. Variabila aleatoare X urmeaz legea
2
_ generalizat (X are
repartiie
2
_ generalizat ) cu parametrii n i o ( 0 ,
*
> e o N n )
dac densitatea sa de probabilitate (repartiie) este funcia

s
>
|
.
|

\
|
I =

. 0 , 0
, 0 ,
2
) 2 (
1
) (
2
2
1
2
x
x e x
n
x f
x n
n
o
o (4.6.4)

ntr-un mod asemntor cu demonstraia Teoremei 4.6.2 se arat urmtoarea
teorem.

Teorema 4.6.4. Dac variabila aleatoare X are repartiie
2
_ generalizat cu
parametrii n i o ( 0 ,
*
> e o N n ), atunci momentele iniiale de ordinul k sunt

, , ) 2 2 ( ) 2 ( ) (
* 2
N k k n n n X m
k
k
e + + = o (4.6.5)

deci media i dispersia sa sunt

. 2 )] ( [ ) ( ) ( , ) ( ) (
4 2
1 2
2
1
o o n X m X m X Var n X m X E = = = = (4.6.6)
117
Propoziia 4.6.5. Dac variabila aleatoare X are repartiie
2
_ generalizat cu
parametrii n i o ( 0 ,
*
> e o N n ), atunci funcia sa caracteristic este

. , ) 2 1 ( ) (
2
2
R t it t
n
e =

o (4.6.7)


Demonstraie
Folosind formula din demonstaia Propoziiei 4.4.6, obinem


. , ) 2 1 (
!
1
2
1
2 2
) 2 (
1
2
1
2 2
) 2 (
!
) (
!
) (
) (
2
2
0
2
0
2
0
R t it
k
k
n n n
it
k
n n n
k
it
m
k
it
t
n
k
k
k
k
k
k
k
k
e =
|
.
|

\
|
+
|
.
|

\
|
+
=
|
.
|

\
|
+ |
.
|

\
|
+ = =


o o
o

q.e.d.

Din relaia (4.6.7) pentru , 1 = o deducem c funcia caracteristic a unei
variabile X cu rpartiie
2
_ cu n grade de libertate este

( ) . , 2 1 ) ( 2 R t it t
n
e =

(4.6.8)

Legturile dintre repartiia
2
_ i repartiia normal sunt prezentate n
urmtoarele dou teoreme.

Teorema 4.6.6. Dac variabila
n
X are repartiie
2
_ cu n grade de libertate
( 1 > n ) atunci densitatea de probabilitate a variabilei
n
X
n
n
2

tinde pentru
n ctre densitatea de repartiie normal standard.
Teorema 4.6.7. Dac fiecare dintre variabilele aleatoare independente
n
X X X , , ,
2 1
are repartiie normal standard, atunci variabila aleatoare
2 2
2
2
1 n
X X X X + + + = are repartiie
2
_ cu n grade de libertate.

Propoziia 4.6.8. Dac variabilele aleatoare independente X i Y au repartiii
2
_ cu m, respectiv n grade de libertate, atunci X+Y are repartiie
2
_ cu m+n
grade de libertate.

Demonstraie
S notm cu f i g densitile de probabilitate ale variabilelor X i Y, adic avem

118

s
>
|
.
|

\
|
I =

s
>
|
.
|

\
|
I =

. 0 , 0
, 0 ,
2
2
1
) (
, 0 , 0
, 0 ,
2
2
1
) (
2
1
2
2
2
1
2
2
x
x e x
n
x g
x
x e x
m
x f
x n
n
x m
m


Atunci densitatea de probabilitate a variabilei X+Y este


}


= . ) ( ) ( ) ( dy y g y x f x h

Folosind un raionament asemntor celui ntlnit n demonstraia Propoziiei
4.4.7, deducem c , 0 , 0 ) ( s = x x h iar pentru 0 > x obinem


}
}

+

|
.
|

\
|
I
|
.
|

\
|
I
=
|
.
|

\
|
I

|
.
|

\
|
I
=
x
n m
n m
x
x
y n
n
y x m
m
dy y y x
n m
e
dy e y
n
e y x
m
x h
0
1
2
1
2
2
2
0
2
1
2
2
2
1
2
2
. ) (
2 2
2
2
2
1
) (
2
2
1
) (


Notm y=tx, de unde rezult dy=xdt; dac 0 y atunci 0 t , iar dac
x y atunci . 1 t Obinem


. 0 ,
2
2
1
2
,
2
2 2
2
) 1 (
2 2
2
) ( ) (
2 2
2
) (
2
1
2
2
2
1
2 2
1
0
1
2
1
2
1
2
2
2
1
0
1
2
1
2
2
2
>
|
.
|

\
| +
I
=
|
.
|

\
|
|
.
|

\
|
I
|
.
|

\
|
I
=
|
.
|

\
|
I
|
.
|

\
|
I
=

|
.
|

\
|
I |
.
|

\
|
I
=

+
+
+


+
+

}
}
x e x
n m
n m
B
n m
x e
dt t t x
n m
e
dt x tx tx x
n m
e
x h
x n m
n m
n m
n m x
n m n m
n m
x
n m
n m
x


Deducem c X+Y are repartiie
2
_ cu m+n grade de libertate.
119
Concluzia acestei propoziii o putem obine mai direct folosind funciile
caracteristice. Fie
1
i
2
funciile caracteristice ale variabilelor X i Y, i
anume

( ) . , ) 2 1 ( ) ( , 2 1 ) (
2
2
2
1
R t it t it t
n
m
e = =



Atunci funcia caracteristic a variabilei aleatoare X+Y este

( ) . , 2 1 ) ( ) ( ) ( 2
2 1
R t it t t t
n m
e = =
+



Deducem din relaia obinut c X+Y are repartiie
2
_ cu m+n grade de libertate.
q.e.d.


4.7. Legea Student (t). Legea Cauchy

Definiia 4.7.1. Variabila aleatoare X urmeaz legea Student (t) (X are
repartiie Student) cu parametrul n (
*
N ne ) dac densitatea sa de probabilitate
(repartiie) este funcia

. , 1
2
2
1
) (
2
1
2
R x
n
x
n
n
n
x f
n
e
|
|
.
|

\
|
+
|
.
|

\
|
I
|
.
|

\
| +
I
=
+

t
(4.7.1)


Parametrii n din Definiia 4.7.1 se mai numesc grade de libertate, astfel c o
s mai spunem c X are repartiie Student cu n grade de libertate.
Funcia f din relaia (4.7.1) este o densitate de probabilitate deoarece

R x x f e > , 0 ) ( i . 1 ) ( =
}


dx x f

Pentru a verifica ultima relaie, avem


} } }


|
|
.
|

\
|
+
|
.
|

\
|
I
|
.
|

\
| +
I
=
|
|
.
|

\
|
+
|
.
|

\
|
I
|
.
|

\
| +
I
=
0
2
1
2
2
1
2
. 1
2
2
1
2
1
2
2
1
) ( dx
n
x
n
n
n
dx
n
x
n
n
n
dx x f
n n
t t


120
n ultima integrala de mai sus facem schimbarea de variabil , 0 , /
2
> = x y n x de
unde rezult

.
2
dy
y
n
dx =

Intervalul ) , 0 [ se transform n intervalul ) , 0 [ i astfel obinem


. 1
2
1
2 2
1
2
2
1
2
,
2
1
2
2
1
) 1 (
2
2
1
) (
0
2
1
2
2 / 1
=
|
.
|

\
| +
I
|
.
|

\
|
I |
.
|

\
|
I

|
.
|

\
|
I
|
.
|

\
| +
I
=
|
.
|

\
|

|
.
|

\
|
I
|
.
|

\
| +
I
=
+ |
.
|

\
|
I
|
.
|

\
| +
I
=
} }

+


n
n
n
n
n
B
n
n
dy
y
y
n
n
dx x f
n
t
t t


n relaiile de mai sus am folosit proprietile j) i k) ale funciei B din Propoziia
4.5.2 i proprietatea d) a funciei Idin Propoziia 4.4.2.

Teorema 4.7.2. Dac variabila aleatoare X are repartiie Student cu n grade de
libertate, atunci momentele iniiale de ordinul k sunt


. , 2 ,
) 2 ( ) 4 )( 2 (
! )! 1 2 (
) (
, 1 2 , 0 ) (
*
2
1 2
N k n k
k n n n
k n
X m
n k X m
k
k
k
e <


=
< + =
+

(4.7.2)

Demonstraie
Pentru , 1 2 n k < + momentele de ordin impar sunt nule. ntr-adevr


}

+
+
=
|
|
.
|

\
|
+
|
.
|

\
|
I
|
.
|

\
| +
I
= , 0 1
2
2
1
) (
2
1
2
1 2
1 2
dx
n
x
x
n
n
n
X m
n
k
k
t
(4.7.3)

deoarece funcia f este impar (integrala de mai sus este convergent). Dac
n k > +1 2 integrala din (4.7.3) este divergent, deci X nu are momente iniiale de
ordinul . 1 2 + k
Pentru momentul de ordin par ), (
2
X m
k
cu n k < 2 avem
121

}

|
|
.
|

\
|
+
|
.
|

\
|
I
|
.
|

\
| +
I
=
0
2
1
2
2
2
. 1
2
2
1
2
) ( dx
n
x
x
n
n
n
X m
n
k
k
t
(4.7.4)

Pentru calculul ultimei integrale folosim aceeai schimbare de variabil ca cea
folosit mai sus pentru verificarea relaiei . 1 ) ( =
}


dx x f Notm
, 0 , /
2
> = x y n x de unde rezult .
2
dy
y
n
dx = Intervalul ) , 0 [ se transform n
intervalul ) , 0 [ i astfel obinem


}
} }
(

|
.
|

\
|
+ |
.
|

\
|
+ |
.
|

\
|
+

+

+

+
|
.
|

\
|
I
|
.
|

\
| +
I
=
+
|
.
|

\
|
I
|
.
|

\
| +
I
= +
|
.
|

\
|
I
|
.
|

\
| +
I
=
0
2 2
1
1
2
1
0
2
1
2
1
0
2
1
2
. ) 1 (
2
2
1
) 1 (
2
2
1
2
) 1 ( ) (
2
2
1
2
) (
dy y y
n
n
n
dy y y
n
n
n
dy
y
n
y ny
n
n
n
X m
k
n
k k
k
n
k
k
n
k
k
t
t t

Folosind proprietile funciei B din Propoziia 4.5.2 deducem din relaia de
mai sus


|
.
|

\
|
I |
.
|

\
|

|
.
|

\
|
I |
.
|

\
|
I |
.
|

\
|

=
|
.
|

\
|
I
|
.
|

\
|
I |
.
|

\
|
+ I
=
|
.
|

\
| +
I
|
.
|

\
|
I |
.
|

\
|
+ I

|
.
|

\
|
I
|
.
|

\
| +
I
= |
.
|

\
|
+
|
.
|

\
|
I
|
.
|

\
| +
I
=
1
2
1
2
2 2
1
2
1
2
2 2
1
2
1
2 2
1
2
2
1
2
,
2
1
2
2
1
) (
2
n n
k
n
k k
n
n
k
n
k
n
n
k
n
k
n
n
n
k
n
k B
n
n
n
X m
k k
k k
k
t t
t t

122

.
) 2 ( ) 4 )( 2 (
! )! 1 2 (
2 2
2
2
1
2
2 2
1
2
1
2
3
2
1
2
2
2
2
1
2
2 2
3
2
3
2
1
k n n n
k n
k
n
k
n n n
k
n
k k
n
n n n
k
n
k k k
n
k k
k


=
|
.
|

\
|
I |
.
|

\
|
|
.
|

\
|
|
.
|

\
|

|
.
|

\
|
I |
.
|

\
|
I |
.
|

\
|
|
.
|

\
|

=
=
|
.
|

\
|
I |
.
|

\
|
|
.
|

\
|

|
.
|

\
|
I |
.
|

\
|
I |
.
|

\
|
|
.
|

\
|

=

t
t


Dac n k > 2 integrala din relaia (4.7.4) este divergent, deci variabila X nu are
momente iniiale de ordinul 2k. q.e.d.

Din relaiile (4.7.2) deducem c dac n>1 atunci media variabilei X este
, 0 ) ( = X E iar dac n>2 atunci dispersia variabilei X este .
2
) (

=
n
n
X Var
Legturile dintre repartiia Student i repartiia normal sunt prezentate n
urmtoarele dou teoreme.

Teorema 4.7.3. Dac
n
f este densitatea de probabilitate a unei repartiii
Student cu n grade de libertate atunci

, ), 1 , 0 ; ( ) ( lim R x x f x f
n
n
e =



unde ) 1 , 0 ; (x f este densitatea de repartiie normal standard.

Teorema 4.7.4. Dac fiecare dintre variabilele aleatoare independente
1 2 1
, , ,
+ n
X X X are repartiie normal cu parametrii 0 = m i , o atunci
variabila aleatoare


2 2
1
1
n
n
X X
X
n X
+
=
+


are repartiie Student cu n grade de libertate.

Pentru 1 = n legea (repartiia) Student se mai numete legea (repartiia)
Cauchy. O variabil aleatoare X cu repartiie Cauchy are densitatea de
probabilitate funcia

. ,
) 1 (
1
) (
2
R x
x
x f e
+
=
t

123
Din observaiile fcute dup demonstaia Teoremei 4.7.2 , deducem c variabila
aleatoare X cu repartiia Cauchy nu are nici valoare medie i nici dispersie.


4.8. Legea Snedecor. Legea Fisher

Definiia 4.8.1. Variabila aleatoare X urmeaz legea Snedecor (X are repartiie
Snedecor) cu parametrii
1
n i ) , ( ,
*
2 1 2
N n n n e dac densitatea sa de
probabilitate (repartiie) este funcia


s
>
|
|
.
|

\
|
+
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I

|
|
.
|

\
|
=
+

. 0 , 0
, 0 , 1
2 2
2
) (
2
2
1
1
2
2 1
2 1
2
2
1
2 1
1
1
x
x x
n
n
x
n n
n n
n
n
x f
n n
n
n
(4.8.1)

Parametrii
1
n i
2
n din Definiia 4.8.1 se mai numesc grade de libertate,
astfel c o s mai spunem c X are repartiie Snedecor cu
1
n i
2
n grade de
libertate.
Funcia f din relaia (4.8.1) este o densitate de probabilitate, deoarece
R x x f e > , 0 ) ( i . 1 ) ( =
}


dx x f Pentru a verifica ultima relaie, avem


} }

+



|
|
.
|

\
|
+
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I

|
|
.
|

\
|
=
0
2
2
1
1
2
2 1
2 1
2
2
1
. 1
2 2
2
) (
2 1
1
1
dx x
n
n
x
n n
n n
n
n
dx x f
n n
n
n


n ultima integral de mai sus facem schimbarea de variabil . /
2 1
y n x n = Astfel
obinem

124

( )
. 1
2
,
2
2 2
2
) 1 (
2 2
2
1
2 2
2
) (
2 1
2 1
2 1
0
2
1
2
2 1
2 1
0
1
2
2
1
2
1
2
2 1
2 1
2
2
1
2 1 1
2 1
1 1
= |
.
|

\
|
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
= +
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
=
+
|
|
.
|

\
|
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
=
}
} }

n n
B
n n
n n
dy y y
n n
n n
dy
n
n
y
n
y n
n n
n n
n
n
dx x f
n n n
n n
n n


Teorema 4.8.2. Dac variabila aleatoare X are repartiie Snedecor cu
parametrii
1
n i ), , ( ,
*
2 1 2
N n n n e atunci momentele iniiale de ordinul k sunt

. , 2 ,
) 2 ( ) 4 )( 2 (
) 2 2 ( ) 2 (
) (
*
2
2 2 2
1 1 1
1
2
N k n k
k n n n
k n n n
n
n
X m
k
k
k
e <

+ +
=

(4.8.2)

Demonstaie
Variabila X are momente iniiale de ordinul k pentru . 2
2
n k < Avem


} }

+
|
|
.
|

\
|
+
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
= = . 1
2 2
2
) ( ) (
0
2
2
1
1
2
2 1
2 1
2
2
1
2 1
1
1
dx x
n
n
x
n n
n n
n
n
dx x f x X m
n n
n
k
n
k
k


Pentru calculul ultimei integrale folosim aceeai schimbare de variabil ca cea
folosit mai sus pentru verificarea relaiei . 1 ) ( =
}


dx x f Notm y n x n =
2 1
/
i obinem


}

+
+
|
|
.
|

\
|
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
=
0
1
2 2
1
2
1
2
2 1
2 1
2
2
1
2 1
1 1
) 1 (
2 2
2
) ( dy
n
n
y
n
y n
n n
n n
n
n
X m
n n
n
k
n
k


125

.
) 2 ( ) 4 )( 2 (
) 2 2 ( ) 2 (
2 2
2
2
1
2 2
2 2 2
2
2
1
2
1
2
1
2 2
2
1
2
1
2
2
2 2
2 2
2
2
,
2
2 2
2
) 1 (
2 2
2
2 2 2
1 1 1
1
2
2 2 2 2 1
2 1 1 1 1
1
2
2 2 1
2 1 1
1
2
2 1
2 1
2 1
2 1
1
2
2 1
2 1
2 1
1
2
0
2
1
2
2 1
2 1
1
2
2 1 1
k n n n
k n n n
n
n
k
n
k
n n n n
k
n n n n
k
n
k
n
n
n n n
k
n
k
n n
k
n
n
n n
k
n n
k
n n
n n
n
n
k
n n
k B
n n
n n
n
n
dy y y
n n
n n
n
n
k
k
k
k
k
n n n
k
k

+ +
|
|
.
|

\
|
=
|
.
|

\
|
I |
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
I
|
.
|

\
|
I |
.
|

\
|
I |
.
|

\
|
+ |
.
|

\
|
+
|
|
.
|

\
|
=
=
|
.
|

\
|
I |
.
|

\
|
|
.
|

\
|
I
|
.
|

\
|
I |
.
|

\
|
+ I |
.
|

\
|
+
|
|
.
|

\
|
=
|
.
|

\
| +
I
|
.
|

\
|
I |
.
|

\
|
+ I

|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
=
|
.
|

\
|
+
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
=
+
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
=
}

+
+



q.e.d.

Din relaia (4.8.3) deducem c pentru 2
2
> n media variabilei X este
,
2
) (
2
2

=
n
n
X E iar pentru 4
2
> n dispersia variabilei X este

.
) 2 )( 4 (
) 2 ( 2
) (
2
2 2 1
2 1
2
2

+
=
n n n
n n n
X Var

Legtura dintre repartiia normal i repartiia Snedecor este dat n
urmtoarea teorem.

Teorema 4.8.3. Dac variabilele aleatoare independente ,... , ,..., ,
1 2 1
1 1
+ n n
X X X X
2 1
n n
X
+
urmeaz legea normal cu parametrii 0 i o atunci variabila aleatoare
126


2 2
1
2 2
1
1
2
2 1 1
1
n n n
n
X X
X X
n
n
X
+ +
+ +
+ +
=



are repartiie Snedecor cu parametrii
1
n i .
2
n

Definiia 4.8.4. Variabila aleatoare X urmeaz legea Fisher (X are repartiie
Fisher) cu parametrii
1
n i ) , ( ,
*
2 1 2
N n n n e dac densitatea sa de probabilitate
(repartiie) este funcia

. , 1
2 2
2
2 ) (
2
2
2
1
2 1
2 1
2
2
1
2 1
1
1
R x e
n
n
e
n n
n n
n
n
x f
n n
x x n
n
e
|
|
.
|

\
|
+
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
=
+

(4.8.3)

Teorema 4.8.5. Dac variabila aleatoare X are repartiie Snedecor cu
parametrii
1
n i ,
2
n atunci variabila aleatoare X Y ln
2
1
= are o repartiie Fisher
cu parametrii
1
n i .
2
n

Demonstraie
Dac notm funcia de repartiie X cu F, atunci funcia de repartiie G a variabilei
Y este


. ), ( ) (
) 2 (ln ln
2
1
) ( ) (
2 2
R x e F e X P
x X P x X P x Y P x G
x x
e = s =
s =
|
.
|

\
|
s = s =


Deci densitatea de probabilitate a variabilei Y este


. , 1
2 2
2
2
) ( 2 ) ( ' 2 ) ( ' ) (
2
2
2
1
2 1
2 1
2
2
1
2 2 2 2
2 1 1
1
R x e
n
n
n n
n n
n
n
e
e f e e F e x G x g
n n
x
n
x n
x x x x
e
|
|
.
|

\
|
+
|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
|
|
.
|

\
|
=
= = =
+

q.e.d.




127
4.9. Legea Weibull. Legea exponenial

Definiia 4.9.1. Variabila aleatoare X urmeaz legea Weibull (X are
repartiieWeibull) cu parametrii i o ) 0 , 0 ( > > o dac densitatea sa de
probabilitate (repartiie) este funcia

s
>
=

. 0 , 0
, 0 ,
) (
1
x
x e x
x f
x
o
o
o
(4.9.1)

Funcia f din (4.9.1) este o densitate de probabilitate, deoarece
R x x f e > , 0 ) ( i
} }


= = . 1 ) (
0
1
dx e x dx x f
x
o
o
o ntr-devr pentru
verificarea ultimei relaii facem schimbarea de variabil , y x =
o
de unde
rezult
o

/ 1
) / ( y x = i .
1
1
1
1
dy y dx

=
o
o
o
Atunci

} } }


= = |
.
|

\
|
=
0 0
1
1
1
1
. 1
1
) ( dy e dy y e
y
dx x f
y y
o
o
o
o
o

o

Teorema 4.9.2. Dac variabila aleatoare X are repartiie Weibull cu
parametrii i o , ) 0 , 0 ( > > o atunci valoarea medie i dispersia sa sunt

. 1
1
1
2
) ( , 1
1
) (
2
2 1
(

|
.
|

\
|
+ I |
.
|

\
|
+ I = |
.
|

\
|
+ I =

o o

o o
X Var X E (4.9.2)

Demonstraie
Folosind schimbarea de variabil de mai sus, obinem pentru media variabilei X


. 1
1 1
1
) (
1
0
1
1
0
1
1
1
0
|
.
|

\
|
+ I = =
= =



}
} }
o

o o
o o
o
o
o
o
o
dy e y
dy y e
y
dx e x X E
y
y x


Pentru dispersia lui X calculm mai nti media lui .
2
X Avem


} }

+
|
.
|

\
|
+ I = |
.
|

\
|
= =
0
2
1
1
1
1
0
1 2
. 1
2 1
) (
o

o o
o o
o
o
o
o
o
dy y e
y
dx e x X E
y x

128
Atunci dispersia lui X este
. 1
1
1
2
) (
2
2
(

|
.
|

\
|
+ I |
.
|

\
|
+ I =

o o

o
X Var
q.e.d.

Pentru 1 = o legea (repartiia) Weibull se mai numete legea exponenial
(repartiia exponenial) de parametru . Deci densitatea de probabilitate a
unei variabile aleatoare X cu repartiie exponenial cu parametrul este

s
>
=

. 0 , 0
, 0 ,
) (
x
x e
x f
x



Din relaia (4.9.2) rezult c media i dispersia unei variabile aleatoare X cu
repartiie exponenial cu parametrul sunt
,
1
)] 2 ( ) 3 ( [
1
) ( ,
1
) 2 (
1
) (
2
2
2

= I I = = I = X Var X E

deoarece . 2 ) 3 ( , 1 ) 2 ( = I = I

Observaia 4.9.3. Repartiia exponenial cu parametrul este o repartiie
gamma generalizat cu parametrii 1 = p i .

Propoziia 4.9.4. Dac variabila aleatoare X are repartiie exponenial cu
parametrul , atunci funcia sa caracteristic este
. , 1 ) (
1
R t
it
t e |
.
|

\
|
=

(4.9.3)

Demonstraie
Din Observaia 4.9.3 i relaia (4.4.7) din Propoziia 4.4.6, deducem c funcia
caracteristic a variabilei X este dat de expresia din (4.9.3).
Funcia caracteristic se poate calcula i direct folosind formula din
definiia sa. Avem


( )

2 1
. ) sin( ) cos( )] sin( ) [cos(
) ( ) (
0 0 0
0
) (
0
I
x
I
x x
x it x itx itx itX
dx tx e i dx tx e dx tx i tx e
dx e dx e e dx x f e e E t
} } }
} } }


+ = + =
= = = =





Pentru
1
I obinem

129

( )
( ) (
. ) cos(
1
) cos(
) sin(
1
) sin(
1
) sin(
) cos(
1
) cos(
1
) cos(
0
2
2
0
0 2
0
'
2
0
0
0
'
0
1
} }
} }
} }


= |
.
|

+ = + =
= = =
dx tx e
t
dx tx e t
tx e
t
dx tx e
t
dx tx e
t
tx e dx tx e dx tx e I
x x
x x x
x x x








Rezult astfel relaia ,
1
1
2
2
1
I
t
I

= de unde obinem c .
2 2 1
t
I
+
=


Pentru
2
I din relaiile de mai sus deducem .
2 2 2
t
t
I
+
=

Obinem astfel pentru ) (t


expresia . , 1 ) (
1
R t
it
t e |
.
|

\
|
=

q.e.d.

Aplicaia 4.9.5. Fie variabilele independente
1
X i
2
X cu repartiii
exponeniale cu parametrii ,
1
respectiv
2
. S se determine densitatea de
probabilitate a variabilei .
2 1
X X + S se generalizeze apoi rezultatul obinut la
cazul a n variabile aleatoare independente cu repartiii exponeniale cu acelai
parametru .

Rezolvare
S notm cu
1
f i
2
f densitile de probabilitate ale variabilelor
1
X i
,
2
X adic

s
>
=

s
>
=

. 0 , 0
, 0 ,
) (
, 0 , 0
, 0 ,
) (
2 1
2
2
1
1
x
x e
x f
x
x e
x f
x x



Dac
2 1
= atunci densitatea de probabilitate f a variabilei
2 1
X X + este 0
pentru , 0 s x iar pentru 0 > x avem


( ).
) ( ) ( ) (
1 2 2 1 1 2 1 1
2 1
2 1
2 1
0
) (
2 1
2 1
0
) (
2 1
0
2
) (
1 2 1
x x x y x
x
y x
x
y y x
e e e e dy e e
dy e e dy y f y x f x f









= =
= =
}
} }


Deci funcia f are forma
( )

s
>
=

. 0 , 0
, 0 ,
) (
1 2
2 1
2 1
x
x e e
x f
x x



130
Dac = =
2 1
atunci , 0 , 0 ) ( s = x x f iar pentru 0 > x obinem

. ) (
2
0
2
0
) ( x
x
x
x
y y x
xe dy e dy e e x f



= = =
} }


Deci densitatea de probabilitate a variabilei
2 1
X X + este

s
>
=

. 0 , 0
, 0 ,
) (
2
x
x xe
x f
x



Pentru trei variabile aleatoare independente
3 2 1
, , X X X cu repartiii
exponeniale cu parametrul , densitatea de probabilitate a variabilei
3 2 1
X X X + + este 0 , 0 ) ( s = x x h i pentru 0 > x avem

.
2
) ( ) ( ) (
2
3
0
3
0
) ( 2 x
x
x
x
y y x
e x dy y x e dy e e y x x h




= = =
} }


Deci

s
>
=

. 0 , 0
, 0 ,
2
) (
2
3
x
x e x
x h
x


Prin inducie matematic se arat c pentru variabilele aleatoare
independente
n
X X X ,..., ,
2 1
cu repartiii exponeniale cu parametrul ,
densitatea de probabilitate a variabilei
n
X X X X + + + =
2 1
este funcia

s
>
=

. 0 , 0
, 0 ,
)! 1 ( ) (
1
x
x e x
n x k
x n
n



Rezult c variabila X are o repartiie gamma generalizat cu parametrii n i .




131
Capitolul 5


Convergena variabilelor aleatoare


5.1.Convergena aproape sigur i convergena n probabilitate

Fie (,K,P) un spaiu probabilizat i (
n
X )
n
un ir de variabile aleatoare. Fie
de asemenea X o alt variabil aleatoare. Ce nseamn c
n
X tinde la X ?
Desigur, variabilele aleatoare sunt funcii X
n
: 9. Pentru funcii se tie
deja ce nseamn c
n
X converge la X : c
n
X () X() pentru orice e .
Mai exist i noiunea de convergen uniform:
n
X

u
X dac sup
e

n
X () X()

0.
n teoria probabilitilor aceste dou tipuri de convergen nu prea sunt de
folos. Situaia tipic ntlnit n practica statistic este urmtoarea: se face un
experiment cu rezultatele posibile r
1
,,r
k
. Rezultatul obinut la al n-ulea
experiment este
n
X .
(De exemplu se arunc un zar despre care nu tim dac este corect sau
falsificat; n acest caz rezultatele sunt 1,2,3,4,5,6)
Nu avem cum s prezicem rezultatul
n
X , dar putem spera s aproximm
probabilitile p
i
de apariie a rezultatului r
i
, dac facem unele ipoteze
acceptabile. De exemplu, dac acceptm c toate variabilele aleatoare
n
X au
aceeai repartiie, F. Am putea numra procentajele f
i
de apariie a rezultatului r
i

i spera c ele nu difer mult de adevratele probabiliti p
i
.

De altfel, de aici a i pornit teoria probabilitilor.

n cazul zarului nostru, am putea s l aruncm de 6n de ori de exemplu i
s vedem dac frecvenele obinute difer mult de n. Dac da, (deocamdat nu
tim ce nseamn prea mult, se va vedea la capitolul privind intervalele de
ncredere) am putea spera c dac o s mrim numrul de aruncri ale zarului ne
vom apropia din ce n ce mai mult de adevratele valori
) (
i i
r X P p = =
.
S formalizm puin contextual.
Avem un ir de variabile aleatoare
n n
X ) ( care sunt identic repartizate cu
repartiia necunoscut
|
|
.
|

\
|
=
k
k
p p p
r r r
F
...
...
2 1
2 1
. Vrem s gsim numerele
132
k
p p ,...,
1
. Pentru aceasta calculm valorile
{ }
n
r X n j
Y
i j
i n
= s
=
:
,
i ne gndim
c, poate,
i n
Y
,
converge la
i
p dac n .
Aceasta este problema de baz.
Nu ne putem atepta ca
i n
Y
,
s convearg la
i
p n sensul obinuit al
cuvntului, adic s aib loc convergena pentru orice scenariu O e e : de
exemplu, s-ar putea ca rezultatul
i
r s apar mereu sau nici mcar s nu apar,
dei 0 >
i
p .
Dar poate c
i n
Y
,
converge la
i
p n majoritatea covritoare a cazurilor?
ntr-adevr, aa se ntmpl dac se mai adaug nite ipoteze. Aceasta este
legea numerelor mari.
Mai nti s lmurim ce nseamn n majoritatea covritoare a cazurilor:
nseamn aproape sigur.

Definiia 5.1.1. Spunem c
n n
X ) ( converge la X P-aproape sigur i scriem
X X
s a P
n

. .
(sau X X
n
(mod P)) dac
1 ) inf lim sup (lim = = = X X X P
n n
. Dac 1 ) inf lim sup (lim = =
n n
X X P ,
spunem c
n n
X ) ( este un ir P- convergent aproape sigur.

Observaia 5.1.2. Dac probabilitatea P se subnelege, putem renuna la litera
P i scriem doar X X
s a
n

. .


Observaia 5.1.3. Evident c dac
n
X converge la X punctual - n sensul
obinuit al cuvntului - atunci X X
s a
n

. .
. La fel de evident este c diferena
ntre convergena punctual i cea aproape sigur poate fi foarte mare.

Observaia 5.1.4. Tot evident este c limita aproape sigur a unui ir de
variabile aleatoare nu este unic, ci numai unic aproape sigur. ntr-adevr,
dac X X
s a
n

. .
i Y X = (a.s.), atunci putem la fel de bine s spunem c
Y X
s a
n

. .
.

Observaia 5.1.5. La fel de evident este c 0
. . .

s a
n
s a
n
X X X X ,
deoarece
) 0 ) inf( lim ) sup( (lim ) inf lim sup (lim = = = = = X X X X P X X X P
n n n n
.

Exemplu 5.1.6. Fie = 9, K = B(9), X
n
() = sin(n),
|
|
.
|

\
|
= + =
5 . 5 .
0
) (
0
t
o o
t
P . irul
n
X este divergent, singurele puncte n care el
133
converge sunt cele de forma = kt. Totui,
. .s a P
n
X 0, deoarece
1 ) 0 ( = =
n
X P . Sau, dac schimbm puin i lum ) ( sin ) ( e = e
n
n
X , acesta
converge la 0 cu excepia punctelor de forma t/2 + kt. Dac lum, de data
aceasta, = + = ) (
2 / 5 2 / t t
o o P
|
|
.
|

\
| t t
5 . 5 .
2 / 5 2 /
, atunci 1
. .

s a P
n
X .

Exemplul 5.1.7. Fie = [0,1), K = B([0,1)), P = Uniform(0,1) ( = msura
Lebesgue pe !) i
1
) (
> n n
a un ir strict cresctor de numere pozitive cu
proprietatea c =
n
a lim dar 0 ) lim(
1
=
+ n n
a a i, n plus, 1
1
s
+
n n
a a . De
exemplu putem lua n a
n
ln = sau n a
n
= .
Fie ] [ ) ( x x x d = partea zecimal a lui x, A
n
= d([a
n
, a
n+1
)) := {d(x) : x e
[a
n
,a
n+1
)} i X
n
=
n
A
1 . Observm c P(A
n
) = a
n+1
a
n
0. (De exemplu, dac
n a
n
ln = , atunci ), 1 4 ln , 1 3 [ln ), 1 3 ln , 0 [ ) 1 , 2 [ln ], 2 ln , 0 [
3 2 1
= = = A A A
etc. ). ) 2 5 ln , 0 [ ) 1 , 1 4 [ln
4
= A . Atunci limsup A
n
= i liminf A
n
= C deci
1 1 sup lim
sup lim
= =
n
A n
X i 1 inf lim =
n
X
C
= 0.
(ntr-adevr,
( ) ( ) O = =
|
|
.
|

\
|
= =
+ + + + + +
n
n
n k n k
k n k n k n k n n
a d a a d a a d A ) , [ ) , [ ) , [ sup lim
1 1
iar
( )

n k
k n k n n
a a d A ) , [ inf lim
1 + + +
= = C)
Exemplul 5.1.7 este unul extrem, n care limita superioar i cea
inferioar nu coincid nicieri.

Exemplul 5.1.8. Fie, pe spaiu probabilizat de la exemplul anterior,
|
.
|

\
|
=
n
n
n X
1
, 0
1 . Atunci
n
X converge evident la 0, deci converge i a.s.

Cum putem decide dac X X
n
? n cazul cel mai simplu, un rspuns este dat
de

Propoziia 5.1.9. Fie (,K,P) un spaiu probabilizat i
n n
A ) ( un ir de
evenimente din K. Presupunem c seria ( )
n
A P este convergent. Atunci
n
A
1 0
. .

s a
.

Demonstraie
134
Fie ...
1
=
+ n n n
A A B . Cum P(
n
B ) s ( )

>
+
0 k
k n
A P i seria ( )
n
A P este
convergent, 0 ) (
n
B P . Dar irul de mulimi
n n
B ) ( este monoton
descresctor, deci
B
B
n
1 1 cu B =

=1 n
n
B i 0 ) ( lim ) ( = =
n
B P B P .
Dar limsup
n
A
1 =
B
B
A
A
n
n k
k n
n
1 1 1 1
sup lim
= = =
+

de unde 0 s lim inf


n
A
1 s
limsup
B
A
n
1 1 = . Cum P(limsup
n
A
1 = liminf
n
A
1 ) s P(B) = 0, urmeaz c irul
n
A
n
) 1 ( converge aproape sigur. Putem lua ca limit a sa, X, orice variabil
aleatoare
A
X 1 = unde A este o mulime neglijabil. Cel mai simplu e s spunem
c
n
A
1 0. .q.e.d

De aici rezult un criteriu important cu care putem verifica dac
. .s a
n
X X

Propoziia 5.1.10. Fie
n n
X ) ( un ir de variabile aleatoare. Presupunem c
pentru orice c > 0 seria ( )

> c | |
n
X P este convergent. Atunci
. .s a
n
X 0.
Demonstraie
Fie B = {e :
n
X () nu converge la 0}. Atunci B =

N
N
B unde
N
B ={e :
n
X ()> 1/N de o infinitate de ori}. Cum irul de mulimi
N N
B ) (
este cresctor, P(B) = lim P(
N
B ) aplicm din nou proprietatea de continuitate
monoton a probabilitii. Dar seria ( )

> N X P
n
/ 1 | | este convergent, deci
P(
N
B ) = 0 N de unde P(B) = 0 q.e.d.

Observaia 5.1.11. Condiia din propoziia de mai sus nu este dect suficient,
nu i necesar. De exemlu dac avem un ir descresctor de mulimi A
1
_A
2
_......
cu P(A
n
) = 1/n, atunci
n
A
1 este un ir descresctor, deci are o limit de forma
A
1
cu A =
n
n
A . Deci
n
A
1 1
A
. Cum P(A) = 0, putem scrie, conform observaiei 3, c
n
A
1
. .s a
0.

Observaia 5.1.12. Convergenele obinuite sunt date de o distan. Adic
putem scrie c X
n
X c > 0 exist n
c
astfel ca n > n
c
d(X
n
,X) s c..
Aceste convergene au urmtoarea proprietate: dac din orice subir al lui
) (
n
X se poate extrage un sub-subir care este convergent i limita sa este
aceeai, s zicem X, atunci X X
n
. nr-adevr, dac X X
n
= lim , atunci
135
exist un c > 0 i un subir
n n
k ) ( astfel ca d( c > ) , X X
n
k
, deci din subirul
(
n
k
X )n nu putem extrage nici un sub-subir care s tind la c. Spunem c aceste
convergene sunt topologice. Convergena aproape sigur nu este topologic.
ntr-adevr, dac ne uitm la exemplul extrem 1.1.7, n care irul nu are absolut
nici o limit aproape sigur, vedem c el are proprietatea ciudat c din orice
subir al su se poate extrage un sub-subir care converge la 0. Motivul este c
0 ) (
n
A P . Altfel zis, irul
n
A
1 converge totui la 0, dar n probabilitate.

Definiia 5.1.13. Spunem c irul de variabile aleatoare ) (
n
X converge n
probabilitate la X (i scriem X
n

P
X) dac . 0 0 ) | (| lim > c = c >

X X P
n n


Din definiie rezult imediat c un ir de forma X
n
=
n
A
1 converge n
probabilitate la 0 dac i numai dac P(A
n
) 0. Acesta este cazul exemplului
1.1.7, care ne arat cum se prea poate ca un ir divergent aproape sigur s
convearg, totui, n probabilitate.
Convergena n probabilitate este una mult mai uor de manipulat, deoarece
ea este topologic: provine de la distan.

Propoziia 5.1.14. Fie X,Y dou variabile aleatoare. Definim d(X,Y) = E(X Y .
1). Atunci funcia d este o semidistan pe spaiul L(,K) al tuturor variabilelor
aleatoare i, n plus, avem echivalena X
n

. P
X d(X,X
n
) 0

Demonstraie
Cum este evident c a,b > 0 a.1 + b.1 > (a+b). 1 , este clar c d
este o semidistan: d(X,Y) + d(Y,Z) = E[(X Y . 1) + (Y Z . 1)] > E(X Z .
1).
Pe de alt parte, dac notm cu Z variabila aleatoare X Y , observm c
dac c e (0,1), putem scrie E(Z . 1) = E(Z . 1; Z s c) + E(Z . 1; Z > c) s cP(Z s c) +
P(Z > c) de unde
E(Z . 1) s c + P(Z > c) (5.1.1)
Apoi E(Z . 1; Z s c) + E(Z . 1; Z > c) > E(Z . 1; Z > c) > E(c; Z > c) de unde
E(Z . 1) > cP(Z > c) (5.1.2)
Din (5.1.1) i (5.1.2) deducem cletele
cP(Z > c) s E(Z.1) s c + P(Z > c) (5.1.3)
S presupunem acum c d(X,X
n
) 0. Din prima inegalitate de la (5.1.3)
deducem inegalitatea P(X X
n
> c) s
( )
c
. 1 | |
n
X X E
, adic P(X X
n
> c) s
( )
c
n
X X d ,
lim
n
P(X X
n
> c) = 0; aadar d(X,X
n
) 0 X
n

P
X
Reciproc, dac pentru orice c > 0 avem c lim
n
P(X X
n
> c) = 0, din a doua
inegalitate de la (5.1.3) rezult c lim sup
n
d(X,X
n
) s c pentru orice c>0. Dar c
este arbitrar, deci lim d(X,X
n
) = 0. q.e.d.
136

Un caz care implic imediat convergena n probabilitate este
convergena n L
p
..

Definiia 5.1.15. Spunem c irul de variabile aleatoare (X
n
)
n
converge n
p
L la
X (i notm acest lucru cu X
n

p
L
X) dac lim
n
X
n
X
p
= 0.
1


Propoziia 5.1.16. Dac X
n

p
L
X pentru un anumit p > 1, atunci X
n

P
X.

Demonstraie
Pentru p e [1,) folosim inegalitatea evident P(Z > c) s
p
p
p
Z
c
2
: ntr-adevr,
dac X
n

p
L
X, atunci lim
n
P(X - X
n
> c) s lim
n
p
p
p
n
X X
c

= 0 . Iar dac p = ,
atunci este i mai evident: X
n

L
X X
n

p
L
X X
n

P
X. q.e.d.

Observaia 5.1.17. Totui, dac X
n

P
X, din orice subir al su se poate
extrage un sub-subir care converge la X aproape sigur. ntr-adevr, aplicm
Propoziia 5.1.10 Prin procedeul diagonal, putem alege un subir (k
n
)
n
n aa fel
nct seria ( ) c > | |
n
k
X P s fie convergent pentru orice c>0.

Concluzie. ntre cele trei tipuri de convergen exist urmtoarele implicatii:
X
n

L
X X
n

p
L
X (p< ) X
n

P
X i X
n

. .s a
X X
n

P
X
n
k
X
. .s a
X
Aadar, convergena n probabilitate este cea mai slab. Este de remarcat c
nu exist alte implicaii. Astfel:
-irul de la exemplul 5.1.3 converge peste tot, dar nu n L
1
, deci nici n L
p
cu p
> 1
-irul de la exemplul 5.1.2 converge n probabilitate i n L
p
pentru orice
1sp<, dar nu a.s.
-Dac lum X
n
=
|
.
|

\
|
o
n
n 1
, 0
1 pe = (0,1), P = Uniform(0,1), care converge
punctual la 0, atunci pentru orice p>1 putem gsi un ir (o
n
)
n
astfel ca X
n


1
Amintim c dac X este o variabil aleatoare, i p e[1,] atunci
X
p
:= ( )
p
p
X E
1
| | dac p < iar X

:= lim
p
X
p
= ess sup X . Inegalitatea
normelor ne spune c funcia p X
p
este cresctoare.
2
( ) ( ) c > c > c > > = | | | | ; | | | | Z P Z Z E Z E Z
p p p
p
p

137

' p
L
0 pentru p < p dar X
n
nu converge nicieri dac p > p. De exemplu o
n
=
p
n
1
.


5.2. Legi ale numerelor mari i aplicaii

5.2.1 Legea slab

Revenim la problema de baz enunat n paragraful precedent: putem spera
s gsim repartiia unei variabile aleatoare empiric, adic fcnd observaii
asupra ei?
Aa pus fiind, problema nu are sens.
Pentru noi niciodat nu putem face mai multe observaii asupra unei variabile
aleatoare, ci numai una. Dac aruncm un zar de n ori, noi nu observm o
variabil aleatoare, ci un ir de variabile aleatoare X
1
,...,X
n
. Putem accepta c
aceste variabile aleatoare au aceeai repartiie.
Atunci problema capt sens: avem un ir de variabile aleatoare (X
n
)
n
care
sunt identic repartizate i am dori s i aproximm repartiia, pe baza
observaiilor fcute asupra lui.
Nu cumva am putea s i calculm, aproximativ, media? n definitiv = EX
j

nu se numete degeaba medie!
Rspunsul este: uneori, da.

Propoziia 5.2.1. Legea slab a numerelor mari.(WLLN)
3

Fie (X
n
)
n
un ir de variabile aleatoare identic repartizate i necorelate din L
2

(adic avnd i moment de ordin 2). Fie = EX
j
, o
2
= Var(X
j
) i fie
n
X X X
X
n
n
+ + +
=
...
2 1
media empiric
4
. Atunci n X
P
.
Ca un caz particular, dac X
n
~
|
|
.
|

\
|
p p 1
1 0
, atunci
{ }
n
X n j
X
j
n
1 : = s
=

P
p. Acum mediile n X se noteaz cu f
n
i se numesc frecvene relative.

Demonstraie
Centrm variabilele: fie Y
n
= X
n
- . Atunci n X - =
n
Y Y Y
n
+ + + ...
2 1
.
Urmeaz n X -
2
2
= E( n X - )
2
=
s s n j i
j i
Y EY
n , 1
2
1
. Dar EY
i
Y
j
= cov(X
i
,X
j
) = 0

3
abreviere internaional: Weak Law of Large Numbers
4
Se mai numete i media de selecie
138
dac i = j . Deci E( n X - )
2
=
n
n
n
EY
n n i
i
2
2
2
1
2
2
1 o
=
o
=
s s
. Concluzie: n X
2
L
deci,
conform cu Propoziia 1.1.16, n X
P
. q.e.d.

Rezultatul nu mai rmne adevrat dac renunm la ipoteza necorelrii. De
exemplu, dac X i Y sunt dou variabile aleatoare cu aceeai repartiie i pe
baza lor construim irul X
n
= X dac n este par i X
n
= Y dac este impar, atunci
n X va converge peste tot la
2
Y X +
, care nu numai c nu coincide cu media, dar
mai este i variabil aleatoare.
Se pot da exemple de iruri de variabile aleatoare identic repartizate pentru
care media empiric nu converge nicieri. De exemplu se iau doua variabile
aleatoare X i Y si cu ajutorul lor se construieste un sir format doar din X i Y
care nu are limit Cesaro.

Observaia 5.2.2. Legea slab se mai numete Teorema lui Bernoulli. Ea a dat
primul rspuns la ntrebarea: putem aproxima empiric probabilitile? Forma
sa verbal repetat de sute de ani este: Frecvenele relative converg n
probabilitate la adevrata probabilitate.

Acest rezultat nu este satisfctor. De aceea teorema lui Bernoulli se numete
Legea slab. Faptul c n X converge n probabilitate la nu nseamn de loc c
irul n X () converge la pentru toate scenariile , nici mcar c aa ceva se
ntmpl pentru marea lor majoritate. E suficient s privim exemplul 5.1.7. E
adevrat c el conine un subir care converge la (observaia 5.1.17) dar asta ne
ajut prea puin.
Am dori un rezultat tare care s ne asigure c n X converge la aproape
sigur. Dac eliminm ipoteza ca natura ne joac o fars urt, atunci putem fi
siguri c dac tot repetm un experiment n anumite condiii, ne vom apropia
orict de media cea adevrat.
5

Chiar aa se i ntmpl.




5.2.2 Legea tare

Preul este s nlocuim ipoteza ca variabilele X
n
sunt necorelate cu ipoteza
mult mai tare c ele sunt independente.

5
Aici e de fapt o problem de filosofie a satisticii: decretm c evenimentele de probabilitate 0
nu se ntmpl. E o discuie fascinant, dar mai complicat.
139
Fie atunci X: 9

vectorul cu componentele X = (X
1
,X
2
,....). Componentele
sale X
j
sunt proieciile pr
j
(X). n loc s scriem
n
X , scriem
)) ( ... ) ( (
1
1
X pr X pr
n
n
+ + . Avantajul este c acum avem o singur variabil,
anume X. Introducem i funcia t: 9

definit prin
t(x
1
,x
2
,.....) = (x
2
,x
3
,....) pr
j
(t(x)) = pr
j+1
(x) j > 1 (5.2.1)
care se numete shiftul canonic. Dac notm cu f:9

9 prima proiecie ( f =
pr
1
)

atunci putem scrie
n X = ( ) ) ( ...
1
1 2
X t f t f t f f
n
n
+ + + + (5.2.2)
unde prin t
k
nelegem tt...t, compunerea de n ori a lui t cu ea nsi.
Scrierea are avantajul c ne permite s ne concentrm asupra unui ir
Cesaro n care apar doar dou variabile: funcia f i shiftul t. Cu studiul unor
asemenea iruri se ocup o disciplin matematic numit teorie ergodic.
Ca s putem aplica rezultatele din teoria ergodic, ar trebui verificat c
shiftul invariaz msura.
Este vorba despre repartiia P
1
= PX
-1
a vectorului X. Ea este o
probabilitate pe spaiul produs (9

,B

(9))
6
n general nu tim s o calculm, dar
dac facem ipoteza suplimentar c variabilele X
n
sunt independente i identic
repartizate, atunci este uor de vzut c P
1
= F

, unde F este repartiia comun a


variabilelor aleatoare X
n
.
7


Lema 5.2.3. Pe spaiul (9

,B

(9)) avem c
(i) P
1
t
-1
= P
1

(ii) Dac A e B

(9) are proprietatea c t


-1
(A) = A, atunci P
1
(A) e {0,1}

Demonstraie
(i) Trebuie artat c P
1
(t
-1
(A)) = P
1
(A) A e B

(9). Din motive elementare


8
este
suficient s verificm acest lucru pentru un bloc de lungime n, A =
B
1
B
2
...B
n
99...

6
o-algebra produs se definete ca fiind cea mai mic o-algebr generat de blocuri. Un bloc de
lungime n este o mulime de forma B
1
B
2
...B
n
99....... unde mulimile B
n
sunt boreliene.
Mulimea D a blocurilor este n mod evident stabil la intersecii finite, deci B

(9) coincide cu
U-sistemul generat de D.
7
Amintim c dac H
j
sunt o probabilitate pe un spaiu msurabil (E,E), atunci P = H
1
H
2
....
este probabilitatea pe E

cu proprietatea c P(B
1
B
2
...B
n
EE.....) = H
1
(B
1
)H
2
(B
2
)...H
n
(B
n
).
C o asemenea probabilitate (numit probabilitate produs) exist, nu este evident: existena ei
este dat de teorema lui Kolmogorov. Dac H
1
= H
2
= ....= H, atunci probabilitatea produs se
noteaz cu H

. Acesta este cazul nostru.


8
Motivul elementar este c dac dou probabiliti definite pe o aceeai o-algebr coincid pe un
sistem de generatori nchis la intersecii finite al o-algebrei , atunci ele coincid. n cazul de fa
acest sistem de generatori este mulimea D a blocurilor.
140
S remarcm c t
-1
(A) = 9A. ntr-adevr, x e t
-1
(A) t(x) e A (x
2
,x
3
,.....) e
B
1
B
2
...B
n
99.. x
2
e B
1
, x
3
e B
2
,...,x
n+1
e B
n
x e 9
B
1
B
2
...B
n
99.. = 9A. Deci P
1
(t
-1
(A)) = F

( 9 B
1
B
2
...B
n
99..) =
F(9)F(B
1
)...F(B
n
) = F(B
1
)...F(B
n
) = P
1
(A). Adic t invariaz probabilitatea P
1
.
(ii) Lucrm cu indicatori, cci este mai comod. Ipoteza t
-1
(A) = A devine 1
A
t = 1
A

. Dac punem f n loc de 1
A
se pune ntrebarea ce putem spune despre o funcie f
care are proprietatea c f = ft. Aplicm aceast funcie vectorului X i avem c
f(X) = f(t(X)) = f(t(t(X))) = .... sau, scris explicit, c f(X
1
,X
2
,...) = f(X
2
,X
3
,...) =
f(X
3
,X
4
,...) = .......
Aici intervine n for ipoteza independenei.
Deci variabila aleatoare Y = f(X) este independent de X
1
(de vreme ce Y =
f(X
2
,X
3
,...) !) i de X
2
(de vreme ce Y = f(X
3
,X
4
,...) !), i de X
3
, adic de toate
variabilele aleatoare X
n
. Deci f(X) este independent de X, adic i de f(X).
nseamn c Y este independent de ea nsi. Dar atunci ea este constant
aproape sigur.
Concluzie: dac 1
A
t = 1
A
, atunci 1
A
= constant (mod P
1
). Aceast constant,
firete, nu poate fi dect 0 sau 1: deci P(A) e {0,1}. q.e.d.

Definiia 5.2.4. Fie (,K,P) un spaiu probabilizat. i fie t : msurabil.
Spunem c t este ergodic fa de P dac P
1
t
-1
= P
1
i t
-1
(A) = A P(A) e {0,1}

Acum suntem n contextul firesc al teoriei ergodice. Putem aplica:

Teorema 5.2.5.(Teorema ergodic) Fie (,K.P) un spaiu probabilizat i f e
L
1
(,K,P). Fie, de asemenea, t: o funcie ergodic. Atunci

( )
1 2
...
1

+ + + +
n
t f t f t f f
n

. .s a
Ef =
}
fdP

Demonstraia este departe de a fi evident i nu o vom da aici.
9

i avem ceva mult mai tare dect am sperat, anume

Teorema 5.2.6. Fie (,K,P) un spaiu probabilizat, (E,E) un spaiu msurabil, X
= (X
n
)
n
un ir de variabile aleatoare X
n
: E cu proprietatea c shiftul t: E

este ergodic fa de repartiia sa P


1
= PX
-1
. Fie f: E

9 o funcie
msurabil cu proprietatea c f(X) e L
1
(,K,P). Atunci
( ) ) ( ...
1
1 2
X t f t f t f f
n
n
+ + + + converge P aproape sigur la Ef(X).

9
Cititorul interesat poate gsi multe despre aceast teorem aici:
http://en.wikipedia.org/wiki/Ergodic_theory. O demonstraie frumoas se poate gsi in
cursul lui I. Cuculescu (1974) sau Tudor. Demonstraia original a autorului (Birkhoff
1931) este aici: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1076138/?page=1


141

Demonstraie
Nu avem dect s aplicm teorema ergodic pe spaiul (E

,E

,PX
-1
).
q.e.d.

Avantajul acestei formulri a legii tari a numerelor mari este c se poate
generaliza i la alte tipuri de iruri de variabile aleatoare de exemplu la lanuri
Markov sau la proces staionare.
Ca s o nelegem mai bine, o s i scriem cteva particularizri.

Corolarul 5.2.7. Fie (X
n
)
n
un ir de variabile aleatoare i.i.d. cu valori ntr-un
spaiu msurabil (E,E) i fie f: E

9 o funcie msurabil cu proprietatea c


f(X
1
,X
2
,....) e L
1
. Atunci
( ) ( ) ( ) ( ) ( ) ,... , ,... , ... ,... , ,... ,
1
2 1
. .
1 3 2 2 1
X X Ef X X f X X f X X f
n
s a P
n n
+ + +

+
(5.2.3)
i acest enun este foarte general. Ca s l putem aplica, ar trebui s putem
calcula membrul drept. Particularizm la cazuri calculabile. De exemplu dac
variabilele aleatoare sunt reale iar f depinde doar de o mulime finit de
componente:

Corolarul 5.2.8. Fie (X
n
)
n
un ir de variabile aleatoare i.i.d. i fie f:9
k
9 o
funcie msurabil cu proprietatea c f(X
1
,X
2
,...,X
k
) e L
1
. Atunci
( ) ( ) ( ) ( ) ( )
k
s a P
k n n n k k
X X X Ef X X X f X X X f X X X f
n
,..., , ,.., , ... ,.., , ,.., ,
1
2 1
. .
1 1 1 3 2 2 1
+ + +

+ + +
(5.2.4)

Avantajul este c acum chiar putem calcula membrul drept, folosind formula
de transport.
Dac PX
n
-1
= F, atunci Ef(X
1
,...,X
k
) =
}
k
fdF .
Dac, de exemplu, F are o densitate fa de msura Lebesgue, atunci
Ef(X
1
,...,X
k
) = ( ) ( ) ( ) ( )
}

k k k
dx dx dx x x x x x x f ... ... ,..., ,
2 1 2 1 2 1
.

O particularizare i mai mare este cea cu care am nceput: dac f = pr
1
.

Corolarul 5.2.9. Legea tare a numerelor mari (SLLN)
10

Fie (X
n
)
n
un ir de variabile aleatoare i.i.d. din L
1
. Fie F repartiia lor i =
EX
1
= ( )
}
x xdF . Atunci
n
X X X
X
n
n
+ + +
=
...
2 1
converge a.s. la ..

Exemplul 5.2.10. Fie X
n
variabile aleatoare pozitive i.i.d. i repartiia F. Atunci
media geometric
n
n
X X X ...
2 1
converge a.s. la
( )
}
=
x xdF X E
e e
ln ln
1
. (ntr-adevr,

10
abreviere internaional: Strong Law of Large Numbers
142
logaritmnd expresia avem ( )
n
X X X
n
ln ... ln ln
1
2 1
+ + + ElnX
1
). Dac P(X
n
= 0) > 0,
atunci limita este 0.

Exemplul 5.2.11. Media lor armonic converge la
1
1
/ 1
X
E . ntr-adevr,

1 2 1
1
1
1
...
1 1
X
E
X X X
n
n

+ + +
.

Exemplul 5.2.12. (Procese de rennoire). Fie (o
n
)
n
un ir de variabile aleatoare
i.i.d. strict pozitive a.s. i T
0
= 0 iar n > 1 T
n
= o
1
+ ...+ o
n
. Fie N(t) = max{k:T
k
<
t}. N(t) este un contorcare numr cte variabile o
j
au aprut pn la momentul t.
Atunci
1
. .
1 ) (
o

E t
t N
s a
. ntr-adevr, N(t) = n T
n
s t < T
n+1
. Dac t , atunci
n i avem cletele
n
T
t N
t
n
T
n n 1
) (
+
< s n care termenii din stnga i din dreapta
au aceeai limit, anume Eo
1
.


Posibilitatea statisticii: teorema lui Glivenko

Revenim la problema iniial: putem spera s aproximm, empiric, funcia de
repartiie a unei variabile aleatoare X?
Dac dispunem de un ir de observaii independente asupra ei, rspunsul este,
da.
Cu condiia s punem problema corect.
Observaii independente asupra lui X nseamn de fapt un ir de variabile
aleatoare (X
n
)
n
care sunt independente, identic repartizate i avnd aceeai
repartiie ca X.

Exemplu 5.2.13. Se d un zar, posibil falsificat i dorim s estimm
probabilitile p
i
= P(X = i), 1 s i s 6. X este rezultatul unei aruncri a zarului.

Exemplu 5.2.14. Se arunc la ntmplare dou puncte A, B ntr-un ptrat de
latur L = 1. Segmentul AB are o lungime aleatoare X e [0, 2 ]. Am dori s i
gsim funcia de repartiie n ipoteza c la ntmplare nseamn c punctele A
i B sunt vectori aleatori independeni repartizai uniform n ptrat.

n ambele cazuri problema este similar, dei cu grad de dificultate tehnic
diferit.
Fie (X
n
)
n
un ir de variabile i.i.d. cu funcia de repartiie F. Deci F(x) = P(X
j
s
x). i atam funcia de repartiie empiric i artm c ea converge la F.
143

Definiia 5.2.15. Fie (X
n
)
n
un ir de variabile aletoare i.i.d. irul de variabile
aleatoare F
n
(x) = { } x X n j
n
j
s s :
1
se numete funcia de repartiie empiric
calculat n x.

Propoziia 5.2.16. Pentru orice n > 1, Y
n
:= nF
n
(x) sunt variabile aleatoare
repartizate Binomial(n, F(x)). Deci EY
n
= F(x), Var(Y
n
) = nF(x)(1 F(x)). n plus,
F
n
(x)
. .s a
F(x)
n cuvinte:Funcia de repartiie empiric converge aproape sigur la adevrata
funcie de repartiie.

Demonstraie
Fie Z
j
=
{ } x X
j
s
1 . Variabilele Z
j
sunt i.i.d. repartizate Binomial(1,F(x)) iar
F
n
(x) nu este altcineva dect
n
Z Z Z
n
+ + + ...
2 1
care, conform SLLN converge a.s.
la EZ
1
= F(x). q.e.d.

i totui, se poate i mai bine.

Este adevrat c F
n
(x) converge punctual la F(x). Dar funcia de repartiie F:9
[0,1] este definit pe o mulime nenumrabil.
Nu cumva mulimea
0
:= { e F
n
(x)() F(x) pentru orice x e 9} poate
s fie de probabilitate mic, sau chiar 0? Noi am vrea s estimm funcia de
repartiie F n toate punctele, nu numai ntr-un singur x!
Din fericire, lucrurile nu stau aa. Nu numai c P(
0
) = 1 (ceea ce traneaz
problema), dar se poate demonstra chiar mai mult:

Teorema 5.2.17. (Teorema lui Glivenko) Fie
n
() = sup F
n
(x)() F(x)
distana uniform dintre funcia de repartiie empiric dup n observaii i
adevrata funcie de repartiie. Atunci
n

. .s a
0
Funcia de repartiie empiric converge aproape sigur uniform la
adevrata funcie de repartiie.

Nu vom da demonstraia acestui rezultat.
11

Semnalm c ea este foarte mult mbuntit dac funcia de repartiie F este
continu. Un rezultat de matematic grea este urmtorul

Teorema 5.2.18. (Teorema Kolmogorov Smirnov) Dac F este continu, atunci

11
Cititorul interesat poate consulta Teoria probabilitilor de Cuculescu (1974) sau Tudor (1980).
Sau poate vedea mai multe referine aici
http://en.wikipedia.org/wiki/Glivenko%E2%80%93Cantelli_theoremhttp://en.wikipedia.org/wiki
/Glivenko%E2%80%93Cantelli_theorem
144
lim
n
P( n
n
s x) =
( )

t
>
t

1
8
1 2
2
2 2
2
i
x
i
e
x



Metoda Monte Carlo

Metoda se folosete ntr-o serie de probleme unde apar calcule prea grele
pentru a fi abordate determinist. Ele sunt de dou tipuri: calcul de integrale sau
probleme de optimizare.
Calcul de integrale.
S presupunem c vrem s calculm o integral de forma
I = ( )
} }
=
C
k
C k k
d f dx dx dx x x f 1 ... ,...,
2 1 1

(5.2.5)
unde C este un compact de msur Lebesgue pozitiv i f o funcie
integrabil pe acel compact. Ideea este s generm un ir de vectori aleatori
independeni X
n
repartizai uniform n compactul C. Atunci
( ) ( ) ( ) ( )
1
. .
1
...
1
X Ef X f X f
n
s a
n
+ + . Dar, conform formulei de transport, Ef(X
1
) =
( )
( )
} }

=
C k k
k
C
dx dx dx x x f
C
fdU ... ,...,
1
2 1 1
.Deci algoritmul este
( )
}
C
k k
dx dx dx x x f ... ,...,
2 1 1
=
k
(C)[a.s. lim
n
( ) ( ) ( )
n
X f X f
n
+ +...
1
1
]
(5.2.6)
A simula un vector aleator repartizat uniform ntr-un compact nu este un
lucru simplu. Uneori ns, este simplu: dac C = [a
1
,b
1
][a
2
,b
2
]...[a
k
,b
k
]. Atunci
X
n
= (X
n,1
,...,X
n,k
) este uor de simulat: componentele sale sunt variabile aleatoare
independente repartizate Uniform(ai,bi). Toate mediile de programare (R, C++,
Java, R, Matlab, Excel etc) au n dotare cel puin generatoare de numere
pseudoaleatoare, repartizate Uniform(0,1)
Revenind la Exemplul 1.1.11. Urmtoarea secvena (sau, cum i se mai
spune, script) din mediul de programare R:
segment1<-function(n)
{xa=runif(n);xb=runif(n);ya=runif(n);yb=runif(n)
d=sqrt((xa-xb)^2+(ya-yb)^2)
d}
face n simulari (instruciunea xa=runif(n) produce un vector de lungime
n cu componentele variabile aleatoare repartizate Uniform(0,1)
Cu instruciunea
> d<-segment1(1000000);summary(d)
generm 1000000 de segmente crora le calculm lungimea. Apoi ni se
furnizeaz minimul, maximul, prima cuantil, mediana, media i cuantila a treia.
145
Sigur c este vorba de cuantilele de selecie (se poate arta, tot pe baza
SLLN c i cuantilele de selecie converg la adevratele cuantile). Conform
SLLN ne ateptm ca aceste variaile aleatoare (cci asta sunt!) s nu oscileze
prea tare i s ne dea informaii despre repartiia variabilei aleatoare X = A-B.
Iat rezultatul a 10 simulri de cte 1 milion de segmente

Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0007994 0.3276000 0.5118000 0.5214000 0.7049000
1.3560000
0.0002333 0.3278000 0.5116000 0.5211000 0.7043000
1.4010000
0.0003137 0.3284000 0.5117000 0.5214000 0.7043000
1.3670000
0.0005139 0.3279000 0.5119000 0.5213000 0.7044000
1.3760000
0.0006177 0.3277000 0.5117000 0.5210000 0.7043000
1.3880000
0.0008395 0.3284000 0.5119000 0.5212000 0.7041000
1.3860000
0.0004015 0.3283000 0.5123000 0.5215000 0.7046000
1.3860000
0.0008071 0.3279000 0.5113000 0.5209000 0.7039000
1.3790000
0.0006265 0.3282000 0.5113000 0.5213000 0.7045000
1.3820000
0.0005321 0.3284000 0.5126000 0.5215000 0.7046000
1.3800000

Observm c media reprezint o remarcabil stabilitate: primele dou
zecimale nu se schimb. La fel i mediana. Putem avea o idee despre precizia
estimrii comparnd cu lucruri cunoscute: tim c maximul esenial al lui X este
2
i minimul este 0. Maximul empiric al lui X pare s fie 1.38 iar minimul
pare a fi 0.
Calculul exact este aproape imposibil de fcut. Teoretic, avem de calculat
urmtoarele
F(x) = P(X s x) = P((x
A
x
B
)
2
+ (y
A
y
B
)
2
s x
2
)
(5.2.7)
EX = E ( ) ( )
2 2
B A B A
y y x x +
(5.2.8)
unde A(x
A
,y
A
), B(x
B
,y
B
) sunt punctele aleatoare repartizate uniform n ptratul
unitate.
Formal, se dau patru variabile aleatoare independente: x
A
, x
B
, y
A
, y
B
i se cere s se
calculeze cantitile (5.2.7) i (5.2.8). Prima revine la a calcula msura Lebesgue
4-dimensional
4
a mulimii M
x
= { x
A
, x
B
, y
A
, y
B
e [0,1]: (x
A
x
B
)
2
+ (y
A
y
B
)
2
s x
2
}
Iar a doua, pe baza formulei de transport, la a calcula integrala
146
EX = ( ) ( )
} } } }
+
1
0
1
0
1
0
1
0
2 2
B A B A B A B A
dy dy dx dx y y x x
Prima cantitate se poate calcula exact, cu mult efort; pentru al doua, nu exist
formule prin cuadraturi.
Ca s avem o idee de puterea metodei, o putem compara cu metodele
deterministe de calcul ale integralelor multiple. Tot o sum avem de fcut, dup
ce lum cte o diviziune pe fiecare ax. Dac diviziunea este echidistant cu 20
de puncte, vom avea de calculat valoarea funciei de integrat n 204 = 160.000 de
puncte. Nu e sigur c eroarea va fi mai mic!
Putem concluziona c X este o variabil aleatoare cu media 0.521 i
mediana.512
De curiozitate, prezentm i graficul unei funcii de repartiie empirice dup
100.000 de probe.


Calcul de maxime-minime.

O problem fundamental n matematica aplicat este de a gsi maximele i
minimele unei funcii f:C 9 unde C este un domeniu din 9
kk
. Exist multe
metode deterministe de a face acest lucru acesta este domeniul teoriei
optimizrii. Exist dou tipuri de agoritmi : determiniti i probabiliti.
Ideea de baz a algoritmilor probabiliti este de a arunca o ploaie de puncte
la ntmplare cu mai mult sau mai puin inteligen .

Propoziia 5.2.19. Fie f:C 9 o funcie mrginit definit pe compactul cu
interior nevid C _ 9
k
. Fie (X
n
)
n
un ir de variabile aleatoare repartizate uniform
n C i Y
n
= max(f(X
1
),...,f(X
n
)), Z
n
= min(f(X
1
),..,f(X
n
)). Atunci (Y
n
)
n
este un ir
cresctor de variabile aleatoare, (Y
n
)
n
este un ir descresctor . Primul
147
converge aproape sigur la Esssupf iar al doilea la Essinf f.
12
Dac f este
continu, atunci Y
n

. .s a
max(f) i Z
n

. .s a
min(f)

Demonstraie
Fie F funcia de repartiie a variabilei aleatoare f(X) unde X ~
Uniform(C). Deci F(x) = P(f(X) s x) = P(X e f
-1
(-,x]) =
k
(f
-1
(-,x])/
k
(C).
Fie M = ess inf f. Atunci P(Y
n
s M - c) = P(max(f(X
1
),...,f(X
n
)) s M - c). Dar
variabilele f(X
k
) sunt independente, deci
P(max(f(X
1
),...,f(X
n
)) s M - c) = P(f(X
1
) s M - c, f(X
2
) s M - c,... f(X
n
)) s M - c)
= P(f(X
1
) s M - c)P(f(X
2
) s M - c,)...P(f(X
n
)) s M - c) = F
n
(M - c). Cum M este
supremul esenial, F(M - c) < 1, deci F
n
(M - c) 0. Deci P(Y
n
s M - c) 0. Dar
irul Y
n
, fiind cresctor, are o limit, Y

. Rezult c P(Y

s M - c) = 0 c. Deci Y

>
M. Pe de alt parte, Y
n
s M deoarece toate variabilele aleatoare f(X
j
) au aceast
proprietate. nseamn c Y

= M P-a.s. Y

= M (
k
a.p.t.).
Dac funcia este continu, nu mai este nevoie de precauia ca ea s fie
mrginit: sigur c este, deoarece orice funcie continu duce compacte n
compacte. Mai mult, atunci maximul ei coincide cu supremul esenial din
urmtorul motiv: fie M = max f. Atunci mulimea {x e C f(x) > M - c} este
deschis n C, deci are interior nevid. Orice mulime de interior nevid are msur
pozitiv. Adic M are proprietatea care definete supremul esenial.
Demonstrarea afirmaiilor legate de minim sau infimul esenial este analog.
q.e.d.

Observaia 5.2.20. Acesta este cel mai simplu algoritm, deoarece lucreaz n
orb, fr memorie. Perfecionarea lui duce la algoritmii genetici. Dac
apelm i la un minimum de memorie, reinnd punctele de minim i maxim
gsite, atunci putem avea o idee despre Argmin f i Argmax f
13


Exemplul 5.2.21. Pentru a vedea ct este de tare algoritmul, s lum o funcie
creia i putem calcula extremele, de exemplu f(x,y) = x.y xy, f:[0,1]
2
9.
Verificai c max f = f( , ) = , minf =0. Puncte de minim sunt o infinitate
frontiera ptratului unitate, dar exist un singur punct de maxim.. Aplicm
metoda Monte Carlo i s vedem ce rezult. Dup 1000 de simulri a rezultat
minimul min f = 4.069785e-07 (n loc de 0), maximul max f = 0.2480471 (n loc
de 0.25), punctul de maxim z = (0.5315545, 0.5295112) (n loc de (0.5, 0.5)!) i
un punct de minim de coordonate (0.8046973, 2.083834e-06) . Dac ns facem

12
Supremul esenial al unei funcii definite pe un compact de interior nevid C este un numr M
cu proprietatea c f(x) s M pentru aproape toi x e M i msura Lebesgue a mulimii {x e C f(x)
> M - c} este pozitiv c>0. Similar, infimul esenial este un numr m cu proprietatea c f(x) >
M pentru aproape toi x e M i msura Lebesgue a mulimii {x e C f(x) < M + c} este pozitiv
c>0. A nu se confunda cu supremul i infimul De exemplu, dac f = 1

cu diagonala
ptratului unitate din plan, i cealalt diagonal atunci sup f = 1, inf f = -1, dar ess sup f = ess
inf f = 0.
13
O notaie pentru punctele n care se gsete maximul sau minimul.
148
10000 de simulri, obinem minf =9.063544e-09, max f = 0.2499187, Argmax(f)
= (0.4966409, 0.4967819), Argmin(f) =(0.9999011, 9.165588e-05) .

De regul algoritmii Monte Carlo nu se aplic dect in extremis dac nu
avem altceva mai bun.
Viteza de convergen la WLLM i SLLM este dat de o
2
= Var(X
i
).



5.3. Convergena n repartiie

Spre deosebire de convergenele din capitolul precedent, convergena n
repartiie nu se refer ca convergena variabilelor aleatoare, ci la cea a
repartiiilor lor. Propoziia X
n
converge la X n repartiie cu notaia X
n
D
X
trebuie neleas n sensul repartiiile variabilelor aleatoare X
n
converg la
repartiia lui X .
De obicei, noiunea de convergen este legat de o topologie: un ir de
repartiii F
n
are limita F dac n afara oricrei vecinti a lui F exist cel mult un
numr finit de termeni ai irului.
i tot de obicei, noiunea de vecintate este legat de o distan: o vecintate
a unui punct F este o mulime care conine o bil de centru F i raz c.

Convergena tare
Cele mai folosite distane sunt date de norme: d(F,G) =F - G.
Repartiiile variabilelor aleatoare sunt probabiliti pe dreapt. Probabilitile
sunt msuri finite pe (9, B(9)). Diferena a dou msuri finite este o msur cu
semn.
Aici trebuie amintite unele lucruri elementare: msurile finite cu semn pe un
spaiu msurabil (E,E) formeaz spaiu vectorial. O msur cu semn : E 9
se poate ntotdeauna scrie sub forma =
+
-
-
unde
+
i
-
reprezint partea
pozitiv i partea negativ a msurii. Aceasta este descompunerea Hahn
Jordan.
14

Mai mult, exist o mulime H _ E
15
cu proprietatea
+
(E) = (H) i
-
(E) =
(E \ H). Ea are proprietatea c (AH) > 0 , (A \ H) s 0 pentru orice A e E .
Msura :=
+
+
-
se numete variaia lui iar funcia definit prin
= (E) = 2(H) - (E) este o norm: = 0 = 0 i
1
+
2
s
1
+
2


1
,
2
msuri cu semn.

14
Vezi orice manual de teoria msurii sau, de exemplu aici:
http://www.math.purdue.edu/~zhang24/SignedMeasure.pdf
15
Ea se numete mulimea Hahn ataat lui . Dac, de exemplu, = v, unde v este o msur
oarecare, atunci H = { > 0}
149
Norma se calculeaz uor dac are o densitate fa de o msur adevrat,
v: mai precis, dac = v, atunci = v
}
d
16
.
De exemplu dac F i G sunt dou repartiii discrete cu acelai suport, F =
o
j
x j
j
p , G = o
j
x j
j
q , atunci v = o
j
x
j
, densitatea lui F ar fi (p
j
)
j
, cea a lui G ar
fi (q
j
)
j
iar distana ntre F i G ar fi F G =


j
j j
q p | | .

Definiia 5.3.1. Fie (E,E) un spaiu msurabil. Fie (F
n
)
n
i F probabiliti pe el.
Spunem c F
n
converge tare la F dac F F
n
0. Notm acest lucru prin
F
n
s
F.

Propoziia 5.3.2. Fie (E,E) un spaiu msurabil.
(i). Dac F i G sunt dou probabiliti pe E, atunci d(F, G) e [0,2]. Dac
d(F,G) = 0, atunci F = G iar dac d(F,G) = 2, atunci exist o mulime A n aa
fel nct F(A) = 0 i G(A) = 1. Spunem c F i G sunt singulare.
(ii). Dac v este o msur oarecare i F
n
= f
n
v, F = fv sunt probabiliti,
atunci F
n
s
F f
n
( )

v , ,
1
E E L
f. O condiie suficient ca f
n
s convearg la f
n L
1
este ca f
n
s convearga la f v - aproape sigur.
(iii). Dac F
n


s
F, atunci F
n
(A) F(A) A e E. Reciproca nu este
adevrat. Ca un caz particular, dac F
n
i F sunt repartiii de pe dreapta real,
atunci funciile lor de repartiie converg: F
n
((-,x]) F((-,x]).
17


Demonstraie
(i). Fie = F G.Deci (E) = F(E) G(E) = 1 1 = 0. Fie H mulimea Hahn
ataat lui . Atunci = 2(H) - (E) = 2(H). Dac = 2, atunci (H) = 1
F(H) G(H) = 1. Dar F i G sunt probabiliti, deci F(H) = 1 i G(H) = 0.
(ii). F
n
F = v
}
d f f
n
, deci e clar echivalena F
n
s
F f
n
( )

v , ,
1
E E L
f.
Interesant este cealalt afirmaie, deoarece n general nu este adevrat c dac f
n

converge la f aproape sigur, converge i n L
1
(vezi exemplul 1.1.8). Dar la noi
exist condiia foarte tare ca fn s convearg la o densitate de probabilitate.
Folosind egalitatea x = 2x
+
- x i avem

16
Notaia = .v este acceptat de majoritatea matematicienilor pentru a desemna msura de
densitate i baz v. Precis, sensul este (v)(A) =
}
v d
A
1 pentru orice A e E. Ali autori
folosesc n acelai scop notaia d = dv, care are avantajele ei, deoarece atunci cnd calculm
integrala, densitatea iese n fa: ( )
}
v =
}
v d f fd .
17
Se obinuiete notaia F(x) n loc de F((-,x]). Dac suntem ateni, nu este nici un pericol de
confuzie: dac A este o mulime, F(A) nseamn probabilitatea lui A i dac x e punct, F(x)
nseamn F((-,x]).
150
( ) ( )
} }
v
}
+ v = v
+
d f f d f f d f f
n n n
2 = ( )
}
v
+
d f f
n
2 . irul (f f
n
)
+
tinde v-a.s.
la 0 este dominat de f care este n L
1
. Teorema de convergen dominat ne spune
atunci c putem comuta limita cu integrala: lim
n

}
v d f f
n
= v
}
d f f
n
n
| | lim = 0.
(iii). F
n
(A) F(A)s F
n
F (A) s F
n
F . Pentru a doua afirmaie, vezi
exemplul 1.3.7 de mai jos.

Exemple de aplicare

Exemplul 5.3.3. Dac (p
n
)
n
este un ir de probabiliti cu proprietatea c np
n

, cu >0, atunci repartiiile Binomial(n,p
n
) converg tare la Poisson(). ntr-
adevr, putem lua v = o
>0 n
n
msura cardinal cu suport mulimea numerelor
naturale i densitile f
n
(i) = ( )
i n
n
i
n
i
n
p p C

1 , f(i) =
! i
i

. Verificai c f
n
f.

Exemplul 5.3.4. Fie F
n
=
n
n n
o + o |
.
|

\
|

1 1
1
0
Atunci F
n
s
o
0
.

Exemplul 5.3.5. Dac a
n
a i b
n
b, atunci Uniform(a
n
,b
n
) Uniform(a,b).

Exemplul 5.3.6. Mai general, familiile de repartiii obinuite: (Geometric(p),
Negbin(k,p), Gamma(k,), N(,o
2
) etc) sunt continue n parametru:
n

Gamma(k,
n
)

s
Gamma(k,);
n
, o
n
o N(
n
,o
n
)

s
N(,o). Nu
avem dect s verificm c densiile converg.

Exemplul 5.3.7. Fie A
n
=
1 2
0
1
]
2
1 2
,
2
2
(

+
n
k
n n
k k
i F
n
= ( )
n
A
1 2 , unde este msura
Lebesgue. Fie f = Uniform(0,1) = 1
(0,1)
. Atunci F
n
F = 1 (ntr-adevr,
norma este egal cu
}
d
n
A ) 1 , 0 (
1 1 iar ( )( )

e
e
=
rest n
A x dac
A x dac
x
n
n
A
n
0
\ ) 1 , 0 ( 1
1
1 1
) 1 , 0 (
).
Totui, F
n
(A) F(A) pentru orice mulime borelian A din urmtorul
motiv:remarcm c F
n
(A) s 2F(A) pentru orice A e B (9). Fie atunci C ={A e B
(9): F
n
(A) F(A)}. Familia C este un u-sistem (singurul lucru cu probleme este
s artm c dac (A
k
) este un ir de mulimi disjuncte cu proprietatea c F
n
(A
k
)
F(A
k
), atunci i F
n
(
k
k
A ) F(
k
k
A ) ( ) ( )
k
k
k
k n
A F A F ceea ce rezult din
faptul c seriile ( )
k
k n
A F sunt dominate de 2 ( )
k
k
A F ). Acest u-sistem conine
intervalele A = (-,x]. ntr-adevr, pentru x s 0 sau x >1 funciile de repartiie
151
chiar coincide: F
n
(x) = F(x). Dac 0 < x < 1 se arat imediat prin inducie c
F
n
(x) = x +
1
1 1
2
| 2 ]
2
1
2 [ |


+
n
n n
x x
deci 0 s F
n
F s 2
-n
.
Deci funciile de repartiie converg uniform, (F
n
- F)(A) converge la 0 pentru orice
A i totui F
n
nu converge tare la F.

Exemplul 5.3.8. Dac F este o repartiie discret i G este o repartiie continu,
atunci F G = 2 adic maximul posibil. n consecin niciodat nu se poate
aproxima n sensul tare o repartiie continu cu un ir de repartiii discrete.

n multe situaii se pune problema evalurii momentelor unei variabile
aleatoare aproximndui repartiia cu alta. Schema mental este Dac X
n
D
X ,
atunci poate c i EX
n
EX


Este oare convergena tare suficient pentru a asigura convergena
momentelor?
Uneori chiar aa se ntmpl, dar n general rspunsul este negativ. Dac
lum, de exemplu, X
n
~ F
n
:=
|
|
.
|

\
|

n n
n
1 1
1
0
, X = 0~ o
0
, vedem c dei F
n
s
F, EX
n

= 1 nu converge la EX = 0. Problema convergenei momentelor este dificil.
18


Convergena slab

Convergena tare, dei cea mai natural, nu rspunde satisfctor problemelor
de statistic. Toate repartiiile vizibile n statistic sunt repartiii empirice, deci
sunt discrete. Exemplul 5.3.7 ne arat c nu se pot aproxima repartiiile continui
cu repartiii discrete. Ce puin nu n sensul tare.
Teorema lui Glivenko ne spune c (uneori, vezi mai sus) funciile de
repartiie empirice converg la adevrata funcie de repartiie. O idee ar fi s
decretm c

Definiia 5.3.9.(Definiie intermediar) Fie (F
n
)
n
un ir de repartiii pe dreapt.
Fie F o alt repartiie. Spunem c F
n
F dac F
n
(x) F(x) pentru orice x e 9.

Dar aceast definiie are dou neajunsuri. Amndou serioase.
n primul rnd, ca s fie ceva care corespunde intuiiei, ar trebui ca, dac x
n

x , atunci i
n
x
o s convearg la o
x
. i nu este aa. De exemplu, dac x
n
=
n
1
, x
n


18
Cititorul poate consulta, de exemplu, Ioan Cuculescu, Teoria Probabilitilor, Bucureti, All,
1998, pg 281-368.
152
0, dar funciile de repartiie sunt F
n
(x) =
) ,
1
[
1

n
(x) 1
(0,)
(x) ; limita nu este o
funcie de repartiie fiindc nu este continu la dreapta. Am fi vrut s convearg
la funcia de repartiie a lui o
0
, care este 1
[0,)
.
n al doilea rnd, ar fi preferabil o definiie care s se poat extinde i la alte
spaii msurabile, nu numai la dreapt. Am vrea s dm un sens, de exemplu, i
noiunii de convergen dac avem de a face cu repartiii n plan sau n spaiu.
De aceea s-a ales alt definiie. Ea are sens pe spaii mai generale, dar ne
mulumim aici cu spaiile euclidiene, care sunt cel mai bine cunoscute.

Definiia 5.3.10. Fie (F
n
)
n
, F repartiii pe spaiul euclidian (9
d
, B(9
d
)). Spunem
c F
n
converge slab la F dac
} }
fdF fdF
n
pentru orice funcie continu i
mrginit f.
19

Notm acest fapt prin F
n
F
Dac X
n
,X sunt vectori aleatori cu repartiiile F
n
i F, n locul notaiei F
n

F se folosete, prin abuz de limbaj, notaia X
n
D
X care se citete X
n

converge n repartiie la X. Se admite i notaia X
n
D
F , care se citete
X
n
converge n repartiie la F.

Proprietile cele mai importante ale acestei noiuni sunt sintetizate n
urmtorul rezultat Teorema Portmanteau.

Propoziia 5.3.11. (Teorema Portmanteau)
Fie E = 9
d
, d > 1, E = B(9
d
) i (F
n
)
n
, F probabiliti pe (E, E).
Atunci urmtoarele proprieti sunt echivalente
(i)
} }
fdF fdF
n
pentru orice f continu i mrginit
(ii)
} }
fdF fdF
n
pentru orice f uniform continu i mrginit
(iii) limsup F
n
(C) s F(C) pentru orice mulime nchis din E
(iv) liminf F
n
(D) > F(D) pentru orice mulime deschis din E
(v) lim F
n
(A) = F(A) pentru orice mulime A cu frontier F- neglijabil (adic
F( ) ( \ A Int A ) = 0!).
(vi) (doar pentru d = 1): F
n
(x) F(x) x punct de continuitate pentru F
(vii) (doar pentru d = 1): F
n
(x) F(x) x e I unde I este o mulime
numrabil dens din 9.

Nu vom demonstra aceast teorem. Unele implicaii sunt simple, altele mai
laborioase.
20



19
Mulimea funciilor reale continue i mrginite pe 9
d
se noteaz cu C
b
(9
d
).
20
Ioan Cuculescu, Teoria Probabilitilor sau
http://en.wikipedia.org/wiki/Convergence_of_measures. Sunt sute de cri care conin
demonstraia.
153
Observaia 5.3.12. Toate punctele teoremei de mai sus pot scrise n termini de
variabile aleatoare. Dac n loc de F
n
i F punem X
n
i X obinem urmtoarele
caracterizri echivalente ale faptului c X
n


D
X:
(i) Ef(X
n
) Ef(X) pentru orice f continu i mrginit
(ii) Ef(X
n
) Ef(X) pentru orice f uniform continu i mrginit
(iii) limsup P(X
n
eC) s P(X eC) pentru orice mulime nchis din E
(iv) liminf P(X
n
eD) > P(X eD pentru orice mulime deschis din E
(v) lim P(X
n
eA) = P(X eA) pentru orice mulime A cu frontier F-
neglijabil

Observaia 5.3.13. Nu trebuie s credem c dac F
n
sunt funcii de repartiie i
F
n
F, atunci i F este funcie de repartiie. Exemplele sunt nenumrate: 1
[n,)

sunt funcii de repartiie care converg la 0, la fel i funciile de repartiie pentru
Uniform(0,n) (adic F
n
(x) = ) 1 , min(
n
x
+
) etc. Este fenomenul cunoscut ca escape
to infinity sau se pierde mas spre infinit.

Observaia 5.3.14. Dac dorim s avem o familie de probabiliti care s fie
relative compact (din orice ir s se poat extrage un subir Cauchy), atunci
trebuie ca ea s fie tight: pentru orice c > 0 s existe un compact C cu
proprietatea ca F(C) > 1 - c pentru toate probabilitile F din acea familie
(Teorema lui Prohorov)
21
.

Remarcm urmtoarea consecin imediat a teoremei Portmanteau:

Corolarul 5.3.15. Fie X
n
.X vectori aleatori. Dac X
n


P
X, atunci X
n


D
X.
Convergena n probabilitate implic convergena n repartiie.

Demonstraie
Dac X
n


P
X, atunci conine un subir care converge a.s. la X. Dac f
este o funcie continu, atunci f(X
n
) converge aproape sigur la f(X). Dac f este i
mrginit, teorema de convergen dominat arat c Ef(X
n
) Ef(X).

Ce avem de fcut dac dorim s verificm o conjectur de tipul F
n
F?
Nici una din reetele din Teorema Portmanteau nu pare s funcioneze. Nici
mcar n cazul unidimensional: este uor de zis verific dac F
n
(x) converge la
F(x) pe o mulime dens, dar e mai greu de fcut.

Exist un instrument care ajut n multe cazuri, anume funcia
caracteristic.


21
De exemplu http://en.wikipedia.org/wiki/Prokhorov%27s_theorem
154
Definiia 5.3.16. Fie F o repartiie pe (9
d
,B(9
d
)). Funcia
F
: 9
d
C definit
prin

F
(t) = ( )
}
x dF e
x it '
(5.3.1)
se numete funcia caracteristic a lui F. (Un punct x din 9
d
este un vector
coloan; t este transpusul lui t deci tx este produsul scalar dintre t i x : tx =
t
1
x
1
+ t
2
x
2
+ ...+ t
d
x
d
). Dac F este repartiia unui vector aleator d-dimensional, X,
atunci scriem
X
n loc de
F
i, pe baza formulei de transport, avem

X
(t) = Ee
itX
(5.3.2)

Funcia caracteristic are proprietatea de a fi multiplicativ: dac X i Y sunt
vectori independeni, atunci
X+Y
=
X

Y
. Dac este de clas C

, atunci X are
toate momentele finite i ele se pot calcula prin derivri. Ea are ns o
proprietate suplimentar pe care analogul su real (funcia generatoare de
momente m
X
(t) = Ee
tX
) nu o are: aceea c domeniul su de definiie este acelai
indiferent de repartiia F i c ea caracterizeaz astfel, repartiia. Mai precis,
avem

Propoziia 5.3.17.
(i) Fie F i G dou repartiii pe (9
d
,B(9
d
)) cu proprietatea c
F
=
G
. Atunci F =
G (Teorema de unicitate).
(ii) Presupunem c (F
n
)
n
este un ir de repartiii cu proprietatea c irul
n
F
este
convergent i limita sa, , este continu n 0. Atunci exist o repartiie F cu
proprietatea c
F
= i F
n
F. Sau, n termeni de variabile aleatoare: dac
(X
n
)
n
sunt vectori aleatori d-dimensionali independeni i
n
X
, continu n
0, atunci exist o repartiie F ca X
n

D
F.

Nu vom demonstra nici aceast teorem fundamental.
22


Cu ajutorul ei ns putem arta

Propoziia 5.3.18.
(i). Dac F
n
F i G
n
G, atunci F
n
G
n
FG (sau, acelai lucru n
termeni de variabile aleatoare dac X
n

D
X, Y
n

D
Y ,X
n
independent de Y
n
,
atunci (X
n
,Y
n
)
D
(X,Y))
(ii). Dac F
n
F i G
n
G, atunci F
n
-G
n
F-G ( n termeni de variabile
aleatoare : dac X
n

D
X, Y
n

D
Y ,X
n
independent de Y
n
, atunci X
n
+Y
n


D
X+Y)

22
Ioan Cuculescu, Teoria Probabilitilor sau Lukacs, E. (1970). Characteristic functions.
London: Griffin.
155

Demonstraia se reduce la verificarea faptului banal c
FG
=
F

G
i
F-G
=

G
. q.e.d.


5.4. Teorema limit central

Am vzut c n varianta ei cea mai simplu de neles, Legea numerelor mari
spune c dac X
n
sunt variabile aleatoare i.i.d., atunci media empiric
n
X X X
X
n
n
+ + +
=
...
2 1
converge aproape sigur la adevrata medie = EX. Pentru
a studia mai amnunit viteza de convergen, ar trebui s calculm mrimea p(c)
= P( n X > c) ; am dori s tim cte observaii ne-ar trebui pentru ca aceast
probabilitate s fie mic. Dac scriem
n
S
X
n
n = , probabilitatea n cauz s-ar scrie
sub forma p(c) = P( n S
n
>nc) = P(S
n
e (-, n(-c)) (n(+c),))
Dac notm cu F
n
repartiia sumelor S
n
, atunci probabiliitatea respectiv s-ar
putea scrie p(c) = F(n( - c)) + 1 F(n(+c))
Ce s-ar putea spune despre aceast cantitate?
Se tie c repartiia sumei unor variabile aleatoare independente este
convoluia erepartiiilor termenilor. ntrebarea este: cum se comport
convoluiile de multe repartiii?
S studiem un exemplu n care se pot face calcule. S zicem c X
n
~ U(0,1).
Atunci vectorul X:=(X
1
,...,X
n
) este repartizat uniform n cubul [0,1]
n
. Deci P(S
n
s x)
= P( X e A
x
) unde

A
x
={x e[0,1]
n
: x
1
+...+ x
n
s x } (5.4.1)

Dac x s 1, este uor de fcut calculul: P( X e A
x
) este volumul simplexului
S
n
(x) = {x0: x
1
+...+ x
n
s x } care, din raiuni de simetrie este 1/n! din volumul
cubului, adic F
n
(x) =
! n
x
n
. Dac ns x > 1, atunci trebuie sczute din el
volumele celor n simplexe de latur x 1 care apar (fcei un desen n cazul n =
3!). Deci A
x
= S
n
(x) \ ( )
n
j
j
x A
1 =
cu A
j
(x) = {x e S
n
(x): x
i
> 1}. Intersecia unei familii
finite de asemenea mulimi e de aceeai form. Aplicnd principiul includerii i
exculderii, gsim
F
n
(x) = ( ) ( ) ( ) ..... 2 1
!
1
2 1
+
n
n
n
n
n
x C x C x
n
(5.4.2)

Unde suma se face atta vreme ct x k > 0. Ca s nu avem probleme de sumare,
scriem
156

F
n
(x) = ( ) ( )

=
+
0
1
!
1
k
n k k
n
k x C
n
(5.4.3)

unde x+ este partea pozitiv a lui x. Derivnd (sumele sunt, totui, finite) gsim
densitile

f
n
(x) =
( )
( ) ( )


=

+
0
1
1
! 1
1
k
n k k
n
k x C
n
(5.4.4)

n figura de mai jos am fcut graficele densitilor f
j
cu 2 s j s 6.
Se observ cum ele capt o form specific, de clopot.



0 1 2 3 4 5 6
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
x
y



Ca sa putem compara mai bine densitile, ar trebui s facem ca aceste
densiti s aib aceeai ax de simetrie. Adic s centrm variabilele aleatoare
X
n
, scznd din ele media. Astfel obinem sumele centrate S
n,c

= S
n
- n unde =
EX
n
= . Funciile de repatiie centrate, notate ad-hoc cu F
n,c
se calculeaz
imediat dup foemula evident

F
n,c
(x) = F
n
(x + n) , f
n,c
(x) = f
n
(x + n) (5.4.5)

Obinem cinci grafice care se pot compara mai bine, fiindc au aceeai ax de
simetrie.



157
-3 -2 -1 0 1 2 3
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
x
y


Totui, dispersiile tind la infinit, aa c i densitile centrate vor tinde la 0.
Nu putem s le comparm bine. Ca s facem s aib toate aceeai dispersie,
mprim la abaterea medie ptratic a lui S
n
, care este o n , unde o
2
= Var(X
n
) =
12
1
. Obinem sumele centrate i normate
s
n
=
n
n S
n
o


(5.4.6)

care au funciile de repartiie notate cu

u
n
(x) = P(s
n
s x) = F
n
(n + o n x) (5.4.7)

i densitile


n
(x) = u
n
(x) = o n f
n
(n+o n x) (5.4.8)

Mai jos am fcut graficele celor cinci densiti centrate i normate. Se observ
cum se stabilizeaz.



158
-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5
0.1
0.2
0.3
0.4
0.5
x
y



Cine este limita?

S lum un caz particular, n care chiar putem face calcule: s zicem c X
n
~
Exp(1) sunt toate repartizate exponenial standard. Verificai imediat prin
inducie c

f
n+1
(x) = ) ( 1
!
) , 0 (
x e
n
x
x
n


(5.4.9)

Acum = o = 1, deci conform cu (1.4.8) avem
n+1
(x)= 1 + n f
n
(n+1+ 1 + n x)
adic

n+1
(x) =
( )
( )
) 1 1 ( 1
!
1 1
1
) , 0 (
1 1
x n n e
n
x n n
n
x n n
n
+ + +
+ + +
+

+ + +

(5.4.10)

Dac n este mare, n+1 + x 1 + n devine pozitiv, deci putem renuna la
indicator.Aplicm formula lui Stirling, n! n
e
n
n
t |
.
|

\
|
2 i avem
n+1
(x)

( ) x n n n
n
e
n
x n n
n
n
1 1
1 1
2
1
+ + +
|
|
.
|

\
|
+ + +
t
+
=
( ) x n
n
n
e
n
n
n
x n n
n
n
1 1
1
1
1 1
2
1
+ +
|
.
|

\
| +
|
|
.
|

\
|
+
+ + +
t
+
.

Trecnd la limit avem

( ) x
n
n


lim
= lim
x n
n
n
e
n
x n n
n
n
n
n
e
1 1
1
1 1
lim
1
2
1
+
|
|
.
|

\
|
+
+ + +
|
|
.
|

\
|
|
.
|

\
| +
t
+
=
|
|
.
|

\
|
|
|
.
|

\
|
+
+
t
+ x n
n
e
n
x
1
1
1 lim
2
1

=
t 2
1
L

159
Logaritmm: lnL = lim
|
|
.
|

\
|
+
|
|
.
|

\
|
+
+ 1
1
1 ln n x
n
x
n . Dezvoltm logaritmul n serie
(ln(1+t) = t t
2
/2 + t
3
/3 t
4
/4 + ....) i avem

lnL = lim ( )
( ) ( ) ( )
|
|
.
|

\
|
+
|
|
.
|

\
|
+
+

+ +
+
+

+
+
+
1 ...
1 4 1 1 3 1 2 1
1
1
2
4 3 2
n x
n
x
n n
x
n
x
n
x
n
n
n


= lim
( )
|
|
.
|

\
|
+
|
|
.
|

\
|
+
+

+
+ + 1 ...
1 4 1 3 2
1
4 3 2
n x
n
x
n
x x
n x = - x
2
/2.

Concluzie
irul densitilor centrate i normate converge, n cazul n care X
n
sunt
repartizate Exp(1) la funcia (x) =
2
2
2
1
x
e

t
. Aceasta chiar este o densitate, este
densitate repartiiei noemale standard N(0,1)! (Atenie: limita unui ir de
densiti nu este obligatoriu o densitate, dup cum ne putem convinge cu
densitile f
n
= 1
[0,n]
(x)/n care converg la 0! )

Am verificat pe un caz particular

Teorema 5.4.1(Teorema limit central local) Dac densitatea comun a
variabilelor aleatoare i.i.d. din L
2
, (X
n
)
n
, este mrginit, atunci densitile
n
ale
sumelor centrate i normate s
n
=
n
n S
n
o

converge la densitatea repartiiei
normale standard :
n
(x)
2
2
2
1
x
e

t
. n consecin, conform Propoziiei
5.3.2.(ii)

( ) 1 , 0 N
n
n S
s
n

o


(5.4.11)

Afirmaia este valabil ntr-un context i mai general, anume dac putem
demonstra c exist un n ncepnd de la care n este o mrginit. Demonstraia
depete cu mult cadrul acestui manual. Cine chiar este interesat o poate gsi de
exemplu, n Y. Ptohorov, Y. Rozanov, Probability Theory, Springer 1969, pp
190-194. Alte demonstraii, mai recente se pot gsi pe Internet, cu Google.

Dar dac variabilele aleatoare X
n
sunt discrete, atunci problema local nu are
sens. Se poate demonstra un rezultat mai slab.


160
Teorema 5.4.2.(Teorema Limit Central (TLC))
Fie (X
n
)
n
un ir de variabile aleatoare i.i.d. din L
2
. Fie = EX
1
i o
2
= Var(X
1
).
Atunci

( ) 1 , 0
...
2 1
N
n
n X X X
D
n

o
+ + +

Scris explicit, afirmaia este c

lim
n }
t
=
|
|
.
|

\
|
s
o
+ +

x
t
n
dt e x
n
n X X
P
2
1
2
2
1 ...


Observaia 5.4.3. Funcia de repartiie a repartiiei N(0,1) se noteaz cu u i
este tabelat de peste 100 de ani. Acum nu se mai folosec tabelele, deoarece
toate softurile matematice o calculeaz. Deci

u(x) =
}

t
x
t
dt e
2
2
2
1



Demonstraie
Dac acceptm teorema de convergen a funciilor caracteristice, demonstraia
este simpl. Fie Y
n
= X
n
- variabilele centrate i (t) = Ee
itY
funcia lor
caracteristic. tim de la proprietile funciilor caracteristice c dac Y
n
sunt din
L
2
, atunci este derivabil de dou ori. Ne intereseaz c e derivabil de dou
ori n 0: deci putem scrie (t) = (0) + t(0)+
2
2
t
(0) + o(t)t
2
unde o(t) este o
funcie continu i o(0) = 0. Dar (0) = 1, (0) = EY
n
= 0 i (0) = - EY
n
2
= - o
2
.
Deci (t) = 1
2
2 2
o t
+ o(t).
Calculm funcia caracteristic a lui s
n
, notat cu
n
:

n
(t) = E
( )
n
Y Y
n
it
e
+ +
o
...
1
=
|
|
.
|

\
|
o

n
t
n
=
n
n
t
n
t
o
n
t
|
|
.
|

\
|
o
|
|
.
|

\
|
o
+
o
o

2
2 2 2
2
1 .

Atunci
lim
n

n
(t) = exp[
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
o o
+
n
t
o
n
t
n
t
n
2
2 2
2
lim ]= exp
|
|
.
|

\
|
|
|
.
|

\
|
o o
+
n
t
o
t t
lim
2
2
2 2
=
2
2
t
e

.

161
Dar funcia (t) =
2
2
t
e

este funcia caracteristic a repartiiei normale standard.


Teorema este demonstrat. q.e.d.


Exemplu de aplicare:
Exemplul 5.4.4. Repartiia binomial. Dac X
n
~
|
|
.
|

\
|
p q
1 0
, atunci S
n
~
Binomial(n,p). Dac n este destul de mare putem aproxima P(S
n
s a) cu TLC
astfel: Avem = p, o= pq . Deci

P(S
n
s a) = P(
npq
np a
npq
np S
n

s

)
|
|
.
|

\
|

u
npq
np a
.

Se tie c dac npq > 20, aproximarea este foarte bun. Prezentm un grafic cu
diferenele dintre funcia de repartiie a repartiiei Binomial(100,0.42) i cea a
repartiiei N(np, npq
2
) = N(42,
2
24.36 ) calculate pentru x e [0,100]




Pe axa Ox sunt valorile lui x iar pe axa Oy valorile diferenei dintre cele dou
funcii de repartiie. Maximul este maimic de 0.05. Daca ns luam un caz
extrem, cu p =0.042, situaia se schimba

162



Diferena dintre probabiliti poate depi 0.12, ceea ce este imens. Explicaia
este c acum =4.2 i probabilitatea ca X ~ Binomial(100,0.042) s ia valorile 4
sau 5 este mare : 0.3653754. Ca s fie aplicabil aproximarea normal trebuie
ca toate probabilitile P(X = k) s fie mici. Dac produsul np este mic, dei n
este mare, atunci este preferabil aproximarea cu repartiia Poisson(np).


163
Capitolul 6


Simularea variabilelor aleatoare


n dotarea calculatoarelor exist de mult generatoare de numere aleatoare,
care simuleaz destul de bine un ir de variabile aleatoare repartizate
Uniform(0,1). A simula o variabil aleatoare nseamn ca, pe baza acestui
generator de numere aleatoare s se construiasc variabile aleatoare avnd o
repartiie dat.
Formal, problema s-ar pune aa: se d o variabil aleatoare
U~Uniform(0,1) i o funcie de repartiie, F. S se construiasc o funcie f astfel
ca funcia de repartiie a variabilei aleatoare X = f(U) s fie F.
Sau, mai general, se dau k variabile aleatoare (U
j
)
1sjsk
i.i.d., repartizate
Uniform(0,1) i se cere s se construiasc o funcie f:9
k
9 ca n aa fel nct
variabila aleatoare X = f(U
1
,...,U
k
) s aib funcia de repartiie F.
Exist mai multe medii de programare care fac acest lucru n cazul
repartiiilor clasice. De exemplu, n R, mediu de programare gratuit, care se
poate descrca de pe internet exist posibilitatea simulrii (i nu numai) cel puin
a urmtoarelor repartiii
Repartiia Numele ei n R Parametri
beta beta o,|
binomial binom k,p
Cauchy cauchy m,a
_
2
chisQ n
exponential exp
F f m,n
gamma gamma v,
geometric geom p
hipergeometric hyper a, n, k
1

log-normal lnorm ,o
logistic logis ,o
2

negativ binomial nbinom k,p
normal norm ,o
3

Poisson pois

1
Extragem k bile dintr-o urn cu a bile albe i n bile negre; X este numrul de bile albe.
2
Repartiia logistic are funcia de repartiie
o

+
x
e 1
1
. Este mai rar folosit..
3
n codificarea R, x=rnorm(1,,o) produce o variabila aleatoare X ~ N(,o
2
). Parametrul al
doilea reprezint abaterea medie ptratic i nu variana. Uneori se face confuzie.
164
Student t n
uniform unif a,b
Weibull weibull k,
Wilcoxon wilcox m, n

Pentru a genera un vector cu n componente i.i.d. cu aceste repartiii se
pune n faa numelui lor din R litera r. 4 Apoi se pune numrul de variabile
aleatoare dorite i parametrii repartiiei.
De exemplu:
x=rnorm(100,10,4);x : x este un vector cu 100 de componente repartizate
N(10,4
2
)
x=rbinom(10,10,.4);x
[1] 3 5 1 5 4 6 4 5 6 3 : x este un vector cu 10 componente repartizate
Binomial(10,.4)
x=rnbinom(6,10,.4);x
[1] 19 8 9 25 8 19 : x este un vector cu 10 componente repartizate
Negbin(10,.4)
x=rhyper(10,4,6,6);x
[1] 3 2 3 3 2 2 2 2 1 3 : x este un vector cu 10 componente
~Hypergeometric(4,6,6)

ntrebarea este cum generm noi variabile aleatoare cu o repartiie care nu
face parte din cele simulate de mediile de programare?


6.1. Simularea repartiiilor pe dreapt


Algoritmul general: metoda cuantilei

Cum putem folosi o variabil U ~ Uniform(0,1) pentru a simula o
variabil aleatoare X cu o repartiie dat?
S presupunem pentru nceput c funcia de repartiie a lui X este
bijectiv. Mai precis, presupunem c exist un interval I _ 9 astfel ca F: I [0,1]
s fie bijectiv. Cum este i cresctoare, firete c ar trebui ca F s fie i continu
dac ar fi discontinu ntr-un punct a, atunci imaginea sa, Im(F), nu ar conine
intervalul (F(a-0), F(a)).

4
Dac vrem s le calculm funcia de repartiie punem p, pentru densitate punem d iar pentru
cuantile (vezi mai jos) punem Q. De exemplu
x=pnorm(1,0,1);y=dnorm(1,0,1);z=Qnorm(0.01,0,1) va produce numerele x = 0.8413447 (cci
u(1) = 0.8413447), y = 0.2419707 =
2 /
2
2
1
x
e

t
cu x = 1 i z = -2.326348 = u
-1
(0.02)
165
Observaia fundamental este c variabila aleatoare X = F
-1
(U) are exact
funcia de repartiie F. Acesta este algoritmul inversei funciei de repartiie.
ntr-adevr, dac x e [0,1], atunci , innd seama de ipoteza c U ~ Uniform (0,1)
P(U s x) = x x e [0,1], avem P(X s x) = P(F
-1
(U) s x) = P(F(F
-1
(U)) s F(x)) deci
P(X s x) = P(U s F(x)) = F(x). (6.1.1)
n general, funciile de repartiie nu sunt bijective. Dac, de exemplu, X ~
Uniform({1,2,...,n}), atunci F(x) =
| |
1 .
+
n
x
ia doar valorile k/n cu 0 s k s 1. Este o
situaie tipic pentru repartiiile discrete. Dar, chiar dac repartiia este continu,
e posibil ca F s nu fie injectiv. De exemplu, dac X ~ Uniform([0,1][2,3]),
atunci F
X
este constant pe intervalul [1,2](verificai: F(x) = (x
+
.1 + (x-2)
+
.1)/2 ).
Ce se mai poate salva n acest caz din algoritmul anterior?
Ideea este s nlocuim inversa cu cuantila.

Definiia 6.1.1. Fie F o funcie de repartiie. O cuantil a sa este orice funcie
real Q = Q
F
definit pe ( 0,1) cu proprietatea c F(Q(u)-0) s u s F(Q(u)) u.

Dac F este inversabil, exist o unic cuantil, anume inversa lui F : Q = F
-1

Dac nu, pot exista o infinitate. De exemplu, dac X ~ Binomial (1, ) =
Uniform({0,1}), atunci F(x) = pentru x e [0,1) . Verificai c orice funcie de
forma Q(u) = 1
( ,1)
(u) + o1
{ }
cu o e (0,1) este o cuantil.

Propoziia 6.1.2. Fie F:9 [0,1] o funcie de repartiie i Q:(0,1) 9 o
cuantil a sa. Fie U o variabil aleatoare repartizat Uniform(0,1). Atunci X =
Q(U) este o variabil aleatoare avnd funcia de repartiie F.

Demonstraie
Observm c orice cuantil este o funcie cresctoare. ntr-adevr, dac
u<v , atunci Q(u) s Q(v) deoarece n caz contrar, Q(u) > Q(v) F(Q(u) 0) >
F(Q(v)) u > F(Q(u)-0) > F(Q(v)) > v u > v.
Artm c {U < F(x)} _ { Q(U) s x} _ { U s F(x) }i va fi suficient, pentru c
atunci rezult c P(U < F(x)) s P(Q(U) s x) s P(U s F(x)) de unde, cum U ~
Uniform(0,1), deducem c P(Q(U) s x) = F(x).
Presupunem Q(U) s x. Atunci F(Q(U)) s F(x). Dar, din definiia cuantilei, U s
F(Q(U)), deci U s F(x). Am demonstrat c
{ Q(U) s x }_{ U s F(x)} (6.1.2)
S presupunem acum c Q(U) > x. Atunci F(Q(U) 0 ) > F(x) . Dar, tot din
definiia cuantilei. U > F(Q(U) 0) , deci U > F(x).Aadar { Q(U) > x }_{ U > F(x)}
Trecnd la complementar,avem c
{ Q(U) s x }_{ U < F(x)} (6.1.3)
Din (6.1.2) i (6.1.3) deducem c { U < F(x)} _ { Q(U) s x } _ { U s F(x)}.
q.e.d..

166
Dou sunt cazurile extreme care intereseaz n calcule: cuantil inferioar i
cuantila superioar.
Cuantila inferioar, notat cu Q -, se definete prin relaia
Q

(u) = sup{F < u } = inf{F > u } (6.1.4)
iar cea superioar, notat cu Q
+
se definete prin
Q
+
(u) = sup{F s u } = inf{F > u } (6.1.5)


Propoziia 6.1.3. Funciile definite prin relaiile (6.1.4) i (6.1.5) sunt cuantile.
Orice alt cuantil Q este cuprins ntre ele: Q

s Q s Q
+
.

Demonstraie
Din definiia supremului avem urmtoarele lucruri evidente
F(Q

(u) c) < u , F(Q

(u) + c) > u c > 0


F(Q
+
(u) c) s u , F(Q
+
(u) + c) > u c > 0
Trecnd la limit cu c + 0, deducem c F(Q

(u) 0) su , F(Q

(u) + 0) > u i
F(Q
+
(u) 0) s u , F(Q
+
(u) + 0) > u. Dar F este continu la dreapta, deci
ambele funcii verific definiia cuantilei.q.e.d.

Exemplul 6.1.4. Dac X ~ Uniform({0,1}) atunci F(x) = pentru x e [0,1) .
Cuantilele inferioar i superioar sunt Q

(u) = 1
( ,1)
(u), Q
+
(u) = 1
[ ,1)
(u) = [2u]
deci X = [2U] este o variabil aleatoare cu repartiia cerut.

Exemplul 6.1.5. Dac X ~ Uniform({1,2,...,n}), atunci Q
+
(u) = 1 + [nu] X = 1 +
[nU]

Exemplul 6.1.6. Dac X ~ Exponential(1), atunci F(x) = 1 e
x
este chiar
bijectiv de la (0,) la (0,1), deci Q
+
= Q
-
= F
-1
Q(x) = - ln(1 u). Putem pune
X = - ln( 1 U). Dar U i 1 U au aceeai repartiie, Uniform(0,1), deci putem
la fel de bine s punem X = - ln U.

Exemplul 6.1.7. Dac X ~ Negbin(1,p), atunci F(x) = 1 q
[x]+1
, unde x > 0 i q =
1 p. O cuantil a sa este Q(u) =
( )
(

p
u
1 ln
ln
. Deci X =
( )
(

p
u
1 ln
ln
este o
variabil aleatoare cu repartiia cerut.

Exemplul 6.1.8. n general, dac repartiia F este discret,
|
|
.
|

\
|
=
... ...
.... ...
3 2 1
3 2 1
p p p
a a a
F cu a
1
< a
2
< a
3
< ..., atunci cuantilele ei sunt
Q
+
(u) =
( )
( )
| )
( )
| )
( ) .... 1 1 1
3 2 2 1 1
, 3 , 2 , 0 1
+ + + u a u a u a
s s s s s
i
( ) ( ) ( ) .... 1 1 1 ) (
] , ( 3 ] , ( 2 ] , 0 ( 1
1
3 2 2 1 1
+ + + =

u a u a u a u Q
s s s s s
.
unde s
1
= p
1
, s
2
= p
1
+p
2
, s
3
= p
1
+ p
2
+ p
3
...
167
Deci variabila aleatoare X =
| )
( )
>

1
,
1
1
k
s s k
U s
k k
are exact repartiia F .

Iat un script n R care calculeaz cuantila unei repartiii discrete
|
|
.
|

\
|
k
k
p p p p
a a a a
...
...
3 2 1
3 2 1
. Aici a este vectorul care contine valorile variabilei
aleatoare X; p este vectorul care cuprinde probabilitile ca s se ia aceste
valori. Ambii vectori au lungimea k. Vectorul o este permutarea care trebuie
fcut pentru ca numerele a
i
s fie puse n ordine cresctoare iar F este
repartiia propriu-zis; acum e scris canonic. Vectorul s cuprinde sumele s
k
=
p
1
+ p
2
+...+ p
3
. Interesant este ct de simplu este de gsit locul lui u: instruciunea
which(s >= u) produce mulimea J(u) = {i: s
i
>u} creia i se ia primul element i =
min(J(u)) = Q
+
(u).

cuantila<-function(u,a,p)
{o=order(a) #sortez pe a, pentru ca se poate sa
nu fie in ordine
F=rbind(a[o],p[o]); a=F[1,]; p=F[2,]
#calculez sumele partiale
s=p; for (i in 1:length(a)){s[i]=sum(p[1:i])}
#caut locul lui u
v=which(s>=u);i=min(v); q=a[i]
q}

Apelarea funciei se face cu instruciunea q=cuantila(u,a,p)
Un exemplu concret: s se simuleze n =1000 variabile aleatoare avnd repartiia
F =
|
|
.
|

\
|
4 1 2 1 2
3 2 1 0 6
10
1

n=1000;a=c(-
6,0,1,2,3);p=c(2,1,2,1,4)/10;u=runif(n,0,1)
x=u;for (i in 1:n) {x[i]=cuantila(u[i],a,p)}

Pentru a verifica dac e bine, folosim instruciunea table(x) care arat
repartiia empiric a unui vector x : sub fiecare valoare diferit pe care o ia
vectorul se scrie numrul de apariii a acelei valori (frecvena absolut). n cazul
nostru avem:

table(x)
x
-6 0 1 2 3
195 99 190 98 418

168
Valorile frecvenelor absolute corespund celor teoretice, care ar fi trebuit s fie
200,100, 200,100,400. Deci ese plauzibil. Exist metode de verificare a
acurateei modelulului dat de o repartiie : de exemplu metoda qqplot.
5

Pentru valori relativ mici ale lungimii k a vectorilor a i p algoritmul este
satisfctor i rapid. Poate fi folosit pn la k 1000.
Dac, ns, vectorii au lungime prea mare ncep s apar erori de main
i, pe de alt parte, viteza lui scade. Este i normal. De aceea, dac se poate, ar fi
bine s fie folosii algoritmi rapizi bazai pe diverse le repartiii care se pot obine
din repartiia uniform.
Problema este de a calcula cuantila dac repartiia F nu este neaprat
discret i cu suportul format dintr-o mulime cu numr mic de elemente.
Chiar dac avem funcia de repartiie F dat printr-o formul analitic (de
exemplu F(x) = pF
1
+ qF
2
cu F
1
= Exp(1), F
2
= Gamma(2,1) F(x) = 1 (1 + qx)e
-x
)
nu avem formule pentru a calcula inversa F
-1
(u) (n cazul de mai sus ar trebui
rezolvat ecuaia 1 (1 + qx)e
-x
= u , 0<u<1, care este o ecuaie transcendent).
Pentru a iei din dilem ar trebui s facem o discretizare a lui F. nlocuim funcia
de repartiie F cu repartiia F
d
=
( ) ( ) ( )
|
|
.
|

\
|

o
k k k
k
a F a F a F a F a F a F
a a a
1 ) ( ... ) ( ) (
...
1 1 2 1
2 1 unde o este
un numr mare i aplicm algoritmul cuantilei pentru aceast repartiie. Eventual
un algoritm modificat n care nlocuim funcia F
d
cu o linie poligonal care
unete punctele de coordonate (a
j
,F(a
j
))
j
. Sigur c pierdem din precizie.


Algoritmi speciali bazai pe proprieti ale repartiiilor

Dou sunt operaiile mai importante care se fac cu repartiiile: mixtura i
convoluia.

Definiia 6.1.9. Fie (F
j
)
1sjsn
o mulime de repartiii pe dreapt i fie (p
j
)
1sjsn

numere pozitive i de sum 1. Atunci repartiia F = p
1
F
1
+ ...+ p
n
F
n
se numete
mixtur de F. Dac X
j
~ F
j
sunt variabile aleatoare independente, atunci
repartiia sumei lor S=X
1
+ ...+ X
n
este F
1
-F
2
-...-F
n
.

De exemplu, dac F(x) = pF
1
+ qF
2
cu F
1
= Exp(1), F
2
= Gamma(2,1),
atunci F este o mixtur de exponenial cu Gamma.
Observaia este c dac tim s simulm variabilele X
i
, atunci simulm
mai uor variabilele X (cu repartiia F) i S (cu repartiia F
1
-F
2
-...-F
n
), fr a
trece prin metoda pseudoinversei. Pentru S nu avem ce comenta, dar nu este
absolut evident cum construim pe X.


5
Chiar n R exist instruciunea qqplot.
169
Propoziia 6.1.10. Fie X
j
~ F
j
cu 1 s j s n i fie J o variabil aleatoare
independent de (X
j
)
j
cu repartiia J ~
|
|
.
|

\
|
n
p p p
n
... ...
... ... 2 1
2 1
. Atunci variabila X := X
J

are repartiia F =
=
n
j
j j
F p
1
.

Demonstraie
P(X s x) = P(X
J
s x) = ( ) ( ) ( ) ( ) = = s = = s
= = =
n
j
j j
n
j
j
n
j
J
p x F j J P x X P j J x X P
1 1 1
; q.e.d.
Deci, revenind la exemplul nostru cu F = pGamma(1,1) + qGamma(2,1)
algoritmul exact este: simulm variabila J ~
|
|
.
|

\
|
q p
2 1
. Dac J = 1, simulm X ~
Exp(1) = Gamma(1,1) iar dac J=2 simulm X = Gamma(2,1). Dup cum se
vede n scriptul urmtor, care folosete funcia cuantila din paragraful anterior

mixtura<-function(n,p) # simuleaz n variabile aleatoare ~ pExp(1)+qgamma(2,1
{a=c(1,2);pr=c(p,1-p)
x1<-rexp(n,1) # simuleaz n variabile aleatoare ~ Exp(1)
;x2<-rgamma(n,2,1) # simuleaz n variabile aleatoare ~ Gamma(2,1)
z<-rbind(x1,x2) # se formeaz cu ele o matrice z de tip 2n
x=x1 # se iniializeaz x
for (i in 1:n)
{u=runif(1,0,1) # se genereaz o variabil aleatoare U ~ Uniform(0,1)
j=cuantila(u,a,pr) # se genereaz variabila aleatoare J
x[i]=z[j,i] # x = z(J,.)
}
x # se simuleaz n variabile aleatoare ~ Exp(1)
}
Ne putem convinge c este aa dac ncercm mai multe variante de p.
Pentru p = 0 avem variabile repartizate Gamma(2,1); pentru p = este o mixtur
cu ponderi egale iar pentru p = 1 avem doar variabile repartizate Exp(1). Scriptul
urmtor face cte 5000 de simulri de fiecare tip i apoi face greficul celor trei
funcii de repartiie empirice, care ar trebui s semene cu cele adevrate

t=1:5000;t=t/5000
xo=mixtura(5000,0);xo=sort(xo)
xm=mixtura(5000,0.5);xm=sort(xm)
xu=mixtura(5000,1);xu=sort(xu)
plot(xo,t,type="l");lines(xm,t,col="red");
lines(xu,t,col="blue")


170


Exemplul 6.1.11. S presupunem c nu avem acces la un software performant,
dar vrem s simulm o variabil aleatoare X ~ Gamma(n,) cu n numr ntreg.
Cum facem?

Soluie
Variabilele X
j
= (- lnU
j
)/ sunt repartizate Exp(). Dar Gamma(n,) = Exp()
-n

exponeniala convolutat cu ea nsi de n ori. Deci soluia este

=
=
n
j
j
U
X
1
ln


Dar dac vrem s simulm X ~ N(,o
2
) i nu avem dect un software de
baz? Firete, este suficient s simulm Y ~ N(0,1) i apoi s punem X = +
oY. Dar cum simulm o normal standard? Algoritmul cuantilei nu ne d dect o
aproximare, pentru c nu putem calcula exact nici mcar u, funcia caracteristic
a repartiiei N(0,1), cu att mai puin s i calculm i cuantila. Putem face o
aproximare bun, este adevrat, dar asta cere timp.

Propoziia 6.1.12. Metoda Box Muller. Fie U,V ~ Uniform(0,1) dou variabile
aleatoare independente. Atunci variabilele X = sin(2tU) V ln 2 , Y =
cos(2tU) V ln 2 sunt dou variabile aleatoare independente repartizate
N(0,1). Deci (X,Y) ~ N(
|
|
.
|

\
|
|
|
.
|

\
|
1 0
0 1
,
0
0
)




171
Demonstraie
Avem de artat c dac f:9
2
9 este o funcie continu i mrginit,
atunci Ef(X,Y) = ( )
} }
t




+

dxdy e y x f
y x
2
2 2
,
2
1

Din formula de transport

} }
=
1
0
1
0
)) 2 sin( ln 2 ), 2 cos( ln 2 ( ) , ( dudv u u f Y X Ef tv tv (6.1.6)
Facem schimbarea de variabil
( ) ( ) v u y v u x t = t = 2 sin ln 2 , 2 cos ln 2 (6.1.7)
Rezult x
2
+ y
2
= 2lnu , de unde

2
2 2
y x
e u
+

= (6.1.8)
Iacobianul este
( )
( )
( )
( )
( )
( ) v u
u u
v
v u
u u
v
v u D
y x D
t t

t t

=
2 sin ln 2 2
ln 2
2 cos
2 cos ln 2 2
ln 2
2 sin
,
.
=
u
t 2

Imaginea mulimii [0,1] [0,1] prin aceast transformare este 9
2
\ {0}.Cum
punctul {0}este o mulime neglijabil fa de msura Lebesgue n plan, deducem
din relaia (6.1.8) c
dxdy =
u
t 2
dudv dudv =
t 2
u
dxdy =
t
+

2
2
2 2
y x
e
dxdy deci relaia (6.1.6) devine
( ) ( ) ( )
} }
t t
1
0
1
0
2 sin ln 2 , 2 cos ln 2 dudv v u v u f = ( )
} }
t




+

dxdy e y x f
y x
2
2 2
,
2
1

(6.1.9)
exact ceea ce trebuia verificat.q.e.d.

Prin metoda Box Muller se genereaz variabile aleatoare normale
folosind doar dou variabile uniform repartizate. Este evident o mare
simplificare.

Exist i o metod exact de a simula repartiia Poisson(), fr a calcula
cuantilele. Uneori ea este mai rapid.

Propoziia 6.1.13. Fie (U
n
)
n
~ Uniform(0,1) un ir de variabile aleatoare i.i.d.
Fie
N = min{n > 1 : U
1
U
2
...U
n
< e
-
} 1 (6.1.10)
Atunci N ~ Poison().

Demonstraie
172
Fie o
n
=

n
U ln
i T
n
= o
1
+ ...+ o
n
. Atunci o
n
sunt i.i.d. repartizate
Exponential(). Logaritmnd expresia din (6.1.10) avem N = min {n : T
n
> 1}. Deci
P(N = 0) = P(T
1
>1) = e
-
iar dac n > 1, atunci P(N = n) = P(T
n
s 1, T
n+1
> 1} = P(T
n
s
1) P(T
n+1
s 1) = P(T
n+1
> 1) P(T
n
> 1). Dar T
n
~ Gamma(n,1), deci

P(T
n
> t) =
( )
t
n n
e
n
t t t


|
|
.
|

\
|

+ +

+
! 1
....
! 2 ! 1
1
1 1 2 2
(6.1.11)
Rezult c P(T
n+1
> t) P(T
n
> t) =
t
n n
e
n
t

!
. Am demonstrat chiar mai
mult: c dac punem N(t) = min {n : T
n
> t}, atunci N(t) ~ Poisson(t).
6
q.e.d.

Deci dac dorim s simulm, de exemplu, N ~ Poisson(1), nmulim un
ir de variabile aleatoare uniform repartizate pn cnd produsul lor devine mai
mic dect 1/e. Dac pentru acest lucru a fost nevoie de n variabile aleatoare,
atunci declarm c N = n -1.
n statistica Bayesian apare frecvent repartiia Beta(m,n). Dac m i n
sunt numere ntregi, i aceste repartiii se pot simula fr a se calcula cuantilele.

Propoziia 6.1.14. Fie (U
j
)
1 s j s n
~ Uniform(0,1) independente. Sortm aceste
variabile aleatoare sub forma ( U
(1)
< U
(2)
< ...< U
(n)
). Atunci U
(k)

~ Beta(k, n+1 k).

Demonstraie
Fie A
n,k
= { exact k dintre variabilele aleatoare U
j
sunt mai mici dect x }
Evident P(A
n,k
) = ( )
k n k k
n
x x C

1 . S observm c evenimentul (U
(k)
s x) se poate
scrie sub forma A
n,k
A
n,k+1
...A
n,n
. Cum mulimile (A
n,j
)
0 s j s n
sunt disjuncte,
gsim c funcia de repartiie a lui (U)
(k)
este P(U
(k)
s x) =
( )
k n k k
n
x x C

1 + ( )
1 1 1
1
+ + +

k n k k
n
x x C +....+ ( )
n n n n
n
x x C

1 , care este exact funcia de
repartiie a unei variabile aleatoare Beta(k,n+1 k). Densitatea sa este

f
k
(x) = ( )
k n k k
n
x x kC

1
1
(6.1.12)

Exemplul 6.1.15. S simuleze o variabil aleatoare X ~ Beta(10,2). Acum n
= 10 + 2 1 = 11. Simulm 11 variabile uniforme i le sortm; o lum pe cea de
a zecea. Dac avem la dispoziie un program de sort, nu e nici o problem.
De exemplu, n R secvena ar fi:
u = runif(11);u=sort(u);x=u[10]



6
Procesul stochastic (N(t))
t>0
se numete procesul Poisson de intensitate . Se poate demonstra
c el este cu creteri independente, adic dac t
1
< t
2
< ...< t
n
, atunci variabilele aleatoare (N(t
1
),
N (t
2
) - N(t
1
),......, N (t
n
) - N(t
n-1
) ) sunt independente.
173
Simularea repartiiilor d dimensionale

6.2. Algoritmul general: teorema de descompunere

Ideea de baz este urmtoarea: orice repartiie d-dimensional se poate
scrie ca produsul dintre o probabilitate pe dreapt i mai multe probabiliti de
trecere.
Pentru a nelege, s studiem urmtorul exemplu simplu
Un punct aleator bidimensional Z = X + iY (l scriem ca numr complex,
este mai simplu)
Z~
|
|
.
|

\
| + +
1 1 1 1 1 1 1 1
1 1 2 1 2 1 0
8
1 i i i i

Atunci X ~
|
|
.
|

\
|
1 2 3 2
2 1 0 1
8
1
. Dac X = -1, atunci Y poate lua dou valori,
0 i 1. repartiia sa condiionat de faptul c X = -1 se o scriem (abuz de notaie,
dar sugestiv)
(Y X = -1) ~
|
|
.
|

\
|
1 1
1 0
2
1
. Analog, avem (Y X = 0) ~
|
|
.
|

\
|
1 1 1
2 1 0
3
1
, (Y X = 1) ~
|
|
.
|

\
|
1 1
1 0
2
1
i, n sfrit, (Y X = 2) ~o
0
.
Pentru a-l genera, simulm mai nti prima component, cu algoritmul
cuantilei. Apoi avem patru variante: dac X = -1, sau X = 1 simulm pe Y
~.
|
|
.
|

\
|
1 1
1 0
2
1
, dac X = 0 simulm Y ~
|
|
.
|

\
|
1 1 1
2 1 0
3
1
iar dac X = 2, punem Y = 0.
Ideea este c P(X = i, Y = j) = P(X = i)P(Y = j X = i). Pentru fiecare
valoare a lui X avem o alt repartiie pentru Y, repartiia condiionat.
Generm pe X i, apoi, depinznd de valoarea lui X simulm pe Y cu repartiia
condiionat (Y X = x).
Formal, acest lucru se poate generaliza astfel:

Algoritmul general. Fie Z = (X,Y) e E F un vector aleator. S presupunem c
repartiia lui X este H i c exist o familie de repartiii pe F, (Q
x
)
x e E
cu
proprietatea c P(Y eB X) = Q
X
(B). Atunci repartiia vectorului Z este HQ.

Familia de probabiliti (Q
x
)
x e E
se numete repartiia lui Y condiionat
de X. Un mod intuitiv de a o nota este F
Y X
. Un mod i mai intuitiv este s
scriem Q
x
= F
Y X = x
. Aceasta este notaia din statistic. Avem de lmurit ce
nseamn probabilitatea condiionat P(Y e B X). Dac X este discret, nu e nici
o problem: P(Y e B X) = ( )
( )
= e
e
=
A x
x X
x X B Y P 1 | unde A = {x e E P(X = x) > 0).
Dar dac X este continu, avem o problem, deoarece P(YeB X = x) nu are
sens.
174
Definiia 6.2.1. Probabilitate condiionat, medie condiionat. Fie (,K,P) un
spaiu probabilizat, Y: F, X: E dou variabile aleatoare cu valori n
spaii msurabile(E,E) i (F,F). Fie B e F. Atunci definim P(Y e B X) = E(1
B
(Y)
X).
Dac U: 9 este o variabil aleatoare, cu moment de ordin 1, atunci definim
E(U X) = (X) E(U(X)) = E((X)(X))
:E 9 msurabil i mrginit.
Se demonstreaz c media condiionat exist i c, n caz c U are i moment
de ordin 2, ea are urmtoarea proprietate de optim
E(U - (X))
2
s E(U h(X))
2
h:9 9 msurabil ca E[h(X)]
2
< .

Media condiionat are trei proprieti importante, care se folosesc n practic:

- Dac X i Y sunt independente, atunci E[h(Y) X] = Eh(Y) (la
independen nu conteaz condiionarea). Cum o variabil aleatoare constant
este independent de orice alt variabil aleatoare, deducem c dac X este
constant, E[h(Y) X] = Eh(Y).
- E[h(X) X] = h(X) i, mai general, E[h(X)Y X] = h(X)E[Y X] (funciile
X-msurabile se comport precum constantele). Aici h este o funcie msurabil
i mrginit.
- E[E[Z X,Y] X] = E[Z X ] (proprietatea de iterativitate).
n particular, dac X = constant (mod P) avem E[E[Z Y]] = E[Z].

Deci, a spune c repartiia lui (Y X) este Q neamn a spune c
E[h(Y )X] = ( ) ( )
}
y dQ y h
X
pentru orice funcie msurabil h: E 9 (6.2.1)
Un alt mod de a scrie acelai lucru (de multe ori mai comod) este
E[h(Y) X] =
}
) , ( ) ( dy X Q y h (6.2. 2)
Relaia (2.1.1) se poate prelungi la funcii de dou variabile
E[h(X,Y) X ] = ( ) ( )
}
dy X Q y X h , , (6.2.3)
ntr-adevr, formula (6.2.3) este imediat dac h(x,y) = f(x)g(y), apoi se
prelungete la indicatori de mulimi de forma h = 1
AB
; familia mulimilor C
pentru care formula este adevrat este un u sistem, deci aceast familie
conine o-algebra E F etc .
Existena repartiiilor condiionate este dat de:

Teorema 6.2.2 Teorema de dezintegrare. Fie P o probabilitatea pe E F unde E
= 9
m
i F = 9
n
. Fie H(A) = P(AF). Atunci exist o probabilitate de trecere de la E
la F, notat cu Q n aa fel nct P = HQ

Nu vom demonstra aceast teorem. Se gsete n manualele de teoria
probabilitilor, de exemplu G. Ciucu, C. Tudor, Teoria probabilitilor, Editura
175
Academiei, Bucureti 1981 sau I. Cuculescu, Teoria Probabilitilor, Editura ALL,
Bucureti 1998. Sau se poate cuta pe internet, Dissintegration Theorem.

Important este s lmurim ce spune teorema i s nelegem cum se
aplic.

Definiia 6.2.3. Fie (E, E) i (F, F) spaii msurabile. O funcie Q:E F [0,1]
se numete probabilitate de trecere de la E la F dac
(i) aplicaia x Q(x, B) este msurabil pentru orice B e F
(ii) aplicaia B Q(x, B) este o probabilitate pe F pentru orice xe E

Putem gndi o probabilitate de trecere i altfel: ca o colecie de
probabiliti pe F, (Q
x
)
x eE
. Condiia (i) este una tehnic, pentru a se putea face
calcule.

Exemplul 6.2.4. Familiile clasice de repartiii de pe dreapt pot fi gndite ca
fiind probabiliti de trecere: Q

= Exponential() este o probabilitate de trecere


de la (0,) la (0,), Q
(n,p)
= Binomial(n,p) este o probabilitate de trecere de la
{1,2,3,...}[0,1] la 9, etc..

Produsul dintre o probabilitate pe E i una de trecere de la E la F se
definete astfel:

Definiia 6.2.5. Fie (E,E) i (F,F) dou spaii msurabile, H o probabilitate pe E
i Q o probabilitate de trecere de la E la F. Atunci HQ este o probabilitate pe
(EF, C F) definit prin
HQ(C) = ( ) ( ) x d x C Q
x
H
}
,.) ( (6.2.4)
unde C(x,.) = {y e F (x,y) e C}. Dac observm c 1
C(x,.)(y)
= 1
C
(x,y), atunci
putem scrie formula (2.1.4) ca
HQ(C) = ( ) ( ) ( )
}
H
}
x d y dQ y x
x C
. , 1 . (6.2.5)

Astfel obinem o formul de integrare fa de probabilitatea produs.
Definirea n acest mod a produsului este motivat de urmtorul rezultat
care justific algoritmul general

Propoziia 6.2.6. Fie Z = (X,Y) un vector aleator cu valori n spaiul msurabil
(EF, EF). Dac H este repartiia lui X i Q este repartiia lui Y condiionat
de X, atunci repartiia lui Z este HQ.

Demonstraie
Fie f:EF 9 o funcie msurabil. Avem ( ) ( )
}
H y x Q d y x f , , =
( ) ( ) ( )
} }
H x d y dQ y x f
x
) , ( = ( ) ( )
}
H x d x h unde h(x) = ( ) ( )
}
y dQ y x f
x
, .
176
Cum H este repartiia lui X, formula de transport spune c ( ) ( )
}
H x d x h =
Eh(X) . Dar h(X) = ( ) ( )
}
y dQ y X f
X
, = E[f(X,Y) X] (conform cu (2.1.3), deci Eh(X) =
E[E[f(X,Y) X]] = Ef(X,Y) (proprietatea de iterativitate). Aadar Ef(X,Y) =
( ) ( )
}
H y x Q d y x f , , . Cum egalitatea este valabil pentru orice f msurabil i
mrginit, rezult c repartiia lui Z = (X,Y) este HQ.

Scrierea statistic a acestei propoziii este
F
(X,Y)
= F
X
F
(Y X)
(6.2.6)
Principiul este
nmulim repartiia lui X cu repartiia lui Y condiionat de X.
Avantajul este c formula se poate generaliza
F(X,Y,Z) =
) | ( ) | ( XY Z X Y X
F F F (6.2.7)
n general am avea

) | ( ) , | ( ) ,..., , (
1
,..., 1 2 1 3 1 2 1
...

=
n
X n n
X X X X X X X X X
F F F F
(6.2.8)


Exist dou situaii n care aplicarea algoritmului nu pune probleme:
Cazul discret
S se simuleze un vector aleator Z ~
|
|
.
|

\
|
n
n
p p p p
z z z z
...
...
3 2 1
3 2 1
unde
( )
d j j j
z z z
, 1 ,
,..., = sunt vectori d dimensionali. Atunci formula (6.2.8) revine la
P(X
1
=x
1
,X
2
=x
2
,...,X
d
=x
d
)= ( ) ( ) ( )
1 1 1 1 1 1 2 2 1 1
,..., | .... |

= = = = = =
d d d d
x X x X x X P x X x X P x X P (6.2.9)

Cazul absolut continuu. Acum presupunem c vectorul d - dimensional
Z are densitatea f
Z
. Atunci se verific imediat c i repartiiile
( )
1 1
,..., |
k k
X X X
F au
densiti, notate
( )
1 1
,..., |
k k
X X X
f care se calculeaz astfel: mai nti calculm
densitile celor d vectori de dimensiune k s d. Este imediat c
( )
( ) ( )
d k k d k k Z k X X
dx dx dx x x x x f x x f
k d
k
... ,..., , ,..., ,...,
2 1 1 1 1 ,...,
1
+ +
9
+ }
=

. Apoi punem

- ( ) ( )
}
=

9
1
1
... ,..., ,
3 2 2 1 1
d
d d X
dx dx dx x x x f x f
- ( )
( )
( )
( )
1
2 1 ,
2 |
1
2 1
1 2
,
X f
x X f
x f
X
X X
X X
=
- ( )
( )
( )
( )
( )
2 1 ,
3 2 1 , ,
3 , |
,
, ,
2 1
3 2 1
2 1 3
X X f
x X X f
x f
X X
X X X
X X X
=
- ......................
Dac folosim notaiile statistice formulele devin mai uor de neles
177
( ) ( )
}
=

9
1
1
... ,..., ,
3 2 2 1 1
d
d d X
dx dx dx x x x f x f , ( )
( )
( )
( )
1
2 1 ,
2 |
1
2 1
1 1 2
,
x f
x x f
x f
X
X X
x X X
=
=
( )
( )
( )
( )
( )
2 1 ,
3 2 1 , ,
3 , |
,
, ,
2 1
3 2 1
2 2 1 1 3
x x f
x x x f
x f
X X
X X X
x X x X X
=
= =
,... (6.2.10)

Exemplul 6.2.7. S se simuleze un vector X repartizat Multinomial (100;
0.1,0.2,0.7).

Soluie
Repartiia multinomial Multinomial (n ; p
1
,p
2
,p
3
,...,p
k
) este o repartiie k
dimensional discret definit prin densitile discrete
p(i
1
,...,i
k
) =
k
i
k
i i
k
p p p
i i i
n
...
! !... !
!
2 1
2 1
2 1

Aici (i
1
,...,i
k
) e {0,1,...,n}
k
. n cazul acesta, discret, putem s renunm la
teorie i s simulm vectorul nostru Z ca pe orice variabil aleatoare discret:
codificm cumva vectorul (i
1
,...,i
k
) de exemplu l gndim c ar fi un numr scris
n baza (n+1) i apoi aplicm metoda cuantilei. n cazul particular de mai sus,
am avea de a face cu o variabil aleatoare cu (100 +1)
3
componente. Se poate, dar
nu v sftuiesc.
Dar, dac inem seama de interpretarea probabilistic a acestei repartiii
(se extrag cu revenire n bile dintr-o urn cu bile de k culori diferite, urn n care
p
j
este proporia bilelor de culoare j !) se verific imediat c
X
1
~ Binomial(n,p
1
), (X
2
X
1
) ~ Binomial(n X
1
,
k
p p
p
+ +...
2
2
),
(X
3
X
1
,X
2
) ~ Binomial(n X
1
X
2
,
k
p p
p
+ +...
3
3
), etc
n cazul nostru concret X1 ~ Binomial(100, 0.1); (X
2
X
1
) ~ Binomial(100 X
1
,
0.2/0.9) iar X
3
= 100 X
1
X
2
.
Secvena de instruciuni care simuleaz n R N = 10 asemenea vectori este

n=100;p1=.1;p2=.2/(1-p1);N=10
x1=rbinom(N,n,p1);x2=rbinom(N,n-x1,p2);x3=n-x1-
x2;x=cbind(x1,x2,x3);x
x1 x2 x3
[1,] 8 23 69
[2,] 5 23 72
[3,] 8 20 72
[4,] 14 24 62
[5,] 13 23 64
[6,] 8 16 76
[7,] 4 32 64
[8,] 8 25 67
[9,] 10 21 69
[10,] 10 21 69
178

Exemplul 6.2.8. S se simuleze un vector X ~ Uniform(C) unde C este sfera
tridimensional unitar de raz 1: C = {(x,y,z) e 9
3
x
2
+ y
2
+ z
3
s 1}

Soluie
Amintim c un vector X se numete repartizat uniform ntr-un compact din 9
k
de
volum nenul dac P(X e B) =
k
(B C) /
k
(C). O definiie alternativ este c
densitatea sa f
X
= o1
C
unde o = 1/
k
(C). Aici
k
este msura Lebesgue k
dimensional.
n cazul nostru f
X
(x,y,z) = ( ) z y x
C
, , 1
4
3
t
- deoarece volumul sferei este 4t1
3
/ 3.
Folosim formulele (6.2.10.) Mai nti, ( ) ( )
}
t
= dydz z y x x f
C X
, , 1
4
3
1
. Integrala
aceasta reprezint aria seciunii prin sfer fcut prin punctul (x,0,0); seciunea
are form de cerc cu raza r =
2
1 x , deci aria este t(1 x
2
), deci
( )
( )
4
1 3
2
1
x
x f
X

= . Apoi,
( )
( ) ( )
}
t
= dz z y x y x f
C X X
, , 1
4
3
,
2 1
,
; integrala este lungimea
seciunii fcute n sfer (x,y,0) , care este intervalul [-
2 2
1 y x
2 2
1 y x ],
deci avem
( )
( )
{ } 1
2 2
,
2 2
2 1
1
2
1 3
,
s +
t

=
y x
X X
y x
y x f . Deci avem n concluzie

( )
( )
4
1 3
2
1
x
x f
X

=

( ) ( ) y
x
y x
y f
x x
x X X
(


t
=
2 2 1 2
1 , 1
2
2 2
|
1
1
1 2


( )
( )
( ) z
y x
x
z f
y x y x
y X x X X
(


= =

=
2 2 2 2 2 1 3
1 , 1 2 2
2
, |
1
1 3
1 2


Principial ar trebui s simulm pe X
1
dup prima densitatea. Cu valoarea lui X
1
=
x astfel obinut simulm pe X
2
dup a doua. Gsim X
2
= y i, cu x i y astfel
gsii, simulm pe X
3
.
Se poate face, dar necesit timp i la calculul cuantilelor se pierde mult din
precizie. Poate e loc i de mai bine.q.e.d.

Exemplul 6.2.9. S se simuleze un vector X ~ N(
|
|
.
|

\
|
|
|
.
|

\
|
9 3
3 4
,
1
1
)


179
Soluie
n general, dac X ~ N(
|
|
.
|

\
|
o o o
o o o
|
|
.
|

\
|

2
2 2 1
2 1
2
1
2
1
,
r
r
), atunci se demonstreaz uor,
folosind funcia caracteristic sau ce generatoare de momente, c
X
1
~ N(
1
,o
1
2
) i (X
2
X
1
) ~ N(
2
2
2
1
2
1 1 2
1 , ) ( |
.
|

\
|
o
o
o
+ r X r )
n cazul nostru
1
=
2
= 1, o
1
= 2, o
2
= 3, r = 0.5. n R este foarte simplu:

mu1=1;mu2=1;sig1=2;sig2=3;r=.5;N=10
x1=rnorm(N,mu1,sig1);mu2yx=mu2+r*x1*sig2/sig1
x2=rnorm(N,mu2yx,sig2*sqrt(1-r^2));x2
cbind(x1,x2)

x1 x2
[1,] 1.4348022 -0.4392765
[2,] 2.9756048 1.3576312
[3,] 1.4325336 5.1186160
[4,] 3.6110443 0.2845141
[5,] -1.6309399 -0.8586991
[6,] -1.1127450 -3.2264889
[7,] -1.7916329 -3.2797160
[8,] 0.2004633 5.0036828
[9,] 3.4808525 5.0187472
[10,] -0.2603470 2.8354261

n figura alturat vedem rezultatul a 5000 de simulri.



Pentru dimensiuni mai mari, algoritmul general nu mai este satisfctor nici
pentru simularea vectorilor aleatori normali, deoarece formulele de calcul pentru
(X
j
X
1
,...,X
j-1
) devin tot mai complicate.
180
6.3. Algoritmi speciali: repartiii uniforme

Problema 6.3.1. Fie C _ 9
k
o mulime compact de volum
k
(C) > 0. S se
simuleze un vector X ~ Uniform(C).

Am vzut c algoritmul general pune mari dificulti chiar n cazurile
simple. De exemplu, chiar i pentru o mulime simpl, cum ar fi simplexul C =
3

= {(x,y,z) e [0,1]
3
: x + y + z s 1},unde densitile sunt uor de calculat am avea
probleme: f = 61
C
, ( ) ( )
2
1 3
1
x x f
X
= 1
(0,1)
(x), ( ) ( )
{ } 1 ,
1 1 6 ,
2 1
< +
=
y x X X
y x y x f
( )
( )
( )
| |
( ) y
x
y x
y f
x x X X 1 , 1
2
|
1
1
1 2
1 2
=


= . La prima densitate e uor de calculat cuantila, la
a doua e greu.

Algoritmul acceptare / respingere. Ideea este s generm vectori
aleatori unifom repartizai ntr-o mulime mai mare, unde este comod de fcut
aceasta, i s reinem doar acei vectori care sunt C. Cel mai comod este s
includem C ntr-un hiperparalelipiped [a
1
,b
1
]...[a
k
,b
k
]
Formal, rezultatul este urmtorul:

Propoziia 6.3.2 Fie C _ A _ 9
k
dou compacte de msur pozitiv i fie (X
n
)
n
un
ir de vectori aleatori i.i.d. repartizai Uniform(C). Fie N = inf {n : X
n
e C} i Z =
X
N
.
Atunci Z ~ Uniform(C).

Demonstraie
Fie p = P(X
n
e C). Atunci P(N = n) = p(1 p)
n-1
, deci probabilitatea ca nu
nimerim niciodat n C este 0. Fie B _ C o mulime borelian. Atunci

P(Z e B) = P(X
N
e B) = ( ) = e
>1
,
n
N
n N B X P =

( )
( )
( )
( ) e < e
e
e
= e < e
> > 1 1
,
)
,
n
n j
n
n
n
n j
C X n j C X P
C X P
B X P
B X n j C X P =

( )
( )
( )
e
e
>

1
1
1
)
n
n
n
n
p p
C X P
B X P
=
( )
( )
( ) ( )
( ) ( )
( )
( ) C
B
A C
A B
C X P
B X P
k
k
k k
k k
n
n

=


=
e
e
/
/
)
, exact ce voiam.

Viteza algoritmului depinde, evident, de raportul dintre volumul lui C i
volumul lui A. n cazul C =
3
, putem lua A = [0,1]
3
mai bine nici nu se poate.
Cum raportul dintre volume este 1/6, ne ateptm ca n jur de o esime din
punctele generate Uniform(A) s fie i n C. Chiar aa i este: dup 120 de
simulri, am reuit s nimerim de 23 de ori n A.

181
N=120;x1=runif(N);x2=runif(N);x3=runif(N);s=x1+x2+x3
v=which(s<1);nf=length(v)
xb1=1:nf;xb2=1:nf;xb3=1:nf
for (i in 1:nf)
{xb1[i]=x1[v[i]];xb2[i]=x2[v[i]];xb3[i]=x3[v[i]]}
x=cbind(xb1,xb2,xb3);x

xb1 xb2 xb3
[1,] 0.261076623 0.001725541 0.59342688
[2,] 0.329976494 0.618442961 0.02125208
[3,] 0.070146402 0.406062445 0.41304084
[4,] 0.551778257 0.067009293 0.28671116
[5,] 0.229001845 0.150103106 0.29779559
[6,] 0.145313528 0.550778716 0.19904163
[7,] 0.019184817 0.133237032 0.68866607
[8,] 0.180765220 0.394726553 0.23718938
[9,] 0.619285529 0.085581634 0.19468893
[10,] 0.012022830 0.403672086 0.19543799
[11,] 0.420006088 0.054411151 0.36632268
[12,] 0.042866380 0.024161682 0.77753557
[13,] 0.394432793 0.135697418 0.09784523
[14,] 0.342567456 0.325553098 0.11622695
[15,] 0.439633231 0.135284625 0.04868877
[16,] 0.002924559 0.660988999 0.21707588
[17,] 0.442618400 0.198682676 0.14334936
[18,] 0.055533753 0.397702978 0.21110361
[19,] 0.102202073 0.703533423 0.04253352
[20,] 0.101106154 0.433682927 0.38915822
[21,] 0.458446015 0.205739238 0.10033640
[22,] 0.067286825 0.133509017 0.29028897
[23,] 0.229641613 0.620405543 0.06375227

Dac ns k, dimensiunea simplexului, n loc s fie 3 era 7, atunci
volumul su era 1/7! = 1/5040. Din 120 de simulri era foarte probabil ca nici
una s nu fie n mulimea dorit.
Avem i o veste bun: dac C este un simplex, atunci exist algoritmi
rapizi care genereaz vectori repartizai uniform acolo. El se bazeaz pe
urmtoarea descoperire

Propoziia 6.3.3. Simularea rapid a vectorilor repartizai uniform ntr-un
simplex. Fie n+1 variabile aleatoare i.i.d. (X
j
)
1 s j s n+1
repartizate Exponential(1).
Fie S suma lor i Y
j
=
S
X
j
. Atunci vectorul Y = (Y
j
)
1sjsn
este repartizat Uniform(
n
)
unde
n
= {xe[0,1]
n
: x
1
+ x
2
+ ...+ x
n
s 1}.

182
Demonstraie
Fie f : 9
n
9 o funcie msurabil i mrginit. Avem de calculat Ef(Y)
n sperana c rezultatul va fi
}

A
n
n
fd n! . Din formula de transport, avem

Ef(Y) = ( )
1 2 1 1 1
) , 0 [
2 1
.... , ,..., 1 ,..., ,
1
+ +

+ }
|
.
|

\
|
n n n
s n
dx dx dx x x x e
s
x
s
x
s
x
f
n
. Aici s este suma x
1

+ ...+ x
n+1

Facem schimbarea de variabile

y
1
= x
1
/s, y
2
= x
2
/s,..., y
n
= x
n
/s , y
n+1
= s. Jacobianul ei este
( )
( )
=
+
+
1 1
1 1
,...
,...,
n
n
y y D
x x D
s
n
,

imaginea mulimii [0,)
n
[0,) prin ea este
n
[0,) deci integrala devine

Ef(Y) = ( ) ( ) ( ) ds dy dy dy s y y e s y y y f
n n
s n
n
n
.... 1 ,..., 1 ,..., ,
2 1 ) , 0 [ 1 2 1 A

}
=

( ) ( )
n n n
dy dy dy y y y y y f
n
.... ,..., 1 ,..., ,
2 1 1 2 1 A } }


0
ds e s
s n
, adic exact ce doream cci a
doua integral este n!. q.e.d.

n general o mulime se numete simplex n dimensional dac este
anvelopa convex a unei mulimi de n+1 puncte i, dac, n plus, are interiorul
nevid. De exemplu, pentru n = 2, orice triunghi ABC este un simplex, cu condiia
ca nu cumva cele trei puncte s fie coliniare. n spaiu, orice tetraedru ABCD
este simplex dac nu cumva cele patru puncte sunt coplanare.
Frumuseea este c simplexul S = S(a) cu vrfurile a
1
a
2
.a
n
a
n+1
se poate descrie
ntotdeauna sub forma

S = {a
1
X
1
+ a
2
X
2
+.+ a
n
X
n
+ a
n+1
(1 X
1
X
2
- - X
n
) : (X
1
, X
2
, ,X
n
e
n
} (6.3.1)

i de aici se vede ce avem de fcut pentru a simula un vector uniform
repartizat acolo: simulm vectori aleatori repartizai unifom n
n
.

Exemplul 6.3.4. S se simuleze un vector aleator repartizat U(C) unde C este
triunghiul ABC

Soluie. Fie a,b,c afixele celor trei puncte. Atunci

X =
3 2 1
3 2 1
X X X
cX bX aX
+ +
+ +
unde X
j
sunt i.i.d i ~ Exponential(1).

183
Mai exist un caz n care suntem norocoi: dac X ~ N(,C). Atunci
folosim urmtorul truc:

Propoziia 6.3.5. Fie C o matrice pozitiv definit i A o matrice simetric cu
proprietatea c A
2
= C. Fie Y ~ N(0,I
k
) (adic un vector normal standard cu
toate componentele i.i.d ~ N(0,1)). Atunci X = AY + este un vector repartizat
N(,C).

Demonstraie
Evident. X este normal , EX = i cov(X) = cov(AY + ) = Acov(Y)A = AA =
A
2
. q.e.d.

Ca s construim construim pe A scriem matricea C la forma diagonala C
= ODO unde O este matricea vectorilor proprii, care sunt ortogonali, D este
matricea diagonal care cu valorile proprii, nlocuim D cu D - adic cu
matricea care pe diagonal are radcinile ptrate ale valorilor proprii i punem A
= O D O.
Dac avem un software care e n stare s calculeze vectorii proprii, nu e
nici o problem. Iat, de exemplu, o funcie n R exact acest lucru

#simularea unei repartitii normale k-dimensionale
normal<-function(mu,cov)
{k=length(mu);jor=eigen(cov);valp=jor[[1]] #
valp sunt valorile proprii
vecp=jor[[2]] # vecp are vectorii proprii
kk=k^2;diag=1:kk;diag=diag-diag;dim(diag)=c(k,k)
for (i in 1:k) {diag[i,i]=sqrt(valp[i])}
a=vecp%*%diag%*%t(vecp)
u=rnorm(k,0,1);x=a%*%u+mu
x}

Funcia se apeleaz prin comanda

x=normal(mu,c)

Pentru a o apela este nevoie de vectorul mu = al mediilor, si de
matricea de covarian C. Iat un exemplu:simulm 10 vectori aleatori N(,C) cu

=(1,2,3) i C =
|
|
|
.
|

\
|

16 2 1
2 9 1
1 1 4
.

xx= 1:30; dim(xx) = c(10,3=
for (i in 1:10) {xx[i,]=normal(mu,c)}; xx
184
[,1] [,2] [,3]
[1,] 1.3356960 2.7749180 15.06867494
[2,] 2.3000149 1.3544057 -1.01883329
[3,] -1.3323644 0.8461128 10.02604282
[4,] 0.9394982 0.8378104 7.92561663
[5,] 2.0869182 0.7712231 -7.01464171
[6,] 0.2167368 1.6627487 0.05478921
[7,] 0.7415051 3.6121115 3.01237874
[8,] 0.5663550 1.6125076 -1.61308129
[9,] 0.6628614 -1.1853937 12.85524488
[10,] 5.2891190 0.4922314 0.82281214

185
Capitolul 7


Statistic descriptiv

Introducere

Statistica descriptiv este ramura statisticii ce se ocup cu prezentarea,
organizarea i interpretarea unei colectii de date. Descrierea acestor informaii se
poate face grafic (prin liste, grafice liniare, de distribuie etc.), sau prin indicatori
statistici (medie, median, abatere etc.).


7.1. Prezentarea datelor statistice

Analiza statistic a unui fenomen ncepe cu statistica formal (culegerea
datelor asupra fenomenului respectiv i nregistrarea datelor). Datele sunt apoi
analizate i interpretate, cu ajutorul statisticii matematice.


Definiia 7.1.1. Prin populaie statistic (populaie) se nelege orice mulime
care formeaz obiectul unei analize statistice. Elementele unei populaii
statistice se numesc uniti statistice sau indivizi.

Caracteristica este trstura comun unitilor unei populaii statistice.
Valoarea numeric a caracteristicii se numete variabil aleatoare. De exemplu,
dac ne referim la repartiia componenilor unei echipe de fotbal, dup nlime,
constatm c mulimea sportivilor formeaz populaia statistic, fiecare fotbalist
este o unitate statistic i nalimea este caracteristica studiat.
Matematic, o populaie statistic este o partiie a unei mulimi E, E={A
1
,
... , A
n
}, submulimile A
1
, ... , A
n
fiind clase. Unitile statistice care compun o
clas A
i
sunt alese pe baza unei relaii de echivalen, care reprezint
caracteristica populaiei.
Caracteristicile pot fi calitative sau cantitative. Caracteristicile cantitative
pot fi msurate folosind numere reale. Integrarea datelor cantitative n text are
anumite avantaje, dar tabelele statistice permit realizrea unor comparaii.
n tabelul 7.1.1, avem informaiile privind durata medie a vieii n
Romnia, in perioada 1998- 2007 (conform Institutului Naional de Statistic),
prezentate sub forma de tabel, evideniindu-se, astfel, aspectele importante ale
datelor. Obesrvm astfel c aceasta valoare crete, ncepnd cu anul 2003, dup o
scdere nesemnificativ.

186


Anul Durata medie
de viata
1998 69,24
1999 69,74
2000 70,53
2001 71,19
2002 71,18
2003 71,01
2004 71,32
2005 71.76
2006 72,22
2007 72,61

Tabelul 7.1.1

Reprezentarea grafic realizat pentru studierea schimbrilor sau pentru
compararea variabilelor statistice se numete grafic. Exist mai multe astfel de
reprezentri.
Reprezentarea cu batoane folosete batoane verticale sau orizontale, a
cror lungime simbolizeaz valorile variabilei statistice. Batoanele verticale se
folosesc, de obicei, pentru caracteristici care variaz n timp. ntre batoanele
consecutive se las, de regul, un spaiu de jumtate de unitate.
Figura 7.1.1 este reprezentarea cu batoane pentru datele din tabelul 7.1.1.


67
68
69
70
71
72
73
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Figura 7.1.1




187
Reprezentarea cu batoane orizontale prezint variante adaptate, de exemplu
reprezentarea pe componente. Diagrama cu batoane grupate furnizeaz o metod
de prezentare a prilor componente ale unui ntreg, fr realizarea unei
comparaii cu ntregul.
Dac ne referim la datele din Tabelul 7.1.2, privind structura populatiei
pe medii (urban, rural), data furnizate de

Tabelul 7.1.2

Anul Urban(%) Rural(%)
1960 32,1 67,9
1970 36,9 63,1
1980 45,8 54,2
1990 54,3 45,7
2000 54,6 45,4
2001 54,6 45,4
2002 53,3 46,7
2003 53,4 46,6
2004 54,9 45,1
2005 54,9 45,1
2006 55,2 44,8
2007 55,1 44,9
2008 55,0 45,0

Institutul Naional de Statistic, se obine reprezentarea cu batoane orizontale pe
componente, din figura 7.1.2.


0 10 20 30 40 50 60 70 80
1960
1980
2000
2002
2004
2006
2008
Figura 7.1.2
Rural(%)
Urban(%)

188


Graficul liniar pe poriuni este format din segmente de dreapt ce se obin
prin unirea perechilor de valori corespunztoare ale unei perechi de variabile
diferite.
n tabelul 7.1.3, sunt prezentate datele furnizate de Institutul Naional de
Statistic privind totalul numrului de imigrani, n perioada 2003-2008.

Anul
Total
imigrani
2003 3267
2004 2987
2005 3704
2006 7714
2007 9575
2008 10030

Tabelul 7.1.3
Pentru acest tabel, am realizat graficul liniar pe poriuni din figura 7.1.3.

Total imigrani
0
2000
4000
6000
8000
10000
12000
2003 2004 2005 2006 2007 2008
Figura 7.1.3



Diagrama circular arat descompunerea unui ntreg n prile sale
componente. Ele se exprim ca procente din total i sunt reprezentate prin
segmente de cerc, unghiurile la centru avnd msuri egale cu procentul
corespunztor din 360
0
.
Figura 7.1.4 arat structura cheltuielilor din domeniul cercetare-
dezvoltare, din punctul de vedere al surselor de finanare, n Romnia, n 2001.

189
Uniti economice
48%
Fonduri de la buget
43%
Fonduri externe
8%
Alte surse
1%
Uniti economice
Fonduri de la buget
Fonduri externe
Alte surse

Figura 7.1.4

n continuare, ne vom referi la distribuii i reprezentarea lor prin
diagrame i tabele.

Definiia 7.1.2. O variabil statistic se numete discret dac ea nu poate lua
dect valori izolate n intervalul su de variaie. Ea se numete continu dac
poate lua toate valorile posibile n intervalul su de variaie.

Ca exemplu de variabil discret, ne putem referi la numrul capitolelor
unei cri, numrul articolelor produse de o fabric etc.. Pentru cazul continuu,
putem da ca exemplu nlimea unei persoane, ora sosirii unui tren etc..
Ne referim n continuare la cazul variabilei continue.
S considerm un eantion de 40 de angajai al cror salariu brut
exprimat n mii lei, la nceputul lunii ianuarie, conduce la datele din tabelul
7.1.4.
0,831 0,904 0,896 0,961 0,981
0,956 1,705 1,591 1,156 1,221
1,587 0,991 1,981 1,459 1,861
0,82 1,141 1,452 1,344 1,42
1,805 1,052 1,731 1,75 0,976
1,091 1,201 1,895 0,972 1,071
1,605 0,989 1,858 1,081 1,492
1,594 1,354 1,946 1,671 1,057

Tabelul 7.1.4
O descriere precis a seriei statistice obinute se realizeaz prin
construirea unui tabel al frecvenelor, n care observaiile sunt clasificate n
raport cu numrul unitilor statistice care se afl ntre anumite limite. Tabelul
7.1.5 prezint frecvenele pentru datele anterioare, privind salariile. Astfel,
marginile claselor de valori (0,8; 0.95 ...) din tabelul 7.1.5 sunt limitele sau
marginile clasei de valori. Media aritmetic a limitelor unei clase se numete
190
mijlocul sau valoarea central a clasei. Diferena dintre cea mai mare i cea mai
mic margine se numete domeniu sau amplitudine. Frecvena absolut este dat


Limitele
clasei
Mijlocul
clasei
Frecvena
absolut
Frecvena
relativ(%)
Frecvena
cumulat
absolut
Frecvena
cumulat
relativ(%)
[0,8;0,95) 0,875 4 10 4 10
[0,95;1,1) 1,025 12 30 16 40
[1,1;1,25) 1,175 5 12,5 21 52,5
[1,25;1,4) 1,325 2 5 23 57,5
[1,4;1,55) 1,475 5 12,5 28 70
[1,55;1,7) 1,625 5 12,5 33 82,5
[1,7;1,85) 1,775 4 10 37 92,5
[1,85;2) 1,925 3 7,5 40 100
Tabelul 7.1.5
de numrul unitilor statistice aflate ntre limitele unei clase, iar cea relativ este
raportul dintre frecvena absolut i numrul total al unitilor statistice. n cazul
n care nu este precizat, prin frecven se nelege frecven relativ. Mulimea
frecvenelor (absolute sau relative), mpreun cu clasele lor formeaz frecvena
distribuiei. Frecvena cumulat a unei clase este suma frecvenelor pn la clasa
respectiv, clasele fiind ordonate cresctor.
n general, este indicat utilizarea a 10-20 clase de valori.
Histograma este o reprezentare cu batoane, fr spaiu ntre acestea. Ea
prezint marginile claselor pe axa orizontal i frecvenele pe cea vertical.
Histograma pentru datele din tabelul 7.1.4 este prezentat in figura 7.1.5.

0
5
10
15
20
25
30
35
Figura 7.1.5.


191
Poligonul frecvenelor este un grafic liniar pe poriuni, mijloacele claselor
fiind reprezentate pe axa orizontal i frecvenele pe cea vertical. Fiecare mijloc
are o frecven, marcat printr-un punct. Punctele consecutive se unesc prin
segmente de dreapt, rezultnd poligonul frecvenelor.
Figura 7.1.6 prezint poligonul frecvenelor pentru datele din tabelul
7.1.4 (pe axa absciselor s-au folosit rotunjiri, pentru a da doar dou zecimale).
0
5
10
15
20
25
30
35
0.875 1.025 1.175 1.325 1.475 1.625 1.775 1.925
Figura 7.1.6
F
r
e
c
v
e
n

a
(
%
)


Poligonul frecvenelor cumulate este un grafic liniar pe poriuni, care se
realizeaz similar cu poligonul frecvenelor, singura schimbare fiind aceea ca n
locul frecvenelor apar frecvenele cumulate.


7.2. Caracteristici numerice

Ne vom referi acum la descrierea informaiilor folosind indicatori statistici. n
acest sens, exist dou mari categorii: msuri ale tendinei centrale (media,
mediana, moda etc.) i msuri ale variaiei sau mprtierii (amplitudinea,
abaterea etc.).
n continuare, prezentm principalii indicatori ai tendinei centrale.
ntr-o distribuie (ne referim la variabil continu), clasa cu cea mai mare
valoare a frecvenei este clasa modal, iar mijlocul acesteia este moda variabilei.
n tabelul 7.1.5, clasa modal este [0,95;1,1), iar moda este 1,025.
S ne referim acum la o mulime de date de selecie (variabil discret),
moda este valoarea cu frecvena maxim.
S considerm o grup format din 20 de studeni care susin un test la
matematic, obinndu-se rezultatele din tabelul 8.2.1. Aici, moda este 8.

Definiia 7.2.1. Pentru cazul discret, mediana unei mulimi x
1 ,
x
2
,..., x
m
(datele
de selecie sunt ordonate cresctor) este valoarea de mijloc, x
(m+1)/2
, dac m este
impar, i media celor dou valori de mijloc,
2
1
(x
m/2
+x
m/2+1
), dac m este par.
192

De exemplu, media mulimii 5,6,8,9,12 este 8, iar pentru 15, 18, 20, 14,
28, 30 se obine mediana
2
1
(20+24)=22.




Nota Frecvena
absolut
Frecvena
relativ(%)
3 1 5
4 1 5
5 2 10
6 2 10
7 5 25
8 6 30
9 2 10
10 1 5
Tabelul 7.2.1


Definiia 7.2.2. Pentru o variabil continu, clasa cu frecvena cea mai mic ce
are proprietatea c frecvena cumulat asociat este mai mare dect
2
m
, m fiind
numrul total de clase, se numete clasa medianei.

Notnd cu m numrul total de clase, m
d
mediana distribuiei, f
i
frecvena
pentru clasa [x
i-1
,x
i
), F
i
frecvena cumulat pentru clasa [x
i-1
,x
i
) i [x
j-1
,x
j
) clasa
modal. Efectund o interpolare, obinem urmtoarea

Definiia 7.2.3. ntr-o distribuie, valoarea medianei este dat de relaia
m
d
=x
i
+h
i
i
i
f
F
1
5 , 0

,
unde h
i
=x
i
-x
i-1
, F
i-1
<0,5 ;i F
i
>0,5.

Pentru datele din tabelul 8.1.5, clasa median este [1,1;1,25), iar mediana
este m
d
=1,1+1,5
125 , 0
4 , 0 5 , 0
=1,122.

Definiia 7.2.4. Media(de selecie) a unei mulimi x
1 ,
x
2
,..., x
m
se definete prin
193

=
=
m
i
i
x
m
x
1
1
.

De exemplu, dac lista de preuri, n lei, pentru centrale termice, este
urmtoarea: 9900, 10300, 11200, 12500, 7600, 17500, costul mediu al unei
centrale este
( ) 11500 500 17 600 7 500 12 200 11 300 10 900 9
6
1
= + + + + + = x .
Dac x
1 ,
x
2
,..., x
k
sunt valorile distincte ale lui X, iar n
i
este frecvena lui
x
i
, formula se rescrie

=
=
=
k
i i
i
k
i i
i i
n
x n
x .
Notnd f
i
=
m
n
i
, rezult
i
k
i
i
x f x

=
=
1
, ("media ponderat").

Definiia 7.2.5. Considerm un tabel al frecvenelor cu k clase. Dac x
1
*
,

x
2
*
,...,
x
m
*
sunt mijloacele claselor, n
1
, n
2
, ..., n
k
frecvenele lor absolute i f
1
, f
2
, ..., f
k
frecvenele lor relative, atunci media distribuiei este

=
=
=
k
i i
i
k
i i
i
i
n
x n
x
*
,
mai precis
*
1
i
k
i
i
x f x

=
= .

Pentru datele din tabelul 7.1.5, media este
3 4 5 5 2 5 12 4
925 . 1 3 775 , 1 4 625 , 1 5 475 , 1 5 375 , 1 2 175 , 1 5 025 , 1 12 875 , 0 4
+ + + + + + +
+ + + + + + +
= x

. 3175 , 1 =
Se observ c media nu d o imagine complet a datelor de selecie sau a
distribuiei. De exemplu, mulimile {2, 2, 2, 5, 8, 8, 8}, {3, 3, 5, 5, 5, 7, 7}, {4, 4,
4, 5, 6, 6, 6} au aceeai medie, dar au structuri diferite. Acesta este motivul
194
pentru care sunt introduse msuri ale variaiei, care s arate gradul de mprtiere
a datelor n jurul mediei.

Definiia 7.2.6. Pentru o variabil discret, diferena dintre cea mai mare i cea
mai mic valoare a seleciei se numete amplitudine.
Pntru o variabil continu, amplitudinea este diferena dintre limita
superioar a clasei cu cele mai mari margini i limita inferioar a clasei cu cele
mai mici margini.

Definiia 7.2.7. Fie x
1 ,
x
2
,..., x
m
date de selecie avnd media x . Abaterea
medie se definete prin relaia

=
=
m
i
i
x x
m
m a
1
| |
1
. . .

S considerm urmtoarele date de selecie: 12, 15, 13, 20, 13. Media lor
este ( ) 6 , 14 13 20 13 15 12
5
1
= + + + + = x , n timp ce abaterea medie are valoarea
( ) | 6 , 14 13 | | 6 , 14 20 | | 6 , 14 13 | | 6 , 14 15 | | 6 , 14 12 |
5
1
. . + + + + = m a
. 32 , 2 =
Altfel spus, valorile de selecie difer n medie cu 2,32 fa de media
14,6.
Fie x
1 ,
x
2
,..., x
k
valorile distincte ale lui X, avnd media x , iar n
i

frecvena lui x
i
. Atunci

=
=

=
k
i i
i
k
i i
i i
n
x x n
m a
| |
. . .
Notnd cu f
i
=
m
n
i
frecvena relativ, rezult | |
1
x x f x
i
k
i
i
=

=
.
Pentru datele din tabelul 7.2.1, abaterea medie este . 3 , 1 . . = m a

Definiia 7.2.8. Fie o variabil continu cu un tabel al frecvenelor cu k clase.
Dac x
1
*
,

x
2
*
,..., x
m
*
sunt mijloacele claselor, n
1
, n
2
, ..., n
k
frecvenele lor
absolute i f
1
, f
2
, ..., f
k
frecvenele lor relative, atunci abaterea medie este
195

=
=

=
k
i i
i
k
i i
i
i
n
x x n
m a
| |
. .
*
,
adic
. | | . .
*
1
x x f m a
i
k
i
i
=

=


Pentru tabelul 7.1.5, calculm abaterea medie i obinem valoarea
99625 , 2
40
85 , 119
= .

Definiia 7.2.9. Fie x
1 ,
x
2
,..., x
m
date de selecie cu media x . Dispersia se
definete astfel
( )

=
= o
m
i
i
x x
m
1
2
2
1
.
( )

=
= o
m
i
i
x x
m
1
2 1
este abaterea de selecie (empiric) standard.

Fie x
1 ,
x
2
,..., x
k
valorile distincte ale lui X, cu media x , iar n
i
frecvena
lui x
i
. Formula pentru calculul dispersiei devine
( ) ( )
m
x x
n
x x
k
i
i
k
i
i
k
i
i

=
=
=

=

= o
1
2
1
1
2
2
.

Dac frecvena relativ este f
i
=
m
n
i
, rezult ( )
2
1
2
x x f
i
k
i
i
= o

=
.
Dispersia corespunztoare datelor din tabelul 7.2.1 este
| + + + + + = o
2 2 2 2 2 2
) 7 7 ( 5 ) 7 6 ( 2 ) 7 5 ( 2 ) 7 4 ( 1 ) 7 3 ( 1
20
1

| 8 , 2 ) 7 10 ( 1 ) 7 9 ( 2 ) 7 8 ( 6
2 2 2
= + + ,
n timp ce abaterea standard este 673 , 1 = o .

196
Definiia 7.2.10. Fie o variabil continu cu un tabel al frecvenelor cu k clase.
Dac x
1
*
,

x
2
*
,..., x
k
*
sunt mijloacele claselor, n
1
, n
2
, ..., n
k
frecvenele lor
absolute i f
1
, f
2
, ..., f
k
frecvenele lor relative, atunci media distribuiei este
( )

=
=

= o
k
i i
i
k
i i
i
i
n
x x n
2
*
2
,
mai precis
( )

=
= o
k
i
i i
x x f
1
2
*
.

Pentru datele din tabelul 7.1.5, dispersia este 114 , 1
40
2750 , 445
2
= = o , iar
abaterea este 055 , 1 = o .


7.3. Corelaie. Regresie

Legtura dintre dou sau mai multe variabile poart numele de corelaie.
Conexiunea aceasta se poate prezenta sub mai multe forme, cea mai simpl fiind
relaia ( ) x f y = , unde f este o funcie de variabila x, egalitate ce arat c lui x i
corespunde o valoare bine determinat a lui y.
Mai jos sunt prezentate notele la algebr i geometrie obinute de zece
studeni.

Nr. crt. Nota
algebr
Nota
geometrie
1 5 5
2 6 5
3 6 6
4 6 7
5 7 7
6 7 8
7 8 8
8 9 9
9 10 9
10 10 10

Tabelul 7.3.1
197
Vom reorganiza datele de mai sus sub forma unui tabel cu dou intrri,
astfel: notele la algebr sunt reprezentate pe axa absciselor, iar cele la geometrie
pe cea a ordonatelor.

5 6 7 8 9 10 m
Y
10 9,5
9 9
8 8
7 7,5
6 6
5 5
m
X
5,5 6 6,5 7,5 9,5 10

Tabelul 7.3.2

Vom indica existena unui student ce ia note corespunztoare unui ptrat
printr-un punct situat n interiorul acestuia. De exemplu, studentul cu notele 7 i
8 se va regsi n ptratul (7,8). Acest tablou se numete tablou de corelaie.
Observm c, n general, creterea notelor la algebr este nsoit de
creterea notelor la geometrie. Astfel, ntre aceste variabile exist o corelaie
pozitiv. Punctele din interiorul tabloului de corelaie se grupeaz n jurul unei
diagonale a ptratului, deci se poate afirma c avem o corelaie liniar.
n figurile 7.3.1 i 7.3.2, am reprezentat grafic pe m
X
n raport cu x i pe
m
Y
n raport cu y.

0
2
4
6
8
10
12
0 2 4 6 8 10 12
Figura 7.3.1



198
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10 12
Figura 7.3.2


m
X
i m
Y
se numesc funcii de regresie. n figurile de mai sus, graficele
lor se grupeaz n jurul primei bisectoare. n figura 7.3.1, avem regresia lui y
asupra lui x, iar n figura 7.3.2, regresia lui x asupra lui y.
Pentru fixarea ideilor, s considerm V(X,Y) un vector n plan, X i Y fiind
variabile aleatoare. Statistic, suntem interesai de situaia n care vectorul V ia un
numr finit de valori, ( ), ,
k j ij ij
b a v v = , , 1 m j = , , 1 n k = vecorul avnd
componentele
k j
b a , . Notnd ( )
, jk jk
p v V P = = avem 0 >
jk
p i
. 1
1 1
=

= =
m
j
jk
n
k
p Tabelul 7.3.3 se numete tabel de corelaie.





1
b
2
b
n
b Y
1
a

1
p
2
a
2
p

...


...

...

...

...

...

...


...

...

...

...

...
m
a
1 m
p
2 m
p

mn
p
m
p
X
1
p
2
p

n
p

Tabelul 7.3.3

Au loc urmtoarele relaii:
199
,
1
j
n
k
jk
p p =

=
; , 1 m j = ,
1
k
m
j
jk
p p =

=
; , 1 n k =
, 1
1
=

=
n
k
k
p 1
1
=

=
m
j
j
p .

j
p , respectiv
k
p , se numesc probabiliti marginale i reprezint
probabilitatea ca
j
a X = , respectiv
k
b Y = , penrtu orice valoare a celeilalte
variabile.
Similar cu valorile medii pentru variabilele unidimensionale se definesc
cele pentru variabilele bidimensionale. Dac notm

= =
=
m
j
n
k
s
k
r
j jk rs
b a p m
1 1
,
obinem, ca valori particulare:

= = =
= =
m
j
n
k
m
j
j j jk
a a p m
1 1 1
10

= =
=
m
j
n
k
k
jk
b p m
1 1
01
,
care se noteaz, de obicei, prin m
1
i respectiv m
2
, ele fiind coordonatele
centrului de greutate.
Momentele centrate se definesc prin:
( ) ( ) | | ( ) ( )

= =
= =
m
j
n
k
s
k
r
j
s r
rs
m b m a m Y m X E
1 1
2 1 2 1
.
Momentele centrate de ordinul al doilea au denumiri speciale n teoria
probabilitilor. Astfel,
20
se noteaz cu
2
1
o i reprezint dispersia lui X,
02
, notat
2
2
o , este dispersia lui Y.
11
este covariana variabilelor X i Y.
Dac notm prin ( )
j
m
i
i ij
j
p
a p
b Y X E

=
= =
1
| valoarea medie a lui X,
condiionat de
j
b Y = , obinem modul de comportare al variabilei X atunci
cnd Y ia valoarea b
j.
Avnd n vedere toate valorile ( )
j i
b a , , m i , 1 = , iar b
j

rmne fix, diversele medii condiionate referitoare la a
i
caracterizeaz modul de
variaie al variabilei X pentru
j
b Y = fixat.
200
Se poate caracteriza aceast variaie pintr-o relaie ( ) Y f X = , astfel ca
( )
j j
b Y b f X m = | ) (
2
s fie minim, m
2
fiind momentul de ordinul al doilea.
n general, se ncearc o exprimare de forma | + o = x Y , astfel ca
( )
2
_ o X Y E s fie minim. Avnd n vedere c
( ) ( )
2
1 1
2

= =
| o = _ o
m
i
n
j
i j ij
a b p X Y E ,
i derivnd n raport cu , o | se obine dreapta de regresie
( )
1
1
2
2
m x m y
o
o
= . Am notat prin
( )( )
( ) ( )
2
2
2
1
2 1
m Y m X E
m Y m X E


= coeficientul
de corelaie.

201
Capitolul 8


Teoria seleciei

Introducere

Teoria seleciei s-a dezvoltat datorit necesitilor practice. n multe situaii,
apare necesitatea de a obine informaii relevante despre mulimi cu numr mare
de elemente, neexistnd posibilitatea real de a studia fiecare element n parte. n
aceste cazuri, se poate examina o selecie (eantion) din mulime, n ideea ce
informaia obinut este util pentru ntreaga populaie studiat. Numeroase
aplicaii au condus la axioma potrivit creia un eantion d informaii utile
despre ntreaga mulime i c, pe msur ce selecia crete ca volum, datele
obinute sunt din ce n ce mai fidele.


8. 1. Generarea valorilor particulare ale unei variabile aleatoare

Simularea unei variabile aleatoare este utilizat att n statistic (procedee
de eantionare), ct i n modelarea stochastic. Aceast simulare se poate realiza
cu ajutorul unor obiecte (zar, rulet), sau algoritmizarea generrii unor valori
numerice pe calculator. Calculatoarele din ce n ce mai performante au
determinat, n principal, orientarea spre cea de a doua metod.
n ceea ce privete clasificarea, exist generatoare de variabile aleatoare
uniform repartizate i neuniform repartizate, ultimele construindu-se, n general,
pe baza celor din prima categorie.
Variabile aleatoare discrete uniform repartizate. Fie X o variabil
aleatoare discret ( )
n
i X P
1
= = , n i , 1 = . Simularea acestei variabile aleatoare
utilizeaz o funcie I I g
k
: , unde I este mulimea numerelor ntregi
reprezentate n calculator. Pornind de la valorile iniiale x
1,
x
2
, ..., x
n
i folosind
relaia de recuren ( )
1
,...

=
n k n n
x x g x , k n > , se genereaz o secven de
numere. irul ( )
n
x este periodic, deoarece I este finit. Acest generator este
suficient de bun dac perioada lui este mare n raport cu numrul de valori
generate i valorile generate nu sunt secvenial corelate, adic secvene de p
valori succesiv generate ocup spaiul de dimensiune p. Aceste dou condiii pot
fi ndeplinite printr-o alegere adecvat a funciei g. Metodele congrueniale sunt
cele mai utilizate. Ele se bazeaz pe o relaie de recuren de forma
( ) m x x f x
n k n n
mod ,...,
1
=
202
unde I I f
k
: .
Este comod s alegem funcia liniar
( ) , ... ,...,
1 1 1
c x a x a x x f
k n k n n k n
+ + + =

a
1
, ...a
k,
c fiind valori ntregi.
Metoda genereaz valori cuprinse ntre 0 i m-1, motiv pentru care m se
alege ct mai mare. Pentru k=0, avem generatori de ordinul nti. n acest caz,
a=16807, c=0, m=
31
2 1 sau a=24298, c=99991, m=199017 sunt cteva seturi de
valori adecvate.
Variabile aleatoare continue. Simularea unei variabile aleatoare continue
uniforme pe [0,1] se realizeaz prin generarea de valori ntregi uniform
repartizate pe mulimea {0, 1, ..., m-1} i prin mprirea lor prin m-1. Pentru o
variabil aleatoare uniform repartizat pe (0,1) se genereaz valori din mulimea
{1, ..., m-1}, care se mpart la m. O variabil aleatoare X, uniform repartizat pe
(a,b) se genereaz cu ajutorul unei variabile aleatoare Y, uniform repartizat pe
(0,1) dup care se efectueaz schimbarea de variabil a Y a b X + = ) ( .
n cele ce urmeaz, ne vom referi la metoda inversrii funciei de
repartiie.
Fie X o variabil aleatoare avnd drept funcie de repartiie : F R[0,1],
atunci inversa ei se definete ca F
-1
(y)={xeR F(x) >u}, ( ) ue[0,1],
rezultnd astfel o posibilitate de algoritmizare n vederea simulrii variabilei.
Pentru diverse repartiii concrete, se obin diveri algoritmi.
Repartiii discrete. Fie X o variabil aleatoare discret, X: ,
|
|
.
|

\
|
i
i
p
x
n i , 1 = ,

=
n
i
i
p
1
, 0 >
i
p . Aceast variabil are funcia de repartiie

>
s < =
s =
=

=

. , 1
; ,
...
; , 0
) (
1
1
1
1
n
n
k
i i k i
i
x x
x x x p F
x x F
x F

Atunci inversa funciei de repartiie se determin astfel:
, ) (
1
i
x u F =


ori de cte ori ) ( ) (
1 i i
x F u x F < <

, n i , 1 = , unde =
0
x , 0 ) (
0
= x F .
Algoritmul de simulare const n generarea unei valori u, uniform repartizate n
(0,1), i n determinarea indicelui i astfel nct
i i
F u F s <
1
.

Exemplul. 8.1.1. S considerm o variabil aleatoare binomial X, cu funcia
de repartiie
203

>
s <
s
=

=

. , 1
1 , ) 1 (
; 0 , 0
) (
0
1
n x
k x k p p C
x
x F
k
i
n i i
n



X poate fi simulat prin construirea tabelului asociat funciei de repartiie i
aplicarea metodei clasice de cutare. O alt posibilitate este de a simula
extragerile cu revenire i de a numra de cte ori se produce evenimentul de
probabilitate p. n acest sens, se consider N, cel mai mic numr natural pentru
care Np n =
1
i Np n =
2
sunt naturale i se construiete tabelul corespunztor,
cu valorile 1 ...
2 1
= = = =
n
t t t , . 0 ...
2 1 1 1
2 1
= = =
+ + + n n n n
t t t

Exemplul 8.1.2. Fie acum o variabil aleatoare geometric X, avnd funcia de
repartiie

>
s <
s
=

=
n x
k x k pq
x
x F
k
i
k
, 1
1 ,
; 0 , 0
) (
0
,
unde , 1 = + q p ) 1 , 0 ( e p .
X poate fi simulat prin aplicarea modelului clasic de cutare sau prin
simularea variabilei aleatoare cu ajutorul monedei trucate n aa fel nct
probabilitatea apariiei valorii sa fie p, iar cea a stemei sa fie q. Astfel, variabila
X arat la a cta ncercare se obine stema prima dat.

Repartiiile continue. n situaia n care se cunoate expresia inversei
funciei de repartiie, se poate utiliza forma general a algoritmului. n caz
contrar, se utilizeaz algoritmul specific repartiiilor discrete. n prealabil se
determin intervalul ( |
i i
F F ,
1
ce conine pe u, calculndu-se
. ) (
1
1
1 1
*

+ =
i i
i
i i i
F F
F u
x x x x
Facem precizarea c aici
*
x reprezint valoarea obinut, i nu
i
x .

Exemplul 8.1.3. Fie X o variabil aleatoare exponenial, cu funcia de
repartiie , 1 ) (
x
e x F

= 0 , > x . Inversa lui F este ) 1 ln(
1
) (
1
u u F =

, iar
u este uniform repartizat n (0,1). Astfel, i u 1 este uniform repartizat n
(0,1), rezultnd astfel imediat algoritmul de simulare.
204
Exemplul 8.1.4 Fie X o variabil aleatoare Weibull, cu funcia de repartiie
b
ax
e x F =1 ) ( , . 0 , > b a Algoritmul de simulare se dudcce uor, pe baza faptului
c inversa funciei F este
b
u
a
u F
1
1
) 1 ln(
1
) ( |
.
|

\
|
=

.

Exemplul 8.1.5. Ne referim acum la simularea variabilei aleatoare normal
repartizate, mai precis la metoda bazat pe teorema limit central. Conform
acesteia, dac ) , ( ,... ,
2 1
o eN X X X
n
, atunci irul |
.
|

\
|

+
o
=
n
X X n
Z
n
n
...
1

este convergent n repartiie ctre ). 1 , 0 ( N Z e S considerm
2
1
= i
12
1
2
= . Atunci obinem
12
2
...
1
n
n
X X
Z
n
n
+ +
= .
Pentru , 12 = n algoritmul de simulare devine simplu, ntruct
6 ...
12 1
+ + = X X Z
n
.

Exemplul 8.1.6. Generarea variabilelor
2
i Student se bazeaz pe legtura
lor cu repartiia normal standard.


8. 2. Variabile de eantionare

Fenomenele din natur, studiile sociologice au consacrat metoda sondajului.
Problema care se pune este de a determina caracteristica unei populaii format
din N indivizi, prin prisma rezultatelor x
1
, x
2
, ... , x
n
obinute prin n experiene
indepenente. x
i
se numesc valori de eantionare, iar populaia este distribuia
teoretic. Dac populaia este infinit, sau poate fi considerat infinit, singura
metod de cercetare pentru determinarea caracteristicilor distribuiei teoretice
este metoda seleciei (sondajele de opinie). Acelai lucru se realizeaz i pentru
un numr finit de indivizi (controlul antidoping realizat pe un numr mic de
componeni ai unei echipe).

Definiia 8.2.1. O subcolectivitate a unei colectiviti cercetate se numete
selecie sau sondaj. Numrul elementelor seleciei este volumul seleciei.

Definiia 8.2.2. Valorile obinute pentru indivizii care intr n selecie privind
caracteristica X de numesc date de selecie relative la caracteristica X.
Pentru o selecie de volum n vom nota datele de selecie cu x
1
, x
2
, ..., x
n
.
205
Definiia 8.2.3. Datele de selecie x
1
, x
2
, ..., x
n
sunt valorile unor variabile
aleatoare X
1
, X
2
, ..., X
n
, care se vor numi variabile de selecie.
Pe parcursul ntregului capitol vom avea n vedere notaiile menionate
n definiia anterioar.

Definiia 8.2.4. O funcie de variabile de selecie a crei valoare devine
cunoscut cnd variabilele de selecie sunt nlocuite prin valorile de selecie se
numete statistic.

Sondajul este operaia de colectare a elementelor unui eantion din
populaia statistic examinat. Exist sondaje cu revenire (bernoulliene), cnd
elementul extras din populaia considerat este reintrodus n colectiv nainte de
efectuarea unei noi extrageri, sau sondaje fr revenire.
Colectarea elementelor din eantion conduce la realizarea mai multor
tipuri de sondaje. Sondajul pur aleator se obine cand unitile statistice au
aceeai probabilitate de a fi alese din eantion (sunt echiprobabile). Dac se
prestabilete un principiu, se efectueaz un sondaj dirijat. n cazul n care
populaia examinat este mprit n grupuri (straturi) n raport cu o
caracteristic prestabilit, avem un sondaj mixt. Acestea pot fi de mai multe
feluri: sondaje stratificate simple fr revenire, sondaje stratificate (tipice) n
dou faze (se aleg mai nti r straturi din cele deja existente, iar dup aceea se fac
extrageri aleatoare din fiecare strat). Dac din fiecare start tipic se extrage un
numr de uniti ales astfel nct raportul dintre volumul eantionului de strat i
volumul stratului s coincid cu raportul dintre volumul eantionului general i
volumul total al populaiei, se realizeaz un sondaj stratificat proporional. Un
sondaj n care volumul eantionului nu este fixat iniial i prelucrarea continu
pn cnd un anumit eveniment se realizeaz se numete sondaj secvenial.
Cercetarea i perfecionarea metodelor de analiz a datelor experimentale
privind un anumit fenomen depind de volumul eantionului ales. Datele pot fi
ordonate dup anumite criterii, spre exemplu: momentul din timp i locul n care
s-a produs fenomenul frecvena apariiei acestuia.

Definiie 8.2.5. Frecvena absolut
i
n reprezint numrul de apariii ale unui
rezultat n cele n experimente efectuate asupra eantionului, n timp ce frecvena
relativ
i
f este raportul dintre frecvena absolut i volumul eantionului.

Exist trei moduri n care pot fi organizate rezultatele
n
x x x ,..., ,
2 1
ale
msurtorilor. Primul dintre acestea este
n
x x x < < < ...
2 1
, unde , 1 =
i
n
n
f
i
1
= ,
n i , 1 = , n fiind volumul eantionului,
i
n frecvenele absolute ale apariiei
206
valorilor
i
x corespunztoare, iar
i
f sunt frecvenele relative, cel de al doilea ar fi
n
x x x < < < ...
2 1
, 1 =
i
n ,
n
n
f
i
i
= , k i , 1 = .
S presupunem acum c msurtorile pot fi grupate n k intervale de
valori, de lungime egal, fiecrui interval corespunzndu-i un reprezentant
i
x ,
. , 1 k i = n aceast situaie, frecvenele absolute asociate fiecrui interval sunt
egale cu numrul de valori ale caracteristicii msurate n intervalul respectiv.
Apare astfel cel de al treilea tip de serie statistic, i anume
k
x x x ...
2 1
< < < , 1 =
i
n ,
n
n
f
i
i
= , k i , 1 = .
Deosebirea fa de cel de al doilea tip const n faptul c n serie apar
reprezentanii intervalelor.
Fie X caracteristica examinat. Ea poate fi caracterizat prin
, 1 , :
1
=
|
|
.
|

\
|

=
n
i
i
i
i
f
f
x
X
sau prin funcia empiric de repartiie, notat
*
n
F . Pentru seriile din primele dou
categorii, aceasta are forma

+ = < s
<
=

=

1
1
1
1
*
. 1 , 1 , ,
, , 0
) (
i
j
i i j
n
k i x x x f
x x
x F
Pentru ultimul tip, funcia empiric de repartiie este dat de

+ = < s

+
<
=

1
1
1
1
0
*
, 1 , 1 , ,
, , 0
) (
i
j
i i i
i
j
n
k i l x l f
d
l x
f
l x
x F
k fiind numrul intervalelor (
i i
l l ,
1
), iar d lungimea acestor intervale.
Este uor de remarcat faptul c funcia empiric de repartiie este
analogul funciei de repartiie a unei variabile aleatoare discrete finite.
Datorit diversitii mrimilor obinute, i aici sunt necesare analiza i
organizarea datelor. Tendinele de grupare i mprtiere n jurul unei tendine
maxime se msoar cu indicatori care se definesc similar cu cei definii in
capitolul 8, de aceea nu i vom reaminti.

Definiia 8.2.6. Media de selecie (momentul de ordin 1) este definit prin
relaia
.
1
1

=
=
n
j
j n
X
n
X
Dac x
j
reprezint valoarea observat a variabilei X
j
, valoarea numeric a
acestei statistici este
207
.
1
1

=
=
n
j
j n
x
n
x

Definiia 8.2.7. Momentul centrat de selecie de ordinul r este dat de relaia

=
=
n
j
r
j r
X X
n
1
) (
1
,
notaie pe care o vom folosi i pentru valoarea momentului de selecie de ordin
r,
. ) (
1
1
r
n
j
j r
x x
n

=
=
Rezult de aici valoarea dispersiei de selecie,

=
=
n
j
j
x x
n
s
1
2 2
. ) (
1

n paragraful urmtor vom demonstra proprieti privind media de
selecie i dispersia.

Exemplul 8.2.8. S considerm un eantion de 20 de clieni ai unui magazin
alimentar. Ne propunem s studiem frecvena X cu care clienii fac apel la
serviciile magazinului de-a lungul unei sptmni i s cercetm cheltuielile
lunare Y n zeci de lei ale clienilor pentru achiziionarea de produse din
magazinul respectiv. Datele de selecie sunt urmtoarele (n ordinea n care au
fost obinute):
. 103 , 109 , 112 , 108 , 2 , 9 , 96 , 110 , 113 , 121 , 76 , 97 , 86 , 100 , 102 , 77 , 85 , 88 , 101 , 9 , 90 :
; 1 , 2 , 3 , 4 , 2 , 6 , 4 , 3 , 2 , 3 , 2 , 1 , 6 , 5 , 2 , 3 , 4 , 1 , 1 , 2 :
Y
X

Datele de selecie pentru caracteristica X au 6 = n valori distincte, rezultnd,
astfel, pentru aceasta, distribuia empiric
|
|
.
|

\
|
2 1 3 4 6 4
6 5 4 3 2 1
: X .
n cazul lui Y, vom face o grupare a datelor de selecie corespunztoare, n
intervalele | ) 80 , 70 , | ) 90 , 80 , ..., rezultnd, n acest mod, urmtoarea distribuie
empiric
|
|
.
|

\
|
1 3 6 4 4 2
125 115 105 95 85 75
: Y .
Mediile de selecie ale celor dou caracteristici sunt:
( )
( ) . 5 , 98 125 1 115 3 105 6 95 4 85 4 75 2
20
1
85 , 2 6 2 5 1 4 3 3 4 2 6 1 4
20
1
= + + + + + =
= + + + + + =
Y
X

208
Pentru momentele centrate de selecie de ordinul al doilea, obinem:

( + + + = =

=
2 2 2
20
1
2
2
) 85 , 2 3 ( 4 ) 85 , 2 2 ( 6 ) 85 , 2 1 ( 4
20
1
) (
20
1
) (
j
j
X x X
) . 3275 , 2 ) 85 , 2 6 ( 2 ) 85 , 2 5 ( 1 ) 85 , 2 4 ( 3
2 2 2
= + +

( ) (

=
+ + = =
20
1
2 2 2
2
2
) 5 , 98 95 ( 4 ) 5 , 98 85 ( 4 ) 5 , 98 75 ( 2
20
1
20
1
) (
j
k
Y y Y
) . 5 , 182 ) 5 , 98 125 ( 1 ) 5 , 98 115 ( 3 ) 5 , 98 105 ( 6
2 2 2
= + +

Funciile de repartiie de selecie ale celor dou caracteristici sunt:





>
s <
s <
s <
s <
s <
s
=
6 , 1
; 6 5 ,
10
9
; 5 4 ,
20
17
; 4 3 ,
10
7
; 3 2 ,
2
1
; 2 1 ,
5
1
; 1 , 0
) (
*
, 20
x
x
x
x
x
x
x
x F
X
,
respectiv
209

>
s <
s <
s <
s <
s <
s
=
. 6 , 1
; 125 115 ,
20
19
; 115 105 ,
5
4
; 105 95 ,
2
1
; 95 85 ,
10
3
; 85 75 ,
10
1
; 1 , 0
) (
*
, 20
y
y
y
y
y
y
y
y F
Y


Repartiii statistice bidimensionale. Ne ndreptm acum atenia asupra
populaiilor statistice care au dou caracteristici (cantitative sau calitative). S
considerm X i Y caracteristici cantitative ale unei populaii, pentru care s-au
determinat valorile
r
x x x ,..., ,
2 1
, respectiv
s
y y y ,..., ,
2 1
. Fie
ij
n frecvenele
absolute ale cazurilor pentru care
i
x X = i
j
y Y = , , , 1 r i = s j , 1 = . n fiind
momentul seleciei, n mod evident relaia

= =
=
r
i
s
j
ij
n n
1 1
. Frecvenele relative
sunt 1 =
n
f
ij
,

= =
=
r
i
s
j
ij
n f
1 1
, i sunt trecute ntr-un tabel de corelaie, asemntor
unei matrice cu r linii i s coloane.

Definiia 8.2.9. Momentul de selecie de ordinul k n raport cu X i Y este dat de
relaiile:

= = =
= = =
r
i
s
j
r
i
k
i i
k
i ij k
x x f x f m
1 1 1
0 0
,

= = =
= = =
r
i
s
j
r
i
k
i j
k
i ij k
y x f y f m
1 1 1
0 0
,
unde

=
=
s
j
ij i
f f
1
0
i

=
=
r
i
ij i
f f
1
0
.

Definiia 8.2.10. Momentul de selecie de ordin h n raport cu X de ordin k n
raport cu Y se definete prin
210

= =
=
r
i
s
j
k
j
h
i ij hk
y x f m
1 1
.
Momentele centrate
hk
se definesc n mod asemntor.

Definiia 8.2.11. Momentul centrat mixt de ordinul al doilea,

= =
=
r
i
s
j
j i ij
y y x x f
1 1
11
) )( ( ,
reprezint covariana de selecie, n timp ce coeficientul de corelaie este
,
2 1
11
s s

=
2
2
2
1
, s s fiind dispersiile de selecie ale celor dou variabile
individuale. Coeficientul de corelaie reprezint, de fapt, o msur a dependenei
celor dou variabile X i Y.


8.3. Legi de probabilitate ale variabilelor de eantionare

Principiul fundamental al statisticii matematice afirm c frecvena
experimental de apariie a unui eveniment converge ctre frecvena teoretic,
datorat lui Bernoulli.

Teorema 8.3.1. (Bernoulli) Fie
n
a numrul de apariii ale unui eveniment A n
n experimente independente i p probabilitatea de realizare acestui eveniment n
fiecare experien. Dac
n
a
f
n
n
= este frecvena relativ de apariie a acestui
evenimentului, atunci irul ) (
n
f converge n probabilitate ctre p.

Demonstraie
Deoarece
n n
nf a = ,
n
a este o variabil binomial, aadar np a E
n
= ) ( i
). 1 ( ) ( p np a Var
n
= Au loc urmtoarele relaii, avnd n vedere inegalitatea lui
Cebev:
( ) ( )
( ) = > <
= < = <

2 2
1
) (
1 ) (


n
a D
n a M a P
n np a P p f P
n
n n
n n

.
) 1 (
1
2
n
p p
=
De aici rezult c ( ) , 1 lim = c <

p f P
n
n
q.e.d.

211
Aceast teorem permite doar evaluarea direct a probabilitii p de producere a
unui eveniment. Cnd ne referim la o variabil aleatoare, pentru obinerea de
informaii globale trebuie s facem apel la teorema lui Glivenko.

Teorema 8.3.2. Fie F funcia de repartiie a statisticii X, i
*
n
F funcia de
repartiie de selecie corespunztoare unei selecii bernoulliene de volum n,
atunci
. 1 0 ) ( ) ( max lim
*
=
|
.
|

\
|
=

x F x F P
n
x n



Pentru demonstraie, ndrumm cititorul spre lucrarea [11].
Teoremele de convergen arat condiiile n care repartiia statistic
(empiric) tinde ctre cea teoretic. Aceasta din urm nu este cunoscut, de cele
mai multe ori, ea putnd fi apreciat doar cu ajutorul momentelor de diferite
ordine ale variabilei considerate X. n aceast situaie, apare ns problema de a
studia n ce msur diversele momentele de selecie converg ctre momentele
teoretice. Trebuie s precizm c valorile variabilei X rezultate din msurtori
sunt, de asemenea, variabile aleatoare, numite variabile de selecie. Ele depind de
eantionul ales, aadar momentele de selecie devin, la rndul lor, variabile
aleatoare.
Dac X este o variabil aleatoare examinat printr-o selecie de volum n,
obinut printr-un sondaj pur aleator, care are momentele ) (
k
X E i dispersia
) ( X Var , atunci variabilele de selecie
n
X X X ,..., ,
2 1
sunt independente, au
aceeai repartiie ca i variabila iniial X, aceleai momente i aceeai dispersie.

Teorema 8.3.3. Dac repartiia teoretic a unei variabile este normal, de
medie i dispersie
2
o , atunci distribuia mediei de selecie obinut prin
sondaj pur aleator este de asemenea normal.

Demonstraie
Variabilele de selecie sunt independente i normal repartizate. Folosind
notaiile anunate la nceputul paragrafului, media de selecie,

=
=
k
i
i i
X f X
1
,
este o combinaie liniar de variabile repartizate normal, aadar are tot repartiie
normal, parametrii fiind ns urmtorii:


= = =
= = =
|
|
.
|

\
|
=
k
i
k
i
i i
k
i
i i
f X M X f M X M
1 1 1
; ) ( ) (
212

= =
o =
|
|
.
|

\
|
=
k
i
i
k
i
i i
f X f Var X Var
1
2 2
1
) ( , q.e.d.

Observaia 8.3.4. n cazul unei serii statistice din primul tip descris anterior,
dispersia mediei are valoarea
n
2
o
.
Teorema 8.3.5. Fie
j
jn j j
X X X ,..., ,
2 1
, k j , 1 = , selecii independente din
populaii normale ) , (
2
j j
N o i
j
X , , , 1 k j = mediile de selecie. Atunci
variabila

=
=
k
j
j
j
X a Y
1
este de asemenea normal, de parametri
j
k
j
j
a

=1
,
respectiv

=
o
k
j
j
j
j
n
a
1
2
2
.

Demonstraie
Aplicnd teorema precedent, rezult c
|
|
.
|

\
|
o
e
j
j
j j
n
N X
2
, . Variabila Y, fiind
combinaie liniar de variabile normal repartizate, este tot normal repartizat,
calcule asemntoare celor din teorema anterioar conducnd la determinarea
parametrilor si. q.e.d.

Teorema 8.3.6. Dac ) , 0 (
2
o eN X i
n
X X X ,..., ,
2 1
reprezint variabile de
selecie obinute prin sondaj pur aleator, atunci

=
o _ e =
n
i
i
n X Y
1
2 2
). , (

Demonstraie
Considerm
2
i i
X Y = i n i N X
i
, 1 ), , 0 (
2
= o e . Au loc relaiile:
. 0 ), ( ) ( ) ( ) (
2
> < < = < = < = x X x P x X P x Y P x F
i i i Y
i

Deoarece du e x F
x
x
u
Y
i }

t o
=
2
2
2
2
1
) ( i
2
2
2
2
1
) (
o

t o
=
x
Y
e
x
x f
i
, rezult
c ) , (
2
o _ e n Y
i
. Funcia caracteristic a lui Y arat c ea este variabil din
) , (
2
o _ n , q.e.d.
213
Teorema 8.3.7. Fie ( )
t
n
X X X X ,..., ,
2 1
= o selecie obinut prin sondaj pur
aleator dintr-o populaie caracterizat de o repartiie normal redus i
( )
n j i
ij
a A
s s
=
, 1
o martice ortonormal. Atunci variabilele

=
=
n
k
k jk j
X a V
1
,
n j , 1 = , sunt independente i normal repartizate, de parametri 0 i 1.

Demonstraie
Dac
t
n
V V V V ) ,..., , (
2 1
= , deoarece AX V = i matricea A este ortonormal, au
loc relaiile:
.
1
2
1
2

= =
= = = =
n
j
j
n
j
t t t t
j
V X X AX A X V V V
Funcia caracteristic a vectorului V devine, succesiv:
}
[
=

=
t
=
|
|
|
|
.
|

\
|

=
=
n
k k k
n
k
k k
R
n
k
n
x x it
v t i
n V
dx dx e
e E t t t
1
1
2
1
2 1
...
2
1
) ,..., , (
2
1

[ [ [ [
}
= = = =

= = =
t
=
n
k
n
k
n
k
X k X
n
k
k
x x it
t t e dx e
k k
k
t
k
k k
1 1 1 1
2 2
1
). ( ) (
2
1
2
2

Variabilei
j
V i se asociaz funcia caracteristic urmtoare
=
|
|
|
|
.
|

\
|

=
=
n
k
k jk
j
x a it
V
e E t
1
) (
[ [
= =
= =

= =
=
n
k
X
t
a
t
n
k
a t
jk X
t e e e ta
k
n
k
jk
jk
k
1
2
2
1
2
). ( ) (
2
1
2
2 2 2

Acest lucru arat c
j
V sunt normal redus repartizate. Avnd n vedere c
funcia caracteristic a vectorului V este chiar produsul funciilor caracteristice
ale variabilelor componente, rezult c
j
V sunt variabile independente, q.e.d.

Teorema 8.3.8. Dac ( )
t
n
X X X X ,..., ,
2 1
= este o selecie obinut prin sondaj
pur aleator dintr-o populaie caracterizat de o distribuie normal redus,
atunci variabilele:
X n X
n
U
n
i
i
= =

=1
1
,
214
( )

= = =
|
|
.
|

\
|
= =
n
i
n
i
n
i
i i i
X
n
X X X V
1 1
2
1
2
2 1

sunt independente. n plus, ( ) 1 , 0 N U e i ). 1 , 1 (
2
_ e n V

Demonstraie
U este o combinaie liniar de variabile independente identic repartizate,
aadar U este normal repartizat, cu parametrii:
, 0 ) ( = U E
. 1 ) (
1 1
) (
1
= =
|
|
.
|

\
|
=

=
i
n
i
i
X nVar
n
X
n
Var U Var
S considerm acum o matrice ortonormal A, n care , ,
1
1
k
n
a
k
= i
) ,... , (
2 1 n
V V V AX V = = . Avnd n vedere teorema anterioar, ) 1 , 0 ( N V
j
e .
Egalitile

= = = = =
=
|
|
.
|

\
|
=
|
|
.
|

\
|
=
n
j
n
i
n
i
i i
n
i
i
n
i
i j
V X
n
X X
n
X V
2 1
2
1
2
2
1 1
2 2
1 1

conduc la concluzia c ), 1 , 1 (
2
_ e n V q.e.d.

Teorema 8.3.9. Fie ) ,..., , (
2 1 n
X X X X = o selecie obinut prin sondaj pur
aleator, dintr-o populaie normal distribuit, cu parametri i
2
o . Atunci:
), 1 , 0 ( N n
X
U e
o

=
( )

= =
_ e
|
|
.
|

\
|
o

=
o
=
n
i
n
i
i
i
n
X X
X X V
1 1
2
2
2
2
). 1 , 1 (
1


Demonstraie
Notnd , , 1 , n i
X
Y
i
i
=
o

= rezult c ) 1 , 0 ( N Y
i
e . Concluzia rezult
uor, verificnd condiiile din teorema anterioar prin intermediul variabilelor
ajuttoare abia introduse, q.e.d.

215
Capitolul 9


Teoria estimaiei


9.1. Estimatori nedeplasai

S considerm o variabil aleatoare X a crei lege de probabilitate conine
un parametru . Fie
n
X X ..., ,
1
variabile aleatoare independente care au aceeai
distribuie ca i X.
Alegem o anumit funcie ( )
n
X X t ..., ,
1
pe care o vom utiliza ca estimator
al lui ; cu alte cuvinte, dac dispunem de valorile
n
x x ..., ,
1
obinute
experimental, numrul ( )
n
x x t ..., ,
1
va fi considerat ca estimator al parametrului .

Definiia 9.1.1. ( )
n
X X t ..., ,
1
se numete estimator nedeplasat al parametrului
dac media lui ( )
n
X X t ..., ,
1
este egal cu pentru orice valoare posibil a lui .

Exemplul 9.1.2. Fie media lui X. Atunci
( ) ( )
n n
X X
n
X X t + + = ...
1
..., ,
1 1

este un estimator nedeplasat al lui , fiindc n mod clar media variabilei
aleatoare
( )
n
X X
n
+ +...
1
1
este egal cu ( ) = + +...
1
n
.

Exemplul 9.1.3. Fie media lui X i
2
dispersia lui X. Pentru un n fixat, notm
( ) . ...
1
1 n
X X
n
X + + =
Am vzut n exemplul anterior c X este un estimator nedeplasat al mediei
. n calitate de estimator al dispersiei lui X putem alege pe
( )
2 2 2
1
2
...
1
X X X
n
S
n
+ + = .
Un calcul algebric elementar ne convinge c media variabilei aleatoare
2
S
este egal cu
2
1

n
n
. Aceasta arat c
2
S nu este estimator nedeplasat; deducem
ns imediat c media lui
2
1
S
n
n


216
este egal cu
2
, deci
2
1
S
n
n

este estimator nedeplasat pentru dispersia


2
.
Cu alte cuvinte, dac dispunem de valorile experimentale
n
x x ..., ,
1
vom estima
dispersia
2
prin
.
... ...
1
2
1
2 2
1
|
|
.
|

\
|
|
.
|

\
| + +

+ +
n
x x
n
x x
n
n
n n



9.2. Estimatori de maxim verosimilitate

Fie ( ) ; x f densitatea de probabilitate a unei variabile aleatoare X, n care
este parametrul care urmeaz s fie estimat. S presupunem c avem la
dispoziie valorile experimentale ( )
n
x x ..., ,
1
ale lui X, obinute n urma unei
selecii de volum n.

Definiia 9.2.1. Funcia
( ) ( ) ( ) ; ... ; ; ..., ,
1 1 n n
x f x f x x L =
se numete funcia de verosimilitate.

Definiia 9.2.2. Un estimator de maxim verosimilitate este un estimator care
maximizeaz pe L ca funcie de .

Exemplul 9.2.3. S considerm densitatea exponenial
( )

s
>
=

. 0 , 0
; 0 ,
;
x
x e
x f
x


Funcia de verosimilitate este
( )
n n
x x
n
x x
e e e L
+ +
= =
...
1 1
...

.
Derivata lui L ca funcie de este egal cu
( )
( ) ( ) . ...
1
...
1 1


n
x x
n
x x n e
n
+ +
+ +


Deducem imediat c L i atinge maximumul pentru
.
...
1 n
x x
n
+ +
=
Aadar, estimatorul de maxim verosimilitate al parametrului din legea
exponenial este
.
...
1 n
X X
n
+ +


217
Exemplul 9.2.4. S considerm variabila X cu densitatea uniform
( )

s s
=
. rest in , 0
; 0 ,
1
;

x
x f

innd seama de natura acestei variabile, valorile experimentale ( )
n
x x ..., ,
1

satisfac condiia n i x
i
.., . , 1 , 0 = s s .
Funcia de verosimilitate este
( ) .
1
; ..., ,
1
n
n
x x L

=
Valoarea ei este cu att mai mare, cu ct este mai mic. Datorit
condiiilor impuse, cea mai mic valoare posibil a lui este { }
n
x x ..., , max
1
.
Prin urmare, estimatorul de maxim verosimilitate este { }
n
X X ..., , max
1
.

Exemplul 9.2.5. S considerm variabila aleatoare X cu densitatea
( )
( )

s s +
=
. rest in , 0
; 1 0 , 1
;
x x
x f


Funcia de verosimilitate este
( ) ( ) ( ) . ... 1 ; ..., ,
1 1


n
n
n
x x x x L + =
Derivata lui L ca funcie de este egal cu
( ) ( ) ( ) ( ) ( ) . ... ln 1 ... 1
1 1
1
n n
n
x x n x x

+ + +


Funcia L i atinge maximumul pentru
, 1
ln ... ln
1

+ +
=
n
x x
n

deci estimatorul de maxim verosimilitate este n acest caz
. 1
ln ... ln
1

+ +

n
X X
n


Exemplul 9.2.6. Fie X o variabil normal cu densitatea
( )
( )
.
2
1
;
2 /
2


=
x
e x f
Funcia de verosimilitate este
218
( )
( ) ( ) | |
.
2
1 2 / ...
2 2
1

+ +
=
n
x x
n
e L
Se constat imediat c ea i atinge maximumul pentru
.
...
1
n
x x
n
+ +
=
Deci, estimatorul de maxim verosimilitate este
.
...
1
n
X X
n
+ +

S observm c coincide cu media variabilei X, deci, estimatorul de
maxim verosimilitate este tocmai estimatorul nedeplasat despre care a fost
vorba n Exemplul 9.1.2.

Exemplul 9.2.7. S considerm o variabil normal X cu densitatea
( ) .
2
1
;
2 2
2 /

x
e x f

=
Funcia de verosimilitate este acum
( )
( )
.
1
2
1
2 2 2
1
2 / ...

n
x x
n n
e L
+ +
=
Ea i atinge maximumul pentru
( ) , ...
1
2 / 1
2 2
1
|
.
|

\
|
+ + =
n
x x
n

deci, estimatorul de maxim verosimilitate este n acest caz
( ) . ...
1
2 / 1
2 2
1
|
.
|

\
|
+ +
n
X X
n

219
Capitolul 10


Estimarea prin interval de ncredere


Introducere

Estimaia punctual a unui parametru u, necunoscut la nivelul unei
populaii, dei constituie o informaie n legtur cu acesta, nu poate fi utilizat
fr a avea o imagine i asupra mrimii probabilistice a erorii de estimare. Apare
astfel necesitatea estimrii unui parametru prin aa numitul, interval de ncredere.
n capitolul de fa vom prezenta forma general a intervalului de ncredere,
expresia intervalului de ncredere pentru medie inclusiv cazul particular al unei
proporii, interval de ncredere pentru diferena a dou medii, interval de
ncredere pentru dispersie i respectiv interval de ncredere pentru raportul a
dou dispersii. Pe tot parcursul capitolului va fi prezentat doar cazul cnd
eantionul se formeaz pe baza unei selecii simple aleatoare format prin
extrageri independente.


10.1. Forma general a intervalului de ncredere

Fie o populaie statistic A, variabila statistic X studiat prin intermediul
unei selecii simple de volum n, format prin extrageri independente,
( )
n
X X X ,..., ,
2 1
i un parametru necunoscut u asociat variabilei X, pentru care se
obine pe baza seleciei estimatorul ( )
n
X X X ,..., ,
2 1
u , avnd densitatea de
probabilitate ( ) u f .

Definiia 10.1.1. Se numete interval de ncredere pentru parametrul
necunoscut , cu nivelul de semnificaie ( ) 1 , 0 e o , intervalul

( ) ( ) ( ) ( )) ,..., , ,..., (
1 2 1 1 n n
X X h X X h u u (10.1.1)

susceptibil de a conine valoarea lui u cu o probabilitate ( ) o 1 , unde
( ) ( ) ( )
n
X X h h ,...,
1 1 1
u u = i ( ) ( ) ( )
n
X X h h ,...,
1 2 2
u u = rezult din legea de
probabilitate dat prin ( ) u f .

220
Dup observarea statistic a eantionului (seleciei), cele dou limite ale
intervalului mai sus menionat pot fi determinate numeric. Intervalul care
ncadreaz parametrul u are proprietatea c acoper valoarea u n ( ) o 1 100 din
cazuri. Cu ct nivelul de semnificaie o este mai mic cu att u are anse mai
mari de a se afla n acel interval (de regul 05 , 0 s o ). Probabilitatea o 1 este
probabilitatea de garantare a intervalului, valorile acceptate fiind de regul peste
0,95.

Observaia 10.1.2. Obinerea celor dou limite ale intervalului se realizeaz
pornind de la faptul c pentru ( )
n
X X X ,..., ,
2 1
u (sau pentru o alt variabil
aleatoare de lege de probabilitate cunoscut a crei expresie l conine pe u) se
pot determina pe baza legii de probabilitate cunoscute, dou valori particulare
( ) u
1
a i ( ) u
2
a astfel nct s aib loc relaia:

o u u u u u
u
u
= = < <
}
1 ) ( )) ( ) ( (
) (
) (
2 1
2
1
a
a
d f a a P , (10.1.2)

formul ce se poate scrie, prin artificii matematice, astfel:

o u u u u u
u
u
= = < <
}
1 ) ( ))) ,... ( ( )) ...., ( ( (
) (
) (
1 2 1 1
2
1
a
a
n n
d f X X h X X h P . (10.1.3)
.
Observaia 10.1.3. Dac estimatorul u este un estimator centrat (nedeplasat),
deci ( ) u u = E intervalul de ncredere este simetric n raport cu u , vom avea
( ) u u u A =
1
h i ( ) u u u A + =
2
h unde u A reprezint eroarea limit de
estimare sub form absolut. Astfel intervalul de ncredere se poate scrie:

o u u u u u u u
u
u
= = A + < < A
}
1 ) ( ) (
) (
) (
2
1
a
a
d f P (10.1.4)

unde u A este de obicei proporional cu dispersia estimatorului, prin urmare se
scrie de forma
u
o u = A z
.


Probabilitatea o 1 i eroarea limit constituie mpreun o msur a
preciziei estimrii parametrului u prin ( )
n
X X ,...,
1
u . De regul acestea se
fixeaz apriori, astfel:

% 5 100 s
A
=
u
u
u
R i % 5 s o . (10.1.5)

221
Pe baza acestor parametri ai peciziei va rezulta dimensiunea eantionului prin
care se asigur precizia dorit, folosind n acest scop formula
u
o u = A z n
care se va vedea c dispersia estimatorului
u
o depinde i de volumul n al
seleciei, iar z depinde de nivelul de semnificaie stabilit i de legea de
probabilitate implicat.


10.2. Interval de ncredere pentru medie

Vom considera n cele ce urmeaz, cazul cnd parametrul necunoscut u
pe care dorim s-l estimm prin interval de ncredere este media unei variabile
aleatoare.

Propoziia 10.2.1. Intervalul de ncredere pentru media unei variabile X ce
urmeaz legea normal ( )
2
,o N cu IR e necunoscut i 0
2
> o cunoscut
este de forma ) , (
2
1
2
1
n
z X
n
z X
o o
o o
+

, cu

o
o

o
o o
= + < <

1 ) (
2
1
2
1
n
z X
n
z X P (10.2.1)

unde
n
X X X
X
n
+ + +
=
...
2 1
este media de selecie corespunztoare unui
eantion obinut prin extrageri aleatoare independente, ( ) 1 , 0 e o este nivelul de
semnificaie iar
2
1
o

z este cuantila de ordin


2
1
o
a repartiiei normale standard
dat prin funcia de repartiie (funcia integral Laplace - Gauss),
( ) dt e x
x t
}

=
2
2
2
1
t
| .

Demonstraie
ntruct ( )
2
,o N X e , iar media de selecie este de forma
n
X X X
X
n
+ + +
=
...
2 1
, extragerile fiind independente, urmeaz c
|
|
.
|

\
|
e
n
N X
2
,
o
i mai departe, avem c variabila

222
n
X
Z
o

=

urmeaz legea normal standard (centrat i redus), ( ) 1 , 0 N . n consecin, fiind
dat un prag de semnificaie 05 , 0 s o , vom gsi dou numere
1
z i
2
z astfel
nct:

o | |
t
o

= = = <

<
}

1 ) ( ) (
2
1
) (
1 2
2
2 1
2
1
2
z z dt e z
n
X
z P
z
z
t


unde | este funcia de repartiie a legii normale standard, Laplace-Gauss,
( ) dt e x
x t
}

=
2
2
2
1
t
| , ale crei valori sunt tabelate. Mai departe, prin artificii de
calcul folosind probabilitatea unor evenimente echivalente, avem c:

o | |
t
o

o
= = = < <
}

1 ) ( ) (
2
1
) (
1 2
2
1 2
2
1
2
z z dt e
n
z X
n
z X P
z
z
t
.

Pentru o fixat, se pot determina o infinitate de numere
1
z i
2
z , astfel nct
o | | = 1 ) ( ) (
1 2
z z , ns pentru o precizie ct mai bun a intervalului de
ncredere, ne va interesa un interval de lungime minim, ori acesta se obine
pentru cazul cnd
2 1
z z = , prin urmare, avem

o | |
t
o

o
= = = + < <
}

1 ) ( ) (
2
1
) (
2 2
2
2 2
2
2
2
z z dt e
n
z X
n
z X P
z
z
t
.

n acest caz
2
z se determin din relaia o | | = 1 ) ( ) (
2 2
z z cu
) ( 1 ) (
2 2
z z | | = , adic
2
1 ) (
2
o
| = z , ceea ce nseamn c
2
1
2 o

= z z este
cunatila de ordin
2
1
o
, a repartiiei normale standard.
Prin urmare, intervalul este dat prin formula

o
o

o
o o
= + < <

1 ) (
2
1
2
1
n
z X
n
z X P . q.e.d.

223
Observaia 10.2.2. Valorile funciei de repartiie Laplace - Gauss,
( ) dt e x
x t
}

=
2
2
2
1
t
| sunt tabelate, adic pentru probabilitatea auxiliar
2
1
o
,
vom gsi n tabel valoarea cuantilei
2
1
2 o

= z z ns exist i tabele, care prezint


valorile funciei ( ) dt e x
x t
}

=
0
2
2
2
1 ~
t
| , 0 > x , caz n care
2
z este
corespunztoare valorii
2
1 o
.
Observaia 10.2.3. Folosind notaia:
n
z X
o
o
= A

2
1
, se poate scrie intervalul
de ncredere ca un caz particular al formulei (10.1.4), ( X fiind estimator
nedeplasat) i anume:

o = A + < < A 1 ) ( X X X X P .

Determinarea efectiv a celor dou limite presupune cunoaterea expresiei
matematice a estimatorului X i a erorii medii ptratice de estimare
X
o , fiecare
variind de la un tip de sondaj la altul, aici fiind prezentat doar cazul unui sondaj
aleator simplu cu extrageri independente. Cu ct lungimea X A a intervalul de
ncredere, respectiv nivelul de semnificaie o sunt mai mici, cu att estimaia
parametrului necunoscut este mai bun.

Observaia 10.2.4. Pentru selecii de volum mare, intervalul de ncredere pentru
medie, precizat n Propoziia 10.2.1 este valabil i pentru cazul n care
variabila X urmeaz o lege oarecare de probabilitate, datorit Teoremei limit
central.

Exemplul 10.2.5. S presupunem c dispunem de valorile unei variabile
( )
2
2 , N X e , obinute printr-o selecie simpl cu extrageri independente, de
volum 25 i de medie 55 = x , obiectivul fiind acela de a estima media la nivelul
populaiei, , necunoscut, printr-un interval de ncredere de 95%.

Soluie
ntruct 05 , 0 = o , obinem din Anexa 1, 96 , 1
2
1
=

o
z i mai departe,
pentru 95% din cazuri,

25
2
96 , 1 55
25
2
96 , 1 55 + < < .
224

Prin urmare, n 95% din cazuri, intervalul (54,216 - 55,784) va acoperi valoarea
necunoscut a parametrului .

Propoziia 10.2.6. Intervalul de ncredere de tip o 1 , pentru media unei
variabile X ce urmeaz legea normal ( )
2
,o N cu IR e necunoscut i
0
2
> o necunoscut este de forma ) , (
2
1 , 1
2
1 , 1
n
s
t X
n
s
t X
n n
+

o o
, cu

o
o o
= + < <

1 ) (
2
1 , 1
2
1 , 1
n
s
t X
n
s
t X P
n n
(10.2.2)

unde
n
X X X
X
n
+ + +
=
...
2 1
este media de selecie corespunztoare unui
eantion obinut prin extrageri aleatoare independente,
( ) ( ) ( )
1
...
2 2
2
2
1 2

+ + +
=
n
X X X X X X
s
n
este estimaia absolut corect a lui
2
o , ( ) 1 , 0 e o este nivelul de semnificaie iar
2
1 , 1
o
n
t este cuantila de ordin
2
1
o
a repartiiei Student cu n-1 grade de libertate.

Demonstraie
Conform legilor de probabilitate ale variabilelor de eantionare, atunci
cnd ( )
2
,o N x e , variabila
n
s
X
T

= urmeaz legea Student cu n-1 grade de
libertate, ntruct se obine ca raport ntre dou variabile independente, o
variabil ce urmeaz legea normal standard i radicalul unei alte variabile de tip
2
_ raportat la numrul gradelor de libertate. Procednd ca n cazul cnd
2
o
este cunoscut se obine intervalul de ncredere corespunztor. q.e.d.

Exemplul 10.2.7. S considerm estimarea printr-un interval de ncredere de
tip 98%, a notei medii de repartiie normal, pornind de la urmtoarele date: 5,
10, 7, 6, 9, 8.

Soluie
ntruct 02 , 0 = o , 6 = n , obinem din Anexa 2, 365 , 3
2
1 , 1
=

o
n
t . Pe baza
seleciei avem 5 , 7 = x , 87 , 1 = s i mai departe, n 98% din cazuri,

225
6
87 , 1
365 , 3 5 , 7
6
87 , 1
365 , 3 5 , 7 + < < .

Prin urmare, n 98% din cazuri, intervalul (4,93 - 10) va acoperi valoarea
necunoscut a parametrului .

Observaia 10.2.8. Pentru selecii de volum mare, diferena ntre valorile
cuantilelor repartiiei Student i cele ale repartiiei normale standard este
neglijabil. De asemenea este neglijabil i diferena dintre estimatorul absolut
corect
( ) ( ) ( )
1
...
2 2
2
2
1 2

+ + +
=
n
X X X X X X
s
n
i estimatorul
( ) ( ) ( )
n
X X X X X X
n
2 2
2
2
1
2
... + + +
= , prin urmare, se poate utiliza
formula (10.2.1) cu
2
o nlocuit de
2
.

Propoziia 10.2.9. Pentru selecii de volum mare, intervalul de ncredere de tip
o 1 , pentru media unei variabile X ce urmeaz legea Bernoulli de parametru
necunsocut p este de forma

( ) ( )
)
1
,
1
(
2
1
2
1
n
p p
z p
n
p p
z p

+



o o
(10.2.3)

unde
n
X X X
p
n
+ + +
=
...

2 1
este media de selecie corespunztoare unui
eantion obinut prin extrageri aleatoare independente, ( ) 1 , 0 e o este nivelul de
semnificaie iar
2
1
o

z este cuantila de ordin


2
1
o
a repartiiei normale standard.

Demonstraie
Media unei variabile aleatoare ce urmeaz legea Bernoulli de parametru
necunoscut p, are pentru selecii de volum mare, conform Observaiei 10.2.4, o
repartiie aproximativ normal cu media egal cu p i abaterea medie ptratic
aproximativ egal cu
( )
n
p p 1
, prin urmare aplicnd Propoziia 10.2.1 se
obine intervalul dorit. q.e.d.

O astfel de medie exprim de fapt proporia p de indivizi dintr-o
populaie care au o anumit caracteristic i este tratat ca media unei variabile X
cu valorile 0 i 1, prin valoarea 1 notnd valoarea variabilei X pentru indivizii
care au aceast caracteristic.
226
Exemplul 10.2.10. La un sondaj electoral, 40 din 100 de persoane chestionate s-
au pronunat n favoarea unui candidat, scopul fiind determinarea unui interval
de ncredere de tip 95% pentru procentul de alegtori favorabil acelui candidat.

Soluie
n 95% din cazuri intervalul va fi
100
6 , 0 4 , 0
96 , 1
100
40
100
6 , 0 4 , 0
96 , 1
100
40
+ < <

p , adic (0,304- 0,496), prin


urmare n 95% din cazuri, procentul favorabil candidatului va fi aproximativ
ntre 30% i 50%.


10.3. Interval de ncredere pentru diferena a dou medii

Vom considera n cele ce urmeaz problema determinrii intervalelor de
ncredere pentru diferena a dou medii, util n cazul n care dorim s avem o
informaie privind diferena de comportament a unei variabile, de la o populaie
la alta.

Propoziia 10.3.1. Fie dou populaii studiate n raport cu variabila X, pentru
prima populaie variabila fiind de tipul ( )
2
1 1
,o N iar pentru a doua, de tipul
( )
2
2 2
,o N , cu
2 1
, necunoscute, respectiv
2
2
2
1
,o o cunoscute. Fie de
asemenea dou selecii bazate pe extrageri independente de volume
1
n i
respectiv
2
n , din cele dou populaii, cu mediile de selecie
2 1
, X X . Pentru un
nivel de semnificaie, ( ) 1 , 0 e o , intervalul de ncredere pentru diferena celor
dou medii este de forma

2
2
2
1
2
1
2
1
2 1 2 1
2
2
2
1
2
1
2
1
2 1
n n
z X X
n n
z X X
o o

o o
o o
+ + < < +

(10.3.1)

unde
2
1
o

z este cuantila de ordin


2
1
o
a repartiiei normale standard.
Demonstraie
Variabila aleatoare
( ) ( )
2
2
2
1
2
1
2 1 2 1
n n
X X
Z
o o

+

= urmeaz legea normal
standard. q.e.d.

Exemplul 10.3.2. Vom determina intervalul de ncredere de tip 95% pentru
diferena mediilor unei variabile n dou populaii diferite n care se presupune
227
c repartiiile variabilei sunt normale, de medii necunoscute
1
respectiv
2
i
dispersii cunoscute
2 2
2
2 2
1
3 , 2 = = o o , pornind de la seleciile de volum 7
1
= n
i respectiv 8
2
= n , de medie, 22
1
= x i respectiv, 20
2
= x .

Soluie
n 95% din cazuri intervalul va fi

|
|
.
|

\
|
+ + < < +
8
9
7
4
96 , 1 ) 20 22 (
8
9
7
4
96 , 1 ) 20 22 (
2 1
.

Propoziia 10.3.3. Fie dou populaii studiate n raport cu variabila X, pentru
prima populaie variabila fiind de tipul ( )
2
1 1
,o N iar pentru a doua, de tipul
( )
2
2 2
,o N , cu
2 1
, necunoscute, respectiv
2
2
2
1
,o o necunoscute dar egale.
Fie de asemenea dou selecii bazate pe extrageri independente de volume
1
n i
respectiv
2
n , din cele dou populaii cu mediile de selecie
2 1
, X X i estimatorii
absolut coreci ai dispersiilor,
2
2
2
1
, s s . Pentru un nivel de semnificaie,
( ) 1 , 0 e o , intervalul de ncredere pentru diferena celor dou medii este de
forma

2 1 2
1 ,
2 1 2 1
2 1 2
1 ,
2 1
1 1 1 1
n n
S t X X
n n
S t X X + + < < +

o

(10.3.2)

unde
2
1 ,
o

t este cuantila de ordin
2
1
o
a repartiiei Student cu 2
2 1
+ = n n
grade de libertate iar
( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
S .

Demonstraie
Variabila aleatoare
( ) ( )
2 1
2 1 2 1
1 1
n n
S
X X
T
+

=

urmeaz legea Student cu
2
2 1
+ n n grade de libertate. q.e.d.

Exemplul 10.3.4. n vederea comparrii comportamentului unei variabile n
dou populaii normale, avnd aceeai dispersie, se pune problema determinrii
unui interval de ncredere de tip 95% pentru diferena mediilor variabilei n cele
228
dou populaii, pornind de la dou seturi de date de volum 10 i 12 cu mediile
5 , 2
1
= x i 2
2
= x , respectiv 22 , 0 i 2 , 0
2
2
2
1
= = s s .

Soluie
n 95% din cazuri intervalul va fi

|
|
.
|

\
|
+ < < +

12
1
10
1
) 2 5 , 2 (
12
1
10
1
) 2 5 , 2 (
2
1 ,
2 1
2
1 ,
S t S t
o

,

cu 086 , 2
975 . 0 , 20
2
1 ,
= =

t t
o

i
( ) ( )
2 12 10
22 , 0 1 12 2 , 0 1 10
2
+
+
= S .

Propoziia 10.3.5. Fie dou populaii studiate n raport cu variabila X, pentru
prima populaie variabila fiind de tipul ( )
2
1 1
,o N iar pentru a doua, de tipul
( )
2
2 2
,o N , cu
2 1
, necunoscute, respectiv
2
2
2
1
,o o necunoscute i diferite.
Fie de asemenea dou selecii bazate pe extrageri independente de volume
1
n i
respectiv
2
n , din cele dou populaii cu mediile de selecie
2 1
, X X i estimatorii
absolut coreci ai dispersiilor,
2
2
2
1
, s s . Pentru un nivel de semnificaie,
( ) 1 , 0 e o , intervalul de ncredere pentru diferena celor dou medii este de
forma

2
2
2
1
2
1
2
1 ,
2 1 2 1
2
2
2
1
2
1
2
1 ,
2 1
n
s
n
s
t X X
n
s
n
s
t X X + + < < +

o

(10.3.3)

unde
2
1 ,
o

t este cuantila de ordin
2
1
o
a repartiiei Student cu grade de
libertate unde
( )
1
1
1
1
2
2
1
2

=
n
c
n
c

iar
1 1
1
2
2
2
1
2
1
1
2
1

=
n
s
n
s
n
s
c .

Demonstraie
Variabila aleatoare
( ) ( )
2
2
2
1
2
1
2 1 2 1
n
s
n
s
X X
T
+

=

urmeaz legea Student cu
grade de libertate. q.e.d.

229
Exemplul 10.3.6. n vederea comparrii comportamentului unei variabile n
dou populaii normale, avnd dispersii diferite, se pune problema determinrii
unui interval de ncredere de tip 95% pentru diferena mediilor variabilei n cele
dou populaii, pornind de la dou seturi de date de volum 10 i 12 cu mediile
5 , 2
1
= x i 2
2
= x , respectiv 22 , 0 i 2 , 0
2
2
2
1
= = s s .

Soluie
n 95% din cazuri intervalul va fi

|
|
.
|

\
|
+ < < +

12
22 , 0
10
2 , 0
) 2 5 , 2 (
12
22 , 0
10
2 , 0
) 2 5 , 2 (
2
1 ,
2 1
2
1 ,
S t t
o

,

cu
2
1 ,
o

t determinat din Anexa 2, pentru 975 , 0
2
1 =
o
i determinat din
relaia
( )
11
1
9
1
2 2
c c
+ =

cu
11
22 , 0
9
2 , 0
9
2 , 0
+
= c .

Observaia 10.3.7. Dac volumul seleciilor este mare, se poate considera c
variabilele aleatoare utilizate n Propoziia 10.3.3 i Propoziia 10.3.5 au
repartiia normal, folosindu-se astfel formula (10.3.1) n care
2
2
2
1
,o o se
estimeaz prin momentele centrate de ordin 2, corespunztoare celor dou
selecii. De asemenea, pentru selecii mari, formula (10.3.1) se poate utiliza i
pentru populaii n care repartiia variabilei nu este normal.


10.4. Interval de ncredere pentru dispersie i raportul a dou
dispersii

Un alt parametru care se poate estima prin interval de ncredere este
dispersia (variana) unei variabile. De asemenea, dup cum s-a putut observa n
paragraful anterior, pentru a obine estimaii privind diferena a dou medii este
util s avem informaii despre raportul dintre dispersiile corespunztoare, atunci
cnd ele nu se cunosc, aspecte ce vor fi prezentate n acest paragraf.

Propoziia 10.4.1. Intervalul de ncredere de tip o 1 , pentru dispersia unei
variabile X ce urmeaz legea normal ( )
2
,o N cu IR e necunoscut i
0
2
> o necunoscut este de forma

230
2
2
, 1
2
2
2
2
1 , 1
2
o o
_
o
_

< <

n n
s n s n
(10.4.1)

unde

( ) ( ) ( )
1
...
2 2
2
2
1 2

+ + +
=
n
X X X X X X
s
n


este estimaia absolut corect a lui
2
o pentru o selecie de volum n, bazat pe
extrageri independente, ( ) 1 , 0 e o este nivelul de semnificaie iar
2
2
1 , 1
o
_
n
i
2
2
, 1
o
_
n
sunt cuantilele de ordin
2
1
o
i
2
o
ale repartiiei
2
_ cu n-1 grade de
libertate.

Demonstraie
ntruct, conform legilor de probabilitate ale variabilelor de eantionare,
cum o sum de ptrate de n variabile aleatoare independente, de medie 0 i
repartiie normal are o repartiie de tip
2
_ cu n-1 grade de libertate, avem c
variabila
( )
2
2
2
1
o
s n
= X urmeaz legea
2
_ cu n-1 grade de libertate, prin
urmare pentru un nivel de semnificaie o , gsim dou numere
2
1
_ i
2
2
_ , astfel
nct ( ) o _ _ = < X < 1
2
2
2 2
1
P . Dac alegem
2
2
, 1
2
1 o
_ _

=
n
i
2
2
1 , 1
2
2 o
_ _

=
n

cuantilele de ordin
2
1
o
i
2
o
ale repartiiei
2
_ cu n-1 grade de libertate,
obinem
( )
2
2
1 , 1
2
2
2
2
, 1
1
o o
_
o
_

<

<
n n
s n
, de unde prin artificii de calcul, rezult
intervalul dorit. q.e.d.

Exemplul 10.4.2. n vederea estimrii variabilitii unui instrument de
msurare, se pune problema determinrii unui interval de ncredere de tip 98%
pentru
2
o pornind de la 5 msurtori independente presupuse ca fiind extrase
dintr-o repartiie normal, pentru care s-a calculat 2
2
= s .






231
Soluie
n 98% din cazuri intervalul va fi
2
01 . 0 , 4
2
2
99 . 0 , 4
2 5 2 5
_
o
_

< <

, unde
28 , 13
2
99 . 0 , 4
= _ i 297 , 0
2
01 . 0 , 4
= _ rezult din Anexa 3, cu valorile tabelate ale legii
2
_ .

Propoziia 10.4.3. Fie dou populaii studiate n raport cu variabila X, pentru
prima populaie variabila fiind de tipul ( )
2
1 1
,o N iar pentru a doua, de tipul
( )
2
2 2
,o N , cu
2 1
, necunoscute, respectiv
2
2
2
1
,o o necunoscute. Fie de
asemenea dou selecii bazate pe extrageri independente de volume
1
n i
respectiv
2
n , din cele dou populaii cu mediile de selecie
2 1
, X X i estimatorii
absolut coreci ai dispersiilor,
2
2
2
1
, s s . Pentru un nivel de semnificaie,
( ) 1 , 0 e o , intervalul de ncredere pentru raportul celor dou dispersii va fi

2
2
2
1
2
, 1 , 1
2
2
2
1
2
2
2
1
2
1 , 1 , 1
2 1 2 1
1 1
s
s
f s
s
f
n n n n
< <

o o
o
o
(10.4.2)

unde
2
1 , 1 , 1
2 1
o
n n
f i
2
, 1 , 1
2 1
o
n n
f sunt cuantilele de ordin
2
1
o
i
2
o
ale
repartiiei Fisher-Snedecor cu 1
1
n i 1
2
n grade de libertate.

Demonstraie
Cum raportul a dou variabile de tip
2
_ este o variabil de tip Fisher,
avem c variabila
2
2
2
2
2
1
2
1
o
o
s
s
F = urmeaz legea Fisher cu 1
1
n i 1
2
n grade de
libertate i raionand ca n propoziia anterioar, se obine intervalul dorit. q.e.d.

Exemplul 10.4.4. n vederea comparrii comportamentului unei variabile n
dou populaii normale, se pune mai nti problema determinrii unui interval
de ncredere de tip 95% pentru raportul dispersiilor n cele dou populaii,
pornind de la dou seturi de date fiecare de volum 10 i 12 cu
22 , 0 i 2 , 0
2
2
2
1
= = s s .



232
Soluie
n 95% din cazuri intervalul este
22 , 0
2 , 0 1
22 , 0
2 , 0 1
025 . 0 , 11 , 9
2
2
2
1
975 . 0 , 11 , 9
< <
f f
o
o
,

cu 59 , 3
975 . 0 , 11 , 9
= f determinat din Anexa 4, cu valorile tabelate ale legii Fisher
i 278 , 0
1
975 . 0 , 11 , 9
025 . 0 , 11 , 9
= =
f
f .

233

Capitolul 11


Teoria deciziei

11.1. Decizii empirice

n viaa de zi cu zi suntem nevoii s lum decizii importante sau mai puin
importante, la fiecare pas. Cnd traversm strada printr-un loc nepermis, culegem n
mod empiric cteva informaii (distana pn la cel mai apropiat vehicul, viteza cu
care se apropie de noi, etc.), apoi lum decizia de a traversa. De fiecare dat ne
asumm riscul ca decizia s fie greit, i uneori, decizia chiar este greit.


11.2. Decizii statistice

Firma de automobile F trebuie s cumpere o mare cantitate de anvelope i
are de ales ntre mrcile A1 i A2. nainte de a lua o decizie, firma testeaz n
anvelope de tip A1 i n anvelope de tip A2. Avnd la dispoziie msurtorile care
rezult n urma testrilor, firma decide c anvelopele A1 sunt superioare. Aceast
decizie se bazeaz pe testarea unui numr n de anvelope, care prin fora
lucrurilor este mic n raport cu numrul mare de anvelope care vor fi
cumprate. Prin urmare, exist riscul ca decizia s fie greit.

Poate fi msurat acest risc?

Triumful teoriei statistice a deciziilor const tocmai n posibilitatea de a
msura gradul de risc n termenii unor probabiliti obiective. Prelucrnd statistic
rezultatele numerice ale msurtorilor, statisticienii firmei F pot comunica
managerului c probabilitatea ca decizia s fie greit este mai mic dect, s zicem,
0.05. Tinnd seama de toi factorii implicai, managerul poate decide c riscul este
acceptabil. Dac probabilitatea ca decizia s fie greit este prea mare, managerul
poate cere teste suplimentare, sau poate lua n considerare parametrii suplimentari.
Cnd decidem s traversm strada printr-un loc nepermis, actionm pe baza
unor probabiliti subiective, i deci gradul de risc este apreciat n mod subiectiv.
Cnd avem la dispoziie rezultatele numerice ale unor experimente, teoria
statistic a deciziilor ne permite s msuram gradul de risc asociat unei decizii n
termenii unor probabiliti obiective.
234
n cele ce urmeaz, vom prezenta anumite metode de a calcula astfel de
probabiliti obiective i implicit de a aprecia gradul de risc asociat unei
decizii. Metode de acest tip vor fi aplicate la testarea irurilor binare cu scopul de
a decide dac sunt aleatoare.


11.3. Ipoteze statistice

ntr-o accepiune larg, prin ipotez statistic nelegem o ipotez asupra
unui fenomen aleator. Putem formula, de exemplu, ipoteza asupra naturii
distribuiei unei variabile aleatoare: normal, binomial, Poisson etc. Sau, dac
natura distribuiei este precizat, putem formula ipoteze asupra valorilor
numerice ale parametrilor care intervin n structura legii respective de
probabilitate.
Ipoteza care urmeaz s fie testat se noteaz cu H
0
. Este necesar s
formulm i ipotez alternativ, notat cu H
1
.
Dac, de exemplu, H
0
este ipoteza c un anumit parametru p, are o valoare
numeric p
0
, atunci H
1
poate fi ipoteza c p are o alta valoare numeric p
1
. Alt
exemplu ar putea fi ipoteza H
1
: pp
1
; cu alte cuvinte, H
1
poate fi pur i simplu
ipoteza c H
0
este fals.
Un test statistic are menirea de a recomanda acceptarea ipotezei H
0
(i deci
respingerea lui H
1
) sau respingerea lui H
0
(i deci acceptarea lui H
1
).


11.4. Teste statistice

Un test statistic se bazeaz pe un experiment n urma cruia, sub ipoteza
H
0,
putem deduce valoarea numeric a unei statistici X. n spaiul valorilor pe
care le poate lua X vom izola o submulime numit zona critic a testului. Dac
valoarea numeric a lui X furnizat de experiment aparine zonei critice, vom
decide c respingem ipoteza H
0
i acceptm ipoteza H
1
; n caz contrar, acceptm
H
0
i respinge H
1
.
ntruct rezultatul experimentului este influenat de factori aleatori, decizia
noastr nu este infailibil: ea poate fi eronat.


11.5. Tipuri de erori

S presupunem c H
0
este adevrat, dar c n ciuda acestui fapt
datorit factorilor aleatori, valoarea lui X obinut n urma experimentului
aparine zonei critice. Noi vom decide s respingem ipoteza H
0
, dar aceast
decizie va fi evident greit. n acest caz se spune ca am comis o eroare de tip I.
235
Cealalt eroare posibil este de a accepta ipoteza H
0
cnd n realitate ea
este fals; aceasta se ntmpl cnd, dei H
0
este fals, valoarea lui X n urma
experimentului se plaseaz n afara zonei critice. n acest caz avem de a face cu o
eroare de tip II.


11.6. Nivel de semnificaie

Probabilitatea de a comite o eroare de tip I se noteaz cu i se numete
nivel de semnificaie al testului. Dac, de exemplu, =0.05 i aplicm testul de
1000 de ori, n aproximativ 50 de cazuri vom respinge n mod eronat ipoteza H
0
.
Probabilitatea de a comite o eroare de tip II se noteaz cu .
Desigur c dorim s proiectm teste pentru care probabilitile de eroare
i s fie mici. n anumite situaii, se caut minimizarea sumei + . n alte
cazuri se fixeaz nivelul de semnificaie i se caut testul pentru care s fie
minim. n cazuri complexe printre care i testarea irurilor binare calculul
lui este dificil sau chiar imposibil, aa c se fixeaz doar nivelul de
semnificaie .
Aceste consideraii sunt exemplificate n urmtorul exemplu.
Considerm o anumit distribuie de probabilitate a crei form o
cunoatem, dar n structura creia intra un parametru necunoscut .

Fie H
0
: =
0
, i fie K zona critic a testului. Avem

( ) ( )
0 0
| adevarata este | = e = e = K x P H K x P
ntruct distribuia de probabilitate este complet specificat, probabilitatea
de mai sus poate fi calculat.

i. Fie H
1
: =
1
.

Atunci
( ) ( ) ( )
1 1 0
| adevarata este | falsa este | = e = e = e = K x P H K x P H K x P
Din nou distribuia de probabilitate este complet specificat, deci
probabilitatea poate fi i ea calculat.

ii. Fie H
1
:
0
. Acum
( ) . |
0
= e = K x P
De data aceasta, parametrul nu mai este specificat, deci calculul lui este
dificil sau chiar imposibil.


236
11.7. Un exemplu

Notm cu X timpul dintre dou semnalizri succesive ale unui contor
Geiger. Din studiul dezintegrrii radioactive se tie c variabila aleatoare X are
densitatea exponenial:
( )

>
=

. rest in , 0
0 , t e
t f
t


unde este un parametru care depinde de natura materialului radioactiv.
Un fizician dorete s testeze valoarea lui pentru un anumit material
radioactiv.
Din anumite considerente teoretice sau experimentale, el tie c poate lua
fie valoarea 1, fie valoarea 2; intuiia fizicianului favorizeaz valoarea 2.
Aadar se testeaz ipoteza:
2 :
0
= H
n prezena ipotezei alternative:
. 1 :
1
= H
Pentru simplitatea exprimrii, vom presupune c se face o singur
observaie asupra variabilei X, cu alte cuvinte, se msoar lungimea unui singur
interval de timp dintre dou scintilaii consecutive ale contorului Geiger; desigur
c n practic testarea se va baza pe mai multe astfel de observaii.
Notm cu x valoarea msurat a lui X. Alegem drept zon critic a testului
intervalul (1, +). Aceasta nseamn c:
Dac x > 1, vom respinge ipoteza H
0
i vom accepta ipoteza H
1
;

Dac 0 < x 1, vom accepta ipoteza H
0
i vom respinge ipoteza H
1
.
S calculm nivelul de semnificaie al testului. Avem
( ) ( ) . 2 | 1 adevarata | 1
0
= > = > = x P H x P
Pentru =2, densitatea de probabilitate este
( ) 0 , 2
2
> =

t e t f
t

i deci
( )
} }


= = =
1 1
2
. 13 . 0 2 dt e dt t f
t

Aadar, probabilitatea de a comite o eroare de tipul I (i.e., de a respinge n
mod eronat ipoteza H
0
) este egal cu 0.13.
S calculm acum probabilitatea de a comite o eroare de tipul II (adic de a
accepta eronat ipoteza H
0
, ceea ce este totuna cu a respinge eronat ipoteza H
1
).
( ) ( ) . 1 | 1 0 adevarata | 1 0
1
= s < = s < = x P H x P
Pentru =1, densitatea de probabilitate este
237
( ) , 0 , > =

t e t f
t

i atunci avem


Desigur, probabilitatea unei erori de tipul II este mare, dar aceasta se
explic prin faptul c testul nostru se bazeaz pe o singura observaie.
Este util o interpretare geometric a faptelor de mai sus.

Pentru =2, graficul densitii de probabilitate este schiat n figura de mai jos.


Zona critic este intervalul (1, +) de pe axa Ox. Probabilitatea ca
observaia x s aparin zonei critice este egal cu aria suprafeei delimitate de
grafic i axa deasupra zonei critice. Nivelul de semnificaie este egal cu
aceast arie.
Pentru =1 avem graficul de mai jos:

238

Zona necritic este intervalul (0,1], iar probabilitatea este egal cu aria
delimitat de grafic i axa deasupra zonei necritice.
S construim acum alt test, cu acelai nivel de semnificaie, dar n care
regiunea critic s fie un interval de forma (0,a). Aceasta nseamn s
determinm numrul a>0 astfel nct
( ) . 13 . 0 2 | 0 = = < < a x P
Condiia de mai sus se transcrie n forma echivalent:

de unde se poate deduce a=0.07.
n aceste condiii, probabilitatea unei erori de tipul II va fi
( )
}


= = = > =
07 . 0
. 93 . 0 1 | dt e a x P
t

Constatm acum c probabilitatea este mai mare dect n situaia precedent,
prin urmare, testul anterior, bazat pe zona critic , este superior.
Interpretarea geometric n cazul al doilea se deduce din urmtoarele grafice.

239
Nivelul de semnificaie este egal cu aria suprafeei situate deasupra zonei
critice Graficul corespunde valorii =2.


Pr obabi li t at ea est e egal cu ar i a suprafeei si t uat e deasupr a zonei necr i t i ce
Gr af i cul est e t r asat pent r u val oar ea =1.


11.8. Relaia dintre probabilitile i

n fiecare situaie concret este important s tim care dintre cele dou
erori posibile ar produce cele mai mari prejudicii, i s minimalizm
probabilitatea de a comite acea eroare. Intuitiv este clar c dac se micoreaz
valoarea lui , va crete valoarea lui , i invers. Acest fapt poate fi ilustrat
geometric n condiiile exemplului din seciunea anterioar.
S relum ipotezele:
; 2 :
0
= H
. 1 :
1
= H
referitoare la parametrul O din densitatea de probabilitate
( )

s
>
=

. 0 , 0
0 ,
t
t e
t f
t


Alegem drept zona critic a testului un interval de forma unde




240
n aceast figur este trasat graficul densitii pentru =2. Nivelul de
semnificaie coincide cu aria de sub grafic, la dreapta lui c.


Pentru =1, graficul densitii de probabilitate este trasat n figura de mai
sus; probabilitatea coincide cu aria suprafeei de sub grafic, la stnga lui c.
Este clar c alegerea lui c determin valorile lui i . A micora pe
nseamn a muta punctul c spre dreapta; evident c aa l vom mri pe . Invers,
a-l micora pe nseamn a muta punctul c spre stnga, ceea ce l mrete pe .
O pr act i c des ntlnit n situaii concr et e est e aceea de a f i xa un anumi t ni vel
de semnificaie ( de obi cei = 0.05, sau = 0.01, = 0.001); apoi , di nt r e t est el e cu acest
ni vel se caut unul pent r u car e s f i e ct mai mic cu put i n. Int ui t i v est e cl ar c
dac numrul de observaii pe car e se bazeaz t est ul cret e, at unci scade; ns un
numr spor i t de observaii poat e angaj a cost ur i supl i ment ar e consi der abi l e.


11.9. Puterea unui test

S considerm din nou densitatea de probabilitate
( )

s
>
=

. 0 , 0
0 ,
t
t e
t f
t


241
Vom testa ipoteza
; 2 :
0
= H

n prezenta ipotezei alternative
. 2 :
1
< H
care va nlocui ipoteza alternativ =1 considerat anterior. Considerm drept zon
critic intervalul , ceea ce nseamn ca nivelul de semnificaie este =0.13.
De data aceasta, ipoteza alternativ H
1
nu mai specific o valoare cunoscut
a lui , aa nct nu mai putem indica o valoare numeric a probabilitii ;
putem ns determina expresia lui ca funcie de variabila ( ) 2 , 0 e .
ntr-adevr ( ) este probabilitatea ca s aparin zonei necritice cnd
valoarea parametrului este
( )
}

= = =
1
0
1
0
. 1 |

e e dt e
t t

Aadar, probabilitatea ca noi s acceptm n mod eronat ca valoare a
parametrului numrul 2, cnd adevrata valoare este , va fi egal cu


e 1 .
n general, funcia ( ) ( ) = 1 p se numete funcia de putere a testului,
sau puterea testului. Aceast funcie descrie probabilitatea ca testul s resping
ipoteza H
0
atunci cnd ea este eronat.
n cazul exemplului de mai sus avem:
( )


= e P 1 ; graficul acestei funcii este schiat mai jos.


Pentru fiecare valoare a parametrului, funcia de putere P() descrie
probabilitatea ca s aparin zonei critice; n particular, P(2) = 0.13.
Dac = 1, valoarea eronat 2 este respins cu probabilitatea 0.37, iar dac
=0.5, aceeai valoare eronat 2 este respins cu probabilitate 0.61.

242

11.10. nc un exemplu

Ni se d o moned i ni se cere s decidem dac este sau nu trucat. Avem
de testat ipoteza
H
0
: moneda nu este trucat
n prezena ipotezei alternative
H
1
: moneda este trucat
Astfel formulate, ipotezele H
0
i H
1
sunt de natur calitativ; le putem
transcrie sub o form cantitativ, numeric, dac notm cu p probabilitatea de a
obine faa A la o aruncare a monedei ( i deci q = 1 - p va fi probabilitatea de a
obine faa B).
Atunci putem scrie:
H
0
: ,
H
1
:
Testul va consta din a arunca moneda de 100 de ori. S notm prin X
numrul de apariii ale feei A n cele 100 de aruncri. Sub ipoteza H
0
, X este o
variabil aleatoare repartizat binomial cu parametrii i . Media lui
X va fi np = 50, iar dispersia npq = 25.
Aproximnd distribuia binomial printr-o distribuie normal cu media 50
i dispersia 25, densitatea lui X va fi aproximativ cea schiat in figura
urmtoare.
35 40 45 50 55 60 65


Vom determina zona critic n aa fel nct nivelul de semnificaie s fie
0.05. Folosind tabele pentru legea normal deducem

243
nseamn c zona necritic va fi intervalul [40,60], iar cea critic exteriorul
acestui interval.
Aadar testul nostru poate fi rezumat astfel:
1. Dac faa A apare de un numr de ori mai mic dect 40 sau mai mare
dect 60, moneda este trucat. Probabilitatea ca aceast concluzie s
fie greit este mai mic dect 0.05.
2. Dac faa A apare de un numr de ori cuprins ntre 40 i 60, nu exist
suspiciuni (la nivelul de semnificaie 0.05) c moneda ar fi trucat.
S presupunem acum c n realitate p = 0.7, dar noi nu tim asta. Atunci
distribuia real a lui X va fi aproximativ normal cu media 70 i dispersia 21.
Atunci probabilitatea pentru testul nostru va fi

Folosind funcia de putere, avem

Alte valori ale funciei de putere, calculate n mod similar, sunt



Cu alte cuvinte, dac p=0.3 testul nostru va respinge ipoteza greit p=0.5 cu
probabilitatea 0.98.


11.11. Testarea irurilor binare

Avem n vedere iruri finite (numite i secvene) formate cu simbolurile 0
i 1. Un astfel de ir aleator poate fi interpretat ca rezultat al aruncrilor unei
monede netrucate avnd feele notate cu 0 i 1. Aruncrile sunt independente
unele de altele i rezultatele aruncrilor pn la un anumit moment nu
influeneaz n nici un fel rezultatele aruncrilor viitoare.
Acest experiment ideal este neconvenabil pentru scopuri practice. n
practic irurile binare sunt produse de generatoare, i ele urmeaz s fie testate
din punct de vedere al caracterului aleator.


11.12. Testarea statistic a irurilor binare

S considerm un ir binar care urmeaz s fie testat. Vom formula ipoteza
H
0
: irul dat este aleator
i ipoteza alternativ
H
1
: irul dat nu este aleator.
244
Alegem un nivel de semnificaie , adic probabilitatea de a comite o
eroare de tip I. O valoare mare a lui indic un risc mare ca testul s resping
ipoteza H
0
cnd ea este n realitate adevrat; cu alte cuvinte, un risc mare ca
testul s declare drept nealeatoare iruri care au fost produse n mod aleator.
O eroare de tip II nseamn n cazul de fa s acceptm drept aleator un ir
produs de un generator imperfect. Probabilitatea de a comite o astfel de eroare
depinde de natura imperfeciunii generatorului, i este dificil de estimat n
practic. n mod curent se consider c o valoare prea mic a lui mrete riscul
unei erori de tip II, cu alte cuvinte mrete riscul de a accepta drept aleatoare
iruri produse de un generator imperfect.
Este deci important s alegem nivelul de semnificaie adecvat problemei
concrete pe care o avem de rezolvat. n practic se folosete un nivel de
semnificaie cuprins ntre 0.001 i 0.05; se alege de multe ori = 0.01.
Fiecare test se bazeaz pe o statistic X a crei valoare numeric se
calculeaz pornind de la irul considerat. De obicei se aleg statistici care pot fi
calculate n mod eficient i care urmeaz o lege normal sau .
Valoarea x a statisticii X pentru irul dat se compar cu valoarea ateptat
de la un ir aleator.
a. S presupunem c statistica X cu care lucrm este distribuit N(0,1), i c
ia fie valori foarte mici, fie valori foarte mari pentru irurile nealeatoare.
Folosind tabele pentru legea normal fixm un prag x

astfel nct

Zona critic a testului va fi ( ) ( ) + , ,

x x . Dac valoarea x a
lui X, calculat pentru irul considerat, aparine zonei critice, irul este
considerat nealeator; cu alte cuvinte, ipoteza H
0
este respins la nivelul de
semnificaie .
Dac , com accepta ipoteza H
0
; nu sunt suspiciuni (la
nivel de semnificaie ) c irul ar fi produs de un generator imperfect.
De exemplu, dac =0.05, atunci x

= 1.96; probabilitatea ca un ir
aleator s fie respins ca nealeator este de 0.05.
b. S presupunem acum c statistica X este distribuit cu grade de
libertate, i c ia valori foarte mari pentru irurile nealeatoare. Pragul x

se
determin (folosind tabele pentru legea ) din condiia

Zona critic a testului va fi Dac valoarea x a lui X,
calculat pentru irul testat, aparine zonei critice, ipoteza H
0
va fi respins la
nivel de semnificaie , adic irul va fi considerat nealeator. Dac
acceptm ipoteza H
0
; nu sunt suspiciuni c irul ar fi nealeator.
De exemplu, dac =5 i =0.025, atunci x

=12.83; probabilitatea ca
un ir aleator s fie declarat, n mod eronat, ca nealeator este de 0.025.


245
11.13. Noiunea de P-valoare

Uneori nu se lucreaz cu pragul x

, ci se prefer folosirea aa-numitei P-


valori. Vom prezenta aceast noiune n cadrul exemplelor (a) i (b) de mai sus.
a. Fie x valoarea numeric a lui X pentru irul testat. Probabilitatea



se numete P-valoare.



Examinnd figura de mai sus deducem c urmatoarele afirmaii sunt
echivalente.
1) X aparine zonei critice
2)
3)
4)
Din echivalena condiiilor (1) i (4) deducem c ipoteza H
0
va fi
respins dac i numai dac P-valoarea este mai mic dect .
Aadar irul testat va fi respins ca nealeator (la nivelul de semnificaie
) dac i numai dac P-valoarea calculat pentru el este mai mic dect .
b. n condiiile acestui exemplu, descrise n seciunea precedent, fie x
valoarea numeric a lui X pentru irul testat. Probabilitatea ( ) x X P > se
numete P-valoare.

246
x

x



Examinnd aceast figur conchidem c urmtoarele afirmaii sunt
echivalente:

1) x aparine zonei critice
2) x > x


3)
4)


Echivalena condiiilor (1) i (4) arat c ipoteza H
0
va fi respins la nivelul
de semnificaie dac i numai dac P-valoarea este mai mic dect . irul
testat va fi respins ca nealeator dac i numai dac P-valoarea calculat pentru el
este mai mic dect .
247
Iat, n rezumat, dou concluzii.
1. Dac testul a fost proiectat pentru nivelul de semnificaie =0.001, din
1000 de iruri produse aleator, el va respinge, n medie, unul singur ca fiind
nealeator. Dac pentru un ir dat P-valoarea este mai mic dect 0.001,
irul va fi declarat nealeator, iar probabilitatea ca aceast decizie s fie
greit este 0.001.
2. Din 1000 de iruri aleatoare, un test cu nivelul de semnificaie =0.01 va
respinge, n media, 10 iruri ca fiind nealeatoare. Un ir cu P-valoarea mai
mic dect 0.01 va fi declarat nealeator, iar nivelul nostru de ncredere n
corectitudinea acestei decizii este 99%.


11.14. Un exemplu: statistic repartizat normal

Am observat deja mai sus c aruncnd o moned netrucat generm un ir
binar aleator. Prin urmare, avnd de testat un ir dat, ne putem imagina c el a
aprut ca rezultat al aruncrilor unei monede, i rmne s testm dac moneda
este netrucat.
O astfel de testare a fost descris anterior, la nivelul de semnificaie
=0.05; tot acolo am vzut ce fel de consideraii pot fi fcute n legtur cu
probabilitatea (de a accepta ca aleator un ir care de fapt nu este aleator) i n
legtur cu puterea testului.
n cazul specific al irurilor binare, metoda respectiv de testare poate fi
descris astfel. Considerm un ir binar de lungime n. Formulm ipoteza

H
0
: irul este aleatoriu

Statistica S
n
va indica numrul de apariii ale cifrei 1. Sub ipoteza H
0
, S
n

este repartizat binomial, cu parametrii n i , adic
, k = 0,1,2,,n.
Notm
Atunci X este repartizat aproximativ N(0,1), adic



unde
z>0.

Fixnd nivelul de semnificaie , vom determina pragul x

din relaia
248


De exemplu, x
0.05
= 1.96, iar x
0.01
= 2.58.

Pentru un ir dat, s notm cu x valoarea numeric a lui X:



Atunci P-valoarea asociat irului va fi



Cu scop ilustrativ, s considerm exemplul irului binar
1011010101
S fixm nivelul de semnificaie = 0.01, ceea ce determin pragul
x

= 2.58.
Avem n=10, S
n
=6, deci



ntruct 0 < x < x

, acceptm ipoteza c irul este aleator.


De altfel putem calcula i P-valoarea pentru acest ir, ea este



S considerm acum irul binar
1111011111
Avem n=10, S
n
=9, deci



249
P-valoarea calculat pentru acest ir este



irul trece (aproape la limit) testul cu nivelul de semnificaie 0.01, dar este
respins de testul cu nivelul de semnificaie 0.05.


11.15. Alt exemplu: statistic repartizat
2


Fie M i N numere naturale fixate. Considerm un ir binar de lungime n =
MN, pe care l mprim in N blocuri consecutive de lungime M. Notm cu M
i

numrul de cifre 1 n blocul i,
Sub ipoteza
H
0
: irul este aleator,

M
i
este o variabil aleatoare binomial cu parametrii M i ; altfel spus,



Media lui M
i
este , iar dispersia
n aceste condiii variabila aleatoare



este repartizat aproximativ cu N grade de libertate; altfel spus, densitatea ei de
probabilitate este funcia



Este comod s notm cu frecvena relativ a cifrei 1 in blocul i.
Atunci putem scrie

250
Aceast variabil aleatoare cu N grade de libertate poate fi folosit la
testarea irului, aa cum se arat n exemplul de mai sus.
Cu scop ilustrativ, s considerm irul
011001101
Alegem M=3, N=3, i considerm blocurile
011, 001, 101
Cu notaiile anterioare,


Acum putem calcula valoarea x a variabilei X:



Lucrm cu 3 grade de libertate; din tabele gsim c P-valoarea irului este
0.80, deci irul este considerat aleator la nivelele de semnificaie 0.01 i 0.05.
Aceeai concluzie se obine comparnd valoarea x=1 cu pragurile x
0.01
= 11.341
i x
0.05
= 7.815.



251
Capitolul 12


Analiza regresiei


Introducere

Analiza de regresie i are originile n nenumratele probleme practice,
care apar atunci cnd dorim s nelegem i s cuantificm aspectul cauz-efect,
n studiul a dou sau mai multe fenomene, de natur divers. Principala noiune
cu care opereaz acest capitol este noiunea de model de regresie. Vom vedea n
cele ce urmeaz cteva generaliti ale problemei regresiei, prezentndu-se
principalele tipuri de modele de regresie, apoi se va fundamenta modelul liniar
multiplu, incluznd particularitile modelului liniar simplu, estimarea
coeficienilor modelului prin metoda celor mai mici ptrate, inferena asupra
modelului n ipotezele Gauss-Markov, precum i aspecte privind previziunea pe
baza modelului de regresie.


12.1. Modele de regresie

S considerm, spre exemplu, c fiecare element al unei populaii
statistice posed o caracteristic numeric, X i o alta Y. Pentru a vedea cum
afecteaz valorile lui X, realizrile variabilei Y, este necesar studierea posibilei
corelaii existente ntre cele dou variabile. Un exemplu clasic este acela care
studiaz nlimea unei persoane, n funcie de cea a tatlui.
n cazul legturilor statistice, care conin ca i caz particular, aferent
dependenei totale, legtura funcional, unei singure valori, x, a variabilei X, i se
asociaz o repartiie de valori a variabilei Y, de medie ( ) x f , D x e , D fiind
mulimea valorilor variabilei X.

Definiia 12.1.1. Dac pentru fiecare valoare, D x e , a lui X , Y este o variabil
aleatoare cu distribuia de probabilitate depinznd de x, vom numi funcie de
regresie a lui Y pe X, funcia ( ) x f , definit cu ajutorul valorii medii
condiionate,

( ) ( ) D x x Y E x f e = , . (12.1.1)

innd cont de caracteristicile valorii medii condiionate, o legtur direct
ntre Y i X va fi dat atunci, de modelul de regresie simpl
252
( ) c + = X f Y , (12.1.2)

unde c satisface condiiile ( ) 0 = c E i ( ) c Var - minim i are semnificaia de
eroare de specificare, eroare datorat faptului c variabila/variabilele luate n
considerare nu sunt singure suficiente, pentru a explica n totalitate, fenomenul
cuantificat de Y.

Vom considera n cele ce urmeaz, aa cum se ntmpl i n practic,
mai multe variabile cauz (variabile exogene, predictori,
regresori),
p
X X X ,..., ,
2 1
, pentru variabila efect, Y (variabil endogen).

Definiia 12.1.2. Modelul de regresie multipl este modelul de forma

( ) c + =
p
X X X f Y ,..., ,
2 1
, (12.1.3)

unde c reprezint o variabil aleatoare, pentru care ( ) 0 = c E i ( ) c V mic.

Dei
p
X X X ,..., ,
2 1
sunt considerate variabile deterministe, Y mprumut
de la c , caracterul aleator, termenul eroare, c , fiind cel care transform modelul
matematic, strict funcional, n unul statistic.
Odat specificat un model de regresie, este necesar s determinm, sau
mcar s estimm, funcia de regresie f, pe baza unor date de selecie. Astfel,
spre exemplu, pentru un model de regresie simpl, se pornete de la datele
( ) n i y x
i i
, 1 , , = , care reprezint de fapt, o selecie de volum n, pentru variabilele
X i Y i se obine modelul observaional ( ) n i x f y
i i i
, 1 , = + = c . E bine de tiut
faptul c,
i
c poate cuprinde pe lng erorile de specificare i erori de observare,
n cazul n care valorile variabilei Y i eventual, ale variabilei X, ne sunt puse la
dispoziie, n urma unor msurtori, posibil afectate de mici erori. Desigur, se
presupune c n modelul de regresie nu intr erorile sistematice, ci doar cele
aleatoare. Din punct de vedere al punctului de plecare, n procesul de estimare a
funciei de regresie f, deosebim regresia parametric i regresia neparametric,
cea din urm nefiind obiectivul acestui capitol. Dac n determinarea funciei de
regresie se pleac de la ideea (desigur pe ct posibil fundamentat), c funcia f
are o anumit form atunci vorbim de regresia parametric.

Definiia 12.1.3. Modelul de regresie n care funcia este de forma

( ) ( ) IR X X X f X X X f
i q p p
e = o o o o , ,..., , ; ,..., , ,..., ,
2 1 2 1 2 1
, q i , 1 = , (12.1.4)

se numete model de regresie parametric.
253
Plecnd de la definiie, se observ c un model de regresie parametric
presupune cunoscut forma funciei de regresie, f (mai bine zis a estimatorului
cutat), excepie fcnd un numr finit de parametri necunoscui, adic
( ) ( ) o , = f f , cu ( )
q
q
IR B _ e
'
= o o o ,...,
1
. Evident, dac ( ) o , f este
cunoscut, estimarea lui f, ntr-un model de regresie parametric, revine la
estimarea lui o . Folosind metode de estimare adecvate bazate pe minimizarea
erorii din model, cum ar fi criteriul celor mai mici ptrate, e posibil s se
estimeze, din date, vectorul o i implicit f. Reprezentarea grafic a estimatorului
funciei f, obinut prin astfel de metode, va fi o curb care ajusteaz, cel mai bine
datele, din mulimea de curbe permise, prin specificarea modelului.
Modelele de regresie parametric pot depinde, ntr-o manier liniar sau
neliniar, de parametri.

Definiia 12.1.4. Vom spune c avem o regresie liniar, dac funcia f este
liniar n variabilele
p
X X X ,..., ,
2 1
adic asupra funciei de regresie facem
presupunerea c are forma

( )

=
=
p
k
k k p p
X X X X f
1
2 1 2 1
,..., , ; ,..., , o o o o . (12.1.5)

Orice alt form a funciei f presupune regresie neliniar.

Forma liniar a funciei de regresie i metoda celor mai mici ptrate
utilizat n scopul estimrii parametrilor sunt cele mai des ntlnite, n analiza
regresional. Modelele liniare sunt cele mai simple i mai utilizate modele,
multe dintre modelele neliniare i chiar neparametrice, fcnd apel la
caracteristicile acestora. Tehnicile de estimare punctual i inferenial, utilizate
n determinarea modelului liniar, in de un domeniu important n analiza
regresional i anume, regresia liniar.
Exist ns o grup de modele neliniare, care pot fi tratate tot prin
intermediul tehnicilor regresiei liniare i anume, modelele neliniare liniarizabile,
o parte dintre acestea fiind i modelele liniare n parametri.

Definiia 12.1.5. Se numete model de regresie liniarizabil n parametri,
modelul n care funcia de regresie este de forma

( ) ( )

=
=
q
k
p k k q p
X X X X X X f
1
2 1 2 1 2 1
,..., , ,..., , ; ,..., , o o o o , (12.1.6)

adic este presupus liniar, n raport cu parametrii
p
o o ,...,
1
.

Astfel de modele pot fi liniarizate prin substituiile,
254
( ) , , 1 , ,..., ,
2 1
q k Z X X X
k p k
= =

un exemplu fiind modelul de regresie polinomial, n care

( )
q
q q
X X X f o o o o o o + + + = ... ,..., , ;
1 0 1 0
(12.1.7)

i din care pentru q=1 deriv modelul de regresie liniar simpl, dat prin

( ) X X f
1 0 1 0
, ; o o o o + = . (12.1.8)

Un astfel de model este i modelul hiperbolic, cu funcia de regresie
( )
X
X f
2
1 2 1
, ;
o
o o o + = , liniarizabil prin substituia Z
X
=
1
. Tot din grupa
modelelor neliniare, dar liniarizabile, fac parte i modelele care se reduc la
modelul liniar, n urma mai multor operaii: logaritmare, substituie, etc. Un
exemplu este modelul exponenial, dat de funcia ( )
X
X f
2 1 2 1
, ; o o o o = , care
se liniarizeaz prin logaritmarea ( )
2 1 2 1
log log , ; log o o o o + = X X f i
substituiile ( ) ( )
2 1
, ; log , , o o X f B A X F = i
2 1
log , log o o = = B A , obinndu-
se modelul liniar dat prin B X A B A X F + = ) , , ( . Exist ns i alte modele
neliniare, care nu pot fi liniarizate, cum ar fi de exemplu, modelul
c o o
o
+ + =
2
1 0
X Y . Este deja bine cunoscut formularea, c modelele neliniare,
liniarizabile prin substituie, adic acelea n care se presupune c funcia de
regresie este liniar n parametri, in de regresia liniar, deoarece studiul lor se
face cu tehnicile acesteia. Modelele neliniare n parametri, dar liniarizabile n
urma unor operaii, cum ar fi logaritmarea, pot fi tratate, att cu tehnici ale
regresiei liniare, ct i cu cele ale regresiei neliniare. Aplicarea regresiei liniare
pe modelul transformat are avantajul c estimatorii se bucur de proprieti mai
bune i dezavantajul c modelul obinut este doar o aproximare a celui iniial (a
se vedea cazul modelului exponenial, n care erorile intr aditiv n modelul
iniial). Modelele neliniarizabile in exclusiv de regresia neliniar, regresie n
care tehnicile nu mai pot fi fundamentate, pe avantajele obinute din liniaritate.
Pentru modelele neliniare, sistemul care deriv din criteriul celor mai
mici ptrate fiind neliniar, se ntmpin de cele mai multe ori, dificulti de
rezolvare, motiv pentru care, atunci cnd modelul este liniarizabil, se prefer mai
nti liniarizarea lui, care va duce la un sistem liniar de ecuaii normale i nu
aplicarea direct a criteriului, dei n acest fel, se obine doar o aproximare
rezonabil a modelului iniial. n cazul modelelor care nu pot fi liniarizate, se
aplic tehnici ale regresiei neliniare, bazate n special pe metode iterative, cum ar
fi metoda iterativ Gauss - Newton.

255
12.2. Modelul liniar. Estimarea parametrilor modelului prin
metoda celor mai mici ptrate

n acest paragraf, ne ocupm de aspecte privind ajustarea modelului
liniar. Sunt amintite forma teoretic, forma observaional/matriceal i forma
ajustat a modelului liniar, precum i condiia care garanteaz existena soluiei
ajustrii de cele mai mici ptrate.

Definiia 12.2.1. Se numete model regresional liniar multiplu, ntre variabila Y
i variabilele
p
X X X ,..., ,
2 1
, modelul

=
+ =
p
k
k k
X Y
1
c o . (12.2.1)

Problema regresiei liniare const n studiul comportrii variabilei Y, n
raport cu factorii
p
X X X ,..., ,
2 1
, n ipoteza (12.2.1). Acest studiu revine la
evaluarea parametrilor (coeficienilor) de regresie,
p
o o o ,..., ,
2 1
i a termenului
aleator, c . Estimarea coeficienilor de regresie se face pe baza unei selecii de
volum n. Pentru datele de selecie (i atunci cnd este cazul pentru variabilele de
selecie), vom folosi urmtoarele notaii:

( )
n
n
IR y y y y e = ' ,..., ,
2 1
, ( ) p n
x x x
x x x
x x x
x x x
np n n
p
p
p
>
|
|
|
|
|
.
|

\
|
= = ,
...
... ... ... ...
...
...
,...,
2 1
2 22 21
1 12 11
1
. (12.2.2)

n cazul n care analistul are control asupra alegerii variabilelor,
p
X X X ,..., ,
2 1
,
matricea x se numete matrice de design. Pentru parametrii p k
k
, 1 , = o , i pentru
erorile n i
i
, 1 , = c , corespunztoare datelor de selecie, vom folosi de asemenea,
notaiile matriceale :

( )
p
p
IR e = ' o o o o ,..., ,
2 1
, ( )
n
n
IR e = ' c c c c ,..., ,
2 1
. (12.2.3)

Pentru datele de selecie corespunztoare lui i, modelul (12.2.1) devine
modelul observaional (cu datele observate),

i
p
k
ik k i
x y c o + =

=1
, (12.2.4)

256
ceea ce, pentru n i , 1 = , duce la forma matriceal a modelului liniar
observaional,

c o + = x y , (12.2.5)

n care o , , x y i c sunt cele din notaiile (12.2.2) i (12.2.3). n vederea
estimrii lui o , se ajusteaz modelul (12.2.5), printr-o condiie de minim asupra
erorii, care aa cum am subliniat nc din paragraful introductiv al acestui
capitol, este de dorit s fie mic. Ne vom opri aici, doar asupra ajustrii prin
criteriul celor mai mici ptrate, care const n minimizarea expresiei

=
= '
n
i
i
1
2
c c c . (12.2.6)

Definiia 12.2.2. Se numete model liniar, ajustat prin criteriul celor mai mici
ptrate, modelul

e xa y + = , (12.2.7)

unde ( )
p
p
IR a a a a e = ' ,..., ,
2 1
realizeaz minimul expresiei (12.2.6), iar e e' , cu
( )
n
n
IR e e e e e = ' ,..., ,
2 1
( este valoarea minim obinut.

Sistemul de ecuaii, la care revine condiia de minim, este

y x xa x ' = ' (12.2.8)

i se numete sistemul de ecuaii normale (Gauss), ataat modelului (12.2.7).
Notaiile a i e desemneaz estimatori punctuali ai lui o i c , atunci cnd
n i y
i
, 1 , = , p k n i x
ik
, 1 , , 1 , = = , desemneaz variabilele de selecie i estimaii
punctuale (valori nenule), atunci cnd prin n i y
i
, 1 , = , p k n i x
ik
, 1 , , 1 , = = ,
nelegem date de selecie. Obinerea estimatorilor de cele mai mici ptrate a,
pentru coeficienii de regresie necunoscui o , depinde aadar, de existena
inversei matricei x x' , care revine la condiia ( ) p x x rang = ' . Se cunoate
urmtorul rezultat, care d condiii de existen (unic) a estimatorilor de cele
mai mici ptrate (a se vedea de exemplu [30]).

Teorema 12.2.3. Dac ( ) p x rang = , atunci soluia ajustrii prin criteriul celor
mai mici ptrate este dat de formula

( ) y x x x a ' ' =
1
. (12.2.9)
257
Condiia ( ) p x rang = revine la independena liniar a vectorilor
p
x x x ,..., ,
2 1
. Amintim n continuare, cteva noiuni utilizate i n teoria
modelelor de regresie oarecare.

Definiia 12.2.4. Se numete valoare ajustat a lui y (n modelul liniar),
valoarea ( )
n
n
IR y y y y e = ' ,..., ,
2 1
, definit de xa y = . Se numete matrice de
influen a modelului, matricea H care transform valoarea y, n valoarea
ajustat y , adic, Hy y = , matricea de influen n modelul liniar fiind de
forma ( ) x x x x H ' ' =
1
. Se numete reziduu, valoarea ( )y H I y y e = = .

Un caz particular al modelului liniar, care face mai uor trecerea la
modelul liniar simplu (cu o singur variabil exogen), este modelul liniar cu
termen constant.

Definiia 12.2.5. Se numete model liniar cu termen constant, un model liniar n
care una dintre variabile este nlocuit de constanta 1.

Modelul observaional, scris pe baza datelor de selecie n forma
matriceal, va arta atunci astfel,

c o o + + =
p
u x y
0 0
, (12.2.10)

cu notaiile IR
p
e o , ( )
1 , 1 1 0
,...,

e =
p n p
M x x x , ( )
1
1 2 1 0
,..., ,

e =
' p
p
IR o o o o ,
( )
n
IR u e = ' 1 ,..., 1 . Dac notm ( ) ( )
p
u x x o o o , , :
0 0
' = = , modelul poate fi scris
n forma modelului liniar oarecare, c o + = x y . O teorem similar cu Teorema
12.2.3 are loc i n cazul modelului liniar cu termen constant.

Teorema 12.2.6. Fie matricea de centrare, u u
n
I P ' =
1
. Notm cu z
~
, vectorul
centrat corespunztor lui
n
IR z e , adic ( )
'
= = z z z z z z Pz z
n
,..., ,
~
2 1
, cu
z , media de selecie. Dac ( ) p x rang = i ( ) u x x :
0
= , ajustarea prin metoda
celor mai mici ptrate are soluia unic dat de

( ) ( ) y x x x a a a a
p
~ ~ ~ ~
,..., ,
0
1
0 0 1 2 1 0
' ' =
'
=

,
(12.2.11)

=
=
1
1
p
k
k k p
x a y a ,
258
unde
0
~
x este matricea obinut din matricea
0
x , prin centrarea vectorilor de pe
coloan, iar y i
k
x , noteaz mediile de selecie corespunztoare valorilor
i
y
respectiv, n i x
ik
, 1 , = .

Observaia 12.2.7. Dac n Definiia 12.2.5, se consider 2 = p , obinem
modelul de regresie liniar simpl,

c | o + + = X Y , (12.2.12)

care cu ajutorul datelor de selecie se scrie,

IR x y n i x y
i i i i i i
e = + + = | o c c | o , , , , , , 1 , .

n acest caz, relaiile (12.2.11) dau reprezentarea estimatorilor a i b, ai
coeficienilor o i | i anume,

( )( )
( )
( )
2
1
2
1
, cov
x
n
i
i
n
i
i i
S
y x
x x
y y x x
a =

=
=
,
(12.2.13)
x a y b = ,

unde ( ) y x, cov reprezint covariana ntre x i y, iar
2
x
S , variana lui x.

Exemplul 12.2.8. Teoria economic privind gestiunea portofoliului susine c
rentabilitatea unei aciuni este influenat de modificarea indicelui general al
bursei, adic de evoluia pieei n general (modelul de pia Sharp-Markowitz,
([17])). Pornind de la aceast idee, se pune problema determinrii estimatorilor
de cele mai mici ptrate pentru coeficienii unui model liniar simplu care s
descrie corelaia dintre rata rentabilitii unor aciuni, Y i rata rentabilitii
pieei, X. Se va considera un eantion de 15 zile, cu valorile:

Y(%): -2,8; 0,2; 1,6; 3,9; 0,2; 2,4; 4,4; 18,6; 1,5; -17,9; 0,5; 0; 0,8; 0,1; -0,8
X(%): -0,5; 1,5; 3,2; 5,8; 3,3; 7,4; 5,8; 16,0; -2,0; -13,1; 0,7; 0,9; 2,9; 1,8; 1,1.

Soluie
Pe baza eantionului, obinem , 85 , 0 = y 32 , 2 = x , ( ) 41 , cov = y x ,
36
2
=
x
S , prin urmare, conform formulelor de calcul pentru a i b , avem
259
13 , 1
36
41
= = a i 76 , 1 32 , 2
36
41
85 , 0 = = b i modelul ajustat este
c + + = X Y 13 , 1 76 , 1 .


12.3. Modelul liniar clasic Gauss - Markov. Inferene asupra
estimatorilor unui model liniar

n acest paragraful tratm aspectul probabilist al regresiei, cercetnd
calitile estimatorilor de cele mai mici ptrate, caliti obinute sub anumite
ipoteze de natur probabilist, fcute asupra erorii. Sunt amintite ipotezele
clasice, calitile estimatorilor n aceste ipoteze, cteva statistici utile n inferena
asupra coeficienilor, precum i intervalele de ncredere privind coeficienii i de
asemenea, cteva din testele cunoscute, referitoare la coeficieni.
n continuare, pe tot parcursul acestui capitol, se pstreaz notaiile
referitoare la forma teoretic, forma matriceal i forma ajustat a modelului,
precum i condiia ( ) p x rang = .Vom ncepe prin a preciza ipotezele clasice n
care se lucreaz ntr-un model liniar, ipoteze care, dei nu neaprat de nenlocuit,
duc la bune proprieti ale estimatorilor. Aceste ipoteze se refer la distribuia
erorilor i anume,

( ) ( )
n
IR E e
'
= = 0 ,..., 0 , 0 , u u c , (12.3.1)

( ) ( ) I E Var
2
o c c c = ' = , (12.3.2)

N e c (12.3.3)

sau altfel spus,

( ) I N
2
,o u c e . (12.3.4)

Condiia (12.3.2) se poate scrie i sub forma relaiilor

( ) n i Var
i
, 1 ,
2
= = o c , (12.3.5)

( ) n j i j i
j i
, 1 , , , 0 , cov = = = c c . (12.3.6)

Condiiile puse asupra erorii se transfer asupra variabilei aleatoare, adic avem
( ) I x N y
2
,o o e .

260
Definiia 12.3.1. Ipotezele (12.3.1) i (12.3.2) sunt cunoscute i sub denumirea
de ipoteze Gauss-Markov, modelul liniar sub aceste ipoteze, numindu-se
modelul liniar Gauss-Markov. Pentru eroarea care satisface aceste ipoteze se
folosete i denumirea de zgomot alb. Datorit ipotezei (12.3.5), modelul se
numete homoscedastic, iar datorit ipotezei (12.3.6), model cu erori
necorelate. Dac la ipotezele Gauss-Markov, se adaug i ipoteza normalitii
(12.3.3), atunci modelul liniar este cunoscut i sub denumirea de model liniar
clasic, cele trei ipoteze fiind apelate ca ipotezele liniaritii modelului, dei
acestea nu in neaprat de un model liniar. Un model clasic (liniar sau nu) este
de fapt, un model cu erori normale ((12.3.3)), independente ((12.3.6)) i identic
distribuite ((12.3.1) i (12.3.5)) sau prescurtat i.i.d.

nainte de a aminti principalele rezultate, cu privire la calitatea
estimatorilor de cele mai mici ptrate, a i e, pentru o i c , obinute sub
ipotezele (12.3.4), vom sublinia faptul c a y , ,c i e sunt vectori aleatori, n timp
ce o este un vector determinist i de asemenea,
p
x x x ,..., ,
2 1
, din matricea
variabilelor de selecie, ( )
p
x x x x ,..., ,
2 1
= , sunt vectori determiniti.

Teorema 12.3.2. n ipotezele Gauss-Markov, au loc urmtoarele afirmaii:
i)Estimatorul de cele mai mici ptrate, a, al lui o , este nedeplasat, ( ) o = a E i
are variana ( ) ( )
1 2
' = x x a Var o . De asemenea, ( ) H y Var
2
o = , unde H este
matricea de influen a modelului.
ii)Estimatorul a, al lui o , este liniar n observaiile lui y.
iii)Estimatorul a al lui o este optimal, adic oricare alt estimator a
~
, nedeplasat
pentru o i liniar n observaiile lui y, are variana mai mare dect variana lui
a, n sensul c, ( ) ( ) p k a Var a Var
k k
, 1 ,
~
= s .

Teorema 12.3.3. n ipotezele Gauss-Markov, estimatorii

e e
p n
e
p n
s
n
i
i
'

=

=
1 1
1
2 2
,
(12.3.7)
( )
1 2
' = x x s S

sunt estimatori nedeplasai pentru
2
o , respectiv ( ) a Var .

n plus, au loc i urmtoarele proprieti:

Propoziia 12.3.4. n ipotezele Gauss-Markov, avem:
i)Estimatorul e al lui c este de varian ( ) Q e Var
2
o = , unde H I Q = , H
matricea de influen ataat modelului.
261
ii)Dac
p q
M c
,
e , atunci ca este estimator optimal pentru o c , n clasa
estimatorilor nedeplasai, care sunt transformri liniare ale lui y.
iii)Estimatorii a i e sunt necorelai, adic ( ) u = e a, cov , ( )
n
IR e
'
= 0 ,..., 0 , 0 u .

Ipoteza normalitii erorilor aduce noi proprieti ale estimatorilor.

Propoziia 12.3.5. ntr-un model liniar clasic (cu erori normale i i.i.d.-
(12.3.4)), estimatorul obinut prin metoda celor mai mici ptrate este un
estimator eficient pentru o .

Atunci cnd se cunoate legea de probabilitate a variabilei y (prin
intermediul legii erorilor), putem vorbi i despre estimatori de verosimilitate
maxim, respectiv de regresie de verosimilitate maxim. ntr-un model liniar,
supus ipotezelor clasice (12.3.4), estimatorul lui o , de cele mai mici ptrate,
coincide cu estimatorul lui o , de verosimilitate maxim, n timp ce estimatorul
de verosimilitate maxim,
2
/ x y
S , pentru
2
o este nedeplasat, unde :

2
1
2 2
/
1 1
s
n
p n
e e
n
e
n
S
n
i
i x y

= ' = =

=
. (12.3.8)

De asemenea, n ipoteza normalitii, ataat ipotezelor Gauss-Markov, se
pot stabili i urmtoarele proprieti, care furnizeaz statistici ce se vor dovedi
utile n inferena estimatorilor.

Propoziia 12.3.6. Dac ( ) I N
2
,o u c e , atunci avem
i)Estimatorii a i
2
s sunt independeni i ( ) ( )
1 2
,

' e x x N a o o .
ii) ( ) ( ) p n e
s
p n
n
i
i
e = =

=
2
1
2
2 2
2
2
1
o o
.
iii)Fie
( ) o o o
o o o
1
' '
' '
=
x x
a
U , ( )
p
p
IR e = ' o o o ,...,
1
. Oricare ar fi
p
IR e o , U i
2
s
sunt independente i ( ) 1 , 0 N U e . Mai mult,
( )
( )
p
IR p n T
x x s
a
T e e
' '
' '
=

o
o o
o o o
,
1
.

Aceste proprieti se bazeaz pe urmtorul rezultat din teoria
probabilitilor ([30]):

Lema 12.3.7. Fie vectorul
n
IR e c , care urmeaz legea normal, de medie u i
matrice de varian, I
2
o ; fie de asemenea, matricele ) (
,
IR M Q
n n
e , Q Q = ' ,
262
Q Q =
2
, ( ) Q rang r = , ) (
,
IR M L
n n
e , u = LQ . Atunci, ( ) r Q
2
2
1
e ' c c
o
,
N L e c i vectorul aleator c L , mpreun cu variabila aleatoare c c
o
Q '
2
1
, sunt
independeni.

Statisticile amintite n Propoziia 12.3.6, pot servi la realizarea inferenei
asupra estimatorilor de cele mai mici ptrate. ncepnd de aici, n tot restul
paragrafului, vom presupune adevrate ipotezele modelului liniar clasic. Ne vom
referi, pentru nceput, la inferena prin intervale de ncredere.

Interval de ncredere pentru coeficieni

Dac n statistica T din Propoziia 12.3.6.iii, se particularizeaz
( )
p
k
IR e = ' = ' 0 ,..., 1 ,..., 0 , 0 o o , se obine statistica Student, cu p n grade de
libertate,

k
k k
k
s
a
T
o
= , (12.3.9)

unde
2
k
s este produsul dintre
2
s i elementul al k-lea, diagonal, al matricei
( )
1
'x x . Pe baza acesteia, se poate construi un interval de ncredere pentru
coeficieni, de forma

o

=
|
|
.
|

\
|
+ < <

1
2
1 ,
2
1 , p n
k k k
p n
k k
t s a t s a P , (12.3.10)

unde
2
1 ,

p n
t este cuantila de ordin
2
1

, a unei variabile Student, cu p n
grade de libertate, care rezult pentru un nivel de semnificaie , fixat, din
relaia

=
|
|
.
|

\
|
<

1
2
1 , p n
k
t T P , (12.3.11)

Desigur, n cazul n care o este cunoscut, nu mai este nevoie de operaia
de studentizare i atunci, se poate folosi statistica U, din Propoziia 12.3.6 iii. Pot
fi de asemenea elaborate regiuni de ncredere, pentru
n
IR x e o i
p
IR e o ,
regiuni pe care nu le vom aminti aici. Atunci cnd o este necunoscut, pe lng
estimaia punctual s, se poate da i un interval de ncredere pentur varian.
263
Interval de ncredere pentru varian

Pe baza statisticii
2
, cu p n grade de libertate, din Propoziia
12.3.6.ii, se poate construi un interval de ncredere pentru
2
o , de forma

( ) ( ) o

=
|
|
|
.
|

\
|

< <


1
2
2
,
2
2
2
2
1 ,
2
p n p n
s
p n
s
p n P , (12.3.12)

unde
2
2
1 ,

p n
i
2
2
,

p n
sunt cuantilele de ordin
2
1

, respectiv
2

, ale unei
variabile
2
, cu p n grade de libertate, determinate astfel nct pentru un nivel
de semnificaie , fixat, s aib loc relaia


=
|
|
.
|

\
|
< <

1
2
2
1 ,
2 2
2
, p n p n
P . (12.3.13)


n ultima parte a acestui paragraf, vom prezenta un al doilea aspect al
inferenei asupra estimatorilor i anume, testrile de ipoteze asupra coeficienilor.

Testul T pentru coeficienii unui model liniar

Ipotezele acestui test sunt ipoteza nul,
( ) 0
0
:
k k
H o o = i alternativa ei,
( ) 0
1
:
k k
H o o = , ceilali coeficieni fiind n afara ipotezelor.
Testul se fundamenteaz pe o statistic de tip Student, cu p n grade de
libertate,
k
T , precizat n formula (12.3.9). Pentru nivelul de semnificaie ,
rezult cuantila
2
1 ,

p n
t , de ordin
2
1

, a unei variabile Student, cu p n
grade de libertate aa nct,

=
|
|
.
|

\
|
<

1
0
2
1 ,
H t T P
p n
k
.

Se calculeaz valoarea
( )
k
k k
k
s
a
t
0
o
= , a statisticii
k
T , pe baza datelor de
selecie i se respinge ipoteza nul, dac
2
1 ;


>
p n
k
t t .
264
Un caz particular al acestui test este cel al semnificaiei coeficientului
k
o ,
test bazat pe ipotezele 0 :
0
=
k
H o i 0 :
1
=
k
H o .
Urmtoarele dou teste clasice, pe care le vom prezenta, se bazeaz pe o
statistic de tip Fisher-Snedecor, furnizat de urmtorul rezultat din teoria
probabilitilor ([19]).

Lema 12.3.8. Fie vectorul aleator ( )
n
c c c ,...,
1
= ' , ce urmeaz legea normal, cu
( ) I N
2
,o u c e i fie matricele ) (
,
IR M x
p n
e , ) (
,
IR M A
q p
e ,
) (
, 0
IR M xA x
q n
e = . Dac se noteaz ( ) x x x x I Q ' ' =
1
i
( )
0
1
0 0 0 0
x x x x I Q ' ' =

, atunci statistica

( ) ( ) ( ) Q rang
Q
Q rang Q rang
Q Q
F
c c c c c c '

' '
=
0
0
(12.3.14)

urmeaz legea de probabilitate Fisher-Snedecor, cu ( ) ( ) Q rang Q rang
0
i
( ) Q rang grade de libertate.

Vom nota pe tot parcursul acestui paragraf,

c c
0
2
0
Q S ' = i c c Q S ' =
2
1
. (12.3.15)

Se observ c, dac matricea X din lem este matricea datelor de selecie
dintr-un model liniar, atunci avem H I Q = , unde H este matricea de influen.
Mai mult, vom avea
0 0
2
0
2
0
e e e S ' = = i e e e S ' = =
2
2
1
. n cazul formulrii
unei ipoteze
0
H , asupra coeficienilor unui model liniar, ipotez n cadrul creia
matricea datelor de selecie devine de forma
0
X din lem, notaiile
2
0
S i
2
1
S
reprezint suma ptratelor reziduurilor, n modelul redus (obinut n ipoteza
0
H ),
respectiv suma ptratelor reziduurilor, n modelul complet (obinut n ipoteza
1
H ).

Testul F al egalitii ntre q coeficieni

Se testeaz ipoteza nul, p q H
q
s = = , ... :
1 0
o o , cu alternativa,
:
1
H
0
H fals. Pentru un nivel fixat , se determin valoarea

=
1 ; ; 1 p n q
f f ,
a unei statistici Fisher-Snedecor, cu 1 q i p n grade de libertate, astfel
nct,

265
( ) = < 1
0
H f F P .

Ipoteza nul se va respinge, dac f f
c
> , unde
2
1
2
1
2
0
1 S
S S
q
p n
f
c

= este
o valoare calculat a statisticii F din Lema 12.3.8, pe baza datelor de selecie.

Testul F al semnificaiei a q coeficieni

Se testeaz ipoteza nul, p q H
q
s = = = , 0 ... :
1 0
o o cu alternativa,
:
1
H
0
H -fals. Pentru un nivel fixat , se determin o valoare

=
1 ; ; p n q
f f , a
unei statistici Fisher-Snedecor, cu q i p n grade de libertate, astfel nct,

( ) = < 1
0
H f F P .

Ipoteza nul se va respinge, dac f f
c
> , unde
2
1
2
1
2
0
S
S S
q
p n
f
c

= este
o valoare a statisticii F din Lema 12.3.8, calculat pe baza datelor de selecie.

Exemplul 12.3.9. Relund datele din Exemplul 12.2.8, ne propunem s
determinm intervalele de ncredere de tip 95% pentru coeficienii modelului
liniar simplu.

Soluie
Aplicnd formula (12.3.10), intervalele de ncredere de tip 95% pentru
coeficienii modelului estimai n Exemplul 12.2.8, vor fi (0.9156, 1.336) pentru
a i (-3.086, -0.4451) pentru b.


12.4. Previziunea i analiza rezultatelor unei regresii liniare

Ne propunem, n acest paragraf, s amintim principalele aspecte care in
de previziunea i analiza rezultatelor unei regresii liniare, dei, marea parte a
aspectelor i statisticilor considerate aici sunt valabile i n cazul altor modele.
([5]). Elaborarea unui model de regresie are ca scop, pe lng determinarea unui
mecanism, care s copieze comportamentul dependenei studiate i acela de a
putea previziona, adic de a obine o estimaie ct mai bun, pentru o valoare
0
y ,
corespunztoare unor noi date pentru variabilele
p
x x x ,..., ,
2 1
. O astfel de
previziune primete credit, atunci cnd specificarea modelului de regresie din
care se obine, este corect. Astfel, nainte de a realiza previziuni asupra
variabilei endogene y, este necesar s ne asigurm c ipotezele fcute asupra
modelului, n special asupra erorii, sunt valide. Vom discuta pe rnd, n acest
266
paragraf, ipotezele respective, vom aminti tehnicile de verificare a lor, precum i
posibilitile de corectare a situaiilor n care ipotezele nu sunt valide. De
asemenea, vom aminti cteva statistici care se folosesc pentru a analiza calitatea
ajustrii datelor, prin model, precum i intervalul de ncredere pentru previziune.

Controlul ipotezelor liniaritii modelului

n literatur, sub denumirea de ipoteze ale liniaritii modelului, se
ntlnesc de fapt, ipotezele clasice, definite n paragraful anterior (erori normale
de medie zero, independente i identic distribuite), la care se adaug ipoteza
necorelaiei ntre erori i variabilele exogene,
p
X X X ,..., ,
2 1
i desigur, absena
corelaiei ntre variabilele exogene (absena multicoliniaritii). Verificarea
ultimei ipoteze ine de tehnici ale corelaiei, care fac obiectul acestui capitol.
Nevalidarea acestei ipoteze duce la erori mari n model de aceea, pentru a nu
compromite din start modelul, se ncearc satisfacerea acestei condiii. innd
cont de aceste dou aspecte, nu vom mai relua aici aceast ipotez. E bine de
specificat c, dei au denumirea de ipoteze ale liniaritii, sunt de fapt
presupuneri care nu au legtur cu caracterul liniar al modelului, de aceea le
putem ntlni i la alte modele, unde vor fi analizate n mod asemntor.
Vom analiza n continuare ipotezele rmase, n cadrul unui model liniar.
Deoarece aceste ipoteze se refer la erorile din model, pentru verificarea lor se
determin modelul, se calculeaz reziduurile n i e
i
, 1 , = , precizate n Definiia
12.2.4 i se analizeaz aceste reziduuri, presupunnd c ele constituie de fapt,
estimatori pentru erorile n i
i
, 1 , = c .

Ipoteza normalitii

Ipoteza N e c este necesar pentru obinerea unor estimatori eficieni ai
coeficienilor i de asemenea, pentru obinerea unor estimatori ce urmeaz legea
normal. Verificarea normalitii erorilor se poate face prin teste de concordan,
fie prin intermediul testului lui Massey (vezi [15]), atunci cnd n este mic, fie
prin testul Kolmogorov-Smirnow (vezi [23]), atunci cnd n este mare. Ambele
teste se bazeaz pe compararea frecvenelor cumulate empirice, cu frecvenele
teoretice, corespunztoare legii normale. Ipoteza normalitii, dei necesar, nu
este crucial atunci cnd volumul eantionului este mare. Teorema central
limit (vezi [23]) ne asigur c, atunci cnd n , dei c nu urmeaz legea
normal, avem c estimatorul de cele mai mici ptrate a, al lui o , converge la
legea normal. Mai precis, se introduce factorul de normalizare n i se obine
c, atunci cnd n este mare, ( ) o a n converge asimptotic, ctre o variabil
normal, ( ) ( ) a Var n N , 0 , de unde ( ) ( ) a Var N a
n
; o

. Pentru eantioane mici,
dac se respinge ipoteza normalitii erorilor, se reprezint reziduurile i se
calculeaz coeficienii de asimetrie i boltire ai lui Fisher, relativ la
i
e , pentru a
267
aprecia mrimea deviaiei de la normalitate. Se vor elimina acele observaii
pentru care reziduurile sunt foarte mari, aa nct reziduurile rmase s se
apropie mai mult de valori normale i se va reface modelul doar cu noile
observaii.

Ipoteza zgomotului alb

Presupunerea ( ) 0 = c E este necesar n obinerea de estimatori a,
nedeplasai, adic ( ) o = a E . Aceast ipotez arat de asemenea, faptul c erorile
din model nu sunt erori sistematice. Verificarea acestei ipoteze se poate realiza
prin analiza grafic a reziduurilor sau prin analiza (grafic sau numeric) a
intervalelor de ncredere, pentru media erorii. Astfel, se reprezint grafic
reziduurile, fiind necesar ca valorile acestora s oscileze n jurul dreptei de
ecuaie, 0 = y . Pentru prezentarea intervalelor de ncredere pentru media erorii,
vom aminti mai nti, noiunea de reziduu studentizat. Conform Propoziiei
12.3.4.i, reziduurile sunt n general corelate i varianele lor depind de locaia
punctelor. n vederea obinerii unei statistici Student, util n testele de ipoteze,
precum i n intervalele de ncredere referitoare la erori, este necesar
studentizarea reziduurilor, proces care const n acest caz, ntr-o scalare care
implic obinerea aceleiai variane pentru reziduuri. n [29], se definete
reziduul studentizat sub forma:

Definiia 12.4.1. Se numete reziduu studentizat, expresia

i
i
i
h s
e
t

=
1
, (12.4.1)

care nainte de eantionare este o variabil aleatoare ce urmeaz legea Student,
( ) p n T . Elementul
i
h este elementul diagonal al matricei de influen H, iar s
este eroarea standard a estimaiei, definit n formula (12.3.7).

n literatura de specialitate, se ntlnesc de asemenea i alte forme ale
reziduurilor studentizate. Astfel, n pachetul de programe Matlab, utilizat i n
statistic, se folosete urmtorul reziduu studentizat,

( )
( ) 1
1
e

p n T
h s
e
t
i i
i
i
, (12.4.2)

unde

268
( )
( )( )
i
i
i
h p n
e
p n
e
s

1 1 1
2
2
2
(12.4.3)
este estimatorul varianei erorilor
2
o , obinut prin omiterea datei a i-a,
( ) p n 1 , fiind astfel, numrul gradelor de libertate din model.
Acelai program folosete urmtorul interval de ncredere pentru media
erorii, precizat prin limitele sale,

( )
n i h s t e
i i
p n
i
, 1 , 1
2
1 ; 1
=



, (12.4.4)

unde
2
1 ; 1

p n
t este cuantila de ordin
2
1

, a variabilei Student, cu 1 p n
grade de libertate, iar
( ) i
s

este cel din (12.4.3). Aceste intervale pot fi
reprezentate printr-un grafic cu bare, mpreun cu reziduurile
i
e . Intervalele de
ncredere care nu-l includ pe 0 sunt echivalente cu respingerea ipotezei c
( ) 0 = c E , respingere fcut pentru pragul de semnificaie . n cazul respingerii
ipotezei de zgomot alb asupra erorii, se elimin acest neajuns, prin scoaterea din
model a acelor observaii pentru care intervalul de ncredere (12.4.4) nu-l conine
pe 0.

Ipoteza necorelaiei erorilor cu variabilele exogene

Ipoteza inexistenei unei corelaii ntre eroare i cte o variabil exogen
p k X
k
, 1 , = , asigur obinerea de estimatori optimali, prin metoda celor mai
mici ptrate. Dac exist corelaie ntre acestea, atunci estimatorul a va fi doar
asimptotic nedeplasat. S-a constatat c deplasarea asimptotic obinut pentru a
este mic, atunci cnd coeficientul de corelaie liniar simpl, ntre c i
k
X , este
mic ([15]). Amintim aici, definiia coeficientului de corelaie liniar simpl.

Definiia 12.4.2. Numim coeficient de corelaie liniar simpl (Bravais-
Pearson), ntre dou variabile aleatoare, X i Y, parametrul

( )
( ) ( ) ( ) ( )
Y X Y X
Y E X E XY E Y X
Y X r
o o o o

=

=
, cov
, . (12.4.5)

Coeficientul de corelaie liniar simpl Pearson, de selecie, are valori
cuprinse ntre 1 i 1 i se va calcula cu formula

269
( )
( )( )
( ) ( )

= =
=


=
n
i
i
n
i
i
n
i
i i
y y x x
y y x x
y x r
1
2
1
2
1
, , (12.4.6)

Dac r se apropie de 1, variabilele sunt liniar corelate. n cazul n care r se
apropie de 0, nu sunt liniar corelate, iar dac X,Y sunt normale i 0 = r ,
variabilele sunt independente.
De asemenea, se cunoate c statistica

( ) 2
1

2
2

= n
r
r
T (12.4.7)

urmeaz legea Student, cu 2 n grade de libertate. Aadar, corelaia ntre
variabila rezidual i variabila exogen
k
X se poate testa printr-un test de
corelaie, bazat pe ipoteza ( ) 0 , :
0
= c
k
X r H , ipotez care presupune necorelaia.
n cazul n care valoarea calculat a statisticii (12.4.7) depete cuantila de
ordin , a unei variabile Student, cu n-2 grade de libertate, fiind pragul de
semnificaie al testului, se respinge ipoteza
0
H . Aceleai informaii se pot
obine, analiznd graficul n care reziduurile sunt reprezentate n funcie de
valorile observate ale variabilei
k
X . Graficul respectiv nu trebuie s dea
impresia vreunei tendine, existena acesteia ducnd la concluzia c exist
corelaie. Atunci cnd corelaia este mare, deplasarea asimptotic a estimatorului
va fi de asemenea, mare i e de preferat ncercarea unui alt model.

Ipoteza homoscedasticitii modelului

n cazul n care condiia de homoscedasticitate (erori identic distribuite),
( )
2
o c =
i
V , nu este ndeplinit, modelul se numete heteroscedastic. ntr-un
astfel de caz, rezult c intensitatea influenei variabilelor exogene asupra celei
endogene difer de la o observaie la alta. Condiia ( ) n i V
i i
, 1 ,
2
= = o c , sau
( ) ( )
2 2
2
2
1
,..., ,
n
diag V o o o c = nu afecteaz nedeplasarea estimatorului a de cele
mai mici ptrate, ns influeneaz variana acestuia. ntr-un model
heteroscedastic avem, ( ) 0 a V , numai atunci cnd lipsete corelaia ntre
2
i
o i
p i x
ki
, 1 , = , adic atunci cnd ordinul de mrime al variabilelor, pentru diverse
observaii, este acelai. Aceast condiie este ns, foarte rar satisfcut n
practic. Astfel, n general dac modelul este heteroscedastic, eroarea ( ) a V a
estimatorului crete, prin urmare, crete i eroarea medie de estimare.
270
Pentru testarea homoscedasticitii, se cunosc mai multe metode. Una
dintre ele apeleaz la un test de comparare a mai multor dispersii, cum ar fi testul
lui Bartlet (vezi [15]), bazat pe legea
2
. Ipoteza
0
H de egalitate a dispersiilor
se va respinge, dac valoarea calculat a statisticii aferente testului depete
cuantila corespunztoare unui anumit prag de semnificaie i legii
2
. De
asemenea, se poate face un test de ipotez bazat pe reziduuri. Pentru n mare
(dup [29]), reziduul studentizat
i
t trebuie s fie cuprins ntre 2 i 2. Se
compar
i
t calculat cu valoarea critic a distribuiei, precizate n formula
(12.4.2). Cazul cnd reziduul
i
t este mare genereaz ndoieli asupra faptului c
reziduul are aceeai varian ca i celelalte, ceea ce duce la nesigurana ipotezei
( ) n i V
i
, 1 ,
2 2
= = o c .
Pentru corectarea heteroscedasticitii se utilizez n general, rescalarea
modelului. Spre exemplu, pentru un model de forma

n i x a x a y
i i i i
, 1 ,
2 2 1 1
= + + = c ,

dac

( )
2
2
2
1
2
i i i i
x x V o c = = ,

se scaleaz modelul astfel,

i i
i
i i i i
i
x x x
a
x
a
x x
y
2 1 1
2
2
1
2 1
1 1 c
+ + =

i atunci, n i
x x
V
i i
i
, 1 ,
2 1
= =
|
|
.
|

\
|

c
.

Ipoteza independenei erorilor

Aceast ipotez revine la

( ) I V
2
c
o c =

sau

( ) n j i j i
j i
, 1 , , , 0 , cov = = = c c .
271
Autocorelaia erorilor presupune ( ) j i
j i
= = , 0 , cov c c . Ipoteza de independen
este necesar n obinerea estimatorilor de varian minim (optimali), prin
metoda celor mai mici ptrate, dar nu i n obinerea estimatorilor nedeplasai.
Autocorelaia erorilor se regsete n principal, n cazul modelelor
dinamice (serii de timp). ntr-un astfel de model, din cauza proastei specificri,
influena erorii unei perioade asupra alteia devine plauzibil. Dup [15],
autocorelaia erorilor poate aprea n modelele statistice, doar dac rezultatele
observrii au fost aranjate n prealabil, cresctor sau descresctor, n raport cu
variabila endogen Y. Pentru validarea ipotezei de independen a erorilor, se
poate folosi, att metoda bazat pe analiza graficului reziduurilor, ct i un test
de corelare. Din punct de vedere grafic, se cerceteaz comportarea empiric a
reziduurilor
n
e e ,...,
1
, care nu trebuie s dea impresia unei tendine. Altfel spus,
reziduurile nu trebuie s aib pentru mai multe observaii consecutive aceeai
comportare, spre exemplu, nu trebuie s fie numai pozitive sau numai negative.
Pentru necorelaie, ele trebuie s fie mprtiate aleatoriu n jurul axei absciselor.
Din punct de vedere cantitativ, se poate folosi testul Durbin-Watson (vezi
[29]), care verific ipotezele
i
H c :
0
necorelate i

0 , :
1 1
> + =

o oc c
i i i
u H (proces autoregresiv de ordin I).

Statistica aferent testului este

( )
| | 4 , 0
1
2
2
2
1
e

=
=

n
i
i
n
i
i i
e
e e
d . (12.4.8)

Pentru a admite ipoteza necorelrii, trebuie ca valoarea lui d s fie n jurul lui 2.
n cazul n care se depisteaz o autocorelaie, se corecteaz calitatea
estimatorilor, folosind metoda celor mai mici ptrate generalizate ([30]).
Odat validate sau corectate ipotezele liniaritii modelului, avem
asigurate pentru estimatorii de cele mai mici ptrate, calitile discutate n
paragraful 12.3. Un alt aspect n analiza rezultatelor regresiei ine de calitatea
ajustrii.

Calitatea ajustrii

Pentru a analiza calitatea ajustrii se pot folosi, att metode numerice, ct
i metode grafice. Metodele grafice (folosite n special n cazul unui singur
predictor) se refer, n mare parte, la analiza reziduurilor, analiz care aa cum s-
a vzut n prima parte a acestui paragraf, se poate realiza i numeric. Metodele
numerice utilizate n analiza calitii ajustrii se bazeaz pe interpretarea ctorva
statistici.
272
Analiza reziduurilor

Pe lng verificarea ipotezelor liniaritii, studiul reziduurilor poate fi
folosit i n cadrul altor modele de regresie, n vederea reperrii observaiilor
aberante(outlieri). n prima parte a paragrafului, s-a vzut deja instrumentarul
folosit n analiza reziduurilor.
Astfel, dintre mai multe ajustri (n regresii cu un singur predictor, liniare
sau nu), se va prefera aceea n care reziduurile sunt aleator mprtiate n jurul lui
zero, fr a comporta o tendin.
n acelai sens, se poate face i comparaia curbelor ajustate, n raport cu
norul statistic. Pentru eliminarea observaiilor aberante, se poate folosi, de
exemplu, testul fundamentat pe reziduurile studentizate i pe statistica (12.4.1)
sau (12.4.2). Un reziduu prea mare poate indica o valoare aberant, dar o valoare
aberant nu are neaprat reziduul mare. Un alt criteriu care s desemneze valorile
aberante ar fi cel bazat pe intervalul de ncredere (12.4.4). Reziduul pentru care
intervalul nu conine valoarea zero indic o valoare aberant.

Influena observaiilor

Am vzut cum poate fi eliminat o observaie aberant. S vedem acum
care ar fi influena unei astfel de observaii, n cazul n care ea ar rmne n
model.
Definiia 12.4.3. Dac notm cu
( ) i
y

, valoarea ajustat(prezis) pentru
i
y
(definit n formula (2.1.10), care se obine atunci cnd este omis observaia a
i-a, vom numi reziduu prezis, valoarea
( ) i i
y y

.
Conform cu [29], se poate arta c

( )
i
i
i i
h
e
y y

>

1
,

aadar observaiile pentru care
i
h e mare i/sau reziduurile sunt mari (observaii
aberante), duc la previziuni suspecte, cci
( ) i i
y y

va fi mult diferit de zero. Ca
o msur a puterii de prezicere a modelului, se cunoate statistica

=
|
|
.
|

\
|

=
n
i i
i
h
e
PRESS
1
2
1
. (12.4.9)

O valoare mic a statisticii indic o putere mare de prezicere. Astfel,
pentru o bun prezicere, trebuie eliminat influena observaiilor aberante (
i
e
mare) sau cele care au
i
h mare. Influena observaiilor asupra estimatorilor este
dat de distana lui Cook,
273
( )
( ) ( )
( )
( )
( )
2
2
2
2

1
1
ps
y y
h
h
e
p ps
a a x x a a
D
i
i
i
i
i i
i


=

=
'
'

= . (12.4.10)

Aici,
( ) ( ) i i
xa y

= ,
( ) i
a

este estimatorul obinut prin eliminarea
observaiei i, iar celelalte elemente au aceeai semnificaie ca n paragraful 12.3.
O observaie se consider a avea o influen anormal, dac 1 >
i
D .

Analiza estimaiilor obinute

Estimatorul a este determinat cu mai mult acuratee, atunci cnd
intervalele de ncredere (12.3.10), pentru coeficieni, sunt mai restrnse.
n continuare, vom prezenta cteva statistici care pot fi folosite pentru
evaluarea i de asemenea, compararea mai multor modele.

Coeficientul de corelaie multipl

Pentru a putea face legtura ntre acest coeficient i coeficientul de
corelaie liniar multipl, vom aminti mai nti definiia acestuia.

Definiia 12.4.4. Se numete coeficient de corelaie liniar multipl, parametrul

( )
|
|
.
|

\
|
=

=
p
i
i i
a
p
Y X a r Y X X X r
i 1
2 1
, sup , ,..., , , (12.4.11)

unde r este coeficientul de corelaie liniar simpl, definit n formula (12.4.5).
Coeficientul de corelaie liniar multipl, de selecie (eantionare), se va
nota cu ( ) y x x x r
p
, ,..., ,
2 1
i este dat de

( )
|
|
.
|

\
|
=

=
p
i
i i
a
p
y x a r y x x x r
i 1
2 1
, sup , ,..., , . (12.4.12)

n cazul particular cnd 1 = p , se obine valoarea absolut a
coeficientului de corelaie liniar simpl. n [30], se demonstreaz c, dac y
este valoarea ajustat a lui y (precizat n Definiia 12.2.4.), dintr-un model de
regresie liniar cu termen constant, atunci

( ) ( ) y y r y x x x r
p
, , ,..., ,
2 1
= . (12.4.13)

274
Altfel spus, metoda celor mai mici ptrate determin acea combinaie liniar
ntre variabilele exogene, pentru care corelaia cu variabila endogen este
maximal. n plus, se poate demonstra c

( )
y y
y y
y x x x r
p

, ,..., ,
2 1
, (12.4.14)

sau ntr-o alt formulare

( )
2
2
2
2
2 1
2

, ,..., ,
y y
y y
y y
y y
y x x x r
p

= . (12.4.15)

Se poate afirma atunci, c coeficientul de corelaie liniar multipl
reprezint proporia n care variaia lui Y este explicat prin regresia liniar pe
p
X X X ,..., ,
2 1
, cu termen constant. Are loc relaia
( ) ( ) 1 , ,..., , , , ,..., , 0
2 1
2
2 1
s s y x x x r y x x x r
p p
, o valoare apropiat de unu fiind o
posibil acoperire a faptului, c modelul liniar este potrivit pentru a explica
variabila Y. Pentru a realiza inferena asupra estimatorului r , se folosete
statistica de tip Fisher Snedecor, cu 1 p i p n grade de libertate,

1 1

2
2

=
p
p n
r
r
F (12.4.16)

i se emite ipoteza nul, 0 = r , care este echivalent de fapt, cu ipoteza
0
, , 1 , 0 o o p k
k
= = oarecare, ipoteze ce infirm regresia liniar. Ipoteza nul se
va respinge, dac valoarea calculat a statisticii (12.4.16) depete cuantila
corespunztoare legii Fisher-Snedecor i pragului de semnificaie . Totui,
chiar dac 1 ~ r i valoarea real r este semnificativ ( ) 0 :
1
= r H , acest lucru
nu indic neaprat o corelaie real. Spre exemplu, n cazul regresiei simple,
aceste situaii cu privire la r i r pot aprea, ca urmare a unei corelaii paralele
pe care, att variabila y, ct i variabila x, o poate avea cu o a treia variabil.
Pentru a elimina influena acestei de-a treia variabile, se poate calcula un
coeficient de corelaie parial, cu formula

2 2
.
1 1

xz yz
xz yz yx
z yx
r r
r r r
r


= ,

formul ce poate fi extins i n cazul regresiei multiple.
275
Testul bazat pe
2
r , prezentat mai sus, este unul de semnificaie al
coeficienilor de regresie n ansamblul lor i n acelai timp(prin r ), al
semnificaiei regresiei liniare cu termen constant, test folosit n analiza
rezultatelor regresiei. Spre exemplu, n Matlab, se ntoarce ca i informaie de
regresie, valoarea calculat a statisticii F i p valoarea asociat acestei statistici,
adic probabilitatea critic,

( )
calculata p n p
F F c

=
, 1
1 . (12.4.17)

Dac s c , prag de semnificaie, se respinge ipoteza
0
H .
Deoarece r , dat prin (12.4.13), s-a definit doar pentru y rezultat din
modelul liniar cu termen constant, nu vom putea vorbi de aceste elemente, n
cazul unui model de regresie liniar oarecare. Pentru modelul de regresie liniar
fr termen constant, se pot folosi testele F de semnificaie asupra unui
subansamblu al coeficienilor, precum i testul T asupra fiecrui coeficient n
parte, teste prezentate n paragraful 12.3. Un test pentru ansamblul coeficienilor
se poate face i pentru modelul de regresie liniar fr termen constant, folosind
statistica de tip Fisher-Snedecor, cu p i p n grade de libertate (vezi [29]):
,

( ) ( )( ) o o '
'
= a x x a
ps
F
2
1
.

Totui, att pentru modelul liniar fr termen constant, ct i pentru un
model de regresie oarecare, se poate defini o caracteristic asemntoare cu r,
caracteristic pe care o vom numi coeficient de corelaie multipl(oarecare).
Definiia 12.4.5. Numim coeficient de corelaie (determinaie) multipl
(oarecare), parametrul definit prin

( )
2
2
2
,
1
T
R
y y
S
S
R = , (12.4.18)

unde

( )
2
1
2

=
=
n
i
i T
y y S , sum de ptrate total,
(12.4.19)
( )

=
=
n
i
i i R
y y S
1
2 2
, sum de ptrate rezidual (indus de reziduuri),

iar y este valoarea ajustat (prezis) a lui y, prin modelul considerat.
276
Aadar, coeficientul de corelaie multipl se calculeaz cu formula

( )
( )
2
2
2
2
2 2
1
2
1
2
2

1
y y
y y y y
S
S S
y y
y y
R
T
R T
n
i
i
n
i
i i

=
=
. (12.4.20)

Mrimea
2
R reprezint o msur a calitii ajustrii datelor, prin modelul
de regresie oarecare, n urma creia rezult valoarea ajustat(prezis), y .
Aceast mrime se poate folosi pentru a compara mai multe ajustri diferite i
poate fi calculat, pentru orice model de regresie, chiar i pentru cele
neparametrice. Totui, n [30], Stapleton atrage atenia, c
2
R bazat pe scri
diferite nu sunt comparabile. Aceast observaie se refer la cazul cnd pentru
ajustare e necesar o transformare. De exemplu, ( ) y y R ,
2
se poate compara cu
( ) y y R
z
,
2
, dar nu cu ( ) z z R , , dac ( ) y g z = , z , valoarea ajustat a lui z, din
modelul liniar al lui z pe x, y , valoarea ajustat a lui y, din regresia lui y pe x,
( ) z g y
z

1
= . O valoare mare a lui
2
R va indica o mai bun apropiere a modelului
fa de date. Acest lucru se poate vizualiza i grafic, pentru modelul cu un singur
regresor. Din formula (12.4.20), se observ c
2
R poate lua i valori negative,
valoarea maxim fiind 1.
Acest parametru este cunoscut n literatura de specialitate, doar sub
denumirea de R-ptrat. Am preferat s-l numim aici coeficient de corelaie
multipl (oarecare), deoarece atunci cnd y provine dintr-un model de regresie
liniar cu termen constant,
2
R coincide cu coeficientul de corelaie liniar
multipl,
2
r , din formula (12.4.15). ntr-adevr, pentru modelul liniar cu termen
constant are loc regula de adunare a varianelor (ANOVA),

( ) ( ) ( )

= = =
+ =
n
i
n
i
n
i
i i i i
y y y y y y
1 1 1
2
2
2
(12.4.21)

sau altfel,

2
2
2
y y y y y y + = (12.4.22)

sau nc,

2
2 2
y y S S
R T
= (sum indus de model). (12.4.23)

277
n general, aceast regul nu are loc, de aceea prima parte a formulei
(12.4.15) nu este valabil pentru
2
R i deci,
2 2
r R = , diferen confirmat i de
faptul c n general,
2
R poate lua valori negative (mai precis pentru modele fr
termen constant), n timp ce
2
r nu poate. Totui
2
R i
2
r au aceeai
semnificaie i anume, precizeaz proporia,
|
|
.
|

\
|
2
2 2
T
R T
S
S S
, n care un model
explic bine datele, numai c
2
r se refer strict la modelul liniar cu termen
constant. Spre exemplu, o valoare de 0,97 a lui
2
R ne arat, c modelul din care
rezult y acoper variabilitatea observaiilor, n proporie de 97%.
O mrime asemntoare cu
2
R este i raportul de determinaie(corelaie),
( ) ( )
( )
0 >
X V
X Y V
, care coincide cu
2
R i cu
2
r (a se vedea [29]), pentru regresia
liniar simpl. n general, raportul de corelaie arat proporia n care factorul X
explic variabila Y , nepreciznd forma corelaiei, n timp ce coeficientul de
corelaie arat proporia n care factorul X (unidimensional) explic variabila Y,
prin intermediul unui anumit model de regresie.
Pe lng
2
R , tot ca i msur a calitii ajustrii, se folosete o variant
ajustat a sa. Necesitatea acestei ajustri rezid n faptul c
2
R nu este un criteriu
absolut al calitii ajustrii, n cazul cnd se compar dou modele cu un numr
diferit de parametrii. Astfel, dac p crete n regresia liniar, spre exemplu,
implic faptul c n model s-a inclus o nou variabil, ceea ce face ca
2
R
S s
scad i implicit, R s creasc artificial.

Definiia 12.4.6. Se numete coeficient de corelaie ajustat, parametrul

( )
2
2
1
1
1 R
p n
n
R

= . (12.4.24)

Astfel, factorul p n corecteaz modificarea artificial a lui
2
R , odat
cu modificarea lui p. Ca i n cazul lui
2
R , o valoare apropiat de 1 a lui
2
R va
arta o bun ajustare,
2
R fiind un criteriu bun pentru modele cu un numr diferit
de parametri.
Alte statistici care msoar numeric calitatea ajustrii (pe lng
2
R i
2
R ) sunt
2
R
S din formula (12.4.19) i s din formula (12.3.7). Statistica
2
R
S este
cunoscut i sub denumirea de sum de ptrate datorat erorilor i msoar
abaterea total a variabilei Y, de la model. O valoare apropiat de zero indic o
bun ajustare. Statistica s, numit i eroare standard a regresiei, este rdcina
ptrat a erorii medii ptratice, ntlnit sub notaia MSE sau RMS (media
ptratelor erorilor). O valoare a lui s apropiat de 0 indic o bun ajustare. Toate
aceste statistici pot fi definite i pentru alte modele dect cele liniare.
278
Odat stabilit i validat modelul de regresie, ne intereseaz problema
previziunii.

Intervale de ncredere pentru previziune

Pe lng intervalele de ncredere pentru previziune, pentru o nou
observaie, vom prezenta aici i intervale de ncredere pentru medie (pentru
funcia de regresie f), pentru a le putea compara. De asemenea, n literatura de
specialitate, se iau n calcul, att intervale simultane (pentru x oarecare), ct i
intervale nesimultane (pentru o singur valoare specificat,
0
x ). Vom considera
aici doar intervale nesimultane.

Cazul regresiei liniare (fr termen constant)

Presupunem c modelul c o + = x y , ( ) I N
2
,o u c e , a fost validat i c
ne intereseaz estimaii asupra unei noi valori,
0
y , a variabilei Y, date fiind
valorile
p
x x x
0 02 01
,..., , , ale variabilelor
p
X X X ,..., ,
2 1
, adic ne intereseaz s
previzionm o valoare a lui y(necunoscut). Avem

0 0 0 0 01 1 0
... c o c o o + ' = + + + = x x x y
p p
(12.4.25)

sau folosind modelul ajustat prin cele mai mici ptrate,

0 0 0 0 01 1 0
... e a x e x a x a y
p p
+ ' = + + + = .

Apar aadar, dou tipuri de erori n estimarea previziunii. Una se datoreaz noii
erori
0
c , cu care valoarea
0
y intr n model, iar alta se datoreaz erorii cu care s-
a estimat o . Sigur, n cazul n care dorim s estimm media
( ) ( ) o
0 0 0
x x f x X Y E ' = = = , atunci eroarea este mai mic i se reduce la eroarea
indus de o . Folosim notaia

a x y
0 0
' = , (12.4.26)

pentru a desemna previziunea punctual i dm n continuare, intervalul de
ncredere pentru

0 0 0
c o + ' = x y (previziune),

respectiv pentru

( ) ( ) o
0 0 0
x x X Y E x f ' = = = (medie).
279
Interval de ncredere pentru previziune:

( ) ( )

=
|
|
.
|

\
|
' ' + + s s ' ' +


1 1 1
0
1
0
2
1 ,
0 0 0
1
0
2
1 ,
0
x x x x st y y x x x x st y P
p n p n
.
(12.4.27)

Interval de ncredere pentru medie:

( ) ( ) ( )

=
|
|
.
|

\
|
' ' + s s ' '


1
0
1
0
2
1 ,
0 0 0
1
0
2
1 ,
0
x x x x st y x f x x x x st y P
p n p n
.
(12.4.28)

n ambele intervale, s, x, o i t au semnificaia precizat deja n acest
capitol. Se observ c intervalul pentru previziune este mai larg, datorit erorii
suplimentare care intervine prin
0
c . n cazul modelului liniar cu termen
constant, intervalele sunt aceleai, difer doar forma lui
0
x i x, care vor conine
i un 1, respectiv o coloan de 1 (a se vedea [29], [30]). n cazul regresiei liniare
simple, cnd funcia ajustat i intervalele pot fi vizualizate grafic, avem
urmtoarea situaie:

y
y=ax+b

medie
previziune

x



Figura 12.4.1



Avem aadar i vizualizarea faptului c intervalul de previziune este mai
larg, curbele corespunztoare ncadrnd, pentru acelai , curbele de la
intervalul pentru medie, care la rndul lor, ncadreaz dreapta de regresie. Dac
pe grafic ar fi vizualizate i datele, s-ar vedea c intervalele de ncredere pentru
previziuni includ punctele. Ca orice interval de ncredere i intervalele de
previziune pot fi instrumente n evaluarea calitii regresiei, acurateea
previziunii fiind cu att mai bun, cu ct intervalul este mai mic. Intervalele
280
simultane sunt asemntoare celor nesimultane, diferena fiind c se utilizeaz
distribuia Fisher-Snedecor, n loc de distribuia Student.

Exemplul 12.4.7. Relund datele din Exemplul 12.2.8, ne propunem s estimm
punctual i prin interval de ncredere de tip 95% rata rentabilitii aciunilor
respective corespunztoare unei rate a pieei de 2%.

Soluie
Calculnd previziunea punctual obinut pe baza modelului din
Exemplul 12.2.8, avem ( ) 5 , 0 2 13 , 1 76 , 1 2 ~ + = y , n timp ce o evaluare a
formulei (12.4.27) duce la intervalul de ncredere de tip 95% pentru previziune,
(-4,42; 5,39).



281
Capitolul 13

Statistic Bayesian i noiuni de teoria
credibilitii

13.1. Statistic Bayesian

Un asigurator are un contract care se deruleaz pe mai muli ani. Sumele
de bani pltite clienilor au fost X
1
,X
2
,,X
t
. innd seama de aceast experien,
care ar fi cel mai bun principiu de calcul al primei de asigurare pentru anul t+1?
Pentru asigurator, clientul este un risc, X.
Problema ar fi : cum am putea modifica prima de asigurare h(X) n aa fel
ca s in seama de experiena anilor trecui?
Nefiind precis formulat, aceasta NU este o problem matematic.
O problem oarecum mai abordabil ar suna astfel: n teoria asigurrilor,
media EX se numete premiul brut sau prima brut. La acesta se mai adaug
diverse sume care ar trebui s in seama de profit, de cheltuieli de regie precum
i de alte lucruri ce nu in de obiectul studiului nostru.
Problema de baz este gsirea repartiiei adevrate a lui X.
n statistica parametric clasic se presupune c repartiia F
X
aparine
unei clase de repartiii depinznd de un parametru necunoscut u e E. De
exemplu, putem crede c X ~ Poisson(u) sau X ~ Binomial(n,p), sau X ~ Exp(a).
n primul caz am avea o familie depinznd de un singur parametru, iar n al
doilea de una depinznd de doi parametri (cci u = (n,p) !) . Pentru a merge mai
departe ar trebui gsit adevratul u. Dac suntem dispui s credem c u nu se
modific la rndul lui n timp, am putea privi atunci experiena acumulat X
=(X
1
,,X
t
) ca o selecie de volum t dintr-o populaie F
u
. Caz n care s-ar pune
problema estimrii lui u.
Dac u ar fi unidimensional, am putea ncerca s gsim intervale de
ncredere pentru u, cu un anume risc asumat o. Acesta este punctul de vedere al
statisticii parametrice. Ea se folosete dac dispunem de multe date.
n acest capitol vom folosi ns o alt abordare, i anume cea Bayesian.
Parametrul u e E se numete factor de risc. Ideea de baz n abordarea
bayesian este c , necunoscnd valoarea adevrat a lui u, e ca i cum factorul
de risc ar fi la rndul lui o variabil aleatoare. O vom nota cu O. Formal,
avem un spaiu probabilizat pe care avem definit un vector de observaii X
=(X
1
,,X
t
) i o variabil aleatoare O cu valori n E
.



282
Desigur c apar unele probleme tehnice: va trebui ca spaiul parametrilor
E s fie organizat ca un spaiu msurabil (E,E). De obicei aceasta nu este o
problem, n cazurile clasice. De exemplu, n cazul repartiiei Poisson sau
exponeniale E = |0,); la binomial este N|0,1| care se organizeaz n mod
natural ca spaii msurabile cu o-algebra mulimilor boreliene B(|0,)) n
primele dou cazuri sau cu P(N)B(|0,1|) n al doilea. La repartiia normal
N(,o
2
), E = 9 (0,), etc.
Putem avea o idee despre repartiia factorului de risc, o credin. Aceasta
se numete repartiia apriori a factorului de risc O. n limbaj matematic,
repartiia apriori este repartiia iniial a lui O. n cele ce urmeaz ea va fi notat
cu U. Deci U (B)= P(O e B).
Dac parametrul O ia valoarea u , atunci repartiia seleciei noastre X ar
trebui s fie Q(u). Acesta se numete modelul. Deci pentru fiecare u e E , Q(u)
este o repartiie pe 9
t.
Aceasta este n definitiv repartiia condiionat a lui X
tiind c O = u.
Pe scurt o abordare Bayesian nseamn o repartiie apriori a
parametrului i un model. Ideea este s obinem din experien o ajustare a
repartiiei apriori, numit repartiia aposteriori a parametrului .
Modelul este de fapt o probabilitate de trecere de la mulimea E a
parametrilor la mulimea 9
t
a rezultatelor. Atunci tim de la capitolul privind
simularea variabilelor aleatoare c repartiia vectorului (O,X) este UQ iar
repartiia lui X este UQ. Amintim c cele dou operaii se definesc astfel
UQ(C) = ( ) ( )
}
u u
u
dU C Q , C _ E 9
t
msurabil (13.1.1)
UQ(B)
Def
= UQ(EB) = ( ) ( )
}
u u dU B Q , (13.1.2)
Exemplul 13.1.1. S presupunem c O ~ U(|0,1|) iar X ~ Binomial(1,O)
t
. Mai
explicit, modelul este urmtorul: dac adevrata valoare a lui O ar fi O = p e
|0,1| , atunci P(X
1
=c
1
,, X
t
= c
t
) ar trebui s fie p
v(1,c)
(1-p)
v(0,c)
unde v(1,c) = |{1sj s
t |c
j
= 1}| iar v(0,c) = |{1sj s t |c
j
= 0}| = t N(1,c). Cum afecteaz variabila
aleatoare N(1) repartiia iniial a lui O?

Exemplul 13.1.2. O generalizare. O ~ U(0,1) iar X ~ Binomial(n,O)
t
unde n este
presupus cunoscut. Atunci P(X
1
=x
1
,,X
t
= x
t
) =
t t t
x n x x n x x
n
x
n
C C

u u u u ) 1 ( ... ) 1 ( ...
1 1 1
=
S nt S x
n
x
n
x
n
t
C C C

u u ) 1 ( ...
2 1
unde S = S(x) = x
1
+ + x
t
.

n Exemplul 13.1.1, repartiia lui X este U(0,1)Q unde Q(u) =
Binomial(1,u)
t
. Deci din (13.1.2) avem
P(X = c) =
}
1
0
u
S
(1-u)
t-S
du = |(S + 1,t S + 1) (13.1.3)



283
unde c e Z
2
t
iar S = v(1,c)este definit n Exemplul 13.1.1. Funcia | este funcia |
a lui Euler , |(m+1,n+1) =
( ) ( )
( ) ) 1 ( ) 1 (
1 1
+ + + I
+ I + I
n m
n m
=
)! 1 (
! !
+ + n m
n m
. Rezult c P(X = c) =
)! 1 (
))! ( !
+

t
S t S
.
n Exemplul 13.1.2 diferena este c X este U(0,1)Q unde Q(u) =
Binomial(n,u)
t
deci
P(X = x) =
}
1
0
S nt S x
n
x
n
x
n
t
C C C

u u ) 1 ( ...
2 1
du =
t
x
n
x
n
x
n
C C C ...
2 1
|(S+1, nt -S+1) (13.1.4)

Rezumnd cele de mai sus putem concluziona : ntr-un model Bayesian U
este marginala pe spaiul parametrilor a repartiiei UQ a vectorului (O, X)
format din parametrul aleatoriu O i selecia X, (adic o probabilitate pe (E9
t
))
modelul Q(u) este repartiia seleciei condiionat de valoarea pe care o ia
parametrul,(o probabilitate de trecere de la E la 9
t
) iar a doua marginal, cea de
pe 9t este UQ repartiia seleciei X. Dac, aa cum se ntmpl n aplicaii, O
este la rndul lui un spaiu standard Borel, teorema de dezintegrare o putem
aplica i marginalei a doua. Deci exist o alt probabilitate de trecere U
1
, de data
aceasta de la 9
t
la E astfel nct U = U
1
(UQ) . Din punct de vedere probabilistic Q*
reprezint repartiia lui O condiionat de eantionul X . n jargonul Bayesian, U
1

este repartiia aposteriori a parametrului O dup observaia X.
Sensul ar fi c U
1
(x,A) = P(O e A | X = x).
n anumite condiii, suficient de largi pentru statistic, exist formule de
calcul a repartiiei aposteriori U
1
.
S presupunem c repartiia parametrului O, deci U , admite o densitate
fa de o msur o-finit t. De asemenea, presupunem c i repartiia observaiei
X condiionat de O = u este absolut continu fa o alt msur o-finit v, adic
admite o densitate q fa de v . Atunci se poate calcula repartiia aposteriori a lui
O.

Propoziia 13.1.3. Presupunem c E este o mulime borelian dintr-un spaiu
euclidian. n plus, presupunem c
(i). U = ut, unde t este o msur o-finit pe E;
(ii). Q(u) = q(u)v unde v este o msur o - finit pe 9
t

Atunci
P (O, X)
-1
= f
O, X
(tv) cu f
O,X
(u,x) = q(u,x)u(u) (13.1.5)
P X
-1
= f
X
v unde f
X
(x) =
}
q (u,x)u(u)dt(u) =
}
f
O,X
(u,x) dt(u) (13.1.6)
U
1
(x) = q*(x) t unde q*(x,u) =
}
o t o o
u u
) ( ) ( ) , (
) ( ) , (
d u x q
u x q
(13.1.7)
Notaii standard. O notaie mai sugestiv pentru q(u) este cea folosit n
statistic: f
X O = u
. Deci modelul este c, dac parametrul O ar lua valoarea u,



284
atunci densitatea lui X fa de v ar trebui s fie f
X O = u
. Atunci densitatea comun
a vectorului (O, X) fa de v este f
O, X
iar densitatea parametrului O n ipoteza
c c X = x este f
O X = x
. Reformulnd cu aceste notaii standard avem
densitatea lui (O,X) este f
O,X
(u, x) = f
X O = u
(x)f
O
(u) (13.1.8)
densitatea lui X este f
X
( x) = ( ) ( ) u t u
} O
d x f
X
,
,
(13.1.9)
densitatea aposteriori a lui O dat de rezultatul x este
f
O X = x
(u) =
( )
( ) x f
x f
X
X
,
,
u
O
(13.1.10)
Demontraia se poate gsi, de exemplu, n Gheorghi Zbganu, Metode
matematice n teoria i actuariat, Bucureti, Editura Universitii 2004, pp 236.

Continuare la exemplele 13.1.1 i 13.1.2.
Cu notaiile standardizate de mai sus avem
La exemplul 13.1.1: E = |0,1|, t = U(0,1), u(u) = 1, v = Card(Z
2
t
) este
msura cardinal pe Z
2
t
, densitatea modelului este f
X O = u
(x) = u
S
(1-u)
t-S
cu S
=|{1sj s t |x
j
= 1}|= x
1
++ x
t
.
Atunci
- f
O,X
(u,x) = u
S
(1-u)
t-S
1
(0,1)
(u)
- f
X
(x) =
}
q (u,x)u(u)dt(u) = |(S+1,t-S+1) =
)! 1 (
)! ( !
+

t
S t S

- f
O X = x
(u) =
)! ( !
)! 1 (
S t S
t

+
u
S
(1-u)
t-S

Recunoatem aici c repartiia aposteriori a parametrului O este o
repartiie Beta(S+1,t-S+1) .
Interpretarea: n urma unei experiment n care au aprut M de 1 i N
de 0 i n care apriori nu aveam nici o idee preconceputa asupra lui p credina
noastr asupra parametrului u ar trebui s fie dat de densitatea aposteriori u
1
(u) =
|
M+1,N+1
(u).
La exemplul 13.1.2: E, t, u sunt aceiai, dar v = Card(Z
n
t
);
- f
X O = u
(x)= C(x) u
S
(1-u)
t-S
cu C(x) =
t
x
n
x
n
x
n
C C C ...
2 1

- f
O,X
(u,x) = C(x) u
S
(1-u)
t-S
1
(0,1)
(u)
- f
X
(x) =
S
nt
x
n
x
n
x
n
C nt
C C C
t
) 1 (
...
2 1
+
(vezi (1.1.10)
- f
O|X = x
(u) =
) 1 , 1 (
1
+ + | S nt S
u
S
(1-u)
nt-S
deci repartiia aposteriori a
parametrului O este Beta(S+1, nt-S+1)



Observaie 13.1.4. Dar dac aveam o idee preconceput? De exemplu, dac
am fi crezut c p = o? Atunci statistica Bayesian nu ne-ar fi de nici un
folos. S presupunem c noi avem o credin apriori c O, parametrul nostru



285
are repartiia O ~
|
|
.
|

\
|
u
u u u
n
n
p p ... ...
... ...
2 1
2 1
. Atunci Q ar fi devenit o matrice
stocastic cu n linii i 2
t
coloane: Q(u
j
,x) = u
j
M(x)
(1-u
j
)
t-M(x)
. Cu notaiile din
Propoziia 13.1.3 am avea E ={u
1
,,u
n
} c |0,1|, t = Card(E) , u(u
j
) = p
j
, v =
Card(Z
2
t
), f
O,X
(u,x) = u
j
M(x)
(1-u
j
)
t-M(x)
)p
j
iar
f
O|X = x
(u
j
) =

u u
u u
n
i
i
x M t
i
x M
i
j
x M t
j
x M
j
p
p
1
) ( ) (
) ( ) (
) 1 (
) 1 (
(13.1.11)
n cazul particular n care n = 1 (deci credem orbete c O = u
1
) atunci
suma de la numitorul din (13.1.11) coincide cu numrtorul, deci f
O|X = x
(u
1
) = 1.
Ceea ce nseamn c indiferent ce ne spune experiena, vom continua a crede c
O=u
1
!
O explicaie este c experiena niciodata nu creeaz noi posibiliti
explicative, cel mult poate anula unele din ele sau s le fac mai neverosimile.

Exemplu 13.1.5. Un asigurator are n perspectiv un contract format din
riscuri repartizate binomial. El tie c X
r
~ Binomial(N, t), dar nu tie nici pe N ,
nici pe t. De exemplu X
r
pot fi piesele rebutate dintr-un lot de N piese. Mai tie
c n decursul derulrii contractului aceti parametri nu se schimb. Pentru a
avea o idee ce prim de asigurare s cear, are la dispoziie un istoric al
numrului de rebuturi X
1
,,X
n
. Experiena anterioar l face s cread c c N
i t sunt independente i c N ~

>
c o
1 n
n n
iar t ~ unde :|0,1| |0,) este o
densitate . Dac nu are nici o idee despre p- lucru destul de neverosimil - va lua
= 1
(0,1)
Deci
E = N|0,1|, O = (N,t) ,
t = Card
N
,
u = (n,p), f
O
(n,p) = o
n
(p) , (repartiia apriori)
f
X O=(n,p)
(x) = o
n
C(x , u)p
S
(1-p)
tn-S
cu C(x , u) =C(x,n) =
t
x
n
x
n
x
n
C C C ...
2 1

(acesta este modelul propriu zis!)
f
O,X
(u,x) = o
n
(p)C(x , u)p
S
(1-p)
tn-S
Repartiia lui X este o mixtur de binomiale. Putem scrie
f
O,X
(u,x) = (p)o
n
C(x , u)p
tM(x)
(1-p)
t(n - M(x))
(13.1.12)
unde M(x) este media aritmetic a primelor t observaii, tM(x) = x
1
+ + x
t
. Fie
x* = max (x
1
,,x
t
). Observnd c n < x* C(x,n) = 0 i nlocuind, obinem din c
f
X
(x) =
}
q (u,x)u(u)dt(u) =

=
o
* x n
n
C(x , n)
}

1
0
(p)p
tM(x)
(1- p)
t(N-M(x))
dp (13.1.13)
(dac t ~ U(0,1) atunci f
X
(x) =

=
o
* x n
n S
nt
x
n
x
n
x
n
C nt
C C C
t
) 1 (
...
2 1
+
) iar din (13.1.13)



286
f
O|X = x
(n,p) =

o
o
*
)) ( ( ) (
)) ( ( ) (
d ) ( ) 1 ( ) , (
) 1 ( ) , ( ) (
x k
x M k t x tM
k
x M n t x tM
n
p p p p k x C
p p n x C p
(13.1.14)

(dac t ~ U(0,1) atunci f
O|X = x
(n,p) =

+
o
o
*
) 1 (
...
) 1 ( ) , (
2 1
x k
S
nt
x
k
x
k
x
k
k
S tn S
n
C kt
C C C
p p n x C
t


Observm ceva de bun sim, pentru care nu avem nevoie de mult tiin
de carte: dac n < x
*
, atunci din (13.1.17), f
O|X = x
(n,p) = 0. Nu o s considerm
posibil ca N s ia valori mai mici dect x*!

Definiia 13.1.6. Dac :E 9 este o funcie msurabil, variabila aleatoare
E((O)|X) se numete n limbaj bayesian estimatorul Bayesian cu cele mai mici
ptrate al lui (O).

Propoziia 13.1.3 are drept corolar o formul de calcul pentru E((O)|X), evident
datorit formulei de transport:


Propoziia 13.1.7. Avem

E((O)|X= x) =
}
o t o
}
u t u u
o = O
u = O
) ( d ) ( ) ( |
) ( d ) ( ) ( | ) (
u x f
u x f
X
X
(13.1.15)


S presupunem c variabilele aleatoare X
r
sunt toate identic repartizate
pentru fiecare valoare posibil a factorului de risc u . Fie

(O) = E(X
r
|O) (13.1.16)

Aceasta este cea mai bun aproximare pe care o putem face pentru Xr n
sensul celor mai mici ptrate. n cele ce urmeaz nu vom modifica notaia: (O)
va avea mereu aceeai semnificaie.
Sensul precis este c dintre toate funciile (O) cu care am dori s
aproximm pe X
r
n spaiul L
2
, cea pentru care distana este minim este (O).
Ceea ce ne intereseaz n actuariat este mrimea

E((O)|X) notat cu g(X) . (13.1.17)

Este mai puin evident c, n anumite ipoteze, g(X) este i cea mai bun
aproximare pe care o putem face asupra premiului brut de asigurare viitor (adic



287
pentru X
t+1
) innd seama de modelul nostru bayesian i de experiena acumulat,
X.

Definiia 13.1.8. Dou variabile aleatoare X i Y se numesc condiionat
independente fa de O dac P(X e A, Y e B O ) = P(X e A)P(Y e B O ) pentru
orice A i B mulimi boreliene.

Exemplul 13.1.9. n exemplele 13.1.1 i 13.1.5 am presupus tacit c
observaiile (X
i
)
1 s i s t
sunt condiionat independente. Altfel nu puteam s spunem
c P(X
1
= x
1
,...,X
t
= x
t
) = P(X
1
= x
1
)...P(X
t
= x
t
). Dac X i Y sunt condiionat
independente, nu rezult c sunt independente. ntr-adevr, s spunem c X,Y, O
sunt discrete. Atunci
P(X = i , Y = j) = E(P(X = i , Y = j O) = E(P(X = i O)P(Y = j O))
= E[P(X = i O)]E[P(Y = j O)]. De exemplu, s zicem c (X,Y O) ~
U({O,O+1}), O ~ U({0,1}). Atunci P(X = 0, Y = 0) = [P(X = 0, Y = 0 O = 0) +
P(X = 0, Y = 0 O = 1)]/2 = [ + 0]/2 = 1/8 iar P(Y = 0) = P(X = 0) = [P(X = 0 O
= 0) + P(X = 0 O = 1)]/2 = ( + 0)/2 = . Produsul este 1/16 i nu 1/8.

Propoziia 13.1.10. Fie X i Y dou variabile aleatoare condiionat
independente de . Atunci avem

E(f(Y)|O,X) = E(f(Y)|O) (13.1.18)

n consecin

E(f(Y)|X) = E(E(f(Y)|O)|X) (13.1.19)


Corolarul 13.1.11. Presupunem c observaiile X
r
sunt condiionat independente
fiind dat O. Atunci E(X
t+1
| X
1
,,X
t
) = E((O)|X
1
,,X
t
) = g(X).

Demonstraie
Este de fapt relaia (13.1.19) unde n loc de Y avem X
t+1
iar n loc de X avem
vectorul X = (X
r
)
1srst
.

Principial, g(X) se poate calcula, dac tim repartiia lui O condiionat de
X . O ipotez destul de optimist.
n Exemplul 13.1.2 deci i n exemplul 13.1.1 cunoatem aceast
repartiie: este |
S+1, nt+1-S
. Cum X
r
sunt binomiale condiionat de O (adic P(X
r
=
j|O) = Binomial(n,O)({j}) rezult c (O) = nO. Atunci g(X) = E(nO|X) =
nE(O|X) . Dar media unei variabile aleatoare Y ~ |
m,n
este
n m
m
+
de unde obinem
estimatorul bayesian pentru X
t+1
(premiul brut) ca fiind



288
g(X) =
2
) 1 (
+
+
nt
S n
(13.1.20)

S notm cu M = S/t media aritmetic a observaiilor ( se tie c M este un
estimator nedeplasat i eficient pentru EX
r
n ipoteza c variabilele sunt i.i.d, ceea
ce nu este cazul!). Vom nota de asemenea n mod consecvent

m = EX
r
= E(E(X
r
|O)) = E(nO) = nO/2 (13.1.21)

(cci am acceptat c O ~ U(0,1)). Cu aceste pregtiri putem scrie (1.1.20) sub
forma
g(X) = zM + (1-z)m (13.1.22)

unde z =
2 + nt
nt
. q.e.d.

Observaia 13.1.12. Relaia (13.1.21) este foarte atractiv: este simpl i
admite o interpretare intuitiv: cel mai bine este s prezicem viitorul sub forma
unei mixturi ntre ideile noastre anterioare ( = m) i experien ( = M).
Coeficientul z ne arat ponderea experienei. Dac t , z 1, adic e mai
bine s ne bazm pe experien. Dac t este mic, atunci este bine de luat n
calcul i modelul nostru teoretic.
Se pune ntrebarea : nu cumva mereu g(X) este cuprins ntre m i M ?
Vom da un exemplu c nu este aa.

Exemplul 13.1.13. S presupunem c O ~ U(0,1) i c variabilele aleatoare X
r

sunt repartizate U(u,u+1) Presupunem de asemenea c ele sunt condiionat
independente dac se tie u. Deci
E = |0,1|, t = , u(u) = 1
(0,1)
(u) (repartiia apriori)
Q(u) = U(u,u+1)
t
(acesta este modelul propriu zis!)
f
O,X
(u,x) = 1
(u,u+1)
(x
1
) 1
(u,u+1)
(x
2
) 1
(u,u+1)
(x
t
) 1
(0,1)
(u) = 1
A(x)
(u) unde
A(x) = (x
1
-1,x
1
) (x
2
-1,x
2
) (x
t
-1,x
t
) (0,1) = (x
*
-1,x
*
) (0,1) unde
x
*
= x
1
.x
2
..x
t
, x
*
= x
1
vx
2
vvx
t

f
X
(x) = (A(x)) = ((x
*
.1) (x
*
-1)
+
)
+

f
O|X = x
(u) = 1
A(x)
/f
X
(x) , deci repartiia lui O condiionat de X este U(A(x))
Apoi (O) = E(X
r
|O) = O + (media unei uniforme pe (a,b) este mijlocul
intervalului (a+b)/2 ; n cazul nostru a = O i b = O+1!) deci g(X) = E(O|X) +
= ((x
*
.1) + (x
*
-1)
+
)/2 + (cci i repartiia lui O condiionat de X este tot
uniform! ) . n concluzie



289
g(X) =

>
+
< <
+
s
+
1
2
1
1
2
1
2
1
*
*
*
*
*
*
* *
x daca
x
x x daca
x x
x daca
x
. (13.1.23)

Pe de alt parte m = EX
1
= E(O) = + = 1. Se poate ca g(X) s nu fie ntre m
i M: de exemplu, dac t = 3, x = (1.1; 1.2; 1.9) atunci M = (1.1+ 1.2 + 1.9)/3 =
1.4 < g(x) = (1 + 1.9)/2 = 1.45.


13.2. Modelul de credibilitate Bhlmann

Fie X o selecie de volum t . Variabila aleatoare X
r
, 1 s r s t reprezint
suma pe care asiguratorul a pltit-o n anul r. Bnuim c repartiia acestei
variabile depinde de un factor de risc, O asupra cruia avem o credin adic o
repartiie apriori U = u t
Definiia 13.2.1. Vom numi contract un vector (O,X) unde PO
-1
= U i X =
(X
1
,,X
t
) reprezint variabile aleatoare din L
2
interpretate fiind ca o istorie a
plilor fcute de asigurator la momentele de timp 1,2,,t.

Fie
r
(O) = E(X
r
|O)
Ceea ce ne intereseaz este s dm o predicie asupra plii viitoare X
t+1
.
Istoria plilor pn n prezent (momentul t) este X.
Ca de obicei, dac nu facem unele ipoteze suplimentare, nu vom putea
spune nimic n acest sens.
Vom face ipoteza c pentru fiecare valoare a factorului de risc O ,
variabilele aleatoare (Xr)
1 s r s t
sunt independente i identic repartizate. Atunci i
variabilele
r
(O) vor coincide. Le vom nota cu (O).
tim (Corolar 1.1.11) c E(X
t+1
| X
1
,,X
t
) = E((O)|X
1
,,X
t
) = g(X)
Aceasta este ipoteza independenei condiionate.
Scris precis, cu notaiile din paragraful anterior, ea devie

t
F Q
O
= ) ( ) ( u u (13.2.1)

adic
P(X
1
e B
1
,.,X
t
e B
t
|O) = P(X
1
e B
1
|O)P(X
t
e B
t
|O)
= F(O,B
1
).F(O,B
t
) B
r
e B(9), 1 s r s t (13.2.2)

Am vzut c semnificaia lui g(X) (estimatorul Bayesian exact) este
urmtoarea : dac notm cu L mulimea funciilor h: 9
t
9 care sunt msurabile
i au proprietatea c h(X) e L
2
(O,K ,P) atunci




290
X
t+1
g(X)
2
= min { X
t+1
h(X)
2
| h e L } (13.2.3)
adic
E(X
t+1
g(X))
2
= min { E(X
t+1
h(X))
2
| h e L } (13.2.4)

Cu alte cuvinte g minimizeaz distana ptratic ntre X
t+1
i h(X).

Problema este c n cele mai multe modele realiste g este necalculabil.

Buhlmann a avut ideea s fac un compromis: s caute funcia h afin
care s minimizeze membrul drept din (13.2.4). Cu alte cuvinte s caute h de
forma h(x) = c
0
+ <c, x> astfel ca E(X
t+1
h(X))
2
s fie minim.

S considerm funcia :99
t
9 dat de
h(c
0
, c) = E(X
t+1
c
0
c
1
X
1
c
2
X
2
- - c
t
X
t
)
2
(13.2.5)

Problema de optimizat devine:
Gsii c
0
, c ca h(c
0
,c) = minim (13.2.6)

De data aceasta problema este simpl. Este vorba de a gsi minimul unei
forme ptratice convexe. Fiind strict convex, are optim unic.
Derivm h dup c
0
i punem condiia ca derivata s se anuleze. Gsim

-2E(X
t+1
c
0
c
1
X
1
c
2
X
2
- - c
t
X
t
) = 0 (13.2.7)

(am derivat sub integral, deoarece putem aplica criteriul lui Lebesgue de
dominare: variabilele noastre sunt n L
2
. Rezult

c
0
= E(X
t+1
c
1
X
1
c
2
X
2
- - c
t
X
t
). (13.2.8)

Dar variabilele aleatoare X
r
, fiind condiionat identic repartizate, sunt i
identic repartizate. Media lor se va nota, ca i n primul capitol, cu m = EX
r
=
E(O). nlocuind n (13.2.7) EX
r
cu m rezult

c
0
= m(1- c
1
- c
2
- - c
t
) (13.2.9)

nlocuind n (13.2.5) gsim c avem de optimizat funcia

(c) = E(X
t+1
m c
1
(

X
1
- m) c
2
(X
2
m) - - c
t
(

X
t
- m

))
2
(13.2.10)

S notm cu Y
r
variabilele aleatoare centrate Y
r
= X
r
m. Atunci funcia
(convex!) de optimizat devine

(c) = E(Y
t+1
c
1
Y
1
c
2
Y
2
- - c
t
Y
t
)
2
(13.2.11)

Gradientul ei este



291

Grad (c ) = (-2E(Y
r
(Y
t+1
c
1
Y
1
c
2
Y
2
- - c
t
Y
t
)))
1 s r s t
. (13.2.12)

Ecuaia Grad (c) = 0 devine

=
t
j
j
c
1
E(Y
r
Y
j
) = E(Y
r
Y
t+1
) (1.2.13)

Pe de alt parte, dac j = r variabilele aleatoare Y
j
i Y
r
sunt condiionat
independente deci

E(Y
r
Y
j
) = E(E(Y
r
Y
j
|O)) = E(E(Y
r
|O)E(Y
j
|O)) (13.2.14)

Dar E(Y
j
|O) = E(X
j
-m|O) = E(X
j
|O) m = (O) m = (O) - E(O) de unde

r = j E(Y
j
Y
r
) = Var (O) (13.2.15)

Vom nota Var (O) cu a.
Dac ns r = j atunci E(Y
r
Y
j
) = E(Y
r
2
) = E(E(Y
r
2
|O)) = E(E(X
r
-m)
2
|O)) =
E(E|(X
r
-E(X
r
|O)+(E(X
r
|O) - m)|
2
|O)) = E(E|(X
r
-(O))+((O) - m)|
2
|O)) = E(E|(X
r
-
(O)|
2
|O)) + 2E(|X
r
-(O)||(O)-m||O) + E((O) - m)|
2
) = E(Var(X
r
|O)) + 2E(|X
r
-
(O)||O)|(O)-m|) + Var (O) = s
2
+ 0 + a = a + s
2
.
Am notat E(Var(X
r
|O)) cu s
2
. Cum variabilele aleatoare X
r
sunt identic
repartizate, notaia este corect . Altfel ar fi trebuit s punem s
r
n loc de s. n
concluzie

E(Y
j
Y
r
) = a + o
j,r
s
2
j,r e {1,,t} (13.2.15)

nlocuind n (13.2.12) gsim sistemul

=
t
j
j
c
1
(a + o
j,r
s
2
) = a (13.2.16)
care se rezolv foarte simplu. Adunnd toate ecuaiile rezult (ta + s
2
)(c
1
+ + c
t
)
= ta

de unde suma coeficienilor S = c
1
+ + c
t
=
2
s ta
ta
+
. Cum sistemul se mai
scrie c
r
s
2
+ aS = a , urmeaz c
c
1
= c
2
= = c
t
=
2
s ta
a
+
. (13.2.17)
Concluzia final este

Teorema 13.2.2. Dac variabilelele aleatoare (X
r
)
r > 1
sunt din L
2
i i.i.d.
condiionat de O , atunci estimatorul liniar optim h(X) are forma h(X)=(1-z)m+ zM
unde



292
z =
2
s ta
at
+
, a = Var (O), s
2
= E(Var(X
r
|O)) (13.2.18)


Definiia 13.2.3 Numrul z se numete coeficientul de credibilitate al lui
Buhlmann.
El nu este o statistic , deoarece depinde de trei parametri neobservabili: a
= Var (O); m = E(O) i s
2
= E(Var(X
r
|O)).
Uneori se poate ntmpla s coincid ca h(X) s coincid cu g(X) adic
estimatorul liniar optim s fie chiar estimatorul bayesian optim.
Pe scurt: dac avem observaiile X = (X
1
,,X
t
) i modelul Bayesian
-P(X
1
e B
1
,.,X
t
e B
t
|O) = Q(O,B
1
).Q(O,B
t
) B
r
e B(9), 1 s r s t
- Q(u) are densitatea f
X|O=u
v, probabilitatea apriori cu densitatea U= ut
i notm E(X
r
|O) cu (O), atunci

g(X) = E((O)|X) =
}
}
o t o
u t u u
o = O
u = O
) ( d ) ( ) (
) ( d ) ( ) ( ) (
u X f
u X f
X
X
= E(X
t+1
|X) (13.2.19)

iar estimatorul Buhlman este h(X) = Mz + (1-z)m cu

m = EX
r
, M = (X
1
+ + X
t
)/t, z =
2
s at
at
+
, a = Var (O), s
2
= E(Var(X
1
|O))
(13.2.20)

Tot demersul de pn acum ar fi inutil dac nu ar exista cazuri ntlnite n
statistic care estimatorul Buhlman h(X) ar coincide cu g(X) . Dm acum o
generalizare a exemplului 1, unde cele dou chiar coincid.
Definiia 13.2.4. Densitatea f
X=
se numete familie exponenial dac este de
forma
f
X|O = u
(x) = p(x)e
-ux
/q(u) (13.2.21)
unde se subnelege c spaiul parametrilor E = [0,). Se presupune c funcia
q(u) este derivabil.

n acest caz densitatea vectorului X este
f
X|O = u
(x) =
S
t
t
e
q
x p x p x p
u
u) (
) ( )... ( ) (
2 1
unde S = x
1
+ + x
t
(13.2.22)


S presupunem c densitatea apriori u a variabilei aleatoare O este de
forma
u(u) =
) , (
) (
| o
u
|u o
C
e q
unde o,| e [0,) iar C(o,|) este o constant de normare.
(13.2.23)



293
n aceste condiii densitatea aposteriori este
f
O|X = x
(u)=
}
t
u
= O
u = O
) ( ) ( ) (
) ( ) (
y d y u x f
u x f
y X
X
= A(o,|,x)e
-u(o+S)
/ q
t+|
(u) (13.2.24)

adic este de acelai tip ca i densitatea apriori. Spunem c familia aceasta de
densiti este o familie conjugat..

Propoziia 13.2.5. Dac modelul bayesian este familie exponenial, densitatea
apriori este de forma (1.2.22) i u(0) = u() = 0 atunci g i h , definii prin
(13.2.18) i (13.2.19) coincid.

Un caz particular este dac modelul este Poisson: repartiia Poisson este
de forma (13.2.21). Aici msura v este msura cardinal pe mulimea numerelor
naturale.
Se punem acum problema de a estima pe baza datelor de observaie X cei
trei parametri m, a i s
2
. Acum este o problem de statistic obinuit: cutm trei
estimatori nedeplasai pentru aceste cantiti. Ideea lui Buhlman a fost de a se
apela la mai multe contracte independente de acelai tip.
Un rspuns este urmtorul:

Propoziia 13.2.6. Dac vectorii X
j
= (X
j,r
)
1srst,
sunt independeni i acceptm la
fiecare din ei acelai model Q, atunci M
0
,
2
s i a definii mai jos sunt estimatori
consisteni pentru m, s
2
i a


M
0
=
=
k
j
j
M
k
1
1
(13.2.25)

2
s =

=
k
j
j
s
k
1
2

1
,
2

j
s =
1
) (
1
2
,

=
t
M X
t
r
j r j
=
1
1
2 2
,

=
t
tM X
t
r
j r j
(13.2.26)
a =
1
) (
1
2
0

=
k
M M
k
j
j
-
t
s
2

(13.2.27)
Prin M
j
am notat mediile de selecie ale vectorilor X
j
.

Mai mult,
2
s i
a
sunt estimatori nedeplasai pentru s
2
. Varianele sunt
Var(
2
s ) = ) (
1
2
1
s Var
k
, Var(M
j
) = a +
t
s
2
, Var(M
0
) =
k
M Var
j
) (
(13.2.28)

Apare o evident deosebire fa de cazul i.i.d., cnd aceste variane tind la
0 o dat cu creterea numrului de observaii, t .De asemenea vedem c nu
conteaz aa de mult t (= istoricul ) ct conteaz k numrul de contracte
independente.



294
Corolarul 13.2.7. Variabila aleatoare z =
2

s t a
t a
+
este un estimator pentru
coeficientul de credibilitate z care este consistent n k : adic k z z .

Observaia 13.2.8. n general estimatorul
z
nu este nedeplasat, cci nu avem
motive s credem c o formul de tipul E
Y X
X
+
=
Y X
X
E E
E
+
ar putea fi adevrat,
chiar n ipoteze restrictive. Dac X i Y sunt independente, de exemplu, atunci
E
Y X
X
+
se poate calcula, este diferit de
Y X
X
E E
E
+
.
Ca amuzament, dac X i Y sunt i.i.d. atunci egalitatea este adevrat!
Ambele valori coincid, n mod evident, cu !
295
Bibliografie



1. Brbosu D., Zelina I., Calculul probabilitilor, Editura CUB PRESS
22, Baia Mare, 1998
2. Beganu G. (coordonator), Teoria probabilitilor i statistic
matematic, Culegere de probleme, Editura Meteor Press, Bucureti
2004
3. Blaga P., Calculul probabilitilor i statistic matematic. Curs i
culegere de probleme, Universitatea Babe-Bolyai Cluj Napoca,
1994
4. Blaga P., Statistic matematic. Ediia a II-a, Universitatea Babe-
Bolyai, Cluj-Napoca, 2001
5. Breaz N., Modele de regresie bazate pe funcii spline, Presa
Universitar Clujean, 2007
6. Breaz N., Jaradat M., Statistic descriptiv, teorie i aplicaii, Ed.
Risoprint, Cluj-Napoca, 2009
7. Cbulea L., Aproximare n probabiliti i statistic, Editura
Aeternitas, Alba Iulia, 2003
8. Cbulea L., Aldea M., Elemente de teoria probabilitilor i statistic
matematic, Editura Didactica, Alba Iulia, 2004
9. Ciucu G., Elemente de teoria probabilitilor i statistic matematic,
Editura Didactic i Pedagogic, Bucureti, 1963
10. Ciucu G., Craiu V., Introducere n teoria probabilitilor i statistic
matematic, Editura Didactic i Pedagogic, Bucureti, 1971
11. Ciucu G., Craiu V., Inferena statistic, Editura Didactic i
Pedagogic, Bucureti, 1974
12. Ciucu G., Craiu V., Scuiu I., Culegere de probleme de teoria
probabilitilor, Editura Tehnic, 1967
13. Ciucu G., Smboan G., Teoria probabilitilor i statistic matematic,
Editura Tehnic, Bucureti, 1962
14. Cojocaru N., Clocotici V., Dobra D., Metode statistice aplicate n
industria textil, Editura Tehnic, Bucureti, 1986
15. Florea I., Econometrie, Editura Universitii din Oradea, 2003
16. Florea I., Parpucea I., Buiga A., Statistic descriptiv, teorie si
aplicaii, Editura Continental, Alba Iulia, 1998
17. Florea I., Parpucea I., Buiga A., Lazr D., Statistic inferenial, Presa
Universitar Clujean, 2000
18. Hoel P.G., Introduction to Mathematical Statistics, John Wiley, New
York,1971
19. Lehman E.L., Testing Statistical Hypotheses, Second edition, Springer,
New York-Berlin, 1997
296
20. Luca-Tudorache R., Probleme de teoria probabilitilor, Editura
Tehnopress, Iai, 2006.
21. Luca-Tudorache R., Probleme de analiz matematic. Calcul integral,
Casa de Editur Venus, Iai, 2007
22. Mihoc Gh., Micu N., Teoria probabilitilor i statistic matematic,
Editura Didactic i Pedagogic, Bucureti, 1980
23. Mihoc I., Ftu C.I., Calculul probabilitilor i statistic matematic,
Casa de editur-Transilvania Press, Cluj Napoca 2003
24. Moon T.K., Stirling W.C., Mathematical Methods and Algorithms for
Signal Processing, Prentice Hall, 2000
25. Nicolescu L. J., Stoka M.I., Matematic pentru ingineri, vol. II, Editura
Tehnic, Bucureti, 1971
26. Pitea A., Postolache M., Basic Concepts of Probability and Statistics,
Editura Fair Partners, 2007
27. Reischer C., Smboan A., Culegere de probleme de teoria
probabilitilor i statistic matematic, Editura Didactic i
Pedagogic, Bucureti, 1972
28. Reischer C., Smboan G., Teodorescu T., Teoria probabilitilor,
Editura Didactic i Pedagogic, Bucureti, 1967
29. Saporta G., Probabilits, analyse des donnes et statistique, Editions
Technip, Paris, 1990
30. Stapleton J.H., Linear Statistical Models, John Wiley & Sons, New
York-Chichester-Brisbane, 1995
31. Stark H., Woods J.W., Probability, Random Processes and Estimation
Theory for Engineers, Prentice Hall, 1986
32. abac I. Gh. et all., Matematici speciale, vol. II, Editura Didactic i
Pedagogic, Bucureti, 1983
33. abac I. Gh., Matematici speciale, vol. II, Editura Didactic i
Pedagogic, Bucureti, 1965
34. Trandafir R., Introducere n teoria probabilitilor, Editura Albatros,
1979
35. Trmbia R., Metode statistice, Presa Universitar Clujean,
Universitatea Babe-Bolyai, Cluj-Napoca, 2000
36. Zbganu Gh., Teoria msurii i a probabilitilor, Editura Universitii,
Bucureti, 1998
37. Zbganu Gh., Metode matematice n teoria riscului i actuariat, Editura
Universitii, Bucureti, 2004


297








ANEXE
Anexa 1
Valorile funciei Laplace - Gauss

u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7290
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9779
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986

Anexa 2
Cuantilele repartiiei Student

grade\prob.
0.75 0.90 0.95 0.975 0.99 0.995
1
2
3
4
5
1.000
0.816
0.765
0.741
0.727
3.078
1.886
1.638
1.533
1.476
6.314
2.920
2.353
2.132
2.015
12.706
4.303
3.182
2.776
2.571
31.821
6.695
4.541
3.474
3.365
63.657
9.925
5.841
4.604
4.032
6
7
8
9
10
0.718
0.711
0.706
0.703
0.700
1.440
1.415
1.397
1.383
1.372
1.943
1.895
1.860
1.833
1.812
2.447
2.365
2.306
2.262
2.228
3.143
2.998
2.896
2.821
2.764
3.707
3.499
3.355
3.250
3.169
11
12
13
14
15
0.697
0.695
0.694
0.692
0.691
1.363
1.356
1.350
1.345
1.341
1.796
1.782
1.771
1.761
1.753
2.201
2.179
2.160
2.145
2.131
2.718
2.681
2.650
2.624
2.602
3.106
3.055
3.012
2.977
2.947
16
17
18
19
20
0.690
0.689
0.688
0.688
0.687
1.337
1.333
1.330
1.328
1.325
1.746
1.740
1.734
1.729
1.725
2.120
2.110
2.101
2.093
2.086
2.583
2.567
2.552
2.539
2.528
2.921
2.898
2.878
2.861
2.845
21
22
23
24
25
0.686
0.686
0.685
0.685
0.684
1.323
1.321
1.319
1.318
1.316
1.721
1.717
1.714
1.711
1.708
2.080
2.074
2.069
2.064
2.060
2.518
2.508
2.500
2.492
2.485
2.831
2.819
2.807
2.797
2.787
26
27
28
29
30
0.684
0.684
0.683
0.683
0.683
1.315
1.314
1.313
1.311
1.310
1.706
1.703
1.701
1.699
1.697
2.056
2.052
2.048
2.045
2.042
2.479
2.473
2.467
2.462
2.457
2.779
2.771
2.763
2.756
2.750
35
40
80
120
n>120
0.681
0.681
0.679
0.677
0.674
1.306
1.303
1.291
1.289
1.282
1.690
1.684
1.671
1.658
1.645
2.030
2.021
2.000
1.980
1.960
2.438
2.423
2.390
2.358
2.326
2.724
2.704
2.660
2.617
2.576

Anexa 3
Cuantilele repartiiei
2


grade\prob. 0.005 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99
1
2
3
4
5
0.000
0.010
0.072
0.207
0.412
0.000
0.020
0.115
0.297
0.554
0.001
0.051
0.216
0.484
0.831
0.004
0.103
0.352
0.711
1.15
0.016
0.211
0.584
1.06
1.61
2.71
4.60
6.25
7.78
9.24
3.84
5.99
7.81
9.48
11.07
5.02
7.38
9.35
11.1
12.8
6.63
9.21
11.34
13.28
15.09
6
7
8
9
10
0.676
0.989
1.34
1.73
2.16
0.872
1.24
1.65
2.09
2.56
1.24
1.69
2.18
2.70
3.25
1.64
2.17
2.73
3.33
3.94
2.20
2.83
3.49
4.17
4.87
10.64
12.02
13.36
14.68
16.99
12.59
14.07
15.51
16.92
18.31
14.4
16.0
17.5
19.0
20.5
16.81
18.47
20.09
21.66
23.21
11
12
13
14
15
2.60
3.07
3.57
4.07
4.60
3.05
3.57
4.11
4.66
5.23
3.82
4.40
5.01
5.63
6.26
4.57
5.23
5.89
6.57
7.26
5.58
6.30
7.04
7.79
8.55
17.27
18.55
19.81
21.06
22.31
19.67
21.03
22.36
23.68
25.00
21.9
23.3
24.7
26.1
27.6
24.72
26.22
27.69
29.14
30.58
16
17
18
19
20
5.14
5.70
6.26
6.84
7.43
5.81
6.41
7.01
7.63
8.26
6.91
7.56
8.23
8.91
9.59
7.96
8.67
9.39
10.1
10.9
9.31
10.08
10.86
11.65
12.44
23.54
24.77
25.99
27.20
28.41
26.30
27.59
28.87
30.14
31.41
28.8
30.2
31.3
32.9
34.2
32.00
33.41
34.80
36.19
37.57
21
22
23
24
25
8.03
8.64
9.26
9.89
10.5
8.90
9.54
10.2
10.9
11.5
10.3
11.0
11.7
12.4
13.1
11.6
12.3
13.1
13.8
14.6
13.24
14.04
14.85
15.66
16.47
29.61
30.81
32.01
33.20
34.38
32.67
33.92
35.17
36.41
37.65
35.5
36.8
38.1
39.4
40.6
38.93
40.29
41.64
42.98
44.31
26
27
28
29
30
11.2
11.8
12.5
13.1
13.8
12.2
12.9
13.6
14.3
15.0
13.8
14.6
15.3
16.0
16.8
15.4
16.2
16.9
17.7
18.5
17.29
18.11
18.94
19.77
20.60
35.56
36.74
37.92
39.09
40.26
38.88
40.11
41.34
42.56
43.77
41.9
43.2
44.5
45.7
47.0
45.64
46.96
48.28
49.59
50.89
35
40
60
17.2
20.7
35.5
18.5
22.2
37.5
20.6
24.4
40.5
22.5
26.5
43.2
24.8
29.1
46.5
46.1
51.8
74.4
49.8
55.8
79.1
53.2
59.3
83.3
57.3
63.7
88.4









Anexa 4
Cuantilele repartiiei Fisher - Snedecor

Gr2\Gr1 Prob. 1 2 3 4 5 6 7 8

1

0.95
0.975
0.99
161.4
648
4052
199.5
800
4999
216
864
5403
225
900
5625
230
922
5764
234
937
5859
237
948
5930
239
957
5981

2

0.95
0.975
0.99
18.51
38.5
98.49
19.00
39.0
99.00
19.16
39.2
99.17
19.25
39.2
99.25
19.30
39.3
99.30
19.33
39.3
99.33
19.35
39.4
99.35
19.37
39.4
99.36

3

0.95
0.975
0.99
10.13
17.4
34.12
9.55
16.0
30.84
9.28
15.1
29.46
9.12
15.4
28.71
9.01
14.9
28.24
8.94
14.7
27.91
8.89
14.6
27.7
8.85
14.5
27.49

4

0.95
0.975
0.99
17.71
12.2
21.20
6.94
10.6
18.00
6.59
9.98
16.69
6.39
9.60
15.98
6.26
9.36
15.52
6.16
9.20
15.21
6.09
9.07
15.0
6.04
8.98
14.80

5

0.95
0.975
0.99
6.61
10.0
16.26
5.79
8.43
13.27
5.41
7.76
12.06
5.19
7.39
11.39
5.05
7.15
10.97
4.95
6.98
10.67
4.88
6.85
10.5
4.82
6.76
8.10

6

0.95
0.975
0.99
5.99
8.07
12.25
5.14
7.26
10.91
4.76
6.60
9.78
4.53
6.23
9.15
4.39
5.99
8.75
4.28
5.82
8.47
4.21
5.70
8.26
4.15
5.60
8.10

7

0.95
0.975
0.99
5.59
8.07
12.25
4.74
9.54
9.55
4.35
5.89
8.45
4.12
5.52
7.85
3.97
5.29
7.45
3.87
5.12
7.19
3.79
4.99
6.99
3.73
4.90
6.84

8

0.95
0.975
0.99
5.32
7.57
11.26
4.46
6.06
8.65
4.07
5.42
7.59
3.84
5.05
1.01
3.69
4.82
6.63
3.58
4.65
6.37
3.50
4.53
6.18
3.44
4.43
6.03

9

0.95
0.975
0.99
5.12
7.21
10.56
4.26
5.71
8.02
3.86
5.08
6.99
3.63
4.72
6.42
3.48
4.48
6.06
3.37
4.32
5.80
3.29
4.20
5.61
3.23
4.10
5.47

10

0.95
0.975
0.99
4.96
6.94
10.04
4.10
5.46
7.56
3.71
4.83
6.55
3.48
4.47
5.99
3.33
4.24
5.64
3.22
4.07
5.39
3.14
3.95
5.20
3.07
3.85
5.06

11

0.95
0.975
0.99
4.84
6.72
9.65
3.98
5.26
7.20
3.59
4.63
6.22
3.36
4.28
5.67
3.20
4.04
5.32
3.09
3.88
5.07
3.01
3.76
4.89
2.95
3.66
4.74

12

0.95
0.975
0.99
4.75
6.55
9.33
3.88
5.10
6.93
3.49
4.47
5.95
3.26
4.12
5.41
3.11
3.89
5.06
3.00
3.73
4.82
2.91
3.61
4.54
2.85
3.51
4.50

13

0.95
0.975
0.99
4.67
6.41
9.07
3.81
4.97
6.70
3.41
4.35
5.74
3.18
4.00
5.221
3.03
3.77
4.86
2.92
3.60
4.62
2.83
3.48
4.44
2.77
3.39
4.30

14

0.95
0.975
0.99
4.60
6.30
8.86
3.74
4.86
6.51
3.34
4.24
5.56
3.11
3.89
5.04
2.96
3.66
4.70
2.85
3.50
4.46
2.76
3.38
4.28
2.70
3.29
4.14

15

0.95
0.975
0.99
4.54
6.20
8.68
3.68
4.76
6.36
3.29
4.15
5.42
3.06
3.80
4.89
2.90
3.58
4.56
2.79
3.41
4.32
2.71
3.29
4.14
2.64
3.20
4.00

16

0.95
0.975
0.99
4.49
6.12
8.53
3.63
4.69
6.23
3.24
4.08
5.29
3.01
3.73
4.77
2.85
3.50
4.44
2.74
3.34
4.20
2.66
3.22
4.03
2.59
3.12
3.89

17

0.95
0.975
0.99
4.45
6.04
8.40
3.59
4.62
6.11
3.20
4.01
5.18
2.96
3.66
4.67
2.81
3.44
4.34
2.70
3.28
4.10
2.61
3.16
3.93
2.55
3.06
3.79

18

0.95
0.975
0.99
4.41
5.98
8.29
3.55
4.56
7.01
3.16
3.95
5.09
2.93
3.61
4.58
2.77
3.38
4.25
2.66
3.22
4.01
2.58
3.10
3.84
2.51
3.01
3.71

19

0.95
0.975
0.99
4.38
5.92
8.18
3.52
4.51
5.93
3.13
3.90
5.01
2.90
3.56
4.50
2.74
3.33
4.17
2.63
3.17
3.94
2.54
3.05
3.77
2.48
2.96
3.63

20

0.95
0.975
0.99
4.35
5.87
8.10
3.49
4.46
5.85
3.10
3.86
4.94
2.87
3.51
4.43
2.71
3.29
4.10
2.60
3.13
3.87
2.51
3.01
3.70
2.45
2.91
3.56

21

0.95
0.975
0.99
4.32
5.83
8.02
3.47
4.42
5.78
3.07
3.82
4.87
2.84
3.48
4.37
2.68
3.25
4.04
2.57
3.09
3.84
2.49
2.97
3.64
2.42
2.87
3.51

22

0.95
0.975
0.99
4.30
5.79
7.95
3.44
4.38
5.72
3.05
3.78
4.82
2.82
3.44
4.31
2.66
3.22
3.99
2.55
3.05
3.76
2.46
2.93
3.59
2.40
2.84
3.45

23

0.95
0.975
0.99
4.28
5.75
7.88
3.42
4.35
5.66
3.03
3.75
4.76
2.80
3.41
4.26
2.64
3.18
3.94
2.53
3.02
3.71
2.44
2.90
3.54
2.37
2.81
3.41

24

0.95
0.975
0.99
4.26
5.72
7.82
3.40
4.32
5.61
3.01
3.72
4.72
2.78
3.38
4.22
2.62
3.15
3.90
2.51
2.99
3.67
2.42
2.87
3.50
2.36
2.78
3.36



Anexa 4 (continuare)


Gr2\Gr1 Prob. 9 10 11 12 13 14 15 16

2

0.95
0.975
0.99
19.4
39.4
99.4
19.4
39.4
99.4
19.4
39.4
99.4
19.4
39.4
99.4
19.4
39.4
99.4
19.4
39.4
99.4
19.4
39.4
99.4
19.4
39.4
99.4

3

0.95
0.975
0.99
8.81
14.5
27.3
8.79
14.4
27.1
8.76
14.4
27.1
8.74
14.3
27.1
8.73
14.3
27.0
8.71
14.3
26.9
8.70
14.3
26.9
8.69
14.2
26.8

4

0.95
0.975
0.99
6.00
8.90
14.7
5.96
8.84
14.5
5.94
8.79
14.4
5.91
8.75
14.4
5.89
8.72
14.3
5.87
8.69
14.2
5.86
8.66
14.2
5.84
8.64
14.2

5

0.95
0.975
0.99
4.77
6.68
10.2
4.74
6.62
10.1
4.70
6.57
9.96
4.68
6.52
9.89
4.66
6.49
9.82
4.64
6.46
9.77
4.62
6.43
9.72
4.60
6.41
9.68

6

0.95
0.975
0.99
4.10
5.52
7.98
4.06
5.46
7.89
4.03
5.41
7.79
4.00
5.37
7.72
3.98
5.33
7.66
3.96
5.30
7.60
3.94
5.27
7.56
3.92
5.25
7.52

7

0.95
0.975
0.99
3.68
4.82
6.72
3.64
4.76
6.62
3.60
4.71
6.54
3.57
4.67
6.47
3.55
4.63
6.41
3.53
4.60
6.36
3.51
4.57
6.31
3.49
4.54
6.27

8

0.95
0.975
0.99
3.39
4.36
5.91
3.35
4.30
5.81
3.31
4.24
5.73
3.28
4.20
5.67
3.26
4.16
5.61
3.24
4.13
5.56
3.22
4.10
5.52
3.20
4.08
5.48

9

0.95
0.975
0.99
3.18
4.03
5.35
3.14
3.96
5.26
3.10
3.91
5.18
3.07
3.87
5.11
3.05
3.83
5.05
3.03
3.80
5.00
3.01
3.77
4.96
2.99
3.74
4.90

10

0.95
0.975
0.99
3.02
3.78
4.94
2.98
3.72
4.85
2.94
3.66
4.77
2.91
3.62
4.71
2.89
3.58
4.65
2.86
3.55
4.60
2.85
3.52
4.56
2.83
3.50
4.52

11

0.95
0.975
0.99
2.90
3.59
4.63
2.85
3.53
4.54
2.82
3.47
4.46
2.79
3.43
4.40
2.76
3.39
4.34
2.74
3.36
4.29
2.72
3.33
4.25
2.70
3.30
4.21

12

0.95
0.975
0.99
2.80
3.44
4.39
2.75
3.37
4.30
2.72
3.32
4.22
2.69
3.28
4.16
2.66
3.24
4.10
2.64
3.21
4.05
2.62
3.18
4.01
2.60
3.15
3.97

13

0.95
0.975
0.99
2.71
3.31
4.19
2.67
3.25
4.10
2.63
3.20
4.02
2.60
3.15
3.96
2.58
3.12
3.91
2.55
3.08
3.86
2.53
3.05
3.82
2.51
3.03
3.78

14

0.95
0.975
0.99
2.65
3.21
4.03
2.60
3.15
3.94
2.57
3.09
3.86
2.53
3.05
3.80
2.51
3.01
3.75
2.48
2.98
3.70
2.46
2.95
3.66
2.44
2.92
3.62

15

0.95
0.975
0.99
2.59
3.12
3.89
2.54
3.06
3.80
2.51
3.01
3.73
2.48
2.96
3.67
2.45
2.92
3.61
2.42
2.89
3.56
2.40
2.86
3.52
2.38
2.84
3.49

16

0.95
0.975
0.99
2.54
3.05
3.78
2.49
2.99
3.69
2.46
2.93
3.62
2.42
2.89
3.55
2.40
2.85
3.50
2.37
2.82
3.45
2.35
2.79
3.41
2.33
2.76
3.37

17

0.95
0.975
0.99
2.49
2.98
3.68
2.45
2.92
3.59
2.41
2.87
3.52
2.38
2.82
3.46
2.35
2.79
3.40
2.33
2.75
3.35
2.29
2.72
3.31
2.27
2.70
3.27

18

0.95
0.975
0.99
2.46
2.93
3.60
2.41
2.87
3.51
2.37
2.81
3.43
2.34
2.77
3.37
2.31
2.73
3.32
2.29
2.70
3.27
2.27
2.67
3.23
2.25
2.64
3.19

19

0.95
0.975
0.99
2.42
2.88
3.52
2.38
2.82
3.43
2.34
2.76
3.36
2.31
2.72
3.30
2.28
2.68
3.24
2.26
2.65
3.19
2.23
2.62
3.15
2.21
2.59
3.12

20

0.95
0.975
0.99
2.39
2.84
3.46
2.35
2.77
3.37
2.31
2.72
3.29
2.28
2.68
3.23
2.25
2.64
3.18
2.22
2.60
3.13
2.20
2.57
3.09
2.19
2.55
3.05

21

0.95
0.975
0.99
2.37
2.80
3.40
2.32
2.73
3.31
2.28
2.68
3.24
2.25
2.64
3.17
2.22
2.60
3.12
2.20
2.56
3.07
2.18
2.53
3.03
2.16
2.51
2.99

22

0.95
0.975
0.99
2.34
2.76
3.35
2.30
2.70
3.26
2.26
2.65
3.18
2.23
2.60
3.12
2.20
2.56
3.07
2.17
2.53
.302
2.15
2.50
2.98
2.13
2.47
2.94

23

0.95
0.975
0.99
2.32
2.73
3.30
2.27
2.67
3.21
2.23
2.62
3.14
2.20
2.57
3.07
2.18
2.53
3.02
2.15
2.50
2.97
2.13
2.47
2.93
2.11
2.44
2.89

24

0.95
0.975
0.99
2.30
2.70
3.26
2.25
2.64
3.17
2.21
2.69
3.09
2.18
2.54
3.03
2.15
2.50
2.98
2.13
2.47
2.93
2.11
2.44
2.89
2.09
2.41
2.85