Sunteți pe pagina 1din 302

Probabiliti i

statistic
CUPRINS

Introducere...........................................................................................................7

Capitolul 1. Teoria probabilitilor...................................................................11


1.1. Formalizarea experienelor aleatoare..............................................11
1.1.1. Evenimente...........................................................................11
1.2. Relaii ntre evenimente...................................................................12
1.3. Cmp de evenimente........................................................................14
1.4. Cmp de probabilitate......................................................................15
1.5. Reguli de calcul cu probabiliti......................................................17

Capitolul 2. Variabile aleatoare.........................................................................27


2.1. Variabile aleatoare discrete..............................................................27
2.2. Vector aleator bidimensional...........................................................32
2.3. Caracteristici numerice asociate variabilelor aleatoare....................36
2.4. Funcia caracteristic. Funcia generatoare de momente.................51
2.5. Probleme rezolvate...........................................................................53
2.6. Probleme propuse.............................................................................66

Capitolul 3. Legi clasice de probabilitate (repartiii) ale variabilelor


aleatoare discrete.............................................................................69
3.1. Legea discret uniform...................................................................69
3.2. Legea binomial. Legea Bernoulli...................................................71
3.3. Legea binomial cu exponent negativ. Legea geometric...............79
3.4. Legea hipergeometric.....................................................................83
3.5. Legea Poisson (legea evenimentelor rare) ......................................86

Capitolul 4. Legi clasice de probabilitate (repartiii) ale variabilelor


aleatoare continue..........................................................................91
4.1. Legea continu uniform (rectangular).........................................91
4.2. Legea normal (Gauss-Laplace). Legea normal standard (legea
normal centrat redus).................................................................95
4.3. Legea log-normal........................................................................105
4.4. Legea gamma.................................................................................107
4.5. Legea beta.....................................................................................112
4.6. Legea 2 (Helmert-Pearson) ........................................................114
4.7. Legea Student (t). Legea Cauchy..................................................119
4.8. Legea Snedecor. Legea Fisher......................................................123
4.9. Legea Weibull. Legea exponenial..............................................127

3
Capitolul 5. Convergena variabilelor aleatoare............................................131
5.1. Convergena aproape sigur i convergena n probabilitate..........131
5.2. Legi ale numerelor mari i aplicaii ...............................................137
5.2.1. Legea slab............................................................................137
5.2.2. Legea tare..............................................................................138
5.3. Convergena n repartiie................................................................148
5.4. Teorema limit central ................................................................155

Capitolul 6. Simularea variabilelor aleatoare ...............................................163


6.1. Simularea repartiiilor pe dreapt..................................................164
6.2. Algoritmul general: teorema de descompunere.............................173
6.3. Algoritmi speciali: repartiii uniforme...........................................180

Capitolul 7. Statistic descriptiv....................................................................185


7.1. Prezentarea datelor statistice..........................................................185
7.2. Caracteristici numerice..................................................................191
7.3. Corelaie. Regresie.........................................................................196

Capitolul 8. Teoria seleciei..............................................................................201


8.1. Generarea valorilor particulare ale unei variabile aleatoare..........201
8.2. Variabile de eantionare................................................................204
8.3. Legi de probabilitate ale variabilelor de eantionare....................210

Capitolul 9. Teoria estimaiei...........................................................................215


9.1. Estimatori nedeplasai...................................................................215
9.2. Estimatori de maxim verosimilitate.............................................216

Capitolul 10. Estimarea prin intervale de ncredere......................................219


10.1. Forma general a intervalului de ncredere .................................219
10.2. Interval de ncredere pentru medie...............................................221
10.3. Interval de ncredere pentru diferena a dou medii.....................226
10.4. Interval de ncredere pentru dispersie i raportul a dou
dispersii........................................................................................229

Capitolul 11. Teoria deciziei.............................................................................233


11.1. Decizii empirice .......................................................................233
11.2. Decizii statistice...........................................................................233
11.3. Ipoteze statistice...........................................................................234
11.4. Teste statistice..............................................................................234
11.5. Tipuri de erori..............................................................................234
11.6. Nivel de semnificaie ..................................................................235
11.7. Un exemplu..................................................................................236
11.8. Relaia dintre probabilitile i ..............................................239
11.9. Puterea unui test...........................................................................240

4
11.10. nc un exemplu.........................................................................242
11.11. Testarea irurilor binare.............................................................243
11.12. Testarea statistic a irurilor binare...........................................243
11.13. Noiunea de P-valoare................................................................245
11.14. Un exemplu: statistic repartizat normal..................................247
11.15. Alt exemplu: statistic repartizat 2.........................................249

Capitolul 12. Analiza regresiei.........................................................................251


12.1. Modele de regresie.......................................................................251
12.2. Modelul liniar. Estimarea parametrilor modelului prin metoda
celor mai mici ptrate...................................................................255
12.3. Modelul liniar clasic Gauss - Markov. Inferene asupra
estimatorilor unui model liniar.....................................................259
12.4. Previziunea i analiza rezultatelor unei regresii liniare................265

Capitolul 13. Statistic Bayesian i noiuni de teoria credibilitii.............281


13.1. Statistic Bayesian......................................................................281
13.2. Modelul de credibilitate Bhlmann..............................................289

Bibliografie........................................................................................................295
Anexe.................................................................................................................297

5
Introducere

Teoria probabilitilor i statistica matematic se aplic n majoritatea


domeniilor tiinei, ncepnd cu tiinele exacte i inginereti i finaliznd cu
tiinele socio-economice, n special acolo unde exist condiii de risc i
incertitudine i unde este necesar adoptarea unor decizii riguros argumentate.
Una dintre construciile de baz n fundamentele statisticii i teoriei
probabilitilor, precum i n justificarea aplicrii acestora n alte domenii, este
dat de legea numerelor mari teorem binecunoscut care i aparine
matematicianului Jakob Bernoulli (1654-1705), fiind aprut n lucrarea postum
Ars conjectandi (1713). Printre ali matematicieni care au rmas celebri n
teoria probabilitilor i statistic, i amintim pe: de Moivre, Laplace, Gauss,
Bertrand, Poincar, Cebev, Liapunov, Markov, Borel, Kolmogorov, Glivenko.
De asemenea, coala romneasc de probabiliti, fondat de Octav Onicescu, i
reprezentat de nume precum Gheorghe Mihoc i Marius Iosifescu, a adus
contribuii semnificative n dezvoltarea acestui domeniu.
Cartea de fa i propune s vin n sprijinul studenilor care au ca
disciplin de studiu, n cadrul a diferite specializri, disciplina Probabiliti i
statistic, oferindu-le acestora o gam larg de aspecte teoretice, nsoite de
exemple i aplicaii. Ca structur, cartea se fundamenteaz pe baza a treisprezece
capitole, ase dintre acestea fiind dedicate Teoriei probabilitilor, respectiv
apte capitole, Statisticii matematice.
n Capitolul 1, sunt prezentate concepte de baz ale teoriei
probabilitilor, mai precis, experiene aleatoare, evenimente, probabilitate,
reguli de calcul cu probabiliti, n timp ce n Capitolul 2, sunt abordate noiuni
precum variabile aleatoare, caracteristici numerice ale variabilelor aleatoare,
funcia caracteristic, funcia generatoare de momente. n Capitolul 3 sunt
prezentate principalele legi de probabilitate ale variabilelor aleatoare discrete i
anume: legea discret uniform, legea binomial i cazul su particular legea
Bernoulli, legea binomial cu exponent negativ i cazul particular legea
geometric, legea hipergeometric i legea Poisson (legea evenimentelor rare),
iar n Capitolul 4 sunt prezentate principalele legi de probabilitate ale
variabilelor aleatoare continue, i anume: legea continu uniform
(rectangular), legea normal (Gauss-Laplace), legea log-normal, legea
gamma, legea beta, legea 2 (Helmert-Pearson), legea Student (t) i cazul su
particular legea Cauchy, legea Snedecor i legea Fisher, legea Weibull i cazul
su particular, legea exponenial. Capitolul 5 se construiete n jurul
convergenei, de diferite tipuri, a variabilelor aleatoare, fiind menionate
convergena aproape sigur, convergena n probabilitate, convergena n
repartiie, precum i legile numerelor mari i teorema limit central. Partea
aferent teoriei probabilitilor se ncheie cu Capitolul 6, dedicat algoritmilor de
simulare a variabilelor aleatoare. n Capitolul 7, se studiaz elemente de
7
statistic descriptiv i aspecte privind organizarea datelor, ct i analiza
acestora, punndu-se accentul pe modalitile de reprezentare, dar i pe gsirea
diverselor mrimi caracteristice. Noiunile sunt nsoite de exemple adecvate i
actuale. n Capitolul 8 sunt prezentate noiuni de teoria seleciei, ncepnd cu
descrierea generrii unor valori particulare ale variabilelor aleatoare discrete sau
continue i continund cu legi de probabilitate ale variabilelor de eantionare.
Capitolul 9 conine o scurt introducere n teoria estimaiei. Se prezint, cu multe
exemple, conceptele de estimator nedeplasat i estimator de maxim
verosimilitate. n Capitolul 10, sunt prezentate intervalele de ncredere pentru
principalii parametri statistici. Astfel, capitolul debuteaz cu fundamentarea
formei generale a unui interval de ncredere, ca metod de estimare statistic,
dup care sunt prezentate pe rnd, intervalul de ncredere pentru medie,
incluznd cazul cnd dispersia este necunoscut, respectiv cazul particular al
unei proporii, apoi interval de ncredere pentru diferena a dou medii, respectiv,
interval de ncredere pentru dispersie i pentru raportul a dou dispersii, toate
acestea nsoite de exemple practice. Capitolul 11 prezint succint teoria deciziei.
Sunt descrise noiunile de ipotez statistic, test statistic, tipuri de erori, nivel de
semnificaie, putere a unui test, p-valoare. Exemplele sunt luate din practica
testrii irurilor binare n ceea ce privete caracterul aleator. n Capitolul 12, sunt
prezentate tehnici de analiz a regresiei, att prin intermediul aspectelor
teoretice, ct i prin intermediul unor exemple. n primul paragraf sunt trecute n
revist noiunile de baz, fiind definite diverse tipuri de modele de regresie,
urmnd ca n ultimele trei paragrafe spaiul s fie alocat cu precdere modelului
liniar. Astfel, este prezentat metoda celor mai mici ptrate n estimarea
parametrilor necunoscui ai unui model liniar multiplu, sunt realizate inferene
asupra estimatorilor unui model liniar n ipotezele clasice Gauss-Markov,
capitolul ncheindu-se cu aspecte care in de previziunea i analiza rezultatelor
unei regresii liniare. Cartea se ncheie cu Capitolul 13 n care sunt abordate
aspecte care in de statistica bayesian i noiuni de teoria credibilitii.
Cartea de fa a fost elaborat n cadrul proiectului
POSDRU/56/1.2/S/32768, Formarea cadrelor didactice universitare i a
studenilor n domeniul utilizrii unor instrumente moderne de predare-nvare-
evaluare pentru disciplinele matematice, n vederea crerii de competene
performante i practice pentru piaa muncii, de ctre un colectiv de autori, cadre
didactice universitare, astfel: capitolele 1 i 2, Lucia Cbulea, capitolele 3 i 4,
Rodica Luca-Tudorache, capitolele 5, 6 i 13, Gheorghi Zbganu, capitolele 7
i 8, Ariana Pitea, capitolele 9 i 11, Ioan Rasa, respectiv capitolele 10 i 12,
Nicoleta Breaz.
Finanat din Fondul Social European i implementat de ctre Ministerul
Educaiei, Cercetrii, Tineretului i Sportului, n colaborare cu The Red Point,
Oameni i Companii, Universitatea din Bucureti, Universitatea Tehnic de
Construcii din Bucureti, Universitatea Politehnica din Bucureti,
Universitatea din Piteti, Universitatea Tehnic Gheorghe Asachi din Iai,
Universitatea de Vest din Timioara, Universitatea Dunrea de Jos din Galai,
Universitatea Tehnic din Cluj-Napoca, Universitatea 1 Decembrie 1918 din
8
Alba-Iulia, proiectul contribuie n mod direct la realizarea obiectivului general al
Programului Operaional Sectorial de Dezvoltare a Resurselor Umane
POSDRU i se nscrie n domeniul major de intervenie 1.2 Calitate n
nvmntul superior.
Proiectul are ca obiectiv adaptarea programelor de studii ale disciplinelor
matematice la cerinele pieei muncii i crearea de mecanisme i instrumente de
extindere a oportunitilor de nvare.
Evaluarea nevoilor educaionale obiective ale cadrelor didactice i
studenilor legate de utilizarea matematicii n nvmntul superior, masterate i
doctorate precum i analizarea eficacitii i relevanei curriculelor actuale la
nivel de performan i eficien, n vederea dezvoltrii de cunotine i
competene pentru studenii care nva discipline matematice n universiti,
reprezint obiective specifice de interes n cadrul proiectului. Dezvoltarea i
armonizarea curriculelor universitare ale disciplinelor matematice, conform
exigenelor de pe piaa muncii, elaborarea i implementarea unui program de
formare a cadrelor didactice i a studenilor interesai din universitile partenere,
bazat pe dezvoltarea i armonizarea de curriculum, crearea unei baze de resurse
inovative, moderne i funcionale pentru predarea-nvarea-evaluarea n
disciplinele matematice pentru nvmntul universitar sunt obiectivele
specifice care au ca rspuns materialul de fa.
Formarea de competene cheie de matematic i informatic presupune
crearea de abiliti de care fiecare individ are nevoie pentru dezvoltarea
personal, incluziune social i inserie pe piaa muncii. Se poate constata ns c
programele disciplinelor de matematic nu au ntotdeauna n vedere identificarea
i sprijinirea elevilor i studenilor potenial talentai la matematic. Totui,
studiul matematicii a evoluat n exigene pn a ajunge s accepte provocarea de
a folosi noile tehnologii n procesul de predare - nvare - evaluare pentru a face
matematica mai atractiv.
n acest context, analiza flexibilitii curriculei, nsoit de analiza
metodelor i instrumentelor folosite pentru identificarea i motivarea studenilor
talentai la matematic ar putea rspunde deopotriv cerinelor de mas, ct i
celor de elit.
Viziunea pe termen lung a acestui proiect preconizeaz determinarea
unor schimbri n abordarea fenomenului matematic pe mai multe planuri:
informarea unui numr ct mai mare de membri ai societii n legtur cu rolul
i locul matematicii n educaia de baz n instrucie i n descoperirile tiinifice
menite s mbunteasc calitatea vieii, inclusiv popularizarea unor mari
descoperiri tehnice, i nu numai, n care matematica cea mai avansat a jucat un
rol hotrtor. De asemenea, se urmrete evidenierea a noi motivaii solide
pentru nvarea i studiul matematicii la nivelele de baz i la nivel de
performan; stimularea creativitii i formarea la viitorii cercettori
matematicieni a unei atitudini deschise fa de nsuirea aspectelor specifice din
alte tiine, n scopul participrii cu succes n echipe mixte de cercetare sau a
abordrii unei cercetri inter i multidisciplinare; identificarea unor forme de
pregtire adecvat de matematic pentru viitorii studeni ai disciplinelor
9
matematice, n scopul utilizrii la nivel de performan a aparatului matematic n
construirea unei cariere profesionale.

10
Capitolul 1

Teoria probabilitilor

1.1. Formalizarea experienelor aleatoare

1.1.1. Evenimente

Definiia 1.1.1. Realizarea practic a unui ansamblu de condiii bine precizat


poart numele de experien sau prob.

Definiia 1.1.2. Prin eveniment vom nelege orice rezultat al unei experiene
despre care putem spune c s-a realizat sau c nu s-a realizat, dup efectuarea
experimentului considerat. Evenimentele se pot clasifica n: evenimente sigure;
evenimente imposibile, evenimente aleatoare.

Definiia 1.1.3. Evenimentul sigur este evenimentul care se produce n mod


obligatoriu la efectuarea unei probe i se noteaz cu .

Definiia 1.1.4. Evenimentul imposibil este evenimentul care n mod obligatoriu


nu se produce la efectuarea unei probe i se noteaz cu .

Definiia 1.1.5. Evenimentul aleator este evenimentul care poate sau nu s se


realizeze la efectuarea unei probe i se noteaz prin litere mari A, B, C, , sau
prin litere mari urmate de indici Ai, Bi,.

Definiia 1.1.6. Evenimentul contrar evenimentului A se noteaz i este


evenimentul ce se realizeaz numai atunci cnd nu se realizeaz evenimentul A.

Definiia 1.1.7. Un eveniment se numete:


1) elementar dac se realizeaz ca rezultat al unei singure probe; se
noteaz cu .
2) compus dac acesta apare cu dou sau mai multe rezultate ale
probei considerate.

Definiia 1.1.8. Mulimea tuturor evenimentelor elementare generate de un


experiment aleator se numete spaiul evenimentelor elementare (spaiul de
selecie) i se noteaz cu . Acesta poate fi finit sau infinit.

11
Observaia 1.1.9. O analogie ntre evenimente i mulimi permite o scriere i n
general o exprimare mai comode ale unor idei i rezultate legate de conceptul de
eveniment. Astfel, vom nelege evenimentul sigur ca mulime a tuturor
evenimentelor elementare, adic: 1 , 2 ,..., n i orice eveniment compus
ca o submulime a lui . De asemenea, putem vorbi despre mulimea tuturor
prilor lui pe care o notm prin P( ), astfel c pentru un eveniment compus
A putem scrie, n contextul analogiei dintre evenimente i mulimi, c A
sau A P() .

Exemplul 1.1.10. Fie un zar, care are cele ase fee marcate prin puncte de la 1
la 6. Se arunc zarul pe o suprafa plan neted. Dac notm cu i =
evenimentul "apariia feei cu i puncte", i 1,6 , atunci spaiul evenimentelor
elementare ataat experimentului cu un zar este dat prin ={ 1 , 2 , 3 ,
4 , 5 , 6 }.
Evenimentul sigur este "apariia feei cu un numr de puncte 6".
Evenimentul imposibil este "apariia feei cu 7 puncte".

1.2. Relaii ntre evenimente

Definiia 1.2.1. Spunem c evenimentul A implic evenimentul B i


scriem A B , dac realizarea evenimentului A atrage dup sine i realizarea
evenimentului B.

Observaia 1.2.2. A B i B C rezult AC - proprietatea de


tranzitivitate a relaiei de implicare.

Definiia 1.2.3. Spunem c evenimentele A i B sunt echivalente (egale) dac


avem simultan A B i B A .

Definiia 1.2.4. Prin reunirea evenimentelor A i B vom nelege evenimentul


notat A B care const n realizarea a cel puin unuia dintre evenimentele A i
B. Deoarece evenimentele A i B sunt submulimi formate cu evenimentele
elementare ale spaiului , rezult c reunirea evenimentelor poate fi scris
astfel:

A B / A sau B
Observaia 1.2.5. Dac notm prin K mulimea tuturor evenimentelor asociate
unui experiment aleator avem:
1. A, B K A B B A (comutativitatea);
2. A, B, C K (A B) C A (B C) (asociativitatea);

12
3. Dac A, B K i A BAB B (evident A ,
A A , i A A ).

Definiia 1.2.6. Prin intersecia evenimentelor A i B vom nelege evenimentul


notat A B care const n realizarea simultan a ambelor evenimente.
Intersecia evenimentelor A i B poate fi scris sub forma:

A B / A i B
Observaia 1.2.7. Au loc relaiile urmtoare:
1. A, B K A B B A (comutativitatea)
2. A, B, C K (A B) C A (B C) (asociativitatea)
3. Dac A, B K i A B atunci A B A (evident
A A , A = , = i A A A ).
4. A K A A

Definiia 1.2.8. Spunem c evenimentele A i B sunt incompatibile dac


A B , adic realizarea lor simultan este imposibil, i spunem c sunt
compatibile dac A B , adic este posibil realizarea lor simultan.
Evenimentele A i B sunt contrare unul altuia dac A B i A B ,
adic realizarea unuia const din nerealizarea celuilalt.

Definiia 1.2.9. Se numete diferena evenimentelor A i B, evenimentul notat A-


B care se realizeaz atunci cnd se realizeaz evenimentul A i nu se realizeaz
evenimentul B. Diferena evenimentelor poate fi scris sub forma:

A B / A i B
Observaia 1.2.10. Evident avem A B A B i E A A .
Au loc relaiile lui De Morgan: A B A B i A B A B i
respectiv generalizrile A A ; A A
i i i i .
iI iI iI iI

Teorema 1.2.11. Dac evenimentele A, B, C, D K, atunci sunt adevrate


urmtoarele afirmaii:
i) A B = A (A B)
ii) A B = (A B) B
iii) A = (A B) (A B)
iv) (A B) (B A) =
v) A B = A [B - (A B)]
vi) A (B C) = (A B) - (A C)
vii) (A B) (C D) = (A C) (B D)

13
Definiia 1.2.12. Evenimentele A i B sunt dependente dac realizarea unuia
depinde de realizarea celuilalt i sunt independente dac realizarea unuia nu
depinde de realizarea celuilalt.
O mulime de evenimente sunt independente n totalitatea lor dac sunt
independente cte dou, cte trei etc.
Pentru evenimentele independente n totalitatea lor vom folosi i
denumirea de evenimente independente.

1.3. Cmp de evenimente

Definiia 1.3.1. O mulime nevid de evenimente K P() se numete corp


dac satisface axiomele:
i) A K A K
ii) A, B K A B K .
Cuplul ( , K) se numete cmp finit de evenimente, n cazul n care K
este un corp.

Observaia 1.3.2.
1. ntr-un cmp finit de evenimente ( , K) sunt adevrate afirmaiile:
a. A, B K A B K
b. Evident K i K .
c. Dac A, B K atunci A B K .
2. Dac mulimea evenimentelor elementare este numrabil, o mulime
K P() se numete corp borelian (sau -corp, sau -algebr) pe , n
condiiile:
i) A K A K ,
ii) dac I N, I i Ai K, i I , atunci Ai K ,
iI
iii) K .
Perechea ( , K) n care K este un -corp se numete cmp borelian
(cmp infinit) de evenimente.

Definiia 1.3.3. ntr-un cmp finit de evenimente ( , K), evenimentele A i K ,


i 1, n , formeaz un sistem complet de evenimente (sau o partiie a cmpului)
dac:
n
i) A i
i 1

ii) A i A j i j, i, j 1, n

14
Observaia 1.3.4. Evenimentele elementare i , i 1, n , corespunztoare unei
probe formeaz un sistem complet de evenimente care se mai numete sistem
complet elementar.

Propoziia 1.3.5. Dac 1 , 2 ,..., n atunci cmpul de evenimente


corespunztor conine 2n evenimente.

Demonstraie
Pentru un experiment de n rezultate elementare i prin urmare pentru un
eveniment sigur compus din n evenimente elementare, vom avea diverse
evenimente compuse din acestea dup cum urmeaz:
evenimente compuse din cte zero evenimente elementare Cn0
evenimente compuse din cte un eveniment elementar Cn1
evenimente compuse din cte dou evenimente elementare Cn2
----------------
evenimente compuse din cte k evenimente elementare Cnk
evenimente compuse din cte n evenimente elementare Cnn
i prin urmare, numrul total de evenimente ale lui K este egal cu
C n0 C n1 ... C nk ... C nn 2 n

1.4. Cmp de probabilitate


Definiia 1.4.1.(axiomatic a probabilitii) Fie ( , K) un cmp finit de
evenimente. Se numete probabilitate pe cmpul considerat o funcie P : K R
care satisface axiomele:
i) P( A) 0, A K ,
ii) P( )=1,
iii) P(A B) P(A ) P(B), A, B K, i A B .

Definiia 1.4.2. Se numete cmp finit de probabilitate tripletul { , , K, P} unde


cuplul ( , K) este un cmp finit de probabilitate, iar P : K R este o
probabilitate pe K.

Observaia 1.4.3. n cazul n care cmpul de evenimente ( , K) este infinit (K


este infinit) probabilitatea P definit pe K satisface axiomele:
i) P(A ) 0, A K
ii) P( )=1

15

iii) P A i PA i dac Ai A j i j, i, j I, A i K ,
iI iI
I-o mulime de indici cel mult numrabil.

Propoziia 1.4.4. Au loc relaiile:


1. P 0

2. P A 1 PA
n n
3. P A i PA i dac Ai A j i j, i, j 1, n
i 1 i 1

Demonstraie
1) Din relaiile = i = aplicnd axioma iii) din
definiia probabilitii avem P( ) = P( ) = P() + P( ) i rezult P() =
0
2) Din relaiile A A i A A aplicnd axioma iii) din
definiia probabilitii avem P ( A A) P ( A) P ( A) adic
P () P ( A) P ( A) i rezult P ( A) 1 P ( A)
3) Demonstrm prin inducie matematic

Pentru n = 2 P(A1 A2) = P(A1) + P(A2) relaia este adevrat conform


axiomei iii) din definiia probabilitii.
Presupunem relaia adevrat pentru n 1 evenimente, adic
n 1 n1
P Ai P( Ai ) i demonstrm pentru n evenimente
i 1 i 1
n
n1 n1 n 1 n
P Ai P Ai An P Ai P ( An ) P ( Ai ) P ( An ) P( Ai )
i 1 i 1 i 1 i 1 i 1

n1
dac s-a folosit ipoteza de inducie i s-a inut seama c Ai An .
i 1

Definiia 1.4.5. (clasic a probabilitii) Probabilitatea unui eveniment A este


egal cu raportul dintre numrul evenimentelor egal probabile favorabile
evenimentului A i numrul total al evenimentelor egal probabile.
Alt formulare: probabilitatea unui eveniment este raportul ntre
numrul cazurilor favorabile evenimentului i numrul cazurilor posibile.

Observaia 1.4.6.
1) Conform acestei definiii nu putem stabili probabilitatea unui
eveniment ce aparine unui cmp infinit de evenimente.
2) Definiia clasic se aplic numai atunci cnd evenimentele
elementare sunt egal posibile.
16
Exemplul 1.4.7. Considerm experiena de aruncare a unui zar. Evenimentele
elementare sunt egal posibile i avem 6 cazuri posibile. Notm cu A evenimentul
"apariia unei fee cu numr par de puncte 6 " numrul cazurilor favorabile
3 1
evenimentului A este 3. Deci P(A ) .
6 2

Exemplul 1.4.8. Dintr-o urn cu 15 bile numerotate de la 1 la 15 se extrage o


bil la ntmplare. Se consider evenimentele:
A = obinerea unui numr prim;
B = obinerea unui numr par;
C =obinerea unui numr divizibil prin 3.
S calculm probabilitile acestor evenimente.

Rezolvare
n aceast experien aleatoare numrul total al cazurilor posibile este
15.
Pentru A numrul cazurilor favorabile este 6, adic {2, 3, 5, 7, 11, 13},
6 2
deci P(A ) .
15 5
Pentru B numrul cazurilor favorabile este 7, adic {2, 4, 6, 8, 10, 12,
7
14}, deci P(B) .
15
Pentru C, numrul cazurilor favorabile este 5, adic { 3, 6, 9, 12, 15},
5 1
deci P(C) .
15 3

1.5. Reguli de calcul cu probabiliti

P1) Probabilitatea diferenei: Dac A, B K i A B atunci


P(B-A)=P(B)-P(A)

Demonstraie
Din relaiile B = A (B - A) i A (B - A) = aplicnd axioma iii)
avem P( B) P A ( B A) P( A) P( B A)
P2) Probabilitatea reunirii (formula lui Poincar):
Dac A, B K atunci P( A B) P( A) P( B) P( A B) .

Demonstraie
Din relaiile A B A B ( A B) i A B ( A B)
aplicnd axioma iii) avem
P( A B) P( A) PB ( A B) P( A) P( B) P( A B)

17
dac s-a folosit P1.
Generalizare:
Dac A1,A2,An sunt evenimente compatibile atunci
n n n n

P Ai P( Ai ) P ( Ai A j ) P ( Ai A j Ak ) ... ( 1) n 1 P Ai
i 1 i 1 i , j 1 i j k i 1
i j

P(A B)
P3) Probabiliti condiionate: Dac P(B) 0 atunci raportul l
P(B)
numim probabilitatea lui A condiionat de B i notm PB(A) sau P(A B) .

Demonstraie
Artm c PB ( A) satisface axiomele probabilitii:
i) PB ( A) 0 deoarece P( A B) 0 i P( B) 0
P( B E ) P( B)
ii) PB ( E ) 1
P( B) P( B)
iii) Fie A1 i A2 K i A1 A2 . Avem
PB ( A1 A2 ) P( B A1 ) ( B A2 )
PB ( A1 A2 )
P( B) P( B )
,
P( B A1 ) P( B A2 ) P( B A1 ) P( B A2 )
PB ( A1 ) PB ( A2 )
P( B) P( B) P( B)
dac ( B A1 ) ( B A2 ) .

Observaia 1.5.1.
1) Oricrui cmp de evenimente ( ,K) i putem ataa un cmp de
probabilitate condiionat { , K, PB}.
2) P(A B) P(B) PB (A) - formula de calcul a interseciei a dou
evenimente dependente. Are loc o generalizare: dac A1, A2, An sunt
evenimente dependente atunci
n
P A i P(A 1 ) PA1 (A 2 ) PA1 A 2 (A 3 )....Pn 1 (A n ).
i 1 Ai
i 1

3) Dac evenimentele A i B sunt independente atunci PB(A)=P(A) i


P(A B) P(A) P(B) - formula de calcul a interseciei a dou evenimente
independente.

Generalizare:
Dac A1, A2, An sunt evenimente independente atunci
n
n
P A i P(A i ) .
i 1 i 1

18
4) Dac evenimentele A i B se condiioneaz reciproc i
P(A) 0, P(B) 0 atunci P(A ) PA (B) P(B) PB (A) .

P4) Probabilitatea reunirii evenimentelor independente. Dac A1, A2, An sunt


n n
evenimente independente, atunci: P A i 1 1 P(A i )
i 1 i 1

Demonstraie
n n
Folosind relaiile lui De Morgan Ai Ai i faptul c Ai sunt
i 1 i 1
evenimente independente implic
n n n n n
P Ai 1 P Ai 1 P Ai 1 P( Ai ) 1 1 P( Ai )
i 1 i 1 i 1
i 1 i 1

P5) Inegalitatea lui Boole: A1, A2, An, sunt evenimente dependente atunci
n n n
P Ai P( Ai ) (n 1) 1 P( Ai )
i 1 i 1 i 1

Demonstraie
Verificm inegalitatea din enun prin inducie matematic.
Pentru n = 2 avem P( A1 A2 ) P( A1 ) P( A2 ) P( A1 A2 ) dac
P( A1 A2 ) 1 i rezult P( A1 A2 ) P( A1 ) P( A2 ) 1 relaia este adevrat.
Presupunem inegalitatea adevrat pentru n-1 adic
n 1 n1
P Ai P( Ai ) (n 2) i demonstrm pentru n.
i 1 i 1
Avem succesiv
n n1 n1
P Ai P Ai An P Ai P( An ) 1
i 1 i 1 i 1
n 1 n
P( Ai ) (n 2) P( An ) 1 P( Ai ) (n 1)
i 1 i 1
dac s-a inut seama de ipoteza de inducie.

P6) Formula probabilitii totale: Dac A1A2, An este un sistem complet de


n
evenimente i X K atunci P(X)= P(A i ) PA i (X).
i 1

19
Demonstraie
Din ipoteza c Ai, i 1, n este un sistem complet de evenimente rezult
c X ( A1 X ) ( A2 X ) ... ( An X )
Deoarece Ai A j , i j , i, j 1, n avem c
( X Ai ) ( X A j ) , i j, i, j 1, n
Avem succesiv
n n n
P( X ) P ( Ai X ) P( Ai X ) P( Ai ) PAi ( X )
i 1 i 1 i 1

P7) Formula lui Bayes: Dac A1, A2, An este un sistem complet de evenimente
al cmpului ( , K) i X K atunci:
P(A i ) PA i (X)
PX(Ai)= n , i 1, n
P(A i ) PAi (X)
i 1

Demonstraie
Deoarece P( X Ai ) P( X ) PX ( Ai ) i
P ( X Ai ) P ( Ai ) PAi ( X ) avem P ( X ) PX ( Ai ) P ( Ai ) PAi ( X ) , deci
P( Ai ) PAi ( X ) P( Ai ) PAi ( X )
PX ( Ai ) n
dac s-a folosit formula
P( X )
P( A ) P
i 1
i Ai (X )

probabilitii totale.

Exemplul 1.5.2. Cele 26 de litere ale alfabetului, scrise fiecare pe un cartona,


sunt introduse ntr-o urn. Se cere probabilitatea ca extrgnd la ntmplare de
5 ori cte un cartona i aezndu-le n ordinea extragerii s obinem cuvntul
LUCIA.

Rezolvare
Notm prin X evenimentul cutat, deci de a obine prin extrageri
succesive cuvntul LUCIA, de asemenea notm prin A1 = evenimentul ca la
prima extragere s obinem litera L; A2 = evenimentul ca la a doua extragere s
obinem litera U; A3 = evenimentul ca la a treia extragere s obinem litera C; A4
= evenimentul ca la a patra extragere s obinem litera I; A5 = evenimentul ca la a
cincea extragere s obinem litera A.
Atunci evenimentul X are loc dac avem
X A1 A 2 A 3 A 4 A 5 .
Rezult:

20
P( X ) P( A1 ) P( A2 A1 ) P( A3 A1 A2 ) P( A4 A1 A2 A3 )
1 1 1 1 1
P( A5 A1 A2 A3 A4 ) .
26 25 24 23 22

Exemplul 1.5.3. Dac probabilitatea ca un automobil s plece n curs ntr-o


diminea friguroas este de 0,6 i dispunem de dou automobile de acest fel,
care este probabilitatea ca cel puin unul din automobile s plece n curs ntr-o
diminea friguroas?

Rezolvare
Dac notm prin A1 i A2 evenimentele ca primul respectiv, al doilea
automobil s plece n curs i prin X evenimentul cutat, deci ca cel puin unul
dintre automobile s plece n curs, avem: X A 1 A 2 , iar
P(X ) P(A1 A 2 ) P(A 1 ) P(A 2 ) P( A1 A 2 ), deoarece evenimentele A 1
i A 2 sunt compatibile (cele dou automobile pot s plece n curs deodat).
Cum P( A 1 ) = P( A 2 ) = 0,6, iar evenimentele A 1 i A 2 sunt independente ntre
ele (plecarea unui automobil nu depinde de plecarea sau neplecarea celuilalt),
deci P( A1 A 2 ) = P( A1 )P(A 2 ) = (0,6) 2 . Se obine c P(X) = 0,6 + 0,6 - (0,6) 2
= 0,84.

Exemplul 1.5.4. Trei secii ale unei ntreprinderi S1 , S 2 , S3 depesc planul


zilnic de producie cu probabilitile de respectiv 0,7; 0,8 i 0,6. S se calculeze
probabilitile evenimentelor:
A - cel puin o secie s depeasc planul de producie.
B - toate seciile s depeasc planul de producie.

Rezolvare
Fie A i evenimentul ca secia Si s depeasc planul de producie.
Avem: A = A1 A 2 A 3 , deci
P(A) = P (A 1 A 2 A 3 ) 1 P( A1 A 2 A 3 ) = 1 P(A 1 ) P(A 2 ) P(A 3 ) =
1- (1-0,7)(1-0,8)(1-0,6) = 1 0,3 0,2 0,4 0,976 .
B = A1 A 2 A 3 i innd seama de independena evenimentelor, avem:
P(B) = P(A 1 A 2 A 3 ) P(A 1 ) P(A 2 ) P(A 3 ) 0,7 0,8 0,6 0,336 .

Exemplul 1.5.5. O pres este considerat c satisface standardul de fabricaie


dac trei caracteristici sunt satisfcute. Dac aceste caracteristici A, B i C sunt
9 7 11
satisfcute cu probabilitile P(A) = , P(B) = i P(C) = , atunci
10 11 12
probabilitatea ca s fie satisfcute toate trei caracteristicile se poate evalua cu
formula lui Boole. Astfel se poate scrie:

21

P( A B C) 1 P(A) P(B) P( C ) , adic
1 4 1 229
P( A B C) 1 .
10 11 12 660

Exemplul 1.5.6. Un sortiment de marf dintr-o unitate comercial provine de la


1 1
trei fabrici diferite n proporii, respectiv de la prima fabric, de la a doua
3 6
fabric i restul de la fabrica a treia. Produsele de la cele trei fabrici satisfac
standardele de fabricaie n proporie de 90%, 95% i respectiv 92%. Un client
ia la ntmplare o bucat din sortimentul de marf respectiv.
a) Care este probabilitatea ca produsul s satisfac standardele de
fabricaie?
b) Care este probabilitatea ca produsul s fie defect i s provin de la
prima fabric?

Rezolvare
a) Notm cu A1 , A 2 i A 3 evenimentele ca produsul cumprat s fie de
la prima, a doua, respectiv a treia fabric. Aceste trei evenimente formeaz un
1 1
sistem complet de evenimente i au probabilitile P( A1 ) , P(A 2 ) i
3 6
1
P( A3 ) . Dac A este evenimentul c produsul cumprat de client satisface
2
standardele de fabricaie, atunci P(A A1 ) 0,90, P( A A 2 ) 0,95 i
P( A A 3 ) 0,92 . Folosind formula probabilitii totale se obine:
P( A) P( A1 ) P( A A1 ) P( A2 ) P( A A2 ) P( A3 ) P( A A3 )
1 1 1 5,51
0,90 0,95 0,92 0,918
9 6 2 6
b) Folosind formula lui Bayes, avem:
P(A 1 )P( A A 1 )
P( A1 A)
P ( A1 ) P ( A A 1 ) P ( A 2 ) P ( A A 2 ) P ( A 3 ) P ( A A 3 )
1
0,10
3 0, 2
= 0,408.
1 1 1 0,49
0,10 0,05 0,08
3 6 2

Exemplul 1.5.7. Un student solicit o burs de studii la 3 universiti. Dup


trimiterea actelor necesare, acesta poate obine burs de la universitatea i (Ui)
sau nu (U i ) , 1 i 3 . Scriei evenimentele ce corespund urmtoarelor situaii :
a) primete o burs;

22
b) primete cel mult o burs;
c) primete cel puin o burs;
d) primete cel puin dou burse.

Rezolvare
a) Bursa primit poate fi de la prima universitate, caz n care celelalte
nu-i acord burs, sau de la a doua, caz n care prima i a treia nu-i acord burs,
sau de la a treia, caz n care primele dou nu-i acord burs. Avem astfel
evenimentul
A (U1 U 2 U 3 ) (U1 U 2 U 3 ) (U1 U 2 U 3 ) .
b) Avem dou variante : studentul nu primete nici o burs sau studentul
primete o burs. Obinem evenimentul
B (U1 U 2 U 3 ) A .
c) Evenimentul poate fi scris ca reuniunea a trei evenimente : studentul
primete o burs, dou burse, trei burse. Astfel C A E F , unde
E (U 1 U 2 U 3 ) (U 1 U 2 U 3 ) (U 1 U 2 U 3 ) ,
iar F U 1 U 2 U 3 .
d) Avem D E F . Altfel, evenimentul D este contrar evenimentului
B, deci D B (U 1 U 2 U 3 ) A .

Exemplul 1.5.8. ntr-un grup de studeni aflai n excursie se gsesc 6 fete i 9


biei. Se aleg la ntmplare doi studeni pentru a cerceta traseul. Care este
probabilitatea ca cei doi s fie :
a) biei;
b) fete;
c) un biat i o fat;
d) cel puin un biat;
e) primul biat i a doua fat;
f) de acelai sex.

Rezolvare
Notm cu A1 i A2 evenimentele alegerii unui biat la prima, respectiv a
doua alegere. La primul punct avem de calculat probabilitatea P( A1 A2 ) .
ntruct a doua alegere depinde de prima avem :
9 8 12
P( A1 A2 ) P( A1 ) P( A2 A1 ) ,
15 14 35
deoarece alegnd un biat mai rmn n grup 14 studeni ntre care 8 biei.
Evenimentul de la punctul b) se scrie astfel : B A1 A2 . Deci
6 5 1
P( B) P( A1 A2 ) P( A1 ) P( A2 A1 ) .
15 14 7

23
Evenimentul de la punctul c) este C ( A1 A2 ) ( A2 A1 ) aadar
P (C ) P ( A1 A2 ) P ( A2 A1 ) , ( A1 A2 , A2 A1 sunt incompatibile)
9 6
Dar P( A1 A2 ) P( A1 ) P( A2 / A1 ) ,
15 14
6 9
iar P( A2 A1 ) P( A1 ) P( A2 / A1 )
15 14
9 6 18
de unde P(C ) 2 .
15 14 35
Am obinut i probabilitatea evenimentului de la punctul e) P ( A1 A2 ) .
Evenimentul de la punctul d) se exprim astfel : D A1 A2 .
El este contrar evenimentului : B A1 A2 , prin urmare
1 6
P( D) 1 P( B) 1 . Evenimentul de la ultimul punct f) este
7 7
F ( A1 A2 ) ( A1 A2 ) . Cum ( A1 A2 ) ( A1 A2 ) cele dou
evenimente sunt incompatibile i deci

12 1 17
P( F ) P( A1 A2 ) P( A1 A2 ) .
35 7 35

Exemplul 1.5.9. La un examen de licen particip mai muli absolveni, ntre


care numai trei din strintate. Probabilitatea ca primul student s promoveze
este , probabilitatea ca al doilea s promoveze este 4/5, iar pentru al treilea
5/6. S se determine probabilitile ca :
a) toi cei trei studeni s promoveze;
b) cel puin unul s promoveze examenul.

Rezolvare
Fie Ai evenimentul promovrii examenului de ctre studentul i, i=1,2,3.
Evenimentul de la punctul a) este A A1 A2 A3 , iar de la punctul b) este
B A1 A2 A3 . Evenimentele Ai sunt independente (rezultatele celor 3
studeni nedepinznd unul de celelalte), deci

3 4 5 1
P( A) P( A1 ) P( A2 ) P( A3 ) .
4 5 6 2

Folosind proprietile probabilitii avem :

P( B) P( A1 A2 A3 ) P( A1 A2 ) P( A3 ) P(( A1 A2 ) A3 )
P( A1 ) P( A2 ) P( A1 A2 ) P( A3 ) P(( A1 A3 ) ( A2 A3 ))

24
P( A1 ) P( A2 ) P( A1 A2 ) P( A3 ) [ P( A1 A3 ) P( A2 A3 )
P(( A1 A3 ) ( A2 A3 )) P( A1 ) P( A2 ) P( A3 )
P( A1 A2 ) P( A1 A3 ) P( A2 A3 ) P( A1 A2 A3 ).

innd seama de independena evenimentelor Ai , i=1,2,3, avem:

P ( B ) P ( A1 ) P ( A2 ) P ( A3 ) P ( A1 ) P ( A2 ) P ( A1 ) P ( A3 ) P ( A2 ) P ( A3 )
3 4 5 3 4 3 5 4 5 3 4 5 119
P ( A1 ) P ( A2 ) P ( A3 ) .
4 5 6 4 5 4 6 5 6 4 5 6 120

Exemplul 1.5.10. Din mai multe controale asupra activitilor a trei magazine
se apreciaz c n proporie de 90%, 80%, 70%, cele trei magazine au declarat
marfa vndut. La un nou control, comisia de control solicit 50 de documente
privind activitatea comercial: 20 de la primul magazin, 15 de la al doilea, 15
de la al treilea. Dintre acestea se alege unul la ntmplare pentru a fi verificat:
a) Cu ce probabilitate documentul ales este corect (nregistrat)?
b) Constatnd c este corect, cu ce probabilitate el aparine primului
magazin?

Rezolvare
a) Notm cu A1, A2, A3 evenimentul ca documentul controlat s provin
de la primul, al doilea i respectiv al treilea magazin. Avem astfel

20 15 15
P( A1 ) ; P( A2 ) ; P( A3 ) .
50 50 50

Fie A evenimentul ca documentul controlat s fie corect. Atunci A/


A1, A / A2, A / A3 reprezint evenimentul ca documentul controlat s fie corect
tiind c el provine de la primul, al doilea, al treilea magazin. Prin urmare :
P(A/A1)=0,90; P(A/A2)=0,80; P(A/A3)=0,70 . Cum {A1, A2, A3} este un sistem
complet de evenimente

A1 A2 A3 E , A1 A2 A1 A3 A2 A3

aplicnd formula probabilitii totale avem :

P ( A) P ( A1 ) P ( A / A1 ) P ( A2 ) P( A / A2 ) P ( A3 ) P( A / A3 )
20 15 15
0,90 0,80 0,70 0,81.
50 50 50

b) Aplicnd formula lui Bayes avem :

25
20
0,90
P( A1 ) P( A / A1 ) 0,36 4
P( A1 / A) 3 50 .
0,81 0,81 9
P( Ai ) P( A / Ai )
i 1
(A1/A reprezint evenimentul ca documentul controlat s provin de la
primul magazin tiind c a fost corect).

26
Capitolul 2

Variabile aleatoare

Variabila aleatoare este una din noiunile fundamentale ale teoriei


probabilitilor i a statisticii matematice. n cadrul unei cercetri experimentale
se constat c ntre valorile numerice msurate exist diferene chiar dac rmn
neschimbate condiiile de desfurare ale experimentului.
Dac ne referim la o singur msurtoare, variabila aleatoare este acea
mrime care n cadrul unui experiment poate lua o valoare necunoscut aprioric.
Pentru un ir de msurtori, variabila aleatoare este o noiune care-l
caracterizeaz din dou puncte de vedere:
- caracterizare din punct de vedere cantitativ variabila ne d informaii
privind valoarea numeric a mrimii msurate;
- caracterizare din punct de vedere calitativ variabila aleatoare ne d
informaii privind frecvena de apariie a unei valori numerice ntr-un ir.
Dac valorile numerice ale unui ir de date aparin mulimii numerelor
ntregi sau raionale atunci se definete o variabil aleatoare discret, iar n cazul
aparteneei valorilor la mulimea numerelor reale se definete o variabil
aleatoare continu.

2.1. Variabile aleatoare discrete

n ciuda faptului c dup repetarea unui experiment de un numr mare


de ori intervine o anumit regularitate n privina apariiei unor rezultate ale
acestuia, nu se poate preciza niciodat cu certitudine care anume dintre rezultate
va apare ntr-o anumit prob. Din acest motiv cuvntul sau conceptul aleator
trebuie neles sau gndit n sensul c avem de-a face cu experimente sau
fenomene care sunt guvernate de legi statistice (atunci cnd exist un anumit
grad de incertitudine privind apariia unui rezultat sau reapariia lui) i nu de legi
deterministe (cnd tim cu certitudine ce rezultat va apare sau nu). Pentru ca
astfel de experimente sau fenomene s fie cunoscute i prin urmare studiate, sunt
importante i necesare dou lucruri i anume:
1. rezultatele posibile ale experimentului, care pot constitui o mulime
finit, infinit sau numrabil sau infinit i nenumrabil;
2. legea statistic sau probabilitile cu care este posibil apariia
rezultatelor experimentului considerat.
n linii mari i ntr-un neles mai larg, o mrime care ia valori la
ntmplare sau aleatoriu dintr-o mulime oarecare posibil se numete variabil
aleatoare (sau ntmpltoare). Se poate da i o definiie riguroas.
27
Definiia 2.1.1. Fie cmpul de probabilitate {, K, P}. Numim variabil
aleatoare de tip discret o aplicaie X : R care verific condiiile:
i) are o mulime cel mult numrabil de valori;
ii) x R ( X x ) K

Observaia 2.1.2.
1) Dac K = P() atunci ii) este automat ndeplinit;
2) O variabil aleatoare de tip discret este deci o funcie univoc de
forma
X : {x1, x2, xn, } R;
3) Se obinuiete ca valorile variabilei s se noteze n ordine
cresctoare adic x 1 x 2 x 3 ... x n .... , xi R, i = 1, 2,
4) Evenimentele Ai = X-1(xi) = { / X() = xi } K, oricare ar fi i
= 1, 2, 3, ,
X-1 : {x1, x2, xn, } K este inversa funciei X.

Definiia 2.1.3. Numim distribuia sau repartiia variabilei aleatoare X de tip


xi
discret, tabloul de forma X : unde xi, i I , sunt valorile posibile ale
pi iI
variabilei aleatoare X iar pi este probabilitatea cu care variabila considerat X
ia valoarea xi , adic pi = P(X = xi ), i I mulimea I putnd fi finit sau cel
mult numrabil.

Observaia 2.1.4.
1) Evenimentele (X = xi ), i I formeaz un sistem complet de
evenimente i pi 1 .
iI
2) Variabila aleatoare pentru care mulimea valorilor este un interval
finit sau infinit pe axa numerelor reale este variabil aleatoare continu.
3) Forma cea mai general a unei variabile aleatoare aparinnd unei
clase de variabile aleatoare de tip discret se numete lege de probabilitate
discret.

Definiia 2.1.5. Spunem c variabilele aleatoare X i Y care au respectiv


x yj
distribuiile X i i Y sunt independente dac
pi iI q j jJ
P(X = xi , Y = yj) = P(X = xi ) P(Y = yj), (i, j) IxJ.

28
Definiia 2.1.6. Fie variabilele aleatoare X, Y care au respectiv distribuiile
xi yj
X i Y atunci variabila aleatoare sum X+Y, produs X Y i ct
p
iI
i q
jJ
j

X xi y j
(dac y j 0, j J ) vor avea distribuiile X Y ,
Y p
ij ( i , j )IxJ
xiy j
X Y xi
p X
ij (i , j)IxJ , respectiv yj unde pij = P(X = xi, Y = yj)
Y
pij ( i , j )IxJ
(i,j) IxJ.

Definiia 2.1.7. Se numete


a) produs al variabilei aleatoare X prin constanta real a, variabila
ax
aleatoare notat prin aX : i
p i iI
b) sum a variabilei aleatoare X cu constanta real a, variabila
a xi
aleatoare notat prin a X :
pi iI
c) putere a variabilei aleatoare X de exponent k, k Z , variabila
xk
aleatoare X k : i cu condiia ca operaiile xik , i I , s aib
pi iI
sens.

Observaia 2.1.8. Au loc relaiile p


jJ
ij p i , i I i p
iI
ij q j , j J .

Dac variabilele X,Y sunt independente atunci pij pi q j , (i, j ) I J

Definiia 2.1.9. Fie { , K, P} un cmp de probabilitate, iar X : R o


variabil aleatoare. Numim funcie de repartiie ataat variabilei aleatoare X
funcia F : R [0, 1], definit prin F(x) = P X x , x R, adic
F(x)= p i , x R .
xi x

Dac nu exist pericol de confuzie, funcia de repartiie a variabilei


aleatoare X se noteaz prin F.

Propoziia 2.1.10. (proprieti ale funciei de repartiie)


1. a , b R , a b avem:

29
P(a X b) F (b) P X b F (a ) P X a
P(a X b) F (b) F (a ) P( X b)
P(a X b) F (b) F (a )
P(a X b) F (b) F (a ) P X a

Demonstraie
Avem succesiv
P (a X b) P ( X b, X a ) P( X b) ( X a)
P ( X b) P ( X a ) F (b) P X b F (a ) P X a
dac s-a inut seama de relaia ( X a ) ( X b) i s-a folosit probabilitatea
diferenei.
P ( a X b) P(a X b) ( X a) P (a X b) P ( X a)
F (b) P X b F (a) P X a P ( X a) F (b) P X b F (a)
dac s-a folosit relaia demonstrat anterior.
2. F este nedescresctoare pe R,
adic x1 , x 2 R, x1 x 2 F ( x1 ) F ( x 2 )

Demonstraie
0 P( x 1 X x 2 ) F ( x2 ) F ( x1 ) F ( x1 ) F ( x 2 )
3. lim F ( x) 0, lim F ( x) 1
x x

Demonstraie
lim F ( x ) lim P ( X x) P( ) 0
x x

lim F ( x) lim P ( X x) P ( E ) 1
x x
4. x R , F( x a ) F( x ) (F este continu la stnga n fiecare punct
x R)

Exemplul 2.1.11. Se consider variabila aleatoare discret


1 2 3 4
X : 2 7 1 1 . Care este probabilitatea ca X s ia o valoare mai mic
p p
4 3 6
sau egal cu 3?

Rezolvare
Pentru ca X s fie o variabil aleatoare trebuie ca p0
2 7 1 1 1
i p p 1 . Se obine soluia acceptabil p . Se calculeaz
4 3 6 4

30
probabilitatea cerut prin intermediul evenimentului contrar i anume
1 5
P( X 3) 1 P(X 4) 1 sau
6 6
1 7 1 5
P( X 3) P( X 1) P( X 2) P(X 3) .
16 16 3 6

Exemplul 2.1.12. Se dau variabilele aleatoare independente:


1 0 1 1 0 1
X : 1 1 1 ; Y : 1
2 .
p q 2 p q 12 p
6 3 3 3
a) S se scrie distribuia variabilei 2XY.
2
b) Pentru ce valori ale lui c avem: P (X Y c) ?
9

Rezolvare
Pentru ca X i Y s fie variabile aleatoare se impun condiiile:
1 1 1
p q 1
1 1 6 3 3
p 0; q 0;2p q 0 i apoi : , rezult valorile
6 3 1 2p q 12p 2 1
3
1
acceptabile p i q = 0. Deci variabilele aleatoare au repartiiile:
6
1 0 1 1 0 1
X : 1 1 1 ; Y : 1 1 1 . Avem :


3 3 3 3 3 3
2 0 2
a) 2 XY : 2 5 2

9 9 9
2 1 0 1 2
b) X Y : 1 2 3 2 1 , deci P(X + Y = c)> 2 corespunde
9
9 9 9 9 9
3 2
situaiei P(X + Y = 0) = adic c = 0.
9 9

Exemplul 2.1.13. Variabila aleatoare X cu distribuia urmtoare:

31
1
0, dac x ,
2
1
1 2 1 1
, dac x 1,
X:2 , are funcia de repartiie: F ( x ) P ( X x ) 6 2
1 1 1 2
6 2 3 , dac 1 x 2,
3
1, dac x 2
Graficul funciei de repartiie este:
F(x)
1

2/3

1/6

1/2 1 2 x

2.2. Vector aleator bidimensional

Definiia 2.2.1. Fie cmpul de probabilitate {, K, P}. Spunem c U=(X,Y) este


vector aleator bidimensional de tip discret dac aplicaia U : R 2 verific
condiiile:
i) are o mulime cel mult numrabil de valori;
ii) ( x , y) R 2 , (X x , Y y) K .

Definiia 2.2.2. Numim distribuia sau repartiia vectorului aleator (X,Y) de tip
discret tabloul:
Y y1yj
X
x1 p11p1j unde ( xi , y j ) sunt valorile

pe care le ia vectorul aleator


(X,Y), iar
p ij P ( X xi , Y y j ).
xi pi1pij
..

..

..
.

.
32
Evident p
i , j I J
ij = 1.

Definiia 2.2.3. Numim funcie de repartiie ataat vectorului aleator


bidimensional funcia F: R 2 0,1 , definit prin:
F(x,y) = P(X x, Y y), ( x , y) R 2 .

Propoziia 2.2.4.(proprietile funciei de repartiie a unui vector aleator


bidimensional de tip discret)
1. dac a<b i c<d, atunci
P(a X b, c Y d ) F (b, d ) F (a, c ) .
2. F(x,y) este nedescresctoare n raport cu fiecare argument.
3. lim F( x, y) lim F( x, y) lim F( x , y) 0; lim F( x, y) 1 .
x y x x
y y

4. F(x,y) este continu la stnga n raport cu fiecare argument.

Observaia 2.2.5. Dac (X,Y) are funcia de repartiie F, iar variabilele X i Y


au funciile de repartiie FX i respectiv FY , atunci:
FX ( x ) lim F( x, y) i FY ( y) lim F( x, y) .
y x

Exemplul 2.2.6. Se consider vectorul aleator discret (X,Y) cu repartiia dat n


tabelul:

Y 2 6
X

1 0,20 0,10
3 0,05 0,15
4 0,45 0,05

a) s se determine repartiia variabilelor X,Y, X+Y;


b) s se stabileasc dac X i Y sunt independente sau nu;
7
c) s se calculeze F ,5 .
2

Rezolvare
a) Variabila X are repartiia:

33
p1 p11 p12 0,20 0,10 0,30
1 3 4
X: , unde p 2 p 21 p 22 0,05 0,15 0, 20 , adic
p1 p 2 p 3
p 3 p 31 p 32 0, 45 0,05 0,50
1 3 4
X: .
0,30 0,20 0,50
2 6
Analog, variabila Y are repartiia Y: , unde

q 1 q 2
q 1 p11 p 21 p 31 0,20 0,05 0,45 0,70 2 6
, adic Y: .

q 2 p12 p 22 p 32 0,10 0,15 0,05 0,30 0,70 0,30
3 4 6 7 8 10
Avem: X+Y: .
0, 20 0,05 0,45 0,10 0,15 0,05

b) Pentru verificarea independenei variabilelor X,Y, efectum un
control, de exemplu:
P(X=1) P(Y=2) = 0,30 0,70 0,21 , iar P[(X=1) (Y=2)] = p11 0,20 .
Cum 0,21 0,20, deducem c X i Y sunt dependente.
7 7
c) F( ,5) P( X , Y 5) P[( X 1, Y 2) ( X 3, Y 2)]
2 2
=P(X=1,Y=2) +P(X=3,Y=2) = 0,20+0,05 = 0,25.

Definiia 2.2.7. Fie variabila aleatoare X avnd funcia de repartiie F , vom


spune c X este variabil aleatoare de tip continuu dac funcia de repartiie se
poate reprezenta sub forma:
x
F(x) = ( t )dt, x R .

Funcia : R R se numete densitate de probabilitate a variabilei
aleatoare X.

Propoziia 2.2.8. Au loc afirmaiile:


1) x R , ( x ) 0 .
2) F'(x) = ( x ) a.p.t. pe R.
b
3) P(a X<b) = ( x)dx .
a

4) ( x )dx 1 .

Observaia 2.2.9.
1. Pentru o variabil de tip continuu P(X=a)= 0, deci P(a X<b) =
b
P(a<X<b) = P(a X b) = P(a<X<b) = ( x )dx .
a

34
F ( x x ) F ( x ) P( x X x x )
2. ( x) F ' ( x ) lim lim , deci
x 0 x x 0 x
cnd x este mic avem P(x X x x ) ( x ) x .

Definiia 2.2.10. Fie vectorul aleator (X,Y) avnd funcia de repartiie F,


spunem c (X,Y) este un vector aleator de tip continuu, dac funcia de repartiie
F se poate pune sub forma:
x y
F(x,y) = (s, t ) ds dt , (x , y) R 2 , iar funcia : R 2 R se

numete densitate de probabilitate a vectorului aleator (X,Y).

Observaia 2.2.11. Dac este densitate de probabilitate pentru (X,Y), iar


X i Y densiti de probabilitate pentru X, respectiv Y au loc:
1) ( x , y) 0 , ( x, y) R 2 .
2 F( x, y)
2) ( x, y) a.p.t. pe R 2 .
xy
2
3) P((X,Y) D ) ( x, y ) dx dy , D R .
D

4) ( x, y) dx dy 1 .
R2

5) X ( x ) ( x , y)dy, x R ; Y ( y ) ( x, y )dx, y R .

Definiia 2.2.12. Spunem c variabilele aleatoare de tip continuu X i Y sunt


independente dac F(x,y) = FX ( x ) FY ( y) , ( x , y) R 2 .

kxy 2 , ( x, y ) 1,2 1,3


Aplicaia 2.2.13. Funcia ( x, y ) este densitate de
0 , n rest
probabilitate dac ( x, y ) 0 i ( x, y )dxdy 1 ceea ce implic
R2
2 3 1
ecuaia n k, k xy 2dxdy 1 , verificat pentru k .
1 1 13
n acest caz funcia de repartiie va fi
0 , dac x 1 sau y 1
1 2 3
( x 1)( y 1) , dac x , y 1, 2 1,3
78
x y 1
2
F ( x , y ) uv dudv ( y 3 1) , dac y 1,3 i x 2
26
1 1

1 ( x 2 1) , dac y 1, 2 i y 3
2
1 , dac x 2 i y 3

35
i deducem de asemenea c funciile de repartiie marginale sunt, respectiv,
0 , x 1 0 , y 1
1 2 1 2
FX ( x ) ( x 1) , x 1, 2 ; FY ( y ) ( x 1) , y 1,3
3 3
1 , x 2 1 , y3

2.3. Caracteristici numerice asociate variabilelor aleatoare

Fie , K, P un cmp de probabilitate i X : R o variabil


aleatoare. n afara informaiilor furnizate de funcia de repartiie F (x) sau chiar
de repartiia probabilist (discret pi sau continu (x ) ale unei variabile
aleatoare X, de un real folos teoretic i practic sunt i informaiile pe care le
conin anumite caracteristici numerice (valoarea medie, dispersia, abaterea medie
ptratic sau diverse alte momente) ale lui X despre aceast variabil aleatoare.

Valoarea medie (sperana matematic)

Definiia 2.3.1. Fie {, K, P} un cmp borelian de probabilitate i variabila


x
aleatoare X : R cu distribuia X i , i I . Se numete valoare medie,
pi
caracteristica numeric E ( X ) xi pi .
iI
Observaia 2.3.2.
1) Dac I este finit, valoarea medie exist.
2) Dac I este infinit numrabil, E(X) exist cnd seria care o
definete este absolut convergent.

Definiia 2.3.3. Fie{, K, P} un cmp borelian de probabilitate i variabila


x
aleatoare X : R de tip continuu X , x R . Se numete valoarea
( x )

medie a variabilei X, caracteristica numeric E ( X ) x (x)dx . Valoarea

medie exist atunci cnd integrala improprie care o definete este convergent.

Propoziia 2.3.4.(proprietile valorii medii) Au loc afirmaiile :


1) E (a X b) a E(X) b, a, b R
2) E(X + Y) = E(X) + E(Y)
3) X,Y independente E(X Y) = E(X) E(Y)

Demonstraie

36
a) Fie variabilele aleatoare de tip discret X, Y avnd repartiiile
x yj
X i , Y
pi iI q j jJ
1. Avem E(aX b) (axi b) pi axi pi bpi aE( X ) b
iI iI iI

ax b
dac variabila aX b are repartiia aX b i i p i 1.
pi iI iI

xi y j
2. Variabila X+Y are repartiia X Y
,
pij (i , j )I J
pij P( X xi , Y y j )
Rezult
E ( X Y ) ( xi y i ) pij xi pij y j p ij
iI jJ iI jJ iI jJ

xi pi y j q j E ( X ) E (Y )
iI jJ

dac s-au folosit relaiile p


iI
ij q j i p
jJ
ij pi

xi y j
3. Variabila XY are repartiia XY
dac X i Y sunt
pi q j (i , j )I J
independente.
Avem E ( XY ) xi y j pi q j x i p i y j q j E ( X ) E (Y )
iI jJ iI jJ

b) Presupunem ca X i Y sunt variabile aleatoare de tip continuu.


1. Dac notm prin Y = aX + b, a 0, atunci se obine c
xb
X ( )
Y ( x) a , pentru orice x R.
a

1 xb
Avem: E (aX b) E (Y )

x Y ( x)dx

a
x Y (
a
)dx de unde prin

schimbarea de variabil u = (x b)/a, dx = adu, obinem



E ( aX b ) (au b) X (u )du a u X (u )du b X (u )du aE ( X ) b

2. Dac notm prin Z = X + Y, variabila care are densitatea de
probabilitate Z , iar densitatea de probabilitate a vectorului (X, Y) o notm prin
, atunci:

E ( X Y ) E (Z ) s

Z ( x) dx x ( (u , x u ) du ) dx

37
Schimbm ordinea de integrare, apoi schimbarea de variabil
x u = t, dx = dt, i obinem

E( X Y ) ( x (u, x u )dx)du

( (t u ) (u, t )dt )du


t ( (u, t ) du ) dt u ( (u , t ) dt )du t X (t ) dt u Z (u ) du E (Y ) E ( X )

3. Dac notm prin V =X Y, care are densitatea de probabilitate V , iar


densitatea de probabilitate a vectorului (X, Y) o notam prin , atunci

x dx
E ( XY ) E (V ) x V ( x ) dx x ( (u , u ) u ) dx
Schimbm ordinea de integrare, apoi facem schimbarea de variabil
x / u = t, dx = udt, i obinem:

x x
E ( XY ) ( (u , ) dx )du ( tu (u , t )dt )du

u u

tu X (u ) Y (t )dtdu u X (u )du t Y (t )dt E ( X ) E (Y )

Dispersia

Definiia 2.3.5. Fie {, K, P} un cmp borelian de probabilitate i variabila


aleatoare X : R. Se numete dispersia (variana) variabilei aleatoare X,
2

caracteristica numeric Var ( X ) E X E ( X ) iar ( X ) Var ( X ) se
numete abatere medie ptratic.

2
n mod explicit, dispersia are expresia Var ( X ) x i E ( X ) pi ,
iI
I N , dac X este o variabil aleatoare discret sau
2
Var ( X ) x M ( X ) ( x )dx , dac X este o variabil aleatoare
R
continu.
Dispersia este un indicator numeric al gradului de mprtiere (sau de
dispersare) a valorilor unei variabile aleatoare n jurul valorii medii a acesteia.

Propoziia 2.3.6.(proprietile dispersiei)


a) Var ( X ) E ( X 2 ) E ( X )2
b) Var (aX b) a 2Var ( X ), a, b R
c) X,Y independente Var ( X Y ) Var ( X ) Var (Y )

Demonstraie

38
a)

Var ( X ) E X E ( X ) E X 2 2 E ( X ) X E ( X )
2 2

E ( X 2 ) 2 E ( X ) E ( X ) E ( X ) E ( X 2 ) E ( X )
2 2

dac s-a fcut un calcul formal.


b) Folosind proprietile valorii medii i definiia dispersiei avem:

Var (aX b) E (aX b aE ( X ) b) 2 E a 2 X E ( X )
2


a E X E ( X ) a Var ( X )
2 2
2

c) Dac X, Y sunt independente avem E ( XY ) E ( X ) E (Y ) . Calculm



Var ( X Y ) E X Y E ( X Y ) E X E ( X ) Y E (Y )
2 2


E X E ( X ) Y E (Y ) 2 X E ( X ) Y E (Y )
2 2

E X E ( X ) E Y E (Y ) 2 E X E ( X ) E Y E (Y )
2 2

Var ( X ) Var (Y )
dac s-a inut seama c E X E ( X ) 0

Propoziia 2.3.7.(Inegalitatea lui Cebev) Dac variabila aleatoare X are


valoare medie i dispersie atunci 0 are loc inegalitatea
Var ( X )
P( X E ( X ) ) 1 sau inegalitatea echivalent cu aceasta
2
Var ( X )
P( X E ( X ) ) .
2

Demonstraie
Presupunem c X este o variabil aleatoare de tip continuu, avnd
densitatea de probabilitate (x) . Atunci

Var ( X ) ( x E ( X )) 2 ( x )dx ( x E ( X )) 2 p ( x )dx
D

unde D x / x E( X ) , deoarece x E( X ) , avem c (x E( X ))2 .


Deci, avem
2 2 2
( x E ( X )) ( x)dx ( x)dx P( X E ( X ) )
D D
2
Am obinut c Var ( X ) P ( X E ( X ) ) , rezult
Var ( X )
P( X E ( X ) )
2
Folosind probabilitatea evenimentului contrar se obine i cealalt form a
Var ( X )
inegalitii: P( X E ( X ) ) 1 P( X E ( X ) ) 1
2

Aplicaia 2.3.8. Dac X este o variabil aleatoare discret

39
2 1 0 1 2 3
X : 1 2 2 5 1 1

12 12 12 12 12 12
atunci deducem c:
1 2 2 5 1 1 1
E ( X ) 2 1 0 1 2 3
12 12 12 12 12 12 2
1 2 2 5 1 1
E( X 2 ) 4 1 0 1 4 9 2
12 12 12 12 12 12
1 7
Var ( X ) E ( X 2 ) E ( X ) 2
2

4 4
7
( X ) Var ( X )
2
Aplicaia 2.3.9. Dac X este variabil aleatoare continu
x
x , x 1,3
X : , ( x ) 4
( x) 0, n rest
atunci deducem c:
3 3
3 x3 13 3 x4
E( X ) x ( x )dx , E ( X 2 ) x 2 ( x)dx 5
1 12 1 6 1 16 1
169 11
Var ( X ) E ( X 2 ) E ( X ) 5
2

36 36
11
( X ) Var ( X )
6

Momente

Definiia 2.3.10. Fie {, K, P} un cmp borelian de probabilitate i variabila


aleatoare X : R. Se numete moment iniial (obinuit) de ordin k al
variabilei aleatoare X, caracteristica numeric mk E ( X k )

Observaia 2.3.11. a) Pentru k=1 avem m1 E ( X ) iar pentru k=2,


Var ( X ) m2 m12
x
b) Dac X este variabil de tip discret avnd repartiia X : i ,
pi iI
pi 1 atunci mk xik pi
i I iI

40
x
c) Dac X este variabil de tip continuu X : atunci
( x ) x R
mk x k ( x)dx
R

Definiia 2.3.12. Se numete moment centrat de ordin k al variabilei aleatoare


k
X, caracteristica numeric k E X E ( X ) , adic
xi E ( X ) k pi , X discret
iI
k
xi E ( X ) ( x )dx , X continu
k

Observaia 2.3.13. Pentru k=1 avem 1 0 , iar pentru k=2, 2 Var ( X )

Teorema 2.3.14. ntre momentele centrate i momentele iniiale exist


k
urmtoarea relaie: k (1) i C ki mk i m1i .
i 0
Demonstraie
Avem
k
k
k

k E X E ( X ) E X m1 E C ki X k i ( m1 ) i
i 0
k k k
E (1) i C ki X k i m1i (1) i C ki E ( X k i )m1i (1) i C ki mk i m1i
i 0 i 0 i 0

Observaia 2.3.15. n statistica matematic se utilizeaz de regul primele patru


momente centrate: 1 , 2 , 3 , 4 .
Definiia 2.3.16. Se numete momentul iniial de ordinul (r,s) al vectorului
aleator (X,Y) caracteristica numeric mrs E ( X r Y s ) , adic
xir y sj p ij , ( X , Y ) discret
iI jJ
mrs r s
2 x y ( x, y )dxdy , (X, Y) continuu
R

Definiia 2.3.17. Se numete moment centrat de ordin (r,s) al vectorului aleator


(X,Y), caracteristica numeric

rs E ( X E ( X )) r (Y E (Y ) s , adic

41
xi E ( X ) r y j E (Y )s pij , ( X , Y ) discret
iI jJ
rs
x E ( X ) y E (Y ) ( x, y )dxdy , (X, Y) continuu
r s

R2

Observaia 2.3.18.
m1 o E ( X ), m0 1 E (Y ), 2 0 Var ( X ), 0 2 Var (Y )

Corelaie sau covarian

Definiia 2.3.19. Se numete corelaia sau covariana variabilelor aleatoare X i


Y, caracteristica numeric
C ( X , Y ) E X E ( X )Y E (Y ) adic C(X, Y) 11

Observaia 2.3.20.
1) C ( X , Y ) E ( XY ) E ( X ) E (Y ), C(X, Y) m11 m10 m01
Dac X, Y independente C(X, Y) 0 , dar nu i reciproc.
C ( X , X ) Var ( X )
m n m n
C ai X i , b jY j a b C X i j i , Y j , oricare ar fi variabilele
i 1 j 1 i 1 j 1

aleatoare Xi i Yj i oricare ar fi constantele reale ai i bj, 1 i m , 1 j n


C ( X , Y ) C (Y , X ) , oricare ar fi X i Y.

Definiia 2.3.21. Se numete coeficient de corelaie relativ la variabilele


aleatoare X i Y caracteristica numeric
r(X, Y)= C ( X ,Y )
Var ( X ) Var (Y )

Observaia 2.3.22.
1) X, Y independente r(X, Y) 0 reciproc nu este adevrat;
2) Spunem c X,Y sunt necorelate dac r(X,Y) =0
Proprieti:
a) r ( X, Y) 1
b) r ( X , Y ) 1 Y a X b, a 0
c) r ( X , Y ) 1 Y aX b, a 0

Observaia 2.3.23. n practic se mai spune c:


1) X i Y sunt pozitiv perfect corelate dac r ( X , Y ) 1 ;
2) X i Y sunt negativ perfect corelate dac r ( X , Y ) 1 ;
3) X i Y sunt puternic pozitiv (sau negativ) corelate dac

42
0,75 r ( X , Y ) 1 (sau 1 r ( X , Y ) 0,75 );
4) X i Y sunt slab pozitiv (sau negativ) corelate dac 0 r ( X , Y ) 0, 25
(sau 0,25 r ( X , Y ) 0 );
Marginile valorice decizionale fiind alese convenional.

Aplicaia 2.3.24. Fie (X,Y) un vector aleator discret a crui repartiie


probabilist este dat de tabelul de mai jos.
Calculai coeficientul de corelaie r(X,Y).
Y
-1 0 1 2 pi
X
-1 1/6 1/12 1/12 1/24 9/24
0 1/24 1/6 1/12 1/24 8/24
1 1/24 1/24 1/6 1/24 7/24
qj 6/24 7/24 8/24 3/24 1

Rezolvare
Pe baza formulelor corespunztoare, deducem imediat:
9 8 7 2 1
E ( X ) 1 0 1
24 24 24 24 12
9 8 7 16 2
E( X 2 ) 1 0 1
24 24 24 24 3
2 1 95
Var ( X ) E ( X 2 ) [ E ( X )]2
3 144 144
6 7 8 3 8 1
E (Y ) 1 0 1 2
24 24 24 24 24 3
6 7 1 3 26 13
E (Y 2 ) 1 0 1 4
24 24 24 24 24 12
13 1 35
Var (Y ) E (Y 2 ) [ E (Y )]2
12 9 36
1 1 1 1 1 1 1 1
E ( XY ) 1 1 0 1 2 0 1 0 1 2
6 12 12 24 24 6 12 24
1 1 1 1 5
1 1 0 1 2
24 24 6 24 24
5 1 17
C ( X , Y ) E ( XY ) E ( X ) E (Y )
24 36 72
17
C( X , Y ) 12
r( X , Y ) 0,295
Var ( X )Var (Y ) 95 35

144 36

43
Observaia 2.3.25. Coeficientul de corelaie r ( X ,Y ) reprezint prima msur a
corelaiei sau gradului de dependen n sens clasic. Introdus de ctre
statisticianul englez K. Pearson n anul 1901 ca rod al colaborrii acestuia cu
antropologul englez F. Galton (care a avut prima idee de msurare a corelaiei
sub denumirea de variaie legat), aceast msur a gradului de dependen a
fost criticat nc de la apariiei ei pentru diverse motive, printre care i aceea
c:
1) este dependent de valorile vectorului aleator ( X , Y ) i ca urmare nu
este aplicabil pentru cazul variabilelor aleatoare necantitative;
2) nu este precis n cazul independenei i al necorelrii deoarece
dac r ( X ,Y ) 0 nu exist un rspuns categoric (n sensul
independenei sau necorelrii);
3) nu poate fi extins la mai mult de dou variabile aleatoare sau chiar
la doi sau mai muli vectori aleatori, fapte cerute de practic.
Dac la prima obiecie a dat chiar K. Pearson un rspuns, pentru
celelalte dou obiecii nu s-au dat rspunsuri clare dect dup apariia n 1948
a teoriei matematice a informaiei, rezultate remarcabile n acest sens obinnd
coala romneasc de matematic sub conducerea lui Silviu Guiau introducnd
msurile entropice ale dependenei dintre variabile aleatoare i vectori aleatori
(n anii 1974-1978) cu o larg aplicabilitate teoretic i practic.
n ciuda tuturor criticilor ce i s-au adus, coeficientul de corelaie clasic
(sau coeficientul Galton-Pearson) este cel mai frecvent utilizat n practic i,
pentru c este cel mai simplu n utilizare.

Definiia 2.3.26. Fiind dat vectorul aleator Z X 1, X 2 ,..., X n Z : E R n , se


numete valoare medie a acestuia i se noteaz cu E (Z ) , dac exist, vectorul
n-dimensional ale crui componente sunt valorile medii ale componentelor lui Z
adic:
E ( Z ) E ( X 1 , X 2 ,..., X n ) E ( X 1 ), E ( X 2 ),..., E ( X n ) .
Se numete matrice de covarian (sau de corelaie) a vectorului Z i se
noteaz prin C (Z ) , dac exist, matricea C ( Z ) cij i 1, n C X i , Y j i , j 1, n
j 1, n

Observaia 2.3.27.
a) Pentru cazul unui vector aleator bidimensional, a nu se face confuzie
ntre media produsului componentelor X i Y, care este E ( XY ) i
media vectorului ( X , Y ) care este E ( X , Y ) .
b) Uneori matricea de corelaie C (Z ) se mai noteaz i cu (Z ) .
c) Desfurat matricea de covarian C (Z ) are forma:

44
Var ( X 1 ) C ( X 1 , X 2 ) ... C ( X 1 , X n )

C ( X 2 , X 1 ) Var ( X 2 ) ... C ( X 2 , X n )
C (Z )
... ... ... ...

C ( X , X ) C ( X , X ) ... Var ( X )
n 1 n 2 n
i ca urmare a proprietilor corelaiei, constatm c matricea C (Z ) este
simetric.
d) Pornind de la definiia coeficientului de corelaie i de la matricea
de corelaie, dac toate componentele lui Z sunt neconstante, atunci
putem introduce matricea coeficienilor de corelaie R(Z ) a crei
form dezvoltat este:
1 r ( X 1 , X 2 ) ... r ( X 1, X n )

r ( X 2 , X1 ) 1 ... r ( X 2 , X n )
R( Z )
... ... ... ...

r ( X , X ) r ( X , X ) ... 1
n 1 n 2
Ambele forme ale matricei de corelaie a vectorului aleatoriu Z
reprezint de fapt tabele ale msurrii gradului de dependen dintre
componentele lui Z, considerate dou cte dou.

Aplicaia 2.3.28. Fie variabilele aleatoare:


1 1 1 3 2 4
X 1 : ; X 2 : ; X 3 :
p1 p2 q1 q2 r1 r2
a cror repartiie comun notat ( pijk ) , 1 i, j, k 2 , este:
1 1 1 3
p111 ; p112 ; p121 ; p122 ;
16 16 32 32
1 1 1 5
p211 ; p212 ; p221 ; p222 .
8 4 16 16
S se determine repartiiile bidimensionale i unidimensionale ale
vectorului aleator tridimensional Z X 1, X 2 , X 3 i matricele de corelaie
C (Z ) i R(Z ) .
Rezolvare
Avem imediat repartiiile bidimensionale
1 1
p11 p111 p112 8 p12 p121 p122
8 pentru X , X
;
3 3 1 2
p21 p211 p212 p22 p221 p222
8 8
3 5
p11 p111 p121 32 p1 2 p112 p122
32 pentru X , X
;
8 9 1 3
p21 p211 p221 p2 2 p212 p222
16 16
45
3 5
p11 p111 p211 16 p12 p112 p212
32 pentru X , X
;
3 13 2 3
p 21 p121 p221 p 22 p122 p222
32 32
i ca urmare putem scrie urmtoarele tabele de repartiie bidimensionale:
X2 X3 X3
1 3 pi 2 4 pi 2 4 qi
X1 X1 X2
-1 1/8 1/8 -1 3/32 5/32 1/4 1 3/16 5/16 1/2
1 3/8 3/8 1 3/16 9/16 3/4 3 3/32 13/32 1/2
qj 1/2 1/2 1 rk 9/32 23/32 1 rk 9/32 21/32 1

din care se observ i repartiiile unidimensionale (repartiiile variabilelor


aleatoare considerate X1, X2, X3). Din aceste tabele deducem prin calcul imediat:
1 3
E ( X 1 ) ; E ( X 12 ) 1 ; Var ( X 1 )
2 4
2
E ( X 2 ) 2 ; E ( X 2 ) 5 ; Var ( X 2 ) 1
55 101 207
E( X 3 ) ; E ( X 32 ) ; Var ( X 3 )
16 8 256
E ( X 1 X 2 ) 1 ; E ( X 1 ) E ( X 2 ) 1 ; C ( X 1, X 2 ) 0 ; r ( X 1 , X 2 ) 0
29 55 3 3
E( X1 X 3 ) ; E( X 1 )E(X 3 ) ; C ( X 1, X 3 ) ; r ( X 1 , X 3 ) 0,12
16 32 32 207
113 55
E( X 2 X 3 ) ; E ( X 2 )E ( X 3 ) ;
16 8
3 3
C ( X 2 , X 3 ) ; r( X 2 , X 3 ) 0,21
16 207
i ca urmare putem scrie matricele de corelaie:
34 0 3 32 1 0 0,12

C (Z ) 0 1 3 16 i R (Z ) 0 1 0,21
3 32 3 16 207 256 0,12 0,21 1

constatnd c X1 i X2 sunt independente n timp ce ntre X3 i X1 sau X3 i X2
exist o anumit dependen chiar dac nu este puternic.

Alte caracteristici numerice

Definiia 2.3.29. Se numete mediana unei variabile aleatoare X, caracteristica


numeric Me care verific relaia:
1
P( X M e ) P( X M e )
2

46
Observaia 2.3.30. 1. Dac F este funcia de repartiie i este continu atunci
1
M e se determin din ecuaia F(Me) .
2
ab
2. Dac M e (a, b] atunci se ia M e
2

Definiia 2.3.31. Se numete valoare modal sau modul a variabilei aleatoare X


orice punct de maxim local al distribuiei lui X (n cazul discret) respectiv al
densitii de probabilitate (n cazul continuu).

Observaia 2.3.32. Dac exist un singur punct de maxim local spunem c legea
lui X este unimodal altfel o numim plurimodal.

Definiia 2.3.33. Se numete asimetria (coeficientul lui Fischer) variabilei



aleatoare X caracteristica numeric definit prin s 33 .

Definiia 2.3.34. Se numete exces al variabilei aleatoare X, caracteristica



numeric definit prin e 44 3 .

Observaia 2.3.35.
1) Dac e<0 atunci graficul distribuiei are un aspect turtit i legea se
numete platicurtic.
2) Dac e>0 atunci graficul distribuiei are un aspect ascuit i legea va
fi numit leptocurtic.
3) Dac e = 0 atunci repartiiile sunt mezocurtice.

Definiia 2.3.36. Dac X este o variabil aleatoare cu funcia de repartiie


F (x) , se numesc cuartile (n numr de trei) ale lui X (sau ale repartiiei lui X)
numerele q1 , q2 i q3 cu proprietile:
1 1 3
F (q1 ) 4 F ( q2 ) 2 F (q3 ) 4
1 1 3
F (q1 0) F ( q2 0) F (q3 0)
4 2 4
Observm c q2 Me .

1 0 2
Exemplul 2.3.37. Se consider variabila aleatoare X : .
0,2 0,3 0,5
S se calculeze: E(X), E(3X), E(4X-2), Var ( X ), X .

47
Rezolvare
3
E ( X ) xi p i 1 0,2 0 0,3 2 0,5 0,8
i 1
E (3 X ) 3E ( X ) 3 0,8 3,4 ; E (4 X 2) 4 E ( X ) 2 4 0,8 2 1,2
Var ( X ) E ( X ) E ( X ) 2,2 0,64 1,56 ;
2 2

E ( X 2 ) (1) 2 0, 2 0 2 0,3 2 2 0,5 2,2 ; X Var ( X ) 1,56 1,24

Exemplul 2.3.38. S se calculeze valoarea medie i dispersia variabilei


aleatoare care are densitatea de probabilitate
1 1 x , dac x (0,2)
( x )
0, altfel
Rezolvare
x, dac 0 x 1

Observm c: ( x ) 2 - x, dac 1 x 2
0, altfel

innd seama de definiie avem:
1 2 x3 1 2 2 x3 2
E ( X ) x (x)dx x 2 dx x(2 x)dx x 1
0 1 3 0 1
3 1
1 2 x4 1 x3 2 x4 2 7
E ( X 2 ) x 2 ( x)dx x 3 dx x 2 (2 x)dx 2
0 1 4 0 3 1 4 1 6
7 1
Var ( X ) E ( X 2 ) E ( X ) 1
2

6 6

Exemplul 2.3.39. Fie vectorul aleator (X,Y) cu densitatea de probabilitate


k ( x y 1), x [0,1], y [0,2]
( x , y) Se cere:
0, n rest
a) s se determine constanta k;
b) s se determine densitile marginale;
c) s se cerceteze dac X i Y sunt independente sau nu;
d) s se calculeze coeficientul de corelaie ntre X i Y.

Rezolvare
a) din condiiile ( x , y) 0 k 0
1 2
( x, y )dxdy k dx ( x y 1)dy 1 k 1 5 .
0 0

1
(x y 1), x [0,1], y [0,2]
Deci ( x , y) 5
0, n rest

48
1 2 2x 4
b) X ( x ) ( x, y)dy ( x y 1)dy , x [0,1]
5 0 5
2x 4
, x [0,1]
X (x ) 5
0, altfel
1 1 2y 3
y ( y) (x , y)dx ( x y 1)dx , y [0,2]
5 0 10
2y 3
, y [0,2]
Y ( y) 10
0, altfel
c) X i Y nu sunt independente deoarece: ( x , y) X ( x ) Y ( y)
1 1 8
d) E ( X ) x ( x, y )dxdy x X ( x)dx x(2 x 4)dx
5 0 15
1 2 17
E (Y ) ( x, y )dxdy y Y ( y )dy y (2 y 3)dy
10 0 15
1 1 11
m2 ( X ) E ( X 2 ) x 2 X ( x )dx x 2 (2 x 4)dx
5 0 30
1 2 8
m2 (Y ) E (Y 2 ) y 2 Y ( y )dy y 2 (2 y 3)dy
10 0 15
11 64 37
Var ( X ) E ( X 2 ) E ( X )
2
Deci
30 225 450
8 289 71
Var (Y ) E (Y 2 ) E (Y )
2

5 225 225
1 1 2
E ( X Y ) xy (x, y)dxdy dx xy ( x y 1)dy
5 0 0

1 1 14 9
2x 2 x dx C ( X , Y ) E ( XY ) E ( X ) E (Y ) .
5 0 3 15
9 8 12 1

15 15 15 225
1

C( X ,Y ) 225
Se obine: r ( X , Y ) 0,02758
X Y 37 71

450 225

Exemplul 2.3.40. Se tie c, dac dou variabile aleatoare X i Y sunt


independente, atunci coeficientul lor de corelaie este nul. Reciproca nu este
adevrat. Iat un vector aleator discret (X,Y), n care X i Y sunt dependente i
totui r 0 .

49
Y
X -1 1 2

0 1 2 3
16 16 16

1 2 0 2
16 16

1 2 3
2 16 16 16

Rezolvare
Calculm repartiiile marginale:
0 1 2 1 1 2
X : ; Y :
6 16 4 16 6 16 4 16 4 16 8 16
7 3 3
Avem: E ( X ) 1; E ( X 2 ) ; Var ( X ) ; X
4 4 2
5 3 10
E (Y ) 1; E (Y 2 ) ; Var (Y ) ; Y
2 2 2
2 1 0 2 4
XY : 1 2 6 4

3 , E(XY)=1

16 16 16 16 16
E(X Y) - E(X)E(Y) 11
r 0
X Y 3 10

2 2

Exemplul 2.3.41. Fie X o variabil aleatoare care are densitatea de


0, x (0,2)
probabilitate definit prin: ( x ) .
1 / 2, x (0,2)
a) S se determine modulul i mediana
b) S se calculeze momentul de ordin k, mk (x ) ..

Rezolvare
a) Conform definiiei, M0 este valoarea pentru care ( x ) max . adic
M 0 (0,2) adic exist o infinitate de valori modale situate pe segmentul (0,2).
1
Me se determin din ecuaia F ( M e ) .
2

50
Me Me
Cum F ( M e ) P ( X M e ) ( x )dx M e 1.
0 2
1 2k
b) mk ( X ) E ( X k ) x k dx .
2 k 1

2.4. Funcia caracteristic. Funcia generatoare de momente

Definiia 2.4.1. Fie cmpul de probabilitate , K, P i variabilele aleatoare X


i Y definite pe cu valori reale. Se numete variabil aleatoare complex
Z X iY , i 2 1 , iar valoarea medie a acesteia notat cu E (Z ) este dat de
relaia E (Z ) E ( X ) i E(Y ) dac mediile E ( X ) i E (Y ) exist.

Observaia 2.4.2. Dac X este o variabil aleatoare expresia


eitX cos tX i sin tX , t R definete de asemenea o variabil aleatoare i
2
eitX cos2 tX sin 2 tX 1

Definiia 2.4.3. Fie X o variabil aleatoare real. Se numete funcia


caracteristic a lui X o funcie X : R C dat de relaia
X (t ) (t ) E (e itX ) , care explicit poate fi scris sub forma
pk eitx k , este de tip discret
k K
X (t ) itx
e ( x )dx , este de tip continuu
R

Propoziia 2.4.4. Funcia caracteristic are urmtoarele proprieti:


1) (0) 1 i (t ) 1, t R
2) Dac Xj, j 1, m sunt variabile aleatoare independente n totalitate

cu funciile caracteristice X j (t ) j (t ), j 1, m , atunci funcia caracteristic
a variabilei aleatoare sum X X 1 X 2 ... X m este
m
X (t ) 1 (t ) 2 (t ) ... m (t ) j (t )
j 1

3) Dac Y aX b , a i b R, atunci Y (t ) X (at )eitb


4) Dac X admite momente iniiale de orice ordine atunci funcia
caracteristic admite derivate de orice ordin i are loc relaia
1
mr ( X ) E ( X r ) r X(r ) (0)
i

Demonstraie
51
1) (0) E (1) 1 i
itx k
(t ) p e k p k eitx p k 1 dac X este de tip discret i
k K k K k K

(t ) eitx ( x)dx e itx ( x )dx ( x)dx 1 dac X este de tip continuu.


R R R
2) Avnd n vedere proprietile valorii medii, putem scrie c
m m
itX j
X (t ) E (e itX ) E (e itX 1 e itX 2 ... e itX m ) E (e ) j (t )
j 1 j 1

3) Tot ca urmare a proprietilor mediei avem:


Y (t ) E (e itY ) E (e itaX e itb ) e itb aX (t ) e itb X (at )
4) Observm c X( r ) (t ) E ( X r e itx i r ) i r E ( X r e itX ) i rezult
X( r ) (0) i r E ( X r ) i r mr ( X ) .q.e.d

Observaia 2.4.5. Folosirea relaiei de la punctul 4) este recomandabil doar


atunci cnd calcularea momentelor este mai comod prin aceast relaie dect
pornind direct de la definiia acestora.

Aplicaia 2.4.6.
1 0 1
1) Dac X : atunci
1 6 1 2 1 3
1 1 1 2eit eit 3
(t ) eit eit
6 2 3 6
1
x 2 2ix itx
2) Dac X : , x 0,1 atunci (t ) 2 xeitx dx e
2x 0
e2

x 1 it
3) Dac X : x , x 0 atunci (t ) e x eitx dx
e 0
1 t2

Definiia 2.4.7. Fie X o variabil aleatoare real definit pe cmpul de


probabilitate , K, P . Se numete funcie generatoare de momente, dac
exist, funcia G : R R , dat de relaia G X (t ) G (t ) E (e tX ) care explicit
poate fi scris sub forma
pk etx k , X este de tip discret
k K
G (t ) tx
e ( x )dx , X este de tip continuu
R
cu condiia existenei expresiilor corespunztoare.

Propoziia 2.4.8. Funcia generatoare de momente are urmtoarele proprieti:

52
1) G (0) 1
2) Dac Xj, 1 j m , sunt independente n totalitate i au funciile
generatoare G j (t ) , j 1, m , atunci funcia generatoare a variabilei aleatoare
X X 1 X 2 ... X m este
m
G X (t ) G j (t )
j 1

3) Dac Y aX b , a i b R, atunci
GY (t ) G X (at ) etb
4) Dac X admite momente iniiale de orice ordin, atunci funcia
generatoare admite derivate de orice ordin n punctul zero i
G X( r ) (0) E ( X r ) mr ( X ) , r 1, 2, ...
Aplicaia 2.4.9.
1 0 1
1) Dac X : atunci
1 6 1 12 2 3
1 1 1 2e t e t 3
G (t ) e t e t
6 2 3 6
x
2) Dac X : x , x 0 , 0 atunci
e


G (t ) e x etx dx , dac t
0
t
iar n caz contrar nu exist.
k
3) Dac X : k k n k , p, q 0 , p q 1 , atunci
Cn p q k 0 , n
n
G (t ) Cnk p k q n k e tk ( pet q) n
k 0

G (t ) npet ( pet q )n 1 ; G ' ' (t ) npet ( pet q ) n 1 n(n 1) p 2e 2t ( pet q) n 2


'

G ' (0) np E ( X ) ; G '' (0) n 2 p 2 npq E ( X 2 )

2.5. Probleme rezolvate


Aplicaia 2.5.1. Fie variabilele aleatoare independente :
0 1 2 1 1 2
X : i Y : .
1 / 2 1 / 4 1 / 4 1 / 3 1 / 6 1 / 2
S se scrie variabilele aleatoare : 2X, Y2, X+Y, XY, 2X+3Y, X/Y,
max(X,Y), X .

Rezolvare
53
Probabilitile corespunztoare valorilor lui 2X, Y2, X sunt aceleai
cu cele corespunztoare lui X i respectiv Y. Avem:
0 2 4 0 1 2 1 4
2X : , X : , Y 2 : .

1 / 2 1 / 4 1 / 4 1 / 2 1 / 4 1 / 4 1 / 2 1 / 2
1 1 1
P(Y 2 1) P(Y 1 Y 1) P(Y 1) P(Y 1) .
3 6 2
Deoarece X i Y sunt independente avem c pij = piqj,1 i, j 3 . De exemplu
1 1 1
p12 P( X 0, Y 1) P( X 0) P(Y 1) . Obinem
2 6 12
0 1 0 1 0 2 11 11 1 2 2 1 2 1 2 2
X Y :
1 / 6 1 / 12 1 / 4 1 / 12 1 / 24 1 / 8 1 / 12 1 / 24 1 / 8
adic
1 0 1 2 3 4
X Y : .
1 / 6 1 / 12 1 / 6 7 / 24 1 / 6 1 / 8
Analog
0 (1) 0 1 0 2 1 (1) 1 1 1 2 2 (1) 2 1 2 2
X Y :
1 / 6 1 / 12 1 / 4 1 / 12 1 / 24 1 / 8 1 / 12 1 / 24 1 / 8
de unde
2 1 0 1 2 4
X Y : .
1 / 12 1 / 12 1 / 2 1 / 24 1 / 6 1 / 8
Cum 2X i 3Y au repartiiile
0 2 4 3 3 6
2X : , 3Y : ,
1 / 2 1 / 4 1 / 4 1 / 3 1 / 6 1 / 2
obinem repartiia lui 2X + 3Y :
3 1 1 3 5 6 7 8 10
2 X 3Y : .
1 / 6 1 / 12 1 / 12 1 / 12 1 / 24 1 / 4 1 / 24 1 / 8 1 / 8
La fel obinem:
X 2 1 0 1/ 2 1 2
: ,
Y 1 / 12 1 / 12 1 / 2 1 / 8 1 / 6 1 / 24
0 1 2
max( X , Y ) : .
1 / 6 5 / 24 5 / 8

Aplicaia 2.5.2. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comun (pij ) i marginale (pi) i (qj) sunt date n tabelul urmtor :
X\Y -1 0 1 pi
-1 1/8 1/12 1/6 3/8
1 1/24 1/4 1/3 5/8
qj 1/6 1/3 1/2 1
54
a) S se scrie variabilele aleatoare X i Y.
b) S se precizeze dac X i Y sunt independente.
c) S se scrie variabilele X + Y , X Y, X2, Y2, Y/X .

Rezolvare
a)Din tabelul de repartiie de mai sus deducem c
1 1 1 0 1
X : i Y : .
3 / 8 5 / 8 1 / 6 1 / 3 1 / 2
b)Dac X i Y ar fi independente atunci
p11 P( X 1, Y 1) p1q1 P( X 1) P(Y 1) ,
1 3 1
ceea ce nu are loc ntruct .
8 8 6
c)Deoarece
1 1 1 1 1 1
p11 , p12 , p13 , p21 , p22 , p23 ,
8 12 6 24 4 3
obinem
2 1 0 1 2
X Y : ,
1 / 8 1 / 12 1 / 6 1 / 24 1 / 4 1 / 3
1 0 1
X Y : ,
1 / 6 1 / 24 1 / 12 1 / 4 1 / 8 1 / 3
X 1 0 1
: .
Y 1 / 24 1 / 6 1 / 12 1 / 4 1 / 8 1 / 3
Repartiiile lui X2 i Y2 rezult imediat din cele ale lui X i Y:
1 0 1
X 2 : , Y 2 : .
1 1 / 3 2 / 3
1 2 3 3 3
Aplicaia 2.5.3. Fie variabila aleatoare discret X : .
p p
2
p p2 p 2
a) S se determine p.
b) S se calculeze funcia de repartiie a lui X.
c) S se calculeze probabilitile:
P ( X 1), P ( X 3), P ( X 4), P (1,5 X 3,2), P ( X 2,1),
P (3,1 X X 2,8), P (1,5 X 3 2 X 4).

Rezolvare
a) Trebuie s avem p + p2 + p + p2 + p2 = 1 i p 0. Rezult
3p2 + 2p = 1 i p 0, adic p = 1/3.
b) Cum F(x) = P(X x) rezult c F(x) = 0 dac x 1,
F(x) = p = 1/3 dac x (1,2] ,
F(x) = P(X=1) + P(X=2) = p + p2 = 4/9 dac x ( 2,3] ,

55
F(x) = P(X=1) + P(X=2) + P(X=3) = p + p2 + p = 7/9 dac x (3,4] ,
F(x) = P(X=1) + P(X=2) + P(X=3) + P(X=4) = p + p2 + p + p2 = 8/9
dac x (4,5] i F(x) = 1 dac x > 5 .
Deci :
0, x 1;
1
3 , 1 x 2;
4
, 2 x 3;

F ( x) 9
7
, 3 x 4;
9
8 , 4 x 5;
9
1, x 5.
c) Avem
P(X<1) = P() = 0, P(X<3)=P(X=1)+P(X=2)=4/9,
P(X>4)=P(X=5)=1/9, P(1,5<X<3,2)=P(X=2)+P(X=3)=4/9,
P(X2,1)=P(X=3)+P(X=4)+P(X=5)=5/9,
P(3,1 X , X 2,8) P( X 3,1) 2 p2 2
P(3,1 X X 2,8) 2

P( X 2,8) P( X 2,8) p 2 p 5
P(1,5<X3/2<X<4)=P(X=2 sau X=3 / X=3) = P(X=3/X=3) =1.

Aplicaia 2.5.4. Determinai constanta a R pentru ca funcia f dat mai jos s


fie densitate de repartiie i apoi s se determine funcia de repartiie
corespunztoare. S se calculeze mediana, cuantilele i valoarea modal a
variabilei aleatoare X avnd densitatea de probabilitate (x):
2 x, x [0,1 / 2]
2x
( x ) a , x (1 / 2,2]
3
0, altfel.

Rezolvare
1/ 2 2 2x
Avem ( x)dx 1 , de unde xdx a dx 1 sau
0 1/ 2
3
x2
x 2 10/ 2 ax 12/ 2 1 . Rezult a = 4/3 i deci
3
0, x0 0, x0
2 2
x , x [0,1 / 2]
x x , x [0,1 / 2]
F ( x) (t )dt 1 x 4 2t 4x x2 1
4 1 / 2 3 dt, x (1/ 2,2]

, x (1 / 2,2]
3
1, x2 1, x2

56
ntruct F este continu vom avea F(x) = F(x+0) , x , deci
1 1 1
F ( M e ( X )) i F ( M e ( X )) , adic F ( M e ( X )) . Aceasta se
2 2 2
2
4x x 1 1 3
realizeaz pentru , de unde x 2 (1 / 2,2] .
3 2 2
3 1
Aadar M e ( X ) 2 c2 . Se observ c F(1/2)=1/4 deci c1 c3
2 2
4x x2 1 3 3
rezult din F(x)=3/4, adic , de unde c3 2 .
3 4 2
Deoarece este cresctoare pe [0,1/2] i descresctoare pe (1/2,2],
1
x=1/2 este punct de maxim (singurul), prin urmare M o ( X ) .
2

Aplicaia 2.5.5. S se determine variabilele aleatoare independente


x x 1 x 2 x 3 y 2y 3y
X : i Y : ,
p 2p 3p 4p q q
2
q 2
tiind c E(X)=2 i E(Y)=7. S se calculeze apoi E(2X+3Y), Var(X),
Var(Y) i Var(2X+3Y).

Rezolvare
Deoarece X este o variabil aleatoare trebuie s avem p+2p+3p+4p=1,
adic p=1/10. Atunci
E(X) = xp+(x+1)2p+(x+2)3p+(x+3)4p = 10px+20p = x+2.
Cum E(X) = 2 rezult c x = 0.
Analog q+q2+q2=1, adic 2q2+q-1=0, de unde q=1/2. Rezult c
7
E(Y)=yq+2yq2+3yq2= y . Cum E(Y) = 7 avem c y=4. Tablourile de
4
repartiie ale lui X i Y vor fi
0 1 2 3 4 8 12
X : 1 1 3 2 , Y : 1 1 1 .

10 5 10 5 2 4 4
Folosind proprietile mediei avem
E(2X+3Y) = E(2X)+E(3Y) = 2E(X)+3E(Y) = 22+37 = 25.
Pentru calcularea dispersiilor avem nevoie s calculm mediile lui X2 i
2
Y . Acestea au tablourile de repartiie
0 1 4 9 16 64 144
X 2 : 1 1 3 2 , Y : 1 1 1 , astfel c
2

10 5 10 5 2 4 4
1 1 3 2
E( X 2 ) 0 1 4 9 5 i
10 5 10 5

57
1 1 1
E (Y 2 ) 16
64 144 60 . Atunci
2 4 4
Var(X) = E(X2)-E(X)2 = 5-4 = 1 i Var(Y) = E(Y2)-E(Y)2 = 60-49 = 11.
Cum X i Y sunt independente, rezult c i 2X i 3Y sunt independente
i avem
Var(2X+3Y) = Var(2X)+Var(3Y) = 4Var(X)+9Var(Y) = 41+911 =
103.

Aplicaia 2.5.6. S se determine variabilele aleatoare X i Y ale cror repartiii


sunt date incomplet n tabelul de mai jos, tiind c E(X)=17 i Var(Y)=1. S se
calculeze apoi E(XY) i Var(X-Y).

X\Y -b 0 b pi
a 1/5 1/10
a2 2/5 3/5
qj 1/5

Rezolvare
3 2
Deoarece p1+p2=1 rezult c p1 1 . Mai departe
5 5
1 1 2 1
p11+p12+p13=p1, adic p13 , deci p13 . Cum
5 10 5 10
1 1 1
p13+p23=q3 rezult c p23 . Dar p21+p22+p23=p2, adic
5 10 10
3 2 1 1 3
p21 . Din p11+p21=q1 i p22+p12=q2, rezult c q1 i
5 5 10 10 10
1
q2 . Obinem astfel
2
a a2 b 0 b 2 3
X : 2 3 , Y : 3 1 1 . Astfel E ( X ) a a 2 17 ,
5 5
5 5 10 2 5
adic 3a2+2a-85=0, de unde a1=5, a2=-17/3. Deoarece
3b 1 b b
E (Y ) 0 i
10 2 5 10
3 1 1 b2
E (Y 2 ) (b) 2 0 2 b 2 , rezult c
10 2 5 2
b2 b2 49b 2
Var (Y ) E (Y 2 ) E (Y ) 2 . Din ipotez Var(Y)=1,
2 100 100
100 10
astfel c b 2 , adic b . Din tabloul repartiiei comune (pij) avem
49 7

58
a 2b ab 0 ab a2b a b a2 b a a2 a b a2 b
XY : 1 1 1 1 1 i X Y : 1 1 1 2 1 1

10 5 2 10 10 10 10 10 5 5 10
a 2 b ab ab a 2 b ab a
Astfel E ( XY ) .
10 5 10 10 10 7
Dac a=5, E(XY)=-5/7, iar dac a=-17/3, E(XY)=17/21. Pentru
calcularea dispersiei lui X-Y, avem nevoie de:
a b a 2 b a 2a 2 a b a 2 b 6a 2 4a b
E( X Y )
10 10 10 5 5 10 10
2 2 2 2 4 2
2 ( a b) ( a b) a 2a ( a b) ( a b) 2
2
E[( X Y ) ]
10 10 10 5 5 10
6a 4 4a 2 2ab 5b 2

10
120 18985
Pentru a=5, b=10/7 avem E(X-Y)= i E[( X Y ) 2 ] ,
7 49
18985 14400 4585
deci Var ( X Y ) .
49 49 49
Aplicaia 2.5.7. S se determine parametrii care apar n repartiiile urmtoare
i s se calculeze apoi E(X) i Var(X), X fiind o variabil aleatoare, avnd
repartiia respectiv:
n
a) X : 1 n , n N , q 0 ;
q
4
x
b) X : 2
, x [0,1], a 0 ;
a( x 2 x )
a 2 x 3 , x [0,1]
x 1
c) X : , ( x ) ax, x (1,2]
( x) 2
0, altfel.

Rezolvare

1 n 1 1 1 3
a)Din condiia 4q
n 0
1 rezult c
4 1 q
1 1 q q
4 4
'
1 1 1 1
E ( X ) n q n q n q n 1 q (q n )' q q n
n 0 4 4 n 0 4 n 0 4 n 0
Atunci '
1 1 1 1 1 3 1
q q 2
3
4 1 q 4 (1 q) 4 4 1
16

59
' '
1 1 1 1
E ( X ) n q n q n(q n )' q nq n q nq n
2 2

n 0 4 4 n 0 4 n 0 4 n 0
'
1 1 1 2
q 2
q 24.
4 (1 q ) 4 (1 q ) 3
Astfel Var(X) = E(X2)-E(X)2 = 24-9 = 15.
1
2
b) Din condiia a( x 2 x)dx 1 rezult c
0

x3 4 3
a x 2 10 1 a 1 a . Atunci
3 3 4
1 1 3 3 x 4 2 x 3 1 11
E ( X ) x ( x)dx x ( x 2 2 x )dx 0 ,
0 0 4 4 4 3 16
2
1
2
1
2 3 2 3 x 5 2 x 4 1 21
E ( X ) x ( x )dx x ( x 2 x)dx 0 .
0 0 4 4 5 4 40
2
21 11 67
Astfel Var ( X ) E ( X 2 ) E ( X ) 2 .
40 16 1280
2
c) Din condiia ( x)dx 1 rezult c
0
4
1 ax 2
2 x 1 x2 2 a 2 3a a 1
0 a 2 x 3dx dx 1 a 0 a 1 1 1 Cum
1 2 4 4 4 4 a 4
( x) 0 numai a=1 convine, astfel c :
2 1 2 x x5 x3 1 7 41
E ( X ) x ( x )dx x x 3 dx x dx 1
0 2
1
0 0 1 2 5 6 5 6 30
2 1 2 x x6 x4 49
E ( X 2 ) x 2 ( x)dx x 2 x 3 dx x 2 dx 1
0 2
1 ,
0 0 1 2 6 8 24
2
2 2 49 41 313
Var ( X ) E ( X ) E ( X ) .
24 30 1800
Aplicaia 2.5.8. Fie vectorul aleator (X,Y) cu X, Y variabile aleatoare
independente, a crui densitate de probabilitate este
a
( x, y ) . S se determine:
(1 x )(1 y 2 )
2

a) funcia de repartiie corespunztoare;


b) P(( X , Y ) [0,1) [0,1)) .

Rezolvare

60
a
a) Avem ( x, y )dxdy 1 , deci dxdy 1 . Rezult
R 2
(1 x )(1 y 2 ) 2

dx dy 1
c a 2 2
1 a arctgx arctgy 1 a 2 .
1 x 1 y
1 x y dudv 1 x du y dv
F ( x, y ) 2 2
(1 u )(1 v ) 1 u 2 1 v 2
2 2

Atunci
1 1 1 1
arctgx arctgy
2 2
1 1 1 dudv
P(( X , Y ) D ) 2
0 0 (1 u 2 )(1 v 2 )
b)
1
F (1,1) F (1,0) F (0,1) F (0,0)
16

Aplicaia 2.5.9. Fie vectorul aleator (X,Y) cu densitatea de probabilitate


ax 2 y, ( x, y ) [0,1] [0, 2]
( x, y )
0, altfel.
a) S se determine constanta a.
b) S se calculeze funcia de repartiie F(x,y) i funciile marginale
FX(x) i FY(y).

Rezolvare
1 2 1 2
a) Avem ( x, y )dxdy 1 , adic a x 2 dx ydy 1 , rezult c
0 0 0 0
2a 3
1 de unde a .
3 2
x y
b) Avem F ( x, y ) ( x, y )dxdy .

Dac x < 0 sau y < 0, atunci f(x,y)=0 i deci F(x,y)=0.
Dac x > 1 i y > 2, atunci F(x,y)=1.
Dac (x,y) [0,1] [0,2] avem
3 2
x y 3 x 2 y x3 y 2
F ( x, y ) u vdudv u du vdv
0 0 2 2 0 0 .
4
Dac x [0,1] i y > 2 avem
x 23 3 x 2
F ( x, y ) u 2 vdudv u 2 du vdv x 3 .
0 0 2 2 0 0

Dac x > 1 i y [0,2] obinem


1 y 3 2 3 1 y y2
F ( x, y ) u vdudv u 2 du vdv .
0 0 2 2 0 0 4

61
0, x 0 sauy 0
x3 y 2
, ( x, y ) [0,1] [0,2]
43
Astfel F ( x, y ) x , x [0,1], y 2
y 2

, x 1, y [0,2]
4
1, x 1, y 2
Funciile de repartiie marginale sunt
0, x0
3
FX ( x ) F ( x, ) x , x [0,1]
1, x 1

0, y0
y 2
FY ( y ) F (, y ) , y [0,2]
4
1, y2
Aplicaia 2.5.10. Fie vectorul aleator (X,Y) avnd densitatea de probabilitate
e ( x y ) , x 0, y 0
( x, y )
0, altfel
S se calculeze:
a) P(X<1,Y<1), P(X+Y<1), P(X+Y2), P(X1/Y1), P(X<2Y),
P(X=n) ;
b) Funcia de repartiie F(x,y) i funciile de repartiie marginale FX(x),
FY(y);
c) Densitile de repartiie marginale X(x), Y(y);
d) Momentele obinuite de ordin (k,s) ;
e) Corelaia variabilelor X i Y.

Rezolvare
1 1
a) P ( X 1, Y 1) ( x, y )dxdy

1 1
x y
e dxdy (e x ) 10 (e y ) 10 (1 e 1 ) 2
0 0
1 1 x 1
P ( X Y 1) ( x, y)dxdy e x y dxdy e x ( e y ) 10 x dx
0 0 0
x y 1
1
(e x e 1 )dx (e x ) 10 e 1 1 2e 1 ,
0

P ( X Y 2) 1 P ( X Y 2) 1 ( x, y)dxdy
x y2
2 2 x 2 2
1 e x y dxdy 1 e x (e y ) 02 x dx 1 (e x e 2 )dx 3e 2
0 0 0 0

62
P( X 1, Y 1)
P( X 1 / Y 1)
P(Y 1)
2
P ( X 1, Y 1)

1 1

1

e x y dxdy e x dx (e x ) 1

e
2 2


P (Y 1) e x y dxdy e x
0 (e y ) 1 e 1
0 1

P( X 1, Y 1) e 1
x

x y
P ( X 2Y ) e dxdy 2 e x e y dydx e x (e y ) 0x / 2 dx
0 0 0
0 x 2 y
3 x

x
x 2 32 x 2 1
(e e 2
)dx e e 0 1 , P(X=Y)=0.
0
3 3 3
x y
b) Avem F ( x, y ) (u , v)dudv .

Dac x > 0 sau y < 0 (x,y)=0, deci F(x,y)=0. Dac x 0 i y 0 avem
x y x y
F ( x, y ) e u v dudv e u du e v dv (1 e x )(1 e y ) .
0 0 0 0
Funciile de repartiie marginale sunt
FX ( x ) F ( x, ) 1 e x i FY ( y ) F (, y ) 1 e y .
c) Densitile de probabilitate marginale X (x ) i Y ( y ) sunt
derivatele funciilor de repartiie marginale:
0, x 0 0, y 0
X ( x) x , Y ( y ) y .
e , x 0 e , y 0

d) k , s M ( X kY s ) x k y s e x y dxdy
0 0

x k e x dx y s e y dy (k 1)( s 1) k! s! ,
0 0

unde ( p ) x p1e x dx este funcia gama a lui Euler i are
0
proprietatea c ( p 1) p! pentru p N .
e) Avem

cov( X , Y ) E ( XY ) E ( X ) E (Y ) m11 xe x dx ye y dy
0 0

1 ( 2) 2 1 1 0 .
Aplicaia 2.5.11. Fie (X,Y) un vector aleator discret a crui repartiie
probabilist este dat n tabelul de mai jos. S se calculeze coeficientul de
corelaie r(X,Y) i s se scrie ecuaiile dreptelor de regresie.
X\Y -1 0 1 2 pi
-1 1/10 1/5 1/10 0 2/5
0 1/20 0 1/10 1/20 1/5
1 1/10 1/10 1/20 3/20 2/5
qj 1/4 3/10 1/4 1/5 1
63
Rezolvare
Pe baza formulelor corespunztoare, deducem imediat:
2 1 2 1 3 1 1 2
E ( X ) 1 0 1 0 , E (Y ) 1 0 1 2 ,
5 5 5 4 10 4 5 5
2 1 2 4
E ( X 2 ) (1) 2 0 2 12 ,
5 5 5 5
1 3 1 1 13
E (Y 2 ) (1) 2 0 2 12 2 2 ,
4 10 4 5 10
4
Var ( X ) E ( X 2 ) E ( X ) 2 ,
5
13 4 57
Var (Y ) E (Y 2 ) E (Y ) 2
10 25 50
1 1 1 1
E ( XY ) (1) (1) (1) 0 (1) 1 (1) 2 0 0 (1)
10 5 10 20
1 1 1 1 1 3 1
0 0 0 0 1 0 2 1 (1) 1 0 1 1 1 2
10 20 10 10 20 20 4
1
cov( X , Y ) E ( XY ) E ( X ) E (Y ) ,
4
cov( X , Y ) 0,25
r( X , Y ) .
Var ( X )Var (Y ) 2 57

5 50
Ecuaiile dreptelor de regresie sunt :
2 2
y y
x0 5 , 5 0,25 x 0 .
0,25
4 57 57 4
5 50 50 5
Aplicaia 2.5.12. S se determine funcia caracteristic i funcia generatoare de
momente i apoi s se calculeze, pornind de la acestea, momentele m1 i m2 ,
pentru urmtoarele variabile aleatoare:
0 1 2
a) X : 1 1 1 ;

2 4 4
x
b) X : x , x 0 .
e

Rezolvare
a) Avem
0it 1 1it 1 2it 1 2 e it e 2it
X (t ) e e e i
2 4 4 4
64
1 0t 1 1t 1 2t 2 e t e 2t
G X (t ) e e e .
2 4 4 4
Primele dou derivate ale acestor funcii sunt:
i 1
'X (t ) (eit 2e 2it ) , "X (t ) (e it 4e 2it ) ,
4 4
1 1
G X' (t ) (e t 2e 2t ) , G "X (t ) (e t 4e 2t ) .
4 4
Obinem
3i 5 3 5
'X (0) , "X (0) , G X' (0) , G "X (0) , de unde
4 4 4 4
'
(0) 3
1 ( X ) E(X ) X G X' (0) i
i 4
" (0) 5
2 ( X ) E ( X 2 ) X 2 G "X (0) .
i 4

b) X (t ) e itx e x dx (cos tx i sin tx) e x dx
0 0

cos tx e dx i sin tx e x dx A iB
x
0 0

A cos tx e x dx cos tx ( e x )' dx
0 0

x
cos tx e 0 t sin tx e x dx 1 tB ,
0

B sin tx (e x )dx sin tx e x
0 t cos tx e x dx tA .
0 0

1 t
Obinem A = 1 - t2A, adic A = 2
i B = .
1 t 1 t2
1 it
Astfel X (t ) .
1 t2
e x (t 1) 1
Apoi G X (t ) e tx e x dx e x (t 1) dx
0 ,t 1 .
0 0 t 1 1 t
Primele dou derivate sunt
i 2t it 2 6it 3 14t 2 10it 2
'X (t ) , "
X (t ) ,
(1 t 2 ) 4 (1 t 2 ) 5
1 2
G X' (t ) 2
, G "X (t ) .
(1 t ) (1 t )3
Obinem
' (0)
m1 ( X ) E ( X ) X G X' (0) 1 i
i
2 "X (0)
m2 ( X ) E ( X ) 2
G "X (0) 2 .
i

65
2.6. Probleme propuse

Aplicaia 2.6.1. Se consider vectorul aleator (X,Y) cu densitatea de


A xy , daca x, y 0, y x 1
probabilitate: x, y . S se determine:
0, altfel
a) constanta real A;
b) densitile de probabilitate X, Y pentru variabilele aleatoare X,
Y;
1 1 1 1
c) probabilitile P(0 X , 0 Y ) i P(X Y ).
2 2 2 2

Aplicaia 2.6.2. La patru uniti alimentare din ora se poate gsi zilnic pine
proaspt cu probabilitile p1=0.8, p2=0.9, p3=0.95 i respectiv p4=0.85. Fie X
numrul unitilor alimentare din cele patru la care se gsete pine proaspt
ntr-o zi fixat. S se determine:
a) distribuia variabilei aleatoare X;
b) valoarea medie, dispersia, abaterea medie ptratic, mediana i
modul variabilei aleatoare X.

Aplicaia 2.6.3. Fie (X,Y) coordonatele unui punct luminos ce reprezint o int
pe un ecran radar circular i care urmeaz legea uniform pe domeniul
D = (x,y)R2x2+y2 r2 . S se determine valoarea medie i dispersia
distanei Z = X 2 Y 2 de la centrul ecranului pn la punctul luminos.

Aplicaia 2.6.4. Folosind inegalitatea lui Cebev, s se arate c


m
P(0X2(m+1)) ,
m 1
dac variabila aleatoare X are densitatea de probabilitate
x m x

( x ) m! e , daca x 0 .
0, daca x 0
Aplicaia 2.6.5. Probabilitatea ca o persoan s gseasc loc la un hotel este p
= 0.8. n decursul unei luni de zile, la hotelul respectiv s-au prezentat 4000 de
persoane. Fie X numrul persoanelor care au gsit loc la hotel din totalul de
4000. S se determine probabilitatea ca:
a) numrul persoanelor care au gsit loc la hotel s fie cuprins ntre
3000 i 3400;
b) numrul persoanelor care au gsit loc la hotel s nu depeasc
3000;
c) numrul persoanelor care nu au gsit loc la hotel s fie mai mic
dect 500.

Aplicaia 2.6.6. Fie variabilele aleatoare independente:


66
0 1 2 1 0 1 2
X : i Y :
1 6 1 2 1 3 1 8 1 2 1 4 1 8
S determine variabilele aleatoare: X+Y; X-Y; XY; X2; Y2; X3; Y3; 2X; 3Y;
2X+3Y; 3Y-2X; X .

Aplicaia 2.6.7. Fie X i Y dou variabile aleatoare discrete ale cror repartiii
probabiliste comune ( pij ) i unidimensionale ( pi ) i (q j ) sunt date n tabelul
de mai jos:
Y
-1 0 1 2 pi
X
-1 1/12 1/24 1/24 1/48 3/16
1 1/48 1/24 1/48 1/24 1/8
2 1/48 1/3 1/6 1/6 11/16
qj 1/8 5/12 11/48 11/48 1

a) Scriei variabilele aleatoare X i Y;


b) Precizai dac variabilele aleatore X i Y sunt independente sau
nu i justificai rspunsul;
Y
c) Scriei variabilele aleatoare: X+Y; X-Y; XY; ; X2; Y3;
X
3X-2Y;

Aplicaia 2.6.7. Fie variabilele aleatoare independente:


2 1 0 1 2 0 1 2 3 4 5
X : 1 1 2 1 1 i Y : 1 1 1 1 1 1

10 5 5 10 5 12 12 2 6 12 12
a) Calculai E(X), E(X2), Var(X), E(Y), E(Y2) i Var(Y);
b) Care dintre urmtoarele mrimi pot fi calculate i care nu i de
ce?
E(2X+3Y); Var(2X+3Y); E(X2+Y); Var(X2+Y);
E(X2+Y2); Var(X2+Y2); E(XY).
c) Calculai mrimile de la punctul b) pentru care rspunsul este
favorabil.

Aplicaia 2.6.8. S se determine, n fiecare caz, variabila aleatoare X i apoi s


se calculeze E(X) i Var(X).
x x
a) X : x , xN, p > 0, q > 0, b) X : ax , xN, a > 0, b > 0
pq b
x!
x x
c) X : , x[0,1], aR, d) X : 2
, x[0,1], aR
ax a (3 x 2 x )

67
x x
e) X : a x , aR, xR, f) X : , xR,
e ( x)
ax , x 0,1
a 2 x 2
( x) , x 1,2 , aR
2
0 , n rest

0 1
Aplicaia 2.6.9. Fie variabilele aleatoare discrete: X :1 2 i

3 3
0 1 2 1
Y : 1 1 1 . Dac P( X 0, Y 0) i P( X 1, Y 1) , s se
3
6 2 3
determine repartiia comun a vectorului aleatoriu (X,Y) n funcie de R .
Calculai apoi coeficientul de corelaie r ( X ,Y ) i precizai dac exist valori
ale lui pentru care X i Y s fie independente.

Aplicaia 2.6.10. Fie ( X , Y ) un vector aleatoriu continuu cu densitatea de


a( xy 2 x 2 y ) , ( x, y ) 1,2 2,3
repartiie ( X , Y ) , a > 0

0 , n rest
a) Determinai densitatea de repartiie ( X , Y ) i densitile de
repartiie marginale corespunztoare X (x) i Y ( y ) ;
b) Calculai coeficientul de corelaie r ( X ,Y ) .

Aplicaia 2.6.11. Calculai funcia caracteristic i funcia generatoare de


momente pentru fiecare dintre variabilele aleatoare:
1 2 3 2 1 0 1 2
a) X : 1 1 1 , b) X : 1 1 2 1 1 ,

6 3 2 10 5 5 5 10
x x
c) X : 2 , x 0,1 , d) X : x , x 0
3x xe
i apoi verificai dac momentele obinute pe cale direct coincid cu cele
obinute cu ajutorul acestor funcii.

Aplicaia 2.6.12. Verificai dac funciile urmtoare definesc repartiii ale unor
variabile aleatoare discrete i apoi calculai E(X) i Var(X) pentru fiecare dintre
ele.
1
1 (ln )k 1

a) P(k ) , k N , 1 , b) P(k ) k e , k N , 0 ,
k! k!
c) P(k ) k (1 )1 k , k 0,1,0 1
68
Capitolul 3

Legi clasice de probabilitate (repartiii) ale


variabilelor aleatoare discrete

Introducere

Vom prezenta n acest capitol principalele legi de probabilitate ale


variabilelor aleatoare discrete, i anume: legea discret uniform, legea
binomial i cazul su particular legea Bernoulli, legea binomial cu exponent
negativ i cazul particular legea geometric, legea hipergeometric i legea
Poisson (legea evenimentelor rare).

3.1. Legea discret uniform

Definiia 3.1.1. Variabila aleatoare discret X urmeaz legea discret


uniform dac are tabloul repartiiei

x1 x 2 ... x n 1
X : , unde pk , k 1, 2, ...n , n * . (3.1.1)
p1 p 2 ... p n n

Vom mai spune c variabila aleatoare X dat de formula (3.1.1) are o


repartiie discret uniform.
Din tabloul repartiiei variabilei aleatoare X se observ c

n n
1
pk
k 1 k 1 n
1.

Teorema 3.1.2. Dac variabila aleatoare X are repartiie discret uniform cu


tabloul repartiiei (3.1.1), atunci valoarea medie i dispersia sa sunt

2
1 n 1 n 1 n
E ( X ) x k , Var ( X ) x k2 2 xk . (3.1.2)
n k 1 n k 1 n k 1

Demonstraie
Din formulele de calcul ale mediei i dispersiei obinem

69
n n
1 1 n
E ( X ) xk pk xk xk ,
k 1 k 1 n n k 1
n 2
2 2 n 2
Var ( X ) E ( X ) [ E ( X )] x p k xk pk
k
k 1 k 1
2 2
n
1 n 1 1 n 1 n
x xk x k2 2 x k .
2
k
k 1 n k 1 n n k 1 n k 1
q.e.d.

Observaia 3.1.3. Deoarece Var ( X ) 0 , din relaia a doua (3.1.2) avem

n 2
n 2
n x x k ,
k
k 1 k 1

relaie util n diverse aplicaii practice, i care rezult direct i din inegalitatea
lui Cauchy-Buniakovski-Schwarz.

Propoziia 3.1.4. Dac variabila aleatoare discret X are repartiie uniform


cu tabloul repartiiei (3.1.1), atunci funcia sa caracteristic este

1 n itxk
(t ) e , t R.
n k 1
(3.1.3)

Demonstraie
Conform formulei de calcul pentru funcia caracteristic, avem

n
1 n itxk
(t ) pk e itxk e , t R. q.e.d.
k 1 n k 1

Propoziia 3.1.5. Dac variabila aleatoare discret X are repartiie uniform i


ia valorile x k k , k 1, 2, ..., n , adic are tabloul repartiiei

1 2 n

X : 1 1 1 ,

n n n
atunci

70
n 1 n2 1
E( X ) , Var ( X ) ,
12 12
nt
sin i ( n 1) t
(t ) 2 e 2 , t R, t 2k , k Z ; (t ) 1, t 2k , k Z .
t
n sin
2

Demonstraie
Din formulele (3.1.2), pentru x k k , k 1, 2, ..., n , obinem

1 n 1 n n 1
E( X )
n k 1
xk k
n k 1 2
,
2 2
1 n 1 n 1 n 1 n
Var ( X ) xk2 2 xk k 2 2 k
n k 1 n k 1 n k 1 n k 1
1 n(n 1)(2n 1) 1 n 2 (n 1) 2 n 2 1
2 .
n 6 n 4 12

Din formula (3.1.3), obinem pentru funcia caracteristic

1 n itk e it 1 e int e it 1 cos nt i sin nt


(t ) e n 1 e it n 1 cos t i sin t
n k 1
nt nt nt nt nt nt
it 2 sin 2 2i sin cos it
sin cos i sin
e 2 2 2 e 2 2 2

n t t t n t t t
2 sin 2 2i sin cos sin cos i sin
2 2 2 2 2 2
nt nt
e it sin sin i ( n 1) t

2 cos ( n 1) t ( n 1) t 2 e 2 , t R, t 2k , k Z ,
i sin
t 2 2 t
n sin n sin
2 2
(t ) 1, t 2k , k Z .
q.e.d.

3.2. Legea binomial. Legea Bernoulli


Definiia 3.2.1. Variabila aleatoare discret X urmeaz legea binomial
( X are o repartiie binomial) cu parametrii n i p ( n N , 0 p 1 ) dac ia
valorile 0,1, 2,..., n cu probabilitile

71
P ( X k ) C nk p k q n k , k 0,1, 2,..., n, (3.2.1)

unde q 1 p .
Tabloul repartiiei variabilei aleatoare X este

0 1 2 ... n
X : 0 0 n 1 n1 2 2 n 2 n n 0
.
C
n p q C n pq C n p q ... C n p q

n n
Se observ c C k
n p k q n k C nk p nk q k ( p q) n 1.
k 0 k 0

Exemplul 3.2.2. Dac A1 , A2 , ..., An sunt evenimente independente i


P( Ai ) p, i 1, 2, ..., n , iar X reprezint numrul evenimentelor care se
realizeaz n cadrul unei experiene , atunci X are repartiie binomial cu
parametrii n i p (conform schemei lui Bernoulli).

Exemplul 3.2.3. Dac A este un eveniment legat de o anumit experien i


probabilitatea ca A s se produc cnd efectum o singur dat experiena este
P( A) p , atunci variabila aleatoare care are ca valori numrul realizrilor lui
A cnd efectum de n ori experiena are repartiie binomial cu parametrii n i
p.

Teorema 3.2.4. Dac variabila aleatoare X are repartiie binomial cu


parametrii n i p, atunci valoarea medie i dispersia sa sunt

E ( X ) np, Var ( X ) npq . (3.2.2)

Demonstraie
Valoare medie a variabilei aleatoare X este

n
E ( X ) 0 C n0 p 0 q n 1 C n1 pq n1 2 C n2 p 2 q n2 n C nn p n q 0 kC nk p k q nk .
k 0

Pentru a calcula suma de mai sus vom considera polinomul

P( x) ( px q ) n C n0 p n x n C n1 p n1qx n1 C nn1 pq n1 x C nn q n
n n
C nk p nk q k x nk C nk p k q nk x k .
k 0 k 0

72
Derivnd polinomul de mai sus obinem

P' ( x) np ( px q) n1 nC n0 p n x n1 (n 1)C n1 p n1qx n2


n (3.2.3)
C nn1 pq n1 0 C nn q n kC nk p k q nk x k 1.
k 0

n
Lund x 1 n relaia (3.2.3), obinem kC k
n p k q nk np ( p q) n1 , de unde
k 0
rezult c E ( X ) np .
Pentru a calcula dispersia lui X vom folosi formula

Var ( X ) E ( X 2 ) [ E ( X )]2 .

n
Media variabilei X 2 este E ( X 2 ) k 2 C nk p k q n k .
k 0

nmulim relaia (3.2.3) cu x i obinem

xP' ( x ) npx ( px q ) n1 nC n0 p n x n (n 1)C n1 p n1qx n1 C nn1 pq n1 x


n
0 C nn q n kC nk p k q nk x k .
k 0

Dac derivm relaia de mai sus deducem c

n
P' ( x) xP' ' ( x ) np ( px q ) n1 n(n 1) p 2 x ( px q) n2 k 2 C nk p k q n k x k 1 .
k 0

Lund x 1 n relaia de mai sus deducem c E ( X 2 ) np n(n 1) p 2 .


Obinem astfel dispersia lui X

Var ( X ) np n(n 1) p 2 n 2 p 2 np np 2 npq.


q.e.d.

Propoziia 3.2.5. Dac este modulul (valoarea cea mai probabil) a unei
variabile aleatoare X cu repartiie binomial cu parametrii n i p, atunci

np q np p,

unde q 1 p.

73
Demonstraie
Dac este modulul variabilei X atunci

P( X 1) P( X ), P ( X 1) P( X ).

Inegalitile de mai sus ne conduc la sistemul

q p
1
C p q
n
1 n 1
C p q
n
n
n 1 np p
1 1 n 1
C n p q C n p q n p q np q,
1 n

de unde rezult concluzia propoziiei. q.e.d.

Propoziia 3.2.6. Dac variabila aleatoare X are repartiie binomial cu


parametrii n i p, atunci funcia sa caracteristic este

(t ) ( pe it q) n , t R. (3.2.4)

Demonstraie
Conform formulei pentru funcia caracteristic avem

n n
n k
(t ) C p q k
n
k
e itk
C nk ( pe it ) k q n k ( pe it q ) n , t R.
k 0 k 0
q.e.d.

Teorema 3.2.7. Dac variabilele independente X i Y au repartiii binomiale cu


parametrii n i p, respectiv m i p, atunci variabila X+Y are repartiie binomial
cu parametrii m+n i p.

Demonstraie
Deoarece X ia valorile 0,1,, n, iar Y ia valorile 0,1,, m, rezult c variabila
X+Y va lua valorile 0,1,, n m. Variabila X+Y are valoarea k
( k 0,1,, n m) dac (X=0 i Y=k) sau (X=1 i Y=k-1) sau ... sau (X=k i
Y=0). Atunci vom obine

74
k k
P( X Y k ) P { X j , Y k j} P( X j , Y k j )
j 0 j 0
k k
P( X j ) P(Y k j ) C nj p j q n j C mk j p k j q mk j
j 0 j 0
k
p k q m n k C nj C mk j C mk n p k q m nk .
j 0

Am folosit mai sus faptul c evenimentele X i Y sunt independente, i de


k
asemenea am utilizat formula C n
j
C mk j C mk n , care poate fi dedus egalnd
j 0

coeficientul lui x din dezvoltrile (1 x ) n (1 x) m i (1 x) n m .


k

Deci am obinut

P ( X Y k ) C mk n p k q m n k , k 0,1, , n m,

adic variabila X+Y are o repartiie binomial cu parametrii m+n i p.


Concluzia teoremei mai poate fi obinut folosind proprietatea de la funcii
caracteristice care spune c funcia caracteristic a sumei a dou variabile
aleatoare independente cu funciile caracteristice 1 (t ) i 2 (t ), t R , are forma
(t ) 1 (t ) 2 (t ), t R. Astfel folosind relaia (3.2.4) deducem c funcia
caracteristic a variabilei X+Y este

(t ) pe it q pe it q pe it q
n m mn
, t R.

Din expresia de mai sus a funciei c tragem concluzia c variabila aleatoare X+Y
are repartiie binomial cu parametrii m+n i p. q.e.d.

Teorema 3.2.8. (Bernoulli) Un eveniment are probabilitatea de realizare p


atunci cnd facem o singur dat experiena de care este legat. Dac n este
numrul de realizri ale evenimentului cnd repetm experiena de n ori,atunci


lim P n p 0, (3.2.5)
n
n

oricare ar fi 0.

Demonstraie
Variabila aleatoare n care are ca valori numrul de realizri ale evenimentului
din problem are repartiie binomial cu parametrii n i p. Conform Teoremei
75
n
3.2.2 avem E ( n ) np i Var ( n ) npq . Variabila aleatoare va avea atunci
n
valoarea medie, dispersia i abaterea medie ptratic
1 np
m E n E ( n ) p,
n n n

1 pq pq
Var n 2 Var ( n ) , X .
n n n n

n
Vom folosi acum Inegalitatea lui Cebev pentru variabila i a .
n
Obinem
2 pq
P n p 2 2 .
n n
pq
Deoarece lim 0 , din inegalitatea de mai sus rezult inegalitatea (3.2.5).
n n 2
q.e.d.

Observaia 3.2.9. O mbuntire a inegalitii (3.2.5) este dat de teorema lui


Borel, care spune c n condiiile Teoremei 3.2.8 are loc relaia


P n p 1.
n

Aplicaia 3.2.10. n cadrul unei experiene evenimentele independente


A1 , A2 , An au probabilitile de realizare P( Ak ) p k , k 1, 2,, n. S se
calculeze valoarea medie i dispersia numrului de evenimente care se
realizeaz atunci cnd experiena are loc.

Rezolvare
S notm cu X variabila aleatoare care are ca valori numrul de
evenimente care se realizeaz n cadrul experienei. Valorile variabilei X sunt
0,1, 2,, n. Probabilitatea ca X s ia valoarea k ( k 0,1, 2,, n) este, conform
schemei lui Poisson (schema binomial generalizat) coeficientul lui x k din
polinomul

Q ( x) ( p1 x q1 )( p 2 x q 2 ) ( p n x qn ) , (3.2.6)

unde qi 1 pi , i 1, 2,, n. Dac scriem desfurat pe Q (x ) sub forma

76
Q ( x) a0 a1 x a2 x 2 an x n , (3.2.7)

atunci tabloul repartiiei variabilei X este

0 1 2 n
X : .
a0 a1 a2 a n

Suma tuturor elementelor de pe linia a doua a tabloului de mai sus este 1. ntr-
adevr

a0 a1 an Q(1) ( p1 q1 )( p 2 q 2 ) ( p n q n ) 1.

n
Valoarea medie a variabilei X este E ( X ) ka k . Ideea de demonstraie a
k 0
teoremei este asemntoare cu cea a Teoremei 3.2.4. Vom deriva polinomul Q,
scris sub cele dou forme de mai sus (3.2.6) i (3.2.7). Derivnd relaia (3.2.7)
obinem

Q ' ( x ) a1 2a 2 x 3a3 x 2 na n x n1 , (3.2.8)

de unde rezult

n
Q ' (1) a1 2a 2 3a3 na n kak M ( X ).
k 1

Pe de alt parte parte, derivnd relaia (3.2.6) obinem

Q ' ( x ) p1 ( p k x q k ) p2 ( pk x qk ) p n ( pk x qk ) , (3.2.9)
k 1 k 2 k n

iar pentru x 1 deducem Q' (1) p1 p2 p n . Rezult c

n
E ( X ) pk . (3.2.10)
k 1
n
Pentru a calcula dispersia, vom calcula mai nti E ( X 2 ) k 2 a k . nmulim
k 0
relaia (3.2.8) cu x i obinem

xQ' ( x) a1 x 2a 2 x 2 3a3 x 3 na n x n .

77
Derivnd egalitatea de mai sus rezult

Q ' ( x ) xQ' ' ( x) a1 2 2 a 2 x 32 a3 x 2 n 2 a n x n1.

n
Pentru x 1 deducem din relaia de mai sus Q' (1) Q' ' (1) k 2 a k . Deci
k 1

n
E ( X 2 ) Q ' (1) Q' ' (1) p k Q' ' (1). (3.2.11)
k 1

Derivm acum relaia (3.2.9) pentru a determina Q ' ' ( x) ; obinem


Q ' ' ( x) p1 p 2 ( p j x q j ) p3 ( p j x q j ) pn ( p j x q j )
j 1, 2 j 1,3 j 1, n

p n p1 ( p j x q j ) p 2 ( p j x q j ) pn1 ( p j x q j ).
j 1,n j 2,n j 1,n 1

Pentru x 1 obinem din relaia de mai sus

Q' ' (1) p1 p k p 2 pk p n p k p1[ E ( X ) p1 ] p 2 [ E ( X ) p 2 ]


k 1 k 2 k n

pn [ E ( X ) p n ] E ( X )( p1 p2 p n ) ( p12 p 22 p n2 )
n
[ E ( X )]2 p k2 .
k 1

Din relaia (3.2.11) i din relaia de mai sus deducem c

n n
E ( X 2 ) pk [ E ( X )]2 p k2 . (3.2.12)
k 1 k 1

Folosind acum relaiile (3.2.10) i (3.2.12) rezult c dispersia lui X este

n n
Var ( X ) E ( X 2 ) [ E ( X )]2 p k [ E ( X )]2 p k2 [ E ( X )]2
k 1 k 1
n n n n
p k p k2 pk (1 p k ) p k q k .
k 1 k 1 k 1 k 1

O alt metod mai simpl pentru calculul mediei i dispersiei variabilei X este
urmtoarea: s notm cu X k variabila aleatoare care are ca valori pe 1 dac Ak se
78
realizeaz, i pe 0 dac Ak nu se realizeaz, pentru k 1, 2,, n. Tablourile de
repartiie pentru variabilele X k sunt

1 0
X k : , k 1, 2, , n.
pk q k

Atunci numrul evenimentelor care se realizeaz este X X 1 X n , deci


media sa va fi

n n
E ( X ) E( X k ) pk .
k 1 k 1

Deoarece variabilele aleatoare X k , k 1, 2,, n sunt independente, atunci


dispersia varaibilei X va fi

n n n n

Var ( X ) Var ( X k ) E ( X k2 ) [ E ( X k )]2 ( p k pk2 ) p k q k .
k 1 k 1 k 1 k 1
q.e.d.

Pentru n 1, legea binomial este cunoscut i sub numele de legea


Bernoulli cu parametrul p. Variabila aleatoare X care urmeaz legea Bernoulli
cu parametrul p admite doar dou valori posibile 0 i 1 cu probabilitile de
realizare q=1-p i p, avnd tabloul repartiiei

0 1
X : , q 1 p.
q p

Valoarea medie i dispersia variabilei X sunt E ( X ) p i Var ( X ) pq .


O variabil aleatoare cu repartiie binomial cu parametrii n i p dat de
Definiia 3.2.1 este suma a n variabile aleatoare independente cu repartiii
Bernoulli cu acelai parametru p.

3.3. Legea binomial cu exponent negativ. Legea geometric


Definiia 3.3.1. Variabila aleatoare X urmeaz legea binomial cu exponent
negativ (X are repartiie binomial cu exponent negativ) cu parametrii m i p
( m N * , 0 p 1 ) dac ia valorile m, m 1, m 2, cu probabilitile

P ( X k ) C km11 p m q k m , k m, (3.3.1)

79
unde q=1-p.

Tabloul repartiiei variabilei aleatoare X este

m m 1 m2
X : m1 m 0 .
C m 1 p q C mm 1 p m q C mm11 p m q 2

Exemplul 3.3.2. O experien se efectueaz pn la cea de-a m-a realizare a


unui eveniment A legat de ea. Dac probabilitatea acestui eveniment cnd se
face o singur dat experiena este p, atunci numrul X de efecturi ale
experienei este variabil aleatoare care are repartiie binomial cu exponent
negativ cu parametrii m i p. ntr-adevr, evenimentul { X k } se scrie ca
intersecia a dou evenimente: n primele k-1 efecturi ale experienei
evenimentul A se produce de m-1 ori i n a k-a efectuare a experienei se
produce A. Probabilitatea primului din aceste dou evenimente este
C km11 p m1q k m , conform schemei lui Bernoulli, iar probabilitatea celui de-al
doilea este p. Deci

P ( X k ) pC km11 p m1q k m C km11 p m q k m , k m, m 1,

Teorema 3.3.3. Dac variabila aleatoare X are repartiie binomial cu exponent


negativ cu parametrii m i p, atunci valoarea medie i dispersia sa sunt

m mq
E( X ) , Var ( X ) 2 . (3.3.2)
p p

Demonstraie
Valoarea medie a variabilei aleatoare X este

E ( X ) mC mm11 p m q 0 (m 1)C mm1 p m q (m 2)C mm11 p m q 2



kC km11 p m q k m .
k m

Pentru a calcula suma seriei de mai sus, pornim de la dezvoltarea n serie de


puteri a funciei (1 x ) m , i anume

m m(m 1) 2
(1 x) m 1 x x , x (1,1).
1! 2!

Pentru m N * seria binomial de mai sus se scrie sub forma

80

(1 x) m C m0 1 C m1 x C m2 1 x 2 C kk1m x k m , x (1,1)
k m
sau

(1 x) m C mm11 C mm 1 x C mm11 x 2 C km11 x k m , x (1,1). (3.3.3)
k m
Folosind seria de mai sus (cu x=q), observm c suma tuturor probabilitilor
de pe linia a doua a tabloului repartiiei variabilei X este 1. ntr-adevr

m

m 1 m k m m m 1 k m m m 1 q
C k 1 p q p C k 1 q p (1 q) 1.
k m k m p p

Numele repartiiei binomiale cu exponent negativ provine din observaia c


termenii P ( X k ) C km11 p m q k m , k m sunt termenii generali ai dezvoltrii
m
1 q
.
p p
Relaia (3.3.3) se scrie echivalent astfel

xm

m
C km11 x k (3.3.4)
(1 x) k m

Derivnd relaia (3.3.4) obinem

mx m1

m 1
kC km11 x k 1 , x (1,1). (3.3.5)
(1 x) k m

Pentru x=q din relaia (3.3.5) deducem

mq m1
kCkm11q k 1.
p m1 k m
(3.3.6)

Atunci valoarea medie a variabilei X este, folosind relaia (3.3.6)


mq m 1 m
E ( X ) kC km11 p m q k m p m q m1 kC km11q k 1 p m q m 1 .
k m k m p m 1 p

Pentru a calcula dispersia variabilei X, vom calcula mai nti E ( X 2 ) , i


anume

81

E ( X 2 ) k 2C km11 p m q k m p m q1 m k 2C km11q k 1.
k m k m

nmulim relaia (3.3.5) cu x i obinem

mx m

m 1
kC km11 x k , x (1,1).
(1 x) k m

Prin derivarea relaiei de mai sus rezult

x m1m(m x ) 2 m1 k 1
k C k 1 x , x (1,1).
(1 x) m 2 k m

Pentru x=q din relaia obinut deducem


q m1m(m q)
k 2Ckm11q k 1
k m p m2
.

Rezult atunci c E ( X 2 ) este

q m 1m(m q ) m(m q)
E ( X 2 ) p m q1m ,
p m 2 p2

iar dispersia varaibilei aleatoare X este

m 2 mq m 2 mq
Var ( X ) E ( X 2 ) [ E ( X )]2 2 2.
p2 p p
q.e.d.

Propoziia 3.3.4. Dac variabila aleatoare X are repartiie binomial cu


exponent negativ cu parametrii n i p, atunci funcia sa caracteristic este

m
pe it
(t ) it
, t R. (3.3.7)
1 qe

Demonstraie
Conform formulei pentru funcia caracteristic avem

82

(t ) C km11 p m q k m e itk p m e itm C km11 (qe it ) k m
k m k m
m
pe it
p m e itm (1 qe it ) m , t R,
it
1 qe
conform relaiei (3.3.3), care este adevrat i pentru numere complexe
x C , | x | 1. q.e.d.

Pentru m 1 legea binomial cu exponent negativ cu parametrul p se mai


numete legea geometric cu parametrul p. Tabloul repartiiei unei variabile
aleatoare X cu repartiie geometric cu parametrul p este urmtorul

1 2 3
X : m 0 ,
p q pmq pmq2

unde q=1-p. Conform relaiilor (3.3.2) i (3.3.7) media, dispersia i funcia


caracteristic ale lui X sunt

1 q pe it
E ( X ) , Var ( X ) 2 , (t ) , t R.
p p 1 qe it

3.4. Legea hipergeometric


Definiia 3.4.1. Variabila aleatoare X urmeaz legea hipergeometric (X are
repartiie hipergeometric) cu parametrii a, b i n ( a, b, n N * , n a b ) dac
poate lua orice valoare ntreag ntre max( 0, n b) i min( n, a) i

C ak Cbn k
P( X k ) , k [max( 0, n b), min( n, a )]. (3.4.1)
C anb

Pentru calculul mediei i dispersiei variabilei aleatoare X cu repartiie


hipergeometric vom presupune fr a restrnge generalitatea problemei c
n b i n a , deci max( 0, n b) 0 i min( n, a) n . Atunci tabloul repartiiei
variabilei X este

0 1 2 n
n 1 n 2

X : C a0 Cbn CC1
C C2
C C .n 0

Cn
a b a b

a b

a b C an b C anb C
n
a b

83
Se observ c suma probabilitilor de pe linia a doua a tabloului de mai sus este
1. ntr-adevr avem

n
C ak C bnk 1 n
1
n
n C k
a C bnk n
C anb 1.
k 0 C a b Ca b k 0 C a b

Exemplul 3.4.2. Dac dintr-o urn care conine a bile albe i b bile negre se
extrag n bile una cte una, fr ntoarcerea bilei extrase n urn (sau se extrag n
bile simultan), iar X este numrul de bile albe extrase, atunci X are repartiie
hipergeometric cu parametrii a, b i n, conform schemei hipergeometrice
(schema bilei nentoarse).

Teorema 3.4.3. Dac variabila aleatoare X are repartiie hipergeometric cu


parametrii a, b i n, cu n b i n a , atunci valoarea medie i dispersia sa
sunt

abn
E ( X ) ap , Var ( X ) npq , (3.4.2)
a b 1
a b
unde p , q 1 p .
a b a b

Demonstraie
Valoarea medie a variabilei aleatoare X este

n
C ak C bn k a n
k 1 a an
E( X ) k n
n C a 1 Cbn k n
C anb11 ap .
k 0 C a b C a b k 1 C a b ab

Pentru calculul dispersiei, vom calcula mai nti media variabilei X 2 ; avem

n
C ak Cbn k n
C ak Cbnk n
C ak Cbnk
E( X 2 ) k 2 k ( k 1) k
k 0 C anb k 1 C anb k 0 C anb
a (a 1) n k 2 n k a (a 1) n2 an an(a 1)(n 1)
n
C a b k 2
C a 2 C b E ( X ) n
C a b
C a b 2
a b (a b)(a b 1)
an
.
ab

Deci dispersia lui X este

84
an(a 1)(n 1) an a 2n2
Var ( X ) E ( X 2 ) [ E ( X )]2
(a b)(a b 1) a b (a b) 2
abn(a b n) abn
2
npq .
(a b) (a b 1) a b 1

Folosind modelul urnei din Exemplul 3.4.2, valoarea medie a variabilei X


din problem se poate calcula i n felul urmtor. Considerm o urn cu a bile
albe i b bile negre din care se extrag una cte una n bile (fr ntoarcerea bilei n
urn) i considerm variabilele aleatoare X k , pentru k 1,2,, n , unde variabila
X k ( k 1,2,, n ) are ca valori numrul de bile albe obinute la extragerea k (1
dac obinem bil alb i 0 dac obinem bil neagr). Pentru X 1 , avem

a b
P( X 1 1) , P ( X 1 0) .
a b ab

1 0

Deci tabloul repartiiei variabilei X 1 este X 1 : a b . Pentru variabila

a b a b
X 2 obinem (n urn au rmas a+b-1 bile)

P( X 2 1) P( X 2 1 / X 1 1) P( X 1 1) P( X 2 1 / X 1 0) P( X 1 0)
a 1 a a b a (a b 1) a
,
a b 1 a b a b 1 a b a b 1)(a b) a b
P( X 2 0) P( X 2 0 / X 1 1) P( X 1 1) P( X 2 0 / X 1 0) P( X 1 0)
b a b 1 b b(a b 1) b
.
a b 1 a b a b 1 a b (a b)(a b 1) a b

1 0

Deci tabloul repartiiei variabilei X 2 este X 2 : a b . Pentru variabila

ab a b
X 3 avem (n urn au rmas a+b-2 bile)

P( X 3 1) P( X 3 1 / X 2 1) P( X 2 1) P( X 3 1 / X 2 0) P( X 2 0)
[ P(( X 3 1 / X 2 1) / X 1 1) P( X 1 1) P(( X 3 1 / X 2 1) / X 1
0) P( X 1 0)]P( X 2 1) [ P(( X 3 1 / X 2 0) / X 1 1) P( X 1 1)
P(( X 3 1 / X 2 0) / X 1 0) P( X 1 0)]P( X 2 0)

85
a2 a a 1 b a a 1 a

a b2 a b a b2 a b a b a b2 a b
a b b (a 2)a 2 2(a 1)ab ab 2

a b2 a b a b (a b 2)(a b) 2
a (a b)(a b 2) a
2
.
(a b 2)(a b) ab

b
Asemntor se arat c P( X 3 0) ( 1 P( X 3 1)). Deci tabloul
a b
1 0

repartiiei variabilei X 3 este X 3 : a b .

a b a b

Se arat n acelai mod c toate variabilele X k , k 1, 2,, n au acelai tablou


1 0

de repartiie X k : a b , k 1, 2,, n , (dei ele sunt variabile

ab a b
dependente).
n
Cu ajutorul variabilelor X k , k 1, 2, , n , variabila X se scrie X X k ,
k 1
deci media variabilei X este

n n
a na
E ( X ) E( X k ) np .
k 1 k 1 a b ab

n
Pentru dispersie nu mai putem scrie c Var ( X ) este egal cu Var ( X
k 1
k ),

deoarece variabilele X k , k 1, 2,, n nu sunt independente. q.e.d.

3.5. Legea Poisson (legea evenimentelor rare)

Definiia 3.5.1. Variabila aleatoare X urmeaz legea Poisson (X are repartiie


Poisson) cu parametrul ( 0) dac poate lua orice valoare ntreag pozitiv
i

k
P( X k ) e , k 0,1, 2, (3.5.1)
k!

86
Tabloul repartiiei variabilei X este

0 1 2 k

X : 0 1
2
k
.
e e e e
0! 1! 2! k!

Pentru a verifica c suma probabilitilor de pe linia a doua a tabloului de mai


sus este 1, vom folosi dezvoltarea n serie de puteri a funciei f ( x) e x ,
i anume

x x2 xk
ex 1 , x R . (3.5.2)
1! 2! k!

Folosind relaia (3.5.2) pentru x , avem


k
P( X k ) e k! e e 1.
k 0

k 0

Teorema 3.5.2. Dac variabila aleatoare X are repartiie Poisson cu


parametrul , atunci valoarea medie i dispersia sa sunt

E ( X ) , Var ( X ) . (3.5.3)

Demonstraie
Valoarea medie a variabilei X este


k
k 1
E( X ) k e e e e .
k 0 k! k 1 ( k 1)!

Pentru dispersie, calculm mai nti media variabilei X 2 . Obinem


k 2 k
k
k
E( X 2 ) k 2 e (k k ) e k e k (k 1) e
k 0 k! k 1 k! k 1 k! k 2 k!
2 k 2

E( X ) e E ( X ) 2 e e 2 .
k 2 ( k 2)!

Atunci dispersia lui X este

Var ( X ) E ( X 2 ) [ E ( X )]2 2 2 . q.e.d.

87
Propoziia 3.5.3. Dac variabila aleatoare X are repartiie Poisson cu
parametrul , atunci funcia sa caracteristic este

it
(t ) e (e 1)
, t R. (3.5.4)

Demonstraie
Folosind formula de calcul de la funcia caracteristic, avem


k itk

k itk

(e it ) k it it
(t ) e e e e e e e e e (e 1) , t R.
k 0 k! k 0 k! k 0 k!
q.e.d.

Teorema 3.5.4. Variabilele aleatoare independente X 1 i X 2 au repartiii


Poisson cu parametrii 1 i respectiv 2 . Atunci variabila aleatoare X 1 X 2
are repartiie Poisson cu parametrul 1 2 .

Demonstraie
Variabila aleatoare X 1 X 2 are ca valori pe 0,1, 2, Fie k 0 ntreg.
Atunci avem
k

P ( X 1 X 2 k ) P j 0 ( X 1 j , X 2 k j ) P ( X 1 j , X 2 k j )
k

j 0
k
1 k
2 e ( 1 2 )
j k j k
P( X 1 j ) P( X 2 k j ) e e 1 2
C k
j
1j k2 j
j 0 j 0 j! (k j )! k! j 0
k
(1 2 ) ( 1 2 )
e .
k!
Deducem astfel c variabila aleatoare X 1 X 2 are repartiie Poisson cu
parametrul 1 2 . Folosind funciile caracteristice ale variabilelor X 1 , X 2 ,
exprimate cu ajutorul formulei (3.5.4), i anume
1 ( eit 1) 2 ( e it 1)
1 (t ) e , 2 (t ) e , t R , deducem c funcia caracteristic a
variabilei X 1 X 2 este
it it it
(t ) 1 (t ) 2 (t ) e 1 ( e 1)
e 2 (e 1)
e ( 1 2 )(e 1)
, t R.

Din expresia de mai sus a funciei caracteristice rezult c variabila X 1 X 2 are


repartiie Poisson cu parametrul 1 2 . q.e.d.

Legtura dintre repartiia binomial i repartiia Poisson este dat de


urmtoarea teorem.

88
Teorema 3.5.5. Fie k N fixat, iar pentru n k considerm variabilele X n care
au repartiii binomiale cu parametrii n i p n , astfel nct toate s aib aceeai
valoare medie . Atunci are loc relaia

k
lim P( X n k ) e . (3.5.5)
n k!

Rezolvare
Deoarece variabilele X n , n k au aceeai valoare medie , deducem
conform primei relaii din (3.5.3) c valoarea medie a acestor variabile este
E ( X n ) np n . Deci pn / n . Atunci obinem

k n k
n(n 1)(n k 1)
lim P( X n k ) lim C nk p nk qnn k lim 1
n n n k! n n
n k
k n(n 1) (n k 1) k
lim k
lim 1 e ,
k ! n n n
n k!
adic relaia (3.5.5). q.e.d.

Observaia 3.5.6. Relaia (3.5.5) ne arat c dac p n este suficient de mic i n


suficient de mare, atunci putem aproxima repartiia binomial cu parametrii n i
p n , prin repartiia Poisson de parametru np n . Din acest motiv repartiia
Poisson se mai numete legea evenimentelor rare. Dac n 30 i np 5 atunci
repartiia Poisson cu parametrul np este o bun aproximare a repartiiei
binomiale cu parametrii n i p.
Aplicaia 3.5.7. S se calculeze momentele iniiale m3 ( X ) i m4 ( X ) , precum i
momentele centrate 3 ( X ) i 4 ( X ) pentru o variabil aleatoare X cu
repartiie Poisson cu parametrul .

Rezolvare
Din demonstraia teoremei 3.5.2 tim c m1 ( X ) E ( X ) , iar
m2 ( X ) E ( X 2 ) 2 . Momentul iniial de ordinul al treilea al variabilei X
k

este m3 ( X ) E ( X 3 ) k 3 e .
k 0 k!
Deoarece k 3 k (k 1)(k 2) 3k (k 1) k , vom scrie pe m3 ( X ) astfel

89

k
k
k
m3 ( X ) k (k 1)(k 2) e 3 k (k 1) e k e
k 2 k! k 1 k! k 1 k!

k 3
k 2
k 1
3e 32 e e 3e e
k 3 ( k 3)! k 2 ( k 2)! k 1 ( k 1)!

32 e e e e 3 32 .

Apoi momentul centrat de ordinul al treilea este

3 ( X ) E ( X ) 3 E ( X 3 3X 2 32 X 3 ) E ( X 3 ) 3E ( X 2 )
32 E ( X ) 3 m3 3 m2 32 m1 3 3 32 3 (2 )
33 3 .

Pentru momentul iniial de ordinul al patrulea avem


4

m4 ( X ) E ( X 4 ) k 4 e . Deoarece
k 0 k!
k 4 k (k 1)(k 2)(k 3) 6k (k 1)(k 2) 7k (k 1) k , momentul m4 ( X ) se
scrie astfel


k
k
m4 ( X ) k (k 1)(k 2)(k 3) e 6 k (k 1)(k 2) e
k 3 k! k 2 k!

k k
k 4
k 3
7 k (k 1) e k e 4 e 63e
k 1 k! k 1 k! k 4 ( k 4)! k 3 ( k 3)!
k 2 k 1

72 e e 4 e e 63e e 72 e e
k 2 ( k 2)! k 1 ( k 1)!

e e 4 63 72 .

Apoi momentul centrat de ordinul al patrulea este

4 ( X ) E ( X ) 4 E ( X 4 4X 3 62 X 2 43 X 4 ) E ( X 4 )
4E ( X 3 ) 62 E ( X 2 ) 43 E ( X ) 4 m4 4m3 62 m2 43 m1 4
4 63 72 4 (3 32 ) 62 (2 ) 44 4 32 .

90
Capitolul 4

Legi clasice de probabilitate (repartiii) ale


variabilelor aleatoare continue

Introducere
Vom prezenta n acest capitol principalele legi de probabilitate ale
variabilelor aleatoare continue, i anume: legea continu uniform (rectangular),
legea normal (Gauss-Laplace), legea log-normal, legea gamma, legea beta,
legea 2 (Helmert-Pearson), legea Student (t) i cazul su particular legea
Cauchy, legea Snedecor i legea Fisher, legea Weibull i cazul su particular
legea exponenial.

4.1. Legea continu uniform (rectangular)

Definiia 4.1.1. Variabila aleatoare X urmeaz legea continu uniform


(rectangular) (X are repartiie uniform) cu parametrii i
( R, 0) dac densitatea sa de probabilitate (repartiie) este funcia

1
, x 2 , 2 ,

f ( x) (4.1.1)
0, x , , .
2 2

Observm c funcia f este o densitate de probabilitate, deoarece


f ( x) 0, x R , i


1 x
2
f ( x ) dx
2 dx 1.

2

2

Funcia de repartiie a variabilei X este

91

0, x , ,
2

1
F ( x) x , x , , (4.1.2)
2 2 2

1, x , .
2

Graficele funciilor f i F sunt date n Figura 4.1.1 i respectiv Figura 4.1.2.

Figura 4.1.1 Figura 4.1.2

Teorema 4.1.2. Dac variabila aleatoare X are repartiie uniform cu


parametrii i , atunci valoarea medie i dispersia sa sunt

2
E ( X ) , Var ( X ) . (4.1.3)
12

Demonstraie
Valoarea medie a variabilei X este


x 1 2
2
E ( X ) xf ( x ) dx
2 dx x ,

2
2
2

iar dispersia sa este


1 1 2
Var ( X ) ( x ) 2 f ( x ) dx
2 (x )2 dx ( x )3 2
.

2
3
2
12
q.e.d.

Propoziia 4.1.3. Funcia caracteristic a unei variabile aleatoare X cu


repartiie uniform cu parametrii i este

92
i it it
e e 2 , t R * ,
2

(t ) t (4.1.4)


1, t 0.

Demonstraie
Pentru t 0, avem


i it 2 it

1 1 itx
2
(t ) e f ( x) dx 2 e itx dx
itx
e 2
e e
,
2 it
2
t


iar (0) f ( x ) dx 1. q.e.d.

Aplicaia 4.1.4. S se calculeze momentele m2 ( X ), m3 ( X ) i 3 ( X ) pentru o


variabil aleatoare X cu repartiie uniform cu parametrii i .

Rezolvare
Momentul iniial de ordinul al doilea este

3
1 2 1 3 1
m2 ( X ) x 2 f ( x ) dx
2
x dx x 2


2
3
2
3 2
3
1 2 3 2
3 2 .
2 3 4 12

Apoi momentul iniial de ordinul al treilea este

4

3
31 1 4
2
1
m3 ( X ) x f ( x) dx
2
x dx x

2
4
2
4 2
4
1 3 3 3 2
( 4 ) ,
2 4 4

iar momentul centrat de ordinul al treilea este



3

31 1
3 ( X ) ( x ) f ( x ) dx
2 (x ) dx ( x )4 2
0.

2
4
2

93
Aplicaia 4.1.5. Variabilele aleatoare X i Y sunt independente. X are repartiie
uniform pe intervalul [0,1], iar Y are repartiie uniform pe intervalul [0,2]. S
se calculeze densitatea de probabilitate a variabilei X+Y.

Rezolvare
Dac f1 i f 2 sunt densitile de probabilitate ale variabilelor aleatoare X

i respectiv Y, atunci f1 ( x) dx 1 i f 2 ( x) dx 1. Deducem din aceste

1
relaii c parametrii variabilei X sunt 1 1 i 1 , iar parametrii variabilei Y
2
sunt 2 2 i 2 1. Atunci densitile de probabilitate vor avea forma

1
1, x [0,1], , x [0,2],
f 1 ( x) f 2 ( x) 2
0, x [0,1], 0, x [0,2].

Deoarece X i Y sunt independente, densitatea de probabilitate a variabilei


X+Y este dat de formula


f ( x) f1 ( x y ) f 2 ( y ) dy .

Observm c f1 ( x y ) 0 pentru x y [0,1] sau echivalent y [ x 1, x ] , iar


f 2 ( y ) 0 pentru y [0,2]. Deci f1 ( x y ) f 2 ( y ) 0 pentru y [ x 1, x ] [0,2].
Avem urmtoarele patru cazuri:
a) Dac x [0,3] , atunci [ x 1, x ] [0,2] , deci f ( x) 0 .
b) Dac x [0,1) , atunci [ x 1, x ] [0,2] [0, x] i

x x 1 x
f ( x) f1 ( x y ) f 2 ( y ) dy dy .
0 0 2 2

c) Dac x [1,2) , atunci [ x 1, x ] [0,2] [ x 1, x ] i

x x 1 1
f ( x) f1 ( x y ) f 2 ( y ) dy dy .
x 1 x 1 2 2

d) Dac x [2,3] , atunci [ x 1, x ] [0,2] [ x 1,2] i

2 2 1 3 x
f ( x) f1 ( x y ) f 2 ( y ) dy dy .
x 1 x 1 2 2

94
Deci densitatea de probabilitate a variabilei X+Y este funcia

x / 2, x [0,1),
1 / 2, x [1,2),

f ( x)
(3 x ) / 2 , x [2,3],
0, x [0,3].

4.2. Legea normal (Gauss-Laplace). Legea normal standard


(legea normal centrat redus)
Definiia 4.2.1. Variabila aleatoare X urmeaz legea normal (Gauss-Laplace)
(X are repartiie normal) cu parametrii m i (m R, 0) dac densitatea
sa de probabilitate (repartiie) este funcia

( x m )2
1
2 2
f ( x; m, ) e , x R. (4.2.1)
2

O variabil aleatoare cu repartiie normal cu parametrii m i se noteaz


cu N (m, 2 ).
Funcia f de mai sus se numete densitatea de repartiie normal sau
gaussian. Observm c f este o densitate de probabilitate, deoarece

f ( x) 0, x R i f ( x ) dx 1. ntr-adevr, pentru a verifica ultima relaie,

xm
n integrala de mai sus facem schimbarea de variabil y . Rezult c
2
dx 2 dy . Dac x atunci y , iar dac x atunci y .
Obinem astfel

1 2 2 2

f ( x ) dx e y dy e y dy 1.

0

2
Am folosit mai sus integrala lui Euler-Poisson e y dy / 2 .
0
Graficul funciei f are form de clopot (vezi Figura 4.2.1). Dreapta de
ecuaie x m este ax de simetrie pentru acest grafic, iar pentru x m se obine
1
valoarea maxim a funciei f, i anume . Punctele x m i x m
2
sunt puncte de inflexiune.

95
Figura 4.2.1

Pentru m 0 i 1 funcia f dat de relaia (4.2.1) devine

x2
1
2
f ( x; 0,1) e , x R. (4.2.2)
2

Vom spune despre o variabil aleatoare X care are ca densitate de


probabilitate funcia (4.2.2) c urmeaz legea normal standard sau legea
normal centrat redus.
Pentru a determina funcia de repartiie F ( x; m, ) a unei variabile aleatoare
X cu repartiie normal cu parametrii m i , vom determina mai nti funcia de
repartiie pentru o variabil aleatoare cu repartiie normal standard, notat cu
F (x; 0,1) i numit funcia de repartiie normal standard. Conform relaiei de
legtur dintre f i F, avem

x 0 x 1
F ( x; 0,1) f (t;0,1) dt f (t; 0,1) dt f (t ; 0,1) dt ( x) , (4.2.3)
0 2

1 x t 2 / 2
unde ( x) e dt . Funcia de mai sus se numete funcia
2 0
integral a lui Laplace, pentru valorile creia sunt ntocmite tabele.
Dac variabila aleatoare X urmeaz legea normal cu parametrii m i
1
, atunci variabila aleatoare Y ( X m) urmeaz legea normal cu parametrii

0 i 1. ntr-adevr, dac F1 este funcia de repartiie a variabilei Y, atunci

F1 ( x) P(Y x) P( X m x) F (m x; m, ) , (4.2.4)

iar densitatea de probabilitate a variabilei Y este

96
1 x2 / 2
f1 ( x) F1' ( x) f (m x; m, ) e f ( x; 0,1), x R .
2

Deci F1 ( x) F ( x; 0,1), x R , adic variabila Y urmeaz legea normal cu


parametrii 0 i 1. Din ultima relaie i relaia (4.2.4) obinem

F ( x; 0,1) F (m x; m, ), x R. (4.2.5)

Rezult astfel c pentru variabila aleatoare X cu repartiie normal cu


parametrii m i , funcia de repartiie este

xm 1 xm
F ( x; m, ) F ; 0,1 . (4.2.6)
2

Teorema 4.2.2. Dac variabila aleatoare X are repartiie normal cu parametrii


m i , atunci valoarea medie i dispersia sa sunt

E ( X ) m , Var ( X ) 2 . (4.2.7)

Demonstraie
Valoarea medie a variabilei aleatoare X este

( x m )2
1
2 2
E ( X ) xf ( x; m, ) dx xe dx .

2

xm
n integrala de mai sus vom face schimbarea de variabil y , de unde

rezult dx dy ; pentru x rezult y , iar pentru x rezult
y . Deci obinem

1 2 2
E( X ) (y m)e y / 2 dy ye y /2
dy

2 2
m 2
ey /2
dy m f ( y; 0,1) dy m .

2

Dispersia variabilei X este

( x m )2

2 1
2

2 2
Var ( X ) ( x m) f ( x; m, ) dx ( x m) e dx .

2

97
Folosind schimbarea de variabil de mai sus, obinem
1
2 2 y2 / 2 2 2 y2 / 2
Var ( X ) y e dy y e dy
2 2
2 2 '
2

2 y ye y2 / 2
dy

2
y e y2 / 2
dy
2
2
ye y / 2

2 y2 / 2
e dy 2 .
2

Deducem de aici c abaterea medie ptratic a variabilei X este X . q.e.d.

Propoziia 4.2.3. Dac variabila aleatoare X are repartiie normal cu


parametrii m i , atunci funcia sa caracteristic este

2t 2
imt
(t ) e 2
, t R.
(4.2.8)

Demonstraie
Funcia caracteristic a variabilei X este

( x m )2 x 2 2 mx m 2 2 2itx

itx 1
itx

2 2 1
2 2
(t ) e f ( x ) dx e e dx e dx

2 2
x 2 2 x ( m 2it ) ( m 2it ) 2 m 2 ( m 2it ) 2
1
2 2
2 2
e e dx

2
m 2 4i 2t 2 2 mit 2 m 2 [ x ( m 2it )]2
1 2 2

2 2
e e dx , t R .

2

x (m 2 it )
Folosind schimbarea de variabil u , obinem
2

2t 2 2t 2
1 imt
2

u 2
imt
2
(t ) e e du e , t R . q.e.d.

Propoziia 4.2.4. Dac variabila aleatoare X are repartiie normal cu


parametrii m i , iar a, b, k R, k 0 , atunci
bm am
a) P(a X b) ; (4.2.9)

b) P(| X m | k ) 2 (k ) . (4.2.10)

98
Demonstraie
a) Din relaia (4.2.6) i continuitatea funciei F deducem c

1 b m 1 a m
P(a X b) F (b; m, ) F (a; m, )
2 2
bm am
.

b) Conform relaiei (4.2.9) obinem

P(| X m | k ) P(m k X m k ) (k ) (k ) 2 (k ) ,

deoarece funcia este impar ( (k ) (k ) ). q.e.d.

Observaia 4.2.5. Dac lum k 3 n relaia (4.2.10) rezult

P(| X m | 3 ) 2 (3) 0,9974 . (4.2.11)

Relaia (4.2.11) ne spune c aproape toate valorile variabilei X sunt situate n


intervalul (m 3 , m 3 ) . Egalitatea din (4.2.11) este cunoscut sub numele
de regula celor ase .

Propoziia 4.2.6. Dac variabila aleatoare X are repartiie normal cu


parametrii m i , atunci momentele sale centrate sunt

2 p 1 ( X ) 0, 2 p ( X ) (2 p 1)!! 2 p , p N * , (4.2.12)

unde (2 p 1)!! 1 3 5(2 p 1) .

Demonstraie
Momentul centrat de ordinul k este

( x m )2

k 1
k

2 2
k ( X ) ( x m) f ( x) dx ( x m) e dx . (4.2.13)

2

Obinem astfel


0 ( X ) f ( x ) dx 1, 1 ( X ) ( x m) f ( x ) dx 0, 2 ( X ) Var ( X ) 2 .

99
Pentru k 2 , n integrala din relaia (4.2.13) vom face schimbarea de variabil
xm
y , de unde deducem c dx 2 dy ; apoi pentru x rezult
2
y , iar pentru x rezult y . Obinem atunci

( 2 ) k ( 2 ) k
k ( X )



k
y e y2
dy
2



dy
y k 1 e y
2 '

( 2 ) k 2 ( 2 ) k 2
y k 1e y
(k 1) y k 2 e y dy

2 2
( 2 ) 2 ( 2 ) k 2 2
(k 1) y k 2 e y dy (k 1) 2 k 2 .
2

Deci am dedus relaia de recuren


2
k ( X ) (k 1) k 2 ( X ) . Deoarece 0 ( X ) 1, 1 ( X ) 0 , din relaia de mai
sus rezult relaiile (4.2.12). q.e.d.

Propoziia 4.2.7. Dac variabiele aleatoare indepedente X i Y au repartiii


normale cu parametrii m1 i 1 , respectiv m2 i 2 , atunci variabilele X+Y i
X-Y au repartiii normale cu parametrii m m1 m2 i 12 22 ,
respectiv m m1 m2 i 12 22 .

Demonstraie
Vom calcula mai nti densitile de probabilitate pentru variabilele X+Y
i X-Y, pentru cazul particular m1 m2 0 i 1 2 1. Dac notm cu f i g
densitile de probabilitate ale variabilelor X i Y, atunci conform relaiei (4.2.2)
avem

1 x2 / 2
f ( x) g ( x) e , x R.
2

Densitatea de probabilitate a variabilei X+Y este

100
( x y )2 y2
x2
y 2 xy
1
2

2
1
2

h( x ) f ( x y ) g ( y ) dy e e dy e dy
2 2
2
x x2 y x / 2 z x2 x2
1 y
2

4
1 4
z2 1 4
e e dy e e dz e
2 2
2
x2

1 2 )2
e 2( , x R.
2 2

Deducem astfel c X+Y urmeaz i ea legea normal cu parametrii m 0 i


2.
Asemntor pentru densitatea de probabilitate a variabilei aleatoare X-Y
obinem

( x y )2 y2
x2
y 2 xy
1
2

2
1
2

k ( x) f ( x y ) g ( y ) dy e e dy e dy
2 2
2
x x2 y x / 2 z x2 x2
1 y
2

4
1 4
z2 1 4
e e dy e e dz e
2 2
2
x2

1 2 )2
e 2( , x R.
2 2

Rezult c X-Y urmeaz legea normal cu parametrii m 0 i 2 .


n cazul general al variabilelor X i Y cu repartiii normale cu parametrii m1 i
1 , respectiv m2 i 2 , putem s facem un calcul asemntor celui de sus, sau se
poate raiona mai simplu folosind funciile caracteristice ale variabilelor.
Conform relaiei (4.2.8) funciile caracteristice ale variabilelor X i Y sunt

12t 2 22t 2
im1t im2t
1 (t ) e 2
, 2 (t ) e 2
, t R .

Atunci funcia caracteristic a variabilei aleatoare X+Y este

i ( m1 m2 ) t
2 2
1 2 t 2

(t ) 1 (t ) 2 (t ) e 2
, t R .

Se observ c este tocmai funcia caracteristic corespunztoare legii normale


cu parametrii m m1 m2 i 12 22 .
Asemntor funcia caracteristic a variabilei aleatoare X-Y este

101
i ( m1 m2 ) t
2 2
1 2 t 2

~ (t ) 1 (t ) 2 (t ) e 2
, t R.

Se observ c ~ este funcia caracteristic corespunztoare legii normale cu


parametrii m m1 m2 i 12 22 . q.e.d.

Legea normal reprezint cazul limit al multor legi de probabilitate.


Astfel menionm urmtorul rezultat de legtur ntre repartiia normal i
repartiia Poisson.

Teorema 4.2.8. Dac variabila aleatoare X ( 0) are repartiie Poisson cu


X
parametrul , atunci funcia de repartiie a variabilei aleatoare tinde

ctre funcia de repartiie normal standard, pentru .

X
n ipotezele Teoremei 4.2.8 se mai spune c variabila aleatoare este

asimptotic normal.

Legtura dintre repartiia binomial i repartiia normal este dat n


urmtoarea teorem.

Teorema 4.2.9. (Moivre-Laplace) Dac variabila aleatoare X n are repartiie


binomial cu parametrii n i p (p nu depinde de n), iar X are repartiie normal
standard, atunci

X np 1 b
x2 / 2
lim P a n b P ( a X b) e dx . (4.2.14)
n npq 2 a

Teorema 4.2.9 ne spune c pentru valori mari ale lui n putem folosi tabelele
legii normale pentru studiul variabilelor aleatoare cu repartiii binomiale. Pentru
n 30 , exist urmtoarea regul practic care ne permite s aproximm repartiia
binomial prin cea normal:
- Dac min (np, nq ) 10, atunci aproximarea este foarte bun.
- Dac min (np, nq ) (5,10), atunci aproximarea este acceptabil, dac nu
este nevoie de mare precizie.
- Dac min (np, nq ) 5, atunci nu se folosete aceast aproximare.
Teorema lui Moivre-Laplace este un caz particular al aa numitei Teorema
limit central, care spune c funcia de repartiie a unei sume de variabile
aleatoare independente tinde n condiii destul de generale ctre funcia de

102
repartiie normal. De fapt, prin Teorema limit central se nelege un grup de
teoreme care trateaz problema repartiiei limit a sumelor de variabile aleatoare
(nu ntotdeauna independente). Rezultatul cel mai general n cazul variabilelor
aleatoare independente este teorema lui Lindeberg-Fellar. n aplicaii este foarte
util un caz particular al acestei teoreme, prezentat mai jos.

Teorema 4.2.10. (Liapunov) Fie variabilele aleatoare independente


X n , n 1 cu mediile i dispersiile mn E ( X n ) , n2 Var ( X n ) , n 1, care au
momente centrate absolute de ordinul al treilea n3 E (| X n mn |3 ) , n 1.
( n)
Dac lim 0, unde (n) 12 22 n2 i
n ( n)

(n) 3 13 23 n3 , atunci lim Fn ( x ) F ( x; 0,1) , unde Fn este funcia


n

1 n
de repartiie a variabilei aleatoare X ( X k mk ) .
(n) k 1

Aplicaia 4.2.11. Se arunc o moned de 256 de ori. Care este probabilitatea ca


numrul de apariii ale stemei s fie cuprins ntre 112 i 144?

Rezolvare
S notm cu X variabila aleatoare care are ca valori numrul de apariii
ale stemei, atunci cnd se arunc moneda de 256 de ori. Variabila X are
repartiia binomial cu parametrii n=256 i p=1/2 (probabilitatea ca la o aruncare
s apar stema). n aceast aplicaie trebuie s calculm P(112<X<144).
Deoarece E(X)=np=128, iar X npq 8 , atunci are loc relaia

X 128
P(112 X 144) P 2 2 .
8

Vom folosi Teorema 4.2.9 (Moivre-Laplace) i vom aproxima repartiia


X 128
cu repartiia normal standard Y. Obinem
8

X 128
P 2 2 P(2 Y 2) (2) (2) 2 (2) 0,95 .
8

Aplicaia 4.2.12. De cte ori trebuie s aruncm un zar corect astfel nct
probabilitatea ca abaterea frecvenei relative a feei 1 de la numrul p=1/6 s
fie cuprins ntre -0,03 i 0,03, este 0,95.

Rezolvare

103
Dac n n aruncri faa 1 apare de n ori, vom determina pe n astfel nct
s aib loc relaia


P 0,03 n p 0,03 0,95. (4.2.15)
n

Relaia (4.2.15) se mai poate scrie astfel

np 0,03 n
P n 0,95 , q 1 p 5 . (4.2.16)
npq pq 6

0,03 n
Folosind relaiile (4.2.14) i (4.2.9) (cu m 0, 1 ) pentru b a ,
pq
din relaia (4.2.16) deducem c

0,03 n
2 0,95 0,18 n 0,475
pq 5

0,18 n 1
F 0,18 n 0,975.

5 2 5

Folosind un tabel cu valorile funciei , rezult c 0,18 n / 5 1,96 . Obinem


n 592,8. Deci trebuie s aruncm zarul de 593 de ori pentru a fi verificat
relaia (4.2.15).

Aplicaia 4.2.13. O main produce o pies circular. Piesa este bun dac
diametrul su d este cuprins ntre 3,99 cm i 4,01 cm. Care este probabilitatea
producerii unei piese defecte de ctre maina respectiv, tiind c d are
repartiie normal cu media 4,002 cm i abaterea medie ptratic 0,005 cm ?

Rezolvare
Conform formulei (4.2.9), probabilitatea ca o pies s fie bun este

bm am 4,01 4,002
P(3,99 d 4,01)
0,005
3,99 4,002
(1,6) (2,4) (1,6) (2,4) 0,937 .
0,005

Rezult atunci c probabilitatea ca piesa s fie defect este 1-0,937=0,063.

104
Aplicaia 4.2.14. O main produce o pies circular. Cnd maina este bine
reglat, diametrul d al pieselor are repartiie normal cu media 10 cm i
abaterea medie ptratic 0,08 cm. Se iau la ntmplare 4 piese fabricate de
main i se constat c media aritmetic a diametrelor acestor piese este 10,14
cm. Se poate afirma c maina s-a dereglat ?

Rezolvare
Fie d1 , d 2 , d 3 , d 4 diametrele celor 4 piese alese la ntmplare. Acestea sunt
4 variabile aleatoare indepedente cu repartiii normale cu media 10 cm i
abaterea medie ptratic 0,08. Atunci variabila d (d1 d 2 d 3 d 4 ) / 4 are de
asemenea repartiie normal cu media 10 cm i abaterea medie ptratic 0,04 cm.
ntr-adevr, avem

d d 2 d3 d 4 1 4
m E (d ) E 1 E (d i ) 10,
4 4 i 1
d d 2 d3 d 4 1 4
Var (d ) Var 1 Var (d i ) 0,0016, d 0,04.
4 16 i 1

Conform regulei celor ase (relaia (4.2.11)), avem

P(| d m | 3 ) 2 (3) 0,997 P(m 3 d m 3 ) 0,997 ,

de unde rezult c P(9,88 d 10,12) 0,997 . Din aceast ultim relaie


deducem c d ia valori n afara intervalului (9,88; 10,12) cu o probabilitate mai
mic de 0,003. Deci este aproape sigur c maina s-a defectat.

4.3. Legea log-normal


Definiia 4.3.1. Variabila aleatoare X urmeaz legea log-normal (logaritmic
normal) (X are repartiie log-normal ) cu parametrii m i (m R, 0)
dac densitatea sa de probabilitate (repartiie) este funcia

2
1
(ln x m )
2
e 2 , x 0,
f ( x; m, ) x 2 (4.3.1)

0, x 0.

Funcia f din (4.3.1) este o densitate de probabilitate, deoarece



f ( x) 0, x R i f ( x ) dx 1. ntr-adevr pentru ultima relaie avem

105
ln x m
(ln x m ) 2 t t2
1 1 2 2
1
2
f ( x ) dx e dx e dt 1.

2 0 x 2

Funcia de repartiie a variabilei log-normale X cu parametrii m i este


F ( x) 0 pentru x 0, iar pentru x>0 este
ln t m
(ln t m ) 2 u ln x m u2
x 1 1
x
2 2
1

2
F ( x ) f (t ) dt 0 t e dt e du

2 2
ln x m
F ; 0,1,

unde F(x;0,1) este funcia de repartiie normal standard. Deducem din ultima
ln X m
relaie c pentru valorile pozitive ale lui X, variabila Y urmeaz legea

normal standard.

Teorema 4.3.2. Dac variabila aleatoare X are repartiie log-normal cu


parametrii m i , atunci momentele iniiale de ordinul k sunt

2k 2
mk
mk ( X ) e 2,
, k N *. (4.3.2)

Demonstraie
Conform formulei pentru momentele iniiale de ordinul k, avem

(ln x m ) 2 ln x y

k
1 k

2 2
mk ( X ) x f ( x ) dx x e dx
0
x 2
2
( y m ) y 2 2 my m 2 2 2 yk
1
ky

2 2
1
2 2
e e dy e dy

2 2
y 2 2 y ( m 2 k ) ( m 2 k ) 2 ( m 2 k ) 2 m 2
1
2 2
e dy

2
[ y ( m 2 k )]2 4 k 2 2 m 2 k 4k 2 2 mk 2 [ y ( m 2k )]2
1
2 2 1 2 2

2 2

2


e dy
2
e
e dy.

Notm ( y m 2 k ) /( 2 ) u i obinem

2 k 2 2 mk 2k 2
1 2

u 2
mk
2
mk ( X ) e e 2 du e . q.e.d.

2
106
Din relaia (4.3.2) deducem c media i dispersia variabilei X cu repartiie
log-normal cu parametrii m i sunt

2
m 2 2
E ( X ) m1 ( X ) e 2
, Var ( X ) m2 ( X ) [m1 ( X )]2 e 2 m (e 1) . (4.3.3)

4.4. Legea gamma


Definiia 4.4.1. Variabila aleatoare X urmeaz legea gamma (X are repartiie
gamma ) cu parametrul p ( p 0) dac densitatea sa de probabilitate
(repartiie) este funcia

x p1e x
, x 0,
f ( x) ( p) (4.4.1)
0, x 0,


unde ( p ) x p 1e x dx , p 0 este integrala lui Euler de al doilea tip sau
0
funcia gamma a lui Euler.

Funcia f din (4.4.1) este o densitate de probabilitate, deoarece


f ( x) 0, x R i

1 p 1 x
f ( x ) dx x e dx 1.
( p ) 0

n propoziia urmtoare vom prezenta cteva proprieti ale funciei (pentru


demonstraiile lor vezi [21]).


Propoziia 4.4.2. Integrala (funcia) lui Euler ( p ) x p 1e x dx , p R
0
verific urmtoarele proprieti:
a) ( p ) este convergent pentru p>0 i divergent pentru p 0 ;
b) ( p 1) p( p ), p 0;
c) (n) (n 1)!, n N * ;
d) 1 / 2 .

Teorema 4.4.3. Dac variabila aleatoare X are repartiie gamma cu parametrul


p, atunci momentele iniiale de ordinul k sunt

107
mk ( X ) p ( p 1) ( p k 1), k N * . (4.4.2)

Demonstraie
Momentul iniial de ordinul k este

1 k p1 x ( k p )
mk ( X ) x k f ( x) dx x e dx
( p ) 0 ( p )

(k p 1)(k p 1) (k p 1) ( p 1) p( p)

( p) ( p )
(k p 1)(k p 2) ( p 1) p.

Am folosit mai sus proprietatea b) din Propoziia 4.4.2. q.e.d.

Din relaia (4.4.2) deducem c media i dispersia variabilei X cu repartiie


gamma cu parametrul p sunt

E ( X ) m1 ( X ) p, Var ( X ) m2 ( X ) [m1 ( X )]2 p. (4.4.3)

Definiia 4.4.4. Variabila aleatoare X urmeaz legea gamma generalizat (X


are repartiie gamma generalizat ) cu parametrii p 0 i 0 dac
densitatea sa de probabilitate (repartiie) este funcia

p x p 1e x
, x 0,
f ( x ) ( p) (4.4.4)
0, x 0,

ntr-un mod asemntor cu demonstraia Teoremei 4.4.3 se arat urmtoarea


teorem.

Teorema 4.4.5. Dac variabila aleatoare X are repartiie gamma generalizat


cu parametrii p 0 i 0 , atunci momentele iniiale de ordinul k sunt

p ( p 1) ( p k 1)
mk ( X ) k
, k N*, (4.4.5)

deci media i dispersia sa sunt

p p
E ( X ) m1 ( X ) , Var ( X ) m2 ( X ) [m1 ( X )]2 2 . (4.4.6)

108
Propoziia 4.4.6. Dac variabila aleatoare X are repartiie gamma generalizat
cu parametrii p 0 i 0 , atunci funcia sa caracteristic este

p
it
(t ) 1 , t R . (4.4.7)

Demonstraie
Pentru determinarea funciei caracteristice a variabilei X vom folosi formula care
d momentul de ordinul k al variabilei X n funcie de derivatele funciei
caracteristice c n punctul 0, i anume mk ( k ) (0) i k , ( m0 1 ), precum i
dezvoltarea n serie de puteri a funciei care are forma urmtoare


( k ) (0) k mk i k k (it ) k
(t ) t t mk .
k 0 k! k 0 k! k 0 k!

Folosind formula (4.4.5) pentru momentele iniiale ale variabilei X, obinem


pentru funcia caracteristic formula


(it ) k
(it ) k p( p 1) ( p k 1)
(t ) mk
k 0 k! k 0 k! k
k p
p ( p 1)( p k 1) it it
1 , t R.
k 0 k!
q.e.d.

Din relaia (4.4.7) pentru 1, deducem c funcia caracteristic a unei


variabile X cu repartiie gamma cu parametrul p este

p
(t ) 1 it , t R . (4.4.8)

Propoziia 4.4.7. Dac variabilele aleatoare independente X i Y au repartiii


gamma cu parametrii p i respectiv q, atunci variabila X+Y are repartiie
gamma cu parametrul p+q.

Demonstraie
S notm cu f i g densitile de probabilitate pentru variabilele X i Y.
Deci

109
1
x p 1e x , x 0,
f ( x) g ( x) ( p )
0, x 0.


Densitatea de probabilitate h a variabilei X+Y este h( x) f ( x y ) g ( y ) dy.

Dac x 0 atunci

0
h( x) f ( x y ) g ( y ) dy f ( x y ) g ( y ) dy 0,
0

(n prima integral g(y)=0, iar n a doua integral f(x-y)=0).


Dac x 0, atunci f ( x y ) 0 pentru x y 0 y x, iar g ( y ) 0 pentru
y 0. Deci f ( x y ) g ( y ) 0 dac y [0, x] i atunci

x x 1 1
h( x) f ( x y ) g ( y ) dy ( x y ) p1 e x y y q1e y dy
0 0 ( p) ( q)
ex x
( x y ) p 1 y q1 dy.
( p ) ( q ) 0

Pentru calculul ultimei integrale de mai sus facem schimbarea de variabil y=tx,
deci dy=xdt; pentru y 0 rezult t 0, iar pentru y x rezult
t 1. Obinem astfel

ex 1
p 1 q 1 e x x p q1 1 q 1
h( x ) ( x tx ) ( tx ) x dt x (1 x) p1 dt
( p ) ( q ) 0 ( p ) ( q ) 0

B ( q, p ) e x x p q 1
e x x p q 1 .
( p ) ( q ) ( p q )

Rezult c variabila X+Y are repartiie gamma cu parametrul p+q.


Concluzia acestei propoziii o putem obine mai direct folosind funciile
caracteristice. Fie 1 i 2 funciile caracteristice ale variabilelor X i Y, i
anume

p
1 (t ) 1 it , 2 (t ) (1 it ) q , t R .

Atunci funcia caracteristic a variabilei aleatoare X+Y este

( pq)
(t ) 1 (t ) 2 (t ) 1 it , t R.

110
Deducem din relaia obinut c X+Y are repartiie gamma cu parametrul p+q.
q.e.d.

Propoziia 4.4.8. Dac variabila aleatoare X urmeaz legea normal cu


1
parametrii m i , atunci variabila aleatoare Y 2
( X m) 2 are o repartiie
2
gamma cu parametrul 1/2.

Demonstraie
S notm cu G(x) funcia de repartiie a variabilei Y. Deoarece Y 0 ,
atunci pentru x 0 rezult c F ( x ) P(Y x ) 0 . Pentru x 0 avem

( X m) 2 X m
G ( x) P(Y x) P 2
x P x x
2 2
m 2x m m 2x m
P (m 2 x X m 2 x )




2 2x 2
2 ( 2 x ) e t /2
dt.
0

Atunci pentru x 0 densitatea de probabilitate g a variabilei aleatoare Y este

1 x 1 1 / 2 x
g ( x) G' ( x) e x e ,
x

iar pentru x 0, g(x)=0.


Deoarece (1 / 2) (conform Propoziiei 4.4.2, d)), deducem forma
funciei g, i anume

1
x 1/ 2 e x , x 0,
g ( x ) (1 / 2)
0, x 0,

adic variabila Y are repartiie gamma cu parametrul 1/2. q.e.d.

Aplicaia 4.4.9. S se calculeze momentele centrate 3 ( X ) i 4 ( X ) pentru o


variabil aleatoare X cu repartiie gamma cu parametrul p.

Rezolvare
Momentul centrat de ordinul al treilea este

111

3 ( X ) ( x p ) 3 f ( x) dx x 3 f ( x) dx 3 p x 2 f ( x ) dx 3 p 2 xf ( x) dx


p 3 f ( x ) dx m3 3 pm2 3 p 2 m1 p3 p ( p 1)( p 2) 3 p 2 ( p 1)

3 p p 3 2 p,
3

iar momentul centrat de ordinul al patrulea este


4 ( X ) ( x p ) 4 f ( x ) dx x 4 f ( x) dx 4 p x 3 f ( x ) dx 6 p 2 x 2 f ( x) dx


4 p 3 xf ( x ) dx p 4 f ( x) dx m4 4 pm3 6 p 2 m2 4 p 3 m1 p 4

p ( p 1)( p 2)( p 3) 4 p 2 ( p 1)( p 2) 6 p 3 ( p 1) 4 p 4 p 4 3 p 2 6 p.

4.5. Legea beta


Definiia 4.5.1. Variabila aleatoare X urmeaz legea beta (X are repartiie beta)
cu parametrii p i q ( p, q 0) dac densitatea sa de probabilitate (repartiie)
este funcia

1
x p 1 (1 x) q 1 , x (0,1),
f ( x) B ( p, q ) (4.5.1)
0, x (0,1),

1
unde B ( p, q ) x p 1 (1 x) q 1 dx , p, q 0 este integrala lui Euler de primul tip
0
sau funcia beta a lui Euler.

Funcia f din relaia (4.5.1) este o densitate de probabilitate, deoarece


f ( x) 0, x R i

1 1
f ( x ) dx x p1 (1 x ) q1 dx 1.
B ( p, q) 0

n propoziia urmtoare vom prezenta cteva proprieti ale funciei B (pentru


demonstraiile lor vezi [21]).

1
Propoziia 4.5.2. Integrala lui Euler B ( p, q ) x p 1 (1 x) q 1 dx , p, q R
0
verific urmtoarele proprieti
a) B( p, q ) este convergent pentru p>0 i q>0, i n rest este divergent;

112
b) B( p, q ) B(q, p ), p, q 0;

p 1
c) B( p, q ) B( p 1, q ), p 1, q 0;
p q 1

q 1
d) B( p, q ) B( p, q 1), p 0, q 1;
p q 1

( p 1)(q 1)
e) B( p, q ) B( p 1, q 1), p 1, q 1;
( p q 1)( p q 2)

(n 1)!
f) B( p, n) B(n, p) , n N * , p 0;
p ( p 1)( p n 1)

(m 1)!(n 1)!
g) B(m, n) , m, n N * ;
(m n 1)!

h) B( p 1, q ) B( p, q 1) B( p, q), p, q 0;

i) qB( p 1, q) pB( p, q 1), p, q 0;

t p 1
j) B ( p, q ) dt , p, q 0;
0 (1 t ) p q

( p ) ( q )
k) B( p, q ) , p, q 0;
( p q )


l) B( p,1 p) ( p) (1 p ) , p (0,1).
sin( p )

Teorema 4.5.3. Dac variabila aleatoare X are repartiie beta cu parametrii p i


q ( p, q 0) , atunci momentele iniiale de ordinul k sunt

p ( p 1) ( p k 1)
mk ( X ) , k N *. (4.5.2)
( p q)( p q 1)( p q k 1)

Demonstraie
Momentul iniial de ordinul k este

113
1 1 B ( k p, q )
mk ( X ) x k f ( x) dx x k p 1 (1 x) q 1 dx
B ( p, q ) 0 B ( p, q)
k p 1 B(k p 1, q) (k p 1) ( p 1) p B( p, q )

p q k 1 B ( p, q) ( p q k 1)( p q) B( p, q )
p ( p 1) ( p k 1)
,
( p q )( p q 1) ( p q k 1)

conform Propoziiei 4.5.2, c). q.e.d.

Din relaia (4.5.2) deducem c media i dispersia variabilei X cu repartiie


beta cu parametrii p i q sunt

p pq
E ( X ) m1 ( X ) , Var ( X ) m2 ( X ) [m1 ( X )]2 2
.
pq ( p q) ( p q 1)
(4.5.3)

4.6. Legea 2 (Helmert-Pearson)

Definiia 4.6.1. Variabila aleatoare X urmeaz legea 2 (Helmert-Pearson) (X


are repartiie 2 ) cu parametrul n ( n N * ) dac densitatea sa de probabilitate
(repartiie) este funcia

n x
1 2
1
2
n x e , x 0,
2 n
f ( x) 2 (4.6.1)
2
0, x 0.

Parametrii n din Definiia 4.6.1 se mai numesc grade de libertate, astfel c o


s mai spunem c X are repartiie 2 cu n grade de libertate.
Funcia f din relaia (4.6.1) este o densitate de probabilitate deoarece
f ( x ) 0, x R i

n x
1
2
1
2
f ( x) dx n x e dx 1.
0
2 n
2
2

114
Pentru verificarea relaiei de mai sus , facem n integrala dat schimbarea de
variabil x/2=y, de unde rezult dx=2dy; dac x 0 atunci y 0 , iar dac
x atunci y . Obinem astfel
n
n
1 n
1 22 1

f ( x) dx
n
n 0 2 y 2
0
e y 2 dy n
n
y 2 e y dy
2 2
2 2
2 2
1 n
1.
n 2

2
n Figura 4.6.1 sunt reprezentate grafic funciile f pentru diverse valori ale
parametrului n.

Figura 4.6.1

Teorema 4.6.2. Dac variabila aleatoare X are repartiie 2 cu n grade de


libertate, atunci momentele iniiale de ordinul k sunt

mk ( X ) n(n 2) (n 2k 2), k N * . (4.6.2)

Demonstraie
Momentul iniial de ordinul k este

n x
1 k 1
mk ( X ) x k f ( x ) dx n x2 e 2
dx.
0
2n
2
2

115
Cu aceeai schimbare de variabil de mai sus folosit pentru calculul integralei

f ( x ) dx , obinem

n
n k n
1
2
k 1
y 22
2
k 1
y
mk ( X ) n (2 y) e 2 dy n n 0 y e dy
n 0
2
2 2 2
2 2
n
2 k k
2 2 k n n 1 n k 1 n(n 2) (n 2k 2).

n 2 2 2

2
q.e.d.

Din relaia (4.6.2) deducem c media i dispersia variabilei X cu repartiie


2
cu n grade de libertate sunt

E ( X ) m1 ( X ) n, Var ( X ) m2 ( X ) [m1 ( X )]2 2n. (4.6.3)

Definiia 4.6.3. Variabila aleatoare X urmeaz legea 2 generalizat (X are


repartiie 2 generalizat ) cu parametrii n i ( n N * , 0 )
dac densitatea sa de probabilitate (repartiie) este funcia

n x
1 1 2
2 2
x e , x 0,
n n
f ( x) ( 2 ) (4.6.4)
2
0, x 0.

ntr-un mod asemntor cu demonstraia Teoremei 4.6.2 se arat urmtoarea


teorem.

Teorema 4.6.4. Dac variabila aleatoare X are repartiie 2 generalizat cu


parametrii n i ( n N * , 0 ), atunci momentele iniiale de ordinul k sunt

mk ( X ) n(n 2) (n 2k 2) 2 k , k N * , (4.6.5)

deci media i dispersia sa sunt

E ( X ) m1 ( X ) n 2 , Var ( X ) m2 ( X ) [m1 ( X )]2 2n 4 . (4.6.6)

116
Propoziia 4.6.5. Dac variabila aleatoare X are repartiie 2 generalizat cu
parametrii n i ( n N * , 0 ), atunci funcia sa caracteristic este

n

(t ) (1 2it 2 ) 2 , t R . (4.6.7)

Demonstraie
Folosind formula din demonstaia Propoziiei 4.4.6, obinem


(it ) k
(it ) k nn n
(t ) mk (2 2 ) k 1 k 1
k 0 k! k 0 k! 2 2 2
nn n q.e.d.
1 k 1 n
2 2 2 (1 2it 2 ) 2 , t R.
(2it 2 ) k
k 0 k!

Din relaia (4.6.7) pentru 1, deducem c funcia caracteristic a unei


variabile X cu rpartiie 2 cu n grade de libertate este

n

(t ) 1 2it 2 , t R . (4.6.8)

Legturile dintre repartiia 2 i repartiia normal sunt prezentate n


urmtoarele dou teoreme.

Teorema 4.6.6. Dac variabila X n are repartiie 2 cu n grade de libertate


X n n
( n 1 ) atunci densitatea de probabilitate a variabilei tinde pentru
2n
n ctre densitatea de repartiie normal standard.
Teorema 4.6.7. Dac fiecare dintre variabilele aleatoare independente
X 1 , X 2 , , X n are repartiie normal standard, atunci variabila aleatoare
X X 12 X 22 X n2 are repartiie 2 cu n grade de libertate.

Propoziia 4.6.8. Dac variabilele aleatoare independente X i Y au repartiii


2 cu m, respectiv n grade de libertate, atunci X+Y are repartiie 2 cu m+n
grade de libertate.

Demonstraie
S notm cu f i g densitile de probabilitate ale variabilelor X i Y, adic avem

117
m x n x
1 2
1
2
1 2
1
2
m x e , x 0, n x e , x 0,
2 m 2 n
f ( x) 2 g ( x ) 2
2 2
0, x 0, 0, x 0.

Atunci densitatea de probabilitate a variabilei X+Y este


h( x) f ( x y ) g ( y ) dy.

Folosind un raionament asemntor celui ntlnit n demonstraia Propoziiei


4.4.7, deducem c h( x) 0, x 0 , iar pentru x 0 obinem

m x y n y
x 1 1 1 1
h( x ) m
( x y) 2 e 2
n
y2 e 2
dy
0
m 2 n
2
2 2
2 2
x
m n
2
e x
2
1
2
1
mn ( x y) y dy.
0
2 m n
2
2 2

Notm y=tx, de unde rezult dy=xdt; dac y 0 atunci t 0 , iar dac


y x atunci t 1. Obinem

x
m n
2
e 1 1 1
h( x) mn ( x tx ) 2 (tx) 2 x dt
0
2 m n
2
2 2
x x m n
mn m n 1
2
e 2
1 1
2
1
2
1 e 2x 2 m n
mn
x (1 t ) t dt m n B ,
2 m n 0
m n 2 2
2 2 2
2 2 2 2
m n x
1 2
1
2
mn x e , x 0.
2 mn
2
2

Deducem c X+Y are repartiie 2 cu m+n grade de libertate.

118
Concluzia acestei propoziii o putem obine mai direct folosind funciile
caracteristice. Fie 1 i 2 funciile caracteristice ale variabilelor X i Y, i
anume

m n

1 (t ) 1 2it 2 , 2 (t ) (1 2it ) 2 , t R .

Atunci funcia caracteristic a variabilei aleatoare X+Y este

mn

(t ) 1 (t ) 2 (t ) 1 2it 2 , t R.

Deducem din relaia obinut c X+Y are repartiie 2 cu m+n grade de libertate.
q.e.d.

4.7. Legea Student (t). Legea Cauchy


Definiia 4.7.1. Variabila aleatoare X urmeaz legea Student (t) (X are
repartiie Student) cu parametrul n ( n N * ) dac densitatea sa de probabilitate
(repartiie) este funcia

n 1 n 1
2 2
2 x
f ( x) 1 , x R. (4.7.1)

n n
n
2

Parametrii n din Definiia 4.7.1 se mai numesc grade de libertate, astfel c o


s mai spunem c X are repartiie Student cu n grade de libertate.
Funcia f din relaia (4.7.1) este o densitate de probabilitate deoarece


f ( x ) 0, x R i f ( x ) dx 1.

Pentru a verifica ultima relaie, avem

n 1 n 1 n 1 n 1
2 2 2
2 x 2 x2 2
f ( x) dx 1 dx 1 dx.
n n n 0 n
n n
2 2

119
n ultima integrala de mai sus facem schimbarea de variabil x 2 / n y, x 0, de
unde rezult

n
dx dy.
2 y

Intervalul [0, ) se transform n intervalul [0, ) i astfel obinem

n 1 n 1
1 / 2

2 y 2 1 n
f ( x) dx n 0 n 1

dy B ,
n 2 2
(1 y ) 2 2
2 2
n 1 1 n

2 2 2
1.
n n 1

2 2

n relaiile de mai sus am folosit proprietile j) i k) ale funciei B din Propoziia


4.5.2 i proprietatea d) a funciei din Propoziia 4.4.2.

Teorema 4.7.2. Dac variabila aleatoare X are repartiie Student cu n grade de


libertate, atunci momentele iniiale de ordinul k sunt

m2 k 1 ( X ) 0, 2k 1 n,
n k (2k 1)!! (4.7.2)
m2 k ( X ) , 2 k n, k N * .
(n 2)(n 4)(n 2k )

Demonstraie
Pentru 2k 1 n , momentele de ordin impar sunt nule. ntr-adevr

n 1 n 1
2 2
2 x
m2 k 1 ( X )

x 2 k 1 1 dx 0, (4.7.3)
n
n
n
2

deoarece funcia f este impar (integrala de mai sus este convergent). Dac
2k 1 n integrala din (4.7.3) este divergent, deci X nu are momente iniiale de
ordinul 2k 1.
Pentru momentul de ordin par m2 k ( X ), cu 2k n avem

120
n 1 n 1
2 2 2

2 x 2 k 1 x

m2 k ( X ) dx. (4.7.4)
n 0
n
n
2

Pentru calculul ultimei integrale folosim aceeai schimbare de variabil ca cea



folosit mai sus pentru verificarea relaiei f ( x) dx 1. Notm

n
x 2 / n y, x 0, de unde rezult dx dy. Intervalul [0, ) se transform n
2 y
intervalul [0, ) i astfel obinem

n 1 n 1
2 n 1 n k 1 n 1
2 (ny ) k (1 y ) 2 n 2 y k 2 (1 y ) 2 dy
m2 k ( X ) dy
n 0 2 y n 0
n
2 2
n 1
n k 1 1 n
k k
2 k 2 1
y (1 y ) 2 2 dy.
n 0

2

Folosind proprietile funciei B din Propoziia 4.5.2 deducem din relaia de


mai sus

n 1 n 1 1 n
n k n k k k
m2 k ( X ) 2 B k 1 , n k 2 2 2

n 2 2 n n 1

2 2 2
1 n 1 1 n
k
k k k k k k
n 2 2 n 2 2 2

n n n
1 1
2 2 2

121
1 3 3 n
k k k k k
n 2 2 2 2

n n n
1 2 2
2 2 2
1 3 1 1 n
k k k k
n 2 2 2 2 2 n k (2k 1)!!
.
n 1 n 2 n k n k (n 2)(n 4)(n 2k )

2 2 2 2

Dac 2k n integrala din relaia (4.7.4) este divergent, deci variabila X nu are
momente iniiale de ordinul 2k. q.e.d.

Din relaiile (4.7.2) deducem c dac n>1 atunci media variabilei X este
n
E ( X ) 0 , iar dac n>2 atunci dispersia variabilei X este Var ( X ) .
n2
Legturile dintre repartiia Student i repartiia normal sunt prezentate n
urmtoarele dou teoreme.

Teorema 4.7.3. Dac f n este densitatea de probabilitate a unei repartiii


Student cu n grade de libertate atunci

lim f n ( x) f ( x; 0,1), x R,
n

unde f (x; 0,1) este densitatea de repartiie normal standard.

Teorema 4.7.4. Dac fiecare dintre variabilele aleatoare independente


X 1 , X 2 , , X n1 are repartiie normal cu parametrii m 0 i , atunci
variabila aleatoare

X n1
X n
X 12 X n2

are repartiie Student cu n grade de libertate.

Pentru n 1 legea (repartiia) Student se mai numete legea (repartiia)


Cauchy. O variabil aleatoare X cu repartiie Cauchy are densitatea de
probabilitate funcia

1
f ( x) , x R.
(1 x 2 )
122
Din observaiile fcute dup demonstaia Teoremei 4.7.2 , deducem c variabila
aleatoare X cu repartiia Cauchy nu are nici valoare medie i nici dispersie.

4.8. Legea Snedecor. Legea Fisher


Definiia 4.8.1. Variabila aleatoare X urmeaz legea Snedecor (X are repartiie
Snedecor) cu parametrii n1 i n2 , (n1 , n2 N * ) dac densitatea sa de
probabilitate (repartiie) este funcia

n n2
n
n1
1 n
n1 n2
2
2 21 1 n1 2
1 x 1 x , x 0,
f ( x) n2 n1 n2 n2 (4.8.1)

2 2

0, x 0.

Parametrii n1 i n2 din Definiia 4.8.1 se mai numesc grade de libertate,


astfel c o s mai spunem c X are repartiie Snedecor cu n1 i n2 grade de
libertate.
Funcia f din relaia (4.8.1) este o densitate de probabilitate, deoarece

f ( x ) 0, x R i f ( x ) dx 1. Pentru a verifica ultima relaie, avem

n n2
n1
1 n
n1 n2
n 2
2 21 1 n1 2

f ( x ) dx 1 x 1 x dx.

n2 n1 n2 0 n2

2 2

n ultima integral de mai sus facem schimbarea de variabil n1 x / n2 y. Astfel


obinem

123
n n2
1
n1
n1
1
n1 2
2 n2 y 2 1 2 n2
n n

f ( x ) dx
n
0 n
1 y 2 dy
n n
2 1 2 1 n1
2 2
n n2 n n2
1 n1 n1 n2 1
2 2 1
2 2 n1 n2
y (1 y ) dy B , 1.
n1 n2 0 n1 n2 2 2

2 2 2 2

Teorema 4.8.2. Dac variabila aleatoare X are repartiie Snedecor cu


parametrii n1 i n2 , (n1 , n2 N * ), atunci momentele iniiale de ordinul k sunt

n2k n1 (n1 2) (n1 2k 2)


mk ( X ) k
, 2k n2 , k N * . (4.8.2)
n1 (n2 2)(n2 4)(n2 2k )

Demonstaie
Variabila X are momente iniiale de ordinul k pentru 2k n2 . Avem

n n2
n1
1 n1
n1 n2
n1 2
2 x k 2 1 1 n1 2
mk ( X ) x k f ( x) dx n x dx.
0
n2 n n
1 2 2

2 2

Pentru calculul ultimei integrale folosim aceeai schimbare de variabil ca cea



folosit mai sus pentru verificarea relaiei f ( x) dx 1. Notm n1 x / n2 y

i obinem

n n2
n1
1 n
k 1 1 n n
n 2
2 n2 y 2 1 2 n
mk ( X ) 1 (1 y ) 2 2 dy
n2 n n 0 n n1
1 2 1
2 2

124
n n2
k 1 n1 n1 n2
n 2 y k 2 1 (1 y ) 2 dy
2
n1 n n 0
1 2
2 2
n n2
k 1
n 2 B k n1 , n2 k
2
n1 n1 n2 2 2

2
2
n n2 n n
k 1 k 1 2 k
n 2 2 2
2
n1 n
n n n 2
1 2 1
2 2 2
n n n
k k 1 1 1 k 1 2 k
n 2 2 2
2
n1 n n n
1 2 1 2 1
2 2 2
n n n n n
k k 1 1 k 1 2 1 1 2 k
n 2 2 2 2 2
2
n1 n n n n n
1 2 1 2 2 2 k 2 k
2 2 2 2 2
k
n n1 (n1 2) (n1 2k 2)
2 .
n1 (n2 2)(n2 4)(n2 2k )

q.e.d.

Din relaia (4.8.3) deducem c pentru n2 2 media variabilei X este


n2
E( X ) , iar pentru n2 4 dispersia variabilei X este
n2 2

2n22 (n1 n2 2)
Var ( X ) .
n1 (n2 4)(n2 2) 2

Legtura dintre repartiia normal i repartiia Snedecor este dat n


urmtoarea teorem.

Teorema 4.8.3. Dac variabilele aleatoare independente X 1 , X 2 ,..., X n1 , X n1 1 ,...


X n1 n2 urmeaz legea normal cu parametrii 0 i atunci variabila aleatoare
125
n2 X 12 X n21
X 2
n1 X n1 1 X n21 n2

are repartiie Snedecor cu parametrii n1 i n2 .

Definiia 4.8.4. Variabila aleatoare X urmeaz legea Fisher (X are repartiie


Fisher) cu parametrii n1 i n2 , (n1 , n2 N * ) dac densitatea sa de probabilitate
(repartiie) este funcia

n n2
n1
1 n n
1 2
n 2
2 e n1x 1 n1 e 2 x 2 ,
f ( x) 2 1 n x R. (4.8.3)
n2 n n
1 2 2
2
2

Teorema 4.8.5. Dac variabila aleatoare X are repartiie Snedecor cu


1
parametrii n1 i n2 , atunci variabila aleatoare Y ln X are o repartiie Fisher
2
cu parametrii n1 i n2 .

Demonstraie
Dac notm funcia de repartiie X cu F, atunci funcia de repartiie G a variabilei
Y este

1
G ( x) P(Y x) P ln X x P (ln X 2 x)
2
2x 2x
P( X e ) F (e ), x R.

Deci densitatea de probabilitate a variabilei Y este

g ( x ) G ' ( x) 2e 2 x F ' (e 2 x ) 2e 2 x f (e 2 x )
n n2
n1
1 n n
1 2
n
2e n1x 1
2
2 1 n1 e 2 x 2 , x R. q.e.d.
n2 n n n2
1 2
2
2

126
4.9. Legea Weibull. Legea exponenial
Definiia 4.9.1. Variabila aleatoare X urmeaz legea Weibull (X are
repartiieWeibull) cu parametrii i ( 0, 0) dac densitatea sa de
probabilitate (repartiie) este funcia

x 1e x , x 0,
f ( x) (4.9.1)
0, x 0.

Funcia f din (4.9.1) este o densitate de probabilitate, deoarece



f ( x) 0, x R i f ( x ) dx x 1e x dx 1. ntr-devr pentru
0

verificarea ultimei relaii facem schimbarea de variabil x y , de unde


1
1 1
rezult x ( y / )1 / i dx 1
y
dy . Atunci


1
1
y
y 1 1
f ( x ) dx e 1
y
dy e y dy 1.
0

0

Teorema 4.9.2. Dac variabila aleatoare X are repartiie Weibull cu


parametrii i ( 0, 0) , atunci valoarea medie i dispersia sa sunt

1 2

1 2 2 1
E( X ) 1 , Var ( X ) 1 1. (4.9.2)

Demonstraie
Folosind schimbarea de variabil de mai sus, obinem pentru media variabilei X

1

x
y y 1 1
E ( X ) x e dx e 1 y dy
0 0

1 1
1 1
1 y e y dy 1.
0

Pentru dispersia lui X calculm mai nti media lui X 2 . Avem

1
1 2
y 1 1 2
E ( X 2 ) x 1e x dx e y 1
y dy 1.
0 0


127
Atunci dispersia lui X este
2


2 2 1
Var ( X ) 1 1 .

q.e.d.

Pentru 1 legea (repartiia) Weibull se mai numete legea exponenial


(repartiia exponenial) de parametru . Deci densitatea de probabilitate a
unei variabile aleatoare X cu repartiie exponenial cu parametrul este

e x , x 0,
f ( x)
0, x 0.

Din relaia (4.9.2) rezult c media i dispersia unei variabile aleatoare X cu


repartiie exponenial cu parametrul sunt
1 1 1 1
E ( X ) (2) , Var ( X ) 2 [ (3) 2 (2)] 2 ,

deoarece (2) 1, (3) 2.

Observaia 4.9.3. Repartiia exponenial cu parametrul este o repartiie


gamma generalizat cu parametrii p 1 i .

Propoziia 4.9.4. Dac variabila aleatoare X are repartiie exponenial cu


parametrul , atunci funcia sa caracteristic este
1
it
(t ) 1 , t R . (4.9.3)

Demonstraie
Din Observaia 4.9.3 i relaia (4.4.7) din Propoziia 4.4.6, deducem c funcia
caracteristic a variabilei X este dat de expresia din (4.9.3).
Funcia caracteristic se poate calcula i direct folosind formula din
definiia sa. Avem


(t ) E e itX e itx f ( x) dx e itx e x dx e ( it ) x dx
0 0

e x [cos(tx) i sin( tx)] dx e x cos(tx ) dx i e x sin( tx) dx.
0
0
0

I1 I2

Pentru I1 obinem

128
1 x ' 1
I1 e x cos(tx) dx
0 0
e
cos(tx) dx e x cos(tx) 0

t 1 t 1 t
0 0
'

e x sin( tx) dx 2 e x sin( tx ) dx 2 e x sin( tx)


0

2
1 t
t e x cos(tx) dx 2 e x cos(tx) dx.
0 0

1 t2
Rezult astfel relaia I1 2 I1 , de unde obinem c I1 2 2 . Pentru
t
t
I 2 din relaiile de mai sus deducem I 2 2 2 . Obinem astfel pentru (t )
t
1
it
expresia (t ) 1 , t R. q.e.d.

Aplicaia 4.9.5. Fie variabilele independente X 1 i X 2 cu repartiii


exponeniale cu parametrii 1 , respectiv 2 . S se determine densitatea de
probabilitate a variabilei X 1 X 2 . S se generalizeze apoi rezultatul obinut la
cazul a n variabile aleatoare independente cu repartiii exponeniale cu acelai
parametru .

Rezolvare
S notm cu f1 i f 2 densitile de probabilitate ale variabilelor X 1 i
X 2 , adic

e 1 x , x 0, e 2 x , x 0,
f 1 ( x) 1 f 2 ( x) 2
0, x 0, 0, x 0.

Dac 1 2 atunci densitatea de probabilitate f a variabilei X 1 X 2 este 0


pentru x 0, iar pentru x 0 avem

x
f ( x) f1 ( x y ) f 2 ( y ) dy 1e 1 ( x y ) 2 e 2 y dy
0
x 12 1 x ( 1 2 ) y 1 2 2 x 1x
12 e 1x e ( 1 2 ) y dy
0 1 2
e e x
0
1 2
e e .

12

e 2 x e 1 x , x 0,
Deci funcia f are forma f ( x) 1 2
0, x 0.

129
Dac 1 2 atunci f ( x) 0, x 0, iar pentru x 0 obinem

x x
f ( x) e ( x y ) e y dy 2 e x dy 2 xe x .
0 0

Deci densitatea de probabilitate a variabilei X 1 X 2 este

2 xe x , x 0,
f ( x)
0, x 0.

Pentru trei variabile aleatoare independente X 1 , X 2 , X 3 cu repartiii


exponeniale cu parametrul , densitatea de probabilitate a variabilei
X 1 X 2 X 3 este h( x) 0, x 0 i pentru x 0 avem

x x 3 2 x
h( x) 2 ( x y )e ( x y ) e y dy 3 e x ( x y ) dy x e .
0 0 2

Deci

3 2 x
x e , x 0,
h( x) 2
0, x 0.

Prin inducie matematic se arat c pentru variabilele aleatoare
independente X 1 , X 2 ,..., X n cu repartiii exponeniale cu parametrul ,
densitatea de probabilitate a variabilei X X 1 X 2 X n este funcia

n
x n1e x , x 0,
k ( x ) (n 1)!
0, x 0.

Rezult c variabila X are o repartiie gamma generalizat cu parametrii n i .

130
Capitolul 5

Convergena variabilelor aleatoare

5.1.Convergena aproape sigur i convergena n probabilitate

Fie (,K,P) un spaiu probabilizat i ( X n )n un ir de variabile aleatoare. Fie


de asemenea X o alt variabil aleatoare. Ce nseamn c X n tinde la X ?
Desigur, variabilele aleatoare sunt funcii Xn: . Pentru funcii se tie
deja ce nseamn c X n converge la X : c X n () X() pentru orice .
u
Mai exist i noiunea de convergen uniform: X n X dac sup
X n () X() 0.
n teoria probabilitilor aceste dou tipuri de convergen nu prea sunt de
folos. Situaia tipic ntlnit n practica statistic este urmtoarea: se face un
experiment cu rezultatele posibile r1,,rk . Rezultatul obinut la al n-ulea
experiment este X n .
(De exemplu se arunc un zar despre care nu tim dac este corect sau
falsificat; n acest caz rezultatele sunt 1,2,3,4,5,6)
Nu avem cum s prezicem rezultatul X n , dar putem spera s aproximm
probabilitile pi de apariie a rezultatului ri, dac facem unele ipoteze
acceptabile. De exemplu, dac acceptm c toate variabilele aleatoare X n au
aceeai repartiie, F. Am putea numra procentajele fi de apariie a rezultatului ri
i spera c ele nu difer mult de adevratele probabiliti pi.

De altfel, de aici a i pornit teoria probabilitilor.

n cazul zarului nostru, am putea s l aruncm de 6n de ori de exemplu i


s vedem dac frecvenele obinute difer mult de n. Dac da, (deocamdat nu
tim ce nseamn prea mult, se va vedea la capitolul privind intervalele de
ncredere) am putea spera c dac o s mrim numrul de aruncri ale zarului ne
vom apropia din ce n ce mai mult de adevratele valori pi P( X ri ) .
S formalizm puin contextual.
Avem un ir de variabile aleatoare ( X n ) n care sunt identic repartizate cu
r1 r2 ... rk
repartiia necunoscut F . Vrem s gsim numerele
p1 p2 ... p k

131
j n : X j ri
p1 ,..., p k . Pentru aceasta calculm valorile Yn,i i ne gndim
n
c, poate, Yn,i converge la pi dac n .
Aceasta este problema de baz.
Nu ne putem atepta ca Yn,i s convearg la pi n sensul obinuit al
cuvntului, adic s aib loc convergena pentru orice scenariu : de
exemplu, s-ar putea ca rezultatul ri s apar mereu sau nici mcar s nu apar,
dei pi 0 .
Dar poate c Yn,i converge la pi n majoritatea covritoare a cazurilor?
ntr-adevr, aa se ntmpl dac se mai adaug nite ipoteze. Aceasta este
legea numerelor mari.
Mai nti s lmurim ce nseamn n majoritatea covritoare a cazurilor:
nseamn aproape sigur.

Definiia 5.1.1. Spunem c ( X n ) n converge la X P-aproape sigur i scriem


a . s.
X n P X (sau Xn X (mod P)) dac
P(lim sup X n lim inf X n X ) 1 . Dac P(lim sup X n lim inf X n ) 1 ,
spunem c ( X n ) n este un ir P- convergent aproape sigur.

Observaia 5.1.2. Dac probabilitatea P se subnelege, putem renuna la litera


a. s .
P i scriem doar X n X

Observaia 5.1.3. Evident c dac X n converge la X punctual - n sensul


a. s .
obinuit al cuvntului - atunci X n X . La fel de evident este c diferena
ntre convergena punctual i cea aproape sigur poate fi foarte mare.

Observaia 5.1.4. Tot evident este c limita aproape sigur a unui ir de


variabile aleatoare nu este unic, ci numai unic aproape sigur. ntr-adevr,
a. s .
dac X n X i X Y (a.s.), atunci putem la fel de bine s spunem c
a .s .
X n Y.

a .s . a .s
Observaia 5.1.5. La fel de evident este c X n X X n X 0,
deoarece
P(lim sup X n lim inf X n X ) P(lim sup( X n X ) lim inf( X n X ) 0) .

Exemplu 5.1.6. Fie = , K = B(), Xn() = sin(n),


0
P ( 0 ) . irul X n este divergent, singurele puncte n care el
.5 .5
132
a .s.
converge sunt cele de forma = k. Totui, X n P 0, deoarece
P( X n 0) 1 . Sau, dac schimbm puin i lum X n () sin n () , acesta
converge la 0 cu excepia punctelor de forma /2 + k. Dac lum, de data
/ 2 5 / 2 a . s.
aceasta, P ( / 2 5 / 2 ) , atunci X n P 1 .
.5 .5

Exemplul 5.1.7. Fie = [0,1), K = B([0,1)), P = Uniform(0,1) ( = msura


Lebesgue pe !) i (a n ) n1 un ir strict cresctor de numere pozitive cu
proprietatea c lim a n dar lim( a n1 a n ) 0 i, n plus, a n 1 a n 1 . De
exemplu putem lua a n ln n sau a n n .
Fie d ( x) x [ x] partea zecimal a lui x, An = d([an, an+1)) := d(x) : x
[an,an+1) i Xn = 1 An . Observm c P(An) = an+1 an 0. (De exemplu, dac
a n ln n , atunci A1 [0, ln 2], A2 [ln 2,1) [0, ln 3 1), A3 [ln 3 1, ln 4 1),
etc. ). A4 [ln 4 1,1) [0, ln 5 2) . Atunci limsup An = i liminf An = deci
lim sup X n 1lim sup An 1 i lim inf X n 1 = 0.
(ntr-adevr,

limsup An d [ank , ank 1) d [ank , ank1 ) d[an , )
iar

n k n k n

lim inf An d [a n k , a n k 1 ) = )
n k
Exemplul 5.1.7 este unul extrem, n care limita superioar i cea
inferioar nu coincid nicieri.

Exemplul 5.1.8. Fie, pe spaiu probabilizat de la exemplul anterior,


X n n1 1 . Atunci X n converge evident la 0, deci converge i a.s.
0,
n

Cum putem decide dac X n X ? n cazul cel mai simplu, un rspuns este dat
de

Propoziia 5.1.9. Fie (,K,P) un spaiu probabilizat i ( An ) n un ir de


evenimente din K. Presupunem c seria P A n este convergent. Atunci

1A a
.s.
0 .
n

Demonstraie

133
Fie Bn An An1 ... . Cum P( Bn ) P A
k 0
nk i seria P A
n este

convergent, P( Bn ) 0 . Dar irul de mulimi ( Bn ) n este monoton



descresctor, deci 1 1B cu B = Bn i P( B ) lim P ( Bn ) 0 .
Bn n 1

Dar limsup 1A = 1lim sup A 1 1 B 1B de unde 0 lim inf 1A


n n An k n n
n k

limsup 1 A 1B . Cum P(limsup 1A liminf 1A ) P(B) = 0, urmeaz c irul


n n n

(1 A ) n converge aproape sigur. Putem lua ca limit a sa, X, orice variabil


n

aleatoare X 1 A unde A este o mulime neglijabil. Cel mai simplu e s spunem


c 1A 0. .q.e.d
n

a.s.
De aici rezult un criteriu important cu care putem verifica dac X n X

Propoziia 5.1.10. Fie ( X n ) n un ir de variabile aleatoare. Presupunem c


pentru orice > 0 seria P| X n | este convergent. Atunci X n
a.s.
0.

Demonstraie
Fie B = : X n () nu converge la 0. Atunci B = B N unde
N

B N = : X n ()> 1/N de o infinitate de ori. Cum irul de mulimi ( B N ) N


este cresctor, P(B) = lim P( B N ) aplicm din nou proprietatea de continuitate
monoton a probabilitii. Dar seria P| X n | 1 / N este convergent, deci

P( B N ) = 0 N de unde P(B) = 0 q.e.d.

Observaia 5.1.11. Condiia din propoziia de mai sus nu este dect suficient,
nu i necesar. De exemlu dac avem un ir descresctor de mulimi A1A2......
cu P(An) = 1/n, atunci 1A este un ir descresctor, deci are o limit de forma 1 A
n

cu A = An . Deci 1A 1A. Cum P(A) = 0, putem scrie, conform observaiei 3, c


n n

a.s.
1 0.

An

Observaia 5.1.12. Convergenele obinuite sunt date de o distan. Adic


putem scrie c Xn X > 0 exist n astfel ca n n d(Xn,X) ..
Aceste convergene au urmtoarea proprietate: dac din orice subir al lui
( X n ) se poate extrage un sub-subir care este convergent i limita sa este
aceeai, s zicem X, atunci X n X . nr-adevr, dac lim X n X , atunci

134
exist un > 0 i un subir (k n ) n astfel ca d( X k n , X ) , deci din subirul
( X kn )n nu putem extrage nici un sub-subir care s tind la . Spunem c aceste
convergene sunt topologice. Convergena aproape sigur nu este topologic.
ntr-adevr, dac ne uitm la exemplul extrem 1.1.7, n care irul nu are absolut
nici o limit aproape sigur, vedem c el are proprietatea ciudat c din orice
subir al su se poate extrage un sub-subir care converge la 0. Motivul este c
P( An ) 0 . Altfel zis, irul 1An converge totui la 0, dar n probabilitate.

Definiia 5.1.13. Spunem c irul de variabile aleatoare ( X n ) converge n


P
probabilitate la X (i scriem Xn X) dac lim n P(| X n X | ) 0 0.

Din definiie rezult imediat c un ir de forma Xn = 1A converge n


n

probabilitate la 0 dac i numai dac P(An) 0. Acesta este cazul exemplului


1.1.7, care ne arat cum se prea poate ca un ir divergent aproape sigur s
convearg, totui, n probabilitate.
Convergena n probabilitate este una mult mai uor de manipulat, deoarece
ea este topologic: provine de la distan.

Propoziia 5.1.14. Fie X,Y dou variabile aleatoare. Definim d(X,Y) = E(X Y
1). Atunci funcia d este o semidistan pe spaiul L(,K) al tuturor variabilelor
P.
aleatoare i, n plus, avem echivalena Xn X d(X,Xn) 0

Demonstraie
Cum este evident c a,b 0 a1 + b1 (a+b) 1 , este clar c d
este o semidistan: d(X,Y) + d(Y,Z) = E[(X Y 1) + (Y Z 1)] E(X Z
1).
Pe de alt parte, dac notm cu Z variabila aleatoare X Y , observm c
dac (0,1), putem scrie E(Z 1) = E(Z 1; Z ) + E(Z 1; Z > ) P(Z ) +
P(Z > ) de unde
E(Z 1) + P(Z > ) (5.1.1)
Apoi E(Z 1; Z ) + E(Z 1; Z > ) E(Z 1; Z > ) E(; Z > ) de unde
E(Z 1) P(Z > ) (5.1.2)
Din (5.1.1) i (5.1.2) deducem cletele
P(Z > ) E(Z1) + P(Z > ) (5.1.3)
S presupunem acum c d(X,Xn) 0. Din prima inegalitate de la (5.1.3)
E | X X n | 1
deducem inegalitatea P(X Xn > ) , adic P(X Xn > )

d X , X n P
limn P(X Xn > ) = 0; aadar d(X,Xn) 0 Xn X

Reciproc, dac pentru orice > 0 avem c limn P(X Xn > ) = 0, din a doua
inegalitate de la (5.1.3) rezult c lim supn d(X,Xn) pentru orice >0. Dar
este arbitrar, deci lim d(X,Xn) = 0. q.e.d.
135
Un caz care implic imediat convergena n probabilitate este
convergena n Lp..

Definiia 5.1.15. Spunem c irul de variabile aleatoare (Xn)n converge n L p la


p
L
X (i notm acest lucru cu Xn X) dac limnXn Xp= 0.1

p
L P
Propoziia 5.1.16. Dac Xn X pentru un anumit p 1, atunci Xn
X.

Demonstraie
p
Z p 2
Pentru p [1,) folosim inegalitatea evident P(Z > ) : ntr-adevr,
p
p
X Xn
Lp p
dac Xn X, atunci limn P(X - Xn > ) limn = 0 . Iar dac p = ,
p
p
atunci este i mai evident: Xn LX Xn
L
X Xn
P
X. q.e.d.

P
Observaia 5.1.17. Totui, dac Xn X, din orice subir al su se poate
extrage un sub-subir care converge la X aproape sigur. ntr-adevr, aplicm
Propoziia 5.1.10 Prin procedeul diagonal, putem alege un subir (kn)n n aa fel
nct seria P| X kn | s fie convergent pentru orice >0.

Concluzie. ntre cele trei tipuri de convergen exist urmtoarele implicatii:


p
Xn LX Xn
L
X (p< ) Xn
P a.s.
X i Xn
X Xn
P
X
X kn a
.s.
X
Aadar, convergena n probabilitate este cea mai slab. Este de remarcat c
nu exist alte implicaii. Astfel:
-irul de la exemplul 5.1.3 converge peste tot, dar nu n L1, deci nici n Lp cu p
1
-irul de la exemplul 5.1.2 converge n probabilitate i n Lp pentru orice
1p<, dar nu a.s.
-Dac lum Xn = n1 1 pe = (0,1), P = Uniform(0,1), care converge
0,
n
punctual la 0, atunci pentru orice p>1 putem gsi un ir (n)n astfel ca Xn

1
Amintim c dac X este o variabil aleatoare, i p [1,] atunci
1

Xp := E | X | p
dac p < iar X := limp Xp = ess sup X . Inegalitatea
p

normelor ne spune c funcia p Xp este cresctoare.


2
Z
p
p

E | Z | p E | Z | p ; | Z | p P| Z |

136
p'
L
0 pentru p < p dar Xn nu converge nicieri dac p p. De exemplu n =
1
p
n .

5.2. Legi ale numerelor mari i aplicaii

5.2.1 Legea slab

Revenim la problema de baz enunat n paragraful precedent: putem spera


s gsim repartiia unei variabile aleatoare empiric, adic fcnd observaii
asupra ei?
Aa pus fiind, problema nu are sens.
Pentru noi niciodat nu putem face mai multe observaii asupra unei variabile
aleatoare, ci numai una. Dac aruncm un zar de n ori, noi nu observm o
variabil aleatoare, ci un ir de variabile aleatoare X1,...,Xn. Putem accepta c
aceste variabile aleatoare au aceeai repartiie.
Atunci problema capt sens: avem un ir de variabile aleatoare (Xn)n care
sunt identic repartizate i am dori s i aproximm repartiia, pe baza
observaiilor fcute asupra lui.
Nu cumva am putea s i calculm, aproximativ, media? n definitiv = EXj
nu se numete degeaba medie!
Rspunsul este: uneori, da.

Propoziia 5.2.1. Legea slab a numerelor mari.(WLLN)3


Fie (Xn)n un ir de variabile aleatoare identic repartizate i necorelate din L2
(adic avnd i moment de ordin 2). Fie = EXj , 2 = Var(Xj) i fie
X 1 X 2 ... X n P
Xn media empiric4. Atunci X n .
n
0 1
j n : X j 1
Ca un caz particular, dac Xn , atunci X n
1 p p n
P
p. Acum mediile X n se noteaz cu fn i se numesc frecvene relative.

Demonstraie
Y1 Y2 ... Yn
Centrm variabilele: fie Yn = Xn - . Atunci X n - = .
n
1
Urmeaz X n - 22 = E( X n - )2 = EYiY j . Dar EYiYj = cov(Xi,Xj) = 0
n 2 1i, j n

3
abreviere internaional: Weak Law of Large Numbers
4
Se mai numete i media de selecie
137
2 1 2 n 2 2 L2
dac i j . Deci E( X n - ) = EYi . Concluzie: X n deci,
n 2 1i n n2 n
P
conform cu Propoziia 1.1.16, X n . q.e.d.

Rezultatul nu mai rmne adevrat dac renunm la ipoteza necorelrii. De


exemplu, dac X i Y sunt dou variabile aleatoare cu aceeai repartiie i pe
baza lor construim irul Xn = X dac n este par i Xn = Y dac este impar, atunci
X Y
X n va converge peste tot la , care nu numai c nu coincide cu media, dar
2
mai este i variabil aleatoare.
Se pot da exemple de iruri de variabile aleatoare identic repartizate pentru
care media empiric nu converge nicieri. De exemplu se iau doua variabile
aleatoare X i Y si cu ajutorul lor se construieste un sir format doar din X i Y
care nu are limit Cesaro.

Observaia 5.2.2. Legea slab se mai numete Teorema lui Bernoulli. Ea a dat
primul rspuns la ntrebarea: putem aproxima empiric probabilitile? Forma
sa verbal repetat de sute de ani este: Frecvenele relative converg n
probabilitate la adevrata probabilitate.

Acest rezultat nu este satisfctor. De aceea teorema lui Bernoulli se numete


Legea slab. Faptul c X n converge n probabilitate la nu nseamn de loc c
irul X n () converge la pentru toate scenariile , nici mcar c aa ceva se
ntmpl pentru marea lor majoritate. E suficient s privim exemplul 5.1.7. E
adevrat c el conine un subir care converge la (observaia 5.1.17) dar asta ne
ajut prea puin.
Am dori un rezultat tare care s ne asigure c X n converge la aproape
sigur. Dac eliminm ipoteza ca natura ne joac o fars urt, atunci putem fi
siguri c dac tot repetm un experiment n anumite condiii, ne vom apropia
orict de media cea adevrat.5
Chiar aa se i ntmpl.

5.2.2 Legea tare

Preul este s nlocuim ipoteza ca variabilele Xn sunt necorelate cu ipoteza


mult mai tare c ele sunt independente.

5
Aici e de fapt o problem de filosofie a satisticii: decretm c evenimentele de probabilitate 0
nu se ntmpl. E o discuie fascinant, dar mai complicat.
138
Fie atunci X: vectorul cu componentele X = (X1,X2,....). Componentele
sale Xj sunt proieciile prj(X). n loc s scriem X n , scriem
1
( pr1 ( X ) ... prn ( X )) . Avantajul este c acum avem o singur variabil,
n
anume X. Introducem i funcia t: definit prin
t(x1,x2,.....) = (x2,x3,....) prj(t(x)) = prj+1(x) j 1 (5.2.1)
care se numete shiftul canonic. Dac notm cu f: prima proiecie ( f =
pr1) atunci putem scrie
1
Xn=
n

f f t f t 2 ... f t n1 ( X ) (5.2.2)
unde prin tk nelegem tt...t, compunerea de n ori a lui t cu ea nsi.
Scrierea are avantajul c ne permite s ne concentrm asupra unui ir
Cesaro n care apar doar dou variabile: funcia f i shiftul t. Cu studiul unor
asemenea iruri se ocup o disciplin matematic numit teorie ergodic.
Ca s putem aplica rezultatele din teoria ergodic, ar trebui verificat c
shiftul invariaz msura.
Este vorba despre repartiia P1 = PX-1 a vectorului X. Ea este o
probabilitate pe spaiul produs (,B()) 6 n general nu tim s o calculm, dar
dac facem ipoteza suplimentar c variabilele Xn sunt independente i identic
repartizate, atunci este uor de vzut c P1 = F , unde F este repartiia comun a
variabilelor aleatoare Xn.7

Lema 5.2.3. Pe spaiul (,B()) avem c


(i) P1t -1 = P1
(ii) Dac A B() are proprietatea c t -1(A) = A, atunci P1(A) 0,1

Demonstraie
(i) Trebuie artat c P1(t-1(A)) = P1(A) A B(). Din motive elementare8 este
suficient s verificm acest lucru pentru un bloc de lungime n, A =
B1B2...Bn...

6
-algebra produs se definete ca fiind cea mai mic -algebr generat de blocuri. Un bloc de
lungime n este o mulime de forma B1B2...Bn....... unde mulimile Bn sunt boreliene.

Mulimea D a blocurilor este n mod evident stabil la intersecii finite, deci B () coincide cu
U-sistemul generat de D.
7
Amintim c dac j sunt o probabilitate pe un spaiu msurabil (E,E), atunci P = 12....
este probabilitatea pe E cu proprietatea c P(B1B2...BnEE.....) = 1(B1)2(B2)...n(Bn).
C o asemenea probabilitate (numit probabilitate produs) exist, nu este evident: existena ei
este dat de teorema lui Kolmogorov. Dac 1 = 2 = ....= , atunci probabilitatea produs se
noteaz cu . Acesta este cazul nostru.
8
Motivul elementar este c dac dou probabiliti definite pe o aceeai -algebr coincid pe un
sistem de generatori nchis la intersecii finite al -algebrei , atunci ele coincid. n cazul de fa
acest sistem de generatori este mulimea D a blocurilor.
139
S remarcm c t -1(A) = A. ntr-adevr, x t -1(A) t(x) A (x2,x3,.....)
B1B2...Bn.. x2 B1, x3 B2,...,xn+1 Bn x
B1B2...Bn.. = A. Deci P1(t -1(A)) = F( B1B2...Bn..) =
F()F(B1)...F(Bn) = F(B1)...F(Bn) = P1(A). Adic t invariaz probabilitatea P1.
(ii) Lucrm cu indicatori, cci este mai comod. Ipoteza t -1(A) = A devine 1At = 1A
. Dac punem f n loc de 1A se pune ntrebarea ce putem spune despre o funcie f
care are proprietatea c f = ft. Aplicm aceast funcie vectorului X i avem c
f(X) = f(t(X)) = f(t(t(X))) = .... sau, scris explicit, c f(X1,X2,...) = f(X2,X3,...) =
f(X3,X4,...) = .......
Aici intervine n for ipoteza independenei.
Deci variabila aleatoare Y = f(X) este independent de X1 (de vreme ce Y =
f(X2,X3,...) !) i de X2 (de vreme ce Y = f(X3,X4,...) !), i de X3, adic de toate
variabilele aleatoare Xn. Deci f(X) este independent de X, adic i de f(X).
nseamn c Y este independent de ea nsi. Dar atunci ea este constant
aproape sigur.
Concluzie: dac 1At = 1A, atunci 1A = constant (mod P1). Aceast constant,
firete, nu poate fi dect 0 sau 1: deci P(A) 0,1. q.e.d.

Definiia 5.2.4. Fie (,K,P) un spaiu probabilizat. i fie t : msurabil.


Spunem c t este ergodic fa de P dac P1t -1 = P1 i t -1(A) = A P(A) 0,1

Acum suntem n contextul firesc al teoriei ergodice. Putem aplica:

Teorema 5.2.5.(Teorema ergodic) Fie (,K.P) un spaiu probabilizat i f


L1(,K,P). Fie, de asemenea, t: o funcie ergodic. Atunci

1
n

f f t f t 2 ... f t n1 a
.s.
Ef = fdP

Demonstraia este departe de a fi evident i nu o vom da aici.9


i avem ceva mult mai tare dect am sperat, anume

Teorema 5.2.6. Fie (,K,P) un spaiu probabilizat, (E,E) un spaiu msurabil, X


= (Xn)n un ir de variabile aleatoare Xn: E cu proprietatea c shiftul t: E
E este ergodic fa de repartiia sa P1 = PX-1 . Fie f: E o funcie
msurabil cu proprietatea c f(X) L1(,K,P). Atunci
1
n

f f t f t 2 ... f t n1 ( X ) converge P aproape sigur la Ef(X).

9
Cititorul interesat poate gsi multe despre aceast teorem aici:
http://en.wikipedia.org/wiki/Ergodic_theory. O demonstraie frumoas se poate gsi in
cursul lui I. Cuculescu (1974) sau Tudor. Demonstraia original a autorului (Birkhoff
1931) este aici: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1076138/?page=1

140
Demonstraie
Nu avem dect s aplicm teorema ergodic pe spaiul (E,E,PX-1).
q.e.d.

Avantajul acestei formulri a legii tari a numerelor mari este c se poate


generaliza i la alte tipuri de iruri de variabile aleatoare de exemplu la lanuri
Markov sau la proces staionare.
Ca s o nelegem mai bine, o s i scriem cteva particularizri.

Corolarul 5.2.7. Fie (Xn)n un ir de variabile aleatoare i.i.d. cu valori ntr-un


spaiu msurabil (E,E) i fie f: E o funcie msurabil cu proprietatea c
f(X1,X2,....) L1. Atunci
1
f X1, X2,... f X2, X3,... ... f Xn , Xn1,... Pa
.s.
Ef X1, X2 ,... (5.2.3)
n
i acest enun este foarte general. Ca s l putem aplica, ar trebui s putem
calcula membrul drept. Particularizm la cazuri calculabile. De exemplu dac
variabilele aleatoare sunt reale iar f depinde doar de o mulime finit de
componente:

Corolarul 5.2.8. Fie (Xn)n un ir de variabile aleatoare i.i.d. i fie f:k o


funcie msurabil cu proprietatea c f(X1,X2,...,Xk) L1. Atunci
1
f X1, X2,..,Xk f X2, X3,..,Xk1 ... f Xn, Xn1,..,Xnk1 Pa
.s.
Ef X1, X2,...,Xk (5.2.4)
n

Avantajul este c acum chiar putem calcula membrul drept, folosind formula
de transport.
Dac PXn-1 = F, atunci Ef(X1,...,Xk) = fdF k .
Dac, de exemplu, F are o densitate fa de msura Lebesgue, atunci
Ef(X1,...,Xk) = f x1 , x2 ,..., xk x1 x 2 ...xk dx1dx2 ...dxk .
O particularizare i mai mare este cea cu care am nceput: dac f = pr1.

Corolarul 5.2.9. Legea tare a numerelor mari (SLLN)10


Fie (Xn)n un ir de variabile aleatoare i.i.d. din L1. Fie F repartiia lor i =
X 1 X 2 ... X n
EX1 = xdF x . Atunci X n n
converge a.s. la ..

Exemplul 5.2.10. Fie Xn variabile aleatoare pozitive i.i.d. i repartiia F. Atunci


media geometric n X 1 X 2 ...X n converge a.s. la e E ln X1 e ln xdF x . (ntr-adevr,

10
abreviere internaional: Strong Law of Large Numbers
141
1
logaritmnd expresia avem ln X1 ln X 2 ... ln X n ElnX1). Dac P(Xn= 0) > 0,
n
atunci limita este 0.

1
Exemplul 5.2.11. Media lor armonic converge la 1 / E . ntr-adevr,
X1
n 1
.
1 1 1 1
... E
X1 X 2 Xn X1

Exemplul 5.2.12. (Procese de rennoire). Fie (n)n un ir de variabile aleatoare


i.i.d. strict pozitive a.s. i T0= 0 iar n 1 Tn = 1 + ...+ n. Fie N(t) = maxk:Tk <
t. N(t) este un contorcare numr cte variabile j au aprut pn la momentul t.
N (t ) a.s. 1
Atunci
. ntr-adevr, N(t) = n Tn t < Tn+1 . Dac t , atunci
t E1
T t T
n i avem cletele n n 1 n care termenii din stnga i din dreapta
n N (t ) n
au aceeai limit, anume E1.

Posibilitatea statisticii: teorema lui Glivenko

Revenim la problema iniial: putem spera s aproximm, empiric, funcia de


repartiie a unei variabile aleatoare X?
Dac dispunem de un ir de observaii independente asupra ei, rspunsul este,
da.
Cu condiia s punem problema corect.
Observaii independente asupra lui X nseamn de fapt un ir de variabile
aleatoare (Xn)n care sunt independente, identic repartizate i avnd aceeai
repartiie ca X.

Exemplu 5.2.13. Se d un zar, posibil falsificat i dorim s estimm


probabilitile pi = P(X = i), 1 i 6. X este rezultatul unei aruncri a zarului.

Exemplu 5.2.14. Se arunc la ntmplare dou puncte A, B ntr-un ptrat de


latur L = 1. Segmentul AB are o lungime aleatoare X [0, 2 ]. Am dori s i
gsim funcia de repartiie n ipoteza c la ntmplare nseamn c punctele A
i B sunt vectori aleatori independeni repartizai uniform n ptrat.

n ambele cazuri problema este similar, dei cu grad de dificultate tehnic


diferit.
Fie (Xn)n un ir de variabile i.i.d. cu funcia de repartiie F. Deci F(x) = P(Xj
x). i atam funcia de repartiie empiric i artm c ea converge la F.

142
Definiia 5.2.15. Fie (Xn)n un ir de variabile aletoare i.i.d. irul de variabile
1
aleatoare Fn(x) =
n

j n : X j x se numete funcia de repartiie empiric
calculat n x.

Propoziia 5.2.16. Pentru orice n 1, Yn := nFn(x) sunt variabile aleatoare


repartizate Binomial(n, F(x)). Deci EYn = F(x), Var(Yn) = nF(x)(1 F(x)). n plus,
Fn(x) a
.s.
F(x)
n cuvinte:Funcia de repartiie empiric converge aproape sigur la adevrata
funcie de repartiie.

Demonstraie
Fie Zj = 1X j x . Variabilele Zj sunt i.i.d. repartizate Binomial(1,F(x)) iar
Z1 Z 2 ... Z n
Fn(x) nu este altcineva dect care, conform SLLN converge a.s.
n
la EZ1 = F(x). q.e.d.

i totui, se poate i mai bine.

Este adevrat c Fn(x) converge punctual la F(x). Dar funcia de repartiie F:


[0,1] este definit pe o mulime nenumrabil.
Nu cumva mulimea 0 := Fn(x)() F(x) pentru orice x poate
s fie de probabilitate mic, sau chiar 0? Noi am vrea s estimm funcia de
repartiie F n toate punctele, nu numai ntr-un singur x!
Din fericire, lucrurile nu stau aa. Nu numai c P(0) = 1 (ceea ce traneaz
problema), dar se poate demonstra chiar mai mult:

Teorema 5.2.17. (Teorema lui Glivenko) Fie n() = sup Fn(x)() F(x)
distana uniform dintre funcia de repartiie empiric dup n observaii i
adevrata funcie de repartiie. Atunci n a
.s.
0
Funcia de repartiie empiric converge aproape sigur uniform la
adevrata funcie de repartiie.

Nu vom da demonstraia acestui rezultat.11


Semnalm c ea este foarte mult mbuntit dac funcia de repartiie F este
continu. Un rezultat de matematic grea este urmtorul

Teorema 5.2.18. (Teorema Kolmogorov Smirnov) Dac F este continu, atunci

11
Cititorul interesat poate consulta Teoria probabilitilor de Cuculescu (1974) sau Tudor (1980).
Sau poate vedea mai multe referine aici
http://en.wikipedia.org/wiki/Glivenko%E2%80%93Cantelli_theoremhttp://en.wikipedia.org/wiki
/Glivenko%E2%80%93Cantelli_theorem
143

2i 12 2
2 8x2
limnP( n n x) = e
x i 1

Metoda Monte Carlo

Metoda se folosete ntr-o serie de probleme unde apar calcule prea grele
pentru a fi abordate determinist. Ele sunt de dou tipuri: calcul de integrale sau
probleme de optimizare.
Calcul de integrale.
S presupunem c vrem s calculm o integral de forma
k
I = f x1 ,..., xk dx1dx2 ...dxk f 1C d
C
(5.2.5)
unde C este un compact de msur Lebesgue pozitiv i f o funcie
integrabil pe acel compact. Ideea este s generm un ir de vectori aleatori
independeni Xn repartizai uniform n compactul C. Atunci
1
f X 1 ... f X n a . s.
Ef X 1 . Dar, conform formulei de transport, Ef(X1) =
n
1
fdU C k C f x1 ,..., xk dx1dx2 ...dxk .Deci algoritmul este
C
1
f x1 ,..., xk dx1dx2 ...dxk = (C)[a.s. limn f X 1 ... f X n ]
k

C n
(5.2.6)
A simula un vector aleator repartizat uniform ntr-un compact nu este un
lucru simplu. Uneori ns, este simplu: dac C = [a1,b1][a2,b2]...[ak,bk]. Atunci
Xn = (Xn,1,...,Xn,k) este uor de simulat: componentele sale sunt variabile aleatoare
independente repartizate Uniform(ai,bi). Toate mediile de programare (R, C++,
Java, R, Matlab, Excel etc) au n dotare cel puin generatoare de numere
pseudoaleatoare, repartizate Uniform(0,1)
Revenind la Exemplul 1.1.11. Urmtoarea secvena (sau, cum i se mai
spune, script) din mediul de programare R:
segment1<-function(n)
{xa=runif(n);xb=runif(n);ya=runif(n);yb=runif(n)
d=sqrt((xa-xb)^2+(ya-yb)^2)
d}
face n simulari (instruciunea xa=runif(n) produce un vector de lungime
n cu componentele variabile aleatoare repartizate Uniform(0,1)
Cu instruciunea
> d<-segment1(1000000);summary(d)
generm 1000000 de segmente crora le calculm lungimea. Apoi ni se
furnizeaz minimul, maximul, prima cuantil, mediana, media i cuantila a treia.

144
Sigur c este vorba de cuantilele de selecie (se poate arta, tot pe baza
SLLN c i cuantilele de selecie converg la adevratele cuantile). Conform
SLLN ne ateptm ca aceste variaile aleatoare (cci asta sunt!) s nu oscileze
prea tare i s ne dea informaii despre repartiia variabilei aleatoare X = A-B.
Iat rezultatul a 10 simulri de cte 1 milion de segmente

Min. 1st Qu. Median Mean 3rd Qu. Max.


0.0007994 0.3276000 0.5118000 0.5214000 0.7049000
1.3560000
0.0002333 0.3278000 0.5116000 0.5211000 0.7043000
1.4010000
0.0003137 0.3284000 0.5117000 0.5214000 0.7043000
1.3670000
0.0005139 0.3279000 0.5119000 0.5213000 0.7044000
1.3760000
0.0006177 0.3277000 0.5117000 0.5210000 0.7043000
1.3880000
0.0008395 0.3284000 0.5119000 0.5212000 0.7041000
1.3860000
0.0004015 0.3283000 0.5123000 0.5215000 0.7046000
1.3860000
0.0008071 0.3279000 0.5113000 0.5209000 0.7039000
1.3790000
0.0006265 0.3282000 0.5113000 0.5213000 0.7045000
1.3820000
0.0005321 0.3284000 0.5126000 0.5215000 0.7046000
1.3800000

Observm c media reprezint o remarcabil stabilitate: primele dou


zecimale nu se schimb. La fel i mediana. Putem avea o idee despre precizia
estimrii comparnd cu lucruri cunoscute: tim c maximul esenial al lui X este
2 i minimul este 0. Maximul empiric al lui X pare s fie 1.38 iar minimul
pare a fi 0.
Calculul exact este aproape imposibil de fcut. Teoretic, avem de calculat
urmtoarele
F(x) = P(X x) = P((xA xB)2 + (yA yB)2 x2)
(5.2.7)
EX = E x A xB 2 y A yB 2
(5.2.8)
unde A(xA,yA), B(xB,yB) sunt punctele aleatoare repartizate uniform n ptratul
unitate.
Formal, se dau patru variabile aleatoare independente: xA, xB, yA, yB i se cere s se
calculeze cantitile (5.2.7) i (5.2.8). Prima revine la a calcula msura Lebesgue
4-dimensional 4 a mulimii Mx = xA, xB, yA, yB [0,1]: (xA xB)2 + (yA yB)2 x2
Iar a doua, pe baza formulei de transport, la a calcula integrala

145
EX = 01 01 01 01 x A xB 2 y A yB 2 dx AdxB dy Ady B
Prima cantitate se poate calcula exact, cu mult efort; pentru al doua, nu exist
formule prin cuadraturi.
Ca s avem o idee de puterea metodei, o putem compara cu metodele
deterministe de calcul ale integralelor multiple. Tot o sum avem de fcut, dup
ce lum cte o diviziune pe fiecare ax. Dac diviziunea este echidistant cu 20
de puncte, vom avea de calculat valoarea funciei de integrat n 204 = 160.000 de
puncte. Nu e sigur c eroarea va fi mai mic!
Putem concluziona c X este o variabil aleatoare cu media 0.521 i
mediana.512
De curiozitate, prezentm i graficul unei funcii de repartiie empirice dup
100.000 de probe.

Calcul de maxime-minime.

O problem fundamental n matematica aplicat este de a gsi maximele i


minimele unei funcii f:C unde C este un domeniu din kk. Exist multe
metode deterministe de a face acest lucru acesta este domeniul teoriei
optimizrii. Exist dou tipuri de agoritmi : determiniti i probabiliti.
Ideea de baz a algoritmilor probabiliti este de a arunca o ploaie de puncte
la ntmplare cu mai mult sau mai puin inteligen .

Propoziia 5.2.19. Fie f:C o funcie mrginit definit pe compactul cu


interior nevid C k. Fie (Xn)n un ir de variabile aleatoare repartizate uniform
n C i Yn = max(f(X1),...,f(Xn)), Zn = min(f(X1),..,f(Xn)). Atunci (Yn)n este un ir
cresctor de variabile aleatoare, (Yn)n este un ir descresctor . Primul
146
12
converge aproape sigur la Esssupf iar al doilea la Essinf f. Dac f este
continu, atunci Yn a
.s. a.s.
max(f) i Zn
min(f)

Demonstraie
Fie F funcia de repartiie a variabilei aleatoare f(X) unde X
Uniform(C). Deci F(x) = P(f(X) x) = P(X f-1(-,x]) = k(f-1(-,x])/k(C).
Fie M = ess inf f. Atunci P(Yn M - ) = P(max(f(X1),...,f(Xn)) M - ). Dar
variabilele f(Xk) sunt independente, deci
P(max(f(X1),...,f(Xn)) M - ) = P(f(X1) M - , f(X2) M - ,... f(Xn)) M - )
= P(f(X1) M - )P(f(X2) M - ,)...P(f(Xn)) M - ) = Fn(M - ). Cum M este
supremul esenial, F(M - ) < 1, deci F n(M - ) 0. Deci P(Yn M - ) 0. Dar
irul Yn, fiind cresctor, are o limit, Y. Rezult c P(Y M - ) = 0 . Deci Y
M. Pe de alt parte, Yn M deoarece toate variabilele aleatoare f(Xj) au aceast
proprietate. nseamn c Y = M P-a.s. Y = M (k a.p.t.).
Dac funcia este continu, nu mai este nevoie de precauia ca ea s fie
mrginit: sigur c este, deoarece orice funcie continu duce compacte n
compacte. Mai mult, atunci maximul ei coincide cu supremul esenial din
urmtorul motiv: fie M = max f. Atunci mulimea x C f(x) > M - este
deschis n C, deci are interior nevid. Orice mulime de interior nevid are msur
pozitiv. Adic M are proprietatea care definete supremul esenial.
Demonstrarea afirmaiilor legate de minim sau infimul esenial este analog.
q.e.d.

Observaia 5.2.20. Acesta este cel mai simplu algoritm, deoarece lucreaz n
orb, fr memorie. Perfecionarea lui duce la algoritmii genetici. Dac
apelm i la un minimum de memorie, reinnd punctele de minim i maxim
gsite, atunci putem avea o idee despre Argmin f i Argmax f 13

Exemplul 5.2.21. Pentru a vedea ct este de tare algoritmul, s lum o funcie


creia i putem calcula extremele, de exemplu f(x,y) = xy xy, f:[0,1]2 .
Verificai c max f = f( , ) = , minf =0. Puncte de minim sunt o infinitate
frontiera ptratului unitate, dar exist un singur punct de maxim.. Aplicm
metoda Monte Carlo i s vedem ce rezult. Dup 1000 de simulri a rezultat
minimul min f = 4.069785e-07 (n loc de 0), maximul max f = 0.2480471 (n loc
de 0.25), punctul de maxim z = (0.5315545, 0.5295112) (n loc de (0.5, 0.5)!) i
un punct de minim de coordonate (0.8046973, 2.083834e-06) . Dac ns facem

12
Supremul esenial al unei funcii definite pe un compact de interior nevid C este un numr M
cu proprietatea c f(x) M pentru aproape toi x M i msura Lebesgue a mulimii x C f(x)
> M - este pozitiv >0. Similar, infimul esenial este un numr m cu proprietatea c f(x)
M pentru aproape toi x M i msura Lebesgue a mulimii x C f(x) < M + este pozitiv
>0. A nu se confunda cu supremul i infimul De exemplu, dac f = 1 1 cu diagonala
ptratului unitate din plan, i cealalt diagonal atunci sup f = 1, inf f = -1, dar ess sup f = ess
inf f = 0.
13
O notaie pentru punctele n care se gsete maximul sau minimul.
147
10000 de simulri, obinem minf =9.063544e-09, max f = 0.2499187, Argmax(f)
= (0.4966409, 0.4967819), Argmin(f) =(0.9999011, 9.165588e-05) .

De regul algoritmii Monte Carlo nu se aplic dect in extremis dac nu


avem altceva mai bun.
Viteza de convergen la WLLM i SLLM este dat de 2 = Var(Xi).

5.3. Convergena n repartiie


Spre deosebire de convergenele din capitolul precedent, convergena n
repartiie nu se refer ca convergena variabilelor aleatoare, ci la cea a
D
repartiiilor lor. Propoziia Xn converge la X n repartiie cu notaia Xn X
trebuie neleas n sensul repartiiile variabilelor aleatoare Xn converg la
repartiia lui X .
De obicei, noiunea de convergen este legat de o topologie: un ir de
repartiii Fn are limita F dac n afara oricrei vecinti a lui F exist cel mult un
numr finit de termeni ai irului.
i tot de obicei, noiunea de vecintate este legat de o distan: o vecintate
a unui punct F este o mulime care conine o bil de centru F i raz .

Convergena tare
Cele mai folosite distane sunt date de norme: d(F,G) =F - G.
Repartiiile variabilelor aleatoare sunt probabiliti pe dreapt. Probabilitile
sunt msuri finite pe (, B()). Diferena a dou msuri finite este o msur cu
semn.
Aici trebuie amintite unele lucruri elementare: msurile finite cu semn pe un
spaiu msurabil (E,E) formeaz spaiu vectorial. O msur cu semn : E
se poate ntotdeauna scrie sub forma = + - - unde + i - reprezint partea
pozitiv i partea negativ a msurii. Aceasta este descompunerea Hahn
Jordan.14
Mai mult, exist o mulime H E 15 cu proprietatea +(E) = (H) i -(E) =
(E \ H). Ea are proprietatea c (AH) 0 , (A \ H) 0 pentru orice A E .
Msura := + + - se numete variaia lui iar funcia definit prin
= (E) = 2(H) - (E) este o norm: = 0 = 0 i 1 + 2 1 + 2
1,2 msuri cu semn.

14
Vezi orice manual de teoria msurii sau, de exemplu aici:
http://www.math.purdue.edu/~zhang24/SignedMeasure.pdf
15
Ea se numete mulimea Hahn ataat lui . Dac, de exemplu, = , unde este o msur
oarecare, atunci H = > 0
148
Norma se calculeaz uor dac are o densitate fa de o msur adevrat,
: mai precis, dac = , atunci = d 16.
De exemplu dac F i G sunt dou repartiii discrete cu acelai suport, F =
p j x j , G = q j x j , atunci = x j , densitatea lui F ar fi (pj)j , cea a lui G ar
j j j

fi (qj)j iar distana ntre F i G ar fi F G = | p j q j | .


j

Definiia 5.3.1. Fie (E,E) un spaiu msurabil. Fie (Fn)n i F probabiliti pe el.
Spunem c Fn converge tare la F dac F Fn 0. Notm acest lucru prin
Fn s
F.

Propoziia 5.3.2. Fie (E,E) un spaiu msurabil.


(i). Dac F i G sunt dou probabiliti pe E, atunci d(F, G) [0,2]. Dac
d(F,G) = 0, atunci F = G iar dac d(F,G) = 2, atunci exist o mulime A n aa
fel nct F(A) = 0 i G(A) = 1. Spunem c F i G sunt singulare.
(ii). Dac este o msur oarecare i Fn = fn, F = f sunt probabiliti,
atunci Fn s L1 E ,E , f. O condiie suficient ca f s convearg la f
F fn n
n L1 este ca fn s convearga la f - aproape sigur.
s
(iii). Dac Fn F, atunci Fn(A) F(A) A E. Reciproca nu este
adevrat. Ca un caz particular, dac Fn i F sunt repartiii de pe dreapta real,
atunci funciile lor de repartiie converg: Fn((-,x]) F((-,x]). 17

Demonstraie
(i). Fie = F G.Deci (E) = F(E) G(E) = 1 1 = 0. Fie H mulimea Hahn
ataat lui . Atunci = 2(H) - (E) = 2(H). Dac = 2, atunci (H) = 1
F(H) G(H) = 1. Dar F i G sunt probabiliti, deci F(H) = 1 i G(H) = 0.
s L1 E,E,
(ii). Fn F = f f n d , deci e clar echivalena Fn
F fn f.
Interesant este cealalt afirmaie, deoarece n general nu este adevrat c dac fn
converge la f aproape sigur, converge i n L1 (vezi exemplul 1.1.8). Dar la noi
exist condiia foarte tare ca fn s convearg la o densitate de probabilitate.
Folosind egalitatea x = 2x+ - x i avem

16
Notaia = . este acceptat de majoritatea matematicienilor pentru a desemna msura de
densitate i baz . Precis, sensul este ()(A) = 1A d pentru orice A E. Ali autori
folosesc n acelai scop notaia d = d, care are avantajele ei, deoarece atunci cnd calculm
integrala, densitatea iese n fa: fd fd .
17
Se obinuiete notaia F(x) n loc de F((-,x]). Dac suntem ateni, nu este nici un pericol de
confuzie: dac A este o mulime, F(A) nseamn probabilitatea lui A i dac x e punct, F(x)
nseamn F((-,x]).
149
f f n d 2 f f n d f f n d = 2 f f n d . irul (f fn)+ tinde -a.s.
la 0 este dominat de f care este n L1. Teorema de convergen dominat ne spune
atunci c putem comuta limita cu integrala: limn f f n d = lim | f f n | d = 0.
n
(iii). Fn(A) F(A) Fn F (A) Fn F . Pentru a doua afirmaie, vezi
exemplul 1.3.7 de mai jos.

Exemple de aplicare

Exemplul 5.3.3. Dac (pn)n este un ir de probabiliti cu proprietatea c npn


, cu >0, atunci repartiiile Binomial(n,pn) converg tare la Poisson(). ntr-
adevr, putem lua = n msura cardinal cu suport mulimea numerelor
n 0
i
naturale i densitile fn(i) = Cni pni 1 pn ni , f(i) = . Verificai c fn f.
i!

1 1
s
Exemplul 5.3.4. Fie Fn = 1 0 n Atunci Fn 0 .
n n

Exemplul 5.3.5. Dac an a i bn b, atunci Uniform(an,bn) Uniform(a,b).

Exemplul 5.3.6. Mai general, familiile de repartiii obinuite: (Geometric(p),


Negbin(k,p), Gamma(k,), N(,2) etc) sunt continue n parametru: n
Gamma(k,n) s Gamma(k,); n , n N(n,n) s N(,). Nu
avem dect s verificm c densiile converg.

2 n 1 1
2k 2 k 1
Exemplul 5.3.7. Fie An = ( n

, n ] i Fn = 2 1An , unde este msura
k 0 2 2
Lebesgue. Fie f = Uniform(0,1) = 1(0,1). Atunci Fn F = 1 (ntr-adevr,
1 dac x An


norma este egal cu 1An 1(0,1) d iar 1An 1( 0,1) x 1 dac x (0,1) \ An ).
0 n rest

Totui, Fn(A) F(A) pentru orice mulime borelian A din urmtorul
motiv:remarcm c Fn(A) 2F(A) pentru orice A B (). Fie atunci C =A B
(): Fn(A) F(A). Familia C este un u-sistem (singurul lucru cu probleme este
s artm c dac (Ak) este un ir de mulimi disjuncte cu proprietatea c Fn(Ak)
F(Ak), atunci i Fn( Ak ) F( Ak ) Fn Ak F Ak ceea ce rezult din
k k k k
faptul c seriile Fn Ak sunt dominate de 2 F Ak ). Acest u-sistem conine
k k
intervalele A = (-,x]. ntr-adevr, pentru x 0 sau x 1 funciile de repartiie

150
chiar coincide: Fn(x) = F(x). Dac 0 < x < 1 se arat imediat prin inducie c
1
| [2 n 1 x ] 2 n1 x |
Fn(x) = x + 2 deci 0 Fn F 2-n.
n 1
2
Deci funciile de repartiie converg uniform, (Fn - F)(A) converge la 0 pentru orice
A i totui Fn nu converge tare la F.

Exemplul 5.3.8. Dac F este o repartiie discret i G este o repartiie continu,


atunci F G = 2 adic maximul posibil. n consecin niciodat nu se poate
aproxima n sensul tare o repartiie continu cu un ir de repartiii discrete.

n multe situaii se pune problema evalurii momentelor unei variabile


D
aleatoare aproximndui repartiia cu alta. Schema mental este Dac Xn X,
atunci poate c i EXn EX

Este oare convergena tare suficient pentru a asigura convergena


momentelor?
Uneori chiar aa se ntmpl, dar n general rspunsul este negativ. Dac
0
n
lum, de exemplu, Xn Fn := 1 1 1 , X = 0 0, vedem c dei Fn s
F, EXn

n n
= 1 nu converge la EX = 0. Problema convergenei momentelor este dificil.18

Convergena slab

Convergena tare, dei cea mai natural, nu rspunde satisfctor problemelor


de statistic. Toate repartiiile vizibile n statistic sunt repartiii empirice, deci
sunt discrete. Exemplul 5.3.7 ne arat c nu se pot aproxima repartiiile continui
cu repartiii discrete. Ce puin nu n sensul tare.
Teorema lui Glivenko ne spune c (uneori, vezi mai sus) funciile de
repartiie empirice converg la adevrata funcie de repartiie. O idee ar fi s
decretm c

Definiia 5.3.9.(Definiie intermediar) Fie (Fn)n un ir de repartiii pe dreapt.


Fie F o alt repartiie. Spunem c Fn F dac Fn(x) F(x) pentru orice x .

Dar aceast definiie are dou neajunsuri. Amndou serioase.


n primul rnd, ca s fie ceva care corespunde intuiiei, ar trebui ca, dac xn
1
x , atunci i xn s convearg la x. i nu este aa. De exemplu, dac xn = , xn
n

18
Cititorul poate consulta, de exemplu, Ioan Cuculescu, Teoria Probabilitilor, Bucureti, All,
1998, pg 281-368.
151
0, dar funciile de repartiie sunt Fn(x) = 1 1 (x) 1(0,)(x) ; limita nu este o
[ , )
n
funcie de repartiie fiindc nu este continu la dreapta. Am fi vrut s convearg
la funcia de repartiie a lui 0, care este 1[0,).
n al doilea rnd, ar fi preferabil o definiie care s se poat extinde i la alte
spaii msurabile, nu numai la dreapt. Am vrea s dm un sens, de exemplu, i
noiunii de convergen dac avem de a face cu repartiii n plan sau n spaiu.
De aceea s-a ales alt definiie. Ea are sens pe spaii mai generale, dar ne
mulumim aici cu spaiile euclidiene, care sunt cel mai bine cunoscute.

Definiia 5.3.10. Fie (Fn)n, F repartiii pe spaiul euclidian (d, B(d)). Spunem
c Fn converge slab la F dac fdFn fdF pentru orice funcie continu i
mrginit f. 19
Notm acest fapt prin Fn F
Dac Xn ,X sunt vectori aleatori cu repartiiile Fn i F, n locul notaiei Fn
D
F se folosete, prin abuz de limbaj, notaia Xn X care se citete Xn
D
converge n repartiie la X. Se admite i notaia Xn F , care se citete
Xn converge n repartiie la F.

Proprietile cele mai importante ale acestei noiuni sunt sintetizate n


urmtorul rezultat Teorema Portmanteau.

Propoziia 5.3.11. (Teorema Portmanteau)


Fie E = d, d 1, E = B(d) i (Fn)n, F probabiliti pe (E, E).
Atunci urmtoarele proprieti sunt echivalente
(i) fdFn fdF pentru orice f continu i mrginit
(ii) fdFn fdF pentru orice f uniform continu i mrginit
(iii) limsup Fn(C) F(C) pentru orice mulime nchis din E
(iv) liminf Fn (D) F(D) pentru orice mulime deschis din E
(v) lim Fn(A) = F(A) pentru orice mulime A cu frontier F- neglijabil (adic
F( A \ Int ( A) ) = 0!).
(vi) (doar pentru d = 1): Fn(x) F(x) x punct de continuitate pentru F
(vii) (doar pentru d = 1): Fn(x) F(x) x unde este o mulime
numrabil dens din .

Nu vom demonstra aceast teorem. Unele implicaii sunt simple, altele mai
laborioase.20

19
Mulimea funciilor reale continue i mrginite pe d se noteaz cu Cb(d).
20
Ioan Cuculescu, Teoria Probabilitilor sau
http://en.wikipedia.org/wiki/Convergence_of_measures. Sunt sute de cri care conin
demonstraia.
152
Observaia 5.3.12. Toate punctele teoremei de mai sus pot scrise n termini de
variabile aleatoare. Dac n loc de Fn i F punem Xn i X obinem urmtoarele
D
caracterizri echivalente ale faptului c Xn X:
(i) Ef(Xn) Ef(X) pentru orice f continu i mrginit
(ii) Ef(Xn) Ef(X) pentru orice f uniform continu i mrginit
(iii) limsup P(Xn C) P(X C) pentru orice mulime nchis din E
(iv) liminf P(Xn D) P(X D pentru orice mulime deschis din E
(v) lim P(Xn A) = P(X A) pentru orice mulime A cu frontier F-
neglijabil

Observaia 5.3.13. Nu trebuie s credem c dac Fn sunt funcii de repartiie i


Fn F, atunci i F este funcie de repartiie. Exemplele sunt nenumrate: 1[n,)
sunt funcii de repartiie care converg la 0, la fel i funciile de repartiie pentru
x
Uniform(0,n) (adic Fn(x) = min( ,1) ) etc. Este fenomenul cunoscut ca escape
n
to infinity sau se pierde mas spre infinit.

Observaia 5.3.14. Dac dorim s avem o familie de probabiliti care s fie


relative compact (din orice ir s se poat extrage un subir Cauchy), atunci
trebuie ca ea s fie tight: pentru orice > 0 s existe un compact C cu
proprietatea ca F(C) > 1 - pentru toate probabilitile F din acea familie
(Teorema lui Prohorov)21.

Remarcm urmtoarea consecin imediat a teoremei Portmanteau:

P D
Corolarul 5.3.15. Fie Xn.X vectori aleatori. Dac Xn X, atunci Xn X.
Convergena n probabilitate implic convergena n repartiie.

Demonstraie
P
Dac Xn X, atunci conine un subir care converge a.s. la X. Dac f
este o funcie continu, atunci f(Xn) converge aproape sigur la f(X). Dac f este i
mrginit, teorema de convergen dominat arat c Ef(Xn) Ef(X).

Ce avem de fcut dac dorim s verificm o conjectur de tipul Fn F?


Nici una din reetele din Teorema Portmanteau nu pare s funcioneze. Nici
mcar n cazul unidimensional: este uor de zis verific dac Fn(x) converge la
F(x) pe o mulime dens, dar e mai greu de fcut.

Exist un instrument care ajut n multe cazuri, anume funcia


caracteristic.

21
De exemplu http://en.wikipedia.org/wiki/Prokhorov%27s_theorem
153
Definiia 5.3.16. Fie F o repartiie pe (d,B(d)). Funcia F: d C definit
prin
it ' x
F(t) = e dF x
(5.3.1)
se numete funcia caracteristic a lui F. (Un punct x din d este un vector
coloan; t este transpusul lui t deci tx este produsul scalar dintre t i x : tx =
t1x1 + t2x2 + ...+ tdxd). Dac F este repartiia unui vector aleator d-dimensional, X,
atunci scriem X n loc de F i, pe baza formulei de transport, avem
X(t) = EeitX
(5.3.2)

Funcia caracteristic are proprietatea de a fi multiplicativ: dac X i Y sunt


vectori independeni, atunci X+Y = XY . Dac este de clas C, atunci X are
toate momentele finite i ele se pot calcula prin derivri. Ea are ns o
proprietate suplimentar pe care analogul su real (funcia generatoare de
momente mX(t) = EetX) nu o are: aceea c domeniul su de definiie este acelai
indiferent de repartiia F i c ea caracterizeaz astfel, repartiia. Mai precis,
avem

Propoziia 5.3.17.
(i) Fie F i G dou repartiii pe (d,B(d)) cu proprietatea c F = G. Atunci F =
G (Teorema de unicitate).
(ii) Presupunem c (Fn)n este un ir de repartiii cu proprietatea c irul Fn este
convergent i limita sa, , este continu n 0. Atunci exist o repartiie F cu
proprietatea c F = i Fn F. Sau, n termeni de variabile aleatoare: dac
(Xn)n sunt vectori aleatori d-dimensionali independeni i X n , continu n
D
0, atunci exist o repartiie F ca Xn F.

Nu vom demonstra nici aceast teorem fundamental. 22

Cu ajutorul ei ns putem arta

Propoziia 5.3.18.
(i). Dac Fn F i Gn G, atunci FnGn FG (sau, acelai lucru n
D D
termeni de variabile aleatoare dac Xn X, Yn Y ,Xn independent de Yn,
D
atunci (Xn,Yn) (X,Y))
(ii). Dac Fn F i Gn G, atunci FnGn FG ( n termeni de variabile
D D
aleatoare : dac Xn X, Yn Y ,Xn independent de Yn, atunci Xn+Yn
D
X+Y)

22
Ioan Cuculescu, Teoria Probabilitilor sau Lukacs, E. (1970). Characteristic functions.
London: Griffin.
154
Demonstraia se reduce la verificarea faptului banal c FG = FG i FG =
FG. q.e.d.

5.4. Teorema limit central

Am vzut c n varianta ei cea mai simplu de neles, Legea numerelor mari


spune c dac Xn sunt variabile aleatoare i.i.d., atunci media empiric
X 1 X 2 ... X n
Xn converge aproape sigur la adevrata medie = EX. Pentru
n
a studia mai amnunit viteza de convergen, ar trebui s calculm mrimea p()
= P( X n > ) ; am dori s tim cte observaii ne-ar trebui pentru ca aceast
S
probabilitate s fie mic. Dac scriem X n n , probabilitatea n cauz s-ar scrie
n
sub forma p() = P( S n n >n) = P(Sn (-, n(-)) (n(+),))
Dac notm cu Fn repartiia sumelor Sn, atunci probabiliitatea respectiv s-ar
putea scrie p() = F(n( - )) + 1 F(n(+))
Ce s-ar putea spune despre aceast cantitate?
Se tie c repartiia sumei unor variabile aleatoare independente este
convoluia erepartiiilor termenilor. ntrebarea este: cum se comport
convoluiile de multe repartiii?
S studiem un exemplu n care se pot face calcule. S zicem c Xn U(0,1).
Atunci vectorul X:=(X1,...,Xn) este repartizat uniform n cubul [0,1]n. Deci P(Sn x)
= P( X Ax) unde

Ax =x [0,1]n : x1 +...+ xn x (5.4.1)

Dac x 1, este uor de fcut calculul: P( X Ax) este volumul simplexului


Sn(x) = x0: x1 +...+ xn x care, din raiuni de simetrie este 1/n! din volumul
xn
cubului, adic Fn(x) = . Dac ns x > 1, atunci trebuie sczute din el
n!
volumele celor n simplexe de latur x 1 care apar (fcei un desen n cazul n =
n
3!). Deci Ax = Sn (x) \ A j x cu Aj(x) = x Sn(x): xi > 1. Intersecia unei familii
j 1
finite de asemenea mulimi e de aceeai form. Aplicnd principiul includerii i
exculderii, gsim
Fn(x) =
n!

1 n

x C 1n x 1n C n2 x 2n ..... (5.4.2)

Unde suma se face atta vreme ct x k 0. Ca s nu avem probleme de sumare,


scriem

155
1 k k n
Fn(x) = C n 1 x k (5.4.3)
n! k 0

unde x+ este partea pozitiv a lui x. Derivnd (sumele sunt, totui, finite) gsim
densitile

1
k k n 1
fn(x) = C n 1 x k (5.4.4)
n 1! k 0
n figura de mai jos am fcut graficele densitilor fj cu 2 j 6.
Se observ cum ele capt o form specific, de clopot.

1.0
y
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0
0 1 2 3 4 5 6
x

Ca sa putem compara mai bine densitile, ar trebui s facem ca aceste


densiti s aib aceeai ax de simetrie. Adic s centrm variabilele aleatoare
Xn, scznd din ele media. Astfel obinem sumele centrate Sn,c = Sn - n unde =
EXn = . Funciile de repatiie centrate, notate ad-hoc cu Fn,c se calculeaz
imediat dup foemula evident

Fn,c(x) = Fn(x + n) , fn,c(x) = fn(x + n) (5.4.5)

Obinem cinci grafice care se pot compara mai bine, fiindc au aceeai ax de
simetrie.

156
1.0
y
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

-3 -2 -1 0 1 2 3
x

Totui, dispersiile tind la infinit, aa c i densitile centrate vor tinde la 0.


Nu putem s le comparm bine. Ca s facem s aib toate aceeai dispersie,
mprim la abaterea medie ptratic a lui Sn, care este n , unde 2 = Var(Xn) =
1
. Obinem sumele centrate i normate
12
S n n
sn = (5.4.6)
n

care au funciile de repartiie notate cu

n(x) = P(sn x) = Fn(n + n x) (5.4.7)

i densitile

n(x) = n(x) = n fn(n+ n x) (5.4.8)

Mai jos am fcut graficele celor cinci densiti centrate i normate. Se observ
cum se stabilizeaz.

157
0.5
y

0.4

0.3

0.2

0.1

-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5
x

Cine este limita?

S lum un caz particular, n care chiar putem face calcule: s zicem c Xn


Exp(1) sunt toate repartizate exponenial standard. Verificai imediat prin
inducie c

xn x
fn+1(x) = e 1(0,) ( x) (5.4.9)
n!

Acum = = 1, deci conform cu (1.4.8) avem n+1(x)= n 1 fn(n+1+ n 1 x)


adic

n+1(x) = n 1
n 1 e

n
n 1x n1 n 1x 1
( 0, ) ( n 1 n 1x ) (5.4.10)
n!

Dac n este mare, n+1 + x n 1 devine pozitiv, deci putem renuna la


n
n
indicator.Aplicm formula lui Stirling, n! 2n i avem n+1(x)
e

n n n
n 1 n 1 n 1x n n1 n 1x = n 1 n 1 n 1x n 1 1 n 1x .
e e
2n n 2n n 1 n

Trecnd la limit avem

n
n 1 x
lim n x
1 n 1 n 1 n
e
n 1 n 1x
lim e n 1 x lim 1 e n 1x
2n n n 1 2 n 1
n = lim =
1
= 2 L

158
x
Logaritmm: lnL = lim n ln 1 x n 1 . Dezvoltm logaritmul n serie
n 1
2 3 4
(ln(1+t) = t t /2 + t /3 t /4 + ....) i avem

n x x2 x3 x4
lnL = lim n 1

... x n 1

n 1 2n 1 3n 1 n 1 4n 1
n 1 2

x2 x3 x4
= lim x n 1 ... x n 1 = - x2/2.
2 3 n 1 4n 1

Concluzie
irul densitilor centrate i normate converge, n cazul n care Xn sunt
x2
1
repartizate Exp(1) la funcia (x) = e 2 . Aceasta chiar este o densitate, este
2
densitate repartiiei noemale standard N(0,1)! (Atenie: limita unui ir de
densiti nu este obligatoriu o densitate, dup cum ne putem convinge cu
densitile fn = 1[0,n](x)/n care converg la 0! )

Am verificat pe un caz particular

Teorema 5.4.1(Teorema limit central local) Dac densitatea comun a


variabilelor aleatoare i.i.d. din L2 , (Xn)n, este mrginit, atunci densitile n ale
S n n
sumelor centrate i normate sn = converge la densitatea repartiiei
n
x2
1
normale standard : n (x) e 2 . n consecin, conform Propoziiei
2
5.3.2.(ii)

S n n s
N 0,1
(5.4.11)
n

Afirmaia este valabil ntr-un context i mai general, anume dac putem
demonstra c exist un n ncepnd de la care n este o mrginit. Demonstraia
depete cu mult cadrul acestui manual. Cine chiar este interesat o poate gsi de
exemplu, n Y. Ptohorov, Y. Rozanov, Probability Theory, Springer 1969, pp
190-194. Alte demonstraii, mai recente se pot gsi pe Internet, cu Google.

Dar dac variabilele aleatoare Xn sunt discrete, atunci problema local nu are
sens. Se poate demonstra un rezultat mai slab.

159
Teorema 5.4.2.(Teorema Limit Central (TLC))
Fie (Xn)n un ir de variabile aleatoare i.i.d. din L2. Fie = EX1 i 2 = Var(X1).
Atunci

X 1 X 2 ... X n n D
N 0,1
n
Scris explicit, afirmaia este c

t2
X ... X n n 1 x 2
limn P 1 x e dt
n 2

Observaia 5.4.3. Funcia de repartiie a repartiiei N(0,1) se noteaz cu i


este tabelat de peste 100 de ani. Acum nu se mai folosec tabelele, deoarece
toate softurile matematice o calculeaz. Deci
2
x t
1
(x) = e 2 dt
2

Demonstraie
Dac acceptm teorema de convergen a funciilor caracteristice, demonstraia
este simpl. Fie Yn = Xn - variabilele centrate i (t) = EeitY funcia lor
caracteristic. tim de la proprietile funciilor caracteristice c dac Yn sunt din
L2, atunci este derivabil de dou ori. Ne intereseaz c e derivabil de dou
t2
ori n 0: deci putem scrie (t) = (0) + t(0)+ (0) + o(t)t2 unde o(t) este o
2
funcie continu i o(0) = 0. Dar (0) = 1, (0) = EYn = 0 i (0) = - EYn2 = - 2.
t 22
Deci (t) = 1 + o(t).
2
Calculm funcia caracteristic a lui sn, notat cu n:

it n
Y1 ...Yn t 22 t t 2
n t
n(t) = Ee n = = 1 o 2 .
n 2 n
n n

Atunci
2
t
t2 t2 t t2 t2 t
limnn(t) = exp[ lim n 2 o ]= exp 2 lim o = e 2 .
2n n n
2 n

160
t2

Dar funcia (t) = e 2
este funcia caracteristic a repartiiei normale standard.
Teorema este demonstrat. q.e.d.

Exemplu de aplicare:
0 1
Exemplul 5.4.4. Repartiia binomial. Dac Xn , atunci Sn
q p
Binomial(n,p). Dac n este destul de mare putem aproxima P(Sn a) cu TLC
astfel: Avem = p, = pq . Deci

S n np a np a np
P(Sn a) = P( ) .
npq npq npq

Se tie c dac npq 20, aproximarea este foarte bun. Prezentm un grafic cu
diferenele dintre funcia de repartiie a repartiiei Binomial(100,0.42) i cea a
2
repartiiei N(np, npq 2) = N(42, 24.36 ) calculate pentru x [0,100]

Pe axa Ox sunt valorile lui x iar pe axa Oy valorile diferenei dintre cele dou
funcii de repartiie. Maximul este maimic de 0.05. Daca ns luam un caz
extrem, cu p =0.042, situaia se schimba

161
Diferena dintre probabiliti poate depi 0.12, ceea ce este imens. Explicaia
este c acum =4.2 i probabilitatea ca X Binomial(100,0.042) s ia valorile 4
sau 5 este mare : 0.3653754. Ca s fie aplicabil aproximarea normal trebuie
ca toate probabilitile P(X = k) s fie mici. Dac produsul np este mic, dei n
este mare, atunci este preferabil aproximarea cu repartiia Poisson(np).

162
Capitolul 6

Simularea variabilelor aleatoare

n dotarea calculatoarelor exist de mult generatoare de numere aleatoare,


care simuleaz destul de bine un ir de variabile aleatoare repartizate
Uniform(0,1). A simula o variabil aleatoare nseamn ca, pe baza acestui
generator de numere aleatoare s se construiasc variabile aleatoare avnd o
repartiie dat.
Formal, problema s-ar pune aa: se d o variabil aleatoare
UUniform(0,1) i o funcie de repartiie, F. S se construiasc o funcie f astfel
ca funcia de repartiie a variabilei aleatoare X = f(U) s fie F.
Sau, mai general, se dau k variabile aleatoare (Uj)1jk i.i.d., repartizate
Uniform(0,1) i se cere s se construiasc o funcie f:k ca n aa fel nct
variabila aleatoare X = f(U1,...,Uk) s aib funcia de repartiie F.
Exist mai multe medii de programare care fac acest lucru n cazul
repartiiilor clasice. De exemplu, n R, mediu de programare gratuit, care se
poate descrca de pe internet exist posibilitatea simulrii (i nu numai) cel puin
a urmtoarelor repartiii
Repartiia Numele ei n R Parametri
beta beta ,
binomial binom k,p
Cauchy cauchy m,a
2
chisQ n
exponential exp
F f m,n
gamma gamma ,
geometric geom p
hipergeometric hyper a, n, k1
log-normal lnorm ,
logistic logis , 2
negativ binomial nbinom k,p
normal norm ,3
Poisson pois

1
Extragem k bile dintr-o urn cu a bile albe i n bile negre; X este numrul de bile albe.
2 1
Repartiia logistic are funcia de repartiie x
. Este mai rar folosit..

1 e
3
n codificarea R, x=rnorm(1,,) produce o variabila aleatoare X N(,2). Parametrul al
doilea reprezint abaterea medie ptratic i nu variana. Uneori se face confuzie.
163
Student t n
uniform unif a,b
Weibull weibull k,
Wilcoxon wilcox m, n

Pentru a genera un vector cu n componente i.i.d. cu aceste repartiii se


pune n faa numelui lor din R litera r. 4 Apoi se pune numrul de variabile
aleatoare dorite i parametrii repartiiei.
De exemplu:
x=rnorm(100,10,4);x : x este un vector cu 100 de componente repartizate
2
N(10,4 )
x=rbinom(10,10,.4);x
[1] 3 5 1 5 4 6 4 5 6 3 : x este un vector cu 10 componente repartizate
Binomial(10,.4)
x=rnbinom(6,10,.4);x
[1] 19 8 9 25 8 19 : x este un vector cu 10 componente repartizate
Negbin(10,.4)
x=rhyper(10,4,6,6);x
[1] 3 2 3 3 2 2 2 2 1 3 : x este un vector cu 10 componente
Hypergeometric(4,6,6)

ntrebarea este cum generm noi variabile aleatoare cu o repartiie care nu


face parte din cele simulate de mediile de programare?

6.1. Simularea repartiiilor pe dreapt

Algoritmul general: metoda cuantilei

Cum putem folosi o variabil U Uniform(0,1) pentru a simula o


variabil aleatoare X cu o repartiie dat?
S presupunem pentru nceput c funcia de repartiie a lui X este
bijectiv. Mai precis, presupunem c exist un interval I astfel ca F: I [0,1]
s fie bijectiv. Cum este i cresctoare, firete c ar trebui ca F s fie i continu
dac ar fi discontinu ntr-un punct a, atunci imaginea sa, Im(F), nu ar conine
intervalul (F(a-0), F(a)).

4
Dac vrem s le calculm funcia de repartiie punem p, pentru densitate punem d iar pentru
cuantile (vezi mai jos) punem Q. De exemplu
x=pnorm(1,0,1);y=dnorm(1,0,1);z=Qnorm(0.01,0,1) va produce numerele x = 0.8413447 (cci
1 2
(1) = 0.8413447), y = 0.2419707 = ex /2
cu x = 1 i z = -2.326348 = -1(0.02)
2
164
Observaia fundamental este c variabila aleatoare X = F-1(U) are exact
funcia de repartiie F. Acesta este algoritmul inversei funciei de repartiie.
ntr-adevr, dac x [0,1], atunci , innd seama de ipoteza c U Uniform (0,1)
P(U x) = x x [0,1], avem P(X x) = P(F -1(U) x) = P(F(F -1(U)) F(x)) deci
P(X x) = P(U F(x)) = F(x). (6.1.1)
n general, funciile de repartiie nu sunt bijective. Dac, de exemplu, X
x
Uniform(1,2,...,n), atunci F(x) = 1 ia doar valorile k/n cu 0 k 1. Este o
n
situaie tipic pentru repartiiile discrete. Dar, chiar dac repartiia este continu,
e posibil ca F s nu fie injectiv. De exemplu, dac X Uniform([0,1][2,3]),
atunci FX este constant pe intervalul [1,2](verificai: F(x) = (x+1 + (x-2)+1)/2 ).
Ce se mai poate salva n acest caz din algoritmul anterior?
Ideea este s nlocuim inversa cu cuantila.

Definiia 6.1.1. Fie F o funcie de repartiie. O cuantil a sa este orice funcie


real Q = QF definit pe ( 0,1) cu proprietatea c F(Q(u)-0) u F(Q(u)) u.

Dac F este inversabil, exist o unic cuantil, anume inversa lui F : Q = F -1


Dac nu, pot exista o infinitate. De exemplu, dac X Binomial (1, ) =
Uniform(0,1), atunci F(x) = pentru x [0,1) . Verificai c orice funcie de
forma Q(u) = 1( ,1)(u) + 1 cu (0,1) este o cuantil.

Propoziia 6.1.2. Fie F: [0,1] o funcie de repartiie i Q:(0,1) o


cuantil a sa. Fie U o variabil aleatoare repartizat Uniform(0,1). Atunci X =
Q(U) este o variabil aleatoare avnd funcia de repartiie F.

Demonstraie
Observm c orice cuantil este o funcie cresctoare. ntr-adevr, dac
u<v , atunci Q(u) Q(v) deoarece n caz contrar, Q(u) > Q(v) F(Q(u) 0)
F(Q(v)) u F(Q(u)-0) F(Q(v)) v u v.
Artm c U < F(x) Q(U) x U F(x) i va fi suficient, pentru c
atunci rezult c P(U < F(x)) P(Q(U) x) P(U F(x)) de unde, cum U
Uniform(0,1), deducem c P(Q(U) x) = F(x).
Presupunem Q(U) x. Atunci F(Q(U)) F(x). Dar, din definiia cuantilei, U
F(Q(U)), deci U F(x). Am demonstrat c
Q(U) x U F(x) (6.1.2)
S presupunem acum c Q(U) > x. Atunci F(Q(U) 0 ) F(x) . Dar, tot din
definiia cuantilei. U F(Q(U) 0) , deci U F(x).Aadar Q(U) > x U F(x)
Trecnd la complementar,avem c
Q(U) x U < F(x) (6.1.3)
Din (6.1.2) i (6.1.3) deducem c U < F(x) Q(U) x U F(x).
q.e.d..

165
Dou sunt cazurile extreme care intereseaz n calcule: cuantil inferioar i
cuantila superioar.
Cuantila inferioar, notat cu Q -, se definete prin relaia
Q (u) = supF < u = infF u (6.1.4)
iar cea superioar, notat cu Q + se definete prin
Q + (u) = supF u = infF > u (6.1.5)

Propoziia 6.1.3. Funciile definite prin relaiile (6.1.4) i (6.1.5) sunt cuantile.
Orice alt cuantil Q este cuprins ntre ele: Q Q Q + .

Demonstraie
Din definiia supremului avem urmtoarele lucruri evidente
F(Q (u) ) < u , F(Q (u) + ) u > 0
F(Q+(u) ) u , F(Q+(u) + ) > u > 0
Trecnd la limit cu 0, deducem c F(Q (u) 0) u , F(Q (u) + 0) u i
F(Q+(u) 0) u , F(Q+(u) + 0) u. Dar F este continu la dreapta, deci
ambele funcii verific definiia cuantilei.q.e.d.

Exemplul 6.1.4. Dac X Uniform(0,1) atunci F(x) = pentru x [0,1) .


Cuantilele inferioar i superioar sunt Q (u) = 1( ,1)(u), Q+(u) = 1[ ,1)(u) = [2u]
deci X = [2U] este o variabil aleatoare cu repartiia cerut.

Exemplul 6.1.5. Dac X Uniform(1,2,...,n), atunci Q+(u) = 1 + [nu] X = 1 +


[nU]

Exemplul 6.1.6. Dac X Exponential(1), atunci F(x) = 1 e x este chiar


bijectiv de la (0,) la (0,1), deci Q + = Q - = F -1 Q(x) = - ln(1 u). Putem pune
X = - ln( 1 U). Dar U i 1 U au aceeai repartiie, Uniform(0,1), deci putem
la fel de bine s punem X = - ln U.

Exemplul 6.1.7. Dac X Negbin(1,p), atunci F(x) = 1 q[x]+1 , unde x 0 i q =


ln u ln u
1 p. O cuantil a sa este Q(u) = . Deci X = ln 1 p este o
ln 1 p
variabil aleatoare cu repartiia cerut.

Exemplul 6.1.8. n general, dac repartiia F este discret,


a1 a 2 a 3 ... ....
F cu a1 < a2 < a3 < ..., atunci cuantilele ei sunt
p1 p 2 p3 ... ...
Q+(u) = a110,s1 u a21s1, s2 u a31s2 ,s3 u .... i
Q1(u) a11(0,s1]u a21(s1 ,s2 ]u a31(s2 ,s3 ]u .....
unde s1 = p1, s2 = p1+p2, s3 = p1 + p2 + p3 ...

166
Deci variabila aleatoare X = sk 1sk 1 , sk U are exact repartiia F .
k 1

Iat un script n R care calculeaz cuantila unei repartiii discrete


a1 a2 a3 ... ak
. Aici a este vectorul care contine valorile variabilei
p1 p2 p3 ... pk
aleatoare X; p este vectorul care cuprinde probabilitile ca s se ia aceste
valori. Ambii vectori au lungimea k. Vectorul o este permutarea care trebuie
fcut pentru ca numerele ai s fie puse n ordine cresctoare iar F este
repartiia propriu-zis; acum e scris canonic. Vectorul s cuprinde sumele sk =
p1 + p2 +...+ p3 . Interesant este ct de simplu este de gsit locul lui u: instruciunea
which(s >= u) produce mulimea J(u) = i: siu creia i se ia primul element i =
min(J(u)) = Q+(u).

cuantila<-function(u,a,p)
{o=order(a) #sortez pe a, pentru ca se poate sa
nu fie in ordine
F=rbind(a[o],p[o]); a=F[1,]; p=F[2,]
#calculez sumele partiale
s=p; for (i in 1:length(a)){s[i]=sum(p[1:i])}
#caut locul lui u
v=which(s>=u);i=min(v); q=a[i]
q}

Apelarea funciei se face cu instruciunea q=cuantila(u,a,p)


Un exemplu concret: s se simuleze n =1000 variabile aleatoare avnd repartiia
1 6 0 1 2 3
F=
10 2 1 2 1 4
n=1000;a=c(-
6,0,1,2,3);p=c(2,1,2,1,4)/10;u=runif(n,0,1)
x=u;for (i in 1:n) {x[i]=cuantila(u[i],a,p)}

Pentru a verifica dac e bine, folosim instruciunea table(x) care arat


repartiia empiric a unui vector x : sub fiecare valoare diferit pe care o ia
vectorul se scrie numrul de apariii a acelei valori (frecvena absolut). n cazul
nostru avem:

table(x)
x
-6 0 1 2 3
195 99 190 98 418

167
Valorile frecvenelor absolute corespund celor teoretice, care ar fi trebuit s fie
200,100, 200,100,400. Deci ese plauzibil. Exist metode de verificare a
acurateei modelulului dat de o repartiie : de exemplu metoda qqplot.5
Pentru valori relativ mici ale lungimii k a vectorilor a i p algoritmul este
satisfctor i rapid. Poate fi folosit pn la k 1000.
Dac, ns, vectorii au lungime prea mare ncep s apar erori de main
i, pe de alt parte, viteza lui scade. Este i normal. De aceea, dac se poate, ar fi
bine s fie folosii algoritmi rapizi bazai pe diverse le repartiii care se pot obine
din repartiia uniform.
Problema este de a calcula cuantila dac repartiia F nu este neaprat
discret i cu suportul format dintr-o mulime cu numr mic de elemente.
Chiar dac avem funcia de repartiie F dat printr-o formul analitic (de
exemplu F(x) = pF1 + qF2 cu F1 = Exp(1), F2 = Gamma(2,1) F(x) = 1 (1 + qx)e-x )
nu avem formule pentru a calcula inversa F -1(u) (n cazul de mai sus ar trebui
rezolvat ecuaia 1 (1 + qx)e-x = u , 0<u<1, care este o ecuaie transcendent).
Pentru a iei din dilem ar trebui s facem o discretizare a lui F. nlocuim funcia
de repartiie F cu repartiia Fd = a1 a2 ... ak unde este

F (a ) F(a ) F a ... F (a ) F a 1 F a
1 2 1 k k 1 k

un numr mare i aplicm algoritmul cuantilei pentru aceast repartiie. Eventual


un algoritm modificat n care nlocuim funcia Fd cu o linie poligonal care
unete punctele de coordonate (aj,F(aj))j . Sigur c pierdem din precizie.

Algoritmi speciali bazai pe proprieti ale repartiiilor

Dou sunt operaiile mai importante care se fac cu repartiiile: mixtura i


convoluia.

Definiia 6.1.9. Fie (Fj)1jn o mulime de repartiii pe dreapt i fie (pj)1jn


numere pozitive i de sum 1. Atunci repartiia F = p1F1 + ...+ pnFn se numete
mixtur de F. Dac Xj Fj sunt variabile aleatoare independente, atunci
repartiia sumei lor S=X1 + ...+ Xn este F1F2...Fn.

De exemplu, dac F(x) = pF1 + qF2 cu F1 = Exp(1), F2 = Gamma(2,1),


atunci F este o mixtur de exponenial cu Gamma.
Observaia este c dac tim s simulm variabilele Xi, atunci simulm
mai uor variabilele X (cu repartiia F) i S (cu repartiia F1F2...Fn), fr a
trece prin metoda pseudoinversei. Pentru S nu avem ce comenta, dar nu este
absolut evident cum construim pe X.

5
Chiar n R exist instruciunea qqplot.
168
Propoziia 6.1.10. Fie Xj Fj cu 1 j n i fie J o variabil aleatoare
1 2 ... ... n
independent de (Xj)j cu repartiia J . Atunci variabila X := XJ
p1 p2 ... ... pn
n
are repartiia F = p j F j .
j 1

Demonstraie
n n n

P(X x) = P(XJ x) = P X J x; J j P X j x PJ j F j x p j q.e.d.
j 1 j 1 j 1
Deci, revenind la exemplul nostru cu F = pGamma(1,1) + qGamma(2,1)
1 2
algoritmul exact este: simulm variabila J . Dac J = 1, simulm X
p q
Exp(1) = Gamma(1,1) iar dac J=2 simulm X = Gamma(2,1). Dup cum se
vede n scriptul urmtor, care folosete funcia cuantila din paragraful anterior

mixtura<-function(n,p) # simuleaz n variabile aleatoare pExp(1)+qgamma(2,1


{a=c(1,2);pr=c(p,1-p)
x1<-rexp(n,1) # simuleaz n variabile aleatoare Exp(1)
;x2<-rgamma(n,2,1) # simuleaz n variabile aleatoare Gamma(2,1)
z<-rbind(x1,x2) # se formeaz cu ele o matrice z de tip 2n
x=x1 # se iniializeaz x
for (i in 1:n)
{u=runif(1,0,1) # se genereaz o variabil aleatoare U Uniform(0,1)
j=cuantila(u,a,pr) # se genereaz variabila aleatoare J
x[i]=z[j,i] # x = z(J,.)
}
x # se simuleaz n variabile aleatoare Exp(1)
}
Ne putem convinge c este aa dac ncercm mai multe variante de p.
Pentru p = 0 avem variabile repartizate Gamma(2,1); pentru p = este o mixtur
cu ponderi egale iar pentru p = 1 avem doar variabile repartizate Exp(1). Scriptul
urmtor face cte 5000 de simulri de fiecare tip i apoi face greficul celor trei
funcii de repartiie empirice, care ar trebui s semene cu cele adevrate

t=1:5000;t=t/5000
xo=mixtura(5000,0);xo=sort(xo)
xm=mixtura(5000,0.5);xm=sort(xm)
xu=mixtura(5000,1);xu=sort(xu)
plot(xo,t,type="l");lines(xm,t,col="red");
lines(xu,t,col="blue")

169
Exemplul 6.1.11. S presupunem c nu avem acces la un software performant,
dar vrem s simulm o variabil aleatoare X Gamma(n,) cu n numr ntreg.
Cum facem?

Soluie
Variabilele Xj = (- lnUj)/ sunt repartizate Exp(). Dar Gamma(n,) = Exp()n
n

ln U
j 1
j

exponeniala convolutat cu ea nsi de n ori. Deci soluia este X


Dar dac vrem s simulm X N(,2) i nu avem dect un software de


baz? Firete, este suficient s simulm Y N(0,1) i apoi s punem X = +
Y. Dar cum simulm o normal standard? Algoritmul cuantilei nu ne d dect o
aproximare, pentru c nu putem calcula exact nici mcar , funcia caracteristic
a repartiiei N(0,1), cu att mai puin s i calculm i cuantila. Putem face o
aproximare bun, este adevrat, dar asta cere timp.

Propoziia 6.1.12. Metoda Box Muller. Fie U,V Uniform(0,1) dou variabile
aleatoare independente. Atunci variabilele X = sin(2U) 2 ln V , Y =
cos(2U) 2 ln V sunt dou variabile aleatoare independente repartizate
0 1 0
N(0,1). Deci (X,Y) N( , )
0 0 1

170
Demonstraie
Avem de artat c dac f:2 este o funcie continu i mrginit,
x2 y2
1
atunci Ef(X,Y) = f x, y e 2 dxdy
2
Din formula de transport
1 1
Ef ( X , Y ) f ( 2 ln u cos(2 ), 2 ln u sin( 2 ))dudv (6.1.6)
0 0
Facem schimbarea de variabil
x 2 ln u cos2v , y 2 ln u sin 2v (6.1.7)
2 2
Rezult x + y = 2lnu , de unde
x2 y2

ue 2 (6.1.8)
sin 2v
2 2 ln u cos2v
D x. y 2
Iacobianul este u 2 ln u =
Du , v cos2v 2 2 ln u sin 2v u
u 2 ln u
Imaginea mulimii [0,1] [0,1] prin aceast transformare este 2 \ {0}.Cum
punctul {0}este o mulime neglijabil fa de msura Lebesgue n plan, deducem
din relaia (6.1.8) c
x2 y2

2 u e 2
dxdy = dudv dudv = dxdy = dxdy deci relaia (6.1.6) devine
u 2 2
x2 y2
1
1 1
0 0 f
2 ln u cos2v , 2 ln u sin 2v dudv =
2
f x, y e 2 dxdy

(6.1.9)
exact ceea ce trebuia verificat.q.e.d.

Prin metoda Box Muller se genereaz variabile aleatoare normale


folosind doar dou variabile uniform repartizate. Este evident o mare
simplificare.

Exist i o metod exact de a simula repartiia Poisson(), fr a calcula


cuantilele. Uneori ea este mai rapid.

Propoziia 6.1.13. Fie (Un)n Uniform(0,1) un ir de variabile aleatoare i.i.d.


Fie
N = minn 1 : U1U2...Un < e - 1 (6.1.10)
Atunci N Poison().

Demonstraie

171
ln U n
Fie n = i Tn = 1 + ...+ n. Atunci n sunt i.i.d. repartizate

Exponential(). Logaritmnd expresia din (6.1.10) avem N = min n : Tn > 1. Deci
P(N = 0) = P(T1>1) = e- iar dac n 1, atunci P(N = n) = P(Tn 1, Tn+1 > 1 = P(Tn
1) P(Tn+1 1) = P(Tn+1 > 1) P(Tn > 1). Dar Tn Gamma(n,1), deci

t 2t 2 n 1t n1 t
P(Tn > t) = 1 .... e (6.1.11)
1! 2! n 1!

nt n t
Rezult c P(Tn+1 > t) P(Tn > t) = e . Am demonstrat chiar mai
n!
mult: c dac punem N(t) = min n : Tn > t, atunci N(t) Poisson(t). 6q.e.d.

Deci dac dorim s simulm, de exemplu, N Poisson(1), nmulim un


ir de variabile aleatoare uniform repartizate pn cnd produsul lor devine mai
mic dect 1/e. Dac pentru acest lucru a fost nevoie de n variabile aleatoare,
atunci declarm c N = n -1.
n statistica Bayesian apare frecvent repartiia Beta(m,n). Dac m i n
sunt numere ntregi, i aceste repartiii se pot simula fr a se calcula cuantilele.

Propoziia 6.1.14. Fie (Uj)1 j n Uniform(0,1) independente. Sortm aceste


variabile aleatoare sub forma ( U(1) < U(2) < ...< U(n)). Atunci U(k) Beta(k, n+1 k).

Demonstraie
Fie An,k = exact k dintre variabilele aleatoare Uj sunt mai mici dect x
Evident P(An,k) = Cnk x k 1 x n k . S observm c evenimentul (U(k) x) se poate
scrie sub forma An,k An,k+1 ...An,n. Cum mulimile (An,j)0 j n sunt disjuncte,
gsim c funcia de repartiie a lui (U)(k) este P(U(k) x) =
C nk x k 1 x n k + C nk 1 x k 1 1 x n k 1 +....+ C nn x n 1 x nn , care este exact funcia de
repartiie a unei variabile aleatoare Beta(k,n+1 k). Densitatea sa este

fk(x) = kC nk x k 1 1 x n k (6.1.12)

Exemplul 6.1.15. S simuleze o variabil aleatoare X Beta(10,2). Acum n


= 10 + 2 1 = 11. Simulm 11 variabile uniforme i le sortm; o lum pe cea de
a zecea. Dac avem la dispoziie un program de sort, nu e nici o problem.
De exemplu, n R secvena ar fi:
u = runif(11);u=sort(u);x=u[10]

6
Procesul stochastic (N(t))t0 se numete procesul Poisson de intensitate . Se poate demonstra
c el este cu creteri independente, adic dac t1 < t2 < ...< tn, atunci variabilele aleatoare (N(t1),
N (t2) - N(t1),......, N (tn) - N(tn-1) ) sunt independente.
172
Simularea repartiiilor d dimensionale

6.2. Algoritmul general: teorema de descompunere


Ideea de baz este urmtoarea: orice repartiie d-dimensional se poate
scrie ca produsul dintre o probabilitate pe dreapt i mai multe probabiliti de
trecere.
Pentru a nelege, s studiem urmtorul exemplu simplu
Un punct aleator bidimensional Z = X + iY (l scriem ca numr complex,
este mai simplu)
1 0 1 2 1 i 2i 1 i i 1
Z
8 1 1 1 1 1 1 1 1
1 1 0 1 2
Atunci X . Dac X = -1, atunci Y poate lua dou valori,
8 2 3 2 1
0 i 1. repartiia sa condiionat de faptul c X = -1 se o scriem (abuz de notaie,
dar sugestiv)
1 0 1 1 0 1 2
(Y X = -1) . Analog, avem (Y X = 0) , (Y X = 1)
2 1 1 3 1 1 1
1 0 1
i, n sfrit, (Y X = 2) 0.
2 1 1
Pentru a-l genera, simulm mai nti prima component, cu algoritmul
cuantilei. Apoi avem patru variante: dac X = -1, sau X = 1 simulm pe Y
1 0 1 1 0 1 2
. , dac X = 0 simulm Y iar dac X = 2, punem Y = 0.
2 1 1 3 1 1 1
Ideea este c P(X = i, Y = j) = P(X = i)P(Y = j X = i). Pentru fiecare
valoare a lui X avem o alt repartiie pentru Y, repartiia condiionat.
Generm pe X i, apoi, depinznd de valoarea lui X simulm pe Y cu repartiia
condiionat (Y X = x).
Formal, acest lucru se poate generaliza astfel:

Algoritmul general. Fie Z = (X,Y) E F un vector aleator. S presupunem c


repartiia lui X este i c exist o familie de repartiii pe F, (Qx)x E cu
proprietatea c P(Y B X) = QX(B). Atunci repartiia vectorului Z este Q.

Familia de probabiliti (Qx)x E se numete repartiia lui Y condiionat


de X. Un mod intuitiv de a o nota este FY X . Un mod i mai intuitiv este s
scriem Qx = FY X = x . Aceasta este notaia din statistic. Avem de lmurit ce
nseamn probabilitatea condiionat P(Y B X). Dac X este discret, nu e nici
o problem: P(Y B X) = PY B | X x 1 X x unde A = x E P(X = x) > 0).
x A
Dar dac X este continu, avem o problem, deoarece P(YB X = x) nu are
sens.
173
Definiia 6.2.1. Probabilitate condiionat, medie condiionat. Fie (,K,P) un
spaiu probabilizat, Y: F, X: E dou variabile aleatoare cu valori n
spaii msurabile(E,E) i (F,F). Fie B F. Atunci definim P(Y B X) = E(1B(Y)
X).
Dac U: este o variabil aleatoare, cu moment de ordin 1, atunci definim
E(U X) = (X) E(U(X)) = E((X)(X))
:E msurabil i mrginit.
Se demonstreaz c media condiionat exist i c, n caz c U are i moment
de ordin 2, ea are urmtoarea proprietate de optim
E(U - (X))2 E(U h(X))2 h: msurabil ca E[h(X)]2 < .

Media condiionat are trei proprieti importante, care se folosesc n practic:

- Dac X i Y sunt independente, atunci E[h(Y) X] = Eh(Y) (la


independen nu conteaz condiionarea). Cum o variabil aleatoare constant
este independent de orice alt variabil aleatoare, deducem c dac X este
constant, E[h(Y) X] = Eh(Y).
- E[h(X) X] = h(X) i, mai general, E[h(X)Y X] = h(X)E[Y X] (funciile
X-msurabile se comport precum constantele). Aici h este o funcie msurabil
i mrginit.
- E[E[Z X,Y] X] = E[Z X ] (proprietatea de iterativitate).
n particular, dac X = constant (mod P) avem E[E[Z Y]] = E[Z].

Deci, a spune c repartiia lui (Y X) este Q neamn a spune c


E[h(Y )X] = h y dQ X y pentru orice funcie msurabil h: E (6.2.1)
Un alt mod de a scrie acelai lucru (de multe ori mai comod) este
E[h(Y) X] = h( y )Q ( X , dy ) (6.2. 2)
Relaia (2.1.1) se poate prelungi la funcii de dou variabile
E[h(X,Y) X ] = h X , y Q X , dy (6.2.3)
ntr-adevr, formula (6.2.3) este imediat dac h(x,y) = f(x)g(y), apoi se
prelungete la indicatori de mulimi de forma h = 1AB ; familia mulimilor C
pentru care formula este adevrat este un u sistem, deci aceast familie
conine -algebra E F etc .
Existena repartiiilor condiionate este dat de:

Teorema 6.2.2 Teorema de dezintegrare. Fie P o probabilitatea pe E F unde E


= m i F = n. Fie (A) = P(AF). Atunci exist o probabilitate de trecere de la E
la F, notat cu Q n aa fel nct P = Q

Nu vom demonstra aceast teorem. Se gsete n manualele de teoria


probabilitilor, de exemplu G. Ciucu, C. Tudor, Teoria probabilitilor, Editura

174
Academiei, Bucureti 1981 sau I. Cuculescu, Teoria Probabilitilor, Editura ALL,
Bucureti 1998. Sau se poate cuta pe internet, Dissintegration Theorem.

Important este s lmurim ce spune teorema i s nelegem cum se


aplic.

Definiia 6.2.3. Fie (E, E) i (F, F) spaii msurabile. O funcie Q:E F [0,1]
se numete probabilitate de trecere de la E la F dac
(i) aplicaia x Q(x, B) este msurabil pentru orice B F
(ii) aplicaia B Q(x, B) este o probabilitate pe F pentru orice x E

Putem gndi o probabilitate de trecere i altfel: ca o colecie de


probabiliti pe F, (Qx)x E. Condiia (i) este una tehnic, pentru a se putea face
calcule.

Exemplul 6.2.4. Familiile clasice de repartiii de pe dreapt pot fi gndite ca


fiind probabiliti de trecere: Q = Exponential() este o probabilitate de trecere
de la (0,) la (0,), Q(n,p) = Binomial(n,p) este o probabilitate de trecere de la
1,2,3,...[0,1] la , etc..

Produsul dintre o probabilitate pe E i una de trecere de la E la F se


definete astfel:

Definiia 6.2.5. Fie (E,E) i (F,F) dou spaii msurabile, o probabilitate pe E


i Q o probabilitate de trecere de la E la F. Atunci Q este o probabilitate pe
(EF, C F) definit prin
Q(C) = Qx C ( x,.)d x (6.2.4)
unde C(x,.) = y F (x,y) C. Dac observm c 1C(x,.)(y) = 1C(x,y), atunci
putem scrie formula (2.1.4) ca
Q(C) = 1C x, y.dQx y d x . (6.2.5)

Astfel obinem o formul de integrare fa de probabilitatea produs.


Definirea n acest mod a produsului este motivat de urmtorul rezultat
care justific algoritmul general

Propoziia 6.2.6. Fie Z = (X,Y) un vector aleator cu valori n spaiul msurabil


(EF, EF). Dac este repartiia lui X i Q este repartiia lui Y condiionat
de X, atunci repartiia lui Z este Q.

Demonstraie
Fie f:EF o funcie msurabil. Avem f x, y d Qx, y =
( f x, y dQx y )d x = h x d x unde h(x) = f x, y dQx y .

175
Cum este repartiia lui X, formula de transport spune c h x d x =
Eh(X) . Dar h(X) = f X , y dQX y = E[f(X,Y) X] (conform cu (2.1.3), deci Eh(X) =
E[E[f(X,Y) X]] = Ef(X,Y) (proprietatea de iterativitate). Aadar Ef(X,Y) =
f x, y d Qx, y . Cum egalitatea este valabil pentru orice f msurabil i
mrginit, rezult c repartiia lui Z = (X,Y) este Q.

Scrierea statistic a acestei propoziii este


F(X,Y) = FX F(Y X) (6.2.6)
Principiul este
nmulim repartiia lui X cu repartiia lui Y condiionat de X.
Avantajul este c formula se poate generaliza
F(X,Y,Z) = F X F( Y | X ) F( Z | XY ) (6.2.7)
n general am avea
F( X1 , X 2 ,..., X n ) FX 1 F( X 3 | X 1 , X 2 ) ... F( X n | X1,..., X n 1 )
(6.2.8)

Exist dou situaii n care aplicarea algoritmului nu pune probleme:


Cazul discret
z z z ... z
S se simuleze un vector aleator Z 1 2 3 n
unde
p1 p2 p3 ... pn
z j z j ,1 ,..., z j , d sunt vectori d dimensionali. Atunci formula (6.2.8) revine la
P(X1=x1,X2=x2,...,Xd=xd)= P X1 x1P X2 x2 | X1 x1....P Xd xd | X1 x1,...,Xd1 xd1 (6.2.9)

Cazul absolut continuu. Acum presupunem c vectorul d - dimensional


Z are densitatea fZ. Atunci se verific imediat c i repartiiile F X k | X 1 ,..., X k 1 au
densiti, notate f X k | X 1 ,..., X k 1 care se calculeaz astfel: mai nti calculm
densitile celor d vectori de dimensiune k d. Este imediat c
f X 1 ,..., X k x1 ,..., xk f Z x1 ,..., xk , xk 1 ,..., xd dxk 1dxk 2 ...dxd . Apoi punem
d k

- f X1 x1 f x1 , x2 ,..., xd dx2 dx3 ...dxd


d 1
f X1 , X 2 X 1 , x2
- f X 2 | X 1 x2
f X1 X1
f X 1 , X 2 , X 3 X 1, X 2 , x3
- f X 3 | X1 , X 2 x3
f X1, X 2 X 1 , X 2
- ......................
Dac folosim notaiile statistice formulele devin mai uor de neles

176
f X 1 , X 2 x1 , x2
f X1 x1 f x1 , x2 ,..., xd dx2 dx3 ...dxd , f X 2 | X 1 x1 x2
d 1 f X 1 x1
f X 1 , X 2 , X 3 x1, x2 , x3
f X 3 | X1 x1 , X 2 x2 x3 ,... (6.2.10)
f X 1 , X 2 x1 , x2

Exemplul 6.2.7. S se simuleze un vector X repartizat Multinomial (100;


0.1,0.2,0.7).

Soluie
Repartiia multinomial Multinomial (n ; p1,p2,p3,...,pk) este o repartiie k
dimensional discret definit prin densitile discrete
n! i
p(i1,...,ik) = p i1 p i2 ... pkk
i1!i2 !...ik ! 1 2
Aici (i1,...,ik) 0,1,...,nk. n cazul acesta, discret, putem s renunm la
teorie i s simulm vectorul nostru Z ca pe orice variabil aleatoare discret:
codificm cumva vectorul (i1,...,ik) de exemplu l gndim c ar fi un numr scris
n baza (n+1) i apoi aplicm metoda cuantilei. n cazul particular de mai sus,
am avea de a face cu o variabil aleatoare cu (100 +1)3 componente. Se poate, dar
nu v sftuiesc.
Dar, dac inem seama de interpretarea probabilistic a acestei repartiii
(se extrag cu revenire n bile dintr-o urn cu bile de k culori diferite, urn n care
pj este proporia bilelor de culoare j !) se verific imediat c
p2
X1 Binomial(n,p1), (X2 X1 ) Binomial(n X1, ),
p2 ... pk
p3
(X3 X1 ,X2) Binomial(n X1 X2, ), etc
p3 ... pk
n cazul nostru concret X1 Binomial(100, 0.1); (X2 X1) Binomial(100 X1,
0.2/0.9) iar X3 = 100 X1 X2.
Secvena de instruciuni care simuleaz n R N = 10 asemenea vectori este

n=100;p1=.1;p2=.2/(1-p1);N=10
x1=rbinom(N,n,p1);x2=rbinom(N,n-x1,p2);x3=n-x1-
x2;x=cbind(x1,x2,x3);x
x1 x2 x3
[1,] 8 23 69
[2,] 5 23 72
[3,] 8 20 72
[4,] 14 24 62
[5,] 13 23 64
[6,] 8 16 76
[7,] 4 32 64
[8,] 8 25 67
[9,] 10 21 69
[10,] 10 21 69

177
Exemplul 6.2.8. S se simuleze un vector X Uniform(C) unde C este sfera
tridimensional unitar de raz 1: C = (x,y,z) 3 x2 + y2 + z3 1

Soluie
Amintim c un vector X se numete repartizat uniform ntr-un compact din k de
volum nenul dac P(X B) = k(B C) / k(C). O definiie alternativ este c
densitatea sa fX = 1C unde = 1/ k(C). Aici k este msura Lebesgue k
dimensional.
3
n cazul nostru fX(x,y,z) =1C x, y , z - deoarece volumul sferei este 413/ 3.
4
3
Folosim formulele (6.2.10.) Mai nti, f X1 x 1C x, y, z dydz . Integrala
4
aceasta reprezint aria seciunii prin sfer fcut prin punctul (x,0,0); seciunea
are form de cerc cu raza r = 1 x 2 , deci aria este (1 x2), deci
3

3 1 x2 f X 1 , X 2 x, y 1C x, y, z dz
f X1 x . Apoi, 4 ; integrala este lungimea
4
seciunii fcute n sfer (x,y,0) , care este intervalul [- 1 x 2 y 2 1 x 2 y 2 ],

3 1 x2 y 2
deci avem f X 1 , X 2 x, y 1x2 y 2 1 . Deci avem n concluzie
2

f X1 x

3 1 x2
4

2 2
2 1 x y
f X 2 | X1 x y 1 y
1 x2 1 x 2 , 1 x 2

f X 3 | X1 x , X 2 y z

2 1 x2 1 z
1 x 2 y 2 , 1 x 2 y 2
3 1 x y2
2

Principial ar trebui s simulm pe X1 dup prima densitatea. Cu valoarea lui X1 =


x astfel obinut simulm pe X2 dup a doua. Gsim X2 = y i, cu x i y astfel
gsii, simulm pe X3.
Se poate face, dar necesit timp i la calculul cuantilelor se pierde mult din
precizie. Poate e loc i de mai bine.q.e.d.

1 4 3
Exemplul 6.2.9. S se simuleze un vector X N( , )
1 3 9

178
Soluie
2 r
n general, dac X N( 1 , 1 1 2
2
), atunci se demonstreaz uor,
r
2 1 2 2
folosind funcia caracteristic sau ce generatoare de momente, c
2
2
, 2 1 r 2 )
X1 N(1,12) i (X2 X1 ) N( 2 r ( X 1 1 )
1
n cazul nostru 1 = 2 = 1, 1 = 2, 2 = 3, r = 0.5. n R este foarte simplu:

mu1=1;mu2=1;sig1=2;sig2=3;r=.5;N=10
x1=rnorm(N,mu1,sig1);mu2yx=mu2+r*x1*sig2/sig1
x2=rnorm(N,mu2yx,sig2*sqrt(1-r^2));x2
cbind(x1,x2)

x1 x2
[1,] 1.4348022 -0.4392765
[2,] 2.9756048 1.3576312
[3,] 1.4325336 5.1186160
[4,] 3.6110443 0.2845141
[5,] -1.6309399 -0.8586991
[6,] -1.1127450 -3.2264889
[7,] -1.7916329 -3.2797160
[8,] 0.2004633 5.0036828
[9,] 3.4808525 5.0187472
[10,] -0.2603470 2.8354261

n figura alturat vedem rezultatul a 5000 de simulri.

Pentru dimensiuni mai mari, algoritmul general nu mai este satisfctor nici
pentru simularea vectorilor aleatori normali, deoarece formulele de calcul pentru
(Xj X1,...,Xj-1) devin tot mai complicate.
179
6.3. Algoritmi speciali: repartiii uniforme
Problema 6.3.1. Fie C k o mulime compact de volum k(C) > 0. S se
simuleze un vector X Uniform(C).

Am vzut c algoritmul general pune mari dificulti chiar n cazurile


simple. De exemplu, chiar i pentru o mulime simpl, cum ar fi simplexul C = 3
= (x,y,z) [0,1]3 : x + y + z 1,unde densitile sunt uor de calculat am avea
probleme: f = 61C, f X1 x 31 x 2 1(0,1)(x), f X1 , X 2 x, y 61 x y 1x y 1
21 x y
f X 2 | X1 x y 11 x,1 y . La prima densitate e uor de calculat cuantila, la
1 x 2
a doua e greu.

Algoritmul acceptare / respingere. Ideea este s generm vectori


aleatori unifom repartizai ntr-o mulime mai mare, unde este comod de fcut
aceasta, i s reinem doar acei vectori care sunt C. Cel mai comod este s
includem C ntr-un hiperparalelipiped [a1,b1]...[ak,bk]
Formal, rezultatul este urmtorul:

Propoziia 6.3.2 Fie C A k dou compacte de msur pozitiv i fie (Xn)n un


ir de vectori aleatori i.i.d. repartizai Uniform(C). Fie N = inf n : Xn C i Z =
XN.
Atunci Z Uniform(C).

Demonstraie
Fie p = P(Xn C). Atunci P(N = n) = p(1 p)n-1, deci probabilitatea ca nu
nimerim niciodat n C este 0. Fie B C o mulime borelian. Atunci

P(Z B) = P(XN B) = P X N B, N n =
n 1


P X j Cj n, X n B PPXX n BC) PX j Cj n, X n C =
n 1 n n 1

P X n B P X n B k B / k A k B
p 1 p n 1 = , exact ce voiam.
P X n C ) n 1 P X n C ) k C / k A k C

Viteza algoritmului depinde, evident, de raportul dintre volumul lui C i


volumul lui A. n cazul C = 3, putem lua A = [0,1]3 mai bine nici nu se poate.
Cum raportul dintre volume este 1/6, ne ateptm ca n jur de o esime din
punctele generate Uniform(A) s fie i n C. Chiar aa i este: dup 120 de
simulri, am reuit s nimerim de 23 de ori n A.

180
N=120;x1=runif(N);x2=runif(N);x3=runif(N);s=x1+x2+x3
v=which(s<1);nf=length(v)
xb1=1:nf;xb2=1:nf;xb3=1:nf
for (i in 1:nf)
{xb1[i]=x1[v[i]];xb2[i]=x2[v[i]];xb3[i]=x3[v[i]]}
x=cbind(xb1,xb2,xb3);x

xb1 xb2 xb3


[1,] 0.261076623 0.001725541 0.59342688
[2,] 0.329976494 0.618442961 0.02125208
[3,] 0.070146402 0.406062445 0.41304084
[4,] 0.551778257 0.067009293 0.28671116
[5,] 0.229001845 0.150103106 0.29779559
[6,] 0.145313528 0.550778716 0.19904163
[7,] 0.019184817 0.133237032 0.68866607
[8,] 0.180765220 0.394726553 0.23718938
[9,] 0.619285529 0.085581634 0.19468893
[10,] 0.012022830 0.403672086 0.19543799
[11,] 0.420006088 0.054411151 0.36632268
[12,] 0.042866380 0.024161682 0.77753557
[13,] 0.394432793 0.135697418 0.09784523
[14,] 0.342567456 0.325553098 0.11622695
[15,] 0.439633231 0.135284625 0.04868877
[16,] 0.002924559 0.660988999 0.21707588
[17,] 0.442618400 0.198682676 0.14334936
[18,] 0.055533753 0.397702978 0.21110361
[19,] 0.102202073 0.703533423 0.04253352
[20,] 0.101106154 0.433682927 0.38915822
[21,] 0.458446015 0.205739238 0.10033640
[22,] 0.067286825 0.133509017 0.29028897
[23,] 0.229641613 0.620405543 0.06375227

Dac ns k, dimensiunea simplexului, n loc s fie 3 era 7, atunci


volumul su era 1/7! = 1/5040. Din 120 de simulri era foarte probabil ca nici
una s nu fie n mulimea dorit.
Avem i o veste bun: dac C este un simplex, atunci exist algoritmi
rapizi care genereaz vectori repartizai uniform acolo. El se bazeaz pe
urmtoarea descoperire

Propoziia 6.3.3. Simularea rapid a vectorilor repartizai uniform ntr-un


simplex. Fie n+1 variabile aleatoare i.i.d. (Xj)1 j n+1 repartizate Exponential(1).
Xj
Fie S suma lor i Yj = . Atunci vectorul Y = (Yj)1jn este repartizat Uniform(n)
S
unde n = x[0,1]n : x1 + x2 + ...+ xn 1.

181
Demonstraie
Fie f : n o funcie msurabil i mrginit. Avem de calculat Ef(Y)
n sperana c rezultatul va fi n! fdn . Din formula de transport, avem
n

x x x
Ef(Y) = f 1 , 2 ,..., n e s 1[0, )n 1 x1 ,..., xn , xn1 dx1dx2 ....dxn1 . Aici s este suma x1
s s s
+ ...+ xn+1

Facem schimbarea de variabile

D x1 ,..., xn 1
y1 = x1/s, y2 = x2/s,..., yn = xn/s , yn+1 = s. Jacobianul ei este sn ,
D y1 ,... y n 1

imaginea mulimii [0,)n[0,) prin ea este n [0,) deci integrala devine

Ef(Y) = f y1 , y 2 ,..., yn s n e s 1 n y1 ,..., yn 1[ 0, ) s dy1dy2 ....dyn ds =


n s
f y1 , y 2 ,..., yn 1 n y1,..., yn dy1dy 2 ....dy n s e ds , adic exact ce doream cci a
0
doua integral este n!. q.e.d.

n general o mulime se numete simplex n dimensional dac este


anvelopa convex a unei mulimi de n+1 puncte i, dac, n plus, are interiorul
nevid. De exemplu, pentru n = 2, orice triunghi ABC este un simplex, cu condiia
ca nu cumva cele trei puncte s fie coliniare. n spaiu, orice tetraedru ABCD
este simplex dac nu cumva cele patru puncte sunt coplanare.
Frumuseea este c simplexul S = S(a) cu vrfurile a1a2.anan+1 se poate descrie
ntotdeauna sub forma

S = a1X1 + a2X2 +.+ anXn + an+1(1 X1 X2 - - Xn) : (X1 , X2 , ,Xn n (6.3.1)

i de aici se vede ce avem de fcut pentru a simula un vector uniform


repartizat acolo: simulm vectori aleatori repartizai unifom n n.

Exemplul 6.3.4. S se simuleze un vector aleator repartizat U(C) unde C este


triunghiul ABC

Soluie. Fie a,b,c afixele celor trei puncte. Atunci

aX 1 bX 2 cX 3
X= unde Xj sunt i.i.d i Exponential(1).
X1 X 2 X 3

182
Mai exist un caz n care suntem norocoi: dac X N(,C). Atunci
folosim urmtorul truc:

Propoziia 6.3.5. Fie C o matrice pozitiv definit i A o matrice simetric cu


proprietatea c A2 = C. Fie Y N(0,Ik) (adic un vector normal standard cu
toate componentele i.i.d N(0,1)). Atunci X = AY + este un vector repartizat
N(,C).

Demonstraie
Evident. X este normal , EX = i cov(X) = cov(AY + ) = Acov(Y)A = AA =
A2. q.e.d.

Ca s construim construim pe A scriem matricea C la forma diagonala C


= ODO unde O este matricea vectorilor proprii, care sunt ortogonali, D este
matricea diagonal care cu valorile proprii, nlocuim D cu D - adic cu
matricea care pe diagonal are radcinile ptrate ale valorilor proprii i punem A
= O D O.
Dac avem un software care e n stare s calculeze vectorii proprii, nu e
nici o problem. Iat, de exemplu, o funcie n R exact acest lucru

#simularea unei repartitii normale k-dimensionale


normal<-function(mu,cov)
{k=length(mu);jor=eigen(cov);valp=jor[[1]] #
valp sunt valorile proprii
vecp=jor[[2]] # vecp are vectorii proprii
kk=k^2;diag=1:kk;diag=diag-diag;dim(diag)=c(k,k)
for (i in 1:k) {diag[i,i]=sqrt(valp[i])}
a=vecp%*%diag%*%t(vecp)
u=rnorm(k,0,1);x=a%*%u+mu
x}

Funcia se apeleaz prin comanda

x=normal(mu,c)

Pentru a o apela este nevoie de vectorul mu = al mediilor, si de


matricea de covarian C. Iat un exemplu:simulm 10 vectori aleatori N(,C) cu

4 1 1

=(1,2,3) i C = 1 9 2 .
1 2 16

xx= 1:30; dim(xx) = c(10,3=


for (i in 1:10) {xx[i,]=normal(mu,c)}; xx
183
[,1] [,2] [,3]
[1,] 1.3356960 2.7749180 15.06867494
[2,] 2.3000149 1.3544057 -1.01883329
[3,] -1.3323644 0.8461128 10.02604282
[4,] 0.9394982 0.8378104 7.92561663
[5,] 2.0869182 0.7712231 -7.01464171
[6,] 0.2167368 1.6627487 0.05478921
[7,] 0.7415051 3.6121115 3.01237874
[8,] 0.5663550 1.6125076 -1.61308129
[9,] 0.6628614 -1.1853937 12.85524488
[10,] 5.2891190 0.4922314 0.82281214

184
Capitolul 7

Statistic descriptiv

Introducere
Statistica descriptiv este ramura statisticii ce se ocup cu prezentarea,
organizarea i interpretarea unei colectii de date. Descrierea acestor informaii se
poate face grafic (prin liste, grafice liniare, de distribuie etc.), sau prin indicatori
statistici (medie, median, abatere etc.).

7.1. Prezentarea datelor statistice


Analiza statistic a unui fenomen ncepe cu statistica formal (culegerea
datelor asupra fenomenului respectiv i nregistrarea datelor). Datele sunt apoi
analizate i interpretate, cu ajutorul statisticii matematice.

Definiia 7.1.1. Prin populaie statistic (populaie) se nelege orice mulime


care formeaz obiectul unei analize statistice. Elementele unei populaii
statistice se numesc uniti statistice sau indivizi.

Caracteristica este trstura comun unitilor unei populaii statistice.


Valoarea numeric a caracteristicii se numete variabil aleatoare. De exemplu,
dac ne referim la repartiia componenilor unei echipe de fotbal, dup nlime,
constatm c mulimea sportivilor formeaz populaia statistic, fiecare fotbalist
este o unitate statistic i nalimea este caracteristica studiat.
Matematic, o populaie statistic este o partiie a unei mulimi E, E={A1 ,
... , An }, submulimile A1 , ... , An fiind clase. Unitile statistice care compun o
clas Ai sunt alese pe baza unei relaii de echivalen, care reprezint
caracteristica populaiei.
Caracteristicile pot fi calitative sau cantitative. Caracteristicile cantitative
pot fi msurate folosind numere reale. Integrarea datelor cantitative n text are
anumite avantaje, dar tabelele statistice permit realizrea unor comparaii.
n tabelul 7.1.1, avem informaiile privind durata medie a vieii n
Romnia, in perioada 1998- 2007 (conform Institutului Naional de Statistic),
prezentate sub forma de tabel, evideniindu-se, astfel, aspectele importante ale
datelor. Obesrvm astfel c aceasta valoare crete, ncepnd cu anul 2003, dup o
scdere nesemnificativ.

185
Anul Durata medie
de viata
1998 69,24
1999 69,74
2000 70,53
2001 71,19
2002 71,18
2003 71,01
2004 71,32
2005 71.76
2006 72,22
2007 72,61

Tabelul 7.1.1

Reprezentarea grafic realizat pentru studierea schimbrilor sau pentru


compararea variabilelor statistice se numete grafic. Exist mai multe astfel de
reprezentri.
Reprezentarea cu batoane folosete batoane verticale sau orizontale, a
cror lungime simbolizeaz valorile variabilei statistice. Batoanele verticale se
folosesc, de obicei, pentru caracteristici care variaz n timp. ntre batoanele
consecutive se las, de regul, un spaiu de jumtate de unitate.
Figura 7.1.1 este reprezentarea cu batoane pentru datele din tabelul 7.1.1.

73

72

71

70

69

68

67
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Figura 7.1.1

186
Reprezentarea cu batoane orizontale prezint variante adaptate, de exemplu
reprezentarea pe componente. Diagrama cu batoane grupate furnizeaz o metod
de prezentare a prilor componente ale unui ntreg, fr realizarea unei
comparaii cu ntregul.
Dac ne referim la datele din Tabelul 7.1.2, privind structura populatiei
pe medii (urban, rural), data furnizate de

Tabelul 7.1.2

Anul Urban(%) Rural(%)


1960 32,1 67,9
1970 36,9 63,1
1980 45,8 54,2
1990 54,3 45,7
2000 54,6 45,4
2001 54,6 45,4
2002 53,3 46,7
2003 53,4 46,6
2004 54,9 45,1
2005 54,9 45,1
2006 55,2 44,8
2007 55,1 44,9
2008 55,0 45,0

Institutul Naional de Statistic, se obine reprezentarea cu batoane orizontale pe


componente, din figura 7.1.2.

2008

2006

2004
Rural(%)
2002
Urban(%)
2000

1980

1960

0 10 20 30 40 50 60 70 80
Figura 7.1.2

187
Graficul liniar pe poriuni este format din segmente de dreapt ce se obin
prin unirea perechilor de valori corespunztoare ale unei perechi de variabile
diferite.
n tabelul 7.1.3, sunt prezentate datele furnizate de Institutul Naional de
Statistic privind totalul numrului de imigrani, n perioada 2003-2008.

Total
Anul imigrani
2003 3267
2004 2987
2005 3704
2006 7714
2007 9575
2008 10030

Tabelul 7.1.3
Pentru acest tabel, am realizat graficul liniar pe poriuni din figura 7.1.3.

Total imigrani

12000

10000
8000

6000
4000
2000
0
2003 2004 2005 2006 2007 2008
Figura 7.1.3

Diagrama circular arat descompunerea unui ntreg n prile sale


componente. Ele se exprim ca procente din total i sunt reprezentate prin
segmente de cerc, unghiurile la centru avnd msuri egale cu procentul
corespunztor din 3600.
Figura 7.1.4 arat structura cheltuielilor din domeniul cercetare-
dezvoltare, din punctul de vedere al surselor de finanare, n Romnia, n 2001.

188
Alte surse
1%
Fonduri externe
8%

Uniti economice
Uniti economice
Fonduri de la buget
48%
Fonduri externe
Fonduri de la buget
Alte surse
43%

Figura 7.1.4

n continuare, ne vom referi la distribuii i reprezentarea lor prin


diagrame i tabele.

Definiia 7.1.2. O variabil statistic se numete discret dac ea nu poate lua


dect valori izolate n intervalul su de variaie. Ea se numete continu dac
poate lua toate valorile posibile n intervalul su de variaie.

Ca exemplu de variabil discret, ne putem referi la numrul capitolelor


unei cri, numrul articolelor produse de o fabric etc.. Pentru cazul continuu,
putem da ca exemplu nlimea unei persoane, ora sosirii unui tren etc..
Ne referim n continuare la cazul variabilei continue.
S considerm un eantion de 40 de angajai al cror salariu brut
exprimat n mii lei, la nceputul lunii ianuarie, conduce la datele din tabelul
7.1.4.
0,831 0,904 0,896 0,961 0,981
0,956 1,705 1,591 1,156 1,221
1,587 0,991 1,981 1,459 1,861
0,82 1,141 1,452 1,344 1,42
1,805 1,052 1,731 1,75 0,976
1,091 1,201 1,895 0,972 1,071
1,605 0,989 1,858 1,081 1,492
1,594 1,354 1,946 1,671 1,057

Tabelul 7.1.4
O descriere precis a seriei statistice obinute se realizeaz prin
construirea unui tabel al frecvenelor, n care observaiile sunt clasificate n
raport cu numrul unitilor statistice care se afl ntre anumite limite. Tabelul
7.1.5 prezint frecvenele pentru datele anterioare, privind salariile. Astfel,
marginile claselor de valori (0,8; 0.95 ...) din tabelul 7.1.5 sunt limitele sau
marginile clasei de valori. Media aritmetic a limitelor unei clase se numete

189
mijlocul sau valoarea central a clasei. Diferena dintre cea mai mare i cea mai
mic margine se numete domeniu sau amplitudine. Frecvena absolut este dat

Limitele Mijlocul Frecvena Frecvena Frecvena Frecvena


clasei clasei absolut relativ(%) cumulat cumulat
absolut relativ(%)
[0,8;0,95) 0,875 4 10 4 10
[0,95;1,1) 1,025 12 30 16 40
[1,1;1,25) 1,175 5 12,5 21 52,5
[1,25;1,4) 1,325 2 5 23 57,5
[1,4;1,55) 1,475 5 12,5 28 70
[1,55;1,7) 1,625 5 12,5 33 82,5
[1,7;1,85) 1,775 4 10 37 92,5
[1,85;2) 1,925 3 7,5 40 100
Tabelul 7.1.5
de numrul unitilor statistice aflate ntre limitele unei clase, iar cea relativ este
raportul dintre frecvena absolut i numrul total al unitilor statistice. n cazul
n care nu este precizat, prin frecven se nelege frecven relativ. Mulimea
frecvenelor (absolute sau relative), mpreun cu clasele lor formeaz frecvena
distribuiei. Frecvena cumulat a unei clase este suma frecvenelor pn la clasa
respectiv, clasele fiind ordonate cresctor.
n general, este indicat utilizarea a 10-20 clase de valori.
Histograma este o reprezentare cu batoane, fr spaiu ntre acestea. Ea
prezint marginile claselor pe axa orizontal i frecvenele pe cea vertical.
Histograma pentru datele din tabelul 7.1.4 este prezentat in figura 7.1.5.

35

30

25

20

15

10

0
Figura 7.1.5.

190
Poligonul frecvenelor este un grafic liniar pe poriuni, mijloacele claselor
fiind reprezentate pe axa orizontal i frecvenele pe cea vertical. Fiecare mijloc
are o frecven, marcat printr-un punct. Punctele consecutive se unesc prin
segmente de dreapt, rezultnd poligonul frecvenelor.
Figura 7.1.6 prezint poligonul frecvenelor pentru datele din tabelul
7.1.4 (pe axa absciselor s-au folosit rotunjiri, pentru a da doar dou zecimale).
35

30

25
Frecvena(%)

20
15

10

0
0.875 1.025 1.175 1.325 1.475 1.625 1.775 1.925
Figura 7.1.6

Poligonul frecvenelor cumulate este un grafic liniar pe poriuni, care se


realizeaz similar cu poligonul frecvenelor, singura schimbare fiind aceea ca n
locul frecvenelor apar frecvenele cumulate.

7.2. Caracteristici numerice

Ne vom referi acum la descrierea informaiilor folosind indicatori statistici. n


acest sens, exist dou mari categorii: msuri ale tendinei centrale (media,
mediana, moda etc.) i msuri ale variaiei sau mprtierii (amplitudinea,
abaterea etc.).
n continuare, prezentm principalii indicatori ai tendinei centrale.
ntr-o distribuie (ne referim la variabil continu), clasa cu cea mai mare
valoare a frecvenei este clasa modal, iar mijlocul acesteia este moda variabilei.
n tabelul 7.1.5, clasa modal este [0,95;1,1), iar moda este 1,025.
S ne referim acum la o mulime de date de selecie (variabil discret),
moda este valoarea cu frecvena maxim.
S considerm o grup format din 20 de studeni care susin un test la
matematic, obinndu-se rezultatele din tabelul 8.2.1. Aici, moda este 8.

Definiia 7.2.1. Pentru cazul discret, mediana unei mulimi x 1 , x2 ,..., x m (datele
de selecie sunt ordonate cresctor) este valoarea de mijloc, x(m+1)/2 , dac m este
1
impar, i media celor dou valori de mijloc, (xm/2 +xm/2+1), dac m este par.
2
191
De exemplu, media mulimii 5,6,8,9,12 este 8, iar pentru 15, 18, 20, 14,
1
28, 30 se obine mediana (20+24)=22.
2

Nota Frecvena Frecvena


absolut relativ(%)
3 1 5
4 1 5
5 2 10
6 2 10
7 5 25
8 6 30
9 2 10
10 1 5
Tabelul 7.2.1

Definiia 7.2.2. Pentru o variabil continu, clasa cu frecvena cea mai mic ce
m
are proprietatea c frecvena cumulat asociat este mai mare dect , m fiind
2
numrul total de clase, se numete clasa medianei.

Notnd cu m numrul total de clase, md mediana distribuiei, fi frecvena


pentru clasa [xi-1,xi), Fi frecvena cumulat pentru clasa [xi-1,xi) i [xj-1,xj) clasa
modal. Efectund o interpolare, obinem urmtoarea

Definiia 7.2.3. ntr-o distribuie, valoarea medianei este dat de relaia


0,5 Fi 1
md=xi+hi ,
fi
unde hi=xi-xi-1, Fi-1 <0,5 ;i Fi >0,5.

Pentru datele din tabelul 8.1.5, clasa median este [1,1;1,25), iar mediana
0,5 0,4
este md=1,1+1,5 =1,122.
0,125

Definiia 7.2.4. Media(de selecie) a unei mulimi x 1 , x2 ,..., x m se definete prin

192
m
1
x
m i 1
xi .

De exemplu, dac lista de preuri, n lei, pentru centrale termice, este


urmtoarea: 9900, 10300, 11200, 12500, 7600, 17500, costul mediu al unei
centrale este
1
x 9 900 10 300 11 200 12 500 7 600 17 500 11500 .
6
Dac x 1 , x2 ,..., x k sunt valorile distincte ale lui X, iar ni este frecvena lui
xi , formula se rescrie
k
ni xi
x i i .
k
ni
i i
k
n
Notnd fi= i , rezult x
f i xi , ("media ponderat").
m
i 1

Definiia 7.2.5. Considerm un tabel al frecvenelor cu k clase. Dac x 1*, x2* ,...,
x m* sunt mijloacele claselor, n1, n2, ..., nk frecvenele lor absolute i f1, f2, ..., fk
frecvenele lor relative, atunci media distribuiei este
k
ni x*i
x i i ,
k
ni
i i
mai precis
k
x f i xi * .
i 1

Pentru datele din tabelul 7.1.5, media este


4 0,875 12 1,025 5 1,175 2 1,375 5 1, 475 5 1,625 4 1,775 3 1.925
x
4 12 5 2 5 5 4 3

1,3175.
Se observ c media nu d o imagine complet a datelor de selecie sau a
distribuiei. De exemplu, mulimile {2, 2, 2, 5, 8, 8, 8}, {3, 3, 5, 5, 5, 7, 7}, {4, 4,
4, 5, 6, 6, 6} au aceeai medie, dar au structuri diferite. Acesta este motivul

193
pentru care sunt introduse msuri ale variaiei, care s arate gradul de mprtiere
a datelor n jurul mediei.

Definiia 7.2.6. Pentru o variabil discret, diferena dintre cea mai mare i cea
mai mic valoare a seleciei se numete amplitudine.
Pntru o variabil continu, amplitudinea este diferena dintre limita
superioar a clasei cu cele mai mari margini i limita inferioar a clasei cu cele
mai mici margini.

Definiia 7.2.7. Fie x 1 , x2 ,..., x m date de selecie avnd media x . Abaterea


medie se definete prin relaia
m
1
a.m.
m i 1
| xi x | .

S considerm urmtoarele date de selecie: 12, 15, 13, 20, 13. Media lor
1
este x 12 15 13 20 13 14,6 , n timp ce abaterea medie are valoarea
5
1
a.m. | 12 14,6 | | 15 14,6 | | 13 14,6 | | 20 14,6 | | 13 14,6 |
5
2,32.
Altfel spus, valorile de selecie difer n medie cu 2,32 fa de media
14,6.
Fie x 1 , x2 ,..., x k valorile distincte ale lui X, avnd media x , iar ni
frecvena lui xi . Atunci
k
ni | xi x |
a.m. i i .
k
ni
i i
k
n
Notnd cu fi= i frecvena relativ, rezult x
f i | xi x | .
m
i 1
Pentru datele din tabelul 7.2.1, abaterea medie este a.m. 1,3.

Definiia 7.2.8. Fie o variabil continu cu un tabel al frecvenelor cu k clase.


Dac x 1*, x2* ,..., x m* sunt mijloacele claselor, n1, n2, ..., nk frecvenele lor
absolute i f1, f2, ..., fk frecvenele lor relative, atunci abaterea medie este

194
k
ni | x*i x |
a.m. i i ,
k
ni
i i
adic
k
a.m. f i |xi* x | .
i 1

Pentru tabelul 7.1.5, calculm abaterea medie i obinem valoarea


119,85
2,99625 .
40

Definiia 7.2.9. Fie x 1 , x2 ,..., x m date de selecie cu media x . Dispersia se


definete astfel
m
1 2
2
m i 1
xi x .
m
1 2

m i 1

xi x este abaterea de selecie (empiric) standard.

Fie x 1 , x2 ,..., x k valorile distincte ale lui X, cu media x , iar ni frecvena


lui xi . Formula pentru calculul dispersiei devine
k k
xi x xi x
2 2

2 i 1 i 1 .
k m
ni
i 1

k
n 2
Dac frecvena relativ este fi= i , rezult 2
m

f i xi x .
i 1
Dispersia corespunztoare datelor din tabelul 7.2.1 este
2
1
20

1 (3 7) 2 1 (4 7) 2 2 (5 7) 2 2 (6 7) 2 5 (7 7) 2


6 (8 7) 2 2 (9 7) 2 1 (10 7) 2 2,8 ,
n timp ce abaterea standard este 1,673 .

195
Definiia 7.2.10. Fie o variabil continu cu un tabel al frecvenelor cu k clase.
Dac x 1*, x2* ,..., x k* sunt mijloacele claselor, n1, n2, ..., nk frecvenele lor
absolute i f1, f2, ..., fk frecvenele lor relative, atunci media distribuiei este
k
ni x*i x
2

2 i i ,
k
ni
i i
mai precis
k
f i xi* x
2
.
i 1

445,2750
Pentru datele din tabelul 7.1.5, dispersia este 2 1,114 , iar
40
abaterea este 1,055 .

7.3. Corelaie. Regresie


Legtura dintre dou sau mai multe variabile poart numele de corelaie.
Conexiunea aceasta se poate prezenta sub mai multe forme, cea mai simpl fiind
relaia y f x , unde f este o funcie de variabila x, egalitate ce arat c lui x i
corespunde o valoare bine determinat a lui y.
Mai jos sunt prezentate notele la algebr i geometrie obinute de zece
studeni.

Nr. crt. Nota Nota


algebr geometrie
1 5 5
2 6 5
3 6 6
4 6 7
5 7 7
6 7 8
7 8 8
8 9 9
9 10 9
10 10 10

Tabelul 7.3.1

196
Vom reorganiza datele de mai sus sub forma unui tabel cu dou intrri,
astfel: notele la algebr sunt reprezentate pe axa absciselor, iar cele la geometrie
pe cea a ordonatelor.

5 6 7 8 9 10 mY
10 9,5
9 9
8 8
7 7,5
6 6
5 5
mX 5,5 6 6,5 7,5 9,5 10

Tabelul 7.3.2

Vom indica existena unui student ce ia note corespunztoare unui ptrat


printr-un punct situat n interiorul acestuia. De exemplu, studentul cu notele 7 i
8 se va regsi n ptratul (7,8). Acest tablou se numete tablou de corelaie.
Observm c, n general, creterea notelor la algebr este nsoit de
creterea notelor la geometrie. Astfel, ntre aceste variabile exist o corelaie
pozitiv. Punctele din interiorul tabloului de corelaie se grupeaz n jurul unei
diagonale a ptratului, deci se poate afirma c avem o corelaie liniar.
n figurile 7.3.1 i 7.3.2, am reprezentat grafic pe mX n raport cu x i pe
mY n raport cu y.

12

10

0
0 2 4 6 8 10 12
Figura 7.3.1

197
10
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10 12
Figura 7.3.2

mX i mY se numesc funcii de regresie. n figurile de mai sus, graficele


lor se grupeaz n jurul primei bisectoare. n figura 7.3.1, avem regresia lui y
asupra lui x, iar n figura 7.3.2, regresia lui x asupra lui y.
Pentru fixarea ideilor, s considerm V(X,Y) un vector n plan, X i Y fiind
variabile aleatoare. Statistic, suntem interesai de situaia n care vectorul V ia un

numr finit de valori, vij vij a j , bk , j 1, m, k 1, n, vecorul avnd
componentele a j , bk . Notnd P V v jk p jk , avem p jk 0 i
m n
p jk 1. Tabelul 7.3.3 se numete tabel de corelaie.
j 1k 1

b1 b2 bn Y
a1 p1
a2 p2

... ... ... ... ... ...

... ... ... ... ... ...

am p m1 pm2 p mn pm
X p1 p2 pn
Tabelul 7.3.3

Au loc urmtoarele relaii:


198
n m
p jk p j , j 1, m; p jk pk , k 1, n;
k 1 j 1
n m
p k 1, p j 1.
k 1 j 1
p j , respectiv p k , se numesc probabiliti marginale i reprezint
probabilitatea ca X a j , respectiv Y bk , penrtu orice valoare a celeilalte
variabile.
Similar cu valorile medii pentru variabilele unidimensionale se definesc
cele pentru variabilele bidimensionale. Dac notm
m n
mrs p jk a rj bks ,
j 1k 1
obinem, ca valori particulare:
m n m
m10 p jk a j a j
j 1k 1 j 1
m n
m01 p jk bk ,
j 1k 1
care se noteaz, de obicei, prin m1 i respectiv m2, ele fiind coordonatele
centrului de greutate.
Momentele centrate se definesc prin:
m n

rs E X m1 r Y m2 s a j m1 r bk m2 s .
j 1k 1
Momentele centrate de ordinul al doilea au denumiri speciale n teoria
probabilitilor. Astfel, 20 se noteaz cu 12 i reprezint dispersia lui X,
02 , notat 22 , este dispersia lui Y. 11 este covariana variabilelor X i Y.
m
pij ai

Dac notm prin E X | Y b j i 1 pj
valoarea medie a lui X,

condiionat de Y b j , obinem modul de comportare al variabilei X atunci


cnd Y ia valoarea bj. Avnd n vedere toate valorile ai , b j , i 1, m , iar bj
rmne fix, diversele medii condiionate referitoare la ai caracterizeaz modul de
variaie al variabilei X pentru Y b j fixat.

199
Se poate caracteriza aceast variaie pintr-o relaie X f Y , astfel ca

m2 X f (b j ) | Y b j s fie minim, m2 fiind momentul de ordinul al doilea.
n general, se ncearc o exprimare de forma Y x , astfel ca
E Y X 2 s fie minim. Avnd n vedere c
m n 2
2
E Y X pij b j ai ,
i 1 j 1
i derivnd n raport cu , se obine dreapta de regresie

y m2
2
x m1 . Am notat prin E X m1 Y m2 coeficientul
1 E X m1 2 Y m2 2
de corelaie.

200
Capitolul 8

Teoria seleciei

Introducere
Teoria seleciei s-a dezvoltat datorit necesitilor practice. n multe situaii,
apare necesitatea de a obine informaii relevante despre mulimi cu numr mare
de elemente, neexistnd posibilitatea real de a studia fiecare element n parte. n
aceste cazuri, se poate examina o selecie (eantion) din mulime, n ideea ce
informaia obinut este util pentru ntreaga populaie studiat. Numeroase
aplicaii au condus la axioma potrivit creia un eantion d informaii utile
despre ntreaga mulime i c, pe msur ce selecia crete ca volum, datele
obinute sunt din ce n ce mai fidele.

8. 1. Generarea valorilor particulare ale unei variabile aleatoare

Simularea unei variabile aleatoare este utilizat att n statistic (procedee


de eantionare), ct i n modelarea stochastic. Aceast simulare se poate realiza
cu ajutorul unor obiecte (zar, rulet), sau algoritmizarea generrii unor valori
numerice pe calculator. Calculatoarele din ce n ce mai performante au
determinat, n principal, orientarea spre cea de a doua metod.
n ceea ce privete clasificarea, exist generatoare de variabile aleatoare
uniform repartizate i neuniform repartizate, ultimele construindu-se, n general,
pe baza celor din prima categorie.
Variabile aleatoare discrete uniform repartizate. Fie X o variabil
1
aleatoare discret P X i , i 1, n . Simularea acestei variabile aleatoare
n
utilizeaz o funcie g : I k I , unde I este mulimea numerelor ntregi
reprezentate n calculator. Pornind de la valorile iniiale x1, x2, ..., xn i folosind
relaia de recuren x n g x n k ,...x n 1 , n k , se genereaz o secven de
numere. irul xn este periodic, deoarece I este finit. Acest generator este
suficient de bun dac perioada lui este mare n raport cu numrul de valori
generate i valorile generate nu sunt secvenial corelate, adic secvene de p
valori succesiv generate ocup spaiul de dimensiune p. Aceste dou condiii pot
fi ndeplinite printr-o alegere adecvat a funciei g. Metodele congrueniale sunt
cele mai utilizate. Ele se bazeaz pe o relaie de recuren de forma
x n f x n k ,..., x n 1 mod m

201
unde f : I k I .
Este comod s alegem funcia liniar
f xn k ,..., x n 1 a1 x n 1 ... a k x n k c, a1, ...ak, c fiind valori ntregi.
Metoda genereaz valori cuprinse ntre 0 i m-1, motiv pentru care m se
alege ct mai mare. Pentru k=0, avem generatori de ordinul nti. n acest caz,
a=16807, c=0, m= 231 1 sau a=24298, c=99991, m=199017 sunt cteva seturi de
valori adecvate.
Variabile aleatoare continue. Simularea unei variabile aleatoare continue
uniforme pe [0,1] se realizeaz prin generarea de valori ntregi uniform
repartizate pe mulimea {0, 1, ..., m-1} i prin mprirea lor prin m-1. Pentru o
variabil aleatoare uniform repartizat pe (0,1) se genereaz valori din mulimea
{1, ..., m-1}, care se mpart la m. O variabil aleatoare X, uniform repartizat pe
(a,b) se genereaz cu ajutorul unei variabile aleatoare Y, uniform repartizat pe
(0,1) dup care se efectueaz schimbarea de variabil X (b a )Y a .
n cele ce urmeaz, ne vom referi la metoda inversrii funciei de
repartiie.
Fie X o variabil aleatoare avnd drept funcie de repartiie F : R [0,1],
atunci inversa ei se definete ca F-1(y)={x R F(x) u}, ( ) u [0,1],
rezultnd astfel o posibilitate de algoritmizare n vederea simulrii variabilei.
Pentru diverse repartiii concrete, se obin diveri algoritmi.
x
Repartiii discrete. Fie X o variabil aleatoare discret, X: i , i 1, n ,
pi
n
pi , pi 0 . Aceast variabil are funcia de repartiie
i 1
F1 0, x xi ;
...
n 1
F ( x)
i
F p k , xi 1 x xi ;
k 1
1, x x n .

Atunci inversa funciei de repartiie se determin astfel:


F 1 (u ) xi ,
ori de cte ori F ( x i 1 ) u F ( xi ) , i 1, n , unde x0 , F ( x0 ) 0 .
Algoritmul de simulare const n generarea unei valori u, uniform repartizate n
(0,1), i n determinarea indicelui i astfel nct Fi 1 u Fi .

Exemplul. 8.1.1. S considerm o variabil aleatoare binomial X, cu funcia


de repartiie

202
0, x 0;
k i i
F ( x ) C n p (1 p) n1 , k 1 x k
i0
1, x n.

X poate fi simulat prin construirea tabelului asociat funciei de repartiie i


aplicarea metodei clasice de cutare. O alt posibilitate este de a simula
extragerile cu revenire i de a numra de cte ori se produce evenimentul de
probabilitate p. n acest sens, se consider N, cel mai mic numr natural pentru
care n1 Np i n2 Np sunt naturale i se construiete tabelul corespunztor,
cu valorile t1 t 2 ... t n 1 , t n1 1 t n1 2 ...t n1 n2 0.

Exemplul 8.1.2. Fie acum o variabil aleatoare geometric X, avnd funcia de


repartiie

0, x 0;
k
F ( x ) pq k , k 1 x k ,
i 0
1, x n
unde p q 1, p (0,1) .
X poate fi simulat prin aplicarea modelului clasic de cutare sau prin
simularea variabilei aleatoare cu ajutorul monedei trucate n aa fel nct
probabilitatea apariiei valorii sa fie p, iar cea a stemei sa fie q. Astfel, variabila
X arat la a cta ncercare se obine stema prima dat.

Repartiiile continue. n situaia n care se cunoate expresia inversei


funciei de repartiie, se poate utiliza forma general a algoritmului. n caz
contrar, se utilizeaz algoritmul specific repartiiilor discrete. n prealabil se
determin intervalul Fi 1 , Fi ce conine pe u, calculndu-se
u Fi 1
x * xi 1 ( xi x i 1 ) .
Fi Fi 1
Facem precizarea c aici x * reprezint valoarea obinut, i nu xi .

Exemplul 8.1.3. Fie X o variabil aleatoare exponenial, cu funcia de


1
repartiie F ( x ) 1 e x , x, 0 . Inversa lui F este F 1 (u ) ln(1 u ) , iar

u este uniform repartizat n (0,1). Astfel, i 1 u este uniform repartizat n
(0,1), rezultnd astfel imediat algoritmul de simulare.

203
Exemplul 8.1.4 Fie X o variabil aleatoare Weibull, cu funcia de repartiie
b
F ( x ) 1 e ax , a, b 0. Algoritmul de simulare se dudcce uor, pe baza faptului
1
1 1 b
c inversa funciei F este F (u ) ln(1 u ) .
a

Exemplul 8.1.5. Ne referim acum la simularea variabilei aleatoare normal


repartizate, mai precis la metoda bazat pe teorema limit central. Conform
n X 1 ... X n
acesteia, dac X 1 , X 2 ,...X n N (, ) , atunci irul Z n
n
1
este convergent n repartiie ctre Z N (0,1). S considerm i
2
n
X 1 ... X n
1 2.
2 . Atunci obinem Z n
12 n
12
Pentru n 12, algoritmul de simulare devine simplu, ntruct
Z n X 1 ... X 12 6 .

Exemplul 8.1.6. Generarea variabilelor 2 i Student se bazeaz pe legtura


lor cu repartiia normal standard.

8. 2. Variabile de eantionare
Fenomenele din natur, studiile sociologice au consacrat metoda sondajului.
Problema care se pune este de a determina caracteristica unei populaii format
din N indivizi, prin prisma rezultatelor x1, x2, ... , xn obinute prin n experiene
indepenente. xi se numesc valori de eantionare, iar populaia este distribuia
teoretic. Dac populaia este infinit, sau poate fi considerat infinit, singura
metod de cercetare pentru determinarea caracteristicilor distribuiei teoretice
este metoda seleciei (sondajele de opinie). Acelai lucru se realizeaz i pentru
un numr finit de indivizi (controlul antidoping realizat pe un numr mic de
componeni ai unei echipe).

Definiia 8.2.1. O subcolectivitate a unei colectiviti cercetate se numete


selecie sau sondaj. Numrul elementelor seleciei este volumul seleciei.

Definiia 8.2.2. Valorile obinute pentru indivizii care intr n selecie privind
caracteristica X de numesc date de selecie relative la caracteristica X.
Pentru o selecie de volum n vom nota datele de selecie cu x1, x2, ..., xn.

204
Definiia 8.2.3. Datele de selecie x1, x2, ..., xn sunt valorile unor variabile
aleatoare X1, X2, ..., Xn , care se vor numi variabile de selecie.
Pe parcursul ntregului capitol vom avea n vedere notaiile menionate
n definiia anterioar.

Definiia 8.2.4. O funcie de variabile de selecie a crei valoare devine


cunoscut cnd variabilele de selecie sunt nlocuite prin valorile de selecie se
numete statistic.

Sondajul este operaia de colectare a elementelor unui eantion din


populaia statistic examinat. Exist sondaje cu revenire (bernoulliene), cnd
elementul extras din populaia considerat este reintrodus n colectiv nainte de
efectuarea unei noi extrageri, sau sondaje fr revenire.
Colectarea elementelor din eantion conduce la realizarea mai multor
tipuri de sondaje. Sondajul pur aleator se obine cand unitile statistice au
aceeai probabilitate de a fi alese din eantion (sunt echiprobabile). Dac se
prestabilete un principiu, se efectueaz un sondaj dirijat. n cazul n care
populaia examinat este mprit n grupuri (straturi) n raport cu o
caracteristic prestabilit, avem un sondaj mixt. Acestea pot fi de mai multe
feluri: sondaje stratificate simple fr revenire, sondaje stratificate (tipice) n
dou faze (se aleg mai nti r straturi din cele deja existente, iar dup aceea se fac
extrageri aleatoare din fiecare strat). Dac din fiecare start tipic se extrage un
numr de uniti ales astfel nct raportul dintre volumul eantionului de strat i
volumul stratului s coincid cu raportul dintre volumul eantionului general i
volumul total al populaiei, se realizeaz un sondaj stratificat proporional. Un
sondaj n care volumul eantionului nu este fixat iniial i prelucrarea continu
pn cnd un anumit eveniment se realizeaz se numete sondaj secvenial.
Cercetarea i perfecionarea metodelor de analiz a datelor experimentale
privind un anumit fenomen depind de volumul eantionului ales. Datele pot fi
ordonate dup anumite criterii, spre exemplu: momentul din timp i locul n care
s-a produs fenomenul frecvena apariiei acestuia.

Definiie 8.2.5. Frecvena absolut ni reprezint numrul de apariii ale unui


rezultat n cele n experimente efectuate asupra eantionului, n timp ce frecvena
relativ f i este raportul dintre frecvena absolut i volumul eantionului.

Exist trei moduri n care pot fi organizate rezultatele x1 , x2 ,..., x n ale


1
msurtorilor. Primul dintre acestea este x1 x 2 ... x n , unde ni 1, f i ,
n
i 1, n , n fiind volumul eantionului, ni frecvenele absolute ale apariiei

205
valorilor xi corespunztoare, iar f i sunt frecvenele relative, cel de al doilea ar fi
n
x1 x2 ... xn , ni 1 , f i i , i 1, k .
n
S presupunem acum c msurtorile pot fi grupate n k intervale de
valori, de lungime egal, fiecrui interval corespunzndu-i un reprezentant xi ,
i 1, k . n aceast situaie, frecvenele absolute asociate fiecrui interval sunt
egale cu numrul de valori ale caracteristicii msurate n intervalul respectiv.
Apare astfel cel de al treilea tip de serie statistic, i anume
n
x1 x 2 ... x k , ni 1 , f i i , i 1, k .
n
Deosebirea fa de cel de al doilea tip const n faptul c n serie apar
reprezentanii intervalelor.
Fie X caracteristica examinat. Ea poate fi caracterizat prin
xi n
X : , f i 1,
f i i 1
sau prin funcia empiric de repartiie, notat Fn* . Pentru seriile din primele dou
categorii, aceasta are forma
0, x x1 ,
* i 1
Fn ( x )

f j , x i 1 x xi , i 1, k 1.
j 1

Pentru ultimul tip, funcia empiric de repartiie este dat de


0, x l 0 ,
* i 1 x l i 1
Fn ( x)

fj f i , l i 1 x li , i 1, k 1,
j 1 d
k fiind numrul intervalelor ( li 1 , l i ), iar d lungimea acestor intervale.
Este uor de remarcat faptul c funcia empiric de repartiie este
analogul funciei de repartiie a unei variabile aleatoare discrete finite.
Datorit diversitii mrimilor obinute, i aici sunt necesare analiza i
organizarea datelor. Tendinele de grupare i mprtiere n jurul unei tendine
maxime se msoar cu indicatori care se definesc similar cu cei definii in
capitolul 8, de aceea nu i vom reaminti.

Definiia 8.2.6. Media de selecie (momentul de ordin 1) este definit prin


relaia
n
1
Xn
n j 1
X j.
Dac xj reprezint valoarea observat a variabilei Xj, valoarea numeric a
acestei statistici este

206
n
1
xn
n j 1
x j.

Definiia 8.2.7. Momentul centrat de selecie de ordinul r este dat de relaia


n
1
r ( X j X )r ,
n j 1
notaie pe care o vom folosi i pentru valoarea momentului de selecie de ordin
r,
n
1
r ( x j x)r .
n j 1
Rezult de aici valoarea dispersiei de selecie,
n
1
s2 ( x j x) 2 .

n j 1
n paragraful urmtor vom demonstra proprieti privind media de
selecie i dispersia.

Exemplul 8.2.8. S considerm un eantion de 20 de clieni ai unui magazin


alimentar. Ne propunem s studiem frecvena X cu care clienii fac apel la
serviciile magazinului de-a lungul unei sptmni i s cercetm cheltuielile
lunare Y n zeci de lei ale clienilor pentru achiziionarea de produse din
magazinul respectiv. Datele de selecie sunt urmtoarele (n ordinea n care au
fost obinute):
X : 2,1,1,4,3,2,5,6,1,2,3,2,3,4,6,2,4,3,2,1;
Y : 90,9,101,88,85,77,102,100,86,97,76,121,113,110,96,9,2,108,112,109,103.
Datele de selecie pentru caracteristica X au n 6 valori distincte, rezultnd,
astfel, pentru aceasta, distribuia empiric
1 2 3 4 5 6
X : .
4 6 4 3 1 2
n cazul lui Y, vom face o grupare a datelor de selecie corespunztoare, n
intervalele 70,80 , 80,90 , ..., rezultnd, n acest mod, urmtoarea distribuie
75 85 95 105 115 125
empiric Y : .
2 4 4 6 3 1
Mediile de selecie ale celor dou caracteristici sunt:
1
X 4 1 6 2 4 3 3 4 1 5 2 6 2,85
20
1
Y 2 75 4 85 4 95 6 105 3 115 1 125 98,5.
20

207
Pentru momentele centrate de selecie de ordinul al doilea, obinem:

20
2 (X )
1

20 j 1
(x j X )2
1
20

4 (1 2,85) 2 6 (2 2,85) 2 4 (3 2,85) 2

3 (4 2,85) 2 1 (5 2,85) 2 2 (6 2,85) 2 2,3275.

20
2 (Y )
1

20 j 1
yk Y
2 1
20
2 (75 98,5) 2 4 (85 98,5) 2 4 (95 98,5) 2


6 (105 98,5) 2 3 (115 98,5) 2 1 (125 98,5) 2 182,5.

Funciile de repartiie de selecie ale celor dou caracteristici sunt:

0, x 1;
1
, 1 x 2;
5
1
, 2 x 3;
2
* 7
F20 , X ( x) , 3 x 4; ,
10
17
20 , 4 x 5;

9 , 5 x 6;
10

1, x 6
respectiv

208
0, y 1;
1
, 75 y 85;
10
3
, 85 y 95;
10
* 1
F20, Y ( y ) , 95 y 105;
2
4
5 , 105 y 115;

19 , 115 y 125;
20

1, y 6.

Repartiii statistice bidimensionale. Ne ndreptm acum atenia asupra


populaiilor statistice care au dou caracteristici (cantitative sau calitative). S
considerm X i Y caracteristici cantitative ale unei populaii, pentru care s-au
determinat valorile x1 , x 2 ,..., x r , respectiv y1 , y 2 ,..., y s . Fie nij frecvenele
absolute ale cazurilor pentru care X xi i Y y j , i 1, r , j 1, s . n fiind
r s
momentul seleciei, n mod evident relaia n
i 1 j 1
ij n . Frecvenele relative

f ij r s
sunt
n

1,
i 1 j 1
f ij n , i sunt trecute ntr-un tabel de corelaie, asemntor

unei matrice cu r linii i s coloane.

Definiia 8.2.9. Momentul de selecie de ordinul k n raport cu X i Y este dat de


relaiile:
r s r
mk 0 f ij xik f i0 xik x,
i 1 j 1 i 1
r s r
m0k f ij yik f 0 j xik y,
i 1 j 1 i 1
s r
unde f i 0 f ij i f 0i f ij .
j 1 i 1

Definiia 8.2.10. Momentul de selecie de ordin h n raport cu X de ordin k n


raport cu Y se definete prin

209
r s
mhk f ij xih y kj .
i 1 j 1
Momentele centrate hk se definesc n mod asemntor.

Definiia 8.2.11. Momentul centrat mixt de ordinul al doilea,


r s
11 f ij ( xi x)( y j y) ,
i 1 j 1
reprezint covariana de selecie, n timp ce coeficientul de corelaie este
2 2
11 , s1 , s2 fiind dispersiile de selecie ale celor dou variabile
s1 s 2
individuale. Coeficientul de corelaie reprezint, de fapt, o msur a dependenei
celor dou variabile X i Y.

8.3. Legi de probabilitate ale variabilelor de eantionare

Principiul fundamental al statisticii matematice afirm c frecvena


experimental de apariie a unui eveniment converge ctre frecvena teoretic,
datorat lui Bernoulli.

Teorema 8.3.1. (Bernoulli) Fie an numrul de apariii ale unui eveniment A n


n experimente independente i p probabilitatea de realizare acestui eveniment n
a
fiecare experien. Dac f n n este frecvena relativ de apariie a acestui
n
evenimentului, atunci irul ( f n ) converge n probabilitate ctre p.

Demonstraie
Deoarece an nf n , an este o variabil binomial, aadar E (a n ) np i
Var (a n ) np (1 p). Au loc urmtoarele relaii, avnd n vedere inegalitatea lui
Cebev:
P f n1 p P an np n
D( an )
P an M (an ) n 1
n 2 2
p (1 p )
1 .
n 2
De aici rezult c lim P f n p 1, q.e.d.
n

210
Aceast teorem permite doar evaluarea direct a probabilitii p de producere a
unui eveniment. Cnd ne referim la o variabil aleatoare, pentru obinerea de
informaii globale trebuie s facem apel la teorema lui Glivenko.

Teorema 8.3.2. Fie F funcia de repartiie a statisticii X, i Fn* funcia de


repartiie de selecie corespunztoare unei selecii bernoulliene de volum n,
atunci

P lim max Fn* ( x) F ( x ) 0 1.
n x

Pentru demonstraie, ndrumm cititorul spre lucrarea [11].


Teoremele de convergen arat condiiile n care repartiia statistic
(empiric) tinde ctre cea teoretic. Aceasta din urm nu este cunoscut, de cele
mai multe ori, ea putnd fi apreciat doar cu ajutorul momentelor de diferite
ordine ale variabilei considerate X. n aceast situaie, apare ns problema de a
studia n ce msur diversele momentele de selecie converg ctre momentele
teoretice. Trebuie s precizm c valorile variabilei X rezultate din msurtori
sunt, de asemenea, variabile aleatoare, numite variabile de selecie. Ele depind de
eantionul ales, aadar momentele de selecie devin, la rndul lor, variabile
aleatoare.
Dac X este o variabil aleatoare examinat printr-o selecie de volum n,
obinut printr-un sondaj pur aleator, care are momentele E ( X k ) i dispersia
Var ( X ) , atunci variabilele de selecie X 1 , X 2 ,..., X n sunt independente, au
aceeai repartiie ca i variabila iniial X, aceleai momente i aceeai dispersie.

Teorema 8.3.3. Dac repartiia teoretic a unei variabile este normal, de


medie i dispersie 2 , atunci distribuia mediei de selecie obinut prin
sondaj pur aleator este de asemenea normal.

Demonstraie
Variabilele de selecie sunt independente i normal repartizate. Folosind
k
notaiile anunate la nceputul paragrafului, media de selecie, X fi X i ,
i 1
este o combinaie liniar de variabile repartizate normal, aadar are tot repartiie
normal, parametrii fiind ns urmtorii:

k k k
M (X ) M fi X i M (Xi ) f i ;

i 1 i 1 i 1

211
k k
Var ( X ) Var fi X i 2 f i2 , q.e.d.

i 1 i 1

Observaia 8.3.4. n cazul unei serii statistice din primul tip descris anterior,
2
dispersia mediei are valoarea .
n
Teorema 8.3.5. Fie X j1 , X j 2 ,..., X jn j , j 1, k , selecii independente din

populaii normale N ( j , 2j ) i X j , j 1, k , mediile de selecie. Atunci


k k
variabila Y a j X j este de asemenea normal, de parametri a j j ,
j 1 j 1
k 2
2 j
respectiv aj
nj
.
j 1

Demonstraie

2j
Aplicnd teorema precedent, rezult c X j N j , . Variabila Y, fiind
nj

combinaie liniar de variabile normal repartizate, este tot normal repartizat,
calcule asemntoare celor din teorema anterioar conducnd la determinarea
parametrilor si. q.e.d.

Teorema 8.3.6. Dac X N (0, 2 ) i X 1 , X 2 ,..., X n reprezint variabile de


n
selecie obinute prin sondaj pur aleator, atunci Y X i2 2 (n, ).
i 1

Demonstraie
Considerm Yi X i2 i X i N (0, 2 ), i 1, n . Au loc relaiile:
FYi ( x) P(Yi x ) P( X i2 x) P( x X i x ), 0.
x u 2 x2
1 2 2 du i 1 2 2 , rezult
Deoarece FYi ( x)
2 e fYi ( x )
2x
e
x
2
c Yi (n, ) . Funcia caracteristic a lui Y arat c ea este variabil din
2 (n, ) , q.e.d.

212
Teorema 8.3.7. Fie X X 1 , X 2 ,..., X n t o selecie obinut prin sondaj pur
aleator dintr-o populaie caracterizat de o repartiie normal redus i
n
1i, j n
A aij o martice ortonormal. Atunci variabilele V j a jk X k ,
k 1
j 1, n , sunt independente i normal repartizate, de parametri 0 i 1.

Demonstraie
Dac V (V1 ,V2 ,...,Vn ) t , deoarece V AX i matricea A este ortonormal, au
loc relaiile:
n n
V j V V X A AX X X V j2 .
2 t t t t

j 1 j 1
Funcia caracteristic a vectorului V devine, succesiv:
i nt v n it k x k 1 x k2
k k 1 2 dx ...dx
V ( t1 , t 2 ,..., t n ) E e k 1


2 n k 1
e
1 n

n it x 1 x 2 n t2 n n
k
1 k k
2 k dx

2 k 1
e k e 2 X k (t k ) X k
(t ).
k 1 k 1 k 1
Variabilei V j i se asociaz funcia caracteristic urmtoare
it n a x
jk k
V j (t ) E e k 1


t 2 a 2jk t2 n 2 t2
n n a
2 k 1 jk
X k (ta jk ) e 2 e e 2 X k (t ).
k 1 k 1
Acest lucru arat c V j sunt normal redus repartizate. Avnd n vedere c
funcia caracteristic a vectorului V este chiar produsul funciilor caracteristice
ale variabilelor componente, rezult c V j sunt variabile independente, q.e.d.

Teorema 8.3.8. Dac X X 1 , X 2 ,..., X n t este o selecie obinut prin sondaj


pur aleator dintr-o populaie caracterizat de o distribuie normal redus,
atunci variabilele:
n
1
U
n i 1

Xi n X ,

213
n n n 2
1
X i X
2
V X i2 Xi

n i 1
i 1 i 1
sunt independente. n plus, U N 0,1 i V 2 (n 1,1).

Demonstraie
U este o combinaie liniar de variabile independente identic repartizate,
aadar U este normal repartizat, cu parametrii:
E (U ) 0,
1 n 1
Var (U ) Var X i nVar ( X i ) 1.

n n
i 1
1
S considerm acum o matrice ortonormal A, n care a1k , k , i
n
V AX (V1 , V2 ,...Vn ) . Avnd n vedere teorema anterioar, V j N (0,1) .
Egalitile
n n 2 2
1 n n n
2 1
V j2 X i2
Xi
Xi Xi V

n n i 1
j 2 i 1 i 1 i 1
conduc la concluzia c V 2 (n 1,1), q.e.d.

Teorema 8.3.9. Fie X ( X 1 , X 2 ,..., X n ) o selecie obinut prin sondaj pur


aleator, dintr-o populaie normal distribuit, cu parametri i 2 . Atunci:
X
U n N (0,1),

n n 2
1 2 Xi X
V
2 i 1
X i X

2 (n 1,1).

i 1

Demonstraie
Xi
Notnd Yi , i 1, n, rezult c Yi N (0,1) . Concluzia rezult

uor, verificnd condiiile din teorema anterioar prin intermediul variabilelor
ajuttoare abia introduse, q.e.d.

214
Capitolul 9

Teoria estimaiei

9.1. Estimatori nedeplasai


S considerm o variabil aleatoare X a crei lege de probabilitate conine
un parametru . Fie X 1 , ..., X n variabile aleatoare independente care au aceeai
distribuie ca i X.
Alegem o anumit funcie t X 1 , ..., X n pe care o vom utiliza ca estimator
al lui ; cu alte cuvinte, dac dispunem de valorile x1 , ..., x n obinute
experimental, numrul t x1 , ..., x n va fi considerat ca estimator al parametrului .

Definiia 9.1.1. t X 1 , ..., X n se numete estimator nedeplasat al parametrului


dac media lui t X 1 , ..., X n este egal cu pentru orice valoare posibil a lui .

Exemplul 9.1.2. Fie media lui X. Atunci


1
t X 1 , ..., X n X 1 ... X n
n
este un estimator nedeplasat al lui , fiindc n mod clar media variabilei
aleatoare
1
X 1 ... X n este egal cu 1 ... .
n n

Exemplul 9.1.3. Fie media lui X i 2 dispersia lui X. Pentru un n fixat, notm
1
X X 1 ... X n .
n
Am vzut n exemplul anterior c X este un estimator nedeplasat al mediei
. n calitate de estimator al dispersiei lui X putem alege pe
1
S 2 X 12 ... X n2 X 2 .
n
Un calcul algebric elementar ne convinge c media variabilei aleatoare S 2
este egal cu n 1 2 . Aceasta arat c S 2 nu este estimator nedeplasat; deducem
n
ns imediat c media lui
n
S2
n 1
215
este egal cu 2 , deci n
S2 este estimator nedeplasat pentru dispersia 2 .
n 1
Cu alte cuvinte, dac dispunem de valorile experimentale x1 , ..., x n vom estima
dispersia 2 prin
2
n x 2 ... x 2 x1 ... x n
1 n
.
n 1 n n

9.2. Estimatori de maxim verosimilitate

Fie f x ; densitatea de probabilitate a unei variabile aleatoare X, n care


este parametrul care urmeaz s fie estimat. S presupunem c avem la
dispoziie valorile experimentale x1 , ..., x n ale lui X, obinute n urma unei
selecii de volum n.

Definiia 9.2.1. Funcia


L x1 , ..., x n ; f x1 ; ... f x n ;
se numete funcia de verosimilitate.

Definiia 9.2.2. Un estimator de maxim verosimilitate este un estimator care


maximizeaz pe L ca funcie de .

Exemplul 9.2.3. S considerm densitatea exponenial


e x , x 0 ;
f x ;
0 , x0.
Funcia de verosimilitate este

L e
x 1
... e
x n
n e

x 1 ... x n .
Derivata lui L ca funcie de este egal cu

x 1 ... x n
n1 e n x1 ... xn .
Deducem imediat c L i atinge maximumul pentru
n
.
x1 ... x n
Aadar, estimatorul de maxim verosimilitate al parametrului din legea
exponenial este
n
.
X 1 ... X n

216
Exemplul 9.2.4. S considerm variabila X cu densitatea uniform
1
, 0 x ;
f x ;

0 , in rest .

innd seama de natura acestei variabile, valorile experimentale x1 , ..., xn


satisfac condiia 0 xi , i 1, . .., n .
Funcia de verosimilitate este
1
L x1 , ..., x n ; .
n
Valoarea ei este cu att mai mare, cu ct este mai mic. Datorit
condiiilor impuse, cea mai mic valoare posibil a lui este max x1 , ..., xn .
Prin urmare, estimatorul de maxim verosimilitate este max X 1 , ..., X n .

Exemplul 9.2.5. S considerm variabila aleatoare X cu densitatea


1 x , 0 x 1 ;

f x ;
0 , in rest .

Funcia de verosimilitate este

L x1 , ..., x n ; 1 n x1 ... x n .
Derivata lui L ca funcie de este egal cu

1 n1 x1 ... xn n 1 ln x1 ... xn .
Funcia L i atinge maximumul pentru
n
1,
ln x1 ... ln x n
deci estimatorul de maxim verosimilitate este n acest caz
n
1.
ln X 1 ... ln X n

Exemplul 9.2.6. Fie X o variabil normal cu densitatea


1 2
f x ; e x /2
.
2
Funcia de verosimilitate este

217
L
1
e

x 1 2 ... x n 2 / 2 .
2 n
Se constat imediat c ea i atinge maximumul pentru
x1 ... x n
.
n
Deci, estimatorul de maxim verosimilitate este
X 1 ... X n
.
n
S observm c coincide cu media variabilei X, deci, estimatorul de
maxim verosimilitate este tocmai estimatorul nedeplasat despre care a fost
vorba n Exemplul 9.1.2.

Exemplul 9.2.7. S considerm o variabil normal X cu densitatea


1 2
/ 2 2
f x ; ex .
2
Funcia de verosimilitate este acum

e x 1
1 1 2
... x 2n / 2 2
L .
2 n
n

Ea i atinge maximumul pentru


1/ 2
1

x12 ... x n2
n
,

deci, estimatorul de maxim verosimilitate este n acest caz


1/ 2
1 2
2
X 1 ... X n
n
.

218
Capitolul 10

Estimarea prin interval de ncredere

Introducere

Estimaia punctual a unui parametru , necunoscut la nivelul unei


populaii, dei constituie o informaie n legtur cu acesta, nu poate fi utilizat
fr a avea o imagine i asupra mrimii probabilistice a erorii de estimare. Apare
astfel necesitatea estimrii unui parametru prin aa numitul, interval de ncredere.
n capitolul de fa vom prezenta forma general a intervalului de ncredere,
expresia intervalului de ncredere pentru medie inclusiv cazul particular al unei
proporii, interval de ncredere pentru diferena a dou medii, interval de
ncredere pentru dispersie i respectiv interval de ncredere pentru raportul a
dou dispersii. Pe tot parcursul capitolului va fi prezentat doar cazul cnd
eantionul se formeaz pe baza unei selecii simple aleatoare format prin
extrageri independente.

10.1. Forma general a intervalului de ncredere

Fie o populaie statistic A, variabila statistic X studiat prin intermediul


unei selecii simple de volum n, format prin extrageri independente,
X 1 , X 2 ,..., X n i un parametru necunoscut asociat variabilei X, pentru care se
obine pe baza seleciei estimatorul X 1 , X 2 ,..., X n , avnd densitatea de
probabilitate f .

Definiia 10.1.1. Se numete interval de ncredere pentru parametrul


necunoscut , cu nivelul de semnificaie 0,1 , intervalul

(h1 X 1 ,..., X n , h2 X 1 ,..., X n ) (10.1.1)

susceptibil de a conine valoarea lui cu o probabilitate 1 , unde


h1 h1 X 1 ,..., X n i h2 h2 X 1 ,..., X n rezult din legea de
probabilitate dat prin f .

219
Dup observarea statistic a eantionului (seleciei), cele dou limite ale
intervalului mai sus menionat pot fi determinate numeric. Intervalul care
ncadreaz parametrul are proprietatea c acoper valoarea n 1001 din
cazuri. Cu ct nivelul de semnificaie este mai mic cu att are anse mai
mari de a se afla n acel interval (de regul 0,05 ). Probabilitatea 1 este
probabilitatea de garantare a intervalului, valorile acceptate fiind de regul peste
0,95.

Observaia 10.1.2. Obinerea celor dou limite ale intervalului se realizeaz


pornind de la faptul c pentru X 1 , X 2 ,..., X n (sau pentru o alt variabil
aleatoare de lege de probabilitate cunoscut a crei expresie l conine pe ) se
pot determina pe baza legii de probabilitate cunoscute, dou valori particulare
a1 i a 2 astfel nct s aib loc relaia:

a2 ( )
P(a1 ( ) a 2 ( )) f ( )d 1 , (10.1.2)
a1 ( )

formul ce se poate scrie, prin artificii matematice, astfel:

a2 ( )
P(h1 ( ( X 1 ...., X n )) h2 ( ( X 1 ,...X n ))) f ( )d 1 . (10.1.3)
a1 ( )

.
Observaia 10.1.3. Dac estimatorul este un estimator centrat (nedeplasat),
deci E intervalul de ncredere este simetric n raport cu , vom avea
h1 i h2 unde reprezint eroarea limit de
estimare sub form absolut. Astfel intervalul de ncredere se poate scrie:

a 2 ( )
P( ) f ( )d 1 (10.1.4)
a1 ( )

unde este de obicei proporional cu dispersia estimatorului, prin urmare se


scrie de forma z .

Probabilitatea 1 i eroarea limit constituie mpreun o msur a


preciziei estimrii parametrului prin X 1 ,..., X n . De regul acestea se
fixeaz apriori, astfel:


R 100 5% i 5% . (10.1.5)

220
Pe baza acestor parametri ai peciziei va rezulta dimensiunea eantionului prin
care se asigur precizia dorit, folosind n acest scop formula z n
care se va vedea c dispersia estimatorului depinde i de volumul n al
seleciei, iar z depinde de nivelul de semnificaie stabilit i de legea de
probabilitate implicat.

10.2. Interval de ncredere pentru medie

Vom considera n cele ce urmeaz, cazul cnd parametrul necunoscut


pe care dorim s-l estimm prin interval de ncredere este media unei variabile
aleatoare.

Propoziia 10.2.1. Intervalul de ncredere pentru media unei variabile X ce



urmeaz legea normal N , 2 cu IR necunoscut i 2 0 cunoscut

este de forma ( X z ,X z ) , cu
1
2 n 1
2 n


P( X z X z ) 1 (10.2.1)
1
2 n 1
2 n

X 1 X 2 ... X n
unde X este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente, 0,1 este nivelul de

semnificaie iar z este cuantila de ordin 1 a repartiiei normale standard
1
2
2
dat prin funcia de repartiie (funcia integral Laplace - Gauss),
x t2
1
x e 2
dt .
2

Demonstraie

ntruct X N , 2 , iar media de selecie este de forma
X X 2 ... X n
X 1 , extragerile fiind independente, urmeaz c
n
2
X N , i mai departe, avem c variabila
n

221
X
Z

n

urmeaz legea normal standard (centrat i redus), N 0,1 . n consecin, fiind


dat un prag de semnificaie 0,05 , vom gsi dou numere z1 i z 2 astfel
nct:

t2
X 1 z2
2
P ( z1 z2) e dt ( z 2 ) ( z1 ) 1
2 z1

unde este funcia de repartiie a legii normale standard, Laplace-Gauss,


x t2
1
x 2
e dt , ale crei valori sunt tabelate. Mai departe, prin artificii de
2
calcul folosind probabilitatea unor evenimente echivalente, avem c:

t2
1 z2
2
P( X z 2 X z1 ) e dt ( z 2 ) ( z1 ) 1 .
z1
n n 2

Pentru fixat, se pot determina o infinitate de numere z1 i z 2 , astfel nct


( z 2 ) ( z1 ) 1 , ns pentru o precizie ct mai bun a intervalului de
ncredere, ne va interesa un interval de lungime minim, ori acesta se obine
pentru cazul cnd z1 z 2 , prin urmare, avem

t2
1 z2
2
P( X z 2 X z2 ) e dt ( z 2 ) ( z 2 ) 1 .
z2
n n 2

n acest caz se determin din relaia ( z 2 ) ( z 2 ) 1 cu


z2

( z 2 ) 1 ( z 2 ) , adic ( z 2 ) 1 , ceea ce nseamn c z 2 z este
2 1
2


cunatila de ordin 1 , a repartiiei normale standard.
2
Prin urmare, intervalul este dat prin formula


P( X z X z ) 1 . q.e.d.
1
2 n 1
2 n

222
Observaia 10.2.2. Valorile funciei de repartiie Laplace - Gauss,
x t2
1
x e 2
dt sunt tabelate, adic pentru probabilitatea auxiliar 1 ,
2 2
vom gsi n tabel valoarea cuantilei z 2 z ns exist i tabele, care prezint
1
2
x t2
~ 1
valorile funciei x e 2
dt , x 0, caz n care z2 este
2 0

1
corespunztoare valorii .
2

Observaia 10.2.3. Folosind notaia: X z , se poate scrie intervalul
n 1
2

de ncredere ca un caz particular al formulei (10.1.4), ( X fiind estimator


nedeplasat) i anume:

P( X X X X ) 1 .

Determinarea efectiv a celor dou limite presupune cunoaterea expresiei


matematice a estimatorului X i a erorii medii ptratice de estimare X , fiecare
variind de la un tip de sondaj la altul, aici fiind prezentat doar cazul unui sondaj
aleator simplu cu extrageri independente. Cu ct lungimea X a intervalul de
ncredere, respectiv nivelul de semnificaie sunt mai mici, cu att estimaia
parametrului necunoscut este mai bun.

Observaia 10.2.4. Pentru selecii de volum mare, intervalul de ncredere pentru


medie, precizat n Propoziia 10.2.1 este valabil i pentru cazul n care
variabila X urmeaz o lege oarecare de probabilitate, datorit Teoremei limit
central.

Exemplul 10.2.5. S presupunem c dispunem de valorile unei variabile



X N ,2 2 , obinute printr-o selecie simpl cu extrageri independente, de
volum 25 i de medie x 55 , obiectivul fiind acela de a estima media la nivelul
populaiei, , necunoscut, printr-un interval de ncredere de 95%.

Soluie
ntruct 0,05 , obinem din Anexa 1, z 1,96 i mai departe,
1
2
pentru 95% din cazuri,

2 2
55 1,96 55 1,96 .
25 25

223
Prin urmare, n 95% din cazuri, intervalul (54,216 - 55,784) va acoperi valoarea
necunoscut a parametrului .

Propoziia 10.2.6. Intervalul de ncredere de tip 1 , pentru media unei



variabile X ce urmeaz legea normal N , 2 cu IR necunoscut i
s s
2 0 necunoscut este de forma ( X t ,X t ) , cu
n 1, 1
2 n n 1, 1
2 n

s s
P( X t X t ) 1 (10.2.2)
n 1, 1
2 n n 1, 1
2 n

X 1 X 2 ... X n
unde X este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente,
2
s
X 1 X X 2 X ... X n X
2 2 2

este estimaia absolut corect a lui


n 1
2 , 0,1 este nivelul de semnificaie iar t este cuantila de ordin
n 1,1
2


1 a repartiiei Student cu n-1 grade de libertate.
2

Demonstraie
Conform legilor de probabilitate ale variabilelor de eantionare, atunci
X

cnd x N , 2 , variabila T
s
urmeaz legea Student cu n-1 grade de

n
libertate, ntruct se obine ca raport ntre dou variabile independente, o
variabil ce urmeaz legea normal standard i radicalul unei alte variabile de tip
2 raportat la numrul gradelor de libertate. Procednd ca n cazul cnd 2
este cunoscut se obine intervalul de ncredere corespunztor. q.e.d.

Exemplul 10.2.7. S considerm estimarea printr-un interval de ncredere de


tip 98%, a notei medii de repartiie normal, pornind de la urmtoarele date: 5,
10, 7, 6, 9, 8.

Soluie
ntruct 0,02 , n 6 , obinem din Anexa 2, t 3,365 . Pe baza
n 1,1
2
seleciei avem x 7,5 , s 1,87 i mai departe, n 98% din cazuri,

224
1,87 1,87
7,5 3,365 7,5 3,365 .
6 6

Prin urmare, n 98% din cazuri, intervalul (4,93 - 10) va acoperi valoarea
necunoscut a parametrului .

Observaia 10.2.8. Pentru selecii de volum mare, diferena ntre valorile


cuantilelor repartiiei Student i cele ale repartiiei normale standard este
neglijabil. De asemenea este neglijabil i diferena dintre estimatorul absolut

corect 2
s
X 1 X X 2 X ... X n X
2 2 2

i estimatorul
n 1

2
X 1 X X 2 X ... X n X
2 2 2

, prin urmare, se poate utiliza


n
formula (10.2.1) cu 2 nlocuit de 2 .

Propoziia 10.2.9. Pentru selecii de volum mare, intervalul de ncredere de tip


1 , pentru media unei variabile X ce urmeaz legea Bernoulli de parametru
necunsocut p este de forma

p 1 p p 1 p
( p z , p z ) (10.2.3)
1
2 n 1
2 n

X 1 X 2 ... X n
unde p este media de selecie corespunztoare unui
n
eantion obinut prin extrageri aleatoare independente, 0,1 este nivelul de

semnificaie iar z este cuantila de ordin 1 a repartiiei normale standard.
1
2
2

Demonstraie
Media unei variabile aleatoare ce urmeaz legea Bernoulli de parametru
necunoscut p, are pentru selecii de volum mare, conform Observaiei 10.2.4, o
repartiie aproximativ normal cu media egal cu p i abaterea medie ptratic
p 1 p
aproximativ egal cu , prin urmare aplicnd Propoziia 10.2.1 se
n
obine intervalul dorit. q.e.d.

O astfel de medie exprim de fapt proporia p de indivizi dintr-o


populaie care au o anumit caracteristic i este tratat ca media unei variabile X
cu valorile 0 i 1, prin valoarea 1 notnd valoarea variabilei X pentru indivizii
care au aceast caracteristic.

225
Exemplul 10.2.10. La un sondaj electoral, 40 din 100 de persoane chestionate s-
au pronunat n favoarea unui candidat, scopul fiind determinarea unui interval
de ncredere de tip 95% pentru procentul de alegtori favorabil acelui candidat.

Soluie
n 95% din cazuri intervalul va fi
40 0,4 0,6 40 0,4 0,6
1,96 p 1,96 , adic (0,304- 0,496), prin
100 100 100 100
urmare n 95% din cazuri, procentul favorabil candidatului va fi aproximativ
ntre 30% i 50%.

10.3. Interval de ncredere pentru diferena a dou medii

Vom considera n cele ce urmeaz problema determinrii intervalelor de


ncredere pentru diferena a dou medii, util n cazul n care dorim s avem o
informaie privind diferena de comportament a unei variabile, de la o populaie
la alta.

Propoziia 10.3.1. Fie dou populaii studiate n raport cu variabila X, pentru


prima populaie variabila fiind de tipul N 1 , 1
2

iar pentru a doua, de tipul
2
2
N 2 , 2 , cu 1 , 2 necunoscute, respectiv 1 , 2 cunoscute. Fie de
2

asemenea dou selecii bazate pe extrageri independente de volume n1 i


respectiv n2 , din cele dou populaii, cu mediile de selecie X 1 , X 2 . Pentru un
nivel de semnificaie, 0,1 , intervalul de ncredere pentru diferena celor
dou medii este de forma

2 2 2 2

X1 X 2 z 1 2 1 2 X 1 X 2 z 1 2 (10.3.1)
1
2
n1 n2 1
2
n1 n2


unde z este cuantila de ordin 1 a repartiiei normale standard.
1
2
2
Demonstraie
Variabila aleatoare Z
X 1 X 2 1 2
urmeaz legea normal
2 2
1 2

n1 n2
standard. q.e.d.

Exemplul 10.3.2. Vom determina intervalul de ncredere de tip 95% pentru


diferena mediilor unei variabile n dou populaii diferite n care se presupune
226
c repartiiile variabilei sunt normale, de medii necunoscute 1 respectiv 2 i
2 2
dispersii cunoscute 1 2 2 , 2 3 2 , pornind de la seleciile de volum n1 7
i respectiv n2 8 , de medie, x1 22 i respectiv, x 2 20 .

Soluie
n 95% din cazuri intervalul va fi

4 9 4 9
(22 20) 1,96 1 2 (22 20) 1,96 .
7 8 7 8

Propoziia 10.3.3. Fie dou populaii studiate n raport cu variabila X, pentru


prima populaie variabila fiind de tipul N 1 , 1
2

iar pentru a doua, de tipul
2
2 2
N 2 , 2 , cu 1 , 2 necunoscute, respectiv 1 , 2 necunoscute dar egale.
Fie de asemenea dou selecii bazate pe extrageri independente de volume n1 i
respectiv n2 , din cele dou populaii cu mediile de selecie X 1 , X 2 i estimatorii
2 2
absolut coreci ai dispersiilor, s1 , s 2 . Pentru un nivel de semnificaie,
0,1 , intervalul de ncredere pentru diferena celor dou medii este de
forma

1 1 1 1
X1 X 2 t S 1 2 X 1 X 2 t S (10.3.2)
,1
2
n1 n 2 ,1
2
n1 n 2


unde t este cuantila de ordin 1 a repartiiei Student cu n1 n 2 2
,1
2
2

grade de libertate iar S 2


n1 1s1 2 n2 1s2 2 .
n1 n2 2

Demonstraie
Variabila aleatoare T
X 1 X 2 1 2
urmeaz legea Student cu
1 1
S
n1 n2
n1 n2 2 grade de libertate. q.e.d.

Exemplul 10.3.4. n vederea comparrii comportamentului unei variabile n


dou populaii normale, avnd aceeai dispersie, se pune problema determinrii
unui interval de ncredere de tip 95% pentru diferena mediilor variabilei n cele

227
dou populaii, pornind de la dou seturi de date de volum 10 i 12 cu mediile
2 2
x1 2,5 i x 2 2 , respectiv s1 0,2 i s 2 0,22 .

Soluie
n 95% din cazuri intervalul va fi


(2,5 2) t S 1 1 1 2 (2,5 2) t S 1 1 ,
,1 10 12 ,1 10 12
2 2

cu t t 20, 0.975 2,086 i S 2


10 1 0,2 12 1 0,22 .

,1
2
10 12 2

Propoziia 10.3.5. Fie dou populaii studiate n raport cu variabila X, pentru


prima populaie variabila fiind de tipul N 1 , 1
2

iar pentru a doua, de tipul
2
2
N 2 , 2 , cu 1 , 2 necunoscute, respectiv 1 , 2 necunoscute i diferite.
2

Fie de asemenea dou selecii bazate pe extrageri independente de volume n1 i


respectiv n2 , din cele dou populaii cu mediile de selecie X 1 , X 2 i estimatorii
2 2
absolut coreci ai dispersiilor, s1 , s 2 . Pentru un nivel de semnificaie,
0,1 , intervalul de ncredere pentru diferena celor dou medii este de
forma

2 2 2 2
s s s s
X1 X 2 t 1 2 1 2 X 1 X 2 t 1 2 (10.3.3)
,1
2
n1 n2 ,1
2
n1 n2


unde t este cuantila de ordin 1 a repartiiei Student cu grade de
,1
2
2
2
s1
2
1
libertate unde
c2

1 c iar c .
n1 1
2 2
n1 1 n2 1 s1 s2

n1 1 n2 1

Demonstraie
Variabila aleatoare T
X 1 X 2 1 2
urmeaz legea Student cu
2 2
s1 s
2
n1 n2
grade de libertate. q.e.d.

228
Exemplul 10.3.6. n vederea comparrii comportamentului unei variabile n
dou populaii normale, avnd dispersii diferite, se pune problema determinrii
unui interval de ncredere de tip 95% pentru diferena mediilor variabilei n cele
dou populaii, pornind de la dou seturi de date de volum 10 i 12 cu mediile
2 2
x1 2,5 i x 2 2 , respectiv s1 0,2 i s 2 0,22 .

Soluie
n 95% din cazuri intervalul va fi


(2,5 2) t 0,2 0,22 1 2 (2,5 2) t S 0,2 0,22 ,
,1 10 12 ,1 10 12
2 2


cu t determinat din Anexa 2, pentru 1 0,975 i determinat din
,1
2
2
0,2
2
1 c 2 1 c 9
relaia cu c .
9 11 0, 2 0, 22

9 11

Observaia 10.3.7. Dac volumul seleciilor este mare, se poate considera c


variabilele aleatoare utilizate n Propoziia 10.3.3 i Propoziia 10.3.5 au
2 2
repartiia normal, folosindu-se astfel formula (10.3.1) n care 1 , 2 se
estimeaz prin momentele centrate de ordin 2, corespunztoare celor dou
selecii. De asemenea, pentru selecii mari, formula (10.3.1) se poate utiliza i
pentru populaii n care repartiia variabilei nu este normal.

10.4. Interval de ncredere pentru dispersie i raportul a dou


dispersii
Un alt parametru care se poate estima prin interval de ncredere este
dispersia (variana) unei variabile. De asemenea, dup cum s-a putut observa n
paragraful anterior, pentru a obine estimaii privind diferena a dou medii este
util s avem informaii despre raportul dintre dispersiile corespunztoare, atunci
cnd ele nu se cunosc, aspecte ce vor fi prezentate n acest paragraf.

Propoziia 10.4.1. Intervalul de ncredere de tip 1 , pentru dispersia unei



variabile X ce urmeaz legea normal N , 2 cu IR necunoscut i
2 0 necunoscut este de forma

229
n s2 2 n s2
(10.4.1)
2 2
n 1,1 n 1,
2 2

unde

s 2

X 1 X X 2 X ... X n X
2 2 2

n 1

este estimaia absolut corect a lui 2 pentru o selecie de volum n, bazat pe


extrageri independente, 0,1 este nivelul de semnificaie iar 2 i
n 1,1
2


2 sunt cuantilele de ordin 1 i ale repartiiei 2 cu n-1 grade de
n 1,
2
2 2
libertate.

Demonstraie
ntruct, conform legilor de probabilitate ale variabilelor de eantionare,
cum o sum de ptrate de n variabile aleatoare independente, de medie 0 i
repartiie normal are o repartiie de tip 2 cu n-1 grade de libertate, avem c

variabila 2
n 1 s 2 urmeaz legea 2 cu n-1 grade de libertate, prin
2

urmare pentru un nivel de semnificaie , gsim dou numere 12 i 22 , astfel

nct P 12 2 22 1 . Dac alegem 12 2 i 22 2
n 1, n 1,1
2 2


cuantilele de ordin 1 i ale repartiiei 2 cu n-1 grade de libertate,
2 2
obinem 2
n 1 s 2 , de unde prin artificii de calcul, rezult
2


n 1,
2
2 n 1,1
2
intervalul dorit. q.e.d.

Exemplul 10.4.2. n vederea estimrii variabilitii unui instrument de


msurare, se pune problema determinrii unui interval de ncredere de tip 98%
pentru 2 pornind de la 5 msurtori independente presupuse ca fiind extrase
dintr-o repartiie normal, pentru care s-a calculat s 2 2 .

230
Soluie
5 2 52
n 98% din cazuri intervalul va fi 2
2 2 , unde
4, 0.99 4, 0.01
42, 0.99 13,28 i 42, 0.01 0, 297 rezult din Anexa 3, cu valorile tabelate ale legii
2.

Propoziia 10.4.3. Fie dou populaii studiate n raport cu variabila X, pentru


prima populaie variabila fiind de tipul N 1 , 1
2
iar pentru a doua, de tipul
2

N 2 , 2 , cu 1 , 2 necunoscute, respectiv 1 , 2 necunoscute. Fie de
2 2

asemenea dou selecii bazate pe extrageri independente de volume n1 i


respectiv n2 , din cele dou populaii cu mediile de selecie X 1 , X 2 i estimatorii
2 2
absolut coreci ai dispersiilor, s1 , s 2 . Pentru un nivel de semnificaie,
0,1 , intervalul de ncredere pentru raportul celor dou dispersii va fi

2 2 2
1 s1 1 s1
2
12 2
(10.4.2)
f s2 2 f s2
n1 1, n2 1,1 n1 1, n2 1,
2 2


unde f i f sunt cuantilele de ordin 1 i ale
n1 1,n2 1,1
2
n1 1,n2 1,
2
2 2
repartiiei Fisher-Snedecor cu n1 1 i n2 1 grade de libertate.

Demonstraie
Cum raportul a dou variabile de tip 2 este o variabil de tip Fisher,
2
s1
2
1
avem c variabila F 2
urmeaz legea Fisher cu n1 1 i n2 1 grade de
s2
2
2
libertate i raionand ca n propoziia anterioar, se obine intervalul dorit. q.e.d.

Exemplul 10.4.4. n vederea comparrii comportamentului unei variabile n


dou populaii normale, se pune mai nti problema determinrii unui interval
de ncredere de tip 95% pentru raportul dispersiilor n cele dou populaii,
pornind de la dou seturi de date fiecare de volum 10 i 12 cu
2 2
s1 0,2 i s 2 0,22 .

231
Soluie
2
1 0, 2 1 1 0, 2
n 95% din cazuri intervalul este 2 ,
f 9,11, 0.975 0,22 2 f 9,11,0.025 0,22

cu f 9,11,0.975 3,59 determinat din Anexa 4, cu valorile tabelate ale legii Fisher
1
i f 9,11,0.025 0,278 .
f 9,11, 0.975

232
Capitolul 11

Teoria deciziei

11.1. Decizii empirice


n viaa de zi cu zi suntem nevoii s lum decizii importante sau mai puin
importante, la fiecare pas. Cnd traversm strada printr-un loc nepermis, culegem n
mod empiric cteva informaii (distana pn la cel mai apropiat vehicul, viteza cu
care se apropie de noi, etc.), apoi lum decizia de a traversa. De fiecare dat ne
asumm riscul ca decizia s fie greit, i uneori, decizia chiar este greit.

11.2. Decizii statistice

Firma de automobile F trebuie s cumpere o mare cantitate de anvelope i


are de ales ntre mrcile A1 i A2. nainte de a lua o decizie, firma testeaz n
anvelope de tip A1 i n anvelope de tip A2. Avnd la dispoziie msurtorile care
rezult n urma testrilor, firma decide c anvelopele A1 sunt superioare. Aceast
decizie se bazeaz pe testarea unui numr n de anvelope, care prin fora
lucrurilor este mic n raport cu numrul mare de anvelope care vor fi
cumprate. Prin urmare, exist riscul ca decizia s fie greit.

Poate fi msurat acest risc?


Triumful teoriei statistice a deciziilor const tocmai n posibilitatea de a
msura gradul de risc n termenii unor probabiliti obiective. Prelucrnd statistic
rezultatele numerice ale msurtorilor, statisticienii firmei F pot comunica
managerului c probabilitatea ca decizia s fie greit este mai mic dect, s zicem,
0.05. Tinnd seama de toi factorii implicai, managerul poate decide c riscul este
acceptabil. Dac probabilitatea ca decizia s fie greit este prea mare, managerul
poate cere teste suplimentare, sau poate lua n considerare parametrii suplimentari.
Cnd decidem s traversm strada printr-un loc nepermis, actionm pe baza
unor probabiliti subiective, i deci gradul de risc este apreciat n mod subiectiv.
Cnd avem la dispoziie rezultatele numerice ale unor experimente, teoria
statistic a deciziilor ne permite s msuram gradul de risc asociat unei decizii n
termenii unor probabiliti obiective.

233
n cele ce urmeaz, vom prezenta anumite metode de a calcula astfel de
probabiliti obiective i implicit de a aprecia gradul de risc asociat unei
decizii. Metode de acest tip vor fi aplicate la testarea irurilor binare cu scopul de
a decide dac sunt aleatoare.

11.3. Ipoteze statistice

ntr-o accepiune larg, prin ipotez statistic nelegem o ipotez asupra


unui fenomen aleator. Putem formula, de exemplu, ipoteza asupra naturii
distribuiei unei variabile aleatoare: normal, binomial, Poisson etc. Sau, dac
natura distribuiei este precizat, putem formula ipoteze asupra valorilor
numerice ale parametrilor care intervin n structura legii respective de
probabilitate.
Ipoteza care urmeaz s fie testat se noteaz cu H0. Este necesar s
formulm i ipotez alternativ, notat cu H1.
Dac, de exemplu, H0 este ipoteza c un anumit parametru p, are o valoare
numeric p0, atunci H1 poate fi ipoteza c p are o alta valoare numeric p1. Alt
exemplu ar putea fi ipoteza H1: pp1; cu alte cuvinte, H1 poate fi pur i simplu
ipoteza c H0 este fals.
Un test statistic are menirea de a recomanda acceptarea ipotezei H0 (i deci
respingerea lui H1) sau respingerea lui H0 (i deci acceptarea lui H1).

11.4. Teste statistice

Un test statistic se bazeaz pe un experiment n urma cruia, sub ipoteza


H0, putem deduce valoarea numeric a unei statistici X. n spaiul valorilor pe
care le poate lua X vom izola o submulime numit zona critic a testului. Dac
valoarea numeric a lui X furnizat de experiment aparine zonei critice, vom
decide c respingem ipoteza H0 i acceptm ipoteza H1; n caz contrar, acceptm
H0 i respinge H1.
ntruct rezultatul experimentului este influenat de factori aleatori, decizia
noastr nu este infailibil: ea poate fi eronat.

11.5. Tipuri de erori

S presupunem c H0 este adevrat, dar c n ciuda acestui fapt


datorit factorilor aleatori, valoarea lui X obinut n urma experimentului
aparine zonei critice. Noi vom decide s respingem ipoteza H0, dar aceast
decizie va fi evident greit. n acest caz se spune ca am comis o eroare de tip I.

234
Cealalt eroare posibil este de a accepta ipoteza H0 cnd n realitate ea
este fals; aceasta se ntmpl cnd, dei H0 este fals, valoarea lui X n urma
experimentului se plaseaz n afara zonei critice. n acest caz avem de a face cu o
eroare de tip II.

11.6. Nivel de semnificaie


Probabilitatea de a comite o eroare de tip I se noteaz cu i se numete
nivel de semnificaie al testului. Dac, de exemplu, =0.05 i aplicm testul de
1000 de ori, n aproximativ 50 de cazuri vom respinge n mod eronat ipoteza H0 .
Probabilitatea de a comite o eroare de tip II se noteaz cu .
Desigur c dorim s proiectm teste pentru care probabilitile de eroare
i s fie mici. n anumite situaii, se caut minimizarea sumei + . n alte
cazuri se fixeaz nivelul de semnificaie i se caut testul pentru care s fie
minim. n cazuri complexe printre care i testarea irurilor binare calculul
lui este dificil sau chiar imposibil, aa c se fixeaz doar nivelul de
semnificaie .
Aceste consideraii sunt exemplificate n urmtorul exemplu.
Considerm o anumit distribuie de probabilitate a crei form o
cunoatem, dar n structura creia intra un parametru necunoscut .
Fie H0 : = 0 , i fie K zona critic a testului. Avem

P x K | H 0 este adevarata P x K | 0
ntruct distribuia de probabilitate este complet specificat, probabilitatea
de mai sus poate fi calculat.

i. Fie H1 : = 1.
Atunci
P x K | H 0 este falsa P x K | H1 este adevarata P x K | 1
Din nou distribuia de probabilitate este complet specificat, deci
probabilitatea poate fi i ea calculat.

ii. Fie H1 : 0. Acum


P x K | 0 .
De data aceasta, parametrul nu mai este specificat, deci calculul lui este
dificil sau chiar imposibil.

235
11.7. Un exemplu
Notm cu X timpul dintre dou semnalizri succesive ale unui contor
Geiger. Din studiul dezintegrrii radioactive se tie c variabila aleatoare X are
densitatea exponenial:
e t , t 0
f t
0 , in rest .
unde este un parametru care depinde de natura materialului radioactiv.
Un fizician dorete s testeze valoarea lui pentru un anumit material
radioactiv.
Din anumite considerente teoretice sau experimentale, el tie c poate lua
fie valoarea 1, fie valoarea 2; intuiia fizicianului favorizeaz valoarea 2.
Aadar se testeaz ipoteza:
H0 : 2
n prezena ipotezei alternative:
H1 : 1 .
Pentru simplitatea exprimrii, vom presupune c se face o singur
observaie asupra variabilei X, cu alte cuvinte, se msoar lungimea unui singur
interval de timp dintre dou scintilaii consecutive ale contorului Geiger; desigur
c n practic testarea se va baza pe mai multe astfel de observaii.
Notm cu x valoarea msurat a lui X. Alegem drept zon critic a testului
intervalul (1, +). Aceasta nseamn c:
Dac x > 1, vom respinge ipoteza H0 i vom accepta ipoteza H1;
Dac 0 < x 1, vom accepta ipoteza H0 i vom respinge ipoteza H1.
S calculm nivelul de semnificaie al testului. Avem
P x 1 | H 0 adevarata P x 1 | 2 .
Pentru =2, densitatea de probabilitate este

f t 2 e 2 t , t 0
i deci
2t
1 f t dt 2 1 e dt 0.13 .

Aadar, probabilitatea de a comite o eroare de tipul I (i.e., de a respinge n


mod eronat ipoteza H0) este egal cu 0.13.
S calculm acum probabilitatea de a comite o eroare de tipul II (adic de a
accepta eronat ipoteza H0, ceea ce este totuna cu a respinge eronat ipoteza H1 ).

P 0 x 1 | H 1 adevarata P 0 x 1 | 1 .
Pentru =1, densitatea de probabilitate este

236
f t e t , t 0 ,
i atunci avem

Desigur, probabilitatea unei erori de tipul II este mare, dar aceasta se


explic prin faptul c testul nostru se bazeaz pe o singura observaie.
Este util o interpretare geometric a faptelor de mai sus.
Pentru =2, graficul densitii de probabilitate este schiat n figura de mai jos.

Zona critic este intervalul (1, +) de pe axa Ox. Probabilitatea ca


observaia x s aparin zonei critice este egal cu aria suprafeei delimitate de
grafic i axa deasupra zonei critice. Nivelul de semnificaie este egal cu
aceast arie.
Pentru =1 avem graficul de mai jos:

237
Zona necritic este intervalul (0,1], iar probabilitatea este egal cu aria
delimitat de grafic i axa deasupra zonei necritice.
S construim acum alt test, cu acelai nivel de semnificaie, dar n care
regiunea critic s fie un interval de forma (0,a). Aceasta nseamn s
determinm numrul a>0 astfel nct
P 0 x a | 2 0.13 .
Condiia de mai sus se transcrie n forma echivalent:

de unde se poate deduce a=0.07.


n aceste condiii, probabilitatea unei erori de tipul II va fi
t
P x a | 1 0.07 e dt 0.93 .
Constatm acum c probabilitatea este mai mare dect n situaia precedent,
prin urmare, testul anterior, bazat pe zona critic , este superior.
Interpretarea geometric n cazul al doilea se deduce din urmtoarele grafice.

238
Nivelul de semnificaie este egal cu aria suprafeei situate deasupra zonei
critice Graficul corespunde valorii =2.

Probabilitatea este egal cu aria suprafeei situate deasupra zonei necritice


Graficul este trasat pentru valoarea =1.

11.8. Relaia dintre probabilitile i


n fiecare situaie concret este important s tim care dintre cele dou
erori posibile ar produce cele mai mari prejudicii, i s minimalizm
probabilitatea de a comite acea eroare. Intuitiv este clar c dac se micoreaz
valoarea lui , va crete valoarea lui , i invers. Acest fapt poate fi ilustrat
geometric n condiiile exemplului din seciunea anterioar.
S relum ipotezele:
H 0 : 2 ;
H 1 : 1 .
referitoare la parametrul O din densitatea de probabilitate
e t , t 0
f t
0 , t 0 .
Alegem drept zona critic a testului un interval de forma unde

239
n aceast figur este trasat graficul densitii pentru =2. Nivelul de
semnificaie coincide cu aria de sub grafic, la dreapta lui c.

Pentru =1, graficul densitii de probabilitate este trasat n figura de mai


sus; probabilitatea coincide cu aria suprafeei de sub grafic, la stnga lui c.
Este clar c alegerea lui c determin valorile lui i . A micora pe
nseamn a muta punctul c spre dreapta; evident c aa l vom mri pe . Invers,
a-l micora pe nseamn a muta punctul c spre stnga, ceea ce l mrete pe .
O practic des ntlnit n situaii concrete este aceea de a fixa un anumit nivel
de semnificaie ( de obicei = 0.05, sau = 0.01, = 0.001); apoi, dintre testele cu acest
nivel se caut unul pentru care s fie ct mai mic cu putin. Intuitiv este clar c
dac numrul de observaii pe care se bazeaz testul crete, atunci scade; ns un
numr sporit de observaii poate angaja costuri suplimentare considerabile.

11.9. Puterea unui test


S considerm din nou densitatea de probabilitate
e t , t 0
f t
0 , t 0 .

240
Vom testa ipoteza
H 0 : 2 ;

n prezenta ipotezei alternative


H 1 : 2 .
care va nlocui ipoteza alternativ =1 considerat anterior. Considerm drept zon
critic intervalul , ceea ce nseamn ca nivelul de semnificaie este =0.13.
De data aceasta, ipoteza alternativ H1 nu mai specific o valoare cunoscut
a lui , aa nct nu mai putem indica o valoare numeric a probabilitii ;
putem ns determina expresia lui ca funcie de variabila 0, 2 .
ntr-adevr este probabilitatea ca s aparin zonei necritice cnd
valoarea parametrului este
1 t
0 e dt e t |10 1 e .

Aadar, probabilitatea ca noi s acceptm n mod eronat ca valoare a


parametrului numrul 2, cnd adevrata valoare este , va fi egal cu 1 e .
n general, funcia p 1 se numete funcia de putere a testului,
sau puterea testului. Aceast funcie descrie probabilitatea ca testul s resping
ipoteza H0 atunci cnd ea este eronat.
n cazul exemplului de mai sus avem:
P 1 e ; graficul acestei funcii este schiat mai jos.

Pentru fiecare valoare a parametrului, funcia de putere P() descrie


probabilitatea ca s aparin zonei critice; n particular, P(2) = 0.13.
Dac = 1, valoarea eronat 2 este respins cu probabilitatea 0.37, iar dac
=0.5, aceeai valoare eronat 2 este respins cu probabilitate 0.61.

241
11.10. nc un exemplu

Ni se d o moned i ni se cere s decidem dac este sau nu trucat. Avem


de testat ipoteza
H0 : moneda nu este trucat
n prezena ipotezei alternative
H1 : moneda este trucat
Astfel formulate, ipotezele H0 i H1 sunt de natur calitativ; le putem
transcrie sub o form cantitativ, numeric, dac notm cu p probabilitatea de a
obine faa A la o aruncare a monedei ( i deci q = 1 - p va fi probabilitatea de a
obine faa B).
Atunci putem scrie:
H0 : ,
H1 :
Testul va consta din a arunca moneda de 100 de ori. S notm prin X
numrul de apariii ale feei A n cele 100 de aruncri. Sub ipoteza H0, X este o
variabil aleatoare repartizat binomial cu parametrii i . Media lui
X va fi np = 50, iar dispersia npq = 25.
Aproximnd distribuia binomial printr-o distribuie normal cu media 50
i dispersia 25, densitatea lui X va fi aproximativ cea schiat in figura
urmtoare.

35 40 45 50 55 60 65

Vom determina zona critic n aa fel nct nivelul de semnificaie s fie


0.05. Folosind tabele pentru legea normal deducem

242
nseamn c zona necritic va fi intervalul [40,60], iar cea critic exteriorul
acestui interval.
Aadar testul nostru poate fi rezumat astfel:
1. Dac faa A apare de un numr de ori mai mic dect 40 sau mai mare
dect 60, moneda este trucat. Probabilitatea ca aceast concluzie s
fie greit este mai mic dect 0.05.
2. Dac faa A apare de un numr de ori cuprins ntre 40 i 60, nu exist
suspiciuni (la nivelul de semnificaie 0.05) c moneda ar fi trucat.
S presupunem acum c n realitate p = 0.7, dar noi nu tim asta. Atunci
distribuia real a lui X va fi aproximativ normal cu media 70 i dispersia 21.
Atunci probabilitatea pentru testul nostru va fi

Folosind funcia de putere, avem

Alte valori ale funciei de putere, calculate n mod similar, sunt

Cu alte cuvinte, dac p=0.3 testul nostru va respinge ipoteza greit p=0.5 cu
probabilitatea 0.98.

11.11. Testarea irurilor binare

Avem n vedere iruri finite (numite i secvene) formate cu simbolurile 0


i 1. Un astfel de ir aleator poate fi interpretat ca rezultat al aruncrilor unei
monede netrucate avnd feele notate cu 0 i 1. Aruncrile sunt independente
unele de altele i rezultatele aruncrilor pn la un anumit moment nu
influeneaz n nici un fel rezultatele aruncrilor viitoare.
Acest experiment ideal este neconvenabil pentru scopuri practice. n
practic irurile binare sunt produse de generatoare, i ele urmeaz s fie testate
din punct de vedere al caracterului aleator.

11.12. Testarea statistic a irurilor binare


S considerm un ir binar care urmeaz s fie testat. Vom formula ipoteza
H0 : irul dat este aleator
i ipoteza alternativ
H1 : irul dat nu este aleator.

243
Alegem un nivel de semnificaie , adic probabilitatea de a comite o
eroare de tip I. O valoare mare a lui indic un risc mare ca testul s resping
ipoteza H0 cnd ea este n realitate adevrat; cu alte cuvinte, un risc mare ca
testul s declare drept nealeatoare iruri care au fost produse n mod aleator.
O eroare de tip II nseamn n cazul de fa s acceptm drept aleator un ir
produs de un generator imperfect. Probabilitatea de a comite o astfel de eroare
depinde de natura imperfeciunii generatorului, i este dificil de estimat n
practic. n mod curent se consider c o valoare prea mic a lui mrete riscul
unei erori de tip II, cu alte cuvinte mrete riscul de a accepta drept aleatoare
iruri produse de un generator imperfect.
Este deci important s alegem nivelul de semnificaie adecvat problemei
concrete pe care o avem de rezolvat. n practic se folosete un nivel de
semnificaie cuprins ntre 0.001 i 0.05; se alege de multe ori = 0.01.
Fiecare test se bazeaz pe o statistic X a crei valoare numeric se
calculeaz pornind de la irul considerat. De obicei se aleg statistici care pot fi
calculate n mod eficient i care urmeaz o lege normal sau .
Valoarea x a statisticii X pentru irul dat se compar cu valoarea ateptat
de la un ir aleator.
a. S presupunem c statistica X cu care lucrm este distribuit N(0,1), i c
ia fie valori foarte mici, fie valori foarte mari pentru irurile nealeatoare.
Folosind tabele pentru legea normal fixm un prag x astfel nct

Zona critic a testului va fi , x x , . Dac valoarea x a


lui X, calculat pentru irul considerat, aparine zonei critice, irul este
considerat nealeator; cu alte cuvinte, ipoteza H0 este respins la nivelul de
semnificaie .
Dac , com accepta ipoteza H0; nu sunt suspiciuni (la
nivel de semnificaie ) c irul ar fi produs de un generator imperfect.
De exemplu, dac =0.05, atunci x = 1.96; probabilitatea ca un ir
aleator s fie respins ca nealeator este de 0.05.
b. S presupunem acum c statistica X este distribuit cu grade de
libertate, i c ia valori foarte mari pentru irurile nealeatoare. Pragul x se
determin (folosind tabele pentru legea ) din condiia

Zona critic a testului va fi Dac valoarea x a lui X,


calculat pentru irul testat, aparine zonei critice, ipoteza H0 va fi respins la
nivel de semnificaie , adic irul va fi considerat nealeator. Dac
acceptm ipoteza H0; nu sunt suspiciuni c irul ar fi nealeator.
De exemplu, dac =5 i =0.025, atunci x=12.83; probabilitatea ca
un ir aleator s fie declarat, n mod eronat, ca nealeator este de 0.025.

244
11.13. Noiunea de P-valoare
Uneori nu se lucreaz cu pragul x, ci se prefer folosirea aa-numitei P-
valori. Vom prezenta aceast noiune n cadrul exemplelor (a) i (b) de mai sus.
a. Fie x valoarea numeric a lui X pentru irul testat. Probabilitatea

se numete P-valoare.

Examinnd figura de mai sus deducem c urmatoarele afirmaii sunt


echivalente.
1) X aparine zonei critice
2)
3)
4)
Din echivalena condiiilor (1) i (4) deducem c ipoteza H0 va fi
respins dac i numai dac P-valoarea este mai mic dect .
Aadar irul testat va fi respins ca nealeator (la nivelul de semnificaie
) dac i numai dac P-valoarea calculat pentru el este mai mic dect .
b. n condiiile acestui exemplu, descrise n seciunea precedent, fie x
valoarea numeric a lui X pentru irul testat. Probabilitatea P X x se
numete P-valoare.

245
x x

Examinnd aceast figur conchidem c urmtoarele afirmaii sunt


echivalente:

1) x aparine zonei critice


2) x > x
3)
4)

Echivalena condiiilor (1) i (4) arat c ipoteza H0 va fi respins la nivelul


de semnificaie dac i numai dac P-valoarea este mai mic dect . irul
testat va fi respins ca nealeator dac i numai dac P-valoarea calculat pentru el
este mai mic dect .

246
Iat, n rezumat, dou concluzii.
1. Dac testul a fost proiectat pentru nivelul de semnificaie =0.001, din
1000 de iruri produse aleator, el va respinge, n medie, unul singur ca fiind
nealeator. Dac pentru un ir dat P-valoarea este mai mic dect 0.001,
irul va fi declarat nealeator, iar probabilitatea ca aceast decizie s fie
greit este 0.001.
2. Din 1000 de iruri aleatoare, un test cu nivelul de semnificaie =0.01 va
respinge, n media, 10 iruri ca fiind nealeatoare. Un ir cu P-valoarea mai
mic dect 0.01 va fi declarat nealeator, iar nivelul nostru de ncredere n
corectitudinea acestei decizii este 99%.

11.14. Un exemplu: statistic repartizat normal

Am observat deja mai sus c aruncnd o moned netrucat generm un ir


binar aleator. Prin urmare, avnd de testat un ir dat, ne putem imagina c el a
aprut ca rezultat al aruncrilor unei monede, i rmne s testm dac moneda
este netrucat.
O astfel de testare a fost descris anterior, la nivelul de semnificaie
=0.05; tot acolo am vzut ce fel de consideraii pot fi fcute n legtur cu
probabilitatea (de a accepta ca aleator un ir care de fapt nu este aleator) i n
legtur cu puterea testului.
n cazul specific al irurilor binare, metoda respectiv de testare poate fi
descris astfel. Considerm un ir binar de lungime n. Formulm ipoteza

H0 : irul este aleatoriu

Statistica Sn va indica numrul de apariii ale cifrei 1. Sub ipoteza H0, Sn


este repartizat binomial, cu parametrii n i , adic

, k = 0,1,2,,n.

Notm
Atunci X este repartizat aproximativ N(0,1), adic

unde
z>0.

Fixnd nivelul de semnificaie , vom determina pragul x din relaia

247
De exemplu, x0.05 = 1.96, iar x0.01 = 2.58.

Pentru un ir dat, s notm cu x valoarea numeric a lui X:

Atunci P-valoarea asociat irului va fi

Cu scop ilustrativ, s considerm exemplul irului binar


1011010101
S fixm nivelul de semnificaie = 0.01, ceea ce determin pragul
x = 2.58.
Avem n=10, Sn=6, deci

ntruct 0 < x < x, acceptm ipoteza c irul este aleator.


De altfel putem calcula i P-valoarea pentru acest ir, ea este

S considerm acum irul binar


1111011111
Avem n=10, Sn=9, deci

248
P-valoarea calculat pentru acest ir este

irul trece (aproape la limit) testul cu nivelul de semnificaie 0.01, dar este
respins de testul cu nivelul de semnificaie 0.05.

11.15. Alt exemplu: statistic repartizat 2

Fie M i N numere naturale fixate. Considerm un ir binar de lungime n =


MN, pe care l mprim in N blocuri consecutive de lungime M. Notm cu Mi
numrul de cifre 1 n blocul i,
Sub ipoteza
H0 : irul este aleator,

Mi este o variabil aleatoare binomial cu parametrii M i ; altfel spus,

Media lui Mi este , iar dispersia


n aceste condiii variabila aleatoare

este repartizat aproximativ cu N grade de libertate; altfel spus, densitatea ei de


probabilitate este funcia

Este comod s notm cu frecvena relativ a cifrei 1 in blocul i.


Atunci putem scrie

249
Aceast variabil aleatoare cu N grade de libertate poate fi folosit la
testarea irului, aa cum se arat n exemplul de mai sus.
Cu scop ilustrativ, s considerm irul
011001101
Alegem M=3, N=3, i considerm blocurile
011, 001, 101
Cu notaiile anterioare,

Acum putem calcula valoarea x a variabilei X:

Lucrm cu 3 grade de libertate; din tabele gsim c P-valoarea irului este


0.80, deci irul este considerat aleator la nivelele de semnificaie 0.01 i 0.05.
Aceeai concluzie se obine comparnd valoarea x=1 cu pragurile x0.01 = 11.341
i x0.05 = 7.815.

250
Capitolul 12

Analiza regresiei

Introducere
Analiza de regresie i are originile n nenumratele probleme practice,
care apar atunci cnd dorim s nelegem i s cuantificm aspectul cauz-efect,
n studiul a dou sau mai multe fenomene, de natur divers. Principala noiune
cu care opereaz acest capitol este noiunea de model de regresie. Vom vedea n
cele ce urmeaz cteva generaliti ale problemei regresiei, prezentndu-se
principalele tipuri de modele de regresie, apoi se va fundamenta modelul liniar
multiplu, incluznd particularitile modelului liniar simplu, estimarea
coeficienilor modelului prin metoda celor mai mici ptrate, inferena asupra
modelului n ipotezele Gauss-Markov, precum i aspecte privind previziunea pe
baza modelului de regresie.

12.1. Modele de regresie

S considerm, spre exemplu, c fiecare element al unei populaii


statistice posed o caracteristic numeric, X i o alta Y. Pentru a vedea cum
afecteaz valorile lui X, realizrile variabilei Y, este necesar studierea posibilei
corelaii existente ntre cele dou variabile. Un exemplu clasic este acela care
studiaz nlimea unei persoane, n funcie de cea a tatlui.
n cazul legturilor statistice, care conin ca i caz particular, aferent
dependenei totale, legtura funcional, unei singure valori, x, a variabilei X, i se
asociaz o repartiie de valori a variabilei Y, de medie f x , x D , D fiind
mulimea valorilor variabilei X.

Definiia 12.1.1. Dac pentru fiecare valoare, x D , a lui X , Y este o variabil


aleatoare cu distribuia de probabilitate depinznd de x, vom numi funcie de
regresie a lui Y pe X, funcia f x , definit cu ajutorul valorii medii
condiionate,

f x E Y x , x D . (12.1.1)

innd cont de caracteristicile valorii medii condiionate, o legtur direct


ntre Y i X va fi dat atunci, de modelul de regresie simpl
251
Y f X , (12.1.2)

unde satisface condiiile E 0 i Var - minim i are semnificaia de


eroare de specificare, eroare datorat faptului c variabila/variabilele luate n
considerare nu sunt singure suficiente, pentru a explica n totalitate, fenomenul
cuantificat de Y.

Vom considera n cele ce urmeaz, aa cum se ntmpl i n practic,


mai multe variabile cauz (variabile exogene, predictori,
regresori), X 1 , X 2 ,..., X p , pentru variabila efect, Y (variabil endogen).

Definiia 12.1.2. Modelul de regresie multipl este modelul de forma

Y f X 1 , X 2 ,..., X p , (12.1.3)

unde reprezint o variabil aleatoare, pentru care E 0 i V mic.

Dei X 1 , X 2 ,..., X p sunt considerate variabile deterministe, Y mprumut


de la , caracterul aleator, termenul eroare, , fiind cel care transform modelul
matematic, strict funcional, n unul statistic.
Odat specificat un model de regresie, este necesar s determinm, sau
mcar s estimm, funcia de regresie f, pe baza unor date de selecie. Astfel,
spre exemplu, pentru un model de regresie simpl, se pornete de la datele
xi , yi , i 1, n , care reprezint de fapt, o selecie de volum n, pentru variabilele
X i Y i se obine modelul observaional y i f xi i , i 1, n . E bine de tiut
faptul c, i poate cuprinde pe lng erorile de specificare i erori de observare,
n cazul n care valorile variabilei Y i eventual, ale variabilei X, ne sunt puse la
dispoziie, n urma unor msurtori, posibil afectate de mici erori. Desigur, se
presupune c n modelul de regresie nu intr erorile sistematice, ci doar cele
aleatoare. Din punct de vedere al punctului de plecare, n procesul de estimare a
funciei de regresie f, deosebim regresia parametric i regresia neparametric,
cea din urm nefiind obiectivul acestui capitol. Dac n determinarea funciei de
regresie se pleac de la ideea (desigur pe ct posibil fundamentat), c funcia f
are o anumit form atunci vorbim de regresia parametric.

Definiia 12.1.3. Modelul de regresie n care funcia este de forma

f X 1 , X 2 ,..., X p f X 1 , X 2 ,..., X p ; 1 , 2 ,..., q , i IR , i 1, q , (12.1.4)

se numete model de regresie parametric.

252
Plecnd de la definiie, se observ c un model de regresie parametric
presupune cunoscut forma funciei de regresie, f (mai bine zis a estimatorului
cutat), excepie fcnd un numr finit de parametri necunoscui, adic

f f , , cu 1 ,..., q B IR q . Evident, dac f , este
cunoscut, estimarea lui f, ntr-un model de regresie parametric, revine la
estimarea lui . Folosind metode de estimare adecvate bazate pe minimizarea
erorii din model, cum ar fi criteriul celor mai mici ptrate, e posibil s se
estimeze, din date, vectorul i implicit f. Reprezentarea grafic a estimatorului
funciei f, obinut prin astfel de metode, va fi o curb care ajusteaz, cel mai bine
datele, din mulimea de curbe permise, prin specificarea modelului.
Modelele de regresie parametric pot depinde, ntr-o manier liniar sau
neliniar, de parametri.

Definiia 12.1.4. Vom spune c avem o regresie liniar, dac funcia f este
liniar n variabilele X 1 , X 2 ,..., X p adic asupra funciei de regresie facem
presupunerea c are forma

p
f X 1 , X 2 ,..., X p ; 1 , 2 ,..., p k X k . (12.1.5)
k 1

Orice alt form a funciei f presupune regresie neliniar.

Forma liniar a funciei de regresie i metoda celor mai mici ptrate


utilizat n scopul estimrii parametrilor sunt cele mai des ntlnite, n analiza
regresional. Modelele liniare sunt cele mai simple i mai utilizate modele,
multe dintre modelele neliniare i chiar neparametrice, fcnd apel la
caracteristicile acestora. Tehnicile de estimare punctual i inferenial, utilizate
n determinarea modelului liniar, in de un domeniu important n analiza
regresional i anume, regresia liniar.
Exist ns o grup de modele neliniare, care pot fi tratate tot prin
intermediul tehnicilor regresiei liniare i anume, modelele neliniare liniarizabile,
o parte dintre acestea fiind i modelele liniare n parametri.

Definiia 12.1.5. Se numete model de regresie liniarizabil n parametri,


modelul n care funcia de regresie este de forma

q
f X , X
1 2 ,..., X p ; 1 , 2 ,..., q X , X
k k 1 2 ,..., X p , (12.1.6)
k 1

adic este presupus liniar, n raport cu parametrii 1 ,..., p .

Astfel de modele pot fi liniarizate prin substituiile,


253
k X 1 , X 2 ,..., X p Z k , k 1, q,

un exemplu fiind modelul de regresie polinomial, n care

f X ; 0 , 1 ,..., q 0 1 X ... q X q (12.1.7)

i din care pentru q=1 deriv modelul de regresie liniar simpl, dat prin

f X ; 0 , 1 0 1 X . (12.1.8)

Un astfel de model este i modelul hiperbolic, cu funcia de regresie


1
f X ; 1 , 2 1 2 , liniarizabil prin substituia Z . Tot din grupa
X X
modelelor neliniare, dar liniarizabile, fac parte i modelele care se reduc la
modelul liniar, n urma mai multor operaii: logaritmare, substituie, etc. Un
X
exemplu este modelul exponenial, dat de funcia f X ; 1 , 2 1 2 , care
se liniarizeaz prin logaritmarea log f X ; 1 , 2 log 1 X log 2 i
substituiile F X , A, B log f X ; 1 , 2 i A log 1 , B log 2 , obinndu-
se modelul liniar dat prin F ( X , A, B) A X B . Exist ns i alte modele
neliniare, care nu pot fi liniarizate, cum ar fi de exemplu, modelul
Y 0 1 X 2 . Este deja bine cunoscut formularea, c modelele neliniare,
liniarizabile prin substituie, adic acelea n care se presupune c funcia de
regresie este liniar n parametri, in de regresia liniar, deoarece studiul lor se
face cu tehnicile acesteia. Modelele neliniare n parametri, dar liniarizabile n
urma unor operaii, cum ar fi logaritmarea, pot fi tratate, att cu tehnici ale
regresiei liniare, ct i cu cele ale regresiei neliniare. Aplicarea regresiei liniare
pe modelul transformat are avantajul c estimatorii se bucur de proprieti mai
bune i dezavantajul c modelul obinut este doar o aproximare a celui iniial (a
se vedea cazul modelului exponenial, n care erorile intr aditiv n modelul
iniial). Modelele neliniarizabile in exclusiv de regresia neliniar, regresie n
care tehnicile nu mai pot fi fundamentate, pe avantajele obinute din liniaritate.
Pentru modelele neliniare, sistemul care deriv din criteriul celor mai
mici ptrate fiind neliniar, se ntmpin de cele mai multe ori, dificulti de
rezolvare, motiv pentru care, atunci cnd modelul este liniarizabil, se prefer mai
nti liniarizarea lui, care va duce la un sistem liniar de ecuaii normale i nu
aplicarea direct a criteriului, dei n acest fel, se obine doar o aproximare
rezonabil a modelului iniial. n cazul modelelor care nu pot fi liniarizate, se
aplic tehnici ale regresiei neliniare, bazate n special pe metode iterative, cum ar
fi metoda iterativ Gauss - Newton.

254
12.2. Modelul liniar. Estimarea parametrilor modelului prin
metoda celor mai mici ptrate

n acest paragraf, ne ocupm de aspecte privind ajustarea modelului


liniar. Sunt amintite forma teoretic, forma observaional/matriceal i forma
ajustat a modelului liniar, precum i condiia care garanteaz existena soluiei
ajustrii de cele mai mici ptrate.

Definiia 12.2.1. Se numete model regresional liniar multiplu, ntre variabila Y


i variabilele X 1 , X 2 ,..., X p , modelul

p
Y k X k . (12.2.1)
k 1

Problema regresiei liniare const n studiul comportrii variabilei Y, n


raport cu factorii X 1 , X 2 ,..., X p , n ipoteza (12.2.1). Acest studiu revine la
evaluarea parametrilor (coeficienilor) de regresie, 1 , 2 ,..., p i a termenului
aleator, . Estimarea coeficienilor de regresie se face pe baza unei selecii de
volum n. Pentru datele de selecie (i atunci cnd este cazul pentru variabilele de
selecie), vom folosi urmtoarele notaii:

x11 x12 ... x1 p



x 21 x 22 ... x 2 p
y y1 , y 2 ,..., y n IR , x x1 ,..., x p
n
, n p . (12.2.2)
... ... ... ...

x xn 2 ... x np
n1

n cazul n care analistul are control asupra alegerii variabilelor, X 1 , X 2 ,..., X p ,


matricea x se numete matrice de design. Pentru parametrii k , k 1, p , i pentru
erorile i , i 1, n , corespunztoare datelor de selecie, vom folosi de asemenea,
notaiile matriceale :

1 , 2 ,..., p IR p , 1 , 2 ,..., n IR n . (12.2.3)

Pentru datele de selecie corespunztoare lui i, modelul (12.2.1) devine


modelul observaional (cu datele observate),

p
y i k xik i , (12.2.4)
k 1

255
ceea ce, pentru i 1, n , duce la forma matriceal a modelului liniar
observaional,

y x , (12.2.5)

n care y , x, i sunt cele din notaiile (12.2.2) i (12.2.3). n vederea


estimrii lui , se ajusteaz modelul (12.2.5), printr-o condiie de minim asupra
erorii, care aa cum am subliniat nc din paragraful introductiv al acestui
capitol, este de dorit s fie mic. Ne vom opri aici, doar asupra ajustrii prin
criteriul celor mai mici ptrate, care const n minimizarea expresiei

n
i2 . (12.2.6)
i 1

Definiia 12.2.2. Se numete model liniar, ajustat prin criteriul celor mai mici
ptrate, modelul

y xa e , (12.2.7)

unde a a1 , a 2 ,..., a p IR p realizeaz minimul expresiei (12.2.6), iar ee , cu


e e1 , e2 ,..., e n IR n este valoarea minim obinut.

Sistemul de ecuaii, la care revine condiia de minim, este

x xa x y (12.2.8)

i se numete sistemul de ecuaii normale (Gauss), ataat modelului (12.2.7).


Notaiile a i e desemneaz estimatori punctuali ai lui i , atunci cnd
y i , i 1, n , xik , i 1, n, k 1, p , desemneaz variabilele de selecie i estimaii
punctuale (valori nenule), atunci cnd prin y i , i 1, n , xik , i 1, n, k 1, p ,
nelegem date de selecie. Obinerea estimatorilor de cele mai mici ptrate a,
pentru coeficienii de regresie necunoscui , depinde aadar, de existena
inversei matricei x x , care revine la condiia rang x x p . Se cunoate
urmtorul rezultat, care d condiii de existen (unic) a estimatorilor de cele
mai mici ptrate (a se vedea de exemplu [30]).

Teorema 12.2.3. Dac rang x p , atunci soluia ajustrii prin criteriul celor
mai mici ptrate este dat de formula

1
a x x x y . (12.2.9)

256
Condiia rang x p revine la independena liniar a vectorilor
x1 , x 2 ,..., x p . Amintim n continuare, cteva noiuni utilizate i n teoria
modelelor de regresie oarecare.

Definiia 12.2.4. Se numete valoare ajustat a lui y (n modelul liniar),


valoarea y y1 , y 2 ,..., y n IR n , definit de y xa . Se numete matrice de
influen a modelului, matricea H care transform valoarea y, n valoarea
ajustat y , adic, y Hy , matricea de influen n modelul liniar fiind de
1
forma H x x x x . Se numete reziduu, valoarea e y y I H y .

Un caz particular al modelului liniar, care face mai uor trecerea la


modelul liniar simplu (cu o singur variabil exogen), este modelul liniar cu
termen constant.

Definiia 12.2.5. Se numete model liniar cu termen constant, un model liniar n


care una dintre variabile este nlocuit de constanta 1.

Modelul observaional, scris pe baza datelor de selecie n forma


matriceal, va arta atunci astfel,

y x0 0 u p , (12.2.10)


cu notaiile p IR , x0 x1 ,..., x p1 M n, p 1 , 0 1 , 2 ,..., p 1 IR p 1 ,
u 1,...,1 IR n . Dac notm x x0 : u , 0 , p , modelul poate fi scris
n forma modelului liniar oarecare, y x . O teorem similar cu Teorema
12.2.3 are loc i n cazul modelului liniar cu termen constant.

1
Teorema 12.2.6. Fie matricea de centrare, P I uu . Notm cu ~z , vectorul
n

centrat corespunztor lui z IR n , adic ~
z Pz z z , z z ,..., z z , cu
1 2 n
z , media de selecie. Dac rang x p i x x 0 : u , ajustarea prin metoda
celor mai mici ptrate are soluia unic dat de


a0 a1 , a 2 ,..., a p 1 ~
x 0 ~
x0 ~ x 0 ~
1
y,
(12.2.11)
p 1
a p y a k xk ,
k 1

257
unde ~
x0 este matricea obinut din matricea x0 , prin centrarea vectorilor de pe
coloan, iar y i x k , noteaz mediile de selecie corespunztoare valorilor y i
respectiv, xik , i 1, n .

Observaia 12.2.7. Dac n Definiia 12.2.5, se consider p 2 , obinem


modelul de regresie liniar simpl,

Y X , (12.2.12)

care cu ajutorul datelor de selecie se scrie,

y i xi i , i 1, n, y i , xi , i , , IR .

n acest caz, relaiile (12.2.11) dau reprezentarea estimatorilor a i b, ai


coeficienilor i i anume,

x
i 1
i
x yi y cov x, y
a n
,
S x2
x
2
i x
i 1
(12.2.13)
b y ax ,

unde cov x, y reprezint covariana ntre x i y, iar S x2 , variana lui x.

Exemplul 12.2.8. Teoria economic privind gestiunea portofoliului susine c


rentabilitatea unei aciuni este influenat de modificarea indicelui general al
bursei, adic de evoluia pieei n general (modelul de pia Sharp-Markowitz,
([17])). Pornind de la aceast idee, se pune problema determinrii estimatorilor
de cele mai mici ptrate pentru coeficienii unui model liniar simplu care s
descrie corelaia dintre rata rentabilitii unor aciuni, Y i rata rentabilitii
pieei, X. Se va considera un eantion de 15 zile, cu valorile:

Y(%): -2,8; 0,2; 1,6; 3,9; 0,2; 2,4; 4,4; 18,6; 1,5; -17,9; 0,5; 0; 0,8; 0,1; -0,8
X(%): -0,5; 1,5; 3,2; 5,8; 3,3; 7,4; 5,8; 16,0; -2,0; -13,1; 0,7; 0,9; 2,9; 1,8; 1,1.

Soluie
Pe baza eantionului, obinem y 0,85, x 2,32 , cov x, y 41 ,
2
S 36 , prin urmare, conform formulelor de calcul pentru a i b , avem
x

258
41 41
a 1,13 i b 0,85 2,32 1,76 i modelul ajustat este
36 36
Y 1,76 1,13 X .

12.3. Modelul liniar clasic Gauss - Markov. Inferene asupra


estimatorilor unui model liniar
n acest paragraful tratm aspectul probabilist al regresiei, cercetnd
calitile estimatorilor de cele mai mici ptrate, caliti obinute sub anumite
ipoteze de natur probabilist, fcute asupra erorii. Sunt amintite ipotezele
clasice, calitile estimatorilor n aceste ipoteze, cteva statistici utile n inferena
asupra coeficienilor, precum i intervalele de ncredere privind coeficienii i de
asemenea, cteva din testele cunoscute, referitoare la coeficieni.
n continuare, pe tot parcursul acestui capitol, se pstreaz notaiile
referitoare la forma teoretic, forma matriceal i forma ajustat a modelului,
precum i condiia rang x p .Vom ncepe prin a preciza ipotezele clasice n
care se lucreaz ntr-un model liniar, ipoteze care, dei nu neaprat de nenlocuit,
duc la bune proprieti ale estimatorilor. Aceste ipoteze se refer la distribuia
erorilor i anume,


E , 0,0,...,0 IR n , (12.3.1)

Var E 2 I , (12.3.2)

N (12.3.3)

sau altfel spus,

N , 2 I . (12.3.4)

Condiia (12.3.2) se poate scrie i sub forma relaiilor

Var i 2 , i 1, n , (12.3.5)

cov i , j 0, i j, i, j 1, n . (12.3.6)

Condiiile puse asupra erorii se transfer asupra variabilei aleatoare, adic avem

y N x , 2 I .

259
Definiia 12.3.1. Ipotezele (12.3.1) i (12.3.2) sunt cunoscute i sub denumirea
de ipoteze Gauss-Markov, modelul liniar sub aceste ipoteze, numindu-se
modelul liniar Gauss-Markov. Pentru eroarea care satisface aceste ipoteze se
folosete i denumirea de zgomot alb. Datorit ipotezei (12.3.5), modelul se
numete homoscedastic, iar datorit ipotezei (12.3.6), model cu erori
necorelate. Dac la ipotezele Gauss-Markov, se adaug i ipoteza normalitii
(12.3.3), atunci modelul liniar este cunoscut i sub denumirea de model liniar
clasic, cele trei ipoteze fiind apelate ca ipotezele liniaritii modelului, dei
acestea nu in neaprat de un model liniar. Un model clasic (liniar sau nu) este
de fapt, un model cu erori normale ((12.3.3)), independente ((12.3.6)) i identic
distribuite ((12.3.1) i (12.3.5)) sau prescurtat i.i.d.

nainte de a aminti principalele rezultate, cu privire la calitatea


estimatorilor de cele mai mici ptrate, a i e, pentru i , obinute sub
ipotezele (12.3.4), vom sublinia faptul c y , , a i e sunt vectori aleatori, n timp
ce este un vector determinist i de asemenea, x1 , x 2 ,..., x p , din matricea
variabilelor de selecie, x x1 , x 2 ,..., x p , sunt vectori determiniti.

Teorema 12.3.2. n ipotezele Gauss-Markov, au loc urmtoarele afirmaii:


i)Estimatorul de cele mai mici ptrate, a, al lui , este nedeplasat, E a i
1
are variana Var a 2 x x . De asemenea, Var y 2 H , unde H este
matricea de influen a modelului.
ii)Estimatorul a, al lui , este liniar n observaiile lui y.
iii)Estimatorul a al lui este optimal, adic oricare alt estimator a~ , nedeplasat
pentru i liniar n observaiile lui y, are variana mai mare dect variana lui
a, n sensul c, Var a k Var a~k , k 1, p .

Teorema 12.3.3. n ipotezele Gauss-Markov, estimatorii

1 n 2 1
s2 ei e e ,
n p i 1 n p
(12.3.7)
1
S s x x
2

sunt estimatori nedeplasai pentru 2 , respectiv Var a .

n plus, au loc i urmtoarele proprieti:

Propoziia 12.3.4. n ipotezele Gauss-Markov, avem:


i)Estimatorul e al lui este de varian Var e 2 Q , unde Q I H , H
matricea de influen ataat modelului.
260
ii)Dac c M q, p , atunci ca este estimator optimal pentru c , n clasa
estimatorilor nedeplasai, care sunt transformri liniare ale lui y.

iii)Estimatorii a i e sunt necorelai, adic cova, e , 0,0,...,0 IR n .

Ipoteza normalitii erorilor aduce noi proprieti ale estimatorilor.

Propoziia 12.3.5. ntr-un model liniar clasic (cu erori normale i i.i.d.-
(12.3.4)), estimatorul obinut prin metoda celor mai mici ptrate este un
estimator eficient pentru .

Atunci cnd se cunoate legea de probabilitate a variabilei y (prin


intermediul legii erorilor), putem vorbi i despre estimatori de verosimilitate
maxim, respectiv de regresie de verosimilitate maxim. ntr-un model liniar,
supus ipotezelor clasice (12.3.4), estimatorul lui , de cele mai mici ptrate,
coincide cu estimatorul lui , de verosimilitate maxim, n timp ce estimatorul
de verosimilitate maxim, S y2/ x , pentru 2 este nedeplasat, unde :

1 n 2 1 n p 2
S y2 / x ei e e s . (12.3.8)
n i 1 n n

De asemenea, n ipoteza normalitii, ataat ipotezelor Gauss-Markov, se


pot stabili i urmtoarele proprieti, care furnizeaz statistici ce se vor dovedi
utile n inferena estimatorilor.


Propoziia 12.3.6. Dac N , 2 I , atunci avem
i)Estimatorii a i s sunt independeni i a N , 2 x x
2
1
.
2 n
s 1
ii) 2 n p 2
2 e 2
i 2 n p .
i 1

a

iii)Fie U , 1 ,..., p IR p . Oricare ar fi IR p , U i s 2
1
x x
sunt independente i U N 0,1 . Mai mult,
a
T T n p , IR p .
1
s x x

Aceste proprieti se bazeaz pe urmtorul rezultat din teoria


probabilitilor ([30]):

Lema 12.3.7. Fie vectorul IR n , care urmeaz legea normal, de medie i


matrice de varian, 2 I ; fie de asemenea, matricele Q M n, n ( IR) , Q Q ,

261
1
Q2 Q , r rang Q , L M n, n ( IR ) , Q 2 r ,
LQ . Atunci,
2
1
L N i vectorul aleator L , mpreun cu variabila aleatoare 2 Q , sunt

independeni.

Statisticile amintite n Propoziia 12.3.6, pot servi la realizarea inferenei


asupra estimatorilor de cele mai mici ptrate. ncepnd de aici, n tot restul
paragrafului, vom presupune adevrate ipotezele modelului liniar clasic. Ne vom
referi, pentru nceput, la inferena prin intervale de ncredere.

Interval de ncredere pentru coeficieni

Dac n statistica T din Propoziia 12.3.6.iii, se particularizeaz


k 0,0,...,1,...,0 IR p , se obine statistica Student, cu n p grade de
libertate,

ak k
Tk , (12.3.9)
sk

unde s k2 este produsul dintre s 2 i elementul al k-lea, diagonal, al matricei


xx 1 .
Pe baza acesteia, se poate construi un interval de ncredere pentru
coeficieni, de forma


P a k s k t k ak sk t

1 , (12.3.10)
n p ,1 n p ,1
2 2


unde t este cuantila de ordin 1
, a unei variabile Student, cu n p
n p ,1
2
2
grade de libertate, care rezult pentru un nivel de semnificaie , fixat, din
relaia


P Tk t
1 ,
(12.3.11)
n p ,1
2

Desigur, n cazul n care este cunoscut, nu mai este nevoie de operaia


de studentizare i atunci, se poate folosi statistica U, din Propoziia 12.3.6 iii. Pot
fi de asemenea elaborate regiuni de ncredere, pentru x IR n i IR p ,
regiuni pe care nu le vom aminti aici. Atunci cnd este necunoscut, pe lng
estimaia punctual s, se poate da i un interval de ncredere pentur varian.
262
Interval de ncredere pentru varian

Pe baza statisticii 2 , cu n p grade de libertate, din Propoziia


12.3.6.ii, se poate construi un interval de ncredere pentru 2 , de forma


s2 s2
P n p 2 2 n p 2 1 , (12.3.12)

n p ,1 n p,
2 2


unde 2 i 2 sunt cuantilele de ordin 1 , respectiv , ale unei
n p ,1
2
n p ,
2
2 2
2
variabile , cu n p grade de libertate, determinate astfel nct pentru un nivel
de semnificaie , fixat, s aib loc relaia


P 2 2 2
1 . (12.3.13)
n p , n p ,1
2 2

n ultima parte a acestui paragraf, vom prezenta un al doilea aspect al


inferenei asupra estimatorilor i anume, testrile de ipoteze asupra coeficienilor.

Testul T pentru coeficienii unui model liniar

Ipotezele acestui test sunt ipoteza nul, H 0 : k k0 i alternativa ei,


H 1 : k k0 , ceilali coeficieni fiind n afara ipotezelor.
Testul se fundamenteaz pe o statistic de tip Student, cu n p grade de
libertate, Tk , precizat n formula (12.3.9). Pentru nivelul de semnificaie ,

rezult cuantila t , de ordin 1 , a unei variabile Student, cu n p
n p ,1
2
2
grade de libertate aa nct,


P Tk t
H0 1 .
n p ,1
2

a k k0
Se calculeaz valoarea t k , a statisticii Tk , pe baza datelor de
sk
selecie i se respinge ipoteza nul, dac t k t .
n p ;1
2

263
Un caz particular al acestui test este cel al semnificaiei coeficientului k ,
test bazat pe ipotezele H 0 : k 0 i H 1 : k 0 .
Urmtoarele dou teste clasice, pe care le vom prezenta, se bazeaz pe o
statistic de tip Fisher-Snedecor, furnizat de urmtorul rezultat din teoria
probabilitilor ([19]).

Lema 12.3.8. Fie vectorul aleator 1 ,..., n , ce urmeaz legea normal, cu


N , 2 I i fie matricele x M n, p ( IR) , A M p, q ( IR ) ,
1
x0 xA M n, q ( IR) . Dac se noteaz Q I x x x x i
1
Q0 I x0 x0 x 0 x 0 , atunci statistica

Q0 Q Q
F (12.3.14)
rang Q0 rang Q rang Q

urmeaz legea de probabilitate Fisher-Snedecor, cu rang Q0 rang Q i


rang Q grade de libertate.

Vom nota pe tot parcursul acestui paragraf,

S 02 Q0 i S12 Q . (12.3.15)

Se observ c, dac matricea X din lem este matricea datelor de selecie


dintr-un model liniar, atunci avem Q I H , unde H este matricea de influen.
2 2
Mai mult, vom avea S 02 e0 e0 e0 i S12 e ee . n cazul formulrii
unei ipoteze H 0 , asupra coeficienilor unui model liniar, ipotez n cadrul creia
matricea datelor de selecie devine de forma X 0 din lem, notaiile S 02 i S12
reprezint suma ptratelor reziduurilor, n modelul redus (obinut n ipoteza H 0 ),
respectiv suma ptratelor reziduurilor, n modelul complet (obinut n ipoteza
H 1 ).

Testul F al egalitii ntre q coeficieni

Se testeaz ipoteza nul, H 0 : 1 ... q , q p , cu alternativa,


H 1 : H 0 fals. Pentru un nivel fixat , se determin valoarea f f q 1;n p;1 ,
a unei statistici Fisher-Snedecor, cu q 1 i n p grade de libertate, astfel
nct,

264
P F f H 0 1 .

n p S 02 S12
Ipoteza nul se va respinge, dac f c f , unde f c este
q 1 S12
o valoare calculat a statisticii F din Lema 12.3.8, pe baza datelor de selecie.

Testul F al semnificaiei a q coeficieni

Se testeaz ipoteza nul, H 0 : 1 ... q 0, q p cu alternativa,


H 1 : H 0 -fals. Pentru un nivel fixat , se determin o valoare f f q;n p;1 , a
unei statistici Fisher-Snedecor, cu q i n p grade de libertate, astfel nct,

P F f H 0 1 .

n p S 02 S12
Ipoteza nul se va respinge, dac f c f , unde f c este
q S12
o valoare a statisticii F din Lema 12.3.8, calculat pe baza datelor de selecie.

Exemplul 12.3.9. Relund datele din Exemplul 12.2.8, ne propunem s


determinm intervalele de ncredere de tip 95% pentru coeficienii modelului
liniar simplu.

Soluie
Aplicnd formula (12.3.10), intervalele de ncredere de tip 95% pentru
coeficienii modelului estimai n Exemplul 12.2.8, vor fi (0.9156, 1.336) pentru
a i (-3.086, -0.4451) pentru b.

12.4. Previziunea i analiza rezultatelor unei regresii liniare


Ne propunem, n acest paragraf, s amintim principalele aspecte care in
de previziunea i analiza rezultatelor unei regresii liniare, dei, marea parte a
aspectelor i statisticilor considerate aici sunt valabile i n cazul altor modele.
([5]). Elaborarea unui model de regresie are ca scop, pe lng determinarea unui
mecanism, care s copieze comportamentul dependenei studiate i acela de a
putea previziona, adic de a obine o estimaie ct mai bun, pentru o valoare y 0 ,
corespunztoare unor noi date pentru variabilele x1 , x 2 ,..., x p . O astfel de
previziune primete credit, atunci cnd specificarea modelului de regresie din
care se obine, este corect. Astfel, nainte de a realiza previziuni asupra
variabilei endogene y, este necesar s ne asigurm c ipotezele fcute asupra
modelului, n special asupra erorii, sunt valide. Vom discuta pe rnd, n acest
265
paragraf, ipotezele respective, vom aminti tehnicile de verificare a lor, precum i
posibilitile de corectare a situaiilor n care ipotezele nu sunt valide. De
asemenea, vom aminti cteva statistici care se folosesc pentru a analiza calitatea
ajustrii datelor, prin model, precum i intervalul de ncredere pentru previziune.

Controlul ipotezelor liniaritii modelului

n literatur, sub denumirea de ipoteze ale liniaritii modelului, se


ntlnesc de fapt, ipotezele clasice, definite n paragraful anterior (erori normale
de medie zero, independente i identic distribuite), la care se adaug ipoteza
necorelaiei ntre erori i variabilele exogene, X 1 , X 2 ,..., X p i desigur, absena
corelaiei ntre variabilele exogene (absena multicoliniaritii). Verificarea
ultimei ipoteze ine de tehnici ale corelaiei, care fac obiectul acestui capitol.
Nevalidarea acestei ipoteze duce la erori mari n model de aceea, pentru a nu
compromite din start modelul, se ncearc satisfacerea acestei condiii. innd
cont de aceste dou aspecte, nu vom mai relua aici aceast ipotez. E bine de
specificat c, dei au denumirea de ipoteze ale liniaritii, sunt de fapt
presupuneri care nu au legtur cu caracterul liniar al modelului, de aceea le
putem ntlni i la alte modele, unde vor fi analizate n mod asemntor.
Vom analiza n continuare ipotezele rmase, n cadrul unui model liniar.
Deoarece aceste ipoteze se refer la erorile din model, pentru verificarea lor se
determin modelul, se calculeaz reziduurile ei , i 1, n , precizate n Definiia
12.2.4 i se analizeaz aceste reziduuri, presupunnd c ele constituie de fapt,
estimatori pentru erorile i , i 1, n .

Ipoteza normalitii

Ipoteza N este necesar pentru obinerea unor estimatori eficieni ai


coeficienilor i de asemenea, pentru obinerea unor estimatori ce urmeaz legea
normal. Verificarea normalitii erorilor se poate face prin teste de concordan,
fie prin intermediul testului lui Massey (vezi [15]), atunci cnd n este mic, fie
prin testul Kolmogorov-Smirnow (vezi [23]), atunci cnd n este mare. Ambele
teste se bazeaz pe compararea frecvenelor cumulate empirice, cu frecvenele
teoretice, corespunztoare legii normale. Ipoteza normalitii, dei necesar, nu
este crucial atunci cnd volumul eantionului este mare. Teorema central
limit (vezi [23]) ne asigur c, atunci cnd n , dei nu urmeaz legea
normal, avem c estimatorul de cele mai mici ptrate a, al lui , converge la
legea normal. Mai precis, se introduce factorul de normalizare n i se obine
c, atunci cnd n este mare, n a converge asimptotic, ctre o variabil
normal, N 0, n Var a , de unde a N ;Var a . Pentru eantioane mici,
n
dac se respinge ipoteza normalitii erorilor, se reprezint reziduurile i se
calculeaz coeficienii de asimetrie i boltire ai lui Fisher, relativ la ei , pentru a
266
aprecia mrimea deviaiei de la normalitate. Se vor elimina acele observaii
pentru care reziduurile sunt foarte mari, aa nct reziduurile rmase s se
apropie mai mult de valori normale i se va reface modelul doar cu noile
observaii.

Ipoteza zgomotului alb

Presupunerea E 0 este necesar n obinerea de estimatori a,


nedeplasai, adic E a . Aceast ipotez arat de asemenea, faptul c erorile
din model nu sunt erori sistematice. Verificarea acestei ipoteze se poate realiza
prin analiza grafic a reziduurilor sau prin analiza (grafic sau numeric) a
intervalelor de ncredere, pentru media erorii. Astfel, se reprezint grafic
reziduurile, fiind necesar ca valorile acestora s oscileze n jurul dreptei de
ecuaie, y 0 . Pentru prezentarea intervalelor de ncredere pentru media erorii,
vom aminti mai nti, noiunea de reziduu studentizat. Conform Propoziiei
12.3.4.i, reziduurile sunt n general corelate i varianele lor depind de locaia
punctelor. n vederea obinerii unei statistici Student, util n testele de ipoteze,
precum i n intervalele de ncredere referitoare la erori, este necesar
studentizarea reziduurilor, proces care const n acest caz, ntr-o scalare care
implic obinerea aceleiai variane pentru reziduuri. n [29], se definete
reziduul studentizat sub forma:

Definiia 12.4.1. Se numete reziduu studentizat, expresia

ei
ti , (12.4.1)
s 1 hi

care nainte de eantionare este o variabil aleatoare ce urmeaz legea Student,


T n p . Elementul hi este elementul diagonal al matricei de influen H, iar s
este eroarea standard a estimaiei, definit n formula (12.3.7).

n literatura de specialitate, se ntlnesc de asemenea i alte forme ale


reziduurilor studentizate. Astfel, n pachetul de programe Matlab, utilizat i n
statistic, se folosete urmtorul reziduu studentizat,

ei
ti T n p 1 , (12.4.2)
s i 1 hi

unde

267
2
2
e ei2
s i (12.4.3)
n p 1 n p 11 hi
este estimatorul varianei erorilor 2 , obinut prin omiterea datei a i-a,
n 1 p , fiind astfel, numrul gradelor de libertate din model.
Acelai program folosete urmtorul interval de ncredere pentru media
erorii, precizat prin limitele sale,

ei t s i 1 hi , i 1, n , (12.4.4)
n p 1;1
2


unde t este cuantila de ordin 1 , a variabilei Student, cu n p 1
n p 1;1
2
2
grade de libertate, iar s i este cel din (12.4.3). Aceste intervale pot fi
reprezentate printr-un grafic cu bare, mpreun cu reziduurile ei . Intervalele de
ncredere care nu-l includ pe 0 sunt echivalente cu respingerea ipotezei c
E 0 , respingere fcut pentru pragul de semnificaie . n cazul respingerii
ipotezei de zgomot alb asupra erorii, se elimin acest neajuns, prin scoaterea din
model a acelor observaii pentru care intervalul de ncredere (12.4.4) nu-l conine
pe 0.

Ipoteza necorelaiei erorilor cu variabilele exogene

Ipoteza inexistenei unei corelaii ntre eroare i cte o variabil exogen


X k , k 1, p , asigur obinerea de estimatori optimali, prin metoda celor mai
mici ptrate. Dac exist corelaie ntre acestea, atunci estimatorul a va fi doar
asimptotic nedeplasat. S-a constatat c deplasarea asimptotic obinut pentru a
este mic, atunci cnd coeficientul de corelaie liniar simpl, ntre i X k , este
mic ([15]). Amintim aici, definiia coeficientului de corelaie liniar simpl.

Definiia 12.4.2. Numim coeficient de corelaie liniar simpl (Bravais-


Pearson), ntre dou variabile aleatoare, X i Y, parametrul

cov X , Y E XY E X E Y
r X , Y . (12.4.5)
X Y X Y

Coeficientul de corelaie liniar simpl Pearson, de selecie, are valori


cuprinse ntre 1 i 1 i se va calcula cu formula

268
n

x i
x yi y
r x, y i 1
, (12.4.6)
n n

x y
2 2
i x i y
i 1 i 1

Dac r se apropie de 1, variabilele sunt liniar corelate. n cazul n care r se


apropie de 0, nu sunt liniar corelate, iar dac X,Y sunt normale i r 0 ,
variabilele sunt independente.
De asemenea, se cunoate c statistica

r 2
T n 2 (12.4.7)
1 r 2

urmeaz legea Student, cu n 2 grade de libertate. Aadar, corelaia ntre


variabila rezidual i variabila exogen X k se poate testa printr-un test de
corelaie, bazat pe ipoteza H 0 : r X k , 0 , ipotez care presupune necorelaia.
n cazul n care valoarea calculat a statisticii (12.4.7) depete cuantila de
ordin , a unei variabile Student, cu n-2 grade de libertate, fiind pragul de
semnificaie al testului, se respinge ipoteza H 0 . Aceleai informaii se pot
obine, analiznd graficul n care reziduurile sunt reprezentate n funcie de
valorile observate ale variabilei X k . Graficul respectiv nu trebuie s dea
impresia vreunei tendine, existena acesteia ducnd la concluzia c exist
corelaie. Atunci cnd corelaia este mare, deplasarea asimptotic a estimatorului
va fi de asemenea, mare i e de preferat ncercarea unui alt model.

Ipoteza homoscedasticitii modelului

n cazul n care condiia de homoscedasticitate (erori identic distribuite),


V i 2 , nu este ndeplinit, modelul se numete heteroscedastic. ntr-un
astfel de caz, rezult c intensitatea influenei variabilelor exogene asupra celei
endogene difer de la o observaie la alta. Condiia V i i2 , i 1, n , sau

V diag 12 , 22 ,..., n2 nu afecteaz nedeplasarea estimatorului a de cele
mai mici ptrate, ns influeneaz variana acestuia. ntr-un model
heteroscedastic avem, V a 0 , numai atunci cnd lipsete corelaia ntre i2 i
x ki , i 1, p , adic atunci cnd ordinul de mrime al variabilelor, pentru diverse
observaii, este acelai. Aceast condiie este ns, foarte rar satisfcut n
practic. Astfel, n general dac modelul este heteroscedastic, eroarea V a a
estimatorului crete, prin urmare, crete i eroarea medie de estimare.

269
Pentru testarea homoscedasticitii, se cunosc mai multe metode. Una
dintre ele apeleaz la un test de comparare a mai multor dispersii, cum ar fi testul
lui Bartlet (vezi [15]), bazat pe legea 2 . Ipoteza H 0 de egalitate a dispersiilor
se va respinge, dac valoarea calculat a statisticii aferente testului depete
cuantila corespunztoare unui anumit prag de semnificaie i legii 2 . De
asemenea, se poate face un test de ipotez bazat pe reziduuri. Pentru n mare
(dup [29]), reziduul studentizat t i trebuie s fie cuprins ntre 2 i 2. Se
compar t i calculat cu valoarea critic a distribuiei, precizate n formula
(12.4.2). Cazul cnd reziduul t i este mare genereaz ndoieli asupra faptului c
reziduul are aceeai varian ca i celelalte, ceea ce duce la nesigurana ipotezei
V i2 2 , i 1, n .
Pentru corectarea heteroscedasticitii se utilizez n general, rescalarea
modelului. Spre exemplu, pentru un model de forma

y i a1 x1i a 2 x 2i i , i 1, n ,

dac

V i i2 x12i x 22i ,

se scaleaz modelul astfel,

yi 1 1
a1 a2 i
x1i x 2i x 2i x1i x1i x 2i


i atunci, V i , i 1, n .
x1i x 2i

Ipoteza independenei erorilor

Aceast ipotez revine la

V 2 I

sau

cov i , j 0, i j , i, j 1, n .

270
Autocorelaia erorilor presupune cov i , j 0, i j . Ipoteza de independen
este necesar n obinerea estimatorilor de varian minim (optimali), prin
metoda celor mai mici ptrate, dar nu i n obinerea estimatorilor nedeplasai.
Autocorelaia erorilor se regsete n principal, n cazul modelelor
dinamice (serii de timp). ntr-un astfel de model, din cauza proastei specificri,
influena erorii unei perioade asupra alteia devine plauzibil. Dup [15],
autocorelaia erorilor poate aprea n modelele statistice, doar dac rezultatele
observrii au fost aranjate n prealabil, cresctor sau descresctor, n raport cu
variabila endogen Y. Pentru validarea ipotezei de independen a erorilor, se
poate folosi, att metoda bazat pe analiza graficului reziduurilor, ct i un test
de corelare. Din punct de vedere grafic, se cerceteaz comportarea empiric a
reziduurilor e1 ,..., en , care nu trebuie s dea impresia unei tendine. Altfel spus,
reziduurile nu trebuie s aib pentru mai multe observaii consecutive aceeai
comportare, spre exemplu, nu trebuie s fie numai pozitive sau numai negative.
Pentru necorelaie, ele trebuie s fie mprtiate aleatoriu n jurul axei absciselor.
Din punct de vedere cantitativ, se poate folosi testul Durbin-Watson (vezi
[29]), care verific ipotezele H 0 : i necorelate i

H 1 : i i 1 u i , 0 (proces autoregresiv de ordin I).

Statistica aferent testului este

n
2
e i ei 1
d i2
n
0, 4 . (12.4.8)
2
e
i 1
i

Pentru a admite ipoteza necorelrii, trebuie ca valoarea lui d s fie n jurul lui 2.
n cazul n care se depisteaz o autocorelaie, se corecteaz calitatea
estimatorilor, folosind metoda celor mai mici ptrate generalizate ([30]).
Odat validate sau corectate ipotezele liniaritii modelului, avem
asigurate pentru estimatorii de cele mai mici ptrate, calitile discutate n
paragraful 12.3. Un alt aspect n analiza rezultatelor regresiei ine de calitatea
ajustrii.

Calitatea ajustrii

Pentru a analiza calitatea ajustrii se pot folosi, att metode numerice, ct


i metode grafice. Metodele grafice (folosite n special n cazul unui singur
predictor) se refer, n mare parte, la analiza reziduurilor, analiz care aa cum s-
a vzut n prima parte a acestui paragraf, se poate realiza i numeric. Metodele
numerice utilizate n analiza calitii ajustrii se bazeaz pe interpretarea ctorva
statistici.
271
Analiza reziduurilor

Pe lng verificarea ipotezelor liniaritii, studiul reziduurilor poate fi


folosit i n cadrul altor modele de regresie, n vederea reperrii observaiilor
aberante(outlieri). n prima parte a paragrafului, s-a vzut deja instrumentarul
folosit n analiza reziduurilor.
Astfel, dintre mai multe ajustri (n regresii cu un singur predictor, liniare
sau nu), se va prefera aceea n care reziduurile sunt aleator mprtiate n jurul lui
zero, fr a comporta o tendin.
n acelai sens, se poate face i comparaia curbelor ajustate, n raport cu
norul statistic. Pentru eliminarea observaiilor aberante, se poate folosi, de
exemplu, testul fundamentat pe reziduurile studentizate i pe statistica (12.4.1)
sau (12.4.2). Un reziduu prea mare poate indica o valoare aberant, dar o valoare
aberant nu are neaprat reziduul mare. Un alt criteriu care s desemneze valorile
aberante ar fi cel bazat pe intervalul de ncredere (12.4.4). Reziduul pentru care
intervalul nu conine valoarea zero indic o valoare aberant.

Influena observaiilor

Am vzut cum poate fi eliminat o observaie aberant. S vedem acum


care ar fi influena unei astfel de observaii, n cazul n care ea ar rmne n
model.
Definiia 12.4.3. Dac notm cu y i , valoarea ajustat(prezis) pentru y i
(definit n formula (2.1.10), care se obine atunci cnd este omis observaia a
i-a, vom numi reziduu prezis, valoarea y i y i .
Conform cu [29], se poate arta c

ei
y i y i ,
1 hi

aadar observaiile pentru care hi e mare i/sau reziduurile sunt mari (observaii
aberante), duc la previziuni suspecte, cci y i y i va fi mult diferit de zero. Ca
o msur a puterii de prezicere a modelului, se cunoate statistica

2
n
e
PRESS i . (12.4.9)
i 1 1 hi

O valoare mic a statisticii indic o putere mare de prezicere. Astfel,


pentru o bun prezicere, trebuie eliminat influena observaiilor aberante ( ei
mare) sau cele care au hi mare. Influena observaiilor asupra estimatorilor este
dat de distana lui Cook,

272
a a x x a a
2
i i 1 h y y i
Di ei2 i . (12.4.10)
ps 2 p 1 hi ps 2

Aici, y i xai , ai este estimatorul obinut prin eliminarea


observaiei i, iar celelalte elemente au aceeai semnificaie ca n paragraful 12.3.
O observaie se consider a avea o influen anormal, dac Di 1 .

Analiza estimaiilor obinute

Estimatorul a este determinat cu mai mult acuratee, atunci cnd


intervalele de ncredere (12.3.10), pentru coeficieni, sunt mai restrnse.
n continuare, vom prezenta cteva statistici care pot fi folosite pentru
evaluarea i de asemenea, compararea mai multor modele.

Coeficientul de corelaie multipl

Pentru a putea face legtura ntre acest coeficient i coeficientul de


corelaie liniar multipl, vom aminti mai nti definiia acestuia.

Definiia 12.4.4. Se numete coeficient de corelaie liniar multipl, parametrul

p
r X 1 , X 2 ,..., X p , Y sup r ai X i , Y , (12.4.11)
ai i 1

unde r este coeficientul de corelaie liniar simpl, definit n formula (12.4.5).


Coeficientul de corelaie liniar multipl, de selecie (eantionare), se va
nota cu rx1 , x 2 ,..., x p , y i este dat de

p
rx1 , x 2 ,..., x p , y sup r ai xi , y . (12.4.12)
ai i 1

n cazul particular cnd p 1 , se obine valoarea absolut a


coeficientului de corelaie liniar simpl. n [30], se demonstreaz c, dac y
este valoarea ajustat a lui y (precizat n Definiia 12.2.4.), dintr-un model de
regresie liniar cu termen constant, atunci

rx1 , x 2 ,..., x p , y r y , y . (12.4.13)

273
Altfel spus, metoda celor mai mici ptrate determin acea combinaie liniar
ntre variabilele exogene, pentru care corelaia cu variabila endogen este
maximal. n plus, se poate demonstra c

y y
rx1 , x 2 ,..., x p , y , (12.4.14)
y y

sau ntr-o alt formulare

2
2
y y y y
r x1 , x 2 ,..., x p , y
2
2
1 2
. (12.4.15)
y y y y

Se poate afirma atunci, c coeficientul de corelaie liniar multipl


reprezint proporia n care variaia lui Y este explicat prin regresia liniar pe
X 1 , X 2 ,..., X p , cu termen constant. Are loc relaia
0 rx1 , x 2 ,..., x p , y , r 2 x1 , x 2 ,..., x p , y 1 , o valoare apropiat de unu fiind o
posibil acoperire a faptului, c modelul liniar este potrivit pentru a explica
variabila Y. Pentru a realiza inferena asupra estimatorului r , se folosete
statistica de tip Fisher Snedecor, cu p 1 i n p grade de libertate,

r 2 n p
F (12.4.16)
1 r 2 p 1

i se emite ipoteza nul, r 0 , care este echivalent de fapt, cu ipoteza


k 0, k 1, p, 0 oarecare, ipoteze ce infirm regresia liniar. Ipoteza nul se
va respinge, dac valoarea calculat a statisticii (12.4.16) depete cuantila
corespunztoare legii Fisher-Snedecor i pragului de semnificaie . Totui,
chiar dac r 1 i valoarea real r este semnificativ H 1 : r 0 , acest lucru
nu indic neaprat o corelaie real. Spre exemplu, n cazul regresiei simple,
aceste situaii cu privire la r i r pot aprea, ca urmare a unei corelaii paralele
pe care, att variabila y, ct i variabila x, o poate avea cu o a treia variabil.
Pentru a elimina influena acestei de-a treia variabile, se poate calcula un
coeficient de corelaie parial, cu formula

ryx ryz rxz


ryx. z ,
1 ryz2 1 rxz2

formul ce poate fi extins i n cazul regresiei multiple.

274
Testul bazat pe r 2 , prezentat mai sus, este unul de semnificaie al
coeficienilor de regresie n ansamblul lor i n acelai timp(prin r ), al
semnificaiei regresiei liniare cu termen constant, test folosit n analiza
rezultatelor regresiei. Spre exemplu, n Matlab, se ntoarce ca i informaie de
regresie, valoarea calculat a statisticii F i p valoarea asociat acestei statistici,
adic probabilitatea critic,

c 1 F p 1,n p Fcalculata . (12.4.17)

Dac c , prag de semnificaie, se respinge ipoteza H 0 .


Deoarece r , dat prin (12.4.13), s-a definit doar pentru y rezultat din
modelul liniar cu termen constant, nu vom putea vorbi de aceste elemente, n
cazul unui model de regresie liniar oarecare. Pentru modelul de regresie liniar
fr termen constant, se pot folosi testele F de semnificaie asupra unui
subansamblu al coeficienilor, precum i testul T asupra fiecrui coeficient n
parte, teste prezentate n paragraful 12.3. Un test pentru ansamblul coeficienilor
se poate face i pentru modelul de regresie liniar fr termen constant, folosind
statistica de tip Fisher-Snedecor, cu p i n p grade de libertate (vezi [29]):
,

1
F 2
a x x a .
ps

Totui, att pentru modelul liniar fr termen constant, ct i pentru un


model de regresie oarecare, se poate defini o caracteristic asemntoare cu r,
caracteristic pe care o vom numi coeficient de corelaie multipl(oarecare).
Definiia 12.4.5. Numim coeficient de corelaie (determinaie) multipl
(oarecare), parametrul definit prin

S R2
R2y , y 1 , (12.4.18)
S T2

unde

n 2
2

S y i y , sum de ptrate total,
T
i 1
(12.4.19)
n
2
S R2 y i y i , sum de ptrate rezidual (indus de reziduuri),
i 1

iar y este valoarea ajustat (prezis) a lui y, prin modelul considerat.

275
Aadar, coeficientul de corelaie multipl se calculeaz cu formula

n
2
y i y i
S2 S2 y y y y
2 2

R2 1 i 1
n
T 2 R 2
. (12.4.20)
ST
y
2
i y y y
i 1

Mrimea R 2 reprezint o msur a calitii ajustrii datelor, prin modelul


de regresie oarecare, n urma creia rezult valoarea ajustat(prezis), y .
Aceast mrime se poate folosi pentru a compara mai multe ajustri diferite i
poate fi calculat, pentru orice model de regresie, chiar i pentru cele
neparametrice. Totui, n [30], Stapleton atrage atenia, c R 2 bazat pe scri
diferite nu sunt comparabile. Aceast observaie se refer la cazul cnd pentru
ajustare e necesar o transformare. De exemplu, R 2 y , y se poate compara cu
R 2 y z , y , dar nu cu R z , z , dac z g y , z , valoarea ajustat a lui z, din
modelul liniar al lui z pe x, y , valoarea ajustat a lui y, din regresia lui y pe x,
y z g 1 z . O valoare mare a lui R 2 va indica o mai bun apropiere a modelului
fa de date. Acest lucru se poate vizualiza i grafic, pentru modelul cu un singur
regresor. Din formula (12.4.20), se observ c R 2 poate lua i valori negative,
valoarea maxim fiind 1.
Acest parametru este cunoscut n literatura de specialitate, doar sub
denumirea de R-ptrat. Am preferat s-l numim aici coeficient de corelaie
multipl (oarecare), deoarece atunci cnd y provine dintr-un model de regresie
liniar cu termen constant, R 2 coincide cu coeficientul de corelaie liniar
multipl, r 2 , din formula (12.4.15). ntr-adevr, pentru modelul liniar cu termen
constant are loc regula de adunare a varianelor (ANOVA),

n n n

y y
2 2 2
i y i y i y i y (12.4.21)
i 1 i 1 i 1

sau altfel,

2 2 2
yy y y y y (12.4.22)

sau nc,

2
S T2 S R2 y y (sum indus de model). (12.4.23)

276
n general, aceast regul nu are loc, de aceea prima parte a formulei
(12.4.15) nu este valabil pentru R 2 i deci, R 2 r 2 , diferen confirmat i de
faptul c n general, R 2 poate lua valori negative (mai precis pentru modele fr
termen constant), n timp ce r 2 nu poate. Totui R 2 i r 2 au aceeai
S T2 S R2
semnificaie i anume, precizeaz proporia, 2
, n care un model
ST
explic bine datele, numai c r 2 se refer strict la modelul liniar cu termen
constant. Spre exemplu, o valoare de 0,97 a lui R 2 ne arat, c modelul din care
rezult y acoper variabilitatea observaiilor, n proporie de 97%.
O mrime asemntoare cu R 2 este i raportul de determinaie(corelaie),
V Y X
0 , care coincide cu R 2 i cu r 2 (a se vedea [29]), pentru regresia
V X
liniar simpl. n general, raportul de corelaie arat proporia n care factorul X
explic variabila Y , nepreciznd forma corelaiei, n timp ce coeficientul de
corelaie arat proporia n care factorul X (unidimensional) explic variabila Y,
prin intermediul unui anumit model de regresie.
Pe lng R 2 , tot ca i msur a calitii ajustrii, se folosete o variant
ajustat a sa. Necesitatea acestei ajustri rezid n faptul c R 2 nu este un criteriu
absolut al calitii ajustrii, n cazul cnd se compar dou modele cu un numr
diferit de parametrii. Astfel, dac p crete n regresia liniar, spre exemplu,
implic faptul c n model s-a inclus o nou variabil, ceea ce face ca S R2 s
scad i implicit, R s creasc artificial.

Definiia 12.4.6. Se numete coeficient de corelaie ajustat, parametrul

n 1
2
R 1
n p

1 R2 . (12.4.24)

Astfel, factorul n p corecteaz modificarea artificial a lui R 2 , odat


2
cu modificarea lui p. Ca i n cazul lui R 2 , o valoare apropiat de 1 a lui R va
2
arta o bun ajustare, R fiind un criteriu bun pentru modele cu un numr diferit
de parametri.
Alte statistici care msoar numeric calitatea ajustrii (pe lng R 2 i
2
R ) sunt S R2 din formula (12.4.19) i s din formula (12.3.7). Statistica S R2 este
cunoscut i sub denumirea de sum de ptrate datorat erorilor i msoar
abaterea total a variabilei Y, de la model. O valoare apropiat de zero indic o
bun ajustare. Statistica s, numit i eroare standard a regresiei, este rdcina
ptrat a erorii medii ptratice, ntlnit sub notaia MSE sau RMS (media
ptratelor erorilor). O valoare a lui s apropiat de 0 indic o bun ajustare. Toate
aceste statistici pot fi definite i pentru alte modele dect cele liniare.
277
Odat stabilit i validat modelul de regresie, ne intereseaz problema
previziunii.

Intervale de ncredere pentru previziune

Pe lng intervalele de ncredere pentru previziune, pentru o nou


observaie, vom prezenta aici i intervale de ncredere pentru medie (pentru
funcia de regresie f), pentru a le putea compara. De asemenea, n literatura de
specialitate, se iau n calcul, att intervale simultane (pentru x oarecare), ct i
intervale nesimultane (pentru o singur valoare specificat, x0 ). Vom considera
aici doar intervale nesimultane.

Cazul regresiei liniare (fr termen constant)


Presupunem c modelul y x , N , 2 I , a fost validat i c
ne intereseaz estimaii asupra unei noi valori, y 0 , a variabilei Y, date fiind
valorile x 01 , x 02 ,..., x0 p , ale variabilelor X 1 , X 2 ,..., X p , adic ne intereseaz s
previzionm o valoare a lui y(necunoscut). Avem

y 0 1 x01 ... p x0 p 0 x0 0 (12.4.25)

sau folosind modelul ajustat prin cele mai mici ptrate,

y 0 a1 x 01 ... a p x 0 p e0 x 0 a e0 .

Apar aadar, dou tipuri de erori n estimarea previziunii. Una se datoreaz noii
erori 0 , cu care valoarea y 0 intr n model, iar alta se datoreaz erorii cu care s-
a estimat . Sigur, n cazul n care dorim s estimm media
E Y X x 0 f x0 x 0 , atunci eroarea este mai mic i se reduce la eroarea
indus de . Folosim notaia

y 0 x 0 a , (12.4.26)

pentru a desemna previziunea punctual i dm n continuare, intervalul de


ncredere pentru

y 0 x0 0 (previziune),

respectiv pentru

f x0 E Y X x 0 x 0 (medie).
278
Interval de ncredere pentru previziune:


P y 0 st 1
1 x 0 x x x 0 y 0 y 0 st
1
1 x0 x x x0 1 .
n p ,1 n p ,1
2 2
(12.4.27)

Interval de ncredere pentru medie:

1 1
P y 0 st x 0 x x x0 f x 0 y 0 st x 0 x x x0 1 .
n p ,1 n p ,1
2 2
(12.4.28)

n ambele intervale, s, x, i t au semnificaia precizat deja n acest


capitol. Se observ c intervalul pentru previziune este mai larg, datorit erorii
suplimentare care intervine prin 0 . n cazul modelului liniar cu termen
constant, intervalele sunt aceleai, difer doar forma lui x0 i x, care vor conine
i un 1, respectiv o coloan de 1 (a se vedea [29], [30]). n cazul regresiei liniare
simple, cnd funcia ajustat i intervalele pot fi vizualizate grafic, avem
urmtoarea situaie:

y
y=ax+b

medie
previziune

Figura 12.4.1

Avem aadar i vizualizarea faptului c intervalul de previziune este mai


larg, curbele corespunztoare ncadrnd, pentru acelai , curbele de la
intervalul pentru medie, care la rndul lor, ncadreaz dreapta de regresie. Dac
pe grafic ar fi vizualizate i datele, s-ar vedea c intervalele de ncredere pentru
previziuni includ punctele. Ca orice interval de ncredere i intervalele de
previziune pot fi instrumente n evaluarea calitii regresiei, acurateea
previziunii fiind cu att mai bun, cu ct intervalul este mai mic. Intervalele

279
simultane sunt asemntoare celor nesimultane, diferena fiind c se utilizeaz
distribuia Fisher-Snedecor, n loc de distribuia Student.

Exemplul 12.4.7. Relund datele din Exemplul 12.2.8, ne propunem s estimm


punctual i prin interval de ncredere de tip 95% rata rentabilitii aciunilor
respective corespunztoare unei rate a pieei de 2%.

Soluie
Calculnd previziunea punctual obinut pe baza modelului din
Exemplul 12.2.8, avem y 2 1,76 1,13 2 0,5 , n timp ce o evaluare a
formulei (12.4.27) duce la intervalul de ncredere de tip 95% pentru previziune,
(-4,42; 5,39).

280
Capitolul 13

Statistic Bayesian i noiuni de teoria


credibilitii

13.1. Statistic Bayesian

Un asigurator are un contract care se deruleaz pe mai muli ani. Sumele


de bani pltite clienilor au fost X1,X2,,Xt. innd seama de aceast experien,
care ar fi cel mai bun principiu de calcul al primei de asigurare pentru anul t+1?
Pentru asigurator, clientul este un risc, X.
Problema ar fi : cum am putea modifica prima de asigurare h(X) n aa fel
ca s in seama de experiena anilor trecui?
Nefiind precis formulat, aceasta NU este o problem matematic.
O problem oarecum mai abordabil ar suna astfel: n teoria asigurrilor,
media EX se numete premiul brut sau prima brut. La acesta se mai adaug
diverse sume care ar trebui s in seama de profit, de cheltuieli de regie precum
i de alte lucruri ce nu in de obiectul studiului nostru.
Problema de baz este gsirea repartiiei adevrate a lui X.
n statistica parametric clasic se presupune c repartiia FX aparine
unei clase de repartiii depinznd de un parametru necunoscut E. De
exemplu, putem crede c X Poisson() sau X Binomial(n,p), sau X Exp(a).
n primul caz am avea o familie depinznd de un singur parametru, iar n al
doilea de una depinznd de doi parametri (cci = (n,p) !) . Pentru a merge mai
departe ar trebui gsit adevratul . Dac suntem dispui s credem c nu se
modific la rndul lui n timp, am putea privi atunci experiena acumulat X
=(X1,,Xt) ca o selecie de volum t dintr-o populaie F. Caz n care s-ar pune
problema estimrii lui .
Dac ar fi unidimensional, am putea ncerca s gsim intervale de
ncredere pentru , cu un anume risc asumat . Acesta este punctul de vedere al
statisticii parametrice. Ea se folosete dac dispunem de multe date.
n acest capitol vom folosi ns o alt abordare, i anume cea Bayesian.
Parametrul E se numete factor de risc. Ideea de baz n abordarea
bayesian este c , necunoscnd valoarea adevrat a lui , e ca i cum factorul
de risc ar fi la rndul lui o variabil aleatoare. O vom nota cu . Formal,
avem un spaiu probabilizat pe care avem definit un vector de observaii X
=(X1,,Xt) i o variabil aleatoare cu valori n E
.

281
Desigur c apar unele probleme tehnice: va trebui ca spaiul parametrilor
E s fie organizat ca un spaiu msurabil (E,E). De obicei aceasta nu este o
problem, n cazurile clasice. De exemplu, n cazul repartiiei Poisson sau
exponeniale E = 0,); la binomial este 0,1 care se organizeaz n mod
natural ca spaii msurabile cu -algebra mulimilor boreliene B(0,)) n
primele dou cazuri sau cu P(N)B(0,1) n al doilea. La repartiia normal
N(,2), E = (0,), etc.
Putem avea o idee despre repartiia factorului de risc, o credin. Aceasta
se numete repartiia apriori a factorului de risc . n limbaj matematic,
repartiia apriori este repartiia iniial a lui . n cele ce urmeaz ea va fi notat
cu U. Deci U (B)= P( B).
Dac parametrul ia valoarea , atunci repartiia seleciei noastre X ar
trebui s fie Q(). Acesta se numete modelul. Deci pentru fiecare E , Q()
este o repartiie pe t. Aceasta este n definitiv repartiia condiionat a lui X
tiind c = .
Pe scurt o abordare Bayesian nseamn o repartiie apriori a
parametrului i un model. Ideea este s obinem din experien o ajustare a
repartiiei apriori, numit repartiia aposteriori a parametrului .
Modelul este de fapt o probabilitate de trecere de la mulimea E a
parametrilor la mulimea t a rezultatelor. Atunci tim de la capitolul privind
simularea variabilelor aleatoare c repartiia vectorului (,X) este UQ iar
repartiia lui X este UQ. Amintim c cele dou operaii se definesc astfel
UQ(C) = Q , C dU C E t msurabil (13.1.1)
Def
UQ(B) UQ(EB) = Q , B dU (13.1.2)

Exemplul 13.1.1. S presupunem c U(0,1) iar X Binomial(1,)t. Mai


explicit, modelul este urmtorul: dac adevrata valoare a lui ar fi = p
0,1 , atunci P(X1=1,, Xt = t) ar trebui s fie p(1,)(1-p)(0,) unde (1,) = 1j
t j = 1 iar (0,) = 1j t j = 0 = t N(1,). Cum afecteaz variabila
aleatoare N(1) repartiia iniial a lui ?

Exemplul 13.1.2. O generalizare. U(0,1) iar X Binomial(n,)t unde n este


presupus cunoscut. Atunci P(X1=x1,,Xt = xt) = Cnx1 ...Cnxt x1 (1 ) n x1 ... xt (1 ) n xt =
C nx1 C nx2 ...C nxt S (1 ) nt S unde S = S(x) = x1 + + xt .

n Exemplul 13.1.1, repartiia lui X este U(0,1)Q unde Q() =


Binomial(1,)t. Deci din (13.1.2) avem
1
P(X = ) = S(1-)t-Sd = (S + 1,t S + 1) (13.1.3)
0

282
unde Z2t iar S = (1,)este definit n Exemplul 13.1.1. Funcia este funcia
m 1 n 1 m!n!
a lui Euler , (m+1,n+1) = = . Rezult c P(X = ) =

( m 1) (n 1) ( m n 1)!
S!(t S ))!
.
(t 1)!
n Exemplul 13.1.2 diferena este c X este U(0,1)Q unde Q() =
Binomial(n,)t deci
1
P(X = x) = Cnx1 Cnx2 ...Cnxt S (1 )ntS d = Cnx1 Cnx2 ...Cnxt (S+1, nt -S+1) (13.1.4)
0

Rezumnd cele de mai sus putem concluziona : ntr-un model Bayesian U


este marginala pe spaiul parametrilor a repartiiei UQ a vectorului (, X)
format din parametrul aleatoriu i selecia X, (adic o probabilitate pe (Et))
modelul Q() este repartiia seleciei condiionat de valoarea pe care o ia
parametrul,(o probabilitate de trecere de la E la t) iar a doua marginal, cea de
pe t este UQ repartiia seleciei X. Dac, aa cum se ntmpl n aplicaii,
este la rndul lui un spaiu standard Borel, teorema de dezintegrare o putem
aplica i marginalei a doua. Deci exist o alt probabilitate de trecere U1 , de data
aceasta de la t la E astfel nct U = U1(UQ) . Din punct de vedere probabilistic Q*
reprezint repartiia lui condiionat de eantionul X . n jargonul Bayesian, U1
este repartiia aposteriori a parametrului dup observaia X.
Sensul ar fi c U1(x,A) = P( A X = x).
n anumite condiii, suficient de largi pentru statistic, exist formule de
calcul a repartiiei aposteriori U1.
S presupunem c repartiia parametrului , deci U , admite o densitate
fa de o msur -finit . De asemenea, presupunem c i repartiia observaiei
X condiionat de = este absolut continu fa o alt msur -finit , adic
admite o densitate q fa de . Atunci se poate calcula repartiia aposteriori a lui
.

Propoziia 13.1.3. Presupunem c E este o mulime borelian dintr-un spaiu


euclidian. n plus, presupunem c
(i). U = u, unde este o msur -finit pe E;
(ii). Q() = q() unde este o msur - finit pe t
Atunci
P (, X)-1 = f, X () cu f,X (,x) = q(,x)u() (13.1.5)
-1
P X = fX unde fX (x) = q (,x)u()d() = f ,X (,x) d() (13.1.6)
q(, x )u ()
U1(x) = q*(x) unde q*(x,) = (13.1.7)
q(, x )u () d()
Notaii standard. O notaie mai sugestiv pentru q() este cea folosit n
statistic: fX = . Deci modelul este c, dac parametrul ar lua valoarea ,

283
atunci densitatea lui X fa de ar trebui s fie fX = . Atunci densitatea comun
a vectorului (, X) fa de este f, X iar densitatea parametrului n ipoteza
c c X = x este f X = x . Reformulnd cu aceste notaii standard avem
densitatea lui (,X) este f,X (, x) = fX = (x)f() (13.1.8)
densitatea lui X este fX ( x) = f , X x, d (13.1.9)
densitatea aposteriori a lui dat de rezultatul x este
f , X , x
f X = x() = (13.1.10)
f X x
Demontraia se poate gsi, de exemplu, n Gheorghi Zbganu, Metode
matematice n teoria i actuariat, Bucureti, Editura Universitii 2004, pp 236.

Continuare la exemplele 13.1.1 i 13.1.2.


Cu notaiile standardizate de mai sus avem
La exemplul 13.1.1: E = 0,1, = U(0,1), u() = 1, = Card(Z2t) este
msura cardinal pe Z2t, densitatea modelului este fX = (x) = S(1-)t-S cu S
=1j t xj = 1= x1 ++ xt .
Atunci
- f,X (,x) = S(1-)t-S1(0,1)()
S!(t S )!
- fX (x) = q (,x)u()d() = (S+1,t-S+1) =
(t 1)!
(t 1)! S
- f X = x() = (1-)t-S
S!(t S )!
Recunoatem aici c repartiia aposteriori a parametrului este o
repartiie Beta(S+1,t-S+1) .
Interpretarea: n urma unei experiment n care au aprut M de 1 i N
de 0 i n care apriori nu aveam nici o idee preconceputa asupra lui p credina
noastr asupra parametrului ar trebui s fie dat de densitatea aposteriori u1() =
M+1,N+1 ().
La exemplul 13.1.2: E, , u sunt aceiai, dar = Card(Znt);
- fX = (x)= C(x) S(1-)t-S cu C(x) = C nx1 C nx2 ...C nxt
- f,X (,x) = C(x) S(1-)t-S1(0,1)()
C x1 C x2 ...C nxt
- fX (x) = n n (vezi (1.1.10)
( nt 1)CntS
1
- fX = x () = S(1-)nt-S deci repartiia aposteriori a
( S 1, nt S 1)
parametrului este Beta(S+1, nt-S+1)

Observaie 13.1.4. Dar dac aveam o idee preconceput? De exemplu, dac


am fi crezut c p = ? Atunci statistica Bayesian nu ne-ar fi de nici un
folos. S presupunem c noi avem o credin apriori c , parametrul nostru

284
... ...
are repartiia 1 2 n
. Atunci Q ar fi devenit o matrice
p
1 p 2 ... ... n

stocastic cu n linii i 2t coloane: Q(j,x) = jM(x)(1-j)t-M(x) . Cu notaiile din


Propoziia 13.1.3 am avea E =1,,n 0,1, = Card(E) , u(j) = pj, =
Card(Z2t), f,X (,x) = jM(x)(1-j)t-M(x))pj iar
M ( x)
j (1 j ) t M ( x ) p j
fX = x (j) = n (13.1.11)
M ( x)
i (1 i ) t M ( x ) pi
i 1
n cazul particular n care n = 1 (deci credem orbete c = 1) atunci
suma de la numitorul din (13.1.11) coincide cu numrtorul, deci fX = x (1) = 1.
Ceea ce nseamn c indiferent ce ne spune experiena, vom continua a crede c
=1!
O explicaie este c experiena niciodata nu creeaz noi posibiliti
explicative, cel mult poate anula unele din ele sau s le fac mai neverosimile.

Exemplu 13.1.5. Un asigurator are n perspectiv un contract format din


riscuri repartizate binomial. El tie c Xr Binomial(N, ), dar nu tie nici pe N ,
nici pe . De exemplu Xr pot fi piesele rebutate dintr-un lot de N piese. Mai tie
c n decursul derulrii contractului aceti parametri nu se schimb. Pentru a
avea o idee ce prim de asigurare s cear, are la dispoziie un istoric al
numrului de rebuturi X1,,Xn. Experiena anterioar l face s cread c c N
i sunt independente i c N n n iar unde :0,1 0,) este o
n 1
densitate . Dac nu are nici o idee despre p- lucru destul de neverosimil - va lua
= 1(0,1)
Deci
E = N0,1, = (N,) ,
= CardN,
= (n,p), f(n,p) = n(p) , (repartiia apriori)
fX =(n,p) (x) = nC(x , )pS(1-p)tn-S cu C(x , ) =C(x,n) = C nx1 C nx2 ...C nxt
(acesta este modelul propriu zis!)
f,X (,x) = n(p)C(x , )pS(1-p)tn-S
Repartiia lui X este o mixtur de binomiale. Putem scrie
f,X (,x) = (p)nC(x , )ptM(x)(1-p)t(n - M(x)) (13.1.12)
unde M(x) este media aritmetic a primelor t observaii, tM(x) = x1 + + xt . Fie
x* = max (x1,,xt). Observnd c n x* C(x,n) = 0 i nlocuind, obinem din c
1
fX (x) = q (,x)u()d() = n C(x , n) (p)ptM(x)(1- p)t(N-M(x)) dp (13.1.13)

n x* 0

C C ... C nx t

n
x1 x2
n
(dac U(0,1) atunci fX (x) = n ) iar din (13.1.13)
n x*
( nt 1 ) C ntS

285
( p) n C ( x, n) p tM ( x ) (1 p ) t ( n M ( x ))
fX = x (n,p) =
(13.1.14)
tM ( x ) t ( k M ( x ))
C ( x, k ) p
k x*
k (1 p) ( p)dp

n C ( x, n) p S (1 p ) tnS
(dac U(0,1) atunci fX = x (n,p) =
C x1 C x2 ...Ckxt

k x*
k k k
( kt 1)CntS

Observm ceva de bun sim, pentru care nu avem nevoie de mult tiin
de carte: dac n x*, atunci din (13.1.17), fX = x (n,p) = 0. Nu o s considerm
posibil ca N s ia valori mai mici dect x*!

Definiia 13.1.6. Dac :E este o funcie msurabil, variabila aleatoare


E(()X) se numete n limbaj bayesian estimatorul Bayesian cu cele mai mici
ptrate al lui ().

Propoziia 13.1.3 are drept corolar o formul de calcul pentru E(()X), evident
datorit formulei de transport:

Propoziia 13.1.7. Avem

() f X | ( x )u ()d()
E(()X= x) = (13.1.15)
f X | ( x )u ()d()

S presupunem c variabilele aleatoare Xr sunt toate identic repartizate


pentru fiecare valoare posibil a factorului de risc . Fie

() = E(Xr) (13.1.16)

Aceasta este cea mai bun aproximare pe care o putem face pentru Xr n
sensul celor mai mici ptrate. n cele ce urmeaz nu vom modifica notaia: ()
va avea mereu aceeai semnificaie.
Sensul precis este c dintre toate funciile () cu care am dori s
aproximm pe Xr n spaiul L2, cea pentru care distana este minim este ().
Ceea ce ne intereseaz n actuariat este mrimea

E(()X) notat cu g(X) . (13.1.17)

Este mai puin evident c, n anumite ipoteze, g(X) este i cea mai bun
aproximare pe care o putem face asupra premiului brut de asigurare viitor (adic

286
pentru Xt+1 ) innd seama de modelul nostru bayesian i de experiena acumulat,
X.

Definiia 13.1.8. Dou variabile aleatoare X i Y se numesc condiionat


independente fa de dac P(X A, Y B ) = P(X A)P(Y B ) pentru
orice A i B mulimi boreliene.

Exemplul 13.1.9. n exemplele 13.1.1 i 13.1.5 am presupus tacit c


observaiile (Xi)1 i t sunt condiionat independente. Altfel nu puteam s spunem
c P(X1 = x1,...,Xt = xt) = P(X1 = x1)...P(Xt = xt). Dac X i Y sunt condiionat
independente, nu rezult c sunt independente. ntr-adevr, s spunem c X,Y,
sunt discrete. Atunci
P(X = i , Y = j) = E(P(X = i , Y = j ) = E(P(X = i )P(Y = j ))
E[P(X = i )]E[P(Y = j )]. De exemplu, s zicem c (X,Y )
U(,+1), U(0,1). Atunci P(X = 0, Y = 0) = [P(X = 0, Y = 0 = 0) +
P(X = 0, Y = 0 = 1)]/2 = [ + 0]/2 = 1/8 iar P(Y = 0) = P(X = 0) = [P(X = 0
= 0) + P(X = 0 = 1)]/2 = ( + 0)/2 = . Produsul este 1/16 i nu 1/8.

Propoziia 13.1.10. Fie X i Y dou variabile aleatoare condiionat


independente de . Atunci avem

E(f(Y),X) = E(f(Y)) (13.1.18)

n consecin

E(f(Y)X) = E(E(f(Y))X) (13.1.19)

Corolarul 13.1.11. Presupunem c observaiile Xr sunt condiionat independente


fiind dat . Atunci E(Xt+1 X1,,Xt) = E(()X1,,Xt) = g(X).

Demonstraie
Este de fapt relaia (13.1.19) unde n loc de Y avem Xt+1 iar n loc de X avem
vectorul X = (Xr)1rt .

Principial, g(X) se poate calcula, dac tim repartiia lui condiionat de


X . O ipotez destul de optimist.
n Exemplul 13.1.2 deci i n exemplul 13.1.1 cunoatem aceast
repartiie: este S+1, nt+1-S . Cum Xr sunt binomiale condiionat de (adic P(Xr =
j) = Binomial(n,)(j) rezult c () = n. Atunci g(X) = E(nX) =
m
nE(X) . Dar media unei variabile aleatoare Y m,n este de unde obinem
mn
estimatorul bayesian pentru Xt+1 (premiul brut) ca fiind

287
n( S 1)
g(X) = (13.1.20)
nt 2

S notm cu M = S/t media aritmetic a observaiilor ( se tie c M este un


estimator nedeplasat i eficient pentru EXr n ipoteza c variabilele sunt i.i.d, ceea
ce nu este cazul!). Vom nota de asemenea n mod consecvent

m = EXr = E(E(Xr)) = E(n) = n/2 (13.1.21)

(cci am acceptat c U(0,1)). Cu aceste pregtiri putem scrie (1.1.20) sub


forma
g(X) = zM + (1-z)m (13.1.22)

nt
unde z = . q.e.d.
nt 2

Observaia 13.1.12. Relaia (13.1.21) este foarte atractiv: este simpl i


admite o interpretare intuitiv: cel mai bine este s prezicem viitorul sub forma
unei mixturi ntre ideile noastre anterioare ( = m) i experien ( = M).
Coeficientul z ne arat ponderea experienei. Dac t , z 1, adic e mai
bine s ne bazm pe experien. Dac t este mic, atunci este bine de luat n
calcul i modelul nostru teoretic.
Se pune ntrebarea : nu cumva mereu g(X) este cuprins ntre m i M ?
Vom da un exemplu c nu este aa.

Exemplul 13.1.13. S presupunem c U(0,1) i c variabilele aleatoare Xr


sunt repartizate U(,+1) Presupunem de asemenea c ele sunt condiionat
independente dac se tie . Deci
E = 0,1, = , u() = 1(0,1)() (repartiia apriori)
Q() = U(,+1)t (acesta este modelul propriu zis!)
f,X (,x) = 1(,+1)(x1) 1(,+1)(x2) 1(,+1)(xt) 1(0,1)() = 1A(x)() unde
A(x) = (x1-1,x1) (x2-1,x2) (xt-1,xt) (0,1) = (x*-1,x*) (0,1) unde
x* = x1x2xt , x* = x1x2xt
fX (x) = (A(x)) = ((x*1) (x*-1)+)+
fX = x () = 1A(x)/fX(x) , deci repartiia lui condiionat de X este U(A(x))
Apoi () = E(Xr) = + (media unei uniforme pe (a,b) este mijlocul
intervalului (a+b)/2 ; n cazul nostru a = i b = +1!) deci g(X) = E(X) +
= ((x*1) + (x*-1)+)/2 + (cci i repartiia lui condiionat de X este tot
uniform! ) . n concluzie

288
x* 1
2 daca x* 1
*
x x*
g(X) = daca x* 1 x * . (13.1.23)
*2
x 1 daca x* 1
2

Pe de alt parte m = EX1 = E() = + = 1. Se poate ca g(X) s nu fie ntre m


i M: de exemplu, dac t = 3, x = (1.1; 1.2; 1.9) atunci M = (1.1+ 1.2 + 1.9)/3 =
1.4 g(x) = (1 + 1.9)/2 = 1.45.

13.2. Modelul de credibilitate Bhlmann

Fie X o selecie de volum t . Variabila aleatoare Xr , 1 r t reprezint


suma pe care asiguratorul a pltit-o n anul r. Bnuim c repartiia acestei
variabile depinde de un factor de risc, asupra cruia avem o credin adic o
repartiie apriori U = u
Definiia 13.2.1. Vom numi contract un vector (,X) unde P-1 = U i X =
(X1,,Xt) reprezint variabile aleatoare din L2 interpretate fiind ca o istorie a
plilor fcute de asigurator la momentele de timp 1,2,,t.

Fie r() = E(Xr )


Ceea ce ne intereseaz este s dm o predicie asupra plii viitoare Xt+1 .
Istoria plilor pn n prezent (momentul t) este X.
Ca de obicei, dac nu facem unele ipoteze suplimentare, nu vom putea
spune nimic n acest sens.
Vom face ipoteza c pentru fiecare valoare a factorului de risc ,
variabilele aleatoare (Xr)1 r t sunt independente i identic repartizate. Atunci i
variabilele r() vor coincide. Le vom nota cu ().
tim (Corolar 1.1.11) c E(Xt+1 X1,,Xt) = E(()X1,,Xt) = g(X)
Aceasta este ipoteza independenei condiionate.
Scris precis, cu notaiile din paragraful anterior, ea devie
Q( ) F ( ) t (13.2.1)
adic
P(X1 B1,.,Xt Bt ) = P(X1 B1)P(Xt Bt)
= F(,B1).F(,Bt) Br B(), 1 r t (13.2.2)

Am vzut c semnificaia lui g(X) (estimatorul Bayesian exact) este


urmtoarea : dac notm cu L mulimea funciilor h: t care sunt msurabile
i au proprietatea c h(X) L2(,K ,P) atunci

289
Xt+1 g(X)2 = min Xt+1 h(X)2 h L (13.2.3)
adic
E(Xt+1 g(X))2 = min E(Xt+1 h(X))2 h L (13.2.4)

Cu alte cuvinte g minimizeaz distana ptratic ntre Xt+1 i h(X).

Problema este c n cele mai multe modele realiste g este necalculabil.

Buhlmann a avut ideea s fac un compromis: s caute funcia h afin


care s minimizeze membrul drept din (13.2.4). Cu alte cuvinte s caute h de
forma h(x) = c0 + c, x astfel ca E(Xt+1 h(X))2 s fie minim.

S considerm funcia :t dat de


h(c0, c) = E(Xt+1 c0 c1X1 c2X2 - - ctXt)2 (13.2.5)

Problema de optimizat devine:


Gsii c0, c ca h(c0,c) = minim (13.2.6)

De data aceasta problema este simpl. Este vorba de a gsi minimul unei
forme ptratice convexe. Fiind strict convex, are optim unic.
Derivm h dup c0 i punem condiia ca derivata s se anuleze. Gsim

-2E(Xt+1 c0 c1X1 c2X2 - - ctXt) = 0 (13.2.7)

(am derivat sub integral, deoarece putem aplica criteriul lui Lebesgue de
dominare: variabilele noastre sunt n L2. Rezult

c0 = E(Xt+1 c1X1 c2X2 - - ctXt). (13.2.8)

Dar variabilele aleatoare Xr , fiind condiionat identic repartizate, sunt i


identic repartizate. Media lor se va nota, ca i n primul capitol, cu m = EXr =
E(). nlocuind n (13.2.7) EXr cu m rezult

c0 = m(1- c1- c2 - - ct) (13.2.9)

nlocuind n (13.2.5) gsim c avem de optimizat funcia

(c) = E(Xt+1 m c1( X1- m) c2(X2 m) - - ct( Xt- m ))2 (13.2.10)

S notm cu Yr variabilele aleatoare centrate Yr = Xr m. Atunci funcia


(convex!) de optimizat devine

(c) = E(Yt+1 c1 Y1 c2Y2 - - ct Yt)2 (13.2.11)

Gradientul ei este

290
Grad (c ) = (-2E(Yr(Yt+1 c1 Y1 c2Y2 - - ct Yt)))1 r t. (13.2.12)

Ecuaia Grad (c) = 0 devine


t

c
j 1
j E(YrYj) = E(YrYt+1) (1.2.13)

Pe de alt parte, dac j r variabilele aleatoare Yj i Yr sunt condiionat


independente deci

E(YrYj) = E(E(YrYj)) = E(E(Yr)E(Yj)) (13.2.14)

Dar E(Yj) = E(Xj-m) = E(Xj) m = () m = () - E() de unde

r j E(YjYr) = Var () (13.2.15)

Vom nota Var () cu a.


Dac ns r = j atunci E(YrYj) = E(Yr2) = E(E(Yr2)) = E(E(Xr-m)2)) =
E(E(Xr-E(Xr)+(E(Xr) - m)2)) = E(E(Xr-())+(() - m)2)) = E(E(Xr-
()2)) + 2E(Xr-()()-m) + E(() - m)2) = E(Var(Xr)) + 2E(Xr-
())()-m) + Var () = s2 + 0 + a = a + s2.
Am notat E(Var(Xr)) cu s2. Cum variabilele aleatoare Xr sunt identic
repartizate, notaia este corect . Altfel ar fi trebuit s punem sr n loc de s. n
concluzie

E(YjYr) = a + j,rs2 j,r 1,,t (13.2.15)

nlocuind n (13.2.12) gsim sistemul


t

c j (a + j,rs2) = a (13.2.16)
j 1

care se rezolv foarte simplu. Adunnd toate ecuaiile rezult (ta + s2)(c1 + + ct)
ta
= ta de unde suma coeficienilor S = c1 + + ct = . Cum sistemul se mai
ta s 2
scrie crs2 + aS = a , urmeaz c
a
c1 = c2 = = ct = . (13.2.17)
ta s 2
Concluzia final este

Teorema 13.2.2. Dac variabilelele aleatoare (Xr)r 1 sunt din L2 i i.i.d.


condiionat de , atunci estimatorul liniar optim h(X) are forma h(X)=(1-z)m+ zM
unde

291
at
z= 2
, a = Var (), s2 = E(Var(Xr)) (13.2.18)
ta s

Definiia 13.2.3 Numrul z se numete coeficientul de credibilitate al lui


Buhlmann.
El nu este o statistic , deoarece depinde de trei parametri neobservabili: a
2
= Var (); m = E() i s = E(Var(Xr)).
Uneori se poate ntmpla s coincid ca h(X) s coincid cu g(X) adic
estimatorul liniar optim s fie chiar estimatorul bayesian optim.
Pe scurt: dac avem observaiile X = (X1,,Xt) i modelul Bayesian
-P(X1 B1,.,Xt Bt ) = Q(,B1).Q(,Bt) Br B(), 1 r t
- Q() are densitatea fX= , probabilitatea apriori cu densitatea U= u
i notm E(Xr) cu (), atunci

g(X) = E(()X) =
() f X
( X )u ()d()
= E(Xt+1X) (13.2.19)
f X ( X )u ()d()

iar estimatorul Buhlman este h(X) = Mz + (1-z)m cu

at
m = EXr, M = (X1 + + Xt)/t, z = 2
, a = Var (), s2 = E(Var(X1))
at s
(13.2.20)

Tot demersul de pn acum ar fi inutil dac nu ar exista cazuri ntlnite n


statistic care estimatorul Buhlman h(X) ar coincide cu g(X) . Dm acum o
generalizare a exemplului 1, unde cele dou chiar coincid.

Definiia 13.2.4. Densitatea fX= se numete familie exponenial dac este de


forma
fX = (x) = p(x)e-x/q() (13.2.21)
unde se subnelege c spaiul parametrilor E = [0,). Se presupune c funcia
q() este derivabil.

n acest caz densitatea vectorului X este


p ( x1 ) p( x2 )... p( xt ) S
fX = (x) = e unde S = x1 + + xt (13.2.22)
q t ()

S presupunem c densitatea apriori u a variabilei aleatoare este de


forma
q() e
u() = unde , [0,) iar C(,) este o constant de normare.
C (, )
(13.2.23)
292
n aceste condiii densitatea aposteriori este
f X ( x )u ()
fX = x ()= = A(,,x)e-(+S) / qt+() (13.2.24)
f X y ( x )u ( y )d( y )

adic este de acelai tip ca i densitatea apriori. Spunem c familia aceasta de


densiti este o familie conjugat..

Propoziia 13.2.5. Dac modelul bayesian este familie exponenial, densitatea


apriori este de forma (1.2.22) i u(0) = u() = 0 atunci g i h , definii prin
(13.2.18) i (13.2.19) coincid.

Un caz particular este dac modelul este Poisson: repartiia Poisson este
de forma (13.2.21). Aici msura este msura cardinal pe mulimea numerelor
naturale.
Se punem acum problema de a estima pe baza datelor de observaie X cei
trei parametri m, a i s2. Acum este o problem de statistic obinuit: cutm trei
estimatori nedeplasai pentru aceste cantiti. Ideea lui Buhlman a fost de a se
apela la mai multe contracte independente de acelai tip.
Un rspuns este urmtorul:

Propoziia 13.2.6. Dac vectorii Xj = (Xj,r)1rt, sunt independeni i acceptm la


fiecare din ei acelai model Q, atunci M0, s 2 i a definii mai jos sunt estimatori
consisteni pentru m, s2 i a
1 k
M0 = M j (13.2.25)
k j 1
t t

k ( X j ,r M j ) 2 X 2
j ,r tM 2j
1
s 2 = s 2
j , s 2j = r 1
= r 1
(13.2.26)
k j 1 t 1 t 1
k

(M j M 0 )2
j 1 s 2
a = - (13.2.27)
k 1 t
Prin Mj am notat mediile de selecie ale vectorilor Xj.

Mai mult, s 2 i a sunt estimatori nedeplasai pentru s2. Varianele sunt


1 s2 Var ( M j )
Var( s 2 ) = Var ( s12 ) , Var(Mj) = a + , Var(M0) = (13.2.28)
k t k

Apare o evident deosebire fa de cazul i.i.d., cnd aceste variane tind la


0 o dat cu creterea numrului de observaii, t .De asemenea vedem c nu
conteaz aa de mult t (= istoricul ) ct conteaz k numrul de contracte
independente.

293
at
Corolarul 13.2.7. Variabila aleatoare z = este un estimator pentru
2
a t s
coeficientul de credibilitate z care este consistent n k : adic k z z .

Observaia 13.2.8. n general estimatorul z nu este nedeplasat, cci nu avem


X EX
motive s credem c o formul de tipul E = ar putea fi adevrat,
X Y EX EY
chiar n ipoteze restrictive. Dac X i Y sunt independente, de exemplu, atunci
X EX
E X Y se poate calcula, este diferit de EX EY .
Ca amuzament, dac X i Y sunt i.i.d. atunci egalitatea este adevrat!
Ambele valori coincid, n mod evident, cu !

294
Bibliografie

1. Brbosu D., Zelina I., Calculul probabilitilor, Editura CUB PRESS


22, Baia Mare, 1998
2. Beganu G. (coordonator), Teoria probabilitilor i statistic
matematic, Culegere de probleme, Editura Meteor Press, Bucureti
2004
3. Blaga P., Calculul probabilitilor i statistic matematic. Curs i
culegere de probleme, Universitatea Babe-Bolyai Cluj Napoca,
1994
4. Blaga P., Statistic matematic. Ediia a II-a, Universitatea Babe-
Bolyai, Cluj-Napoca, 2001
5. Breaz N., Modele de regresie bazate pe funcii spline, Presa
Universitar Clujean, 2007
6. Breaz N., Jaradat M., Statistic descriptiv, teorie i aplicaii, Ed.
Risoprint, Cluj-Napoca, 2009
7. Cbulea L., Aproximare n probabiliti i statistic, Editura
Aeternitas, Alba Iulia, 2003
8. Cbulea L., Aldea M., Elemente de teoria probabilitilor i statistic
matematic, Editura Didactica, Alba Iulia, 2004
9. Ciucu G., Elemente de teoria probabilitilor i statistic matematic,
Editura Didactic i Pedagogic, Bucureti, 1963
10. Ciucu G., Craiu V., Introducere n teoria probabilitilor i statistic
matematic, Editura Didactic i Pedagogic, Bucureti, 1971
11. Ciucu G., Craiu V., Inferena statistic, Editura Didactic i
Pedagogic, Bucureti, 1974
12. Ciucu G., Craiu V., Scuiu I., Culegere de probleme de teoria
probabilitilor, Editura Tehnic, 1967
13. Ciucu G., Smboan G., Teoria probabilitilor i statistic matematic,
Editura Tehnic, Bucureti, 1962
14. Cojocaru N., Clocotici V., Dobra D., Metode statistice aplicate n
industria textil, Editura Tehnic, Bucureti, 1986
15. Florea I., Econometrie, Editura Universitii din Oradea, 2003
16. Florea I., Parpucea I., Buiga A., Statistic descriptiv, teorie si
aplicaii, Editura Continental, Alba Iulia, 1998
17. Florea I., Parpucea I., Buiga A., Lazr D., Statistic inferenial, Presa
Universitar Clujean, 2000
18. Hoel P.G., Introduction to Mathematical Statistics, John Wiley, New
York,1971
19. Lehman E.L., Testing Statistical Hypotheses, Second edition, Springer,
New York-Berlin, 1997
295
20. Luca-Tudorache R., Probleme de teoria probabilitilor, Editura
Tehnopress, Iai, 2006.
21. Luca-Tudorache R., Probleme de analiz matematic. Calcul integral,
Casa de Editur Venus, Iai, 2007
22. Mihoc Gh., Micu N., Teoria probabilitilor i statistic matematic,
Editura Didactic i Pedagogic, Bucureti, 1980
23. Mihoc I., Ftu C.I., Calculul probabilitilor i statistic matematic,
Casa de editur-Transilvania Press, Cluj Napoca 2003
24. Moon T.K., Stirling W.C., Mathematical Methods and Algorithms for
Signal Processing, Prentice Hall, 2000
25. Nicolescu L. J., Stoka M.I., Matematic pentru ingineri, vol. II, Editura
Tehnic, Bucureti, 1971
26. Pitea A., Postolache M., Basic Concepts of Probability and Statistics,
Editura Fair Partners, 2007
27. Reischer C., Smboan A., Culegere de probleme de teoria
probabilitilor i statistic matematic, Editura Didactic i
Pedagogic, Bucureti, 1972
28. Reischer C., Smboan G., Teodorescu T., Teoria probabilitilor,
Editura Didactic i Pedagogic, Bucureti, 1967
29. Saporta G., Probabilits, analyse des donnes et statistique, Editions
Technip, Paris, 1990
30. Stapleton J.H., Linear Statistical Models, John Wiley & Sons, New
York-Chichester-Brisbane, 1995
31. Stark H., Woods J.W., Probability, Random Processes and Estimation
Theory for Engineers, Prentice Hall, 1986
32. abac I. Gh. et all., Matematici speciale, vol. II, Editura Didactic i
Pedagogic, Bucureti, 1983
33. abac I. Gh., Matematici speciale, vol. II, Editura Didactic i
Pedagogic, Bucureti, 1965
34. Trandafir R., Introducere n teoria probabilitilor, Editura Albatros,
1979
35. Trmbia R., Metode statistice, Presa Universitar Clujean,
Universitatea Babe-Bolyai, Cluj-Napoca, 2000
36. Zbganu Gh., Teoria msurii i a probabilitilor, Editura Universitii,
Bucureti, 1998
37. Zbganu Gh., Metode matematice n teoria riscului i actuariat, Editura
Universitii, Bucureti, 2004

296
ANEXE

297
Anexa 1
Valorile funciei Laplace - Gauss

u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7290 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9779 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
Anexa 2
Cuantilele repartiiei Student

grade\prob.
0.75 0.90 0.95 0.975 0.99 0.995
1 1.000 3.078 6.314 12.706 31.821 63.657
2 0.816 1.886 2.920 4.303 6.695 9.925
3 0.765 1.638 2.353 3.182 4.541 5.841
4 0.741 1.533 2.132 2.776 3.474 4.604
5 0.727 1.476 2.015 2.571 3.365 4.032
6 0.718 1.440 1.943 2.447 3.143 3.707
7 0.711 1.415 1.895 2.365 2.998 3.499
8 0.706 1.397 1.860 2.306 2.896 3.355
9 0.703 1.383 1.833 2.262 2.821 3.250
10 0.700 1.372 1.812 2.228 2.764 3.169
11 0.697 1.363 1.796 2.201 2.718 3.106
12 0.695 1.356 1.782 2.179 2.681 3.055
13 0.694 1.350 1.771 2.160 2.650 3.012
14 0.692 1.345 1.761 2.145 2.624 2.977
15 0.691 1.341 1.753 2.131 2.602 2.947
16 0.690 1.337 1.746 2.120 2.583 2.921
17 0.689 1.333 1.740 2.110 2.567 2.898
18 0.688 1.330 1.734 2.101 2.552 2.878
19 0.688 1.328 1.729 2.093 2.539 2.861
20 0.687 1.325 1.725 2.086 2.528 2.845
21 0.686 1.323 1.721 2.080 2.518 2.831
22 0.686 1.321 1.717 2.074 2.508 2.819
23 0.685 1.319 1.714 2.069 2.500 2.807
24 0.685 1.318 1.711 2.064 2.492 2.797
25 0.684 1.316 1.708 2.060 2.485 2.787
26 0.684 1.315 1.706 2.056 2.479 2.779
27 0.684 1.314 1.703 2.052 2.473 2.771
28 0.683 1.313 1.701 2.048 2.467 2.763
29 0.683 1.311 1.699 2.045 2.462 2.756
30 0.683 1.310 1.697 2.042 2.457 2.750
35 0.681 1.306 1.690 2.030 2.438 2.724
40 0.681 1.303 1.684 2.021 2.423 2.704
80 0.679 1.291 1.671 2.000 2.390 2.660
120 0.677 1.289 1.658 1.980 2.358 2.617
n>120 0.674 1.282 1.645 1.960 2.326 2.576
Anexa 3
Cuantilele repartiiei 2

grade\prob. 0.005 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99
1 0.000 0.000 0.001 0.004 0.016 2.71 3.84 5.02 6.63
2 0.010 0.020 0.051 0.103 0.211 4.60 5.99 7.38 9.21
3 0.072 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34
4 0.207 0.297 0.484 0.711 1.06 7.78 9.48 11.1 13.28
5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.8 15.09
6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.4 16.81
7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.0 18.47
8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.5 20.09
9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.0 21.66
10 2.16 2.56 3.25 3.94 4.87 16.99 18.31 20.5 23.21
11 2.60 3.05 3.82 4.57 5.58 17.27 19.67 21.9 24.72
12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.3 26.22
13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.7 27.69
14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.1 29.14
15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.6 30.58
16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.8 32.00
17 5.70 6.41 7.56 8.67 10.08 24.77 27.59 30.2 33.41
18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.3 34.80
19 6.84 7.63 8.91 10.1 11.65 27.20 30.14 32.9 36.19
20 7.43 8.26 9.59 10.9 12.44 28.41 31.41 34.2 37.57
21 8.03 8.90 10.3 11.6 13.24 29.61 32.67 35.5 38.93
22 8.64 9.54 11.0 12.3 14.04 30.81 33.92 36.8 40.29
23 9.26 10.2 11.7 13.1 14.85 32.01 35.17 38.1 41.64
24 9.89 10.9 12.4 13.8 15.66 33.20 36.41 39.4 42.98
25 10.5 11.5 13.1 14.6 16.47 34.38 37.65 40.6 44.31
26 11.2 12.2 13.8 15.4 17.29 35.56 38.88 41.9 45.64
27 11.8 12.9 14.6 16.2 18.11 36.74 40.11 43.2 46.96
28 12.5 13.6 15.3 16.9 18.94 37.92 41.34 44.5 48.28
29 13.1 14.3 16.0 17.7 19.77 39.09 42.56 45.7 49.59
30 13.8 15.0 16.8 18.5 20.60 40.26 43.77 47.0 50.89
35 17.2 18.5 20.6 22.5 24.8 46.1 49.8 53.2 57.3
40 20.7 22.2 24.4 26.5 29.1 51.8 55.8 59.3 63.7
60 35.5 37.5 40.5 43.2 46.5 74.4 79.1 83.3 88.4
Anexa 4
Cuantilele repartiiei Fisher - Snedecor

Gr2\Gr1 Prob. 1 2 3 4 5 6 7 8
0.95 161.4 199.5 216 225 230 234 237 239
1 0.975 648 800 864 900 922 937 948 957
0.99 4052 4999 5403 5625 5764 5859 5930 5981
0.95 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37
2 0.975 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4
0.99 98.49 99.00 99.17 99.25 99.30 99.33 99.35 99.36
0.95 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85
3 0.975 17.4 16.0 15.1 15.4 14.9 14.7 14.6 14.5
0.99 34.12 30.84 29.46 28.71 28.24 27.91 27.7 27.49
0.95 17.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04
4 0.975 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98
0.99 21.20 18.00 16.69 15.98 15.52 15.21 15.0 14.80
0.95 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82
5 0.975 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76
0.99 16.26 13.27 12.06 11.39 10.97 10.67 10.5 8.10
0.95 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15
6 0.975 8.07 7.26 6.60 6.23 5.99 5.82 5.70 5.60
0.99 12.25 10.91 9.78 9.15 8.75 8.47 8.26 8.10
0.95 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73
7 0.975 8.07 9.54 5.89 5.52 5.29 5.12 4.99 4.90
0.99 12.25 9.55 8.45 7.85 7.45 7.19 6.99 6.84
0.95 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44
8 0.975 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43
0.99 11.26 8.65 7.59 1.01 6.63 6.37 6.18 6.03
0.95 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23
9 0.975 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10
0.99 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47
0.95 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07
10 0.975 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85
0.99 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06
0.95 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95
11 0.975 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66
0.99 9.65 7.20 6.22 5.67 5.32 5.07 4.89 4.74
0.95 4.75 3.88 3.49 3.26 3.11 3.00 2.91 2.85
12 0.975 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51
0.99 9.33 6.93 5.95 5.41 5.06 4.82 4.54 4.50
0.95 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77
13 0.975 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39
0.99 9.07 6.70 5.74 5.221 4.86 4.62 4.44 4.30
0.95 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70
14 0.975 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29
0.99 8.86 6.51 5.56 5.04 4.70 4.46 4.28 4.14
0.95 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64
15 0.975 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20
0.99 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00
0.95 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59
16 0.975 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12
0.99 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89
0.95 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55
17 0.975 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06
0.99 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79
0.95 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51
18 0.975 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01
0.99 8.29 7.01 5.09 4.58 4.25 4.01 3.84 3.71
0.95 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48
19 0.975 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96
0.99 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63
0.95 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45
20 0.975 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91
0.99 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56
0.95 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42
21 0.975 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87
0.99 8.02 5.78 4.87 4.37 4.04 3.84 3.64 3.51
0.95 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40
22 0.975 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84
0.99 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45
0.95 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37
23 0.975 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81
0.99 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41
0.95 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36
24 0.975 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78
0.99 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36

Anexa 4 (continuare)

Gr2\Gr1 Prob. 9 10 11 12 13 14 15 16
0.95 19.4 19.4 19.4 19.4 19.4 19.4 19.4 19.4
2 0.975 39.4 39.4 39.4 39.4 39.4 39.4 39.4 39.4
0.99 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.4
0.95 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69
3 0.975 14.5 14.4 14.4 14.3 14.3 14.3 14.3 14.2
0.99 27.3 27.1 27.1 27.1 27.0 26.9 26.9 26.8
0.95 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84
4 0.975 8.90 8.84 8.79 8.75 8.72 8.69 8.66 8.64
0.99 14.7 14.5 14.4 14.4 14.3 14.2 14.2 14.2
0.95 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60
5 0.975 6.68 6.62 6.57 6.52 6.49 6.46 6.43 6.41
0.99 10.2 10.1 9.96 9.89 9.82 9.77 9.72 9.68
0.95 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92
6 0.975 5.52 5.46 5.41 5.37 5.33 5.30 5.27 5.25
0.99 7.98 7.89 7.79 7.72 7.66 7.60 7.56 7.52
0.95 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49
7 0.975 4.82 4.76 4.71 4.67 4.63 4.60 4.57 4.54
0.99 6.72 6.62 6.54 6.47 6.41 6.36 6.31 6.27
0.95 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20
8 0.975 4.36 4.30 4.24 4.20 4.16 4.13 4.10 4.08
0.99 5.91 5.81 5.73 5.67 5.61 5.56 5.52 5.48
0.95 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99
9 0.975 4.03 3.96 3.91 3.87 3.83 3.80 3.77 3.74
0.99 5.35 5.26 5.18 5.11 5.05 5.00 4.96 4.90
0.95 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83
10 0.975 3.78 3.72 3.66 3.62 3.58 3.55 3.52 3.50
0.99 4.94 4.85 4.77 4.71 4.65 4.60 4.56 4.52
0.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70
11 0.975 3.59 3.53 3.47 3.43 3.39 3.36 3.33 3.30
0.99 4.63 4.54 4.46 4.40 4.34 4.29 4.25 4.21
0.95 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60
12 0.975 3.44 3.37 3.32 3.28 3.24 3.21 3.18 3.15
0.99 4.39 4.30 4.22 4.16 4.10 4.05 4.01 3.97
0.95 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51
13 0.975 3.31 3.25 3.20 3.15 3.12 3.08 3.05 3.03
0.99 4.19 4.10 4.02 3.96 3.91 3.86 3.82 3.78
0.95 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44
14 0.975 3.21 3.15 3.09 3.05 3.01 2.98 2.95 2.92
0.99 4.03 3.94 3.86 3.80 3.75 3.70 3.66 3.62
0.95 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38
15 0.975 3.12 3.06 3.01 2.96 2.92 2.89 2.86 2.84
0.99 3.89 3.80 3.73 3.67 3.61 3.56 3.52 3.49
0.95 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33
16 0.975 3.05 2.99 2.93 2.89 2.85 2.82 2.79 2.76
0.99 3.78 3.69 3.62 3.55 3.50 3.45 3.41 3.37
0.95 2.49 2.45 2.41 2.38 2.35 2.33 2.29 2.27
17 0.975 2.98 2.92 2.87 2.82 2.79 2.75 2.72 2.70
0.99 3.68 3.59 3.52 3.46 3.40 3.35 3.31 3.27
0.95 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25
18 0.975 2.93 2.87 2.81 2.77 2.73 2.70 2.67 2.64
0.99 3.60 3.51 3.43 3.37 3.32 3.27 3.23 3.19
0.95 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21
19 0.975 2.88 2.82 2.76 2.72 2.68 2.65 2.62 2.59
0.99 3.52 3.43 3.36 3.30 3.24 3.19 3.15 3.12
0.95 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.19
20 0.975 2.84 2.77 2.72 2.68 2.64 2.60 2.57 2.55
0.99 3.46 3.37 3.29 3.23 3.18 3.13 3.09 3.05
0.95 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16
21 0.975 2.80 2.73 2.68 2.64 2.60 2.56 2.53 2.51
0.99 3.40 3.31 3.24 3.17 3.12 3.07 3.03 2.99
0.95 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13
22 0.975 2.76 2.70 2.65 2.60 2.56 2.53 2.50 2.47
0.99 3.35 3.26 3.18 3.12 3.07 .302 2.98 2.94
0.95 2.32 2.27 2.23 2.20 2.18 2.15 2.13 2.11
23 0.975 2.73 2.67 2.62 2.57 2.53 2.50 2.47 2.44
0.99 3.30 3.21 3.14 3.07 3.02 2.97 2.93 2.89
0.95 2.30 2.25 2.21 2.18 2.15 2.13 2.11 2.09
24 0.975 2.70 2.64 2.69 2.54 2.50 2.47 2.44 2.41
0.99 3.26 3.17 3.09 3.03 2.98 2.93 2.89 2.85

S-ar putea să vă placă și