Carte SPD

Ariadna Lucia Pletea Mircea Lupan
SATISTIC PRIN ... MATLAB I

MATHEMATICA

IAI, 2009

Cuprins
1 Cmp de probabilitate 5
1.1 Cmp de evenimente . . . . . . . . . . . . . . . . . . . 5
1.2 Definitia probabilit atii . . . . . . . . . . . . . . . . . . 10
1.3 Formule probabilistice . . . . . . . . . . . . . . . . . . 15
1.4 Metode de num arare . . . . . . . . . . . . . . . . . . . 20
1.5 Moduri de selectare a elementelor . . . . . . . . . . . . 22
1.6 Scheme clasice de probabilitate . . . . . . . . . . . . . 23
1.7 Probleme rezolvate . . . . . . . . . . . . . . . . . . . . 28
2 Variabile aleatoare discrete 43
2.1 Definitia variabilei aleatoare . . . . . . . . . . . . . . . 43
2.2 Variabile aleatoare discrete . . . . . . . . . . . . . . . . 44
2.3 Functia de repartitie a v. a. discrete . . . . . . . . . . . 45
2.4 Operatii cu v. a. discrete . . . . . . . . . . . . . . . . . 47
2.5 Caracteristici numerice ale v. a. discrete . . . . . . . . 49
2.5.1 Propriet ati ale mediei . . . . . . . . . . . . . . . 52
2.5.2 Propriet ati ale dispersiei . . . . . . . . . . . . . 54
2.6 Functia generatoare . . . . . . . . . . . . . . . . . . . . 61
2.7 Legi discrete de repartitie . . . . . . . . . . . . . . . . 61
2.7.1 V. a. repartizat a uniform . . . . . . . . . . . . . 61
2.7.2 V. a. repartizat a binomial . . . . . . . . . . . . 64
2.7.3 V. a. multinomial a . . . . . . . . . . . . . . . . 67
2.7.4 V. a. repartizat a binomial cu exponent
negativ . . . . . . . . . . . . . . . . . . . . . . . 68
2.7.5 V. a. repartizat a geometric . . . . . . . . . . . . 71
2.7.6 V. a. repartizat a hipergeometric . . . . . . . . . 73
2.7.7 V. a. repartizat a Poisson . . . . . . . . . . . . . 75
1
2 CUPRINS
3 Variabile aleatoare continue 95
3.1 Functia de repartitie . . . . . . . . . . . . . . . . . . . 95
3.2 Densitatea de probabilitate . . . . . . . . . . . . . . . . 98
3.3 Caracteristici numerice ale v. a. continue . . . . . . . . 99
3.4 Legi clasice de repartitie . . . . . . . . . . . . . . . . . 105
3.4.1 V. a. distribuit a uniform . . . . . . . . . . . . . 105
3.4.2 V. a. distribuit a exponential . . . . . . . . . . . 107
3.4.3 V. a. distribuit a Weibull . . . . . . . . . . . . . 110
3.4.4 V. a. distribuit a gama . . . . . . . . . . . . . . 112
3.4.5 V. a. distribuit a normal . . . . . . . . . . . . . 113
3.4.6 Functia caracteristic a . . . . . . . . . . . . . . . 119
3.4.7 V. a. distribuit a hi-p atrat
2
(n) . . . . . . . . . 123
3.4.8 V. a. distribuit a Student . . . . . . . . . . . . . 125
3.4.9 Functii de v. a. . . . . . . . . . . . . . . . . . . 126
3.4.10 Repartitia lognormal a . . . . . . . . . . . . . . 128
3.5 Fiabilitate . . . . . . . . . . . . . . . . . . . . . . . . . 130
4 Teorema limit a central a 155
4.1 Aplicatii ale teoremei limit a centrale . . . . . . . . . . 162
4.1.1 Aproximarea v. a. binomiale printr-o
v. a. normal a . . . . . . . . . . . . . . . . . . . 170
4.1.2 Aproximarea v. a. Poisson printr-o
v. a. normal a . . . . . . . . . . . . . . . . . . . 173
5 Vectori aleatori 175
5.1 Variabile aleatoare bidimensionale . . . . . . . . . . . . 175
5.2 Functia de repartitie a unui vec. a. bidimensional . . . 180
5.3 Caracteristici numerice . . . . . . . . . . . . . . . . . . 182
5.4 Operatii cu v. a. continue . . . . . . . . . . . . . . . . 184
5.5 Repartitia normal a bidimensional a . . . . . . . . . . . 194
6 Elemente de statistic a 199
6.1 Populatii statistice . . . . . . . . . . . . . . . . . . . . 199
6.2 Reprezentarea grafic a a datelor statistice . . . . . . . . 201
6.2.1 Gruparea pe clase . . . . . . . . . . . . . . . . . 203
6.2.2 Algoritmul pentru constructia histogramelor . . 204
6.3 Caracteristici statistice ale datelor experimentale . . . 210
6.4 Statistica a dou a variabile . . . . . . . . . . . . . . . . 214
CUPRINS 3
7 Statistic a inferential a 221
7.1 Modele statistice . . . . . . . . . . . . . . . . . . . . . 224
7.2 Estimatori punctuali . . . . . . . . . . . . . . . . . . . 227
7.3 Metoda momentelor . . . . . . . . . . . . . . . . . . . . 232
7.4 Metoda verosimilit atii maxime . . . . . . . . . . . . . . 233
7.4.1 Probleme rezolvate . . . . . . . . . . . . . . . . 248
8 Intervale de ncredere 253
8.1 Intervale de ncredere pentru medie n cazul
cunoscut . . . . . . . . . . . . . . . . . . . . . . . . . . 254
8.1.1 Constructia intervalului de ncredere . . . . . . 254
8.1.2 Alegerea dimensiunii esantionului . . . . . . . . 260
8.2 Intervale de ncredere pentru medie n cazul
necunoscut . . . . . . . . . . . . . . . . . . . . . . . . . 262
8.3 Intervale de ncredere pentru dispersie . . . . . . . . . 268
8.4 Intervale de ncredere pentru proportii . . . . . . . . . 273
8.4.1 Alegerea dimensiunii esantionului . . . . . . . . 276
8.5 Predictia . . . . . . . . . . . . . . . . . . . . . . . . . . 277
8.6 Intervale de tolerant a pentru caracteristici ce urmeaz a
o distributie normal a . . . . . . . . . . . . . . . . . . . 279
8.7 Intervale de ncredere pentru caracteristicile a dou a po-
pulatii care urmeaz a o distributie normal a . . . . . . . 281
8.7.1 Intervale de ncredere pentru diferenta mediilor
a dou a populatii ale c aror dispersii sunt cunos-
cute . . . . . . . . . . . . . . . . . . . . . . . . 282
8.7.2 Intervale de ncredere pentru diferenta mediilor
a dou a populatii ale c aror dispersii sunt necu-
noscute . . . . . . . . . . . . . . . . . . . . . . 285
8.7.3 Intervale de ncredere pentru raportul dispersi-
ilor a dou a populatii . . . . . . . . . . . . . . . 289
8.7.4 Intervale de ncredere pentru diferenta proporti-
ilor a dou a populatii . . . . . . . . . . . . . . . 292
9 Testarea ipotezelor statistice 295
9.1 Teste parametrice . . . . . . . . . . . . . . . . . . . . . 295
9.1.1 Leg atura dintre testarea ipotezei statistice rela-
tiv la un parametru si intervalul de ncredere al
parametrului . . . . . . . . . . . . . . . . . . . 297
9.1.2 Testarea mediei unei distributii normale . . . . 301
4 CUPRINS
9.1.3 P-valoarea n teste statistice . . . . . . . . . . . 303
9.1.4 Test asupra dispersiei unei populatii distribuite
normal . . . . . . . . . . . . . . . . . . . . . . . 313
9.1.5 Test asupra proportiei unei populatii . . . . . . 317
9.1.6 Test asupra diferentei mediilor a dou a caracte-
ristici distribuite normal . . . . . . . . . . . . . 320
9.1.7 Test asupra raportului dispersiilor a dou a popu-
latii . . . . . . . . . . . . . . . . . . . . . . . . 323
9.1.8 Test asupra diferentei proportiilor a dou a pop-
ulatii . . . . . . . . . . . . . . . . . . . . . . . . 324
9.2 Testul lui Pearson (
2
) . . . . . . . . . . . . . . . . . . 326
9.2.1 Algoritmul testului lui Pearson . . . . . . . . . 327
9.3 Teste de independent a n tabele de contingent a . . . . 340
9.3.1 Testul de independent a . . . . . . . . . . . . . . 342
9.3.2 Testarea omogeneit atii populatiilor . . . . . . . 344
Bibliografie 347
Anexe 349
Index de notiuni 361
Capitolul 1
Cmp de probabilitate
Teoria probabilit atii este stiinta incertitudinii. Ea dezvolt a reguli
matematice exacte pentru a ntelege si a analiza propria noastr a igno-
rant a. ntelegerea ne face s a fim mai exacti, s a lu am decizii mai bune,
s a evit am riscul.
1.1 Cmp de evenimente
Teoria probabilit atilor studiaz a experientele aleatoare, experiente
care, reproduse de mai multe ori, se desf asoar a de fiecare dat a n mod
diferit, rezultatul fiind imprevizibil. Exemple: aruncarea unui zar,
tragerile la tint a, durata de functionare a unei masini etc.
Pentru a modela si analiza un experiment aleator trebuie s a intro-
ducem multimea rezultatelor posibile ale experimentului.
Definitia 1.1. Multimea rezultatelor posibile ale unei experiente se
numeste spa tiu de selec tie. O submultime a spatiului de selectie se
numeste eveniment. Un rezultat posibil al experientei se numeste
prob a.
Din definitie rezult a c a evenimentul este format din una sau mai
multe probe.
Definitia 1.2. Un spatiu de selectie este numit discret dac a el este
o multime finit a sau num arabil a. Un spatiu de selectie este numit
continuu dac a contine un interval de numere reale.
5
6 CAPITOLUL 1. CMP DE PROBABILITATE
Notiunile de spatiu de selectie si de eveniment astfel introduse
ne permit ca teoria multimilor s a poat a fi folosit a n studiul eveni-
mentelor. Traducem n limbaj de evenimente notiuni si simboluri
caracteristice teoriei multimilor. Vom nota n continuare spatiul de
selectie cu .
1. Drept submultime a lui se poate considera . Cum indiferent
de rezultatul al experientei, , rezult a c a odat a cu se
realizeaz a . Evenimentul se numeste eveniment cert (sau
eveniment sigur).
2. Drept submultime a lui putem considera multimea vid a care
nu se realizeaz a la nici o efectuare a experientei, motiv pentru
care se numeste eveniment imposibil .
3. Fie evenimentul A . Evenimentul complementar lui A n
raport cu , notat A, se numeste eveniment contrar evenimen-
tului A. Acesta se realizeaz a dac a si numai dac a nu se realizeaz a
evenimentul A, adic a

A
( / A).
4. Fie evenimentele A, B . Evenimentul A implic a evenimentul
B (scris A B) dac a B se realizeaz a prin toate probele lui A
(si prin alte probe), adic a ( A) ( B).
5. Fie A, B dou a evenimente. Evenimentul A B este eveni-
mentul care se realizeaz a prin probe ale evenimentelor A sau B,
adic a ( A B) (( A) ( B)).
6. Fie A, B . Prin evenimentul A B ntelegem evenimentul
care se realizez a prin probe ale evenimentulor A si B, adic a
( A B) (( A) ( B)).
7. Fie A, B . Prin A \ B ntelegem evenimentul care se reali-
zeaz a prin probe ale evenimentelor A si B, adic a ( A\ B)
(( A) ( / B)).
Definitia 1.3. Fie A , A 6= . Evenimentul A se numeste eveni-
ment elementar dac a este implicat numai de el nsusi si de evenimentul
imposibil. Celelalte evenimente se numesc evenimente compuse.
CAPITOLUL 1. CMP DE PROBABILITATE 7
Definitia 1.4. Fie A, B . Evenimentele A, B se numesc compa-
tibile dac a se pot realiza simultan, adic a exist a probe care realizeaz a
att pe A ct si pe B (i.e. AB 6= ). n caz contrar evenimentele se
numesc incompatibile (i.e. A B = ).
Problema 1.1. O urn a con tine 5 bile albe, 3 bile ro sii si 2 bile al-
bastre. Bilele sunt numerotate cu 1, 2, 3, . . . , 10, astfel: bilele nu-
merotate de la 1, 2, 3, 4, 5 sunt albe, bilele numerotate 6, 7, 8 sunt
ro sii, iar bilele numerotate 9, 10 sunt albastre. Din urn a se extrage la
ntmplare o bil a. Se consider a urm atoarele evenimente:
A = {bila extras a are nscris un num ar par},
B = {bila extras a are nscris un num ar multiplu de 3},
C = {bila extras a are culoarea alb a},
D = {bila extras a are culoarea ro sie},
E = {bila extras a are culoarea albastr a},
F = {bila extras a are nscris un num ar multiplu de 10}.
S a se defineasc a evenimentele: AB, CE, AD, BE, A\ B.
S a se precizeze care sunt evenimente elementare si care sunt compuse.
Preciza ti dou a evenimente incompatibile.
Rezolvare. Un rezultat posibil al experientei definite este obtinerea
n urma extragerii a unei bile. Spatiul de selectie este
= {1, 2, 3, . . . , 10}.
Experienta deneste evenimentele A = {2, 4, 6, 8, 10}, B = {3, 6, 9},
C = {1, 2, 3, 4, 5}, D = {6, 7, 8}, E = {9, 10} , F = {10}. Se observ a
imediat c a:
A B = {2, 3, 4, 6, 8, 9, 10} reprezint a evenimentul: a fost extras a
o bil a cu num ar multiplu de 2 sau 3;
C E = {1, 2, 3, 4, 5, 9, 10} reprezint a evenimentul: a fost extras a
o bil a alb a sau albastr a;
A D = {6, 8} reprezint a evenimentul: a fost extras a o bil a rosie
avnd nscris un num ar par;
B E = {3, 6, 8} {1, 2, 3, 4, 5, 6, 7, 8} = {3, 6} reprezint a eveni-
mentul: a fost extras a o bil a avnd nscris un num ar multiplu de 3 si
bila nu este albastr a.
A \ B = {2, 4, 6, 8, 10} \ {3, 6, 9} = {2, 4, 8, 10} reprezint a eveni-
mentul: a fost extras a o bil a, care are nscris un num ar par si care nu
este multiplu de 3.
A\ B = {1, 2, 3, . . . , 10} \ {2, 4, 8, 10} = {1, 3, 5, 6, 7, 9} reprezint a
evenimentul: a fost extras a o bil a, care are nscris un num ar impar
sau un num ar par multiplu de 3.
Singurul eveniment elementar este F. Celelalte evenimente sunt
compuse. Evenimente incompatibile: C si D, C si E, D si E, C si F
etc.
Definitia 1.5. Perechea {F, }, F 6= , F P(), se numeste cmp
de evenimente dac a:
a) A F A F;
b) A, B F A B F.
Observatia 1.1. Dac a este o multime finit a sau cel mult num ara-
bil a de evenimente, atunci cmpul de evenimente se mai numeste cmp
finit de evenimente.
Consecinte ale definitiei:
1. F deoarece (A F
a)
A F)
b)
A A F ( F).
2. F deoarece ( F
a)
F) dar = F.
3. Dac a A, B F atunci A \ B F deoarece A \ B = A B =
A B F.
4. Urm atoarele propriet ati sunt echivalente:
(A, B F A B F) si (A, B F A B F),
deoarece A B = A B.
5. Din Definitia 1.5 rezult a, folosind inductia matematic a,
n 2, A
j
F si pentru 1 j n
n
S
j=1
A
j
F.
6. Din Consecinta 4 rezult a:
n 2, A
j
F, 1 j n
n
T
j=1
A
j
F.
ntr-un cmp de evenimente au loc urm atoarele propriet ati:
P1 Dou a evenimente elementare distincte sunt incompatibile.
Fie A
1
si A
2
dou a evenimente elementare. Presupunem c a nu ar fi
incompatibile, adic a A
1
A
2
= B 6= . Atunci B A
1
, B 6= deci
A
1
nu este eveniment elementar, ceea ce este fals.
P2 ntr-un cmp finit de evenimente exist a evenimente elementare.
Fie A
1
un eveniment. Dac a A
1
este elementar, armatia este
demonstrat a. Dac a A
1
este eveniment compus, exist a A
2
6= , A
2
6= A
1
astfel nct A
2
A
1
. Dac a A
2
este eveniment elementar, armatia
este demonstrat a. Dac a A
2
este eveniment compus se continu a ratio-
namentul anterior. Rationamentul se opreste peste un num ar finit de
pasi, deoarece cmpul este un cmp finit de evenimente.
P3 ntr-un cmp finit de evenimente orice eveniment se poate scrie
ca reuniune finit a de evenimente elementare.
Fie B un eveniment compus (dac a B este eveniment elementar
atunci afirmatia este demonstrat a). Conform propriet atii P2, exist a
un eveniment elementar A
1
F si un eveniment B
1
F astfel nc
B = A
1
B
1
, B
1
= B \ A
1
cu A
1
B
1
= . Dac a B
1
este eveniment
elementar, afirmatia este demonstrat a. Dac a B
1
nu este eveniment
elementar, exist a evenimentul elementar A
2
si un eveniment B
2
F
astfel nct B
1
= A
2
B
2
si deci B = A
1
A
2
B
2
si rationamentul se
continu a. Num arul pasilor va fi finit deoarece cmpul de evenimente
este finit. Deci B = A
1
A
2
A
k
, unde A
i
, i = 1, k sunt
evenimente elementare.
P4 ntr-un cmp finit de evenimente reuniunea tuturor evenimentelor
elementare ale lui F este .
ntr-adev ar, fie = A
1
A
2
A
s
. Presupunem c a n cm-
pul finit de evenimente mai exist a un eveniment elementar A
n
6= A
j
,
j = 1, s. Atunci
A
n
= A
n
= A
n
(A
1
A
s
) = (A
n
A
1
) (A
n
A
s
) =
conform P1.
Nu de putine ori de un real folos ne va fi descompunerea unui eveni-
ment ntr-o reuniune de evenimente incompatibile dou a cte dou a.
Definitia 1.6. Fie {F, } un cmp de evenimente si A
1
, A
2
, . . . , A
n
F.
Spunem c a familia de evenimente A
1
, A
2
,. . . , A
n
formeaz a un sistem
complet de evenimente dac a:
a) A
i
6= , i = 1, n;
b) A
i
A
j
= , i 6= j, i, j = 1, n;
c)
n
S
i=1
A
i
= .
Observatia 1.2. Multimea tuturor evenimentelor elementare atasate
unei experiente formeaz a un sistem complet de evenimente.
1.2 Definitia probabilit atii
Introducemnotiunea de probabilitate atasat a unui eveniment apar-
tinnd unui cmp finit de evenimente. Probabilitatea este folosit a pen-
tru a cuantica sansa de a se produce un eveniment. Probabilitatea
ca s a fie intr-o anumit a zi soare este de 30%. Aceasta este o armatie
care cuantic a posibilitatea de a fi soare n ziua respectiv a.
Definitia 1.7. Se numeste probabilitate (m asur a de probabilitate) o
functie definit a pe un cmp de evenimente {F,} cu valori reale,
P : F [0, 1], care satisface urm atoarele axiome:
a) P() = 1;
b)A, B F, A B = : P(A B) = P(A) +P(B).
Observatia 1.3. Axioma c) din definitie se generalizeaz a, prin in-
ductie, la orice num ar finit de evenimente incompatibile dou a cte
dou a, A
i
A
j
= , i, j = 1, n, i 6= j:
P
n
[
i=1
A
i
=
n
X
i=1
P (A
i
) .
Propriet ati:
P1. P() = 0. ntr-adev ar ( = si = )
P() = P( ) = P() +P() P() = 0.
P2. A F P(A) = 1 P(A). Relatia rezult a din = A A,
A A =
c)
P() = P(A) + P(A)
b)
1 = P(A) + P(A)
P(A) = 1 P(A).
P3. A, B F :P(A\B) = P(A)P(AB). Din (A\B)(AB) =
A si (A\ B) (A B) =
c)
P(A\ B) +P(A B) = P(A).
P4. A, B F, A B P(A) P(B). ntr-adev ar, tinnd
seama de P2 si de faptul c a A B avem 0 P(B \ A) =
P(B) P(B A) = P(B) P(A). Deci P(B) P(A) 0 sau
P(B) P(A).
P5. A F 0 P(A) 1. ntr-adev ar, A si, conform
P4, avem P() P(A) P(), adic a 0 P(A) 1.
Definitia 1.8. Se numeste cmp de probabilitate un cmp de eve-
nimente {F,} pe care am definit o probabilitate P. Se noteaz a
{F,, P}.
Observatia 1.4. Dac a este multime finit a, fie = {A
1
, A
2
, . . . , A
n
},
atunci orice eveniment A F, A 6= poate fi scris ca o reuniune finit a
de evenimente elementare, A = A
i
1
A
i
2
A
i
k
. Conform Obser-
vatiei 1.3 obtinem
P(A) = P(A
i
1
) + +P(A
i
k
).
Deci pentru a cunoaste probabilitatea unui eveniment oarecare din
F este suficient s a cunoastem probabilit atile tuturor evenimentelor
elementare care-l compun. Probabilitatea unui eveniment A este suma
probabilit atilor evenimentelor elementare ce-l compun. Evident, pro-
babilit atile evenimentelor elementare satisfac conditiile
P(A
i
) 0, i = 1, n, (1.1)
P(A
1
) +P(A
2
) + +P(A
n
) = P() = 1. (1.2)
Deci, ind date toate evenimentele elementare care compun , familia
F este perfect determinat a si deci cmpul de probabilitate mai depinde
de alegerea a n numere, probabilit atile evenimentelor elementare, care
satisfac conditiile (1.1) si (1.2). n cazul particular cnd evenimentele
elementare sunt echiprobabile P(A
1
) = P(A
2
) = = P(A
n
) =
1
n
,
si dac a A = A
i
1
A
i
2
A
i
k
, obtinem P(A) =
k
n
, deci ajungem
astfel la definitia probabilit atii dintr-un cmp de probabilitate n care
spatiul de selectie este o multime finit a sau cel mult num arabil a: proba-
bilitatea unui eveniment este raportul dintre num arul evenimentelor
elementare favorabile producerii evenimentului dat si num arul total
de evenimente elementare ale cmpului. De aici rezult a necesitatea
de a studia metodele de num arare si modurile de selectare ale eveni-
mentelor.
Problema 1.2. Un num ar de telefon luat la ntmplare este format
din 6 cifre. Care este probabilitatea ca: 1) toate cifrele s a fie diferite;
2) toate cifrele s a fie pare?
Rezolvare. 1) Un rezultat al experientei este o grupare de sase cifre
formate cu cifrele 0, 1, 2,. . . , 9. Prima cifr a poate fi aleas a n 10 mo-
duri, a doua n 10 moduri,. . . , a sasea cifr a poate fi aleas a n 10 moduri.
Conform principiului multiplic arii exist a 10
6
moduri de alegere a celor
6 cifre. Num arul de numere de sase cifre formate cu cifre diferite este
A
6
10
= 10 9 8 7 6 5 = 151 200. Deci probabilitatea este
p =
151200
10
6
= 0.1512.
2) Cu 5 cifre pare (0, 2, 4, 6, 8) se pot forma 5
6
numere diferite.
Cumnum arul total de numere este 10
6
, rezult a c a probabilitatea eveni-
mentului este
p =
5
6
10
6
=

1
2
6
= 0.015625.
Definitia 1.9. Numim probabilitatea evenimentului A condi tionat de
evenimentul B, P(B) 6= 0, (notat a P
B
(A) sau P(A|B)) probabilitatea
de realizare a evenimentului A n ipoteza c a evenimentul B s-a realizat,
probabilitate definit a prin formula
P(A|B) =
P(A B)
P(B)
. (1.3)
Observatia 1.5. Dac a presupunem c a P(A) 6= 0, atunci
P(B|A) =
P(A B)
P(A)
. (1.4)
Observatia 1.6. Din relatiile (1.3) si (1.4) retinem
P(A B) = P(B)P(A|B) = P(A)P(B|A).
Fie {F,, P} un cmp de probabilitate si A, B F.
Definitia 1.10. Evenimentele Asi B sunt independente (n probabili-
tate) dac a probabilitatea ca unul s a se realizeze nu depinde de faptul
c a cel alalt s-a realizat sau nu, altfel spus
P(A B) = P(A)P(B). (1.5)
Figura 1.1.
Teorema 1.1. a) Evenimentele A si B cu P(A)P(B) 6= 0 sunt inde-
pendente dac a si numai dac a P(B|A) = P(B).
b) Dac a evenimentele A si B sunt independente atunci si evenimentele
A si B, A si B, A si B sunt independente.
Demonstratie. a) Deoarece evenimentele A si B sunt independente,
rezult a P(A B) = P(A)P(B). Dar P(A B) = P(A)P(B|A)
P(B|A) = P(B).
Reciproc, deoarece P(B) = P(B|A) =
P(A B)
P(A)
, rezult a
P (A B) = P(A)P(B), adic a (1.5).
b) S a demonstr am c a (1.5) implic a A, B independente:
P(A B) = P(A)P(B) (1.6)
ntr-adev ar, dac a evenimentele A si B sunt independente, atunci
P (A B) = P(A)P(B) si, deoarece A B = B \ A, avem
P

A B
= P (B \ A)
si
P(B \ A) = P(B) P(A B) = (1 P(A))P(B) = P(A)P(B).
Analog se demonstreaz a c a A si B sau A si B sunt independente.
Definitia 1.11. Date evenimentele A
1
, A
2
,. . . , A
n
, vom spune c a sunt
independente dac a probabilitatea oric arei intersectii nite de eveni-
mente este egal a cu produsul probabilit atilor evenimentelor intersec-
tate, adic a dac a
P(A
i
1
A
i
2
A
i
k
) = P(A
i
1
)P(A
i
2
) P(A
i
k
)
oricare ar fi 1 i
1
i
2
i
k
n.
Observatia 1.7. Dac a evenimentele A
1
, A
2
,. . . , A
n
sunt independete
dou a cte dou a, nu rezult a c a sunt independente n totalitatea lor.
Urm atorul exemplu ilustreaz a acest lucru.
Exemplul lui S. N. Bernstein. Consider am un tetraedru regulat,
cu fetele colorate astfel: una n alb, una n negru, una n rosu si a
patra n toate cele trei culori.
Aruncnd tetraedrul pe o suprafat a, acesta se aseaz a pe una din
fete; ne intereseaz a probabilitatea aparitei fiec arei culori pe fata pe
care se aseaz a tetraedrul si independenta evenimentelor corespunz a-
toare. Fie
A
1
evenimentul care const a n aparitia culorii albe,
A
2
evenimentul care const a n aparitia culorii negre si
A
3
evenimentul care const a n aparitia culorii rosii.
Avem P(A
1
) = P(A
2
) = P(A
3
) =
1
2
deoarece pentru fiecare cu-
loare sunt patru cazuri posibile si dou a favorabile (fata cu culorea
respectiv a si fata cu cele trei culori). Se constat a c a
P(A
1
A
2
) = P(A
1
A
3
) = P(A
2
A
3
) =
1
4
,
dar
P(A
1
A
2
A
3
) =
1
4
6= P(A
1
)P(A
2
)P(A
3
) =
1
8
.
1.3 Formule probabilistice
I. Probabilitatea unei reuniuni de evenimente.
Dac a {F,, P} un cmp de probabilitate, atunci oricare ar fi
A, B F are loc relatia
P(A B) = P(A) +P(B) P(A B). (1.7)
Deoarece A B = A (B \ A) si A (B \ A) = , rezult a
P(A B) = P(A (B \ A)) = P(A) +P(B \ A),
dar, conform propriet atii P2, P(B \ A) = P(B) P(B A) si deci
rezult a (1.7).
Utiliznd relatia (1.7), putem deduce o formul a similar a n cazul a
trei evenimente:
P(A B C) = P((A B) C) =
= P (A B) +P(C) P ((A B) C) =
= P(A) +P(B) P(A B) +P(C) P ((A C) (B C)) =
= P(A) +P(B) +P(C) P(A B) P (A C)
P (B C) +P (A B C) .
Relatia se poate extinde si n cazul a n evenimente
P
n
S
i=1
A
i
=
n
P
i=1
P(A
i
)
n
P
i,j=1,
i<j
P (A
i
A
j
) + + (1)
n1
P
n
T
i=1
A
i
.
Demonstratia se face prin inductie matematic a dup a n.
Figura 1.2.
II. Probabilitatea unei intersectii de evenimente.
Fie {F,, P} un cmp de probabilitate. Oricare ar fi A, B F are
loc relatia (1.3). Ea poate fi folosit a pentru a calcula probabilitatea
unei intersectii: P(AB) = P(B)P(A|B). Cnd folosim aceast a for-
mul a la rezolvarea unei probleme trebuie s a consider am evenimentele
A si B ntr-o ordine convenabil aleas a, dat ind c a se poate utiliza,
datorit a echivalentei demonstrate, relatia P(A B) = P(A)P(B|A).
Formula se poate extinde si n cazul a n evenimente A
1
, A
2
,. . . ,
A
n
, cu P
k
T
i=1
A
i
6= 0, k = 1, n 1, sub forma
P
n
T
i=1
A
i
= P(A
1
)P(A
2
|A
1
) . . . P(A
n
|(A
1
A
2
A
n1
)). (1.8)
ntr-adev ar, folosind definitia probabilit atii conditionate, obtinem
P(A
1
) = P(A
1
),
P(A
2
|A
1
) =
P(A
1
A
2
)
P(A
1
)
,
.
.
.
P(A
n
|(A
1
A
2
A
n1
)) =
P(A
1
A
2
A
n
)
P(A
1
A
2
A
n1
)
.
nmultind relatiile membru cu membru si f acnd simplific arile cores-
punz atoare, obtinem (1.8).
Problema 1.3. Un calculator utilizeaz a parole formate din sase ca-
ractere, nu neap arat distincte, si fiecare caracter este una din cele
26 de litere (a,b,c,. . . ,z) sau o cifr a (0,1,2,. . . ,9). Literele mari nu
sunt admise. Fie A evenimentul c a parola ncepe cu o vocal a (a, e, i,
o, u) si B evenimentul c a parola are al saselea caracter o cifr a par a
(0, 2, 4, 6, 8). Se selecteaz a o parol a la ntmplare. S a se calculeze
probabilit a tile: P(A), P(B), P(A B), P(A B).
Rezolvare. Num ar am cte parole se pot forma: toate s a contin a
numai litere, deci 26
6
, sau s a contin a 5 litere si o cifr a, deci 26
5
10
etc. Situatiile sunt incompatibile (nu putem avea parole formate, de
exemplu, numai din litere si n acelasi timp cu un caracter cifr a). n
total vor fi
26
6
+26
5
10+26
4
10
2
+26
3
10
3
+26
2
10
4
+2610
5
+10
6
= 501 363 136.
Num arul cazurilor favorabile evenimentului A este
526
5
+526
4
10+526
3
10
2
+526
2
10
3
+52610
4
+510
5
= 96 223 680.
Deci
P(A) =
96 223 680
501 363 136
=
1503 495
7833 799
= 0.19192.
Num arul cazurilor favorabile evenimentului B este
26
5
5+26
4
105+26
3
10
2
5+26
2
10
3
5+2610
4
5+10
5
5 = 96 223 680.
Deci
P(B) = P(A) = 0.19192.
Evenimentul AB const a n faptul c a parola ncepe cu o vocal a si
se termin a cu o cifr a par a. Num arul cazurilor favorabile evenimentului
A B este
526
4
5+526
3
105+526
2
10
2
5+52610
3
5+510
4
5 = 18 408 400.
Avem acum
P(A B) =
18 408 400
501 363 136
=
1150 525
31 335 196
= 0.036717.
Evenimentele A si B nu sunt incompatibile, deoarece exist a parole
care s a nceap a cu o vocal a si s a se termine cu o cifr a par a. Avem
P(A B) = P(A) +P(B) P(A B) =
= 0.19192 + 0.19192 0.036717 = 0.34712.
III. Formula probabilit atii totale.
Fie {F,, P} un cmp de probabilitate, {A
1
, A
2
, . . . , A
n
}, A
i
F,
i = 1, n, un sistem complet de evenimente si B un eveniment oarecare,
B F. Atunci
P(B) =
n
P
i=1
P(A
i
)P(B|A
i
). (1.9)
ntr-adev ar, deoarece =
n
S
i=1
A
i
putem scrie
B = B = B
n
[
i=1
A
i
=
n
[
i=1
(B A
i
).
Deoarece pentru i 6= j, A
i
A
j
= , rezult a c a
P(B) =
n
X
i=1
P(B A
i
) =
n
X
i=1
P(A
i
)P(B|A
i
).
Problema 1.4. Un student cunoa ste bine 10 bilete din cele 25 de
bilete propuse la examen. Cnd studentul va avea mai multe sanse s a
ia examenul, dac a va fi primul sau dac a va fi al doilea la extragerea
biletului?
Rezolvare. Dac a studentul va fi primul la extragerea biletului, atunci
probabilitatea ca s a extrag a un bilet "norocos" este p
1
=
10
25
= 0.4.
Presupunem c a studentul va fi al doilea la extragerea biletului. Bile-
tul extras de prima persoan a poate fi "norocos" sau nu. Not am aceste
evenimente cu A
1
, respectiv A
2
. Fie B evenimentul c a studentul ex-
trage un bilet "norocos". Cum B = (A
1
B) (A
2
B), rezult a c a
p
2
= P (B) = P (A
1
) P (B | A
1
) +P (A
2
) P (B | A
2
) =
=
10
25

9
24
+
15
25

10
24
=
10 24
25 24
=
10
25
= 0.4.
Deci sansele sunt egale.
IV. Formula lui Bayes.
Fie {F,, P} un cmp de evenimente si {A
1
, A
2
, . . . , A
n
}, A
i
F,
i = 1, n un sistem complet de evenimente si B un eveniment oarecare.
Atunci
P(A
i
|B) =
P(B|A
i
)P(A
i
)
n
P
i=1
P(A
j
)P(B|A
j
)
. (1.10)
n conditiile date prin ipotez a are loc formula probabilit atii totale
si, tinnd seama de (1.3), obtinem
P(A
i
|B) =
P(B A
i
)
P(B)
=
P(B|A
i
)P(A
i
)
n
P
i=1
P(A
j
)P(B|A
j
)
.
Problema 1.5. S a presupunem c a sistemul de detec tie a unei ba-
terii poate sesiza gre sit prezen ta unei tinte (de ex. un avion inamic)
cu probabilitatea de 0.05, iar prezen ta real a a tintei este detectat a de
sistem cu probabilitatea 0.9. Presupunnd c a probabilitatea apari tiei
unei tinte n zona sistemului este 0.25, s a se determine probabilitatea
unei alarme false la primirea de c atre sistem a unui semnal relativ la
prezen ta unei tinte.
Rezolvare. Not am cu A
1
evenimentul care const a n prezenta real a
a tintei, cu A
2
evenimentul care const a n absenta tintei iar cu B
evenimentul care const a n detectarea unui semnal.
Atunci P(A
1
) = 0.25, P(A
2
) = P(A
1
) = 0.75, P(B|A
1
) = 0.9,
P(B|A
2
) = 0.05. Probabilitatea cerut a, conform formulei lui Bayes,
este
P(A
2
|B) =
P(B|A
2
)P(A
2
)
P(B|A
1
)P(A
1
) +P(B|A
2
)P(A
2
)
=
=
0.05 0.75
0.25 0.9 + 0.75 0.05
= 0.142 86.
D am n continuare cteva exemple n care nu este o multime
finit a si exemplific am modul n care definim functia de probabilitate.
Fie = [0, 1]. Putem considera F ca fiind format din , , toate
submultimile finite de puncte din , subintervale, reunuini finite sau
num arabile de intervale, complementarele lor etc. Pentru orice punct
definim P() = 0 si pentru orice subinterval [a, b] , punem
P([a, b]) = b a, lungimea intervalului.
Fie R
2
o multime fixat a avnd arie nenul a notat a cu ().
Not am cu F multimea p artilor lui care au arie finit a si definim
P(A) =
(A)
()
. Tripletul {F,, P} este un cmp de probabilitate si se
numeste cmp de probabilit a ti geometrice pe .
D am un exemplu care s a justifice studiul unor astfel de cmpuri
de probabilitate.
Exemplul 1.1. Dou a persoane A si B au decis s a se ntlneasc a ntre
orele 12 si 13 ntr-un anumit loc, venind independent. n plus ele au
f acut conventia ca primul venit s a-l astepte pe cel alalt 15 minute (sfer-
tul academic) si dac a acesta nu vine, s a plece. Care este probabilitatea
ca persoanele respective s a se ntlneasc a?
Figura 1.3.
Rezolvare. Notnd cu x (respectiv y)
momentul sosirii lui A (respectiv B) la
locul de ntlnire, considernd ora 12 ca -
ind 0 si ora 13 ca ind 1, avem 0 x 1,
0 y 1. Lu am = [0, 1] [0, 1]
si F multimea submultimilor avnd arie.
Atunci evenimentul care const a n ntl-
nirea celor dou a persoane, pe care l not am
cu I, va fi I =

(x, y) | |x y|
1
4
. Multimea I este notat a n figura

al aturat a.
Probabilitatea de realizare a ntlnirii va fi
P(I) =
(I)
()
=
1 2
3
4

3
4
2
1
=
7
16
= 0.4375.
1.4 Metode de num arare
Calculul probabilit atilor conduce adesea la num ararea diferitelor
cazuri posibile. Capitolul din algebr a referitor la permut ari, aranja-
mente si combin ari este foarte util n aceast a situatie.
Principiul multiplic arii. Presupunem c a avem dou a situatii
A si B, situatia A se poate realiza n m moduri, iar situatia B n k
moduri. Num arul de moduri n are se poate realiza A si B este mk.
Mai general, presupunem c a avem r 2 situatii. n prima situatie
putem face m
1
alegeri, n a doua m
2
,. . . , n a r-a situatie m
r
alegeri,
deci n total m
1
m
2
m
r
.
Exemplul 1.2. Care este num arul situatiilor care apar aruncnd dou a
zaruri? Pentru primul zar sunt 6 situatii, pentru al doilea 6 situatii,
n total 6 6 = 36 situatii.
n continuare vom face distinctie ntre o multime cu o ordine de-
terminat a de dispunere a elementelor sale, numit a multime ordonat a
si o multime n care nu ne intereseaz a ordinea elementelor.
Permut ari. Fie o multime A cu n elemente. Elementele acestei
multimi se pot ordona n mai multe moduri. Fiecare multime ordo-
nat a care se formeaz a cu cele n elemente ale multimii A se numeste
permutare a elementelor acelei multimi. Num arul permut arilor cu n
elemente este n! = 1 2 n. Acest rezultat se obtine din prin-
cipiul multiplic arii. O permutare poate fi construit a prin selectarea
elementului plasat pe prima pozitie, selectare care se face dintre cele
n elemente, apoi selectarea elementului plasat pe a doua pozitie din-
tre cele n 1 elemente r amase, apoi selectarea elementului plasat pe
a treia pozitie dintre cele n 2 elemente r amase, etc.
Dac a din aceste n elemente n
1
sunt identice de un anumit tip, n
2
sunt identice de alt tip,. . . , n
k
sunt identice de alt tip atunci se pot
forma
n!
n
1
!n
2
! n
k
!
(1.11)
n-uple distincte.
Aranjamente. Fie o multime A cu n elemente. Submultimile
ordonate ale lui A, avnd fiecare cte k elemente, 0 k n, se
numesc aranjamente de n luate cte k. Num arul aranjamentelor de n
luate cte k se noteaz a
A
k
n
= n(n 1) (n k + 1) .
Si acest rezultat se obtine din principiul multiplic arii. O sub-
multime poate fi construit a prin selectarea elementului plasat pe prima
pozitie, selectare care se face dintre cele n elemente, apoi selectarea
elementului plasat pe a doua pozitie dintre cele n1 elemente r amase,
apoi selectarea elementului plasat pe a treia pozitie dintre cele n 2
elemente r amase etc, elementul de pe pozitia k va fi selectat din cele
n k + 1 elemente r amase.
Exemplul 1.3. O companie foloseste parole pentru a deschide usile
unor birouri, cabinete etc. Cte parole diferite sunt posibile dac a:
Problema 1.6. a) parola este format a din patru caractere selectate
din literele E, X, A, M.
b) parola este format a din patru caractere selectate din literele M,
A, X, A.
c) parola este format a din patru caractere selectate din cifrele 0, 1,
2,. . . , 9.
Rezolvare. a) Num arul parolelor formate din patru caractere selec-
tate din literele E, X, A, M este 4! = 24 deoarece sunt patru moduri de
a alege prima liter a, trei moduri de a alege a doua liter a, dou a moduri
de a alege a treia liter a si numai un mod de a alege ultima liter a.
b) Num arul parolelor distincte se calculeaz a folosind formula (1.11),
4!
2!
= 12.
c) Num arul parolelor formate din cifrele 0, 1, 2,. . . , 9 este num arul
de aranjamente de 10 luate c ate 4, adic a A
4
10
= 10 9 8 7 = 5040.
Combin ari. Fie o multime A cu n elemente. Submultimile lui A
avnd fiecare cte k elemente, 0 k n, n care nu ne intereseaz a
ordinea elementelor, se numesc combin ari de n luate cte k. Num arul
combin arilor de n luate cte k se noteaz a
C
k
n
=
A
k
n
k!
.
Exemplul 1.4. Pentru un joc, cinci fete si trei b aieti trebuie s a
formeze dou a echipe de cte patru persoane. n cte moduri se pot
forma echipele?
Rezolvare. Studiem n cte moduri se poate forma o echip a de 4
persoane, cealalt a formndu-se din copiii r amasi. Nu ne intereseaz a
num arul de fete sau de b aieti din grup a si nici ordinea lor, ci numai
num arul de grupe care se pot forma. Acest num ar este
C
4
5
+C
3
5
C
1
3
+C
2
5
C
2
3
+C
1
5
C
3
3
= C
4
8
= 70.
1.5 Moduri de selectare a elementelor
Presupunem c a o urn a contine m bile, numerotate de la 1 la m,
din care se extrag n bile n anumite conditii. Vom num ara, n fiecare
situatie, num arul cazurilor posibile. Evident n m.
1. Selectare cu ntoarcerea bilei extrase n urn a si ordonare.
Extragem n bile pe rnd, fiecare bil a ind pus a napoi n urn a
nainte de urm atorea extragere, nsemnnd num arul bilelor n or-
dinea n care apar (intereseaz a ordinea bilelor n n-uplul extras).
Evident c a pot exista si repetitii. Conform principiului multi-
plic arii, n care m
1
= m
2
= = m
n
= m, num arul n-uplurilor
este m
n
.
2. Selectare f ar a ntoarcerea bilei n urn a si cu ordonare.
Proced am ca si n cazul nti, dar dup a fiecare extragere bila
obtinut a este pus a la o parte, aceast a operatie fiind echivalent a
cu extragerea simultan a din urn a a n bile. Obtinem n-upluri
(a
1
, a
2
, . . . , a
n
). Nu pot exista repetitii. Regula de multiplicare
se aplic a astfel: pentru a
1
avem m posibilit ati, pentru a
2
avem
m1 posibilit ati,. . . ,pentru a
n
avem mn + 1 posibilit ati, n
total
m(m1) (mn + 1) = A
n
m
.
Caz particular: dac a m = n, atunci num arul cazurilor posibile
este n!.
3. Selectare cu ntoarcerea bilei n urn a si f ar a ordonare.
Extragem n bile, una dup a alta, fiecare ind repus a n urn a
nainte de a realiza urm atoarea extragere. Nu tinem seama
de ordinea bilelor n multimea format a. Pot exista si repetitii.
Num arul cazurilor posibile este C
n
n+m1
, deoarece ar fi ca si cum
am extrage simultan dintr-o urn a care contine n+m1 bile (nu-
merotate de la 1 la m, unele din ele putndu-se repeta) n bile,
f ar a s a ne intereseze ordinea. Dup a ultima extragere secvential a
n urn a vor r amne m1 bile.
4. Selectare f ar a ntorcerea bilei si f ar a ordonare.
Bilele sunt extrase una dup a alta, f ar a a pune bila extras a napoi;
este acelasi lucru cu a spune c a extragem n bile dintr-o dat a si
form am submultimi de n elemente, n total C
n
m
.
Caz particular. Determinarea num arului de permut ari a m =
= m
1
+ m
2
+ + m
r
elemente care se disting prin grupuri
de culori, adic a avem m
1
elemente de culoarea c
1
, m
2
elemente
de culoarea c
2
,. . . , m
r
elemente de culoarea c
r
. Culorile sunt
distincte, dar bilele de aceeasi culoare nu se disting ntre ele.
Num arul cazurilor posibile este: C
m
1
m
moduri de alegere a poz-
itiilor bilelor de culoare c
1
, C
m
2
mm
1
moduri de alegere a pozitiilor
bilelor de culoare c
2
,. . . , C
m
r
mm
1
m
r1
moduri de alegere a poz-
itiilor bilelor de culoarea c
m
(de fapt mm
1
m
2
m
r1
=
= m
r
si avem, de fapt, o singur a posibilitate); n total, tinnd
seama de regula multiplic arii,
C
m
1
m
C
m
2
mm
1
C
m
r
mm
1
m
r1
=
=
m!
m
1
!(mm
1
)!
(mm
1
)!
m
2
!(mm
1
m
2
)!

(mm
1
m
r1
)
m
r
!
=
=
m!
m
1
!m
2
! m
r
!
.
1.6 Scheme clasice de probabilitate
Schema lui Poisson. Se dau n urne U
1
, U
2
, . . . , U
n
care contin
bile albe si bile negre n proportii date, deci cunoastem probabilit atile
p
i
, i = 1, n, cu care este extras a o bil a alb a din urna U
i
. Se cere
probabilitatea de a extrage k bile albe si nk bile negre, atunci cnd
din fiecare urn a se extrage cte o bil a.
Not am cu A
i
evenimentul extragerii unei bile albe din urna U
i
.
Not am si B
k
evenimentul care const a n extragerea a k bile albe si
n k bile negre, adic a
B
k
= (A
1
A
k
A
k+1
A
n
)(A
1
A
k
A
k+1
A
k+2
A
n
)
(A
1
A
nk
A
nk+1
A
n
),
num arul parantezelor fiind C
k
n
. Un eveniment
A
i
1
A
i
k
A
i
k+1
A
in
se realizeaz a, tinnd seama c a evenimentele sunt independente, cu
probabilitatea
p
i
1
p
i
k
q
i
k+1
q
in
indicii i
1
, i
2
, . . . , i
n
reprezentnd o permutare a indicilor 1, 2, . . . , n, iar
litera p apare de k ori cu indici diferiti, iar q de n k ori cu indici
care nu apar n p. Se observ a c a dup a aceiasi regul a se calculeaz a
coeficientul lui x
k
din polinomul
P(x) = (p
1
x +q
1
)(p
2
x +q
2
) (p
n
x +q
n
).
Schema lui Poisson permite rezolvarea problemelor n care se cere pro-
babilitatea realiz arii de k ori a unor evenimente A
1
, A
2
, . . . , A
n
atunci
cnd se repet a de n ori aceste experiente, presupuse independente,
cnd cunoastem P(A
i
) = p
i
, i = 1, n.
Conditii ale unui experiment Poisson:
1. Exist a n efectu ari n conditii diferite ale unui experiment.
2. Fiecare experiment are exact dou a rezultate posibile.
3. Probabilit atile celor dou a rezultate sunt diferite pe parcursul
repet arilor.
4. Repet arile sunt independente una de cealalt a.
Problema 1.7. ntr-un atelier sunt trei ma sini. Prima d a 0.9% rebut,
a doua 1% si a treia 1.3%. Se ia la ntmplare cte o pies a de la
fiecare ma sin a. Se cere probabilitatea ca dou a din piese s a fie bune si
una rebut.
Rezolvare. Avem
p
1
= 0.991, q
1
= 0.009, p
2
= 0.99,
q
2
= 0.01, p
3
= 0.987, q
3
= 0.013,
.
P(x) = (0.991x + 0.009)(0.99x + 0.01)(0.987x + 0.013).
Coeficientul lui x
2
este
0.9910.990.013+0.990.9870.9870.009+0.9910.9870.01 = 0.0313.
Schema lui Bernoulli. Presupunem c a n schema lui Poisson
urnele U
1
, U
2
,. . . , U
n
sunt identice. Atunci putem lua
p
1
= p
2
= = p
n
= p, q
1
= q
2
= = q
n
= q
Probabilitatea extragerii a k bile albe se va obtine calculnd coecien-
tul lui x
k
din polinomul
P(x) = (px +q)
n
,
adic a va fi C
k
n
p
k
q
nk
. Recunoastem n aceast a expresie termenul gene-
ral al ridic arii la puterea n a binomului px + q. Pentru acest mo-
tiv schema se mai numeste binomial a. Deoarece urnele sunt identice,
putem considera c a toate extragerile se fac dintr-o singur a urn a, bila
extras a punndu-se n urn a dup a fiecare extragere. Obtinem astfel
schema lui Bernoulli. Probabilitatea de a extrage k bile albe din n
extrageri dintr-o urn a, punndu-se de fiecare dat a bila napoi, este
P
n,k
= C
k
n
p
k
q
nk
,
unde p este probabilitatea obtinerii unei bile albe dintr-o singur a ex-
tragere si q = 1p. Schema lui Bernoulli se mai numeste schema bilei
revenite (ntoarse).
Conditii ale unui experiment binomial:
1. Exist a n repet ari identice ale unui experiment.
2. Fiecare repetare are exact dou a rezultate posibile.
3. Probabilit atile celor dou a rezultate r amn constante pe parcur-
sul repet arilor.
4. Repet arile sunt independente una de cealalt a.
Problema 1.8. Se arunc a un zar de 5 ori. Se cere probabilitatea ca
fa ta cu un punct s a apar a exact de dou a ori.
Rezolvare. Avem p =
1
6
, q =
5
6
, n = 5, k = 2 si apoi
P
5,2
= C
2
5
1
6
5
6
3
= 0.16.
Schema lui Bernoulli cu mai multe st ari. Fie o urn a care
contine bile de m culori c
1
, c
2
, . . . , c
m
iar p
i
probabilitatea ca la o
extragere s a obtinem o bil a de culoarea c
i
. Probabilitatea ca n n
extrageri s a obtinem n
1
bile de culoarea c
1
, n
2
bile de culoarea c
2
,. . . ,
n
m
bile de culoarea c
m
(n
1
+n
2
+ +n
m
= n) este
n!
n
1
! n
2
! n
m
!
p
n
1
1
p
n
2
2
p
n
m
m
.
Aceast a schem a rezolv a problemele n care se cere probabilitatea ca
n n efectu ari ale experientei evenimentul A
i
s a se realizeze de n
i
ori,
A
1
, A
2
, . . . , A
m
ind un sistem complet de evenimente si P(A
i
) = p
i
,
i = 1, m. Presupunem c a n cele n efectu ari ale experientei s-au
obtinut succesiv
A
1
. . . A
1
| {z }
n
1
A
2
. . . A
2
| {z }
n
2
. . . A
m
. . . A
m
| {z }
nm
.
Acest eveniment se produce cu probabilitatea
p
1
p
1
| {z }
n
1
p
2
p
2
| {z }
n
2
p
m
p
m
| {z }
n
m
.
Acelasi rezultat l obtinem pentru orice alt a ordine stabilit a dinainte
n care A
i
apare de n
i
ori. R am ane s a vedem n cte moduri putem
scrie cele n simboluri, dintre care n
1
egale cu A
1
, n
2
cu A
2
,. . . , n
m
cu
A
m
:
C
n
1
n
C
n
2
nn
1
C
n
3
nn
1
n
2
C
n
m
nn
1
n
2
n
m1
=
=
n!
n
1
! (n n
1
)!
(n n
1
)!
n
2
! (n n
1
n
2
)!

(n n
1
n
m1
)!
n
m
! (n n
1
n
m
)!
=
=
n!
n
1
! n
m
!
.
Problema 1.9. Se arunc a un zar de 5 ori. Care este probabilitatea
ca exact de dou a ori s a apar a fa ta cu un punct si exact de 2 ori s a
apar a fa ta cu dou a puncte?
Rezolvare. Avem:
n = 5, n
1
= 2, n
2
= 2, n
3
= 1,
p
1
=
1
6
, p
2
=
1
6
, p
3
=
2
3
,
P
4,2,2,1
=
5!
2! 2! 1!
1
6
1
6
2
3
=
5
324
.
Schema hipergeometric a. O urn a contine a bile albe si b bile
negre. Din aceast a urn a se extrag n bile (n a + b) pe rnd, f ar a a
pune bila extras a napoi n urn a (ceea ce este echivalent cu a extrage
n bile deodat a). Se cere probabilitatea ca din cele n bile extrase, k
s a fie albe (k a) si n k negre (n k b). Pentru a calcula
acest a probabilitate vom stabili num arul cazurilor posibile si num arul
cazurlor favorabile.
Num arul cazurilor posibile este C
n
a+b
.
Num arul cazurilor favorabile: un grup de k bile albe dintr-un total
de a bile albe poate fi luat n C
k
a
moduri; un grup de n k bile negre
din totalul de b bile negre poate fi obtinut n C
nk
b
moduri. Un grup
de k bile albe si nk bile negre poate fi obtinut, conform principiului
multiplic arii, n C
k
a
C
nk
b
moduri. Probabilitatea c autat a este
C
k
a
C
nk
b
C
n
a+b
.
Exemplul 1.5. Controlul de calitate. Presupunemc a ntr-o cutie sunt
550 de piese, din care 2% sunt defecte. Care este probabilitatea ca
alegnd 25 de piese, acestea s a contin a dou a piese defecte. Acesta
este principiul test arii produselor prin selec tii aleatoare.
Rezolvare. Spatiul de selectie este format din multimea grupelor de
cte 25 de piese care se pot forma cu cele 550 piese (un rezultat posibil
al experientei este o grupare de 25 de piese, iar un rezultat favorabil
este o grupare de 25 de piese dintre care 2 piese s a fie defecte). Putem
alege cele 25 piese dintre cele 550, f ar a s a ne intereseze ordinea pieselor,
n C
25
550
moduri. Cte din acestea vor contine 2 piese defecte? Putem
alege cele 2 piese defecte, din cele 550 0.02 = 11, n C
2
11
moduri,
iar celelalte 25 2 = 23 piese, care nu sunt defecte, n C
23
439
moduri.
Probabilitatea c autat a va fi
C
2
11
C
23
439
C
25
550
= 0.00059.
Problema 1.10. La o tombol a sunt 400 bilete dintre care 4 c stig a-
toare. O persoan a cump ar a 10 bilete. Care este probabilitatea s a nu
se g aseasc a nici un bilet c stig ator?
Rezolvare. Avem a = 4, b = 396, k = 0, n k = 10, n = 10,
p =
C
0
4
C
10
396
C
10
400
= 0.903.
n general, dac a urna contine a
i
bile de culoarea c
i
, i = 1, m, proba-
bilitatea de a obtine n
1
bile de culoarea c
1
, n
2
bile de culoarea c
2
,. . . ,
n
m
bile de culoarea c
m
cnd facem n = n
1
+ n
2
+ + n
m
extractii,
este egal a cu
C
n
1
a
1
C
n
2
a
2
. . . C
n
m
am
C
n
a
1
+a
2
++am
.
Problema 1.11. O urn a con tine 7 bile albe, 7 bile negre si 6 verzi.
Se extrag 9 bile. Care este probabilitatea s a ob tinem cte 3 de fiecare
culoare?
Rezolvare. Avem a
1
= 7, a
2
= 7, a
3
= 6, n
1
= 3, n
2
= 3, n
3
= 3,
p =
C
3
7
C
3
7
C
3
6
C
9
20
= 0.145.
1.7 Probleme rezolvate
Problema 1.12. Fie A, B, C trei evenimente. S a se scrie expresia
pentru evenimentul ce const a n:
a) producerea numai evenimentului A;
b) producerea unui singur eveniment;
c) producerea a doar dou a evenimente;
d) producerea tuturor celor trei evenimente;
e) producerea a cel pu tin unui eveniment;
f) producerea a cel mult dou a evenimente.
Rezolvare. a) A B C;
b)

A B C
B C A
C A B
;
c)

A B C
B C A
C A B
;
d) A B C; e) A B C; f) A B C.
Problema 1.13. Fie A, B, C trei evenimente ( spa tiul
de selec tie). S a se determine care dintre urm atoarele afirma tii sunt
adev arate:
a) A B C (A B) (B C) (C A);
b) A B = A B;
c) A B C = A B C;
Rezolvare. a) Evenimentul A B C const a n producerea oric arui
eveniment contrar producerii simultane a evenimentelor A, B si C.
Pe de alt a parte, evenimentul (A B) (B C) (C A) const a n
producerea oric aror dou a evenimente din cele trei si nu este exclus a nici
producerea simultan a a tuturor trei, adic a a evenimentului ABC.
Deci afirmatia este fals a.
b) Dac a s-a produs evenimentul A B, nseamn a c a s-a produs
contrarul lui A sau contrarul lui B, deci se poate produce A, dac a nu
contrazice B sau se poate produce B, dac a nu contrazice A. Pe de
alt a parte, dac a se produce evenimentul A B, nseamn a c a nici A,
nici B nu se pot produce. Afirmatia este fals a.
c) Evenimentele A B C si ABC sunt egale deoarece, ambele
exclud producerea oric arui dintre evenimentele A, B sau C si sunt
favorabile producerii oric arui alt eveniment. Afirmatia este adev arat a.
Problema poate fi rezolvat a si grafic. De exemplu la punctul a)
avem
Figura 1.4.
Problema 1.14. Care este probabilitatea c a, la aruncarea a dou a
zaruri, produsul cifrelor este 6?
Rezolvare. Un rezultat posibil al experientei este o pereche de dou a
cifre format a din cifrele 1, 2, 3, 4, 5, 6. Spatiul de selectie este
= {(1, 1) , (1, 2) , . . . , (1, 6) , (2, 1) , . . . , (6, 6)}. Num arul cazurilor
posibile este 6 6 = 36. Cazurile favorabile sunt: (1, 6), (2, 3), (3, 2),
(6, 1). Deci probabilitatea evenimentului este p =
4
36
0.1111.
Problema 1.15. Care este probabilitatea ca la extragerea aleatoare a
trei c ar ti dintr-un pachet de c ar ti s a fie doi a si? Dar la extragerea a
patru c ar ti?
Rezolvare. ntr-un pachet de 52 de c arti sunt 4 asi. Trei c arti pot fi
extrase n C
3
52
=
52 51 50
3 2 1
= 22100 moduri, deci num arul cazurilor
posibile este 22100. Din 4 asi pot fi alesi 2 n C
2
4
=
4 3
2 1
= 6 moduri.
Din restul de 48 de c arti mai este aleas a una la ntmplare, deci sunt 48
de moduri. Prin urmare, num arul cazurilor favorabile este 648 = 288.
Probabilitatea evenimentului va fi p =
288
22100
0.01303. n al doilea
caz avem
p =
C
2
4
C
2
48
C
4
52
=
4 3
2 1

48 47
2 1
52 51 50 48
4 3 2 1
=
6 1128
270725
0.025.
Problema 1.16. Care este probabilitatea ca la mp ar tirea n dou a
p ar ti egale a unui pachet de c ar ti, n fiecare din cele dou a p ar ti s a fie
exact doi a si?
Rezolvare. Rationnd ca n problema precedent a obtinem
p =
C
2
4
C
26
48
C
26
52
=
6 27385657281648
495918532948104
0.3313.
Problema 1.17. De cte ori trebuie aruncate dou a monede, pentru
ca probabilitatea apari tiei a dou a steme s a fie cel pu tin 0.98.
Rezolvare. Probabilitatea ca la aruncarea a dou a monezi sa nu apar a
dou a steme este 1
1
4
=
3
4
. La aruncarea de n ori a celor dou a
monezi, probabilitatea ca s a nu apar a cele dou a steme este

3
4
n
.
Deci la n arunc ari evenimentul "aparitia a dou a steme" se produce cu
probabilitatea 1
3
4
n
. Obtinem inecuatia 1
3
4
n
0.98, de
unde n
ln0.02
ln0.75
13.6. Deci num arul minim de arunc ari este 14.
Problema 1.18. Care este probabilitatea de a ghici 0, 1, 2, 3, 4, 5, 6
dintre numerele "norocoase" la loto 6/49?
Rezolvare. S a not am cu n num arul de numere ghicite, deci 6 n
numere nu vor fi ghicite. Vor exista C
n
6
modalit ati de a ghici cele n
numere dintre cele 6 numere extrase la loto. De asemenea vor exista
C
6n
43
modalit ati de a selecta numerele necstig atoare r amase. Con-
form principiului multiplic arii vor exista C
n
6
C
6n
43
modalit ati de a se-
lecta cele n numere ghicite. Cum cele 6 numere cstig atoare pot fi
extrase n C
6
49
moduri, rezult a c a probabilitatea de a ghici n numere
este p
n
=
C
n
6
C
6n
43
C
6
49
, adic a
p
0
=
C
0
6
C
6
43
C
6
49
0.435965,
p
1
=
C
1
6
C
5
43
C
6
49
0.413094,
p
2
=
C
2
6
C
4
43
C
6
49
0.132378,
p
3
=
C
3
6
C
3
43
C
6
49
0.0176504
1
57
,
p
4
=
C
4
6
C
2
43
C
6
49
9.68620 10
4
1
1033
,
p
5
=
C
5
6
C
1
43
C
6
49
1.84499 10
5
1
54201
,
p
6
=
C
6
6
C
0
43
C
6
49
7.15112 10
8
1
13983816
.
Problema 1.19. S a se determine probabilitatea ca un num ar de dou a
cifre s a fie sau multiplu de 3, sau multiplu de 5, sau multiplu si de 3,
si de 5.
Rezolvare. Fie n num arul de dou a cifre. Atunci A = {n
.
.
. 3}, B =
{n
.
.
. 5}. Deoarece evenimentele A si B sunt compatibile, rezult a c a
P (A B) = P (A) +P (B) P (A B) .
Exist a 90 de numere de dou a cifre: 10, 11, 12, . . . , 99. Dintre ele 30
sunt multiple de 3, 18 sunt multiple de 5, iar 6 sunt multiple si de 3 si
de 5. Deci P (A) =
30
90
, P (B) =
18
90
, P (A B) =
6
90
. Probabilitatea
c autat a este
P (A B) =
30
90
+
18
90

6
90
=
42
90
0.4667.
Problema 1.20. O urn a con tine 4 bile albe si 5 bile negre. Din urn a
se extrag pe rnd dou a bile. Care este probabilitatea c a ambele bile
sunt albe?
Rezolvare. Fie A
1
evenimentul c a la prima extragere bila este alb a,
iar A
2
evenimentul c a la a doua extragere bila este alb a. Se cere s a
se calculeze P (A
1
A
2
). Deoarece P (A
1
A
2
) = P (A
1
) P (A
2
| A
1
),
rezult a c a
P (A
1
A
2
) =
4
9

4 1
9 1
=
4
9

3
8
=
1
6
0.1667.
Problema 1.21. Doi arca si trag simultan n aceea si tint a. Primul
atinge tinta cu probabilitatea de 0.82, iar al doilea cu probabilitatea
0.86. Care este probabilitatea c a tinta va fi lovit a?
Rezolvare. Fie A
i
evenimentul c a arcasul i atinge tinta. Avem
P (A
1
) = 0.82, P (A
2
) = 0.86. Remarc am c a evenimentele A
1
si A
2
sunt independente, deci P (A
1
A
2
) = P (A
1
) P (A
2
). Probabilitatea
ca tinta s a fie lovit a este
P (A
1
A
2
) = P (A
1
) +P (A
2
) P (A
1
A
2
) =
= P (A
1
) +P (A
2
) P (A
1
) P (A
2
) =
= 0.82 + 0.86 0.82 0.86 = 0.9748.
Problema 1.22. Fiabilitatea a dou a p ar ti componente ale unui sistem
este 0, 9, respectiv 0, 8. Care este probabilitatea c a: a) se defecteaz a
doar prima component a; b) ambele componente.
Rezolvare. Fie evenimentele: A = {s-a defectat prima component a},
B = {s-a defectat a doua component a}. Avem P (A) = 1 0.9 = 0.1,
P (B) = 10.8 = 0.2. Se cere s a se determine P

A B
si P (A B).
Avem
P

A B
= P (A) P

B
= 0.1 0.8 = 0.08.

P (A B) = P (A) P (B) = 0.1 0.2 = 0.02.
Problema 1.23. Probabilitatea ca un calculator si o imprimant a s a
func tioneze f ar a s a se defecteze n primul an de func tionare este de
0.95 si respectiv 0.60. Presupunnd c a evenimentele sunt indepen-
dente, s a se calculeze probabilit a tile ca n decurs de un an
a) ambele s a se defecteze,
b) imprimanta s a se defecteze iar calculatorul nu,
c) numai unul din ele s a se defecteze,
d) ambele s a nu se defecteze,
e) m acar unul din ele func tioneaz a f ar a s a se defecteze.
Rezolvare. Fie evenimentele:
A = {calculatorul nu se defecteaz a n primul an} ,
B = {imprimanta nu se defecteaz a n primul an} .
Se cere s a se determine probabilit atile urm atoarelor evenimente:
a) AB, b) AB, c)

A B
A B
, d) AB, e) AB.
Tinnd seama c a evenimentele A si B sunt independente, vom
obtine:
a) P(A B) = P(A)P(B) = (1 P(A))(1 P(B)) =
= 0.05 0.4 = 0.02;
b) P(A B) = P(A)P(B) = P(A)(1 P(B)) =
= 0.95 0.4 = 0.38;
c) P

A B
A B
= P

A B
+P

A B
=
= P(A)P(B) +P(A)P(B) =
= P(A)(1 P(B)) + (1 P(A))P(B) =
= 0.95 0.4 + 0.05 0.6 = 0.41;
d) P(A B) = P(A)P(B) = 0.95 0.6 = 0.57;
e) P (A B) = P (A) +P (B) P (A B) =
= 0.95 + 0.6 0.95 0.6 = 0.98.
Problema 1.24. Trei strunguri produc un anumit tip de piese. 0.2%
din piesele produse de primul strung, 0.3% din piesele produse de al
doilea strung si 0.4% din piesele produse de al treilea strung sunt de-
fecte. S a se determine probabilitatea ca o pies a extras a dintr-un lot,
compus din 1000 de piese produse de primul strung, 2000 piese pro-
duse de al doilea strung si 3000 piese produse de al treilea strung, s a
fie defect a.
Rezolvare. Fie A
i
evenimentul c a piesa defect a a fost produs a de
strungul i. Avem P (A
1
) =
1000
1000 + 2000 + 3000
=
1
6
, P (A
2
) =
2000
6000
=
1
3
, P (A
3
) =
3000
6000
=
1
2
. Fie B evenimentul c a piesa ex-
tras a este defect a. Deci P (B | A
1
) = 0.002, P (B | A
2
) = 0.003,
P (B | A
3
) = 0.004. Deoarece A
1
, A
2
, A
3
formeaz a un sistem com-
plet de evenimente si B = (A
1
B) (A
2
B) (A
3
B), rezult a
c a
P (B) = P (A
1
) P (B | A
1
) +P (A
2
) P (B | A
2
) +P (A
3
) P (B | A
3
) =
=
1
6
0.002 +
1
3
0.003 +
1
2
0.004 0.00333.
Problema 1.25. Probabilitatea ca creditul luat de la banc a de c atre
persoane fizice s a fie returnat, este de 0.99 la primul credit, 0.95 la
al doilea credit si 0.85 la cel de-al treilea credit. Stiind c a 60% din
persoane au luat un singur credit, 30% au luat dou a credite si 10%
au luat trei credite, care este probabilitatea ca un credit emis de c atre
banc a s a fie returnat?
Rezolvare. Fie A
1
, A
2
, A
3
evenimentele c a creditul solicitat este
primul, al doilea, respectiv al treilea credit solicitat de persoana dat a,
B evenimentele c a creditul este returnat. AvemP (A
1
) = 0.6, P (A
2
) =
0.3, P (A
3
) = 0.1, P (B | A
1
) = 0.99, P (B | A
2
) = 0.95, P (B | A
3
) =
0.85. Folosind formula probabilit atii totale obtinem
P (B) = 0.6 0.99 + 0.3 0.95 + 0.1 0.85 = 0.964.
Problema 1.26. Trei sec tii ale unei ntreprinderi fabric a acela si tip
de piese. Prima sec tie produce 40% din piese, a doua produce 45%,
iar a treia produce 15%. Sec tiile produc piese care corespund stan-
dardului de calitate n propor tie de 70%, 80%, respectiv 85%. Care
este probabilitatea ca o pies a oarecare s a fie conform a standardului de
calitate? Stiind c a piesa este conform a standardului de calitate, care
este probabilitatea s a fie produs a de prima sec tie? Dar de la a treia?
Rezolvare. Fie evenimente A
i
= {piesa este produs a la sectia i a
fabricii}, B = {piesa corespunde standardelor de calitate}. Avem
P (A
1
) = 0.4, P (A
2
) = 0.45, P (A
3
) = 0.15, P (B | A
1
) = 0.7,
P (B | A
2
) = 0.8, P (B | A
3
) = 0.85. Conform formulei probabilit atii
totale avem
P (B) = 0.4 0.7 + 0.45 0.8 + 0.15 0.85 = 0.7675.
Evenimentul ca piesa s a fie produs a de prima sectie, stiind c a ea
este conform a standardelor de calitate este A
1
| B. Folosind formula
lui Bayes obtinem:
P (A
1
| B) =
P (A
1
) P (B | A
1
)
P (B)
=
0.4 0.7
0.7675
= 0.36482
iar proobabitatea n cea de a doua situatie este:
P (A
3
| B) =
P (A
3
) P (B | A
3
)
P (B)
=
0.15 0.85
0.7675
= 0.16612.
Problema 1.27. Patru arca si trag n aceea si tint a. Probabilitatea ca
fiecare arca s s a loveasc a tinta este respectiv 0.8, 0.5, 0.4, 0.7. Dac a
tinta a fost lovit a de trei ori, care este probabilitatea c a al patrulea
arca s nu love ste tinta?
Rezolvare. Fie A
i
, i = 1, 4 evenimentul c a arcasul i nu loveste tinta,
B evenimentul c a tinta este lovit a de 3 ori. Calcul am probabilit atile c a
tinta a fost lovit a de trei dintre cei patru arcasi n fiecare din cazurile
posibile:
P (B | A
1
) = P

A
1
A
2
A
3
A
4
= P
A
1
A
2
A
3
P(A
4
) =
= 0.7 0.5 0.4 (1 0.8) = 0.028,
P (B | A
2
) = P

A
1
A
2
A
3
A
4
= P
A
1
P(A
2
)P
A
3
A
4
=
= 0.7 (1 0.5) 0.4 0.8 = 0.112,
P (B | A
3
) = P

A
1
A
2
A
3
A
4
= P
A
1
A
2
P(A
3
)P
A
4
=
= 0.7 0.5 (1 0.4) 0.8 = 0.168,
P (B | A
4
) = P

A
1
A
2
A
3
A
4
= P(A
1
)P
A
2
A
3
A
4
=
= (1 0.7) 0.5 0.4 0.8 = 0.048.
Acum calcul am probabilitatea cerut a
P (A
4
| B) =
P (A
4
) P (B | A
4
)
4
P
i=1
P (A
i
) P (B | A
4
)
=
=
0.3 0.048
0.2 0.028 + 0.5 0.112 + 0.6 0.168 + 0.3 0.048
=
=
0.0144
0.1768
0.08145.
Problema 1.28. n nou a urne se afl a cte 3 bile albe si 3 bile negre,
iar n a zecea se afl a 5 bile albe si o bil a neagr a. Din una din urne a
fost extras a o bil a. Dac a bila extras a este alb a, care este probabilitatea
c a ea a fost extras a din urna a zecea?
Rezolvare. Fie A
i
, i = 1, 10 evenimentul c a din urna i este extras a o
bil a, B evenimentul c a bila extras a este alb a. Avem deci P (A
i
) =
1
10
,
i = 1, 10, P (B | A
i
) =
3
3 + 3
=
1
2
, i = 1, 9 si P (B | A
10
) =
5
5 + 1
=
5
6
.
Conform formulei Bayes avem
P (A
10
| B) =
P (A
10
) P (B | A
10
)
10
P
i=1
P (A
i
) P (B | A
i
)
=
=
1
10

5
6
9
1
10

1
2
+
1
10

5
6
=
5
32
= 0.15625.
Problema 1.29. O moned a se arunc a de 10 de ori. Care este prob-
abilitatea ca stema s a apar a
a) de 4 pn a la 6 ori;
b) cel pu tin o dat a.
Rezolvare. Probabilitatea se va calcula conform schemei lui Bernoulli
P
n,k
= C
k
n
p
k
q
nk
, unde n este num arul de experiente (n = 10), k
num arul de aparitii al stemei, p este probabilitatea de aparitie a stemei
la o aruncare a monezii (p = 0.5), iar q este probabilitatea evenimen-
tului contrar, adic a a aparitiei valorii (q = 1 p = 0.5). Avem deci
P
10,k
= C
k
10

1
2
k

1
2
10k
=
C
k
10
2
10
. Obtinem urm atoarele probabilit ati:
P
10,0
=
C
0
10
2
10
=
1
1024
,
P
10,1
=
C
1
10
2
10
=
10
1024
, P
10,6
=
C
6
10
2
10
=
210
1024
,
P
10,2
=
C
2
10
2
10
=
45
1024
, P
10,7
=
C
7
10
2
10
=
120
1024
,
P
10,3
=
C
3
10
2
10
=
120
1024
, P
10,8
=
C
8
10
2
10
=
45
1024
,
P
10,4
=
C
4
10
2
10
=
210
1024
, P
10,9
=
C
9
10
2
10
=
10
1024
,
P
10,5
=
C
5
10
2
10
=
252
1024
, P
10,10
=
C
10
10
2
10
=
1
1024
,
a) Probabilitatea cerut a este P
10,4
+P
10,5
+P
10,6
=
672
1024
0.6563.
b) Probabilitatea cerut a este
P
10,1
+P
10,2
+ +P
10,10
= 1 P
10,0
=
1023
1024
0.9990.
Problema 1.30. La o tombol a sunt 100 de bilete dintre care 25 sunt
c stig atoare. Cte bilete trebuie cump arate pentru ca printre biletele
cump arate cu probabilitatea de 0.95 s a fie si cel pu tin un bilet c stig a-
tor?
Rezolvare. Fie n num arul de bilete cump arate, p probabilitatea ca
un bilet s a fie cstig ator (p =
25
100
= 0.25 q = 0.75). Probabilitatea
ca printre biletele cump arate s a fie cel putin unul cstig ator este P =
1 P
n,0
0.95. Avem
1q
n
0, 95 q
n
0.05 nln 0.75 ln0.05 n
ln 0.05
ln 0.75
10.4
Deci num arul minim de bilete este 11.
Problema 1.31. O ntreprindere are 100 de salaria ti. Ace stia pot
lua masa la cele dou a cantine ale ntreprinderii, iar probabilitatea de
a alege fiecare din ele este aceea si. Cte locuri trebuie s a aib a fiecare
cantin a pentru a putea deservi, cu probabilitatea de cel pu tin 0, 95, pe
to ti cei veni ti la cantin a.
Rezolvare. Avem n = 100, p = q = 0.5. Trebuie determinat k astfel
nct
k
P
i=0
P
n,i
=
k
P
i=0
C
i
n
p
i
q
ni
0.95. Urm atorul program n Matlab va
calcula k:
% numar minim locuri cantina
clear;
clc;
n=100;
p=0.5;
q=0.5;
P=0.95;
S=0;
for i=0:n
Pni=mfun(binomial,n,i)*pî*q^(n-i);
S=S+Pni;
if S>=P
k=i;
break
end
end
fprintf(%d,k);
Rulnd programul obtinem k = 58. Rulnd programul cu P =
0.99 obtinem k = 62. Deci, m arind num arul de locuri cu doar 4,
probabilitatea va creste pn a la 0.99.
Urm atorul program n Mathematica va calcula k. Comanda <<
StatisticsDiscreteDistributions deschide pachetul de distributii dis-
crete din Mathematica deoarece vom folosi distributia binomial a pen-
tru a calcula probabilit atile.
<<Statistics DiscreteDistributions
f[k_] := PDF[BinomialDistribution[100, 0.5], k]
S:=0
(i=0;Label[incep];S+=f[i];i++;
If[S<0.95,Goto[incep],
Print[i-1],Print[S]]);
58
0.955687
S:=0
(i=0;Label[incep1];S+=f[i];i++;
If[S<0.99,Goto[incep1],
Print[i-1],Print[S]]);
62
0.993984
Problema 1.32. S a se g aseasc a cel mai probabil num ar de apari tii al
fe tei "6" la aruncarea de 50 de ori a unui zar.
Rezolvare. Avem deci n = 50, p =
1
6
, q =
5
6
. Pentru a g asi k
0
astfel nct P
n,k
0
s a fie maxim a, vom folosi inegalitatea np q k
0

np + p. Avem deci
45
6
k
0

51
6
, adic a 7.5 k
0
8.5, de unde
rezult a k
0
= 8. Probabilitatea ca fata "6" s a apar a de 8 ori este
P
50,8
= C
8
50
1
6
8
5
42
6
42
0.1510.
Problema 1.33. Un test gril a con tine 10 intreb ari cu variantele de
r aspuns "da" sau "nu". Daca o persoan a va bifa aleator r aspunsurile,
care va fi num arul cel mai probabil de r aspunsuri corecte si care este
probabilitatea acestui eveniment?
Rezolvare. Procednd ca si n problema precedent a obtinem: n = 10,
p = q =
1
2
,
9
2
k
0

11
2
, adic a k
0
= 5. Probabilitatea ca num arul de
r aspunsuri corecte s a fie 5 este P
10,5
= C
5
10
1
2
10
=
63
256
0.2461.
Problema 1.34. Un zar este aruncat de 6 ori. Care este probabili-
tatea ca fiecare fa t a s a apar a exact o singur a dat a?
Rezolvare. Avem n = 6 num arul de arunc ari, k
1
= k
2
= =
k
6
= 1 num arul de aparitii al fetelor zarului si p
1
= p
2
= =
p
6
=
1
6
probabilitatea de aparitie a fiec arei fete. Conform generaliz arii
formulei lui Bernoulli avem
P
n,k
1
,k
2
,...,k
6
=
n!
k
1
!k
2
! k
6
!
p
k
1
1
p
k
2
2
p
k
6
6
= 6!
1
6
6
0.01543.
Problema 1.35. O urn a con tine o bil a alb a, una neagr a si una ro sie.
Din urn a se extrage cu revenire o bil a de 7 ori. Care este probabilitatea
ca bila alb a si cea neagr a s a fie extrase de cel pu tin 3 ori fiecare?
Rezolvare. Probabilitatea cerut a va fi egal a cu suma probabilit atilor
a trei evenimente: bilele alb a si neagr a apar de cte 3 ori, bila alba
apare de 4 ori si cea neagr a de 3 ori, bila alb a apare de 3 ori si cea
neagr a de 4 ori. Avem
P = P
7,3,3,1
+P
7,4,3,0
+P
7,3,4,0
=
=
7!
3!3!1!

1
3
3

1
3
3

1
3
1
+
7!
4!3!

1
3
4

1
3
3
+
7!
3!4!

1
3
3

1
3
4
=
=
7!
3!3!3
7
1 +
1
4
+
1
4
=
70
729
0.09602.
Problema 1.36. Dintr-o urn a ce con tine 100 de bile numerotate de
la 1 la 100 se extrag cu revenire 10 bile. Care este probabilitatea s a fie
extrase cel mult dou a bile cu numere multiple de 7? S a se simuleze pe
calculator experimentul.
Rezolvare. Din cele 100 de bile, 14 bile sunt numerotate cu numere
multiple de 7. Deci probabilitatea ca la o extragere s a fie extras a o
astfel de bil a este p =
14
100
. Probabilitatea ca s a fie extrase cel mult 2
bile este
P = P
10,0
+P
10,1
+P
10,2
=
= C
0
10
p
0
(1 p)
10
+C
1
10
p
1
(1 p)
9
+C
2
10
p
2
(1 p)
8
=
= 0.2213 + 0.3603 + 0.2639 = 0.8455.
Urm atorul program simuleaz a acest experiment. Pentru a obtine
o estimare a probabilit atii, experimentul se simuleaz a de un numar de
ori. Probabilitatea evenimentului se aproximeaz a cu frecventa rela-
tiv a de producere a evenimentului ntr-un num ar mare de simul ari ale
experimentului.
% Schema lui Bernoulli
% Probabilitatea aparitiei a cel mult doua bile
% cu numere multiple de 7
clear;
clc;
n_ex=10000;
n_ar=10;
p=14/100;
q=1-p;
ne=0;
for i1=1:n_ex
nb=0;
for i2=1:n_ar
bila=floor(rand*100)+1;
if floor(bila/7)==bila/7
nb=nb+1;
end
end
if nb<=2
ne=ne+1;
end
end
fprintf(frecventa relativa =%g,ne/n_ex);
Rulnd de mai multe ori acest program obtinem estim ari ale pro-
babilit atii evenimentului cum ar fi: 0.8444, 0.8475, 0.8443, 0.8451 etc.
Aceeasi secvent a realizat a cu Mathematica
<<StatisticsDiscreteDistributions
f[k_]:=PDF[BinomialDistribution[10, 0.14],k]
f[0]+f[1]+f[2]
0.84547
ndlist=BinomialDistribution[1000, 0.14];
t1=Table[ Random[ndlist], {1000}];
(i=1;Label[inc];
t1[[i]]=t1[[i]]-7 IntegerPart[t1[[i]]/7];
i++;If[i<=1000,Goto[inc]])
test=Count[t1,0]
139
p1=N[test/1000]
0.139
fsim[k_]:=PDF[BinomialDistribution[10,p1],k]
N[fsim[0]+fsim[1]+fsim[2]]
0.847918
Dup a un studiu atent al acestui capitol trebuie retinute urm a-
toarele:
1. Notiunea de spatiu de selectie si eveniment atasate unei expe-
riente aleatoare.
2. Notiunea de probabilitate si calculul probabilit atii unui eveni-
ment dintr-un spatiu discret de selectie. Definitia probabilit atii
ntr-un cmp de evenimente.
3. Utilizarea principiului multiplic arii, a permut arilor, a aranja-
mentelor si combin arilor pentru a num ara cazurile posibile si
cazurile favorabile.
4. Determinarea incompatibilit atii evenimentelor si folosirea incom-
patibilit atii n calculul probabilit atii reuniunii a dou a evenimente.
5. Calculul probabilit atii unei reuniuni si intersectii de evenimente.
6. Interpretarea si calcularea probabilit atii conditionate.
7. Determinarea independentei evenimentelor si folosirea indepen-
dentei la calculul probabilit atii unei intersectii de evenimente.
8. Folosirea teoremei lui Bayes la rezolvarea unor probleme.
9. Folosirea formulei probabilit atii totale la rezolvarea unor prob-
leme.
Capitolul 2
Variabile aleatoare discrete
2.1 Definitia variabilei aleatoare
Una din notiunile fundamentele ale teoriei probabilit atilor este cea
de variabil a aleatoare. Teoria clasic a a probabilit atilor opereaz a, n
principal, cu evenimente, iar teoria modern a prefer a, unde este posibil,
s a studieze variabile aleatoare. Intuitiv, o variabil a aleatoare atribuie o
valoare numeric a oric arui caz posibil al experientei considerate. Prac-
tic toate m arimile zice, tehnice, economice, ntlnite n inginerie, sunt
variabile aleatoare.
Fie {F, , P} un cmp de probabilitate.
Definitia 2.1. Functia
X : R
se numeste variabil a aleatoare dac a
x R { | X() x} F. (2.1)
Aceast a definitie justific a afirmatia c a toate m arimile m asurabile
sunt variabile aleatoare. Pentru simplitate, vom nota
{ | X() x} = {X x}.
Observatia 2.1. Relatia { | X() < x} F semnific a de fapt
c a pentru orice x R se poate calcula probabilitatea ca X s a ia valori
mai mici sau egale cu x, adic a exist a P ({X x}).
Definitia 2.2. Se numeste vector aleator n-dimensional orice n-uplu
X = (X
1
, X
2
, . . . , X
n
) avnd cele n componente, X
1
, X
2
,. . . , X
n
, vari-
abile aleatoare.
43
44 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE
2.2 Variabile aleatoare discrete
Definitia 2.3. Fie {F, } este un cmp finit de evenimente. Orice
functie X : R este o variabil a aleatoare discret a.
Fie = {
1
,
2
, . . . }. Distributia unei variabile aleatoare discrete
X const a n descrierea probabilit atilor asociate valorilor posibile ale
lui X. Distributia este dat a de un tabel al tuturor valorilor posibile
ale variabilei aleatoare mpreun a cu probabilitatea cu care este luat a
fiecare valoare. Uneori este convenabil s a prezent am aceste probabili-
t ati cu ajutorul unor formule.
Notnd x
i
= X(
i
), i 1, valorile distincte, E
i
= { |
X() = x
i
} si p
i
= P(E
i
), se obtin toate valorile posibile ale lui X
precumsi probabilit atile cu care acestea sunt luate. Aceste evenimente
formeaz a un sistem complet de evenimente deoarece pentru i 6= j,
E
i
E
j
= si
S
i1
E
i
= . Evident 0 p
i
1 si
P
i1
p
i
= 1 deoarece
P
i1
p
i
=
P
i1
P(E
i
) = P(
S
i1
E
i
) = P() = 1.
Variabilei aleatoare X i se poate asocia o matrice cu dou a linii,
numit a matricea (tabloul) de reparti tie a lui X, de forma:
X :

x
1
x
2
. . . x
n
. . .
p
1
p
2
. . . p
n
. . .
(2.2)
unde pe prima linie sunt scrise valorile distincte ale lui X si pe linia a
doua probabilit atile cu care sunt luate aceste valori.
Trebuie retinut c a pentru o variabil a aleatoare prezint a interes doar
valorile ei si probabilit atile cu care sunt luate aceste valori.
Exemplul 2.1. O urn a contine 5 bile albe si 4 bile negre. Din urn a
se extrag 4 bile. Fie X variabila aleatoare care ia ca valori num arul
de bile albe extrase. S a se g aseasc a tabelul de repartitie a variabilei
aleatoare X.
Rezolvare. Variabila aleatoare X poate lua urm atoarele valori: 0, 1,
2, 3, 4. Probabilit atile cu care X ia aceste valori sunt:
p
0
= P (X = 0) =
C
0
5
C
4
4
C
4
9
=
1
126
, p
1
= P (X = 1) =
C
1
5
C
3
4
C
4
9
=
20
126
,
p
2
= P (X = 2) =
C
2
5
C
2
4
C
4
9
=
60
126
, p
3
= P (X = 3) =
C
3
5
C
1
4
C
4
9
=
40
126
,
p
4
= P (X = 4) =
C
4
5
C
0
4
C
4
9
=
5
126
.
CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 45
Tabloul de repartitie al variabilei aleatoare X este
X :
0 1 2 3 4
1
126
20
126
60
126
40
126
5
126
!
.
Observ am c a p
i
0 si
5
P
i=0
p
i
=
126
126
= 1.
Observatia 2.2. Dup a cum se vede denumirea de variabil a aleatoare
dat a acestei notiuni nu are nimic aleator, ea este perfect determinat a
de evenimentele lui . De asemenea ea nu este o variabil a ci este o
functie asa cum rezult a din definitie.
2.3 Functia de repartitie a v. a. discrete
n Exemplul 2.1 ne poate interesa probabilitatea de a se extrage,
de exemplu, cel putin trei bile albe, adic a P (X 3). Acest eveniment
este format din reuniunea evenimentelor {X = 0}, {X = 1}, {X = 2}
si {X = 3}. Evident, aceste evenimente sunt incompatibile. Atunci
P (X 3) = P (X = 0) +P (X = 1) +P (X = 2) +P (X = 3) =
=
1
126
+
20
126
+
60
126
+
40
126
=
121
126
.
Acest exemplu ne arat a c a uneori este util s a cunoastemP (X 3).
Pentru v. a. discrete cu valorile x
1
,. . . , x
n
,. . . evenimentele {X = x
1
},
. . . , {X = x
n
},. . . sunt incompatibile si deci
P (X x) =
P
x
i
x
P (X = x
i
) .
Definitia 2.4. Fie o v. a. discret a cu matricea de repartitie
X :

x
1
x
2
. . . x
n
. . .
p
1
p
2
. . . p
n
. . .
.
Definim func tia de reparti tie pentru v. a. discret a dat a, functia
F(x) = P (X x) =
P
x
i
x
P (X = x
i
) .
Functia de repartitie pentru v. a. discret a are urm atoarele pro-
priet ati:
1. 0 F(x) 1.
2. Dac a x y, atunci F(x) F(y).
Functia de repartitie pentru v. a. discret a cu un num ar finit de
valori este o functie scar a dat a de relatia:
F(x) =
_
_
0, dac a x < x
1
,
p
1
, dac a x
1
x < x
2
,
p
1
+p
2
, dac a x
2
x < x
3
,
.
.
.
p
1
+ +p
n1
, dac a x
n1
x < x
n
,
1, dac a x
n
x.
Graficul acestei functii este o functie scar a. n acest caz functia de
repartitie mai poate fi scris a F(x) =
n
X
i=1
p
i
(x x
i
), unde este
func tia treapt a unitate a lui Heaviside,
(x) =

1, x 0
0, x < 0.
Problema 2.1. Fie variabila aleatoare X cu valorile egale cu num arul
de puncte ob tinut la aruncarea unui zar. S a se calculeze si apoi s a se
reprezinte grafic func tia de reparti tie.
Rezolvare. Tabloul de repartitie al variabilei aleatoare X este
X :
1 2 3 4 5 6
1
6
1
6
1
6
1
6
1
6
1
6
!
.
Conform definitiei functiei de repartitie avem F (x) = P (X x).
Deci
F (x) =
_
_
0, x < 1
1/6, 1 x < 2
2/6, 2 x < 3
3/6, 3 x < 4
4/6, 4 x < 5
5/6, 5 x < 6
1, x 6
Graficul functiei de repartitie este reprezentat n figura 2.1.
Figura 2.1.
2.4 Operatii cu v. a. discrete
Date variabilele aleatoare discrete X si Y , cu ele se pot efectua ope-
ratiile aritmetice obisnuite. Presupunem c a avem tabelele de repartitie
ale celor dou a variabile aleatoare. Prezent am operatii cu v. a. n cazul
X () finit.
X :

x
1
x
2
. . . x
m
p
1
p
2
. . . p
m
, Y :

y
1
y
2
. . . y
n
q
1
q
2
. . . q
n
.
Variabila aleatoare X +Y ia valoarea x
i
+y
j
pe submultimea
{X +Y = x
i
+y
j
}.
Dac a {X +Y = x
i
+y
j
} = , variabila aleatoare X+Y ia valoarea
x
i
+y
j
cu probabilitatea zero si aceasta nu se trece n tabel.
Dac a not am P(X + Y = x
i
+ y
j
) = p
ij
, i = 1, m, j = 1, n atunci
tabelul de repartitie al variabilei aleatoare X +Y va fi
X +Y :

x
1
+y
1
x
1
+y
2
. . . x
1
+y
n
. . . x
m
+y
n
p
11
p
12
. . . p
1n
. . . p
mn
. (2.3)
Pentru produs vom avea
XY :

x
1
y
1
x
1
y
2
. . . x
1
y
n
. . . x
m
y
n
q
11
q
12
. . . q
1n
. . . q
mn
. (2.4)
unde P (XY = x
i
y
j
) = q
ij
, dac a P (XY = x
i
y
j
) 6= 0.
Observ am c a
n
X
j=1
p
ij
= p
i
,
m
X
i=1
p
ij
= q
j
, (2.5)
n
X
j=1
q
ij
= p
i
,
m
X
i=1
q
ij
= q
j
. (2.6)
ntr-adev ar,
p
i
= P (X = x
i
) = P ({X = x
i
} ) =
= P ({X = x
i
} ({Y = y
1
} {Y = y
n
})) =
=P(({X=x
i
} {Y =y
1
}) ({X=x
i
} {Y =y
n
}))=
n
P
j=1
p
ij
.
Analog se demonstreaz a si celelate relatii. n ambele cazuri tabelul
de repartitie are cel mult mn coloane.
Operatiile se extind si n cazul variabilelor aleatoare cu un num ar
infinit, dar num arabil, de valori.
Observatia 2.3. n cazul particular Y = a = const, deoarece p
ij
=
P (X = x
i
, Y = a) = P ({X = x
i
} ) = P (X = x
i
) = p
i
, avem:
a +X :

a +x
1
a +x
2
. . . a +x
m
p
1
p
2
. . . p
m
,
aX :

ax
1
ax
2
. . . ax
m
p
1
p
2
. . . p
m
.
Problema 2.2. Probabilitatea extragerii unei bile albe dintr-o urn a
este p. Din aceast a urn a se fac dou a extrageri, punndu-se bila napoi
n urn a dup a extragere. Se consider a variabilele aleatoare X
1
si X
2
,
prima reprezentnd num arul de bile albe ob tinute la prima extragere si
a doua num arul de bile albe de la a doua extragere. S a se scrie tabloul
de reparti tie al variabilelor aleatoare discrete X
1
, X
2
, X
1
+X
2
, X
1
X
2
.
Rezolvare. Dac a X
1
:

0 1
q p
, X
2
:

0 1
q p
, q = 1 p, atunci
X
1
+X
2
:

0 1 2
q
2
2pq p
2
deoarece
P(X
1
+X
2
= 0) = P(X
1
= 0, X
2
= 0) = P(X
1
= 0)P(X
2
= 0) = q
2
,
P(X
1
+X
2
= 1) = P({X
1
= 1, X
2
= 0} {X
1
= 0, X
2
= 1}) = 2pq,
P(X
1
+X
2
= 2) = P(X
1
= 1, X
2
= 1) = P(X
1
= 1)P(X
2
= 2) = p
2
,
P(X
1
+X
2
= 0) = P(X
1
= 0, X
2
= 0) = q
2
.
Interpretarea pe care o putem da variabilei aleatoare X
1
+X
2
este:
valorile variabilei aleatoare reprezint a num arul de bile albe care pot fi
extrase din urn a n urma celor dou a extrageri prezentate n enunt. La
fel,
X
1
X
2
:

0 1
2pq +q
2
p
2
,
deoarece
P (X
1
X
2
= 0) = P({X
1
= 0, X
2
= 0} {X
1
= 1, X
2
= 0)
{X
1
= 0, X
2
= 1}) = 2pq +q
2
,
P (X
1
X
2
= 1) = P(X
1
= 1, X
2
= 1) = p
2
.
Interpretarea pe care o putem da variabilei aleatoare X
1
X
2
este:
variabila ia valoarea 0 dac a s-a extras m acar o bil a neagr a (contrarul
evenimentului c a ambele bile extrase sunt albe) si valoarea 1 dac a am-
bele bile extrase sunt albe.
Definitia 2.5. Dou a v. a. X si Y se numesc independente dac a pentru
orice valori reale x
i
si y
j
evenimente de forma {X = x
i
} si {Y = y
j
},
i = 1, m, j = 1, n, sunt independente, adic a
P ({X = x
i
} {Y = y
j
}) = P (X = x
i
) P (Y = y
j
) .
2.5 Caracteristici numerice ale v. a. dis-
crete
Definitia 2.6. Fie o v. a. discret a X, avnd matricea de repartitie de
forma (2.2) pentru care seria
P
n1
x
i
p
i
este convergent a. n acest caz
definim media lui X
M [X] =
X
n1
x
i
p
i
= m,
iar dac a seria
P
n1
x
2
i
p
i
este convergent a definim momentul ni tial de
ordin doi
M

X
2
=
X
n1
x
2
i
p
i
Definitia 2.7. O v. a. discret a X, avnd matricea de repartitie de
forma (2.2) pentru care seria

P
i=1
(x
i
m)
2
p
i
este convergent a. n acest
caz definim dispersia
D[X] =
X
i1
(x
i
m)
2
p
i
.
Definitia 2.8. O v. a. discret a X, avnd matricea de repartitie de
forma (2.2) admite moment de ordin k dac a seria
P
n1
x
k
i
p
i
este conver-
gent a. n acest caz definim momentul ini tial de ordin k al lui X
M

X
k
=
X
n1
x
k
i
p
i
si momentul centrat de ordin k al v. a. X
M
h
(X M [X])
k
i
=
X
n1
(x
i
M [X])
k
p
i
.
Observatia 2.4. n cazul n care variabilele aleatoare au un num ar
finit de valori atunci toate caracteristicile numerice introduse se reduc
la sume finite. Rezult a c a orice v. a. cu un num ar finit de valori
admite, de exemplu, medie si dispersie.
Sintetiz am notiunile introduse n urm atorul tabel.
V. a. discrete cu V. a. discrete cu un nr. infinit
un nr. finit de val. num arabil de val.
Tabelul v. a.
X :

x
1
x
2
. . . x
n
p
1
p
2
. . . p
n
X :

x
1
x
2
. . . x
n
. . .
p
1
p
2
. . . p
n
. . .
Media Dac a

X
i=1
x
i
p
i
este conv.,
M [X] =
n
X
i=1
x
i
p
i
= m M [X] =

X
i=1
x
i
p
i
= m
Dispersia Dac a

X
i=1
(x
i
m)
2
p
i
este conv.
D[X] =
n
X
i=1
(x
i
m)
2
p
i
D[X] =

X
i=1
(x
i
m)
2
p
i
Alte caracteristici numerice
Momentul initial de ordin k Dac a

X
i=1
x
k
i
p
i
este convergent a
M

X
k
=
n
X
i=1
x
k
i
p
i
M

X
k
=

X
i=1
x
k
i
p
i
Momentul centrat de ordin k Dac a

X
i=1
(x
i
m)
k
p
i
este conv.
M
h
(X m)
k
i
=
n
X
i=1
(x
i
m)
k
p
i
M
h
(X m)
k
i
=

X
i=1
(x
i
m)
k
p
i
Observatia 2.5. Dispersia este momentul centrat de ordin doi.
Definitia 2.9. Se numeste abatere medie p atratic a =
p
D[X].
Problema 2.3. Demonstra ti c a
D[X] =
X
i1
x
2
i
p
i
X
i1
x
i
p
i
2
= M

X
2
[M [X]]
2
.
Rezolvare. ntr-adev ar,
D[X] =
n
X
i=1
(x
i
M [X])
2
p
i
=
=
n
X
i=1
x
2
i
p
i
2M [X]
n
X
i=1
p
i
x
i
+M [X]
2
=
= M

X
2
2M [X]
2
+M [X]
2
= M

X
2
(M [X])
2
.
Definitia 2.10. Variabila aleatoare X M[X] se numeste abaterea
de la medie a variabilei aleatoare X.
Exercitiul 2.1. Variabilele aleatoare discrete simple din Problema
2.2, X
1
si X
2
, avnd repartitiile:
X
1
, X
2
:

0 1
q p
,
au valoarea medie M[X
i
] = 1 p + 0 q = p, i = 1, 2, iar
X
1
+X
2
:

0 1 2
q
2
2pq p
2
, X
1
X
2
:

0 1
2pq +q
2
p
2

au media
M[X
1
+X
2
] = 2pq + 2p
2
= 2p, M[X
1
X
2
] = p
2
.
Calcul am si dispersiile:
M[X
2
i
] = p, D[X
i
] = p
2
p = pq,
M[(X
1
+X
2
)
2
] = 1
2
2pq + 2
2
p
2
,
D[X
1
+X
2
] = 2pq + 4p
2
4p
2
= 2pq,
D[X
1
X
2
] = M[(X
1
X
2
)
2
] (M[X
1
X
2
])
2
= p
2
p
4
= p
2
q
2
.
Observatia 2.6. Denumirea de medie este ndrept atit a dac a tinem
seama de sensul ei practic. Presupunem c a am repetat de N ori o
experient a care ne-a condus la variabila aleatoare X. Dac a valoarea
x
1
este luat a de n
1
ori, valoarea x
2
de n
2
ori,. . . , valoarea x
m
de n
m
ori,
unde n
1
+n
2
+ +n
m
= N, atunci suma valorilor luate de variabila
aleatoare X este n
1
x
1
+ n
2
x
2
+ + n
m
x
m
, iar media aritmetic a a
valorilor luate de X va fi
n
1
x
1
+n
2
x
2
+ +n
m
x
m
N
=
n
1
N
x
1
+
n
2
N
x
2
+ +
n
m
N
x
m
.
Dar
n
1
N
= p
1
reprezint a raportul dintre num arul cazurilor n care s-a
luat valoarea x
1
si num arul total de experiment ari, adic a p
1
. La fel
n
2
N
= p
2
,. . . ,
n
m
N
= p
m
. Media lui X ne arat a la ce valoare putem s a
ne astept am pentru media aritmetic a a unui mare num ar de valori ale
lui X, obtinute n urma repet arii experientei date.
2.5.1 Propriet ati ale mediei
1. Valoarea medie a unei variabile aleatoare care admite medie este
cuprins a ntre cea mai mic a si cea mai mare dintre valorile posi-
bile ale variabilei aleatoare. Fie a =inf
i
{x
i
} si A = sup
i
{x
i
}.
Atunci
M[X] =
X
i1
x
i
p
i
a
X
i1
p
i
= a,
M[X] =
X
i1
x
i
p
i
A
X
i1
p
i
= A,
_
_
a M[X] A.
2. Dac a X si Y sunt variabile aleatoare discrete care admit medie
atunci
M[X +Y ] = M[X] +M[Y ]
ntr-adev ar, folosind relatiile (2.5)
M[X+Y ] =
X
i1
X
j1
(x
i
+y
j
) p
ij
=
X
i1
x
i
X
j1
p
ij
+
X
j1
y
j
X
i1
p
ij
=
=
X
i1
x
i
p
i
+
X
j1
y
j
q
j
= M[X] +M[Y ].
3. Dac a X si Y sunt variabile aleatoare discrete independente, care
admit medie, atunci media produsului este egal a cu produsul
mediilor variabilelor considerate:
M[XY ] = M[X]M[Y ].
Fie
M[XY ] =
X
i1
X
j1
x
i
y
j
p
ij
.
Dac a variabilele sunt independente, se produc simplific ari im-
portante deoarece putem scrie p
ij
= p
i
q
j
si atunci
M[XY ] =
X
i1
X
j1
x
i
y
j
p
i
q
j
=
X
i1
x
i
p
i
X
j1
y
j
q
j
= M[X]M[Y ].
5. Dac a X este o variabil a aleatoare discret a care admite medie si
a R o constant a, atunci au loc relatiile:
M[a +X] = M [a] +M [X] = a +M[X],
M[aX] =
X
i1
(ax
i
) p
i
= aM[X].
Exercitiul 2.2. Media variabilei aleatoare XM[X], abaterea de la
medie, este nul a.
Rezolvare. ntr-adev ar, M [X M[X]] = M [X]M[X] = 0, tinnd
seama de Propriet atile 2 si 5.
2.5.2 Propriet ati ale dispersiei
1. Dispersia unei constante este nul a deoarece, tinnd seama de
propriet atile mediei, D[c] = M[c
2
] (M[c])
2
= 0.
2. D[aX] = a
2
D[X] deoarece
D[aX] = M

a
2
X
2
(M [aX])
2
=
= a
2
M[X
2
] (M [X])
2
= a
2
D[X].
3. Dac a variabilele aleatoare X
1
, X
2
, . . . , X
k
sunt independente,
atunci dispersia sumei este egal a cu suma dispersiilor.
D[X
1
+X
2
+ +X
k
] = D[X
1
] +D[X
2
] + +D[X
k
].
Demonstr am pentru dou a variabile aleatoare. ntr-adev ar, fie Y =
= X
1
+X
2
atunci
D[Y ] = M[Y
2
] (M[Y ])
2
= M[(X
1
+X
2
)
2
] (M[X
1
+X
2
])
2
=
= M[X
2
1
+X
2
2
+ 2X
1
X
2
] (M[X
1
] +M[X
2
])
2
=
= M[X
2
1
] +M[X
2
2
] + 2M[X
1
X
2
] (M[X
1
])
2
2M[X
1
]M[X
2
] (M[X
2
])
2
=
= M[X
2
1
] (M[X
1
])
2
+M[X
2
2
] (M[X
2
])
2
= D[X
1
] +D[X
2
]
Pentru n variabile demonstratia se face prin inductie.
4. Dou a variabile aleatoare care difer a printr-o constant a au dis-
persiile egale, adic a dac a X = Y +c atunci D[X] = D[Y ].
Mai general, combinnd Propriet atile 2 si 3, avem
D
"
k
X
i=1
a
i
X
i
#
=
k
X
i=1
a
2
i
D[X
i
].
n particular, D[X Y ] = D[X] +D[Y ].
Observatia 2.7. Exist a variabile aleatoare discrete cu un num ar in-
nit, dar num arabil, de valori care nu au medie (deci nici dispersie),
de exemplu dac a consider am v. a.
X :

1! 2! . . . n! . . .
1
2
1
2
2
. . .
1
2
n
. . .

seria
X
n1
n!
2
n
este divergent a conform criteriului raportului
lim
n
a
n+1
a
n
= lim
n
(n + 1)!
2
n+1
2
n
n!
= > 1.
Sintetiz am propriet atile mediei si dispersiei n urm atorul tabel:
Media Dispersia
1. Media constantei este 1. Dispersia constantei este
egal a cu constanta. zero.
X :

c
1
, M[X] = c X :

c
1
, D[X] = 0
2. Media sumei a dou a 2. Dac a v. a. sunt indepen-
v. a. este egal a cu dente atunci dispersia su-
suma mediilor. mei v. a. este suma disp.
M[X +Y ] = M[X] +M[Y ] D[X +Y ] = D[X] +D[Y ]
3. M[X +c] = M[X] +c 3. D[X +c] = D[X]
4. M[cX] = cM[X] 4. D[cX] = c
2
D[X]
5. Dac a v. a. sunt indepen- 5. Nu exist a o proprietate
dente atunci media produ- similar a pentru disp.
sului este egal a cu produ-
sul mediilor.
M[XY ] = M[X]M[Y ]
Ar at am c a dispersia unei variabile aleatoare X este, ntr-un anume
sens, cea mai bun a valoare care caracterizeaz a mpr astierea valorilor
x
1
, x
2
, . . . , x
n
sau, cu alte cuvinte, M[X] este punctul cel mai potrivit
fat a de care trebuie s a m asur am devierile acestor valori. Acest lucru
rezult a din urm atoarea propozitie.
Propozitia 2.1. Dac a X este o variabil a aleatoare care ia valorile
x
1
, x
2
, . . . , x
n
, . . . cu probabilit a tile p
1
, p
2
, . . . , p
n
, . . . , iar m este me-
dia, atunci
D[X] =
X
i1
p
i
(x
i
m)
2
X
i1
p
i
(x
i
x)
2
, x R.
Demonstratie. Putem scrie x
i
x = (x
i
m) + (mx), i = 1, n si
p
i
(x
i
x)
2
=
X
i1
p
i
[(x
i
m) + (mx)]
2
=
=
X
i1
p
i
(x
i
m)
2
+ 2(mx)
X
i1
p
i
(x
i
m) + (mx)
2
=
=
X
i1
p
i
(x
i
m)
2
+ 2(mx)(mm) + (mx)
2
=
= D[X] + (mx)
2
D[X].
Definitia 2.11. Fie X si Y dou a variabile aleatoare care admit medie
si dispersie. Covarian ta (sau corela tia) lui X si Y este num arul real
cov(X, Y ) = M [(X M [X]) (Y M [Y ])] .
n cazul n care cov(X, Y ) = 0 se spune c a X si Y sunt necorelate.
Covrianta m asoar a relatia dintre dou a variabile aleatoare.
Exemplul 2.2. Fie X o variabil a aleatoare cu D[X] > 0. Fie Y = 3X
si fie Z = 4X. Atunci M [Y ] = 3M [X] , M [Z] = 4M [X]. Atunci
cov(X, Y ) = M [(X M [X]) (Y M [Y ])] =
= M [(X M [X]) (3X 3M [X])] = 3M

(X M [X])
2
=
= 3D[X].
n timp ce
cov(X, Z) = M [(X M [X]) (Z M [Z])] =
= M [(X M [X]) (4X + 4M [X])] =
= 4M

(X M [X])
2
= 4D[X].
Observ a c a cov(X, Y ) > 0 n timp ce cov(X, Z) < 0. Intuitiv,
aceasta ne indic a faptul c a dac a cov(X, Y ) > 0 atunci Y creste, n
timp ce X creste si dac a cov(X, Z) < 0, Z descreste, n timp se X
creste.
Teorema 2.1. Fie X si Y dou a variabile aleatoare care admit medie.
Atunci:
a) cov(X, Y ) = M [XY ] M [X] M [Y ].
b) dac a X si Y sunt independente, atunci X si Y sunt necorelate.
Reciproca nu este adev arat a.
Demonstratie. a)
cov(X, Y ) = M [XY Y M [X] XM [Y ] +M [X] M [Y ]] =
= M [XY ] M [X] M [Y ] M [Y ] M [X] +M [X] M [Y ] =
= M [XY ] M [X] M [Y ] .
b) Dac a X si Y sunt independente, atunci
M[XY ] = M[X]M[Y ] cov(X, Y ) = 0.
Teorema 2.2. Fie X si Y dou a variabile aleatoare care admit medie
si dispersie. Atunci: D[X +Y ] = D[X] +D[Y ] + 2cov(X, Y ).
Demonstratie.
D[X +Y ] = M

(X +Y M [X +Y ])
2
=
= M

((X M [X]) + (Y M [Y ]))
2
=
= M

(X M [X])
2
+ (Y M [Y ])
2
+ 2 (X M [X]) (Y M [Y ])
=
= M

(X M [X])
2
+M

(Y M [Y ])
2
+
+2M [(X M [X]) (Y M [Y ])] = D[X] +D[Y ] + 2cov(X, Y ).
Problema 2.4. Demonstra ti proprietatea de liniaritate a covarian tei,
adic a fie X, Y si Z trei variabilae aleatoare si a, b R. Atunci:
cov(aX +bY, Z) = acov(X, Z) +bcov(Y, Y ).
O alt a notiune pe care o vom folosi la statistic a este coeficientul
de corelatie.
Definitia 2.12. Fie X si Y dou a variabile aleatoare cu 0 < D[X],
D[Y ] < . Coeficientul de corela tie este num arul real
r
X,Y
=
cov(X, Y )
p
D[X]
p
D[Y ]
.
Exemplul 2.3. Relu am Exemplul 2.2. Calcul am coecientii de core-
latie.
r
X,Y
=
cov(X, Y )
p
D[X]
p
D[Y ]
=
3D[X]
p
D[X]
p
9D[X]
= 1,
r
X,Z
=
cov(X, Z)
p
D[X]
p
D[Z]
=
4D[X]
p
D[X]
p
16D[Z]
= 1.
Intuitiv, aceasta ne indic a faptul c a dac a r
X,Y
> 0 atunci Y creste,
n timp ce X creste si dac a r
X,Z
< 0, Z descreste, n timp se X creste.
Remarc am c a factorii 3 si 4 dispar, ceea ce este esential este semnul.
Vom prezenta la statistic a dou a rezultate importante ale coecien-
tului de corelatie si anume:
1. |r
X,Y
| 1 echivalent a cu |cov(X, Y )|
p
D[X]
p
D[Y ] si
2. |r
X,Y
| = 1 dac a si numai dac a cele dou a variabile aleatoare sunt
ntr-o dependent a liniar a, adic a
X M [X] =
cov(X, Y )
D[Y ]
(Y M [Y ]).
Teorema 2.3. (Inegalitatea lui Ceb sev). Fie X o variabil a aleatoare
care admite medie si dispersie finite. Atunci, oricare ar fi > 0, are
loc inegalitatea
P(|X m| < ) 1
D[X]
2
, m = M[X]. (2.7)
Demonstratie. Facem observatia c a aceast a inegalitate d a o margine
inferioar a pentru probabilitatea ca abaterea absolut a a unei variabile
aleatoare cu dispersia cunoscut a s a fie mai mic a dect un num ar dat.
Pentru demonstratie consider am v. a.
X :

x
1
x
2
. . . x
n
p
1
p
2
. . . p
n
n care presupunem c a am scris valorile n ordine cresc atoare, si deci

asa vor scrise si valorile |x
i
M [X]| ; i = 1, . . . , n, adic a
|x
1
M [X]| |x
2
M [X]| |x
n
M [X]| .
Dac a lu am un > 0 arbitrar, unele din valorile |x
i
M [X]|;
i = 1, . . . , n, vor mai mari sau egale cu , altele mai mici. Exist a
un j astfel nct
|x
1
M [X]| |x
j
M [X]| < |x
j+1
M [X]|
|x
n
M [X]| .
Aceste inegalit ati se mai pot scrie
(x
1
M [X])
2
(x
j
M [X])
2
<
2
(x
j+1
M [X])
2
(x
n
M [X])
2
.
n expresia dispersiei inlocuim cu 0 toti (x
i
M [X])
2
<
2
si cu
2
toti (x
i
M [X])
2

2
,
D[X] =
n
X
i=1
p
i
(x
i
m)
2
2
n
X
i=j+1
p
i
,
deci
D[X]
2

n
X
i=j+1
p
i
, 1
D[X]
2
1
n
X
i=j+1
p
i
= P (|X M [X]| < )
care este echivalent a cu inegalitatea (2.7).
O form a echivalent a a teoremei este: dac a media distributiei X
este m si abaterea medie p atratic a este =
p
D[X], probabilitatea
ca valorile variabilei aleatoare s a fie mai departe de medie cu cel putin
k este cel mult
1
k
2
,
P(|X m| k) <
1
k
2
. (2.8)
Dac a lu am = k n inegalitatea (2.7), se obtine
P(|X m| < k) 1
1
k
2
sau
P(mk < X < m+k) 1
1
k
2
.
Dar evenimentele {|X m| < k} si {|X m| k} sunt contrare,
rezult a (2.8).
Pentru k = 3, de exemplu, obtinem
P(m3 < X < m+ 3) 1
1
9
=
8
9
= 0.88889.
Deci, cu o probabilitate cuprins a ntre 0.88889 si 1, orice variabil a ia
valori cuprinse n intervalul (m3, m+ 3).
Problema 2.5. Num arul clien tilor care viziteaz a un showroom sm-
b ata diminea t a este o variabil a aleatoare cu media m = 18 si = 2.5.
Cu ce probabilitate putem presupune c a num arul vizitatorilor va fi
cuprins ntre 8 si 28 de clien ti.
Rezolvare. Deoarece
8 < X < 28 10 < X 18 < 10 = 10.
folosind relatia (2.7), obtinem:
P(| X 18 |< 10) 0.9375,
deci probabilitatea ca num arul vizitatorilor s a fie cuprins ntre 8 si 28
de clienti este de cel putin 0.9375.
Avantajul inegalit atii lui Cebsev este c a se poate aplica oric arei
distributii pentru care media si abaterea medie p atratic a exist a.
Dezavantajul este c a aceast a inegaliate d a o margine inferioar a
a probabilit atii ca valorile variabilei aleatoare s a fie cuprinse ntr-un
interval de forma (m, m+).
Definitia 2.13. Pentru p [0, 1], se numeste cuantil a de ordin p,
notat a x
p
, pentru o v. a. X, avnd functia de repartitie F
X
, cel mai
mic num ar x
p
care satisface inegalitatea
p F
X
(x
p
).
Observatia 2.8. Folosind definitia functii de repartitie invers a putem
scrie x
p
= F
1
X
(p) = min{x : p F
X
(x
p
)}.
Observatia 2.9. Dac a F
X
este strict cresc atoare si continu a, atunci
F
1
X
(p) este unica valoare x
p
care satisface relatia
F
X
(x
p
) = p. (2.9)
Un caz particular este x
0.5
= F
1
X
(0.5) si reprezint a mediana.
Observatia 2.10. n cazul v. a. discrete cu valorile x
1
< x
2
< <
< x
n
, x
i
este cuantila de ordin
i
n
a distributiei deoarece F
X
(x
i
) =
i
n
si
F
X
(x) <
i
n
pentru x < x
i
. n general cuantila de ordin p este x
p
= x
i
,
unde
i 1
n
< p
i
n
. (2.10)
n cazul discret nu este sigur c a pentru orice p [0, 1] exist a cuan-
til a de ordin p. Dac a ns a existr a o cuantil a de ordin p atunci exist a
o innitate (intervalul ce separ a dou a valori posibile).
2.6 Functia generatoare
n problemele n care apar variabile aleatoare nenegative se uti-
lizeaz a func tia generatoare a variabilei aleatoare X, G
X
(z) care se
deneste prin relatia
G
X
(z) =

X
k=0
p
k
z
k
, (2.11)
unde P(X = k) = p
k
, k = 0, 1, 2, . . .. Deci cunoscnd probabilit atile
p
k
putem determina functia generatoare. Deoarece

P
k=0
p
k
= 1, seria de
puteri (2.11) converge pentru |z| 1. Pentru |z| < 1 seria de puteri
se poate deriva termen cu termen si obtinem:
G
(j)
X
(z) =

X
k=j
k(k 1) (k j + 1)p
k
z
kj
=

X
k=j
C
j
k
j!p
k
z
kj
.
Dac a n relatia de mai sus facem z = 0 obtinem
G
(j)
X
(0) = j!p
j
sau p
j
=
1
j!
G
(j)
X
(0).
Aceasta ne arat a c a putem determina toate probabilit atile p
k
cu
ajutorul functiei generatoare. Din acest a cauz a G
(j)
X
se numeste functie
generatoare. n particular, lund z = 1 n G
0
X
si n G
00
X
obtinem
M[X] = G
0
X
(1), M[X
2
] = G
0
X
(1) +G
00
X
(1), D[X] = G
0
X
(1) +G
00
X
(1)
(G
0
X
(1))
2
.
2.7 Legi discrete de repartitie
Vom prezenta legi teoretice de repartitie a unor variabile aleatoare
discrete. Exist a multe fenomene ntlnite n inginerie care "ascult a"
de aceste legi n sensul c a anumite selectii de date experimentale sunt
organizate dup a modele teoretice standard care trebuie cunoscute.
Statisticianul apeleaz a la rezultatele teoretice care i orienteaz a cal-
culele si deciziile.
2.7.1 V. a. repartizat a uniform
Cea mai simpl a v. a. este cea care ia un num ar finit de valori posi-
bile, fiecare valoare ind luat a cu aceeasi probabilitate. O v. a. care
ia n valori x
1
, x
2
, . . . , x
n
le ia cu aceeasi probabilitate
1
n
. n acest caz
P (X = x
i
) =
1
n
.
Presupunem c a v. a. ia valorile ntregi consecutive m, m+ 1, m+
2,. . . , m + n 1. V. a. va lua n valori fiecare cu probabilitatea
1
n
,
P (X = k) =
1
n
, m k m+n 1. n acest caz
M [X] =
m+n1
P
i=m
i
1
n
=
1
n
(m+n 1)(m+n) m(m1)
2
= m+
n 1
2
,
iar
D[X] = M

X
2
(M [X])
2
=
=
(n +m1)(n +m)(2n + 2m1) (m1)m(2m1)
6n

m+
n 1
2
2
=
n
2
1
12
.
O v. a. discret a uniform a cu n valori o not am X UnifD[m, n].
Problema 2.6. Un sistem de comunica tii con tine 10 de linii externe.
Fie X v. a. care ia ca valori num arul de linii care func tioneaz a la
un moment dat. S a se determine mul timea valorilor lui X, media,
dispersia si abaterea medie p atratic a. S a se scrie tabloul de distribu tie
al v. a. X, s a se calculeze P (X = 5), F
X
(6.5), cuantila de ordin 0.3
si de ordin 0.35.
Rezolvare. V. a. X ia valoriile 1, 2, . . . , 10.
M [X] =
1 + 10
2
= 5.5, D[X] =
(10 1 + 1)
2
1
12
= 8.25,
=
p
D[X] =
8.25 = 2.8723,
1 2 3 4 5 6 7 8 9 10
1
10
1
10
1
10
1
10
1
10
1
10
1
10
1
10
1
10
1
10
P (X = 5) =
1
10
,
F
X
(6.5) = P (X 6.5) = P (X = 1) +P (X = 2) +P (X = 3) +
+P (X = 4) +P (X = 5) +P (X = 6) =
6
10
=
3
5
,
x
0.3
= min {x : 0.3 F
X
(x)} = 3,
x
0.35
= min{x : 0.35 F
X
(x)} = 4.
Secventa urm atoare rezolv a problemele puse cu ajutorul Mathe-
maticii. Comanda <<StatisticsDiscreteDistributions deschide pa-
chetul care contine cinci distributii discrete: distributia discret a uni-
form a, binomial a, geometric a, hipergeometric a, geometric a cu expo-
nent negativ.
Domain[DiscreteUniformDistribution[10]]
{1,2,3,4,5,6,7,8,9,10}
Mean[DiscreteUniformDistribution[10]]
11
2
Variance[DiscreteUniformDistribution[10]]
33
4
N[%]
8.25
PDF[DiscreteUniformDistribution[10],5]
1
10
Table[PDF[DiscreteUniformDistribution[10],j],{j,1,10}]
{
1
10
,
1
10
,
1
10
,
1
10
,
1
10
,
1
10
,
1
10
,
1
10
,
1
10
,
1
10
}
CDF[DiscreteUniformDistribution[10],6.5]
3
5
Quantile[DiscreteUniformDistribution[10],0.3]
3
Quantile[DiscreteUniformDistribution[10],0.25]
3
Comenzile:
Domain[distrib,x] furnizeaz a multimea valorilor v. a. corespunz a-
toare distributiei numit a distrib,
Mean furnizeaz a media,
Variance furnizeaz a dispersia,
PDF[distrib,x] furnizeaz a valoarea densit atii de probabilitate a v.
a. corespunz atoare distributiei numit a distrib, calculat a n punctul x,
CDF[distrib,x] furnizeaz a valoarea functiei de repartitie corespun-
z atoare distributiei numit a distrib, calculat a n punctul x,
Quantile[disttrib,p] furnizeaz a cuantila de ordin p a v. a. corespun-
z atoare distributiei numit a distrib.
2.7.2 V. a. repartizat a binomial
Evenimentele A si contrarul s au A se repet a de mai multe ori si se
produc cu aceeasi probabilitate, P(A) = p respectiv P(A) = q = 1p.
Probabilitatea producerii de k ori a evenimentului A fi C
k
n
p
k
q
nk
, iar
v. a. care ia ca valori num arul de produceri ale evenimentului A are
tabloul de repartitie
X :

0 1 2 . . . n
C
0
n
p
0
q
n
C
1
n
p
1
q
n1
C
2
n
p
2
q
n2
. . . C
n
n
p
n
q
0
.
n acest caz scriem X Bin[n, p]. Termenul de variabil a aleatoare
binomial a provine din faptul c a probabilit atile sunt termenii succesivi
din dezvoltarea (p +q)
n
.
Alegerile lui n si p determin a unic repartitia binomial a; diferite
alegeri conduc la diferite repartitii.
Demonstr am c a M[X] = np si D
2
[X] = npq.
ntr-adev ar, variabila aleatoare X poate fi v azut a ca suma a n vari-
abile aleatoare independente X
i
care iau valoarea 1 cu probabilitatea
p, adic a la a i-a repetare a experientei evenimentul A s-a produs, si
valoarea 0 cu probabilitatea q, adic a la a i-a repetare a experientei
evenimentul A nu s-a produs
X
i
:

0 1
q p
, i = 1, n, M[X
i
] = p.
Cu notatiile introduse, putem scrie
X = X
1
+X
2
+ +X
n
=
n
X
i=1
X
i
,
M[X] = M
"
n
X
i=1
X
i
#
=
n
X
i=1
M[X
i
] = np,
si, deoarece variabilele aleatoare X
i
, i = 1, n sunt independente,
D[X] = D
"
n
X
i=1
X
i
#
=
n
X
i=1
D[X
i
].
Deoarece
X
2
i
:

0 1
q p
, M[X
2
i
] = p,
iar D[X
i
] = M[X
2
i
] (M[X
i
])
2
, rezult a
D
2
[X
i
] = p p
2
= pq si D[X] = npq.
Exercitiul 2.3. Dac a X Bin[n, p] atunci G
X
(z) = (pz +q)
n
si
deduceti cu ajutorul ei relatiile M[X] = np, D
2
[X] = npq.
Rezolvare. G
X
(z) =
n
P
k=0
C
k
n
p
k
q
nk
z
k
=
n
P
k=0
C
k
n
(pz)
k
q
nk
= (pz +q)
n
.
M[X] = G
0
X
(1) = np (p +q)
n1
= np,
M[X
2
] = G
0
X
(1) +G
00
X
(1) = np +n(n 1)p
2
=
= np (1 +np p) = np (np +q) ,
D[X] = G
0
X
(1) +G
00
X
(1) (G
0
X
(1))
2
=
= np (np +q) n
2
p
2
= npq.
Problema 2.7. Un student urmeaz a s a sus tin a n sesiune 5 examene.
Probabilitatea de a lua oricare dintre examene este 0.8. Se consider a
variabila aleatoare X care descrie num arul de examene luate. S a se
g aseasc a tabloul de reparti tie al v. a. X. S a se calculeze media si
dispersia v. a. X.
Rezolvare. Variabila aleatoare X urmeaz a o repartitie binomial a.
Avem n = 5 (num arul de examene), p = 0.8 (probabilitatea de a lua
examenul), q = 0.2 (probabilitatea de a nu lua examenul), deci X
Bin[5; 0.8]. Folosind formula de calcul a probabilit atii evenimente-
lor n cazul unei variabile aleatoare binomiale P (X = k) = C
k
n
p
k
q
nk
,
obtinem urm atorul tablou de repartitie pentru X:
X :

0 1 2 3 4 5
0.00032 0.0064 0.0512 0.2048 0.4096 0.32768
.
Calcul am 0.00032 +0.0064 +0.0512 +0.2048 +0.4096 +0.32768 =
= 1.0, deci tabelul obtinut este tabelul unei v. a.
Cum M [X] = np si D[X] = npq, avem
M [X] = 5 0.8 = 4, D[X] = 5 0.8 0.2 = 0.8.
Problemele n care se utilizeaz a repartitia binomial a sunt
cele n care facem urm atoarele presupuneri:
sunt numai dou a posibilit ati pentru rezultatul experientei (suc-
ces/insucces, realiz ari/nerealiz ari, bit corect/eronat, aparat bun/defect
etc.),
probabilitatea succesului este aceeasi pentru fiecare experient a,
sunt n repet ari ale experientei, unde n este constant,
cele n experiente sunt independente.
Facem observatia c a n calculul factorialelor care intervin n com-
bin ari, pentru n sucient de mare, se recomand a formula aproximativ a
a lui Stirling,
n! n
n
e
n
2n.
De exemplu, compar am valoarea lui 20! = 2.432 910
18
cu cea cal-
culat a aproximativ cu formula lui Stirling si obtinem 20
20
e
20
40 =
= 2.422 8 10
18
.
Secventa urm atoare realizeaz a n Mathematica desenarea punctelor
care reprezint a valorile distributiei binomiale pentru n = 20 si p = 0.2
si p = 0.5.
tab1=Table[{k,f[k]},{k,0,20}];
g[k_]:=PDF[BinomialDistribution[20, 0.5],k]
tab2=Table[{k,g[k]},{k,0,20}];
dd1=Graphics[{PointSize[0.025],Map[Point,tab1]}];
p1=ListPlot[tab1,DisplayFunction\[Rule]Identity];
Show[dd1,dd2,p1,p2,Axes\[Rule]Automatic]
5 10 15 20
0.05
0.1
0.15
0.2
Figura 2.2.
Graficul functiei de repartitie pentru v. a. X Bin[20, 0.5] este
Plot[CDF[BinomialDistribution[20, 0.5],k],{k,0,20}]
5 10 15 20
0.2
0.4
0.6
0.8
1
Figura 2.3.
2.7.3 V. a. multinomial a
O generalizare a distributiei binomiale este repartitia obtinut a pen-
tru modelul urm ator: n urma unui experiment se pot realiza k eveni-
mente diferite independente A
1
, A
2
, . . . , A
k
. Aceste evenimente se pro-
duc cu probabilit atile p
1
, p
2
, . . . , p
k
,
k
P
j=1
p
j
= 1, 0 p
j
1. Se repet a
experienta de n ori si se constat a c a evenimentul A
j
, j = 1, k s-a
realizat de n
j
ori.
Teorema 2.4. Dac a definim v. a. X
j
egal a cu num arul de apari tii ale
evenimentului A
j
n cele n probe, atunci:
P(X
1
=n
1
, X
2
=n
2
, . . . , X
k
=n
k
)=
n!
n
1
!n
2
! n
k
!
(p
1
)
n
1
(p
2
)
n
2
(p
k
)
n
k
cu n
1
+n
2
+ +n
k
= n si 0 n
j
n.
Not am (X
1
, X
2
, . . . , X
k
) Multnom[n, p
1
, p
2
, . . . , p
k
].
Observatia 2.11. Repartitia depinde de k 1 parametri.
Problema 2.8. Presupunem c a o urn a con tine 10 bile ro sii, 20 de
bile albe si 30 bile negre. Extragem 10 bile din urn a cu repunerea bilei
extrase n urn a. S a se determine proobabilitatea ca s a ob tinem 3 bile
ro sii, 4 bile albe si 3 bile negre.
Rezolvare. Deoarece extragerea se face cu repunerea bilei extrase n
urn a evenimentele sunt independente si deci:
P(X
1
=3, X
2
=4, X
3
=3)=
10!
3!4!3!
10
60
20
60
30
60
3
=0.030007.
2.7.4 V. a. repartizat a binomial cu exponent
negativ
Facem observatia c a n cazul variabilei aleatoare binomiale valorile
acestei variabile reprezint a num arul de realiz ari ale evenimentului A
n urma repet arii de n ori a experientei. Deci num arul n de repet ari
ele experien tei este fixat, iar num arul succeselor este aleator.
n cazul v. a. binomiale cu exponent negativ variabila ia ca valori
num arul de experiente necesare pentru a obtine m realiz ari. n acest
caz num arul realiz arilor ale evenimentului A este fixat, iar num arul
repet arilor evenimentului A este aleator. V. a. X este descris a adesea
ca timpul de asteptare pentru obtinerea a m succese n experiente
Bernoulli.
Se spune c a variabila aleatoare X are repartitie binomial a cu expo-
nent negativ, si scriem aceasta X NegBin[m, p] cu parametrii m si
p, (m = 1, 2, . . . , 0 < p < 1), dac a X ia valorile r = m, m+1, m+2, . . .
iar
P(X = r) = C
m1
r1
p
m
q
rm
, q = 1 p.
Acest a repartitie apare n modele de tipul urm ator: s a presupunem
c a s-a efectuat un num ar de observatii independente, n cursul fiec arei
observatii evenimentul A (de exemplu nefunctionarea unui subansam-
blu al unui aparat) poate s a se produc a cu probabilitatea p. Ob-
servatiile continu a pn a cnd evenimentul se produce de m ori si se
caut a probabilitatea pentru ca aceasta s a se produc a exact de m ori
n decursul a r observatii.
Evenimentul {X = r} se scrie ca intersectie a dou a evenimente:
evenimenul B
1
care const a n faptul c a n primele r 1 observatii
evenimentul A se produce de m1 ori si
evenimentul B
2
care const a n faptul c a n observatia r se produce
evenimentul A.
Din schema lui Bernoulli se deduce c a probabilitatea evenimentului
B
1
este P(B
1
) = C
m1
r1
p
m1
q
rm
iar probabilitatea evenimentului B
2
este egal a cu p, P(B
2
) = p. Deci
P (X = r) = P(B
1
B
2
) = P(B
1
)P(B
2
) =
= C
m1
r1
p
m1
q
rm
p = C
m1
r1
p
m
q
rm
.
Numele acestei repartitii provine din faptul c a probabilitatea c au-
tat a este coecient n dezvoltarea n serie a lui
1
p

q
p
m
=

X
r=m
C
m1
r1
p
m
q
rm
. (2.12)
Justific am aceast a relatie:
1
1 x
=

X
k=0
x
k
, pentru |x| < 1,
1
1 x
0
=
1
(1 x)
2
=

X
k=1
kx
k1
,
2
(1 x)
3
=

X
k=2
k(k 1)x
k2
1
(1 x)
3
=

X
k=2
C
2
k
x
k2
.
Se demonstreaz a prin inductie c a
1
(1 x)
m
=

P
r=m1
C
m1
r
x
rm+1
.
Trecem r n r 1 si obtinem (1 x)
m
=

P
r=m
C
m1
r1
x
rm
care
reprezint a dezvoltarea n serie binomial a cu putere negativ a. Trecem
x q si obtinem
1
p

q
p
m
= p
m
(1 q)
m
= p
m

X
r=m
C
m1
r1
q
rm
=

X
k=m
C
m1
r1
p
m
q
rm
.
Observ am c a definirea acestei variabile aleatoare este corect a de-
oarece P(X = r) > 0 si

P
r=m
C
m1
r1
p
m
q
rm
= 1.
Calcul am functia generatoare.
G
X
(z) =

X
r=m
C
m1
r1
p
m
q
rm
(z)
r
=
=

X
r=m
C
m1
r1
(pz)
m
(qz)
rm
=

1
pz

zq
pz
m
,
G
0
X
(z) = m
1
pz

q
p
m1
1
pz
2
, G
0
X
(1) =
m
p
M[X] =
m
p
,
G
00
X
(z) = m(m+ 1)
1
pz

q
p
m2
1
pz
2
2
+
+m
1
pz

q
p
m1
2
pz
3
,
G
00
X
(1) = m(m+ 1)
1
p
2

2m
p
= M[X
2
] M[X]
M[X
2
] = m(m+ 1)
1
p
2

2m
p
+
m
p
D[X] = m(m+ 1)
1
p
2

m
p

m
2
p
2
=
m
p
2

m
p
=
mq
p
2
Problemele n care se utilizeaz a repartitia binomial a cu
exponent negativ sunt cele n care facem urm atoarele presupuneri:
etc.),
num arul realiz arilor experientei, m, este constant,
num arul efectu arilor experientei r, este variabil,
cele r experiente sunt independente.
Problema 2.9. Calculatorul A transmite un mesaj calculatorului B.
Mesajul este codat astfel nct B detecteaz a cnd se produc erori n
cursul transmiterii mesajului. Dac a B detecteaz a o eroare cere calcu-
latorului A retransmiterea mesajului. Presupunem c a probabilitatea ca
transmiterea mesajului s a fie eronat a este p = 0.1. Vrem s a definim
variabila aleatore X care ia ca valori num arul de mesaje care trebuie
transmise pna la ob tinerea a patru mesaje eronate.
Rezolvare. V. a. X are o distributie binomial a cu exponent negativ.
n acest caz m = 4. Valorile pe care le ia v. a. sunt 4, 5, 6, . . . cu
probabilit atile din tabel
X :

4 5 6 7 . . .
0.0001 0.00036 0.00081 0.001458 . . .
P (X = 4) = C
3
3
(0.1)
4
= 0.000 1,
P (X = 5) = C
3
4
(0.1)
4
(0.9) = 0.000 09 4 = 0.000 36
P (X = 6) = C
3
5
(0.1)
4
(0.9)
2
= 8.1 10
5
5 4
2
= 0.000 81
P (X = 7) = C
3
6
(0.1)
4
(0.9)
3
= 7.29 10
5
6 5 4
2 3
= 0.001 458
etc.
M[X] =
m
p
=
4
0.1
= 40, deci cam la 40 de mesaje se obtin patru
mesaje eronate.
Printr-o secvent a similar a celei de la repartitia binomial a desen am
cu Mathematica distributia repartitiei binomiale cu exponent nega-
tiv, nlocuind BinomialDistribution cu NegativeBinomialDistribution
(figura 2.4).
5 10 15 20
0.01
0.02
0.03
Figura 2.4.
2.7.5 V. a. repartizat a geometric
Spre deosebire de variabila aleatoare binomial a care apare cnd
fix am un num ar de repet ari ale unei experiente A, n cazul variabilei
geometrice num ar am num arul m de efectu ari ale experientei pn a
la prima realizare a evenimentului A (experiente de tip Bernoulli,
adic a independente si repetate n aceleasi conditii). V. a. X este
uneori descris a ca "timpul de asteptare" pentru un succes n expe-
riente Bernoulli. n acest caz variabila aleatoare X ia valorile X = k,
k = 1, 2, . . . , m, . . . si avem
P(X = k) = p (1 p)
k1
, k = 1, 2, 3, . . . ,
unde P(A) = p este probabilitatea de realizare a evenimentului A.
Scriem c a X Geom[p].
Calcul am media si dispersia variabilei aleatoare. Not am q = 1p.
Calcul am functia generatoare pentru |qz| < 1.
G
X
(z) =

X
k=1
p
k
z
k
=

X
k=1
pz (qz)
k1
=
pz
1 qz
,
G
0
X
(z) =
p
(1 qz)
2
, G
0
X
(1) =
1
p
M[X] =
1
p
.
G
00
X
(z) =
2pq
(1 qz)
3
, G
00
X
(1) =
2q
p
2
D[X] =
2q
p
2
+
1
p

1
p
2
=
q
p
2
.
Problema 2.10. Calculatorul A transmite un mesaj calculatorului
B. Mesajul este codat astfel nct B detecteaz a cnd se produc erori
n cursul transmiterii mesajului. Dac a B detecteaz a o eroare cere cal-
culatorului A retransmiterea mesajului. Dac a probabilitatea ca trans-
miterea mesajului s a fie eronat a este p = 0.1, care este probabilitatea
ca mesajul s a necesite mai mult de dou a transmisii.
Rezolvare. Fiecare transmitere a mesajului urmeaz a o repartitie bi-
nomial a cu probabilitatea ca mesajul s a fie corect q = 1 p. Expe-
rientele se repet a pn a cnd prima transmisie este corect a. Probabil-
itatea ca mesajul s a necesite mai mult de dou a transmisii este
P(X > 2) = p
2
q +p
3
q + = p
2
q
1
1 p
= p
2
= 10
2
.
Media variabilei aleatoare din acest exercitiu este M [X] =
1
0.1
=
10, iar dispersia este D[X] =
0.9
0.01
= 90.
Interpretarea este urm atoarea: media aritmetic a este 10, deci la
un num ar mare de transmisii num arul mediu de transmisii pn a la
primul mesaj eronat este 10.
Problemele n care se utilizeaz a repartitia geometric a sunt
cele n care facem urm atoarele presupuneri:
etc.),
num arul efectu arilor experientei k, pn a la prima realizare, este
variabil,
cele k experiente sunt independente.
2.7.6 V. a. repartizat a hipergeometric
Fie o urn a care contine N bile albe si negre, k N dintre ele sunt
albe si N k negre. Se extrag n N bile aleator (f ar a revenirea
bilei n urn a). Acestea se pot extrage n C
n
N
moduri. Fie X variabila
aleatoare care ia ca valori num arul de bile albe extrase.
X :
_
_
0 1 . . . i . . . min{n, k}
C
0
k
C
n
Nk
C
n
N
C
1
k
C
n1
Nk
C
n
N
. . .
C
i
k
C
ni
Nk
C
n
N
. . .
C
min{n,k}
a
C
nmin{n,k}
b
C
n
N
_
_
.
Folosim notatia X Hip [n, k, N]. Caracteristicile numerice ale
variabilei aleatoare X sunt
M[X] =
kn
N
= np, D[X] =
np(1 p)(N n)
N 1
,
unde p =
k
N
.
Media se poate calcula astfel: ca si n cazul binomial, variabila
aleatoare hipergeometric a poate fi scris a sub forma unei sume de vari-
abile aleatoare. S a not am cu X
1
num arul de succese la prima ex-
tragere, cu X
2
num arul de succese obtinute la a doua extragere etc.
Tabloul de repartitie al variabilei X
1
este
X
1
:

0 1
q p
.
Vom ar ata c a si celelalte variabile aleatoare X
i
, i = 2, n, au aceeasi
repartitie. Pentru aceasta calcul am probabilitatea obtinerii unui suc-
ces la extractia de ordin i, atunci cnd se fac extrageri f ar a revenirea
obiectului n multime. Num arul cazurilor posibile A
i
N
. Num arul
cazurilor favorabile coincide cu num arul de moduri n care pot fi
obtinute i obiecte astfel nct pe locul i s a fie succes. Un succes poate
fi obtinut n k moduri.
Celelalte i1 locuri pot fi ocupate n A
i1
N1
moduri, n total kA
i1
N1
cazuri favorabile. Probabilitatea c atat a va fi deci
kA
i1
N1
A
i
N
=
k(N 1)(N 2) (N i + 1)
N(N 1) (N i + 1)
=
k
N
= p.
Rezult a c a X
i
are repartitia X
i
:

0 1
q p
. Din relatiile
X = X
1
+X
2
+ +X
n
si M[X
1
] = M[X
2
] = = M[X
n
] = p,
rezult a
M[X] = np.
Ca si n cazul v. a. binomiale, X se scrie ca o sum a de variabile
aleatoare avnd aceeasi repartitie

0 1
q p
. Deosebirea este esential a:

n cazul repartitiei hipergeometrice, variabilele aleatoare nu sunt in-
dependente. Din aceast a cauz a nu putem calcula dispersia variabilei
aleatoare X ca suma dispersiilor variabilelor aleatoare X
i
.
Teorema 2.5. Dac a X este o variabil a aleatoare repartizat a hiperge-
ometric cu parametrii N, k, n, X Hip [n, k, N], pentru care
P(X = i) =
C
i
k
C
ni
Nk
C
n
N
,
atunci
lim
N
C
i
k
C
ni
Nk
C
n
N
= C
i
n
p
i
q
ni
, (2.13)
unde p =
k
N
, q = 1p si deci pentru valori mari ale lui N, o variabil a
aleatoare repartizat a hipergeometric poate fi aproximat a cu o variabil a
repartizat a binomial a Bin
n,
k
N
.
Demonstratie.
C
i
k
C
ni
Nk
C
n
N
=
=
k(k1)(ki+1)
i!
(Nk)(Nk1)(Nkn+i1)
(ni)!
n!
N(Nn+1)
=
=
n!
i!(ni)!
k(k1)(ki+1)(Nk)(Nk1)(Nkn+i1)
N(Nn+1)
=
= C
i
n
k
N
k1
N

ki+1
N
Nk
N
Nk1
N

Nkn+i1
N
N
n
N(Nn+1)
=
= C
i
n
k
N
k1
N

ki+1
N
Nk
N
Nk1
N

Nkn+i1
N
N
n
N(Nn+1)
=
= C
i
n
p(p
1
N
) (p
i1
N
)q(q
1
N
) (q
ni+1
N
)
N
n
N(Nn+1)
.
Trecnd la limit a obtinem (2.13).
Prin programul de mai jos din Mathematica observ am acuratetea
aproxim arii unei v. a. Hip [20, 5, 100], cu distributia repartizat a bino-
mial Bin[20, 0.05].
g[k_]:=PDF[HypergeometricDistribution[20,5,100],k]
<<GraphicsMultipleListPlot
MultipleListPlot[tab1,tab2,
PlotStyle->{GrayLevel[0],Dashing[{Dot,Dash}]},
SymbolShape->{PlotSymbol[Box],PlotSymbol[Triangle]},
SymbolStyle->{GrayLevel[0],GrayLevel[.4]}]
2 4 6 8 10 12 14
0.1
0.2
0.3
0.4
Figura 2.5.
2.7.7 V. a. repartizat a Poisson
Distributia Poisson se foloseste ca model pentru evenimente a c aror
num ar de repetare nu are o limit a superioar a. Spunem c a variabila
aleatoare X urmeaz a o distributie Poisson, cu paramatru R
+
,
X Pois [], dac a tabloul s au de repartitie este
X :

0 1 2 . . . k . . .
e

1!
e

2
2!
e
. . .

k
k!
e
. . .
.
Folosimnotatia P(k; ) =

k
k!
e
. Evident P(k; ) > 0 si

P
k=0
k
k!
e
= 1.
Propriet ati ale repartitiei Poisson.
P1. Media repartitiei Poisson este aceeasi cu dispersia repartitiei si
egal a cu : M[X] = D[X] = . Aceasta este o particularitate
remarcabil a si este o modalitate de a recunoaste c a un fenomen
urmeaz a o repartitie Poisson. ntr-adev ar
M[X] =

X
k=0
k
k
k!
e
= e

X
k=1
k

k1
(k 1)!
= e
= .
Pentru calculul dispersiei folosimformula D[X] = M[X
2
](M[X])
2
.
M[X
2
] = e

X
k=1
k
2
k
k!
= e

X
k=2
(k
2
k)
k
k!
+

X
k=1
k
k
k!
!
=
= e
2

X
k=2
k2
(k 2)!
+

X
k=1
k1
(k 1)!
!
=
2
+,
D[X] =
2
+
2
= .
P2. Repartitia Poisson se obtine ca un caz limit a a repartitiei bino-
miale cnd n si p scade astfel nct np = = const (n
general, n > 30, p (0; 0.1)).
Repartitia Poisson a ap arut odat a cu studiul variabilelor aleatoa-
re cu un num ar foarte mare de valori. Exemple clasice de astfel
de variabile aleatoare sunt cele legate de evenimentele care
apar rar ntr-un interval de timp, ca de exemplu:
num arul de particule emise de o suprafat a radioactiv a ntr-un
interval de timp;
num arul de bacterii ntr-un centimetru cub de ap a;
num arul accidentelor dintr-o fabric a n decurs de o s apt amn a;
num arul masinilor care trec printr-un anumit loc ntr-un in-
terval de timp;
num arul cererilor de I/O la o retea de calculatoare ntr-un
interval de timp.
Toate aceste procese se numesc Poisson si ele vor fi studiate
n Capitolul Procese Stochastice. n aceste cazuri este pro-
portional a cu durata intervalului de timp (adic a = tw, w co-
ecient de proportionalitate). Parametrul w =

t
se mai nu-
meste parametru de intensitate, reprezentnd media num arului
de evenimente care se produc n unitatea de timp.
P3. Deoarece repartitia Poisson se ntlneste n cazul evenimentelor
care se ntmpl a rar (n mare, np = const, rezult a p mic), ea mai
poart a denumirea de legea evenimentelor rare.
Teorema 2.6. Dac a X urmeaz a o reparti tie binomial a atunci
lim
n
C
k
n
p
k
q
nk
=

k
k!
e
,
unde np = = const.
Demonstratie.
lim
n
C
k
n
p
k
q
nk
= lim
n
n(n 1) (n k + 1)
k!
1

n
nk
=
=

k
k!
lim
n
n(n 1) (n k + 1)
n
k
1

n
nk
=

k
k!
e
.
Observatia 2.12. Teorema afirm a c a experimentele Bernoulli cu pro-
babilitate de succes din ce n ce mai mic a se apropie de legea Poisson
de repartitie cu parametul = np.
Teorema 2.6 ne permite s a aproxim am probabilit atile unei repar-
titii binomiale.
Problema 2.11. O fabric a produce becuri si d a 5% rebut. S a se
aproximeze probabilitatea ca ntr-o cutie de 100 de becuri s a existe cel
mult trei becuri defecte?
Rezolvare. Presupunnd indepependenta, avem de-a face cu o vari-
abil a aleatoare repatizat a binomial cu p = 0.05 si n = 100. Dac a
dorim s a calcul am probabilitatea cu ajutorul schemei binomiale, dup a
calcule laborioase obtinem
3
P
k=0
C
k
100
(0.05)
k
(0.95)
100k
= 0.25784. Dac a
aproxim am X cu o variabil a aleatoare repartizat a Poisson, obtinem
= 100 0.05 = 5,
3
X
k=0
5
k
e
5
k!
= 0.26503.
Prin programul de mai jos din Mathematica observ am acuratetea
aproxim arii unei v. a. X Bin[100; 0.05] cu distributia repartizat a
Poisson de parametru = 0.05.
g[k_]:=PDF[PoissonDistribution[5],k]
<<GraphicsMultipleListPlot
MultipleListPlot[tab1,tab2,
PlotStyle\[Rule]{GrayLevel[0],Dashing[{Dot,Dash}]},
SymbolShape\[Rule]{PlotSymbol[Box],PlotSymbol[Triangle]},
SymbolStyle\[Rule]{GrayLevel[0],GrayLevel[.5]}];
5 10 15 20
0.025
0.05
0.075
0.1
0.125
0.15
0.175
Figura 2.6.

Problema 2.12. O urn a con tine 5 bile albe si 4 bile negre. Din urn a
se extrag 4 bile. Fie X num arul de bile albe extrase. S a se g aseasc a
reparti tia variabile aleatoare X.
Rezolvare. Variabila aleatoare X poate lua urm atoarele valori: 0, 1,
2, 3, 4. Probabilit atile cu care X ia aceste valori sunt:
P
0
= P (X=0) =
C
0
5
C
4
4
C
4
9
=
1
126
,
P
1
= P (X=1) =
C
1
5
C
3
4
C
4
9
=
20
126
, P
3
= P (X=3) =
C
3
5
C
1
4
C
4
9
=
40
126
,
P
2
= P (X=2) =
C
2
5
C
2
4
C
4
9
=
60
126
, P
4
= P (X=4) =
C
4
5
C
0
4
C
4
9
=
5
126
,
Tabloul de repartitie al variabilei aleatoare X este
X :
0 1 2 3 4
1
126
20
126
60
126
40
126
5
126
!
.
ntruct evenimentele E
i
= {X = i}, i = 0, 4, formeaz a un sistem
complet de evenimente, trebuie ca
5
P
i=0
P (E
i
) = 1, conditie care ntr-
adev ar se verific a:
5
P
i=0
P
i
=
126
126
= 1.
Problema 2.13. Se arunc a o moned a de dou a ori. S a se g aseasc a
reparti tia variabilei aleatoare X, valorile c areia sunt num arul de apari-
tii al stemei.
Rezolvare. Fie evenimetele E
i
, i = 1, 2, care constau n aparitia
stemei la aruncarea i a monezii. Avem P (E
1
) = P

E
1
= P (E
2
) =
P

E
2
=
1
2
. Deci
P (X = 0) = P

E
1
E
2
=
1
2

1
2
=
1
4
;
P (X = 1) = P

E
1
E
2
E
1
E
2
=
1
2

1
2
+
1
2

1
2
=
1
2
;
P (X = 2) = P (E
1
E
2
) =
1
2

1
2
=
1
4
.
Tabloul de repartitie al lui X este
X :
0 1 2
1
4
1
2
1
4
!
.
Problema 2.14. Fie variabilele aleatoare X si Y cu reparti tiile:
X :

1 0 1
0.3 0.4 0.3
, Y :

0 1 2
0.2 0.3 0.5
.
S a se calculeze tablourile de reparti tie ale variabilelor aleatoare X+Y ,
X Y , 10 X, X
2
.
Rezolvare. Fie variabila aleatoare X + Y . Valorile posibile ale ei
sunt 1, 0, 1, 2, 3. Tinnd seama c a X si Y sunt variabile aleatoare
independente, avem
P(X+Y =1) = P({X=1}{Y =0}) = P(X=1) P(Y =0) =
= 0.3 0.2 = 0.06;
P(X+Y =0) = P(({X = 1}{Y = 1})({X = 0}{Y = 0})) =
= 0.3 0.3 + 0.4 0.2 = 0.17;
P(X+Y =1) = P
({X = 1}{Y = 2})({X = 0}{Y = 1})

({X = 1}{Y = 0})
=
= 0.3 0.5 + 0.4 0.3 + 0.3 0.2 = 0.33;
P(X+Y =2) = P(({X = 1}{Y = 1})({X = 0}{Y = 2})) =
= 0.3 0.3 + 0.4 0.5 = 0.29;
P(X+Y =3) = P({X = 1}{Y = 2}) =
= 0.3 0.5 = 0.15.
Deci
X +Y :

1 0 1 2 3
0.06 0.17 0.33 0.29 0.15
.
n mod similar se obtine repartitia variabilei aleatoare X Y :
X Y :

2 1 0 1 2
0.3 0.5 0.3 0.3 0.4 + 0.2 0.08 0.3 0.3 0.3 0.5
X Y :

2 1 0 1 2
0.15 0.09 0.52 0.09 0.15
.
Variabila aleatoare 10 X va lua valorile 10, 0, 10, iar repartitia ei
este
10 X :

10 0 10
0.3 0.4 0.3
.
Fie variabila aleatoare X
2
. Avem
P

X
2
= 0
= P (X = 0) = 0.4;
P

X
2
= 1
= P ({X = 1} {X = 1}) = 0.3 + 0.3 = 0.6.

Repartitia ei este
X
2
:

0 1
0.4 0.6
.
Problema 2.15. Un zar se arunc a de dou a ori. Se dene ste vari-
abila aleatoare, valorile c areia sunt diferen ta dintre num arul de puncte
ob tinut la prima aruncare si num arul de puncte ob tinut la a doua arun-
care. S a se scrie tabloul de reparti tie al variabilei aleatoare.
Rezolvare. Fie X
1
si X
2
variabilele aleatoare cu valorile egale cu
num arul de puncte la prima, respectiv a doua aruncare a zarului.
Avem
X
1
, X
2
:
1 2 3 4 5 6
1
6
1
6
1
6
1
6
1
6
1
6
!
.
Trebuie de calculat repartitia variabilei aleatoare X
1
X
2
. Avem
P (X
1
X
2
= 5) = P ({X
1
= 1} {X
2
= 6}) =
=
1
6

1
6
=
1
36
;
P (X
1
X
2
= 4) = P(({X
1
= 1} {X
2
= 5})
({X
1
= 2} {X
2
= 6})) =
=
1
6

1
6
+
1
6

1
6
=
2
36
=
1
18
;
P (X
1
X
2
= 3) = P(({X
1
= 1} {X
2
= 4})
({X
1
= 3} {X
2
= 6})) =
= 3
1
6

1
6
=
3
36
=
1
12
;
P (X
1
X
2
= 2) = P(({X
1
= 1} {X
2
= 3})
({X
1
= 4} {X
2
= 6})) =
= 4
1
6

1
6
=
4
36
=
1
9
;
P (X
1
X
2
= 1) = P(({X
1
= 1} {X
2
= 2})
({X
1
= 5} {X
2
= 6})) =
= 5
1
6

1
6
=
5
36
;
P (X
1
X
2
= 0) = P(({X
1
= 1} {X
2
= 1})
({X
1
= 6} {X
2
= 6})) =
= 6
1
6

1
6
=
6
36
=
1
6
;
P (X
1
X
2
= 1) = P(({X
1
= 2} {X
2
= 1})
({X
1
= 6} {X
2
= 5})) =
= 5
1
6

1
6
=
5
36
;
P (X
1
X
2
= 2) = P(({X
1
= 3} {X
2
= 1})
({X
1
= 6} {X
2
= 4})) =
= 4
1
6

1
6
=
4
36
=
1
9
;
P (X
1
X
2
= 3) = P(({X
1
= 4} {X
2
= 1})
({X
1
= 6} {X
2
= 3})) =
= 3
1
6

1
6
=
3
36
=
1
12
;
P (X
1
X
2
= 4) = P(({X
1
= 5} {X
2
= 1})
({X
1
= 6} {X
2
= 2})) =
=
1
6

1
6
+
1
6

1
6
=
2
36
=
1
18
;
P (X
1
X
2
= 5) = P ({X
1
= 1} {X
2
= 5}) =
=
1
6

1
6
=
1
36
.
Tabloul de repartitie al variabilei aleatoare X
1
X
2
este
X
1
X
2
:
5 4 3 2 1 0 1 2 3 4 5
1
36
1
18
1
12
1
9
5
36
1
6
5
36
1
9
1
12
1
18
1
36
!
.
Problema 2.16. Un zar este aruncat de 10 ori. Fie X variabila
aleatoare, valorile c areia sunt num arul de apari tii al fe tei "6". S a se
calculeze n Matlab probabilit a tile corespunz atoare fiec arui num ar de
apari tii, valorile func tiei de reparti tie si s a se reprezinte grafic cele
dou a func tii. S a se calculeze P (X < 4), P (X > 6), P (3 X < 7),
P (3 < X 7).
Rezolvare. Valorile variabilei aleatoare X sunt 0, 1, . . . , 10. Proba-
bilit atile corespunz atoare se calculeaz a conform formulei P (X = k) =
C
k
n
p
k
q
nk
, unde n = 10 este num arul de arunc ari, p =
1
6
este probabili-
tatea aparitiei fetei "6" la o aruncare a zarului, iar q =
5
6
este proba-
bilitatea aparitiei altei fete. Formula de calcul ia forma P (X = k) =
C
k
10
5
10k
6
10
. Valoarea functiei de repartitie n punctul x = k, k = 0, 10
se va calcula astfel F (0) = 0, F (k) = F (k 1) + P (X = k 1),
k = 1, 10. Probabilit atile celor patru evenimente vor fi P (X < 4) =
F (4), P (X > 6) = 1 F (6 + 1), P (3 X < 7) = F (7) F (3),
P (3 < X 7) = F (7 + 1) F (3 + 1).
Urm atorul program n Matlab face aceste calcule si afiseaz a grafi-
cele.
% Aruncarea zarului
% Probabilitatea aparitiei fetei "6"
% Functia de repartitie
clear;
clc;
format short g;
n=10;
p=1/6;
q=5/6;
X=0:n;
for k=0:n
P(k+1)=mfun(binomial,n,k)*p^k*q^(n-k);
end
F(1)=0;
for k=1:n
F(k+1)=F(k)+P(k);
end
fprintf( k P(X=k) F(k)\n);
for k=0:n
fprintf(%2g %14g %10.6g\n,X(k+1), P(k+1), F(k+1));
end
fprintf(P(X<4)=%g\n,F(4+1));
fprintf(P(X>6)=%g\n,1-F(6+1+1));
fprintf(P(3<=X<7)=%g\n,F(7+1)-F(3+1));
fprintf(P(3<X<=7)=%g\n,F(7+1+1)-F(3+1+1));
subplot(1,2,1)
stem(X,P);
title(Probabilitatile evenimentelor);
xlabel(x); ylabel(f(x));grid;
subplot(1,2,2);
hold on;
for k=1:n
plot([X(k) X(k+1)], [F(k+1) F(k+1)]);
end;
title(Functia de repartitie);
axis([0 10 0 1.1]);
xlabel(x); ylabel(F(x));grid;
hold off;
Rezultatele afisate de c atre program sunt
k P (X = k) F (k)
0 0.161506 0
1 0.323011 0.161506
2 0.29071 0.484517
3 0.155045 0.775227
4 0.0542659 0.930272
5 0.0130238 0.984538
6 0.00217064 0.997562
7 0.000248073 0.999732
8 1.86054e 005 0.999981
9 8.26909e 007 0.999999
10 1.65382e 008 1
P(X < 4) = 0.930272
P(X > 6) = 0.000267521
P(3 <= X < 7) = 0.224506
P(3 < X <= 7) = 0.0697084
Graficele functiei probabilit atilor si functiei de repartitie sunt repre-
zentate n figura 2.7.
0 2 4 6 8 10
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
Functia probabilitatilor
x
f
(
x
)
0 2 4 6 8 10
0
0.2
0.4
0.6
0.8
1
Functia de repartitie
x
F
(
x
)
Figura 2.7.
Problema 2.17. Tabloul de reparti tie al unei variabile aleatoare dis-
crete este
X :

1 2 3 4 5 6 7 8 9 10
0.05 0.08 0.12 0.16 0.2 0.14 0.09 0.07 0.05 0.04
.
S a se calculeze media, dispersia si abaterea medie p atratic a a v. a. X.
Rezolvare. Conform definitiei media si dispersia lui X sunt M [X] =
=
n
P
i=1
x
i
p
i
, respectiv D[X] = M [X
2
] M [X]
2
. Urm atorul tabel
contine rezultatele calculelor:
x
i
p
i
x
i
p
i
x
2
i
x
2
i
p
i
1 0.05 0.05 1 0.05
2 0.08 0.16 4 0.32
3 0.12 0.36 9 1.08
4 0.16 0.64 16 2.56
5 0.20 1.00 25 5.00
6 0.14 0.84 36 5.04
7 0.09 0.63 49 4.41
8 0.07 0.56 64 4.48
9 0.05 0.45 81 4.05
10 0.04 0.40 100 4.00
P
1.00 5.09 30.99
Avem M[X] =5.09, D[X] =30.995.09
2
5.08, [X]
5.082.25.
Problema 2.18. Se consider a variabilele aleatoare independente X si
Y :
X :

1 2 3
0.3 0.5 0.2
, Y :

1 0 1 2
0.4 0.3 0.2 0.1
.
S a se calculeze M [X], D[X], M [Y ], D[Y ], M [X +Y ], D[X +Y ],
M [XY ], D[XY ] si s a se verifice c a
M [X +Y ] = M [X] +M [Y ] , M [XY ] = M [X] M [Y ] ,
D[X +Y ] = D[X] +D[Y ] .
Rezolvare. Aplicnd formulele mediei si dispersiei, obtinem
M [X] = 1.9, D[X] = 0.49, M [Y ] = 0, D[Y ] = 1.
Procednd ca n Problema 2.14 obtinem tablourile de repartitie:
X+Y :

0 1 2 3 4 5
0.12 0.29 0.29 0.19 0.09 0.02
,
XY :

3 2 1 0 1 2 3 4 6
0.08 0.20 0.12 0.30 0.06 0.13 0.04 0.05 0.02
.
Obtinem apoi
M [X+Y ] = 1.9, D[X+Y ] = 1.49, M [XY ] = 0, D[XY ] = 4.1.
Egalit atile privind media si dispersia se verific a:
M [X +Y ] = 1.9 = 1.9 + 0 = M [X] +M [Y ] ,
M [XY ] = 0 = 1.9 0 = M [X] M [Y ] ,
D[X +Y ] = 1.49 = 0.49 + 1 = D[X] +D[Y ] .
Problema 2.19. Dintr-o urn a, ce con tine 10 bile albe si 6 bile negre,
se extrag f ar a revenire 5 bile. Fie X num arul de bile albe extrase. S a
se calculeze M [X] si D[X].
Rezolvare. Valorile variabilei aleatoare X sunt 0, 1, 2, 3, 4 si 5. S a
calculam probabilit atile corespunz atoare fiec arei valori. Problema se
ncadreaz a n cazul schemei hipergeometrice. Avem:
P (X = 0) =
C
0
10
C
5
6
C
5
16
=
1
728
, P (X = 3) =
C
3
10
C
2
6
C
5
16
=
300
728
,
P (X = 1) =
C
1
10
C
4
6
C
5
16
=
25
728
, P (X = 4) =
C
4
10
C
1
6
C
5
16
=
210
728
,
P (X = 2) =
C
2
10
C
3
6
C
5
16
=
150
728
, P (X = 5) =
C
5
10
C
0
6
C
5
16
=
42
728
.
Deci tabloul de repartitie al lui X este
X :
0 1 2 3 4 5
1
728
25
728
150
728
300
728
210
728
42
728
!
.
Aplicnd apoi formulele mediei si dispersiei unei variabile aleatoare
discrete, g asim
M [X] =
n
X
i=1
x
i
p
i
= 3.125,
D[X] = M

X
2
M [X]
2
= 10.625 3.125
2
0.859.
Problema 2.20. O moned a se arunc a de 20 de ori. Variabila aleatoare
X indic a num arul de apari tii al stemei. S a se determine tabloul de
reparti tie al v. a. X. S a se determine func tia de reparti tie a v. a. X.
S a se calculeze M [X], D[X] si [X]. Folosind func tia de reparti tie,
s a se calculeze probabilit a tile P (8 X 12), P (5 X 15).
Rezolvare. Variabila aleatoare X este repartizat a binomial. Proba-
bilitatea cu care X ia o valoare oarecare este P (X = k) = C
k
n
p
k
q
nk
,
unde n = 20 este num arul de experiente, p = q =
1
2
sunt proba-
bilit atile de aparitie a celor dou a fete ale monezii la o aruncare, iar
k = 0, 20 parcurge multimea valorilor lui X. Urm atorul program n
Matlab determin a tabloul de repartitie al v. a. X.
% Aruncarea monezii
% Probabilitatea aparitiei stemei
% Functia de repartitie
clear;
clc;
format short g;
n=20;
p=1/2;
q=1/2;
X=0:n;
for k=0:n
P(k+1)=mfun(binomial,n,k)*p^k*q^(n-k);
end
F(1)=0;
for k=1:n
F(k+1)=F(k)+P(k);
end
for k=0:n
fprintf(%2g %14g %14.6g\n,X(k+1), P(k+1), F(k+1));
end
m=sum(X.*P);
d=sum(X.^2.*P)-m^2;
s=sqrt(d);
fprintf(M[X]=%g\n,m);
fprintf(D[X]=%g\n,d);
fprintf(sigma[X]=%g\n,s);
fprintf(P(8<=X<=12)=%g\n,F(12+1+1)-F(8+1));
fprintf(P(5<=X<=15)=%g\n,F(15+1+1)-F(5+1));
subplot(1,2,1)
stem(X,P);
title(Functia probabilitatilor);
subplot(1,2,2);
hold on;
for k=1:n
plot([X(k) X(k+1)], [F(k+1) F(k+1)]);
end;
axis([0 20 0 1.1]);
hold off;
Rezultatele obtinute la rularea programului sunt
k P (X = k) F (k)
0 9.53674e 007 0
1 1.90735e 005 9.53674e 007
2 0.000181198 2.00272e 005
3 0.00108719 0.000201225
4 0.00462055 0.00128841
5 0.0147858 0.00590897
6 0.0369644 0.0206947
7 0.0739288 0.0576591
8 0.120134 0.131588
9 0.160179 0.251722
10 0.176197 0.411901
11 0.160179 0.588099
12 0.120134 0.748278
13 0.0739288 0.868412
14 0.0369644 0.942341
15 0.0147858 0.979305
16 0.00462055 0.994091
17 0.00108719 0.998712
18 0.000181198 0.999799
19 1.90735e 005 0.99998
20 9.53674e 007 0.999999
M[X] = 10
D[X] = 5
sigma[X] = 2.23607
P(8 <= X <= 12) = 0.736824
P(5 <= X <= 15) = 0.988182
Graficele sunt reprezentate n figura 2.8.
0 5 10 15 20
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
Functia probabilitatilor
x
f
(
x
)
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
x
F
(
x
)
Figura 2.8.
Problema 2.21. n cadrul alegerilor un partid a acumulat 15% din
voturi. Cte persoane n medie este necesar de chestionat dup a vot
pentru a g asi un num ar de 100 de voturi acordate partidului dat.
Rezolvare. Probabilitatea ca o persoan a s a fi votat cu partidul dat es-
te p = 0.15. Variabila aleatoare X cu valorile egale cu num arul de per-
soane chestionate are repartitie geometric a, deci X Geom(0, 15).
Media variabile aleatoare X este M [X] =
1
p
=
1
0.15
=
20
3
6.67.
Num arul de persoane necesar de chestionat este 100M [X] 100
6.67 = 667.
Problema 2.22. S a se reprezinte grafic func tia de probabilitate si
func tia de reparti tie a unei variabile aleatoare X repartizate geometric
cu p = 0.2.
Rezolvare. Cum multimea valorilor variabilei aleatoare este N
, ne
limit am la a calcula tabloul de repartitie al lui X pentru primele n =
20 valori. Urm atorul program n Matlab calculeaza si afiseaz a grafic
functia de probabilitate si functia de repartitie ale lui X.
% Functia de probabilitate si
% functia de repartitie ale unei
% variabile repartizate geometric
clear;
clc;
format short g;
n=20;
p=1/5;
q=4/5;
X=1:n;
for k=1:n
P(k)=p*q^(k-1);
end
F(1)=0;
for k=1:n-1
F(k+1)=F(k)+P(k);
end
for k=1:n
fprintf(%2g %14g %14.6g\n,X(k), P(k), F(k));
end
subplot(1,2,1)
stem(X,P);
title(Functia de probabilitate);
subplot(1,2,2);
hold on;
for k=1:n
plot([X(k)-1 X(k)], [F(k) F(k)]);
end;
axis([0 20 0 1.1]);
hold off;
Se obtin urm atoarele rezultate:
k P (X = k) F (k)
1 0.2 0
2 0.16 0.2
3 0.128 0.36
4 0.1024 0.488
5 0.08192 0.5904
6 0.065536 0.67232
7 0.0524288 0.737856
8 0.041943 0.790285
9 0.0335544 0.832228
10 0.0268435 0.865782
11 0.0214748 0.892626
12 0.0171799 0.914101
13 0.0137439 0.931281
14 0.0109951 0.945024
15 0.00879609 0.95602
16 0.00703687 0.964816
17 0.0056295 0.971853
18 0.0045036 0.977482
19 0.00360288 0.981986
20 0.0028823 0.985588
0 5 10 15 20
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
Functia de probabilitate
x
f
(
x
)
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
x
F
(
x
)
Figura 2.9.
Secventa de program Mathematica:
f[k_]:=PDF[GeometricDistribution[ 0.2],k]
Show[dd1,p1,Axes\[Rule]Automatic];
5 10 15 20
0.05
0.1
0.15
0.2
Figura 2.10.
Plot[CDF[GeometricDistribution[0.2], k],
{k, 0, 20}, AxesOrigin -> Automatic,
PlotRange -> {0, 1}, AspectRatio -> 1];
5 10 15 20
0.2
0.4
0.6
0.8
1
Figura 2.11.
Problema 2.23. ntr-un magazin intr a n medie n fiecare minut trei
persoane. S a se calculeze probabilitatea ca ntr-un minut n magazin
a) s a nu intre nici o persoan a; b) s a intre 2 persoane; c) s a intre
cel pu tin 2 persoane.
Rezolvare. Variabila aleatoare X cu valorile egale cu num arul de
persoane are repartitie Poisson. Fie parametrul repartitiei. Cum
media persoanelor intrate n magazin ntr-un minut este 3, rezult a c a
M [X] = 3 = . Este necesar s a se calculeze P (X = 0), P (X = 2),
P (X 2). Probabilitatea ca X s a ia o valoare oarecare k N este
P (X = k) =

k
k!
e
. Calculnd primele cteva coloane ale tabloului

de repartitie, obtinem
X :

0 1 2 3 . . .
0.04979 0.14936 0.22404 0.22404
.
Avem deci
P (X = 0) = 0.04979, P (X = 2) = 0.22404,
P (X 2) = 1 P (X < 2) = 1 (0.04979 + 0.14936) = 0.80085.
toarele:
1. Notiunea de variabil a aleatoare discret a.
2. Determinarea functiei de repartitie a variabilei aleatoare dis-
crete.
3. Calculul mediei si dispersiei unei variabile aleatoare discrete.
4. Folosirea inegalit atii lui Cebsev.
5. Determinarea probabilit atilor folosind functia de repartitie.
6. ntelegerea sensului fiec arei v. a. discret distribuite.
7. Selectarea v. a. discrete potrivite aplicatiei studiate.
Sintetiz am n urm atorul tabel v. a. discrete studiate:
Repartitia p
i
M [X] D[X] Observatii
uniform
discret a
X UnifD[m, n]
1
n
m+
n1
2
n
2
1
12
binomial a
X Bin[n, p]
C
i
n
p
i
q
ni
np npq
lim
n
C
i
n
p
i
q
ni
=
=

i
i!
e
np =
binomial a cu
exponent
negativ
XNegBin[m,p]
C
m1
m+i1
p
m
q
i
m
p
mq
p
2
hiper-
geometrica
X Hip [n, k, N]
C
i
k
C
ni
Nk
C
n
N
np
np(1p)(Nn)
N1
lim
N
C
i
k
C
ni
Nk
C
n
N
=
= C
k
n
p
k
q
nk
Poisson
X Pois []

i
i!
e

geometric a
X Geom[p]
pq
i1
1
p
q
p
2
Capitolul 3
Variabile aleatoare continue
3.1 Functia de repartitie
n cele ce urmeaz a {F, , P} este un cmp de probabilitate.
Definitia 3.1. Fie X o v. a. Se numeste func tie de reparti tie a lui X
(sau func tie de distribu tie cumulativ a) functia real a
F
X
: R [0, 1] , F
X
(x) = P(X x). (3.1)
Rezult a c a oric arui num ar real x i se asociaz a prin functia de repar-
titie F un num ar care reprezint a probabilitatea ca valorile lui X s a fie
mai mici sau egale cu x si acest lucru este posibil deoarece n definitia
v. a. X avem {X x} F.
Observatia 3.1. Unele tratate de teoria probabilit atilor denesc func-
tia de repartitie prin formula
F
X
(x) = P(X < x), x R.
n cele ce urmeaz a vom folosi formula (3.1) n definirea functiei de
repartitie, n parte si datorit a faptului c a softul utilizat, Matlab si
Mathematica, folosesc aceeasi abordare.
Pentru a demonstra propriet atile functiei de repartitie vom folosi
urm atoarea propozitie:
Propozitia 3.1. a) Fie A
1
A
2
A
n
A
n+1
un sir
cresc ator de evenimente si A =
S
n1
A
n
. Atunci P(A) = lim
n
P(A
n
).
b) Fie B
1
B
2
B
n
B
n+1
un sir descresc ator de
evenimente si B =
T
n1
B
n
. Atunci P(B) = lim
n
P(B
n
).
95
96 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE
Demonstratie. a) Putem scrie
A = A
1
(A
2
\ A
1
) (A
3
\ A
2
) (A
n
\ A
n1
) . . . ,
unde termenii reuniunilor sunt evenimente incompatibile. Atunci,
tinnd seama de propriet atile probabilit atii obtinem:
P(A) = P(A
1
) + (P(A
2
) P(A
1
)) + (P(A
3
) P(A
2
)) + +
+(P(A
n
) P(A
n1
)) + = P(A
1
) +

X
n=2
(P(A
n
) P(A
n1
)) =
= P(A
1
) + lim
k
k
X
n=2
(P(A
n
) P(A
n1
)) = lim
k
P(A
k
).
b) Fie A
n
= B
n
, n 1 si A = B. Sirul A
n
astfel construit este un
sir cresc ator si A = B =
T
n1
B
n
=
S
n1
B
n
=
S
n1
A
n
. Conform a) avem
P(A) = lim
n
P(A
n
).
Rezult a 1 P(B) = lim
n
(1 P(B
n
)) = 1 lim
n
P(B
n
).
Teorema 3.1. Urm atoarele afirma tii sunt adev arate:
1. Dac a x
1
x
2
, atunci F
X
(x
1
) F
X
(x
2
), x
1
, x
2
R;
2. F
X
(x + 0) = lim
x
n
&x
F(x
n
) = F
X
(x), x R (F
X
este continu a la
dreapta);
3. lim
x
F
X
(x) = 0;
4. lim
x+
F
X
(x) = 1.
Demonstratie. 1. Observ am c a dac a x
1
x
2
atunci {X x
1
}
{X x
2
} si aplicnd monotonia functiei de probabilitate rezult a
F
X
(x
1
) = P(X x
1
) P(X x
2
) = F
X
(x
2
).
Pentru demonstrarea 2, 3 si 4 este nevoie de proprietatea de conti-
nuitate a probabilit atii. Aceat a proprietate este formulat a n Propozi-
tia 3.1.
CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE 97
2. Pentru orice x R avem
F
X
(x + 0) = lim
n
F
X
x +
1
n
= lim
n
P

X x +
1
n
=
= lim
n
P

T
n1
X x +
1
n
= P (X x) = F
X
(x).
Am folosit faptul c a
{X x + 1}
X x +
1
2
X x +
1
n
. . . ,
T
n=1
X x +
1
n
= {X x} si proprietatea de continuitate a proba-

bilit atii.
3. Fie B
n
= {X n}. Atunci
lim
x
F
X
(x) = lim
n
F
X
(n) = lim
n
P(X n) = lim
n
P(B
n
).
Dar (B
n
) este unsir descresc ator de evenimente si

T
n=1
B
n
= . Rezult a,
aplicnd proprietatea de continuitate a probabilit atii,
lim
x
F
X
(x) = lim
n
P(B
n
) = lim
n
P

T
n=1
B
n
= P() = 0.
4. Fie A
n
= {X < n}. Observ am c a (A
n
) este un sir cresc ator
de evenimente,

S
n=1
A
n
= (epuizeaz a toate valorile v. a. X) si
datorit a continuit atii lui P obtinem lim
x+
F
X
(x) = lim
n+
F
X
(n) =
lim
n
P(A
n
) = lim
n
P

S
n=1
A
n
= P() = 1.
Teorema 3.2. Fie F
X
: R [0, 1] func tia de reparti tie a unei v. a.
X. Atunci pentru orice numere reale a < b avem:
a) P(X > a) = 1 F
X
(a),
P(X < a) = F
X
(a 0),
P(X a) = 1 F
X
(a 0).
b) P(a X < b) = F
X
(b 0) F
X
(a 0),
P(a < X < b) = F
X
(b 0) F
X
(a),
P(a < X b) = F
X
(b) F
X
(a),
P(a X b) = F
X
(b) F
X
(a 0).
Demonstratie.
a) P(X > a) = P({X a}) = 1 P(X a) = 1 F
X
(a),
P(X < a) = P

T
i=1
X a
1
n
= F
X
(a 0),
P(X a) = P({X < a}) = 1 P(X < a) = 1 F
X
(a 0).
b) {a X < b} = {X < b} \ {X < a}, {X < a} {X < b}
P (a X < b) = F
X
(b 0) F
X
(a 0). Analog rezult a si celelalte
relatii.
Exercitiul 3.1. S a presupunem c a pentru o v. a. Y functia de repar-
titie este
F
Y
(x) =
_
_
0 pentru x 0
x
2
2
pentru 0 < x < 1
1 pentru x 1.
.
S a se calculeze P

Y <
1
2
si P

Y
2
1
2
.
Rezolvare. P

Y <
1
2
= F
Y
1
2
0
= F
Y
1
2
=
1
8
,
P

Y
2
1
2
= 1 P

Y
2
<
1
2
= 1 P

2
< Y <
1
=
= 1 F
Y
2
0
+F
Y
= 1
1
4
+ 0 =
3
4
.
3.2 Densitatea de probabilitate
Definitia 3.2. Spunem c a v. a. X este de tip continuu cu densitatea
de probabilitate f
X
: R R dac a functia de repartitie F
X
: R R
este continu a, derivabil a pe subintervale si f
X
(x) = F
0
X
(x) n punctele
de derivabilitate.
Propriet atile densit atii de probabilitate
Teorema 3.3. Fie X o v. a. continu a cu densitatea de probabilitate
f
X
. Atunci:
a) f
X
(x) 0, x R,
b) F
X
(x) =
Z
x
f
X
(t)dt, (3.2)
c)
Z

f
X
(x)dx = 1, (3.3)
d) P(a < X b) =
Z
b
a
f
X
(x)dx, a, b R, a < b. (3.4)
Demonstratie. a) Deoarece F
X
este monoton cresc atoare conform
Teoremei 3.1, rezult a c a derivata ei este pozitiv a adic a f
X
(x) 0,
x R.
b) f
X
(x) = F
0
X
(x)
Z
x
F
0
X
(x)dt =
Z
x
f
X
(t)dt
F
X
(x) lim
x
F
X
(x) =
Z
x
f
X
(t)dt F
X
(x) =
Z
x
f
X
(t)dt.
c) F
X
(x) =
Z
x
f
X
(t)dt lim
x+
F
X
(x) = lim
x+
Z
x
f
X
(t)dt
1 =
Z

f
X
(x)dx.
d) Demonstr am P(a < X b) =
b
R
a
f
X
(x)dx. ntr-avev ar,
P (a < X b) = F
X
(b) F
X
(a) =
=
Z
b
f
X
(t)dt
Z
a
f
X
(t)dt =
Z
b
a
f
X
(t)dt.
Observ am c a f este utilizat a pentru a calcula o arie care reprezint a
probabilitatea ca v. a. X s a ia valori n intervalul (a, b].
Observatia 3.2. n cazul v. a. continue, oricare ar fi x R, avem
P (X = x) = 0. Deoarece n orice punct probabilitatea este zero nu
facem distinctie ntre < si ,
P(a < X b) = P(a X < b) = P (a < X < b) = P(a X b).
3.3 Caracteristici numerice ale v. a. con-
tinue
Definitia 3.3. Fie X o v. a. avnd densitatea de probabilitate f.
Definim
Media: M [X] =
Z

xf(x)dx = m,
Dispersia: D[X] =
Z

(x M [X])
2
f(x)dx,
Abaterea medie p atratic a: =
p
D[X],
n ipoteza c a integralele respective sunt convergente.
La fel se denesc, n ipoteza c a integralele respective sunt conver-
gente,
Momentul (ini tial) de ordin k: k 1, M

X
k
=
Z

x
k
f(x)dx,
Momentul centrat de ordin k: k 1,
M

(X m)
k
=
Z

(x M [X])
k
f(x)dx.
Observatia 3.3. Momentul centrat de ordinul trei, M [(X m)
3
],
caracterizeaz a asimetria gracului densit atii de probabilitate a v. a.
X n raport cu dreapta de ecuatie x = M [X]. Se utilizeaz a coecientul
de asimetrie =
M
[
(Xm)
3
]
3
.
Momentul centrat de ordinul patru, M [(X m)
4
], ndic a gradul
de aplatizare al gracul densit atii de repartitie a lui X. Se utilizeaz a
coecientul de boltire =
M
[
(Xm)
4
]
4
. Pentru comparatie se foloseste
curba de repartitie normal a pentru care = 3. M arimea = 3
reprezint a diferenta de boltire a unei repartitii studiate fat a de repar-
titia normal a si se numeste exces.
Definitia 3.4. Se numeste moda v. a. X acea valoare a v. a. pentru
care densitatea de probabilitate are valoare maxim a.
Observatia 3.4. Dac a X este o v. a. de tip continuu cu densitatea
de probabilitate f, atunci f
0
(x
m
) = 0, f
00
(x
m
) < 0.
Definitia 3.5. Numim mediana v. a. X acea valoare x
0.5
a lui X
pentru care
P (X x
0.5
) = 0.5.
Aceast a relatie se poate scrie, dac a cunostem densitatea de proba-
bilitate, de forma F(x
0.5
) =
Z
x
0.5
f(x)dx = 0.5, adic a dreapta x = x

0.5
mparte aria cuprins a ntre graficul lui f si axa Ox n dou a p arti egale.
Propozitia 3.2. (Inegalitatea lui Ceb sev) Dac a variabila aleatoare X
este de tip continuu cu media m si dispersia
2
, atunci are loc
P(|X m| < ) 1

2
2
, > 0, (3.5)
sau echivalent
P(|X m| ) <

2
2
, > 0.
Demonstratie. Dispersia este dat a de
2
=
Z

(x m)
2
f(x)dx =
=
Z
m
(x m)
2
f(x)dx +
Z
m+
m
(x m)
2
f(x)dx +
Z
+
m+
(x m)
2
f(x)dx.
Din faptul c a x / (m , m + ), rezult a (x m)
2

2
si dispersia
poate fi minorat a prin
2

2
Z
m
f(x)dx +
Z

m+
f(x)dx
=
2
1
Z
m+
m
f(x)dx
,
deoarece

R
f(x)dx = 1. Ultima parantez a se poate scrie
2

2
(1 P (|X m| < )) ,
care este echivalent a cu relatia (3.5).
Problema 3.1. Timpul mediu de r aspuns al unui calculator este de
15 secunde pentru o anumit a opera tie, cu abaterea medie p atratic a 3
secunde. Estima ti probabilitatea ca timpul de r aspuns s a se abat a cu
mai pu tin de 5 secunde fa t a de medie.
Rezolvare. Vom folosi inegalitatea lui Cebsev. Avem
P(|X 15| < 5) 1
9
25
= 0.64.
Definitia 3.6. Sirul {X
n
}
nN
converge n probabilitate c atre X (vom
folosi notatia {X
n
}
prob
X) dac a
> 0 : lim
n
P({ | |X
n
() X()| > }) = 0 (3.6)
sau, echivalent,
> 0 : lim
n
P({ | |X
n
() X()| }) = 1. (3.7)
Una din cele mai importante aplicatii ale convergentei n probabi-
litate este forma slab a a legii numerelor mari a lui Bernoulli.
Corolarul 3.1. Fie X
n
un sir de v. a. avnd medie si dispersie astfel
nct lim
n
D[X
n
] = 0. Atunci {X
n
M [X
n
]}
prob
0 (convergent a n
probabilitate).
Demonstratie. Se stie c a sirul de v. a. (X
n
) converge n probabilitate
c atre X dac a > 0, lim
n
P (|X
n
X| ) = 0.
n cazul acestui corolar avem aplicnd inegalitatea lui Cebsev,
> 0, 0 lim
n
P (|X
n
M [X
n
]| ) lim
n
D[X
n
]
2
= 0. Rezultatul
se obtine aplicnd lema clestelui.
Teorema 3.4. (Forma slaba a legii numerelor mari a lui Bernoulli) Fie
X
n
un sir de v. a. independente avnd aceea si medie si dispersiile
egal majorate (adic a exist a C > 0 astfel nct n 1, D[X
n
] C).
Atunci

1
n
(X
1
+ +X
n
)
prob
m (n probabilitate).
Demonstratie. Stim c a M [X
i
] = m, D[X
i
] C. Not am
Y
n
=
1
n
(X
1
+ +X
n
) si, deoarece v. a. sunt independente, avem
M [Y
n
] = m si
D[Y
n
] =
1
n
2
D[X
1
+ +X
n
]
1
n
2
(D[X
1
] + +D[X
n
])
C
n
0.
Aplicnd Corolarul 3.1 rezult a c a
Y
n
M [Y
n
] =
1
n
(X
1
+ +X
n
) m 0
(convergent a n probabilitate).
Observatia 3.5. Dac a v. a. X
n
sunt identic distribuite si indepen-
dente nu mai este necesar a conditia ca dispersiile s a fie egal majorate.
Exemplul 3.1. Presupunem c a se efectueaz a serii de experiente Ber-
noulli cu P(A) = p. Pentru orice n not am
X
n
=

1 dac a la experimentul n se produce A
0 dac a la experimentul n nu se produce A
.
Matricea de repartitie a lui X
n
este X
n
:
1 0
p 1p
, deci M[X
n
] = p,
D[X
n
] = p(1p). Conform legii numerelor mari a lui Bernoulli rezult a
c a
1
n
(X
1
+ +X
n
) p.
Dar X
1
+ + X
n
reprezint a num arul de realiz ari ale lui A dup a
primele n experimente, adic a frecventa relativ a lui A, notat a n statis-
tic a cu f
n
(A). Am ar atat astfel c a f
n
(A)
prob
p, deci un rezultat de
stabilitate statistic a.
Ca aplicatie la legea numerelor mari analiz am urm atoarea prob-
lem a:
Problema 3.2. n dou a spitale, S1 si S2 sunt 20 si respectiv 200 de
na steri pe zi. Num ar am ntr-un an zilele din fiecare spital n care s-au
n ascut mai mult de 60% b aie ti ntr-o zi. Care spital are mai multe
astfel de zile, stiind c a probabilitatea de a se na ste o fat a sau un b aiat
este aceea si?
Rezolvare. R aspunsul la aceast a ntrebare este legat de legea nu-
merelor mari care spune c a probabilitatea este mai mare n S1 deoarece
num arul nasterilor ntr-o zi ind mai mare n S2, frecventa relativ a
a num arului de b aieti n ascuti tinde c atre probabilitatea de a se naste
un b aiat, adica la 0.5.
Vom folosi simularea pentru a verifica acest r aspuns. Not am cu 1
nasterea unui b aiat si cu 0 nasterea unei fete ntr-o zi. Pentru a calcula
procentul de b aieti dintr-o list a de zile simulate cu nasteri, vom defini
functia f.
f[x_] := Module[{sum},
sum = Apply[Plus, x];
boys = sum/Length[x] // N]
Putem simula modelul nasterilor copiilor cu o distributie Bernoulli
cu p = 0.5. nc arc am pachetul <<StatisticsDiscreteDistributions si
simul am 20 de nasteri pe zi pe parcursul a 365 de zile folosind Ran-
domArray mpreun a cu BernoulliDistribution. Datele obtinute vor fi
notate sp1 pentru spitalul S1 si sp2 pentru spitalul S2.
<< StatisticsDiscreteDistributions
sp1 = RandomArray[BernoulliDistribution[0.5], {365, 20}];
Short[sp1, 5]
{{0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1},
{0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1},
<<361>>, {0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1},
{1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0}}
Comanda Short afiseaz a 5 zile simulate si anume primele dou a si
ultimele trei. Rezultatul din prima zi, de exemplu, l interpret am
astfel: s-au n ascut dou a fete, apoi un b aiat, dou a fete, patru b aieti
etc.
Pentru a determina procentul de b aieti din fiecare zi folosim Map
pentru a aplica f listei sp1. Dup a ce nc arc am pachetul <<Statistics
DataManipulation, folosim BinCounts pentru a determina num arul
zilelor n care s-au n ascut mai mult de 60% b aieti.
boys1 = Map[f, sp1];
BinCounts[boys1,{0,1,.1}]
{0,3,15,76,116,108,40,7,0,0}
BinCounts[boys1,{0.6,1,0.4}]
{47}
Acelasi procedeu l aplic ampentru simularea nasterilor din al doilea
spital.
sp2=RandomArray[BernoulliDistribution[0.5],{365,200}];
boys2=Map[f,sp2];
{0,0,0,0,203,162,0,0,0,0}
{0}.
La o a doua simulare vom obtine
Short[sp1,5]
{{1,0,1,1,1,1,1,1,0,0,0,1,1,0,0,1,0,0,0,1},
{1,0,0,1,1,1,1,1,0,1,1,0,1,1,0,0, 1,1,1,0},<<361>>,
{1,1,1,1,0,1,1,0,1,0,1,1,0,0,0,0,0,1,1,1},
{1,1,1,0,0,1,1,0,1,0,0,0,1,0,0,0,1,1,0,0}}
boys1=Map[f,sp1];
{0,1,17,73,113,103,52,5,1,0}
{58}
Take[sp2,2]
{{0,1,1,0,0,0,1,0,1,0,0,0,0,1,1,0,1,0,0,0,1,1,1,0,1,0,0,0,0,1,0,0,1,0,1,
1,0,0,1,1,1,0,1,0,1,0,1,1,0,0,1,0,0,0,1,0,1,0,1,1,0,1,1,1,1,0,0,1,1,0,0,
1,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,1,0,0,1,0,0,1,0,1,0,1,0,1,1,1,0,0,0,1,
1,0,0,1,1,1,1,1,1,0,0,1,1,0,0,0,0,0,0,0,0,1,0,0,1,1,1,1,1,0,0,1,1,1,1,1,
0,0,1,0,1,1,0,0,1,1,0,1,0,0,0,0,1,1,0,0,1,0,0,1,0,1,1,0,1,0,0,0,1,0,0,0,
0,0,1,0,1,0,1,1,0,0,1,0,1,0,1,1,0,0,1,1,1},{1,0,0,0,1,0,0,0,0,0,0,1,0,1,
0,1,0,0,0,0,1,0,1,1,0,0,0,0,0,1,0,0,1,0,1,0,1,0,1,0,1,0,0,0,1,1,1,0,1,1,
1,1,0,0,0,1,0,1,1,0,1,0,1,1,0,0,0,1,0,0,0,1,1,1,1,1,1,1,0,1,0,1,1,0,1,0,
1,0,0,0,1,0,1,1,0,1,0,0,1,0,0,0,0,0,0,1,1,0,1,0,1,1,0,1,1,0,0,0,1,0,0,1,
0,0,1,1,1,1,0,1,0,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,0,1,0,0,0,0,0,1,1,1,0,
1,0,1,1,0,0,0,1,1,0,1,0,0,0,1,1,0,1,0,1,0,1,1,0,1,1,1,1,0,1,1,1,0,0,0,0,
0,0,1,1,0,0}}
boys2=Map[f,sp2];
{0,0,0,2,195,167,1,0,0,0}
{1}
3.4 Legi clasice de repartitie
3.4.1 V. a. distribuit a uniform
Cea mai simpl a v. a. continu a este cea repartizat a uniform.
Definitia 3.7. Se spune c a v. a. X este distribuit a uniform pe inter-
valul [a, b], a < b, notat X Unif [a, b], dac a densitatea de probabil-
itate este de forma
f
X
: R R, f
X
(x) =
(
1
b a
, dac a x [a, b]
0, n caz contrar
.
Teorema 3.5. Dac a v. a. X este distribuit a uniform pe intervalul
[a, b], a < b, atunci
F
X
(x) =
_
_
0, dac a x < a
x a
b a
, dac a x [a, b]
1, dac a x > b
, M [X] =
a +b
2
, D[X] =
(b a)
2
12
.
Demonstratie. Calcul am functia de repartitie.
Pentru x < a F
X
(x) =
Z
x
f
X
(t)dt = 0,
Pentu x [a, b] F
X
(x) =
Z
x
f
X
(t)dt =
Z
x
a
1
b a
dt =
x a
b a
,
Pentru x > b F
X
(x) =
Z
x
f
X
(t)dt =
Z
b
a
1
b a
dt = 1, deci
F
X
(x) =
_
_
0, dac a x < a
x a
b a
, dac a x [a, b]
1, dac a x > b
.
M [X] =
Z

xf (x) dx =
Z

x
b a
dx =
a +b
2
,
D[X] =
Z

(x M [X])
2
f(x)dx =
=
Z
b
a
x
a +b
2
2
1
b a
dx =
(b a)
2
12
.
Exemplul 3.2. ncepnd cu ora 5 dimineata la fiecare jum atate de
or a exist a o curs a de la localitatea U la localitatea V. Presupunem
c a la fiecare curs a exist a locuri libere n plus fat a de cele rezervate.
O persoan a vrea s a se deplaseze de la localitatea U la localitatea V.
Ea ajunge la un moment arbitrar ntre orele 8.45 si 9.45. Care este
probabilitatea ca s a astepte:
a) cel mult 10 minute,
b) cel putin 15 minute.
Rezolvare. Pentru c a persoana ajunge la un moment arbitrar la
punctul de plecare ntre orele 8.45 si 9.45, v. a. X care ia ca valori
momentul n care a ajuns persoana este distribuit a uniform pe inter-
valul [0, 60],
f(x) =

1
60
, x [0, 60]
0, x / [0, 60]
.
a) pentru ca persoana s a astepte cel mult 10 minute trebuie s a
ajung a cu 10 minute inainte de plecarea cursei, adic a ntre orele 8.50 si
9 sau 9.20 si 9.30. Aceasta nseamn a c a 5 X 15 sau 35 X 45,
P ({5 X 15} {35 X 45}) =
= P (5 X 15) +P (35 X 45) =
Z
15
5
dx
60
+
Z
45
35
dx
60
=
1
3
.
b) pentru ca persoana s a astepte cel putin 15 minute dac a ajunge
la locul de plecare ntre orele 9 si 9.15 sau 9.30 si 9.45. Rezult a c a
15 X 30 sau 45 X 60,
P ({15 X 30} {45 X 60}) =
= P (15 X 30) +P (45 X 60) =
Z
30
15
dx
60
+
Z
60
45
dx
60
=
1
2
.
3.4.2 V. a. distribuit a exponential
Definitia 3.8. O variabil a aleatoare X este distribuit a exponen tial
cu parametrul > 0, si se scrie X Exp [] dac a are densitatea de
probabilitate de forma
f : R R, f(x) =

0, dac a x 0
e
x
, dac a x > 0.
(3.8)
5 3.75 2.5 1.25 0
5
3.75
2.5
1.25
0
x
y
x
y
Figura 3.1.
n figura 3.1 sunt desenate graficele densit atilor de probabilitate
pentru valorile parametrului = 1 (negru), 2 (verde) si 5 (rosu).
Denumirea de v. a. distribuit a exponential provine de la faptul
c a densitatea de probabilitate este exprimat a cu ajutorul unei functii
exponentiale. L as am ca exercitiu demonstrarea urm atorului rezultat.
Teorema 3.6. Dac a X este o v. a. distribuit a exponen tial
F
X
(x) =

0, dac a x 0
1 e
x
, dac a x > 0,
atunci M [X] =
1
, D[X] =
1
2
.
n figura 3.2 sunt desenate graficele functiei de repartitie pentru
valorile parametrului = 1, 2 si 5.
5 2.5 0 -2.5 -5
1
0.75
0.5
0.25
0
x
y
x
y
Figura 3.2.
O proprietate important a a distributiei exponentiale este legat a de
probabilit atile conditionate si anume proprietatea acestei v. a. de a
nu avea memorie.
Exemplul 3.3. Fie X v. a. care ia ca valori timpul scurs intre dou a
detect ari ale particulelor de c atre contorul Geiger (acest contor de-
tecteaz a radiatiile naturale , , , m asoar a radioactivitatea mediului
nconjur ator). Aceast a v. a. urmeaz a o distributie exponential a cu
media M [X] = 1.4 minute. Probabilitatea de a detecta o particul a
n decurs de 30 secunde (adic a 0.5 minute) de la pornirea detectorului
este
P (X 0.5) = F
X
(0.5) = 1 e
0.5
1.4
= 0.3.
Facem un nou experiment si oprim contorul. Pornim din nou con-
torul si astept am trei minute f ar a a detecta o particul a. Care este
probabilitatea ca particula s a fie detectat a n urm atoarele 30 de se-
cunde?
Rezolvare. Probabilitatea cerut a este, tinnd seama de definitia
probabilit atilor conditionate,
P ({X < 3.5} | {X > 3}) =
P (3 < X < 3.5)
P (X > 3)
=
=
F
X
(3.5) F
X
(3)
1 F
X
(3)
=
e
3
1.4
e
3.5
1.4
e
3
1.4
= 0.3.
Dup a asteptarea a trei minute f ar a a detecta nici o particul a, pro-
babilitatea de a detecta o particul a n urm atoarele 30 de secunde este
aceeasi cu probabilitatea de a detecta o particul a n primele 30 de
secunde. Aceasta este proprietatea de pierdere a memoriei pentru
v. a. repartizate exponential.
Demonstratia urm atoarei teoreme o l as am ca exercitiu.
Teorema 3.7. (Proprietatea de pierdere a memoriei) Dac a X Exp []
atunci pentru t
1
, t
2
> 0 are loc rela tia
P ({X < t
1
+t
2
} | {X > t
1
}) = P (X < t
2
) .
Exemplul 3.4. Momentul primei defect ari a unui dispozitiv este o v. a.
repartizat a exponential cu parametrul =
1
TMBF(D)
, unde TMBF(D)
reprezint a timpul mediu de bun a functionarea dispozitivului D. n
practic a acesta se determin a prin experiment statistic. De exem-
plu se urm aresc n dispozitive identice ncepnd cu momentul t = 0
si se noteaz a momentele primei defect ari ale lor t
1
, t
2
, . . . , t
n
. Atunci
TMBF(D) =
t
1
+t
2
+ +t
n
n
si deci =
n
t
1
+t
2
+ +t
n
.
Presupunem c a un dispozitiv D are TMBF(D) = 1000 ore. S a se
calculeze probabilitatea ca D s a functioneze cel putin 200 ore.
Rezolvare. Conform celor prezentate rezult a c a =
1
1000
si proba-
bilitatea cerut a este P (X 200) = 1 P (X < 200) = 1 F(200) =
11+e
200
1000
= e
0.2
= 0.81873. n figura 3.3 este reprezentat gracul
densit atii de probabilitate pentru dat.
6250 5000 3750 2500 1250 0
0.001
0.00075
0.0005
0.00025
0
yy
Figura 3.3.
Proprietatea de pierdere a memoriei a distributiei exponentiale
ne spune c a dispozitivele nu se uzeaz a. Dac a apar n functionarea
dispozitivelor unele uz ari mecanice, nu mai poate fi modelat timpul
de functionare a unui dipozitiv cu ajutorul acestei distributii si se
foloseste n practic a o alt a distributie si anume distributia Weibull.
3.4.3 V. a. distribuit a Weibull
Distributia Weibull Weib(n, a, b), a R, b > 0, este utilizat a n pe
scar a larg a n inginerie la modelarea num arului de defecte care apar
la diferite dispozitive care se uzeaz a n timp, care descresc o dat a cu
timpul (la unii semiconductori) sau care se produc datorit a unor socuri
exterioare sistemului. Aceast a distributie mai este folosit a si n teoria
sigurantei.
Definitia 3.9. V. a. X este distribuit a Weibull, X Weib(a, b) dac a
are densitatea de probabilitate
f(x) =
(
a
b
x
b
a1
e
(
x
b
)
a
, x > 0
0, x 0
.
Desen am graficul distributiei Weibull pentru valorile a = 1, b = 1
(negru), a = 2, b = 3 (rosu), a = 2, b = 6 (verde), a = 3, b = 6
(albastru) (figura 3.4).
10 7.5 5 2.5 0
1
0.75
0.5
0.25
0
yy
Figura 3.4.
Teorema 3.8. Dac a X Weib(a, b) atunci F
X
(x) = 1 e
(
x
b
)
a
,
M [X] = b
1 +
1
a
, D[X] = b
2
1 +
2
a
1 +
1
a
2
.
Demonstratie. M [X] =
Z

0
x
a
b
x
b
a1
e
(
x
b
)
a
dx. Facem schim-
barea de variabil a u =

x
b
a
x = (u)
1
a
b, dx =
1
a
u
1
a
1
bdu, de unde
rezult a c a
M [X] =
Z

0
a
b
a
u
1
a
b
a
e
u
1
a
u
1
a
1
bdu = b
Z

0
u
1
a
e
u
du = b
1 +
1
a
.
Analog, folosind faptul c a D[X] = M [X
2
] (M [X])
2
se obtine
expresia dispersiei.
Exercitiul 3.2. Timpul de defectare n ore a unui sistem mecanic
este modelat cu ajutorul unei v. a. Weibull cu a = 2, b = 500 ore.
Determinati timpul mediu pn a la prima defectare.
Rezolvare. Din expresia mediei rezult a c a
M [X] = b
1 +
1
a
= 500 (
3
2
) = 500
1
2
(
1
2
) = 250
= 443.11.
S a determin am probabilitatea ca defectarea s a se produc a dup a 500
de ore.
P (X > 500) = 1 P (X 500) = 1 F
X
(500) = e
1
= 0.36788.
Concluzia: doar 36% din sisteme se defecteaz a dup a 500 de ore.
Graficul densit atii de probabilitate n acest caz este prezentat n figu-
ra 3.5.
1000 750 500 250 0
0.0015
0.00125
0.001
0.00075
0.0005
0.00025
0
x
y
x
y
Figura 3.5.
Observatia 3.6. Pentru a = 1, b = 1 se obtine distributia expo-
nential a.
3.4.4 V. a. distribuit a gama
O generalizare a distributiei exponentiale este distributia gama.
Reamintim functia gama si cteva propriet ati ale acesteia.
Se numeste functie gama, functia (p)=
Z

0
x
p1
e
x
dx, unde p > 0.
Functia are proprietatea (p) = (p 1)(p 1). Dac a p N atunci
(p) = (p1)!. Functia gama poate fi interpretat a ca o generalizare a
factorialului pentru valori reale pozitive. De asemenea (1) = 0! = 1,
1
2
.
Definitia 3.10. O variabil a aleatoare X este distribuit a gama cu
parametrii si p, X Gama [p, ] dac a are densitatea de probabilitate
de forma:
f
X
(x) =
_
_
_
p
x
p1
e
x
(p)
, x > 0
0, x 0
.
Graficul densit atii de probabilitate pentru functia gama si pentru
diferite valori ale lui si p este prezentat n figura 3.6, = 1, p = 1
(negru), = 2, p = 2 (rosu), = 1.5, p = 2 (verde).
5 3.75 2.5 1.25 0
1
0.75
0.5
0.25
0
x
y
x
y
Figura 3.6.
Pentru p = 1 se obtine distributia exponential a, Gama [1, ] =
Exp [].
Teorema 3.9. Dac a X este o v. a. distribuit a gama, atunci
M [X] =
p
, D[X] =
p
2
.
Demonstratie.
M [X] =
Z

xf(x)dx =
1
(p)
Z

0
x
p
x
p1
e
x
dx =
=
1
(p)
Z

0
(x)
p
e
x
dx =
1
(p)
Z

0
t
p
e
t
dt
=
(p + 1)
(p)
=
p
,
Rezultat se obtine, facnd schimbarea de variabil a x = t, dx =
dt. Pentru dispersie folosim relatia D[X] = M [X
2
] (M [X])
2
. Dar
M

X
2
=
Z

x
2
f(x)dx =
1
(p)
Z

0
x
2

p
x
p1
e
x
dx =
=
1
(p)
Z

0
(x)
p+1
e
x
dx =
1
(p)
Z

0
t
p+1
e
t
dt
=
=
(p + 2)
2
(p)
=
p(p + 1)
2
.
De aici rezult a c a D[X] =
p(p + 1)
2
=
p
2
.
Distributia gama este folosit a pentru a modela timpul de functio-
nare a unor aparate. Este utilizat a pentru a modela diferite situatii
fizice, de exemplu timpul de asteptare.
Pentru =
1
2
si p =
1
2
, 1,
3
2
, 2, . . . se obtin diferite cazuri particulare
ale distributiei
2
(hi-p atrat) care este folosit a n statistic a pentru de-
terminarea intervalelor de ncredere si vericarea ipotezelor statistice
de care ne vom ocupa n capitolele urm atoare.
3.4.5 V. a. distribuit a normal
Definitia 3.11. Ov. a. continu a X este distribuit a normal cu parame-
trii m si > 0, si se scrie X N [m, ] dac a densitatea de probabi-
litate este
f : R R, f(x) =
1
2
e
(xm)
2
2
2
. (3.9)
Exercitiul 3.3. S a se verice c a functia definit a de (3.9) are propri-
et atile densit atii de probabilitate.
Rezolvare. 1. Observ am c a f(x) 0, x R.
2. Facnd schimbarea de variabil a xm = y si folosind integrala
cunoscut a

R
y
2
2
dz =
2, se obtine c a

R
f(x)dx = 1.
Folosind aceeasi schimbare de variabil a la calculul integralelor care
apar n definitia mediei si dispesiei obtinem c a M[X] = m, D[X] =
2
.
Graficul lui f este reprezentat n figura 3.9 pentru valorile lui m
si specicate. Se constat a c a acesta este simetric fat a de dreapta
x = m, pentru x = m functia f are maxim egal cu f(m) =
1
2
, iar
punctele m sunt puncte de inexiune. Pentru constant si m vari-
abil, gracul se transleaz a corespunz ator. Dac a m este constant, iar
variabil se constat a c a punctul de maxim variaz a invers proportional
n raport cu . n figura 3.9 este desenat gracul densit atii de pro-
babilitate normale pentru m = 0,
2
= 0.2 (visiniu), m = 0,
2
= 1
(rosu), m = 0,
2
= 0.5 (verde), m = 0,
2
= 5 (mustar), m = 3,
2
= 5 (galben) si m = 3,
2
= 1 (albastru).
10 7.5 5 2.5 0 -2.5 -5
0.8
0.6
0.4
0.2
0
x
y
x
y
Figura 3.9.
Dac a m = 0 si = 1 atunci scriem X N [0, 1] si numim o astfel
de v. a. normal a standard sau normal a redus a.
Consider am urm atoarea functie cunoscut a
: R R, (x) =
1
2
Z
x
1
2
t
2
dt (3.10)
numit a functia lui Laplace.
Fie X o v. a. distribuit a normal cu media nul a si dispersia 1.
Atunci, conform relatiei (3.9), densitatea de probabilitate a lui X este
f(x) =
1
2
e
1
2
x
2
(gracul ei este reprezentat n figura 3.10), deci
functia de repartitie a lui X va fi, conform relatiei (3.2),
F(x) =
1
2
Z
x
1
2
t
2
dt = (x), x R.
5 2.5 0 -2.5 -5
0.3
0.2
0.1
0
x
y
x
y
Figura 3.10.
Observ am c a
M

(X 0)
3
=
1
(t 0)
3
e
1
2
t
2
dt = 0.0 graficul este
simetric.
M

(X 0)
4
=
1
t
4
e
1
2
t
2
dt = 3.0.
Graficul functiei de repartitie este, pentru aceleati valori ca ale
densit atii de probabilitate, m = 0,
2
= 0.2; m = 0,
2
= 1; m = 0,
2
= 0.5; m = 0,
2
= 5; m = 3,
2
= 5 si m = 3,
2
= 1 (figura 3.11).
10 7.5 5 2.5 0 -2.5 -5
1
0.75
0.5
0.25
0
x
y
x
y
Figura 3.11.
Observatia 3.7. Observ amc a (x) este aria dintre curba y =
1
2
e
1
2
x
2
si axa Ox pn a la punctul de abscis a x, iar ntreaga arie de sub clopot
este egal a cu 1. Datorit a simetriei gracului se observ a, din figura
3.10, c a aria cuprins a ntre curb a si axa Ox, de la pn a la x
este egal a cu aria cuprins a ntre curb a si axa Ox, de la x pn a la .
Rezult a c a
(x) = 1 (x), (3.11)
relatie care ne va fi util a ntr-o serie de aplicatii.
Deci (x) este functia de repartitie a unei v. a. distribuit a normal
X N [0, 1]. Din cauza importantei n statistic a a acestei functii ea
se g aseste tabelat a. Tabelul din Anexa 1 furnizeaz a valorile functiei
de repartitie pentru distributia normal a standard, (x) = P (X x).
Urm atorul exemplu ilustreaz a modul n care se foloseste tabelul.
Exemplul 3.5. Fie X N [0, 1] . S a se calculeze P (X 1.5) . Se ur-
m areste n coloana lui x valoarea 1.5. Probabilitatea se va citi pe linia
corespunz atoare valorii 1.5, pe coloana etichetat a 0.00, adic a 0.933193.
Pentru calculul P (X 1.53) se va citi probabilitatea de pe linia lui
1.5, coloana etichetat a cu 0.03 (1.53 = 1.5 + 0.03) , adic a 0.936992.
Probabilit atile care nu sunt de forma P (X x) se calculeaz a folosind
regulile de baz a ale probabilit atilor si simetria distributiei normale
standard. Pentru valorile negative se tine seama de formula (3.11).
Graficul functiei este prezentat n figura 3.12.
5 2.5 0 -2.5 -5
1
0.75
0.5
0.25
0
x
y
x
y
Figura 3.12.
Avem lim
n
(x) = 1, lim
n
(x) = 0.
Exercitiul 3.4. Dac a X N [m, ] atunci Y =
1
(X m) N [0, 1].
Rezolvare. Exprim am functia de repartitie a v. a. Y cu ajutorul
functiei de repartitie a v. a. X
F
Y
(x) = P (Y x) = P

1
(X m) x
=
= P (X m+x) = F
X
(m+x) .
Densitatea de probabilitate a lui Y va fi
f
Y
(x) = f
X
(m+x) =
1
2
e
(m+xm)
2
2
2
=
1
2
e
x
2
2
,
deci Y va fi repartizat a normal standard.
Teorema 3.10. Fie X N [0, 1] si a < b.Atunci
P (a < X b) = (b) (a),
iar dac a X N [m, ] atunci
P (a < X b) =
b m
a m
. (3.12)
Demonstratie. Folosim Teorema 3.2 si tinem seama de definitia lui
(x). Pentru partea a doua tinem seama de exercitiul 3.4.
Teorema 3.11. Dac a X N [m, ] atunci
P (m X m+) 0.6827,
P (m2 X m+ 2) 0.9545,
P (m3 X m+ 3) 0.9973,
deci aproape sigur valorile lui X sunt cuprinse n intervalul
[m3, m+ 3] (Regula celor trei sigma).
Demonstratie. Demonstr amultima relatie. Celelalte relatii se demon-
streaz a analog. Folosim formula (3.12) si obtinem:
P (m3 X m+ 3) =
m+3m
m3m
=
= (3) (3) = 0.998650 0.001350 = 0.9973.
<<StatisticsContinuousDistributions
N[CDF[NormalDistribution[0,1],1]-CDF[NormalDistribution[0,1],-1]]
0.682689
N[CDF[NormalDistribution[0,1],2]-CDF[NormalDistribution[0,1],-2]]
0.9545
CDF[NormalDistribution[0,1],3]-CDF[NormalDistribution[0,1],-3]
1
2
1 + Erf
h
3
2
i
1
2
Erf
h
3
2
i
N[%]
0.9973
Exercitiul 3.5. S a presupunem c a dimensiunea admisibil a a diame-
trelor d ale unor piese circulare este 10 12 mm si c a pentru un lot
de piese diametrul mediu este m = 11.4 mm, iar abaterea medie p a-
tratic a este = 0.7 mm. Ne propunem s a determin am probabilitatea
de a avea, n acel lot, piese cu diametru 10 mm si probabilitatea de
a avea, n acel lot, piese cu diametru > 12 mm.
Rezolvare.
d N [11.4; 0.7] P (d 10) =
1011.4
0.7
= (2) = 0.02275
P (d>12)=1
1211.4
0.7
=1(0.85714)=10.80432=0.19568.
Densitatea de probabilitate n acest caz este f(x)=
1
0.7
2
e
(x11.4)
2
20.7
2
cu graficul desenat mai jos:
14 12 10 8
0.5
0.375
0.25
0.125
0
x
y
x
y
Figura 3.13
Secventa urm atoare calculeaz a probabilit atile din exercitiu cu Mathe-
matica.
CDF[NormalDistribution[11.4,0.7],10]
0.0227501
1-CDF[NormalDistribution[11.4,0.7],12]
0.195683.
Exercitiul 3.6. Intensitatea curentului care trece printr-o bobin a
urmeaz a o distributie normal a cu media de 10 miliamperi si dispersia
de 4 miliamperi. Care este probabilitatea ca intensitatea s a dep aseasc a
13 miliamperi? Care este probabilitatea ca intensitatea curentului s a
fie cuprins a ntre 9 si 11 miliamperi? S a se determine valoarea c a
intensit atii curentului pentru care P (X < c) = 0.98.
Rezolvare. Fie X valoarea intensit atii n miliamperi, X N [10; 2] .
Se cere probabilitatea
P (X > 13) = 1
1310
2
= 1(1.5) = 10.93319 = 0.066 81.

P (9 < X < 11) =
1110
2
910
2
= (0.5) (0.5) =
= 0.691462 0.308538 = 0.382 92.
P (X < c) = 0.98
c10
2
= 0.98.
Utiliznd tabelul functiei Laplace obtinem
c10
2
=2.06c=14.12.
<< StatisticsContinuousDistributions
1 - CDF[NormalDistribution[10, 2], 13]
1 +
1
2
1 Erf
h
3
2
2
i
N[%]
0.0668072
CDF[NormalDistribution[10,2],11]-CDF[NormalDistribution[10,2],9]
1
2
1 + Erf
h
1
2
2
i
+
1
2
1 + Erf
h
1
2
2
i
N[%]
0.382925
Quantile[NormalDistribution[10,2],0.98]
14.1075.
Distributia normal a este folosit a pentru a aproxima multe alte dis-
tributii si, la rndul lor, alte distributii sunt utilizate pentru a aprox-
ima distributia normal a. Distributia normal a apare adesea n modele
probabilistice din lumea real a. Multe m asur atori privind durata de
viat a a organismelor sau a diferitelor aparate urmeaz a o distributie
normal a.
3.4.6 Functia caracteristic a
Definitia 3.12. Fie X o v. a. cu densitatea de probabilitate f. Functia
X
(t) = M

e
jtX
=
Z

e
jtx
f(x)dx,
se numeste func tia caracteristic a corespunz atoare v. a. X.
Teorema 3.12. Dac a X este o v. a. cu func tia caracteristic a
X
(t),
atunci
1.
X
(0) = 1,
2.
X
(t) =

X
n=0
M [X
n
]
n!
(jt)
n
, M [X
n
] =

(n)
(0)
j
n
, unde M [X
n
]
reprezint a momentul ini tial de ordin n.
3. Dac a a, b R
aX+b
(t) = e
jbt
X
(at).
4. Dac a X si Y sunt v. a. independente, atunci
X+Y
(t) =
X
(t)
Y
(t).
Demonstratie. 1.
X
(0) =

R
e
j0x
f(x)dx =

R
f(x)dx = 1.
2. Folosim dezvoltarea n serie a functiei exponentiale e
jtx
si se
nlocuieste n definitia functiei generatoare,
X
(t) =
Z

f(x)dx +
jt
1!
Z

xf(x)dx +
(jt)
2
2!
Z

x
2
f(x)dx + +
+
(jt)
n
n!
Z

x
n
f(x)dx + =

X
n=0
(jt)
n
n!
M [X
n
] .
3.
aX+b
(t) =

R
e
jtax+jtb
f(x) = e
jtb

R
e
jtax
f(x) = e
bt
X
(at).
4.
X+Y
(t) = M

e
jt(X+Y )
= M

e
jtX
e
jtY
= M

e
jtX
M

e
jtY
X
(t)
Y
(t), unde amtinut seama de independenta v. a. care a permis
scrierea relatiei relativ la medie.
Exercitiul 3.7. S a se determine functia caracteristic a pentru v. a.
X Exp [].
Rezolvare.
X
(t) =
Z

e
jtx
e
x
dx =
Z

0
e
(jt)x
dx =
e
(jt)x
jt
0
=

t
deorece > 0 si

e
(jt)x
= |e
jtx
|
e
x
= e
x
x
0.
Exercitiul 3.8. S a se determine functia caracteristic a pentru v. a.
X Gama [p, ] .
Rezolvare.
X
(t) =
Z

e
jtx
X
(t) =

p
(p)
Z

e
jtx
x
p1
e
x
dx =
=

p
(p)
Z

e
(jt)x
x
p1
dx.
Facem schimbarea de variabil a u = (jt ) x si obtinem
X
(t) =

p
(p)
Z

e
u
u
p1
( jt)
p
dx =

p
( jt)
p
.
S a calcul am media si dispersia cu ajutorul functiei caracteristice.
0
X
(t) =

p
(jt)
p
0
=
p
p
j
(jt)
p+1

0
X
(0) =
pj
M [X] =
p
00
X
(t) =
p(p + 1)
p
j
2
( jt)
p+2
M

X
2
=
p(p + 1)
2
D[X] = M

X
2
(M [X])
2
=
p
2
.
Pachetul din Mathematica <<StatisticsContinuousDistributions
contine comenzi pentru a lucra cu urm atoarele distributii continue:
beta, Cauchy, hi-p atrat, exponential a, Student, gama, normal a, log-
normal a, Pareto, Rayleigh, uniform a, Weibull etc.
Informatii despre o anumit a distributie putem afla utiliznd Help
Browser ca si o serie de functii care opereaz a cu ele. Prezent am o
secvebnt a de program n Mathematica prin care obtinem o serie de
informatii despre repartitia normal a (de exemplu).
Domain[NormalDistribution[3,2]]
Interval[{,}]
PDF[NormalDistribution[3,2],x]
e
1
8
(3+x)
2
2
2
CDF[NormalDistribution[3,2],x]
1
2
1 + Erf
h
3+x
2
2
i
CharacteristicFunction[NormalDistribution[3,2],z]
e
3iz2z
2
Mean[NormalDistribution[3,2]]
3
Variance[NormalDistribution[3,2]]
4
StandardDeviation[NormalDistribution[3,2]]
2
Quantile[NormalDistribution[0,1],0.5]
0
Exemplul 3.6. Fie X Pois [] si Y Pois [], variabile aleatoare
independente. Demonstrati c a X +Y Pois [ +].
Rezolvare. Determin am functia caracteristic a a lui X Pois [].
X
(t) = M

e
jtX
=

X
k=0
e
jtk
e
k
k!
= e

X
k=0
(e
jt
)
k
k!
= e
(e
jt
1)
.
Deoarece v. a. sunt independente
X+Y
(t) =
X
(t)
Y
(t) = e
(e
jt
1)
e
(e
jt
1)
= e
(+)(e
jt
1)
.
Deoarece functia caracteristic a determin a complet functia de repartitie
rezult a c a X +Y este o variabil a Poisson de parametru +.
Exemplul 3.7. S a se determine functia caracteristic a pentru v. a.
X N [m, ] .
Rezolvare.
X
(t) = M

e
jtX
=
1
2
Z

e
jtx
e
(xm)
2
2
2
dx.
Facem schimbarea de variabil a y =
x m
dx = dy
X
(t) =
1
2
Z

e
jt(m+y)
y
2
2
dy =
e
jtm
2
Z

y
2
2jty+j
2
t
2
2
2
e
t
2
2
2
dy =
=
e
jtm
t
2
2
2
2
Z

(yjt)
2
2
dy = e
jtm
t
2
2
2
.
Am folosit
Z

(yjt)
2
2
dy =
Z

u
2
2
du =
2.
Cunoscnd functia caracteristic a se pot determina:
M [X] =

0
X
(0)
j
= m, M

X
2
=

00
X
(0)
j
2
= m
2
+
2
,
D[X] = M

X
2
(M [X])
2
=
2
.
Exemplul 3.8. Fie X N [m
1
,
1
] si Y N [m
2
,
2
] dou a v. a.
independente. Atunci X +Y N
h
m
1
+m
2
,
p
2
1
+
2
2
i
.
Rezolvare.
X
(t) = e
jtm
1
t
2
2
1
2
,
Y
(t) = e
jtm
2
t
2
2
2
2
,
X+Y
(t) =
X
(t)
Y
(t) = e
jtm
1
t
2
2
1
2
e
jtm
2
t
2
2
2
2
=
= e
jt(m
1
+m
2
)
t
2
(
2
1
+
2
2
)
2
= e
jtm
t
2
2
2
cu m = m
1
+m
2
, =
p
2
1
+
2
2
.
Exemplul 3.9. Dac a X
1
, X
2
, . . . , X
n
sunt V. a. in dependente, nor-
male de tip N [m, ] , atunci
1
n
(X
1
+X
2
+ +X
n
) este o v. a. nor-
mal a,
1
n
(X
1
+X
2
+ +X
n
) N
h
m,

n
i
.
Rezolvare. Ca n Exemplul 3.8 g asim
X
1
+X
2
++X
n
(t) = e
jtnm
t
2
n
2
2
.
Folosind Teorema 3.12, punctul 3,
1
n
(X
1
+X
2
++X
n
)
(t) =
X
1
+X
2
++Xn
t
n
= e
jtm
t
2
2
2n
= e
jtm
1
2
(
n
)
2
t
2
.
3.4.7 V. a. distribuit a hi-p atrat
2
(n)
Definitia 3.13. O variabil a aleatoare X este distribuit a hi-p atrat cu
n grade de libertate, X
2
(n) dac a are densitatea de probabilitate
de forma:
f(x) =
_
_
_
1
2
n
2
n
2
x
n
2
1
e
x
2
, x > 0
0, x 0
.
Pentru aceast a v. a. avem M [X] = n, D[X] = 2n.
Graficul densit atii de probabilitate pentru functia
2
cu n grade
de libertate, n = 1 (negru), n = 4 (maro), n = 10 (rosu) si n = 20
(albastru) este prezentat n figura 3.7. Valorile functiei de repartitie
sunt tabelate, n functie de gradele de libertate.
Exemplul 3.10. S a se determine functia caracteristic a a v. a. dis-
tribuit a
2
(n).
25 20 15 10 5 0
0.3
0.2
0.1
0
x
y
x
y
Figura 3.7.
Rezolvare. Fie X
2
(n).
X
(t) =
1
2
n
2
n
2
Z

0
e
jtx
x
n
2
1
e
x
2
dx =
1
2
n
2
n
2
Z

0
x
n
2
1
e
12jt
2
x
dx.
Facem schimbarea de variabil a u =
2jt 1
2
x x =
2
1 2jt
u
dx =
2
1 2jt
du.
X
(t) =
1
2
n
2
n
2
Z

0
u
2
1 2jt
n
2
1
e
u
2
1 2jt
du =
=
1
(1 2jt)
n
2

n
2
Z

0
u
n
2
1
e
u
du =
1
(1 2jt)
n
2
.
La distributia
2
(n) se poate ajunge plecnd de la distributii nor-
male:
Propozitia 3.3. Fie n v. a. X
1
, X
2
, . . . , X
n
independente, care urmeaz a
o distribu tie normal a standard, N [0, 1]. Atunci v. a. Y =
n
P
i=1
X
2
i

2
(n) (urmeaz a o distribu tie hi-p atrat cu n grade de libertate).
Demonstratie. Fie F
i
functia de repartitie a v. a. X
2
i
. Avem:
F
i
(x) = P

X
2
i
x
= P

x X
i

=
=
1
2
Z

x
x
e
t
2
2
dt =
2
2
Z

x
0
e
t
2
2
dt.
Prin derivare determin am densit atile de probabilitate ale lui X
2
i
,
f
i
(x) = F
0
i
(x) =
2
2
e
x
2
1
2
x
=
1
1
2
x
1
2
e
x
2
,
deci X
2
i

2
(1).
Deoarece X
2
1
, X
2
2
, . . . , X
2
n
sunt independente, rezult a c a
X
2
1
+X
2
2
++X
2
n
(t) =
X
2
1
(t)
X
2
2
(t)
X
2
n
(t) =
= (1 2it)
1
2
(1 2it)
1
2
= (1 2it)
n
2
care este tocmai functia caracteristic a a unei v. a. care urmeaz a o
distributie hi-p atrat cu n grade de libertate.
Distributia hi-p atrat se ntlneste n statistic a la testarea ipotezelor
statistice.
3.4.8 V. a. distribuit a Student
Definitia 3.14. O v. a. X este distribuit a Student cu n grade de liber-
tate, X T(n) (notatie consacrat a), dac a densitatea de probabilitate
este
f(x) =

n + 1
2
n
2
1 +
x
2
n
n+1
2
, x R.
Pentru aceast a v. a. avem M [X] = 0, D[X] =
n
n 2
, n > 2.
Graficul densit atii de probabilitate pentru functia Student cu n
grade de libertate, n = 1, n = 5 si n = 12 este prezentat n figura 3.8.
5 2.5 0 -2.5 -5
0.3
0.2
0.1
0
x
y
x
y
Figura 3.8.
n aparent a, gracul distributiei Student este similar distributiei
normale standard: amndou a sunt simetrice si unimodulare, maximul
este atins n x = 0. Dac a n distributia Student aproximeaz a
distributia normal a standard.
n Capitolul 5, Exemplul 5.3, vom demonstra c a o v. a. distribuit a
Student este raportul dintre o v. a. distribuit a normal standard si o
v. a. de forma
q
Y
n
unde Y
2
(n). n Capitolul 8 vom prezenta
modul de calcul, cu ajutorul tabelelor, a valorilor functiei de repartitie
Student.
Cea mai important a aplicatie a distributiei Student este n statis-
tic a la construirea ipotezelor statistice si a intervalelor de ncredere
pentru medie pentru una sau mai multe populatii. n practic a, chiar
dac a populatiile nu urmeaz a o distributie normal a, se obtin rezultate
bune dac a media distributiilor urmeaz a aproximativ o distributie nor-
mal a.
3.4.9 Functii de v. a.
Consider am cazul n care v. a. X este discret a si not amP (X = x)
=f
X
(x). Fie Y =h(X) functia bijectiv a care stabileste leg atura dintre
valorile lui X si Y . Fie x = h
1
(y) solutia unic a a ecuatiei y = h(x).
V. a. Y va lua valorile y cnd X va lua valorile x = h
1
(y). Atunci
f
Y
(y) = P(Y = y) = P(X = h
1
(y)) = f
X
(h
1
(y)).
Exercitiul 3.9. Fie X o variabil a aleatoare distribuit a geometric n
care P(X = k) = p (1 p)
k1
, k = 1, 2, 3, . . .. Ne intereseaz a dis-
tributia lui X
2
.
Rezolvare. Not am f
X
(k) = p (1 p)
k1
. Deoarece X 0, functia
y = x
2
este bijectiv a pentru x 0 x =
y h
1
(y) =
y.
f
Y
(y) = f

h
1
(y)
= p (1 p)
y
, y = 0, 1, 4, 9, 16, . . .
Consider am cazul n care v. a. X este continu a. Fie X v. a. avnd
functia de repartitie F
X
. Dac a Y = h(X) este o functie bijectiv a,
atunci functia de repartitie a v. a. Y este complet determinat a. Fie
x = h
1
(y) solutia unic a a ecuatiei y = h(x). ntr-adev ar, dac a h este
strict cresc atoare, atunci:
F
Y
(y) = P (Y < y) = P (h(X)< y) = P

X< h
1
(y)
= F
X
h
1
(y)
.
Dac a h este strict descresc atoare, atunci:
F
Y
(y) = P (Y < y) = P (h(X) < y) = P

X > h
1
(y)
=
= 1 F
X
h
1
(y) + 0
.
Teorema 3.13. Fie h : R R este o func tie monoton a, derivabil a si
h
0
(x) 6= 0, deci ecua tia h(x) = y are solu tia unic a x = h
1
(y). Atunci
densitatea de probabilitate a v. a. Y = h(X) este:
f
Y
(y) = f
X
(h
1
(y))
h
1
(y)
.
Demonstratie. Dac a h este monoton cresc atoare atunci
f
Y
(y) =
dF
Y
(y)
dy
=
d (F
X
(h
1
(y)))
dy
=
dF
X
(h
1
(y))
dy
d (h
1
(y))
dy
=
= f
X
(h
1
(y))
h
1
(y)
0
,
iar dac a h este monoton descresc atoare atunci
f
Y
(y) =
dF
Y
(y)
dy
=
d (1 F
X
(h
1
(y)))
dy
=
=
dF
X
(h
1
(y))
dy
d (h
1
(y))
dy
= f
X
(h
1
(y))
h
1
(y)
0
.
Exercitiul 3.10. Fie X Unif [0, 1] si Y = 3X. Care este densitatea
de probabilitate a v. a. Y ?
Rezolvare. X are densitatea de probabilitate dat a de
f
X
(x) =

1, dac a x [0, 1]
0, n caz contrar
,
Y = h(X) = 3X, unde h(x) = 3x, h
0
(x) = 3 > 0 h functie continu a
si monoton cresc atoare, deci bijectiv a. Rezult a c a
F
Y
(y) = P (Y < y) = P (3X < y) = P

X <
y
3
= F
X
y
3
f
Y
(y) = F
0
Y
(y) =

F
X
y
3
0
= f
X
y
3
1
3
=
(
1
3
, dac a y [0, 3]
0, n caz contrar.
.
De aici rezult a c a Y Unif [0, 3].
Exercitiul 3.11. Fie X Unif [1, 2] si Y =
1
X
. Care este densitatea
de probabilitate a v. a. Y ?
Rezolvare. Y = h(X) =
1
X
, unde h(x) =
1
x
, h
0
(x) =
1
x
2
< 0
h functie monoton continu a si descresc atoare, deci bijectiv a x =
1
y
.
F
Y
(y) = P (Y <y) = P
1
X
<y
= P
X>
1
y
= 1 F
X
1
y
+ 0
f
Y
(y) = F
0
Y
(y) =

1 F
X
1
y
+ 0
0
= f
X
1
y
1
y
0
=
=
_
_
_
1
y
2
, dac a
1
2
y 1
0, n caz contrar.
.
Observatia 3.8. Dac a X este o v. a. continu a si h este o functie
continu a, stim c a Y = h(X) este o v. a. si M [h(X)] =

R
h(x)f(x)dx.
3.4.10 Repartitia lognormal a
Dac a X este o v. a. care urmeaz a o distributie normal a, intereseaz a
distributia v. a. Y = e
X
. n acest caz se spune c a Y urmeaz a o
distributie lognormal a. Numele vine de la transformarea X = lnY ,
adic a logaritmul natural al lui Y urmeaz a o distributie normal a.
Facem obervatia c a domeniul lui Y este (0, ). Dac a X N [m, ]
atunci
F
Y
(y) = P (Y y)=P
e
X
y
=P (Xln(y))=F
X
(ln y)=
lnym
.
Densitatea de probabilitate este
f
Y
(y) = f
X
(ln y)
1
y
=
1
y
2
e
(ln ym)
2
2
2
, 0 < y < .
n acest caz M [X] = e
m+
2
2
, D[X] = e
2m+
2

e
2
1
.
5 3.75 2.5 1.25
0.8
0.6
0.4
0.2
0
x
y
x
y
Figura 3.14.
Este trasat graficul pentru m = 1, = 1 (negru), m = 1, = 0.5
(rosu), m = 0, = 1 (verde), m = 0, = 1.5 (albastru).
Problema 3.3. Durata de via t a a unui laser cu semiconductori urmea-
z a o distribu tie lognormal a cu m = 10 ore si = 1.5 ore. Care este
probabilitatea ca durata de via t a s a dep a seasc a 10000 ore? Care este
durata de via t a satisf acut a cu o probabilitate de 0.99?
Rezolvare. Fie X variabila aleatoare care ia ca valori durata de viat a
n ore a unui laser cu semiconductori si care urmeaz a o distributie
lognormal a cu m = 10 ore si abaterea medie p atratic a = 1.5 ore.
P (X > 10000) = 1 P (X 10000) = 1
ln1000010
1.5
=
= 1 (0.52644) = 1 0.2993 = 0.7007.
Determin am x astfel nct P (X > x) = 0.99. Avem
1
lnx10
1.5
= 0.99
lnx10
1.5
= 0.01
lnx10
1.5
2.3263 x 672.2.
Deci, cu probabilitatea de 0.99 durata de viat a a laserului va dep asi
672.2 ore.
1-CDF[LogNormalDistribution[10,1.5],10000]
0.700709
Quantile[LogNormalDistribution[10,1.5],0.01]
672.148
3.5 Fiabilitate
n sensul cel mai larg, abilitatea reprezint a proprietatea unui dis-
pozitiv de a-si ndeplini functia specic a n conditii de exploatare date.
O analiz a a abilit atii pune n evident a:
abilitatea precalculat a, care se evalueaz a pornind de la con-
ceptia dispozitivului si a componentelor sale;
fiabilitate tehnic a (nominal a) determinat a n urma ncerc arilor
n conditii de fabric a;
abilitate de exploatare, determinat a de conditiile reale de ex-
ploatare, cu luarea n considerare a actiunii complexe a tuturor facto-
rilor ce inuenteaz a functonarea.
Fiabilitatea poate exprimat a cantitativ prin parametrii de abili-
tate. Determinarea lor se face n practic a n urma prelucr arii statistice
a datelor. Cel mai frecvent utilizat a este probabilitatea function arii
f ar a defectiune ntr-un interval de timp. Intervalul de timp n care
sistemul functioneaz a f ar a defectiuni este o variabil a aleatoare pe care
o not am cu T.
Definitia 3.15. Numim func tie de fiabilitate sau reliabilitate functia
R : R
+
[0; 1], definit a prin
R(t) = P(T > t).
Observ am c a 1 R(t) este functia de repartitie, care n sensul
fiabilit atii m asoar a probabilitatea ca pn a la momentul t s a apar a
o defectiune. Functia F(t) = 1 R(t) se mai numeste func tie de
nesiguran t a . n strns a leg atur a cu propriet atile functiei F(t), putem
enunta pe cele ale lui R.
1. R(0) = 1,
2. lim
t
R(t) = 0,
3. t
1
< t
2
R(t
1
) > R(t
2
),
4. Dac a f este densitatea de probabilitate pentru variabila T,
f(t) = R
0
(t).
Observ am c a la momentul initial functia de fiabilitate este maxi-
m a, iar nesiguranta minim a. Dac a t se produce fenomenul
invers. Vom presupune c a se poate preciza o functie, numit a rat a de
defectare si notat a r, cu proprietatea c a r(t)t este probabilitatea ca
n intervalul (t, t +t) s a apar a o defectiune, dac a pn a la momentul
t, dispozitivul a functionat. Conditia din definitie este o probabilitate
conditionat a:
r(t)t = P (t < T t +t | T > t) =
P(t < T t +t)
P(T > t)
=
=
F (t +t) F(t)
R(t)
=
R(t +t) R(t)
R(t)
.
n ultima relatie mp artim prin t si trecem la limit a pentru t 0.
Dac a aceast a limit a exist a, g asim ecuatia diferential a
R
0
(t)
R(t)
= r(t),
cu conditia initial a R(0) = 1 care are ca solutie
R(t) = e
t
R
0
r(s)ds.
(3.13)
Exemplul 3.11. Rata de defectare a unui utilaj este r(t) = 0.1. Cu
ce probabilitate dispozitivul functioneaz a cel putin 10 ore?
Rezolvare. nlocuim n (3.13) r(t) = 0.1 si observ am c a dispozitivul
functioneaz a cel putin 10 ore este evenimentul T 10, deci
R(10) = e
10
R
0
0.1ds
= 0.36788.
n general variatia defectiunilor unui dispozitiv se poate mp arti n
trei perioade:
1. perioada initial a n care apar defectiuni datorate erorilor de
fabricatie si se face rodajul;
2. perioada de functionare care ncepe dup a rodaj, cnd num arul
defectiunilor scade, r amnnd practic constant (maturitatea), pentru
care se poate utiliza distributta exponential a;
3. perioada n care intensitatea de defectare creste continuu, da-
torit a uzurii (b atrnetea).
Problema 3.4. Un strung produce un anumit tip de piese. Lungimea
pieselor este o variabil a aleatoare cu media egal a cu 50 cm si abaterea
medie p atratic a 0.015 cm. S a se estimeze probabilitatea ca abaterea
lungimii piesei de la valoarea medie nu dep a seasc a 0.02 cm. Ce valoare
nu va dep asi abaterea cu probabilitatea de 0.9.
Rezolvare. Fie X lungimea piesei. Aplicnd inegalitatea Cebsev
obtinem
P (|X M [X]| < ) > 1
D[X]
2

P (|X 50| < 0.02) > 1
0.015
2
0.02
2
= 0.4375.
Din 1
D[X]
2
= 0.9 g asim 0.047, adic a
P (|X 50| < 0.047) > 0.9.
Problema 3.5. S a se simuleze in Matlab un experiment de aruncare
a monezii. S a se calculeze frecventa relativ a a apari tiei stemei si s a
se compare cu probabilitatea apari tiei stemei.
Rezolvare. Pentru simularea arunc arii monezii se va folosi functia
rand care returneaz a valori aleatoare din intervalul (0, 1). Cum pro-
babilitatea aparitiei stemei este
1
2
, dac a functia returneaz a o valoare
mai mic a ca
1
2
se va considera c a, la simularea experimentului, apare
stema. Frecventa relativ a se va calcula pentru n = i 1000, unde
i = 1, 100. Programul afiseaz a graficul frecventei relative si valoarea
ei obtinut a la simularea de 100000 a experimentului.
% Frecventa relativa de aparitie
% a stemei la aruncarea monezii
clear;
clc;
S=0;
for i=1:100
for j=1:1000
if rand<0.5
%apare stema
S=S+1;
end;
end;
f(i)=S/(i*1000);
end;
plot(f);
title(Frecventa relativa);
grid;
fprintf(frecventa relativa este %g\n,S/100000);
Cum experimentul este aleator, rezultatele sale difer a de la o si-
mulare la alta. Un rezultat posibil este
0 10 20 30 40 50 60 70 80 90 100
0.49
0.492
0.494
0.496
0.498
0.5
0.502
0.504
0.506
Frecventa relativa
Figura 3.15
Frecventa relativa este 0.50027
Putem observa c a, n conformitate cu legea numerelor mari, frec-
venta relativ a converge c atre probabilitatea evenimentului.
Problema 3.6. Folosind Mathematica, s a se simuleze aruncarea unei
monede de 10 ori, apoi de 1000 de ori si 100 000 de ori. S a se numere
de cte ori au ap arut cele dou a fe te ale zarului si s a se trag a concluziile.
Rezolvare. Aruncarea monedei este un experiment care const a n
realizarea unui eveniment Bernoulli cu p = 0.5. Simul am aruncare
monedei de 10 ori folosind distributia Bernoulli.
arunc=RandomArray[BernoulliDistribution[0.5],10]
{0,1,1,0,1,1,0,0,1,1}
Cu ajutorul pachetului <<StatisticsDataManipulation si a comen-
zii Frequencies determin am cte valori de 0 si cte valori de 1, core-
spunz ator celor dou a fete ale monedei, s-au obtinut.
<<StatisticsDataManipulation
Frequencies[arunc]
{{4,0},{6,1}}
arunc10=RandomArray[BernoulliDistribution[0.5],1000];
Frequencies[arunc10]
{{496,0},{504,1}}
arunc1000=RandomArray[BernoulliDistribution[0.5],100000];
Frequencies[arunc1000]
{{50120,0},{49880,1}}
Observ am c a pentru num arul arunc arilor tot mai mare, frecventa
relativ a se apropie de probabilitatea 0.5.
Problema 3.7. Folosind Mathematica, s a se simuleze aruncare unui
zar de 12 ori si apoi aruncarea a dou a zaruri de 100 de ori.
Rezolvare. Aruncarea unui zar poate fi modelat a folosind distributia
uniform discret a, prezentat a n Capitolul 2, care ia sase valori, 1, 2, 3,
4, 5 si 6.
Simularea primului experiment:
arunc=RandomArray[DiscreteUniformDistribution[6],12]
{3,3,5,6,4,6,4,2,3,4,6,2}
<<StatisticsDataManipulation
Frequencies[arunc]
{{2,2},{3,3},{3,4},{1,5},{3,6}}
arunc1=RandomArray[DiscreteUniformDistribution[6],6000];
Frequencies[arunc1]
{{1005,1},{1005,2},{1029,3},{1010,4},{977,5},{974,6}}
arunc2=RandomArray[DiscreteUniformDistribution[6],{100,2}]
{{2,6},{4,1},{1,4},{1,3},{3,6},{1,6},{2,1},{4,4},{6,4},{2,3},{4,4},{3,4},
{3,6},{5,3},{1,1},{6,2},{4,5},{4,4},{5,2},{5,6},{2,1},{4,6},{4,2},{1,2},
{2,5},{5,4},{2,2},{1,4},{4,5},{1,4},{5,6},{4,6},{5,2},{3,5},{1,2},{5,1},
{4,2},{6,5},{3,5},{6,2},{6,6},{4,2},{1,3},{5,1},{2,4},{6,6},{4,3},{2,3},
{3,3},{3,6},{5,5},{6,5},{6,5},{4,4},{1,4},{1,2},{2,3},{3,4},{4,3},{4,6},
{6,2},{6,6},{4,2},{2,6},{4,1},{2,3},{5,2},{4,4},{3,3},{4,3},{5,1},{6,4},
{6,1},{3,4},{2,2},{5,3},{1,4},{4,1},{1,1},{1,6},{1,5},{6,2},{6,2},{3,3},
{2,2},{6,6},{5,3},{5,5},{6,6},{2,4},{5,2},{6,1},{5,6},{3,3},{3,6},{1,2},
{3,4},{1,1},{4,6},{4,5}}
Folosind Map mpreun a cu comenzile Apply si Plus g asim suna nu-
merelor de pe cele dou a zaruri.
sums=Map[Apply[Plus,#]&,arunc2]
{8,5,5,4,9,7,3,8,10,5,8,7,9,8,2,8,9,8,7,11,3,10,6,3,7,9,4,5,9,5,11,10,7,8,3,6,\
6,11,8,8,12,6,4,6,6,12,7,5,6,9,10,11,11,8,5,3,5,7,7,10,8,12,6,8,5,5,7,8,6,7,6,\
10,7,7,4,8,5,5,2,7,6,8,8,6,4,12,8,10,12,6,7,7,11,6,9,3,7,2,10,9}
Folosim Frequencies pentru a determina frecventa fiec arei sume.
Frequencies[sums]
{{3,2},{6,3},{5,4},{12,5},{14,6},{16,7},{17,8},{8,9},{8,10},{6,11},{5,12}}
Problema 3.8. Se consider a o vaiabil a aleatoare continu a X cu func tia
de reparti tie
F (x) =
_
_
_
0, x 0,
x
2
, 0 < x 1,
1, x > 1.
S a se calculeze probabilitatea c a:
a) v. a. X va lua valori din intervalul (1/3, 2/3);
b) n 4 experien te X va lua o data o valoare din intervalul (1/4, 1/2)
si o dat a din intervalul (1/2, 3/4);
c) n 3 experien te X va lua valori doar din intervalul (3/4, 1).
Rezolvare. n cazul variabilelor aleatoare continue probabilitatea ca
acestea s a ia valori dintr-un interval oarecare este
P (a < X < b) = F (b) F (a) .
a) P

1
3
< X <
2
3
= F

2
3
F

1
3
=
4
9

1
9
=
1
3
.
b) Se vor calcula mai nti probabilit atile ca X s a ia valori n fiecare
din cele dou a intervale:
p
1
= P

1
4
< X <
1
2
= F

1
2
F

1
4
=
1
4

1
16
=
3
16
,
p
2
= P

1
2
< X <
3
4
= F

3
4
F

1
2
=
9
16

1
4
=
5
16
.
Probabilitatea c autat a este
p = p
1
p
2
(1 p
1
p
2
)
2
=
15
1024
0, 0146.
c) Probabilitatea ca
3
4
< X < 1 este
p
3
= P

3
4
< X < 1
= F (1) F

3
4
= 1
9
16
=
7
16
,
iar probabilitatea cerut a este
p = p
3
3
=
343
4096
0, 0837.
Problema 3.9. Se consider a func tia
F (x) =
_
_
_
0, x < 1,
ln x, 1 x < e,
1, x e.
Este func tia F (x) func tie de reparti tie a unei variabile aleatoare con-
tinue X? n caz armativ s a se g aseasc a densitatea de reparti tie a lui
X. S a se reprezinte grafic cele dou a func tii.
Rezolvare. Observ am c a
a) F (x) este monoton cresc atoare;
b) lim
x
F (x) = 0; lim
x+
= 1;
c) x R, F (x + 0) = F (x) (functia este continu a la dreapta n
orice punct x R).
Prin urmare F (x) este functie de repartitie a unei variabile aleatoare
oarecare X. Analiz am dac a este functia de repartitie a unei variabile
aleatoare continue.
Observ amc a F (x) este continu a pe Rsi este derivabil a pe R\ {1, e}.
Avem
F
0
(x) =
_
_
0, x < 1,
1
x
, 1 < x < e,
0, x > e.
n punctele x {1, e} functia F
0
(x) nu este definit a. Prin urmare
pentru x R\ {1, e} avem f (x) = F
0
(x), iar n punctele x {1, e}
putem considera, de exemplu, f (x) = F
0
(x + 0), adic a
f (x) =
_
_
0, x < 1,
1
x
, 1 x < e,
0, x e.
Calculnd valorile lui f (x) si F (x) ntr-un num ar de puncte din
intervalul (0, 4), construim cele dou a grafice (figura 3.16).
0 1 2 3 4
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 1 2 3 4
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Densitatea de repartitie
Figura 3.16
Problema 3.10. Este dat a func tia
f (x) =

0, x 0,
e
2x
, x > 0.
S a se g aseasc a valorile parametrului , pentru care f (x) este den-
sitatea de reparti tie a unei variabile aleatoare X continue. S a se
g aseasc a func tia de reparti tie a lui X. S a se calculeze probabilitatea
P (1 < X < 2), folosind func tia de reparti tie F (x) si folosind densi-
tatea de reparti tie f (x).
Rezolvare. Pentru ca f (x) s a fie densitate de repartitie este necesar
ca
i) f (x) 0, x R;
ii)
+
R
f (x) dx = 1.
Din conditia i) rezult a c a 0. Conditia ii) implic a
Z
+
e
2x
dx = 1
Z
+
0
e
2x
dx =
1
2
e
2x
+
0
=

2
= 1 = 2.
Prin urmare
f (x) =

0, x 0,
2e
2x
, x > 0.
S a calcul am F (x). Pentru orice x 0 avem
F (x) =
Z
x
f (t) dt =
Z
x
0dt = 0.
Dac a x > 0, atunci
F (x) =
Z
x
f (t) dt =
Z
0
0dt +
Z
x
0
2e
2t
dt = 1 e
2x
.
Prin urmare
F (x) =

0, x 0,
1 e
2x
, x > 0.
S a calcul am P (1 < X < 2):
P (1 < X < 2) = F (2) F (1) =

1 e
4
1 e
2
= e
2
e
4
;
P (1 < X < 2) =
Z
2
1
f (x) dx =
Z
2
1
2e
2x
dx = e
2
e
4
.
Problema 3.11. O variabil a aleatoare X are densitatea de reparti tie
func tia f (x), graficul c areia este
(triunghiul din figur a este echilateral).
S a se g aseasc a expresia densit a tii, func tia de reparti tie si probabi-
litatea P

a
2
< X <
a
2
.
Rezolvare. Deoarece
+
R
f (x) dx = 1, rezult a c a aria triunghiului

echilateral, care are latura 2a este 1. Pe de alt a parte aria triunghiului
este S
4
=

3(2a)
2
4
= a
2
3, de unde rezult a a =
1
4
3
. Pentru a obtine
expresia lui f (x) este necesar de calculat f (0), care este n altimea
triunghiului. n altimea unui triunghi echilateral cu latura
2
4
3
este
3
2

2
4
3
=
4
3. Cunoscnd coordonatele vrfurilor triunghiului, putem

scrie expresia functiei f (x):
f (x) =
_
_
0, x
1
4
3
,
3x +
4
3,
1
4
3
< x 0,
3x +
4
3, 0 < x
1
4
3
,
0, x >
1
4
3
.
Aplicnd formula F (x) =
x
R
f (t) dt, g asim

F (x) =
_
_
0, x
1
4
3
,
(
4
3x+1)
2
2
,
1
4
3
< x 0,
(
4
3x1
)
2
2
+ 1, 0 < x
1
4
3
,
1, x >
1
4
3
.
Probabilitatea cerut a este
P

a
2
< X <
a
2
= P

1
2
4
3
< X <
1
2
4
=
= F

1
2
4
1
2
4
=
7
8

1
8
=
3
4
.
Problema 3.12. O variabil a aleatoare X are densitatea de reparti tie
f (x) =
_
_
_
0, x / (a, a) ,
1
a
2
x
2
, x (a, a) ,
unde a > 0. S a se calculeze func tia de reparti tie, media, dispersia,
abaterea medie p atratic a, asimetria, excesul, mediana, moda, cuan-
tilele de ordinul
1
4
ale lui X.
Solutie. Functia de repartitie a v. a. X este
F (x) =
Z
x
f (t) dt =
_
_
0, x a,
1
2
+
1
arcsin
x
a
, a < x < a,
1, x a.
Aplicnd pentru fiecare dintre caracteristicle numerice formula,
obtinem urm atoarele rezultate.
Media v. a. X:
M [X] =
Z
+
xf (x) dx =
1
Z
a
a
xdx
a
2
x
2
= 0.
Dispersia v. a. X:
D[X] = M

X
2
M [X]
2
=
2
Z
a
0
x
2
dx
a
2
x
2
=
a
2
2
.
Abaterea medie p atratic a:
[X] =
p
D[X] =
a
2
.
Pentru a calcula asimetria si excesul este necesar de calculat mo-
mentele centrate de ordinul 3 si 4:
3
[X] =
Z
+
(x M [X])
3
f (x) dx =
1
Z
a
a
x
3
dx
a
2
x
2
= 0;
4
[X] =
Z
+
(x M [X])
4
f (x) dx =
2
Z
a
0
x
4
dx
a
2
x
2
=
3a
4
8
.
Asimetria v. a. X:
=

3
[X]
3
[X]
= 0.
Excesul v. a. X:
=

4
[X]
4
[X]
3 =
3a
4
8
a
4
4
3 =
3
2
.
n cazul variabilelor aleatoare continue moda este valoarea lui X
cu densitatea de probabilitate maxim a, deci
Mo [X] = 0.
Mediana:
P (X < Me [X]) =
1
2
F (Me [X]) =
1
2
Me [X] = 0.
Cuantilele:
P

X < x
1/4
=
1
4
F

x
1/4
=
1
4
x
1/4
=
a
2
,
P

X < x
2/4
=
1
2
x
2/4
= Me [X] = 0,
P

X < x
3/4
=
3
4
F

x
3/4
=
3
4
x
3/4
=
a
2
.
Problema 3.13. Variabilele aleatoare X si Y au densitat a tile de
reparti tie
f
X
(x) =
(
1
2
, x [0, 2] ,
0, x / [0, 2] ;
f
Y
(x) =

0, x < 0,
e
x
, x 0.
S a se calculeze M [X +Y ], M [XY ], M [X
2
], M [X +Y
2
] si D[X +Y ].
Rezolvare. Variabila aleatoare X are repartitie uniform a, deci M[X] =
0 + 2
2
= 1, D[X] =
(2 0)
2
12
=
1
3
. Variabila aleatoare Y are repartitie
exponential a cu = 1, deci M [Y ] =
1
= 1, D[Y ] =
1
2
= 1. Cum
X si Y sunt variabile aleatoare independente, rezult a c a M [X +Y ] =
M [X] +M [Y ], M [XY ] = M [X] M [Y ], D[X +Y ] = D[X] +D[Y ].
Avem, deci M [X +Y ] = 1 + 1, M [XY ] = 1 1 = 1, D[X +Y ] =
1
3
+ 1 =
4
3
. S a calcul am M [X
2
] si M [X +Y
2
]:
M

X
2
=
Z
+
x
2
f
X
(x) dx =
1
2
Z
2
0
x
2
dx =
4
3
.
M

X +Y
2
= M [X] +M

Y
2
= 1 +
Z
+
x
2
f
Y
(x) dx =
= 1 +
Z
+
0
x
2
e
x
dx = 1 + 2 = 3.
Problema 3.14. O variabil a aleatoare X are reparti tie uniform a pe
intervalul [a, b]. S a se calculeze M [X] si D[X]. S a se g aseasc a
P

X >
3a+b
4
, P

X <
a+2b
3
, P

2a+b
3
< X <
a+4b
5
,
P (|X M [X]| < [X]).
Rezolvare. Dac a o variabil a aleatoare oarecare X are repartitie uni-
form a pe un interval [a, b], atunci densitatea de probabilitate a ei este
f (x) =
(
1
b a
, x [a, b] ,
0, x / [a, b] .
S a determin am functia de repartitie:
F (x) =
Z
x
f (t) dt =
_
_
0, x < a,
x a
b a
, a x b,
1, x > b.
Calculnd media si dispersia lui X, obtinem
M [X] =
Z
+
xf (x) dx =
1
b a
Z
b
a
xdx =
a +b
2
,
D[X] =
Z
+
x
2
f (x) dx M [X]
2
=
1
b a
Z
b
a
x
2
dx
(a +b)
2
4
=
=
a
2
+ab +b
2
3

(a +b)
2
4
=
(b a)
2
12
.
Apoi avem
P

X >
3a +b
4
= 1 F

3a +b
4
= 1
1
4
=
3
4
,
P

X <
a + 2b
3
= F

a + 2b
3
=
2
3
,
P
2a +b
3
<X<
a + 4b
5
=F
a + 4b
5
2a +b
3
=
4
5

1
3
=
7
15
.
S a calcul am P (|X M [X]| < [X]):
[X] =
p
D[X] =
b a
2
3
,
P (|X M [X]| < [X]) = P

X
a +b
2
<
b a
2
=
= F

b a
2
3
+
a +b
2
b a
2
3
+
a +b
2
=
= F
3 + 1
b +
3 1
a
2
3
!
F
3 1
b +
3 + 1
a
2
3
!
=
=
3 + 1
2
3 1
2
3
=
1
3
.
Problema 3.15. O variabil a aleatoare X are reparti tie uniform a pe
intervalul [1, 3]. S a se g aseasc a densitatea de probabilitate a variabilei
aleatoare Y = X
2
+ 1.
Rezolvare. Densitatea de probabilitate a v. a. X este
f
X
(x) =
(
1
2
, x [1, 3] ,
0, x / [1, 3] ,
iar functia de repartitie a lui X este
F
X
(x) =
_
_
0, x < 1,
x
2
, 1 x 3,
1, x > 3.
Calcul am functia de repartitie a v. a. Y
F
Y
(x) = P (Y < x) = P

X
2
+ 1 < x
= P

X <
x 1
=
= F
X
x 1
,
apoi densitatea de repartitie
f
Y
(x) = F
0
Y
(x) =

F
X
x 1
0
= f
X
x 1
1
2
x 1
=
=
_
_
_
1
4
x 1
, x [2, 10] ,
0, x / [2, 10] .
Am folosit faptul c a pe intervalul [1, 3] functia (x) = x
2
+ 1 este
inversabil a si (x) [2, 10].
Problema 3.16. S a se construiasc a graficele densit a tii de probabil-
itate si func tiei de reparti tie pentru urm atoarele valori ale mediei si
dispersiei unei variabile aleatoare repartizate normal: m = 0,
2
= 1;
m = 0,
2
= 1/4; m = 2,
2
= 1; m = 2,
2
=
1
2
.
Rezolvare. Urm atorul program n Matlab calculeaz a valorile celor
dou a functii ntr-un num ar n = 100 de puncte din intervalul [m3,
m+3] si construiste apoi graficele. Se poate observa cum se modific a
graficele densit atii de probabilitate la modificarea parametrilor msi .
% Densitatea de probabilitate si
% functia de repartitie ale unei variabile
% aleatoare repartizata normal
clear;
clc;
n=100;
m1=0;
sigma1=1;
m2=0;
sigma2=1/2;
m3=2;
sigma3=1;
m4=-2;
sigma4=1/sqrt(2);
x1=[(m1-3*sigma1):6*sigma1/n:(m1+3*sigma1)];
f1=pdf(norm,x1,m1,sigma1);
F1=cdf(norm,x1,m1,sigma1);
subplot(2,1,1)
plot(x1,f1,b,x2,f2,r,x3,f3,g,x4,f4,c);
title(Densitatea de probabilitate);
subplot(2,1,2);
plot(x1,F1,b,x2,F2,r,x3,F3,g,x4,F4,c);
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.2
0.4
0.6
0.8
Densitatea de probabilitate
x
f
(
x
)
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.2
0.4
0.6
0.8
1
x
F
(
x
)
Figura 3.18.
Acelasi lucru realizat cu Mathematica
<<GraphicsGraphics
m=0;
sigma=1;
f1[x_]:=PDF[NormalDistribution[m,sigma],x]
g1=Plot[f1[x],{x,m-3 sigma,m+3 sigma}]
h1[x_] := CDF[NormalDistribution[m, sigma], x]
s1 = Plot[h1[x], {x, -4, 4}]
m=0;
sigma=1/2;
s2 = Plot[h2[x], {x, -4, 4}]
m=2;
sigma=1;
s3 = Plot[h3[x], {x, -5, 5}]
m=-2;
sigma=1/Sqrt[2];
s4 = Plot[h4[x], {x, -5, 5}]
Show[g1, g2, g3, g4, AxesLabel -> {"x", "y"}]
-4 -2 2 4
x
0.2
0.4
0.6
0.8
y
Show[s1, s2, s3, s4, AxesLabel -> {"x", "y"}]
-4 -2 2 4
x
0.2
0.4
0.6
0.8
1
y
Problema 3.17. O variabil a aleatoare X are reparti tie normal a cu
media m = 1 si abaterea medie p atratic a = 2. S a se calculeze
P (X < 0), P (X > 3), P (1 < X < 2).
Rezolvare. Dac a X N (m = 1,
2
= 4), atunci
f (x) =
1
2
2
e
(x1)
2
8
, x R
F (x) =
1
2
2
Z
x
(t1)
2
8
dt, x R.
Remarc amc a F (x) poate fi exprimat a prin functia de repartitie (x) =
1
2
x
R
t
2
2
dt a unei variabile aleatoare normale reduse (functia lui
Laplace) sau prin funtia erorilor erf (x) =
2
x
R
0
e
t
2
dt:
F (x) =
x m
x 1
2
=
=
1
2
1 + erf
x m
=
1
2
1 + erf
x 1
2
.
Folosind (x) sau erf (x) putem calcula probabilitatile cerute
P (X < 0) =
1
2
= 1
1
2
,
P (X < 0) =
1
2
1 + erf
1
2
=
1
2
1 erf
1
2
,
P (X > 3) = 1 (1) =
1
2
1 erf
,
P (1 < X < 2) =
1
2
(0) =
1
2
erf
1
2
erf (0)
.
Urm atorul programn Matlab calculeaz a probabilit atile celor trei eveni-
mente, ilustrnd folosirea tuturor celor trei functii: F (x), (x), erf (x).
% Probabilitatile unor evenimente
% calculate in cateva moduri
clear;
clc;
format short g;
n=100;
m=1;
sigma=2;
fprintf(P(X<0)=%g\n,cdf(norm,0,m,sigma));
fprintf(P(X<0)=%g\n,cdf(norm,(0-m)/sigma,0,1));
fprintf(P(X<0)=%g\n,(1+erf((0-m)/sigma/sqrt(2)))/2);
fprintf(P(X>3)=%g\n,1-cdf(norm,3,m,sigma));
fprintf(P(X>3)=%g\n,1-cdf(norm,(3-m)/sigma,0,1));
fprintf(P(X>3)=%g\n,(1-erf((3-m)/sigma/sqrt(2)))/2);
fprintf(P(1<X<2)=%g\n,cdf(norm,2,m,sigma)-
cdf(norm,1,m,sigma));
fprintf(P(1<X<2)=%g\n,cdf(norm,(2-m)/sigma,0,1)-
cdf(norm,(1-m)/sigma,0,1));
fprintf(P(1<X<2)=%g\n,(erf((2-m)/sigma/sqrt(2))-
erf((1-m)/sigma/sqrt(2)))/2);
Rezultatele afisate de program sunt:
P(X < 0) = 0.308538
P(X < 0) = 0.308538
P(X < 0) = 0.308538
P(X > 3) = 0.158655
P(X > 3) = 0.158655
P(X > 3) = 0.158655
P(1 < X < 2) = 0.191462
P(1 < X < 2) = 0.191462
P(1 < X < 2) = 0.191462
Problema 3.18. Pre tul unei ac tiuni poate fi considerat avnd repar-
ti tie normal a cu media 10.25 lei si abaterea medie p atratic a = 0.55
lei. S a se calculeze probabilitatea ca pre tul unei ac tiuni a) s a de-
p a seasc a 11.00 lei; b) s a fie mai mic de 9.75 lei; c) s a fie situat ntre
10.10 lei si 10.40 lei.
Rezolvare. Aplicnd binecunoscutele formule, obtinem:
P (X > 11) = 1 F (11) = 1
11 10.25
0.55
=
= 1 (1.3636) = 1 0, 91366 = 0.086341;
P (X < 9.5) = F (9.5) =
9.5 10.25
0.55
=
= (0.909) = 0.18165;
P (10.1 < X < 10.4) = F (10.4) F (10.1) = (0.2727)
(0.2727) = 0.60747 0.39253 = 0.21494.
Problema 3.19. O variabil a aleatoare X are densitatea de probabi-
litate de forma f (x) = e
x
2
+x
. S a se determine tipul reparti tiei v. a.
X. S a se g aseasc a parametrul , media si dispersia lui X.
Rezolvare. Variabila aleatoare X are repartitie normal a. Transfor-
m am f (x) pentru a g asi m si :
f (x) = e
x
2
+x
= e
(
x+
1
2
)
2
1
4
=

e
1/4
e
(
x+
1
2
)
2
.
Pentru ca f (x) s a fie densitate de probabilitate trebuie ca

e
1/4
=
1
2
, adic a =
e
1/4
2
, de unde obtinem M [X] = m =
1
2
, D[X] =
2
= 1.
Problema 3.20. S a se calculeze media si dispersia unei variabile
aleatoare repartizate exponen tial.
Rezolvare. O variabil a aleatoare X repartizat a exponential are den-
sitatea de repartitie
f (x) =

0, x 0,
e
x
, x > 0.
Aplicnd formulele mediei si dispersiei, obtinem
M[X] =
Z
+
xf (x) dx =
Z
+
0
xe
x
dx =
x + 1
e
x
+
0
=
1
;
D[X] =
Z
+
x
2
f (x) dx
2
=
Z
+
0
x
2
e
x
dx
1
2
=
=
2
x
2
+ 2x + 2
2
e
x
+
0
=
2
2

1
2
=
1
2
.
Problema 3.21. Timpul de a steptare n sta tie a autobuzului are repar-
ti tie exponen tial a cu media de a steptare 10 minute. S a se determine
probabilitatea c a timpul de a steptare a) va dep a si 20 minute; b) va fi
mai mic de 5 minute; c) va fi cuprins ntre 5 si 15 minute. S a se
afi seze graficele densit a tii de probabilitate si a func tiei de reparti tie
ale timpului de a steptare.
Rezolvare. Deoarece M [X] = 10 =
1
, rezult a c a =
1
10
. Deci
f (x) =
(
0, x 0,
1
10
e
x
10
, x > 0,
F (x) =

0, x 0,
1 e
x
10
, x > 0.
Avem apoi
P (X > 20) = 1 F (20) , P (X < 5) = F (5) ,
P (5 < X < 15) = F (15) F (5)
Urm atorul program n Matlab afiseaz a graficele functiilor si calculeaz a
probabilit atile celor trei evenimente:
% Densitatea de probabilitate si
% functia de repartitie ale
% unei variabile aleatoare exponentiale
clear;
clc;
format short g;
lambda=1/10;
x=0:50;
f=pdf(exp,x,1/lambda);
%f=lambda*exp(-lambda*x);
F=cdf(exp,x,1/lambda);
subplot(2,1,1)
plot(x,f);
title(Densitatea de probabilitate);
subplot(2,1,2);
plot(x,F);
fprintf(P(X>20)=%g\n,1-cdf(exp,20,1/lambda));
fprintf(P(X<5)=%g\n,cdf(exp,5,1/lambda));
fprintf(P(5<X<15)=%g\n,cdf(exp,15,1/lambda)
-cdf(exp,5,1/lambda));
Obtinem rezultatele:
P(X > 20) = 0.135335
P(X < 5) = 0.393469
P(5 < X < 15) = 0.3834
Graficele functiilor sunt reprezentate n figura 3.21.
Problema 3.22. Timpul de bun a func tionare a dou a componente de
baz a ale unui aparat este repartizat exponen tial cu media egal a cu 8000
ore, respectiv 10000 ore. S a se calculeze probabilitatea c a timp de
15000 ore de la momentul punerii n func tiune a aparatului a) nu
se defecteaz a nici o component a; b) se defectez a o component a; c) se
defecteaz a ambele componente.
Rezolvare. Fie X Exp (1/8000), Y Exp (1/10000) timpii de
bun a functionare ai celor dou a componente. Functiile de repartitie ale
variabilelor aleatoare sunt
F
X
(x) = 1 e
x
8000
, F
Y
(x) = 1 e
x
10000
.
0 5 10 15 20 25 30 35 40 45 50
0
0.02
0.04
0.06
0.08
0.1
x
f
(
x
)
0 5 10 15 20 25 30 35 40 45 50
0
0.2
0.4
0.6
0.8
1
x
F
(
x
)
Figura 3.21.
Fie p
i
, i = 1, 2 probabilitatea c a componenta i va functiona cel putin
15000 ore, adic a
p
1
= P (X > 15000) = 1 F
X
(15000) = 0.1533,
p
2
= P (Y > 15000) = 1 F
Y
(15000) = 0.2231.
Avem apoi
P ({X > 15000} {Y > 15000}) = p
1
p
2
= 0.0342,
P ({X > 15000} {X > 15000}) = p
1
(1 p
2
) +p
2
(1 p
1
) = 0.3080,
P ({X < 15000} {Y < 15000}) = (1 p
1
) (1 p
2
) = 0.6578.
Problema 3.23. Venitul lunar al unei persoane X ce activeaz a ntr-
un domeniu dat are reparti tie lognormal a cu parametrii m = 7.5 si
= 0.5. S a se g aseasc a venitul mediu al persoanelor din domeniul
respectiv. S a se g aseasc a cota parte a persoanelor cu venit mai mare
de 3000 lei. S a se construiasc a graficele densit a tii de probabilitate si
func tiei de reparti tie ale lui X.
Rezolvare. Dac a X LogN (m, ), atunci
M [X] = e
m+
2
/2
= 2048.78.
Densitatea de repartitie a lui X este
f (x) =
_
_
_
0, x 0,
1
x
2
e
(ln xm)
2
2
2
, x > 0,
iar functia de repartitie este
F (x) =
_
_
_
0, x 0,
x
R
0
1
t
2
e
(ln tm)
2
2
2
dt, x > 0,
=
=
_
_
_
0, x 0,
ln x m
, x > 0,
=
=
_
_
_
0, x 0
1
2
1 + erf
ln x m
, x > 0.
Deci
P (X > 3000) = 1
ln 3000 7.5
0.5
= 1 0.8444 = 0.1556.
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0
2
4
6
x 10
-4
x
f
(
x
)
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0
0.2
0.4
0.6
0.8
1
x
F
(
x
)
Figura 3.22.
toarele:
1. Notiunea de variabil a aleatoare continu a.
2. Definitia si propriet atile densit atii de probabilitate si a functiei
de repartitie.
3. Calculul probabilit atilor folosinde densitatea de probabilitate si
folosind functia de repartitie.
4. Calculul mediei si dispersiei unei variabile aleatoare continue.
5. Selectarea v. a. continue potrivite aplicatiei studiate.
6. Standardizarea v. a. normale.
Sintetiz am n urm atorul tabel v. a. continue studiate:
repartitia
densitatea de
probabilitate
M [X] D[X]
uniform a
X Unif [a, b]
1
ba
, x [a, b]
0, x / [a, b]
a +b
2
(b a)
2
12
exponential a
X Exp []
0, x 0
e
x
, x > 0
1
2
Weibull
Weib(n, a, b)
(
a
b
x
b
a1
e
(
x
b
)
a
, x > 0
0, x 0
b
1 +
1
a
b
2
1 +
2
a
1 +
1
a
2
gama
X Gama [p, ]
(

p
x
p1
e
x
(p)
, x > 0
0, x 0
p
2
hi-p atrat
X
2
(n)
_
_
_
1
2
n
2
n
2
x
n
2
1
e
x
2
, x > 0
0, x 0
n 2n
Student
X T(n)

n+1
2
n
2
1 +
x
2
n
n+1
2
0
n
n 2
, n > 2
normal a
X N [m, ]
1
2
e
(xm)
2
2
2
m
2
lognormal a
X LogN [m, ]
1
x
2
e
(ln xm)
2
2
2
, x > 0 e
m+
2
2
e
2m+
2

e
2
1

Capitolul 4
Teorema limit a central a
Teorema limit a centrala este una dintre cele mai importante teo-
reme din teoria probabilit atilor. Intuitiv, torema afirm a c a suma unui
num ar mare de v. a. independente, identic distribuite (i.i.d.), standar-
dizate (cu media 0 si dispersia 1) poate fi aproximat a de o distributie
normal a. Rezult a importanta acestei distributii, desi densitatea sa
de probabilitate are o form a care pare complicat a. Teorema limit a
central a mai poart a denumirea de miracolul lui Gauss.
Fie X
1
, X
2
, . . . , X
n
, . . . un sir de v. a. independente si identic dis-
tribuite cu M [X
i
] = m si D[X
i
] =
2
, i N
. Fie S
n
= X
1
+ X
2
+
+. . . +X
n
si M
n
=
1
n
S
n
. Teorema limit a central a d a informatii asupra
v. a.
Z
n
=
S
n
nm
n
=
n(M
n
m)
n

n
=
M
n
m
n
=
(M
n
m)
.
Deoarece M [M
n
] = m, D[M
n
] =

2
n
, deducem c a M [Z
n
] = 0 si
D[Z
n
] = 1. Aceat a v. a. se numeste standardizat a, deci sirul Z
n
este
versiunea standardizat a a sirului M
n
.
Teorema 4.1. (Teorema limita centrala) Fie (X
n
)
nN
un sir de v. a.
i.i.d. cu M [X
i
] = m si D[X
i
] =
2
, i N
. Atunci pentru orice

numere reale a < b, avem
lim
n
P (a Z
n
b) =
1
2
Z
b
a
e
1
2
x
2
dx. (4.1)
O variant a a teoremei limit a central a este urm atoarea:
155
156 CAPITOLUL 4. TEOREMA LIMIT
A CENTRAL
A
Teorema 4.2. Fie (X
n
)
nN
un sir de v. a. independente i.i.d. cu
M [X
i
] = m si D[X
i
] =
2
i
, i N
si lim
n
2
n
=
2
. Atunci pentru
orice numere reale a < b, avem
lim
n
P (a Z
n
b) =
1
2
Z
b
a
e
1
2
x
2
dx.
Ilustr am teorema limit a central a prin urm atoarele exemple:
Exemplul 4.1. Select am10 000 de esantioane de dimensiune 3 dintr-o
populatie care urmeaz a o distributie normal a cu media 100 si abaterea
medie p atratic a 16. Folosind aceste esantioane s a se observe, folosind
Mathematica: a) distributia mediei, b) distributia dispersiei.
Rezolvare. Dup a ce am nc arcat pachetul StatisticsContinuousDistri-
butions folosim
- RandomArray pentru a genera 10 000 de esantioane, de dimensiune
3, dintr-o distributie normal a cu media 100 si abaterea medie p atratic a
16 si
- Take pentru a vedea, de exemplu, primele 5 esantioane din cele
generate.
aleat = RandomArray[NormalDistribution[100, 16], {10000, 3}];
{{108.963,80.77,99.911},{116.109,101.269,75.0883},
{80.8656,98.3483,96.1873},{108.833,95.8541,107.294},
{116.027,143.98,80.5511}}
a) Folosim comenzile Map mpreun a cu Mean pentru a calcula me-
dia fiec arui esantion si Take pentru a afisa mediile primelor cinci esan-
tioane din lista aleat.
med = Map[Mean, aleat]
Take[med, 5]
{88.6192,89.9808,107.404,99.843,98.7177}
n = Length[med]
10000
Program am o functie, histnorm care va genera histograma (vezi
Capitolul 6) celor 10000 de medii si gracul distributiei normale de
care acest esantion este foarte apropiat, conform teoremei limit a cen-
tral a. Aceast a distributie normal a va avea media 100 si abaterea me-
die p atratic a 16/
3. Pentru a realiza toate acestea este necesar s a se

utilizeze pachetul GraphicsGraphics.
CAPITOLUL 4. TEOREMA LIMIT
A CENTRAL
A 157
<< GraphicsGraphics
histnorm[aleat2_, n_, i_, med2_] :=
(amin = Min[med2]; amax = Max[med2];
h = N[(amax - amin)/(1 + Log[2, n])];
r = (amax - amin)/h;
vec = {amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,
amin + 5 h, amin + 6 h, amin + 7 h, amin + 8 h, amin + 9 h,
amin + 15 h};
freqq12 = BinCounts[med2, {amin, amax, h}];
ghh = Histogram[freqq12, FrequencyData -> True,
HistogramCategories -> { amin, amin + h, amin + 2 h, amin + 3 h,
amin + 14 h, amin + 15 h},
Ticks -> IntervalCenters, HistogramCategories -> Automatic,
HistogramScale -> 1, DisplayFunction -> Identity];
m = N[Mean[med2]];
sigma = 16/Sqrt[i];
hh[x_] := PDF[NormalDistribution[m, sigma], x];
pn = Plot[hh[x], {x, m - 3 sigma, m + 3 sigma},
DisplayFunction -> Identity];
Show[pn, ghh])
gg = histnorm[aleat, n, 3, med]
Show[GraphicsArray[{gg}]]
100 120 140
0.01
0.02
0.03
0.04
Figura 4.1.
b) Calcul am dispersia fiec arui esantion din cele 10000 de esantioane
si le folosim pentru a reprezenta histograma.
var = Map[Variance, aleat];
A CENTRAL
A
Take[var, 5]
{207.195,431.381,90.8446,50.2826,1010.54}
amin = Min[var];
amax = Max[var];
h = N[(amax - amin)/(1 + Log[2, n])];
r = (amax - amin)/h
14.2877
amin + 15 h};
freqq1 = BinCounts[var, {amin, amax, h}]
{5258,2499,1150,603,257,123,55,26,10,9,3,3,1,1,1}
HistogramCategories -> {amin, amin + h, amin + 2 h, amin + 3 h,
amin + 14 h, amin + 15 h},
HistogramScale -> 1]
286.002 667.312 1048.62 1429.93 1811.24 2192.55 2573.86
0.0005
0.001
0.0015
0.002
0.0025
Figura 4.2.
Facem observatia c a dipersia esantionului poate fi modelat a de o
distributie proportional a cu distributia hi-p atrat cu 2 grade de liber-
tate.
Exemplul 4.2. Select am 5 000 de esantioane de dimensiuni 2, 3, 4, 5,
10 si 1000, respectiv, dintr-o populatie care urmeaz a o repartitie uni-
form a pe intrevalul [95, 105] . S a se studieze normalitatea esantioanelor
mediilor n cazurile considerate.
A CENTRAL
A 159
Rezolvare. Gener am sirurile de numere aleatoare
aleat2 = RandomArray[UniformDistribution[95, 105], {5000, 2}];
aleat1000 =RandomArray[UniformDistribution[95,105],{5000,1000}];
Folosim comenzile Map mpreun a cu Mean pentru a calcula media
fiec arui esantion.
med2 = Map[Mean, aleat2];
n = Length[med2]
5000
Pentru fiecare esantion desen am histograma si repartitia normal a
respectiv a.
<< GraphicsGraphics
histnorm[aleat2_, n_, med2_] :=
h = N[(amax - amin)/(1 + Log[2, n])];
vec = { amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,
amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h, amin + 14 h};
freqq12 = BinCounts[ med2, {amin, amax, h}];
HistogramCategories -> {amin, amin + h, amin + 2 h, amin + 3 h,
amin + 14 h},
m = N[Mean[med2]]; sigma = N[StandardDeviation[med2]];
A CENTRAL
A
pn = Plot[hh[x], {x, m - 3 sigma, m + 3 sigma}, DisplayFunction
-> Identity];
Show[pn, ghh])
g2 = histnorm[aleat2, n, med2]
g3 = histnorm[aleat3, n, med3];
Show[GraphicsArray[{{g2, g3}, {g4, g5}, {g10, g1000}}]]
98 99 100 101 102 103
0.1
0.2
0.3
0.4
99.7 99.8 99.9 100.1100.2100.3
1
2
3
4
98 100 102 104
0.05
0.1
0.15
0.2
0.25
98 100 102 104
0.05
0.1
0.15
0.2
0.25
0.3
96 98 100 102 104 106
0.05
0.1
0.15
0.2
98 100 102 104
0.05
0.1
0.15
0.2
Figura 4.3.
.
Rezultatul nu este afisat deoarece am inclus DisplayFunction ->
Identity n functia construit a, iar graficele au fost redate folosind Show
mpreun a cu GraphicsArray.
Exemplul 4.3. Select am 5 000 de esantioane de dimensiuni 2, 3, 25,
30, 50 si respectiv 100 dintr-o populatie care urmeaz a o distributie
exponential a cu media 2. S a se studieze normalitatea esantioanelor
mediilor n cazurile considerate.
Rezolvare. Media 2 implic a = 0.5.
aleat2 = RandomArray[ExponentialDistribution[0.5], {5000, 2}];
A CENTRAL
A 161
n = Length[med2]
5000
<< GraphicsGraphics
histnorm[aleat2_, n_, med2_] :=
h = N[(amax - amin)/(1 + Log[2, n])];
vec = { amin, amin + h, amin + 2 h, amin + 3 h, amin + 4 h,
amin + 10 h, amin + 11 h, amin + 12 h, amin + 13 h, amin + 14 h};
freqq12 = BinCounts[med2, { amin, amax, h}];
HistogramCategories -> { amin, amin + h, amin + 2 h,
amin + 13 h, amin + 14 h},
m = N[Mean[med2]]; sigma = N[StandardDeviation[med2]];
pn = Plot[hh[x], {x, m - 3 sigma, m + 3 sigma},
DisplayFunction -> Identity];
Show[pn, ghh])
Show[GraphicsArray[{{g2, g3}, {g4, g5}, {g10, g100}}]]
A CENTRAL
A
1.5 2.5 3
0.2
0.4
0.6
0.8
1
1.2
1.4
1.25 1.5 1.75 2.25 2.5 2.75
0.5
1
1.5
2
1.5 2 2.5 3 3.5 4
0.2
0.4
0.6
0.8
1
1.5 2 2.5 3 3.5 4
0.2
0.4
0.6
0.8
1
-2 2 4 6 8 10 12
0.05
0.1
0.15
0.2
0.25
0.3
2 4 6 8
0.05
0.1
0.15
0.2
0.25
0.3
0.35
Figura 4.4.
Observ am c a natura exponential a a distributiei mediei populatiei
este aparent a pentru esantioane de dimensiune 2 si 3, iar cnd dimen-
siunea esantionului creste distributia devine tot mai normal a.
4.1 Aplicatii ale teoremei limit a centrale
Problema 4.1. Determinarea volumului unei selectii bernoul-
liene care s a permit a aplicarea legii numerelor mari. Pre-
supunem c a se realizeaz a experimente de tip Bernoulli n care un eveni-
ment A se produce cu probabilitatea p. Ne intereseaz a s a determin am
num arul minim de repet ari ale experien tei astfel nct s a putem aplica
legea numerelor mari a lui Bernoulii (s a putem afirma c a probabili-
tatea ca, n modul, diferen ta dintre frecven ta relativ a a evenimentului
A n n repet ari ale experien tei, si p este mai mare dect un > 0, este
mai mic a dect un num ar dat).
Rezolvare. Not am cu X
k
variabila aleatoare care ia valoarea 1 dac a
la experienta cu num arul de ordine k se produce evenimentul A si
0 dac a nu se produce A. Avem P(A) = p, q = 1 p. Variabilele
aleatoare (X
k
)
kN
sunt independente. Atunci valoare lui S

n
= X
1
+
X
2
+. . . +X
n
reprezint a num arul de succese a lui A n urma efectu arii
a n experiente. S
n
este o v. a. distribuit a binomial, S
n
Bin(n, p).
1
n
S
n
este frecventa relativ a de realizare a evenimentului A n primele
A CENTRAL
A 163
n probe independente si se mai noteaz a f
n
(A) =
1
n
S
n
. M

1
n
S
n
= p,
D
1
n
S
n
=
pq
n
. Legea numerelor mari a lui Bernoulli afirm a c a
1
n
S
n
p,
deci
lim
n
P

1
n
S
n
p
>
= 0,
Dar
P

1
n
S
n
p
>
<
pq
n
2
< ,
fiind dat. Relatia ne permite s a determin am o margine inferioar a
pentru volumul selectiei n. Deoarece pq = p(1 p)
1
4
, rezult a c a
pq
n
2
< n >
pq
2
si max
p
pq
2
=
1
4
2
n >
1
4
2
.
Aceast a margine inferioar a este mai mult dect este necesar pentru
a putea aplica legea numerelor mari a lui Bernoulli. Putem verica
aceasta aplicnd teorema limit a central a deoarece v. a. ale sirului
(X
n
)
nN
au aceeasi repartitie (binomial a) si sunt independente. Apli-

carea acestei teoreme ne permite s a calcul am probabilitatea exact a
pentru
P

1
n
S
n
p
>
= P
1
n
S
n
p
p
pq
n
>
r
n
pq
!
=
=1P
1
n
S
n
p
p
pq
n
r
n
pq
!
=1
r
n
pq
r
n
pq
=
= 2
r
n
pq
< .
Not am z =
r
n
pq
; problema este s a se determine z
0
astfel nct
2(z) < 2(z
0
) = (z
0
) =

2
, si n astfel nct
r
n
pq
= z
0
.
Rezult a n =
z
2
0
pq
2
si deci max
p,q
z
2
pq
2
=
z
2
4
2
, adic a
n
z
2
0
4
2
. (4.2)
ntr-adev ar, dac a lu am = 0.02 si = 0.05 obtinem, conform Legii
numerelor mari n >
1
40.02
2
0.05
= 125000. Deci, (z
0
) =
0.05
2
= 0.025,
adic a z
0
= 1.96 si deci n >
1.96
2
40.02
2
= 2401.
A CENTRAL
A
Problema 4.2. Pentru a estima probabilitatea unui eveniment A, se
efectueaz a un sir de experien te Bernoulli. Se observ a frecven ta relativ a
a evenimentului A. De cte ori trebuie repetat evenimentul A astfel
nct cu o probabilitate de 0.95 frecven ta relativ a s a difere de p = P(A)
cu 0.01?
Rezolvare. Fiind experiente Bernoulli, media M[X] = p si dispersia
D[X] = p(1p). Evident c a p(1p) 1/4 pentru 0 p 1. Folosim
rezultatele exercitiului anterior si tinem seama c a = 0.01 si = 0.05.
Obtinem n >
1
4
2
=
1
40.050.01
2
= 50000.
Aceast a evaluare s-a obtinut utiliznd inegalitatea lui Cebsev
care d a niste evalu ari destul de grosiere. Vom obtine o alt a evalu-
are utiliznd teorema limit a central a: n
z
2
0
4
2
unde (z
0
) =
0.05
2
=
0.975 z
0
= 1.96 n >
1.96
2
40.01
2
= 9604.
Problema 4.3. S a se determine num arul minim de arunc ari ale unei
monede care s a asigure cel pu tin cu o probabilitate de 0.9 ca diferen ta
dintre frecven ta relativ a ob tinut a si probabilitatea de apari tie a unei
fe te s a fie mai mic a n valoare absolut a dect 0.2.
Rezolvare. Folosind inegalitate lui Cebsev obtinem,
P

f
n
(A)
1
2
< 0.2
> 0.9. (4.3)

Conform relatiei (4.2) avem = 0.2, = 1 0.9 = 0.1 si deci n >
1
4
2
=
1
40.10.2
2
= 62.5, n > 63. Cel putin 63 de arunc ari asigur a
P

S
63
63

1
2
< 0.2
> 0.9.
Putem determina intervalul n care variaz a frecventa relativ a astfel
nct (4.3) s a fie satisf acut a si deci frecventa absolut a pentru un anu-
mit n 63,
k
n

1
2
< 0.2 0.3 <

k
n
< 0.7 n 0.3 < k < n 0.7.
Dac a n = 63 rezult a 18 < k < 44. Deci din 63 arunc ari, num arul
arunc arilor reusite este cuprins ntre 18 si 44, atunci (4.3) este sat-
isf acut a, adic a am determinat intervalul n care se situeaz a num arul
cazurilor favorabile aparitiei unei aceleiasi fete, aceasta avnd loc cu
probabilitatea de cel putin 0.9.
A CENTRAL
A 165
Problema 4.4. O central a electric a trebuie s a deserveasc a o re tea de
10000 de aparate. Probabilitatea func tion arii unui aparat n perioada
de vrf a consumului de energie electric a, este de 0.7. S a se fac a
analiza economic a necesar a proiect arii centralei.
Rezolvare. Pentru a determina capacitatea centralei pot fi adoptate
criterii diferite:
1. s a construim centrala astfel nct n orice moment cele 10 000
de aparate s a functioneze simultan;
2. s a se determine capacitatea centralei astfel nct cu o probabi-
litate suficient de mare, consumul obisnuit s a fie asigurat cu energia
necesar a unei bune function ari.
Fie X o variabil a aleatoare care ia ca valori num arul de aparate care
pot functiona n perioada de vrf a consumului de energie electric a.
Aceast a variabil a aleatoare are o repartitie binomial a cu
n = 10000, p = 0.7, M[X] = np = 7000,
D[X] = npq = 2100,
p
D[X] = 45.83 46,
Adopt am cea de a doua solutie: s a determin am capacitatea centralei
astfel nct cu o probabilitate de 0.99 functionarea s a fie normal a.
Folosim Teorema Moivre-Laplace cu a = .
P
1
n
S
n
p
p
pq
n
b
!
= 0.999 = (b) b = 3.09
S
n
10000 0.7
10000 0.7 0.3

3.09.
S
n
= 7000 +
10000 0.7 0.3 3.09 = 7141.6 7142 se numeste

coecient de simultaneitate si este indicat s a se fac a constructia cen-
tralei pentru el. Dac a centrala se construieste pentru 10000 de aparate
care s a functioneze simultan, cu o probabilitate de 0.01, un num ar de
10000 7142 = 2858 aparate r amn nefolosite.
Problema 4.5. O fabric a are n stoc 1660 tone dintr-o materie prim a.
Stiind c a zilnic se consum a n medie 13.33 t cu abaterea 1.2 t, cu ce
probabilitate aceast a cantitate ajunge pentru 4 luni.
Rezolvare. Not am cu X
i
variabila aleatoare care ia ca valori con-
sumul zilei i, i = 1, 120. Avem
M[X
i
] = 13.33,
p
D[X
i
] = 1.2.
A CENTRAL
A
n 120 de zile se consum a X =
120
P
i=1
X
i
. Ne afl am n cazul general n
care nu se cunoa ste reparti tia variabilei aleatoare X
i
. S a determin am
P(X < 1660).
M[X] = nm = 120 13.33 = 1599.6,
D[X] =
n
2
=
n =
120 1.2 = 13.1,

P(X < 1660) = P

X 1599.6
13.1
<
1660 1599.6
13.1
= 0.999.
Se poate deci presupune c a aproape sigur cantitatea de materie prim a
este suficient a.
Problema 4.6. Aplicatie la sondaje de opinie. Presupunem c a
se realizeaz a experimente de tip Bernoulli n care un eveniment A se
produce cu probabilitatea p. Not am cu X
k
variabila aleatoare care ia
valoarea 1 dac a la experien ta cu num arul de ordine k se produce eveni-
mentu A si 0 dac a nu se produce A. Variabilele aleatoare (X
k
)
k1
sunt
independente. Atunci S
n
= X
1
+ X
2
+ . . . + X
n
reprezint a num arul
total de realiz ari ale evenimentului A, deci num arul de succese ale lui
A n urma efectu arii a n experien te. S
n
este o v. a. repartizat a bino-
mial, S
n
Bin(n, p). V. a. (X
n
)
nN
au aceea si reparti tie (binomial a).
Ne intereseaz a s a calcul am ntre ce limite poate varia S
n
astfel nct
succesul s a se produc a cu o probabilitate dat a.
Rezolvare. Not am cu Z
n
=
S
n
np
npq
. Conform teoremei limit a
central a rezult a c a pentru orice a < b si n suficient de mare,
P (a Z
n
b) =
1
2
Z
b
a
e
1
2
x
2
dx = (b) (a).
Pentru orice < , avem S
n
dac a si numai dac a
np
npq
Z
n

np
npq
.
Notnd
np
npq
= a,
np
npq
= b, rezult a c a
P ( S
n
) =
np
npq
np
npq
A CENTRAL
A 167
si deci
P (np +a
npq S
n
np +b
npq)
= (b) (a).
n particular, pentru a = b (b > 0) rezult a formula
P (np b
npq S
n
np +b
npq)
= 2 (b) 1, (4.4)
pentru n >> 1 (unii statisticieni recomand a npq 10 ).
Aceast a formul a este utilizat a n sondaje astfel. Consider am o po-
pulatie statistic a uman a c areia i cerem opinia ntr-o anumit a chesti-
une: ce echip a de fotbal, ce partid, ce televiziune etc prefer a. Nu toat a
lumea poate fi consultat a si atunci se realizeaz a un sondaj pe esan-
tioane restrnse, alese cu obiectivitate. S a presupunem c a se consult a
n persoane si not am cu S
n
num arul de persoane care se pronunt a pen-
tru (succes); se determin a parametrul p ca ind frecventa de succes.
Cu ajutorul lui se determin a intervalul de succes pentru populatia
studiat a.
De exemplu, pentru b = 2.17 avem (b) = 0.985 deci 2 (b) 1 =
0.97 si conform (4.4), se realizeaz a cu eroare sub 3% evenimentul
S
n
[np 2.17
npq S
n
np + 2.17
npq] ;
pentru b = 1.96 avem 2(b)1 = 0.952 si conform (4.4), se realizeaz a
cu eroare sub 5% evenimentul
S
n
[np 1.96
npq S
n
np + 1.96
npq] .
Problema 4.7. Dintr-un sondaj realizat ntr-un ora s a rezultat c a
dintr-un e santion de 1000 votan ti 600 ar vota cu partidul X. Cu o
eroare de sub 3% s a se estimeze c ti dintre cei 1.2 milioane de votan ti
ar vota pentru X. Dar cu o eroare de 5%? Dar de 1%?
Rezolvare. Avem p =
600
1000
= 0.6 si q = 0.4, n = 1200000 si deoarece
2 (b) 1 = 0.97 rezult a (b) = 0.985 b = 2.17, deci num arul
cerut este cuprims ntre np 2.17
npq si np + 2.17
npq adic a ntre

1200000 0.6 2.17
1200000 0.6 0.4 = 718840

si
1200000 0.6 + 2.17
1200000 0.6 0.4 = 721160.

A CENTRAL
A
Dac a 2 (b) 1 = 0.95 rezult a (b) = 0.975 b = 1.96, deci
num arul cerut este cuprims ntre
1200000 0.6 1.96
1200000 0.6 0.4 = 718950

si
1200000 0.6 + 1.96
1200000 0.6 0.4 = 721050.

Dac a 2 (b) 1 = 0.99 rezult a (b) = 0.995 b = 2.57, deci
num arul cerut este cuprims ntre
1200000 0.6 2.57
1200000 0.6 0.4 = 718620

si
1200000 0.6 + 2.57
1200000 0.6 0.4 = 721380.

Observ am c a o eroare mai mic a implic a un interval mai mare.
Rezolvarea cu Mathematica:
p = 0.6;
n = 1200000;
eroare = 0.05;
q1 = Quantile[NormalDistribution[0, 1], (2 - eroare)/2]
1.95996
inmin = n p - q1 Sqrt[n p (1 - p)]
718948
inmax = n p + q1 Sqrt[n p (1 - p)]
721052
eroare = 0.01;
q2 = Quantile[NormalDistribution[0, 1], (2 - eroare)/2]
2.57583
inmin = n p - q2 Sqrt[n p (1 - p)]
718618
inmax = n p + q2 Sqrt[n p (1 - p)]
721382
Facem observatia c a diferentele apar datorit a erorilor de aproxi-
mare.
Problema 4.8. O moned a este aruncat a de 1000 de ori. Cu o proba-
bilitate de 0.95 n ce interval se va situa num arul de apari tii al stemei?
A CENTRAL
A 169
Rezolvare. Probabilitatea de aparitie a stemei la o aruncare este
p =
1
2
. Fie X variabila aleatoare egal a cu num arul de aparitii al stemei
la aruncarea de n = 1000 de ori a monezii. X poate fi aproximat cu
o variabil a aleatoare normal a avnd media m = np = 500 si dispersia
2
= np (1 p) = 250. Prin urmare
P

X m
<
= 2() 1 = 0.95.
De unde g asim () = 0.975 si apoi = 1.96.
Deci X [m, m+], adic a X [402, 598].
Problema 4.9. Probabilitatea de producere a unui eveniment oare-
care n cadrul unei experien te este de 0.1. n cadrul a n experien te
evenimentul s-a produs de 100 ori. S a se determine intervalul pentru
num arul de experien te cu o probabilitate de a) 0.95, b) 0.99.
Rezolvare. Experientele considerate sunt experiente Bernoulli cu pro-
babilitatea de succes p = 0.1. Consider am variabilele aleatoare X
i
X
i
:

1 0
p 1 p
, i = 1, n.
Avem
M [X
i
] = p
not
= m, D[X
i
] = p (1 p)
not
=
2
.
Variabila aleatoare X =
n
P
i=1
X
i
poate fi aproximat a cu o variabil a
aleatoare normal a cu media mn = np si dispersia n
2
= np (1 p).
Avem
P
X np
p
np (1 p)
<
!
= 0.95.
Pe de alt a parte
P
X np
p
np (1 p)
<
!
= 2() 1 = 0.95
() = 0.975 = 1.96.
A CENTRAL
A
Cum X = 100 rezult a c a
100 np
p
np (1 p)
=
100
1
10
n
3
10
n
= 1.96 n = 830,
100 np
p
np (1 p)
=
100
1
10
n
3
10
n
= 1.96 n = 1204.
n concluzie 830 n 1204.
Procednd analog pentru probabilitatea 0.99, obtinem
2() 1 = 0.99 () = 0.995 = 2.575,
100 np
p
np (1 p)
= 2.575 n
1
= 783, n
2
= 1275
si deci 783 n 1275.
4.1.1 Aproximarea v. a. binomiale printr-o v. a.
normal a
Fie X o v. a. discret a repartizat a binomial cu parametrii p si n
(deci M [X] = np, D[X] = npq) si k N, k n. S a se calculeze
P (X = k) si P (X k) folosind teorema limit a central a (pentru n
suficient de mare si pq nu foarte mic).
Conform teoremei limit a central a X N

np,
npq
si deci
P (X = k) = P

X
k
1
2
, k +
1
2
=
=
k +
1
2
np
npq
k
1
2
np
npq
.
Ad augarea lui 0.5 la k se numeste corectie prin continuitate. A
fost pentru mbun at atirea aproximatiei.
La fel P (X k) = P

X k +
1
2
k +
1
2
np
npq
.
Problema 4.10. La un canal de comunicare digital presupunem c a
v. a. care ia ca valori num arul bi tilor erona ti primi ti poate fi modelat a
de o v. a. distribuit a binomial.
a) Presupunem c a probabilitatea de a ob tine un bit eronat este de
10
5
. Dac a 16 milioane de bi ti au fost transmi si, care este probabili-
tatea ca cel mult 150 s a fie erona ti?
A CENTRAL
A 171
b) Presupunem c a probabilitatea de a ob tine un bit eronat este de
10
1
. Dac a 50 de bi ti au fost transmi si, care este probabilitatea ca cel
mult 2 s a fie erona ti? Compara ti aceast a probabilitate cu ce ob tinut a
prin aproximarea cu distribu tia normal a.
c) n condi tiile de la punctul b), calcula ti probabilitatea de a avea
exact 5 bi ti erona ti prin cele dou a metode.
Rezolvare. a) Fie X v. a. repartizat a binomial care ia ca valori
num arul de biti care au fost transmisi eronat n cursul transmisiei celor
16 milioane de biti.
P (X 150) =
150
X
i=0
C
i
16000000
10
5
1 10
5
16000000i
.
Evident, aceast a probabilitate este foarte greu de calculat. Vom
folosi distributia normal a care furniza o bun a aproximare pentru proba-
bilitatea c autat a. Deoarece n = 16000000 si p = 10
5
, atunci repar-
titia normal a care aproximeaz a are m = 160 si = 12.469. Din ur-
m atoarea secvent a observ am c a repartitia normal a realizeaz a n acest
caz o foarte bun a aproximare.
n = 16000000;
p = N[10^(-5)]
0.00001
m = N[n p]
160
sigma= N[Sqrt[n p(1 - p)]]
12.649
<< StatisticsDiscreteDistributions
hh[x_] := PDF[NormalDistribution[m, sigma], x]
f[k_] := PDF[BinomialDistribution[n, p], k]
tab1 = Table[{k, f[k]}, {k, 10, 250}];
p1 = Plot[hh[x], {x, m - 3 sigma, m + 3 sigma}, DisplayFunction ->
Identity];
<< GraphicsGraphics
p2 = Graphics[{PointSize[0.015], Map[Point, tab1]}]
Show[p1, p2]
A CENTRAL
A
50 100 150 200 250
0.005
0.01
0.015
0.02
0.025
0.03
Figura 4.5.
P (X 150) = P (X 150.5) =
=P
X 160
p
160(1 10
5
)
150.5 160
p
160(1 10
5
)
!
=P (Z0.75) = 0.226
CDF[NormalDistribution[160, 12.649], 150.5]
0.226312
b) p = 0.1, n = 50, P (X 2) =
2
P
i=0
C
i
50
(10
1
)
i
(1 10
1
)
50i
.
Calcul am aceast a probabilitate. Definim functia ajut atoare pentru
calculul probabil atii
f[i_, n_] = n!/(i! (n - i)!)(10^(-1))î (1 - 10^(-1))^(n - i);
N[Sum[f[i, 50], {i, 0, 2}]]
0.111729
Calcul am probabilitatea aproximnd cu distributia normal a cu me-
dia m = np = 50 0.1 = 5 si =
50 0.1 0.9 = 2.1213,

0.119296
c) P (X = 5) = C
5
50
(10
1
)
5
(1 10
1
)
45
sau
P (X = 5) = P (4.5 X 5.5) =
5.55
2.1213
4.55
2.1213
.
Facem calculele cu Mathematica.
f[i_, n_] = n!/(i! (n - i)!)(10^(-1))î (1 - 10^(-1))^(n - i);
N[f[5, 50]]
0.184925
CDF[NormalDistribution[5, 2.12132], 5.5] -
A CENTRAL
A 173
0.186336
Observ am c a aproximarea este nc a suficient de bun a.
Problema 4.11. Se arunc a o moned a si probabilitatea de a ob tine
banul este 0.6. Se arunc a moneda de 1000 ori. Care este probabilitatea
de a ob tine banul de 650 de ori?
Rezolvare. Fie X v. a. care ia ca valori num arul de aparitii ale ban-
ului n cele 1000 de arunc ari. Evident X Bin[10000; 0.6]. Conform
teoremei limit a central a X N (600, 240).
P (X = 650) = P

X
650
1
2
, 650 +
1
2
=
=
650 +
1
2
600
240
650
1
2
600
240
=
= (3.25) (3.19) = 0.999423 0.999289 = 0.000134.
O v. a. distribuit a binomial se aproximeaz a cu o v. a. distribuit a
normal dac a np > 5, nq > 5.
Conditii pentru aproximarea distributiei hipergeometrice si bino-
miale:
distributia distributia distributia
hipergeo-
metric a
n
N
< 0.1 binomial a
np > 5
n(1 p) > 5
normal a
4.1.2 Aproximarea v. a. Poisson printr-o v. a.
normal a
Reamintim c a distributia Poisson s-a dezvoltat ca limit a a dis-
tributiei binomiale cnd num arul experimentelor tinde la innit. De
aceea apare logic ca s a utiliz am distributia normal a pentru a aproxima
probabilit ati Poisson. Fie X o v. a. discret a repartizat a Poisson cu
parametru . Atunci M [X] = , D[X] = . Conform teoremei lim-
it a central a X N

,
. S a se calculeze P (X = k) si P (X k)
pentru k num ar natural.
P (X = k) = P

X
k
1
2
, k +
1
2
=
=
k +
1
2

k
1
2

.
Analog P (X k) = P

X k +
1
2
k+
1
2
.
Aproximarea este bun a dac a > 5.
A CENTRAL
A
Problema 4.12. Statistica arat a c a la o unitate de asigur ari se pri-
mesc n medie 300 de reclama tii pe an. Fie X v. a. care ia ca valori
num arul de reclama tii pe an, presupus a repartizat a Poisson. S a se
determine probabilitatea ca s a primeasc a cel pu tin 351 de reclama tii
pe an.
Rezolvare. Fie X Poiss [], = 300,
P (X 351) = 1 P (X 351) = 1
351.5 300
300
=
= 1 (2.9734) = 1 0.99853 = 0.00147.
m = 300
sigma = Sqrt[300]
300
10
3
N[%]
17.3205
1 - CDF[NormalDistribution[300, 17.3205 ], 351]
0.00161745
Dup a un studiu atent al acestui capitol retinem c a teorema limit a
central a permite aproximarea, n anumite conditii, a diferitelor dis-
tributii prin distributii normale, ceea ce este foarte util n simularea
experimentelor.
Capitolul 5
Vectori aleatori
5.1 Variabile aleatoare bidimensionale
n aplicatiile practice ale teoriei probabilit atilor se ntlnesc adesea
probleme n care rezultatele nu pot fi descrise de o variabil a aleatoare,
ci de dou a sau mai multe, ele formnd un vector aleator.
De exemplu, ntr-un anumit experiment ne intereseaz a s a m asur am
att viteza ct si directia particulelor atomice emise de o suprafat a.
Acestea sunt date de perechile (v, ), unde este m arimea unghiului
orientat n raport cu sistemul de referint a si v viteza. Acestea pot fi
studiate ca un vector aleator.
Definitia 5.1. Se numeste vector aleator n-dimensional orice n-uplu
X = (X
1
, X
2
, . . . , X
n
) avnd cele n componente, X
1
, X
2
, . . . , X
n
,
variabile aleatoare.
Pentru simplitate, vom considera vectori aleatori (vec. a. ) bidi-
mensionali.
Definitia 5.2. Vec. a. bidimensional X = (X
1
, X
2
) se numeste dis-
cret dac a multimea valorilor v. a. (X
1
, X
2
) este cel mult num arabil a.
Orice vec. a. discret simpl bidimensional X = (X
1
, X
2
) se con-
sider a ca un v. a. de componente X
1
si X
2
. Dac a v. a. X
1
si X
2
iau
un num ar finit de valori, atunci valorile lui Y sunt perechile ordonate
(x
i
, y
j
) pe care le ia cu probabilitatea p
ij
= P (X
1
= x
i
si X
2
= y
j
) .
Obtinem urm atorul tablou bidimensional de repartitie:
175
176 CAPITOLUL 5. VECTORI ALEATORI
X
1
/X
2
y
1
y
2
. . . y
n
P(X
1
= x
i
)
x
1
p
11
p
12
. . . p
1n
p
1
x
2
p
21
p
22
. . . p
2n
p
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
m
p
m1
p
m2
. . . p
mn
p
m
P(X
2
= y
j
) p
1
p
2
. . . p
n
1
n care 0 p
ij
1.
Din faptul c a evenimentele {X
1
= x
i
, X
2
= y
j
}, i = 1, m, j = 1, n,
formeaz a un sistem complet de evenimente, rezult a c a suma probabil-
it atilor din tabel este 1,
m
X
i=1
n
X
j=1
p
ij
= 1,
unde
p
ij
= P ({X
1
= x
i
si X
2
= y
j
}) .
Am notat
n
X
k=1
p
ik
= p
i
, i = 1, m,
m
X
k=1
p
kj
= p
j
, j = 1, n,
cantit ati care se numesc probabilit a ti marginale. Deoarece
{X
1
= x
i
} = {X
1
= x
i
}
T
n
S
j=1
{X
2
= y
j
}
=
n
S
j=1
{X
1
= x
i
, X
2
= y
j
}
rezult a c a
P (X
1
= x
i
) =
n
X
j=1
p
ij
= p
i.
, P (X
2
= y
j
) =
m
X
i=1
p
ij
= p
.j
.
Definitia 5.3. Variabila aleatoare X
1
conditionat a de X
2
= y
j
are
repartitia
x
1
. . . x
i
. . . x
m
P (x
1
| y
j
) . . . P (x
i
| y
j
) . . . P (x
m
| y
j
)
unde am notat cu P (x
i
| y
j
) probabilitatea condi tionat a:
P (x
i
| y
j
) = P (X
1
= x
i
| X
2
= y
j
) =
P ({X
1
= x
i
} {X
2
= y
j
})
P(X
2
= y
j
)
=
p
ij
p
j
.
(5.1)
CAPITOLUL 5. VECTORI ALEATORI 177
Analog, variabila aleatoare X
2
conditionat a de X
1
= x
i
are repar-
titia

y
1
. . . y
j
. . . y
n
P (y
1
| x
i
) . . . P (y
j
| x
i
) . . . P (y
n
| x
i
)
unde am notat cu
P(y
j
| x
i
) = P(X
2
= y
j
| X
1
= x
i
) =
p
ij
p
i
.
Dac a nmultim relatia (5.1) cu P(X
2
= y
j
) obtinem
P({X
1
= x
i
} {X
2
= y
j
}) = P (X
1
= x
i
| X
2
= y
j
) P (X
2
= y
j
) ,
adic a am exprimat p
ij
ca un produs dintre o probabilitate conditionat a
si o probabilitate marginal a. Analog se obtine
P({X
1
= x
i
} {X
2
= y
j
}) = P (X
2
= y
j
| X
1
= x
i
) P (X
1
= x
i
) ,
Deoarece evenimentul
(X
2
= y
1
| X
1
= x
i
) (X
2
= y
n
| X
1
= x
i
) = E | {X
1
= x
i
}
rezult a c a
n
X
j=1
P (X
2
= y
j
| X
1
= x
i
) =
n
X
j=1
p
j
= 1.
La fel
m
X
i=1
P (X
1
= x
i
| X
2
= y
j
) =
m
X
i=1
p
i
= 1.
Definitia 5.4. Variabilele aleatoare:
X
1
:

x
i
p
i
, i = 1, m, X
2
:

y
j
p
j
, j = 1, n,
se numesc legi de probabilitate marginale pentru vect. a. bidimensional
(X
1
, X
2
).
Dac a evenimentele {X
1
= x
i
} si {X
2
= y
j
} sunt independente
atunci variabilele aleatoare X
1
si X
2
sunt independente, deci p
ij
=
p
i.
p
.j
si reciproc.
Dac a v. a. sunt independente atunci repartitiile conditionate sunt
identice cu repartitiile marginale.
Observatia 5.1. Putem atasa vec. a. (X
1
, X
2
) tabloul de repartitie
dat de legile de probabilitate conditionat a:
X
1
| X
2
= y
j
:

x
1
x
2
. . . x
i
. . . x
m
p
1j
p
j
p
2j
p
j
. . .
p
ij
p
j
. . .
p
mj
p
j
,
si respectiv
X
2
| X
1
= x
i
:

y
1
y
2
. . . y
j
. . . y
m
p
i1
p
i
p
i2
p
i
. . .
p
ij
p
i
. . .
p
in
p
i
.
Deci avem n legi conditionate ale variabilei aleatoare X
1
corespunz a-
toare celor n valori ale variabilei aleatoare X
2
si respectiv m legi de
probabilitate ale variabilei aleatoare X
2
conditionate de cele m valori
ale lui X
1
.
Exemplul 5.1. Sunt studiate mai multe tipuri de tranzactii n functie
de modurile de realizare. Tipurile de tranzactii sunt n num ar de cinci
si sunt notate x
1
, x
2
, . . . , x
5
. Modurile de realizare a fiec arei tranzactii
pot fi n num ar de sapte, notate y
1
, y
2
, . . . , y
7
. Num arul operatiilor de
fiecare tip de tranzactie sunt date n urm atorul tabel:
X
1
/X
2
y
1
y
2
y
3
y
4
y
5
y
6
y
7
x
1
43 23 11 12 0 0 0 89
x
2
44 4 3 1 0 1 0 53
x
3
4 11 0 0 0 1 0 16
x
4
5 130 120 0 10 0 0 265
x
5
4 0 0 0 0 0 1 5
100 168 134 13 10 2 1 428
V. a. X
1
se ia ca valori tipurile de tranzactii, n num ar de cinci,
notate x
1
, x
2
, . . . , x
5
iar X
2
ia ca valori modurile de realizare a tran-
zactiilor notate y
1
, y
2
, . . . , y
7
.
S a se scrie tabloul de repartitie a vec. a. (X
1
, X
2
) , legile de prob-
abilitate marginale pentru vec. a. (X
1
, X
2
) , legea de probabilitate
conditionat a X
2
|X
1
= x
2
Rezolvare. Observ am c a X
1
si X
2
sunt v. a. discrete cu un num ar
finit de valori, iar num arul valorilor vec. a. (X
1
, X
2
) va fi si el finit.
n exemplul dat tabloul bidimensional de repartitie este
X
1
/X
2
y
1
y
2
y
3
y
4
y
5
y
6
y
7
P(X
1
= x
i
)
x
1
43
428
23
428
11
428
12
428
0 0 0
89
428
x
2
44
428
4
428
3
428
1
428
0
1
428
0
53
428
x
3
4
428
11
428
0 0 0
1
428
0
16
428
x
4
5
428
130
428
120
428
0
10
428
0 0
265
428
x
5
4
428
0 0 0 0 0
1
428
5
428
P(X
2
= y
j
)
100
428
168
428
134
428
13
428
10
428
2
428
1
428
1
n acest caz avem v. a. marginale sunt
X
1
:
x
1
x
2
x
3
x
4
x
5
89
428
53
428
16
428
265
428
5
428
!
X
2
:
y
1
y
2
y
3
y
4
y
5
y
6
y
7
100
428
168
428
134
428
13
428
10
428
2
428
1
428
!
.
n acest caz avem v. a. marginale sunt
X
1
:
x
1
x
2
x
3
x
4
x
5
89
428
53
428
16
428
265
428
5
428
!
X
2
:
y
1
y
2
y
3
y
4
y
5
y
6
y
7
100
428
168
428
134
428
13
428
10
428
2
428
1
428
!
.
Legea de probabilitate conditionat a X
2
|X
1
= x
2
X
2
|X
1
= x
2
:
_
_
y
1
y
2
y
3
y
4
y
5
y
6
y
7
p
21
p
2
p
22
p
2
p
23
p
2
p
24
p
2
p
25
p
2
p
26
p
2
p
27
p
2
_
_
,
X
2
|X
1
= x
2
:
_
_
_
y
1
y
2
y
3
y
4
y
5
y
6
y
7
44
428
53
428
4
428
53
428
3
428
53
428
1
428
53
428
0
53
428
1
428
53
428
0
53
428
_
_
_
,
X
2
|X
1
= x
2
:
y
1
y
2
y
3
y
4
y
5
y
6
y
7
44
53
4
53
3
53
1
53
0
1
53
0
!
.
5.2 Functia de repartitie a unui vec. a. bi-
dimensional
Presupunem c a avem dou a v. a. X
1
si X
2
Definitia 5.5. Fie un vec. a. bidimensional X = (X
1
, X
2
). Se
numeste func tie de reparti tie a lui X functia real a
F
X
: R
2
[0, 1] , F
X
(x, y) = P(X
1
x, X
2
y).
Definitia 5.6. Fie vec. a. discret X = (X
1
, X
2
) . Functia de repartitie
este definit a de
F
X
(x, y) = P(X
1
x, X
2
y) =
=
X
x
i
x
X
y
j
y
P ({X
1
= x
i
si X
2
= y
j
}) =
X
x
i
x
X
y
j
y
p
ij
.
Definitia 5.7. Vec. a. bidimensional X = (X
1
, X
2
) se numeste con-
tinuu cu densitatea de probabilitate f
X
: R
2
R dac a functia de
repartitie F
X
: R
2
R este continu a si derivabil a pe portiuni si
f
X
(x, y) =

2
F
X
(x, y)
xy
.
Teorema 5.1. Urm atoarele afirma tii sunt adev arate:
1. F
X
(x, y) este monoton cresc atoare n raport cu fiecare variabil a,
2. F
X
(x, y) este continu a la dreapta n raport cu fiecare variabil a,
3. lim
x,
y
F
X
(x, y) = 0, lim
x,
y
F
X
(x, y) = 1.
Teorema 5.2. Fie vec. a. bidimensional X = (X
1
, X
2
) cu densitatea
de probabilitate f
X
. Atunci:
a) f
X
(x, y) 0, (x, y) R
2
,
b)

R
f
X
(x, y)dxdy = 1,
c) F
X
(x, y) = P (X
1
x, X
2
y) =
x
R
y
R
f
X
(u, v)dudv
sau pentru orice domeniu D R
2
,
P ((X
1
, X
2
) D) =
ZZ
D
f
X
(x, y)dxdy
d) dac a a b si c d atunci
P (a < X
1
b, c < X
2
d) = F
X
(b, d)F
X
(a, d)F
X
(b, c)+F
X
(a, c)
sau
P (a < X
1
b, c < X
2
d) =
Z
b
a
Z
d
c
f
X
(x, y)dxdy.
Definitia 5.8. Fie vec. a. bidimensional X = (X
1
, X
2
) si f
X
(x, y)
densitatea sa de probabilitate. Functiile
f
X
1
(x) =
Z

f
X
(x, y)dy, f
X
2
(y) =
Z

f
X
(x, y)dx
se numesc densit a ti de probabilitate marginale.
1
, X
2
) si f
X
(x, y)
densitatea sa de probabilitate, iar f
X
1
(x) si f
X
2
(y) densit atile de prob-
abilitate marginale. Variabilele aleatoare X
1
si X
2
sunt independente
dac a
f
X
(x, y) = f
X
1
(x)f
X
2
(y), x, y.
Densit ati de probabilitate conditionate.
Fie vec. a. X = (X
1
, X
2
) cu densitatea de probabilitate f
X
(x, y).
Ne propunem s a determin am densitatea de probabilitate a v. a. X
1
,
conditionata de X
2
= y
j
.
Dac a A
1
= {X
1
< x} si A
2
= {y
j
h < X
2
< y
j
+h} atunci putem
scrie
P(A
1
|A
2
) =
P ({X
1
< x} {y
j
h < X
2
< y
j
+h})
P ({y
j
h < X
2
< y
j
+h})
=
=
Z
x
du
Z
y
j
+h
y
j
h
f
X
(u, v)dv
Z
y
j
+h
y
j
h
f
X
2
(v)dv
,
unde f
X
2
(v) =

R
f
X
(u, v)du este densitatea de probabilitate marginal a
a v. a. X
2
.
Atunci functia de repartitie a lui X
1
conditionat a de X
2
= y
j
este
dat a de
F
X
1
|y
j
(x) = lim
h0
P(A
1
|A
2
) = lim
h0
Z
x
du
Z
y
j
+h
y
j
h
f
X
(u, v)dv
Z
y
j
+h
y
j
h
f
X
2
(v)dv
=
= lim
h0
Z
x
[f
X
(u, y
j
+h) +f
X
(u, y
j
h)] du
f
(X
1
,X
2
)
(u, x
2
+h) +f
(X
1
,X
2
)
(u, x
2
h
=
Z
x
f
X
(u, y
j
)du
f
X
2
(y
j
)
.
Cum f
X
1
|y
j
(x) =

x
F
X
1
|y
j
(x) rezult a c a f
X
1
|y
j
(x) =
f
X
(x, y
j
)
f
X
2
(y
j
)
.
Definitia 5.10. Dat vec. a. X = (X
1
, X
2
) cu densitatea de probabil-
itate f
X
(x, y), atunci densitatea de probabilitate condi tionat a a lui X
1
dac a X
2
= y
j
este
f
X
1
|y
j
(x) =
f
X
(x, y
j
)
f
X
2
(y
j
)
.
dac a f
X
1
(x
i
) > 0.
5.3 Caracteristici numerice
1
, X
2
) cu densitatea
de probabilitate f
X
. Definim n mod analog cu cazul unidimensional
Media: M [X] =
m
X
i=1
n
X
j=1
x
i
y
j
p
ij
, dac a X este vect. a. discret,
M [X] =
Z

xyf
X
(x, y)dxdy, dac a X este vect. a. continuu.
Se mai definesc media lui X
1
, si respectiv X
2
:
M [X
1
] =
m
X
i=1
n
X
j=1
x
i
p
ij
, M [X
2
] =
m
X
i=1
n
X
j=1
y
j
p
ij
,
n cazul discret si
M[X
1
] =
Z

xf
X
(x, y)dxdy, M[X
2
] =
Z

yf
X
(x, y)dxdy,
n cazul continuu.
Dispersia:
D[X] =
m
X
i=1
n
X
j=1
(x
i
M [X
1
])
2
(y
j
M [X
2
])
2
p
ij
,
dac a X este vect. a. discret, respectiv
D[X] =
Z

(x M [X
1
])
2
(y M [X
2
])
2
f
X
(x, y)dxdy,
dac a X este vect. a. continuu.
Se mai definesc dispersia lui X
1
, si respectiv X
2
:
D[X
1
] =
m
X
i=1
n
X
j=1
(x
i
M [X
1
])
2
p
ij
,
D[X
2
] =
m
X
i=1
n
X
j=1
(y
j
M [X
2
])
2
p
ij
,
n cazul discret si
D[X
1
] =
Z

(x M [X
1
])
2
f
X
(x, y)dxdy,
D[X
2
] =
Z

(y M [X
2
])
2
f
X
(x, y)dxdy,
n cazul continuu.
n toate cazurile integralele improprii care intervin trebuie s a fie
convergente.
ntroducem media conditionat a lui X
1
| X
2
= y
j
M [X
1
| X
2
= y
j
] =
m
X
i=1
x
i
p
ij
p
j
n cazul discret si, respectiv,
M [X
1
| X
2
= y
j
] =
Z
R
xf
X
1
|y
j
(x)dx =
Z
R
x
f
X
(x, y
j
)
f
X
2
(y
j
)
dxdy
n cazul continuu.
Dispersia conditionat a X
1
| X
2
= y
j
D[X
1
| X
2
= y
j
] =
m
X
i=1
(x
i
M [X
1
| X
2
= y
j
])
2
p
ij
p
j
.
n cazul discret si respectiv
D[X
1
| X
2
= y
j
] =
Z
R
(x
i
M [X
1
| X
2
= y
j
])
2
f
X
(x, y
j
)
f
X
2
(y
j
)
dx.
n cazul continuu.
Analog introducemnotiunile medie si dispersie conditionat a pentru
X
2
| X
1
= x
i
.
5.4 Operatii cu v. a. continue
Distributia sumei a dou a v. a. continue
Exercitiul 5.1. S a se demonstreze c a suma a dou a variabile aleatoare
independente are drept densitate de probabilitate produsul de con-
volutie a densit atilor de probabilitatea a celor dou a v. a.
Rezolvare. Fie X
1
si X
2
dou a v. a. care au densit atile de probabili-
tate f
1
respectiv f
2
si f
X
(x, y) densitatea de probabilitate a vectorului
X = (X
1
, X
2
) . Not am cu Z = X
1
+ X
2
iar h respectiv H densitatea
de probabilitate, respectiv functia de repartitie a lui Z.
Conform definitiei functiei de repartitie avem:
H(z) = P (Z z) = P ((X
1
, X
2
) S) , z R
unde S = {(x, y) R
2
, x +y < z} . Deci H(z) =
ZZ
S
f
X
(x, y)dxdy.
Figura 5.1.
Un punct arbitrar de pe dreapta de ecuatie x +y = z are coordo-
natele (x, z x). Inecuatia x +y < z reprezint a semiplanul S n care
x R si y (, z x) . Atunci H(z) =

R
dx
zx
R
f
X
(x, y)dxdy.
Derivnd sub integral a n raport cu z, obtinem
h(z) = H
0
(z) =
Z

f
X
(x, z x)dx.
Dac a v. a. X
1
, X
2
sunt independente, adic a f
X
(x, y) = f
X
1
(x)f
X
2
(y),
atunci
h(z) =
Z

f
X
1
(x)f
X
2
(z x)dx = (f
X
1
f
X
2
)(z).
Distributia ctului a dou a v. a. continue
Exemplul 5.2. S a se calculeze densitatea de probabilitate a ctului
a dou a v. a. continue. S a se particularizeze n cazul n care cele dou a
v. a. sunt independente.
Rezolvare. Fie X
1
si X
2
dou a v. a., X
2
6= 0, care au densit atile de
probabilitate f
1
respectiv f
2
si f
X
(x, y) densitatea de probabilitate
a vectorului X = (X
1
, X
2
). Not am cu Z =
X
1
X
2
iar h respectiv H
densitatea de probabilitate, respectiv functia de repartitie a lui Z.
Conform definitiei functiei de repartitie avem: z R,
H(z) = P (Z z) =
Z
y>0
Z
x<zy
f
X
(x, y)dxdy +
Z
y<0
Z
x>zy
f
X
(x, y)dxdy =
=
Z
0
zy
Z
f
X
(x, y)dxdy +
0
Z
Z
zy
f
X
(x, y)dxdy.
Prin derivare n raport cu z g asim
h(z) =
Z

|y| f
X
(zy, y)dy.
n particular, pentru X
1
si X
2
independente g asim
h(z) =
Z

|y| f
X
1
(zy)f
X
2
(y)dy.
Exemplul 5.3. Fie v. a. X N [0, 1] si Y
2
(n). S a se determine
densitatea de probabilitate a v. a.
a)
q
Y
n
si
b) Z =
X
Y
n
.
Rezolvare. Densitatea de probabilitate a lui X N [0, 1] este
f
X
(x) =
1
2
e
x
2
2
iar a lui Y
2
(n) este
f
Y
(x) =
_
_
_
1
2
n
2
n
2
x
n
2
1
e
x
2
, x > 0
0, x 0
.
a) F
Y
n
(y) = P
q
Y
n
< y
= P (Y < y
2
n) = F
Y
(y
2
n) , pentru
y > 0 si 0 pentru y < 0. Rezult a c a densitatea de probabilitate a lui
q
Y
n
este
f
Y
n
(y) =
d
dy
F
Y
n
(y) = 2nyF
0
Y
(y
2
n) =
= 2nyf
Y
y
2
n
=
2ny
2
n
2
n
2

y
2
n
n
2
1
e
y
2
n
2
,
deci
f
Y
n
(y) =
_
_
_
2ny
2
n
2
n
2
(y
2
n)
n
2
1
e
y
2
n
2
, y > 0
0, y 0
.
b) Pentru Z =
X
Y
n
avem densitatea de probabilitate, conform
Exercitiului 5.2,
f
Z
(z) =
Z

|y| f
X
(zy)f
Y
n
(y)dy =
=
Z

0
y
1
2
e
(zy)
2
2
2ny
2
n
2
n
2

y
2
n
n
2
1
e
y
2
n
2
dy =
=
2 (n)
n
2
2
n+1
2

n
2
Z

0
y
n
e
(
z
2
+n
)
y
2
2
dy.
Facem schimbarea de variabil a
(z
2
+n)y
2
2
= u, y = u
1
2
q
2
z
2
+n
f
Z
(z) =
2 (n)
n
2
q
2
z
2
+n
n+1
2
n+1
2

n
2
2
Z

0
e
u
u
n+1
2
1
du =

n+1
2
z
2
+n
n
n+1
2
n
2
n
,
f
Z
(z) =

n+1
2
n
2
1 +
z
2
n
n+1
2
.
Recunoastem n expresia acestei functii densitatea de probabilitate
a v. a. distribuite Student, prezentat a n Capitolul 3.
Exercitiul 5.2. Fie X v. a. care ia ca valori timpul de asteptare pn a
cnd un calculator se conecteaz a la server (m asurat n microsecunde)
si Y v. a. care ia ca valori timpul de asteptare pn a cnd serverul au-
torizeaz a accesul (recunoaste calculatorul respectiv ca un user valid).
Fiecare dintre aceste v. a. m asoar a timpul de asteptare de la ace-
lasi moment de plecare si, n mod evident, X < Y. S-a constatat c a
densitatea de probabilitate a vec. a. (X, Y ) este
f
(X,Y )
(x, y) = 6 10
6
exp (0.001x 0.002y)
pentru 0 < x < y si zero n rest.
a) S a se verifice propriet atile densit atii de probabilitate a vec. a.
bidimensional. S a se scrie functia de repartitie.
b) S a se calculeze probabilitatea ca X 1000 si Y < 2000 si
P (1000 < X 2000, 1500 < Y 2500) .
c) S a se calculeze densit atile de probabilitate marginale si probabi-
litatea ca Y 2000 microsecunde. Sunt cele dou a v. a. independente?
d) S a se determine f
Y |x
(y) si s a se particularizeze n cazul x = 1500.
S a se calculeze P ({Y > 2000 | X = 1500}) .
e) S a se determine media conditionat a lui Y pentru x = 1500.
f) sunt variabilele aleatore X, Y independente?
Rezolvare. Regiunea n care probabilitatea este diferit a de zero este
desenat a mai de culoare neagr a n figura de mai jos.
dom = Graphics[Polygon[Table[{{0, 0}, {1, 1}, {0, 1}}]]]
Show[dom, AspectRatio -> 1, Axes -> True, AxesLabel -> {x, y}]
0.2 0.4 0.6 0.8 1
x
0.2
0.4
0.6
0.8
1
y
Figura 5.2.
a) Se verific a: f
(X,Y )
(x, y) 0,
Z

f
(X,Y )
(x, y)dxdy =
=
Z

0
Z

x
6 10
6
exp(0.001x 0.002y) dy
dx = 1.
Integrate[2 10^(-6) E^(-0.001u - 0.002 v), {u, 0, Infinity}, {v, u,
Infinity}]
1.
Determin am functia de repartitie
F(x, y) =
Z
x
0
Z
y
u
6 10
6
exp (0.001u 0.002v) dv
du =
= 1 e
0.003x
3e
0.002y
1 e
0.001x
.
Verific am propriet atile functiei de repartitie. Observ am c a F este
o functie continu a, lim
x,
y
F
X
(x, y) = 0 rezult a din definitia densit atii
de probabilitate, iar lim
x,
y
F
X
(x, y) = 1 rezult a din calcul.
Calculat cu Mathematica obtinem
F[x_, y_] := Integrate[6 10^(-6) E^(-0.001u - 0.002 v), {u, 0, x},
{v, u, y}]
F[x,y]
1.-1.E^(-0.003x)-0.003E^(-0.002y)[1000.-1000.E^(-0.001x)]
F[x, y] /. {x ->, y ->}
1.
b) {X < 1000, Y < 2000} are loc pe domeniul hasurat si calcul am
integral a dubl a pe acest domeniu pe care l vom nota D.
P ({X < 1000, Y < 2000}) =
ZZ
D
f
(X,Y )
(x, y)dxdy =
=
Z
1000
0
Z
2000
x
f
(X,Y )
(x, y)dxdy =
= 6 10
6
Z
1000
0
Z
2000
x
exp(0.002y) dy
exp (0.001x) dx =
= 6 10
6
Z
1000
0
exp(0.002x) exp(4)
0.002
exp (0.001x) dx =
= 0.003
Z
1000
0
(exp (0.003x) exp(4) exp(0.001x)) dx =
= 0.003
1 e
3
0.003
e
4
1 e
1
0.001
= 0.91548
Integrate[2 10^(-6) E^(-0.001u - 0.002 v), {u, 0, 1000}, {v, u, 2000}]
0.91548
Aceast a probabilitate reprezin a aria suprafetei desenate mai jos cu
Mathematica.
Plot3D[2 10^(-6) E^(-0.001x - 0.002 y), {x, 0, 1000}, {y, 0, 2000},
Axes -> True, AxesLabel -> {x, y, z}]
Suprafata este reprezentat a n figura 5.3.
P (1000 < X 2000, 1500 < Y 2500) =
2000
Z
1000
2500
Z
1500
f
(X,Y )
(x, y)dxdy =
= 6 10
6
2000
Z
1000
2500
Z
1500
exp (0.001x 0.002y) dxdy = 0.0300325
Integrate[6 10^(-6) Exp[-0.001x - 0.002 y], {x, 1000, 2000},
{y, 1500, 2500}]
0.0300325
c)
f
X
(x) =
Z

f
(X,Y )
(x, y)dy =
=
Z

x
6 10
6
exp (0.001x 0.002y) dy = 0.003 e
0.003 x
0
200
400
600
800
1000
x
0
500
1000
1500
2000
y
0
510
-7
110
-6
1.510
-6
210
-6
z
0
200
400
600
800
x
Figura 5.3.
pentru x > 0. Observ am c a aceasta este o distributie exponential a cu
= 0.003
Plot[0.003Exp[-0.003x], {x, 0, 1000}]
200 400 600 800 1000
0.0005
0.001
0.0015
0.002
0.0025
0.003
Figura 5.4.
f
Y
(y) =
Z

f
(X,Y )
(x, y)dy =
Z
y
0
6 10
6
exp (0.001x 0.002y) dx =
= 0.006e
0.002 y
1 1 e
0.001 y
pentru y > 0.
Plot[-0.006 Exp[-0.003 y] + 0.006 Exp[-0.002 y], {y, 0, 5000},
PlotRange -> {0, 0.002}]
1000 2000 3000 4000 5000
0.00025
0.0005
0.00075
0.001
0.00125
0.0015
0.00175
0.002
Figura 5.5.
P (Y > 2000) =
Z

2000
0.006e
0.002 y
1 1 e
0.001 y
=
= 3.0e
4
2.0e
6
= 4.998 9 10
2
0.05.
Observ am c a f
(X,Y )
(x, y) 6= f
X
(x)f
Y
(y), deci nu sunt indepen-
dente.
d) f
Y |x
0
(y) =
f
(X,Y )
(x
0
, y)
f
X
(x
0
)
=
6 10
6
exp(0.001x
0
0.002y)
0.003 e
0.003 x
0
=
= 0.002 exp (0.002 x
0
0.002 y) pentru 0 < x
0
< y.
Observ am c a f
X
(1500) = 0.003 e
0.0031500
= 3.332 7 10
5
6= 0
astfel nct
f
Y |1500
(y) = 0.002 exp (0.002 1500 0.002 y) =
= 0.002 exp (3.0 0.002 y) pentru y > 1500.
P (Y > 2000 | X = 1500) =
Z

2000
f
Y |1500
(y)dy =
=
Z

2000
0.002 exp (0.002 1500 0.002 y) dy = 0.36788.
Integrate[210^(-3)Exp[3 - 0.002y], {y, 2000, Infinity}]
0.367879
e) Densitatea de probabilitate conditionat a a lui Y | X = 1500 a
fost calculat a la punctul d). Media conditionat a Y | X = 1500 este
M [Y | X = 1500] =
Z

yf
Y |1500
(y)dy =
=
Z

1500
y 0.002 exp (3.0 0.002 y) dy =
= 0.002e
3
Z

1500
y exp (0.002 y) dy = 2000.
f) Deoarece f
(X,Y )
(x, y) 6= f
X
(x)f
Y
(y), v. a. nu sunt indepen-
dente.
Exercitiul 5.3. n exercitiul 5.2 modic am densitatea de probabili-
tate a vect. a. (X, Y ) astfel:
f
(X,Y )
(x, y) = 2 10
6
exp (0.001x 0.002y) pentru x 0, y 0.
Sunt v. a. X, Y independente?
S a se calculeze P (X > 1000, Y < 1000) .
Rezolvare. Densitatea de probabilitate marginal a a lui X
f
X
(x) =
Z

0
2 10
6
exp (0.001x 0.002y) dy = 0.001 e
0.001 x
pentru x 0.
Densitatea de probabilitate marginal a a lui Y
f
Y
(y) =
Z

0
2 10
6
exp (0.001x 0.002y) dx = 0.002 e
0.002 y
pentru y 0.
Observ am c a f
(X,Y )
(x, y) = f
X
(x) f
Y
(y), deci v. a. X si Y sunt
independente.
Pentru a calcula probabilitatea cerut a tinem seama c a v . a. sunt
independente si deci
P (X > 1000, Y < 1000) = P (X > 1000) P (Y < 1000) =
=
Z

1000
0.001 e
0.001 x
dx
Z
1000
0
0.002 e
0.002 y
dy = e
1
1e
2
= 0.318 09.
Definitia 5.12. Fie vectorul aleator bidimensional X = (X
1
, X
2
) cu
v. a. X
1
, X
2
definite pe acelasi spatiu de selectie. Numim covarian t a
sau corela tie caracteristica numeric a
cov (X
1
, X
2
) = M [(X
1
M [X
1
]) (X
2
M [X
2
])] .
Propozitia 5.1. Are loc urm atoarea egalitate
cov (X
1
, X
2
) = M [X
1
X
2
] M [X
1
] M [X
2
] . (5.2)
Demonstratie. Din calcul rezult a c a
cov (X
1
, X
2
) = M [(X
1
M [X
1
]) (X
2
M [X
2
])] =
= M [X
1
X
2
X
1
M [X
2
] M [X
1
] X
2
+M [X
1
] M [X
2
]]
Tinem seama de propriet atile mediei (media sumei este suma medi-
ilor, media constantei este constanta) si obtinem
cov (X
1
, X
2
) = M [X
1
X
2
] M [X
1
] M [X
2
] M [X
1
] M [X
2
] +
+M [X
1
] M [X
2
] = M [X
1
X
2
] M [X
1
] M [X
2
] .
Exercitiul 5.4. Dac a v. a. sunt independente atunci cov (X
1
, X
2
) = 0.
Rezolvare. Dac a v. a. sunt independente, media produsului celor dou a
v. a. este egal a cu produsul mediilor si folosind relatia 5.2, rezult a con-
cluzia.
1
, X
2
) cu v. a.
X
1
, X
2
definite pe acelasi spatiu de selectie. Numim coeficient de
corela tie raportul
r (X
1
, X
2
) =
cov (X
1
, X
2
)
p
D[X
1
]
p
D[X
2
]
.
Exercitiul 5.5. Pentru suma a dou a v. a. X
1
, X
2
definite pe acelasi
spatiu de selectie.avemD[X
1
+X
2
] = D[X
1
]+D[X
2
]+2 cov (X
1
, X
2
).
Rezolvare.
D[X
1
+X
2
] = M
(X
1
+X
2
M [X
1
+X
2
])
2
=
= M
((X
1
M [X
1
]) + (X
2
M [X
2
]))
2
=
= M
(X
1
M[X
1
])
2
+ (X
2
M[X
2
])
2
+
+ 2 (X
1
M[X
1
]) (X
2
M[X
2
])
=
= M
(X
1
M [X
1
])
2
+M

(X
2
M [X
2
])
2
+
+ 2M[(X
1
M [X
1
]) (X
2
M [X
2
])] =
= D[X
1
] +D[X
2
] + 2 cov (X
1
, X
2
) .
Exercitiul 5.6. S a se scrie matricea covariantelor pentru un vec. a.
bidimensional.
Rezolvare. Fie vectorul aleator bidimensional X = (X
1
, X
2
). Ma-
tricea covariantelor este:
cov (X
1
, X
1
) cov (X
1
, X
2
)
cov (X
2
, X
1
) cov (X
2
, X
2
)
.
Din cauza simetriei covariantei observ am c a matricea covariantelor
este simetric a. Dac a X
1
si X
2
sunt v. a. independente, atunci ma-
tricea covariantelor este o matrice diagonal a, pe diagonala principal a
aflndu-se dispersiile celor dou a v. a.
Mathematica contine pachetele <<StatisticsMultiDiscreteDistribu-
tions si << StatisticsMultiDescriptiveStatistics care permite s a se lu-
creze cu vectori aleatori discreti (vectori multinomiali, vectori bino-
miali cu exponent negativ, vectori Poisson) si respectiv cu vectorii
aleatori continui (vectori normali, Student etc.)
5.5 Repartitia normal a bidimensional a
Definitia 5.14. Fie m
1
, m
2
,
1
,
2
si numere reale cu
1
,
2
> 0 si
1 1. Vectorul aleator X = (X
1
, X
2
) care are densitatea de
probabililtate
f
X
(x, y) =
1
2
1
1
2
exp
1
2
1
2
xm
1
2
+
ym
2
2
2
xm
1
ym
2
,
x, y R, este distrubuit normal. Se spune despre v. a. X
1
, X
2
ca au
densitatea de probabilitate normal a bidimensional a.
Propozitia 5.2. X
1
N [m
1
,
1
] si X
2
N [m
2
,
2
] , deci sunt nor-
mal distribuite.
Parametrul m asoar a leg atura care exist a ntre X si Y.
Propozitia 5.3. Fie v. a. X
1
, X
2
cu densitatea de probabilitate nor-
mal a bidimensional a. Atunci r
(X
1
,X
2
)
= .
Propozitia 5.4. Dac a v. a. X
1
, X
2
cu densitatea de probabilitate nor-
mal a bidimensional a sunt independente, atunci = 0.
n Mathematica distributia normal a multidimensional a se apeleaz a
cu ajutorul comenzii MultinormalDistribution[mu, sigma] unde mu este
vectorul mediilor si sigma matricea covariantelor.
Secventa de mai jos realizeaz a graficul distributiei bidimensionale
normale standard.
<< StatisticsMultinormalDistribution
mn = {0, 0};
sig = {{1, 0}, {0, 1}};
f[x_, y_] := PDF[MultinormalDistribution[mn, sig], {x, y}]
f[x, y]
e
1/2(x
2
y
2
)
2
Plot3D[f[x, y], {x, -3, 3}, {y, -3, 3}, PlotPoints -> 25]
Graficul distributiei este reprezentat n figura 5.6.
-2
0
2
-2
0
2
0
0.05
0.1
0.15
-2
0
2
Figura 5.6.
Redefinim matricea covariantelor astfel nct dispersiile s a nu fie
egale.
Clear[sig]
mn = {0, 0};
sig = {{1, 0}, {0, 2}};
Plot3D[f[x, y], {x, -3, 3}, {y, -3, 3}, PlotPoints -> 25]
Graficul distributiei este reprezentat n figura 5.7.
-2
0
2
-2
0
2
0
0.025
0.05
0.075
0.1
-2
0
2
Figura 5.7.
mn = {0, 0};
sig = {{1, 0.9}, {0.9, 1}};
Plot3D[f[x, y], {x, -3, 3}, {y, -3, 3}, PlotPoints -> 25, ViewPoint ->
{1.2, 1.2, 1.2}]
-2
0
2
-2
0
2
0
0.02
0.04
0.06
-2
0
2
0
02
4
Figura 5.8.
Graficul distributiei n cazul n care coeficientul de corelatie este
0.8 este n figura 5.8.
Observ am c a dac a v. a. sunt independente graficul este clopotul
simetric dac a dispersiile sunt egale si deformat dac a v. a. nu sunt
independente.
Exemplul 5.4. n tabelul de mai jos sunt date mediile a 15 studenti
la testele din timpul semestrului si media final a de la examen. S a
se determine media celor doi vectori, matricea covariantelor. S a se
deseneze graficul distributiei normale bidimensionale avnd vectorul
mediilor si matricea covariantelor calculate anterior.
Test Medie Test Medie Test Medie
5.667 5 8 9 8.334 8
8.667 9 7.667 9 9.667 9
9 8 10 10 7 7
7.667 9 9 10 4.667 4
6.667 8 6.334 7 8.667 10
Rezolvare.
test={5.667, 8.667, 9, 7.667, 6.667, 8, 7.667, 10, 9, 6.334, 8.334,
9.667, 7, 4.667, 8.667}
final={5, 9, 8, 9, 8, 9, 9, 10, 10, 7, 8, 9, 7, 4, 10}
sigma = CovarianceMatrix[Transpose[{test, final}]] // N
{{2.25056, 2.31418}, {2.31418, 3.12381}}
mn = Mean[Transpose[{test, final}]] // N
{7.80027, 8.13333}
Plot3D[f[x, y], {x, 4, 11}, {y, 4, 11}, PlotPoints -> 25]
Graficul este reprezentat n figura 5.9.
-2
0
2
-2
0
2
0
0.025
0.05
0.075
0.1
-2
0
2
Figura 5.9.

Dup a un studiu atent al acestui capitol retinem
1. notiunile de densitate de probabilitate si functie de repartitie
pentru vectori aleatori,
2. calculul densit atilor marginale,
3. calculul desit atilor de probabilitate conditionate pentru vect. a.
bidimensionali,
4. calculul covariantei si a corelatiei dintre vect. a.
Capitolul 6
Elemente de statistic a
6.1 Populatii statistice
Statistica se poate defini ca fiindstiinta care se ocup a cu colectarea,
prezentarea, clasificarea, analiza si interpretarea cantitativ a a datelor
si cu aplicarea teoriei probabilit atilor n analiza si estimarea caracte-
risticilor (parametrilor) populatiei.
Definitia 6.1. Popula tia statistic a este o multime de elemente supus a
cercet arii statistice. Un element al acestei populatii se numeste unitate
statistic a.
Definitia 6.2. O proprietate comun a tuturor unit atilor statistice se
numeste caracteristic a statistic a a populatiei.
Caracteristicile pot fi:
- cantitative, dac a pot fi cuantificate printr-un num ar,
- calitative, dac a nu pot fi cuantificate printr-un num ar, ci prin
aprecieri de tipul bun, foarte bun, mult, putin.
Definitia 6.3. Valoarea numeric a a unei caracteristici cantitative,
care se modific a de la o unitate statistic a la alta, se numeste variabil a
statistic a.
Definitia 6.4. O submultime a unei populatii statistice se numeste
selec tie sau e santion.
De exemplu, dac a se solicit a opinia unei populatii ntr-o problem a
oarecare este dificil s a fie consultat a ntreaga populatie si se recurge
la extragerea unui esantion.
199
200 CAPITOLUL 6. ELEMENTE DE STATISTIC
A
Un esantion ale c arui unit ati au fost alese la ntmplare se numeste
e santion reprezentativ (aleator). Extragerea unui esantion reprezen-
tativ se realizeaz a astfel nct elementele s a aib a sanse egale de a fi
extrase. n multe situatii se folosesc numere aleatoare. De exem-
plu dac a avem o list a a populatiei initiale x
1
, x
2
, . . . , x
N
se aleg nu-
mere aleatoare k
1
, k
2
, . . . , k
n
ntre 1 si N si un esantion aleator este
x
k
1
, x
k
2
, . . . , x
kn
.
Variabilele statistice pot fi discrete (ex: num arul de becuri care
se ard dup a 1000 de ore de ntrebuintare) sau continue (ex: timpii
de defectare a unui num ar fixat de n becuri). Aceste rezultate ex-
perimentale se prezint a sub forma diverselor scheme grafice care in-
dic a o anumit a comportare a variabilei statistice. n cazul variabilelor
discrete rezultatele sunt prezentate sub forma unui tablou de forma
urm atoare:
X x
1
x
2
x
3
x
4
x
k
n n
1
n
2
n
3
n
4
n
k
(6.1)
cu n =
k
P
j=1
n
j
. Num arul n se numeste volumul selec tiei. Presupunem
c a n tabel am aranjat astfel nct x
1
< x
2
< x
3
< < x
k
.
Frecven ta absolut a a unei valori x
j
, j = 1, k a unei caracteristici
este num arul n
j
si reprezint a num arul de unit ati statistice ale popu-
latiei statistice care corespund valorii x
j
a variabilei statistice X.
Frecven ta relativ a a unei valori x
j
, j = 1, k a unei caracteristici este
raportul dintre frecventa absolut a si volumul selectiei, adic a f
j
=
n
j
n
,
j = 1, k. Suma frecventelor relative este egal a cu 1.
Frecven ta absolut a cumulat a cresc ator este suma frecventelor ab-
solute valorilor mai mici sau egale cu valoarea x
j
:
j
P
i=1
n
i
, j k.
Frecven ta relativ a cumulat a cresc ator a unei valori x
j
, j = 1, k
a unei caracteristici este suma frecventelor relative corespunz atoare
valorilor mai mici sau egale cu x
j
:
1
n
j
P
i=1
n
i
, j k.
Definitia 6.5. Se numeste func tie de reparti tie empiric a asociat a unei
v. a. X si unei selectii (x
1
, x
2
, . . . , x
n
) Functia
F
n
: R R, F
n
(x) =
num ar de valori x
j
< x
n
=
k
x
n
.
CAPITOLUL 6. ELEMENTE DE STATISTIC
A 201
Teorema de mai jos pune n evident a c a functiile de repartitie em-
pirice aproximeaz a orict de bine functia real a de repartitie.
Teorema 6.1. Fie o populatie statistic a si X variabila aleatoare ata sa-
t a ei cu functia de repartitie F. Pentru o selectie de volum n: (x
1
, x
2
,
. . . , x
n
) construim ca mai sus func tia de reparti tie empiric a F
n
. Atunci
> 0 : P {|F(x) F
n
| }
n
0, fixat.
Demonstratie. S a not am cu p=P(X<x) =F(x), si cu F
n
(x) =
k
x
n
functia de repartitie empiric a. Definim v. a. Y
1
, Y
2
,. . . , Y
n
, astfel
nct Y
j
are valoarea 1 dac a x
j
< x si 0 n caz contrar. Variabilele
Y
1
, Y
2
,. . . , Y
n
sunt independente (selectiile fiind independente) si au
distributia

1 0
p 1 p
.
Avem M [Y
j
] = p, D[Y
j
] = p(1 p). Evident v. a. Z
n
=
1
n
n
P
i=1
Y
i
are
M [Z
n
] = p si dispersia D[Z
n
] =
p(1 p)
n
.
Aplic am inegaliatea lui Cebsev lui Z
n
si g asim
P {|F(x) F
n
| } = P {|Z
n
p| }
D[Z
n
]
2
=
p(1 p)
n
n
0.
6.2 Reprezentarea grafic a a datelor statis-

tice
O reprezentare a datelor statistice este sub forma histogramei. His-
tograma se construieste sub forma unor dreptunghiuri lipite, cu baza
pe Ox, m arimea lor ind egal a la baz a cu m arimea intervaluilui de
variatie respectiv. n altimea dreptunghiului va fi dat a de frecventa
corespunz atoare fiec arui interval de variatie. Histograma arat a forma
de repartitie, densitatea de repartitie a frecventelor si gradul de asime-
trie.
Exemplul 6.1. Punctele obtinute de studenti care au promovat exa-
menul de matematic a si care cuantic a cunostintele lor sunt:
A
{64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86, 62,
58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69, 77, 58, 62, 82,
85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65, 53, 60, 49, 68,
74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66, 68, 95, 94, 99,
81, 81, 92, 88, 99, 81, 81}
O reprezentare a acestor date este:
X 49 51 53 54 58 60 62 64 65 66 68 69
n
i
1 1 1 1 4 1 3 1 2 4 5 1
X 70 71 72 73 74 75 76 77 78 79 80 81
n
i
3 5 2 2 2 1 3 3 7 1 1 4
X 82 83 84 85 86 88 89 91 92 94 95 99
n
i
4 1 4 2 1 3 1 1 2 2 1 2
O alt a reprezentare a datelor este dat a mai jos prin Mathema-
tica. Reprezentarea prin bare se obtine folosind functia BarChart care
este continut a n pachetul <<GraphicsGraphics. nti nc arc am pa-
chetul mentionat si apoi pachetul <<StatisticsDataManipulation care
ne permite folosirea comenzii Frequencies, Column pentru a num ara
frecventele datelor studiate si a le organiza ntr-un vector.
pdata ={64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77, 84,
92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69, 77,
58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65, 53,
60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66, 68,
95, 94, 99, 81, 81, 92, 88, 99, 81, 81};
<< GraphicsGraphics
<< StatisticsDataManipulation
freq = Frequencies[pdata]
{{1,49}, {1,51}, {1,53}, {1,54}, {4,58}, {1,60}, {3,62}, {1,64}, {2,65},
{4,66}, {5,68}, {1,69}, {3,70}, {5,71}, {2,72}, {2,73}, {2,74}, {1,75}, {3,76},
{3,77}, {7,78}, {1,79}, {1,80}, {4,81}, {4,82}, {1,83}, {4,84}, {2,85}, {1,86},
{3,88}, {1,89}, {1,91}, {2,92}, {2,94}, {1,95}, {2,99}}
t = Column[freq, 1]
{1, 1, 1, 1, 4, 1, 3, 1, 2, 4, 5, 1, 3, 5, 2, 2, 2, 1, 3, 3, 7, 1, 1, 4, 4, 1, 4, 2, 1,
3, 1, 1, 2, 2, 1, 2}
BarChart[t]
A 203
1 2 3 4 5 6 7 8 9101112131415161718192021222324252627282930313233343536
1
2
3
4
5
6
7
Figura 6.1.

n cazul variabilelor continue, datele se grupeaz a ntr-un tablou de
forma:
X [t
1
, t
2
) [t
2
, t
3
) [t
m
, t
m+1
)
n n
1
n
2
n
m
.
n acest caz X este variabila statistic a, iar n
j
este num arul valorilor
variabilei statistice aflate n intervalul [t
j
, t
j+1
) si se numeste frecven ta
absolut a. La fel n =
m
P
j=1
n
j
este volumul selec tiei.
Frecven ta relativ a corespunz atoare ntervalului [t
j
, t
j+1
) este
n
j
n
si
reprezint a num arul valorilor variabilei statistice aflate n intervalul
[t
j
, t
j+1
) mp artit la volumul selectiei.
Analog se introduc si celelalte notiuni de frecventa absolut a cumu-
lat a, frecventa relativ a cumulat a etc.
6.2.1 Gruparea pe clase
n urma oric arei selectii de volum n dintr-o populatie de numere
se obtine un sir finit de n numere numit serie statistic a (de volum
n). Cum construim o densitate de probabilitate empiric a? Pentru a
r aspunde la aceast a ntrebare grup am termenii unei serii statistice n
intervale disjuncte: I
1
, I
2
,. . . , I
r
, dup a criterii mai mult sau mai putin
subiective.
Dac a avem o selectie x
1
, x
2
, . . . , x
n
de volum n obtinute n urma
m asur arii unor m arimi zice, tehnice, economice de care depinde evolu-
tia unor procese sau fenomene, not am cu m = min
i
x
i
si M = max
i
x
i
.
A
Organiz am datele selectiei n grupe sau subintervale obtinute diviznd
intervalul [m, M] ntr-un num ar r de subintervale congruente (de ace-
easi lungime). Pentru determinarea num arului de subintervale de gru-
pare poate fi folosit a formula lui H. A. Sturges:
r = [1 + 3.322 lg n] . (6.2)
Definitia 6.6. Se numeste pasul de histogram a num arul h =
M m
r
.
Intervalele de grupare sunt astfel
I
1
= [m, m+h) , I
2
= [m+h, m+ 2h) , . . . , I
r
= [m+ (r 1)h, M] .
Formula lui Sturges (6.2) initial a fost scris a sub forma echivalent a
r = 1 + log
2
n. ntr-adev ar, avem log
2
n =
lg n
lg 2
= log
2
10 lg n
3.322 lg n.
Not am cu n
1
num arul acelor valori x
i
care sunt situate n intervalul
I
1
, n
2
i
care sunt situate n intervalul I
2
, . . . , n
r
i
care sunt situate n intervalul I
r
. Histograma
asociat a selectiei x
1
, x
2
, . . . , x
m
este reuniunea dreptunghiurilor D
k
=
I
k
[0, n
k
] (produs cartezian), pentru 1 k r. Moda selectiei este
subgrupa (intervalul I
k
) ce corespunde dreptunghiului cel mai nalt.
Deci datele selectiei x
1
, x
2
, . . . , x
n
se grupeaz a n r grupe si ex-
ist a posibilitatea de vizualizare: se alege un sistem ortogonal de axe
xOy, cu intervalul [m, M] plasat pe axa Ox (cu originea O eventual n
punctul m). Pe intervalul I
1
se construieste dreptungiul de n altime
n
1
si baza de lungime h, pe intervalul I
2
se construieste dreptungiul
de n altime n
2
si baza de lungime h, etc. Intervalul I
k
pentru care n
k
este maxim este moda selectiei. Dac a dou a subgrupe sunt la fel de
nalte si detasate de celelalte, se spune c a selectia este bimodal a (ex:
figura 6.2).
6.2.2 Algoritmul pentru constructia histogramelor
Date initiale: x
1
, x
2
, . . . , x
n
.
Pasul I. Se calculeaz a m = min
i
x
i
, M = max
i
x
i
, r = [1 + 3.322 lg n]
si h =
M m
r
.
Pasul II. Se determin a intervalele I
k
= [m + (r 1) h, m + rh) si
frecventele absolute n
k
, 1 k r.
A 205
1 2 3 4 5 6 7 8 9
10
20
30
40
50
Figura 6.2.
Pasul III. Se constuiesc dreptunghiurile ce formeaz a histograma
D
k
= I
k
[0, n
k
], 1 k r.
Relu am Exemplul 6.1.
Pasul I. M = max
i
x
i
= 99, m = min
i
x
i
= 49, n = 83,
r = [1 + 3.322 lg 83] = 7
h =
M m
r
=
99 49
7
= 7.14286
Pasul II. Se determin a intervalele I
k
si frecventele n
k
, 1 k 7.
I
k
[49, 56.1429) [56.1429, 63.2857) [63.2857, 70.4286)
n
k
3 8 16
I
k
[70.4286, 77.5714) [77.5714, 84.7143) [84.7143, 91.8571)
n
k
18 22 8
I
k
[91.8571; 99]
n
k
7
Pasul III. Desen am histograma (figura 6.3).
Realiz am cu Mathematica desenul histogramei.
pdata = {64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,
84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,
77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,
53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,
68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81};
A
1 2 3 4 5 6 7
5
10
15
20
Figura 6.3.
Remarc am c a num arul datelor poate fi calculat cu Length.
n = Length[pdata]
83
amin = Min[pdata]
49
amax = Max[pdata]
99
r = IntegerPart[1 + Log[2, n]]
7
h = N[(amax - amin)/r]
7.14286
amin + 5 h, amin + 6 h, amin + 7 h}
{49, 56.1429, 63.2857, 70.4286, 77.5714, 84.7143, 91.8571, 99.}
<< StatisticsDataManipulation
Numararea punctajelor aflate in fiecare subinterval
freqq1 = BinCounts[aa, {amin, amax, h}]
{3, 8, 16, 18, 22, 8, 7}
<< GraphicsGraphics
Histogram[freqq1, FrequencyData -> True];
n Mathematica putemrealiza histograma scalat a, astfel nct suma
ariilor dreptunghiurilor histogramei s a fie egal a cu 1. Histograma sca-
lat a este util a atunci cnd vrem s a o suprapunem peste gracul unei
densit ati de probabilitate n vederea intuirii acesteia. Vom face acest
lucru pentru exercitiul studiat si vom testa dac a putem emite ipoteza
A 207
c a repartitia urmat a de punctaje este normal a.
Histograma scalat a:
HistogramCategories -> vec, Ticks -> IntervalCenters,
HistogramScale -> 1];
63.2857 77.5714 91.8571
0.005
0.01
0.015
0.02
0.025
0.03
0.035
Figura 6.4
S a suprapunem histograma scalat a peste repartitia normal a.
m = N[Mean[pdata]]
75.0602
sigma = N[StandardDeviation[pdata]]
11.1271
pn = Plot[hh[x], {x, m - 3 sigma, m + 3 sigma}];
Show[pn, ghh]
Histograma este reprezentat a n figura 6.5.
Programul calculeaz a media de selectie m = 75.0602 si abaterea
medie de selectie = 11.1271 necesare construirii graficului repartitiei
normale (formulele de calcul sunt definite n sectiunea urm atoare).
Exemplul 6.2. Presupunem c a ntr-un atelier lucreaz a 225 de munci-
tori si c a s-a analizat ntr-o perioad a de timp modul n care si reali-
zeaz a sarcinile. S-a constatat c a 10 dintre ei realizeaz a 101%, etc.
conform tabelului de mai jos
10 15 40 23 17 18 36 45 8 5 8
101% 89% 85% 106% 127% 95% 105% 112% 117% 96% 80%
A
50 60 70 80 90 100 110
0.005
0.01
0.015
0.02
0.025
0.03
0.035
Figura 6.5.
Construim histograma.
n acest caz m = 80, M = 127, r = [1 + 3.322 log
10
225] = 8,
h =
127 80
8
= 5.875. Vom mp arti intervalul n 8 clase de lungime
5.875 fiecare
t [80, 85.875) [85.875, 91.75) [91.75, 97.625)
n
j
48 15 23
t [97.625, 103.5) [103.5, 109.375) [109.375, 115.25)
n
j
10 59 45
t [115.25, 121.125) [121.125, 127]
n
j
8 17
Avem I
1
= [80, 85.4) , n
1
= 48, I
2
= [85.4, 90.8) , n
1
= 15, etc.
Desen am histograma
nr = {10, 15, 40, 23, 17, 18, 36, 45, 8, 5, 8}
proc = {101, 89, 85, 106, 127, 95, 105, 112, 117, 96, 80}
{10, 15, 40, 23, 17, 18, 36, 45, 8, 5, 8}
{101, 89, 85, 106, 127, 95, 105, 112, 117, 96, 80}
ppmin = Min[proc]
ppmax = Max[proc]
80
127
n = Total[nr]
A 209
225
8
h = N[(ppmax - ppmin)/r]
5.875
tg = {ppmin, ppmin + h, ppmin + 2 h, ppmin + 3 h, ppmin + 4 h,
ppmin + 5 h, ppmin + 6 h, ppmin + 7 h, ppmin + 8 h}
{80, 85.875, 91.75, 97.625, 103.5, 109.375, 115.25, 121.125, 127.}
frec = {48, 15, 23, 10, 59, 45, 8, 17}
{48, 15, 23, 10, 59, 45, 8, 17}
<< GraphicsGraphics
Histogram[frec, FrequencyData -> True, HistogramCategories -> tg,
Ticks -> IntervalCenters, HistogramCategories -> Automatic]
82.9375 94.6875 106.438 118.188
10
20
30
40
50
60
Figura 6.6.
Ce concluzii se pot trage din analiza histogramei? n primele patru
grupe sunt persoanele care nu-si realizeaz a sarcinile. Caracteristica
numeric a numit a mod a este, pentru atelierul respectiv, "s a se reali-
zeze sarcinile ntre 103.5% si 109.375%". 59 din cei 225 de muncitori
sunt n mod a.
Unind cu o linie poligonal a extremit atile perpendicularelor ridicate
n mijloacele intervalelor de variatie se obtine poligonul frecven telor
(figura 6.7).
Dac a pe ordonat a se reprezint a frecventele relative se obtine prin
acelasi procedeu poligonul frecventelor relative.
A
82.9375 94.6875 106.438 118.188
10
20
30
40
50
60
Figura 6.7.
Histograma si poligonul frecventelor n cazul intervalelor de lungimi
neegale. n acest caz histograma se construieste reprezentnd pentru
fiecare clas a un dreptunghi cu arie egal a cu frecventa relativ a
n
i
n
. Ast-
fel baza dreptunghiului
i
este [x
i
, x
i+1
) iar n altimea
n
i
n(x
i+1
x
i
)
,
i = 1, m1.
6.3 Caracteristici statistice ale datelor ex-
perimentale
Definitia 6.7. Dac a avem o selectie x
1
, x
2
, . . . , x
n
de volumn, definim
media de selec tie (empiric a) ca fiind x =
1
n
(x
1
+x
2
+ +x
n
), adic a
media aritmetic a a celor n valori.
Dac a datele sunt organizate sub forma unui tabel (6.1) atunci me-
dia de selec tie este x =
1
n
k
P
i=1
n
i
x
i
, unde n
i
reprezint a frecventa ab-
solut a de aparitie a valorii x
i
a variabilei n selectia considerat a si
r
P
i=1
n
i
= n.
n cazul datelor grupate x
i
se nlocuieste cu x
i
care este valoarea
din mijloc a intervalului [x
i
, x
i+1
) deci x =
1
n
r
P
i=1
n
i
x
i
, unde r este
num arul intervalelor.
A 211
Teorema 6.2. Au loc rela tiile: x +c = x+c, kx = kx, x +y = x+y.
Mediana este valoarea R astfel ca num arul de valori x
j

este egal cu num atul de valori x
j
. Deci mediana mparte sirul
ordonat de date n dou a p arti egale. Dac a sirul are 2k + 1 unit ati,
atunci mediana coincide cu unitatea de ordin k + 1, dac a sirul are 2k
unit ati, mediana este media aritmetic a a unit atilor de ordin k si k +1.
dac a exist a mai multe asemenea valori pentru , atunci ele formeaz a
un interval si mediana este prin definitie mijlocul acestui interval.
Exemplul 6.3. Pentru sirul de date: 2.5, 3.7, 1.4, 0.2, 5.4, 8.9, 4.2
sirul ordonat este 0.2, 1.4, 2.5, 3.7, 4.2, 5.4, 8.9. Avem 2k + 1 = 7,
apoi k = 3 si unitatea de ordin k +1 = 4 este 3.7 care este mediana.
Dac a x
me
= x atunci repartitia este simetric a.
Modul selec tiei. Pentru datele negrupate este valoarea observat a
care are frecventa maxim a. Pentru date grupate este o valoare din
clasa cu cel mai mare num ar de observatii.
Dispersia de selec tie (empiric a) este
2
=
1
n
n
P
i=1
(x
i
x)
2
.
Dispersia de selec tie modificat a este s
2
=
1
n 1
n
P
i=1
(x
i
x)
2
.
Observ am c a dac a s
2
este mic atunci datele difer a unele de altele
foarte putin, dac a s
2
este mare, datele difer a foarte mult.
Pentru date negrupate avem
s
2
=
n
P
i=1
(x
i
x)
2
n 1
=
n
P
i=1
(x
2
i
2xx
i
+x
2
)
n 1
=
n
P
i=1
x
2
i
2x
n
P
i=1
x
i
+nx
2
n 1
=
=
n
P
i=1
x
2
i
nx
2
n 1
=
n
P
i=1
x
2
i

n
2
x
2
n
n 1
=
n
P
i=1
x
2
i

1
n
n
P
i=1
x
i
2
n 1
=
n
P
i=1
x
2
i
n 1

n
n 1
x
2
,
iar pentru date grupate
s
2
=
r
P
i=1
n
i
x
2
i

1
n
r
P
i=1
n
i
x
2
n 1
=
r
X
i=1
n
i
n 1
(x
i
x)
2
.
A
Motivatia introducerii acestei dispersii o vom vedea ulterior n leg a-
tur a cu conceptul de estimator nedeplasat.
x se mai numeste speran ta matematic a a selectiei, dispersia de
selectie se mai numeste varian ta selectiei.
Amplitudinea unei serii statistice este diferenta dintre cea mai mare
si cea mai mic a valoare a variabilei A = x
max
x
min
.
n cazul v. a. continue, amplitudinea este diferenta dintre limita
superioar a a ultimului interval si limita inferioar a a primului.
Abaterea medie p atratic a de selec tie este =
p
2
.
Abaterea medie p atratic a de selec tie modificat a este s =
s
2
.
Coeficientul de varia tie este v =
s
2
x
. O selectie de valori pozitive
se consider a omogen a dac a v <
1
3
.
Toate aceste caracteristici statistice pot fi calculate cu comenzi din
Mathemartica. S-a generat sirul st si pentru el calcul am
st = {2.5, 3.7, 1.4, 0.2, 5.4, 8.9, 4.2};
n = Length[st]
7
Media de selectie
m = Mean[st]
3.75714
Dispersia de selectie modificat a
v = Variance[st]
8.18952
Abaterea medie p atratic a de selectie
StandardDeviation[st]
2.86173
Mediana
Median[st]
3.7
Pentru Exemplul 6.2 vrem s a calcul am media si dispersia. Cal-
culele se organizeaz a n felul urm ator:
A 213
x
i
n
i
x
i
n
i
x
i
n
i
n
(x
i
x)
2 n
i
n1
(x
i
x)
2
82.7 48 3969.6 17.643 309. 76 66.377
88.1 15 1321.5 5.8733 148.84 9.9670
93.5 23 2150.5 9.5578 46.24 4.7479
98.9 10 989.0 4.3956 1.96 0.0875
104.3 59 6153.7 27.350 16.0 4.2143
109.7 45 4936.5 21.94 88.36 17.751
115.1 8 920.8 4.0924 219.04 7.8229
120.5 0 0 0 408.04 0
125.1 17 2126.7 9.452 615.04 46.677
P
225 100.3 157.64
x =
r
P
i=1
n
i
x
i
r
P
i=1
n
i
= 100.3, s
2
= 157.64, s =
157.64 = 12.555.
Se poate trage concluzia c a pe ansamblu sarcinile sunt realizate n
general, dar nu se poate spune nimic despre profitul atelierului.
Calculele organizate cu Mathematica
nr = {10, 15, 40, 23, 17, 18, 36, 45, 8, 5, 8}
proc = {101, 89, 85, 106, 127, 95, 105, 112, 117, 96, 80}
{10, 15, 40, 23, 17, 18, 36, 45, 8, 5, 8}
{101, 89, 85, 106, 127, 95, 105, 112, 117, 96, 80}
ppmin = Min[proc]
ppmax = Max[proc]
80
127
n = Total[nr]
225
8
h = N[(ppmax - ppmin)/r]
5.875
tg = {ppmin, ppmin + h, ppmin + 2 h, ppmin + 3 h, ppmin + 4 h,
ppmin + 5 h, ppmin + 6 h, ppmin + 7 h, ppmin + 8 h}
{80, 85.875, 91.75, 97.625, 103.5, 109.375, 115.25, 121.125, 127.}
frec = {48, 15, 23, 10, 59, 45, 8, 17}
{48, 15, 23, 10, 59, 45, 8, 17}
A
Calculul mediei
m = Sum[(tg[[i]] + tg[[i + 1]])/2 frec[[i]], {i, 1, 9}]/n
100.11
Calculul dispersiei
Sum[((tg[[i]] + tg[[i + 1]])/2 - m)^2 frec[[i]], {i, 1, 9}]/(n - 1)
156.712
6.4 Statistica a dou a variabile

Am studiat caracteristici statistice ale unei singure m arimi. Multe
decizii statistice se bazeaz a pe observarea relatiei dintre dou a sau mai
multe m arimi. De exemplu relatia pret-calitate, profilul unei societ ati
comerciale n relatie cu reclama din pres a, rezultatele la examene ale
studentilor n relatie cu num arul orelor de studiu, preturile caselor n
relatie cu zona n care au fost construite, relatia dintre vrsta unei
masini si pretul de vnzare, relatia dintre cerere si ofert a n diferite
cazuri etc.
Fie X si Y doua v. a. si mp perechi de valori, (x
i
, y
j
) unde x
1
, x
2
, . . . ,
x
m
sunt valorile pentru X si valorile y
1
, y
2
, . . . , y
p
pentru Y .
X/Y y
1
y
2
. . . y
p
x
1
n
11
n
12
. . . n
1p
n
1
x
2
n
21
n
22
. . . n
2p
n
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
m
n
m1
n
m2
. . . n
mp
n
m
n
1
n
2
. . . n
p
N
Se definesc urm atoarele m arimi:
n
i
=
p
X
j=1
n
ij
, n
j
=
m
X
i=1
n
ij
, N =
m
X
i=1
p
X
j=1
n
ij
.
Seria (x
i
, n
i
) se numeste serie marginal a n X, iar seria (y
j
, n
j
) se
numeste serie marginal a n Y .
f
i
=
n
i
N
, f
j
=
n
j
N
se numesc frecven te marginale, iar f
ij
=
n
ij
N
se
numeste frecven t a dubl a.
x =
m
P
i=1
p
P
j=1
n
ij
x
i
N
=
m
P
i=1
n
i
x
i
N
si y =
m
P
i=1
p
P
j=1
n
ij
y
j
N
=
p
P
j=1
n
j
y
j
N
A 215
se numesc medii marginale.
2
x
=
m
P
i=1
p
P
j=1
n
ij
(x
i
x)
2
N
=
m
P
i=1
n
i
(x
i
x)
2
N
=
m
P
i=1
n
i
x
2
i
N
x
2
si
2
y
=
m
P
i=1
p
P
j=1
n
ij
(x
i
x)
2
N
=
p
P
j=1
n
j
(y
j
y)
2
N
=
p
P
j=1
n
j
y
2
j
N
y
2
se numesc dispersii marginale.
Covarianta este
cov (X, Y ) =
m
P
i=1
p
P
j=1
n
ij
(x
i
x) (y
j
y)
N
=
m
P
i=1
p
P
j=1
n
ij
x
i
y
j
N
xy.
Consider am dou a selectii de acelasi volum n din dou a populatii
diferite, v. a. X si Y de valori (x
1
, x
2
, . . . , x
n
) si respectiv (y
1
, y
2
, . . . , y
n
).
Sunt mai multe metode de a studia relatia dintre dou a v. a.
Una din metode este metoda evolutiv a. Se porneste de la un model
simplu, o dreapt a si pe parcurs, dac a este necesar, n pasi succesivi se
adaug a noi conditii modelului. Aceasta corespunde n mod natural la
dezvoltatea obisnuit a a teoriei de la simplu la complex.
Se evidentiaz a n puncte M
1
(x
1
, y
1
), M
2
(x
2
, y
2
), . . . , M
n
(x
n
, y
n
) din
planul R
2
raportat la un reper ortonormat xOy. Aceste puncte formea-
z a un nor de date. Graficul astfel obtinut este numit diagram a de
mpr a stiere. Totodat a se evidentiaz a o tabel a de date de tipul
x x
1
x
2
. . . x
n
y y
1
y
2
. . . y
n
(6.3)
Fie x =
1
n
(x
1
+x
2
+ +x
n
) si y =
1
n
(y
1
+y
2
+ +y
n
) medi-
ile de selectie ale datelor si punctul mediu M(x, y).
Ecuatia unei drepte care s a treac a prin punctul M este y y =
(x x), unde este coecientul unghiular. n general aceast a dreapt a
nu poate trece prin punctele M
1
, M
2
, . . . , M
n
. Dac a ar trece prin toate
acreste puncte ar rezulta c a y
k
y = (x
k
x) pentru k = 1, n.
Obtinem astfel un sistem de n ecuatii cu o singur a necunoscut a, anume
A
, sistem care, n general, este incompatibil. Atunci vom impune niste
conditii mai putin restrictive; not am cu
k
= y
k
y (x
k
x) , k = 1, n
si n loc de a cere ca toti
k
s a fie nuli, cerem s a fie simultan mici,
punnd conditia lui Gauss ca suma p atratelor s a fie minim a. Deter-
min am pe m astfel nct expresia
E() =
n
X
k=1
(y
k
y x
k
+x)
2
s a fie minim a. Conditia necesar a este:
E
0
() = 0
n
X
k=1
2 (y
k
y x
k
+x) (x
k
+x) = 0
n
X
k=1
x
k
y
k
+y
n
X
k=1
x
k
+
n
X
k=1
(x
k
)
2
x
n
X
k=1
x
k
+
+x
n
X
k=1
y
k
nxy X
n
X
k=1
x
k
+n(x)
2
= 0
nlocuim
n
P
k=1
x
k
= nx si
n
P
k=1
y
k
= ny si obtinem:
=
n
P
k=1
x
k
y
k
nxy
n
P
k=1
(x
k
)
2
n(x)
2
. (6.4)
Se poate ar ata c a =
n
n
P
k=1
x
k
y
k
n
P
k=1
x
k
n
P
k=1
y
k
n
n
P
k=1
(x
k
)
2
n
P
k=1
x
k
2
=
cov(X, Y )
2
x
.
Definitia 6.8. Fiind dat a o tabel a de valori (6.3), dreapta care trece
prin punctul mediu M(x, y) si cu coecientul unghiular (6.4) se nu-
meste dreapta de regresie asociat a tabelei (6.3) si are ecuatia
: y y = (x x), unde =
cov(X, Y )
2
x
. (6.5)
A 217
Observatia 6.1. n general relatia statistic a ntre dou a m arimi alea-
toare se numeste regresie, spre deosebire de relatiile algebrice sau
functionale. Pe baza regresiei se pot prezice valori ale uneia din m arimi
cunoscnd-o pe cealalt a. Determinarea dreptei de regresie se numeste
regresie liniar a. Ideea lui Gauss prin care mai multe cantit ati sunt
simultan mici n modul dac a suma p atratelor lor este minim a st a la
baza metodei celor mai mici p atrate.
Exemplul 6.4. Protul anual al unei ntreprinderi Y este legat de
valoarea X a activelor sale. Lund 5 ntreprinderi rentabile s-au con-
statat urm atoarela date (n mii de RON)
x 10 20 30 40 50 activele
y 1 3 2 5 4 profitul anual
.
Rezolvare. Ne propunem s a determin am dreapta de regresie. Avem
x =
1
5
(10 + 20 + 30 + 40 + 50) = 30, y =
1
5
(1 + 3 + 2 + 5 + 4) = 3,
5
X
k=1
x
k
y
k
= 10 + 60 + 60 + 200 + 200 = 530,
5
X
k=1
(x
k
)
2
= 100 + 400 + 900 + 1600 + 2500 = 5500.
Conform (6.4) obtinem: =
530 5 30 3
5500 5 900
= 0.08.
Dreapta de regresie va avea ecuatia
y 3 = 0.08(x 30) y = 0.08x + 0.6.
Dreapta de regresie permite realizarea unor predictii. Pentru exem-
plul considerat se poate prevedea c a pentru o ntreprindere care are
active de 60 milioane RON protul va fi y = 3 + 0.08 (60 30) = 5.4
milioane.
a = {10, 20, 30, 40, 50};
b = {1, 3, 2, 5, 4};
<< StatisticsMultiDescriptiveStatistics
Correlation[a, b]
4
5
dataplot = {{10, 1}, {20, 3}, {30, 2}, {40, 5}, {50, 4}};
Pl1 = ListPlot[dataplot, Prolog -> AbsolutePointSize[5]]
A
20 30 40 50
2
3
4
5
Figura 6.8.
-Graphics-
Mean[dataplot]
{30, 3}
Variance[dataplot]
{250,
5
2
}
<< StatisticsLinearRegression
Fit[dataplot, {1, x}, x]
0.6 + 0.08 x
Am reg asit ecuatia dreptei de regresie.
Se pot studia regresii neliniare. De exemplu, determinarea unei
curbe y = f(a, b, c, x) cu parametri a, b, c care s a medieze printre
punctele M
k
(x
k
, y
k
), k = 1, n. Punnd conditia ca y
k
f(a, b, c, x
k
) s a
fie simultan mici, k = 1, n, functia E(a, b, c) =
n
P
k=1
(y
k
f(a, b, c, x
k
))
2
trebuie s a fie minim a, deci este necesar ca
E
a
= 0,
E
b
= 0,
E
c
= 0.
De asemenea se pot studia regresii multuple ntre trei sau mai
multe v. a., ceea ce conduce la cuburi de date.
Pentru a g asi o regresie neliniar a se poate folosi pachetul << Statis-
ticsNonlinearFit.
<< StatisticsNonlinearFit
NonlinearFit[dataplot, Exp[a x], {x}, {a}, RegressionReport ->
BestFitParameters]
e
0.0315015x
NonlinearFit[dataplot, Sin[a x], {x}, {a}, RegressionReport ->
BestFitParameters]
sin[1.0142x]
A 219
NonlinearFit[dataplot, b x^2, {x}, {b}, RegressionReport -> BestFit-
Parameters]
0.00215526x
2
NonlinearFit[dataplot, x^(2 a), {x}, {a}, RegressionReport ->
BestFitParameters]
x
0.349662
Dreapta de regresie asociat a unei tabele de date (6.3) exprim a o
leg atur a ntre dou a v. a. X si Y , dar nu de tip cauzal (cauz a-efect).
Norul de date M
k
(x
k
, y
k
), 1 k n, d a o prim a indicatie vizual a,
intuitiv a; astfel, dac a punctele respective sunt situate ntr-o band a
subtire, deci grupate n jurul dreptei de regresie, atunci ntre X si Y
exist a o relatie puternic a (sau, cum se mai spune, corelatie).
Pentru a decide cu acuratete t aria leg aturii statistice dintre X si
Y se defineste un indicator cantitativ.
Definitia 6.9. Se numeste coecient de corela tie liniar a asociat tabelei
(6.3) de date num arul:
X,Y
=
cov (X, Y )
y
. (6.6)
Dac a v. a. X si Y sunt independente, atunci cov(X, Y ) = 0 si
r
xy
= 0.
Au loc relatiile cov(X a, Y ) = cov(X, Y ) si cov(aX, bY ) =
ab cov(X, Y ).
Teorema 6.3. Avem 1
X,Y
1 pentru orice tabel a de date (6.3).
Demonstratie. n general, pentru orice constante a, b avem
cov(X a, Y b) = cov(X, Y )
deci
cov
X x
x
,
Y y
=
1
y
cov(Xx, Y y) =
cov(X, Y )
y
=
X,Y
,
conform relatiei (6.6).
Not am X
0
=
X x
x
, Y
0
=
Y y
y
si obtinem astfel v. a. normate
cu media 0 si dispersia 1 si
xy
= cov(X
0
, Y
0
).
A
Dar D[X
0
+Y
0
] = D[X
0
] +D[Y
0
] + 2 cov(X
0
, Y
0
), deci
D[X
0
] +D[Y
0
] + 2 cov(X
0
, Y
0
) 0,
adic a
1 + 1 + 2 cov(X
0
, Y
0
) 0 cov(X
0
, Y
0
) 1
xy
1.
Apoi D[X
0
Y
0
] = D[X
0
] +D[Y
0
] 2 cov(X
0
, Y
0
), deci
D[X
0
] +D[Y
0
] 2 cov(X
0
, Y
0
) 0,
adic a
1 + 1 2 cov(X
0
, Y
0
) 0 cov(X
0
, Y
0
) 1
xy
1.
Exist a o stns a leg atur a ntre coeficientul unghiular al dreptei de

regresie si coeficientul de corelatie.
Teorema 6.4. Avem:
=
X,Y

y
x
. (6.7)
Interpretarea coeficientului de corelatie.
dac a
X,Y
= 0 atunci X si Y sunt independente,
dac a
X,Y

= 0 norul de date nu se aseaz a n jurul dreptei de
regresie.
dac a
X,Y
= 1 atunci datele, adic a punctele M
k
, 1 k n sunt
coliniare. Dac a
X,Y
este apropiat de 1, datele sunt n vecin atatea
dreptei de regresie; n acest caz > 0 conform relatiei (6.7) deci
dreapta de regresie este cresc atoare (dac a valorile x
k
cresc, la fel y
k
).
Dac a
X,Y
este apropiat de 1, datele sunt n vecin atatea dreptei de
regresie; n acest caz m < 0 conform relatiei (6.7) deci dreapta de
regresie este descresc atoare (dac a valorile x
k
descresc, la fel y
k
).
n cazul n care
X,Y
este apropiat de
X,Y
(respectiv 1) se spune
c a ntre X si Y exist a o corelatie bun a pozitiv a (respectiv negativ a).
Dac a
X,Y
este apropiat de 0 se poate decide absenta corel arii.
toarele:
1. cum s a construim histograma,
2. s a interpret am vizual datele,
3. s a calcul am si s a interpret am media de selectie, dispersia de
selectie, abaretea de selectie.
Capitolul 7
Statistic a inferential a
Statistica inferential a se concentraz a asupra lu arii deciziilor des-
pre caracteristicele unei populatii bazate pe informatiile obtinute prin
studiul datelor uneia sau mai multor selectii aleatoare si pe calcule
probabilistice.
Statistica inferential a se mparte n dou a mari domenii:
estimarea parametrilor si
ipoteze statistice.
Metodele de inferent a se bazeaz a pe respectarea caracterului aleator
al selectiei.
Fie X o v. a. cu legea de probabilitate f(x, ), x R, R,
care poate fi functia de frecvent a, n cazul discret, respectiv densitatea
de probabilitate, n cazul continuu.
Definitia 7.1. Multimea legilor de probabilitate f(x, ) care contin
parametrul necunoscut se numeste model probabilistic.
n practic a exist a numeroase astfel de familii de legi de proba-
bilitate care pot fi alese ca modele probabilistice: normal a, expo-
nential a, Poisson etc. Alegerea unei astfel de familii, ca model al
unui fenomen particular real se face pe baza experientei anterioare n
studiul fenomenelor asem an atoare sau n urma unui studiu preliminar
al rezultatelor experientei sau observatiei.
n momentul n care am ales o lege de probabilitate de o anumit a
form a, incertitudinea legat a de rezultatul particular al experimen-
tului s-a transferat n incertitudinea legat a de valorile parametrului
(parametrilor).
221
222 CAPITOLUL 7. STATISTIC
A INFEREN TIAL
A
Definitia 7.2. Reparti tia selec tiei X = (X
1
, X
2
, . . . , X
n
) este definit a
ca repartitia comun a a variabilelor de selectie X
1
, X
2
, . . . , X
n
. Dac a
x
1
, x
2
, . . . , x
n
sunt valorile luate de variabilele de selctie X
1
, X
2
, . . . , X
n
atunci legea de probabilitate a selec tiei este notat a prin
f(x
1
, x
2
, . . . , x
n
; ), (x
1
, x
2
, . . . , x
n
) R
n
.
Repartitia selectiei depinde de si ncorporeaz a att selectia ct
si modelul probabilistic.
Cea mai folosit a form a de selectie este selectia aleatoare si este
bazat a pe ideea experimentului aleator.
Definitia 7.3. Vom spune c a (X
1
, X
2
, . . . , X
n
) este o selec tie aleatoare
asupra v. a. X care are legea de probabilitate f(x, ) dac a X
1
, X
2
, . . . ,
X
n
sunt independente si identic distribuite (i.i.d.) ca si X.
n cazul selectiei aleatoare legea de probabilitate a selectiei este
f(x
1
, x
2
, . . . , x
n
; ) =
n
Y
j=1
f(x
j
, ).
O selectie aleatoare poate fi constituit a prin repetarea unui exper-
iment aleator de n ori. Realizarea selectiei aleatoare (datele obtinute
n urma selectiei) se noteaz a cu (x
1
, x
2
, . . . , x
n
) si multimea tuturor
realiz arilor deneste spatiul observatiilor.
Definitia 7.4. Modelul probabilist f(x, ) mpreun a cu selectia alea-
toare X = (X
1
, X
2
, . . . , X
n
) definesc modelul statistic.
Modelul statistic mpreun a cu datele observate impun considerarea
urm atoarelor ntreb ari:
1. datele observate sunt consistente cu modelul statistic postulat?
2. presupunnd c a modelul statistic postulat este consistent cu
datele observate, ce putem spune despre parametrii necunoscuti
?
a) putem descreste incertitudinea asupra lui prin reducerea
spatiului parametrilor la
0
unde
0
este o submultime a lui ?
(estimatie prin intervale de ncredere)
b) putem descreste incertitudinea asupra lui prin alegerea
unei valori particulare

din ca avnd cea mai reprezentativ a valoare
a lui ? (estimatie punctual a)
CAPITOLUL 7. STATISTIC
A INFEREN TIAL
A 223
c) putem considera ntrebarea: apartine unei submultimi
0
a lui ? (verificarea ipotezelor statistice)
3. presupunnd c a a fost aleas a o valoare particular a

reprezen-
tativ a a lui , ce putem spune despre observatiile viitoare? (predictie)
Definitia 7.5. Dat a o populatie de volum N, se numeste statistic a
a acelei populatii orice m arime semnificativ a calculat a cu ajutorul
datelor obtinute dintr-un esantion aleator al acelei populatii.
Exemple de statistici frecvent folosite: media de selectie statistic a,
dispersia de selectie statistic a, dispersia de selectie modificat a.
Definitia 7.6. Pentru un parametru al repartitiei, se numeste es-
timator al acelui parametru orice statistic a care aproximeaz a acel
parametru.
Dac a consider am selectia aleatoare X = (X
1
, X
2
, . . . , X
n
) cu datele
obtinute n urma selectiei (x
1
, x
2
, . . . , x
n
), vom nota estimatorul para-
metrului cu

=

(x
1
, x
2
, . . . , x
n
) si atunci putem scrie
> 0 : lim
n
P

(x
1
, x
2
, . . . , x
n
)
>
= 0
Cu alte cuvinte, pentru > 0 dat, pentru valori mari ale lui n
este foarte putin probabil ca

(x
1
, x
2
, . . . , x
n
) s a ia valori n afara
intervalului [ , +], adic a este foarte putin probabil ca num arul
(x
1
, x
2
, . . . , x
n
) s a fie n afara intervalului [, +]. n aceste con-
ditii, dup a un num ar de n experiente, consider am pe

(x
1
, x
2
, . . . , x
n
)
ca o aproximatie bun a pentru . Este posibil s a ne nsel am, dar proba-
bilitatea de a ne nsela este mic a, pentru n mare. Statistica nu ne ofer a
r aspunsuri sigure ci doar aproximatii n care putem avea un grad mai
mic sau mai mare de ncredere. Se accept a acele aproximatii n care
avem un grad mai mare de ncredere.
Se utilizeaz a estim ari punctuale sau estim ari cu ajutorul inter-
valelor de ncredere. Estimatorul punctual atribuie o valoare parame-
trului. Intervalele de ncredere genereaz a un interval n care parame-
trul apartine cu un anumit nivel de ncredere.
Exemplul 7.1. Consider am populatia diametrelor unor bile de rul-
menti dintr-un lot. Ca statistic a a acestei populatii se poate lua media
de selectie x a unui sir (x
1
, x
2
, . . . , x
n
) format de diametrele unui esan-
tion de bile din acel lot. Considernd alt lot, media de selectie x va
avea alt a valoare.
A INFEREN TIAL
A
Exemplul 7.2. O societate de telefoane poate considera populatia
tuturor abonatilor. Un esantion se poate obtine lund pe s arite din
lista abonatilor, de exemplu, din 25 n 25. Presupunem c a societatea
este interesat a n estimarea unui parametru caracteristic; de exemplu,
gradul de satisfactie g al abonatilor relativ la serviciile oferite de soc-
itate. Se cere o apreciere cu note de la 1 la 5. Este solicitat r aspunsul
abonatilor din esantionul ales si se obtine un estimator al lui g.
Dac a, de exemplu, reprezint a media atunci putem considera ca
statistic a a mediei, = X =
X
1
+X
2
+ +X
n
n
. Fie x
1
, x
2
, . . . , x
n
sunt valorile luate de X
1
, X
2
, . . . , X
n
atunci estimatorul lui este

=
x =
1
n
(x
1
+x
2
+ +x
n
). n conditiile n care m asur atorile sunt
realizate cu acuratete si precizie rezonabile, atunci X
1
, X
2
, . . . , X
n
se
pot considera independente si identic repartizate.
Vom prezenta exemple de modele statistce care apar adesea n
practic a.
7.1 Modele statistice
Modelul Bernoulli
Presupunem c a X
1
, X
2
, . . . , X
n
este o selectie aleatoare a unei po-
pulatii care urmeaz a o distributie Bernoulli cu parametrul [0, 1]
necunoscut. Stim c a distributia Bernoulli poate fi utilizat a la obser-
varea unui articol, rezultat al unui proces industrial, caz n care X
i
= 1
indic a faptul c a articolul i este bun si X
i
= 0 dac a articolul este de-
fect. n studii medicale rezultatul X
i
= 1 indic a faptul c a tratamentul
aplicat pacientului i a avut succes iar X
i
= 0 n caz contrar. n aceste
cazuri vrem s a stim valoarea lui .
Spatiul parametrului este [0, 1]. Dac a x
1
, x
2
, . . . , x
n
sunt valorile
luate de X
1
, X
2
, . . . , X
n
atunci func tia de frecven t a pentru X
i
este
f(x
i
, ) =
x
i
(1 )
1x
i
,
si reprezint a P (X = x
i
) , este parametrul necunoscut, iar legea de
probabilitate a selectiei este dat a de
n
Y
i=1
f(x
i
, ) =
n
Y
i=1
x
i
(1 )
1x
i
=
nx
(1 )
n(1x)
.
A INFEREN TIAL
A 225
Modelul Poisson
Presupunem c a X
1
, X
2
, . . . , X
n
este o selectie aleatoare a unei po-
pulatii care urmeaz a o distributie Poisson cu parametrul R
+
ne-
cunoscut. Stim c a distributia Repartitia Poisson a ap arut odat a cu
studiul variabilelor aleatoare cu un num ar foarte mare de valori. Ex-
emple clasice de astfel de variabile aleatoare sunt cele legate de eveni-
mentele care apar rar ntr-un interval de timp. n aceste cazuri
vrem s a stim valoarea lui .
Spatiul parametrului este R
+
. Dac a x
1
, x
2
, . . . , x
n
sunt valorile
luate de X
1
, X
2
, . . . , X
n
atunci func tia de frecven t a pentru X
i
este
f(x
i
, ) =

x
i
x
i
!
e
,
si reprezint a P (X = x
i
) , este parametrul necunoscut, iar legea de
probabilitate a selectiei este dat a de
n
Y
i=1
f(x
i
, ) =
n
Y
i=1
x
i
x
i
!
e
=

nx
x
1
!x
2
!...x
n
!
e
n
.
Modelul normal
Presupunemc a X
1
, X
2
, . . . , X
n
este o selectie aleatoare a unei popu-
latii care urmeaz a o distributie normal a N (, ) cu = (, )
R R
+
necunoscuti, unde R
+
= (0, ). De exemplu, putem avea
observatii asupra n altimii n centimetrii a unei populatii si intuim c a
este rezonabil s a presupunem c a distributia n altimii este normal a cu
media si dispersia necunoscute. Dac a x
1
, x
2
, . . . , x
n
sunt valorile luate
de X
1
, X
2
, . . . , X
n
atunci densitatea de probabiltate a unui esantion
este dat a de
n
Y
i=1
f(x
i
; ,
2
) =

2
2
n
2
exp
1
2
2
n
X
i=1
(x
i
)
2
Deoarece
n
X
i=1
(x
i
)
2
= n(x )
2
+
n
X
i=1
(x
i
x)
2
,
unde x =
1
n
n
P
i=1
x
i
este media de selectie si s
2
=
1
n 1
n
P
i=1
(x
i
x)
2
este
dispersia de selectie modificat a (deviatia standard), obtinem
n
Y
i=1
f(x
i
; ,
2
) =

2
2
n
2
exp
n
2
2
(x )
2
n 1
2
2
s
2
. (7.1)
A INFEREN TIAL
A
Ne putem pune ntrebarea dac a presupunerea c a n altimea popu-
latiei urmeaz a o distributie normal a este corect a. Aceast a ipotez a
trebuie verificat a. Procedurile care duc la verificarea unor astfel de
ipoteze se numesc teste statistice.
Modelul exponential
Presupunemc a timpul de viat a a unui aparat este distribuit Exp []
unde (0, ) este necunoscut. Presupunem c a X
1
, X
2
, . . . , X
n
este
o selectie aleatoare a unei populatii care urmeaz a o distributie ex-
ponential a. Dac a x
1
, x
2
, . . . , x
n
1
, X
2
, . . . , X
n
atunci densitatea de probabiltate a unui esantion este dat a de
n
Y
i=1
f(x
i
; ) =
n
exp{nx} .
Modelul multinomial
n capitolul II amintrodus distributia multinomial a. Aceasta apare
n aplicatii n care n urma unui experiment se pot realiza k evenimente
diferite independente A
1
, A
2
, . . . , A
k
. Aceste evenimente se produc cu
probabilit atile p
1
, p
2
, . . . , p
k
,
k
P
j=1
p
j
= 1, 0 p
j
1.
Facem presupunerea c a, de exemplu, k = 3. n acest caz nu cunoas-
tem parametrii (p
1
, p
2
, p
3
). Dac a x
1
, x
2
, x
3
1
,
X
2
, X
3
atunci densitatea de probabiltate a unui esantion este dat a de
3
Y
i=1
f(x
i
; p
1
, p
2
, p
3
) = p
x
1
1
p
x
2
2
p
x
3
3
.
Constructia histogramei si ncercarea de a intui modelul statistic
sunt metode folosite de statistician n ncercarea de a studia distributia
populatiei. Deseori nu este clar ce model statistic trebuie folosit. Mai
mult, dac a am intuit modelul statistic, nu stim nimic despre valoarea
parametrilor care intra n definitia modelului statistic. De exemplu,
stim c a n altimea urmeaz a o distributie normal a, dar nu stim media
si dispersia. Folosind intuitia am putea presupune c a media poate fi
aproximat a cu x. Pentru a justifica aceast a alegere avem nevoie s a
studiem estimatorii punctuali.
A INFEREN TIAL
A 227
7.2 Estimatori punctuali
Estimarea punctual a este valoarea atribuit a unui parametru pe
baza statisticii construite din esantion.
Definitia 7.7. Se consider a o populatie de volum N si un parametru
al acestei populatii. Fie X
1
, X
2
, . . . , X
n
este o selectie aleatoare
dintr-un esantion reprezentativ (n << N) al populatiei care ia valorile
x
1
, x
2
, . . . , x
n
; un estimator punctual

=

(x
1
, x
2
, . . . , x
n
) a lui se
numeste estimator nedeplasat sau absolut corect dac a M[
] = .
n practic a se recomand a n 30 si n
N
3
.
Definitia 7.8. Dac a lim
n
M[
] = si lim
n
D[
] = 0 atunci

este un
estimator corect sau deplasat al lui (n cazul estimatorului consistent
limita trebuie s a fie orict de mic a atunci cnd n creste).
Teorema 7.1. Dac a statistica

(x
1
, x
2
, . . . , x
n
) este un estimator co-
rect a lui atunci este un estimator al lui , adic a pentru orice > 0
avem
lim
n
P

(x
1
, x
2
, . . . , x
n
)
>
= 0.
Demonstratie. Conform inegalit atii lui Cebsev,
P

(x
1
, x
2
, . . . , x
n
) M[
>
D[
2
,
dar lim
n
M[
] = si lim
n
D[
] = 0 de unde rezult a concluzia.

Ar at am c a statisticile introduse anterior sunt estimatori ale para-
metrilor corespunz atori.
Teorema 7.2. Fie x
1
, x
2
, . . . , x
n
(n 2) o selec tie de valori ale vari-
abilelor X
1
, X
2
, . . . , X
n
(v. a. independente si identic distribuite ca si
X). Not am
m = M [X] media teoretic a,
2
= D[X] dispersia teoretic a,
X =
1
n
n
P
i=1
X
i
media de selec tie,
2
=
1
n
n
P
i=1
X
i
X
2
dispersia de selec tie si
A INFEREN TIAL
A
S
2
=
1
n 1
n
P
i=1
X
i
X
2
dispersia de selec tie modificat a.
Atunci media de selec tie X si dispersia de selec tie S
2
sunt estima-
tori punctuali pentru media, respectiv dispersia teoretic a. n plus,
1. media de selec tie X este un estimator absolut corect al lui m;
2. dispersia de selec tie
2
este un estimator corect al lui
2
.
3. dispersia de selec tie modicat a S
2
este un estimator absolut
corect al lui
2
.
Demonstratie. 1. Trebuie vericate conditiile din definitia estima-
torului absolut corect.
M

X
=
1
n
M
n
X
i=1
X
i
=
1
n
nM [X] = M [X] .
D
= D
1
n
n
X
i=1
X
i
=
1
n
2
D
n
X
i=1
X
i
=
1
n
2
n
X
i=1
D[X
i
] =

2
n
.
2.
M
h
2
i
=
1
n
M
n
X
i=1
X
i
X
=
=
1
n
M
n
X
i=1
X
2
i
2X
n
X
i=1
X
i
+nX
2
=
=
1
n
M
n
X
i=1
X
2
i
nX
2
= M
1
n
n
X
i=1
X
2
i
M
h
X
2
i
.
Dar
M
h
X
2
i
=
1
n
2
M
n
X
i=1
X
i
=
1
n
2
M
n
X
i=1
X
2
i
+
2
n
2
n
X
i<j
M [X
i
X
j
] .
Apoi M [X
2
i
] = M [X
2
] si din ipoteza de independent a
M [X
i
X
j
] = M [X
i
] M [X
j
] = (M [X])
2
,
rezult a
M
h
X
2
i
=
1
n
2
M

X
2
+
n 1
n
(M [X])
2
.
Deci
M
h
2
i
=
1
n
M

X
2
1
n
2
M

X
2
+
n 1
n
(M [X])
2
=
=
n 1
n
M

X
2
(M [X])
2
=
n 1
n

2
2
.
A INFEREN TIAL
A 229
Rezult a c a
2
nu estimeaz a absolut corect dispersia v. a. X.
3. Retinem c a M
h
2
i
=
n 1
n

2
.
Rezult a c a M [S
2
] = M

n
n 1
=
2
. Se poate demonstra c a
D
S
2
=
1
n
1
n
n
X
i=1
X
i
X
n 3
n 1
D[X]
2
!
, (7.2)
de unde rezult a c a D[S
2
] 0.
Observatia 7.1. Desi dispersia de selectie S
2
este un estimator nede-
plasat a lui
2
, S este un estimator deplasat a lui . Pentru valori mari
n 10 se poate considera c a =

1 +
1
[4(n1)]
S este un estimator
nedeplasat a lui .
Observatia 7.2. n practic a se foloseste S
2
n locul lui
2
deoarece d a
rezultate mai bune dup a cum ne arat a Teorema 7.2. Totusi formula
(7.2) ne spune c a pentru n suficient de mare si statistica
2
poate fi
folosit a ca estimator al dispersiei v.a. X.
Urm atorul tabel sintetizeaz a relatia dintre parametrii necunoscuti
si estimatorii punctuali asociati. Astfel noteaz a media,
2
este dis-
persia, p este probabilitatea repartitiei binomiale, p =
k
n
, unde k este
num arul realiz arilor ntr-un esantion de volum n,
1

2
estimeaz a
diferenta dintre mediile a dou a esantioane independente a dou a statis-
tici aleatoare, p
1
p
2
estimeaz a diferenta dintre proportiile a dou a
esantioane independente a dou a statistici aleatoare.
Param.
nec.
Statistica Estim. punctual
X =
1
n
n
P
i=1
X
i
x =
1
n
n
P
i=1
x
i
2
S
2
=
1
n1
n
P
i=1
X
i
X
2
s
2
=
1
n1
n
P
i=1
(x
i
x)
2
p p =
1
n
X p =
1
n
x
2
X
1
X
2
=
=
1
n
1
n
1
P
i=1
X
1i
1
n
2
n
2
P
i=1
X
2i
x
1
x
2
=
=
1
n
1
n
1
P
i=1
x
1i
1
n
2
n
2
P
i=1
x
2i
p
1
p
2
p
1
p
2
=
1
n
1
X
1
1
n
2
X
2
p
1
p
2
=
1
n
1
x
1
1
n
2
x
2
A INFEREN TIAL
A
Observatia 7.3. Dac a X Poiss [], atunci M [X] = D[X] = si
atunci x si s
2
sunt estimatorii nedeplasati pentru . Se pune ntrebarea
pe care l vom alege. Cum dispersia este o m asur a a mpr astierii,
intuitia sugereaz a s a-l alegem pe acela care are cea mai mic a dispersie
si aceasta deoarece el are o repartitie mai concentrat a n jurul lui .
Dintre doi estimatori nedeplasati

si

1
pentru acelasi parametru
, se consider a c a este mai precis cel care are dispersie mai mic a.
Problema 7.1. Se fac m asur atori asupra elonga tiei a 15 piese de
o tel, dintre care 6 au fost tratate cu metoda A si 9 au fost tratate cu
metoda B. Rezultatele ob tinute sunt:
Cu metoda A: 28,29,25,28,24,26;
Cu metoda B: 27,32,28,29,29,31,30,32,27.
Variabilele aleatoare sunt repartizate normal: X
1
, X
2
, X
3
, X
4
, X
5
,
X
6
N (
1
, ), Y
1
, Y
2
, Y
3
, Y
4
, Y
5
, Y
6
, Y
7
, Y
8
, Y
9
N (
2
, 2) ( cunos-
cut,
1
,
2
necunoscu ti). S a se g aseasc a estimatori punctuali pentru
1
si/sau
2
.
Rezolvare. x =
1
6
(28 + 29 + 25 + 28 + 24 + 26) = 26.667
y =
1
9
(27 + 32 + 28 + 29 + 29 + 31 + 30 + 32 + 27) = 29.444.
Dac a [0, 1] se consider a = x +(1 ) y. Vedem dac a este
estimator nedeplasat pentru
1
sau pentru
2
. Deoarece
M[ ] = M
X + (1) Y
= M
+(1) M
=
1
+(1)
2
observ am c a este estimator nedeplasat pentru
1
dac a = 1 si
pentru
2
dac a = 0.
Dispersia
D[ ] =D
X+(1) Y
=
2
D
+(1)
2
D
=
2
2
+ 4 (1)
2
care este minim a pentru =

4
5
.
Astfel =
4
5
26.667 +
1
5
29.444 = 27.222 poate fi considerat un
estimator att pentru
1
ct si pentru
2
.
A INFEREN TIAL
A 231
Teorema 7.3. Fie X o v. a. cu media m si abaterea medie p atratic a
. Dac a x
1
, x
2
, . . . , x
n
(n 2) o selec tie de valori ale lui X (v. a. inde-
pendente la fel distribuite ca si X), atunci pentru n sucient de mare
se poate considera c a X N

m,

.
Demonstratie. Conform teoremei limit a central a avem c a
S
n
= X
1
+X
2
+ +X
n
S
n
N

nm,
.
Deoarece
M

1
n
S
n
=
1
n
nm = m, D
1
n
S
n
=
1
n
2
n
2
=

2
n
,
rezult a c a
1
n
S
n
N

m,

.
Corolarul 7.1. n conditiile Teoremei 7.3 pentru orice a < b avem
P

a X < b
b m
n
!
a m
n
!
. (7.3)
Statisticienii recomand a folosirea formulei (7.3) pentru populatii
statistice de volum N si esantioane de volum n unde n 30 si n
N
3
.
Dac a n < 30 formula este util a dac a populatia initial a nu este departe
de a fi normal distribuit a. Pentru esantioane mici statisticienii propun
o corectie care s a nlocuiasc a

n
prin

n
r
N n
N 1
.
Problema 7.2. Consider am greut a tile popula tiei de 350 studen ti din-
tr-o facultate s-a constatat c a media este m = 70 si abaterea media
p atratic a este = 10.
a) S a se determine probabilitatea ca un student luat la ntmplare
s a cnt areasc a ntre 65 si 70 kg?
b) S a se determine probabilitatea ca media maselor s a fie ntre 65
si 75 kg.
c) S a se determine probabilitatea ca extr agnd un e santion de 36
studen ti din acea popula tie, media e santionului s a fie cuprins a ntre
65 si 75 kg.
d) Extr agnd un e santion de 100 de studen ti care este probabilitatea
ca media maselor s a fie sub 65 kg?
A INFEREN TIAL
A
Rezolvare. a) Pobabilitatea cerut a nu poate fi calculat a deoarece
X = greutatea populatiei nu este repartizat a normal.
La fel si la b).
c) n = 36, m = 70,
X
=
10
36
= 1.6667,
P

65 X 75
75 70
1. 6667
65 70
1. 6667
=
= 0.9986 0.0014 = 0.9972.
d) n = 100, m = 70,
X
=
10
100
= 1,
P

X 65
65 70
1
= 0.0000003.
7.3 Metoda momentelor
Ideea metodei este de a egala momentele distributiei cu momentele
statistice si de aici obtinem estimarea parametrilor. Momentele popu-
latiei vor depinde de parametrii necunoscuti.
De exemplu momentul initial de ordin nti este media, iar media
statistic a este momentul statistic de ordin nti. Egal am acestea si
obtinem estimarea punctual a = X. Deci media statistic a este un
estimator punctual al mediei populatiei.
Fie x
1
, x
2
, . . . , x
n
(n 2) o selectie de valori ale variabilelor X
1
,
X
2
, . . . , X
n
care au o distributie exponential a cu parametru . Avem
un singur parametru de estimat. Stim c a M [X] =
1
. De aici rezult a
c a
1
= X

=
1
x
este un estimator punctual al parametrului
obtinut cu metoda momentelor.
Exemplul 7.3. Ca exemplu, presupunem c a este testat timpul de
viat a a unui modul electronic folosit n industria automobilelor. Tim-
pul de viat a urmeaz a o distributie exponential a. S-au f acut teste si
s-au obtinut urm atoarele date: x
1
= 11.96, x
2
= 5.03, x
3
= 67.40,
x
4
= 16.07, x
5
= 31.50, x
6
= 7.73, x
7
= 11.10, x
8
= 22.38. Deoarece
x = 21.65, estimarea punctual a a parametrului obtinut cu metoda
momentelor este

=
1
21.65
= 0.046189.
A INFEREN TIAL
A 233
Fie x
1
, x
2
, . . . , x
n
(n 2) o selectie de valori ale variabilelor X
1
,
X
2
, . . . , X
n
care au o distributie normal a de parametrii si . n
acest caz avem M [X] = , M [X
2
] =
2
+
2
.
Rezult a c a
=
1
n
X
i=1
x
i
,
2
+
2
=
1
n
X
i=1
x
2
i
=
1
n
X
i=1
x
i
,

2
=
1
n
X
i=1
x
2
i

1
n
X
i=1
x
i
2

2
=
1
n
X
i=1
(x
i
x)
2
.
Reamintim c a acest estimator pentru
2
este un estimator corect sau
deplasat.
7.4 Metoda verosimilit atii maxime
Una din cele mai bune metode de a obtine un estimator punctual
pentru un parametrul este metoda verosimilit atii maxime.
Metoda verosimilit atii maxime a fost dezvoltat a n 1920 de mate-
maticianul englez R. A Fisher si extins a de Cramer, Rao si Wald.
Este cea mai folosit a metod a de estimare si joac a un rol important n
verificarea ipotezelor statistice.
Fie v. a. X cu densitatea de probabilitate f(x, ), unde este
parametrul necunoscut. Consider am o selectie X
1
, X
2
, . . . , X
n
i.i.d cu
v. a. X si fie x
1
, x
2
, . . . , x
n
valorile variabilelor de selectie. Atunci
func tia de verosimilitate maxim a corespunz atoare selectiei este
L(x
1
, x
2
, . . . , x
n
; ) =
n
Y
j=1
f(x
j
, ).
Aceast a functie se utilizeaz a numai dac a avem un singur parametru
necunoscut . Estimatorul de verosimilitate maxim a este acea valoare
a lui care maximizeaz a functia L(x
1
, x
2
, . . . , x
n
; ). n cazul unei
v. a. discrete interpretarea functiei este
L(x
1
, x
2
, . . . , x
n
; ) = P (X
1
= x
1
, X
2
= x
2
, . . . , X
n
= x
n
) ,
adic a reprezint a tocmai probabilitatea de a obtine n urma selectiei
valorile x
1
, x
2
, . . . , x
n
.
Metoda verosimilt atii maxime const a n urm atorul principiu (axi-
om a): valoarea cea mai verosimil a (cea mai potrivit a n acest sens!)
A INFEREN TIAL
A
a parametrului este aceea pentru care functia L(x
1
, x
2
, . . . , x
n
; ) este
maxim a. Aceasta implic a punct n care
L(x
1
, x
2
, . . . , x
n
; )
= 0. (7.4)
Ecuatia (7.4) n practic a se dovedeste a fi dificil a. De aceea se
foloseste observatia: L(x
1
, x
2
, . . . , x
n
; ) este maxim a dac a si numai
dac a ln L(x
1
, x
2
, . . . , x
n
; ) este maxim a.
Introducem functiile: logaritmul func tiei de verosimilitate
lnL(x
1
, x
2
, . . . , x
n
; ) si func tia scor
L(x
1
, x
2
, . . . , x
n
; )
= s (x
1
, x
2
, . . . , x
n
; ) .
Acestea ncoporeaz a aceeasi informatie ca si L(x
1
, x
2
, . . . , x
n
; ).
Dac a avem oricare dintre ele putem s a o obtinem pe cealalt a.
Definitia 7.9. t
n
(x
1
, x
2
, . . . , x
n
) : S se numeste estima tie de
verosimilitate maxim a pentru parametrul dac a este punct de maxim
pentru functia de verosimilitate, adic a
ln L(x
1
, x
2
, . . . , x
n
; t
n
) ln L(x
1
, x
2
, . . . , x
n
; )
pentru toti .
n cele ce urmeaz a presupunem c a f(x, ) este derivabil a pn a la
ordinul doi inclusiv n raport cu . Atunci exist a
L(x
1
, x
2
, . . . , x
n
; )
si estimatia de verosimilitate maxim a este solutie a ecuatiei

L(x
1
, x
2
, . . . , x
n
; )
= 0 (7.5)
sau a ecuatiei
lnL(x
1
, x
2
, . . . , x
n
; )
= 0. (7.6)
Fie aceast a solutie
0
. Pentru a fi estimator de verosimilitate maxim a
trebuie s a satisfac a si conditia
2
lnL(x
1
, x
2
, . . . , x
n
; )
=
0
< 0.
A INFEREN TIAL
A 235
Definitia 7.10. Ecuatiile (7.5) si (7.6) se numesc ecua tii de vero-
similitate.
Exemplul 7.4. Fie x
1
, x
2
, . . . , x
n
(n 2) o selectie de valori ale vari-
abilelor X
1
, X
2
, . . . , X
n
care au o distributie binomilal a, i. i. r. cu v.
a. X Bernoulli []. Atunci
f(x, ) =

x
(1 )
1x
, x = 0, 1
0, n rest.
.
este parametrul care trebuie estimat. Functia de verosimilitate
maxim a este, pentru selectia f acut a,
L(x
1
, x
2
, . . . , x
n
; ) =
x
1
(1 )
1x
1
x
2
(1 )
1x
2
. . .
xn
(1 )
1x
n
=
=
n
Y
j=1
x
j
(1 )
1x
j
=
nx
(1 )
nnx
.
Observ am c a minimizeaz a L(x
1
, x
2
, . . . , x
n
; ) dac a minimizeaz a
si ln L(x
1
, x
2
, . . . , x
n
; ). Atunci
lnL(x
1
, x
2
, . . . , x
n
; ) = nxln + (n nx) ln (1 ) .
lnL(x
1
, x
2
, . . . , x
n
; )
=
nx

n nx
1
nx

n nx
1
= 0
= x.
De aici rezult a c a estimatorul de verosimilitate maxim a pentru p
este
=
1
n
n
P
j=1
x
j
.
Exemplul 7.5. Fie x
1
, x
2
, . . . , x
n
(n 2) o selectie de valori ale vari-
abilelor de selectieX
1
, X
2
, . . . , X
n
care au o distributie normal a, i. i. d.
cu v. a. X N (m, ).
a) Dac a
2
este cunoscut a si media m este necunoscut a cu = R,
atunci functia de verosimilitate maxim a este
L(x
1
, x
2
, . . . , x
n
; m) =

1
n
exp
(
1
2
2
n
X
i=1
(x
i
m)
2
)
.
A INFEREN TIAL
A
Deoarece functia lnL este strict cresc atoare n L si valoarea lui m care
maximizeaz a ln L(x
1
, x
2
, . . . , x
n
; m) maximizeaz asi L(x
1
, x
2
, . . . , x
n
; m),
este mai usor de lucrat cu logaritmul lui L dect cu L. Avem
ln L(x
1
, x
2
, . . . , x
n
; m) =
n
2
ln 2
n
2
ln
2
1
2
2
n
X
i=1
(x
i
m)
2
.
Dar
ln L(x
1
, x
2
, . . . , x
n
; m)
m
=
1
2
n
X
i=1
(x
i
m) ,
deci
1
2
n
X
i=1
(x
i
m) = 0 m = x.
Observ am c a

2
lnL(x
1
, x
2
, . . . , x
n
; m)
m
2
=
n
2
0, m R, deci
m = x este punct de maxim. Astfel t
n
(x
1
, x
2
, . . . , x
n
) = x este punct
de verosimilitate maxim a.
b) Dac a m este cunoscut a si
2
= (0, ) este necunoscut
folosim forma functiei de verosimilitate maxim a dedus a n (7.1) si
obtinem
L(x
1
, x
2
, . . . , x
n
; m,
2
) =
=

2
2
n
2
exp
(
1
2
2
n
X
i=1
(x m)
2
n 1
2
2
s
2
)
=
=

2
2
n
2
exp
(
1
2
2
n
X
i=1
(x m)
2
)
exp
n 1
2
2
s
2
.
Fix am m = x si obtinem
L(x
1
, x
2
, . . . , x
n
;
2
) =

2
2
n
2
exp
n 1
2
2
s
2
ln L(x
1
, x
2
, . . . , x
n
;
2
) =
n
2
ln2
n
2
ln
2
n 1
2
2
s
2
.
lnL(x
1
, x
2
, . . . , x
n
;
2
)
2
=
n
2
2
+
n 1
2
4
s
2
,
lnL(x
1
, x
2
, . . . , x
n
;
2
)
2
= 0
2
=
n 1
n
s
2
.
A INFEREN TIAL
A 237
Dar
d
2
ln L
d (
2
)
2
(x
1
, x
2
, . . . , x
n
;
2
) =
n
2
4

n 1
6
s
2
2
=
n1
n
s
2
=
=
1
2
n
3
s
4
(n 1)
2
0.
Rezult a c a
2
este estimatorul de verosimilitate maxim a.
Dac a avem de estimat mai multi parametri 1, 2, ..., p, cu X cu
densitatea de probabilitate f(x,
1
,
2
, ...,
p
), atunci n mod analog cu
cazul unui singur parametru, aplic amprincipiul verosimilit atii maxime.
Consider amo selectie X
1
, X
2
, . . . , X
n
i.i.d cu v. a. X si fie x
1
, x
2
, . . . , x
n
valorile variabilelor de selectie. Atunci func tia de verosimilitate ma-
xim a corespunz atoare selectiei este
L(x
1
, x
2
, . . . , x
n
;
1
,
2
, ...,
p
) =
n
Y
j=1
f(x
j
,
1
,
2
, ...,
p
).
Se aleg pentru parametri acele valori care maximizeaz a functia
de verosimilitate L(x
1
, x
2
, . . . , x
n
;
1
,
2
, ...,
p
) sau ceea ce este acelasi
lucru acele valori care maximizeaz a ln L(x
1
, x
2
, . . . , x
n
;
1
,
2
, ...,
p
).
Aceasta implic a:
_
_
ln L(x
1
, x
2
, . . . , x
n
;
1
,
2
, ...,
p
)
1
= 0
ln L(x
1
, x
2
, . . . , x
n
;
1
,
2
, ...,
p
)
2
= 0

ln L(x
1
, x
2
, . . . , x
n
;
1
,
2
, ...,
p
)
p
= 0
(7.7)
si diferentiala de ordin doi, care este o form a p atratic a, calculat a n
punctul (
1
,
2
, ...,
p
) , solutie a sistemului (7.7), negativ definit a.
Exemplul 7.6. Fie x
1
, x
2
, . . . , x
n
(n 2) o selectie de valori ale
variabilelor de selectieX
1
, X
2
, . . . , X
n
care au o distributie normal a,
i. i. d. cu v. a. X N (m, ). Dac a m si
2
sunt necunoscute,
={(m,
2
) |mR,
2
(0, )}, atunci estimatorul de verosimilitate
A INFEREN TIAL
A
maxim a

m,
2
se obtine rezolvnd sistemul

_
_
lnL(x
1
, x
2
, . . . , x
n
; m,
2
)
m
=
1
2
n
X
i=1
(x
i
m) = 0
lnL(x
1
, x
2
, . . . , x
n
; m,
2
)
2
= 0
adic a
_
_
1
2
n
X
i=1
(x
i
m) = 0
n
2
2
+
1
2 (
2
)
2
n
X
i=1
(x m)
2
+
n 1
2 (
2
)
2
s
2
= 0
.
Obtinem
(
m = x

2
=
n 1
n
s
2
Calcul am
d
2
ln L(x
1
, x
2
, . . . , x
n
; m,
2
) =

2
lnL(x
1
, . . . , x
n
; m,
2
)
m
2
dm
2
+
+2
2
lnL(x
1
, . . . , x
n
; m,
2
)
m
2
dmd
2
+

2
ln L(x
1
, . . . , x
n
; m,
2
)
(
2
)
2
d
2
2
,
d
2
lnL(x
1
, x
2
, . . . , x
n
; m,
2
) =
1
2
dm
2
n
3
2(n 1)
2
(s
2
)
2
d
2
2
care este o form a p atratic a, evident, negativ definit a. De aici rezult a c a
x,
n 1
n
s
2
este unicul estimator de verosimilitate maxim a pentru

(m,
2
).
Exemplul 7.7. Presupunem c a timpul de viat a a unui aparat este
distribuit Exp [] unde (0, ) este necunoscut. Bazndu-ne pe o
selectie (x
1
, x
2
, . . . , x
n
) de valori ale variabilelor X
1
, X
2
, . . . , X
n
care
au o distributie exponential a obtinem functia de verosimilitate
L(x
1
, x
2
, . . . , x
n
; ) =
n
exp{nx}
ln L(x
1
, x
2
, . . . , x
n
; ) = nln nx
lnL(x
1
, x
2
, . . . , x
n
; )
=
n
nx
n
nx = 0
=
1
x
.
A INFEREN TIAL
A 239
2
lnL
2
(x
1
, x
2
, . . . , x
n
; ) =
n
2
lnL
2
(x
1
, x
2
, . . . , x
n
;
1
x
) = n(x)
2
0
=
1
x
este estimatorul de verosimilitate maxim a a lui .
Folosim programul Mathematica ca s a ilustr am grafic cum functi-
oneaz a metoda verosimilit atii maxime.
Gener am un sir de 40 numere aleatoare distribuite exponential cu
parametrul = 0.04. Construim, utiliznd numerele aleatoare genera-
te, functia de verosimilitate maxim a L(x
1
, x
2
, . . . , x
n
; ), apoi functia
lnL(x
1
, x
2
, . . . , x
n
; ), determin am estimatorul de verosimilitate maxi-
m a si apoi desen am graficul functiei ln L(x
1
, x
2
, . . . , x
n
; )
ex1 = RandomArray[ExponentialDistribution[0.04], 40];
lvm[x_] := x^40 E^(-x Sum[ex1[[i]], {i, 1, 40}])
lnlvm[x_] := Log[lvm[x]]
Solve[D[lnlvm[x], x] == 0, x]
{{x -> 0.0353324}}
t1 = Plot[lnlvm[x], {x, 0.02, 0.1}, PlotStyle -> {GrayLevel[0]},
AxesLabel -> {"x value", "lnlvm[x]"}, PlotPoints -> 5000]
0.02 0.04 0.06 0.08
x value
-200
-195
-190
-185
-180
-175
lnlvm @xD
Figura 7.1.
Am g asit, pe baza celor 40 de numere aleatoare generate, estima-
torul de verosimilitate maxim a

= 0.0353324. Din grafic se observ a
c a punctul de maxim este aproximativ cel g asit si c a functia este rela-
tiv rotund a n regiunea maximului ceea ce ne sugereaz a c a parametrul
nu este estimat foarte precis.
A INFEREN TIAL
A
n continuare vom desena graficele a trei functii logaritmice de
verosimilitate maxim a, care au acelasi punct de maxim, dar care sunt
construite cu selectii diferite de volum respectiv 20, 100 si 500. Ob-
serv am cum devine gracul mai ascutit n punctul de maxim cu ct
selectia este de volum mai mare.
lm1[x_] := Log[x^20 E^(-566.0525746593293 x)]
Solve[D[lm1[x], x] == 0, x]
{{x -> 0.0353324}}
lm2[x_] := Log[x^100 E^(-2830.2628732966464 x)]
{{x -> 0.0353324}}
lm3[x_] := Log[x^500 E^(-14151.314366483233 x)]
{{x -> 0.0353324}}
<< GraphicsGraphics
DisplayTogether[
Plot[lm1[x], {x, 0.001, 0.3}, PlotStyle -> Hue[.06]],
Plot[lm2[x], {x, 0.001, 0.3}, PlotStyle -> {GrayLevel[0],
Dashing[{.03}]}],
Plot[lm3[x], {x, 0.001, 0.3}, PlotStyle -> Hue[.6]]]
0.05 0.1 0.15 0.2 0.25 0.3
-4000
-3000
-2000
-1000
Figura 7.2.
Exemplul 7.8. Considernd o selectie (x
1
, x
2
, . . . , x
n
) de valori ale
variabilelor X
1
, X
2
, . . . , X
n
dintr-o populatie a c arei caracteristic a stu-
diat a urmeaz a o distributie Poisson cu parametrul obtinem functia
de verosimilitate
L(x
1
, x
2
, . . . , x
n
; ) =

x
1
x
1
!
e
x
2
x
2
!
e

x
n
x
n
!
e
=

n
P
i=1
x
i
x
1
!x
2
! x
n
!
e
n
A INFEREN TIAL
A 241
ln L(x
1
, x
2
, . . . , x
n
; ) = ln
n
P
i=1
x
i
ln (x
1
!x
2
! x
n
!) n
lnL(x
1
, x
2
, . . . , x
n
; )
=
n
P
i=1
x
i
n = 0 =
n
P
i=1
x
i
n
= x,
2
ln L(x
1
, x
2
, . . . , x
n
; )
2
=
n
P
i=1
x
i
2
,
2
lnL(x
1
, x
2
, . . . , x
n
; x)
2
=
n
2
x
< 0,
rezult a c a

= x este estimatorul de verosimilitate maxim a a lui .
Ne punem ntrebarea dac a acest estimator este si cel mai eficient,
n sensul c a are dispersia cea mai mic a. La aceast a ntrebare r aspunsul
l g asim n teorema lui Rao-Cramer.
Teorema 7.4. (Rao-Cramer) Statistica (X
1
, X
2
, . . . , X
n
) este un es-
timator cu dispersie minim a n mul timea estimatorilor absolut corec ti
dac a
D[ (X
1
, X
2
, . . . , X
n
)] =
1
n

R
lnf(x,)
2
f(x, )dx
sau
D[ (X
1
, X
2
, . . . , X
n
)] =
1
n

P
k=0
lnf(k,)
2
f(k, )
dac a distribu tia este cu valori discrete.
Relu am Exemplul 7.8.
D[ (X
1
, X, . . . , X
n
)] = D
1
n
n
P
i=1
X
i
=
D[X]
n
=

n
.
f(k, ) =

k
k!
e
, ln f(x, ) = +k ln lnk!,
ln f(k, )
= 1 +
k
.
Calcul am
X
k=0
ln f(k, )
2
f(k, ) =

X
k=0
1 +
k
k
k!
e
=
=

X
k=0
1 2
k
+
k
2
k
k!
e
= e

X
k=0
k
k!
2

X
k=0
k

k
k!
+

X
k=0
k
2
k
k!
!
=
A INFEREN TIAL
A
= e

X
k=0
k
k!
2

X
k=1
k1
(k 1)!
+

X
k=2
k2
(k 1)!
k
!
=
= e
2e
+

X
k=2
k2
(k 1)!
(k 1 + 1)
!
=
= e
+e
+
1
=
1
.
Deci
1
n

P
k=0
lnf(k,)
2
f(k, )
=
1
n
1
=

n
.
Rezult a din teorema Rao-Cramer c a media de selectie este un estima-
tor ecient al parametrului .
Studiem dac a estimatorul obtinut n Exemplul 7.4.
f(k, ) =

k
(1 )
1k
, k = 0, 1
0, n rest.
.
De aici rezult a c a estimatorul de verosimilitate maxim a pentru p este
=
1
n
n
P
j=1
X
j
.
Calcul am
ln f(k, ) = k ln + (1 k) ln(1 ),
1
X
k=0
lnf(k, )
2
f(k, ) =
=

lnf(0, )
2
f(0, ) +
ln f(1, )
2
f(1, ) =
=

1
1
2
(1 ) +
2
=
1
1
+
1
=
1
(1 )
.
Deci
1
X
k=0
lnf(k, )
2
f(k, ) =
1
n
1
(1)
=
(1 )
n
.
Rezult a din teorema Rao-Cramer c a media de selectie este un es-
timator ecient al parametrului .
A INFEREN TIAL
A 243
Exemplul 7.9. Consider am o populatie n care indivizii sunt m-
p artiti n trei nivele: 1, 2 si 3. Mai mult, probabilitatea ca un individ
s a apartin a unui nivel este respectiv p
1
= , p
2
=
2
, p
3
= 1
2
unde este necunoscut. Observ am c a trebuie s a impunem conditiile:
0 1, 0
2
1, 0 1
2
1
2
+ 1 0
h
0,
5 1
/2
i
= [0, 0.61803] .
Asemenea modele apar n genetic a, de exemplu n probleme legate
de clasificarea indivizilor n diferite genotipuri. Pentru un esantion de
dimensiune n (unde n este mic relativ la dimensiunea populatiei, asa
c a putem presupune v. a. independente si identic distribuite), functia
de verosimilitate va fi
L(x
1
, x
2
, x
3
; ) =
x
1
2x
2

1
2
x
3
,
unde x
i
reprezint a num arul de selectii apartinnd clasei i, x
1
+x
2
+x
3
=n.
Atunci
ln L(x
1
, x
2
, x
3
; ) = (x
1
+ 2x
2
) ln +x
3
ln
1
2
si
ln L(x
1
, x
2
, x
3
; )
=
x
1
+ 2x
2

x
3
(2 + 1)
1
2
.
Estimatorul de verosimilitate maxim a se obtine rezolvnd ecuatia
x
1
+ 2x
2

x
3
(2 + 1)
1
2
= 0
2
(x
1
+ 2x
2
+ 2x
3
) (x
1
+ 2x
2
+x
3
) +x
1
+ 2x
2
= 0
si trebuie verificat a conditia de limitare asupra lui .
Pentru ca valoare lui ,

s a fie un estimator de verosimilitate
maxim a trebuie ca derivata de ordin doi calculat a n

s a fie negativ a,
2
lnL(x
1
, x
2
, x
3
; )
=
x
1
+ 2x
2
2

x
3
2
+ 2
+ 3
2
< 0.
De exemplu dac a x
1
= 70, x
2
= 5, x
3
= 25 130
2
105+80 = 0
rezult a {[ = 1.286 2] , [ = 0.47847]}
A INFEREN TIAL
A
Alegem solutia pozitiv a si mai mic a dect

5 1
/2 = 0.61803.
Rezult a = 0.47847.
2
ln L(x
1
, x
2
, x
3
; )
2
=
80
2

25
2
2
+ 2 + 3
1
2
2
lnL(s
1
, s
2
, . . . , s
n
; 0.47847)
2
=
=
80
0.47847
2

25 (2 0.47847
2
+ 2 0.47847 + 3)
(1 0.47847 0.47847
2
)
2
= 1638.6
si deci estimatorul de verosimilitate va fi

= 0.47847.
Rezolv am problema cu Mathematica (am notat parametrul cu x).
Reduce[{0x1,01-x-x^21},x]
0 x
1
2
(1 +
5)
N[%]
0. x 0.618034
lvm[x_] := x^70x^(10)(1-x-x^2)^25
lvm[x]
x
80
((1 x x
2
)
25
)
N[Solve[D[Log[lvm[x]], x] == 0, x]]
{{x > 1.28616}, {x > 0.478467}}
d2[x_] := Simplify[D[Log[lvm[x]], {x, 2}]]
d2[x] /. x-> 0.478467
-1638.57.
Complicatii care pot ap area n folosirea functiei de verosi-
militate maxim a: nu este ntotdeauna usor s a minimiz am functia
de verosimilitate maxim a deoarece ecuatia obtinut a
L
= 0 poate fi
dificil de rezolvat. Mai mult, uneori nu este posibil s a determin am cu
metode directe maximum lui L(). Exemplific am acest lucru:
Exemplul 7.10. Consider am X Unif [0, a], deci densitatea de
probabilitate va fi:
f(x) =
(
1
a
dac a x [0, a] ,
0 n rest.
Parametrul pe care vrem s a-l estim am este a.
A INFEREN TIAL
A 245
Rezolvare. Functia de verosimilitate maxim a va fi L(a) =
n
Q
i=1
1
a
=
1
a
n
pentru 0 x
1
a, 0 x
2
a, . . . , 0 x
n
a. n acest caz graficul
functiei de verosimilitate este
min (x
i
)
Figura 7.3.
Punctul de verosimiltate maxim a este ntr-un punct de disconti-
nuitate. Deoarece
d
da
1
a
n
=
n
a
n+1
6= 0 pentru a > 0, iar a
n
este o functie descresc atoare n raport cu a > 1 (si cresc atoare pentru
a < 1), ceea ce indic a faptul c a maximul functiei de verosimilitate este
atins n valoarea cea mai mic a (respectiv cea mai mare). Figura arat a
c a max L(a) = L(min
i
(x
i
)) (respectiv max L(a) = L(max(x
i
)), deci un
estimator al lui a este a = min(x
i
) (respectiv max
i
(x
i
)).
Exemplul 7.11. Fie X
1
, X
2
, . . . , X
n
o selectie dintr-o populatie care
urmeaz a o distributie Gama de valori x
1
, x
2
, . . . , x
n
. Functia de verosi-
militate maxim a este, n acest caz,
L[r, ] =
n
Y
i=1
r
x
r1
i
e
x
i
(r)
,
lnL[r, ] = ln
n
Y
i=1
r
x
r1
i
e
x
i
(r)
!
=
= nr ln + (r 1)
n
X
i=1
ln x
i
nln(r)
n
X
i=1
x
i
.
Derivatele functiilor de verosimilitate maxim a sunt
L[r, ]
r
= nln +
n
X
i=1
lnx
i
n
0
(r)
(r)
,
A INFEREN TIAL
A
L[r, ]
r
=
nr

n
X
i=1
x
i
.
Egal am derivatele cu zero si vom avea un sistem de dou a ecuatii
cu dou a necunoscute care trebuie rezolvat.
_
_
nln +
n
P
i=1
lnx
i
n
0
(r)
(r)
= 0
nr

n
P
i=1
x
i
= 0
.
Sistemul este dicil de rezolvat. Sunt folosite diferite metode nu-
merice si softuri pentru a rezolva sistemul. Solution am problema cu
Mathematica.
ex1 = RandomArray[GammaDistribution[2., 1], 400];
Short[ex1, 4]
{2.49901, 0.321189, 3.78343, 0.407012, <<393>>, 0.537742, 0.901422,
3.66009}
ss = Sum[Log[ex1[[i]]], {i, 1, 400}]
149.796
ssr = Sum[ex1[[i]], {i, 1, 400}]
759.69
n = 400;
vmaxGa[r_, lam_] := n r Log[lam] + (r - 1) ss - n Log[Gamma[r]] -
lam ssr
d1 = D[vmaxGa[r, lam], lam]
-759.6898125225405 + 400 r/lam
d2 = D[vmaxGa[r, lam], r]
149.796 + 400 Log[lam] - 400 PolyGamma[0, r]
ec = {d1 == 0, d2 == 0}
{-759.6898125225405 + 400 r/lam == 0,
149.79562794164252 + 400 Log[ lam] - 400 PolyGamma[0, r] == 0}
FindRoot[ec, {lam, 1.5}, {r, 0.5}]
{lam -> 1.06559, r -> 2.0238}
<< GraphicsGraphics3D
Plot3D[vmaxGa[r, lam], {lam, 0.1, 4}, {r, 0.1, 10}];
A INFEREN TIAL
A 247
1
2
3
4
2
4
6
8
10
-4000
-2000
0
1
2
3
Figura 7.4.
ContourPlot[vmaxGa[r, lam], {lam, 0.1, 4}, {r, 0.1, 10},
ContourLines -> False, Compiled -> True];
1 2 3 4
0
2
4
6
8
10
Figura 7.5.
Graficul a fost f acut pentru functia de verosimilitate maxim a pen-
tru distributia gama folosind 400 de numere aleatoare distribuite gama
cu r = 2 si = 1. Primul grafic deseneaz a suprafata generat a de
functia de verosimilitate maxim a, iar al doilea deseneaz a suprafete
de nivel. Din acest ultim desen observ am c a functia de verosimiltate
maxim a este maximizat a n aproximativ = 1.06559, r = 2.0238.
A INFEREN TIAL
A
7.4.1 Probleme rezolvate
Problema 7.3. Fie o selec tie de valori (x
1
, x
2
, . . . , x
n
) ale variabilelor
X
1
, X
2
, . . . , X
n
dintr-o popula tie a c arei caracteristic a studiat a urmeaz a
o distribu tie uniform a pe intervalul [0, a] , a > 0.
a) S a se determine un estimator punctual al lui a folosind metoda
momentelor.
b) S a se analizeze dac a estimatorul ob tinut este nedeplasat.
Rezolvare.
a) X Unif [0, a] f
X
: R R, f
X
(x) =
(
1
a
, dac a x [0, a]
0, n caz contrar
.
Avem M [X] =
a
2
si X =
1
n
n
P
i=1
X
i
. Rezult a, conform metodei mo-
mentelor, c a
a
2
=
1
n
n
P
i=1
X
i
. Deci a =
2
n
n
P
i=1
X
i
este un estimator pentru
parametrul a.
b) Calcul am M [ a] = M

2
n
n
P
i=1
X
i
=
2
n
n
P
i=1
M [X
i
] = a.
Problema 7.4. Se consider a func tia:
f : R R, f(x) =

c(1 +x), 1 x 1,
0, n rest.
a) S a se determine valoarea constantei c astfel nct f s a fie o
densitate de probabilitate.
b) Care este estimatorul lui ob tinut prin metoda momentelor?
c) Ar ata ti c a

= 3X este un estimator nedeplasat al lui .
d) Determina ti estimatorul de verosimilitate maxim a a lui .
Rezolvare. a)
1
R
1
c(1 +x)dx = 2c c =
1
2
.
b) M [X] =
1
2
1
R
1
(x + x
2
)dx =
1
3

1
3
= X, X =
1
n
n
P
i=1
X
i
,
= 3X.
c) M
h
i
= 3M

X
= 3M

1
n
n
P
i=1
X
i
=
3
n
n
P
i=1
M [X
i
] = .
A INFEREN TIAL
A 249
d)
L(x
1
, x
2
, . . . , x
n
; ) =

1
2
n n
Y
i=1
(1 +x
i
) ,
ln L(x
1
, x
2
, . . . , x
n
; ) = nln 2 +
n
X
i=1
ln(1 +x
i
) ,
ln L(x
1
, x
2
, . . . , x
n
; )
=
n
X
i=1
x
i
1 +x
i
,
n
X
i=1
x
i
1 +x
i
= 0.
Determinarea estimatorului de verosimilitate maxim a este dificil a.
n acest caz prefer am o alt a metod a pentru estimarea parametrului .
1
, x
2
, . . . , x
n
) ale variabilelor
X
1
, X
2
, . . . , X
n
dintr-o popula tie a c arei caracteristic a studiat a urmea-
z a o distribu tie cu densitatea de probabilitate
f(x) =

( + 1)x
, 0 x 1
0, n rest
, > 1.
S a se determine estimatorul de verosimilitate maxim a.
Rezolvare.
L(x
1
, x
2
, . . . , x
n
; ) =
n
Y
i=1
( + 1)x
i
= ( + 1)
n
n
Y
i=1
x
i
!
,
ln L(x
1
, x
2
, . . . , x
n
; ) = nln( + 1) +
n
X
i=1
ln(x
i
) ,
lnL(x
1
, x
2
, . . . , x
n
; )
=
n
+ 1
+
n
X
i=1
ln (x
i
) ,
n
+ 1
+
n
X
i=1
ln x
i
= 0
=
n
n
P
i=1
ln (x
i
)
1.
2
ln L(x
1
, x
2
, . . . , x
n
; )
2
=
n
( + 1)
2
< 0, 6= 1.
Estimatorul de verosimilitate maxim a este

=
n
n
P
i=1
ln(x
i
)
1.
A INFEREN TIAL
A
1
, x
2
, . . . , x
n
) ale variabilelor
X
1
, X
2
, . . . , X
n
dintr-o popula tie a c arei caracteristic a studiat a urmea-
z a o distribu tie cu densitatea de probabilitate
f(x) =
1
2
xe
x/
, 0 x < .
S a se determine estimatorul de verosimilitate maxim a.
Rezolvare.
L(x
1
, x
2
, . . . , x
n
; ) =
n
Y
i=1
1
2
xe
x
i
/
=
1
2n
n
Y
i=1
x
i
e
x
i
!
=
=
1
2n
n
Y
i=1
x
i
!
exp
n
P
i=1
x
i
=
1
2n
n
Y
i=1
x
i
!
e
nx
,
ln L(x
1
, x
2
, . . . , x
n
; ) = 2nln +
n
X
i=1
ln (x
i
)
nx
,
ln L(x
1
, x
2
, . . . , x
n
; )
=
2n
+
nx
2
,
2n
+
nx
2
= 0
=
1
2
x.
2
ln L(x
1
, x
2
, . . . , x
n
; )
2
=
2n
2

2nx
2
ln L(x
1
, x
2
, . . . , x
n
; )
=
1
2
x
=
8n
x
2
< 0.

=
1
2
x.
1
, x
2
, . . . , x
n
) ale variabilelor
X
1
, X
2
, . . . , X
n
dintr-o popula tie a c arei caracteristic a studiat a urmeaz a
o distribu tie Pareto [], (0, ) necunoscut. S a se determine un
estimator de verosimiltate maxim a pentru , dac a acesta exist a. (den-
sitatea de probabilitate pentru o v. a. repartizat a Pareto este f(x) =
(1 +x)
1
, x 0
0, x < 0.
).
Rezolvare.
L(x
1
, x
2
, . . . , x
n
; ) =
n
Y
i=1
(1 +x
i
)
1
=
n
n
Y
i=1
(1 +x
i
)
!
1
,
A INFEREN TIAL
A 251
ln L(x
1
, x
2
, . . . , x
n
; ) = nln + ( 1)
n
X
i=1
ln(1 +x
i
),
ln L(x
1
, x
2
, . . . , x
n
; )
=
n

n
X
i=1
ln(1 +x
i
),
ln L(x
1
, x
2
, . . . , x
n
; ) = nln + ( 1)
n
X
i=1
ln(1 +x
i
),
ln L(x
1
, x
2
, . . . , x
n
; )
=
n

n
X
i=1
ln(1 +x
i
),
n

n
X
i=1
ln(1 +x
i
) = 0 =
n
n
P
i=1
ln(1 +x
i
)
.
2
ln L(x
1
, x
2
, . . . , x
n
; )
2
=
n
2
< 0.
Problema 7.8. Conform legilor genetice ale lui Hardy-Weinberg, pro-
por tia genotipurilor AA, Aa, aa este
2
, 2(1 ), (1 )
2
respectiv,
unde [0, 1]. Facem o selec tie de volum n dintr-o popula tie (n re-
lativ mic n raport cu volumul popula tiei) si observ am c a x
1
indivizi
apar tin genotipului AA, x
2
indivizi apar tin genotipului Aa, x
3
indivizi
apar tin genotipului aa. S a se scrie func tia de verosimilitate maxim a,
func tia log de verosimilitate maxim a, func tia scor. S a se stabileasc a,
dac a exist a, un estimator de verosimilitate maxim a pentru .
Rezolvare. Folosim modelul multinomial. Functia de verosimilitate
maxim a
L(x
1
, x
2
, . . . , x
n
; ) =
2x
1
(2(1 ))
x
2
(1 )
2x
3
=
= 2
x
2
2x
1
+x
2
(1 )
x
2
+2x
3
.
Functia log de verosimilitate maxim a
lnL(x
1
, x
2
, . . . , x
n
; ) = ln
2x
1
(2(1 ))
x
2
(1 )
2x
3
=
= x
2
ln 2 + (2x
1
+x
2
) ln + (x
2
+ 2x
3
) ln(1 ) .
Functia scor
lnL(x
1
, x
2
, . . . , x
n
; )
=
2x
1
+x
2

x
2
+ 2x
3
1
.
2x
1
+x
2

x
2
+ 2x
3
1
= 0
=
2x
1
+x
2
2x
1
+ 2x
2
+ 2x
3
.
A INFEREN TIAL
2
ln L(x
1
, x
2
, . . . , x
n
; )
2
=
2x
1
+x
2
2

x
2
+ 2x
3
(1 )
2
< 0.

=
2x
1
+x
2
2x
1
+ 2x
2
+ 2x
3
.
toarele:
1. Conceptul general de estimare a parametrilor unei populatii.
2. Propriet atile estimatorilor punctuali.
3. Cum pot fi construiti estimatorii punctuali folosind metoda mo-
mentelor si metoda verosimilit atii maxime.
Capitolul 8
Intervale de ncredere
Am v azut cum poate fi estimat un parametru folosind datele furni-
zate de un esantion. Parametrul din populatie nu este, n general, egal
cu statistica calculat a cu ajutorul esantionului. Ne punem problema
ct este de bun a aceast a estimare, adic a vom calcula asa numita marj a
de eroare.
Presupunem c a studiem vscozitatea unei anumite substante. Prin
studierea unui esantion s-a constatat c a media acestei caracteristici
este = x = 1000. Dac a consider am un alt esantion este aproape
imposibil s a obtinem aceeasi estimare numeric a pentru media vsco-
zit atii. Nu putem spune nimic despre relatia dintre cele dou a medii.
Problema pe care o punem este urm atoarea: valoarea real a a vscozi-
t atii este cuprins a ntre 900 si 1100 sau ntre 990 si 1100? R aspunsul la
aceast a ntrebare afecteaz a deciziile ulterioare legate de acest proces.
Marginile unui interval plauzibil pentru valorile mediei constituie un
interval estimat.
Acest interval unde b anuim c a este situat a valoarea real a a para-
metrului populatiei studiate se numeste interval de ncredere. Inter-
valul de ncredere const a din:
- un interval, obtinut cu ajutorul datelor furnizate de o selectie,
- un nivel de ncredere, care reprezint a probabilitatea ca intervalul
s a acopere valoarea real a a parametrului.
Nivelul de ncredere se precizeaz a. De regul a se consider a 0.90 sau
mai mult. Se d a de obicei , unde nivelul de ncredere este 1 (0.95
corespunde pragului de semnificatie = 0.05).
Definitia 8.1. Se numeste interval de ncredere pentru un parametru
asociat unei populatii orice interval I = [a, b] pentru care se poate
253
254 CAPITOLUL 8. INTERVALE DE NCREDERE
estima probabilitatea ca I. Dac a este un num ar cuprins ntre
0 si 1 si dac a P( I) 1 , se spune c a I este un interval de
ncredere pentru cu un nivel de ncredere 1 (sau echivalent, cu
un nivel de ncredere (1 ) 100% sau cu eroare sub 100%).
n cele ce urmeaz a vom construi intervale de ncredere numai pen-
tru caracteristici care urmeaz a o distributie normal a
8.1 Intervale de ncredere pentru medie
n cazul cunoscut
Presupunem c a realiz am o selectie populatie a c arei caracteristic a
studiat a urmeaz a o distributie normal a, N [m, ], cu cunoscut, m
necunoscut. Situatia este mai putin ntlnit a n realitate deoarece n
mod normal att media ct si dispersia sunt necunoscute. Totusi vom
prezenta n continuare si acest caz.
8.1.1 Constructia intervalului de ncredere
Fie x
1
, x
2
, . . . , x
n
valorile variabilelor de selectie X
1
, X
2
, . . . , X
n
ob-
tinute dintr-o populatie care urmeaz a o distributie normal a, N [m, ],
> 0 cunoscut, m necunoscut. Stim c a Z =
X m
n
N([0, 1]. Din
aceast a cauz a putem scrie, (evident z > 0),
P (|Z| z) = 1 1 = P

m
X z

n
, X +z

1 = (z) (z) 1 = 1 2(z) (z) =

2
Not amcu z
2
valoarea (pozitiv a) a lui z obtinut a din relatia (z) =
=

2
. Pentru determinarea acestei valori se foloseste tabelul pentru
functia lui Laplace (a se vedea Anexa 1) sau programele Matlab sau
Mathematica.
De ndat a ce selectia a fost realizat a si a fost calculat a media de
selectie x =
1
n
n
P
i=1
x
i
se obtine intervalul,
x z
n
, x +z
(8.1)
CAPITOLUL 8. INTERVALE DE NCREDERE 255
Suntem tentati s a spunem c a 1 este probabilitatea ca acest
interval s a cuprind a valoarea exact a a lui m, dar aceast a afirmatie
nu este corect a. Trebuie s a tinem seama de faptul c a ntervalul de
ncredere este un interval aleator, el depinde de selectia f acut a, deci
extremit atile sale sunt v. a. Prin urmare interpretarea corecta a lui
1 este urm atoarea: dac a, facem un num ar foarte mare de selectii si
calcul am de fiecare dat a ntervalul de ncredere cu nivelul de ncredere
1 , atunci (1 ) 100% din aceste intervale vor contine valoarea
exact a pentru m.
Observ am c a intervalul de ncredere pentru m este centrat n es-
timatia punctual a x. Cnd n creste se obtine un interval mai scurt
pentru acelasi coecient de ncredere. Un interval de ncredere mai
scurt indic a o mai mare ncredere n x ca estimatie a lui m.
Relu am exemplul 6.1 din capitolul 6.
Exemplul 8.1. Punctajele obtinute de studenti care au promovat
examenul de matematic a si care cuantific a cunostintele lor sunt:
{64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86, 62,
58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69, 77, 58, 62, 82,
85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65, 53, 60, 49, 68,
74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66, 68, 95, 94, 99,
81, 81, 92, 88, 99, 81, 81}.
Se presupune c a se cunoaste = 10.99. S a se construiasc a inter-
valele de ncredere pentru medie cu nivelele de ncredere de 90%, 95%
si 99%.
Rezolvare. Am calculat x =
1
83
83
P
i=1
x
i
= 75.0602.
Calcul am intervalele de ncredere cu nivelul de ncredere de 90%,
95% si 99%.
Pentru 90% avem = 0.1 si
(z) = 0.05 z = 1.6449 z
2
= 1.6449.
Atunci, conform (8.1), intervalul
I =

x z
n
, x +z
= [73.0760; 77.0445] .
este un interval de ncredere pentru m cu 90% nivel de ncredere.
Pentru 95% avem = 0.05 si (z) = 0.025 z
2
= 1.9599.
Intervalul de ncredere pentru m este
I =

x 1.9599

n
, x + 1.9599

= [72.6960; 77.4245] .
Pentru 99% avem = 0.01 si (z) = 0.005 z
2
= 2.5758,
intervalul de ncredere pentru m este
I =

x 2.5758

n
, x + 2.5758

= [71.9530; 78.1675] .
Observ am c a dac a, de exemplu, nivelul de ncredere este 0.95,
atunci z
2
= 1.9599 trebuie s a lase la dreapta sa o arie egal a cu
2
= 0.025, iar la stnga o arie egal a cu 1

2
= 1 0.025 = 0.975.
-4 -3 -1.96 -1 1 1.96 3 4
0.1
0.2
0.3
0.4
0.025 0.025
-4 -3 -1.96 -1 1 1.96 3 4
0.1
0.2
0.3
0.4
Figura 8.1.

Aceast a modalitate de determinare a intervalului de ncredere se
poate sintetiza n testul Z.
Algoritmul testului Z
Presupunem dat a o selectie de valori independente (de volum n)
dintr-o populatie de medie m necunoscut a si dispersie
2
( > 0)
cunoscut a.
Pasul 1. Se calculeaz a x.
Pasul 2. Se consider a statistica Z =
X m
n
.
Pasul 3. Pentru un nivel de ncredere prescris (1 ) 100% se
determin a z
2
> 0 astfel nct (z
2
) =

2
.
Pasul 4. Se determin a intervalul de ncredere pentru m
x z
n
, x +z
.
Compar am intervalele obtinute n exemplul de mai sus n functie
de nivelul de ncredere
(1 ) 100%

2
z
x z
n
, x +z
90% 0.05 1.6449 [73.0760; 77.0445]

95% 0.025 1.9599 [72.6960; 77.4245]
99% 0.005 2.5758 [71.9530; 78.1675]
Din tabel se observ a c a lungimea intervalului este invers proportio-
nal a cu nivelul de ncredere.
Calcul am intervalele de ncredere cu ajutorul softului Mathema-
tica. Vom calcula nti dup a formulele prezentate, apoi cu ajutorul
comenzilor specifice softului.
punc = {64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,
84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,
77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,
53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,
68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81};
n = Length[punc]
m = N[Mean[punc]]
83
75.0602
Calculul intervalului de ncredere pentru nivelul de incredere 90%,
95%, 99% urm arind algoritmul testului Z
= 0.1
z = Quantile[NormalDistribution[0, 1], 1-0.05]
1.64485
imin = m - z 10.99/Sqrt[n]
imax = m + z 10.99/Sqrt[n]
73.0760
77.0444
= 0.05
z1 = Quantile[NormalDistribution[0, 1], 1-0.025]
1.95996
imin = m - z1 10.99/Sqrt[n]
imax = m + z1 10.99/Sqrt[n]
72.6959
77.4245
= 0.01
2.57583
imin = m - z2 10.99/Sqrt[n]
imax = m + z2 10.99/Sqrt[n]
71.95299
78.16748
Calculul intervalului de ncredere pentru nivelul de incredere 90%,
95%, 99% folosind comenzi specifice softului Mathematica. Aceste
comenzi se g asesc n pachetul StatisticsDescriptiveStatistics. Pachetul
este nc arcat automat atunci cnd se scrie comanda
<<StatisticsDescriptiveStatistics.
Comenzile sunt:
NormalCI[mean, sd] furnizeaz a un interval de ncredere pentru
medie, centrat n mean si cu abaterea medie p atratic a sd, interval
calculat cu ajutorul distributiei normale.
MeanCI[data, KnownVariance -> var] furnizeaz a un interval de
ncredere pentru media esantionului numit data, interval calculat cu
ajutorul distributiei normale.
n ambele cazuri nivelul de ncredere este considerat implicit este de
95%. Dac a dorim un interval de ncredere cu un alt nivel de ncredere
folosim optiunea ConfidenceLevel ->1-.
<< StatisticsConfidenceIntervals
NormalCI[m, 10.99/Sqrt[n], ConfidenceLevel -> 0.90]
{73.076, 77.0444}
MeanCI[punc, KnownStandardDeviation -> 10.99,
ConfidenceLevel -> 0.90]
{73.076, 77.0444}
n aceast a secvent a observ am urm atorele: comanda NormalCI fur-
nizeaz a acelasi interval de ncredere ca si MeanCI[data, KnownVariance
-> var].
D am si secventele care genereaz a intervale de ncredere cu 95% si
99% nivel de ncredere.
NormalCI[m, 10.99 /Sqrt[n]]
{72.6959, 77.4246}
MeanCI[punc, KnownStandardDeviation -> 10.99]
{72.6959, 77.4246}
NormalCI[m, 10.99 /Sqrt[n], ConfidenceLevel -> 0.99]
{71.953, 78.1675}
MeanCI[punc, KnownStandardDeviation -> 10.99,
ConfidenceLevel -> 0.99]
{71.953, 78.1675}
Am putea spune c a 95% dintre studenti au punctajele cuprinse
n intervalul [72.6960; 77.4245]? Aceast a interpretare nu este corect a
deoarece valoarea exact a a mediei nu este cunoscut a si armatia m
[72.6960; 77.4245] poate fi corect a sau nu deoarece intervalul de n-
credere construit este aleator, el bazndu-se pe o selectie aleatoare.
Interpretarea corect a este: dac a facem un num ar mare de selectii
si de fiecare dat a calcul am intervalul de ncredere pentru medie cu
nivelul de ncredere de 95%, atunci n 95% din aceste intervale vor
contine valoarea corect a a mediei. Deci metoda folosit a ne permite
s a obtinem intervale pentru medie care vor contine n 95% din cazuri
valoatrea corect a.
Alegerea nivelului de ncredere este arbitrar a. Ne punem prob-
lema ce se ntmpl a dac a m arim nivelul de ncredere, de exemplu,
la 99%? Este rezonabil s a dorim s a m arim nivelul de ncredere. n
acest caz, pentru exemplul considerat, intervalul de ncredere va fi
[71.9530; 78.1675], deci va fi mai mare dect n cazul nivelului de 95%.
Dac a dimensiunea esantionului si abaterea medie p atratic a sunt p as-
trate constante, atunci un nivel mai nalt de ncredere atrage un in-
terval de ncredere mai mare.
Lungimea intervaluilui de ncredere este o m asur a a preciziei es-
tim arii. Din cele prezentate rezult a c a precizia este invers proportio-
nal a cu nivelul de ncredere. Este preferabil s a obtinem un interval
de ncredere ct mai scurt pentru o problema pus a, dar cu un nivel de
ncredere adecvat. Un mod de a atinge acest scop este alegerea dimen-
siunii esantionului astfel nct cu ajutorul acestei selectii s a putem
obtine un interval de ncredere de lungime specicat a si cu nivelul de
ncredere dat.
8.1.2 Alegerea dimensiunii esantionului
Observ amc a lungimea intervaluilui de ncredere este 2z
n
. Aceas-
ta nseamn a c a folosind x ca estimare pentru m, eroarea E = |x m|
z
n
cu un nivel de ncredere de (1 ) 100%. Se poate alege n
acest caz n astfel nct cu un nivel de ncredere de (1 ) 100%,
eroarea pe care o facem estimnd m cu x s a fie mai mic a dect E.
Dac a consider am E = z
n
atunci
n =

2
E
+ 1. (8.2)
Binenteles se poate lua n
h
z
2
/2
2
E
2
i
+1, dar formula (8.2) d a va-
loarea minim a pentru num arul n de date ale esantionului, care asigur a
o eroare prescris a de estimare (sau, echivalent, un nivel prescris de
ncredere).
Pentru Exemplul 8.1 dorim s a determin am volumul esantionului
astfel nct cu un nivel de ncredere de 95% eroarea pe care o facem
estimnd m cu x = 74 s a fie mai mic a dect E = 0.5. Aplicnd formula
obtinem n = 1856.
1.95996
= 10.99;
ER = 0.5;
IntegerPart[( z1/ER)^2] + 1
1856
Dac a micsor am eroarea, volumul esantionului creste.
ER = 0.1;
IntegerPart[(( z1)/ER)^2] + 1
46398
Relatii ntre volumul esantionului, lungimea dorit a a intervalului
de ncredere 2E, nivelul de ncredere de (1 ) 100% si abaterea
medie :
dac a 2E descreste, volumul esantionului creste pentru nivelul de
ncredere si fixati (se observ a din secventa de comenzi de mai sus),
dac a creste, n creste pentru 2E, nivelul de ncredere de (1 )
100% fixati,
1.95996
ER = 0.5;
= 10;
1537
= 10.99
1856
dac a nivelul de ncredere creste, n creste pentru 2E si fixati.
Nivelul de ncredere 0.9
1.64485
1308
Nivelul de ncredere 0.95
1.95996
1856
Nivelul de incredere 0.99
2.57583
3206
Intervalele de ncredere studiate pn a acum sunt bilaterale n sen-
sul c a d adeau ca rezultat un interval nchis. Dac a exist a o informatie
relativ a la valoarea medie de forma c a aceasta nu este limitat a supe-
rior, atunci intervalul de ncredere devine de forma

x z
n
,
si este un interval de ncredere unilateral.

n acest caz
P (Z > z) = 1 P

m
x z

n
,
= 1
1 (z) = 1 (z) =
Not am cu z
valoarea obtinut a din relatia (z) = .

O situatie similar a are loc dac a valoarea medie nu este limitat a
inferior, intervalul de ncredere fiind

, x +z
, iar valoarea
z
se obtine din relatia (z) = 1 .

8.2 Intervale de ncredere pentru medie
n cazul necunoscut
Presupunem c a populatia studiat a are o distributie normal a cu
media m si dispersia
2
necunoscute. Facem o selectie de dimensiune
n. Fie x
1
, x
2
, . . . , x
n
valorile variabilelor de selectie X
1
, X
2
, . . . , X
n
.
Putem calcula media de selectie x =
1
n
n
P
i=1
x
i
si dispersia de selectie
modificat a s
2
=
1
n1
n
P
i=1
(x
i
x)
2
.
Vrem s a calcul am un interval de ncredere pentru m. Dac a disper-
sia este cunoscut a, stim c a Z =
X m
n
urmeaz a o distributie normal a.
Dac a este necunoscut o procedur a normal a este de a nlocui cu
s. Statistica devine acum T =
X m
s
n
. O ntrebare logic a care se
pune este urm atoarea: care este efectul nlocuirii lui cu s asupra
distributiei statisticii T? Dac a n este sucient de mare, r aspunsul la
aceast a ntrebare este: efectul este "destul de mic" si putem consi-
dera c a urmeaz a o distributie normal a standard. n general n trebuie
s a fie cel putin 40. Teorema limit a central a are loc pentru n 30,
dar m arirea esantionului recomandat a este la cel putin 40, deoarece
nlocuirea lui cu s n Z conduce la modic ari suplimentare ale dis-
tributiei.
n acest caz intervalul de ncredere se construieste astfel:
Pasul 1. Se calculeaz a x =
1
n
n
P
i=1
x
i
si s
2
=
1
n1
n
P
i=1
(x
i
x).
Pasul 2. Se consider a statistica Z =
x m
s
n
.
Pasul 3. Pentru un nivel de ncredere prescris (1 ) 100% se
determin a z
2
> 0 astfel nct (z
2
) =

2
.
Pasul 4. Se determin a intervalul de ncredere pentru m,
x z
2
s
n
, x +z
2
s
.
Dac a n este mic, cum se ntmpl a n multe probleme din inginerie,
trebuie folosit a distributia Student pentru construirea intervalului de
ncredere.
Testul Student
Presupunem c a populatia studiat a are o distributie normal a cu
media m si abaterea medie p atratic a necunoscute. Facem o selectie
de dimensiune n, n mic. Vrem s a calcul am un interval de ncredere
pentru m.
Teorema 8.1. Fie X
1
, X
2
, . . . , X
n
independente, care urmeaz a o dis-
tribu tie normal a cu media m si dispersia
2
. Fie x
1
, x
2
, . . . , x
n
, x =
1
n
n
P
i=1
x
i
si fie s =
r
1
n1
n
P
i=1
(x
i
x)
2
, unde x reprezint a media de se-
lec tie, s reprezint a abaterea medie de selec tie. Statistica T =
X m
s
n
urmeaz a o distribu tie Student cu n 1 grade de libertate.
n tabelul din Anexa 2 pentru functia de repartitie a distributiei
Student pe prima linie sunt date valorile lui iar pe coloan a sunt
trecute gradele de libertate. Astfel calcul am
F(t
,n
) = P (T t
,n
) =
Z
t
,n
f(x)dx = 1 ,
unde f (x) este densitatea de probabilitate a distributiei Student.
Pentru valorile negative se foloseste faptul c a
F(t
,n
) = 1 F(t
,n
). (8.3)
Deoarece distributia Student este simetric a, avem t
1,n
= t
,n
,
ceea ce nseamn a c a n partea dreapt a a lui t
,n
, dar si n partea stng a
a lui t
1,n
, aria este (figura 8.2).
La fel obtinem aceste informatii folosind softul Mathematica.
Exemplul 8.2. Stiind c a T t (10), s a se calculeze
F(1.812) = P (T 1.812) ,
F(1.812) = P (T 1.812) ,
F(t
0.05,10
) = P (T t
0.05,10
) = 0.95,
F(t
0.05,10
) = P (T t
0.05,10
) = 0.05.
-3 t1,n -1 1 t,n 3
0.1
0.2
0.3
0.4

-3 t1,n -1 1 t,n 3
0.1
0.2
0.3
0.4
Figura 8.2.
CDF[StudentTDistribution[10], 1.812]
0.949962
CDF[StudentTDistribution[10], -1.812]
0.0500376
Deci F(1.812) = 0.949962. Observ amc a F(1.812) = 1F(1.812).
Functia invers a functiei de repartitie, determinarea lui t cnd se
cunoaste probabilitatea, se face cu ajutorul comenzii Quantile.
Quantile[StudentTDistribution[10], 0.95]
1.81246
Quantile[StudentTDistribution[10], 0.05]
1.81246.
In tabelul din Anexa 2 urm arim pe linia corespunz atoare celor
10 grade de libertate si c aut am valoarea 1.812. Urcnd pe coloan a
g asim = 0.05. Pentru valoarea negativ a tinem seama de simetria
densit atii de probabilitate folosim relatia (8.3). Pentru ultimele dou a
valori c aut am valoarea la intersectia liniei corespunz atoare celor 10
grade de libertate cu coloana corespunz atoare lui si obtinem valoarea
pozitiv a.
Pentru orice (0, 1) se poate determina pragul t
2
,n1
> 0 astfel
nct P(|T
n1
| t
2
,n1
) = 1 . Se alege t
2
,n1
astfel nct ariile
colorate din figura 8.3. s a fie fiecare

2
.
nlocuind T
n1
=
X m
n
s
, rezult a
-3 t2,n1 -1 1 t2,n1 3
0.1
0.2
0.3
0.4
2 2
-3 t2,n1 -1 1 t2,n1 3
0.1
0.2
0.3
0.4
Figura 8.3.
P(t
2
,n1

X m
n
s
t
2
,n1
) = 1
P

m
x
s
n
t
2
,n1
, x +
s
n
t
2
,n1
= 1 .
Rezult a c a intervalul
x
s
n
t
2
,n1
, x +
s
n
t
2
,n1
este un interval de ncredere pentru media m cu coecientul de n-

credere 100(1 )%.
Algoritmul testului Student (mai este cunoscut sub denumirea
de testul T)
Fie x
1
, x
2
, . . . , x
n
o selectie de variabile de selectie X
1
, X
2
, . . . , X
n
i.i.d. dintr-o populatie normal a cu media m si dispersia
2
necunos-
cute.
1
n
n
P
k=1
x
k
si s =

1
n1
n
P
k=1
(x
k
x)
2
1
2
.
Pasul 2. Se consider a statistica T =
X m
s
n
.
Pasul 3. Pentru un coeficient de ncredere prescris (1 ) 100%
se determin a din tabelul functiei de repartitie Student sau cu ajutorul
softurilor num arul t
2
,n1
> 0 astfel nct P(|T| t
2
,n1
) = 1 .
Pasul 4. Se determin a intervalul de ncredere pentru m,
x
s
n
t
2
,n1
, x +
s
n
t
2
,n1
.
n acest caz calculul intervalului de ncredere se poate face cu aju-
torul Mathematicii folosind comenzile:
MeanCI[data] furnizeaz a un interval de ncredere pentru media
esantionului numit data, bazat pe distributia Student.
StudentTCI[mean, se, dof] furnizeaz a un interval de ncredere pen-
tru medie, centrat n mean, un estimator nedeplasat al abaterii medii
p atratice notat se si cu num arul gradelor de libertate dof, calculat
cu ajutorul distributiei Student. Estimatorul nedeplasat se se de-
termin a cu ajutorul comenzii StandardErrorOfSampleMean[data], unde
data reprezint a esantionul de date obtinut. Dac a se cunoaste abaterea
medie p atratic a aceasta se poate preciza prin optiunea
KnownStandardDeviation->valoarea cunoscut a.
Exemplul 8.3. Consider amun esantion de 36 studenti care au obtinut
punctajele:
64, 62, 76, 82, 66, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86, 62, 58, 80, 79,
84, 83, 62, 78, 84, 94, 88, 77, 58, 65, 53, 60, 49, 68, 74, 78, 98.
S a se stabileasc a intervale de 90%, 95% si 99% ncredere pentru
media punctajelor obtinute.
Rezolvare. Folosim testul Z.
Rezult a x = 73.7778, ' s = 11.6082.
Statistica T este distribuit a Student cu 35 grade de libertate (a se
consulta anexa 2 cu tabelul valorilor functiei de repartitie Student n
functie de gradele de libertate).
Pentru 90% ncredere (deci eroare sub 10%) avem t
0.05
= 1.68957.
Intervalul cerut are capetele 73.7778 1.68957
11.6082
36
, adic a
[70.509; 77.0466].
0.025
= 2.03011.
11.6082
36
, adic a
[69.8501; 77.7054]
0.005
= 2.72381.
11.6082
36
, adic a
[68.5081; 79.0475]
Calcul am intervalele de ncredere folosind algoritmul testului Stu-
dent si apoi folosind comenzi specice Mathematicii.
punc1 = {64, 62, 76, 82, 66, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86,
62, 58, 80, 79, 84, 83, 62, 78, 84, 94, 88, 77, 58, 65, 53, 60, 49, 68, 74,
78, 98};
n = Length[punc1]
m = N[Mean[punc1]]
36
73.7778
s = N[StandardDeviation[punc1]]
11.6082
Nivelel de ncredere 90%, = 0.1
z = Quantile[StudentTDistribution[n - 1], 1-0.05]
1.68957
imin = m - z s/Sqrt[n]
imax = m + z s/Sqrt[n]
70.509
77.0466
z1 = Quantile[StudentTDistribution[n - 1], 1-0.025]
2.03011
imin = m - z1 s/Sqrt[n]
imax = m + z1 s/Sqrt[n]
69.8501
77.7054
z2 = Quantile[StudentTDistribution[n - 1], 1-0.005]
2.72381
imin = m - z2 s/Sqrt[n]
imax = m + z2 s/Sqrt[n]
68.5081
79.0475
Calculul intervalelor de ncredere cu comenzi din Mathematica.
MeanCI[punc1]
{69.8501, 77.7054}
se = N[StandardErrorOfSampleMean[punc1]]
1.93469
StudentTCI[m, se, n - 1]
{69.8501, 77.7054}
Si n acest caz putem construi intervale de ncredere de forma
x t
,n1
s
n
,
sau
, x +t
,n1
s
pentru intervale de n-
credere unilaterale.
8.3 Intervale de ncredere pentru disper-
sie
Uneori este necesar calculul intervalului de ncredere pentru dis-
persia unei caracteristici studiate. Dac a populatia este modelat a de o
distributie normal a putem aplica intervalele descrise n continuare.
Teorema 8.2. Fie variabilele de selec tie X
1
, X
2
, . . . , X
n
i.i.d. (inde-
pendente si identic distribuite) cu X N(m, ), media m si dispersia
2
necunoscute. Statistica
2
n1
=
(n 1)s
2
2
urmeaz a o distribu tie hi-p atrat cu n 1 grade de libertate.
Definim x
,n
ca ind punctul pentru care este satisf acut a inegali-
tatea
P

2
x
,n
=
x,n
Z
f(t)dt = 1 , (8.4)
unde f (t) este densitatea de probabilitate a distributiei
2
(n).
Probabilitatea c autat a este aria situat a la stnga lui x
,n
din figura
8.4.
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
1
x,n 5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
Figura 8.4.
Pentru a ilustra modul de utilizare a tabelului de valori ale functiei
de repartitie hi-p atrat observ am c a pe prima coloan a sunt trecute
gradele de libertate iar pe linie sunt trecute valorile lui . De exemplu,
pentru n = 10 si = 0.05 obtinem x
0.05,10
= 18.31, iar x
10.05,10
=
3.94.
Cu Mathematica aceste informatii se obtin astfel, tinndu-se seama
de relatia (8.4):
Quantile[ChiSquareDistribution[10], 0.05]
3.9403
Quantile[ChiSquareDistribution[10], 1 - 0.05]
18.307.
Deci P (
2
x
0.05,10
) = 10.05, P (
2
x
0.95,10
) = 0.05, x
0.05,10
=
18.31, iar x
10.05,10
= 3.94.
Pentru constructia intervalului de ncredere pentru dispersie se
foloseste statistica
2
n1
=
(n 1)s
2
2

2
(n 1) . Pentru (0, 1)
dat determin am x
1
() si x
2
() astfel nct
P

x
1
()
2
n1
x
2
()
= 1 . (8.5)
Numerele x
1
() si x
2
() nu sunt unic determinate si de obicei se
aleg astfel nct x
1
() = x
1/2,n1
si P

2
n1
x
1/2,n1
=

2
, iar
x
2
() = x
/2,n1
si P

2
n1
x
/2,n1
=

2
.
Semnificatia valorilor x
1/2,n1
si x
/2,n1
poate fi vazut a n figu-
ra 8.5.
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
2
x12,n1
2
x2,n1
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
Figura 8.5.
nlocuind
2
n1
=
(n 1)s
2
2
n (8.5) si obtinem:
P

x
1/2,n1

(n 1)s
2
2
x
/2,n1
= 1 . (8.6)
Relatia (8.6) poate fi rearanjat a astfel:
P

(n 1)s
2
x
/2,n1

2
(n 1)s
2
x
1/2,n1
= 1 . (8.7)
Am obtinut astfel un interval de ncredere pentru dispersie.
Algoritmul de determinare a intervalului de ncredere pen-
tru dispersie
Fie x
1
, x
2
, . . . , x
n
o selectie de valori pentru variabilele de selectie
X
1
, X
2
, . . . , X
n
i.i.d. dintr-o populatie normal a cu media msi dispersia
2
necunoscute.
1
n
n
P
k=1
x
k
si s =

1
n 1
n
P
k=1
(x
k
x)
2
1
2
.
Pasul 2. Se alege statistica
2
n1
=
(n 1)s
2
2
despre care se stie c a
urmeaz a o distributie
2
cu n 1 grade de libertate.
Pasul 3. Pentru un nivel de ncredere prescris (1 ) 100% se de-
termin a, din tabelul valorilor functiei de repartitie
2
cu n1 grade de
libertate sau cu ajutorul softurilor Matlab sau Mathematica, numerele
x
1/2,n1
si x
/2,n1
astfel nct
P

2
n1
x
1/2,n1
=

2
si P

2
n1
x
/2,n1
= 1

2
.
Pasul 4. Se determin a intervalul

(n 1)s
2
x
/2,n1
,
(n 1)s
2
x
1/2,n1
si rezult a
intervalul de ncredere pentru
2
.
Observatia 8.1. Este posibil s a determin am intervale nem arginite
inferior sau superior pentru dispersie cu un anumit nivel de ncredere
(1) 100%. Acestea sunt
,
(n1)s
2
x
1,n1
, respectiv
(n1)s
2
x
,n1
,
.
Exemplul 8.4. Relu am Exemplul 8.1. Dorim s a construim intervale
de ncredere pentru dispersie.
Rezolvare. Avem n = 83. Calcul am s = 11.3517. Consider am sta-
tistica
2
82
=
(n 1)s
2
2
=
82s
2
2
.
Pentru nivelul de ncredere de 90% avem x
0.95,83
= 62.1323 si
x
0.05,83
= 104.139. Intervalul de ncredere pentru dispersie este
[101.468, 170.068].
0.975,83
= 58.8446 si
x
0.025,83
[96.998, 179.57].
0.995,83
= 52.7674 si
x
0.005,83
[89.0006, 200.251].
Intervalele de ncredere pentru dispersie pot fi calculate cu co-
manda din Mathematica VarianceCI[data], din pachetul StatisticsCon-
fidenceIntervals. Calculul intervalului de ncredere se face pe baza
algoritmului prezentat mai sus. Implicit nivelul de ncredere este con-
siderat 95%. n alte situatii el trebuie precizat cu optiunea Con-
denceLevel ->1-.
punc = {64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,
84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,
77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,
53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,
68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81};
n = Length[punc]
83
s = N[StandardDeviation[punc]]
11.1271
Nivelel de ncredere 95%
x1 = Quantile[ChiSquareDistribution[n - 1], 0.05/2]
58.8446
x2 = Quantile[ChiSquareDistribution[n - 1], 1 - 0.05/2]
108.937
imin = (n - 1)s^2/x2
imax = (n - 1)s^2/x1
93.1976
172.534
VarianceCI[punc]
{93.1976, 172.534}
62.1323
104.139
imin = (n - 1)s^2/x2
imax = (n - 1)s^2/x1
97.492
163.405
VarianceCI[punc, ConfidenceLevel -> .9]
{97.492, 163.405}
52.7674
118.726
imin = (n - 1)s^2/x2
85.5136
imax = (n - 1)s^2/x1
192.405
VarianceCI[punc, ConfidenceLevel -> .99]
{85.5136, 192.405}
Exemplul 8.5. Media erorilor de m asurare a lungimilor unor baghete
metalice este de 3 mm. Presupunem c a aceste erori respect a legea
normal a cu media 3 mm si dispersia necunoscut a. Se face o selectie
de volum 6: {-1, 4, 4, 1,3,1}. Se cere un interval de estimatie pentru
dispersie cu nivel de ncredere de 90%.
Rezolvare. Avem n = 6, m = 3. Calcul am
s
2
=
1
3
(1 3)
2
+ (4 3)
2
+ (4 3)
2
+ (1 3)
2
+
+(3 3)
2
+ (1 3)
2
=
26
3
= 8.666 7
Consider am statistica
2
5
=
(n 1)s
2
2
=
5s
2
2
.
0.95,5
= 1.14548 si
x
0.05,5
= 11.0705.
Intervalul de ncredere pentru dispersie este [2.34858; 22.698].
mas = {-1, 4, 4, 1, 3, 1};
n = Length[mas]
6
sp = 1/3 ((-1 - 3)^2 + (4 - 3)^2 + (4 - 3)^2 + (1 - 3)^2)
26
3
Nivelel de incredere 90%
1.14548
11.0705
imin = (n - 1)sp/x2
2.34858
imax = (n - 1)sp/x1
22.698
ChiSquareCI[sp, n - 1, ConfidenceLevel -> .9]
{2.34858, 22.698}
Se observ a c a intervalul este destul de mare, deci precizia pentru
dispersie este mic a, chiar dac a apare cu probabilitate mare.
8.4 Intervale de ncredere pentru propor-
tii
Pentru o populatie a c arei membrii pot fi clasicati n functie de
o anumit a caracteristic a n dou a categorii: fie p probabilitatea de
a apartine unei categorii, numit succes si 1 p probabilitatea de a
apartine celeilalte categorii, numit a esec. Parametrul p poat a denu-
mirea de proportia populatiei si ipotezele asupra lui p se fac num arnd
succesele, X =
n
P
i=1
X
i
( n), unde
X
i
:

0 1
1 p p
.
Atunci

P =
X
n
un estimator punctual al lui p. Reamintim c a n
si p sunt parametrii unei distributii binomiale. Mai mult, statistica P
urmeaz a o distributie normal a cu media p si dispersia
p(1 p)
n
dac a
p nu este aproape de 0 sau 1 si dac a n este relativ mare.
Aceasta nseamn a c a pentru a folosi aceast a aproximare este nece-
sar ca np 5, n(1 p) 5.
Teorema 8.3. Dac a n este astfel nc at np 5, n(1 p) 5, atunci
Z =
X np
p
np(1 p)
=

P p
q
p(1p)
n
urmeaz a aproximativ o distribu tie normal a standard.
Pentru a construi un interval de ncredere pentru p, observ am c a
P

z
2
Z z
= 1
sau
P
2

P p
q
p(1p)
n
z
= 1 ,
unde z
2
> 0 astfel nct (z
2
) =

2
.
Aceast a relatie poate fi rearanjat a astfel:
P
P z
2
r
p(1 p)
n
p

P +z
2
r
p(1 p)
n
= 1 .
Cantitatea
r
p(1 p)
n
se numeste eroarea standard a estimatoru-
lui punctual

P. Deoarece marginile intervalului contin p care este
necunoscut, o solutie satisf ac atoare este nlocuirea sa cu

P. Astfel
obtinem
P

P z
2
q

P(1
P)
n
p

P +z
2
q

P(1
P)
n
' 1 .
Aceasta conduce la determinarea unui interval de ncredere cu
nivelul de ncredere de (1 )100% si acesta este
P z
2
q

P(1
P)
n
,

P +z
2
q

P(1
P)
n
.
Exemplul 8.6. Se presupune ca la 85 de autoturisme de o anumit a
marc a se studiaz a arborele cotit dup a un anumit timp de functionare.
Se constat a c a la 10 automobile acesta prezenta defecte ce impunea
nlocuirea lui. S a se determine un estimator punctual al num arului
ce reprezint a ce proportie dintre automobilele de acest tip prezint a
aceast a deficient a. S a se interpreteze acest rezultat si s a se estimeze ce
proportie dintre automobilele de acest tip prezint a aceast a deficient a.
Rezolvare. Pentru fiecare autoturism studiat, se obtine rezultatul c a
arborele cotit este defect sau nu. Putem aplica modelul Bernoulli si
estimatorul de verosimilitate maxim a va fi:
P =
10
85
= 0.117 655.
Eroarea standard a estimatorului punctual este
q

P(1
P)
n
=
r
10
85
(1
10
85
)
85
= 0.034946.
Nu este foarte clar cum interpret am aceast a valoare de 0.034 946.
Este aceast a estimare foarte exact a, exact a sau nu?
Construim un interval de ncredere cu un nivel de ncredere de 95%
bazat pe valoarea observat a 0.117 655.
P z
2
q

P(1
P)
n
p

P +z
2
q

P(1
P)
n
,
0.117 6 1.96
q
0.117 60.88
85
p 0.117 6 + 1.96
q
0.117 60.88
85
,
0.04915 p 0.186141.
Concluzia: n 95% din cazuri probabilitatea ca automobilul s a pre-
zinte defectul studiat este cuprins a n intervalul [0.0491534, 0.186141].
pe = N[10/85]
n = 85;
0.117647
n pe 5 && n(1 - pe) 5
True
Nivelul de ncredere 90%
1.64485
linf = pe - z1 Sqrt[p(1 - p)/n]
lsup = pe + z1 Sqrt[p(1 - p)/n]
0.0601654
0.175129
n 90% din cazuri probabilitatea ca automobilul sa prezinte defec-
tul studiat este cuprinsa n intervalul [0.0601654, 0.175129].
Nivelul de ncredere 95%
1.95996
linf = pe - z2 Sqrt[p(1 - p)/n]
lsup = pe + z2 Sqrt[p(1 - p)/n]
0.0491534
0.186141
n 95% din cazuri probabilitatea ca automobilul sa prezinte defec-
tul studiat este cuprinsa n intervalul [0.0491534, 0.186141].
8.4.1 Alegerea dimensiunii esantionului
Deoarece

P este un estimator punctual al lui p, putem defini
eroarea de estimare a lui p prin

P de forma E = |p

P|. Observ am
c a suntem aproximativ (1 )100% siguri c a aceast a eroare este mai
mic a dect z
2
q

P(1
P)
n
. n exemplul anterior suntem 95% siguri c a
P =
10
85
= 0.117 655 difer a de valoarea exact a a lui p cu mai putin de
1.95996
s
10
85
(1
10
85
)
85
= 0.069 084.
n situatiile n care dimensiunea esantionului poate fi aleas a, putem
lua n astfel nct s a fim aproximativ (1 )100% siguri c a eroarea
este mai mic a dect o valoare specificat a E. Dac a consider am E =
z
2
q

P(1
P)
n
si rezolv am ecuatia n raport cu n obtinem ca dimensiune
a esantionului
n =

2
E
P(1

P)
+ 1. (8.8)
O estimare a lui p este necesar a. Pentru aceasta se poate lua un
esantion preliminar, se calculeaz a

P si apoi folosind relatia (8.8) putem
determina cte observatii mai trebuie f acute pentru a obtine pentru p
o estimare satisf ac atoare.
O alt a solutie este de a tine seama c a p(1 p)
1
4
si atunci
n =

1
4
2
E
+ 1. (8.9)
Exemplul 8.7. Relu am Exemplul 8.6. Ct de mare trebuie luat esan-
tionul astfel nct s a fim 95% siguri c a eroarea pe care o facem cnd
folosim

P ca estimator a lui p s a fie mai mic a dect 0.05?
Rezolvare. Folosind

P =
10
85
g asim
n =

2
E
2
p(1 p)
+ 1 =
h
1.96
0.05
2
10
85
1
10
85
i
+ 1 = 160.
Dac a vrem s a fim cel putin 95% siguri c a eroarea pe care o facem
cnd folosim

P ca estimator a lui p s a fie mai mic a dect 0.05 putem
folosi formula (8.9)
n =

1
4
2
E
+ 1 =
h
1
4
1.96
0.05
2
i
+ 1 = 385.
Observ am c a dac a avem o informatie privind valoarea lui p, chiar
dintr-un esantion preliminar, obtinem o dimensiune mai mic a a esan-
tionului mentinnd precizia estim arii si nivelul de ncredere.
Este posibil s a determin am intervale deschise nem arginite infe-
rior sau superior pentru proportia p cu un anumit nivel de ncredere
(1) 100%. Acestea sunt
,

P +z
q

P(1
P)
n
P z
q

P(1
P)
n
,
.
8.5 Predictia
n unele situatii suntem interesati n a prevedea urm atoarele valori
ale variabilei de selectie. Vom vedea cum se determin a un interval de
predictie cu (1)100% nivel de ncredere pentru urm atoarea valoare
a unei variabile de selectie care urmeaz a o distributie normal a.
Fie x
1
, x
2
, . . . , x
n
o selectie de valori pentru variabile de selectie
X
1
, X
2
, . . . , X
n
i.i.d. dintr-o populatie normal a cu media msi dispersia
2
. Dorim s a prevedem valoarea variabilei de selectie X
n+1
la o singur a
observatie viitoare.
Un punct de predictie este x. Eroarea de predictie este X
n+1
x.
Media erorii de predictie este M [X
n+1
x] = m m = 0, iar dis-
persia este D[X
n+1
x] =
2
+

2
n
=
2
1 +
1
n
, deoarece X
n+1
este
independent a de media x.
Predictia X
n+1
x este normal distribuit a si atunci Z =
X
n+1
X
q
1 +
1
n
are o distributie normal a standard.
Dac a nlocuim prin s obtinem T =
X
n+1
x
s
q
1 +
1
n
care are o dis-
tributie Student cu n1 grade de libertate. Obtinem astfel intervalele
de predictie cu (1 )100% nivel de ncredere
P
2
,n1

X
n+1
x
q
1 +
1
n
t
2
,n1
!
= 1
"
x z
r
1 +
1
n
X
n+1
x +z
r
1 +
1
n
#
si respectiv
"
x t
2
,n1
s
r
1 +
1
n
X
n+1
x +t
2
,n1
s
r
1 +
1
n
#
.
Exemplul 8.8. Se studiaz a o caracteristic a pe n = 22 unit ati statis-
tice si se obtin valorile: 19.8, 15.4, 11.4, 19.5, 10.1, 18.5, 14.1, 8.8, 14.9,
7.9, 17.6, 13.6, 7.5, 12.7, 16.7, 11.9, 15.4, 11.9, 15.8, 11.4, 15.4, 11.4.
S a se determine intervalul de predictie pentru cea de a 23-a valoare
si intervalul de ncredere pentru media valorilor obtinute, nivelul de
ncredere ind de 95%, iar caracteristica urmeaz a o repartitie normal a.
Rezolvare. Calcul am si obtinem x = 13.71 si s = 3.55. Intervalul de
ncredere pentru medie este
h
x
s
n
t
2
,n1
, x +
s
n
t
2
,n1
i
=
=
h
13.7136
3.55358
22
2.07961, 13.7136 +
3.55358
22
2.07961
i
=
= [12.1381, 15.2892] .
Intervalul de predictie cu 95% ncredere este
x t
2
,n1
s
q
1 +
1
n
, x +t
2
,n1
s
q
1 +
1
n
=
=

13.713 2.079 3.553
q
1 +
1
22
, 13.713 + 2.079 3.553
q
1 +
1
22
=
= [6.48601; 20.9413] .
Rezult a c a 6.48601 X
23
20.9413.
Prezent am secventa de comenzi Mathematica care rezolv a prob-
lema.
dat = {19.8, 15.4, 11.4, 19.5, 10.1, 18.5, 14.1, 8.8, 14.9, 7.9, 17.6,
13.6, 7.5, 12.7, 16.7, 11.9, 15.4, 11.9, 15.8, 11.4, 15.4, 11.4};
n = Length[dat]
m = N[Mean[dat]]
22
13.7136
s = StandardDeviation[dat]
3.55358
z = Quantile[StudentTDistribution[n - 1], 1-0.025]
2.07961
pmin = m - z s/Sqrt[n]
pmax = m + z s/Sqrt[n]
6.48601
20.9413
MeanCI[dat]
{12.1381, 15.2892}
Remarc am c a intervalul de predictie este considerabil mai lung
dect cel de ncredere. Lungimea intervalului de ncredere, pentru
n , tinde la zero pe cnd lungimea intervalului de predictie tinde
la 2t
2
,n1
s.
8.6 Intervale de tolerant a pentru carac-
teristici ce urmeaz a o distributie nor-
mal a
Definitia 8.2. Intervalul de toleran t a este un interval statistic n care,
cu un nivel de ncredere dat, caracteristica studiat a a unei populatii
ia valori cu o probabilitate de acoperire specificat a.
Capetele intervalului de tolerant a se numesc limite de toleran t a.
n cazul intervalului de tolerant a se cunoaste distributia pe care o
urmeaz a caracteristica si, eventual, se cunosc parametrii distributiei
si se determin a intervalul cu o probabilitate de acoperire si cu un
anumit nivel de ncredere. Difer a de intervalul de ncredere deoarece
acesta din urm a furnizeaz a limite pentru un anumit parametru al po-
pulatiei, necunoscut, de ex. medie, dispersie numai cu un anumit nivel
de ncredere.
n inginerie se specic a, de obicei, limitele de tolerant a, de ac-
ceptibilitate ale caracteristicii unui produs si nu reect a ntotdeauna
valoarea obtinut a prin m asur atori.
Exemplul 8.9. Studiem o categorie de procesoare. Din istoricul
studiului procesoarelor de acest tip se stie c a frecventa procesoarelor
urmeaz a o distributie normal a cu media m = 600 megahertzi si aba-
terea medie p atratic a = 30 megahertzi. S a se determine un interval
de tolerant a pentru frecventa procesoarelor cu un nivel de ncredere
de 95% si cu o probabilitate de acoperire de 95%.
Dac a media si dispersia sunt cunoscute, intervalul de tolerant a
se defineste de forma

mz
2
, m+z
, n functie de nivelul de
ncredere 100 (1 ) %. Probabilitatea de acoperire este 1 .
n exemplul dat, pentru un nivel de ncredere de 95% avem inter-
valul [550.65; 649.35].
mz
2
= 600 1.96 30 = 541.2
m+z
2
= 600 + 1.96 30 = 658.8
Ele reprezint a valorile acceptate pentru frecventa procesoarelor.
Dac a msi nu sunt cunoscuti, putem folosi x si s pentru a calcula
intervalul de tolerant a,

x z
2
s, x +z
2
s
.
Este de asteptat ca n acest caz, datorit a introducerii lui x si s,
probabilitatea de acoperire s a fie mai mic a dect 1 cu un nivel
de ncredere de (1 ) 100% Solutia este de a nlocui pe z
2
cu o
valoare care s a asigure un nivel de ncredere de (1 ) 100%.
Un interval de tolerant a care s a aib a probabilitatea de acoperire
p pentru o caracteristic a care urmeaz a o distributie normal a, cu un
nivel de ncredere de (1 ) 100% este [x ks, x +ks], unde k este
un factor de tolerant a.
Un exemplu de calcul al factorului de tolerant a este dat de Howe,
W. G. (1969).
Formula factorului de tolerant a dat a de Howe este
k =
s
(n 1)(1 +
1
n
)z
2
(1+)/2
1p,n1
Algoritmul de calcul al factorului de tolerant a, n functie de pro-
portia p si de probabilitatea , este:
1. Se determin a z
(1+p)/2
astfel nct dac a Z urmeaz a o distributie
normal a, P

Z z
(1+p)/2
= (1 +p)/2;
2. Se determin a
,n1
astfel c a dac a urmeaz a o distributie hi-
p atrat cu n 1 grade de libertate, P

,n1
= ;
3. Se nlocuiesc n formula lui k.
Relu am exemplul cu procesoarele. Dorim s a determin am un in-
terval de tolerant a a frecventei procesorelor astfel ca probabilitatea de
acoperire s a fie de 90% cu un nivel de ncredere de 99%. Au fost anali-
zate 43 de procesoare si s-a obtinut c a media frecventei este m = 584
megahertzi si devierea standard s = 32 megahertzi.
n = 43;
p = 0.9;
alpha= 0.01;
p1 = (1 + p)/2
0.95
z = Quantile[NormalDistribution[0, 1], p1]
1.64485
x = Quantile[ChiSquareDistribution[42], alpha]
23.6501
k = Sqrt[(n - 1)(1 + 1/n)z^2/x]
2.21732
Intervalul de tolerant a este [513.05, 654.95]. 90% din procesoare
vor avea frecventa cuprins a n acest interval cu un nivel de ncredere
de 99%.
8.7 Intervale de ncredere pentru carac-
teristicile a dou a populatii care ur-
meaz a o distributie normal a
Pn a acumau fost prezentate moduri de constructie ale intervalelor
de ncredere pentru un parametru corespunz ator unei singure popu-
latii. Vom extinde n continuare aceste rezultate n cazul a dou a po-
pulatii independente care urmeaz a distributii normale.
Presupunem c a avem o populatie care urmeaz a o distributie nor-
mal a cu media m
1
si dispersia
2
1
, iar cea de a doua populatie urmeaz a
o distributie normal a cu media m
2
si dispersia
2
2
. Intervalele vor
fi construite pe baza a dou a esantioane de volum n
1
respectiv n
2
.
Fie x
11
, x
12
, . . . , x
1n
1
o selectie de valori pentru variabile de selectie
X
11
, X
12
, . . . , X
1n
1
i.i.d. din prima populatie distribuit a normal si x
21
,
x
22
, . . . , x
2n
2
o selectie de valori pentru variabile de selectie X
21
, X
22
,
. . . , X
2n
2
i.i.r. din a doua populatie distribuit a normal.
8.7.1 Intervale de ncredere pentru diferenta me-
diilor a dou a populatii ale c aror dispersii
sunt cunoscute
Construim intervale de ncredere, cu nivelul de ncredere (1 )
100%, pentru diferenta mediilor a dou a populatii care urmeaz a o dis-
tributie normal a si ale c aror dispersii sunt cunoscute.
Facem urm atoarele ipoteze:
1. Se consider a dou a populatii independente care urmeaz a o dis-
tributie normal a cu dispersiile cunoscute;
2. Se consider a x
11
, x
12
, . . . , x
1n
1
o selectie de n
1
valori pentru
variabile de selectie X
11
, X
12
, . . . , X
1n
1
i.i.d. din prima populatie;
3. Se consider a x
21
, x
22
, . . . , x
2n
2
o selectie de n
2
valori pentru
21
, X
22
, . . . , X
2n
2
i.i.d. din a doua populatie.
Un estimator logic pentru diferenta mediilor, m
1
m
2
este diferenta
dintre mediile statistice ale celor dou a esantioane, X
1
X
2
, unde
X
1
=
1
n
1
n
1
P
i=1
X
1i
si X
2
=
1
n
2
n
2
P
i=1
X
2i
. Folosind propriet atile mediei si
dispersiei obtinem c a
M

X
1
X
2
= M

X
1
M

X
2
= m
1
m
2
,
D
X
1
X
2
= D
X
1
+D
X
2
=

2
1
n
1
+

2
2
n
2
.
Tinnd seama de presupunerile f acute si de rezultatele anterioare
putem afirma
Propozitia 8.1. Statistica
Z =
X
1
X
2
(m
1
m
2
)
r
2
1
n
1
+

2
2
n
2
(8.10)
urmeaz a o distribu tie normal a standard.
Observatia 8.2. Dac a sunt ndeplinite conditiile Teoremei limit a cen-
tral a pentru cele dou a populatii, atunci rezultatul Propozitiei 8.1 se
p astreaz a.
Tinnd seama de rezultatul Propozitiei 8.1 putem scrie
P

z
/2
Z z
/2
= 1
P
z
/2
X
1
X
2
(m
1
m
2
)
s

2
1
n
1
+
2
2
n
2
z
/2
= 1
P

X
1
X
2
z
/2
r
2
1
n
1
+
2
2
n
2
m
1
m
2
X
1
X
2
+z
/2
r
2
1
n
1
+
2
2
n
2
= 1 .
Dac a x
1
=
1
n
1
n
1
P
i=1
x
1i
si x
2
=
1
n
2
n
2
P
i=1
x
2i
atunci un interval de n-
credere pentru m
1
m
2
, cu un nivel de ncredere (1 ) %, este
_
_
x
1
x
2
z
/2
s
2
1
n
1
+

2
2
n
2
, x
1
x
2
+z
/2
s
2
1
n
1
+

2
2
n
2
_
_
. (8.11)
Exercitiul 8.1. Fie variabilele de selectie X
11
, X
12
, . . . , X
1n
1
i.i.d.
care urmeaz a o legea normal a N(m
1
,
1
) si reprezint a ncas arile n mii
lei ale unui lant de magazine din orasul A si variabile de selectie X
21
,
X
22
, . . . , X
2n
2
i.i.r. care urmeaz a o legea normal a N(m
2
,
2
) si re-
prezint a ncas arile n mii lei ale unui alt lant de magazine din orasul
B. Presupunem c a cele dou a selectii sunt independente. S-au efectuat
dou a sondaje, respectiv pentru X
1
si X
2
si s-au obtinut urm atoarele
date: pentru X
1
: 226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5 si
pentru X
2
: 221.5, 230.2, 223.4, 224.3, 230.8, 223.8. Cu un nivel de
ncredere de respectiv 0.90%, 0.95%, 0.99% vrems a construimintervale
de ncredere pentru diferenta mediilor, m
1
m
2
dac a
1
= 2.5,
2
= 3,
cunoscute.
Rezolvare. Rezolv am problema cu Mathematica folosind expresia
(8.11) pentru intervalul de ncredere.
data1 = {226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5};
data2 = {221.5, 230.2, 223.4, 224.3, 230.8, 223.8};
n1 = Length[data1]
n2 = Length[data2]
7
6
s1 = 2.5;
s2 = 3;
x1 = Mean[data1]
224.314
x2 = Mean[data2]
225.667
alpha = 0.1;
z = Quantile[NormalDistribution[0, 1], 1-alpha/2]
1.64485
x1 - x2 - z Sqrt[s1^2/n1 + s2^2/n2]
-3.89678
x1 - x2 + z Sqrt[s1^2/n1 + s2^2/n2]
1.19202
Intervalul de ncredere pentru diferenta mediilor ncas arilor cu un
nivel de ncredere de 90% este [3.89678, 1.19202].
Acelasi rezultat se poate obsine folosind comenzi specice softului
Mathematica. n pachetul StatisticsConfidenceIntervals comanda Me-
anDierenceCI[data1, data2], KnownVariance ->{var1, var2}] furnizeaz a
un interval de ncredere bazat pe distributia normal a si prezentat prin
relatia 8.11. Dac a nu punem optiunea CondenceLevel ->1 , im-
plicit nivelul de ncredere este considerat 95%.
MeanDierenceCI[data1, data2, KnownVariance -> {6.25, 9}, Con-
denceLevel -> 0.9]
{-3.89678, 1.19202}
MeanDierenceCI[data1, data2, KnownVariance -> {6.25, 9}]
{-4.38422, 1.67946}
MeanDierenceCI[data1, data2, KnownVariance -> {6.25, 9}, Con-
denceLevel -> 0.99]
{-5.3369, 2.63213}
Observatia 8.3. Si n acest caz putem construi intervale de ncredere
de forma
x
1
x
2
z
/2
q
2
1
n
1
+

2
2
n
2
,
sau

,x
1
x
2
+z
/2
q
2
1
n
1
+

2
2
n
2
pentru diferenta mediilor.

Alegerea dimensiunii esantionului
Dac a dispersiile sunt cunoscute si dimensiunile esantioanelor sunt
egale, n
1
= n
2
= n, putem determina dimensiunea esantionului astfel
nct eroarea pe care o facem nlocuind m
1
m
2
cu x
1
x
2
s a fie mai
mic a dect E cu un nivel de ncredere (1 ) 100%. Deoarece
|m
1
m
2
(x
1
x
2
)| z
/2
r
2
1
n
+

2
2
n
E
rezult a
n
z
/2
E
2
q
2
1
+
2
2
, n N.
n Exercitiul 8.1 vrem sa alegem dou a esantioane de aceeasi di-
mensiune astfel nct, dac a nlocuim m
1
m
2
cu x
1
x
2
eroarea s a
fie mai mic a dect 0.01 cu un nivel de ncredere de 95%.
= 0.05;
Er = 0.1;
sigma1 = 2.5;
sigma2 = 3;
z = Quantile[NormalDistribution[0, 1], 1-/2]
1.95996
n = IntegerPart[(z/Er)^2 Sqrt[sigma1^2 + sigma2^2]] + 1
1501
8.7.2 Intervale de ncredere pentru diferenta me-
diilor a dou a populatii ale c aror dispersii
sunt necunoscute
Extindem rezultatele anterioare pentru cazul n care cele dou a po-
pulatii urmeaz a o distributie normal a si dispersiile sunt necunoscute.
Dac a volumele esantioanelor n
1
si n
2
dep asesc valoarea de 40, rezul-
tatul anterior poate fi utilizat. Dac a esantioanele sunt mai mici atunci
constructia intervalului de ncredere se bazeaz a pe distributia Student.
Construim intervalul de ncredere cu nivelul de ncredere egal cu
100 (1 ) %, pentru diferenta mediilor a dou a populatii ale c aror
dispersii sunt necunoscute.
Dou a situatii diferite trebuie tratate:
1. Cazul n care dispersiile sunt necunoscute, dar egale
2
1
=
2
2
=
2
,
2. Cazul n care dispersiile sunt necunoscute si diferite.
Cazul 1.
2
1
=
2
2
=
2
Se consider a x
11
, x
12
, . . . , x
1n
1
o selectie de n
1
valori pentru vari-
abile de selectie X
11
, X
12
, . . . , X
1n
1
i.i.d. din prima populatie si x
21
,
x
22
, . . . , x
2n
2
o selectie de n
2
valori pentru variabile de selectie X
21
,
X
22
, . . . , X
2n
2
i.i.d. din a doua populatie. Fie mediile de selectie
X
1
=
1
n
1
n
1
P
i=1
X
1i
si X
2
=
1
n
2
n
2
P
i=1
X
2i
si dispersiile de selectie S
2
1
=
1
n
1
1
n
1
P
i=1
X
1i
X
1
2
si S
2
2
=
1
n
2
1
n
1
P
i=1
X
2i
X
2
2
.
Observ am c a M

X
1
X
2
= M

X
1
M

X
2
= m
1
m
2
,
deci X
1
X
2
este un estimator nedeplasat pentru diferenta mediilor.
Dispersia lui X
1
X
2
este
D
X
1
X
2
= D
X
1
+D
X
2
=

2
n
1
+

2
n
2
=
2
1
n
1
+
1
n
2
.
Combin am cele dou a dispersii de selectie S
2
1
si S
2
2
pentru a forma
un estimator al lui
2
. Acest estimator, notat S
2
p
, se defineste astfel:
S
2
p
=
(n
1
1) S
2
1
+ (n
2
1) S
2
2
n
1
+n
2
2
.
Obsev am c a S
2
p
poate fi scris astfel
S
2
p
=
n
1
1
n
1
+n
2
2
S
2
1
+
n
2
1
n
1
+n
2
2
S
2
2
= S
2
1
+ (1 ) S
2
2
,
unde 0 < 1. S
2
p
este o combinatie liniar a de cele dou a dipersii
de selectie n care depinde doar de dimensiunea esantioanelor, n
1
si
n
2
. Dac a n
1
= n
2
= n atunci S
2
p
este media aritmetic a a celor dou a
dispersii de selectie.
Stim c a Z =
X
1
X
2
(m
1
m
2
)
q
1
n
1
+
1
n
2
urmeaz a o distributie normal a
standard. nlocuind cu S
p
obtinem urm atorul rezultat:
T =
X
1
X
2
(m
1
m
2
)
S
p
q
1
n
1
+
1
n
2
urmeaz a o distribu tie Student cu n
1
+n
2
2 grade de libertate.
Atunci
P

t
/2,n
1
+n
2
2
T t
/2,n
1
+n
2
2
= 1
P
_
_
t
/2,n
1
+n
2
2

X
1
X
2
(m
1
m
2
)
S
p
q
1
n
1
+
1
n
2
t
/2,
_
_
= 1
P

X
1
X
2
t
/2,n
1
+n
2
2
S
p
r
1
n
1
+
1
n
2
m
1
m
2

X
1
X
2
+t
/2,n
1
+n
2
2
S
p
r
1
n
1
+
1
n
2
= 1 .
Dac a x
1
=
1
n
1
n
1
P
i=1
x
1i
si x
2
=
1
n
2
n
2
P
i=1
x
2i
si s
2
1
=
1
n
1
1
n
1
P
i=1
(x
1i
x
1
)
2
si s
2
2
=
1
n
2
1
n
1
P
i=1
(x
2i
x
2
)
2
atunci un interval de ncredere pentru
m
1
m
2
, cu un nivel de ncredere de 100 (1 ) % este
h
x
1
x
2
t
/2,n
1
+n
2
2
s
p
q
1
n
1
+
1
n
2
, x
1
x
2
+t
/2,n
1
+n
2
2
s
p
q
1
n
1
+
1
n
2
i
.
MeanDierenceCI[data1, data2, EqualVariances -> True] furnizeaz a
un interval de ncredere bazat pe distributia Student n cazul n care
dispersiile sunt egale.
Exercitiul 8.2. Relu am Exercitiul 8.1 si presupunem c a dispersiile
sunt egale, dar necunoscute. Determin am un interval de ncredere cu
95% nivel de ncredere folosind expresia data a intervalului si folosind
comenzi specifice softului.
Rezolvare.
data1 = {226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5};
data2 = {221.5, 230.2, 223.4, 224.3, 230.8, 223.8};
n1 = Length[data1]
n2 = Length[data2]
7
8
x1 = Mean[data1]
224.314
x2 = Mean[data2]
225.667
s1 = Variance[data1]
17.7648
s2 = Variance[data2]
14.9507
sp = (n1 - 1)/(n1 + n2 - 2) s1 + (n2 - 1)/(n1 + n2 - 2) s2
16.4856
t = Quantile[StudentTDistribution[n1 + n2 - 2], 1-0.025]
2.20099
x1 - x2 - t Sqrt[sp] Sqrt[1/n1 + 1/n2]
-6.32422
x1 - x2 + t Sqrt[sp] Sqrt[1/n1 + 1/n2]
3.61946
MeanDierenceCI[data1, data2, EqualVariances -> True]
{-6.32422, 3.61946}
Cazul 2.
2
1
6=
2
2
n unele situatii nu putem presupune c a dispersiile necunoscute
sunt egale. Si n acest caz putem g asi un interval de ncredere pentru
diferenta mediilor, cu un nivel de ncredere de 100(1 )% folosind
faptul c a
T
=
X
1
X
2
(m
1
m
2
)
q
S
2
1
n
1
+
S
2
2
n
2
urmeaz a aproximativ o distributie Student cu grade de libertate,
unde
=
s
2
1
n
1
+
s
2
2
n
2
s
2
1
n
1
2
n
1
1
+
s
2
2
n
2
2
n
2
1
.
Dac a nu este ntreg, se rotunjeste prin lips a la cel mai apropiat
ntreg.
Intervalul de ncredere, n acest caz, este
_
_
x
1
x
2
t
/2,
s
S
2
1
n
1
+
S
2
2
n
2
, x
1
x
2
+t
/2,
s
S
2
1
n
1
+
S
2
2
n
2
_
_
.
Relu am Exercitiul 8.1 si presupunem c a dispersiile sunt egale, dar
necunoscute. Determin am un interval de ncredere cu 95% nivel de
ncredere folosind folosind comenzi specifice softului.
data1 = {226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5};
data2 = {221.5, 230.2, 223.4, 224.3, 230.8, 223.8};
MeanDierenceCI[data1, data2, EqualVariances -> False]
{-6.29254, 3.58778}
8.7.3 Intervale de ncredere pentru raportul dis-
persiilor a dou a populatii
Construim intervale de ncredere, cu nivelul de ncredere (1 )
100%, pentru raportul mediilor a dou a populatii care urmeaz a o dis-
tributie normal a si ale c aror medii si dispersii sunt necunoscute.
Facem urm atoarele ipoteze:
1. Se consider a dou a populatii independente care urmeaz a o dis-
tributie normal a;
2. Se consider a x
11
, x
12
, . . . , x
1n
1
o selectie de n
1
valori pentru
11
, X
12
, . . . , X
1n
1
i.i.d. din prima populatie;
3. Se consider a x
21
, x
22
, . . . , x
2n
2
o selectie de n
2
valori pentru
21
, X
22
, . . . , X
2n
2
i.i.d. din a doua populatie.
Fie S
2
1
si S
2
2
dispersiile de selectie ale celor dou a populatii.
F =
S
2
2
/
2
2
S
2
1
/
2
1
urmeaz a o F-distribu tie cu n
2
1 grade de libertate la num ar ator si
n
1
1 grade de libertate la numitor.
Definitia 8.3. Densitatea de probabilitate a F-distributiei cu u grade
de libertate la num ar ator si v grade de libertate la numitor este
f(x) =

u+v
2

u
v
u/2
x
(u/2)1
u
2
v
2

u
v
x + 1
(u+v)/2
, 0 < x < .
Propozitia 8.4. Media si dispersia F-distribu tiei sunt:
M [X] =
v
v 2
, pentru v > 2,
D[X] =
2v
2
(u +v 2)
u(v 2)
2
(v 4)
, pentru v > 4.
Graficul densit atii de probabilitate pentru u = v = 5 este dat n
figura 8.6.
15 12.5 10 7.5 5 2.5 0
0.625
0.5
0.375
0.25
0.125
0
x
y
x
y
Figura 8.6.
Graficul F-distributiei este foarte asem an ator cu graficul distribu-
tiei hi-p atrat. Cei doi parametrii asigur a o flexibilitate a formei.
Valorile functiei de repartitie a F-distributiei pot fi calculate cu aju-
torul tabelului din Anexa 4. Fie f
,u,v
punctul n care vrems a calcul am
valoarea functiei de repartitie cu u grade de libertate la num ar ator si
v grade de libertate la numitor. Atunci
F
u,v
(f
,u,v
) =
Z

f,u,v
f(x)dx = .
Exemplul 8.10. Pentru u = 5 si v = 10 s a se calculeze f
,u,v
= 3.33.
n tabel la intersectia liniei v = 10 si coloanei u = 5 se g aseste, n
tabelul corespunz ator lui = 0.05 valoarea 3.33.
F
5,10
(3.33) = 0.95.
Tabelul contine probabilit atile pentru valorile lui egale cu 0.25,
0.1, 0.05, 0.025, 0.01.
Valorile functiei de repartitie a F-distributiei cu u grade de liber-
tate la num ar ator si v grade de libertate la numitor se pot obtine cu
ajutorul comenziilor din Mathematica.
Se ncarc a pachetul StatisticsContinuousDistributions si se foloseste
CDF[FRatioDistribution[u,v],x].
CDF[FRatioDistribution[5, 10], 3.33]
0.950169
Operatia invers a se realizeaz a cu ajutorul comenzii Quantile. Se
stie probabilitatea si se cere s a se determine f
,u,v
,
Quantile[FRatioDistribution[5, 10], 0.950169]
3.33001
Intervalul de ncredere
P

f
/2,n
2
1,n
1
1
T f
1/2,n
2
1,n
1
1
= 1
P

f
/2,n
2
1,n
1
1

S
2
2
/
2
2
S
2
1
/
2
1
f
1/2,n
2
1,n
1
1
= 1
P

S
2
1
S
2
2
f
/2,n
2
1,n
1
1

2
1
2
2

S
2
1
S
2
2
f
1/2,n
2
1,n
1
1
= 1 .
S
2
1
S
2
2
f
/2,n
2
1,n
1
1
,
S
2
1
S
2
2
f
1/2,n
2
1,n
1
1
. (8.12)
Determinarea valorilor f
,n
1
,n
2
se realizeaz a n Mathematica cu aju-
torul comenzii Quantile[FRatioDistribution[n
1
, n
2
], ].
Determinarea intervalului de ncredere cu ajutorul Mathematicii
se face folosind comanda FRatioCI[rap, n
1
, n
2
, CondenceLevel ->
1 ], comand a care se utilizeaz a deschiznd pachetul << Statis-
ticsConfidenceIntervals.
Exercitiul 8.3. ntr-un atelier se polizeaz a o anumit a suprafat a me-
talic a. Dou a procedee de polizare sunt folosite si ambele procedee
produc portiuni neregulate. Coordonatorul vrea s a aplice acel pro-
cedeu care realizeaz a cea mai mic a variatie a portiunilor neregulate.
A fost ales un esantion de n
1
= 11 portiuni de suprafat a polizate cu
primul procedeu si a rezultat o dispersie de selectie S
2
1
= 26.01, deci
o deviere standard de S
1
= 5.1 microinches si un esantion de n
2
= 16
portiuni de suprafat a polizate cu al doilea procedeu si a rezultat o
dispersie de selectie S
2
2
= 22.09, deci o deviere standard de S
2
= 4.7
microinches. S a se determine un interval de ncredere pentru raportul
dispersiilor cu un nivel de ncredere de 90%.
Rezolvare.
rap = (5.1/4.7)^2;
n1 = 16;
n2 = 11;
FRatioCI[rap, n2 - 1, n1 - 1, ConfidenceLevel -> 0.9]
{0.462888, 3.34988}
Intervalul de ncredere pentru raportul dispersiilor este [0.462888,
3.34988]. Reg asim acelasi interval de ncredere folosind formula (8.12).
z1 = Quantile[FRatioDistribution[15, 10], 0.05]
0.393125
z2 = Quantile[FRatioDistribution[15, 10], 0.95]
2.84502
z1 rap
0.462888
z2 rap
3.34988
Intervalul de ncredere pentru raportul abaterilor standard
Sqrt[z1 rap]
0.680358
Sqrt[z2 rap]
1.83027
8.7.4 Intervale de ncredere pentru diferenta pro-
portiilor a dou a populatii
Presupunem c a avem dou a esantioane de dimensiuni n
1
si respectiv
n
2
extrase din dou a populatii X
1
si X
2
reprezentnd num arul de obser-
vatii care apartin unei clase care se studiaz a. Mai mult, presupunem
aproximarea distributiei binomiale cu distributia normal a este apli-
cabil a (populatia s a aib a m acar 10 elemente), astfel nct estimatorii
proportiilor

P
1
= X
1
/n
1
si

P
2
= X
2
/n
2
Z =

P
1

P
2
(p
1
p
2
)
q
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
este distribuit a aproximativ normal standard.
Determin am intervalul de ncredere
P

z
/2
Z z
/2
= 1
P
z
/2

P
1

P
2
(p
1
p
2
)
q
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
z
/2
!
= 1
Dac a p
1
si p
2
sunt proportiile obtinute din observatiile f acute asupra
celor dou a esantioane, atunci
z
/2

p
1
p
2
(p
1
p
2
)
q
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
z
/2

p
1
p
2
z
/2
s
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
p
1
p
2

p
1
p
2
+z
/2
s
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
.
Exercitiul 8.4. Un cercet aror este interesat dac a persoanele care au
f acut psihologia sunt capabile s a rezolve o problem a care implic a o
anumit a judecat a. Cercet atorul este interesat n a estima diferenta
dintre proportiile persoanelor din cele dou a populatii care pot rezolva
problema. Prima populatie are 100 membrii din care 65 au rezolvat
problema, iar a doua populatie are 110 din care doar 45 au rezolvat
problema. S a se construiasc a un interval de ncredere pentru diferenta
proportiilor cu un nivel de ncredere de 99%.
Rezolvare.
p1 = 65/100;
p2 = 45/110;
n1 = 100;
n2 = 110;
2.57583
p1 - p2 - z Sqrt[p1(1 - p1)/n1 + p2(1 - p2)/n2]
0.0686441
p1 - p2 + z Sqrt[p1(1 - p1)/n1 + p2(1 - p2)/n2]
0.413174
Intervalul de ncredere este [0.0686441, 0.413174]. Acest interval
nu include 0, este pozitiv, ceea ce nseamn a c a n prima populatie
avem o mai multi cercet atori care pot rezolva problema.
toarele:
1. Constructia intervalelor de ncredere pentru media unei popu-
latii care urmeaz a o distributie normal a, folosind distributiile normale
si Student.
2. Constructia intervalelor de ncredere pentru dispersia unei popu-
latii care urmeaz a o distributie normal a.
3. Constructia intervalelor de ncredere pentru proportia unei po-
pulatii.
4. Modul de comparare a caracteristicilor a dou a populatii: in-
tervale de ncredere pentru diferenta mediilor, intervale de ncredere
pentru raportul dispersiilor, pentru diferenta proportiilor.
Capitolul 9
Testarea ipotezelor statistice
n continuare vom face ipoteze asupra parametrilor unor populatii,
stiind distributia pe care o urmeaz a. Vom folosi rezultatele obtinute
la estimarea prin intervale de ncredere a unor parametri remarcabili
ai unor distributii cunoscute.
Fie o colectivitate cercetatat a din punct de vedere al caracteristicii
X. Legea de probabilitate este f(x, ) si poate fi functia de frecvent a,
n cazul discret, respectiv densitatea de probabilitate, n cazul con-
tinuu.
9.1 Teste parametrice
Definitia 9.1. Se numeste ipotez a statistic a orice presupunere relativ
la parametrii distributiei uneia sau mai multor populatii statistice,
dac a distributia este cunoscut a, sau presupuneri legate de distributia
de probabilitate a populatiei statistice. Ipotezele pot fi acceptate sau
nu cu anumite probabilit ati de corectitudine a deciziei.
Testul statistic poat fi referitor la parametrii de care depinde legea
de probabilitate a caracteristicii X. n acest caz testul se numeste
parametric. n caz contrar se obtine un test neparametric.
Acceptarea unei ipoteze nu nseamn a c a este adev arat a ci c a nu
exist a motive de respingere. Adev arul sau falsitatea ipotezei nu se
poate stabili niciodat a cu exactitate pn a nu se examineaz a ntreaga
populatie. Acest lucru este imposibil n cele mai multe situatii prac-
tice. De aceea procedura de testare a ipotezei statistice se face cu o
anumit a probabilitate de a trage o concluzie gresit a.
295
296 CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE
Exemplul 9.1. S a presupunem c a n timp ce urm arim o emisiune
la TV apare pe ecran o reclam a n care se afirm a c a firma X vinde
un nou tip de baterii electrice functionnd n medie 100 de ore f ar a
ntrerupere. Un consumator sceptic doreste s a testeze aceast a ar-
matie care se refer a la durata de viat a a bateriilor produse de firma
X. Pentru aceasta, statistica recomand a s a se considere un esantion
aleator din bateriile produse de acea firm a, s a fie l asate s a functioneze
si s a se nregistreze timpii scursi pn a la desc arcarea lor. S a pre-
supunem c a s-au considerat 26 de baterii si a rezultat un timp mediu
de functionare x = 98.2 de ore. Dac a ar fi rezultat x 100, atunci nu
se putea reprosa nimic firmei X; dar pentru x = 98.2 se pune prob-
lema avertiz arii consumatorilor. Unii se pot ntreba dac a esantionul
a fost reprezentativ, altii decid c a totul este Ok (ce nseamn a 98.2,
dar 100?). Ct de mult se poate cobor pentu a decide c a reclama nu
este minciunoas a? Astfel de ntreb ari se pun n leg atur a cu testarea
oric arei ipoteze statistice.
n testarea ipotezelor se ncepe cu o afirmatie numit a ipoteza nul a
si notat a H
0
, despre care nu se stie dac a este adev arat a sau fals a, iar
esantionul este ales pentru a valida aceast a ipotez a. n cazul bateriilor
electrice ipoteza nul a este
H
0
: m = 100
(deci firma X spune adev arul). Not amcu H
1
o ipotez a alternativ a care
s a sugereze si conditiile n care ipoteza H
0
este respins a; de exemplu:
H
1
: m < 100
Nu ntotdeauna ipoteza H
1
reprezinta negatia logic a obisnuit a a
ipotezei H
0
. De regul a, aceasta a doua ipotez a se alege n directia
deciziei de respingere a ipotezei H
0
; nu se ia aici H
1
: m > 100 care nu
ar fi o ipotez a de respingere ci de satisfactie pentru calitatea bateriilor.
Valorile parametrilor specificati prin ipoteza nul a sunt determinati
prin mai multe c ai:
pot rezulta dintr-o experient a trecut a, din experiente realizate
acum,
pot fi obtinute din teorie sau modele privitoare la procesele n
studiu.
Obiectivul testului este, de obicei, de a stabili dac a aceste valori
s-au schimbat. Alt a situatie apare cnd valorile parametrilor rezult a
CAPITOLUL 9. TESTAREA IPOTEZELOR STATISTICE 297
din consideratii exterioare sau din obligatii contractuale. Atunci obiec-
tivul test arii ipotezelor este de a conrma aceste valori.
9.1.1 Leg atura dintre testarea ipotezei statistice
relativ la un parametru si intervalul de n-
credere al parametrului
Fie parametrul si [u, v] intervalul de ncredere pentru acest para-
metru cu nivelul de ncredere 100(1 )%. Astfel pentru ipoteza bi-
lateral a
H
0
: =
0
,
H
1
: 6=
0
,
vom respinge ipoteza H
0
0
/ [u, v], [u, v] in-
tervalul de ncredere cu nivelul de ncredere 100(1 )%. Regiunea
critic a pentru testul bilateral (contine valorile pentru care ipoteza H
0
se respinge) este n afara intervalului de ncredere.
Pentru ipoteza unilateral a
H
0
: =
0
,
H
1
: <
0
,
vomrespinge ipoteza H
0
dac asi numai dac a
0
< u. Multimea (, u)
se numeste regiune critic a pentru testul unilateral propus, [u, ) fiind
intervalul de ncredere unilateral pentru parametrul .
Pentru ipoteza unilateral a
H
0
: =
0
,
H
1
: >
0
,
vom respinge ipoteza H
0
0
> v. Multimea (v, )
se numeste regiune critic a pentru testul unilateral propus, (, v]
fiind intervalul de ncredere unilateral pentru parametrul .
Etapele procedurii de testare a ipotezelor:
Pasul 1. Pentru problema studiat a se identific a parametrul care
intereseaz a a fi testat.
Pasul 2. Se formuleaz a ipoteza nul a H
0
.
Pasul 3. Se formuleaz a ipoteza alternativ a H
1
.
Pasul 4. Se alege pragul de semnificatie .
Pasul 5. Se face selectia, dac a testul veric a o ipotez a pentru date
conrmate din experiente realizate. Se determin a testul statistic core-
spunz ator.
Pasul 6. Se stabileste regiunea critic a corespunz atoare testului pro-
pus.
Pasul 7. Se fac calculele necesare, se nlocuiesc n testul statistic si
se calculeaz a valoarea.
Pasul 8. Se stabileste dac a ipoteza H
0
se accept a sau nu.
Exemplul 9.2. Folosim un test unilateral pentru medie cu dispersie
necunoscut a. Aplic am pasii testului problemei din Exemplul 9.1.
Pasul 1. Pentru problema studiat a se identic a parametrii care in-
tereseaz a: timpul mediu de functionare a bateriilor. Not am cu m
parametrul care ia ca valori acest timp mediu.
Pasul 2. Se formuleaz a ipoteza nul a
H
0
: m = 100
Pasul 3. Se formuleaz a ipoteza alternativ a
H
1
: m < 100
Pasul 4. Se alege pragul de semnificatie = 0.05.
Pasul 5. Se face selectia si se determin a testul statistic corespun-
z ator. Se consider a un esantion n = 26 de baterii, sunt puse s a
functioneze si se noteaz a timpul de functionare a bateriilor. S-a obtinut
media x = 98.2 si s = 10 ore. Deoarece dispersia nu este cunoscut a si
volumul esantionului este mic folosim testul Student. Pentru aceasta
utiliz am statistica (conform rezultatelor de la intervale de ncredere)
T =
X m
s
n
t(n 1).
Pasul 6. Testul este unilateral. Se determin a t
,n1
astfel nct
P(T < t
,n1
) = , P(T < t
0.05,25
) = 0.05 rezult a t
0.05,25
=
1.70814. Regiunea critic a pentru T este (, 1.70814).
Stim c a x = 98.2 si s = 10 ore, rezult a c a
s
n
=
10
26
= 1.9612.
Calcul am T =
X m
s
n
=
98.2 100
10
26
= 0.91782.
Aceasta nseamn a c a X < 100
10
26
1.70814 = 96.65, regiunea
critic a pentru m este (, 96.65).
0
se accept a sau nu. Deoarece
T = 0.917 82 > 1.70814 = t
0.05,25
, rezult a c a n acest caz nu
avem motive s a respingem ipoteza H
0
, deci ipoteza H
0
se accept a
(figura 9.1).
-3 -2 -1 1 2 3
0.1
0.2
0.3
0.4
2
t
2,n1
-3 -2 -1 1 2 3
0.1
0.2
0.3
0.4
Figura 9.1.
Regiunea colorat a este regiunea critic a pentru testul unilateral
H
0
: m = m
0
, H
1
: m < 100
Observatia 9.1. Dac a am fi aplicat Testul Z atunci : (z
0.05
) =
0.95 z
0.05
= 1.64485 si regiunea critic a este (, 1.64485) . Deoa-
rece Z = 0.917 82 > 1.64485, rezult a c a nu avem motive s a res-
pingem ipoteza H
0
.
Dac a datele din esantion ar fi dat x = 94.5, folosind testul Student
rezult a
T =
X m
s
n
=
94.5 100
10
26
= 2.8045 < 1.70814 = t
0.05,25
si respingem ipoteza H
0
.
Dac a am fi aplicat testul Z am obtine T = 2.804 5 < 1.64485,
rezult a c a, la fel ca mai sus, respingem ipoteza H
0
.
Dac a schimb am pragul de semnificatie = 0.01, atunci dac a apli-
c am testul Student t
0.01,25
= 2.48511 si pentru x = 98.2, T = 0.91782
> 2.48511. Rezult a c a nu avem motive s a respingem ipoteza H
0
.
Pragul de semnificatie este dat de piat a, lupta pentru calitate,
concurenta n promovarea produselor.
Aceast a procedur a de decidere ne poate conduce la dou a concluzii
gresite: eroare de tip I si eroare de tip II. Deoarece deciziile sunt bazate
pe rezultate aleatoare, probabilit atile pot fi asociate acestor erori.
Eroarea de tip I const a n respingerea ipotezei H
0
desi ea este
adev arat a (se respinge pe nedrept ipoteza nul a). Probabilitatea de a
face o eroare de tip I se numeste risc de speta nti (risc al furnizorului)
si este dat a de nivelul de ncredere,
= P (se respinge H
0
, desi H
0
este adev arat) .
Pentru exemplul nostru nseamn a c a eroarea de tip I poate apare
cnd pentru esantionul studiat, media timpului de functionare a ba-
teriilor a fost x = 94.5, fapt care ne conduce la respingerea ipotezei,
desi n realitate timpul de functionare este corect.
Calcul am
P (x < 94.5 | m = 100) = P
x 100
10
26
<
94.5 100
10
26
!
=
= P(T < 2.8045) = F
25
(2.804 5) = 0.0048 0.005,
unde F
25
(2.804 5) reprezint a valoarea functiei de repartitie Student
cu 25 de grade de libertate. Aceasta nseamn a c a 0.5% din esantioane
vor conduce la respingerea ipotezei nule cnd media real a de viat a a
bateriilor este de 100 ore.
Observatia 9.2. Putem reduce prin l argirea regiunii de acceptare.
De exemplu, dac a regiunea critic a ar fi (, 94.5) atunci
= P (x < 94.5 | m = 100) = P
x 100
10
26
<
94.5 100
10
26
!
=
= P(T < 3.8243) = F
25
(3.8243) = 0.000388446
Se poate reduce si prin cresterea dimensiunii esantionului. Dac a
facem o selectie de volum n = 36 si am obtinut acelasi s = 10, atunci
= P (x < 96.65 | m = 100) = P
x 100
10
36
<
94.5 100
10
36
!
=
= P(T < 3.3) = F
25
(3.3) = 0.00111.
Eroarea de tip II nseamn a admiterea unei ipoteze false, adic a nu
se respinge ipoteza H
0
desi ea este fals a. Probabilitatea acestei erori
se numeste risc de speta a doua (risc al beneficiarului) si este notat a
cu .
n exemplul nostru se poate produce o eroare de tip II dac a esan-
tionul pentru care am obtinut x = 98.2 ne conduce la acceptarea
ipotezei H
0
, desi ea este fals a. = P(nu resping H
0
, desi H
0
este
fals).
Presupunem c a n realitate m = 95.
= P (x > 98.2 | m = 95) = P
x 95
10
26
>
98.2 95
10
26
!
=
= P(T > 1.631 7) = 1 F
25
(1.631 7) = 0.05763
Astfel, n testarea orc arei ipoteze statistice pot apare patru situatii:
Decizia H
0
adev arat a H
0
este fals a
nu avem motive de
respingere a lui H
0
p = 1
eroare de tip II
p =
respingem H
0
eroare de tip I
p = p = 1
Orice regul a de decizie este cuplul de numere (, ).
Dintre dou a reguli de decizie cu (
1
,
1
) si (
2
,
2
) astfel nc at
1

2
,
1

2
, vom elimina pe a doua. Spunem c a regula de
decizie (
1
,
1
) domin a regula (
2
,
2
). Exist a si cazuri n care cele
dou a reguli nu se pot compara.
9.1.2 Testarea mediei unei distributii normale
Vrem s a test am ipoteza
H
0
: m = m
0
H
1
: m 6= m
0
unde m
0
este constant a dat a.
Selectia X
1
, X
2
, . . . , X
n
s-a facut dintr-o populatie distribuit a nor-
mal cu media necunoscut a si abaterea medie p atratic a cunoscut a.
Deoarece X este distribuit a normal cu media m
0
si devierea standard
n
, si dac a ipoteza nul a este adev arat a, putem construi o regiune
critic a pe baza datelor din esantion. Se utilizeaz a statistica (conform
rezultatelor de la intervale de ncredere) Z
0
=
X m
0
n
N(0, 1).
P (|Z
0
| z) = 1
1 = P

m
x z

n
, x +z

= (z) (z) =
= 1 2(z) 1 = 1 2(z).
Not am cu z
2
valoarea pozitiv a a lui z obtinut a din relatia (z) =

2
.
Dac a pentru selectia f acut a valoarea calculat a Z
0
=
xm
0
n
/
2
, z
ipoteza H
0
este respins a. Regiunea
, z
2
,
este regiunea
critic a sau regiunea de respingere a ipotezei H
0
.
-4 -3 z2 -1 1 z2 3 4
0.1
0.2
0.3
0.4
2 2
-4 -3 z2 -1 1 z2 3 4
0.1
0.2
0.3
0.4
Figura 9.2.
Regiunea critic a pentru testul bilateral H
0
: m = m
0
, H
1
: m 6= m
0
este prezentat a n Figura 9.2 iar aria fiec arei zone colorate este

2
.
Dac a Z
0
=
x m
0
2
, z
nu avem motive s a respingem

ipoteza H
0
.
Dac a dispersia este necunoscut a se foloseste testul statistic
T =
X m
0
s
n
t (n 1), care urmeaz a, n acest caz, o distributie
Student cu n 1 grade de libertate.
Regiunea critic a pentru testul unilateral
H
0
: m = m
0
, H
1
: m > m
0
este
-4 -3 -2 -1 1 z 3 4
0.1
0.2
0.3
0.4
-4 -3 -2 -1 1 z 3 4
0.1
0.2
0.3
0.4
Figura 9.3.
Ipoteza
H
0
Statistica
Ipoteza
alternativ a
H
1
Regiunea criti-
c a pentru res-
pingerea lui H
0
A)
Z
0
=
X m
0
n
N (0, 1)
m < m
0
Z
0
< z
m = m
0
( cunoscut)
n 30
m > m
0
Z
0
> z
m 6= m
0
|Z
0
| > z
2
B)
T =
X m
0
s
n
t (n 1)
m < m
0
T < t
,n1
m = m
0
( necunoscut)
n < 30
m > m
0
T
n1
> t
,n1
m 6= m
0
|T
n1
| > t
2
,n1
9.1.3 P-valoarea n teste statistice
Definitia 9.2. P-valoarea unui test statistic este cel mai mic prag de
semnificatie care poate conduce la respingerea ipotezei nule pentru o
selectie dat a.
Softul Mathematica, la testarea statistic a, calculeaz a P-valoarea,
probabilitatea de respingere a ipotezei nule.
P-valoarea la un test bilateral, care urmeaz a o distributie normal a,
este
1 P

z
2
< Z
0
< z
= 1
= 2
.
Pentru teste unilaterale P-valoarea este:
P (Z
0
< z
) = (z
), dac a H
0
: m = m
0
, H
1
: m < m
0
;
P (z
< Z
0
) = 1 (z
), dac a H
0
: m = m
0
, H
1
: m > m
0
.
Urm atoarele dou a tabele, conform [1], dau informatii asupra res-
pingerii sau sustinerii ipotezei H
0
n functie de P-valoare.
P-valoarea
Informatii asupra
respingerii ipotezei H
0
p > 0.10 slabe
0.05 < p 0.1 moderate
0.01 < p 0.05 puternice
p 0.01 foarte puternice
Tabelul 9.1.
P-valoarea
Informatii asupra
sustinerii ipotezei H
0
p < 0.2 nu sunt
0.2 p < 0.5 slabe
0.5 p < 0.75 moderate
0.5 p < 0.75 puternice
Tabelul 9.2.
P-valoarea p furnizeaz a informatia: ipoteza nul a va fi respins a pen-
tru orice > p. n ce m asur a vom fi multumuti de rezultat vom trage
concluziile din tabelele de mai sus.
Definitia 9.3. Puterea unui test se defineste ca fiind probabilitatea
de a respinge ipoteza nul a H
0
cnd ipoteza H
1
este adev arat a (proba-
bilitatea respingerii unei ipoteze false). Puterea testului este 1 .
Puterea testului folosit a pentru compararea testelor statistice.
Exemplul 9.3. Relu am Exemplul 8.1 din capitolul 8. Stiind c a aba-
terea medie patratic a punctajelor la acest examen este de 10.99, s a
se verifice ipoteza c a media punctajelor este 77 de puncte fat a de
alternativa c a media punctajelor este diferit a de 77 cu un coeficient
de ncredere de 90%, 95% si 99%. Care este P-valoarea?
Rezolvare. Aplic am un test bilateral pentru medie cu dispersia
cunoscut a.
Prezent am exemplul rezolvat cu secvente intercalate de program
Mathematica
punc = {64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77,
84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69,
77, 58, 62, 82, 85, 58, 78, 84, 94, 88, 77, 78, 88, 91, 70, 71, 78, 58, 65,
53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66,
68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81};
n = Length[punc]
m = N[Mean[punc]]
83
75.0602
Pasul 1. Parametrul care trebuie testat este media punctajelor m.
Pasul 2. Se fixeaz a ipoteza nul a H
0
: m = 77
Pasul 3. Se fixeaz a ipoteza alternativ a H
1
: m 6= 77
Pasul 4. Nivelul de semnificatie este considerat pe rnd = 0.05,
0.1, 0.01.
Pasul 5. Se face selectia. Se stabileste statistica folosit a
Z
0
=
X m
0
n
N(0, 1)
Pasul 6. Testul este bilateral. Se determin a regiunea critic a, pentru
= 0.05, se calculeaz a z
0.025
din relatia P

z
2
< Z
0
< z
= 1,
z
0.025
= 1.95996.
Nivelul de incredere 95%
1.95996
Ipoteza H
0
este respins a dac a Z
0
> 1.95996 sau Z
0
< 1.95996.
Retinem c a acest rezultat este legat de alegerea de la Pasul 4 a lui
si furnizeaz a regiunea critic a pentru Z
0
. Regiunea critic a pentru Z
0
este (, 1.95996) (1.95996, ).
Z0 = (m - 77)/(10.99/Sqrt[n])
-1.60801
0
se accept a sau nu. Deoarece
Z
0
nu este n regiunea critic a, rezult a c a nu sunt motive s a respingem
ipoteza nul a.
Pentru nivelul de ncredere de 90%
1.64485
Ipoteza H
0
0
> 1.64485 sau Z
0
< 1.64485.
Nici n acest caz nu avem motive s a respingem ipoteza nul a.
Pentru nivelul de ncredere de 99%
2.57583
Ipoteza H
0
0
> 2.57583 sau Z
0
< 2.57583.
Nici n acest caz nu avem motive s a respingem ipoteza nul a.
Se pot folosi testele din pachetul << StatisticsHypothesisTests.
Pentru medie este testul MeanTest. Utilizarea lui n aceast a problem a
se face astfel:
<< StatisticsHypothesisTests
Pval = MeanTest[punc, 77, KnownVariance -> 10.66^2, TwoSided
-> True]
Rezultatul acestei comenzi este
TwoSidedPValue -> 0.107833
Valoarea furnizat a de MeanTest este P-valoarea testului bilateral
(optiunea TwoSided -> True) calculat a pentru datele punc cu media
testat a 77 si cu dispersia cunoscut a dat a prin optiunea KnownVariance
-> 10.66^2.
P-valoarea 0.107833 furnizeaz a informatia c a ipoteza nul a va fi res-
pins a pentru orice > 0.107833, dar nu va fi respins a pentru = 0.05
sau = 0.1 sau = 0.005. Pentru = 0.2, de exemplu, ipoteza nul a
va fi respins a. ntr-adev ar,
z4 = Quantile[NormalDistribution[0, 1], 1-0.2/2]
1.28155
Ipoteza H
0
0
> 1.28155 sau Z
0
< 1.28155.
Dar Z
0
= 1.60801 < 1.28155, deci n acest caz ipoteza nul a este
respins a.
Optiunea FullReport ofer a urm atoarele informatii: media esantionu-
lui, valoarea testului statistic, P-valoarea si concluzia.
MeanTest[punc, 77, KnownVariance -> 10.99^2, TwoSided -> True,
FullReport -> True]
{FullReport->
Mean TestStat Distribution
75.0602 -1.6080 NormalDistribution
, TwoSided-
PValue -> 0.107832}
Informatiile furnizate de test sunt:
media de selectie m a esantionului: 75.0602,
valoarea testului statistic: 1.6080,
folosirea testului Z, specificat prin faptul c a distributia utilizat a
este normal a,
P-valoarea testului bilateral, 0.107832.
Dac a nu se specific a nivelul de semnificatie (SignificanceLevel) se
consider a implicit 0.05.
Dac a adug am optiunea SignicanceLevel atunci prin executarea
comenzii MeanTest este furnizat a si informatia dac a ipoteza nul a este
admis a sau respins a.
FullReport -> True, SignificanceLevel -> .05]
{FullReport->
, TwoSided-
PValue -> 0.107832, Fail to reject null hypothesis at signicance level ->
0.05}
Aplic am testul pentru nivele de ncredere de 90% si 99%.
FullReport -> True, SignificanceLevel -> .1]
{FullReport->
, TwoSided-
0.1}
FullReport ->
True, SignificanceLevel -> .01]
{FullReport->
, TwoSided-
0.01}.
FullReport ->
True, SignificanceLevel ->0.2]
{FullReport->
, TwoSided-
PValue -> 0.107832, Reject null hypothesis at signicance level -> 0.2}.
Exemplul 9.4. La un control al calit a tii produselor fabricate de c atre
o fabric a s-au ob tinut urm atoarele date privind greutatea n grame
a unui anumit produs: 998, 989, 1004, 1015, 991, 987, 995, 1006,
987, 983, 996, 997, 1003, 990, 996, 992, 997, 1016, 990, 981. S a
se verifice ipoteza c a greutatea produselor corespunde standardului de
calitate care este 1000 g. S a se calculeze intervalul de ncredere pentru
greutatea produselor.
Rezolvare. Se va efectua mai nti testul bilateral pentru medie cu
dispersie necunoscut a.
Pasul 1. Parametrul care trebuie testat este media greut atii m.
Pasul 2. Se fixeaz a ipoteza nul a
H
0
: m = 1000 (greutatea produselor corespunde normei);
Pasul 3. Se fixeaz a ipoteza alternativ a
H
1
: m 6= 1000 (greutatea produselor nu corespunde normei,
snt necesare ajust ari ale procesului de productie).
Pasul 4. Nivelul de seminficatie este considerat pe rnd = 0.05
si = 0.01.
Pasul 5. Se face selectia. Se stabileste statistica folosit a (conform
rezultatelor de la intervale de ncredere)
T =
X m
0
s
n
t (n 1) ,
care are repartitie Student cu n 1 grade de libertate. Avem x =
1
n
n
P
i=1
x
i
este media greut atilor produselor din lotul dat, s este abaterea
medie p atratic a de selectie, s =
r
1
n 1
n
P
i=1
(x
i
x)
2
.
Pasul 6. Se determin a regiunea critic a si valoarea critic a t
2
,n1
> 0
astfel nct P(|T| t
2
,n1
) = 1. Se vor considera cazurile = 0.05
si = 0.01.
0
se accept a sau nu. Dac a
|T| t
/2
, atunci nu avem motive s a respingem ipoteza H
0
, iar dac a
|T| > t
/2
, atunci ipoteza H
0
se respinge si se accept a ipoteza H
1
.
Urm atorul program Matlab va efectua calculele necesare si va de-
termina ce ipotez a trebuie acceptat a:
% Test bilateral privind media repartitiei normale,
% dispersie necunoscuta.
% ipoteza nula H0: m=1000
% ipoteza alternativa H1: m~=1000
clc;
clear;
format compact;
x=[998, 989, 1004, 1015, 991, 987, 995, 1006, 987,...
983, 996, 997, 1003, 990, 996, 992, 997, 1016,...
990, 981]
n=length(x)
alfa=0.05
m=1000
ms=sum(x)/n
s=sqrt(1/(n-1)*sum((x-ms).^2))
t=(ms-m)*sqrt(n)/s
ta=tinv(1-alfa/2,n-1)
if abs(t)<=ta
disp(Ipoteza H0 se accepta)
else
disp(Ipoteza H0 se respinge)
end;
int_incr=[ms-ta*s/sqrt(n) ms+ta*s/sqrt(n)]
t=-5:0.1:5;
ft=tpdf(t,n-1);
plot(t,ft,m);
xlabel(t); ylabel(densitatea de repartitie Student);
patch([t(t<=-ta),-ta],[ft(t<=-ta),0],b);
patch([t(t>=ta),ta],[ft(t>=ta),0],b);
Rulnd programul, obtinem:
x = 995, 65; s = 9, 4494; t = 2, 0587; t
/2
= 2, 093.
Prin urmare |t| < t
/2
si, deci, ipoteza nul a H
0
se accept a pentru
nivelul de semnificatie = 0, 05. Intervalul de incredere
x t
/2
s
n
, x +t
/2
s
pentru x (greutatea produsului) este [991, 23; 1000, 1]. Programul

afiseaz a, de asemenea, gracul densit atii de repartitie Student (figura
9.2). Zona hasurat a indic a valorile lui t pentru care ipoteza nul a este
respins a.
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
t
d
e
n
s
i
t
a
t
e
a

d
e

r
e
p
a
r
t
i
t
i
e

S
t
u
d
e
n
t
Figura 9.4.
Lund = 0.01, obtinem t
/2
= 2.8609 si deci ipoteza nul a se
confirm a iar. Intervalul de ncredere este [989.6; 1001.7].
Rezolvarea cu Mathematica:
greut = {998, 989, 1004, 1015, 991, 987, 995, 1006, 987, 983, 996,
997, 1003, 990, 996, 992, 997, 1016, 990, 981};
n = Length[greut]
20
m = N[Mean[greut]]
995.65
sigma = Sqrt[N[Variance[greut]]]
9.44945
MeanTest[greut, 1000, TwoSided -> True, SignificanceLevel -> 0.01,
FullReport -> True]
{FullReport->
995.65 -2.05872 StudentTDistribution[19]
,
TwoSidedPValue -> 0.0534983, Fail to reject null hypothesis at signi-
cance level -> 0.01}
MeanTest[greut, 1000, TwoSided -> True, SignificanceLevel -> 0.05,
FullReport -> True]
{FullReport->
995.65 -2.05872 StudentTDistribution[19]
,
cance level -> 0.05}.
MeanCI[greut]
[991.228, 1000.07]
Exemplul 9.5. Printr-un sondaj, pentru un e santion de volum n =
20, s-a constatat c a durata medie de func tionare n ore a unui anumit
tip de acumulatoare pn a la urm atoarea nc arcare este 148 ore. S a se
verice ipoteza c a durata de func tionare este 150 ore, ipoteza alterna-
tiv a ind un timp de func tionare mai mic de 150 ore, la un nivel de
semnica tie de 0.05, stiind c a dispersia duratei de func tionare este 35.
Rezolvare. Se va efectua un test unilateral pentru medie cu dispersie
cunoscut a.
Pasul 1. Parametrul care trebuie testat este media timpilor de
functionare a unui anumit tip de acumulator, m.
H
0
: m = 150
H
1
: m < 150
Pasul 4. Nivelul de semnificatie este = 0.05.
Pasul 5. Se face selectia. Se stabieste statistica folosit a
Z =
X m
N (0, 1) .
Pasul 6. Se determin a regiunea critic a si valoarea critic a z
pentru
nivelul de semnificatie dat, din conditia P (z < z
) = , adic a
(z
) = 1 .
0
se accept a sau nu. Dac a
z z
atunci nu avem motive s a respingem ipoteza H

0
, n caz
contrar se respinge H
0
. Programul urm ator va efectua acest test.
% Test unilateral privind media repartitiei normale,
% dispersie cunoscuta
% ipoteza nula H0: media m=150
% ipoteza alternativa H1: m<150
clc;
clear;
n=20;
alfa=0.05
m=150
sg=sqrt(35)
ms=148
z=(ms-m)*sqrt(n)/sg
za=norminv(1-alfa,0,1)
if z>=-za
else
end;
z=-5:0.1:5;
fz=normpdf(z,0,1);
plot(z,fz,m);
xlabel(z); ylabel(densitatea de repartitie normala);
patch([z(z<=-za),-za],[fz(z<=-za),0],b);
Rulnd programul, obtinem = 5.92, z = 1.51, z
= 1.64 si,
deci, ipoteza nul a se confirm a. Programul afiseaz a si densitatea de
repartitie normal a si intervalul de respingere a ipotezei nule.
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
z
d
e
n
s
i
t
a
t
e
a

d
e

r
e
p
a
r
t
i
t
i
e

n
o
r
m
a
l
a
Figura 9.5.
Aceeasi problem a rezolvat a cu Mathematica:
m = 148;
n = 20;
z1 = Quantile[NormalDistribution[0, 1], 0.05]
1.64485
Z = N[(148 - 150)/(Sqrt[35]/Sqrt[20])]
1.51186
Deoarece Z = 1.51186 > z1 = 1.64485 rezult a c a nu avem
motive s a respingem ipoteza nul a.
9.1.4 Test asupra dispersiei unei populatii distri-
buite normal
S a presupunem o selectie X
1
, X
2
, . . . , X
n
dintr-o populatie repar-
tizat a normal cu media m si dispersia
2
.
Pentru a testa ipoteza
H
0
:
2
=
2
0
H
1
:
2
6=
2
0
se foloseste statistica
2
0
=
(n 1)s
2
2
0

2
(n 1).
Se calculeaz a
2
0
. Pentru (0, 1) dat, se determin a
2
1/2,n1
,
2
/2,n1
astfel nct
P
(n 1)s
2
2

2
1/2,n1
=

2
si P
(n 1)s
2
2

2
/2,n1
=

2
.
De aici rezult a c a nu avem motive s a accept am ipoteza H
0
dac a
2
0
>
2
/2,n1
sau
2
0
<
2
1/2,n1
. Regiunea critic a n cazule testului
bilateral este prezentat a n figura 9.6.
Aceeasi statistic a este folosit a pentru testul
H
0
:
2
=
2
0
;
H
1
:
2
>
2
0
.
Nu avem motive s a accept am ipoteza H
0
dac a
2
0
>
2
,n1
(figura
9.7).
Pentru testul
H
0
:
2
=
2
0
;
H
1
:
2
<
2
0
se foloseste aceeasi statistic a. Nu avem motive s a accept am ipoteza
H
0
dac a
2
0
<
2
1,n1
. Regiunea critic a este prezentat a n figura 9.8.
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
2
12,n1
2
2
2,n1
2 5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
Figura 9.6.
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
2,n1
2
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
Figura 9.7.
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
12,n1
2
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
Figura 9.8.
Exemplul 9.6. O sectie de vopsitorie utilizeaz a o mare cantitate de
titan (ca pigment alb). Conform standardelor, se m asoara tonul de alb
a acestui pigment utiliznd o scal a 030, unde nivelul 30 nseamn a alb
perfect. Recent sectia si-a schimbat furnizorul si noul furnizor afirm a
c a dioxidul de titan livrat are nivelul mediu 25, cu o dispersie de 0.4.
Cei din sectia de vopsitorie se ndoiesc de aceast a mic a dispersie si
planific a un experiment pe 10 esantioane, cernd testarea ipotezei la
nivel de dispersie, cu nivelul de semnificatie = 0.05.
Rezolvare.
Pasul 1. Parametru care trebuie testat este dispersia,
2
.
H
0
:
2
= 0.4.
H
1
:
2
6= 0.4.
Pasul 4. Nivelul de semnificatie este = 0.05.
Pasul 5. Se face selectia. Presupunem c a n cele 10 esantioane,
tonul de alb m asurat este: 24, 25, 27, 25, 26, 26, 24, 25, 26, 25 deci
X = 25.3, s
2
= 0.9.
dat = {24, 25, 27, 25, 26, 26, 24, 25, 26, 25};
n = Length[dat]
10
N[Mean[dat]]
25.3
N[Variance[dat]]
0.9
Pasul 6. Statistica folosit a este
2
0
=
(n 1)s
2
2
0

2
(n 1) .
Se stabileste regiunea critic a. Se determin a
2
0.975,9
si
2
0.025,9
:
P

2
0

2
0.975,9
= 0.025
2
0.975,9
= 2.70039 si
P

2
0

2
0.025,9
= 0.975
2
0.025,9
= 19.0228.
alpha = 0.05;
Quantile[ChiSquareDistribution[9], alpha/2]
2.70039
Quantile[ChiSquareDistribution[9], 1-alpha/2]
19.0228
imin = (n - 1)s^2/x2
imax = (n - 1)s^2/x1
0.425806
2.99957
Fiind un test bilateral, H
0
se respinge dac a
2
>
2
/2,n1
sau
2
<
2
1/2,n1
.
se calculeaz a valoarea. Atunci
2
0
=
(n 1)s
2
2
=
9 0.9
0.4
= 20.25.
0
se accept a sau nu.
Deoarece
2
0
= 20.25 >
2
0.975,9
= 19.0228, se respinge H
0
.
Comanda din Mathematica pentru testarea dispersiei este Vari-
anceTest din pachetul StatisticsHypothesisTests.
VarianceTest[dat, 0.4, SignificanceLevel -> .05, TwoSided -> True,
FullReport -> True]
{FullReport->
Variance TestStat Distribution
0.9 20.25 ChiSquareDistribution[9]
,
TwoSidedPValue -> 0.0328614, Reject null hypothesis at signicance
level->0.05}
Observ am c a intervalul de ncredere de 99.5% pentru dispersie este
"
(n 1)s
2
2
1/2,n1
,
(n 1)s
2
2
/2,n1
#
=

9 0.9
19.0228
,
9 0.9
2.70039
= [0.4258; 2.9996] ,
iar 0.4 nu intr a n acest interval.
Ipot. H
0
Testul statistic
Ipot.
altern.
H
1
Regiunea critic a
pentru respingerea
lui H
0
2
<
2
0

2
0
<
2
1,n1
2
=
2
0

2
0
=
(n 1)s
2
2
0

2
>
2
0

2
0
>
2
,n1
2
6=
2
0
2
0
<
2
1/2,n1
sau
2
0
>
2
/2,n1
9.1.5 Test asupra proportiei unei populatii
n probleme de inginerie apar v. a. care urmeaz a o distribuitie
binomial a. De exemplu, studiem ce procent de aparate defecte sunt
produse de o anumit a fabric a. Este logic s a model am acest proces cu
o distributie binomial a cu parametrul p care reprezint a probabilitatea
ca un aparat s a nu fie acceptat. Multe decizii din inginerie se bazeaz a
pe teste asupra parametrului p.
Se consider a ipotezele asupra lui p:
H
0
: p = p
0
,
H
1
: p 6= p
0
.
Se consider a, de obicei, un test bazat pe aproximarea repartitiei
binomiale cu o repartitie normal a. Testul furnizeaz a rezultate accep-
tabile att timp ct p nu este aproape de 0 sau 1 si dac a volumul
selectiei este relativ mare. Fie X num arul observatiilor dintr-un esan-
tion de dimensiune n care apartin clasei c areia i este asociat a pro-
babilitatea p. Atunci, dac a ipoteza H
0
: p = p
0
este adev arat a, avem
X N [np
0
, np
0
(1 p
0
)], aproximativ. Pentru acest test este folosit a
statistica (conform rezultatelor de la intervale de ncredere)
Z
0
=
X np
0
p
np
0
(1 p
0
)
N [0, 1] .
Ipoteza H
0
va fi respins a dac a Z
0
< z
2
sau Z
0
> z
2
. Observ am
c a distributia normal a standard este cea utilizat a n acest test.
Ipot. H
0
Testul statistic
Ipot. altern.
H
1
Regiunea critic a
pentru respingerea
lui H
0
p < p
0
Z
0
< z
2
p = p
0
Z
0
=
X np
0
p
np
0
(1 p
0
)
p > p
0
Z
0
> z
2
p 6= p
0
Z
0
> z
2
sau Z
0
< z
2
Exemplul 9.7. O firm a produce aparate de comand a utilizate n in-
dustria automobilistic a. Utilizatorul impune conditia ca procentul de
aparate defecte s a nu dep aseasc a 5%. Produc atorul consider a c a acest
procent este mai mic. Se utilizeaz a un test statistic n care se con-
sider a pragul de semnicatie = 0.05, se alege un esantion de 200
de aparate si se constat a c a 4 dintre ele au defect. Poate demonstra
produc atorul c a are dreptate?
Rezolvare. Prezent am pasii n testarea ipotezei statistice.
Pasul 1. Parametrul testat este procentul de aparate defecte p.
0
: p = 0.05.
1
: p < 0.05.
Pasul 4. = 0.05.
Pasul 5. Se efectueaz a selectia esantionului de volum n = 200 si se
stabileste c a procentul de aparate defecte n esantion este p =
4
200
=
0.02.
Pasul 6. Se consider a statistica Z
0
=
p p
0
q
p
0
(1p
0
)
n
.
Se stabileste regiunea critic a. (z
0.05
)=0.05z
0.05
= 1.64485.
Rezult a regiunea critic a (, 1.64485).
Se calculeaz a Z
0
=
0.02 0.05
q
0.05(10.05)
200
= 1.9467.
0
se accept a sau nu.
Z
0
= 1.9467 < 1.64485, ipoteza H
0
se respinge. Deci produc a-
torul are dreptate.
=0.05;
n=200;
pe=N[4/200];
p0=0.05;
Z = (pe - p0)/Sqrt[p0 (1 - p0)/n]
-1.94666
Quantile[NormalDistribution[0, 1], 0.05]
-1.64485
Determin am eroarea de tip II
Se poate obtine o aproximare a erorii de tip II, -eroare pentru
testul anterior. Presupunem c a p este valoarea exact a a proportiei.
Eroarea de tip II pentru ipoteza alternativ a H
1
: p 6= p
0
este
=
_
_
p
0
p +z
2
q
p
0
(1p
0
)
n
q
p(1p)
n
_
_
_
_
p
0
p z
2
q
p
0
(1p
0
)
n
q
p(1p)
n
_
_
.
Dac a H
1
: p < p
0
= 1
_
_
p
0
p z
2
q
p
0
(1p
0
)
n
q
p(1p)
n
_
_
.
Dac a H
1
: p > p
0
=
_
_
p
0
p +z
2
q
p
0
(1p
0
)
n
q
p(1p)
n
_
_
.
Acesast a ecuatie poate fi folosit a pentru a aproxima dimensiunea
esantionului n dac a dorim s a aplic am un test cu nivelul de ncredere
1 si riscul specificat .
n cazul testului bilateral
n =
"
z
2
p
p
0
(1 p
0
) +z
2
p
p(1 p)
p p
0
#2
.
Pentru testul unilateral
n =
"
z
p
p
0
(1 p
0
) +z
p
p(1 p)
p p
0
#
2
.
n cazul Exemplului 9.7 eroarea de tip II este, dac a consider am c a
valoarea corect a a lui p = 0.03,
= 1
0.050.031.64485
q
0.05(10.05)
200
q
0.03(10.03)
200
=
= 1 (0.44343) = 1 0.328727 = 0.67127.
Eroarea de tip II este aproximativ 0.7, destul de mare iar puterea
testului este 0.3, o putere mic a.
Dac a s-ar dori o eroare de tip II de 0.1, valoarea corect a ar fi p = 0.3
cu = 0.05, dimensiunea esantionului ar trebui s a fie cel putin
n =

1.645
0.05(10.05)+1.28155
0.03(10.03)
0.030.05
2
' 832.
9.1.6 Test asupra diferentei mediilor a dou a ca-
racteristici distribuite normal
Aceste teste vor folosi statisticele studiate n capitolul Intervale
de ncredere pentru caracteristicile a dou a populatii care urmeaz a o
distributie normal a, n functie de cele dou a cazuri, dispersia cunos-
cut a sau necunoscut a. Statisticile folosite sunt cele prezentate la con-
structia intervalelor de ncredere pentru diferenta mediilor a dou a pop-
ulatii care urmeaz a o distributie normal a cu dispersiile cunoscute, re-
spectiv necunoscute.
Urmeaz a un exemplu de aplicare a testului privind egalitatea medi-
ilor a dou a esantioane, dispersie necunoscut a.
Exemplul 9.8. Notele nregistrate de studen tii a dou a grupe la un
test sunt
I: 7, 5, 4, 8, 10, 9, 3, 8, 6, 5; II: 9, 7, 10, 10, 8, 4, 5, 4, 6, 9.
S a se testeze dac a cuno stin tele studen tilor celor dou a grupe difer a
semnificativ sau nu, stiind distrubu tia caractetistica studiat a urmeaz a
o distribu tie normal a.
Rezolvare. Se va efectua un test Student pentru verificarea egalit atii
mediilor a dou a esantioane, dispersiile populatiilor fiind necunoscute.
Pasul 1. Se testeaz a egalitatea mediilor notelor obtinute de stu-
dentii a dou a grupe, m
1
si m
2
.
0
: m
1
= m
2
.
1
: m
1
6= m
2
.
Pasul 4. Consider am nivelul de semnificatie = 0.05.
Pasul 5. Se efectueaz a selectia, se calculeaz a mediile celor dou a
esantioane, dispersiile de selectie.
Pasul 6. Se consider a statistica
T =
m
1
m
2
r
(n
1
1) s
2
1
+ (n
2
1) s
2
2
n
1
+n
2
2
r
1
n
1
+
1
n
2
t(n
1
+n
2
2).
unde s
2
1
si s
2
2
snt dispersiile de selectie ale celor dou a esantioane, iar n
1
si n
2
snt volumele esantioanelor. Variabila aleatoare t are repartitie
Student cu n
1
+n
2
2 grade de libertate.
Se stabileste regiunea critic a.
se calculeaz a valoarea critic a.
0
se accept a sau nu.
Ipoteza nul a H
0
se va accepta dac a |T| t
/2
, unde t
/2
se de-
termin a din conditia P

|T| t
/2
= 1 si va fi respins a dac a
|T| > t
/2
. Urm atorul program Matlab va verica ipoteza egalit atii
celor dou a medii:
% testare bilaterala a diferentei mediilor a doua esan-
tioane
% ipoteza nula: m1=m2
% ipoteza alternativa: m1~=m2
clc;
clear;
format compact;
x1=[7 5 4 8 10 9 3 8 6 5]
x2=[9 7 10 10 8 4 5 4 6 9]
alfa=0.05
n1=length(x1);
n2=length(x2);
ms1=sum(x1)/n1
ms2=sum(x2)/n2
s1=sqrt(1/(n1-1)*sum((x1-ms1).^2))
s2=sqrt(1/(n2-1)*sum((x2-ms2).^2))
s=sqrt(((n1-1)*s1^2+(n2-1)*s2^2)/(n1+n2-2))
T=(ms1-ms2)/s/sqrt(1/n1+1/n2)
ta=tinv(1-alfa/2,n1+n2-2)
if abs(t)<=ta
else
end;
Rulnd programul, obtinem
x
1
= 6.5; s
2
1
= 2.27; x
2
= 7.2;
s
2
2
= 2.35; T = 0.677; t
/2
= 2.1.
Cum |T| < t
/2
, rezult a c a nu avem motive s a respingem ipoteza nul a
H
0
, adic a la nivelul de semnificatie dat cunostintele studentilor celor
dou a grupe nu difer a semnificativ.
Secventa de comenzi Mathematica care rezolv a exemplul dat.
not1 = {7, 5, 4, 8, 10, 9, 3, 8, 6, 5};
nott2 = {9, 7, 10, 10, 8, 4, 5, 4, 6, 9};
MeanDierenceTest[not1, nott2, 0, EqualVariances -> False, FullRe-
port -> True, TwoSided -> True, SignicanceLevel -> 0.05]
{FullReport->
MeanDi TestStat Distribution
-0.7 -0.677419 StudentTDistribution[18]
,
TwoSidedPValue ->0.506763, Fail to reject null hypothesis at significance
level -> 0.05}.
Concluzia: nu avem motive s a respingem ipoteza nul a H
0
, adic a la
nivelul de semnificatie dat cunostintele studentilor celor dou a grupe
nu difer a semnificativ.
Exemplul 9.9. Un produc ator este interesat n reducerea timpului
de uscare a unei vopsele. n acest caz se stie c a timpul de uscare
urmeaz a o distributie normal a. Sunt testate dou a formule: formula
1 este cea standard, formula 2 contine un ingredient n vopsea care
reduce timpul de uscare. Din experient a se stie c a timpul de uscare
urmeaz a o repartitie normal a cu abaterea standard de 8 minute si c a ea
nu este afectat a de ad augarea ingredientului. 10 produse sunt vopsite
utiliznd formula 1 si 10 utiliznd formula 2. Alegerea produselor
pentru vopsire se face aleator. Se obtin datele
x1 = {120, 132, 111, 121, 119, 123, 120, 120, 119, 125}
x2 = {110, 111, 120, 113, 112, 103, 121, 115, 102, 113}.
Ce concluzie se poate trage despre cele dou a formule folosind =
0.05?
Se va efectua un test normal pentru verificarea egalit atii mediilor
a dou a esantioane, dispersiile populatiilor fiind cunoscute si egale..
Ipoteza nula: H
0
: m
1
= m
2
(media timpilor de uscare nu difer a
semnificativ, este aproape zero)
Ipoteza alternativ a: H
1
: m
1
> m
2
media timpului de uscare a
formulei 1 este mai mare decit a formulei 2.
x1 = {120, 132, 111, 121, 119, 123, 120, 120, 119, 125};
x2 = {110, 111, 120, 113, 112, 103, 121, 115, 102, 113};
MeanDierenceTest[x1, x2, 0, KnownVariance -> {64, 64}, FullRe-
port -> True, SignicanceLevel -> .05]
{FullReport->
MeanDi TestStat Distribution
9. 2.51558 NormalDistribution
,
OneSidedPValue -> 0.00594189, Reject null hypothesis at significance
level -> 0.05}.
Nu sunt motive s a se accepte ipoteza nul a, deci timpul de uscare
prin a doua formul a este mai mic dect cel prin prima formul a.
9.1.7 Test asupra raportului dispersiilor a dou a
populatii
Vom aplica test asupra raportului dispersiilor a dou a populatii
care urmeaz a o distributie normal a si ale c aror medii si dispersii sunt
necunoscute.
Relu am exercitiul 8.3 din Capitolul 8.
Exemplul 9.10. ntr-un atelier se polizeaz a o anumit a suprafat a me-
talic a. Dou a procedee de polizare sunt folosite si ambele procedee
produc portiuni neregulate. Coordonatorul vrea s a aplice acel pro-
cedeu care realizeaz a cea mai mic a variatie a portiunilor neregulate.
A fost ales un esantion de n
1
= 11 portiuni de suprafat a polizate cu
primul procedeu si s-au obtinut rezultatele
{22.0, 13.1, 22.7, 12.9, 12.05, 12.5, 12.55, 20.1, 24.7, 22.7, 14.5}.
A rezultat o dispersie de selectie S
2
1
= 26.0992, deci o deviere
standard de S
1
= 5.10874 microinches si un esantion de n
2
= 16
portiuni de suprafat a polizate cu al doilea procedeu si s-au obtinut
rezultatele
{22.0, 13.2, 13.1, 22.1, 12.9, 12.4, 12.05, 12.1, 12.9, 14.55, 23.1,
23.3, 26.5, 24.158, 13.4, 14.5, 14.5, 19.7, 15.6, 12.6, 16.8, 15}
A rezultat o dispersie de selectie S
2
2
= 22.0243, deci o deviere
standard de S
2
= 4.69301 microinches. Dorim s a verific am ipoteza c a
dispersiile celor dou a procedee sunt egale cu un nivel de ncredere de
90%.
Rezolvare.
Ipoteza nula: ipoteza nul a H
0
:
1
=
2
.
Ipoteza alternativ a: H
1
:
1
6=
2
.
x11 = {22.0, 13.1, 22.7, 12.9, 12.05, 12.5, 12.55, 20.1, 24.7, 22.7,
14.5};
n1 = Length[x11]
11
Variance[x11]
26.0992
StandardDeviation[x11]
5.10874
x12 = {22.0, 13.2, 13.1, 22.1, 12.9, 12.4, 12.05, 12.1, 12.9, 14.55,
23.1, 23.3, 26.5,
24.158, 13.4, 14.5, 14.5, 19.7, 15.6, 12.6, 16.8, 15};
Variance[x12]
22.0243
StandardDeviation[x12]
4.69301
VarianceRatioTest[x11, x12, 1, TwoSided -> True, FullReport ->
True, SignificanceLevel -> .05]
{FullReport->
Ratio TestStat Distribution
1.18502 1.18502 FRatioDistribution[10, 15]
,
cance
level -> 0.05}.
Concluzia: nu avem motive s a respingem ipoteza nul a.
9.1.8 Test asupra diferentei proportiilor a dou a
populatii
Presupunem c a avem dou a esantioane de dimensiuni n
1
si respectiv
n
2
extrase din dou a populatii X
1
si X
2
reprezentnd num arul de obser-
vatii care apartin unei clase care se studiaz a. Mai mult, presupunem
aproximarea distributiei binomiale cu distributia normal a este apli-
cabil a (populatia s a aib a m acar 10 elemente), astfel nct estimatorii
proportiilor

P
1
= X
1
/n
1
si

P
2
= X
2
/n
2
Suntem interesati n a testa ipotezele
H
0
: p
1
= p
2
,
H
1
: p
1
6= p
2
.
Statistica folosit a este
Z =

P
1

P
2
(p
1
p
2
)
q
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
.
Ea urmeaz a o distributie aproximativ standard normal a. Dac a
ipoteza nul a este adev arat a, folosind faptul c a p
1
= p
2
= p, atunci
Z =

P
1

P
2
r
p (1 p)
1
n
1
+
1
n
2
N [0, 1] .
Estimatorul parametrului p este

P =
X
1
+X
2
n
1
+n
2
.
Statistica folosit a pentru testul avnd ipoteza H
0
: p
1
= p
2
va fi
Z
0
=

P
1

P
2
r
P

1

P
1
n
1
+
1
n
2
.
Ipoteza alternativ a Regiunea critic a
H
1
: p
1
6= p
2
, z
2
,
H
1
: p
1
> p
2
(z
, )
H
1
: p
1
< p
2
(, z
)
Exemplul 9.11. Un cercet aror este interesat dac a persoanele care au
f acut psihologia sunt capabile s a rezolve o problem a care implic a o
anumit a judecat a. Cercet atorul este interesat n a estima diferenta
dintre proportiile persoanelor din cele dou a populatii care pot rezolva
problema. Prima populatie are 100 membrii din care 65 au rezolvat
problema, iar a doua populatie are 110 din care doar 45 au rezolvat
problema. S a se analizeze ipotezele:
a) cele dou a proportii sunt egale,
b) prima proportie este mai mare dect a doua.
Rezolvare. a) 1. Parametrii care intereseaz a sunt p
1
si p
2
.
2. Ipoteza nul a H
0
: p
1
= p
2
,
3. Ipoteza alternativ a H
1
: p
1
6= p
2
.
4. Alegem = 0.05
5. Testul statistic utilizat Z
0
=
p
1
p
2
r
p (1 p)
1
n
1
+
1
n
2
, unde p
1
=
0.65, p
2
=
45
110
= 0.409 09, n
1
= 100, n
2
= 110 si
p =
X
1
n
1
+
X
2
n
2
=
65 + 45
100 + 110
= 0.523 81.
6. Regiunea critic a: deoarece z
0.025
= 1.96 rezult a c a ipoteza nul a
0
(, 1.96) (1.96, ) .
7: Z
0
=
0.65 0.409 09
q
0.523 81 (1 0.523 81)
1
100
+
1
110
= 3.4911.
8. Concluzia: deoarece Z
0
= 3.4911 > 1.96, rezult a c a ipoteza nul a
este respins a, deci proportiile nu sunt egale.
b) 1. Parametrii care intereseaz a sunt p
1
si p
2
.
2. Ipoteza nul a H
0
: p
1
= p
2
,
3. Ipoteza alternativ a H
1
: p
1
> p
2
.
4. Alegem = 0.05
5. Testul statistic utilizat Z
0
=
p
1
p
2
r
p (1 p)
1
n
1
+
1
n
2
, unde p
1
=
0.65, p
2
=
45
110
= 0.409 09, n
1
= 100, n
2
= 110 si
p =
X
1
n
1
+
X
2
n
2
=
65 + 45
100 + 110
= 0.523 81.
6. Regiunea critic a: deoarece z
0.05
= 1.65, rezult a c a ipoteza nul a
0
(1.65, ).
7: Z
0
=
0.65 0.409 09
q
0.523 81 (1 0.523 81)
1
100
+
1
110
= 3.4911
8. Concluzia: deoarece Z
0
= 3.4911 > 1.65 rezult a c a ipoteza nul a
este respins a, deci proportiile nu sunt egale iar prima proportie este
mai mare dect a doua.
9.2 Testul lui Pearson (
2
)
Este folosit ca indicator al concordantei unei repartitii empirice cu
una teoretic a. Este unul din cele mai importante teste statistice.
Se consider a o selectie de volum n, x
0
1
, x
0
2
, . . . , x
0
n
.
Ipoteza H
0
: selectia f acut a provine dintr-o populatie cu functia
de repartitie F complet specificat a (de exemplu normal a standard).
Ipoteza alternativ a H
1
: selectia nu provine din populatia definit a de F.
Se consider a o selectie de volum n, x
0
1
, x
0
2
, . . . , x
0
n
. Datele se m-
part n r clase, x
1
< x
2
< < x
r
. Obtinem intervalele [x
1
, x
2
) ,
[x
2
, x
3
) , . . . , [x
r
, ) . Fie f
j
num arul de observatii din intervalul j si
p
j
probabilitatea teoretic a ca v. a. din care provine selectia s a ia valori
n intervalul j, dac a admitem ipoteza H
0
. Atunci frecventa teoretic a
este np
j
.
Statistica utilizat a n testarea acestei ipoteze este:
2
=
r
X
j=1
(f
j
np
j
)
2
np
j
(9.1)
care urmeaz a legea
2
cu r 1.
9.2.1 Algoritmul testului lui Pearson
Pasul 1. Alegerea lui r: Mann si Wald au propus formula
r = 4
2(n 1)
2
C
2
1
5
unde C este cuantila de ordin al repartitiei N(0, 1).
Pasul 2. Selectia de volumn se mparte n r intervale. Se calculeaz a
f
k
num arul de observatii n intervalul k iar p
k
probabilitatea teoretic a
ca v. a. n studiu s a ia valori n intervalul k n ipoteza c a H
0
este
adev arat a. Pentru aceasta se estimeaz a media (sau alti parametrii) si
se genereaz a acelasi num ar de date repartizate conform legii teoretice
alese. Pentru o buna aplicare a testului trebuie ca np
k
5 pentru
k = 1, r.
Pasul 3. Se calculeaz a
2
=
r
X
j=1
(f
j
np
j
)
2
np
j
.
Pasul 4. Se stabileste nivelul de semnificatie 1 , se calculeaz a
2
,r1
.
Ipoteza H
0
se respinge dac a
2
>
2
,r1
.
Dac a
2
<
2
,r1
nu avem motive s a respingem ipoteza H
0
.
Observatia 9.3. n practic a se poate da o expresie mai usor de retinut
pentru (9.1) si anume
2
=
X
(O E)
2
E
,
unde O sunt datele observate si E cele estimate (pentru care trebuie
decis a buna potrivire).
Observatia 9.4. Dac a se estimeaz a un num ar de s parametri, atunci
2
urmeaz a o repartitie
2
cu r s 1 grade de libertate.
Exemplul 9.12. La o or a de vrf s-au sondat canalele de televiz-
iune TVR1, PROTV, TVR2, Antena 1, Realitatea, care au avut la 23
martie audientele 34%, 8%, 12%, 34%, 12% respectiv. La un sondaj
printre 500 telespectatori dup a 6 luni s-au constatat rezultatele urm a-
toare: 159 spectatori pentru TVR1, 49, 62, 161, 69 pentru celelalte.
Apare o diferent a semnicativ a?
Rezolvare. n acest exemplu avem r = 5, X = audienta, n = 500,
p
1
= 0.34, p
2
= 0.08, p
3
= 0.12, p
4
= 0.34, p
5
= 0.12.
Num arul estimat de telespectatori la 23 martie este respectiv
np
1
= 500 0.34 = 170, np
2
= 500 0.08 = 40, np
3
= 500 0.12 = 60,
np
4
= 500 0.34 = 170, np
5
= 500 0.12 = 60.
Calcul am
2
=
(159170)
2
170
+
(4940)
2
40
+
(6260)
2
60
+
(161170)
2
170
+
(6960)
2
60
= 4.629 9.
Datele pot fi organizate conform urm atorului tabel
Grupa 1 2 3 4 5
f
k
159 49 62 161 69
p
k
0.34 0.08 0.12 0.34 0.12
np
k
170 40 60 170 60
f
k
np
k
11 9 2 9 9
(f
k
np
k
)
2
121 81 4 81 81
(f
k
np
k
)
2
np
k
0.71176 2.025 6.6667 10
2
0.47647 1.35
Alegem = 0.1, r 1 = 4, atunci
2
0.1
(4) = 7.779. Deoarece
2
<
2
0.1
(4) (4.629 9 < 7.7794) rezult a c a nu avem argumente suficiente
pentru a respinge ipoteza H
0
.
Dac a lu am = 0.5 atunci
2
0.5
(4) = 3.36 si H
0
se respinge cu o
eroare de 50%.
Secventa de program Mathematica care realizeaz a aceast a testare
este dat a mai jos:
Potrivire cu repartitia binomial a
Exemplul 9.13. O reclam a a fost difuzat a n mass-media. Dintr-un
esalon de 800 de persoane au fost 434 care nu au auzit (v azut) reclama;
329 au auzit o dat a; 35 de dou a ori si 2 de 3 ori (nimeni mai mult de
trei ori). Ne propunem s a verific am la nivel de semnificatie 95% dac a
num arul de d ati cnd o persoan a a aflat de acea reclam a urmeaz a o
repartitie binomial a cu parametru p = 0.2.
Rezolvare. Pasii care trebuie urmati n testarea ipotezei statistice
Pasul 1. Variabila care intereseaz a: X num ar a de cte ori o per-
soan a a auzit reclama.
Pasul 2. H
0
: variabila X urmeaz a o distributie binomial a.
Pasul 3. H
1
: variabila X nu urmeaz a o distributie binomial a.
Pasul 4. = 0.05.
Pasul 5. Testul statistic este
2
=
r
X
k=1
(f
k
np
k
)
2
np
k
Pasul 6. Ipoteza H
0
este respins a dac a
2
>
2
0.05
(3) = 7.81473.
Regiunea critic a este (7.81473, ).
Pasul 7. Calculele: r = 4, k = 1, 2, 3, 4 si aceste valori sunt luate
de X cu probabilit atile p
k
= C
k1
3
p
k1
(1 p)
4k
, deci
p
1
= C
0
3
(0.2)
0
(0.8)
3
= 0.512, p
2
= C
1
3
(0.2)
1
(0.8)
2
= 3 0.128 = 0.384,
p
3
= 3 (0.2)
2
(0.8)
1
= 0.096, p
4
= (0.2)
3
(0.8)
0
= 0.008
n = 800,
Grupa 0 1 2 3
f
k
434 329 35 2
p
k
0.512 0.384 0.096 0.008
np
k
409.6 307.2 76.8 6.4
f
k
np
k
24.4 21.8 41.8 4.4
(f
k
np
k
)
2
595.36 475.24 1747.2 19.36
(f
k
np
k
)
2
np
k
7.864 1 10
2
1.547 22.75 3.025
2
= 28.776,
2
0.95
(3) = 7.81473.
Pasul 8. 28.776 > 7.81473 rezult a c a respingem H
0
, deci datele
observate nu urmeaz a o lege binomial a cu parametru p = 0.2.
Secventa de program Mathematica care realizeaz a aceast a testare
este dat a mai jos:
p = 0.2;
n = 800;
r = 4;
p0 = (1 - p)^3
0.512
p1 = 3 p (1 - p)^2
0.384
p2 = 3 p^2 (1 - p)
0.096
p3 = p^3
0.008
CHI = (n p0 - 434)^2/(n p0) + (n p1 - 329)^2/(n p1) + (n p2 -
35)^2/(n p2) + (n p3 - 2)^2/(n p3)
28.776
Quantile[ChiSquareDistribution[r - 1], 0.95]
7.81473
n ipoteza c a variabila studiat a ar urma, totusi, o repartitie bino-
mial a, estim am parametrul p cu metoda verosimilit atii maxime. Con-
struim functia de verosimilitate maxim a dup a modelul Exemplului 7.9
p
1
= C
0
3
p
0
(1p)
3
, p
2
= C
1
3
p
1
(1p)
2
, p
3
= C
2
3
p
2
(1p)
1
, p
4
= C
3
3
p
3
,
L(x
1
, x
2
, x
3
, x
4
; p) = p
x
1
1
p
x
2
2
p
x
3
3
p
x
4
4
L(434, 329, 35, 2; p) = (1 p)
3434
3p
329
(1 p)
2329
3p
235
(1 p)
35
P
32
=
= 9p
405
(1 p)
1995
,
ln L(434, 329, 35, 2; p) = ln 9 + 405 lnp + 1995 ln(1 p),
ln L(434, 329, 35, 2; )
p
=
405
p

1995
1 p
,
405
p

1995
1 p
= 0, p =
27
160
= 0.16875.
Secventa Mathematica:
dr[s_] := (1 - s)^(3 434) 3 s^329 (1 - s)^(2 329) 3 s^70 (1 - s)^35
s^6
d1 = Simplify[dr[s]]
9(1 s)
1995
s
405
dd = Factor[D[Log[d1], s]]
15(27+160s)
(1+s)s
Solve[dd == 0, s]
s >
27
160
N[%]
{{s > 0.16875}}
Cu acest p determinat, testul
2
d a ca valoare
2
= 19.3074 fapt
care ne conduce la aceeasi concluzie c a datele observate nu urmeaz a o
lege binomial a.
p0 = (1 - s)^3; p1 = 3 s (1 - s)^2;
p2 = 3 s^2 (1 - s); p3 = s^3;
CHI = (n p0 - 434)^2/(n p0) + (n p1 - 329)^2/(n p1) + (n p2 -
35)^2/(n p2) + (n p3 - 2)^2/(n p3)
19.3074
Observ am din programul realizat cu Mathematica c a dac a lu am
p = 0.168,
2
= 19.4136, deci
2
ncepe s a creasc a.
s = 0.168;
p0 = (1 - s)^3; p1 = 3 s (1 - s)^2;
p2 = 3 s^2 (1 - s); p3 = s^3;
CHI = (n p0 - 434)^2/(n p0) + (n p1 - 329)^2/(n p1) + (n p2 -
35)^2/(n p2) + (n p3 - 2)^2/(n p3)
19.4138
Potrivire cu repartitia Poisson
Exemplul 9.14. Vrem s a stabilim dac a num arul defectiunilor unui
circuit al unei imprimante urmeaz a o repartitie Poisson. Se studiaz a
comportatea acestui circuit pe un num ar de 60 de imprimante si sunt
consemnate num arul defectiunilor care au ap arut.
Nr. defectiunilor Frecventa
0 32
1 15
2 9
3 4
Media distributiei Poisson presupuse este necunoscut a si trebuie
estimat a din datele esantionului. Estimarea mediei num arului de-
fectelor circuitului o facem printr-un estimator punctual al mediei,
x =
320+151+92+43
60
= 0.75. Din distributia Poisson cu parametrul
= 0.75 putem calcula probabilit atile teoretice p
i
, i = 1, 2, 3, 4,
p
1
= P (X = 0) =
e
0.75
(0.75)
0
0!
= 0.472 367
p
2
= P (X = 1) =
e
0.75
(0.75)
1
1!
= 0.354 275
p
3
= P (X = 2) =
e
0.75
(0.75)
2
2!
= 0.132 853
p
4
= P (X 3) = 1 (p
1
+p
2
+p
3
) = 0.0405054
Secventa cu Mathematica
n = 60;
media = (0 32 + 1 15 + 2 9 + 3 4)/60
3
4
= N[%]
0.75
p1 = Exp[-]
0.472 367
p2 = Exp[-]
0.354 275
p3 = Exp[-] ()^2/2
0.132 853
p4 = 1 - (p1 + p2 + p3)
0.0405054
Aplic am testul.
Pasul 1. Variabila care intereseaz a: X num arul de defecte care
apar la un circuit.
Pasul 2. H
0
: variabila X urmeaz a o distributie Poisson.
Pasul 3. H
1
: variabila X nu urmeaz a o distributie Poisson.
Pasul 4. = 0.05
2
=
r
X
k=1
(f
k
np
k
)
2
np
k
Pasul 6. Determin am regiunea critic a.
2
urmeaz a o distributie hi-
p atrat cu 2 grade de libertate. Sunt patru grade, ar trebui s a urmeze o
distributie cu 3 grade de libertate dar, deoarece s-a estimat parametrul
distributiei Poisson, num arul gradelor de libertate se consider a cu o
unitate mai mic, conform Observatiei 9.4.
Frecventele observate
f1 = 32;
f2 = 15;
f3 = 9;
f4 = 4;
Determin am regiunea critic a
5.99146
Ipoteza H
0
este respins a dac a
2
>
2
0.05
(2) = 5.99146. Regiunea
critic a este (5.99146, ).
Pasul 7. Calculele:
CHI = (n p1 - f1)^2/(n p1) + (n p2 - f2)^2/(n p2) + (n p3 - f3)^2/(n
p3) + (n p4 - f4)^2/(n p4)
3.46021
Pasul 8.
2
= 3.46021 <
2
0.05
(2) = 5.99146. Nu avem motive s a
respingem ipoteza nul a.
Potrivire cu repartitia uniform a
Exemplul 9.15. Un comerciant vrea s a vad a dac a un anumit produs
se vinde la fel (uniform) n 5 dintre magazinele sale. Prin experiment
constat a c a ntr-o saptamn a s-au realizat vnz ari n mii RON de
43, 29, 52, 34, 48. Este aceast a informatie suficient a pentru a considera
c a exist a mari diferente ntre cele 5 magazine?
Pasul 1. Variabila care intereseaz a: X veniturile realizate prin
vnz ari n 5 magazine, n decursul unei s apt amni.
Pasul 2. Ipoteza H
0
: variabila X urmeaz a o distributie uniform a.
Probabilitatea de a cump ara de la unul din cele cinci magazine este
aceeasi p
1
= p
2
= = p
5
= 0.2, cu alte cuvinte vnz arile sunt
aceleasi.
Observatia 9.5. n cazul unei repartitii uniforme a vnz arilor pe cele
5 magazine, ele ar trebui s a vnd a fiecare n valoare de 206 0.2 =
41.2 mii RON. Acestea sunt datele estimate dac a ipoteza H
0
ar fi
adev arat a. Datele date n enunt sunt cele observate.
Pasul 3. Ipoteza H
1
: variabila X nu urmeaz a o distributie uni-
form a.
Pasul 4. = 0.1
2
=
r
X
k=1
(f
k
np
k
)
2
np
k
.
2
urmeaz a o distributie
hi-p atrat cu 4 grade de libertate.
p1 = 0.2; p2 = 0.2; p3 = 0.2; p4 = 0.2; p5 = 0.2;
f1 = 43; f2 = 29; f3 = 52; f4 = 34; f5 = 48;
n = f1 + f2 + f3 + f4 + f5
206
7.77944
Deoarece am estimat probabilit atile teoretice p
1
= p
2
= = p
5
=
0.2 care depind de volumul selectiei (num arul magazinelor cercetate)
specialistii recomand a s a se considere c a au r amas 5 1 1 = 3 grade
de libertate. n acest caz
6.25139
Pasul 7. Calculele:
p3) + (n p4 - f4)^2/(n p4) + (n p5 - f5)^2/(n p5)
8.90291
Pasul 8. Pentru r = 5 la un nivel de semnificatie de 10%
2
0.05
(4) =
7.77944 > 8.902 91, deci nu avem motive s a respingem ipoteza H
0
. La
fel si pentru cazul a trei grade de libertate.
Observ am c a dac a consider am = 0.05, atunci
9.48773
7.81473
n acest caz avem, conform celor dou a situatii, regiunile critice:
(9.48773, ) si respectiv (7.81473, ).
Observ am c a ntre cele dou a situatii interpret arile sunt diferite si
atunci concluzia se trage n functie de conjunctur a. Pentru r = 5 la
un nivel de semnificatie de 5%
2
0.05
(4) = 9.48773 > 8.902 91, deci nu
avem motive s a respingem ipoteza H
0
. n cazul n care se consider a
5 1 1 = 3 grade de libertate,
2
0.05
(3) = 7.81473 < 8.902 9 si n
acest caz putem zice c a sunt diferente mari ntre magazine.
Dac a se consider a = 0.01 atunci
7.77944
6.25139
n acest caz putem zice c a sunt diferente mari ntre magazine.
Potrivire cu repartitia normal a
Exemplul 9.16. Presupunem c a timpul mediu de asamblare (n mi-
nute) pentru un esantion de 300 de aparate electronice a fost m = 84,
cu abaterea medie p atratic a = 3. S-a observat c a aceste 300 de
aparate au fost repartizate astfel: pentru 15 aparate au fost necesare
sub 78 de minute, pentru 39 ntre 78-81 minute, pentru 96 ntre 81-84
minute, pentru 87 ntre 84-87, pentru 48 aparate ntre 87-90 minute
si pentru 15 aparate peste 90 minute. S a se testeze la nivel de sem-
nicatie de 1% dac a datele anterioare sunt repartizate normal.
Pasul 1. Variabila care intereseaz a: X timpul mediu de asamblare
a unor aparate electronice.
Pasul 2. H
0
: variabila X urmeaz a o distributie normal a.
Pasul 3. H
1
: variabila X nu urmeaz a o distributie normal a.
Pasul 4. = 0.1
2
=
r
X
k=1
(f
k
np
k
)
2
np
k
.
Pasul 6. Determin am regiunea critic a. Datele sunt mp artite n 6
grupe. S-a estimat media, m = 84 si abaterea medie p atratic a, = 3.
Testul statistic urmeaz a o distributie
2
0.01
(3).
m = 84;
= 3;
f1 = 15;
f2 = 39;
f3 = 96;
f4 = 87;
f5 = 48;
f6 = 15;
n = f1 + f2 + f3 + f4 + f5 + f6
300
11.3449
Regiunea critic a este: (11.3449, ).
Pasul 7. Calculele:Avem r = 6 grupe; dac a X = timpul de asam-
blare si dac a X N(84, 9), atunci
p
1
= P (X < 78) =
78 84
3
= (2) = 1 (2) =
= 1 0.977 25 = 0.022 75
p
2
= P (78 X < 81) =
81 84
3
78 84
3
=
= (1) (2) = 0.977 25 0.841 34 = 0.135 91
p
3
= P (81 X < 84) =
84 84
3
81 84
3
=
= (0) (1) = 0.841 34 0.5 = 0.341 34
p
4
= P (84 X < 87) =
87 84
3
84 84
3
=
= (1) (0) = 0.841 34 0.5 = 0.341 34
p
5
= P (87 X < 90) =
90 84
3
87 84
3
=
= (2) (1) = 0.977 25 0.841 34 = 0.135 91
p
6
= P (90 X) = 1
90 84
3
= 1 (2) =
= 1 0.977 25 = 0.022 75
n = 300
Acest calcul se realizeaz a prin secventa
p1 = N[CDF[NormalDistribution[0, 1], (78 - 84)/3]]
0.0227501
p2 = N[CDF[NormalDistribution[0, 1], (81 - 84)/3]] - N[CDF[
NormalDistribution[0, 1], (78 - 84)/3]]
0.135905
0.341345
0.341345
0.135905
p6 = 1 - N[CDF[NormalDistribution[0, 1], (90 - 84)/3]]
0.0227501
Calcul am valoarea statisticii
p3) + (n p4 - f4)^2/(n p4) + (n p5 - f5)^2/(n p5) + (n p6 - f6)^2/(n
p6)
23.6597
2
= 23.6597
Pasul 8.
2
= 23.6597 >
2
0.01
(3) = 11.3449 rezult a c a respingem
ipoteza H
0
.
Potrivire cu repartitia exponential a
n general nu avem o densitate de probabilitate pentru X, ci numai
un model statistic pe care l alegem din modelele cunoscute. Consi-
der am un esantion (X
1
, X
2
, . . . , X
k
) Multinomial [n, p
1
, p
2
, . . . , p
k
].
n mod natural ne punem problema s a gasim un estimator de verosimi-
litate maxim a n acest caz. Functia de verosimilitate maxim a se ia de
forma:
L(x
1
, x
2
, . . . , x
k
; p
1
, p
2
, . . . , p
k
) = (p
1
)
x
1
(p
2
)
x
2
(p
k
)
x
k
.
Exemplul 9.17. Presupunem c a este testat a durata de functionare
a unui tip de becuri (m asurat a n ore) pentru un esantion de 30 de
becuri. S-a observat c a durata de functionare a 9 becuri este sub 1000
de ore, a 12 becuri ntre 1000 si 2000 de ore, a 8 becuri ntre 2000
si 3000 de ore, iar a unui bec peste 3000 de ore. S a se testeze la
nivel de semnificatie de 0.1% dac a datele prezentate sunt repartizate
exponential.
Avem nevoie de o estimare a parametrului v. a. X care ia ca valori
durata de functionare (m asurat a n sute de ore) a becurilor, presupus a
exponential a X Exponential []. Reamintim c a pentru repartitia
exponential a F(x) =

0 dac a x 0
1 e
x
dac a x > 0
.
Datele se mpart n patru grupe, (0, 1], (1, 2], (2, 3], (3, ).
p
1
= P (0 X < 1) = F(1) F(0) = 1 e
,
p
2
= P (1 X < 2) = F(2) F(1) = e
e
2
,
p
3
= P (2 X < 3) = F(3) F(2) = e
2
e
3
,
p
4
= P (3 X) = 1 F(3) = e
3
.
Pentru a calcula probabilit atile trebuie estimat parametrul . Folo-
sim estimatorul de verosimilitate maxim a. Functia de verosimilitate
maxim a este
L(x
1
, . . . , x
n
; ) =

1 e
e
2
12
e
2
e
3
1
.
ln L(x
1
, . . . , x
n
; ) = ln
1e
e
2
12
e
2
e
3
e
3
1
=
= 9 ln(1 e
) + 12 ln(e
e
2
) + 8 ln(e
2
e
3
) 3,
ln L(x
1
, x
2
, . . . , x
n
; )
=
=
9e
1e
+
12
e
e
2
2e
2
e
+
8
e
2
e
3
3e
3
2e
2
3 =
=
9e
1 e
+
12
1 e
2e
+
8
1 e
3e
3 =
=
1
e
31 60e
,
1
e
31 60e
= 0
= 0.66036,
ln L(x
1
, x
2
, . . . , x
n
; )
= 0
= 0.660 36,
2
ln L(x
1
, x
2
, . . . , x
n
; )
2
=
= 57
e
1 e
9
e
2()
(1 e
)
2
12
e
(1 e
)
2
2e
8
e
(1 e
)
2
3e
= 29
e
(1 e
)
2
< 0,
2
ln L(x
1
, x
2
, . . . , x
n
; )
=0.66036
=
=
57e
0.66036
1e
0.66036

9e
2(0.66036)
(1e
0.66036
)
2

12e
0.66036
(1e
0.66036
)
2
2e
0.66036
1
8e
0.66036
(1 e
0.66036
)
2
3e
0.66036
2
= 64.137.
= 0.660 36 este estimator de verosimilitate maxim a.

Secventa prin mathematica care realizeaz a acest calcul este:
[p_] := (1 - Exp[-p])^9 (Exp[-p] - Exp[-2 p])^12 (Exp[-2 p] - Exp[-3
p])^8 Exp[-3 p]
der = Factor[D[Log[[p]], p]]
60+31e
p
1+e
p
N[Solve[der == 0, p]]
{{p->0.660357}}
D[der, p] /. p -> 0.6603573577369545
64.1379
Aplic am testul.
Pasul 1. Variabila care intereseaz a: X durata de functionare m a-
surat a n sute de orea a unui tip de becuri.
Pasul 2. H
0
: variabila X urmeaz a o distributie exponential a.
Pasul 3. H
1
: variabila X nu urmeaz a o distributie exponential a.
Pasul 4. = 0.001
2
=
r
X
k=1
(f
k
np
k
)
2
np
k
.
13.8155
Pasul 7. Calculele:
Probabilit atile teoretice sunt
p
1
= 1 e
0.660 36
= 0.483 33,
p
2
= e
0.660 36
e
20.660 36
= 0.24972,
p
3
= e
20.660 36
e
30.660 36
= 0.12902,
p
4
= e
30.660 36
= 0.137 92,
2
= 2.086 2 + 2.713 2 + 4.405 5 + 2.379 3 = 11.584
2
0.999
(2) = 13.8155
p1 = 1 - Exp[-p]
0.483 33
p2 = Exp[- p] - Exp[-2 p]
0.24972
p3 = Exp[-2 p] - Exp[-3 p]
0.12902
p4 = Exp[-3 p]
0.137 92
f1 = 9;
f2 = 12;
f3 = 8;
f4 = 1;
n = 30;
p3) + (n p4 - f4)^2/(n p4)
11.5837
2
<
2
0.001
(2), rezult a c a nu avem motive s a respingem ipoteza H
0
.
9.3 Teste de independent a n tabele de
contingent a
Tabelele de contingent a sunt construite n scopul studierii relatiei
dintre dou a sau mai multe variabile de clasificare.
De multe ori n elemente ale unei selectii pot fi clasicate conform
unor criterii diferite. Este interesant s a stim dac a criteriile de clasi-
care sunt statistic independente. Presupunem c a prima metod a de
clasicare conduce la r clase, iar a doua metod a la s clase. Not am cu
o
ij
frecventele relative observate pentru nivelul i din prima clasicare
si nivelul j din a doua clasicare. Datele vor apare, n general, ntr-un
tabel de forma:
1 2 . . . s
1 o
11
o
12
o
1s
s
P
j=1
o
1j
2 o
21
o
22
o
2s
s
P
j=1
o
2j
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
r o
r1
o
r2
o
rs
s
P
j=1
o
rj
s
P
i=1
o
i1
s
P
i=1
o
i2

s
P
i=1
o
is
Un astfel de tabel se numese tabel de contingen t a.
Suntem interesati s a test am dac a metodele folosite pentru clasi-
carea datelor pe linii si coloane sunt independente. Dac a respingem
aceast a ipotez a nseamn a c a exist a unele interactiuni ntre cele dou a
criterii de clasicare.
Urm atorul test este valabil pentru n mare. Fie p
ij
probabilitatea
ca un element luat la ntmplare s a apartin a celulei ij, stiind c a cele
dou a calsic ari sunt independente. Atunci p
ij
= u
i
v
j
unde u
i
este
probabilitatea ca elementul selectat s a apartin a liniei i si v
j
proba-
bilitatea ca elementul selectat s a apartina coloanei j. n conditii de
independent a, estimatorii lui u
i
si v
j
sunt:
u
i
=
1
n
s
X
j=1
o
ij
, v
j
=
1
n
r
X
i=1
o
ij
.
Atunci frecventele asteptate a fi pentru fiecare celul a sunt:
E
ij
= n u
i
v
j
=
1
n
s
X
j=1
o
ij
r
X
i=1
o
ij
.
Pentru n mare, statistica
2
0
=
r
X
i=1
s
X
j=1
(o
ij
E
ij
)
2
E
ij
urmeaz a distributia
2
cu (r 1)(s 1) grade de libertate. Ipoteza
de independent a este respins a dac a valoarea statisticii
2
0
dep aseste
valoarea
2
,(r1)(s1)
.
Cu ajutorul testului
2
este posibil s a se verifice ipoteza conform
c areia cele dou a variabile de clasificare sunt independente.
9.3.1 Testul de independent a
Exemplul 9.18. O companie are de ales ntre trei planuri de pensii
private. Se pune problema dac a preferintele pentru planurile de pensii
private sunt independente de forma de angajare cu = 0.05. Este
chestionat un esantion de 500 angajati iar rezultatele sunt prezentate
n urm atorul tabel:
1 2 3 Total
salariati full time 160 140 40 340
salariati part time 40 60 60 160
Total 200 200 100 500
Pasul 1. Variabilele de testat sunt preferintele pentru planurile de
de pensii private.
Pasul 2. Ipoteza H
0
: preferintele sunt independente de forma de
angajare.
Pasul 3. Ipoteza H
1
: preferintele nu sunt independente de forma
de angajare.
Pasul 4. = 0.05.
Pasul 5. Statistica folosit a este:
2
0
=
r
P
i=1
s
P
j=1
(o
ij
E
ij
)
2
E
ij
.
Pasul 6. r = 2, s = 3, num arul gradelor de libertate este (r 1)
(s 1) = 2,
2
0.05,2
= 5.99. Ipoteza va fi respins a dac a
2
0
>
2
0.05,2
=
5.99. Regiunea critic a este (5.99, ).
5.99146
Pasul 7. Pe baza tabelului calcul am
u
1
=
340
500
= 0.68, u
2
=
160
500
= 0.32,
v
1
=
200
500
= 0.4, v
2
=
200
500
= 0.4, v
3
=
100
500
= 0.2.
n = 500;
o11 = 160; o12 = 140; o13 = 40;
o21 = 40; o22 = 60; o23 = 60;
u1 = N[340/500]
0.68
u2 = N[160/500]
0.32
v1 = N[200/500]
0.4
v2 = N[200/500]
0.4
v3 = N[100/500]
0.2
Frecventele asteptate sunt
E
11
= n u
1
v
1
= 5000.680.4 = 136, E
12
= n u
1
v
2
= 5000.680.4 = 136,
E
13
= n u
1
v
3
= 5000.680.2 = 68, E
21
= n u
2
v
1
= 5000.320.4 = 64,
E
22
= n u
2
v
2
= 5000.320.4 = 64, E
23
= n u
2
v
3
= 5000.320.2 = 32.
E11 = n u1 v1
136
E12 = n u1 v2
136
E13 = n u1 v3
68
E21 = n u2 v1
64
E22 = n u2 v2
64
E23 = n u2 v3
32
2
0
=
r
X
i=1
s
X
j=1
(o
ij
E
ij
)
2
E
ij
=
=
(160 136)
2
136
+
(140 136)
2
136
+
(40 68)
2
68
+
(40 64)
2
64
+
+
(60 64)
2
64
+
(60 32)
2
32
= 49.632.
CHI = (o11 -E11)^2/E11 + (o12 - E12)^2/E12 + (o13 - E13)^2/E13
+ (o21 - E21)^2/E21 + ( o22 - E22)^2/E22 + (o23 - E23)^2/E23
49.6324
Pasul 8. Concluzii: deoarece
2
0
= 49.632 >
2
0.05,2
= 5.99 rezult a
c a nu avem motive s a accept am ipoteza c a preferintele pentru diferite
planuri de pensionare nu depind de forma de angajare.
9.3.2 Testarea omogeneit atii populatiilor
Mai multe populatii se numesc omogene dac a ele sunt formate din
acelasi num ar de subgrupe (straturi) cu acelasi procent din populatie
n fiecare subgrup a. Testul de omogeneitate poate fi v azut ca un test
de independent a.
Exemplul 9.19. 300 de elevi din ultimele clase de liceu au fost ches-
tionati asupra intentiilor lor de a-si continua studiile universitare n
trei domenii de interes. Rezultatele sunt prezentate n urm atorul tabel:
inginerie stiint a art a Total
b aieti 37 41 44 122
fete 35 72 71 178
Total 72 113 115 300
Testati ipoteza c a populatiile sunt omogene (adic a nu exist a leg a-
tur a ntre faptul c a elevul este b aiat sau fat a si tipul de facultate) cu
un nivel de ncredere de 90%. Concluziile ar fi diferite dac a nivelul de
ncredere ar fi de 95%?
Pasul 1. Test am dac a cele dou a populatii, formate din b aieti si
respectiv fete, sunt omogene.
Pasul 2. Ipoteza H
0
: preferintele sunt independente de faptul c a
elevul este b aiat sau fat a si tipul de facultate.
Pasul 3. Ipoteza H
1
: preferintele nu sunt independente de faptul
c a elevul este b aiat sau fat a si tipul de facultate.
Pasul 4. = 0.1.
Pasul 5. Statistica folosit a este:
2
0
=
r
P
i=1
s
P
j=1
(o
ij
E
ij
)
2
E
ij
Pasul 6. r = 2, s = 3, num arul gradelor de libertate este (r 1)
(s 1) = 2,
2
0.1,2
= 4.60517. Ipoteza va fi respins a dac a
2
0
>
2
0.05,2
=
4.60517. Regiunea critic a este (4.60517, ).
4.60517
Pasul 7. Pe baza tabelului calcul am
n = 300;
o11 = 37; o12 = 41; o13 = 44;
o21 = 35; o22 = 72; o23 = 71;
u1 = N[122/300]
0.406667
u2 = N[178/300]
0.593333
v1 = N[72/300]
0.24
v2 = N[113/300]
0.376667
v3 = N[115/300]
0.383333
E11 = n u1 v1
28.28
E12 = n u1 v2
45.9533
E13 = n u1 v3
46.7667
E21 = n u2 v1
42.72
E22 = n u2 v2
67.0467
E23 = n u2 v3
68.2333
CHI =(o11 - E11)^2/E11 +(o12 - E12)^2/E12 +(o13 - E13)^2/E13
+ (o21 - E21)^2/E21 + (o22 - E22)^2/E22 + (o23 - E23)^2/E23
4.60628
Pasul 8. Concluzii: deoarece
2
0
= 4.60628 >
2
0.05,2
= 4.60517
rezult a c a nu avem motive s a accept am ipoteza c a preferintele n ceea
ce priveste studiile viitoare sunt independente de faptul c a elevul este
b aiat sau fat a. Deci populatia nu este omogen a. Procentul de b aieti
care intentioneaz a s a urmeze anumite facult ati este diferit de procentul
de fete.
De exemplu, pentru inginerie, num arul datelor observate la b aieti
este 37, mai mare dect num arul asteptat, 29, dar pentru fete num arul
datelor observate este 35, mai mic dect cel asteptat care este de 43,
dac a ipoteza nul a ar fi fost adev arat a.
Dac a nivelul de ncredere este de 95%, atunci
5.99146
Regiunea critic a este (5.99145, ) si deci nu avem argumente s a
respingem ipoteza nul a, deci procentul de elevi care intentioneaz a s a
urmeze o anumit a facultate este acelasi n ambele situatii.
toarele:
1. modul de luare a deciziilor n testele statistice,
2. modul de folosire a testului asupra mediei unei populatii care
urmeaz a o distributie normal a, utilizarea testului Z sau a testului t,
3. modul de folosire a testului asupra dispersiei unei populatii care
urmeaz a o distributie normal a,
4. modul de folosire a testului asupra proportiei populatii,
5. utilizarea P-valorii,
6. calculul puterii testului, a erorii de tip II,
7. stabilirea unui volum al selectiei corespunz ator,
8. ntelegerea leg aturii ntre intervalele de ncredere si testele sta-
tistice,
9. utilizarea testului
2
.
Bibliografie
[1] Martha L. Abell, James P. Braselton, John A. Rafter - Statistics
with Mathematica, Academic Press, San Diego, 1998
[2] Petru Blaga - Statistic a...prin MATHLAB. Presa Universitar a
Clujean a, Cluj-Napoca, 2002
[3] Teresa Bradley - Essential Statistics for Economics, Business and
Management, John Willey&Sons, Inc., 2007
[4] Adrian Corduneanu - Matematici speciale, vol. II, Institutul Po-
litehnic Iasi, 1979
[5] Mariana Craiu - Statistic a matematic a, teorie si probleme, MA-
TRIX ROM, Bucuresti, 1998
[6] Kai Lai Chung - Elementary Probability Theory with Stichastic
Process, Springer Verlag, 1982
[7] Michael J. Evans, Jerey S. Rosenthal - Probability and Statis-
tics, W. H. Freeman and Company, New York, 2004
[8] Teohari Ganciu, Cristina Tugurlan - Elemente de statistic a si
abilitate, Editura "Gheorghe Asachi", 2002
[9] John J. Kinney - Probability, Willey&Sons, Inc., 1997
[10] Douglas C. Montgomery, George C. Runger - Applied Statis-
tics and Probability for Engineers, Fourth Edition, John Wil-
ley&Sons, Inc., 2006
[11] Viorel Petrehus, Sever-Angel Popescu - Probabilit ati si statistic a,
Bucuresti, 1997
347
348 BIBLIOGRAFIE
[12] Ariadna Lucia Pletea, Liliana Popa - Teoria Probabilit atilor, Uni-
versitatea Tehnic a "Gheorghe Asachi" din Iasi, 1999
[13] Tatiana St an asil a - Metode statistice pentru ingineri, teoria, exer-
citii, aplicatii, MATRIX ROM, Bucuresti, 1998
[14] P. Talpalaru, Gh. Sufaru Matematici speciale (Elemente de teo-
ria probabilit atilor si statistic a matematic a) Institutul Politehnic
Iasi, 1979
[15] P. Talpalaru, Liliana Popa, E. Popovici - Probleme de teoria prob-
abilit atilor si statistic a matematic a), Universitatea Tehnic a "Ghe-
orghe Asachi" din Iasi, 1995
Anexe
Tabele statistice
349
350 ANEXE
ANEXA 1. Functia de repartitie normal a standard
(x) = P(X x) =
Z
x
2
e
t
2
/2
dt
(x) +(x) = 1
-3 -2 -1 1 2 3
0.1
0.2
0.3
0.4
HxL
-3 -2 -1 1 2 3
0.1
0.2
0.3
0.4
x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.500000 0.503989 0.507978 0.511966 0.515953 0.519939 0.523922 0.527903 0.531881 0.535856
0.1 0.539828 0.543795 0.547758 0.551717 0.555670 0.559618 0.563559 0.567495 0.571424 0.575345
0.2 0.579260 0.583166 0.587064 0.590954 0.594835 0.598706 0.602568 0.606420 0.610261 0.614092
0.3 0.617911 0.621720 0.625516 0.629300 0.633072 0.636831 0.640576 0.644309 0.648027 0.651732
0.4 0.655422 0.659097 0.662757 0.666402 0.670031 0.673645 0.677242 0.680822 0.684386 0.687933
0.5 0.691462 0.694974 0.698468 0.701944 0.705401 0.708840 0.712260 0.715661 0.719043 0.722405
0.6 0.725747 0.729069 0.732371 0.735653 0.738914 0.742154 0.745373 0.748571 0.751748 0.754903
0.7 0.758036 0.761148 0.764238 0.767305 0.770350 0.773373 0.776373 0.779350 0.782305 0.785236
0.8 0.788145 0.791030 0.793892 0.796731 0.799546 0.802337 0.805105 0.807850 0.810570 0.813267
0.9 0.815940 0.818589 0.821214 0.823814 0.826391 0.828944 0.831472 0.833977 0.836457 0.838913
1.0 0.841345 0.843752 0.846136 0.848495 0.850830 0.853141 0.855428 0.857690 0.859929 0.862143
1.1 0.864334 0.866500 0.868643 0.870762 0.872857 0.874928 0.876976 0.879000 0.881000 0.882977
1.2 0.884930 0.886861 0.888768 0.890651 0.892512 0.894350 0.896165 0.897958 0.899727 0.901475
1.3 0.903200 0.904902 0.906582 0.908241 0.909877 0.911492 0.913085 0.914657 0.916207 0.917736
1.4 0.919243 0.920730 0.922196 0.923641 0.925066 0.926471 0.927855 0.929219 0.930563 0.931888
ANEXE 351
ANEXA 1. Functia de repartitie normal a standard (x) (continuare)
x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.5 0.933193 0.934478 0.935745 0.936992 0.938220 0.939429 0.940620 0.941792 0.942947 0.944083
1.6 0.945201 0.946301 0.947384 0.948449 0.949497 0.950529 0.951543 0.952540 0.953521 0.954486
1.7 0.955435 0.956367 0.957284 0.958185 0.959070 0.959941 0.960796 0.961636 0.962462 0.963273
1.8 0.964070 0.964852 0.965620 0.966375 0.967116 0.967843 0.968557 0.969258 0.969946 0.970621
1.9 0.971283 0.971933 0.972571 0.973197 0.973810 0.974412 0.975002 0.975581 0.976148 0.976705
2.0 0.977250 0.977784 0.978308 0.978822 0.979325 0.979818 0.980301 0.980774 0.981237 0.981691
2.1 0.982136 0.982571 0.982997 0.983414 0.983823 0.984222 0.984614 0.984997 0.985371 0.985738
2.2 0.986097 0.986447 0.986791 0.987126 0.987455 0.987776 0.988089 0.988396 0.988696 0.988989
2.3 0.989276 0.989556 0.989830 0.990097 0.990358 0.990613 0.990863 0.991106 0.991344 0.991576
2.4 0.991802 0.992024 0.992240 0.992451 0.992656 0.992857 0.993053 0.993244 0.993431 0.993613
2.5 0.993790 0.993963 0.994132 0.994297 0.994457 0.994614 0.994766 0.994915 0.995060 0.995201
2.6 0.995339 0.995473 0.995604 0.995731 0.995855 0.995975 0.996093 0.996207 0.996319 0.996427
2.7 0.996533 0.996636 0.996736 0.996833 0.996928 0.997020 0.997110 0.997197 0.997282 0.997365
2.8 0.997445 0.997523 0.997599 0.997673 0.997744 0.997814 0.997882 0.997948 0.998012 0.998074
2.9 0.998134 0.998193 0.998250 0.998305 0.998359 0.998411 0.998462 0.998511 0.998559 0.998605
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
352 ANEXE
ANEXA 2. Cuantilele t
,n
ale distributiei Student
F(t
,n
) = P (T t
,n
) =
Z
t,n
f(x)dx = 1 , F (t
,n
) =
-3 -2 -1 1 2 3
0.1
0.2
0.3
0.4
t
,n
-3 -2 -1 1 2 3
0.1
0.2
0.3
0.4
n, 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1 0.325 1.000 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
2 0.289 0.816 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.598
3 0.277 0.765 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 0.271 0.741 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.267 0.727 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.265 0.718 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.263 0.711 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.262 0.706 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.261 0.703 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.260 0.700 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.260 0.697 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.259 0.695 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.259 0.694 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.258 0.692 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.258 0.691 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
ANEXE 353
ANEXA 2. Cuantilele t
,n
ale distributiei Student (continuare)
n, 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
16 0.258 0.690 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.257 0.689 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.257 0.688 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.257 0.688 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.257 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.257 0.686 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.256 0.686 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 0.256 0.685 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 0.256 0.685 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.256 0.684 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.256 0.684 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.256 0.684 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.256 0.683 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.256 0.683 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.256 0.683 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
35 0.255 0.682 1.306 1.690 2.030 2.438 2.724 2.996 3.340 3.591
40 0.255 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
45 0.255 0.680 1.301 1.679 2.014 2.412 2.690 2.952 3.281 3.520
50 0.255 0.679 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
100 0.254 0.677 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
150 0.254 0.676 1.287 1.655 1.976 2.352 2.609 2.849 3.146 3.357
0.253 0.674 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
354 ANEXE
ANEXA 3. Cuantilele
2
,n
ale distributiei Hi p atrat
F

2
,n
= P

2

2
,n
=
Z

2
,n
f(t)dt = 1 ,
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
,n
2
5 10 15 20 25
0.02
0.04
0.06
0.08
0.1
n, 0.995 0.990 0.975 0.950 0.900 0.500 0.100 0.050 0.025 0.010 0.005
1 0.00+ 0.00+ 0.00+ 0.00+ 0.02 0.45 2.71 3.84 5.02 6.63 7.88
2 0.01 0.02 0.05 0.10 0.21 1.39 4.61 5.99 7.38 9.21 10.60
3 0.07 0.11 0.22 0.35 0.58 2.37 6.25 7.81 9.35 11.34 12.84
4 0.21 0.30 0.48 0.71 1.06 3.36 7.78 9.49 11.14 13.28 14.86
5 0.41 0.55 0.83 1.15 1.61 4.35 9.24 11.07 12.83 15.09 16.75
6 0.68 0.87 1.24 1.64 2.20 5.35 10.64 12.59 14.45 16.81 18.55
7 0.99 1.24 1.69 2.17 2.83 6.35 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 7.34 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.70 3.33 4.17 8.34 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 9.34 15.99 18.31 20.48 23.21 25.19
11 2.60 3.05 3.82 4.57 5.58 10.34 17.28 19.68 21.92 24.72 26.76
12 3.07 3.57 4.40 5.23 6.30 11.34 18.55 21.03 23.34 26.22 28.30
ANEXE 355
ANEXA 3. Cuantilele
2
,n
ale distributiei Hi p atrat (continuare)
n, 0.995 0.990 0.975 0.950 0.900 0.500 0.100 0.050 0.025 0.010 0.005
13 3.57 4.11 5.01 5.89 7.04 12.34 19.81 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 7.79 13.34 21.06 23.68 26.12 29.14 31.32
15 4.60 5.23 6.26 7.26 8.55 14.34 22.31 25.00 27.49 30.58 32.80
16 5.14 5.81 6.91 7.96 9.31 15.34 23.54 26.30 28.85 32.00 34.27
17 5.70 6.41 7.56 8.67 10.09 16.34 24.77 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 10.86 17.34 25.99 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.12 11.65 18.34 27.20 30.14 32.85 36.19 38.58
20 7.43 8.26 9.59 10.85 12.44 19.34 28.41 31.41 34.17 37.57 40.00
21 8.03 8.90 10.28 11.59 13.24 20.34 29.62 32.67 35.48 38.93 41.40
22 8.64 9.54 10.98 12.34 14.04 21.34 30.81 33.92 36.78 40.29 42.80
23 9.26 10.20 11.69 13.09 14.85 22.34 32.01 35.17 38.08 41.64 44.18
24 9.89 10.86 12.40 13.85 15.66 23.34 33.20 36.42 39.36 42.98 45.56
25 10.52 11.52 13.12 14.61 16.47 24.34 34.38 37.65 40.65 44.31 46.93
26 11.16 12.20 13.84 15.38 17.29 25.34 35.56 38.89 41.92 45.64 48.29
27 11.81 12.88 14.57 16.15 18.11 26.34 36.74 40.11 43.19 46.96 49.64
28 12.46 13.56 15.31 16.93 18.94 27.34 37.92 41.34 44.46 48.28 50.99
29 13.12 14.26 16.05 17.71 19.77 28.34 39.09 42.56 45.72 49.59 52.34
30 13.79 14.95 16.79 18.49 20.60 29.34 40.26 43.77 46.98 50.89 53.67
40 20.71 22.16 24.43 26.51 29.05 39.34 51.81 55.76 59.34 63.69 66.77
50 27.99 29.71 32.36 34.76 37.69 49.33 63.17 67.50 71.42 76.15 79.49
60 35.53 37.48 40.48 43.19 46.46 59.33 74.40 79.08 83.30 88.38 91.95
70 43.28 45.44 48.76 51.74 55.33 69.33 85.53 90.53 95.02 100.43 104.21
80 51.17 53.54 57.15 60.39 64.28 79.33 96.58 101.88 106.63 112.33 116.32
90 59.20 61.75 65.65 69.13 73.29 89.33 107.57 113.15 118.14 124.12 128.30
100 67.33 70.06 74.22 77.93 82.36 99.33 118.50 124.34 129.56 135.81 140.17
356 ANEXE
ANEXA 4. Cuantilele f
,u,v
ale repartitiei Fisher, F (f
,u,v
) =
R
f,u,v
f(x)dx = 1 , = 0.25.
v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 60 120
1 5.83 7.50 8.20 8.58 8.82 8.98 9.10 9.19 9.26 9.32 9.37 9.41 9.44 9.47 9.49 9.58 9.63 9.67 9.71 9.76 9.80 9.85
2 2.57 3.00 3.15 3.23 3.28 3.31 3.34 3.35 3.37 3.38 3.39 3.39 3.40 3.41 3.41 3.43 3.44 3.44 3.45 3.46 3.47 3.48
3 2.02 2.28 2.36 2.39 2.41 2.42 2.43 2.44 2.44 2.44 2.45 2.45 2.45 2.45 2.46 2.46 2.46 2.47 2.47 2.47 2.47 2.47
4 1.81 2.00 2.05 2.06 2.07 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08 2.08
5 1.69 1.85 1.88 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.89 1.88 1.88 1.88 1.88 1.87 1.87 1.97
6 1.62 1.76 1.78 1.79 1.79 1.78 1.78 1.78 1.77 1.77 1.77 1.77 1.77 1.76 1.76 1.76 1.75 1.75 1.75 1.74 1.74 1.74
7 1.57 1.70 1.72 1.72 1.71 1.71 1.70 1.70 1.69 1.69 1.69 1.68 1.68 1.68 1.68 1.67 1.67 1.66 1.66 1.65 1.65 1.65
8 1.54 1.66 1.67 1.66 1.66 1.65 1.64 1.64 1.63 1.63 1.63 1.62 1.62 1.62 1.62 1.61 1.60 1.60 1.59 1.59 1.58 1.58
9 1.51 1.62 1.63 1.63 1.62 1.61 1.60 1.60 1.59 1.59 1.58 1.58 1.58 1.57 1.57 1.56 1.55 1.55 1.54 1.54 1.53 1.53
10 1.49 1.60 1.60 1.59 1.59 1.58 1.57 1.56 1.56 1.55 1.55 1.54 1.54 1.54 1.53 1.52 1.52 1.51 1.51 1.50 1.49 1.48
11 1.47 1.58 1.58 1.57 1.56 1.55 1.54 1.53 1.53 1.52 1.52 1.51 1.51 1.51 1.50 1.49 1.49 1.48 1.47 1.47 1.46 1.45
12 1.46 1.56 1.56 1.55 1.54 1.53 1.52 1.51 1.51 1.50 1.49 1.49 1.49 1.48 1.48 1.47 1.46 1.45 1.45 1.44 1.43 1.42
13 1.45 1.55 1.55 1.53 1.52 1.51 1.50 1.49 1.49 1.48 1.47 1.47 1.47 1.46 1.46 1.45 1.44 1.43 1.42 1.42 1.41 1.40
14 1.44 1.53 1.53 1.52 1.51 1.50 1.49 1.48 1.47 1.46 1.46 1.45 1.45 1.44 1.44 1.43 1.42 1.41 1.41 1.40 1.39 1.38
15 1.43 1.52 1.52 1.51 1.49 1.48 1.47 1.46 1.46 1.45 1.44 1.44 1.43 1.43 1.43 1.41 1.40 1.40 1.39 1.38 1.37 1.36
16 1.42 1.51 1.51 1.50 1.48 1.47 1.46 1.45 1.44 1.44 1.43 1.43 1.42 1.42 1.41 1.40 1.39 1.38 1.37 1.36 1.35 1.34
17 1.42 1.51 1.50 1.49 1.47 1.46 1.45 1.44 1.43 1.43 1.42 1.41 1.41 1.41 1.40 1.39 1.38 1.37 1.36 1.35 1.34 1.33
18 1.41 1.50 1.49 1.48 1.46 1.45 1.44 1.43 1.42 1.42 1.41 1.40 1.40 1.40 1.39 1.38 1.37 1.36 1.35 1.34 1.33 1.32
19 1.41 1.49 1.49 1.47 1.46 1.44 1.43 1.42 1.41 1.41 1.40 1.40 1.39 1.39 1.38 1.37 1.36 1.35 1.34 1.33 1.32 1.30
20 1.40 1.49 1.48 1.47 1.45 1.44 1.43 1.42 1.41 1.40 1.39 1.39 1.38 1.38 1.37 1.36 1.35 1.34 1.33 1.32 1.31 1.29
25 1.39 1.47 1.46 1.44 1.42 1.41 1.40 1.39 1.38 1.37 1.36 1.36 1.35 1.35 1.34 1.33 1.31 1.31 1.29 1.28 1.27 1.25
30 1.38 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.36 1.35 1.34 1.34 1.33 1.33 1.32 1.30 1.29 1.28 1.27 1.26 1.24 1.23
40 1.36 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34 1.33 1.32 1.31 1.31 1.30 1.30 1.28 1.26 1.25 1.24 1.22 1.21 1.19
60 1.35 1.42 1.41 1.38 1.37 1.35 1.33 1.32 1.31 1.30 1.29 1.29 1.28 1.27 1.27 1.25 1.23 1.22 1.21 1.19 1.17 1.15
120 1.34 1.40 1.39 1.37 1.35 1.33 1.31 1.30 1.29 1.28 1.27 1.26 1.26 1.25 1.24 1.22 1.20 1.19 1.18 1.16 1.13 1.10
1.32 1.39 1.37 1.35 1.33 1.31 1.29 1.28 1.27 1.25 1.25 1.24 1.23 1.22 1.22 1.19 1.17 1.16 1.14 1.12 1.08 1.00
ANEXE 357
,u,v
ale repartitiei Fisher, = 0.10 (continuare).
v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 60 120
1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19 60.47 60.71 60.90 61.07 61.22 61.74 62.05 62.26 62.53 62.79 63.06 63.36
2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.40 9.41 9.41 9.42 9.42 9.44 9.45 9.46 9.47 9.47 9.48 9.49
3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 5.22 5.22 5.21 5.20 5.20 5.18 5.17 5.17 5.16 5.15 5.14 5.13
4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 3.91 3.90 3.89 3.88 3.87 3.84 3.83 3.82 3.80 3.79 3.78 3.76
5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.28 3.27 3.26 3.25 3.24 3.21 3.19 3.17 3.16 3.14 3.12 3.11
6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.92 2.90 2.89 2.88 2.87 2.84 2.81 2.80 2.78 2.76 2.74 2.72
7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.68 2.67 2.65 2.64 2.63 2.59 2.57 2.56 2.54 2.51 2.49 2.47
8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.52 2.50 2.49 2.48 2.46 2.42 2.40 2.38 2.36 2.34 2.32 2.29
9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.40 2.38 2.36 2.35 2.34 2.30 2.27 2.25 2.23 2.21 2.18 2.16
10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.30 2.28 2.27 2.26 2.24 2.20 2.17 2.16 2.13 2.11 2.08 2.06
11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.23 2.21 2.19 2.18 2.17 2.12 2.10 2.08 2.05 2.03 2.00 1.97
12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 2.17 2.15 2.13 2.12 2.10 2.06 2.03 2.01 1.99 1.96 1.93 1.90
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 2.12 2.10 2.08 2.07 2.05 2.01 1.98 1.96 1.93 1.90 1.88 1.85
14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 2.07 2.05 2.04 2.02 2.01 1.96 1.93 1.91 1.89 1.86 1.83 1.80
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.92 1.89 1.87 1.85 1.82 1.79 1.76
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 2.01 1.99 1.97 1.95 1.94 1.89 1.86 1.84 1.81 1.78 1.75 1.72
17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 1.98 1.96 1.94 1.93 1.91 1.86 1.83 1.81 1.78 1.75 1.72 1.69
18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 1.95 1.93 1.92 1.90 1.89 1.84 1.80 1.78 1.75 1.72 1.69 1.66
19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 1.93 1.91 1.89 1.88 1.86 1.81 1.78 1.76 1.73 1.70 1.67 1.63
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 1.91 1.89 1.87 1.86 1.84 1.79 1.76 1.74 1.71 1.68 1.64 1.61
25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 1.84 1.82 1.80 1.79 1.77 1.72 1.68 1.66 1.63 1.59 1.56 1.52
30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 1.79 1.77 1.75 1.74 1.72 1.67 1.63 1.61 1.57 1.54 1.50 1.46
40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 1.74 1.71 1.70 1.68 1.66 1.61 1.57 1.54 1.51 1.47 1.42 1.38
60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 1.68 1.66 1.64 1.62 1.60 1.54 1.50 1.48 1.44 1.40 1.35 1.29
120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 1.65 1.63 1.60 1.58 1.56 1.55 1.48 1.44 1.41 1.37 1.32 1.26 1.19
2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63 1.60 1.57 1.55 1.52 1.50 1.49 1.42 1.38 1.34 1.30 1.24 1.17 1.00
358 ANEXE
,u,v
v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 60 120
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 246.0 248.0 249.3 250.1 251.1 252.2 253.3 264.7
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.45 19.46 19.46 19.47 19.48 19.49 19.50
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.66 8.63 8.62 8.59 8.57 8.55 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.56 4.52 4.50 4.46 4.43 4.40 4.37
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.87 3.83 3.81 3.77 3.74 3.70 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.44 3.40 3.38 3.34 3.30 3.27 3.23
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.15 3.11 3.08 3.04 3.01 2.97 2.93
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.94 2.89 2.86 2.83 2.79 2.75 2.71
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.77 2.73 2.70 2.66 2.62 2.58 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.65 2.60 2.57 2.53 2.49 2.45 2.40
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.54 2.50 2.47 2.43 2.38 2.34 2.30
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.46 2.41 2.38 2.34 2.30 2.25 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.39 2.34 2.31 2.27 2.22 2.18 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.33 2.28 2.25 2.20 2.16 2.11 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.28 2.23 2.19 2.15 2.11 2.06 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.23 2.18 2.15 2.10 2.06 2.01 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.19 2.14 2.11 2.06 2.02 1.97 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.12 2.07 2.04 1.99 1.95 1.90 1.84
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.20 2.16 2.14 2.11 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.06 2.04 2.01 1.93 1.88 1.84 1.79 1.74 1.68 1.62
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.97 1.95 1.92 1.84 1.78 1.74 1.69 1.64 1.58 1.51
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.89 1.86 1.84 1.75 1.69 1.65 1.59 1.53 1.47 1.39
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.87 1.83 1.80 1.78 1.75 1.66 1.60 1.55 1.50 1.43 1.35 1.25
3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.79 1.75 1.72 1.69 1.67 1.57 1.51 1.46 1.39 1.32 1.22 1.00
ANEXE 359
,u,v
v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 60 120
1 647.8 799.5 864.2 899.6 921.9 937.1 948.2 956.7 963.3 968.6 973.0 976.7 979.8 982.5 984.9 993.1 998.1 1001 1006 1010 1014 1018
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 39.41 39.42 39.43 39.43 39.45 39.46 39.46 39.47 39.48 39.49 39.50
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.37 14.34 14.30 14.28 14.25 14.17 14.12 14.08 14.04 13.99 13.95 13.90
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.79 8.75 8.71 8.68 8.66 8.56 8.50 8.46 8.41 8.36 8.31 8.26
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.57 6.52 6.49 6.46 6.43 6.33 6.27 6.23 6.18 6.12 6.07 6.02
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.41 5.37 5.33 5.30 5.27 5.17 5.11 5.07 5.01 4.96 4.90 4.85
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.71 4.67 4.63 4.60 4.57 4.47 4.40 4.36 4.31 4.25 4.20 4.14
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.24 4.20 4.16 4.13 4.10 4.00 3.94 3.89 3.84 3.78 3.73 3.67
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.91 3.87 3.83 3.80 3.77 3.67 3.60 3.56 3.51 3.45 3.39 3.33
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.66 3.62 3.58 3.55 3.52 3.42 3.35 3.31 3.26 3.20 3.14 3.08
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.47 3.43 3.39 3.36 3.33 3.23 3.16 3.12 3.06 3.00 2.94 2.88
12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.32 3.28 3.24 3.21 3.18 3.07 3.01 2.96 2.91 2.85 2.79 2.73
13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.20 3.15 3.12 3.08 3.05 2.95 2.88 2.84 2.78 2.72 2.66 2.60
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.09 3.05 3.01 2.98 2.95 2.84 2.78 2.73 2.67 2.61 2.55 2.49
15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 3.01 2.96 2.92 2.89 2.86 2.76 2.69 2.64 2.59 2.52 2.46 2.40
16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.93 2.89 2.85 2.82 2.79 2.68 2.61 2.57 2.51 2.45 2.38 2.32
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.87 2.82 2.79 2.75 2.72 2.62 2.55 2.50 2.44 2.38 2.32 2.25
18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.81 2.77 2.73 2.70 2.67 2.56 2.49 2.44 2.38 2.32 2.26 2.19
19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.76 2.72 2.68 2.65 2.62 2.51 2.44 2.39 2.33 2.27 2.20 2.13
20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.72 2.68 2.64 2.60 2.57 2.46 2.40 2.35 2.29 2.22 2.16 2.09
25 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.56 2.51 2.48 2.44 2.41 2.30 2.23 2.18 2.12 2.05 1.98 1.91
30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.46 2.41 2.37 2.34 2.31 2.20 2.12 2.07 2.01 1.94 1.87 1.79
40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.33 2.29 2.25 2.21 2.18 2.07 1.99 1.94 1.88 1.80 1.72 1.64
60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 2.22 2.17 2.13 2.09 2.06 1.94 1.87 1.82 1.74 1.67 1.58 1.48
120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 2.10 2.05 2.01 1.98 1.94 1.82 1.75 1.69 1.61 1.53 1.43 1.31
5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05 1.99 1.94 1.90 1.87 1.83 1.71 1.63 1.57 1.48 1.39 1.27 1.00
360 ANEXE
,u,v
v, u 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 60 120
1 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106 6126 6143 6157 6209 6240 6261 6287 6313 6339 9999
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.41 99.42 99.42 99.43 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.13 27.05 26.98 26.92 26.87 26.69 26.58 26.50 26.41 26.32 26.22 26.12
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.31 14.25 14.20 14.02 13.91 13.84 13.75 13.65 13.56 13.46
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.82 9.77 9.72 9.55 9.45 9.38 9.29 9.20 9.11 9.02
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.60 7.56 7.40 7.30 7.23 7.14 7.06 6.97 6.88
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 6.36 6.31 6.16 6.06 5.99 5.91 5.82 5.74 5.65
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.61 5.56 5.52 5.36 5.26 5.20 5.12 5.03 4.95 4.86
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.01 4.96 4.81 4.71 4.65 4.57 4.48 4.40 4.31
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65 4.60 4.56 4.41 4.31 4.25 4.17 4.08 4.00 3.91
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.34 4.29 4.25 4.10 4.01 3.94 3.86 3.78 3.69 3.60
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.10 4.05 4.01 3.86 3.76 3.70 3.62 3.54 3.45 3.36
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.91 3.86 3.82 3.66 3.57 3.51 3.43 3.34 3.25 3.17
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.75 3.70 3.66 3.51 3.41 3.35 3.27 3.18 3.09 3.00
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.61 3.56 3.52 3.37 3.28 3.21 3.13 3.05 2.96 2.87
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.50 3.45 3.41 3.26 3.16 3.10 3.02 2.93 2.84 2.75
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.40 3.35 3.31 3.16 3.07 3.00 2.92 2.83 2.75 2.65
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.32 3.27 3.23 3.08 2.98 2.92 2.84 2.75 2.66 2.57
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.24 3.19 3.15 3.00 2.91 2.84 2.76 2.67 2.58 2.49
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 3.09 2.94 2.84 2.78 2.69 2.61 2.52 2.42
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 3.06 2.99 2.94 2.89 2.85 2.70 2.60 2.54 2.45 2.36 2.27 2.17
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.91 2.84 2.79 2.74 2.70 2.55 2.45 2.39 2.30 2.21 2.11 2.01
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 2.66 2.61 2.56 2.52 2.37 2.27 2.20 2.11 2.02 1.92 1.80
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 2.44 2.39 2.35 2.20 2.10 2.03 1.94 1.84 1.73 1.60
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.40 2.34 2.28 2.23 2.19 2.03 1.93 1.86 1.76 1.66 1.53 1.38
6.64 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.25 2.18 2.13 2.08 2.04 1.88 1.77 1.70 1.59 1.47 1.32 1.00
Index de notiuni
Abatere medie p atratic a, 49, 98
de selectie, 210
Amplitudine, 210
Aranjamente, 19
Asimetrie, 98
Cmp de evenimente, 6
finit, 6
Cmp de probabilitate, 9
Coeficient de corelatie, 55, 191
liniar a, 217
Coeficient de variatie, 210
Combin ari, 19
Convergent a n probabilitate, 99
Corelatie, 54, 190
Covariant a, 54, 190, 213
Densitate de probabilitate, 96,
178
conditionat a, 180
marginal a, 179
Diagram a de mpr astiere, 213
Dispersie, 48, 98, 181
de selectie, 209
marginal a, 213
Dreapt a de regresie, 214
Esantion, 197
aleator, 198
reprezentativ, 198
Ecuatii de verosimilitate, 233
Eroare
de tip I, 298
de tip II, 299
standard, 272
Estimatie de verosimilitate ma-
xim a, 232
Estimator, 221
absolut corect, 225
corect, 225
deplasat, 225
nedeplasat, 225
Eveniment, 3
cert, 4
compus, 4
contrar, 4
elementar, 4
imposibil, 4
sigur, 4
Evenimente
compatibile, 5
incompatibile, 5
independente, 11
Exces, 98
Exemplul lui Bernstein, 12
Formula
lui Bayes, 16
lui Howe, 278
lui Mann-Wald, 325
lui Stirling, 64
lui Sturges, 202
probabilit atii totale, 15
Frecvent a
361
362 INDEX DE NO TIUNI
absolut a, 198
cumulat a cresc ator, 198
dubl a, 212
marginal a, 212
relativ a, 198
cumulat a cresc ator, 198
Functia
caracteristic a, 117
de distributie cumulativ a, 93
de frecvent a, 222, 223
de fiabilitate, 128
de nesigurant a, 128
de reliabilitate, 128
de repartitie, 43, 93, 178
empiric a, 198
de verosimilitate maxim a, 231,
235
gama, 110
generatoare, 59
lui Heaviside, 44
scor, 232
Histogram a, 199
Inegalitatea lui Cebsev, 56, 99
Interval de
ncredere, 251
tolerant a, 277
Ipotez a statistic a, 293
Legea
evenimentelor rare, 74
numerelor mari, 100
Legi de probabilitate marginale,
175
M asur a de probabilitate, 8
Matrice de repartitie, 42
Median a, 98, 209
Medie, 47, 98, 180
de selectie, 208
marginal a, 213
Mod a, 98, 202
Model
probabilistic, 219
statistic, 220
Modul, 209
Moment
centrat, 48, 98
initial, 48, 98
Nivel de ncredere, 251
P-valoare, 301
Pas de histogram a, 202
Permut ari, 18
Poligonul frecventelor, 207
Populatie statistic a, 197
Principiul multiplic arii, 18
Prob a, 3
Probabilitate, 8
conditionat a, 10, 174
marginal a, 174
Proprietatea de pierdere a me-
moriei, 107
Putere a testului, 302
Rat a de defectare, 128
Regiune critic a, 295
Regula celor trei sigma, 115
Repartitia selectiei, 220
Repartitie
binomial a, 62
binomial a cu exponent ne-
gativ, 66
exponential a, 105
gama, 110
geometric a, 69
hi p atrat, 121
hipergeometric a, 71
INDEX DE NO TIUNI 363
lognormal a, 126
multinomial a, 65
normal a, 111
bidimensional a, 192
Poisson, 73
Student, 123
uniform a, 59, 103
Weibull, 108
Schema
bilei revenite, 23
hipergeometric a, 25
lui Bernoulli, 23
cu mai multe st ari, 24
lui Poisson, 21
Selectie, 197
aleatoare, 220
Selectare
cu ntoarcere si cu revenire,
20
cu ntoarcere si f ar a revenire,
21
f ar a ntoarcere si cu revenire,
20
f ar a ntoarcere si f ar a revenire,
21
Serie
marginal a, 212
statistic a, 201
Sistem complet de evenimente,
7
Spatiu de selectie, 3
continuu, 3
discret, 3
Sperant a matematic a, 210
Statistic a, 221
Tabel de contingent a, 339
Tablou de repartitie, 42
Teorema
limit a central a, 153
Rao-Cramer, 239
Test
neparametric, 293
parametric, 293
Testul
Pearson, 324
Student, 261
T, 263
Z, 254
Unitate statistic a, 197
Variabil a
aleatoare, 41
discret a, 42
statistic a, 197
continu a, 198
discret a, 198
Variabile aleatoare
independente, 47
necorelate, 54
Variant a, 210
Vector aleator, 41, 173
discret, 173

Carte SPD

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Carte SPD

Încărcat de

Drepturi de autor:

Formate disponibile

Ariadna Lucia Pletea Mircea Lupan

SATISTIC PRIN ... MATLAB I

. Multimea I este notat a n figura

= 0.1 0.8 = 0.08.

52 CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE

CAPITOLUL 2. VARIABILE ALEATOARE DISCRETE 55

n care presupunem c a am scris valorile n ordine cresc atoare, si deci

. Deosebirea este esential a:

. Evident P(k; ) > 0 si

({X = 1}{Y = 2})({X = 0}{Y = 1})

= P ({X = 1} {X = 1}) = 0.3 + 0.3 = 0.6.

. Calculnd primele cteva coloane ale tabloului

= {X x} si proprietatea de continuitate a proba-

f(x)dx = 0.5, adic a dreapta x = x

f(x)dx = 1. Ultima parantez a se poate scrie

= 1(1.5) = 10.93319 = 0.066 81.

f (x) dx = 1, rezult a c a aria triunghiului

3. Cunoscnd coordonatele vrfurilor triunghiului, putem

f (t) dt, g asim

154 CAPITOLUL 3. VARIABILE ALEATOARE CONTINUE

. Atunci pentru orice

3. Pentru a realiza toate acestea este necesar s a se

sunt independente. Atunci valoare lui S

au aceeasi repartitie (binomial a) si sunt independente. Apli-

> 0.9. (4.3)

< 0.2 0.3 <

10000 0.7 0.3

10000 0.7 0.3 3.09 = 7141.6 7142 se numeste

120 1.2 = 13.1,

CAPITOLUL 4. TEOREMA LIMIT

npq adic a ntre

1200000 0.6 0.4 = 718840

1200000 0.6 0.4 = 721160.

1200000 0.6 0.4 = 718950

1200000 0.6 0.4 = 721050.

1200000 0.6 0.4 = 718620

1200000 0.6 0.4 = 721380.

50 0.1 0.9 = 2.1213,

6.2 Reprezentarea grafic a a datelor statis-

6.4 Statistica a dou a variabile

Exist a o stns a leg atur a ntre coeficientul unghiular al dreptei de

] = 0 de unde rezult a concluzia.

care este minim a pentru =

si estimatia de verosimilitate maxim a este solutie a ecuatiei

se obtine rezolvnd sistemul

este unicul estimator de verosimilitate maxim a pentru

1 = (z) (z) 1 = 1 2(z) (z) =

90% 0.05 1.6449 [73.0760; 77.0445]

si este un interval de ncredere unilateral.

valoarea obtinut a din relatia (z) = .

se obtine din relatia (z) = 1 .

este un interval de ncredere pentru media m cu coecientul de n-

pentru diferenta mediilor.

nu avem motive s a respingem

pentru x (greutatea produsului) este [991, 23; 1000, 1]. Programul

atunci nu avem motive s a respingem ipoteza H

= 0.660 36 este estimator de verosimilitate maxim a.

S-ar putea să vă placă și