Sunteți pe pagina 1din 285

PREFA Cartea pe care o prezentm este conceput s acopere programa analitic, n special, pentru studenii Facultii de Cibernetic, Statistic

i Informatic Economic, din anul II i III. Ea este util i studenilor de la celelalte faculti din cadrul Academiei de Studii Economice i, de ce nu, pentru studenii facultilor de profil economic din ar. Materialul prezentat urmrete s dea posibilitatea studenilor economiti s neleag modelarea aleatoare a fenomenelor economice, s rezolve probleme de teoria probabilitilor i statistic matematic, s neleag i s ptrund cunotinele dobndite deja la cursul de statistic teoretic sau economic. Ne-am strduit s utilizm pe ct posibil numai noiunile de algebr liniar i analiz matematic pe care le dobndesc studenii la cursul de Matematici cu aplicaii n economie, fr a face concesii prea mari rigorii tiinifice specifice cursurilor de matematic. Dei timpul alocat studiului teoriei probabilitilor (inclusiv cunotine de teoria proceselor stochastice) i statisticii matematice foarte limitat ne-a silit s scoatem din program noiuni i rezultate de teoria informaiei, am considerat c n acest curs trebuie s-i gseasc loc i un capitol de teoria informaiei, pentru ca studentul s-i completeze cunotinele cu care vine n contact la cursurile de informatic. n unele situaii sunt prezentate i aplicaii, dar acestea sunt n numr redus, dat fiind faptul c urmeaz s apar o culegere de probleme unde vor fi reflectate mai bine noiunile i rezultatele obinute, prin exemple variate att sub form teoretic, ct i numeric. Coninutul crii este completat cu o anex n care figureaz tabele statistice ale principalelor funcii de repartiie ce intervin frecvent n aplicaii. Tot aici este dat o tabel ce cuprinde valorile funciei-plogp necesar rezolvrii problemelor n care intervine efectiv noiunea de entropie. Bibliografia pe care am indicat-o n final are rolul de a indica cititorului unde poate gsi demonstraii complexe i riguroase ale unor teoreme pe care nu le-am putut prezenta fie din lips de spaiu, fie din cauz c ar fi necesitat completri teoretice pentru a putea fi nelese. Parcurgnd bibliografia, cititorul are la dispoziie piste pentru lmuriri suplimentare sau completri de cunotine. Aceast bibliografie este orientativ i am cutat s facem trimiteri, pe ct posibil, la lucrri de referin, fie ele n limba romn, fie n alte limbi de larg circulaie. Vom primi cu mult simpatie sugestiile cititorilor, n vederea mbuntirii coninutului crii, pentru a fi de un real folos celor ce sunt interesai i care au un bagaj relativ de cunotine n alte domenii de matematic. Vom ncheia prin a sublinia faptul c la capitolul Procese Markov i Poisson am considerat util s artm c se pot obine unele modele din teoria firelor de ateptare prin particularizarea procesului general de natere i moarte, dat fiind faptul c n cadrul cursului de Cercetri operaionale nu este timp suficient pentru obinerea sistemului de ecuaii caracteristice modelului. AUTORII

Capitolul 1 CMP DE EVENIMENTE. CMP DE PROBABILITATE 1.1. Evenimente Noiunea primar cu care se opereaz n teoria probabilitilor este noiunea de eveniment. Prin eveniment se nelege rezultatul unui experiment. Cnd vorbim de experiment, nelegem un fenomen n ansamblul su, indiferent dac, n evoluia sa, este dirijat, provocat de om sau nu. Prin urmare, cnd vorbim de un experiment subnelegem existena unui complex de condiii, la care ne raportm n studiul fenomenului considerat i fa de care considerm diversele rezultate posibile, diversele evenimente. Din punct de vedere probabilistic, ne intereseaz acele fenomene, experimente, ale cror rezultate nu pot fi prevzute cu certitudine, care au loc dup o legitate de tip determinist. Intereseaz acele experimente ale cror rezultate, influenate de o multitudine de factori ce acioneaz ntmpltor - n cadrul complexului de condiii care se presupune a fi asigurat - i care determin un caracter ntmpltor evenimentelor ce apar. Aceast aciune ntmpltoare nu este haotic, ci are un caracter legic, care este specific teoriei probabilitilor i statisticii matematice. Aadar, evenimentele apar dup o anumit legitate, creia i vom spune s este de tip stochastic i n studiul oricrui fenomen cutm s determinm legitatea de evoluie a sa. Evenimentele ce apar ca rezultat al unor experimente le vom nota A, B, C cu indici sau nu, dup cum va fi necesar ntr-un context dat. n mulimea evenimentelor distingem unele evenimente remarcabile. Evenimentul care se realizeaz cu certitudine ntr-o experien ce are loc n cadrul unui complex de condiii date, l vom numi evenimentul sigur i-l vom nota cu sau E. Evenimentul care nu se realizeaz niciodat n cadrul unui experiment dat, l vom numi evenimentul imposibil i-l vom nota cu . Evenimentul contrar sau complementar unui eveniment A este acel eveniment care se realizeaz atunci i numai atunci cnd nu se realizeaz A. Vom nota acest eveniment cu AC sau A . ntre evenimente exist relaii logice pe care le vom nota cu semnele utilizate n teoria mulimilor. Astfel, vom nota o familie de evenimente cu litere mari ronde i dac A este un eveniment ce aparine unei familii K de evenimente, vom scrie A K. De asemenea, dac A este o familie de evenimente coninute n familia K, vom scrie A K. Dac realizarea evenimentului A atrage dup sine (implic) realizarea evenimentului B vom scrie A B. Dou evenimente A i B sunt echivalente dac se implic unul pe altul i vom scrie A = B. Deci, A B i B A A = B. n cadrul unui complex de condiii date, pentru un eveniment A arbitrar, avem implicaiile: A n mulimea evenimentelor legate de un experiment dat, relaia de implicaie constituie o relaie de ordine parial. Aceasta nseamn c operaia are proprietile: i) reflexivitate: A A oricare ar fi evenimentul A ii) antisimetria: dac A B i B A, atunci A = B iii) tranzitivitatea: dac A B i B C, atunci A C iv) pot exista evenimente A, B astfel nct A B i B A.
9

Operaii cu evenimente. Ca i relaiile dintre evenimente, operaiile cu evenimente sunt operaii logice i ele vor fi simbolizate ca n teoria mulimilor. Dac A i B sunt evenimente, vom considera evenimentul care const n realizarea sau a evenimentului A sau a evenimentului B i-l vom nota A B (se citete evenimentul A sau B). Odat cu evenimentele A, B, considerm evenimentul care const n realizarea simultan a evenimentelor A, B i-l vom nota A B (se citete evenimentul A i B). Dou evenimente a cror realizare simultan este echivalent cu evenimentul imposibil se numesc incompatibile i vom scrie A B = ; n caz contrar, evenimentele se numesc compatibile (A B ). Fiind date evenimentele A, B se introduce evenimentul care const n realizarea evenimentului A i nerealizarea evenimentului B, notat A - B. Se constat imediat c A - B = A B ; B = - B (complementarul fa de ). Putem enuna acum un rezultat asupra cruia vom mai reveni. Orice reuniune de evenimente arbitrare se poate scrie ca o reuniune de evenimente incompatibile. ntr-adevr, dac evenimentele A1,A2,,An sunt compatibile, atunci dac
Bk = A k U Aj , k=1,2,,n se constat imediat c BkBk=, kk, k,k{1,2,,n} i
j=1 k-1

U A = U (A - U A )
k k j k =1 k =1 j=1

k-1

UB
k =1

Cmp de evenimente. S considerm o mulime arbitrar i () mulimea prilor lui . Definiie. O familie nevid K() se numete corp de pri (mulimi ) dac: i) () AK A K ii) () A,BK ABK Observaie. Axioma ii) este echivalent cu:
ii) () A1,A2,,AnK, nN, n2

U A K.
k k =1

ntr-adevr, ii) ii) deoarece A1,A2K A1A2K. Lum acum A1A2,A3K A1A2A3K .a.m.d. Dac A1A2An-1K, AnK

UA
k =1

K. ii) ii) deoarece

pentru n = 2, dac punem A1=A, A2=B, rezult afirmaia. Asociativitatea reuniunii, mpreun cu i) i ii) implic faptul c un corp K este o mulime nevid de pri nchis n raport cu reuniunea finit i complementar. Propoziie. Dac K() este un corp de pri, atunci: 1) K, K 2) (Ak) 1 k n K

IA
k =1

3) A,B K A \ B K 4) A,B K A B K Demonstraie: 1) ntruct K este corp de pri, exist A astfel nct A K. Deci A K i A A = K. De asemenea, = K.
10

2) A1,A2,,An K A 1, A 2,, A n K i

UA
k =1

K U A k = I Ak K .
k =1 k =1

3) A,B K A, B K A B = A - B K. 4) A,B K, AB = (A-B) (B-A) K. innd seama de modul cum am definit evenimentul AB, rezult c, dac A1,A2,,An sunt evenimente, atunci

UA
k =1

este evenimentul care const n realizarea cel puin a unuia din

evenimentele A1,A2,,An. De aici, rezult,

UA =IA
k k =1 k =1

IA =UA
k k =1 k =1

, adic tocmai

formulele lui De Morgan din teoria mulimilor. Aceste moduri de scriere a evenimentelor vor fi folosite frecvent n rezolvarea unor probleme de teoria probabilitilor. Definiie. O familie nevid K() se numete - corp de mulimi (sau corp borelian) dac: i) () AK A K ii) () (An)nN K U An K .
n

Se constat c orice corp borelian de mulimi este i corp de mulimi; reciproca nu este adevrat. Proprietile deduse pentru corpul de pri K se transpun i pentru corpul borelian i nu vom insista asupra acestui lucru. Cel mai simplu - corp de pri ale lui este chiar (). Definiie. O mulime nzestrat cu un corp K (corp borelian K) de pri se numete cmp (cmp borelian) de evenimente. Vom nota acest cmp de evenimente ,K. Definiie. Un sistem de evenimente A1,A2,,An cu proprietatea c AiAj= dac ij, i,j{1,2,,n},

U A = spunem
i i =1

c formeaz un sistem complet de evenimente sau o

desfacere a lui . S considerm acum o mulime arbitrar nzestrat cu un corp de pri. Presupunem c este cel mult numrabil. n acest caz, elementele lui le vom numi evenimente elementare, iar nsui evenimentul sigur. Dac card = n, atunci ={1,2,,n}, iar corpul K=() i are 2n evenimente care se construiesc innd seama de proprietile lui K: 0 n numr de Cn 1 {1},{2},,{n} n numr de C n 2 {1,2},{1,3},,{n-1,n} n numr de C n 3 {1,2,3},,{n-2,n-1,n} n numr de C n n {1,2,,nn numr de C n 1 1},,{2,3,,n} n {1,2,,n} = n numr de Cn 0 1 n n total, corpul K conine Cn + C n ++ C n 1 + Cnn = (1+1)n = 2n evenimente.

11

1.2. Cmp de probabilitate Pn acum suntem n msur s descriem evoluia unui fenomen, a unui experiment n limbajul evenimentelor, dar nu suntem n msur s putem pune n eviden legitile specifice. Pentru a putea face pasul ctre acest lucru, va trebui s cuantificm evenimentele, atand fiecrui eveniment o probabilitate de apariie, adic un numr cuprins ntre zero i unu. Vom da i vom dezvolta definiia axiomatic a probabilitii, ns nainte ce aceasta vom da i definiia clasic i cea statistic a probabilitii, aa cum au aprut ele din punct de vedere istoric. Definiie (definiia clasic a probabilitii). Se numete probabilitate a evenimentului A i se noteaz P(A), raportul dintre numrul m de rezultate favorabile producerii evenimentului A i numrul total de n rezultate ale experimentului, considerate egal posibile. m P(A) = n Din definiia dat rezult imediat c probabilitatea definit astfel are urmtoarele proprieti: 1) 0 P(A) 1 oricare ar fi evenimentul A, cci 0 m n. 2) P()=0, P()=1, cci evenimentului imposibil i corespunde m=0, iar evenimentului sigur m=n. 3) P(AB) = P(A) + P(B), dac AB= m1 m2 m1 + m2 P(A) = , P(B) = , P(A B) = P(A) + P(B) = , m1 + m2 n n n n 4) P(A) = 1 - P(A) 5) Dac AB, atunci P(A) P(B). Alturi de noiunea de probabilitate, noiunea de frecven relativ este alt noiune fundamental n teoria probabilitilor. Frecvena relativ de apariie a evenimentului A este raportul dintre numrul probelor n care evenimentul A s-a produs i numrul total, n, de probe efectuate. Observaii statistice ndelungate au dovedit c dac un experiment se repet de un numr mare de ori, se produce o stabilitate a frecvenei relative n sensul c ea oscileaz tot mai strns n jurul probabilitii de apariie a evenimentului considerat. n acest mod s-a impus definiia statistic a probabilitii: n(A) P(A) = lim , n n unde n(A) este numrul de apariii a evenimentului A n cele n probe independente. S considerm un cmp de evenimente {,K} i s introducem definiia axiomatic a probabilitii. Definiie. Se numete probabilitate pe cmpul de evenimente {,K} o funcie de mulime P:KR+ care satisface urmtoarele axiome: i) () AK P(A) 0 ii) P() = 1 iii) () A,B K, AB = P(AB)=P(A)+P(B) Observaie. Axioma iii) este echivalent cu axioma iii): Dac A1,A2,,An K, AiAj=,

ij, i,j{1,2,,n} P(U A ) = P(Ai) . Demonstraia este imediat i o lsm n seama


i =1

i=1

cititorului. Definiie. Un cmp de evenimente {,K} nzestrat cu o probabilitate P se numete cmp de probabilitate i-l vom nota {,K,P}.

12

Definiie. O probabilitate aditiv (sau complet aditiv) pe cmpul borelian de evenimente {,K} este o funie de mulime P:KR+ care satisface axiomele: i) () AK P(A) 0 ii) P() = 1 iii) () (An)nNK, AmAn=, m n, m,n N P( U An) = P(An) .
n N n N

Prin definiie, un cmp borelian de evenimente {,K} nzestrat cu o probabilitate P complet aditiv, se numete cmp borelian de probabilitate i-l vom nota {,K,P}. Exemplu. Fie = {i}iI unde I este o mulime de indici cel mult numrabil. n acest caz, K=() i fie (pi)iI o familie de numere reale nenegative astfel nct pi = 1 . Considerm AK, A={h, hHI}; punem P(A)= ph . Atunci, {,K,P} este un
h H

iI

cmp borelian de probabilitate. Evenimentele {i}iI sunt evenimente elementare i cunoaterea probabilitilor evenimentelor elementare pi=P({i}), iI determin complet probabilitatea oricrui eveniment A K. Un caz particular se obine de aici cnd este o mulime finit, ={i, i=1,2,,n}. 1 S considerm familia finit (pi) 1 i n astfel nct pi = P({i}) = , i=1,2,,n. n m(A) , unde m(A) este numrul evenimentelor Atunci, pentru orice A(A) = K, P(A) = n elementare ce compun pe A; m(A) = card A. card A i am czut peste definiia clasic a probabilitii. n acest fel, P(A) = card S dm acum o serie de proprieti importante ale probabilitii, care se obin din definiiile date. Propoziie. Probabilitatea introdus mai sus are urmtoarele proprieti: 1) P(B-A) = P(B) - P(AB) 2) P(B-A) = P(B) - P(A) i P(A) P(B), dac AB 3) P( A ) = 1-P(A) 4) P() = 0 5) 0 P(A) 1 6) P(AB) = P(A) + P(B) - P(AB), P(AB) P(A) + P(B) 7) P(AB) = P(A) + P(B) - 2P(AB) 8) P(U Ai) = P(Ai) - P(Ai Aj) +
i=1 n i=1 n i< j n n i< j<k

P(A A A )+...+(-1)
i j k

n-1

P(I Ai)
i=1

9) P(U Ai) P(Ai)


i=1 i=1

Demonstraie: 1) B=(B-A) (AB); (B-A) (AB) = i, deci: P(B) = P(B-A) + P(AB) 2) B = A(B-A); A(B-A) = P(B) = P(A) + P(B-A) Cum P(B-A) 0 P(A) P(B) 3) A A = ; A A = ; P(A) + P( A ) = 1 4) = ; = ; P() + P() = P() 5) A i, folosind afirmaia 2) rezult afirmaia 6) A B = A (B-A); A (B-A) =
13

P(AB) = P(A)+ P(B-A) = P(A) + P(B)-P(AB). Cum P(AB)0 P(AB) P(A) + P(B) 7) AB = (A-B)(B-A) i (A-B)(B-A) = . Deci, P(AB) = P(A-B)+P(B-A) = P(A)+P(B)-2P(AB) 8) Egalitatea este cunoscut sub numele de formula lui PoincarJ. O vom demonstra prin inducie. Pentru n=2 este proprietatea 6), pe care am demonstrat-o. S-o presupunem adevrat pentru n i s artm c se menine pentru n+1:
P(U Ai) = P((U Ai) An + 1) = P(U Ai) + P(An + 1) - P( U (Ai An + 1)) = P(Ai) i=1 i=1 i=1 i=1 i=1 n+1 n n n n

P(Ai A j) +
i< j

i< j<k

P(A A A )+...+(-1)
i j k

n-1

P(I Ai) + P(An + 1) - P(Ai An + 1) i=1 i=1


n n

P(Ai Aj An + 1)+...+(-1) n-1 P(I Ai An + 1)] = P(A)- P(Ai A) + P(Ai Aj Ak) + i j


i< j i=1 i=1 i< j i< j< k

n+1

+...+(-1) n P( I Ai).
i=1

n+1

P(U Ai) P(U Ai) + P(An + 1) P(Ai) , deoarece:


i=1

n +1

n +1 i=1

P(U Ai) P(Ai) i P((U Ai) An + 1) 0.


i=1 i=1 i=1

i=1 n

Pentru inegalitatea de la punctul 8) considerm: B1=A1 B2=A2-A1 BiBj=, ij Bn=An- U A ,


i =1 n 1

atunci: P(U Bi) = P(Bi) P(Ai)


i=1 i =1 i=1 n n n

Cum

U B =U A ,
i i i =1 i =1

rezult: P(U Ai) P(Ai) .


i =1 i =1

Propoziie

a) Dac (An)nN este un ir descendent de evenimente, atunci: lim P(An) = P(I An) .
n

b) Dac (An)nN este un ir ascendent de evenimente, atunci: lim P(An) = P(U A n ) .


n n=1

n =1

Demonstraie: a) irul fiind descendent, nseamn c AnAn+1, nN. S presupunem mai nti c
n N

IA

= ; atunci:

An = U (Ak - Ak + 1) i
kn k =1

P(An) = [P(Ak) - P(Ak + 1)]


k =n

reprezint

restul seriei convergente P(A1) = [P(Ak) - P(Ak + 1)] .

14

Deci, lim P(An) = P(lim An) = P(I An) = P()=0. Dac


n n n =1

IA
n=1 n =1

= B , construim irul = .

descendent (Bn)nN, Bn=An-B, nN, care are proprietatea:


n n

IB

Deci, lim P(Bn) = P( lim Bn) = 0 . Dar, P(Bn)=P(An-B)=P(An)-P(B). Prin trecerea la limit se obine lim P(An) = P(B) = P(I An) .
n n =1

b) irul (An)nN fiind ascendent, nseamn c AnAn+1, nN i lim An = U An . Considerm


n n =1

irul (An)
n

nN,

care este un ir descendent, i, atunci:


n n =1 n =1

lim P(An) = P( lim An )= P(I An) = P(U An) sau

lim[1- P(An)] = 1 P(U An) , de unde


n n =1

rezult imediat afirmaia. Afirmaia din propoziia anterioar mai este cunoscut sub numele de axioma continuitii. Acest rezultat va fi utilizat n demonstraia unor proprieti ale funciei de repartiie. Acum, ns, vom arta c un cmp de probabilitate n care probabilitatea este finit aditiv i, n plus, se adaug axioma continuitii devine un cmp borelian de probabilitate. ntr-adevr, dac (An)nN K este un ir de evenimente incompatibile dou cte dou, AiAj=, ij, i,jN i dac notm A = Bn+1Bn, nN. Evident I Bn = i deci lim P(B n ) = 0.
n
n n

UA

i Bn = A - U Ak , atunci A,BnK i
k =1

ns P(Bn)=P(A- U Ak) = P(A) - P(Ak) . lim P(Bn) = P(A)- lim P(Ak) = 0 .


k =1 k =1 n n k =1

Deci P(A) = P( U An) = lim P(Ak) = P(An) , adic


n n k =1

P( U An) = P(An) , ceea ce


n n

dovedete afirmaia. S punem n eviden o inegalitate important, cunoscut sub numele de inegalitatea lui Boole. Fie familia finit de evenimente (Ai) 1 i n; atunci: P(I Ai) 1 - P(Ai) = P(Ai) - (n - 1) .
i=1 i=1 i=1 n n n

Demonstraie:

P(I Ai) = 1 - P(I Ai) = 1 P(U Ai ) 1 P(Ai) = 1 - [1 - P(Ai)] = P(Ai) - (n - 1)


i=1 i=1 i=1 i=1

i =1

i=1

15

1.3. Probabilitate condiionat

Fie {,K,P} un cmp de probabilitate i AK, astfel nct P(A)>0. Definiie. Numim probabilitate condiionat de evenimentul A a evenimentului B i o notm P(A B) P(B/A) expresia: P(B / A) = , P(A)>0. P(A) Propoziie. P(. / A) este o probabilitate definit pe cmpul de evenimente {,K} sau, altfel spus, {,K,P(. / A)} este un cmp de probabilitate. Demonstraie: este suficient s artm c funcia de mulime P(. / A) satisface axiomele i), ii), iii). P(A B) i) Cum P(B / A) = i 0 P(AB) P(A), rezult c P(B / A) 0, P(A)>0. P(A) ii) Fie A1,A2,,AnK, AiAj=, ij. Atunci: = = P(A) P(A) P(A) deoarece (AAi) (AAj) = , ij. P(A ) P(A) iii) P( / A) = = = 1. P(A) P(A) Din definiia probabilitii condiionate rezult c, dac A i B sunt evenimente reciproc condiionate, atunci: P(A) P(B/A) = P(B) P(A/B).
i=1 i=1 i=1 i=1

P(U Ai / A) =

P(A (U Ai))

P(U (A Ai))

P(A A )
i

P(A Ai) n = = P(Ai / A) , P(A) i=1 i=1


n

Fie acum A1,A2,,An o familie finit de evenimente astfel nct P(I Ai) 0 ; atunci:
i=1

P(I Ai) = P(A1) P(A2 / A1) P(A3 / A1 A2)...P(An / A1 A2... An - 1) .


i=1 n

ntr-adevr, condiia pus ne d posibilitatea s scriem succesiunea de egaliti: P(I Ai) = P(A1 A2... An - 1) P(An / A1 A2... An - 1) =
= P(A1 A2... An - 2) P(An 1 / A1... An 2) P(An / A1... An 1) = .. = P(A1) P(A2 / A1) P(A3 / A1 A2)...P(An / A1 A2... An 1) . S considerm desfacerea (sistemul complet de evenimente) D = {Ai, i=1,2,,n}, AiAj=, ij i
i=1

U A = , P(Ai)0, i=1,2,,n.
i
i =1

Dac BK cu P(B)0, atunci P(Ai / B) =

P(Ai) P(B / Ai)

P(A ) P(B / A )
i i i =1

, i=1,2,,n.

Relaia dat este cunoscut sub numele de formula lui Bayes i are numeroase aplicaii n statistica matematic. Demonstraia formulei rezult printr-un calcul direct: P(Ai B) P(Ai) P(B / Ai) P(Ai / B) = = P(B) P(B) ns, B = B = B (U Ai) = U (B Ai) i P(B) = P(U (B Ai)) = P(B Ai) =
i=1 i=1 i=1 i=1 n n n n

16

= P(Ai) P(B / Ai) . Relaia P(B) = P(Ai) P(B / Ai) este cunoscut sub numele de
i =1 i=1

formula probabilitii totale. nlocuind P(B) n expresia P(Ai / B) se obine formula lui Bayes.
Evenimente independente. S considerm familia finit de desfaceri
D(i) = { A (i) , j=1,2,,ni}, i=1,2,,m. j

Definiie. Spunem c desfacerile D(i), i=1,2,,m sunt independente cte k, 2 k < m, dac, oricum am lua indicii i1<i2<<ik i oricum am lua indicii j1,j2,,jk, 1 jk nk, avem P(A (i11) A (i22) ... A (ikk) ) = P(A (i11) ) P(A (i22) )...P(A (ikk) ) . j j j j j j

Desfacerile sunt total independente, dac: P(A (1) A (j22) ... A (jm) ) = P(A (j11) ) P(A (j22) )...P(A (jm) ) j1 m m Independena n totalitate atrage dup sine independena cte k (k<m) a desfacerilor i, n general, independena cte k atrage dup sine independena cte h a desfacerilor dac h<k. Reciproca afirmaiei nu este adevrat dup cum vom constata pe un contraexemplu. Fie ={1,2,3,4} i cmpul de probabilitate {,K,P}, unde P({i})=1/4, i=1,2,3,4. S considerm evenimentele A={1,2}, B={1,3}, C={1,4} i desfacerile DA={A, A }, DB={B, B }, DC={C, C }. Aceste desfaceri sunt independente dou cte dou, deoarece: 1 1 1 1 ; P(A B) = P(A) P(B) = 2 ; 2 = P(A B) = P(A) P(B) = 2 2 2 2 1 1 P(A C) = P(A) P(C) = 2 ; P(A C) = P(A) P(C) = 2 ; 2 2 1 1 P(A B) = P(A) P(B) = 2 ; P(A B) = P(A) P(B) = 2 ; 2 2 1 1 P(A C) = P(A) P(C) = 2 ; P(A C) = P(A) P(C) = 2 ; 2 2 1 1 P(B C) = P(B) P(C) = 2 ; P(B C) = P(B) P(C) = 2 ; 2 2 1 1 P(B C) = P(B) P(C) = 2 ; P(B C) = P(B) P(C) = 2 . 2 2 1 1 ns P(A B C) = 2 P(A) P(B) P(C) = 3 , de unde urmeaz c DA,DB,DC nu sunt 2 2 independente n totalitate. Definiie. Evenimentele A1,A2,,An sunt independente cte k (k<n) dac desfacerile D(i) = {Ai, Ai } i=1,2,,n sunt independente cte k. Evenimentele A1,A2,,An sunt independente n totalitate (simplu independente) dac desfacerile D(i) = {Ai, Ai } i=1,2,,n sunt independente n totalitate. Dac avem dou evenimente A i B, atunci, conform definiiei, evenimentele A i B sunt independente, dac desfacerile D(1) = {A, A }, D(2) = {B, B } sunt independente. Aceasta nseamn c: P(AB)=P(A)P(B) P(A B )=P(A)P( B ) P( A B)=P( A )P(B) P( A B )=P( A )P( B )

n realitate, pentru independena a dou evenimente este necesar i suficient numai una din aceste relaii. ntr-adevr, s presupunem prima relaie adevrat i s artm c i celelalte trei sunt adevrate. P(A B ) = P(A\AB) = P(A)-P(AB) = P(A)-P(A)P(B) = P(A)[1-P(B)] = P(A)P( B ) La fel se procedeaz i cu celelalte dou egaliti i absolut analog oricum am alege ca relaie de definiie una oarecare din cele patru relaii.
1.4. Scheme probabilistice clasice de calcul a probabilitilor

Vom pune n eviden acum unele scheme cu urne, de calcul a probabilitilor i la care se vor reduce multe modele de calcul ntlnite att practic, ct i teoretic. Schema lui Poisson. Se consider n urne U1,U2,,Un, fiecare urn coninnd bile albe i bile negre n proporii date. Fie ai numrul de bile albe din urna Ui i bi numrul de bile negre din urna Ui. Probabilitatea de a extrage o bil alb din urna Ui este: ai pi = , i=1,2,,n, ai + bi iar probabilitatea de a extrage o bil neagr din aceeai urn este: bi qi = , i=1,2,,n ai + bi Evident, pi + qi=1, i=1,2,,n. Se extrage cte o bil din fiecare urn i se cere s se afle probabilitatea ca, din cele n bile extrase, k bile s fie albe. S exprimm evenimentul ce rspunde favorabil situaiei cerute: fie Ai evenimentul care const n faptul c s-a extras o bil alb din urna Ui i fie A i evenimentul c s-a extras o bil neagr din urna Ui. Evenimentul ce rspunde favorabil este cel constituit din k evenimente A i n-k evenimente A . O situaie posibil este urmtoarea: Ai1 Ai2... Aik Aik + 1 Aik + 2... Ain (dup ce le-am aranjat n ordine, dup cum a aprut bila alb sau bila neagr). ntruct rezultatele extragerilor sunt independente, probabilitatea acestui eveniment este P( Ai1 Ai2... Aik Aik + 1 Aik + 2... Ain ) = pi1 pi2...pik qik + 1...qin . Notm cu B evenimentul care const n apariia de k ori bil alb i de n-k ori bil neagr. Atunci: B = U ( Ai1 Ai2...Aik Aik + 1 Aik + 2...Ain ). Urmeaz c:
(i1 ,i 2 ,...,i n ) k ori A, n-k ori A

P(B) =

(i1 ,i 2 ,...,i n ) k ori A, n-k ori A

P( Ai1 Ai2... Aik Aik + 1 Aik + 2... Ain ) = =

(i1 ,i 2 ,...,i n ) k ori A, n-k ori A

pi1 pi2...pik qik + 1...qin

Constatm c dup aceeai regul se calculeaz coeficientul lui xk din polinomul P(x) = (pix + qi) i, n felul acesta, lucrurile se simplific mult cnd este vorba de
i=1 n

utilizarea efectiv a acestei scheme. Schema lui Poisson este folosit n rezolvarea problemelor n care se cere probabilitatea realizrii de k ori a unui eveniment ntr-o experien ce const n efectuarea a n probe independente, atunci cnd se cunoate probabilitatea realizrii evenimentului (i a contrarului su) n fiecare din cele n probe.

Schema lui Bernoulli (schema bilei revenite). S presupunem c cele n urne din schema lui Poisson au aceeai compoziie. n acest caz, p1 = p2 = = pn = p q1 = q2 = = qn = q A extrage cte o bil din fiecare urn este echivalent cu a utiliza o singur urn i a reface compoziia dup fiecare extragere, deci de a introduce bila la loc n urn, dup ce s-a constatat culoarea, amestecndu-se bilele pentru a avea rezultate independente. n acest caz, polinomul P(n) devine P(x) = (px + q) n , iar coeficientul lui xk, care d probabilitatea cutat va fi P(n;k) = C k p k q n-k . n Schema lui Bernoulli (sau schema bilei revenite) rezolv problemele n care se cere s se calculeze probabilitatea realizrii unui eveniment de k ori ntr-o serie de n probe independente, cnd se cunoate probabilitatea realizrii evenimentului ntr-o singur prob. Schema lui Bernoulli cu mai multe stri (schema multinomial). Considerm o urn U care conine bile de m culori: C1,C2,,Cm. Fie pi probabilitatea de a extrage o bil de culoarea Ci; ne propunem s calculm probabilitatea evenimentului ca n n extrageri independente, punnd la loc de fiecare dat bila extras s apar de n1 ori culoarea C1, de n2 ori culoarea C2 .a.m.d., de nm ori culoarea Cm. O situaie posibil este urmtoarea: A1441...3 1442443 ... 144 244Am A2 A2... A2 Am 4m ...4 A 1 A 44A1 2 3
n 1 ori n 2 ori n m ori

Probabilitatea acestui eveniment este n P( A1 A1... A A2 A2... A2 ... Am Am ... Am ) = p 1 1 p n 2 ...p n m 2 m cu n1 + n2 ++ nm = n. n! Cum evenimentul considerat se poate exprima n situaii distincte n1! n2! ... nm! (incompatibile dou cte dou), rezult c probabilitatea cerut este: n! n p 1 1 p n 2 ...p n m , P(n; n1,n2,,nm) = 2 m n1! n2! ... nm! n1 + n2 ++ nm = n. Schema bilei nerevenite (cu dou culori). Se consider o urn U care conine a bile albe i b bile negre. Din aceast urn se extrag n bile, fr a pune bila extras napoi n urn i se cere probabilitatea de a avea k bile albe. Vom utiliza definiia clasic a probabilitii. Atunci, numrul cazurilor posibile este n C a + b , iar numrul cazurilor favorabile este C k C n k . Deci, probabilitatea cerut este: a b

Ck Cnk Pn; k = a n b C a+ b Se nelege c numrul k de bile extrase satisface dubla inegalitate: max (0,n-b) k min (a,n), 0 n a+b S formulm problema aa cum apare ea n controlul de recepie a loturilor de produse: presupunem c avem un lot de N produse printre care se gsesc D produse defecte. Se extrag la ntmplare n produse i se cere probabilitatea ca printre cele n produse s se gseasc d produse difecte. Dac notm cu P(N,D; n,d) probabilitatea cerut, atunci: Cnd Cd P(N,D; n,d) = N D D , max (0,n+D-N) d min (n,D). Cn N

Schema bilei nerevenite cu mai multe culori. Considerm urna U n care se gsesc a1 bile de culoarea C1, a2 bile de culoarea C2 .a.m.d., am bile de culoarea Cm. Se extrag n bile fr a pune la loc bila extras (n < a1+a2++am) i se cere probabilitatea ca n cele n bile extrase s fie 1 de culoarea C1, 2 de culoarea C2 .a.m.d., m bile de culoarea Cm. Folosind tot definiia clasic a probabilitii, obinem + numrul cazurilor posibile egal cu C11+ a 22++......++amm , 1+2++m = n, iar numrul cazurilor a

favorabile
C a1 C a 2 ...C a m . Deci, P(n; 1,2,,m) =
1 2 m
m C11 C22 ...Cm a a a

+ +... C11+ a22+...++amm a

Exemplu. Trei ntreprinderi trimit acelai tip de piese ntr-un depozit central, n proporie de 5; 3; 2. Cele trei ntreprinderi au rebuturi n cantitate de 1%, 3%, respectiv 2%. Piese n valoare de 3600 u.m. s-au dovedit rebuturi. n ce proporie trebuie mprit suma de 3600 u.m. pentru cele trei ntreprinderi? Soluie: notm cu Ai, i=1,2,3 evenimentul piesa provine de la ntreprinderea i i cu B evenimentul piesa este rebut. Atunci: 5 3 2 P(A1) = = 0,5; P(A2) = = 0,3; P(A3) = = 0,2; P(B / A1) = 0,01; P(B / A2) = 0,03; 10 10 10 P(B / A3) = 0,02. P(Ai) P(B / Ai) , i=1,2,3 obinem: Aplicnd formula lui Bayes: P(Ai / B) = n P(Ai) P(B / Ai)
i =1

5 9 4 i, de aici, sumele repartizate pe ; P(A2 / B) = ; P(A3 / B) = 18 18 18 ntreprinderi sunt 1000 u.m., 1800 u.m., 800 u.m. Exemplu. ntr-o magazie sunt depozitate trei loturi de produse. n primul lot sunt 5% produse defecte, n al doilea lot 6%, iar n al treilea 3%. Se extrage cte un produs din fiecare lot i se cere probabilitatea ca: a) din cele trei produse extrase unul s fie defect, b) cel mult un produs s fie defect. Soluie: din condiiile date se obin probabilitile: p1 = 0,05; p2 = 0,06; p3 = 0,03 q1 = 0,95; q2 = 0,94; q3 = 0,97 a) Aplicnd schema lui Poisson, probabilitatea cutat este coeficientul lui x din polinomul (0,05 x + 0,95)(0,06 x + 0,94)(0,03 x + 0,97). P(3;1) = 0,05 0,94 0,97 + 0,06 0,95 0,97 + 0,03 0,95 0,94. b) P(3;0) + P(3;1), unde P(3;0) = 0,95 0,94 0,97. Exemplu. Dintr-o urn n care sunt aezate toate numerele ntregi de la 1 la 90 se extrag 6 numere. Care este probabilitatea ca s ias trei din numerele 3; 13; 23; 33; 43; 53. C3 C3 Soluie: se aplic schema bilei nerevenite i avem P = 6 6 84 . C 90 Exemplu. ntr-un lot de piese sunt 15% de calitatea ntia, 65% de calitatea a doua, 18% de calitatea a treia i restul cu anumite defecte. Se extrag la ntmplare 20 de piese punndu-se la loc piesa extras i se cere: a) probabilitatea ca 5 piese s fie de calitatea ntia; b) probabilitatea ca 5 piese s fie de calitatea ntia, 10 de calitatea a doua, 4 de calitatea a treia i 1 necorespunztoare. P(A1 / B) =

Soluie: a) aplicm schema


5 20

lui
5

Bernoulli,
15

cu:

p=

15 85 ; q= ; n = 20; k = 5 i, 100 100

atunci,

15 85 P(20;5) = C 100 100 b) se aplic schema multinomial cu p1 = 0,15; p2 = 0,65; p3 = 0,18; p4 = 0,02; n1 = 5; n2 = 10; n3 = 4; n4 = 1; n1 + n2 + n3 + n4 = 20. 5 10 4 20 15 65 18 2 P(20;5;10;4;1) = . 5! 10! 4! 1! 100 100 100 100 Exemplu. Se reia problema din exemplul anterior, presupunnd c numrul produselor din lot este 100, iar extragerile se fac fr revenire. Soluie: 5 C15 C15 85 a) se aplic schema bilei nerevenite cu dou culori i se obine P = 20 C100 b) se aplic schema bilei nerevenite pentru o urn cu mai multe culori i avem 5 4 C15 C10 C18 C1 65 2 P= 20 C100 Exemplu. S considerm o schem electric alctuit din n blocuri dispuse n serie: B1 B2 Bn

Notm tot cu Bj evenimentul ca blocul Bj s ias din funciune (s se defecteze). Atunci, schema electric iese din funciune dac se defecteaz cel puin un bloc i deci probabilitatea ca schema s ias din funciune este: P(U Bj) = P(Bj) P(Bj Bk) + P(Bj Bk Bl)+...+( 1) n 1 P(I Bj)
j=1 j=1 j< k j< k < l j=1 n n n

Exemplu. Considerm o schem electric alctuit din n blocuri dispuse n paralel:

B1 B2 Bn

Cu aceleai notaii ca n exemplul anterior, se obine c probabilitatea ca schema s ias din funciune (eveniment D) este P(D) = P(I Bj) P(Bj) (n 1) . Dac admitem c blocurile
j=1 j=1 n n

sunt scrise n ordinea n care este condiionat defectare, atunci: P(D) = P(I Bj) =P(B1) P(B2 / B1) P(B3 / B1 B2)...P(Bn / B1 B2... Bn 1)
j=1 n

Exemplu. S considerm o schem electric alctuit din blocuri serie-paralel, aa cum este indicat n schema de mai jos:

B11 B12 B1n1

B21 B22 B2n2

Bm1 Bm2 Bmnm

Atunci, probabilitatea de defectare (pstrndu-se semnificaia evenimentelor) este dat de: P(D) = P( U ( I Bij)) = P(I Bij) P( I Bij I Bkj)+...+( 1) m 1 P(I (I Bj))
i =1 j=1 i =1 j=1 i< k j=1 j=1 i =1 j=1 m ni m ni ni nk m ni

Exemplu. S considerm acum o schem electric alctuit din blocuri dispuse paralel-serie, ca n schema de mai jos:

B11 B12 B1n1

B21 B22 B2n2

B1n1 B2n2 Bmnm

Atunci, probabilitatea de defectare este dat de:


P(D) = P( I ( U Bij)) P( U Bij) (m 1) =
i =1 j=1 i =1 j=1 ni n i 1 = P(Bij) P(Bij Bik)+...+( 1) P(I Bij) (m 1) j=1 i =1 j=1 j< k m ni m ni m ni

Capitolul 2 VARIABILE ALEATOARE. FUNCII I DENSITI DE REPARTIIE 2.1. Variabile aleatoare Noiunea de variabil aleatoare este fundamental n teoria probabilitilor. Considerat intuitiv, legat de experiment, variabila aleatoare se poate defini ca fiind o funcie real pe mulimea rezultatelor unui experiment. Cu alte cuvinte, valorile acestei funcii sunt luate dup cum s-a realizat un anumit eveniment, pentru un experiment dat. S considerm experimentul care const n aruncarea cu dou zaruri i n care ne intereseaz suma punctelor obinute. Dac notm cu Sk evenimentul care const n faptul c la o aruncare a aprut suma k, k=2,3,,12, atunci variabila aleatoare X, care este o funcie real pe mulimea experimentelor {Sk, k=2,3,,12}, are valorile X(Sk)=k. Acest lucru poate fi sintetizat astfel:
S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 X: 2 3 4 5 6 7 8 9 10 11 12

Dar rezultatele Sk, 2 k 12 apar cu probabilitile P(S2)=1/36; P(S6)=5/36; P(S10)=3/36; P(S3)=2/36; P(S7)=6/36; P(S11)=2/36); P(S4)=3/36; P(S8)=5/36; P(S12)=1/36 P(S5)=4/36; P(S9)=4/36;

i atunci variabila aleatoare X poate fi scris:

2 3 4 5 6 7 8 9 10 11 12 , X: 1 2 3 4 5 6 5 4 3 2 1 36 36 36 36 36 36 36 36 36 36 36 ceea ce conduce la faptul c o variabil aleatoare este o funcie real ale crei valori sunt luate cu probabilitile corespunztoare unui sistem complet de evenimente. Din exemplul considerat rezult c prin intermediul variabilelor aleatoare, evenimentele pot fi descrise cu ajutorul unor valori numerice reale, care n general sunt rezultatul unor observaii. Vom da acum definiia riguroas din punct de vedere matematic a variabilei aleatoare cu care vom opera n continuare. S considerm cmpul de probabilitate {,K,P} dat i s notm cu R mulimea numerelor reale i cu B tribul mulimilor boreliene1 de pe R, astfel nct (R,B) este un cmp complet aditiv.

Tribul mulimilor boreliene de pe dreapta real este cel mai mic corp care conine toate mulimile deschise de pe dreapt.

Definiie. Aplicaia X: R se numete variabil aleatoare dac X-1(B)K, ()B. Observm c dac lum B=(a,) atunci X-1(B)=X-1(a,)={w:X(w)(a,)}={:X()>a}, aR arbitrar. Se demonstreaz c definiia introdus mai sus este echivalent cu definiia de mai jos: Definiie. Aplicaia X: R se numete variabil aleatoare dac: {: X() > a} K, () aR.

n cele ce urmeaz vom folosi aceast definiie i adesea vom scrie prescurtat: {: X()>a} = {X > a}. Avnd n vedere faptul c variabilele aleatoare dau posibilitatea scrierii evenimentelor cu ajutorul lor, punem n eviden urmtoarea propoziie:
Propoziie. X: R este variabil aleatoare dac i numai dac este adevrat una din afirmaiile (i) {:X() a}K, () aR (ii) {: X() < a}K, () aR (iii) {: X() a} K, () aR Demonstraie: se constat c : 1 1 {:X() a} = I {:X ( ) > a }. ns, {:X( ) > a - } K, n = 1,2, ( )a R, n n n =1 1 I1{: X ( ) > a n} K , ()a R n=

{:X() < a} = C{:X() a}K {:X() a} = C{:X() > a}K, ceea ce demonstreaz implicaia (). Implicaia () rezult n acelai mod. De aici rezult o observaie important: Cum
Observaie. Dac X este o variabil aleatoare definit pe {,K,P}, atunci, pentru orice a,bR, a<b, avem: X-1({a})K, X-1([a,b))K, X-1([a,b])K, X-1((a,b))K. Pentru exemplificare,

X-1((a,b))={: a< X() < b} = {: X() > a} {: X() < b}. Ne intereseaz s vedem dac, n urma compunerii de variabile aleatoare, obinem tot variabile aleatoare, rspuns care se va desprinde din teoremele ce urmeaz:
Teorem. Dac X este variabil aleatoare, iar bR, atunci: (1) X + b (2) bX (3) |X| (4) X2 1 (5) , dac X0 X

sunt variabile aleatoare. Demonstraie: Se vede imediat c toate aplicaiile (1) - (5) sunt de la R. Rmne s artm c este ndeplinit i cea de a doua cerin.
(1) { :( X + b)( ) > a} = { : X ( ) + b > a} = { : X ( ) > b a} K a { : X( ) > b }, b > 0 ( 2 ) { : bX( ) > a} = { : X ( ) < a }, b < 0 b / O, dac a < 0 (3) { :| X( )| > a} = { : X( ) > a} { : X( ) < -a}, a 0 / O, dac a < 0 ( 4) {:X 2 ( ) > a} = {:| X( )|> a }, a 0 { : X ( ) > 0}, a = 0 1 1 (5) { : > a} = { : X ( ) > 0} { : X ( ) < }, a > 0 X( ) a 1 { : X ( ) > 0} [{ : X ( ) < 0} {: X ( ) < }], a < 0 a Deci toate cele cinci aplicaii sunt variabile aleatoare. Urmtoarea propoziie va da posibilitatea s compunem diverse variabile aleatoare.

Propoziie. Dac X i Y sunt variabile aleatoare, atunci

{:X() > Y()}K, {:X() Y()}K, {:X() = Y()}K.


Demonstraie. Cum X,Y sunt variabile aleatoare reale i X() > Y(), exist un numr real r astfel nct X() > r > Y(). Fie (rk)kNQ i (rk)kNQ, rk r, rk r. Atunci:

{:X() > Y()} = i, de aici, rezult c:

I [{: X ( ) > r } {: Y ( ) < r }]


k ' k

{:X() > Y()} K Celelalte dou afirmaii rezult din faptul c {:X() Y()} = C{:Y() > X()} i {:X() = Y()} = {:X() Y()} {:X() Y()}, ceea ce dovedete afirmaia. Putem acum s dm o teorem de compunere a dou variabile aleatoare.
Teorem. Dac X i Y sunt variabile aleatoare, atunci (1) X - Y (2) X + Y (3) XY

X , dac Y0 Y sunt variabile aleatoare. Demonstraie. (1) Este clar c X - Y: R.. Cum {:X() - Y() > a} = {:X() > Y() + a} K conform cu propoziiile anterioare, rezult c X - Y este variabil aleatoare.

(4)

(2) Deoarece X + Y = X - (-Y) am redus cazul acesta la cazul (1). 1 (3) XY = [(X + Y) 2 (X Y) 2 ] . Cum X + Y, X - Y i ptratele lor sunt variabile aleatoare, 4 rezult afirmaia. 1 X = X i, deci, raportul este tot o variabil aleatoare. (4) Y Y n mulimea variabilelor aleatoare, un rol important l au acelea care pot lua o mulime finit sau numrabil de valori.
Definiie. Spunem c variabila aleatoare X este de tip discret dac ia o mulime de valori cel mult numrabil. Un exemplu de variabil aleatoare discret cu o mulime numrabil de valori este variabila aleatoare Poisson: k k X : e , k = 0,1, 2,... k! Constanta >0 este parametrul repartiiei (n momentul n care avem o variabil de tip discret xk i am dat X : spunem c avem o repartiie; n exemplul dat este repartiia Poisson pk , k I

de parametru >0).
Definiie. Spunem c variabila aleatoare X este simpl dac poate lua numai un numr finit de valori.

Ca exemplu de variabil aleatoare simpl, s considerm variabila binomial: k . X : p k n k Cn p q , k = 0,1, 2,..., n Denumirea deriv din faptul c P(X=k) = C k p k q n k sunt tocmai termenii din dezvoltarea n binomului (p + q)n. Variabila aleatoare simpl 1, dac A IA( ) = 0, dac CA o vom numi variabil aleatoare indicator al mulimii A.

Dac variabila aleatoare X ia valorile x1,x2,,xn pe mulimile A1,A2,,An respectiv, unde (Ai)1in constituie o partiie a lui (sistem complet de evenimente), adic AiAj = dac ij i

U A = , atunci putem scrie:


i i =1

X ( ) = xi I Ai ( ), R.
i =1

Rezultatul care urmeaz ne va da posibilitatea s aproximm variabilele aleatoare oarecare cu ajutorul variabilelor aleatoare simple. Teorem. Dac X este o variabil aleatoare oarecare, atunci exist un ir cresctor (Xn)nN* de variabile aleatoare simple convergent ctre X.
Demonstraie. S presupunem mai nti c X 0; atunci, pentru orice nN*, s punem: i -1 i i 1 n n , dac n X ( ) < n , i = 1,2,..., n 2 Xn( ) = 2 2 2 n, dac X( ) n

Din modul cum am definit Xn rezult c este o variabil aleatoare simpl, oricare ar fi nN*, iar irul (Xn)nN* este cresctor. Dac X() < , atunci: i i 1 1 0 X ( ) Xn( ) n n = n 2 2 2 i, de aici:
lim Xn ( ) = X ( ) , uniform n raport cu .
n

Dac X() = , atunci Xn() = n, pentru orice nN* i deci lim Xn( ) = X ( ) .
n

Dac X nu este nenegativ, atunci ea poate fi pus sub forma X = X+ - X-, unde + X = sup (X,0), X- = -inf (X,0), care sunt variabile aleatoare nenegative crora li se poate aplica rezultatul menionat, ceea ce demonstreaz complet teorema. 2.2. Funcia de repartiie. Densitate de repartiie.
Proprieti. S considerm un cmp de probabiliti {,K,P} i X o variabil aleatoare definit pe acest cmp. Definiie. Numim funcie de repartiie a unei variabile aleatoare, X, aplicaia FX: R[0,1], definit prin relaia: FX(x) = P({:X() < x}) Exemplu. S considerm variabila aleatoare binomial k X : k k n k Cn p q , k = 0,1, 2,..., n Aplicnd definiia funciei de repartiie, obinem:

0 C 0 p 0 q n n 0 1 Cn p 0 q n + Cn p1q n 1 k FX ( x ) = Cnj p j q n j j=0 n 1 j j n j C n p q j=0 1

, x0 , 0 < x 1 , 1< x 2 , k < x k +1 , n 1 < x n , x>n

S-a obinut o funcie n trepte (n scar) cu salturi n punctele 0,1,2,,n.


Propoziie. Funcia de repartiie a unei variabile aleatoare X are urmtoarele proprieti:

(1) FX( ) = lim FX(x) = 0; FX(+ ) = lim FX(x) = 1


x x

(2) FX(x1) FX(x2), dac x1 < x2 (este nedescresctoare) (3) FX(x) = FX(x-0) = lim FX(y) (este continu la stnga)
y x

Demonstraie. (1) Fie irul (Xn) nN, Xn+1 < Xn, nN i lim Xn = - i s notm An = {:X() < Xn}.
n

Atunci, irul de evenimente (An) nN este descendent, An+1An, nN i Urmeaz, atunci, c:


lim P(An) = P(lim An) = P( I An) = 0
n n

n N

IA

/ =O .

Deci, lim P({ :X( ) < xn}) = lim Fx (xn) = F(- ) = 0 .


n n

Fie acum un ir (xn) nN, cresctor, xn<xn+1, nN cu lim x' n = + .


n

Notm Bn={:X() < xn}. Am obinut un ir ascendent de evenimente (Bn) nN, BnBn+1, nN i putem scrie: lim P(Bn) = P(lim Bn) = P( U Bn ) = 1 ,
n n n

adic:

lim P( :X( ) < xn) = 1 i, deci, lim FX(xn) = FX(+ ) = 1


n n

(2) Cum x1 < x2, putem scrie: {:x1 X() < x2} = {:X() < x2} - {:X() < x1}, {:X() < x1}{:X() < x2} P(:x1 X() < x2) = P(:X() < x2) - P(:X() < x1) = FX(x2) - FX(x1) 0 (3) S considerm irul (yn)nN R, yn < yn+1, nN, yn < x i lim yn = x .
n

Dac punem An = {:yn X() < x}, observm c AnAn+1, nN,


n n

n
n n

IA

/ = O i, din

lim P(An) = P( I An) = 0 , rezult c: lim P( :yn Xn( ) < x) = lim [Fx (x) - Fx (yn)] = 0 ,

adic lim Fx (yn) = Fx (x - 0) = Fx (x) .


n

Urmeaz de aici c, n mod necesar, orice funcie de repartiie are proprietile enumerate. Mai mult, orice funcie cu aceste proprieti este o funcie de repartiie, deci c proprietile (1),(2),(3) sunt necesare i suficiente pentru FX funcie de repartiie. Ca o completare la cele de mai sus, dm unele expresii utile n calcul.
Propoziie. Dac X este o variabil aleatoare i x1,x2R, x1 < x2, atunci: P(:x1 X() < x2) = FX(x2) - FX(x1) P(:x1 < X() < x2) = FX(x2) - FX(x1) - P(:X() = x1) P(:x1 < X() x2) = FX(x2) - FX(x1) + P(:X() = x2) - P(:X() = x1) P(:x1 X() x2) = FX(x2) - FX(x1) + P(:X() = x2). Demonstraia rezult imediat, iar noi o vom da numai pentru una din relaii, pentru celelalte fcndu-se analog.

{:x1 < X() < x2} = {:X() < x2} - {:X() x1} = = {:X() < x2} - [{:X() < x1} {:X() = x1}]. Lund probabilitatea i innd cont de faptul c {:X() x1} {:X() < x2}; x1 < x2 i {:X() < x1} {:X() = x1} = i se obine: P(:x1 < X() < x2) = FX(x2) - FX(x1) - P(:X() = x1).
Observaie. P(:X() = xi) reprezint saltul funciei de repartiie FX n punctul xi, i=1,2. Dac FX este continu, atunci P(:X() = xi) = 0, i=1,2. Din definiia funciei de repartiie rezult c ea are salturi numai la dreapta. Cum FX este o funcie cu variaia mrginit, cu variaia total 1, rezult c suma tuturor salturilor este 1. Teorema care urmeaz stabilete c mulimea tuturor salturilor ale funciei FX este cel mult numrabil. Demonstraie. Cum suma tuturor salturilor este 1, rezult c: 1 salturi mai mari ca : cel mult 1 2 1 salturi mai mari ca : cel mult 2 3 .. 1 salturi mai mari ca : cel mult n n . Deci, mulimea tuturor salturilor este o reuniune numrabil de mulimi cel mult numrabile, care este o mulime cel mult numrabil. Observaie. Unii autori definesc funcia de repartiie prin relaia: GX(x) = P(: X() x), x R.

Deosebirea const numai n faptul c, definit n acest mod, se modific proprietatea de continuitate, funcia GX fiind continu la dreapta, spre deosebire de FX care am vzut c este continu la stnga. Aadar, cnd se efectueaz calcule cu funcia de repartiie, va trebui s fim ateni cum s-a definit funcia, dac aceasta este discontinu (n cazul funciilor de repartiie continue am vzut c nu sunt probleme). S lmurim un aspect important privind corespondena ntre mulimea variabilelor aleatoare i mulimea funciilor de repartiie. Din definiia funciei de repartiie rezult c fiecrei variabile aleatoare i corespunde o singur funcie de repartiie. Reciproca, ns, nu-i adevrat, adic, fiind dat o funcie de repartiie, ea nu determin n mod unic variabila aleatoare. Vom dovedi acest lucru pe baza unui contraexemplu. Fie cmpul de probabilitate {[0,1], [0,1], P}, unde P este msura intervalului. Pe acest cmp, definim: 1 1 - 1, [0, 2 ) 1 , [0, 2 ) ; Y( ) = X( ) = 1 , [ 1 ,1] 1, [ 1 ,1] 2 2 Se vede imediat c X Y i c: 0 , x -1 1 FX(x) = P(:X() < x) = ,1 < x 1 2 1 , x > 1 0 , x -1 1 FY(x) = P(:X() < y) = ,1 < x 1 2 1 , x > 1 Cum FX = FY pe R, rezult afirmaia.

Densitate de repartiie. Dac exist o funcie f: RR+, integrabil pe R i astfel nct F(x) =

f(t) dt ,

atunci vom numi funcia f densitate de repartiie a variabilei aleatoare X care are funcia de repartiie F. Din definiia dat funciei f, rezult c aceasta are urmtoarele proprieti: (1) f(x) 0, xR (2)
-

f(x) dx = 1

Se constat imediat c dac exist densitatea de repartiie f, atunci F este derivabil i F(x) = f(x), iar probabilitatea ca variabila aleatoare X s ia valori cuprinse ntre x1 i x2, x1<x2 este dat de: P(:x1 X() < x2) = F(x2) - F(x1) = f(t) dt
x1 x2

Exemplu. S se determine constanta n astfel nct f: RR+ definit prin: , x (0,1) 0 , f(x) = a-1 b-1 , x (0,1) kx (1 - x)

unde a,b >0 sunt parametri. Dac k 0, atunci f(x) 0, x R. Din condiia
1 -

f(x) dx = 1 rezult:

k x a-1 (1- x) b-1 dx = 1


0

Cum

x
0

a-1

(1 - x)

b-1

, x ( 0,1) 0 1 1 i f(x) = dx = (a,b), obinem k = x a 1 (1 x ) b1 , x ( 0,1). (a, b) (a, b)

Variabila aleatoare X care are aceast densitate de repartiie, spunem c urmeaz o lege beta de parametri a i b.
Exemplu. S se verifice c funcia f: RR, definit prin relaia: a cos x , x [ / 2, / 2] f(x) = , x [ / 2, / 2] 0

poate fi o densitate de repartiie; alegnd convenabil constanta a, s se determine funcia de repartiie corespunztoare. S lum a 0, cci pe intervalul [-/2, /2], cos x 0 i s punem condiia /2 /2 1 f(x) dx = 1. n cazul nostru, a-/ 2cos x dx = 1 i cum -/ 2cos x dx = 2 , rezult a = 2 . - Atunci, , x - / 2 0 1 1 F(x) = f ( t ) dt = (sin x + 1) , - / 2 < x / 2 2 - 2 , x>/2 1 Dac X este o variabil aleatoare de tip discret, xn X: Pn , n I Pn = P(: X() = xn), nI, cel mult numrabil, atunci: F(x) = Pn ,
x n <x

care este o funcie de repartiie de tip discret. 2.3. Caracteristici numerice ale funciilor de repartiie. Fie X o variabil aleatoare, F funcia sa de repartiie i qN, q 2.
Definiie. Numim q-cvantile ale variabilei aleatoare X, numerele finite (ci(X))1iq-1 pentru q-i care P(:X() ci(X)) , P(:X() ci(X)) i/q, unde 1 i q-1. q

Din relaia P(:X() ci(X)) + P(:X() < ci(X)) = 1 rezult c q-cvantilele se definesc echivalent: F(ci(X) = 1 - P(:X() ci(X)) 1 F(ci(X) + 0)
q-i i = q q

i , 1 i q-1 q Se constat imediat c, n general, q-cvantilele nu sunt unic determinate. Dar dac F este continu i cresctoare, atunci q-cvantilele se pot determina n mod unic ca soluii ale ecuaiilor: i F(ci(X)) = , 1 i q 1 q Lund valori particulare ale lui q, obinem pentru q=2 mediana, pentru q=4 cvartilele, pentru q=10 decilele, pentru q=100 centilele. Aadar, mediana variabilei aleatoare X este numrul real c2(X) care satisface condiiile: 1 P(:X() c2(X)) 2 1 P(:X() c2(X)) 2 sau, cu ajutorul funciei de repartiie 1 F(c2(X)) 2 1 F(c2(X)+0) 2

Dac graficul funciei y = F(x) se completeaz n punctele de discontinuitate cu rezultatele cuprinse ntre punctele (x,F(x)) i (x,F(x+0)), atunci graficul y = F(x) are sau un 1 singur punct sau un segment paralel cu axa OX n comun cu dreapta y = . Punctul comun 2 sau punctele comune sunt toate puncte mediane ale funciei de repartiie F. Cnd F este 1 continu i strict cresctoare, mediana se obine ca soluie a ecuaiei F(x) = (soluie care 2 este unic). Dac exist densitatea de repartiie f(x) atunci se pot determina uor q-cvantilele cu ajutorul ecuaiei: c i (x) i f(x) dx = q , i = 1,2,,q-1, sau, echivalent:
c i (x)

f(x) dx = f(x) dx = = ( f(x) dx = f(x) dx = q )


c1 (x)
cq -2 x

c 2 (x)

cq -1 ( x )

c q -1 (x)

n cazul q = 2, avem:
me -

f(x) dx = f(x) dx = 2
m2

unde me este punctul median al repartiiei.


Definiie. Fiind dat funcia de repartiie F care are densitatea f, orice punct de maxim local pentru f se numete mod (punct modal). Dup numrul punctelor de maxim pentru f, avem repartiii unimodale, bimodale sau multimodale n general. n cazul repartiiilor discrete, punctul modal poart numele de valoarea cea mai probabil. Dac valorile variabilei aleatoare X sunt (xn)nI, IN i sunt presupuse a fi aezate n ordine cresctoare, notnd Pk = P(X=xk), valoarea cea mai probabil xk este cea care corespunde probabilitii Pk ce satisface dubla inegalitate

Pk-1 Pk Pk+1.
Exemple. 1) S se calculeze valoarea median pentru repartiia cu densitatea e - x , x > 0 f(x) = ,x 0 0 2) S se determine valoarea modal pentru repartiie N(m,). 3) S se stabileasc valoarea cea mai probabil pentru repartiiile: k k k ; Y = - X: k k n k C n p q , k = 0,1,2,..., n e , k = 0,1,2,... k! Soluii. me 1 ln 2 1 . 1) e - x dx = conduce la 1 - e - m e = , de unde me = 2 2 0 2) f(x; m,) =
1

e
3

( x m)2 2 2

x-m ; f '(x) = - 3 e 2

( x m )2 2 2

= 0 conduce la xmod = m.

< 0 rezult c este vorba de un maxim. 2 3) C k-1 p k 1q n k +1 C k p k q n k C k +1 p k +1q n k 1 ne conduce la np - q k np + p, n n n

Cum f(xmod) = -

care este valoarea cea mai probabil pentru X. Analog,


e -

k-1
( k 1)!

e -

k
k!

e -

k +1
(k + 1)!

ne conduce la valoarea cea mai probabil -1 k . 2.4. Vectori aleatori. Funcii de repartiie i densiti de repartiie multidimensionale. Dac {,K,P} este un cmp de probabilitate i (Rn,Bn) un cmp complet aditiv, cu R = Rx xR, Bn = BB cu semnificaia menionat, atunci X:Rn este o variabil aleatoare n-dimensional (un vector aleator n-dimensional) dac
n

X-1(B) = {:(X1(),X2(),,Xn()) B}, () B=B1xx Bn Bn.. Ca i n cazul unidimensional, vom considera definiia echivalent, X:Rn este variabil aleatoare n-dimensional dac {:X1() < x1, X2() < x2,,Xn() < xn} K, () (x1,x2,,xn)Rn.
Definiie. Numim funcie de repartiie n-dimensional a variabilei aleatoare vectoriale X=(X1,X2,,Xn), funcia F:Rn[0,1] definit prin:

FX(x1,x2,,xn) = P({{:X1() < x1, X2() < x2,,Xn() < xn}) Ca i n cazul unidimensional, funcia de repartiie are o seam de proprieti care-i sunt specifice i care o caracterizeaz: 1) Funciile pariale xk FX(x1,x2,,xk-1, xk, xk+1,,xn), k 1, n sunt nedescresctoare, adic FX este nedescresctoare n raport cu fiecare argument. 2) FX este continu la stnga n raport cu fiecare argument 3) Dac cel puin una dintre componente xi -, atunci FX 0, adic: lim FX (x1,..., xi - 1, xi, xi + 1,..., xn) = 0
x i

4)

x1 + ... x n +

lim FX (x1, x2,..., xn) = 1

(dac toate componentele xj , funcia de repartiie FX tinde ctre 1). 5) Pentru orice dou n-upluri (x1,x2,,xn) Rn, (y1,y2,,yn) Rn astfel nct xj < yj, 1jn, are loc: FX(y1, y2,..., yn) - Pi + Pij
i=1 i < j =1 n n i < j< k =1

ijk

+...+( 1) n FX(x1, x2,..., xn) 0

unde: Pi = FX(y1,,yi-1,xi,yi+1,,yn) Pij = FX(y1,,yi-1,xi,yi+1,,yj-1,xj,yj+1,,yn), 1 i j n i aa mai departe, cu Pijk, Proprietatea (5) completeaz proprietile funciei de repartiie, astfel nct orice funcie de repartiie n-dimensional are proprietile amintite i reciproc. Ea reprezint faptul c: P(:(X1(),X2(),,Xn()) [x1,y1)[x2,y2)[xn,yn)) 0, iar acest lucru se vede foarte bine n cazul n=2, cnd ea devine F(y1,y2) - F(x1,y2) - F(x2,y1) + F(x1,x2) 0 care, evident, reprezint probabilitatea de mai jos P(x1X1<y1; x2X2<y2) 0 S considerm mulimea (x1,y1)(x2,y2). u2

y2

x2 0 x1 y1 u1

Cum {: x1X1()<y1; x2X2()<y2} = = {:X1()<y1; X2()<y2} - [{:X1()<x1, X2()<y2} {:X1()<y1, X2()<y2}], iar i A = {X1<y1; X2<y2} A1A2 = {X1<x2; X2<y2} {X1<y1; X2<x2} A1A2 = {X1<x1, X2<x2}.

Lund probabilitatea i folosind proprietile acesteia, se obine imediat rezultatul. S observm c exist funcii F:Rn[0,1] care au proprietile (1)-(4) i care nu pot fi funcii de repartiie, deoarece nu ndeplinesc proprietatea (5). Iat, n cazul n=2, un exemplu care justific afirmaia. Fie F:R2R definit prin: 0 , dac x 0 sau y 0 sau x + y 2 F(x, y) = 1 , n rest Deci, pe D1={(x,y)x0 sau y0 sau x+y2} F ia valoarea zero, iar pe D2 = C R 2 D1 ia valoarea 1.

(0,2) D2 D1 (2,0)

S lum acum y1=y2=2; x1=x2=1. n acest caz, F(2,2) - F(1,2) - F(2,1) + F(1,1) = 1 - 1 - 1 + 0 = -1 i, deci, expresia dat de (5) nu poate reprezenta probabilitatea unui eveniment. S introducem acum noiunea de densitate de repartiie n-dimensional. Dac exist o funcie f:RnR continu i integrabil pe Rn, astfel nct:
x1 x 2

F(x1,..., xn) =

... f (u , u ,..., u ) du du ...du ,


1 2 n 1 2 n

xn

atunci funcia f poart numele de densitate de repartiie n-dimensional a vectorului aleator (X1,X2,,Xn). Din definiia dat, rezult imediat c funcia f are proprietile: (i) f(x1,x2,,xn)0 oricare ar fi (x1,x2,,xn)Rn

(ii)

... f (u , u ,..., u ) du du ...du


1 2 n 1 2

=1

n F(x1, x2,..., xn) Tot din definiie rezult c exist x1 x2... xn n F(x1, x2,..., xn) . x1 x2... xn

i c

f(x1,x2,,xn)=

S considerm acum cmpul de probabilitate {,K,P}, (X)I o familie de variabile aleatoare (I fiind o familie de indici).
Definiie. Familia (X)I este o familie de variabile aleatoare independente, dac pentru orice JI, J finit i orice familie de mulimi boreliene (B)J are loc relaia:
P( I X 1 ( B )) = P( X 1 ( B ))

Se poate demonstra urmtoarea teorem, important n aplicaii, relativ la independena variabilelor aleatoare. Teorem. Condiia necesar i suficient ca (X)I s fie independente este ca pentru orice JI, J finit, s avem: P( I X < a )) = P( X < a )) , aR, J
J J

Vom introduce acum noiunea de funcie de repartiie marginal. Dac F(x1,x2,,xn) este funcie de repartiie a vectorului aleator (X1,X2,,Xn) atunci:
x1 ... xi 1 xi +1 ... x n

lim F ( x1, x 2,..., xi 1, xi, xi + 1,... xn ) = Fi( xi ), i 1, n

se numete funcie de repartiie marginal a variabilei Xi.. Analog, putem introduce o repartiie marginal relativ la k variabile , 1 k < n. Astfel, de exemplu, dac alegem primele k variabile ale vectorului (X1,X2,,Xk,,Xn), atunci
x k +1 ... x n

lim F ( x1, x 2,..., xk , xk + 1,... xn ) = Fx 1 , . . . , x k ( x1,..., xk ) ,

ceea ce se poate exprima imediat cnd este vorba de variabilele Xi 1 , Xi 2 ,..., Xi k i obinem FXi1 ,Xi 2 ,...,Xi k ( xi 1 , xi 2 ,..., xi k ) . Acelai lucru este valabil n cazul densitilor de repartiie ndimensionale. Astfel, dac f(x1,x2,,xn) este densitatea de repartiie a vectorului aleator (X1,X2,,Xn), atunci densitatea de repartiie marginal a variabilei Xi este dat de:

f Xi (xi) =

... fi (x1,..., xi - 1, xi, xi + 1,..., xn) dx j


j i j =1

Desigur c, n mod asemntor, se obine:

f X1,X2,...,Xk (x1, x2, . . . , xk) =

... fi (x1,..., xn) dx j 442443 j = k +1 1 4 4


n k

Dac componentele vectorului aleator X=(X1,X2,,Xn) sunt variabile aleatoare discrete, atunci repartiia n-dimensional este dat de:

(x i1 , x i2 ,..., x in ) ( X1, X2,..., Xn ) : P (i1, i2,..., in) I1 I2...In , i1,i2,...,in


Ij, 1 j n cel mult numrabile, iar
P = P(X1 = x , X2 = x ,..., Xn = x ) i1,i2,...,in i1 i2 in

Atunci, repartiia marginal a variabilei Xk este

x ik Xk : P *...*ik*...*
unde: P
*...* k*...*

ik Ik ,

i i i i II I I Ca i n cazul variabilelor aleatoare de tip continuu, P = i1,i2,...,ik*...*

( 1,..., k-1, k+1,..., n) 1 2... k-1 k+1... n

P i1,i2,...,in

( k+1,..., n) k+1... n

P i1,i2,...,ik,ik+1,...,in

S vedem ce devin aceste relaii pentru n=2 att n cazul continuu, ct i n cel discret. Dac (X,Y) este un vector aleator cu funcia de repartiie F(x,y) i densitatea de repartiie f(x,y), atunci:
F1(x) = lim F(x, y); F2(y) = lim F(x, y)
y x

f1(x) = f(x, y)dy; f2(y) = f(x, y)dx


- -

n cazul discret, fie repartiia vectorului (x,y)

(xi, yi) i = 1,2,... , m; j = 1,2,..., n , (X, Y) : pij

pe care s o scriem sub forma tabelului de mai jos: Y X x1 x2 xi xm p*j unde am pus: pij=P(X=xi, Y=yj), i=1,2,,m; j=1,2,,n pi* = pij, i = 1,2,..., m; p * j = pij, j = 1,2,..., n
j=1 i=1 n m

y1

y2 yj yn

pi* p1* p2* pi* pm*

p11 p12 p1j p1n p21 p22 p2j p2n pi1 pi2 pij pin

pm1 pm2 pmj pmn p*1 p*2 p*j p*n

p = p = p
ij i* i=1 j =1 i =1 j =1

* j

=1

Cu ajutorul funciilor de repartiie marginale putem exprima acum simplu condiia de independen a componentelor X1, X2,,Xn ale unui vector aleator (X1,X2,,Xn). Deci, variabilele aleatoare X1,X2,,Xn sunt independente dac i numai dac F(x1, x2,..., xn) = Fj(xj) ,
j=1 n

sau, n cazul n care exist densiti de repartiie, f(x1, x2,..., xn) = fj(xj)
j=1 n

Dac X1,X2,,Xn sunt de tip discret vom avea

p
oricare ar fi ikIk, k=1,2,,n.

i1i2...in

=p

p ... p , **...*in i1*...* *i2*...*

Pentru n=2 relaiile devin: F(x,y) = F1(x) F2(y) f(x,y) = f1(x) f2(y) Pij = Pi* P*j , i = 1, 2, ..., m; j = 1, 2, ..., n O noiune important pentru aplicaii o constituie cea de repartiie condiionat. Avnd n vedere aplicaiile, precum i dificultile care apar n tratarea acestei noiuni, ne vom referi la densitatea de repartiie condiionat n cazul continuu i repartiie condiionat n cazul discret, pentru cazul particular n=2.

Fiind dat vectorul aleator (X,Y), se definete densitatea de repartiie a variabilei aleatoare X condiionat de Y=y i pe care o vom nota f(x/y) prin: f(x, y) f(x, y) f(x / y) = = f2(y) f(x, y) dx

n mod analog, avem densitatea de repartiie cu variabile aleatoare y condiionat de X = x:


f(y / x) = f(x, y) = f1(x) f(x, y)

f(x, y) dy

n cazul vectorilor aleatori (x,y) cu componentele X i Y variabile aleatoare discrete, avem:


xi / Y = yj i I , j J X / Y = yj : P(X = xi / Y = yj

i analog:
yj / X = xi j J , i I Y / X = xi : P(Y = yy / X = xi P(X = xi, Y = yj) pij P(X = xi / Y = yj) = p(xi / yj) = = P(Y = yj) p*j P(X = xi, Y = yj) pij = P(Y = yj / X = xi) = p(yj / xi) = , iI, jJ P(X = xi) pi *

Exemplu. Se consider vectorul aleator (X,Y) cu densitatea de repartiie: 1 (x + y + 2) , dac (x, y) (0,2)x(1,3) f(x, y) = 20 0 , n rest S se determine: (a) Densitile de repartiie marginale; (b) Funciile de repartiie marginale; (c) Funcia de repartiie a vectorului aleator (X,Y); (d) Densitile de repartiie condiionate. Soluie: (a) Din definiia densitilor de repartiie marginale rezult: 3 1 x+4 (x + y + 2)dy = , x (0,2) f1(x) = f(x, y)dy = 1 20 10 0 , x (0,2)

2 1 y+3 (x + y + 2)dx = , y (1,3) f2(y) = f(x, y)dx = 0 20 10 0 , y (1,3)

(b)

, < x 0 0 x 1 F1(x) = f1(u)du = (x 2 + 8x) ,0 < x 2 20 1 ,x > 2 , < y 1 0 y 1 F2(y) = f2(v)dv = (y 2 + 6y - 7) ,1 < y 3 20 1 ,y> 3
F(x, y) =

(c)

f(u, v) du dv =
, x ( ,0] sau y (-,1] , (x, y) (0,2]x(1,3] , (x, y) (2, )x(1,3] , (x, y) (0,2]x(3, ) , (x, y) (2, )x(3, )

x y

0 1 ( x 2 y + xy 2 + 4 xy x 2 10 x ) 40 1 = ( y 2 + 6 y 7) 20 1 ( x 2 + 8x ) 20 1

(d) Densitile de repartiie condiionate: x + y + 2 f(x, y) , x (0,2) f(x / y) = = 2(y + 3) , () y(1,3) f2(y) 0 , x (0,2)

x + y + 2 f(x, y) , y (1,3) f(y / x) = = 2(x + 4) , () x(0,2) f1(x) 0 , y (1,3)


2.5. Momente obinuite i centrate. Proprieti Asociem acum o serie de caracteristici numerice variabilelor aleatoare, caracetristici care intervin n mod frecvent n aplicaii i care vin s caracterizeze diversele tipuri de legi de repartiie. Este vorba de momentele obinuite i centrate de diferite ordine.
Definiie. Numim moment de ordin k al variabilei aleatoare X numrul

Mk(X) =

dF(x) ,

dac integrala Stieltjes exist. Un caz important pentru aplicaii este acela n care exist densitatea de repartiie f a variabilei aleatoare X i atunci:
Mk(X) =

f(x) dx

(n ipoteza c exist integrala Riemann improprie). Dac X este variabil aleatoare discret, atunci:

Mk(X) = x k P(X = xj) , j


jJ

J cel mult numrabil, n ipoteza c seria este convergent.


Definiie. Numim moment absolut de ordinul k al variabilei aleatoare X numrul Mk(X) , dac acesta exist, definit prin:
Mk(X) = Mk(| X| ) = | x| k dF(x)
-

Dac variabila aleatoare X are densitate de repartiie, Mk(X) = | x| k f(x) dx , iar dac X este de tip discret, Mk(X) = | x j | P(X = xj) .
k
jJ
-

S definim acum momentele centrate, care joac un rol tot att de important ca i cele obinuite.
Definiie. Numim moment centrat de ordinul k al variabilei aleatoare X numrul k(X), dac acesta exist, definit prin:

k(X) = (x M(x)) k f(x ) dx


-

Dac variabila aleatoare X are densitatea de repartiie f(x), atunci:

k(X) = (x M(x)) k f(x ) dx ,


iar dac X este de tip discret, k(X) = x j M(X)) k P(X = xj) , J cel mult numrabil.
jJ
-

Momentul de ordinul unu poart numele de valoare medie i vom scrie M1(X)=M(X). Momentul centrat de ordinul doi poart numele de dispersie a variabilei aleatoare X i o vom nota 2(X) sau D2(X) sau 2X. Radical din dispersie poart numele de abatere medie ptratic. Momentele centrate de ordinul k se pot exprima cu ajutorul momentelor obinuite pn la ordinul k, inclusiv. Pentru aceasta avem nevoie ns de unele proprieti ale valorii medii pe care le vom da n cele ce urmeaz. nainte, ns, s introducem noiunea de moment mixt. Fiind dat vectorul aleator X = (X1,X2,,Xn), numim moment mixt de ordinul k1,k2,,kn numrul

k1k2...k n

(X1X2...Xn) =

k k ... x1k1 x 2 2 ... x n n dn F(x1, x2,..., xn)

dac exist integrala Stieltjes multipl. Dac vectorul aleator (X1,X2,,Xn) are densitatea de repartiie f(x1,x2,,xn), atunci
M k1k2...kn (X1X2... Xn) =

k k ... x1k1 x 2 2 ... x n n f(x1, x2,..., xn) dx1...dxn

(n ipoteza c integrala multipl de ordinul n exist), iar dac vectorul (X1,X2,,Xn) este de tip discret,
M k1,k2,...,kn (X1X2...Xn) =
j 1J 1

... x
jn Jn

k1 j1

x k22 ... x knn P(X1 = x j1 , X 2 = x j2 ,..., X n = x jn ) j j


n

Analog, se definesc momentele centrate de ordinul k1,,kn (dac ele exist):

k1k2...kn (X1X2... Xn) = k1k2...kn (X1X2... Xn) =

... (xj - M(Xj)) kj dn F(x1, x2,..., xn) ,


j=1 n n

sau, cnd exist densitatea de repartiie f(x1,x2,,xn),

... (xj - M(Xj)) kj f(x1, x2,..., xn) dxj


j=1 j=1

iar n cazul variabilelor aleatoare discrete, k1k2...kn (X1X2...Xn) = ... (xj1 - M(X1 )) k1 ...(xj n - M(X n )) k n P(X1 = x j1 , ..., X n = x jn ) j 1J 1 jn Jn Din momentele mixte se pot obine momentele variabilelor aleatoare unidimensionale obinuite sau centrate:
Mk(Xp) = M 0,...,0,k,0,...0 (X1X2... Xn) =

... x k f(x1, x2,..., xn) dxj p


j=1

k(Xp) = 0,..., 0 ,k , 0...0 (X1X2...Xn) =

... (xp - M(xp)) kj f(x1, x2,..., xn) dxj , p=1,2,,n.


j=1 j=1

Frecvena de utilizare a valorii medii i dispersiei n aplicaii sau n tratarea unor aspecte teoretice impune un studiu al proprietilor acestora. Propoziie. Operaia valoarea medie are urmtoarele proprieti: (1) Dac variabila aleatoare X=c (constant) cu probabilitatea 1, atunci M(Xk) = ck, kN (2) M(aX) = a M(X) (3) M( ajXj) = ajM(Xj)
j=1 n j=1 n n

(4) M( Xj) = M(Xj) ,


j=1 j =1

dac X1,X2,,Xn sunt independente (n totalitate).

Demonstraie.
0, x c c (1) Dac X = c cu probabilitatea 1, atunci X are repartiia X : i deci FX(x) = 1 1, x > c k k i de aici urmeaz M(X ) = c . axj (2) Este suficient s demonstrm n cazul X discret; atunci: a X : j J i deci P(X = xj)

M(aX) = (aXj) P(X = xj) = aM(X) .


jJ

(3) Este suficient s demonstrm proprietatea pentru n = 2, a1 = a2 = 1, apoi, prin inducie dup n i folosind proprietatea (2), rezult afirmaia. Vom presupune pentru simplificare c vectorul (X1,X2) are densitatea de repartiie f(x1,x2) i atunci urmeaz c:
M(X1 + X2) =

( x1 + x2)f(x1, x2) dx1dx2 =


2 1

x1 f(x1, x2) dx1dx2 +


2

x f(x , x ) dx dx
2 1 2 1

x ( f(x , x ) dx ) dx
1 1 2

x ( f(x , x ) dx ) dx
2 1 2 1

= x1 f1(x1) dx1 + x2 f2(x2) dx2 =

= M ( X 1) + M ( X 2 ).

(4) Presupunnd c X1,X2,,Xn sunt independente n totalitate i c vectorul (X1,X2,,Xn) are densitatea de repartiie f(X1,X2,,Xn)( x1,x2,,xn) care, n ipoteza de independen, este f(X1,X2,,Xn)( x1,x2,,xn) = f1(x1)f2(x2)fn(xn), va rezulta:
=

M (X1X2...Xn) =

... x1x2...xn f X1X2...Xn (x1, x2,..., xn) dx1...dxn =

n n

... x1x2...xn f(x1)f(x2)...f(xn) dx1...dxn = xjfj(xj) dxj = M(Xj)


j=1 - j=1

adic M( Xj) = M(Xj) .


j=1 j=1

Observaie. Dac X este o variabil aleatoare pentru care exist M(X), atunci X - M(X) o vom numi variabil aleatoare abatere i, folosind proprietile valorii medii, va rezulta imediat c: M(X - M(X)) = 0. Dac, n plus, exist M2(X) atunci, pornind de la definiie i folosind proprietile valorii medii, vom obine: D2(X) = M[(X - M(X))2] = M[X2 - 2M(X)X + M2(X)] = M(X2) - M2(X) = M2(X) - M2(X). Dac variabila aleatoare X are valoare medie i dispersie, atunci are sens pe care o vom numi abatere normal, dat fiind faptul c: X - M(X) 2 X - M(X) M = 0; D D( X ) = 1 D( X ) Propoziie. Au loc urmtoarele proprieti pentru momentul centrat de ordinul doi: (1) Dac X = c (constant) cu probabilitatea 1, atunci D2(X) = 0. (2) D2(aX) = a2D2(X). (3) D ( ajXj) = a 2 D 2 (Xj) , dac X1,X2,,Xn sunt independente dou cte dou. j
2 j=1 n

X - M(X) , D( X )

j =1

Demonstraie.
c (1) Cum X are repartiia X : , rezult c M(X) = c i X - M(x) : 1 2 (2) D (aX) = M[(aX - M(aX))2] = M[a2(X - M(X))2] = a2D2(X) 0 2 , adic D (X)=0. 1

(3) Aplicm definiia dispersiei:


D 2 ( ajXj) = M2( ajXj) - M 2 ( ajXj)
j=1 n j=1 j=1 n n n

M 2 ( ajXj) = ( ajM(Xj)) 2 = a 2 M 2 (Xj) + 2 j


j=1 n j=1 j=1 n n 2 2

1 j< k n

a a M(X )M(X )
j k j k

M ( ajXj) = M (( ajXj) ) = a 2 M 2 (X 2 ) + 2 j j
j=1 j=1 j=1

1 j< k n

a a M(X X )
j k j k

Cum variabilele X1,X2,,Xn sunt independente dou cte dou, rezult c: M(XjXk) = M(Xj)M(Xk) i, deci,

D 2 ( ajXj) = a 2 M 2 (X 2 ) + 2 j j
j=1 j=1 2 j n 2 j 2

1 j< k n

ajakM(Xj)M(Xk) a 2j M 2 (X 2j ) - 2
j =1

1 j< k n

a a M(X )M(X ) =
j k j k

= a [M(X ) - M (X j )] = a 2 D 2 (Xj) j
j =1 j=1

Aa dup cum am amintit,

2 ( X ) = D( X ) = X
este abaterea medie ptratic a variabilei aleatoare X. Ca aplicaie a proprietilor valorii medii putem acum s artm c momentele centrate de ordinul k se pot exprima cu ajutorul momentelor de ordin cel mult k i reciproc. ntr-adevr,

k ( X ) = Mk[ X M ( X )] = M [( X M ( X )) k ] = ( 1) j Ckj Mk j( X ) M j ( X ), k *
j=0

i reciproc, Mk ( X ) = Ckj k j ( X ) M j ( X )
j=0 k

Alte valori tipice ale variabilei aleatoare se pot introduce de la momentele obinuite sau centrate. Aa, de exemplu, se introduce noiunea de asimetrie a unei variabile aleatoare pentru care exist 2(X) i 3(X). Prin definiie, coeficientul de asimetrie al variabilei X este (X) 1 = 332 2 / ( X ) Se constat imediat c acest coeficient are acelai semn cu momentul 3(X). De aici rezult c asimetria este pozitiv dac valoarea modal este situat n stnga valorii medii i negativ n caz contrar. Pentru variabilele aleatoare pentru care exist 2(X) i 4(X) se introduce coeficientul de exces prin expresia: (X) 21 = 4 3 22 ( X )

Acest coeficient caracterizeaz gradul de aplatizare a graficului densitii de repartiie fa de graficul densitii de repartiie normal: 1 x2 /2 , f (x) = e 2 pentru care 2 = 0. Repartiiile pentru care 2 = 0 se numesc mezocurtice, cele cu 2 > 0 leptocurtice, iar cele cu 2 < 0 - platocurtice. S considerm acum dou exemple pentru care s punem n eviden coeficienii de asimetrie i de exces. Se consider variabila aleatoare Poisson k k X : - k = 0,1,2,... e k!

i variabila aleatoare Y repartizat exponenial negativ, de parametru : x 1 ,x > 0 e f(x) = >0 0 ,x 0 Atunci,

M(X) = ke -
k=0

x
k!

= = e - k
k=1

M2(X) = k 2 e -
k=0

x
k!

k-2 k-1 2 = e -k + = + ( k 1)! k=2 ( k 2)! k=1 ( k 1)!


2

k-1

M3(X) = k e
k=0

k!

= e k
- k=1

k-1
( k 1)!

= e [( k 1) + 2( k 1) + 1]

2 k=1

k-1
( k 1)!

= 3 + 32 + M4(X) = k e
k=0

4 -

x
k!

= 4 + 43 + 82 + 2

ntruct 2(X) = i 3(X) = M3(X) - 3M(X)M(X) + 2M3(X) = , rezult:

1 =

3 ( X ) 1 = 3/ 2 = 1/ 2 > 0 3/ 2 2 ( X )

ceea ce nseamn c repartiia Poisson este asimetric (pozitiv asimetric)


1 3 4 ( X ) = C40 M 4 ( X ) C4 M 3 ( X ) M ( X ) + C42 M 2 ( X ) M 2 ( X ) C4 M 4 ( X ) + M 4 ( X ) =

= 2 (1 + 2 2 ) 4 ( X ) 2 (1 + 2 2 ) 3 3= 2 = 2 2 ( X ) 2 (1 + ) 2

n cazul repartiiei exponeniale, x 1 k M k (X) = x e dx = k ( k + 1) 0 M1(X) = M2(X) = 22 M3(X) = 63 M4(X) = 244 1(X) = 0 2(X) = 2 3(X) = 23 4(X) = 94

3 ( X ) 2 3 1 = 3/ 2 3= = 2 - pozitiv asimetric 2 ( X ) 6 4 ( X ) 9 4 2 = 2 3= 4 3= 6, 2 ( X ) deci o repartiie leptocurtic.

Inegalitatea lui Cebev. Aceast inegalitate celebr leag posibilitatea abaterii n valoare absolut de dispersia variabilei aleatoare i intervine n numeroase aplicaii. Dac X este o variabil aleatoare pentru care exist M(X) i D2(X), atunci, pentru orice > 0, are loc inegalitatea: D2 ( X ) P(:| X ( ) M ( X )| ) 2

Pentru a dovedi acest lucru, pornim de la expresia dispersiei: D 2 ( X ) = ( x M ( X )) 2 dF ( x ) =


R

| x M ( X )|

( x M ( X ))
2

dF ( x ) +

| x M ( X )|<

( x M ( X ))

dF ( x )

| x M ( X )|

( x M ( X ))

dF ( x )
2

| x M ( X )|<

dF ( x ) =
D2 ( X )

P(:| X ( ) M ( X )| )

Deci, P(:| X ( ) M ( X )| )

2 P( :| X ( ) M ( X )| ) + P( :| X ( ) M ( X )| < ) = 1, obinem:
P(:| X ( ) M ( X )| < ) = 1 P(:| X ( ) M ( X )| ) 1

. Dac acum inem seama de egalitatea

D2 ( X )

Aadar, cu ajutorul inegalitii lui Cebev putem evalua o limit inferioar a probabilitii cu care valorile variabilei aleatoare se grupeaz n jurul valorii medii. 1 8 Dac lum = 3X, atunci P( :| X ( ) M ( X )| < 3 X ) 1 = , care mai poate 9 9 fi scris 8 P( : M ( X ) 3 X < X ( ) < M ( X ) + 3 X ) , 9 motiv pentru care este cunoscut i sub numele de regula 3X.
2.6. Inegaliti pentru momente. Inegalitatea lui H lder Dac X i Y sunt variabile aleatoare astfel nct exist Mr(|X|) i Ms(|Y|), atunci exist M(|XY|) i 1 1 1 1 r M(|XY|) Mr(| X| ) Ms(|Y| ) s , unde r > 1 i + = 1 . r s Pentru r = s = 2 obinem un caz particular, inegalitatea lui Schwartz: M(|XY|) (M2(|X|))
Demonstraie. Vom pleca de la inegalitatea | ab|
1 2 1 2

(M2(|Y|)) .

| a| r | b| s 1 1 + , r > 1, + = 1, a,bR. s r r s

Dac lum obinem:

a=

X X b= r 1/ r ; ( M (|/ Y | sr ))1/ s ( M (| X | ))

i nlocuim n inegalitatea considerat,

| XY | | X |r | Y|s + ( M (| X | r ))1/ r ( M (| Y | ) s )1/ s rM (| X | r ) s( M (| Y | ) s ) Aplicnd operatorul valoare medie, se obine: M (| XY | ) M (| X | r ) M (| Y | s ) 1 1 + + =1 r 1/ r s 1/ s r s = ( M (| X | )) ( M (| Y | ) ) rM (| X | ) s( M (| Y | ) ) r s i, deci, M(|XY|) Mr(| X| )
1 r 1

Ms(|Y| ) s ,

care este tocmai inegalitatea considerat. n cazul n care r = s = 2 se obine de aici, aa cum am menionat, inegalitatea lui Schwartz. Inegalitatea lui Minkowski. Dac X i Y sunt variabile aleatoare astfel nct M(|X|r) i M(|Y| ) exist pentru r 1, atunci exist M(|X+Y|r) i avem:
r
1

M(|X+Y| ) M(|X| r )

r r

1 r

+ M(|Y| r ) r .

Demonstraie. Pentru r = 1 inegalitatea este evident. Presupunem deci r >1 i atunci putem scrie: M(| X + Y| r ) = M(| X + Y|| X + Y| r-1 ) M((| X|+|Y| )| X + Y| r-1 ) =
= M(| X|| X + Y| r-1 )
+ M(|Y|| X + Y| r-1

Aplicnd inegalitatea lui H lder pentru fiecare termen din ultima sum obinem:

M(| X|| X + Y|

r-1

) M(| X| )) M(| X + Y|
r 1

1 r

s(r-1)

1 s 1

M(|Y|| X + Y| r-1 ) M(|Y| r )) r M(| X + Y| s(r-1) ) s


Avem, deci,
1 1 1 M(| X + Y| r ) ( M(| X| r )) r + (M(|Y| r )) r M(| X + Y| s(r-1) ) s 1 1 1 mprind cu M(| X + Y| s(r-1) ) s i innd seama de faptul c (r - 1)s = r; 1- = se obine: s r 1

M(|X+Y |) M(|X| )
r

1 r

+ M(|Y| ) .

1 r

Inegalitatea lui Liapunov (proprietatea de monotonie a momentelor).


Dac exist M(| X| ) i M(|X| ) , 0 < r1 r2 atunci (M(| X| )) (M(|X| )) . Demonstraie.
r1 r2
r1 r2 1 r2 1 r2

Pentru r1 = r2 inegalitatea este adevrat, cu semnul egal. Presupunem deci c r1 < r2 i atunci r2 1 1 + = 1 i s aplicm inegalitatea lui H lder aa cum rezult > 1 ; alegem s astfel nct r2 s r1 r1 mai jos:
(M(| X| r1 ) = (M(| X| r1 1) (M((| X| r1 ) r2 / r1 ))1/
1 1
r 2 / r1

( M (1s ))1/ s = ( M(| X| r2 )) r1 / r2

De aici rezult imediat c (M(|X| r1 )) r1 (M(|X| r2 )) r2 . 2.7. Corelaie i coeficient de corelaie. S considerm vectorul aleator (X,Y) i asupra componentelor facem ipoteza c exist M2(X) i M2(Y).
Definiie. Numim corelaie (covarian) a variabilelor X i Y momentul mixt

11 = M[(X- M(X)) (Y - M(X))] Adesea se mai noteaz 11 = cov(X,Y). Acest indicator msoar existena legturii stochastice ntre variabilele X i Y. Din definiia corelaiei rezult imediat c 11 = M(XY) - M(X)M(Y) Prin definiie, variabilele X i Y se numesc necorelate dac 11 = 0. Aceasta nseamn c: M(XY) = M(X)M(Y) Dac variabilele X i Y sunt independente, atunci ele sunt necorelate. Reciproc nu-i adevrat ntotdeauna, lucru ce se poate constata pe urmtorul exemplu. Se consider vectorul aleator (X,Y), cu densitatea de repartiie bidimensional:

1 2 2 4 [1 + xy(x y )] f(x, y) = 0 Dintr-un calcul simplu rezult imediat c:

, (x, y) [1,1]x[1,1] , n rest

1 M(X) = 4 1 1 4 1
1 1

1 x[1 + xy(x y )] dx dy = 4 1
2 2

1 x dx dy + 4 1

x 4 y dx dy

x 2 y 3 dx dy = 0
2

1 M(Y) = 4 1

1 1

y[1 + xy(x
1

y 2 )] dx dy = 0
1 2 2

1 M(XY) = 4 1 1 4 1
1

1 xy[1 + xy(x y )] dx dy = 4 1 x 2 y 4 dx dy = 0

1 xy dx dy + 4 1

x 4 y 2 dx dy -

Deci 11 = 0, adic variabilele X i Y sunt necorelate. Pe de alt parte,


f1 (x) = 1 1 1[1 + xy(x 2 y 2 )]dy = 2 , x[-1,1] 4
1 1

1 1 f 2 (y) = [1 + xy(x 2 y 2 )]dx = , y[-1,1] 4 1 2

i, evident, f(x,y) f1(x)f2(y), ceea ce nseamn c variabilele X i Y nu sunt independente. Intensitatea legturii stochastice a dou variabile aleatoare se poate msura cu ajutorul unor indicatori numerici dintre care cel mai frecvent ntlnit este coeficientul de corelaie. Fie X,Y dou variabile aleatoare pentru care exist D2(X) i D2(Y). Definiie. Numim coeficient de corelaie al variabilelor X,Y raportul: 11 M ( XY ) M ( X ) M (Y ) X,Y = = D(X)D(Y) D 2 ( X )D 2 (Y )
Teorem. Oricare ar fi variabilele aleatoare X,Y astfel nct D2(X)D2(Y) 0, au loc proprietile: (1) XY = 0 dac i numai dac variabilele aleatoare X,Y sunt necorelate; (2) Dac X,Y sunt independente, atunci XY = 0, reciproca nefiind adevrat; (3) |XY| 1; (4) |XY| = 1 implic o dependen liniar ntre variabilele X i Y. Demonstraie. (1) rezult imediat, din nsi definiia coeficientului de corelaie. (2) X,Y independente nseamn M(XY) = M(X)M(Y) i deci conv(XY) = 0, ceea ce conduce la XY = 0. Faptul c invers nu-i adevrat rezult imediat din exemplul anterior.

(3) | XY | =

M[( X M ( X ))(Y M (Y ))] M ( ( X M ( X ))(Y M (Y )) ) D( X )D(Y ) D( X )D(Y )

( M (| X M ( X )| 2 ))1/ 2 ( M (| Y M (Y )| 2 ))1/ 2 =1 D( X )D(Y ) (4) Fie a,b R, a 0 i s lum Y = aX + b. Atunci,


2 M [( X M ( X ))( aX + b aM ( X ) b)] aM ( X M ( X )) . = XY | = D( X ) D( aX + b) | a| D 2 ( X )

Deci, XY =

a 1 = | a| 1

,a < 0 ,a > 0

i, dac exist ntre X i Y o dependen liniar, atunci XY = 1. S considerm acum variabilele aleatoare abatere normat:
X M( X ) Y M (Y ) ; Y' = D( X ) D(Y ) Atunci, M(XY) = XY = 1. Pe de alt parte, X'=

M (( X M ( X )) 2 ) M ((Y M (Y )) 2 ) + 2 M ( X ' Y ' ) = 2 2( 1) = 0 D2( X ) D 2 (Y ) i, deci, X Y = 0 cu probabilitatea 1. innd cont de modul n care s-au definit cele dou variabile aleatoare rezult: X M( X ) Y = M (Y ) D(Y ) D( X ) M (| X 'Y '| 2 ) =
ceea ce dovedete c: Y = b aX, adic o dependen liniar.
y M (Y ) x M( X ) x M( X ) y M (Y ) i se numesc drepte = 1 = 2 D(Y ) D( X ) D( X ) D(Y ) de regresie i se intersecteaz n punctul (M(X)M(Y)).

Dreptele

Valori medii condiionate. Vom lua n consideraie doar cazurile importante, cnd exist densitate de repartiie condiionat sau cnd variabilele sunt de tip discret. Dac variabila aleatoare X are repartiia

xj X: P(X = x j )

j J

i dac A este un eveniment cu P(A) 0, atunci, prin definiie, valoarea medie condiionat de evenimentul A a variabilei X este:

M(X / A) = x j P(X = x j / A) .
jJ

n cazul cnd avem un vector aleator bidimensional (X,Y) cu X i Y de tip discret, n locul evenimentului A putem lua {Y = yk} i atunci

M(X / Y = y k ) = x j P(X = x j / Y = y k )
jJ

n ipoteza c exist densitatea de repartiie condiionat f(x/y) rezult:


x f(x, y) 1 M(X / Y = y) = xf(x / y) dx = dx = xf(x, y) dx f 2 (y) f 2 (y) -

Analog, se introduc mediile condiionate:

M(Y / B) = y k P(Y = y k / B)
jkJK

M(Y / X = x j ) = y k P(Y = y k / X = x j )
jkJK

1 M(Y / X = x ) = yf(y / x) dy = yf(x, y) dy f1 (x) -

Se vede imediat c

M(X/Y=y) = 1(y) M(Y/X=x) = 2(x), funcii care poart numele de curbe de regresie.

2.8. Funcii de argumente aleatoare Fie (Xi) 1 i n o familie finit de variabile aleatoare i s considerm familia de aplicaii hj:RnR, 1 j m msurabile Borel. Atunci Yj = hj(X1,X2,,Xn), 1 j m sunt variabile aleatoare. Dac notm cu X = (X1,X2,,Xn) vectorul aleator n-dimensional i cu Y = (Y1,Y2,,Ym) vectorul aleator m-dimensional, atunci

FY ( y1 , y 2 ,..., y m ) = ... d n FX ( x1 , x 2 ,..., x n ) ,


Dn

unde Dn = {(x1,x2,,xn)Rn : hj(x1,x2,,xn) < yj, 1 j m}. n cazul n care m = n, hj, 1 j m sunt bijecii difereniabile, iar X i Y admit densiti de repartiie, atunci
-1 (*) fY(x1,..., xn) = fX(h 1 (x1,..., xn),..., h -1 (x1,..., xn)) | J| n

unde J este iacobianul transformrii,


J= D( h1,..., hn ) . D ( x1,.., xn )

Dac m = n = 1, relaia (*) devine:

fY(x) = fX(h 1 (x)) |(h 1 (x))'|


Exemplu. Fie Y o variabil aleatoare a crei densitate de repartiie este fX(x) i s considerm variabila aleatoare Y = h(X) = X2. Atunci h 1 (x) = x , x > o i de aici rezult:

0 f Y (x) = 1 fX( x) + fX( x ) 2 x

,x 0 ,x > 0

Aceast relaie rezult ns imediat (i mai simplu), dup cum urmeaz: 0 ,x 0 FY ( x ) = P( : Y ( ) < x ) = P( : X 2 ( ) < x ) = P( :| X ( )| < x , x > 0 0 ,x 0 = FX ( x ) FX ( x ) , x > 0

De aici, prin derivare, rezult c: 0 f Y (x) = 1 fX( x) + fX( x ) 2 x ,x 0 ,x > 0

Pentru familia de variabile aleatoare (Xi) 1 i n independente, n cazul m =1 i Y = h(X1,X2,,Xn)= Xi , atunci:


i =1 n

FY ( y ) = ... d n FX ( x1 , x 2 ,..., x n ) = ... dF 1( x1 )... dFn( x n ) ,


Dn Dn

unde Dn = {(x1,x2,,xn)R : x1+x2++xn < y}. innd seama de definiia produsului de compoziie (convoluie) i de asociativitatea sa, putem scrie
FY ( y ) =

d ( F ... F )( x ) =( F ... F )( x )
1

S considerm acum vectorul aleator (X,Y) cu densitatea de repartiie fX,Y(x,y) i s determinm densitatea de repartiie a variabilelor X 1) U = X+Y; 2) V = XY; 3) W = , Y 0 . Y

1) FU(u)

P(X+Y<u)=

{( x , y )R 2 :x + y < u

X, Y

(x, y) dx dy =

f
X, Y

u y

(X, Y)

(x, y) dx dy .

Rezult:

fU ( u) =

X, Y

(u y, y) dy i, prin simetrie, fU ( u ) =

(x, u - x) dx . Dac X,Y sunt

independente, atunci fU(u) =

fX(u y)fY(y) dy = fX(x)fY(u x) dx .

2) FV(v)=P(XY<v)=

{( x , y )R :xy < v }
2

f
0

X, Y

(x, y) dx dy =
0

v y

(X, Y)

(x, y) dx dy +

v y

f$

X,Y

(x, y) dx dy

1 v 1 v fV(v) = fX, Y( , y)dy fX, Y( , y)dy . y y y y 0

Deci,

fV(v) =

v 1 v fX, Y( , y)dy = fX, Y(x, )dx y x x y

Dac X,Y sunt independente, atunci:

fV(v) =
X 3) FW(w) = P( < w) = Y Urmeaz c

v 1 v fX( )fY(y)dy = fX(x)fY( )dx x x y y


yw

x {( x , y )R : < w , y 0} y
2

fX, Y(x, y) dx dy =
0

fX, Y(x, y) dx dy +

yw

X, Y

(x, y) dx dy

fW(w) = yfX, Y(yw, y)dy yfX, Y(yw, y)dy = y fX, Y(yw, y)dy
0

Dac X,Y sunt independente, atunci:


fW(w) =

y f (yw)f (y)dy
X Y

Observaie. Cu ajutorul schimbrilor la variabile se pot obine aceleai rezultate, pe aceast cale simpl: 1) Z = X+Y i punem T=Y. Atunci, D(x, y) F(Z, T)(z, t) = f(X, Y)(x(z, t), y(z, t)) D(z, t) D(x, y) 1 1 x = z-t; y = t; = =1 0 1 D(z, t)

i
fZ(z) = f Z,T (z, t)dt = f X,Y (z - t, t)dt = f X,Y (z - y, y)dy = f X,Y (x, z - x)dx
-

2) V = XY; T = Y FV,T (v, t) = f(X, Y)(x(v, t), y(v, t))


v x = t y = t
1 D(x, y) t = D(v, t) 0 v t2 = 1 t 1

D(x, y) D(z, t)

v 1 f(V, T)(v, t) = f(X, Y)( , t) t | t|

i, de aici,
fV(v) =

v 1 v 1 f(V, T)(v, t) dt = f(X, Y)( , t) dt = f(X, Y)( , y) dy t | t| y | y| -

x = t v y = t

Analog, dac punem 1 D( x, y ) = v D( v, t ) 2 t


fV(v) =

0 1 = 1 , obinem: t t

v 1 v 1 f(T, V)(t, v) dt = f(X, Y)(t, ) dt = f(X, Y)(x, ) dx t | t| x | x| -

3) S punem X x = tw W = Y y = t T = Y

D(x, y) w t = = t D(t, w) 1 0
f(T, W)(t, w) = f(X, Y)(tw, t)| t|

i, de aici,
fW(w) =

f(T, W)(t, w) dt = f(X, Y)(tw, t) | t| dt =


-

(X, Y)

(yw, y)| y| dy

2.9. Funcie caracteristic. Proprieti Am vzut c funcia de repartiie constituie un instrument analitic de studiat variabilele aleatoare. n multe situaii - ndeosebi n studiul sumelor de variabile aleatoare independente - devine mai dificil de manipulat i, drept urmare, s-au cutat alte instrumente mai uor de manipulat. Funcia caracteristic constituie un instrument puternic de investigaie i comod de utilizat.
Definiie. Fie X o variabil aleatoare definit pe {,K,P} cu funcia de repartiie FX. Aplicaia X:RC, definit prin: X(t) = M(eitX)

o vom numi funcie caracteristic a variabilei aleatoare X. Din definiia funciei caracteristice rezult c:

X (t) =

itx

dFX ( x )

Dac variabila aleatoare este de tip discret, atunci: X ( t ) = e itxj P( X = xj ) ,


j J

iar dac X admite densitatea de repartiie fX, rezult, din definiie, c:

X ( t ) = e itx f X ( x )dx

Propoziia care urmeaz grupeaz principalele proprieti ale funciei caracteristice.


Propoziie. Dac X este funcia caracteristic a variabilei aleatoare X, atunci ea are proprietile:

(1) (2) (3) (4)

X(0) = 1 | X(t) | 1 X (t) = X ( t) X este uniform continu pe R.

Demonstraie.

(1) Rezult imediat c X ( 0) = 1 dFX(x) = 1

(2) X ( t ) =

itx

dFX ( x )

e
itx

itx

dFX ( x ) = dFX ( x ) = 1

(3) X ( t ) =

itx

dFX ( x )

dFX ( x ) = e itx dFX ( x ) =X ( t )

(4) Fie t1,t2R i s considerm

X ( t1) X ( t 2 ) =

it1 x

dFX ( x )

it 2 x

dFX ( x )

(e
i

it1 x

it 2 x

)dFX ( x )

it1 x

e it 2 x dFX ( x )

Fie acum > 0 i A > 0 astfel nct

dF

(x) <

dF ( x ) < 8 .
X A

Pentru |x| < A, dac |t1-t2| < (), atunci


A

e it1x e it2 x <

. Deci,
dFX ( x ) + e it1x e it2 x dFX ( x )
A

X ( t 1) X ( t 2 ) =

it1 x

it 2 x

dFX ( x ) +

it1 x

it 2 x

Cum pentru orice xR, e it1x e it2 x 2 , rezult c:

X ( t1) X ( t 2 ) = 2 dFX ( x ) +

2 A

dFX ( x ) + 2 dFX ( x ) = ,
A

ceea ce demonstreaz afirmaia.


Propoziie. Dac Y = aX + b, atunci:

(1) Y ( t ) = e ibt X ( at ) Dac (Xj)1 j n sunt variabile aleatoare independente, atunci: (2)
(t ) = X j (t )
j =1 n

j =1

Xj

Demonstraie. (1) Y(t) = M(eitY) = M(eit(aX+b)) = M(eibt eiatX) = eibtM(eiatX) = eibtX(at)

(2) Demonstrm prin inducie: n = 2: ( X ,X ) ( t ) = M e it ( X1 + X 2 ) = M e it ( aX1 ) e it ( aX 2 ) = M ( e itX1 ) M ( e itX 2 ) = X 1 ( t )X 2 ( t ) 1 2 Presupunem proprietatea adevrat pentru n-1 i dovedim pentru n:

j =1

Xj

(t ) = M (e

it

X ) =M (e
j j =1

it Xj
j =1

itXn

) = M (e

it Xj
j =1

) M ( e itXn ) = X j ( t ) Xn ( t ) = X j ( t )
j =1 j =1

n 1

n 1

S stabilim legtura ntre funcia caracteristic i momente, dac acestea exist.


Teorem. Dac X este o variabil aleatoare pentru care exist Mn(|X|), atunci X este de n ori derivabil i ( Xk ) ( 0) = i k M k ( X ), 1 k n Demonstraie. n expresia funciei caracteristice

X ( t ) = e itx dFX ( x )

s derivm formal de k ori (k n). Obinem

Dar,

(k) X

(t) = i

e itx dFX ( x ) .

(k ) X

(t ) = i

e dFX ( x )
itx

dFX ( x ) = Mk (| x| ) < ,

n virtutea ipotezei fcute. Din derivata de ordin K a funciei caracteristice, rezult acum imediat:

( Xk ) ( 0) = i k M k ( X ), 1 k n

Consecin. Dac variabila aleatoare X admite momente de orice ordin (finite), atunci: ( it ) k X (t) = M k ( X ) , k! k =0 pe intervalul de convergen al seriei de puteri. Pornind de la funcia caracteristic vom defini acum alte caracteristici numerice ale unei variabile aleatoare X, diferite de momentele considerate de noi. Definiie. Fie X o variabil aleatoare i X(t) funcia ei caracteristic. Vom numi aplicaia

X:RC, definit prin: X(t) = ln X(t) a doua funcie caracteristic a variabilei aleatoare X. (s-a luat aici determinarea principal a logaritmului natural). Din definiia dat, rezult c dac exist X(0) i X(0) atunci exist M(X) i D2(X) i putem scrie: M(X) = -i X(0); D2(X) = i2 X(0)

( Dac exist Xk ) ( 0) , kN*, atunci expresia ( k ( X ) = i k Xk ) ( 0)

poart numele de semiinvariantul sau cumulantul de ordin k al variabilei aleatoare X. Se constat c k(X) este funcie raional ntreag de primele k momente. Formula de inversiune; teorema de unicitate Am vzut c fiecrei variabile aleatoare i corespunde funcia ei de repartiie FX i, odat cu aceasta, putem determina funcia caracteristic X(t) = M(eitX). Ne punem acum ntrebarea: dac se cunoate funcia caracteristic, putem determina funcia de repartiie? Rspunsul este dat de teorema care urmeaz.
Teorem. (Formula de inversiune) Fie X o variabil aleatoare i FX, X respectiv funcia de repartiie i funcia caracteristic corespunztoare. Dac x1,x2 cu x1<x2 sunt puncte de continuitate ale lui FX, atunci:
1 FX ( x 2) FX ( x1) = lim c 2 e itx1 e itx2 ( t ) dt it c
c

Demonstraie. S observm mai nti c funcia de sub integral este luat n origine prin continuitate, c este continu i mrginit i, deci, pentru orice c R integrala

1 Ic = 2

e itx1 e itx 2 ( t ) dt it c

este o integral Riemann obinuit. Dac inem seama c (t) = M(eitX), urmeaz c: c c e it ( y x1 ) e it ( y x 2 ) 1 e itx1 e itx 2 1 ity Ic = dt dF ( y ) = e dF( y ) dt = 2 c 2 c it it
1 = 2

c cos t ( y x1) cos t ( y x 2 ) + i(sin t ( y x1) sin t ( y x 2 )) dt dF ( y ) it c

(s-a putut schimba ordinea de integrare deoarece integrala n raport cu y este absolut convergent). c cos t ( y x1) cos t ( y x 2) Dar dt = 0 (se integreaz o funcie impar ca funcie it c par + impar) i atunci:
Ic =

sin t ( y x1) sin t ( y x 2 ) dt dF ( y ) . t 0

c c sin t ( y x 2 ) 1 sin t ( y x1) dt dt . Notm g( c, y , x1, x 2 ) = 0 t t 0

1 / 2 , < 0 c 1 sin t , = 0 , convergena fiind uniform dac dt = 0 Din formula lui Dirichlet, lim c t 0 1 / 2 , > 0

1 sin t dt < 1. Atunci, || > , iar dac || , atunci t 0


c

1 , x1 < y < x 2 lim g( c, y , x1, x 2 ) == 1 / 2 , y {x1, x 2} i, deci: c 0 , y ( , x1) ( x 2, )


lim Ic =
c x 2

lim g(c, y, x , x )dF ( y ) = lim g(c, y, x , x )dF ( y ) + lim g(c, y, x , x )dF ( y ) +


c 1 2 c 1 2 x1 c 1 2 x 2 + 1 2 x2 c 1 2 x2 + c 1 2

x1 +

c x1 +

lim g(c, y, x , x )dF ( y ) + lim g(c, y, x , x )dF ( y ) + lim g(c, y, x , x )dF ( y ) ,

unde > 0 astfel nct x1 + < x2 - . Urmeaz c: lim Ic =


c

1 1 [ F ( x1 + ) F ( x1 )] + [ F ( x 2 ) F ( x1 + )] + 2 [ F ( x 2 + ) F ( x 2 )] 2

Fcnd pe 0 (>0), rezult:

lim Ic =
c

1 1 [ F ( x1 + 0) F ( x1 0)] + [ F ( x 2 0) F ( x1 + 0)] + 2 [ F ( x 2 + 0) F ( x 2 0)] 2

i cum x1 i x2 sunt puncte de continuitate pentru F, rezult: c itx1 1 e e itx2 ( t ) dt F ( x 2 ) F ( x1 ) = lim 2 c c it


Teorem. (Teorema de unicitate) Funcia de repartiie este determinat n mod unic de funcia ei caracteristic. Demonstraie. Dac x i y sunt puncte de continuitate pentru F, atunci, conform formulei de inversiune, putem scrie: c 1 e itx1 e itx2 ( t ) dt F ( x ) F ( y ) = lim c 2 it c

Lund limita n raport cu y dup punctele y de continuitate pentru F, obinem:


1 F ( x ) = lim y 2

ity

e itx ( t ) dt it

S vedem acum n ce condiii putem obine o formul de inversiune pentru densitatea de repartiie.
Teorem. Dac funcia caracteristic (t) este absolut integrabil pe R, atunci funcia de repartiie F(x) este absolut continu, derivata ei, f(x), este continu i 1 f (x) = F' (x) = e itx ( t ) 2 Demonstraie. Dac funcia |(t)| este integrabil pe R, atunci funcia

1 itx1 (e e itx2 ) ( t ) it

este integrabil i, conform formulei de inversiune, putem scrie: 1 e itx1 e itx2 ( t ) dt , F ( x 2 ) F ( x1 ) = 2 it pentru orice x1 < x2 puncte de continuitate pentru F. S presupunem c x1 = x - h1, x2 = x + h, h>0 sunt puncte de continuitate pentru F. Putem, deci, scrie: ith e ith 1 1 2 sin th itx itx e F ( x + h) F ( x h) = e ( t ) dt = ( t ) dt = e it 2 2 t

1 = 2h 2

sin th itx e ( t ) dt th

sin th 1 1 , rezult F ( x + h ) F ( x h ) 2 h Deoarece | ( t )| dt , adic F este absolut th 2 continu. Pe de alt parte, F ( x + h) F( x h) 1 sin th itx e ( t ) dt = 2h 2 th

Fcnd pe h0, ntruct limita din membrul drept exist, rezult c exist i limita din membrul stng i: F ( x + h) F ( x h) 1 lim = f (x) = e itx ( t ) dt h 0 2h 2 De asemenea, putem scrie: th th th 1 1 1 | f ( x + h ) f ( x )| 2|sin 2 || (t )| dt = |t | A |sin 2 || (t )| dt + |t | A |sin 2 || ( t )| dt 2 > Pentru orice > 0, putem alege A suficient de mare, astfel nct Dac h este suficient de mic, 1 th || ( t )| dt < 2 2 1

| t |> A

| ( t )| dt <

i, deci, | f ( x + h) f ( x )| < .
Exemplu.

| t | A

| sin

Ne propunem s determinm funcia de repartiie corespunztoare funciei


t2 2

caracteristice ( t ) = e

.
1 e itx t2 it e dt i de aici,
t2 2

1 Aplicnd formula de inversiune, putem scrie F ( x ) F ( 0 ) = 2 prin derivare,

1 F '( x ) = 2 sau: F '( x ) = 1

itx

t2 2

1 dt = 2

(cos tx i sin tx )e

t2 2

1 dt = 2

cos tx e

dt ,

cos tx e
0

t2 2

dt .

Integrnd prin pri relaia obinut, avem:


sin tx t2 e F' ( x ) = x
2

t t 1 1 2 t sin tx e dt = t sin tx e 2 dt + x x 0 0 t2 2

Pe de alt parte, dac mai derivm odat, F ' ' ( x ) =

t sin tx e
0

dt .
x2 2

Deci, F ''( x ) = xF '( x ) care conduce la F ' ( x ) = c e

x2 2

, adic f ( x ) = c e

, c > 0.

Din

ce

x2 2

dx = 1 se obine c = f (x) = 1

1 2

, deci, n final,
x2 2

e ; F(x) = e dy 2 2 Exemplu. S se determine densitatea de repartiie a variabilei aleatoare X cu funcia caracteristic (t) = e-|t|. Aplicnd formula de inversiune pentru densitatea de repartiie, putem scrie:

y2 2

1 f (x) = 2

itx

0 1 t 1 t itx t itx e dt = dt = e cos tx dt e dt + e 2 0 0 |t |

Integrnd de dou ori prin pri, obinem:


1 f ( x ) = ( e )'cos tx dt = e t cos tx 0 1
t 0 1 x e sin tx dt = 1 x e t sin tx dt = 0 0 t

1 1 1 1 t t 2 2 1 2 2 = 1 x e cos tx dt = x e cos tx dt = x f ( x ) f ( x )(1 + x ) = 0 0

i, deci,
f (x) =
1 , (1 + x 2 )

adic X este repartizat Cauchy. Funcia caracteristic pentru variabile aleatoare vectoriale S considerm vectorul aleator X = (X1,X2,,Xn) a crei funcie de repartiie este F(x1,x2,,xn).
Definiie. Funcia :RC definit prin ( t1, t 2,..., tn ) = M ( e caracteristic a vectorului aleator (X1,X2,,Xn).
i tk X k
k =1 n

este funcia

Din definiie rezult c ( t1, t 2,..., tn ) =

Rn

i t k xk
k =1

dn F ( x1, x 2,..., xn ) ,

n cazul n care exist densitatea de repartiie f(x1,x2,,xn),

( t1, t 2,..., tn ) =
iar n cazul discret,

Rn

i tk xk
k =1

f ( x1, x 2,..., xn )dx1... dxn ,

( t1, t 2,..., tn ) =

x1 S1 x 2 S 2

...

i tk xk
k =1

P( X 1 = x1, X 2 = x 2,..., Xn = xn ) ,

x n S n

unde am notat cu Sk mulimea valorilor variabilei aleatoare Xk, mulime care este cel mult numrabil, 1 k n.
Propoziie. Funcia caracteristic a vectorului aleator (X1,X2,,Xn) are urmtoarele proprieti: (a) (0,0,,0) = 1 (b) |(t1,t2,,tn)| 1 (c) ( t1, t 2,..., tn ) = ( t1, t 2,..., tn ) (d) (t1,t2,,tn) este uniform continu pe Rn (e) Dac vectorul aleator X = (X1,X2,,Xn) are funcia caracteristic X(u1,u2,,un) i se

consider

vectorul
i bjt j
j =1 m

(Y1,Y2,,Yn),

Yj = cjkXk + bj, 1 j m ,
k =1
m

atunci

Y ( t 1, t 2,..., tm ) = e

X ( u1, u2,..., un ) , unde uk = cjktj, 1 k n .


j=1

Vom deduce numai relaia de la punctul (e), celelalte fiind simple transpuneri din cazul unidimensional.

Y ( t1, t 2,..., tm ) = M ( e
=e
i bjt j
j =1 m n m

i tjXj
j =1

) = M (e
i bjt j
j =1 m

i tj(
j =1

c jk X k + b j )
k =1

) = M (e

i bjt j
j =1

i t j c jk X k
j =1 k =1

)=

M (e

i ( t j c jk ) X k
k =1 j =1

)=e

X ( t j c j1 , t j c j 2 ,..., t j c jn )
j =1 j =1 j =1
i bjt j
j =1 m

i, dac notm uk = cjktj, 1 k n , obinem Y ( t 1, t 2,..., tm ) = e


j=1

X ( u1, u2,..., un )

Din funcia caracteristic X(t1,t2,,tn) se pot obine imediat funciile caracteristice ale componentelor vectorului X: X k ( t k ) = X ( 0,0,...,0, t k ,0,...,0 ) 1 k n i dac vectorul X are componentele independente, atunci:

X ( t1, t 2,..., tn ) = X k ( tk )
k =1

Legtura cu momentele este dat de relaia de mai jos: dac vectorul X are momente mixte de ordinul k1,k2,,kn atunci:
1 i
j =1

M k1,k 2,...,kn ( X 1, X 2,..., Xn ) =

kj

( t1, t 2,..., tn ) t1 =... = tn = 0 t1 t 2 ... tn


j =1 k1 k2 kn

kj

i n cazul n-dimensional are loc formula de inversiune i teorema de unicitate, al crei enun l vom meniona: Fie (t1,t2,,tn) i F(x1,x2,,xn) funcia caracteristic, respectiv funcia de repartiie a vectorului aleator (X1,X2,,Xn). Dac (a1,a2,,an), (b1,b2,,bn)Rn, aj < bj, 1 j n i funcia F este continu n punctele (a1,a2,,an), (a1,,aj-1,bj,aj+1,,an), (a1,,aj-1,bj,aj+1,, ,ak-1,bk,ak+1,,an), (b1,b2,,bn), atunci:

P(a1 X1 < b1, a2 X2 < b2, ,..., an Xn < bn) = = 1 (2 ) n lim ...
c c c c

e itk ak e itk bk ( t1, t 2,..., tn ) dt1... dtn itk k =1


n

Funcia de repartiie F(x1,x2,,xn) este determinat n mod unic de funcia ei caracteristic. 2.10. Funcia generatoare Funcia generatoare a unei variabile aleatoare a fost utilizat ncepnd de la Laplace, deci mult nainte de a se utiliza funcia caracteristic. Am vzut c funcia caracteristic are proprietatea |(t)| 1 (deci mrginit) n timp ce funcia generatoare nu mai este mrginit, dar ea este deosebit de util ndeosebi pentru calculul momentelor. Vom considera c variabila aleatoare X este discret i c ia numai valori ntregi nenegative. Numim funcie generatoare a variabilei aleatoare X funcia G:CC, prin relaia:

Gx(z) = pkz k , pk = P(X = k), kN, cu |z| 1


k =0

Din definiia dat rezult c x(t) = Gx(eit), care stabilete o legtur ntre funcia caracteristic i funcia generatoare. Tot din definiie rezult c funcia generatoare determin n mod univoc repartiia variabilei aleatoare X k X: , pk , k unde: G (k) (0) x , k = 1,2,3, p0 = Gx(0); pk = k! Se obine imediat c variabila aleatoare X (variabila binomial)
k X: k k n-k C n p q , k = 0,1,2,..., n are funcia generatoare Gx(z) = [1 + p(z - 1)]n, iar variabila

k k Y: - e , k = 0,1,2,..., n,... k!

are funcia generatoare Gy(z) = e(z-1). Funcia generatoare se utilizeaz frecvent pentru calculul momentelor factoriale i, cu ajutorul acestora, a momentelor obinuite i centrate de diferite ordine, dac acestea exist. Din definiia funciei generatoare rezult c ea are sens pentru |z| 1. Atunci, derivatele n punctul z = 1, dac exist, vor fi luate ca derivate la stnga. Atunci:
G 'x (1) = k pk
k =1

G ''x (1) = k(k - 1) pk


k=2

G (s) (1) = k(k - 1)...(k - s + 1) pk x


k=s

De aici rezult c:
Gx(1) = M0(x) = 1 G 'x (1) = M1(x) = M(x) G ''x (1) = M2(x) - M1(x) G ''' (1) = M3(x) - 3M2(x) + 2M1(x) x G 'v (1) = M4(x) - 6M3(x) + 11M2(x) - 6M1(x), x

sau:
M1(x) = G 'x (1) M2(x) = G ''x (1) + G 'x (1) M3(x) = G ''' (1) + 3G ''x (1) + G ''x (1) x M4(x) = G 'v (1) + 6G ''' (1) + 7G ''x (1) + G 'x (1) x x

Pentru calculul momentelor centrate utilizm relaia:

Hs( x ) = c sj ( 1) j M s j ( x ) M1j ( x )
j= 0

Aceast relaie este comod i se recomand pentru valori mici ale lui s. n cazul cnd s va avea valori mari, vom proceda n felul urmtor: notm Z = ew i dezvoltm n serie de puteri funcia GX(ew).

Funcia GX(Z) este dezvoltabil n serie de puteri n punctul Z = 1 dac ea este r regulat n acest punct. Dac |w| r < 1, rezult | e w 1| i, deci, dac r este suficient 1 r de mic, funcia GX(ew) este regulat pentru |w| r. ntruct departe:
k S wS wS s GX ( e w ) = pke wk = pk = pkk , putem scrie mai k =0 s ! k =0 s ! k =0 k =0 k =0

Hx( w) = Gx( e w ) =
s= 0

Ms( x ) s w s!

Funcia Hx(w) poart numele de funcie generatoare de momente. Momentele centrate se calculeaz acum utiliznd funcia: Lx( w) = e w M1( x )Hx( w) , ntruct M1j ( x )w j M s ( x ) s w s j Lx( w) = ( 1) w = j ! j= 0 s! j= 0 s ! j= 0 = Hs( x )
s= 0

(1)
j= 0

Csj M1j ( x ) Ms j( x ) =

ws s!

Aceast funcie mai poart numele de funcie generatoare a momentelor centrate.

Capitolul 3 LEGI DE REPARTIIE n acest capitol ne vom ocupa de principalele legi de repartiie ce intervin n aplicaii concrete sau n abordarea diverselor aspecte teoretice sau specifice din teoria probabilitilor i statistica matematic. Vom aborda mai nti repartiiile de tip discret, apoi cele caracterizate de o densitate de repartiie. 3.1. Repartiii de tip discret Cea mai simpl repartiie discret este repartiia variabilei aleatoare X cu masa concentrat ntr-un punct aR.
a X: , P(X=a) = 1, P(Xa) = 0 1

Se obine imediat c M(X) = a, D2(X) = 0, (t) = eita


0, x a Fa ( x ) = 1, x > a

Urmeaz de aici c orice repartiie discret admite pentru funcia de repartiie reprezentarea:
aj X: , j J ; F(x) = pjFaj(x) ; pj = P(X=aj); jJ, J cel mult numrabil. P(X = aj) jJ

Un caz aparte l constituie repartiia uniform discret:

aj X: 1 n

1 ,1 j n ; P(X = aj) = , 1 j n ; n

M(x) =

1 n 1 n 1 n aj ; D 2 (x) = a 2 ( a j ) 2 ; n j= 1 n j=1 j n j=1 1 n itaj e ; n j =1

(t) = M(eitx) = F(x) =

1 n Faj(x) n j=1 Dac presupunem c a1<a2<<an, atunci, evident,

0 1 n ... F(X) = k n ... 1

, x a1 ,a1 < x a2 ,ak < x ak + 1 , x > an

Repartiia binomial

Spunem c variabila aleatoare X este repartizat binomial de parametri p i n (0<p<1) dac P(X = k) = C k p k q n k , 0 k n, q = 1 p . Vom scrie: n
0 X: 0 0 n Cn p q 1 C1 p 1q n-1 n ... k C k p k q n-k n ... n n n 0 Cn p q

Denumirea vine de la faptul c P(X = k) = C k p k q n k sunt termenii dezvoltrii n binomului

(p + q) n = C k p k q n k , q = 1 - p n
k=0

Funcia de repartiie
0 q n ... F(X) = j k k n k C n p q k=0 ... 1 Momentele obinuite MS(X) = k s C k p k q n k n
k=0 n

,x 0 ,0 < x 1 , j < x j+1 ,x > n

Momentele centrate

s(x) = [k M(x)]s C k p k q n k n
k=0

nainte de a meniona cum se calculeaz efectiv momentele, vom da funcia caracteristic:

x(t) = M(e itx ) = e itk C k p k q n k = C k (pe it ) k q n k = (pe it + q) n n n


k=0 k=0

Calculul momentelor: M(X) = kC k p k q n k n


k=0 n

Considerm egalitatea (p + q) n = C k p k q n k ca o funcie de p. n


k=0

Derivm, nmulim cu p ambii membri, apoi inem seama de faptul c p + q = 1 i obinem:

n(p + q) n-1 = kC k p k-1q n k ; np(p + q) n-1 = kC k p k q n k n n


k =0 k =0

Deci, M(X) = kC k p k q n k = np. n


k=0

Repetm raionamentul, lund derivata a doua i nmulind cu p2: n(n 1)(p + q) n 2 = k(k 1)C k p k 2 q n k ; n
k=2 n

n(n 1)p 2 = k(k 1)C k p k q n k = k 2 C k p k q n k kC k p k q n k n n n


k =0 k =0 k =0

Deci,

M2(x) = k 2 C k p k q n k = n 2 p 2 np 2 + np = npq + n 2 p 2 n
k=0

Pentru calculul momentului M3(X):

n(n 1)(n 2)(p + q) n 3 = k(k - 1)(k - 2)C k p k-3q n k n


k =0

n(n 1)(n 2)p 3 = k(k - 1)(k - 2)C k p k q n k = n


k=0

= k 3 C k p k q n k 3 k 2 C k p k q n k + 2 kC k p k q n k n n n
k=0 k=0 k =0

Urmeaz c: M3(X) = n(n -1)(n - 2)p 3 + 3M2(x) - 2M(x) = n 3 p 3 + 3n 2 p 2q + npq(1- 2p) n mod analog, se obine: M4(X) = n 4 p 4 + 6n 3 p 3q + n 2 p 2 (7 -18p + 11p 2 ) + np(1- 7p + 12p 2 - 6p 3 ) La aceleai rezultate se poate ajunge pornind de la funcia caracteristic (t) = (peit + q)n,

pe baza relaiei:
Mr(X) =

(r) (0)
ir

, r = 1,2,
n

Pentru calculul momentelor obinuite, se mai poate folosi i faptul c X = Xj ,


j= 1

Xj fiind variabile aleatoare independente identic repartizate


1 0 Xj = , 1 j n p q

Atunci, M(X) = M(Xj) = np


j =1

n 2 n n Xj = M X 2j + 2 X j Xk = M(X 2j ) + 2 M(X j )M(Xk) = np + 2C 2 p 2 = M 2 (X) = M n j=1 j< k j< k j=1 j=1 = np + n(n 1)p 2 = n 2 p 2 + npq

Analog se calculeaz celelalte momente, de ordin mai mare dect doi, dificultatea
n n constnd n a exprima doar puterile Xj , Xj etc. j=1 j=1 Pentru obinerea momentelor centrate folosim relaia:
3
4

r (X) = (-1) j C rj Mr j(X)M j (X)


j=0

i astfel obinem: 1(x) = 0; 2(x) = npq; 3(x) = npq (q-p); 4(x) = 3n2p2q2 + npq (1-6pq) n general, 2r(x) = a0nr + a1nr-1 + + ar-1n, 2r+1(x) = b0nr + b1nr-1 + + br-1n. Putem acum exprima coeficienii de asimetrie i exces.
Asimetria: 1 =

3( x ) npq( q p) 1 2 p = = . ( npq)3/ 2 ( npq)1/ 2 23/ 2 ( x )

Dac n , atunci repartiia binomial tinde ctre una simetric: 10.

4( x ) 3n 2 p 2 q 2 + npq(1 6 pq ) 1 6 pq Excesul: 2 = 2 3= 3= 2 2 2 n p q npq 2 ( x )

Am vzut c P(X=k) = C k p k q n k , k = 0,1,2,,n. Atunci, valoarea cea mai probabil n este dat de: P(X = k-1) P(X = k) P(X = k+1) Din dubla inegalitate

C k-1 p k-1q n k +1 C k p k q n k C k +1 p k +1q n k-1 n n n


se obine: np - q k np + p n general, np + p nu este ntreg i atunci nici np - q nu este ntreg, caz n care o unic valoare are cea mai mare probabilitate. n cazul excepional cnd np + p este ntreg, rezult c i np - q este ntreg, i atunci avem dou valori ce corespund probabilitilor maxime: P(X = np - q) = P(X = np + p)
Repartiia Poisson

Spunem c variabila aleatoare X urmeaz o repartiie Poisson de parametru , > 0, k , k = 0,1,2,. dac P(X = k) = e - k! Vom scrie k k X: - k = 0,1,2,... e , k!

Este vorba de un sistem complet de probabiliti, ntruct Funcia de repartiie este:

P( X = k ) = e
k=0 k=0

k
k!

=1 .

, x0 0 e - , 0 < x 1 ... F(x) = k - j e j! , k < x k + 1 j=0 ...

Funcia caracteristic este:

(t) = M(e itx ) = e itx e -


k =0

k
k!

= e -

( e it ) k k! k =0

(t) = e (e
Momentele obinuite:

it

-1)

M(x) = ke -
k=0

k
k!

= e -
k=1

k 1
( k 1)!

M2(X) = k 2 e -
k=0 -

k
k!

= e - k
k=1

k 1
( k 1)!

= e - ( k 1 + 1)
k=1

k 1
( k 1)!

k 2 k 1 2 = e + = + k=2 ( k 2)! k=1 ( k 1)!

Analog,

M3(X) = 3 + 32 + M4(X) = 4 + 63 + 72 +

La aceleai rezultate se ajunge cu ajutorul funciei caracteristice Mr(X) = Momentele centrate: 1(x) = 0; 2(x) = ; 3(x) = ; 4(x) = 32+

( r ) (0)
ir

Coeficienii de asimetrie i exces:

1 = 2 =

3 ( x ) 1 = 3/ 2 = 1/ 2 3/ 2 2 ( x ) 4 ( x ) 3 2 + 1 3= 3= 2 2 2 ( x )

Repartiia Poisson intervine n aplicaii n studiul evenimentelor rare, drept urmare mai este cunoscut sub numele de legea evenimentelor rare. Aa, de exemplu, dac se alege un interval de timp unitate (de lungime convenabil), atunci numrul de apeluri la o central telefonic, numrul de autovehicule ce trec printr-o intersecie n intervalul de timp considerat, urmeaz o lege de repartiie Poisson.

Repartiia binomial cu exponent negativ


Se consider un eveniment A care are probabilitatea p de a se realiza i probabilitatea q = 1 - p de a se realiza A . Efectum k probe, pn cnd evenimentul A se realizeaz de m ori; k m. Dac notm cu Pm(k) probabilitatea corespunztoare, atunci: P(X1 = k) = Pm(k) = C m-1 p m q k m k-1 Am obinut astfel repartiia:
k X1: m-1 m k m C k-1 p q , k = m, m + 1, ...

S artm c

k=m

P( X
k=m

= k ) = 1 . ntr-adevr,

k=m

P(X1 = k) =

m-1 k-1

p q

km

=p

k=m

C q

m-1 k-1

km

=p

l=m

C m-1 q l = p m (1 q) m = 1 , m+l-1

cu k - m = l.

1 q ntruct Pm(k) este termenul general al dezvoltrii binomului p (1- q) = p p cu exponent negativ, se justific numele de repartiie binomial cu exponent negativ. Aplicaiile repartiiei binomiale cu exponent negativ se ntlnesc n modelarea fenomenelor de contagiune i teoria estimaiei. S studiem pentru nceput cazul cnd m = 1. Atunci, P( X 1 = k ) = pq 1, k = 1,2,3... . Rezult, acum, imediat: p 1 M(X1) = kpq k 1 = 2 = p (1 q) k =1
m -m

M2(X1) = k 2 pq k 1
k =1

qk =
k=0 k =1

1 ; 1 q
k 1

kq k 1 =
k =1

p ; (1 q) 2
2

k(k - 1)q
k=2

k2

2 (1 q) 3

k(k - 1)q
k =1

2q ; p3

k
k =1

q k 1 kq k 1 =
k =1

2q p3

p k 2 q k 1 = De aici, urmeaz c:
M2(X1) = 2q 1 + ; p2 p

2pq k 1 3 + p k q p k =1

D 2 (X1) = M2(X1) M 2 (X1) =

2q 1 1 2q + p 1 q + (p + q) 1 q + = = = 2 p2 p p2 p2 p2 p

Momentele, ns, le putem calcula mai uor de la funcia generatoare a momentelor factoriale pt p p k k-1 (t) = t pq = pt (qt) k 1 = = + (1- qt) 1 1 qt q q k =1 k =1 Atunci: 1 d ( t ) M (1) ( X 1) = = t =1 dt p
d 2 ( t ) M ( 2) ( X 1) = dt 2 d 3 ( t ) M ( 3) ( X 1) = dt 3 ... M ( r ) ( X 1) = ... De aici urmeaz: d r ( t ) dt r
t =1

2!q p2

t =1

3! q 2 = 3 p r ! q r 1 pr

t =1

M1(X1) = M (1) (X1) =

1 ; p 1 2q ; + p p2 1 6q 6q + + p p2 p3

M2(X1) = M (1) (X1) + M (2) (X1) =

M (3) (X1) = M (1) (X1) + 3M (2) (X1) + M (3) (X1) = ...

nainte de a trece la cazul m oarecare, s determinm funcia caracteristic a variabilei X1 n cazul m=1.

X ( t ) = e itk pq k 1 = pe it ( qe it )
1

k 1

k =1

k =1

pe it 1 qe it

S presupunem acum c am efectuat X1 probe pn ce s-a realizat o dat evenimentul A, apoi X2 probe pn s-a realizat o dat A .a.m.d., Xm probe pn s-a realizat o dat evenimentul A. Aadar, dac notm cu X numrul de probe pn s-a realizat de m ori evenimentul A, atunci X = Xj , X1,X2,,Xm independente. Atunci,
j=1 m

pe it m 1 d X ( t ) = . X ( t ) = Xj ( t ) = ; M( X ) = it t=0 i dt p 1 qe j =1 Analog, mq m 2mq 1 d 2 X ( t ) 1 M 2( X ) = 2 = + 2 + m( m 1) 2 ; D 2 (X) = 2 2 t =0 i dt p p p p


m

Prin calcule directe, se determin coeficienii de asimetrie i exces:

1 =

2 p 1+ q 1/ 2 = ( mq) ( mq)1/ 2

p 2 6p + 6 2 = mq
Repartiia geometric:
k X: k-1 ; k = 1,2,3... pq

este caz particular al repartiiei binomiale cu exponent negativ, pentru m=1, pe care am studiat-o n amnunt.

Repartiia hipergeometric este dat de variabila X care reprezint numrul de bile albe existente printre cele n bile extrase fr revenire, dintr-o urn cu A bile albe i B bile negre.

C k C nk Atunci, dup cum tim, Pn(k) = A n B . ntruct 0 k A, 0 n-k B, rezult C A+B


max (0, B - n) k min (A, n)

i, deci,

k k nk X: C A C B max (0, B n) k min (A, n) ; C n +B A Dac facem k = 0, atunci B(B 1)...(B n + 1) Pn(0) = (A + B)(A + B 1)...(A + B n + 1) Cu aceast relaie, probabilitatea Pn(k) se poate pune sub forma:
Pn(k) = n(n 1)...(n k + 1) A(A 1)...(A k + 1) Pn(0) k! (B - n + 1)(B n + 2)...(B n + k)

Pentru calculul momentelor, procedm n modul urmtor: dintr-o urn care conine A bile albe i B bile negre (A+B=N) efectum n extrageri succesive, fr a pune napoi bila extras. Vom avea astfel succesiunea de variabile aleatoare dependente X1,X2,,Xn, fiecare avnd repartiia: 1 0 Xi: , pi + qi = 1 pi qi Deci avem de calculat primele momente ale variabilei X = X1 + X2 ++Xn. Atunci M(X) = M(Xi) = nP(Xi = 1) . Cum P(Xi = 1) =
i =1
n

A(N 1)! A = = p , deci M(X) = np, N! N

M2(X) = M(X 2 ) = M(X 2 ) + 2 M(XiXj) = np + n(n 1)M(XiXj) . i


i =1 i< j

Avem de considerat situaiile:

(Xi = 1, Xj = 1), (Xi = 1, Xj = 0), (Xi = 0, Xj = 1), (Xi = 0, Xj = 0) Atunci produsul P(Xi=1,Xj=1). XiXj ia valoarea diferit de zero (valoarea 1) cu probabilitatea
A(A -1)(N 2)! A(A -1) p(Np 1) . = = N! N(N -1) N 1

ns P(Xi = 1, Xj = 1) =

Deci, M2(X) = np + n(n 1)

(Np 1)p 1 = [(Np 1)pn 2 + Npqn] , cu q = 1 - p. N 1 N 1

De aici, urmeaz c D 2 (X) =

Nn npq . N 1

Observaie. Dispersia corespunztoare la n probe n repartiia hipergeometric difer de Nn < 1. Dac N = n, D2(X)=0, adic dispare factorul dispersia binomial prin factorul N 1 aleator. n plus, Nn lim D 2 (X) = lim npq = npq , N N N 1 care este dispersia unei variabile Bernoulli.

Repartiia multinomial (variabil aleatoare vectorial de tip discret).

Am vzut c dac avem o urn cu bile de s culori care conine a1 bile de culoarea 1, a2 bile de culoarea 2, , as bile de culoarea s, atunci probabilitatea de a obine n n extracii succesive, cu revenire, 1 bile de culoarea 1,2 bile de culoarea 2,,s bile de culoarea s este:
Pn( 1, 2,..., s ) = n! p 1 p 2 ... p s s , 1 ! 2 !...s ! 1 2

1 + 2 + + s = n

Dar, probabilitile p1,p2,,ps 0, p1 + p2 ++ ps = 1. Atunci, variabila multinomial de studiat este variabila X = Xk , unde X1,X2,,Xn sunt
k =1 n

variabile aleatoare independente, avnd repartiiile:


e1 e2 ... es X: , 1kn p1 p2 ... ps

e1 = (1,0,0,0) e2 = (0,1,0,,0) es = (0,0,0,,1)


(1 , 2 ,..., s ) X : ; 0 i n; Pn(1 , 2 ,..., s )

i =1

= n

S artm c este vorba de un sistem complet de probabiliti:

( 1 , 2 ,..., s ) 1 + 2 + ...+ s = n

P ( , ,..., ) =
n

( 1 , 2 ,..., s ) 1 + 2 + ...+ s = n

n! p 1 p 2 ... ps s = ( p1 + p2 +...+ ps ) n = 1 1 ! 2 !... s ! 1 2

Pentru calculul momentelor s determinm mai nti funcia caracteristic a vectorului Xk:

Xk ( t1, t 2,..., ts ) = p1e it + p2e it +...+ pse it


1 2

Cum X = Xk ,
k =1

s X ( t1, t 2,..., ts ) = n ( t1, t 2,..., ts ) = X k ( t1, t 2,..., ts ) = pje itj Xk j =1 k =1 k =1


n

La aceleai rezultate putem ajunge i prin calcul direct:

X ( t1, t 2,..., ts ) =
= =

1 , 2 ,..., s 0 1 + 2 + ...+ s = n

( t11 + t 2 2 + ...+ t s s ) i

Pn(1 , 2 ,..., s ) =

1 + 2 + ...+ s = n


1 , 2 ,...,

s 0

n! p1 1 p 2 2 ... p s s e ( t11 + t2 2 +...+ t s s ) i = 1 ! 2 !... s ! n! ( p1e it1 ) 1 ( p 2e it 2 ) 2 ...( pse it s ) s = ( p1 e it1 + p 2 e it2 +...+ p s e it s ) n 1 ! 2 !... s !
n

1 + 2 + ...+ s = n


1 , 2 ,...,

s 0

s Deci, X ( t1, t 2,..., ts ) = pjei tj . De aici urmeaz: j =1

M (j ) =

1 ( t1, t 2,..., ts ) tj i

t1 = t2 = ...= t s = 0

n it = npj = pj( p1e it1 +...+ pse its ) n 1 ie j t1 = t2 =...= ts = 0 i


= [n( n 1) p 2 ( p1e it1 +...+ pse its ) n 2 e j
2 it j

M ( 2 ) = j

1 2 ( t1, t 2,..., ts ) i2 t 2 j

t1 = t 2 = ...= t s = 0 it

+ npj( p1e it1 +...+ pse its ) n 1 e j ]t1 = t2 = ...= ts = 0 = n( n 1) p 2 + npj = n 2 p 2 + npj(1 p j ) j j

D 2 (j ) = npj(1 pj ), 1 j s
M (jk ) = 1 2 ( t1,..., ts ) i2 tjtk = n( n 1) pjpk ( p1e it1 +...+ pse its ) n 2 e j e itk
t1 = t 2 = ...= t s = 0 t1 = t 2 = ...= t s = 0 it

= n(n -1)pjpk, j, k = 1,2,...,s; j k

3.2. Repartiii care admit densitate de repartiie. Repartiia normal N(m, )


Prin definiie, spunem c variabila aleatoare X urmeaz o lege normal de parametri m i i vom nota X N(m;), dac densitatea ei de repartiie este:

f X ( x; m, ) =

, x ( , ), m ( , ), ( 0, ) fiind parametrii repartiiei. 2 Dac m=0, =1, spunem c variabila este normat sau standard i scriem Y e
2 2

( x m )2

N(0;1). Se verific imediat c fX(x;m,) este o densitate de repartiie. ntr-adevr, fX(x;m,) 0, x (-,) i

( x m )2 2 2

dx =

1 2

y2 2

dy = 1 , cu y =

xm

.
xm

Funcia de repartiie FX ( x ) = cu z =

1 2
1 2
x

( y m )2 2 2

dy =

1 2

x m / e 2 dz = O , z

ym

/ , unde am pus O( x ) =

z2 2

dz , funcia lui Laplace, care este tabelat.


x z2 2

~ / n multe situaii gsim tabelat funcia O( x ) =

1 2

e
0

dz , x>0.

Atunci, pe baza relaiei


~ / O( x ) = 1 2

y2 2

dy =

1 2

y2 2

dy +

1 2

e
0

y2 2

1 dy = + 2

1 2

e
0

y2 2

dy

De aici, rezult:

1 ~ / 2 + O( x ) , x > 0 1 / (x) = O ,x = 0 2 ~ 1 O( x ) , x < 0 / 2 Dac se consider funcia densitate de repartiie fX(x;m,), obinem imediat c ea este 1 . simetric fa de dreapta x = m, c x = m este punct de maxim i f max = f ( m) = 2 Din
f f
' (x)

= =

xm

2
e
( x m)2 2
2

( x m)2 2 2

; 1 e
( x m )2 2
2

'' (x)

3 2

( x m) 2

3 2

( x m )2 2 2

( x m) 2 1 2

rezult c x = m sunt puncte de inflexiune pentru fX(x;m,).

Pentru determinarea momentelor obinuite de ordin k, vom stabili momentele de ordin k ale variabilei X N(0;1). Atunci:
1 2

Mk ( X ) =
1 2

x2 2

dx = 2 2

x
0

0
x2 2s 2

, k = 2s + 1 e dx , k = 2s

2 s +1

x2 2

dx = 0 , deoarece funcia integrant este impar.

2 2 =
s

x e
0

x2 2s 2

2s dx = 2

1 2

e y dy =

2s

1 2s 1 1 s + = s s =... = 2 2 2

x2 2 1 3 3 1 1 ( 2 s )! s s ... = ( 2 s 1)( 2 s 3)...3 1 = (cu y = ) s !2 s 2 2 2 2 2 2 , k = 2s + 1 0 Deci, Mk ( X ) = ( 2s )! s!2 s , k = 2s

Momentele centrate de ordin k ale variabilei Y N(m,) se pot calcula acum imediat: k (Y ) = Mk[Y M (Y )] = Mk (Y m) = Mk (X ) = k Mk ( X ) Ym = X Y m = X , k = 2s + 1 , k = 2s

0 ( 2s )! 2 s Deci, k (Y ) = s !2 s

Pentru k = 1, obinem 1(Y) = M(Y-m) = M(Y) - m = 0. Deci, M(Y) = m. 2! 2 Pentru k = 2, obinem 2 (Y ) = = 2 = D 2 (Y ) , adic parametrii legii normale N(m,) 1! 2 au urmtoarea interpretare probabilistic: m = M(Y), 2 = D2(Y) (Y N(m,)) Asimetria i excesul n cazul unei legi normale N(m,) au valorile:
A=

4 3 4! 3= 0 2 3= 3/ 2 = 0; E = 2 ( 2 ) 2!2 2 4
4

Acesta este motivul pentru care n statistica descriptiv se consider c dac asimetria i excesul unei repartiii sunt zero, se poate considera c este vorba de o lege de repartiie normal. Evident, faptul c asimetria i excesul sunt egale cu zero constituie o condiie necesar dar nu i suficient de normalitate a unei repartiii.

Funcia caracteristic. Vom stabili mai nti funcia caracteristic a variabilei aleatoare X N(0,1). Aplicnd definiia, obinem: 2 x2 t k e k k x2 1 1 itx itx X (t ) = M (e ) = e e 2 dx = 2 0 k ! x e dx k= 2

Seria de sub integral fiind absolut i uniform convergent, se pot permuta operatorii

k=0

i obinem:
t2 x2 t2 2 t 2 s ( 1) s ( 2 s )! 1 s k 2 x e dx = ( 2s)! s!2 s = ( 1) s! = e 2 2 s= 0 s= 0
s

X (t ) =

t kik k =0 k !

De aici obinem funcia caracteristic a variabilei aleatoare YN(m,), innd cont de faptul c Y = m + X. Deci, Y ( t ) = M ( e itY ) = M [e it ( m+X ) ] = M (e itm+ itX ) ) = e itm M (e itX ) = e itm X (t ) Deci Y ( t ) = e pentru k = 1,
itm t 2 2 2

. De aici rezult, aplicnd relaia M k (Y ) =

( k ) ( 0)
ik

( t ) = ( im t )e M(Y) = m
' Y 2 '' Y 2 itm t 2 2 2

itm

t 2 2 2

pentru k = 2,

( t ) = e + ( im t )e i 2 2 + i 2 m 2 M 2(Y ) = = 2 + m2 , 2
2

itm

t 2 2 2

ceea ce obinusem pe cale direct. S remarcm faptul c se poate calcula funcia caracteristic pe baza unui calcul formal, care este de fapt justificat, dup cum urmeaz: dac XN(0,1), atunci:

X (t ) = M (e ) =
itX

1 2

itx

x2 2

dx = e

t2 2

1 2

1 ( x it )2 2

dx

Integrala funciei e de-a lungul axei OX este egal cu integrala funciei e pe o dreapt paralel cu axa OX: z = x + iy, unde y = -t (constant), dz = dx. ntr-adevr, conform teoremei lui Cauchy aplicat la integrala funciei e conturului C de mai jos: y -A A x
z2 2

1 ( x it )2 2

z2 2

, derivabil n tot planul, de-a lungul

este nul i la limit, cnd A . n cele ce urmeaz vom folosi aceast modalitate de calcul fr a mai face justificarea menionat mai sus. Deci, X ( t ) = e
t2 2

i mai departe, pentru YN(m,),

Y (t ) = e

itm

t 2 2 2

3.3. Repartiia uniform pe un interval [a,b].


Definiie. Spunem c variabila aleatoare X are o repartiie uniform pe intervalul [a,b] dac densitatea de repartiie are expresia: 1 , x [a , b] fX ( x ) = b a 0 , x [a , b]

De aici urmeaz c funcia de repartiie are expresia: ,x a 0 x x a F ( x ) = f ( u) du = ,a < x b b a ,x > b 1 Funcia caracteristic:

( t ) = M ( e itX ) =
a

e itx e itb e ita dx = b a it ( b a )

Momentele obinuite:
b k + 1 a k +1 1 k Mk ( X ) = x dx = ba ( k + 1)( b a ) a
b

Pentru k = 1, obinem M ( X ) =

a+b b 2 + ab + a 2 ; , iar pentru k = 2, M 2( X ) = 3 2

D 2 ( X ) = M 2( X ) M 2 ( X ) =

b 2 + ab + a 2 ( a + b) 2 ( b a ) 2 . = 3 4 12

Asimetria: Excesul:

1 = 0. 2 = -1,2.

Dac a = 0, b = 1, avem o repartiie uniform pe intervalul [0,1]. Repartiia uniform intervine n aplicaii ale metodei Monte-Carlo.
Repartiia Pareto: Spunem c variabila aleatoare X are o repartiie Pareto de parametru , dac densitatea de repartiie este:

( 1)x 0 1 f ( x, ) = x 0

, x ( x 0 , ) , > 1 , n rest , x0 > 0

Se constat imediat c f(x,) este o densitate de repartiie, ntruct f(x,) 0 oricare ar fi x R i

f ( x, ) dx = 1.

0 1 Funcia de repartiie este: F ( x , ) = f ( u, ) du = x 0 1 x

, x x0 , x > x0

Valoarea medie:

M ( X ) = ( 1) x 0
x0

x dx =( 1) x 0 1 x +1 dx x x0

Integrala respectiv este convergent dac > 2. Deci, pentru > 2 exist M(X) i are valoarea M ( X ) = Pentru > 3 exist i M2(X) i are valoarea

1 x . 2 0 1 2 x . 3 0

M 2 ( X ) = ( 1) x 0
x0

x2 1 + 2 dx =( 1) x 0 x dx . x x0
2

M2 ( X ) =

2 ( 1) x 0 1 2 ( 1) 2 2 Deci, D ( X ) = M 2 ( X ) M ( X ) = x x = 3 0 ( 2) 2 0 ( 3)( 2) 2 2

n general, dac > k+1, exist Mk(X) i

M k ( X ) = ( 1) x 0
x0

xk ( 1) k dx = x . k +1 0 x

3.4. Repartiia Gama de parametri a,b > 0


Definiie. Spunem c variabila aleatoare X are o repartiie Gama de parametri a,b, dac densitatea ei de repartiie are expresia:
x 1 a x a 1e b f ( x ) = b ( a ) 0

, x>0 , x 0,

a,b > 0. Se constat imediat c f este o densitate de repartiie, ntruct f(x)0, xR i

f ( x ) dx =

x 1 x a 1 e b dx = 1 ba (a) 0

,x 0 0 1 x y Funcia de repartiie: F ( x ) = a y a 1e b dy , x > 0 b (a ) 0

Funcia caracteristic:

X ( t ) = M ( e itX ) =

x 1 1 ba e itx x a 1 e b dx = a b a ( a ) b ( a ) (1 ibt ) a 0

y
0

a 1

e y dy =

1 (1 ibt ) a

Deci, X(t) = (1 - ibt)-a . Momentele obinuite:


Mk ( X ) =
x b k (a + k ) ba+k 1 y a + k 1 e y dy = x a + k 1 e b dx = a = (a ) b (a ) b a ( a ) 0 0

= b k ( a + k 1)( a + k 2)...( a + 1)a

Momentele centrate:

k ( X ) = ( 1) j Ckj M k j ( X ) M j ( X )
j =0

M1(X) = ab M2(X) = b2 a(a+1) M3(X) = b3a(a+1)(a+2); M4(X) = b4a(a+1)(a+2)(a+3) 2(X) = ab2; 3(X) = M3(X) - 3M2(X)M(X) + 2M3(X) = 2ab3; 4(X)= M4(X) - 4M3(X)M(X) + 6M2(X)M2(X) - 3M4(X) = 3b4a(a+2). De aici rezult: Coeficientul de asimetrie 1 = Coeficientul de exces 2 = 6 . a
2 a

Pentru a = 1 se obine repartiia exponenial de parametru b:


1 x b f(x) = b e 0 0 , x > 0 ; F(x) = x 1 e b ,x 0 ,x 0 ,x > 0

; b>0

(x) = (1 - ibt)-1

M1(X) = b; 1(X) = 0; 1 = 2

M2(X) = 2b2; M3(X) = 6b3; M4(X) = 24b4; 2(X) = b2; 2 = 6 3(X) = 2b3; 4(X) = 9b4;

obinute prin particularizare, din valorile corespunztoare ale repartiiei Gama. Repartiia
2 (n)

(hi ptrat)cu n grade de libertate


2 (n)

Definiie. Variabila aleatoare X are o lege de repartiie

(hi ptrat)cu n grade de libertate

i parametru > 0 dac densitatea ei de repartiie are expresia:

0 x2 n 1 2 1 x 2 e 2 f (x) = n n 2 2 n 2

,x 0 ,x > 0

n , b = 22, se obine 2 tocmai repartiia (2n ) . Drept urmare, vom considera rezultatele obinute pentru valorile
Se constat imediat c, dac n repartiia Gama punem a =

particulare menionate.
0 1 F( x ) = n 2 2 n n 2 ,x 0
x y n 1 2 2 2

dy , x > 0

Datorit multiplelor aplicaii ale repartiiei gsesc tabelate pentru = 1.

2 (n)

, valorile funciei de repartiie se

( t ) = (1 2i 2 t ) n / 2 ;
n n n n M k ( X ) = 2 k 2k + k 1 + k 2 ... + 1 2 2 2 2
M1(X) = 2n; M2(X) = n(n+2)4; 1(X) = 0; 2(X) = 2n4; M3(X) = n(n+2)(n+4)6; M4(X) = n(n+2)(n+4)(n+6)8 3(X) = 23n6; 4(X) = 12n(n+4)8;

1 =

2 2 n

; 2 =

12 . n
2 (n)

Rezultatul care urmeaz stabilete legtura ntre repartiia normal i repartiia rezultat de o importan deosebit n aplicaii.

Teorem. Dac X1,X2,,Xn sunt variabile aleatoare independente, identic repartizate, avnd

repartiia N(0,), atunci Y = X 2 are o repartiie j


j= 1

2 (n)

cu parametrul .

Demonstraie: S determinm mai nti densitatea de repartiie a variabilei X 2 : j

0 ,x 0 FX 2 ( x ) = P( X 2 < x ) = ; j j P( x < X j < x ) , x > 0 ,x 0 0 FX 2 ( x ) = j F ( x ) FX j ( x ) , x > 0 Xj Rezult c:

0 x2 x2 2 2 1 1 1 f X2 (x) = 1 2 2 j + e 2 e 2 x 2 x 2 ,x 0 0 x2 1 2 1 x 2 e 2 , x > 0 f X2 (x) = 1 j 2 2 1 2

,x 0 ,x > 0 ;

2 Aceasta este tocmai densitatea de repartiie a unei variabile (n) cu un grad de

libertate. Urmeaz c:

X ( t ) = (1 2i 2 t )
2 j

1 2 n 2

Y (t ) =

j =1

X2 j

(t ) =
j =1

( t ) = (1 2i t )
2 X2 j

Cum Y ( t ) = (1 2i 2 t )

n 2

2 este funcia caracteristic a unei variabile (n) (cu n grade de

libertate i parametru ) rezult c densitatea de repartiie a variabilei Y este:


0 x n 1 2 1 x 2 e 2 f Y (x) = n 2 2 n n 2
n

,x 0 ,x > 0

2 deci, Y = X 2 este o variabil X (n) cu parametru . j


j =1

Dac X1,X2,,Xn sunt variabile aleatoare independente identic repartizate N(0, ) vom determina densitile de repartiie ale variabilelor:

Y1 =

1 n 2 X ; n j =1 j

Y2 =

X 2j ; Y3 =
j=1

1 n 2 X . n j=1 j

0 1 n ,x 0 FY1 ( x ) = P(Y 1 < x ) = P X 2 < x = j FY ( nx ) , x > 0 n j =1

Rezult acum:

,x 0 0 ; f Y1 ( x ) = nfY ( nx ) , x > 0

0 n nx n 2 1 2 2 2 f Y1 ( x ) = n n x e 2 n n 2 2

,x 0 ,x > 0

FY2 ( x ) = P(Y 2 < x ) = P

X
j =1

2 j

0 ,x 0 < x = 2 FY ( x ) , x > 0

0 x2 2 2 n 1 x e 2 f Y2 ( x ) = n n 2 2 n 2

,x 0 ,x >0

1 n 2 0 ,x 0 FY3 ( x ) = P(Y 3 < x ) = P n X j < x = FY ( nx 2 ) , x > 0 j =1

0 n nx 2 2n 2 n 1 2 f Y3 ( x ) = n x e 2 n n 2 2 3.5. Repartiia Student

,x 0 ,x >0

Spunem c variabila aleatoare X are o repartiie Student cu n grade de libertate, dac densitatea de repartiie are expresia:
n + 1 n +1 2 2 2 x f (x) = , x ( , ) 1 + n n n 2

S artm c f este o densitate de repartiie: pentru f(x) 0, x (-,)

n + 1 n + 1 n +1 2 2 2 2 x dx = 2 1 + n n n n n 2 2

x2 1 + n

n +1 2

dx =

n + 1 1 2 2 n2 = n 2 n 2

1 2

(1 + y )

n +1 2

n + 1 n + 1 1 n 2 1 n 2 2 2 dy = , = =1 n 2 2 1 n + 1 2 2 2

n + 1 n +1 2 x y2 2 Funcia de repartiie F ( x ) = 1 + n dy este tabelat, dat fiind utilizarea n n 2 ei n construirea intervalelor de ncredere i verificarea ipotezelor statistice. S determinm momentele de diferite ordine; ntruct funcia densitate de repartiie este par, media variabilei Student este nul i drept urmare momentele obinuite coincid cu cele centrate:

n + 1 n +1 2 2 r +1 x2 2 2 r +1 ( X ) = x 1 + n dx = 0 n n 2 (funcia de integrat este impar cu limitele de integrare simetrice).


n + 1 2 2r ( X ) = n n 2
n +1 2

x 2r x 1 + n
2

n + 1 2 2 dx = n n 2

x2 x 2 r 1 + n

n +1 2

dx

x2 Cu substituia = y se obine n

n + 1 r 2 n 2 2r ( X ) = n n 2

1 r 2

(1 + y )

n +1 2

n + 1 r n 2 n dy = 2 n 2
1 2

1 2

(1 + y )

n +1 2

dy =

1 n n + 1 n + 1 n r n r r + r 2 2 1 n 2 2 = r + , r = 2 2 n + 1 n n 2 2 2

n n n n n Cum = 1 2 ... r r ; 2 2 2 2 2
se obine, n final:

r +

1 = r 2

1 r 2

3 1 1 ... , 2 2 2

2r ( X ) =
i expresia are loc numai dac r <

n r 1 3...( 2r 1) ( n 2)( n 4)...( n 2r)

n . De aici rezult, prin particularizarea lui r: 2

2 ( X ) =

n n2 3n 2 4 ( X ) = ( n 2 )( n 4)

15n 3 6 ( X ) = ( n 2 )( n 4 )( n 6) ...

1 = 0 (repartiie simetric)
3n 2 6 ( n 2)( n 4) 3= 2 = 2 n4 n 2 ( n 2)

Rezultatul care urmeaz stabilete legtura ntre repartiia normal, repartiia repartiia Student.

2 (n)

Teorem. Fie variabilele aleatoare independente XN(0,) i X1,X2,,XnN(0,). Atunci, X variabila aleatoare T = are o repartiie Student cu n grade de libertate. 1 n 2 X n j =1 j Demonstraie. Dac notm cu Y =

1 n 2 X X j , atunci T = Y i densitatea de repartiie a n j =1


1 e
x2 2
2

vectorului aleator (X,Y) este f ( x, y ) =

2n 2 n 2 2
n
n

n 2

n 1

ny 2 2 2

Urmeaz c:
FT ( t ) = P(T < t ) =
n 2 n +1

x {( x , y ): < t , y > 0} y yt x2 2
2

f ( x, y )dx dy =

1 2
n 2

2n 2 n 2 2
n

x {( x , y ): < t , y > 0} y

x2 2 2

n 1

ny 2 2 2

dx dy =

2n 2 2
n 2

2
n 2

e n
0

n 1

ny 2 2 2

dx dy

f T (t ) =

2n 2 2
n 2

n +1

n 2

y e

y2 2 2

(t 2 +n)

dy

Dac efectum schimbarea de variabil y =

2 z
2

1 2 1 2

, obinem:

(t + n)
n 2 n 2

f T (t) =

n +1 n ( t 2 + n) 2 2

n 1 2

e z dz =

n + 1 n 2

n 2

n +1 2

(1 +

+ t 2 n2 1 ) n

n + 1 + 2 t 2 n2 1 (1 + ) , care este tocmai densitatea de repartiie a unei variabile Deci, f T ( t ) = n n n 2 Student cu n grade de libertate. 3.6. Repartiia Snedecor i repartiia Fischer Spunem c o variabil aleatoare are repartiie Snedecor dac densitatea sa de repartiie are expresia , x0 0 n1 + n 2 n1 + n2 n1 n21 2 n21 1 n1 2 f (x) = x 1 + x , x>0 ; n 2 n2 n1 n 2 2 2 n1 i n2 sunt numere naturale date, numite grade de libertate.
Constatm c f(x) 0, xR. S verificm c ntr-adevr, n1 + n 2 n1 2 2 n1 n2 n1 n 2 2 2 n1 = n2
n1 2

f ( x ) dx = 1 .

n1 1 2

n1 1 + x n2

n1 + n2 2

dx =

n1 + n 2 n1 1 n1 + n2 n1 1 2 n2 2 n2 y 2 (1 + y ) 2 dy = n1 n1 n1 n 2 0 2 2
n1 2

n1 + n 2 2 n1 n 2 n1 n 2 , = 1 = n 2 n1 n1 n 2 2 2 2 2 n1 n2 x = y, x = y ). (am fcut schimbarea de variabil n2 n1


n1 2

Momentele obinuite:
n1 2

n1 Mr ( X ) = n2

n1 + n 2 2 n1 n 2 2 2

n1 + r 1 2

n1 1 + x n2

n 1 + n2 2

n1 n 2 r + r 2 2 n2 dx = n1 n1 n 2 2 2
r

Momentul de ordinul r exist numai dac r <

n2 . Cum 2

n1 n1 n1 n1 n1 r + = + r 1 + r 2 ... 2 2 2 2 2 n2 n2 n2 n2 n2 = 1 2 ... r r 2 2 2 2 2 se obine n final se obine: n2 , n2 2 n2 2 n1 + 2 , M 2( X ) = n1 ( n 2 2 )( n 2 4 ) ( n1 + 2 )( n1 + 4 ) n2 3 , M 3( X ) = 2 n1 ( n 2 2 )( n 2 4 )( n 2 6) M 1( X ) = n2 n1( n1 + 2)...( n1 + 2r 2) . Prin particularizarea lui r, Mr ( X ) = n1 ( n2 2)( n2 4)...( n2 2r)
r

S stabilim o legtur ntre repartiia


Teorem. Fie
2 ( n1 )

2 (n)

i repartiia Snedecor.
2 (n)

2 ( n2 )

dou variabile aleatoare independente repartizate

cu n1,

respectiv n2 grade de libertate. Atunci, variabila

Fn1 ,n2 =

(2n ) / n1
1

(2n ) / n2
1

n2 (2n1 ) n1 (2n1 )

are o repartiie Snedecor cu n1, respectiv n2 grade de libertate.

Demonstraie. Notm X =

(2n )
1

n1

, Y=

(2n

n2

. Atunci

Fn1 ,n2 =

X , X,Y fiind variabile Y

independente.

FFn1 ,n2 ( z ) = P( Fn1 ,n2 < z ) = P(


n1 2

X < z) = Y

x {( x , y ): < t , y > 0} y

f ( x, y )dx dy =
n2 2

x {( x , y ): < t , y > 0} y yz

n1
n1 2 n1

n 2 1 2
n1 n2

n1x n1 1 2 2 2

n2
n2 2 n2

n 2 2 2
nx n y

n2 y n2 1 2 2 2

dx dy =

n1 n2 1 2 1 2 1 2 n1 2 n 2 2 2 2 = n1 + n2 x e y 2 e 2 dx dy n n 0 2 2 n1 + n2 1 2 2 2

f Fn1 ,n2 ( z ) = 2

n1 n 2
n1 + n2 2

n1 2

n2 2

n2

n1 + n2

n n 1 2 2 2

y( yz )
0

n1 1 2

n1 yz 2 2

n2 y n2 1 2 2 2

dy =

n1

n1 2 n 2 2 = n1 + n2 n n 2 2 n1 + n2 1 2 2 2

y
0

n1 + n2 1 y 2 2 ( n1z + n2 ) 2

dy

Dac facem schimbarea de variabil


n1 n2 n1 1 n1 + n2

y 2 2
1

( n1z + n2) = t; y =

2 2 t , atunci, n1z + n2
2 2 dt n1z + n 2

n1 2 n 2 2 z 2 2 2 n1 + n2 2 f Fn1 , n2 ( z ) = n1 + n2 t n1 + n2 1 n1 + n2 n1 n 2 0 2 2 ( n1 z + n 2 ) 2 2 2

n1 + n2 1 2

e t

Deci,
n1 2 n 2 2 z 2 2 2 n1 + n2 n + n2 1 f Fn1 ,n2 ( z ) = n1 + n2 = n1 + n2 2 n1 + n2 n1 n 2 2 2 ( n1 z + n 2 ) 2 2 2 n1 2 n1 + n2 n +n 1 2 2 2 n21 1 n1 2 , z>0 , z 1 + z = n2 n1 n2 2 2
n1 n1 n2 n1 1 n1 + n2 1

care este tocmai densitatea de repartiie a unei variabile Snedecor cu n1 ,n2 grade de libertate, respectiv. S punem n eviden o alt repartiie care deriv din repartiia Snedecor i care are o importan n verificarea ipotezelor statistice.

Fie X o variabil aleatoare repartizat Snedecor cu grade de libertate n1 ,n2 respectiv. 1 Atunci, variabila Z = ln X are densitatea de repartiie: 2
n1 2

n1 h( z ) = 2 n2

n + n2 n +n 1 1 2 2 n1z n1 2 z 2 e 1 + e n2 n1 n2 2 2

ntr-adevr,
1 H Z ( z ) = P( Z < z ) = P( ln X < z ) = P( X < e 2z ) = FX ( e 2z ) 2 n1 + n 2 n +n n1 1 2 2 n1 2z 2 n1 2 2e n1z 1 + e h( z ) = f X ( e 2z )2e 2z = n2 n2 n1 n 2 2 2

Repartiia dat de aceast densitate de probabilitate este cunoscut sub numele de repartiia Z a lui R.A.Fischer. Repartiia Beta Prin definiie, spunem c variabila aleatoare X are o repartiie Beta de parametri a i b dac densitatea ei de repartiie are expresia:

1 x a 1 (1 x ) b1 f ( x; a, b) = ( a, b) 0

, x ( 0,1) , x ( 0,1)

, a,b > 0.

Se verific imediat c f(x;a,b) 0 i c

f ( x; a, b) dx = 1 ,

ntruct

x
0

a 1

(1 x ) b1 dx = (a, b) .

0 ,x 0 1 x Funcia de repartiie: F ( x ) = y a 1 (1 y ) b 1 dy ,0 < x 1 ( a, b) 0 1 , x >1 Momentele obinuite:


(r + a, b) a ( a + 1)...( a + r 1) 1 Mr ( X ) = x r + a 1 (1 x ) b1 dx = (a, b) = ( a + b)( a + b + 1)...( a + b + r 1) (a, b) 0
1

Particulariznd valorile lui r, obinem:


M 1( X ) = a( a + 1)( a + 2) a ( a + 1) a ; ; M 3( X ) = ; M 2( X ) = ( a + b)( a + b + 1)( a + b + 2) ( a + b)( a + b + 1) a+b ab a( a + 1)( a + 2)( a + 3) ;...; 1 ( X ) = 0; 2 (X) = ;... M 4( X ) = 2 ( a + b)( a + b + 1)( a + b + 2)( a + b + 3) ( a + b) ( a + b + 1)

Repartiia Beta se utilizeaz n aplicaii din teoria deciziei, analiza de drum critic cu durate aleatoare etc. n aplicaii privind analiza drumului critic apar variabile aleatoare de forma: Y = (b - A) X + A (B > A), unde X este o variabil aleatoare B(a,b). S punem n eviden densitatea de repartiie a variabilei Y:

x A Y A x A x A FY ( x ) = P(Y < x ) = P < = P X < = FX B A B A B A B A


x A f Y (x) = f X B A
b 1 1 x A a 1 x A 1 1 , x ( A, B) 1 = B( a , b) B A B A B A B A , x ( A, B) 0

sau

1 ( x A) a 1 ( B x ) b 1 f Y ( x ) = B( a, b)( B A) a + b 1 0

, x ( A, B ) , x ( A, B )

Calculul momentelor (ndeosebi media i dispersia) nu este o problem complicat nici n acest caz, rmnnd ca exerciiu pe care-l propunem. 3.7. Repartiia Weibull Spunem c variabila aleatoare X are o repartiie Weibull de parametri a,b,c dac densitatea de repartiie are expresia

a x b a 1 x b c f ( x; a, b, c ) = c c e 0

, x ( b, ) , x ( b, )

Sub aceast form, ne aflm n cazul triparametric, care constituie varianta complet. Dac b = 0, obinem modelul biparametric, cnd:

adx a 1 e dx f ( x; a , c ) = 0

,x >0 ,x 0

Dac b = 0, c = 1, atunci obinem modelul

ax a 1 e x f ( x, a ) = 0

,x >0 ,x 0

care conine drept caz particular modelul exponenial, cnd a = 1. n cazul biparametric, obinem:
2 1 2 1 2 2 M ( X ) = c ( + 1 ; D (X) = c + 1 + 1 a a a

Repartiia Weibull intervine n studiul fiabilitii elementelor. 3.8. Repartiia normal n-dimensional
Definiie. Vectorul aleator (X1,X2,,Xn) urmeaz o lege normal n-dimensional dac densitatea de repartiie a acestui vector are expresia
f ( x1, x 2,..., xn ) = ke
a ij x i x j
i , j =1 n

= ke X ' AX ,

unde

i , j =1

ij

x i x j 0 este o form ptratic pozitiv definit, iar k este o constant pozitiv pe

care o determinm astfel nct:

(1) f ( x1, x 2,..., xn ) 0 ( 2) k ... e X ' AX dx1... dxn = 1


Rn

Fie transformarea ortogonal X = HY care reduce forma ptratic pozitiv definit XAX la o sum de ptrate: X ' AX = ( HY )' AHY = Y ' H ' AHY = i y i2 ,
i =1 n

unde i sunt valorile proprii ale matricei A : | A - E | = 0 . ntruct XAX este pozitiv definit, rezult c i, i=1,2,,n sunt reale i pozitive. Pe de alt parte, transformarea liniar X = HY fiind ortogonal, determinantul funcional are valoarea 1 i, prin urmare, are loc egalitatea:
k ... e X ' AX dx1... dxn =k ... e
Rn Rn

i y i2
i =1

dy1... dyn =k e i y i dy i = 1
2

i =1

Dar
y y e i i dy i = 2 e i i dy i = 2 ( i )
2 2

1 2

z 2

1 2

e z dz =

1 2

n 1 2

1 2

1 1 , cu i y i2 = z , y i = ( i ) 2 z 2 i

Atunci,

k=

e
i =1

= dy i

( ... )
1 2

i y i2

n 2

. ns | A - E | = 0 (-1)nn ++|A| = 0 i,

| A| ( 1) n | A| =| A| , de unde urmeaz: f ( x1 , x 2 ,..., x n ) = n e X ' AX . deci, 12 ... n = n ( 1) 2

Pentru a pstra analogia cu densitatea de repartiie a unei legi normale N(m,), vom considera densitatea de repartiie a vectorului aleator (X1,X2,,Xn)

f ( x1 , x 2 ,..., x n ) =

| A|

(2 )

n 2

1 ( X ' m') A( X m) 2

m1 a11 a21 m2 cu forma ptratic (X-m)A(X-m) pozitiv definit i m = , A = ... ... an1 mn

a12 ... a1n a22 ... a2n . ... . . . a2n ... ann

Funcia caracteristic i momentele unei legi normale n-dimensionale: din definiie, rezult c (t1,t2,,tn) = M(eitX), t= (t1,t2,,tn). Deci,

(t) =

| A| (2 )
n 2

... e
Rn

1 it ' X X ' AX 2

dx1... dxn

S aplicm din nou transformarea ortogonal X = HY; atunci, tX = (Hu)HY = uHHY = uH-1HY = uY , determinantul funcional este 1, iar XAX = YHAHY =

y
i =1 i

2 i

. Deci,

(t) =

| A| (2 )
n 2

... e
R
n

1 iu'Y Y ' H 1 AH 2

dy1... dyn =
u2 j 2 j

| A| (2 )
n 2

... e
R
n

u j y j 2 j y 2j
j =1 j =1

dy1... dyn =

| A| (2 )
n 2

e
j =1

1 iu j y j j y 2 j 2

dyj =
z2 j 2

| A| (2 )
n 2

e
j =1

iu j 2 1 j y j j 2
j

dyj =

| A| (2 )
n 2

n u2 1 j 2 j =1 j

j =1

dzj =

| A| (2 )
n 2

(2 ) e 12 ... n

n 2

n u2 1 j 2 j =1 j

Prin urmare, ( t ) = e

2 1 n uj 2 j =1 j

, u fiind funcie de t.

Transformarea X = HY ne-a condus la


1 0 0 2 B = H ' AH = ... ... 0 0 0 ... 0 . ... ... ... n ...

y
j =1 j

2 j

= YHAHY = YBY, unde

1 1 n n u2 0 j = u' B 1u , ntruct B 1 = Cum j u 2 = uBu, rezult c j j =1 i =1 ji ... 0 Din relaiile t = Hu; B = HAH se obine: u = H-1t; t = uH = uH-1; u = tH; B-1 = (HAH)-1 = H-1A-1H i, deci,

0 1 ... 0 . 2 ... ... ... 1 0 ... n 0 ...

i =1

u2 j
j

= t ' HH 1 A 1 HH 1t = t ' A 1t . Deci, ( t ) = e

1 t ' A1t 2

, unde A-1 este matricea de

covarian a repartiiei. S obinem acum funcia caracteristic a unei repartiii normale n-dimensionale cu vectorul valoare medie M(X) = m 0. Dac X are o repartiie normal n-dimensional cu m0, atunci variabila aleatoare vectorial Y = X - m are densitatea de repartiie f (X) = | A| ( 2 )
n 2

1 X ' AX 2

pentru care funcia caracteristic este ( t ) = e

1 t ' A1t 2

; atunci,
1 t ' A 1t 2

X ( t ) = M ( e itX ) = M ( e it '( m+ Y ) ) = M ( e it ' m e it 'Y ) = e it ' m e


X ( t ) = e it ' m e

i, deci,

1 t ' A 1t 2

Calculul momentelor: am vzut c n cazul m = 0, funcia caracteristic este

(t ) = e

1 t ' A 1t 2

=e

1 2

a 1t j t k jk

j =1 k =1

unde a 1 sunt elementele matricei A-1. Din expresia funciei caracteristice se obine: jk
1 a jk1t j tk n 1 ( t1,..., tn ) ie 2 j =1 k =1 1 M( X j ) = a jk t k = 0 = t =0 k =1 tj i t =0
n n

1 1 a jk1t j tk n a 1t j t k jk n 1 2 ( t1,..., tn ) 2 1 1 1 i 2 e 2 j =1 k =1 = a 1 M( X j Xk ) = 2 a jk t j a jk t k + a jk e j =1 k =1 = jk k =1 j =1 i tj tk t = 0 t =0
n n n n

n cazul n care m0, funcia caracteristic are expresia:

(t ) = e
De aici urmeaz:

1 it ' m t ' A1t 2

=e

t jmj

j =1

1 2

a 1t j t k jk

j =1 k =1

n 1 1 M( X j ) = = mj + i a jk t j ( t ) = mj; 1 j n i tj t = 0 j =1 t =0 n n 1 2 M( X j Xk ) = 2 = m j + i a 1t j mk + i a 1t k ( t ) + a 1 ( t ) = mjmk + a 1 ; jk jk jk jk j =1 k =1 i tj tk t = 0 t =0 1 j, k n;...

Rezult, deci, c

M ( Xj mj ) = 0, 1 j n; M [( Xj mj ) 2 ] = M ( X 2 ) m 2 = a 1 ; j jj j ... ceea ce dovedete c A-1 este matricea de corelaie a repartiiei considerate. n cazul n care n = 2, dac notm M(X1) =m1, M(X2) = m2, M [( Xj mj )( Xk mk )] = M ( XjXk ) mjmk = a 1 ; jk

2 M (( X 1 m1)2 ) = 1 ; M (( X 2 m2 )2 ) = 2 ; M (( X 1 m1)( X 2 m2 )) = 1 2 2

i atunci
12 A = 1 2
1

1 2 22
2 2

2 2 2 det A1 = 1 2 2 1 2 = (1 2 ) 1 2 2

deci,

det A =

1 2 (1 ) 1
2

2 2

1 2 2 (1 ) 1 A= (1 2 )1 2

2 (1 )1 2
1 (1 2 )
2 2

m1 Urmeaz c densitatea de repartiie a vectorului aleator (X1,X2), m = i A-1 determinat m2 mai sus, este:

f ( x1 , x 2 ) =

1 2 1 2

( x1 m1 ) 2 2 ( x1 m1 )( x 2 m2 ) ( x 2 m2 ) 2 1 exp + 2 2 1 2 22 1 2 2(1 ) 1

Se pot pune n eviden densitile de repartiie condiionate:


f ( x1 / x 2 ) =
2 1 1 exp ( x 2 m2 ) 2 2 x1 m1 + 2 2 2 1 1 21 (1 )

M ( X 1 / X 2 = x 2 ) = m1 +

1 ( x m2 ) 2 2

2 D 2 ( X1 / X 2 = x 2 ) = 1 (1 2 )
2 2 1 exp ( x1 m1 ) 2 2 x 21 m2 + 1 1 2 2 2 (1 )

f ( x 2 / x1 ) =

1 2 2

M ( X 2 / X1 = x1 ) = m2 +

2 ( x m1 ) 1 1

D 2 ( X 2 / X1 = x1 ) = 2 (1 2 ) 2

Capitolul 4 LEGEA NUMERELOR MARI. LEGI LIMIT Legtura ntre frecvena relativ de apariie a unui eveniment i probabilitate constituie baza fundamental a aplicaiilor calculului probabilitilor la experiena practic. Bernoulli a formulat aceast legtur prin legea numerelor mari, potrivit creia frecvena unui fenomen cu probabilitate constant p tinde n probabilitate ctre p. Frecvena de apariie a unui eveniment este, ns, o variabil aleatoare i drept urmare este necesar s se pun n eviden tipuri de convergen specifice teoriei probabilitilor. Unele dintre acestea permit tratarea riguros matematic a legii numerelor mari, a legii tare a numerelor mari, a legilor limit i altele. 4.1. iruri de variabile aleatoare. Convergen S considerm un cmp de probabilitate {,K,P} complet aditiv i (Xn)nN* un ir de variabile aleatoare definite pe acest cmp de probabilitate; deci Xn:R, nN*, X n 1 ( B ) K , ( )B B . Definiie. Spunem c irul de variabile aleatoare (Xn)nN* converge n probabilitate ctre variabila aleatoare X dac, pentru orice >0 i >0, exist un rang N(,) astfel nct: P(: |Xn() - X()| ) , de ndat ce n N(,). Se vede imediat c n locul condiiei (1) putem scrie: P(: |Xn() - Xm()| < ) 1-
P (se scrie probabilitatea evenimentului complementar). Vom scrie n acest caz: Xn X . n

(1)

Definiie. Spunem c irul de variabile aleatoare (Xn)nN* este un ir Cauchy n probabilitate dac, pentru orice >0 i >0, exist un N(,) astfel nct: P(: |Xn() - Xm()| ) de ndat de n,m N(,). Vom scrie (Xn)n1 este un ir Cauchy. Definiie. Spunem c irul de variabile aleatoare (Xn)nN* converge n repartiie (sau n sens Bernoulli) ctre variabila aleatoare X, dac:
n

lim Fn( x ) = F ( x )

pentru orice x punct de continuitate al funciei F, unde Fn(x) = P(Xn < x), F(x) = P(X < x). B Vom scrie Xn X . n

Observaie. Convergena n sens Bernoulli mai este cunoscut i sub numele de convergena slab a irului de variabile aleatoare (Xn)nN*. Definiie. irul de variabile aleatoare (Xn)nN* converge tare ctre variabila aleatoare X dac, pentru orice >0 i >0, exist un rang N(,) astfel nct

P U { :| Xn( ) X ( ) } n N ( , )
Prescurtat, vom scrie Xn tare P X . n

Definiie. irul de variabile aleatoare (Xn)nN* converge aproape sigur ctre variabila aleatoare X dac P( : lim Xn( ) exist i este egal cu X()) = 1. Pentru aceast
n
a .S convergen vom adopta scrierea prescurtat Xn n X .

Definiie. irul de variabile aleatoare (Xn)nN* converge n medie de ordinul r ctre variabila aleatoare X (pentru care Mr(X) exist) dac lim M (| Xn X | r ) = 0 . n fine, n acest caz, vom
n

scrie Xn n X .
Mr

Din definiia convergenei tare n probabilitate a unui ir de variabile aleatoare rezult imediat c irul converge n probabilitate. Se arat, totodat, c un ir de variabile aleatoare (Xn)nN* converge tare n probabilitate dac i numai dac converge aproape sigur. Noi o s artm ns c este adevrat urmtoarea teorem. Teorem. Dac irul de variabile aleatoare (Xn)nN* converge n probabilitate ctre variabila aleatoare X, atunci lim FXn ( a ) = FX ( a ) n orice punct a de continuitate al funciei de
n

repartiie FX. Demonstraie. Fie a un punct de continuitate al funciei FX i >0, >0 astfel nct FX(a + ) - FX(a - ) < Atunci,

= P ( : X ( ) < a ) {: X n ( ) < a} { : Xn( ) a} P( : Xn( ) < a ) +

FX ( a ) = P( : X ( ) < a ) = P[(: X ( ) < a ) ] =

+ P[( : X ( ) < a ) ( : Xn( ) a )] = FX n ( a ) + P ( : X ( ) < a ) ( : Xn( ) a ) FX n ( a ) + P( : Xn( ) X ( ) ) Deci, Atunci,


lim F X n ( a ) lim FX n ( a ) F X ( a + ) F X ( a ) <
n n

F X ( a ) lim F X n ( a ) i, n acelai mod, FX ( a + ) lim FX n ( a ) .


n

i cum > 0 este arbitrar, rezult c lim FXn ( a ) = FX ( a ) .


n

Observaie. Nu se poate face afirmaia c lim FXn ( a ) = FX ( a ) oricare ar fi a R.


n

ntr-adevr,
P

dac

lum

1 Xn( ) = , n N * i X ( ) = 0 , , n

atunci,

evident

Xn X . Totodat

1 0 , a n 0 , a 0 ; FX n ( a ) = FX n ( a ) = 1 1 , a > 0 1 , a > n
0 , a < 0 Dar lim F X n ( a ) = i de aici rezult c lim F X n ( 0) = 1 Fx( 0 ) = 0 din cauz c n n 1 , a 0 zero nu este punct de continuitate pentru FX.

Teorem. Dac P(:X() = k) = 1 unde k este o constant i dac lim F X n ( a ) = FX ( a ) n


n

orice punct a de continuitate pentru FX, atunci irul de variabile aleatoare (Xn)nN* converge n probabilitate ctre k.

Demonstraie. n condiiile teoremei, funcia FX are expresia


0 , a k FX (a ) = 1 , a > k

i, deci, singurul punct de discontinuitate al funciei de repartiie FX este punctul a = k. Putem scrie succesiv:
0 1 P( :| Xn( ) k | ) = 1 P(: k Xn( ) k + ) = = 1 [ P( : Xn( ) k + ) P( : Xn( ) < k )] = = FX ( k + ) FX ( k ) FX n ( k + ) + FX n ( k )

De aici rezult c lim P( :| Xn( ) k | ) = 1 , adic Xn k .


P

Convergena n medie de ordinul r implic convergena n probabilitate. Invers nu este totdeauna adevrat. Pentru aceasta, s considerm irul de variabile aleatoare (Xn)nN*

n Xn: 1 2 2n

1 1 2 n

n 1 , nN* 2n 2

1 < ndat ce n2 n > N(,), ceea ce dovedete faptul c irul (Xn)nN* converge n probabilitate ctre zero. Atunci, oricare ar fi >0 i >0, exist N(,) astfel nct P(| Xn| > ) =

1 1 1 2 Dac acum vom calcula M (| Xn 0| 2 ) = M ( X n ) = 01 2 + n 2 2 + n 2 2 = 1 i, n 2n 2n deci, (Xn)nN* nu converge n medie de ordinul doi.
Aadar, schema de mai jos indic lanul de implicaii ntre tipurile de convergen pe care le-am introdus mai sus:

Xn X Xn X
n n

a .s

tare P

B Xn X Xn X
P n M n

Xn X
n

4.2. Legea numerelor mari


Experiena uman dobndit n procesul de producie a bunurilor materiale sau n studiul fenomenelor naturale a dovedit c fenomenele ce au o probabilitate de realizare apropiat de 1 se produc aproape sigur, iar cele cu probabilitatea apropiat de 0 apar destul de rar. De aceea, evenimentele ce se produc cu probabiliti foarte mici sunt practic imposibile, iar cele care se produc cu probabiliti mari sunt practic certe. Principala problem care se ridic este de a stabili ct de mare sau ct de mic s fie o probabilitate pentru ca evenimentele corespunztoare s poat fi considerate practic certe, respectiv practic imposibile. Rspunsul nu este general valabil, ci depinde efectiv de fenomenul studiat, aceeai probabilitate putnd s reflecte evenimente practic certe n anumite situaii, iar altele nu. Deci, numai situaiile concrete, practice sunt n msur s stabileasc dac un eveniment poate fi considerat ca neglijabil cu o probabilitate dat. Totodat, dac avem un eveniment ce se realizeaz cu o probabilitate foarte mic i dac numrul experienelor este foarte mare, atunci el se poate realiza cu o probabilitate orict de apropiat de 1, cu toate c este greu s ne ateptm ca el s apar ntr-un numr de experiene dinainte fixat. Drept urmare, se impune studiul unor legiti de apariie a unor evenimente cu probabilitatea 0 sau 1 ntr-un numr foarte mare de experiene. Tocmai acesta este obiectul legilor numerelor mari. Acest fapt se poate formula n cadrul unor teoreme de tip lege a numerelor mari ntr-o form determinat, ceea ce vom face n cele ce urmeaz. S considerm un ir de variabile aleatoare (Xn)nN* i Yn = n(X1,X2,,Xn), nN* funcii date, simetrice n primele n variabile ale irului (Xn)nN*.

Definiie. Dac exist un ir de numere reale (an)nN* astfel nct pentru orice >0 s avem lim P(| Yn an| < ) = 1 , atunci spunem c irul (Xn)nN* se supune legii numerelor mari cu
n

funciile (n) nN*. Se mai spune c irul (Xn)nN* este stabil cu funciile (n) nN*. n mod frecvent, n legea 1 n numerelor mari ne limitm la cazul n care n(X1,X2,,Xn)= Xj , cnd se mai spune c n j= 1 irul (Xn)nN* este normal stabil.

Din definiia dat rezult c irul (Xn)nN* se supune legii numerelor mari cu funciile P (n) nN*, dac exist irul de numere reale (an) nN* astfel nct Yn an 0 .
n

Dac an = a, nN*, atunci acest lucru revine la Yn a .


n

Teorema lui Cebev. Fie (Xn)nN* un ir de variabile aleatoare independente, cu dispersii finite, uniform mrginite, D2(Xk) c, () k=1,2,. Atunci,
1 n 1 n lim P Xk M ( Xk ) < = 1 n n n k =1 k =1

(sau c irul (Xn)nN* se supune legii numerelor mari n varianta Cebev). 1 n 1 n 1 1 n Demonstraie. ntruct M Xk = M ( Xk ) i D 2 Xk = 2 n k = 1 n k =1 n k =1 n

D
k =1

( Xk )

c n

(variabilele irului sunt independente, iar dispersiile sunt uniform mrginite). Aplicnd inegalitatea lui Cebev, obinem

1 n 1 n 1 P Xk M ( Xk ) < 1 n k =1 n k =1

1 n D Xk n k =1
2

c n 2

1 n 1 n Prin trecere la limit se obine lim P Xk M ( Xk ) < = 1 . n n n k =1 k =1

1 n Observaie. Se constat c an = M ( Xk ) . n k =1
Teorema lui Markov. Fie (Xn)nN* un ir de variabile aleatoare astfel nct
1 2 n 2 D Xk n 0 k =1 n
1 n 1 n Atunci, lim P Xk M ( Xk ) < = 1 . n n n k =1 k =1

Demonstraie. Se aplic inegalitatea lui Cebev


i, prin trecere la limit, se obine: 1 n 1 n lim P Xk M ( Xk ) < = 1 n n n k =1 k =1

1 2 n Observaie. Condiia 2 D Xk n 0 este cunoscut sub numele de condiia lui k =1 n Markov. Dac variabilele irului (Xn)nN* sunt necorelate dou cte dou, atunci condiia lui Markov devine: 1 n 2 D ( Xk ) n 0 n 2 k =1

ntr-adevr,
2 2 n n n n 2 D Xk = M Xk M Xk = M Xk + 2 XkXl k =1 k =1 k =1 k <l k =1 2

n n M 2 ( Xn) + 2 M ( Xk ) M ( Xl ) = [ M ( X k2 ) M 2 ( Xk )] + 2 [ M ( XkXl ) M ( Xk ) M ( Xl )] k =1 k =1 k <l k <l Cum variabilele sunt necorelate dou cte dou, avem M(XkXl) - M(Xk)M(Xl) = 0 oricare ar fi k,lN*, kl.
n n Deci, D 2 Xk = D 2 ( Xk ) . k =1 k =1

Teorema lui Hincin. Fie (Xn)nN* un ir de variabile aleatoare independente, identic repartizate i cu valori medii finite: M(Xk) = a, k=1,2,. Atunci,
1 n lim P Xk a < = 1 n n k =1

Demonstraie. Definim irurile de variabile aleatoare (Yn)nN* i (Zn)nN* n modul urmtor: fie > 0 fixat i pentru k = 1,2,,n punem Yk = Xk, Zk = 0, dac |Xk|<n Yk = 0, Zk = Xk, dac |Xk|n

Atunci, pentru orice k = 1,2,,n avem Xk = Yk + Zk. S calculm media i dispersia variabilei Yk:
n

M (Yk ) = D (Yk ) =
2

xdF ( x ) = a
n
n

n
2

dF ( x ) an
2

dF ( x ) n x dF ( x ) bn
n

Cu b =

| x| dF ( x ) (care este finit). Cum lim an = lim


n n

xdF ( x ) = a

rezult c pentru orice

>0 exist N() cu proprietatea c pentru orice n N() avem |an - a| < . Cum

1 n 1 n nan M Yk = M (Yk ) = = an n k = 1 n k =1 n 1 n 1 D Yk = 2 n k =1 n
2

D
k =1

(Yk )

nbn = b n2

b 1 n aplicm inegalitatea lui Cebev, obinem P Xk an 2 . n k =1

1 n 1 n Pe de alt parte, Yk an Yk a +| an a| . n k =1 n k =1 Dac 1 n 1 n Yk a < i |an - a|< atunci Yk a < 2 . Deci, n k =1 n k =1

1 n 1 n Yk a < {| an a| < } Yk an < 2 n k =1 n k =1


care este echivalent cu

1 n 1 n Yk an 2 Yk a {| an a| > } n k =1 n k =1
i de aici

1 n 1 n b P Yk ak 2 P Yk a + P(| an a| > ) 2 n k =1 n k =1
(deoarece an a ), dac n N() P( Zn 0) =
n n
a .s .

|x | n

dF ( x) n | x| dF ( x ) n .
|x | n

Dar P( Zk 0) P(Zk 0) i, de aici,


k =1 k =1

1 n 1 n b n P Xk a 2 P Yk a 2 + P Zk 0 2 + k =1 n k =1 n k =1
Cum i sunt arbitrari, urmeaz c
b + poate fi fcut orict de mic.

4.3. Teorema lui Bernoulli. Fie numrul de apariii ale evenimentului A n n probe independente i p = P(A). Atunci oricare ar fi > 0, are loc relaia

lim P p < = 1 n n
1 0 Demonstraie. Asociem experimentului de rang j variabilele aleatoare Xj: . p q Deci, variabila aleatoare Xj ia valoarea 1 dac s-a realizat evenimentul A i 0 n caz contrar, j=1,2,. Am obinut un ir de variabile aleatoare independente (Xn)nN* identic repartizate i

M(Xn) = p, nN* 1 D 2 ( Xn ) = pq (dispersii uniform mrginite). 4 Cum

1 n Xj , rezult c sunt ndeplinite condiiile teoremei lui Hincin i, deci, n j =1

lim P p < = 1. n n
Observaie. Din teorema lui Bernoulli rezult c frecvena relativ de apariie a evenimentului A n n probe independente converge n probabilitate ctre p = P(A):

p
n

Acelai rezultat ar putea obine i ca urmare a faptului c sunt ndeplinite condiiile teoremei 1 lui Cebev, deoarece D 2 ( Xn ) = pq , nN* adic variabilele aleatoare Xn au dispersii 4 egale mrginite.
Teorema lui Poisson. Dac ntr-o succesiune de probe independente, probabilitatea de apariie a evenimentului A n proba de rang k este pk, atunci
1 n lim P pk < = 1 n n n k =1

unde este numru lde apariii ale avenimentului A n primele n probe.

Demonstraie. Dac introducem variabila aleatoare Xk cu numrul de apariii ale evenimentului A n proba de rang k, atunci
1 0 Xk: , pk + qk = 1, k=1,2,n, pk qk

Rezult c am obinut irul de varianbile aleatoare independente (Xn)nN* astfel nct:

M(Xn) = pk; D 2(Xk)=pkqk

1 , k=1,2,... 4

adic dispersiile variabilelor irului sunt uniform mrginite de c =

1 . Sunt verificate 4 1 n 1 n 1 n condiiile teoremei lui Cebev i, deci, cum = Xj i M Xk = pk , rezult n k =1 n k =1 n n j =1


1 n lim P pk < = 1 . n n n k =1

Exemplu. Se consider irul de variabile aleatoare independente (Xn)nN* cu repartiiile n 0 n 1 2 1 , n = 2,3,4,, P(X1=0)=1. S se arate c irul (Xn)nN* se supune Xn: 1 n n n legii numerelor mari. Soluie: M(Xk) = 0, k = 1,2, D2(Xk) = 2, k = 2,3,
Atunci, fiind ndeplinite condiiile teoremei lui Cebev, rezult c irul dat se supune legii numerelor mari n varianta lui Cebev.

Exemplu. Fie irul de variabile aleatoare independente (Xn)nN* cu repartiiile - log k 0 log k , k = 2,3, S se arate c irul dat se supune legii numerelor X 1: , Xk: 1 1/ 2 1/ 2
mari n varianta lui Markov. Soluie. Prin calcul direct rezult imediat c M(Xk) = 0, k = 1,2, D2(X1) = 0; D2(Xk) = log k, k=2,3, atunci 1 n 1 n 1 n 1 n M Xk 0 ; D 2 Xk = 2 D 2 ( Xk ) = 2 log k n k =1 n k =1 n k =1 n k =1 ns

log k =
k =1

1 n 1 ln k < ln 10 ln 10 k =1
n

n +1

ln xdx =
A

1 x ln x ln 10

n +1 1

n +1

dx = ln 10 [( n + 1) ln( n + 1) n]
1

1 ( n + 1) ln( n + 1) n n 0 . Deci, D 2 Xk < n k =1 n 2 ln 10 Sunt ndeplinite condiiile teoremei lui Markov i, deci, irul (Xn)nN* se supune legii numerelor mari.

Exemplu. S se arate c irul de variabile aleatoare independente (Xn)nN* unde Xn are ( x n ) 2 1 n e densitatea de repartiie f X n ( x ) = , nN*, [0,1] se supune legii numerelor 4 n mari.

Soluie. Prin calcul direct,

M ( Xk ) = D ( Xk ) =
2

k
4

xe

( x k ) 2 k

dx = k , kN*;
2

4 k

( x )
k

( x k ) 2 k

dx =

k , kN*. 2

De aici rezult c:
1 n 1 n n +1 M Xk = k = n k =1 n k =1 n(1 )

1 n 1 D 2 Xk = 2 n k =1 n

D 2 ( Xk ) =
k =1

1 n2

k =1

k n n < 0 n 2 2n 2

Deci, irul (Xn)nN* se supune legii numerelor mari, unde irul de numere reale (an)nN* este n +1 dat de an = , nN*. n(1 )

Exemplu. S se precizeze dac integrala I =


a

sin x dx , a > 0 se poate calcula prin metoda x

Monte-Carlo, cu formula In =

a 1 1 a yk sin yk , dup efectuarea schimbrii de variabil y = x i n k =1 unde y1,y2,,yn sunt numere aleatoare repartizate uniform pe intervalul [0,1].
n

Soluie. Efectundu-se schimbarea de variabil menionat, se obine:


1 a a 1 1 I = sin dy = sin dy y y 1 y 0 y 0

Valoarea In obinut din formula indicat poate fi considerat ca o valoare aproximativ a P integralei numai n cazul n care lim P(| In I | < ) = 1 deci, dac i numai dac In I .
n

Numerele aleatoare yk sunt identic repartizate (uniform repartizate) pe [0,1], deci i a 1 sunt identic repartizate. Atunci, pentru a funciile de variabile aleatoare k ( yk ) = sin yk yk putea aplica teorema lui Hincin de la legea numerelor mari, trebuie s dovedim existena a 1 valorii medii M sin cu Y variabil aleatoare uniform repartizat pe [0,1]. Y Y

a 1 M sin exist dac i numai dac Y Y

y sin y dy este absolut convergent.


0

Fie s cel mai mic numr natural care satisface inegalitatea s


1 a |sin x| 1 dx sin dy = y y x k=s a ( k +1)

. Atunci,

sin y |sin x| dy dx = x k = s 0 y + k

ns

k =s 0

sin y 1 2 1 dy > sin ydy = = y + k k=s k +1 k = s ( k + 1) 0


1

De aici rezult c integrala

a 1 1 sin y dy este divergent i, deci, M sin nu exist. Y y Y

n concluzie, nu se poate aplica teorema lui Hincin i, deci, nu poate fi calculat integrala prin metoda Monte-Carlo.

Exemplu. ntr-o cercetare tiinific se efectueaz n experiene, urmrindu-se apariia unei anumite caracteristici. S se determine numrul minim de experiene astfel nct, cu o probabilitate de cel puin 0.95, frecvena relativ de apariie s difere n valoare absolut de probabilitatea p cu mai puin de 10-3. Soluie. Aplicnd inegalitatea lui Cebev, se obine:
k D2 n

p(1 p ) k P p < 10 3 1 6 = 1 n n 10 n 10 6

p(1 p ) p(1 p )10 6 0.95 rezult n Din inegalitatea 1 = 2 p( p 1)10 7 6 0.05 n 10

Exemplu. Se efectueaz 800 de probe independente. n 200 din ele probabilitatea apariiei unui rezultat ateptat a fost de 0.5; n 400 de probe aceast probabilitate a fost de 0.4, iar n restul probelor a fost de 0.3. S se determine marginea inferioar a probabilitii n abaterea absolut a frecvenei relative de apariie a evenimentului astfel nct media probabilitilor s nu depeasc 0.04. Soluie. Se aplic teorema lui Poisson i se obine:
1 k P ( 200 0.5 + 400 0.4 + 200 0.3) < 0.04 0.817 n 800

4.4. Teoreme limit Am folosit pn acum n mod deosebit convergena n probabilitate i cu ajutorul ei am exprimat legea numerelor mari n diverse variante. Vom utiliza acum convergena n repartiie i vom obine rezultate privind repartiia limit a unui ir de variabile aleatoare constituit adecvat pornind de la un ir dat de variabile aleatoare (Xn)nN* presupus a ndeplini anumite condiii. Formularea general a legilor limit se pune n modul urmtor: Fie (Xn)nN* un ir de variabile aleatoare. Dac exist dou iruri de numere reale (an)nN* i Xn an B X , unde X are o lege de repartiie determinat, atunci (bn)nN* astfel nct n bn repartiiile astfel obinute constituie o familie pe care o numim familia repartiiilor de tip L, n care legea normal ocup un loc deosebit de important.

nainte de a pune n eviden legi limit normale N(m;), vom formula unele rezultate importante fr a le demonstra - pe care apoi le vom utiliza.

Teorem. Fie (Xn)nN* un ir de variabile aleatoare. Dac lim FX n ( x ) = Fx ( x ) n orice xR


n

punct de continuitate al funciei de repartiie FX, atunci irul (Xn(t))nN* converge ctre X(t) uniform, n orice interval (a,b]R.

Teorem. Dac (Xn(t))nN* este irul funciilor caracteristice, corespunztor irului de funcii de repartiie (FXn(x))nN* i dac lim X n ( t ) = ( t ) , tR, (t) continu n t = 0, atunci
n

(t) este o funcie caracteristic i irul (FXn(x))nN* converge ctre F n orice punct de continuitate al funciei F, funcia de repartiie corespunztoare funciei caracteristice (t).

Teorem. Fie (Xn)nN* un ir de variabile aleatoare care au momente de orice ordin. Dac pentru orice kN Mk ( Xn ) n Mk ( X ) , atunci lim P( Xn < x ) = P( X < x ) .
n

4.5. Teorema limit central (Lindeberg-Levy). Fie (Xn)nN* un ir de variabile aleatoare independente, identic repartizate, care admit momente de ordinul unu i doi. Dac se n n Xk M Xk k =1 k =1 , nN*, atunci consider irul de variabile aleatoare (Yn)nN* Yn = n D Xk k =1
1 Yn X N ( 0;1) , adic lim Fn( x ) = lim P( : Yn( ) < x ) = n n n 2
B

y2 2

dy .

Demonstraie. Se constat imediat c


n n M Xk = M ( Xk ) = nm; m = M ( Xk ), k = 1,2,... k =1 k =1 n n D 2 Xk = D 2 ( Xk ) = n 2 ; 2 = D 2 ( Xk ), k = 1,2,.. . k =1 k =1

i, deci,

Yn = Atunci,

(X
k =1

m)

Y (t ) = M e
n

( )
it Yn

k1( Xk m ) n i it = n = Me = M e k =1
n

t n

( Xk m )

n i = Me k =1

t n

( Xk m )

t t = ( Xk m ) = n n k =1
n

Cum pentru orice tR, dac n este suficent de mare, n serie n jurul originii funcia i obinem

t n

< 1, atunci putem dezvolta

t2 2 t2 t 1 1 =1 + 3/ 2 = 1 + 3/ 2 2 n n n 2n 2! n
n
2

t t2 (1 + n ) , lim n = 0 i, de aici, lim Yn ( t ) = e 2 . Urmeaz c Yn ( t ) = 1 n n 2n

Din teorema de inversiune i unicitare rezult c lim FYn ( x ) =


n

1 2

y2 2

dy .

Teorema lui Liapunov. Fie (Xn)nN* un ir de variabile aleatoare idependente pentru care
exist M(Xk) = mk, D2(Xk) = D2k, M(|Xk - mk|3) = H3k, kN*.
n n 3 Notm Sn = D k2 ; Kn = H k k =1 k =1
n
1/ 3

. Dac lim

Kn = 0 , atunci n Sn

Yn =

n Xk M Xk k =1 k =1 D Xk k =1
n
y2 2

X N ( 0,1) ,
n

adic lim FYn ( x ) =


n

1 2

dy .

Demonstraie.
n n 2 Vom folosi tot metoda funciei caracteristice; cum D Xk = D 2 ( Xk ) = S n , k = 1 k =1 2

variabila aleatoare Yn mai poate fi scris sub foma Yn =

(X
k =1

mk )
i, cu aceasta,

Sn

n i t ( Xk mk ) n i t ( Xk mk ) n i t ( Xk mk ) Sn k =1 Sn S Yn (t ) = M e = M e = M e = M e n k =1 k =1 n t Deci, Yn ( t ) = Xk mk . Dar, X k mk ( t ) = e itmk X k ( t ) = ak ( t ) + ibk ( t ) . Sn k =1

it Yn

Dac notm cu Gk(x) funcia de repartiie a variabilei aleatoare Xk = mk, rezult c:

Dk2 t 2 t 3 ak (t ) = cos txdGk (x ) = 1 + 2 6 t3 bk (t ) = sin txdGk (x ) = 6 Atunci, X k mk ( t ) = 1


x
1

dGk (x ) , cu |j| < 1, j=1,2

x dGk (x )

Dk2 t 2 + t 3 Rk , unde 2

1 | Rk| = 6

H k3 1 3 (1 x 2 x ) dGk( x ) 6 | x ||1 2 | dGk( x ) 3


3 3

Dk2 t 2 t3 t i, de aici, X k mk = 1 2 + 3 , iar Sn 2S n 3S n


ln Yn ( t ) = ln X k mk (
k =1 n n D 2 t 2 t 3 Rk t ) = ln 1 k 2 + 3 . Sn 2S n 3S n k =1

Kn 0 cnd n, rezult c oricare ar fi > 0, exist un rang N() astfel Sn H k3 3 Kn nct pentru orice n > N() s avem < , t 0 . De aici rezult c 3 < 3 , dac S n | t| Sn | t | n > N(). Deoarece Din inegalitatea lui Liapunov (monotonia momentelor absolute) avem Dk Hk, kN* i, deci,
Dk2 H k2 H k3 2 2 = Sn S n S n3
2/3 2 Hn 2 2 2 , k = 1,2, ... , n . Atunci, pentru orice > 0, Sn t

t 2 D k2 t 3 Rk 2 3 + <2 2 + 3 < 2 3 2S n 3S n

n D 2 t 2 t 3 Rk sub forma: S punem ln Yn ( t ) = ln1 k 2 + 3 2S n 3S n k =1

n D k2 t 2 t 3 Rk D k2 t 2 t2 ln Yn ( t ) + = ln 1 + + 3 2 2 k =1 2 S k2 3S n 2 S n

t 2 Dk2 1 t 3 Rk , putem scrie Cum |ln(1 + x ) x| | x | dac | x| , cu notaia Ak = 2 , Bk = 2 2S n 3S n3


2

ln Yn ( t ) +

t2 = 2

ln(1 + Ak + Bk ) ( Ak + Bk ) + Bk | Ak + Bk| 2 + | Bk|


k =1 k =1 k =1

Dar

| Bk|
k =1

3 | t| 3 K n 3 , iar 3 3 3S n

| Ak + Bk| 2 2 (| Ak|+| Bk|) 2


k =1 k =1

| t| 2 5 + . 2 3

Urmeaz, de aici, c
t2 2

ln Yn ( t ) +

t 2 2 | t| 2 5 3 1 + + < , dac < . 2 2 3 3 3| t| 2

Deci, lim Yn ( t ) = e
n

i, din teorema de convergen a funciilor caracteristice, rezult c


lim FYn ( x ) =
n

Observaie.

Dac

variabilele
n

irului
1/ 2

e 2 (Xn)nN*

y2 2

dy

sunt
n

identic
1/ 3

repartizate,

atunci

Dk2 = 2 ; H k3 = H 3 , kN* i Sn = Dk2 k =1

= n ; Kn = H k3 k =1

= H 3 n . Urmeaz c

Kn H 1 = n 6 0 adic este ndeplinit condiia lui Liapunov. n Sn Observaie. Dac variabilele sirului (Xn)nN* satisfac proprietile: |Xk - mk| A, k=1,2, i 2 lim Sn = + , atunci i H k3 = M ( Xk mk 3) A M Xk mk = A D k2
n

n n 2 3 3 Kn = H k A Dk2 = A1/ 3 S n / 3 . k =1 k =1

Rezult c

2 K n A 1/ 3 S n / 3 = A1/ 3 S n 1/ 3 0 i, deci, n acest caz, condiia lui Liapunov n Sn Sn este ndeplinit.

4.6. Teorema Moivre-Laplace. Fie un experiment n care poate s apar evenimentul A cu probabilitatea p sau contrariul lui A cu probabilitatea q, p+q=1. Dac se repet de n ori experimentul n aceleai condiii i dac se noteaz cu k numrul de realizri ale evenimentului A n cele n experimente independente, atunci: x k np 1 y2 /2 < x = lim P e dy npq n 2 Demonstraie. 1 0 Asociem experimentului de rang j, variabila aleatoare Xj: . p q
n n n Atunci, K = Xj; M Xj = np; D 2 Xj = npq . Cum variabilele Xj, j=1,2, sunt j =1 j =1 j =1 independente, se poate aplica teorema limit central Lindeberg-Lvy i, deci, n n Xj M Xj x y2 k np j =1 j =1 = 1 e 2 dy < x = lim P lim P <x n n 2 npq n D Xj j =1

Observaie. n condiiile teoremei de mai sus,

k np lim P npq < x n

k p n = lim P < x = n pq n

1 2

y2 2

dy

k p n < ( ) ( ) . De aici rezult, dac n este suficient de mare, P pq n De asemenea, pentru n suficient de mare,

k p k k b p b p a p a p n P a b = P a p p b p = P pq pq pq n n pq pq n n n n n
Exemplu. Cu ce probabilitate putem afirma c din 100 de aruncri a unei monede, stema apare de un numr de ori cuprins ntre 40 i 60? Soluie. Aplicm teorema Moivre-Laplace, tiind c p = q = 1/2, n = 100.

40 50 60 50 40 np k np 60 np = (2 ) (2 ) = P (40 k 60) = P npq npq npq 100 100 4 4 = 2(2 ) 1 = 0,9544


Exemplu. S considerm irul de variabile aleatoare independente (Xn)nN*, cu repartiiile: 1 1 1 1 0 X n: n n , p ( 0,1), , , nN*. S se arate c irului (Xn)nN* i se 3 2 1 2 p p p poate aplica teorema lui Liapunov. Soluie. Cutm s vedem dac sunt ndeplinite condiiile teoremei lui Liapunov.

M ( Xk ) = 0, M ( X k2 ) = D k2 =
3 M ( Xk ) = H k = 3

2p , kN* k 2

2p , kN* k 3

De aici urmeaz c:

S = D = 2 p
2 n k =1 2 k k =1

1 k
2

; K = H = 2 p
3 n k =1 3 k k =1

1 k 3

ntruct

n n 1 1 3 1 1 < , rezult c 1 < 3 i, de aici, lim 3 = 3 convergent. n 2 3 2 k =1 k k =1 k

Pe de alt parte,

k >k
k =1 2 k =1

i lim

1 = + . n k =1 k

De aici urmeaz c lim este dovedit.

Kn = 0 i, fiind ndeplinite condiiile teoremei lui Liapunov, afirmaia n Sn

Exemplu. Se consider irul de variabile aleatoare independente (Xn)nN* identic repartizate, 1, x (0,1) f X n (x) = 0, x (0,1) S se aplice teorema lui Liapunov irului dat i s se deduc de aici un mod de generare a valorilor unei variabile repartizat normal N(0;1). Soluie. Am vzut c n cazul variabilelor aleatoare identic repartizate, pentru care exist momentele de primele trei ordine, condiia lui Liapunov este ndeplinit i, deci,
n n Xk M Xk k =1 k =1 < x = lim P n n D Xk k =1

1 2

y2 2

dy

X
Prin umare, variabila aleatoare
k =1

n M Xk k =1

n D Xk k =1

urmeaz aproximativ o lege normal

N(0;1), dac n este suficient de mare. pentru n suficient de n 12 mare, este aproximativ normal N(0;1). Pentru n=12 se obine o aproximaie destul de bun i atunci Dar M ( Xk ) = 1 1 , D 2 (Xk) = , k = 1,2,... i atunci 2 12

X
k =1

n 2

X
k =1

12

6 este aproximativ normal N(0;1). Se alege un set de 12 numere aleatoare

uniform repartizate pe intervalul (0,1): r1,r2,,r12. Cu acestea se obine o valoare 1 a unei variabile aleatoare normal N(0;1). Se repet procedeul lund un alt set de 12 numere uniforme pe (0,1) .a.m.d., pn se obine numrul dorit de valori ale variabilei normale N(0;1). Se constat c procedeul este destul de simplu, dar cum pentru un set de 12 numere uniform repartizate pe (0,1) se obine un numr repartizat N(0;1) - procedeul este ineficient cnd avem nevoie s obinem un numr destul de mare de astfel de valori.
Exemplu. Dac numrul n de grade de libertate al unei repartiii (2n ) tinde ctre , atunci
F 2 ( x ) n ( x ) =
(n)

1 2

y2 2

dy .

Demonstraie.

S scriem funcia caracteristic a variabilei aleatoare

(2n ) M ( (2n ) )
D( (2n ) )
n 2

(2n ) n
2n
n 2

it ( n ) n it n( t ) = M e 2 n = e
2

n 2

i M e

t 2

(2n )

n it it t 2 =e = e (2n ) 2n

2 1 i t n

Logaritmnd (lum determinarea principal a funciei logaritm) se obine:

ln n ( t ) =

n n ti ln1 2 2

2 ti n

ntruct trebuie s facem n, rezult c pentru n suficient de mare, oricare ar fi tR, 3 n n 2 2 t2 2 t <1 tii, deci, ln n (t) = ti + + n 2 adic 2 2 n n 2 n
1 1 t2 2 ln n ( t ) = + n = 0; lim n 2 = 0 . n 2
t t2 Trecnd la limit, i, deci , lim n ( t ) = e 2 care este tocmai lim ln n ( t ) = n n 2 funcia caracteristic a legii normale N(0;1). De aici rezult afirmaia.
2

Exemplu. Dac n, numrul gradelor de libertate, tinde la infinit, atunci repartiia Student cu n grade de libertate tinde ctre repartiia normal N(0;1). Demonstraie. Este suficient s artm c irul momentelor Mr(T(n)) cu r = 0,1,2, tinde ctre Mr(X) unde XN(0;1). n r 1 3...( 2r 3)( 2r 1) . Am vzut c M2r+1(T(n)) = 0; M2r+1(X) = 0, iar M 2r (T ( n )) = ( n 2)( n 4)...( n 2r ) De aici, n r 1 3...( 2r 3)( 2r 1) = 1 3 5...( 2r 1) lim M 2 r (T ( n )) = lim n n ( n 2 )( n 4 )...( n 2r )

Cum M2r(X) = 135(2r-1), rezult afirmaia. Vom pune n eviden teorema limit central a calculului probabilitilor n formularea J.W.Lindeberg i W.Feller i vor rezulta ca simple consecine teoremele limit demonstrate de noi direct, n paginile anterioare. Demonstraia nu o vom da, dat fiind faptul c este laborioas, iar cei interesai o pot gsi n cursul de "Teoria probabilitilor i statistic matematic" de M.Iosifescu, Gh.Mihoc, R.Theodorescu, aprut n Editura Tehnic, 1966. Considerm un ir de variabile aleatoare independente (Xn)nN* care admit dispersii finite. Vom nota M ( Xk ) = mk , D 2 (Xk) = k2 , kN* n n 1 n 2 mn = mk i S n = k2 , Yn = ( Xk mk ) Sn k =1 k =1 k =1

Definiie. Spunem c irul de variabile aleatoare independente (Xn)nN* verific condiia L (condiia Lindeberg) dac, pentru orice > 0, are loc relaia:
1 (L) lim n ( ) = lim 2 n n S n

k =1 {x ;|x mk |> S n }

( x mk )

dFk ( x ) = 0 ,

unde Fk(x) = P({; Xk( < x}). 4.7. Teorema Lindeberg-Feller. Fie (Xn)nN* un ir de variabile aleatoare independente. Atunci,
lim FYn ( x ) = ( x ),

xR
2

n 1 k n

lim max

k2
2 Sn

=0

dac

numai

dac

lim

1 n S 2 n

k =1 { x ;| x mk | > S n }

( x mk )

dFk ( x ) = 0 (este satisfcut condiia (L)).

S punem n eviden unele consecine directe ale teoremei Lindeberg-Feller.


Consecin. Dac variabilele aleatoare ce compun irul de variabile independente (Xn)nN* sunt identic repartizate, atunci lim FYn ( x ) = ( x ), () xR
n

Demonstraie. n acest caz, M ( Xk ) = m, D 2 (Xk) = 2 , kN* i, deci, Sn = n .

Cu acestea, condiia lui Lindeberg devine

n ( ) =
i, deci

1
2

k =1 n

{ x ;| x m|> n }

( x m)

dF ( x ) =

1 n 2

{ x ;| x m| > n }

( x m)

dF ( x )

lim n ( ) = 0 , adic este ndeplinit condiia lui Lindeberg.


n

Consecin. Dac irul de variabile aleatoare indpendente (Xn)nN* are proprietatea c variabilele aleatoare Xn sunt uniform mrginite, admit dispersii finite i lim Sn = + atunci
n

lim FYn ( x ) = ( x ) .
n

Demonstraie. Dat fiind c variabilele aleatoare Xk, kN* sunt uniform mrginite, rezult c () A > 0 astfel nct Xk - mk A, kN*. De aici rezult c:

{| x mk |> S n }

(x m )
k

dF ( x ) =

{ ;| x k ( ) mk |> S n }

( X ( ) m )
k k

dP( ) A 2 P({ ;| Xk ( ) mk| Sn})

ntruct lim Sn = + , putem lua n suficient de mare astfel nct Sn > A, i, n acest caz,
n

P({;|Xk() - mk| > Sn}) = 0

i, deci,

{| x mk |> S n }

(x m )
k

dF ( x ) = 0 , kN*, ceea ce implic verificarea condiiei (L).

Bazai pe teorema limit central Lindeberg-Feller putem demonstra uor teorema lui Leapunov, pe care am demonstrat-o anterior independent.
Teorema Leapunov. Fie irul de variabile aleatoare independente (Xn)nN* . Dac exist >0 astfel nct:
lim n ( ) = lim
n

1 S

2+ n

M( x
n k =1

mk

2 +

) = 0,

atunci lim FYn ( x ) = ( x ), () xR.


n

Demonstraie. Vom cuta s vedem dac este ndeplinit condiia (L):

n ( ) =

1 2 Sn

k =1 {| x mk |> S n }

( x mk )2

Sn 1 dFk ( x ) = 2+ Sn Sn

k =1

{|x m|> S n }

x m

2+

dFk ( x )

n ( )

lim ( ) = 0 , adic este satisfcut condiia "L". n n Pentru = 1 se obine exact formularea teoremei Leapunov, pe care am demonstrat-o direct anterior. Dac pentru irul de variabile aleatoare independente (Xn)nN* exist
n

Trecnd la limit, 0 lim n ( )

H k3 = M xk mk

n 3 Kn = 0, unde Kn = H k3 , atunci kN* i dac lim , n Sn k =1

lim FYn ( x ) = ( x ), () xR.

Capitolul 5 PROCESE MARKOV I POISSON

5.1. Procese Markov depinznd de un parametru discret S considerm un cmp de probabilitate {,K,P} complet aditiv i mulimea variabilelor aleatoare reale definite pe acest cmp, pe care o notm cu V i TR. Definiie. Numim proces stochastic cu mulimea de parametri T o aplicaie X: T V S explicm puin noiunea de proces stochastic introdus mai sus. Pentru aceasta s admitem c variabilele aleatoare din mulimea V descriu starea unui anumit sistem, iar mulimea T a parametrilor reprezint timpul. Atunci, un proces stochastic reflect evoluia n timp a unui sistem dat. De obicei, se ia drept mulime T a parametrilor fie toat dreapta real, R=T=(-,+), fie numai semiaxa pozitiv T=(0,) sau T=[0,), fie un segment finit al dreptei reale, de regul T=[0,1]. Procesele stochastice ne ofer posibilitatea s privim sistemele n micare, ca de altfel i funciile obinuite din analiza matematic. Spre deosebire ns de starea clasic, starea sistemului la un moment dat nu mai este perfect determinat, ci este aleatoare, ceea ce nseamn c ea nu poate fi cunoscut dect probabilistic. Formal, un proces stochastic depinde de dou variabile: tT i . De aceea vom scrie X(t,) sau Xt(). Pentru fiecare tT, Xt(.) este o variabil aleatoare definit pe {,K,P} i pentru fiecare (cu alte cuvinte, pentru fiecare realizare , X(t,.) reprezint o funcie definit pe T), X(t,.) este o funcie de variabil real tT. Dac card T = n, adic T conine numai un numr finit de elemente, T={t1,t2,,tn}, atunci procesul stochastic {Xt, tT} este echivalent cu un vector aleator. n cazul n care T este o mulime numrabil, se ia ca mulime a parametrilor fie mulimea Z={,-n,,-1,0,1,,n,}, fie mulimea N={0,1,2,,n,}. n acest caz, procesul este un ir de variabile aleatoare i-l vom numi lan. Am vzut c o variabil aleatoare se consider determinat dac se cunoate funcia ei de repartiie. n cazul unui proces stochastic, acesta va fi determinat dac se cunosc toate funciile de repartiie finit dimensionale, ceea ce nseamn c pentru orice nN, orice t1,t2,,tnT i orice x1,x2,,xnR se cunosc probabilitile:

P({ : X t1 ( ) < x1, X t2 ( ) < x 2,..., X tn ( ) < xn}) = Ft1 ,t2 ,...,tn ( x1 , x 2 ,..., x n )
n afara proprietilor cunoscute pentru funciile de repartiie n-dimensionale, aceste funcii trebuie s mai satisfac urmtoarele proprieti de consisten: (1) lim Ft1 ,t2 ,...,tn ( x1 , x 2 ,..., x n ) = Ft1 ,t2 ,...,t j 1t j +1 ,...tn ( x1 , x 2 ,..., x j 1 x j +1 ,... x n )
x j

(2) oricare ar fi permutarea (i1,i2,,in) a lui (1,2,,n),

Fti1 ,ti 2 ,...,ti n ( xi1 , x i2 ,..., x in ) = Ft1 ,t2 ,..,tn ( x1 , x 2 ,..., x n )

S vedem ce se ntmpl cu dou procese crora le corespund aceeai familie de funcii de repartiie finit dimensionale. Fr a intra n amnunte, vom da numai urmtoarea definiie: Definiie. Dou procese stochastice definite pe aceeai mulime de parametri se numesc echivalente dac toate repartiiile finit dimensionale corespunztoare lor coincid. Noi vom considera acum procese stochastice depinznd de un parametru discret, n care T=N={0,1,2,,n,}. Fie, deci, un cmp de probabilitate {,K,P} i (Xn)nN, un ir de variabile aleatoare definite pe acest cmp. Vom presupune c fiecare variabil aleatoare Xn este de tip discret i s notm cu I reuniunea valorilor posibile pe care le pot lua variabilele Xn, nN. Rezult imediat c I este o mulime cel mult numrabil i c iI dac i numai dac exist nN astfel nct P(:Xn()=i) > 0. Mulimea I o vom numi mulimea de stri ale procesului stochastic de parametru discret (Xn)nN. Definiie. Spunem c irul de variabile aleatoare (Xn)nN constituie un lan Markov dac pentru orice nN, n2, orice t1,t2,,tn, 0t1<t2<<tn i orice i1,i2,,inI are loc relaia (*) P(: X t n ( ) = in / X t n 1 ( ) = in 1 ,..., X t1 ( ) = i1 ) = P(: X t n ( ) = in / X t n 1 ( ) = in 1 ) , ori de cte ori membrul stng al egalitii este definit. Se poate demonstra c relaia de definiia a lanului Markov este echivalent cu urmtoarea condiie aparent mai simpl: pentru orice nN,

P(: Xn( ) = in / X n 1 ( ) = in 1 ,..., X 0 ( ) = i0 ) = P(: X n ( ) = in / X n 1 ( ) = in 1 )


Din definiia dat lanului Markov, rezult c acesta reflect un sistem ce evolueaz n timp discret, evoluie a crei stare viitoare depinde numai de starea prezent, indiferent ce s-a petrecut cu strile sistemului n trecut (anterioare prezentului). Se mai spune c un astfel de sistem este fr memorie. Putem acum s introducem o definiie echivalent a unui lan Markov prin propoziia care urmeaz. Propoziie. irul de variabile aleatoare (Xn)nN constituie un lan Markov dac i numai dac pentru orice m0 i orice t1,t2,,tn+m, 0t1<t2<<tn+m i orice i1,i2,,in+mI are loc relaia: P( X tV ( ) = iV , n V n+m / X tV ( ) = iV ,..., X tV ( ) = iV ,1 V n-1) = (**) = P( X tV ( ) = iV , n V n+m / X tn 1 ( ) = in 1 ) Demonstraie. Vom proceda prin inducie asupra lui mN. Pentru m = 0, relaia (**) se reduce la relaia (*) de definiie a unui lan Markov. S presupunem c (**) este adevrat pentru un m dat i s artm c ea este adevrat pentru m+1. ntr-adevr,

P( X t V ( ) = i V , n V n+m + 1 / X tV ( ) = iV ,1 V n-1) = = P ( X t( )
( )
n + m +1

P ( X t V ( ) = i V ,1 V n+m + 1) P ( X t V ( ) = i V ,1 V n 1) =

= i n + m+1 / X tV = i V ,1 V n+m) P( X t V ( ) = i V ,1 V n+m

P ( X t V ( ) = i V ,1 V n 1

= P ( X t n + m+1 ( ) = i n + m+1 / X t n + m ( ) = i n + m ) P( X t V ( ) = i V , n V n+m / X t V ( ) = i V ,1 V n 1)

care, conform ipotezei de inducie, devine: P X tn + m+1 ( ) = in + m+1 / X tn+ m ( ) = in + m P X tV ( ) = iV , n V n+m / X tn 1 ( ) = in 1 =

( )( P( X ( ) = i , n 1 V n+m + 1) P( X ( ) = i , n 1 V n+m) = = P( X ( ) = i ) P( X ( ) = i , n 1 V n+m) P( X ( ) = i , n 1 V n+m + 1) = = P( X ( ), n V n+m + 1 / X ( ) = i ) P( X ( ) = i )


tV V tV V tV V t n 1 n 1 tV V tV t n 1 n 1 t n 1 n 1

)(

= P X tn + m+1 ( ) = in+ m+1 / X tV ( ) = iV , n 1 V n+m P X tV ( ) = iV , n V n+m / X tn 1 ( ) = in1

Observaie. Dac inem seama de unele rezultate din teoria msurii, se poate afirma c valabilitatea relaiei (**) pentru orice m0 este echivalent cu urmtorul rezultat, mult mai general: Pentru orice MK(Xt; t>tn) are loc relaia P( M / X tV ( ) = iV ,1 V n ) = P( M / X t n ( ) = i ) , n unde K(Xt; t>tn) este corpul borelian generat de variabilele aleatoare Xt, t>tn. 5.2. Probabiliti de trecere S considerm cmpul de probabilitate {,K,P} i irul de variabile aleatoare (Xn)nN definite pe acest cmp. Notm cu K0 corpul borelian generat de variabilele aleatoare Xn, nN ale irului considerat. Evident c avem K0K. Dac toate variabilele irului sunt discrete, aa cum am presupus iniial, cu mulimea de stri I, atunci probabilitile pe toate mulimile din corpul K0 sunt determinate de repartiiile finit dimensionale P(Xn() = in, Xn-1() = in-1,,X0() = i0), pentru orice nN i i0, i,,inI. Dar, P(Xn() = in, Xn-1() = in-1,,X0() = i0) = P(X0() = i0). P(X1() =i1 / X0()= i0). P(X2() = i2 / X1() = i1, X0() = i0) P(Xn() = in / Xn-1() = in-1,,X0() = i0) = P(X0() = i0) P( Xt ( ) = it / Xs() = is, 1 s t-1)
t =1 n

Dac acum (Xn)nN este un lan Markov, atunci:

P( Xt ( ) = it ,0 t n) = P( X 0( ) = i 0) P( Xt ( ) = it / Xt 1( ) = it 1)
t =1

din starea it-1 n starea it i le vom nota p(t;it-1,it), iar probabilitile P( X 0( ) = i 0) = p i0 , iI vor constitui repartiia iniial. Atunci, P( Xt ( ) = it ,0 t n) = pi0 p(t; it 1 , it )
t =1 n

Vom numi probabilitile P( Xt ( ) = it / Xt 1( ) = it 1) probabiliti de trecere la momentul t,

Definiie. Un lan Markov spunem c este omogen sau cu probabiliti de trecere staionare, dac acestea nu depind explicit de timpul t:

p( t ; it 1, it ) = pit 1it
Pentru un lan Markov omogen (cu probabilitile de trecere staionare) are loc relaia:
P( Xt ( ) = it ,0 t n) = pi0 pit 1it
t =1 n

Probabilitile pit 1it constituie elementele unei matrici

( p )

numit matricea de trecere

ij ( ij )

IxI .
pi 0;
pij 0;

Se constat imediat c:

p =1
i iI

p
j I

ij

= 1 , () iI;

aceste probabiliti determin toate repartiiile finit dimensionale P( Xt ( ) = it ,0 t n) , nN i, prin urmare, determin probabilitatea P pe cmpul borelian K0 generat de lanul Markov considerat. n felul acesta, probabilitile iniiale (pi)iI i probabilitile de trecere (pij)i,jI formeaz o familie de cantiti determinate pentru un lan Markov. De aici urmeaz o alt definiie a unui lan Markov, i anume: un lan Markov este un proces aleator (Xn)nN cu variabilele aleatoare discrete pentru care exist o mulime de indici I, cel mult numrabil, un ir (pi)iI i o matrice (pij)i,jI verificnd condiiile : pi 0, i I , pi = 1; pij 0, i, j I ; pi j = 1
iI j I

n acest mod, probabilitile finit dimensionale sunt date de:

P( Xn( ) = in,..., X 0 = i0) = pio p( it 1, it )


t =1

Fie (Xn)nN un lan Markov omogen (cu probabiliti de trecere staionare).


Definiie. Vom spune c un lan Markov omogen este cu creteri independente dac

pij = qj-i, i,jI. Exemplu de lan Markov cu creteri independente: Fie irul de variabile aleatoare (Yn)nN definit n modul urmtor: Y0 = X0, Yn = Xn - Xn-1, n1. Fie I mulimea numrabil de numere de forma j-i, i,jI astfel nct pij>0. Atunci I este mulimea valorilor posibile corespunztoare irului (Yn)nN. Fie L mulimea valorilor lui Y0. Pentru orice n 1, i0L, j0J, 1 n, avem:
n n P( Yn = jn / Y = j ,0 n) = P Xn = js / X = js,0 n 1 = s= 0 s= 0 n n = P Xn = js / Xn 1 = s= 0 s= 0

js = qjn

Rezult c procesul (Yn)nN este un ir de variabile aleatoare independente, toate, exceptnd pe Y0, avnd o repartiie comun dat de (qj)jJ. Prin urmare, Xn = Y este suma a n+1 variabile aleatoare discrete, independente
=0
n

toate, afar de Y0, avnd aceeai repartiie. Reciproc, un astfel de proces (Yn)nN* este cu creteri independente. 5.3. Probabiliti de trecere dup n pai Introducem probabilitile de trecere dup n pai dintr-o stare i ntr-o stare j, pe care le ( vom nota pijn ) , nN. Pentru n = 0, punem, prin definiie: Pentru n = 1, punem
( pij1)

0, i j ( pij0 ) = ij = 1, i = j = pij , iar pentru nN arbirtar, punem:


( ( (1) (*) pijn +1) pikn ) p kj , k I

relaie care este valabil i pentru n = 0. S demonstrm urmtoarea propoziie.


( Propoziie. Pentru orice hN, are loc relaia Pik n ) = P( Xh + n = j / Xh = i) . Demonstraie. (1) Pentru n = 1 relaia se reduce la pik = P( Xh + 1 = j / Xh = i) , care este tocmai relaia de

definiie a probabilitilor de trecere. Presupunem relaia adevrat pentru s n i artm c rmne adevrat pentru s = n + 1, orice ar fi i,jI. Atunci: P( Xh + n + 1 = j, Xh + n = k , Xh = i) P( Xh + n + 1 = j / Xh = i) = P( Xh + n + 1 = j, Xh + n = k / Xh = i) = = P( Xh = i) k I k I
=
k I

P( Xh + n + 1 = j, Xh + n = k , Xh = i) P( Xh + n = k , Xh = i) = P( Xh + n + 1 = j / Xh + n = k , Xh = i) P( Xh = i) P( Xh + n = k , Xh = i) k I
k I

( ( ( P( Xh + n = k / Xh = i) = pikn) pkj1) = pijn+1) ,

deci, n baza induciei dup n, am demonstrat afirmaia.

n baza acestei propoziii este justificat denumirea de probabilitate de trecere din ( starea i n starea j dup n pai a expresiei pijn ) . Probabilitatea absolut a variabilei Xn este dat de :
p (j n ) = P ( Xn = j ) =
( Deci, p (j n ) = pi pijn ) . i I

P( X
i I

= i , Xn = j ) =

P( X
i I

( = i ) P ( Xn = j / X 0 = i ) = pi pijn ) i I

i Fie (Xn)n0 un lan Markov omogen cu repartiie iniial X 0: i I , pi = P(X0=i) pi , i i cu repartiia la pasul n, Xn: ( n ) i I , p i( n ) = P( Xn = i ) . pi ,

Definiie. Lanul Markov (Xn)n0 se numete staionar, dac p i( n ) = pi , nN, iI.


( Din p (j n ) = P( Xn = j ) = P( Xn = j , X 0 = i ) = P( X 0 = i)P( Xn = j / Xn = i) = pi pijn )
j I j I iI

rezult c, dac lanul este staionar, atunci:

p (j n ) = p j i, deci, p j = Pi Pij( n ) , () jI, nN.


iI

n particular, pentru n = 1 avem: p j = pi pij , () jI.


i I

Probabilitile de trecere dup n pai verific relaia general dat de propoziia de mai jos:
( ( ( Propoziie. Pentru orice n, mN, are loc relaia pijn + m ) = pikn ) p kjm ) . k I

Demonstraie. Facem inducie dup m. ( ( ( ( ( ( Pentru m = 0 relaia este: pijn + 0 ) = pijn ) = p ikn ) p kj0 ) = pikn ) kj = p ijn ) .
k I k I

Presupunem c relaia este adevrat pentru s m dat i orice nN, i,jI i s artm c este adevrat pentru s = m+1:

( ( ( ( ( ( ( ( ( ( ( pijn + m+1) = pikn+ m) p kj1) = piln ) plkm) p kj1) = piln ) plkm) p kj1) = piln ) pljm+1) l I kI l I k I kI l I
( ( ( Relaia demonstrat, pijn + m ) = pikn ) p kjm ) (**) k I

este cunoscut sub numele de relaia Chapman-Kolmogorov. Tot sub acelai nume este cunoscut i relaia ( ( ( (*) pijn +1) = pikn ) p kj1)
kI

Evident c relaia (**) este o generalizare a relaiei (*) i ea uureaz calculul ( probabilitilor pijn ) dac n este mare. Totodat ele sugereaz utilizarea matricilor n calculul
( probabilitilor de trecere dup n pai, pijn ) .

O matrice A = (aij)i,jN de ordin finit sau numrabil, ale crei elemente au proprietile aij 0, aij = 1 spunem c este o matrice stochastic. Dac A = (aij)i,jI i B = (bij)i,jI sunt
j I

matrici stochastice, atunci C = AB are sens, C = (cij)i,jI , cij = aikbkj , iar C este o matrice
j I

stochastic, deoarece cij 0 (evident) i

c = a b = a b = a
ij ik kj ik kj j I j I k I k I j I k I

ik

= 1.

Din rezultatele prezentate, urmeaz c matricea de trecere a unui lan Markov omogen este o matrice stochastic i reciproc, orice matrice stochastic este matricea de trecere a unui lan Markov omogen cu o repartiie dat. ( Relaia Chapman-Kolmogorov pune n eviden faptul c probabilitile pijn +1) sunt elementele matricii

( n +1)

n +1

. Matricea

(n)

= o vom numi matrice de trecere


n

dup n pai, care evident este puterea a n-a a matricii de trecere

( Probabilitile pijn ) , nN constituie un ir pentru fiecare i,jI i vom urmri s

studiem comportarea lor asimptomatic. n cele ce urmeaz vom presupune c I este o mulime finit.
Definiie. Un lan Markov se numete ergodic dac pentru orice pereche de stri i,jI exist ( limita p = lim p ijn ) independent de i i p (j ) = 1 . j
n

j I

Teorema ergodic ce urmeaz, precum i consecinele ei, se refer la comportarea ( asimptomatic a probabilitilor pijn ) .
( 5.4. Teorema ergodic. iruln )( pij ) nN converge ctre o limit p j , jI oricare ar fi iI, cnd

n, dac i numai dac exist un numr natural s >0 i o stare hI astfel nct: ( pihs ) >0, () i I. Demonstraie. ( Necesitatea: din p = lim p ijn ) rezult p (j ) = 1 i, deci, exist un hI astfel nct j
n

j I

p >0. Dar, din definiia lui p rezult p >0 oricare ar fi iI, dac s este suficient de mare.

( s) ih

Suficiena: pentru orice jI considerm irurile ( p (j n ) )nN i p


(n) j

( p ( n ) )nN , unde
j j

= sup p
iI

(n) ij

, p j = inf p
(n)

iI

(n) ij

i artm mai nti c ( p

(n) nN j

este necresctor, iar ( p ( n ) )nN

este nedescresctor. ( ( ( ( ntr-adevr, pijn +1) = pik1) p kjn ) p (j n ) pik1) = p (j n ) oricare ar fi i,jI i, deci,
kI kI
( sup pijn +1) = p (j n +1) p (j n ) , oricare ar fi nN; analog, p (jn +1) p (jn ) , oricare ar fi nN. i I

ns, 0 p ( n ) , p (j n ) 1, adic ( p (j n ) )nN i ( p ( n ) )nN sunt monotone i mrginite, deci j j convergente i fie
n i , l I

p , j

p j

limitele lor, respectiv. Dac reuim s artm c

( ( lim sup p ijn ) p ljn ) = 0 , rezult c p = p = p , jI. j j j

( ( S evalum maximul diferenei pijn ) pljn ) , i,j,lI. S presupunem c n > s. Atunci, pe


( ( ( baza relaiei lui Chapman-Kolmogorov, pijn ) = pirs ) prjn s ) , putem scrie: r I ( ( ( ( ( ( ( ( ( ( pijn ) pljn ) = pirs ) prjn s ) plrs ) prjn s ) = ( pirs ) plrn s ) ) prjn s ) = bil ( r ) prjn s ) r I r I r I r I

( unde am pus pi(rs ) p lrs ) = bil (r ) .

Fie acum

I+ = {rI / bil(r) > 0} I- = {rI / bil(r) 0} I+ I- = I

Cum

p
r I

( s) ir

( = p lrs ) = 1 , rezult c r I

b
r I
r I +

il

(r ) =

r I +

il

(r ) +

r I

il

( r ) = 0 i, de aici,

il =

il

(r ) =

r I

il

(r )

S artm c 0 il 1. S presupunem c indicele h care apare n enunul teoremei aparine lui I+. Atunci,

il =

rI

b
+

il

(r ) =

rI

p
+

( s) ir

rI

p
+

( s) lr

( pirs )

rI

r I

p
+

( s) lr

= 1

rI

p
+

( s) lr

1 p ( s ) . Deci,
h

( ( 0 il 1- phs ) < 1, deoarece p (hs ) = inf p ihs ) > 0 .


iI

n mod analog, pentru hI obinem aceeai evaluare. Fie acum = sup il . Deoarece I este o mulime finit, rezult 0 < 1. Atunci, pentru il >0
i ,l I

putem scrie:
( ( pijn ) pljn ) = r I +

il

( ( il max prjn s ) min prjn s ) il p (j n s ) p (jn s ) p (j n s ) p (jn s ) r I r I

( ( ( ( ( r ) prjn s ) bil ( r ) prjn s ) max prjn s ) bil ( r ) min prjn s ) bil ( r ) r I r I r I r I + r I

) (

) (

De aici urmeaz c obinem:

n p (j n ) p (jn ) p (j n s ) p (jn s ) . Aplicnd aceast relaie de ori, s


0 p
(n) j

pj
(n)

n s

n n n n s s n p s p s s , j j

( ( ntruct p (j n ) p ( n ) 1 . Atunci, sup pijn ) pljn ) = p (j n ) p (jn ) s . j i ,l I

Dac n rezult c i
lim p
n (n) ij

n s .

( ( Prin urmare, lim sup pijn ) pljn ) = 0 , adic n i ,l I

= p , jI, oricare ar fi iI.

Din cele de mai sus rezult:

p
j I

( = lim pijn ) = 1 . n j I

Din aceast teorem rezult acum unele consecine utile n aplicaii.


Consecin. Are loc relaia:

p
j I

m p (jk ) = p k , kI, mN.

Demonstraie. Dac n relaia Chapman-Kolmogorov,

p
r I

(n) ij

m ( p (jk ) = p ikm+ n ) , facem n, se obine

rezultatul menionat.
Consecin.

p > 0 , jI dac i numai dac ncepnd cu un s suficient de mare, elementele j


( s)

matricei

sunt toate strict pozitive.

1 , jI dac i numai dac m elementelor mulimii I.


Consecin. p = j Demonstraie. Din condiia dat rezult c

p
iI

ij

= 1 , oricare ar fi iI, m fiind numrul

p
i I

(n)
ij

= 1 , n > 1 i, deci, lim p (ijn ) = mp = 1 adic j


n i I

p = j

1 , jI (card I = m). m Reciproc, dac p = j 1 , jI atunci, n baza primei consecine, putem scrie m = p , din care rezult afirmaia. j

p
j I

( p ij1)

5.5. Exemple de lanuri Markov omogene.


Exemplu. S considerm r urne numerotate 1,2,,r care conin fiecare bile de r tipuri diferite, marcate de asemenea, 1,2,,r. Probabilitatea de a extrage o bil de tipul j din urna i este egal cu pij, i,j = 1,2,,r. La momentul iniial se alege o urn conform repartiiei de probabilitate (pi)1ir.

Din aceast urn se extrage o bil care se reintroduce apoi la loc. Dac bila extras a fost de tipul i, atunci extragerea urmtoare se va face din urna i .a.m.d. Este evident c irul tipurilor de bile extrase succesiv este un lan Markov cu mulimea strilor I = {1,2,,r}, probabilitile iniiale (pi)1ir i probabilitile de trecere (pij)1i, jr. Exemplu. Problema ruinrii juctorului. Dou persoane sunt angajate ntr-o serie de partide ale unui aceluiai joc, capitalurile lor iniiale fiind k i l-k uniti. Presupunem c la fiecare partid se pariaz pe o singur unitate de capital, c probabilitile de ctig al unei partide de ctre cei doi juctori sunt p i q = 1 - p i c rezultatele partidelor sunt independente. Repartizarea capitalului total l ntre cei doi juctori va evolua nencetat pn ce unul dintre ei va pierde ultima sa unitate de capital (se va ruina). Ne ntrebm care sunt probabilitile de ruinare a celor doi juctori. Evoluia capitalului primului juctor, de exemplu, poate fi reprezentat de un lan Markov avnd mulimea strilor I = {0,1,,l}, care pleac din starea k i cu matricea de trecere
0 1 1 0 q 0 2 0 p 0 0 0 3 ... l 2 l 1 l 0 0 0 0 0 0 0 0 p 0 0 0 q 0 0 0 0 0 p 1

0 1

2 0 q ... l 1 0 0 l 0 0

ntr-adevr, dac la un moment dat capitalul primului juctor este i uniti, i0,l, atunci, independent de evoluia anterioar a acestuia, la momentul urmtor, el poate avea i+l uniti sau i-l uniti cu probabilitile p, respectiv q. Dac i = 0 (ceea ce corespunde ruinrii primului juctor) sau i = l (ceea ce corespunde ruinrii adversarului su), toate tranziiile ulterioare (fictive din punct de vedere al problemei) nu pot schimba valoarea capitalului, adic p(0,0) = p(l,l) = 1. Strile 0 i l se numesc stri absorbante deoarece odat atinse ele nu mai pot fi prsite. Exemplu. Un model din teoria ateptrii. O staie de servire poate servi clienii la momentele 0,1,2,. Vom presupune c n intervalul de timp (n,n+1) sosesc Yn clieni, variabilele Y0,Y1,Y2, fiind presupuse independente i identic reaprtizate, cu repartiia iniial P(Y0 = k) = pk, k 0 i c exist loc de ateptare pentru cel mult m clinei, numr n care se include i clientul care este servit. Clienii care, ajungnd la staie, gsesc m clieni ateptnd, pleac (fr a fi servii) i nu se mai ntorc. S notm cu X(n) numrul clienilor prezeni la momentul n, numr n care se include i clientul care este n curs de servire. Vom arta c (X(n))n0 este un lan Markov cu strile 0,1,2,,m. Numrul clienilor prezeni la momentul n+1 este egal cu numrul clienilor prezeni la momentul n, mai puin cel servit la momentul n (dac acesta exist), plus numrul clienilor care sosesc n intervalul (n,n+1) dac rezultatul acestei nsumri nu depete m i este egal cu m n caz contrar. Prin urmare,

X(n) 1 + Yn , dac 1 X(n) m X(n + 1) = Yn , dac 0 Yn m + 1- X(n) sau X(n) = 0, 0 Yn m -1 m , n restul situaiilor
care mai poate fi scris X(n+1) = min {X(n) + (0,X(n)) - 1 + Yn, m},
1, dac X(n) = 0 unde ( 0, X ( n )) = 0, dac X(n) 0

Deoarece X(n+1) depinde numai de X(n) i Yn, iar din definiia variabilei Yn rezult c aceasta este independent de X(n), se observ c (X(n))n0 este un lan Markov. Se pune problema de a determina matricea de trecere a lanului Markov definit mai sus. Notnd P1 = pl + pl+1 + 1 l m, vom avea: dac 0 j m-1 dac j = m

p(0,j) = P(X(n+1) = j / X(n) = 0) = P(Yn = j / X(n) = 0) = pj, P(Yn m) = pm + pm+1 + = Pm , iar pentru 1 i m,

p (i, j ) = P ( X ( n + 1) = j / X ( n ) = i ) , dac i- j j m -1 P (Yn = j + 1 i ) = pj i + 1 P (Yn m + 1 i ) = Pm + 1 i , dac j= m 0 , n celelale cazuri t

Prin urmare, matricea de trecere este:


0 P0 P0 0 0 0 1 2 ... P1 P2 P1 P2 P0 0 0 P1 0 0 m 1 Pm 1 Pm 1 m Pm Pm

0 1 2 ... m 1 m

Pm 2 Pm 1 P1 P0 P2 P1

Exemplu. Aplicaie n gestiunea stocurilor cu cerere aleatoare. Un depozit care desface un anumit produs are capacitatea S = 5 uniti. Cererea sptmnal U din acel produs este aleatoare i are urmtoarea repartiie:
1 2 3 4 5 6 0 U: . 0.05 015 0.20 0.30 0.20 0.08 0.02

Presupunem c cererea dintr-o sptmn este independent de cea a celorlalte sptmni . S notm cu Yn cererea din sptmna a n-a. Depozitul folosete urmtoarea politic de tip (s,S): dac la sfritul unei sptmni cantitatea disponibil este de cel puin s, nu comand nimic, dar dac la sfritul sptmnii cantitatea disponibil este inferioar lui s, se lanseaz o comand suficient pentru ca stocul s fie adus la nivelul S. Cantitatea comandat este livrat imediat de un depozit central. Cheltuielile de stocare sunt de C1 lei pe unitatea de produs (se ia n considerare cantitatea existent n stoc la sfritul sptmnii). Dac o cerere nu poate fi satisfcut integral, se livreaz ntreaga cantitate existent n depozit i se pltesc C2 lei penalizri (valoarea penalizrii nu depinde de cererea rmas neacoperit). O cerere care nu poate fi satisfcut este anulat. Valoarea lui s poate fi de 2 sau 3 uniti. Care dintre aceste valori trebuie preferat dac C2 = 10C1 ? Soluie. Notm cu Xn cantitatea existent n depozit la sfritul sptmnii a n-a. S observm c Xn poate lua valorile 0 n dou situaii: fie cnd cererea este egal cu cantitatea existent n depozit (i n acest caz nu se pltesc penalizri, iar cheltuielile de stocare sunt nule), fie cnd cererea depete disponibilul (cheltuielile de stocare sunt nule, dar se pltesc penalizri). Pentru a face deosebire, n cea de-a doua situaie, vom atribui lui Xn o valoare special, s zicem , care se deosebete de starea Xn=0, prin faptul c implic penalizri. La nceputul sptmnii a (n+1)-a nivelul stocului este fie S, dac Xn<s (n particular dac Xn=0 sau Xn=), fie Xn dac Xns (n acest caz nu s-a lansat nici o comand depozitului central). Vom avea, deci

Xn Yn , dac Yn Xn i Xn s Xn + 1 = S Yn , dac Yn S i Xn < s , dac Yn > Xn s sau Yn > s


Rezult c (Xn)n0 formeaz un lan Markov cu probabilitile de trecere:
P(U = i - j) P(Xn + 1 = j / Xn = i ) = P(U > i) P(U = S - j) P(U > S) 0

, dac 0 j < i i i s , j = i i s , j S i i < s , dac j = i i < s , n rest

S analizm cazul s = 2, apoi cazul s = 3. Pentru s = 2 matricea probabilitilor de trecere va fi urmtoarea:


0 1 P( s= 2 ) 3 4 5

0 1 2 3 4 5 0,02 0,08 0,20 0,30 0,20 0,15 0,05 0,02 0,08 0,20 0,30 0,20 0,15 0,05 0,02 0,08 0,20 0,30 0,20 0,15 0,05 = 0,60 0,20 0,15 0,05 0 0 0 0,30 0,30 0,20 0,15 0,05 0 0 0,10 0,20 0,30 0,20 0,15 0,05 0 0,02 0,08 0,20 0,30 0,20 0,15 0,05

De exemplu, dac Xn = 2, nu se lanseaz nici o comand de aprovizionare, s fiind 2 i se vor plti penalizri ndat ce U ia o valoare mai mare ca 2:

P(U > 2) = P(U = k ) = 0,6 , deci, P2 = 0,60


k =3

Dac Xn = 1, atunci cantitatea n stoc la nceputul sptmnii a (n+1)-a este S = 5 i, deci, se vor plti penalizri numai dac U = 6; P1 = P(U=6) = 0,02. n mod analog se obin i celelalte probabiliti de trecere. Rezolvnd sistemul

vj =
jC

v p
j C j

i ij

= 1 (u = c )
i i

, jC={,0,1,2,3,4,5},

se obine: =19,00%; 0=14,58%; 1=19,80%, 2=21,70%, 3=13,23%, 4=8,87%, 5=2,81% Rezult c se vor plti penalizri, n medie n 19% din cazuri, iar cheltuielile medii de stocare vor fi: 5 kk C1 = (10,1980 + 20,2170 + 30,1323 + 40,0887 + 50,0281)C1 u.m. k =1 Cheltuielile medii totale vor fi (pentru s = 2): (s=2) = 0,19C2 + 1,5244C1 = (0,1910 + 1,5244)C1 = 3,4244C1 Refcnd calculele pentru s = 3, se obin: =7,64%; 0=13,08%; 1=21,13%, 2=26,33%, 3=16,90%, 4=11,33%, 5=3,58%. Cheltuielile medii de stocare vor fi, n acest caz, 5 kk C1 = (10,2113 + 20,2633 + 30,1690 + 40,1133 + 50,0358)C1 = 1,8771 C1. k =1 Cheltuielile medii totale vor fi:

(S=3) = 0,0764C2 + 1,8771C1 = (0,076Y10 + 1,8771)C1 = 2,6411C1 Comparnd (s=2) cu (s=3) constatm c este mai avantajos s se ia s=3 uniti disponibile la sfritul sptmnii. 5.6. Procese Markov ce depind de un parametru continuu Noiuni generale. n multe situaii concrete din tiinele naturii, ntlnim procese n care cunoaterea unei stri a sistemului la un moment t0 nu determin n mod min. strile sistemului n urmtoarele momente de timp, ci determin doar probabilitatea ca sistemul s ajung ntr-una din strile unei mulimi de stri ale sistemului. Dac notm cu xR starea sistemului la momentul t (unde t este un parametru continuu care are semnificaia de timp) i cu AR o mulime de stri ale sistemului, atunci pentru aceste procese X(t) este definit probabilitatea de trecere p(t,x;,A) ca sistemul s treac ntr-o stare din mulimea A la momentul > t dup ce s-a aflat la momentul t n starea x. Dac cunoaterea strilor sistemului pentru momentul t > nu modific aceste probabiliti, vom numi aceste procese - procese fr postaciune sau, prin analogie cu cele n timp discret, procese de tip Markov. Probabilitatea de trecere p(t,x;,A) i o probabilitate iniial P(A) caracterizeaz complet aceste procese de tip Markov. n cazul n care n probabilitatea de trecere p(t,x,,A) mulimea AR este de forma (-,y), obinem repartiii de trecere F(t,x,,y) = P(X() < y / X(t) = x). Cu alte cuvinte, repartiia de trecere F(t,x,,y) reprezint probabilitatea ca la momentul procesul aleator corespunztor s ia o valoare mai mic dect y, tiind c la momentul t (cu t < ) a avut loc egalitatea X(t) = x. Vom presupune c funcia F(t,x,,y) definit pentru > t se bucur de proprietile: (i) este o funcie de repartiie n raport cu y (ii) este continu n raport cu t i (iii) este integrabil n raport cu x (iv) au loc egalitile:

1 , dac x = y lim F ( t , x; , y ) = lim F ( t , x; , y ) = ( x, y ) = t+0 t 0 0 , dac x y

Toate aceste condiii puse funciei de repartiie de trecere F(t,x;,y) se transcriu imediat pentru probabilitatea de trecere p(t,x;,A). S considerm acum o mulime AK i o variabil aleatoare cu funcia de repartiie G(z) = P(Y < z). tim atunci c are loc relaia: P ( A) = P ( A / Y ( ) = z ) dG ( z ) .
R

Dac BK, atunci (1) P ( A / B ) = P ( A / B {Y ( ) = z}) dGB ( z ) , unde GB(z) = P(Y < z / B)
R

innd seama de aceste relaii, s lum acum momentele de timp t, s, ; t < s < i s punem: A = {X(t) < y}, B = {X(t) = x}; Y() = X(s,)

Aplicnd relaia (1), obinem:

P( X ( ) < y / X ( t ) = x ) = P( X ( ) < y / X ( t ) = x, ) X ( s) = z )dzP( X ( s ) < z / X ( t ) = x )


R

Lund n consideraie faptul c procesul este de tip Markov, atunci: P(X() < y / X(t) = x, X(s) = z) = P(X() < y / X(s) = z) = F(s,z; ,y) Deci, relaia (1) devine: (2) F(t,x; ,y) =

F ( s, z; , y )dzF ( t , x; s, z )
R

Aceast relaie constituie generalizarea natural a relaiei lui Chapman - Kolmogorov, deoarece reprezint extensiunea relaiei stabilit pentru procesele de tip Markov. Dac exist o densitate de trecere f(t,x; ,y)=
y

F ( t , x; , y ) atunci: y

F(t,x; ,y) =

f ( t , x; , z )dz; f ( t , x; , z )dz = 1
R

i relaia Chapman-Kolmogorov devine: (3) f(t,x; ,y) =

f ( s, z; , y)dz f (t , x; s, z)dz
R

Dac procesul este staionar, atunci funcia de repartiie de trecere depinde numai de intervalul de timp scurs: F(t,x; ,y) = G(-t,x,y) iar relaiile (2) i (3) devin: G(t1+t2; x,y) = g(t1+t2;x,y) =

G(t ; z, y )dzG( t ; x, z )
1 2 R

g(t ; z, y ) g(t ; x, z )dz


1 2 R

Definiie. Spunem c procesul X(t) este aditiv (sau cu creteri independente) dac F(t,x; ,y) depinde de t i x-y.

5.7. Procese Poisson Cel mai simplu caz de proces Markov l constituie procesul Poisson. S considerm un proces Markov {X(t)} omogen i aditiv i s presupunem c diferena Xt - Xs este un ntreg nenegativ pentru orice valori s < t i, n plus, c

P( X t + t X t > 1) =0 t 0 P( X t + t X t = 1) lim

Prin definiie, un proces {X(t)} cu proprietile menionate se numete proces Poisson omogen. Dac notm P(Xt -Xs = n) = Pn(t - s), atunci are loc urmtoarea teorem. Teorem. Dac {X(t)} este un proces Poisson omogen, atunci exist o constant >0 astfel n t ( t ) , n = 0,1,2, nct Pn( t ) = e n!
Demonstraie. Din proprietatea de aditivitate a procesului rezult c variabilele X+t - X i X+t+s - X+t sunt independente dac t,s > 0 (t+s>t) i, deci,

P(X+t+s - X= 0) = P (X+t+s - X+t + Xt+ - X = 0) = P(X+t+s - X+t = 0, X+t - X = 0) = = P(X+t+s - X+t = 0) P(X+t - X = 0), sau, altfel scris, P0(t+s) = P0(s) P0(t) Dac lum s = t, atunci P0(t+t) = P0(t) P0(t)

Scznd din ambii membri P0(t) i mprind cu t, obinem: P0 ( t + t ) P0 ( t ) 1 P0 ( t ) P ( 0) P0 ( t ) = P0 ( t ) 0 = P0 ( t ) t t t Trecnd la limit pentru t 0, se obine: P0(t) = -P0(t) P0(0) Fie P0(0) = > 0. Atunci, integrnd ecuaia P0(t) = - P0(t), se obine P0(t) = ce- t, iar din P0(0) = 1 rezult c = 1, adic P0(t) = e- t. Pentru determinarea probabiltii Pk(t), k = 1,2, s exprimm Pk(t+ t ). Dac n intervalul (0,t+ t ) s-au produs i schimbri de stare, acestea s-au produs n felul urmtor: (i) n intervalul (0,t) s-au produs k schimbri, iar n intervalul (t,t+ t ) nici una; (ii) n intervalul (0,t) s-au produs k-1 schimbri, iar n intervalul (t,t+ t ) una singur; (iii) n intervalul (0,t) s-au produs cel mult k-2 schimbri, iar n intervalul (t,t+ t ) cel puin dou. Evenimentele menionate fiind independente, obinem: Pk(t+ t )=Pk(t) P0( t )+Pk-1(t) P1( t )+R, unde R = Pk-2(t) P2( t )+Pk-3(t) P3( t )+ Pk ( t ) . Scznd din ambii membri Pk(t) i mprind cu t obinem:
k =2

(1)

Pk (t + t ) Pk (t ) [1 P0 ( t )] P1 ( t ) R = P k (t ) + Pk 1 (t ) + t t t t ( t ) 1 e t 1 P0 = t 0 t t P1 ( t ) P1 ( t ) 1 P0 ( t ) = 1 t 0 t t 1 P0 ( t )

R = 0 , atunci membrul doi are o limit finit, deci i membrul t dPk ( t ) R nti, care va fi = Pk '( t ) . Pentru a arta c lim = 0 este suficient s artm c t 0 t dt Dac artm c lim
t 0

1 P ( t ) P ( t ) 1 lim Pk (t ) = t 0 0 t 1 = 0 t 0 t k=2 lim


ns

1 P0 ( t ) P ( t ) 1 P0 ( t ) P1 ( t ) P1 ( t ) 1 P0 ( t ) 1 = t P1 ( t ) 1 P0 ( t ) t P( X t + t X t > 1) 1 P0 ( t ) P1 ( t ) = 0. = 0 este echivalent cu lim t 0 P( X t 0 P ( t ) 1 t + t X t = 1)


P0(t) = e-t , avem
P1 ( t ) = 1 i t 0 1 P ( t ) 0 lim

Condiia lim

Pe de alt parte, innd seama c

Pk ( t ) 1 P0 ( t ) k =2 = 0. = . Deci, lim lim t 0 t 0 t t


n plus, deoarece Pk(0) = 0, rezult lim Pk ( t ) Pk ( 0) = Pk '( 0) = 0 , k = 2,3,. t 0 t

innd seama de rezultatele obinute anterior, rezult c, dac n relaia (1) facem pe t0, se obine: (2) Pk(t) = -Pk(t) + Pk-1(t), k=1,2,3, Pentru integrarea acestui sistem de ecuaii difereniale, introducem o funcie auxiliar: Lk(t) = Pk(t)et, k = 0,1,2, Urmeaz c: Pk(t) = Lk(t)e-t i Pk(t) = Lk(t)e-t-Lk(t)e-t nlocuind n sistemul (2), obinem: Lk(t)e-t-Lk(t)e-t = -Lk(t)e-t + Lk-1(t)e-t, adic Lk(t) = Lk-1(t), k = 1,2,3,

Cum P0(t) = e-t, rezult L0(t) = 1 i L1 (t ) = L0 ( u)du = t


0 t

( t ) 2 L2 (t ) = L1 ( u)du = 2! 0
t

... ( t ) k Lk (t ) = Lk 1 ( u)du = , k! 0 care, prin inducie, se dovedete adevrat pentru orice kN. ( t ) k t nlocuind Lk(t) se obine Pk ( t ) = e , k = 0,1,2,3,, ceea ce era de k! demonstrat.
t

Proprieti ale proceselor Poisson Se obine imediat c: ntr-adevr,

P (t ) = 1.
k =0 k

P (t ) = e
k =0 k

( t ) k k ! = et et = 1 k =0

Propoziie. Dac {Xt} este un proces Poisson omogen i aditiv, atunci

M ( X t ) = t , D 2 ( X t ) = t , X t , X t + s =

1 1+ s t

Demonstraie.
( t ) k ( t ) k 1 t M ( X t ) = kPk ( t ) = e k = te = te t e t = t k! k =0 k =0 k =1 ( k 1)! k 1 ( t ) ( t ) k 1 M 2 ( X t ) = k 2 Pk (t ) = te t k = te t [( k 1) + 1] = ( k 1)! ( k 1)! k =0 k =1 k =1 t
(t ) k 2 ( t ) k 1 t t 2 t = te t t + = te [ te + e ] = (t ) + t k = 2 ( k 2)! k =1 ( k 1)! De aici rezult: D2(Xt) = t. S calculm cov (Xt,Xt+s) = M(Xt Xt+s) - M(Xt) M(Xt+s)

M(Xt Xt+s) = M(Xt Xt+s - Xt2+Xt2) = M(Xt2) + M[Xt(Xt+s - Xt)] = (t)2 + t + M(Xt)M(Xt+s - Xt) = (t)2 + t + t s Urmeaz c:

X ,X
t

t+s

M ( X t X t+s ) M ( X t ) M ( X t +s ) D ( X t )D ( X t+s )
2 2

(t ) 2 + t + 2 ts t (t + s)

t ( t + s)

t t ( t + s)
2

1 1+ s t

Teorem. Dac {Xt}, {Yt} sunt dou procese Poisson omogene independente cu parametrii respectiv , atunci {Xt+Yt} este tot un proces Poisson omogen, cu parametrul +. Demonstraie. S notm Zt = Xt + Yt. Atunci,

P( Z n+ t Z n = n) = P ( X n+ t + Yn+ t X n Yn = n) = P( X n+ t X n = k , Yn+ t Yn = n k ) =
k =0

= P ( X n+ t X n = k ) P(Yn+ t Yn = n k ) = Pk (t ) Pn k (t ) = e
k =0 k =0 k =0

(t ) k t ( t ) n k e = k! ( n k )!

= e ( + )t

( + )t [ ( + )t ] 1 n n! , (t ) k ( t ) n k = e k !( n k )! n! n! k =0 n

ceea ce dovedete faptul c {Zt} este un proces Poisson, omogen.


Teorem. Fie {Xt} un proces Poisson omogen i (n)nN irul momentelor de producere a evenimentelor aleatoare. Atunci, (n+1-n)n0, 0=0 sunt variabile aleatoare independente, identic repartizate, cu funcia de repartiie
0 F( X ) = x 1 e ,x 0 ,x > 0

Demonstraie. {Xt} este un proces Markov aditiv, deci n+1-n, n = 0,1,2, sunt variabile aleatoare independente. Atunci, P(n+1-n < x / n = y) = P(Xy+n - Xy > 0) = 1- P0(x) = 1-e-x, dac x > 0 (independent de y). Deci, P(n+1-n < x / n = y) = P(n+1-n < x) = F(x) = 1- e-x

Urmeaz c densitatea de repartiie corespunztoare este:


0 f ( x ) = x e ,x 0 ,x > 0

iar M(n+1-n) = xe x dx =
0

Observaie. Se constat c dac numrul de evenimente ce apar n intervalul de timp (0,t) este un proces Poisson omogen, adic ( t ) n n = 0,1,2, , P( X t X 0 = n ) = e t n!

atunci intervalul de timp dintre dou momente succesive de apariie a evenimentelor, este o variabil aleatoare repartizat exponenial negativ de parametru . Procesele Poisson intervin n diverse aplicaii i ndeosebi n teoria firelor de ateptare sau n sigurana de funcionare a unor sisteme complexe. Ca aplicaii s considerm procesul de natere i de moarte. S presupunem c la momentul t sistemul se afl n starea En. Probabilitatea de trecere din starea En n starea En+1, n intervalul de timp (t, t+t) este egal cu nt + O(t), iar probabilitatea de trecere n starea En-1 n acelai interval de timp este egal cu nt + O(t). Probabilitatea ca n intervalul de timp (t,t+t) s nu avem nici o modificare de stare (adic procesul rmne n starea En) este 1 - (n + n) t + O(t), iar probabilitatea de trecere din starea En ntr-o stare En+1 sau En-1 cu i > 1 este O(t), unde am notat prin O(t) o funcie O( t ) cu proprietatea c lim . t 0 t Atunci, Pn(t+ t ) = n-1Pn-1(t) t + [1-(n + n) t ] Pn(t) + n+1Pn+1(t) t +O( t ) Trecnd Pn(t) n membrul nti, mprind cu t i trecnd la limit pentru t 0, deoarece membrul doi are limit finit, rezult c i membrul nti are limit i obinem:
dPn (t ) = n1 Pn1 (t ) ( n + n ) Pn (t ) + n+1 Pn+1 (t ), n = 1,2,3, ... dt dP0 (t) = 0 P0 (t ) + 1 P1 ( t ) , dt

care se obine n acelai mod. Acest sistem de ecuaii sunt ecuaiile difereniale ale procesului, care, integrate, ne conduc la probabilitile strilor Pn(t), n = 0,1,2,. S obinem de aici unele cazuri particulare. 1. n cazul n care n = 0, n = 1,2, sistemul de ecuaii difereniale devine:

dPn (t ) = n1 Pn1 (t ) n Pn (t ), n = 1,2,... dt dP0 (t) = 0 P0 (t ) , dt care sunt ecuaiile difereniale ale procesului simplu de natere. 2. Dac x = 0, sistemul de ecuaii difereniale devine: dPn (t ) = n Pn (t ) + n+1 Pn+1 (t ), n = 1,2,... dt dP0 (t) = 0 P0 (t ) + 1 P1 (t ) , dt care constituie ecuaiile difereniale ale procesului simplu de moarte. S studiem separat procesul simplu de natere, procesul simplu de moarte, apoi s determinm soluia n cazul general al unui proces de natere i de moarte, n ipoteza c acestea sunt liniare.

Procesul simplu de nastere Am vzut c sistemul de ecuaii difereniale ale probabilitilor strilor este:
dPn ( t ) = n 1 Pn 1 ( t ) n Pn ( t ), n = 1,2,... 1 i = n dt unde Pn ( 0) = in = dP0 (t) 0 i n = 0 P0 ( t ) dt

Vom spune c procesul simplu de natere este liniar dac n = n, > 0, iar n acest caz sistemul de ecuaii difereniale devine: dPn ( t ) = n Pn ( t ) + n 1 Pn 1 ( t ), n 1 dt Pentru n = 1, obinem: dP1 (t) = P ( t ) 1 dt i, de aici, P0(t) = c1e-t. Cum P1(0) = 1, rezult c1 = 1. Considernd acum ecuaia P(n) = -nPn(t) + (n-1)Pn-1(t) i notnd Ln(t) = Pn(t)etn , ecuaia diferenial devine: Ln(t)e-tn - nLn(t)e-tn = -nLn(t)e-tn + (n-1)Ln-1(t)e-t(n-1) sau Ln(t) = (n-1)Ln-1(t)et ns L1(t) = P1(t)et = 1 i, deci, L2 (t ) = e u P ( u)du = e udu = e t 1 1
0 t 0 t t t

1 1 2 L3 (t ) = 2 e P2 ( u)du = 2 e u ( e u 1) du = 2 ( e 2 t 1) ( e t 1) = ( e t 1) 2 0 0
u

n general, Ln(t) = (et-1)n-1, de unde urmeaz c Pn(t) = e-t(1-e-t)n-1, n = 1,2,3,. S artm c

P (t ) = 1 .
n =1 n

ntr-adevr,

e (1 e )
t n =1

t n 1

=e

(1 e )
n =1

t n 1

= 1.

Putem acum calcula media i dispersia procesului: M ( X t ) = nPn ( t ) = e t n(1 e t )


n =1 n =1 n 1

Dac notm 1- e t = z, atunci

M ( Xt ) = e

nz
n =1

n1

= e t

d 1 t =e dz 1 z
t

M 2 ( X t ) = n Pn ( t ) = e
2 n =1

n
n =1
n 1

n 1 2

Cum

n
n =1

n 1

= n( n 1 + 1)z
n =1

n 1

= n( n 1)z
n= 2

n 1

+ nz
n =1

d2 =z 2 dt

1 d 1 + = 1 z dz 1 z

2z 1 1+ z 3 + 2 = (1 z ) (1 z ) (1 z ) 3

Deci, M 2 ( X t ) = e t

e t
e
3t

= e 2 t ( 2 e t )

Mai departe, urmeaz c:

D 2 ( X t ) = M 2 ( X t ) M 2 ( X t ) = e 2t ( 2 e t ) e 2t = e t ( e t 1)
Procesul simplu de moarte Sistemul de ecuaii difereniale ale probabilitilor strilor corespunztoare acestui proces este dat de: dPn ( t ) = n Pn ( t ) + n +1 Pn +1 ( t ), n = 0,1,2,... dt Procesul simplu de moarte este liniar dac n = n, > 0. n acest caz, obinem: dPn ( t ) = nPn ( t ) + ( n + 1) Pn +1 ( t ) dt Dac presupunem c la momentul t = 0 sistemul se afl n starea E n0 , cu n0 1, atunci condiiile iniiale ale sistemului de ecuaii difereniale sunt date de:
1 n = n 0 Pn ( 0) = n0 n = 0 n n 0

S obinem soluia sistemului de ecuaii pentru procesul de moarte liniar. dPn0 ( t ) Se observ c pentru n = n0 avem Pn0 +1 (t) = 0 i, deci, = n 0 Pn0 ( t ) , de unde rezult: dt Pn0 ( t ) = e n0 t Dac n = n0 - 1, obinem
dPn0 1 ( t ) dt = ( n 0 1) Pn0 1 ( t ) + n 0 Pn0 ( t )

sau, dac nlocuim Pn0 ( t ) :


dPn0 1 ( t ) dt = ( n 0 1) Pn0 1 ( t ) + n 0 e n0t ,

care este o ecuaie liniar de ordinul nti. Ecuaia omogen are soluia Pn0 1 ( t ) = ce ( n0 1) t constantelor,

i,

aplicnd

metoda

variaiei

P' n01 (t ) = c' e ( n0 1) t ( n0 1)ce ( n0 1) t ,

care, nlocuit n ecuaie ne conduce la c' e ( n0 1) t = n0e n0t c' = n0e t , de unde rezult:
c = n 0 e u du = n 0 (1 e t )
0

Prin urmare,

Pn0 1 (t ) = n0e n0t (e t 1) i, n general, rezolvnd din aproape n aproape,


n Pn ( t ) = Cn0 e n0t ( e t 1) n0 n , 0 n < n0

Aplicnd acum definiiile valorilor caracteristice numerice ale procesului, se obine: M(Xt) = n0e-t, D2(Xt) = n0e-t(1-e-t) 5.8. Procesul de natere i moarte Am vzut c ecuaiile difereniale ale procesului sunt:
dPn ( t ) = n 1 Pn 1 ( t ) ( n + n )Pn ( t ) + n +1 Pn +1 ( t ), n = 1,2,3,... dt dP0 (t) = 0 P0 ( t ) + 1 P ( t ) 1 dt

Procesul este liniar dac n = n; n = n, iar starea En pentru n = 0 este o stare de absorbie. n cazul procesului liniar, avem de rezolvat sistemul:
dPn ( t ) = ( n 1) Pn 1 ( t ) ( n + n ) Pn ( t ) + ( n + 1) Pn +1 ( t ), n = 1,2,3,... dt dP0 (t) = P1 ( t ) dt

Urmeaz c 0 = 0 = 0, iar pentru t = 0 i n = n0 condiiile iniiale devin:

1 n = n 0 Pn ( 0) = n0 n = 0 n n 0

Pentru a afla soluia sistemului de ecuaii difereniale menionat, vom utiliza funcia generatoare G( t , ) = Pn ( t ) n . n urma unor calcule relativ simple, sistemul de ecuaii
n= 0

devine:

G ( t , ) G( t , ) = ( 1)( ) t t
Soluia acestei ecuaii cu derivate pariale este dat de:

+ (1 )e ( ) t G ( t , ) = ( )t + (1 )e
Dac se noteaz u( t ) = sub forma: 1 e( )t ; e ( ) t v( t ) =

n0

u( t ) , funcia generatoare poate fi scris


n

u( t ) + (1 u( t ) v( t )) 0 G( t , ) = ; 1 v( t )

coeficientul lui n din funcie ne d:


Pn ( t ) =
min( n0 , n ) j=0

j n0

n Cn0+jn j 1 ( u( t )) n0 j ( v ( t )) n0 j [1 u( t ) v ( t )]

Cunoscnd funcia generatoare, momentele se pot calcula uor i se obine:


n 0 e ( ) t M( Xt ) = n0 , , = + ( )t ( )t n 1) , (e e D ( Xt ) = 0 , = 2 t
2

0 Din expresia valorii medii a procesului rezult imediat c lim M ( X t ) = n 0 t

, > , = , <

Interpretarea acestui rezultat este simpl, i anume: dac rata deceselor este mai mare dect rata naterilor, atunci populaia se stinge; dac rata deceselor este egal cu rata naterilor, numrul mediu de indivizi din populaie ar trebui s rmn neschimbat i, n fine, dac < populaia crete nelimitat. S artm cum putem obine din procesul de natere i moarte principalele modele de ateptare cu veniri poissoniene i timp de servire exponenial. Pentru aceasta, s considerm sistemul de ecuaii difereniale ale unui proces de natere i moarte:

dPn ( t ) dt = n 1 Pn 1 ( t ) ( n + n ) Pn ( t ) + n +1 Pn +1 ( t ), n = 1,2,3,... dP0 (t) = P ( t ) + P ( t ) 0 0 1 1 dt Dac n = , n = , oricare ar fi nN, atunci se obin ecuaiile unui model de ateptare cu o staie, veniri poissoniene i timp de servire exponenial: dPn ( t ) dt = Pn 1 ( t ) ( + ) Pn ( t ) + Pn +1 ( t ), n = 1,2,3,... dP0 (t) = P ( t ) + P ( t ) 0 1 dt Dac se menin condiiile n = , n = , oricare ar fi nN i 0 n N, adic Pn(t) = 0, n = N+1, , atunci se obin ecuaiile unui model de ateptare cu o staie, veniri poissoniene, timp de servire exponenial i fir de ateptare limitat:
dP0 (t) dt = P0 ( t ) + P1 ( t ) dPn ( t ) = Pn 1 ( t ) ( + ) Pn ( t ) + Pn +1 ( t ), n = 1,2,3,...N -1 dt dPN (t) dt = PN 1 ( t ) PN ( t )

Dac se consider n = (m-n), n = , n = 0,1,2,,m; Pn(t) = 0, n = m+1,m+2, , se obin ecuaiile sistemului de ateptare cu o staie, veniri poissoniene, timp de servire exponenial, populaie finit:
dP0 (t) dt = mP0 ( t ) + P1 ( t ) dPn ( t ) = [m ( n 1)]Pn 1 ( t ) [( m n ) + ]Pn ( t ) + Pn +1 ( t ), n = 1,2,3,..., m -1 dt dPm (t) dt = Pm1 ( t ) Pm ( t ) n ,1 n s 1 Dac se consider n = , nN, n = , se obin ecuaiile sistemului ,n s s

de ateptare cu s staii, veniri poissoniene, timp de servire exponenial pentru fiecare staie (staii identice), populaie infinit:
dP0 (t) dt = P0 ( t ) + P1 ( t ) dPn ( t ) = Pn 1 ( t ) ( + n ) Pn ( t ) + ( n + 1)Pn +1 ( t ), n = 1,2,3,...,s -1 dt dPn (t) dt = Pn 1 ( t ) ( + s ) Pn ( t ) + sPn +1 ( t )

n ,1 n s 1 Dac se consider n = , nN, n = i, evident, Pm+1(t) = ,n s s = Pm+2(t) = = 0, se obin ecuaiile sistemului de ateptare cu s staii, veniri poissoniene, timp de servire exponenial pentru fiecare staie, fir de ateptare limitat:
dP0 (t) dt = P0 ( t ) + P1 ( t ) dPn ( t ) = P ( t ) ( + n ) P ( t ) + ( n + 1)P ( t ), n = 1,2,3,...,s -1 n 1 n n +1 dt dPn (t) = P ( t ) ( + s ) P ( t ) + sP ( t ), n = s,s + 1,..., m -1 n 1 n n +1 dt dP (t) n = Pm1 ( t ) sPm ( t ) dt

n ,1 n s 1 i, evident, Pm+1(t) = Dac se consider n = (m-n), n = s , s n m = Pm+2(t) = = 0, se obin ecuaiile sistemului de ateptare cu s staii, veniri poissoniene, timp de servire exponenial pentru fiecare staie, populaie finit:
dP0 (t) dt = mP0 ( t ) + P1 ( t ) dPn ( t ) = [m ( n 1)]P ( t ) [( m n ) + n ]P ( t ) + ( n + 1)P ( t ), n = 1,2,3,..., s -1 n 1 n n +1 dt dPn ( t ) = [m ( n 1)]P ( t ) [( m n ) + s ]P ( t ) + sP ( t ), n = s, s + 1,..., m -1 n 1 n n +1 dt dP (t) m = Pm1 ( t ) sPm ( t ) dt

Capitolul 6 ELEMENTE DE TEORIA INFORMAIEI

6.1. Informaia; cantitatea de informaie Comunicrile sau mesajele pe care le ntlnim n teoria informaiei sunt constituite dintr-o mulime de date referitoare la un anumit sistem fizic. Aa, de exemplu, ca date de intrare ntr-un sistem de comand automat a unei secii dintr-o ntreprindere industrial pot servi comunicri relative la mrimea procentului de rebut a produselor fabricate, compoziia chimic a unui material, temperatura ntr-un cuptor de tratament termic etc. Toate aceste comunicri descriu starea unui sistem fizic, iar cunoaterea strii sistemului fizic conduce la faptul c transmiterea de informaie este inutil. Aadar, orice comunicare nu are sens dac starea sistemului este dinainte cunoscut. Noiunea de informaie, n teoria informaiei, nu se definete. Pentru construirea acestei teorii este necesar i suficient numai noiunea de cantitate de informaie. Vom conveni, deci, c o informaie transmis se refer la un anumit sistem fizic, A, sistem care se poate afla ocazional ntr-o stare anumit, ceea ce nseamn c sistemul este caracterizat printr-un anumit grad de nedeterminare. n conformitate cu definiia obiectului teoriei informaiei n accepiunea actual, msura cantitii de informaie trebuie s fie util pentru analiza i sinteza sistemului de transmitere, precum i de pstrare a informaiei. Cantitatea de informaie trebuie definit prin ceva general, care s reflecte obiectiv diferitele aspecte ale comunicrilor, pstrnd armonia cu reprezentrile intuitive legate de obinerea de informaii. Aceasta scoate n relief faptul c obinerea unei informaii arbitrare are loc n prezena unui experiment. Orice informaie dobndit de noi este rezultatul unui experiment i numai al unui experiment. Drept experiment poate fi, de exemplu, considerat o transmisie radio, o transmisie prin semnale optice, variaiile unui parametru al unui proces dat, msurile efectuate cu anumite aparate etc. nainte de efectuarea experimentului, trebuie s existe o anumit nedeterminare asupra rezutatelor posibile ale acestui experiment. Informaiile ce le obinem vor fi cu att mai importante cu ct gradul de nedeterminare naintea recepionrii lor (adic gradul de nedeterminare apriori) este mai mare. Astfel, pn la efectuarea experimentului avem o nedeterminae mai mic sau mai mare n sistemul fizic ce ne intereseaz, iar dup efectuarea experimentului (deci dup ce s-a obinut informaia) sistemul devine mai determinat i la ntrebarea pus referitor la starea sistmului putem rspunde sau c starea este unic, sau c s-a micorat gradul de nedeterminare. Cantitatea cu care s-a micorat gradul de nedeterminare dup experiment este egal cu cantitatea de informaie ce ne-a dezvluit-o rezultatul experimentului. Pentru a stabili o relaie cu ajutorul creia s calculm cantitatea de informaie este necesar s stabilim o relaie care s exprime gradul de nedeterminare al experimentului. Diferena dintre aceste cantiti de nedeterminare d cantitatea de informaie ce se obine n urma unui experiment dat. Pentru aceasta, vom presupune mai nti c dup un experiment nu mai exist nici o nedeterminare.

Aa, de exemplu, dac considerm aruncarea cu un ban, avem experimentul A cu dou rezultate posibile A1 i A2. A1 A2 1 A: 1 2 2

Fiecare rezultat poate s apar cu aceeai probabilitate P( A1 ) =

1 1 , P( A2 ) = . 2 2 Dup aruncarea monedei (deci dup efectuarea expeimentului) nu mai avem nici o nedeterminare i ca atare nedeterminarea existent pn la efectuarea experimentului, numeric va fi egal cu cantitatea de informaie obinut. De aici rezult c gradul de nedeterminare pn la efectuarea experimentului (sau cantitatea de informaie), satisface urmtoarele cerine intuitive: 1. Cantitatea de informaie obinut n urma efecturii a dou experimente este mai mare la experimentul care are mai multe rezultate posibile. Dac notm cu I cantitatea de informaie i cu n numrul rezultatelor, atunci aceast cerin se exprim astfel: I(n1) I(n2), dac n1 n2

2. Experimentul cu un singur rezultat posibil conduce n mod necesar la o cantitate de informaie egal cu zero, adic: I(1) = 0 3. Cantitatea de informaie obinut din dou experimente independente trebuie s fie egal cu suma cantitilor de informaie a celor dou experimente. Aa, de exemplu, dac ne referim la cantitatea de informaie coninut n dou cri diferite n ceea ce privete coninutul, aceasta este egal cu suma cantitilor de informaie din fiecare carte. (Dac cele dou cri au o parte comun de coninut, aceast proprietate nu mai rmne adevrat; cantitatea de informaie va fi mai mic dect suma celor dou cantiti). n form analitic, aceast proprietate se exprim cu relaia: I(n1,n2) = I(n1) + I(n2) Evident, singura funcie de argument n care satisface aceste proprieti este funcia logaritm i de aici rezult c dup efectuarea unui experiment care are n rezultate, n urma cruia nedeterminarea a fost nlturat, obinem cantitatea de informaie: I = c logan, unde c i a sunt constante arbitrare. Desigur, aici am persupus c nu facem distincie ntre rezultatele ce apar cu probabiliti mici i cele ce apar cu probabiliti mari, ci numai c rezultatele se consider egal probabile, adic fiecare din cele n rezultate A1, , An are aceeai probabilitate 1 P( Ai ) = p = n innd cont de acest lucru, putem scrie expresia I sub forma:
I = -c logap;

alegerea constantei c i a bazei logaritmului nu este esenial, deoarece, lund n considerare indentitatea
logbn = logba logan,

rezult c trecerea de la o baz la alta a logaritmului revine la nmulirea cu o constant sau, ceea ce este echivalent, cu trecerea la o alt scar pentru cantitatea de informaie I. Pentru simplificare, vom considera c c = 1 i a = 2; n acest caz,
I = -log2p = log2n,

lucru foarte comun n teoria informaiei. De aici rezult o proprietate important, i anume c 1 unitatea de informaie corespunde cazului cnd p = . 2 Utiliznd baza 2 pentru logaritm, cantitatea de informaie se spune c este exprimat n cifre binare (binary digits) sau, pe scurt, n bii. Adesea, se utilizeaz ca baz pentru logaritm i numrul e, caz n care unitatea de informaie este nitul. n baza egalitii: 1 , log e 2 = 0,693 = 1,443 avem urmtoarele relaii ntre unitile de msur introduse mai sus:
1 bit = 0,693 nit; 1 nit = 1,443 bit

S vedem acum ce se ntmpl atunci cnd rezultatele experimentului nu mai apar cu probabiliti egale. Fie, pentru aceasta, experimentul A cu rezultatele A1,,An i cu P(Ai) = pi, adic:

A1 A: p1

A2 ... An p 2 ... p n

Cantitatea de informaie a unei comunicri care precizeaz faptul c a aprut rezultatul Ai este egal cu log pi = I Ai . Dar aceast cantitate apare cu probabilitatea pi i am ajuns astfel la variabile aleatoare

( )

I ( A1 ) I ( A2 )... I ( An ) X: p 2 ... pn p1 Pentru a nu lua n considerare o msur aleatoare a cantitii de informaie, vom lua media acestei variabile i obinem:

M ( X ) = I ( Ai ) p i = pi log p i
i =1 i =1

Aceast relaie exprim cantitatea medie de informaie (sau nedeterminarea medie pn la efectuarea experimentului) a unui rezultat arbitrar Ai condiionat de faptul c dup experiment a fost nlturat ntreaga nedeterminare.

Exemplu. Dintre locuitorii unui ora, 25% sunt elevi. Printre elevi, 50% sunt fete. Toate fetele din ora constituie 35% din locuitori. Ce cantitate de informaie suplimentar este coninut n comunicarea c o fat ntlnit este elev? Soluie. Notm cu A1 evenimentul c a fost ntlnit o fat, iar prin A2 evenimentul c a fost ntlnit un elev. Atunci, P(A1)P(A2 / A1) = P(A2)P(A1 / A2) Dar, P(A1) = 0,35; P(A2) = 0,25; P(A1 / A2) = 0,5 De aici rezult: P( A2 )P( A1 / A2 ) 0,25 0,5 P( A2 / A1 ) = = 0,357 = P( A1 ) 0,35 Iar, cu aceasta, cantitatea de informaie:

I = -log P(A2 / A1) = -log 0,357 = 1,486 bii


Exemplu. Experimentul A are rezultatele Ai, i = 1,2,3, cu probabilitile menionate mai jos:

A1 A2 A3 A: 0,2 0,5 0,3 S se afle cantitatea de informaie punctual i medie a rezultatelor A1,A2,A3. Soluie. I(A1) = -log p1 = -log 0,2 = 2,32 bii I(A2) = -log p2 = -log 0,5 = 1,00 bii I(A3) = -log p3 = -log 0,3 = 1,74 bii Cum avem variabila 2,32 1 1,74 X: 0,2 0,5 0,3 M(X) = 2,320,2 + 10,5 + 1,740,3 = 1,49 bii
Exemplu. S considerm un experiment A cu 2 rezultate posibile

A1 A2 A: , 0,1 0,9 cu probabilitile menionate. Se repet experimentul de un numr mare de ori, N, n condiii identice. S se afle cantitatea medie de informaie ce revine la un rezultat al exprimentului. Soluie. Notm cu C succesiunea de rezultate n N repetri ale experimentului. Atunci, pentru N suficient de mare, n virtutea teoremei lui Bernoulli, putem scrie P( A1 ) = n1 n , P( A2 ) = 2 , N N

unde n1 i n2 reprezint, respectiv, numrul de cte ori s-a realizat A1 i A2 n succesiunea C. Atunci, P( C ) = ( P( A1 )) n1 ( P( A2 )) n2 = ( P( A1 )) NP( A1 ) ( P( A2 )) NP( A2 )

Se vede c probabilitatea succesiunii C depinde numai de probabilitile P(A1), P(A2) i de N. Putem considera c toate succesiunile posibile C se pot considera ca egal probabile, iar numrul n va fi: 1 n= P( C ) n acest caz, pentru determinarea cantitii de informaie a succesiunii C, se poate exprima prin relaia:

I N = log n = log P(C) = log[ P( A1 ) NP( A1 ) P( A2 ) NP( A2 ) ] = N [ P( A1 )log P( A1 ) + P( A2 )log P( A2 )] , unde am notat prin IN cantitatea de informaie n cele N repetri ale experimentului. Cantitatea de informaie pentru un singur rezultat al experimentului va fi de N ori mai mic I I = N = P( A1 ) log P( A1 ) P( A2 ) log P( A2 ) , N sau, dac nlocuim, I = -0,1 log 0,1 - 0,9 log 0,9 = 0,469 bii
6.2. Entropie. Proprieti ale entropiei Dac dup efectuarea unui experiment rmne o anumit nedeterminare, atunci H ( A ) = H ( p1 , p2 ,..., p n ) = pi log pi
i =1 n

nu mai exprim cantitatea medie de informaie a unui rezultat al experimentului. Totui, mrimea H(A) exprim o latur fundamental pentru teoria informaiei i anume ea reprezint msura gradului de nedeterminare pn la efectuarea experimentului i poart numele de entropie a experimentului A. Ea a fost introdus de C.E. Shanon, n 1948, n lucrarea A mathematical theory of communications. Proprieti ale entropiei. nainte de a da i a demonstra proprietile imporante ale entropiei, s stabilim o inegalitate fundamental, cunoscut sub numele de inegalitatea lui Jensen. Fie f:[a,b]R. Definiie. Spunem c f este concav pe intervalul [a,b] dac n acest interval orice arc al graficului este situat deasupra coardei ce subntinde acest arc. Din aceast definiie rezult c oricare ar fi x1,x2 [a,b] i 1,2 0, 1 + 2 = 1, este satisfcut inegalitatea 1f(x1) + 2f(x2) f(1x1 + 2x2) Putem acum da urmtoarea propoziie. Propoziie. Dac f:[a,b]R este concav pe [a,b], x1,x2,,xn[a,b], 1,2,,n0,

i =1

= 1 , atunci:
n i f (xi ) f i xi i=1 i =1
n

Demonstraie. Pentru n = 2, inegalitatea este adevrat prin definiie. S presupunem inegalitatea adevrat pentru n = 1 i s artm c rmne adevrat pentru n.

Fie, deci, x1,x2,,xn[a,b], 1,2,,n0, i = 1 . S considerm = i i


n 1 n 1 i xi i a ib . Se vede imediat c , deci c x[a,b] i, n plus, 0, x= x i =1 i =1 i =1 +n=1. Atunci, cum pentru n = 2 inegalitatea este verificat, rezult: n 1

n 1 i =1

i =1

f(x) + nf(xn) f(x + nxn) nlocuind pe x i i innd seama de inducie, obinem:

n 1 n 1 i xi + n f ( x n ) f i x i + n x n , i =1 i =1

n n 1 adic: f i xi + n f ( xn ) f i xi , i =1 i =1
sau, nc,
n 1

n i f ( xi ) + n f ( xn ) f i xi , ceea ce justific afirmaia. i =1 i =1

S punem acum n eviden proprietile entropiei:


P1. H(p1,p2,,pn) 0 Demonstraie. Cum 0 pi 1, i = 1,2,,n , rezult c log pi <0, iar semnul minus din faa sumei asigur nenegativitatea fiecrui termen - pi log pi. P2. Dac exist i{1,2,,n} astfel nct pi=1, atunci H(p1,p2,,pn) = 0 Demonstraie. Din pi=1 i

1 , k = i = 1 rezult: pk = 0 , k i i =1 innd seama de faptul c lim x log x = 0 , s facem convenia c 0log 0 = 0. Urmeaz c:

x 0

A 1 A 2 ... A i ... A n A: 0 1 0 0 Cum 1log 1 = 0, rezult imediat afirmaia.


P3. Pentru orice p1,p2,,pn 0,

p
i =1

1 1 1 = 1 , H ( p1 , p 2 ,..., pn ) H , ,..., = log n n n n

Demonstraie. n inegalitatea lui Jensen s punem:

x k = pk , k =

1 , k = 1,2,..., n i f ( x ) = x log x n

Se constat c pe intervalul [0,1] f(x) este concav i, deci, inegalitatea lui Jensen este satisfcut. Atunci, putem scrie n n n 1 1 1 1 1 pk log pk pk log pk = log , k =1 n n n k =1 n k =1 n de unde rezult:
1 1 1 H ( p1 , p2 ,..., pn ) log , adic: n n n 1 1 1 H ( p1 , p2 ,..., pn ) log n = H , ,..., n n n

Observaie. Aceast proprietate spune c entropia unui experiment este maxim atunci cnd p1 = p2 = = pn = 1 / n. Acest lucru este n concordan cu imaginea pe care o avem asupra nedeterminrii, deoarece cea mai mare nedeterminare ntr-un experiment cu n rezultate posibile, o avem atunci cnd toate rezultatele experimentului sunt egal posibile. P4. Dac avem dou experimente A1 A2 ... An A1 A: i B: p1 p2 ... pn p1 atunci H(p1,p2,,pn,0) = H(p1,p2,,pn) Demonstraie. Fie p1,p2,,pn 0,

A2 ... An p2 ... pn

An+1 , 0
n +1 k =1

p
k =1

= 1 i p1,p2,,pn,pn+1 0,

p
k =1

=1

Deoarece pn+1log pn+1 = 0 rezult:


H ( p1 , p2 ,..., pn ,0) = H ( p1 , p2 ,..., pn , pn+1 ) = pk log pk = pk log pk pn+1 log pn+1 =
k =1 k =1 n +1 n

= pk log pk = H ( p1 , p2 ,..., pn )
k =1

S considerm acum un experiment compus din experimentele A i B. Dac cele dou experimente sunt date de A1 A2 ... Am A1 A2 ... Bn A: i B: , p1 p2 ... pm q1 q2 ... qn prin experimentul compus (A,B) nelegem experimentul cu rezultatele: A1 B1 A1 B2 ( A ,B): 12 11 ... A1 Bn 1n ... A2 B1 A2 B1 ... Am Bn , mn ...

21

21

unde am notat AiBj obinerea simultan a rezultatelor Ai i Bj, iar i=1,2,,m; j=1,2,,n. Evident, ij 0,

ij = P(AiBj);


i =1 j =1

ij

= 1.

Are loc urmtoarea proprietate: P5. Dac experimentele A i B sunt independente, atunci H(A,B) = H(A) +H(B) Demonstraie. ntruct A i B sunt independente, rezult c: ij = P(A i B j ) = P(A i )P(B j ) = p i q j

Prin urmare: H(A ,B ) = ij log ij = p i q j log(p i q j ) = p i log p i ( qj) qj log qj( p i ) =


i =1 j=1 i =1 j=1 i =1 j=1 j=1 i =1 m n m n m n n m

= H(A ) + H(B ) S presupunem acum c cele dou experimente A i B nu mai sunt independente. Fie: m A A 2 ... A m , p k 0, k = 1,2,... m, p k = 1 A : 1 p1 p 2 ... p m k =1 S presupunem c experimentul B este condiionat de rezultatele experimentului A. Dac notm cu B1, B2,Bn rezultatele experimentului B, atunci notm cu Bj/Ai rezultatul Bj al experimentului B condiionat de rezultatul Ai al experimentului A. Probabilitatea unui astfel de rezultat s-o notm P(Bj/Ai) = qij, i=1,2,,m; j = 1,2,,n. Rezult c:

qij 0, qij = 1, i = 1,2,..., m

Cum: ij = P A i B j = P(A i ) P B j / A i ,
rezult c: ij = piqij, i = 1,2,,m; j = 1,2,,n , cu ij 0 i

j =1

ij = p iq ij = 1
i =1 j=1 i =1 j=1

B1 / Ai Notnd experimentul Bi , Bi : qi1

B2 / Ai ... Bn / Ai , qi 2 ... qin


n j=1

obinem: H i (B ) = (Bi ) = H(q i1 , q i 2 ,..., q in ) = q ij log q ij Msura nedeterminrii dat de experimentul Bi o vom numi entropia experimentului B condiionat de rezultatul Ai al experimentului A. Dar Ai se realizeaz cu probabilitatea pi i, deci, avem o variabil aleatoare: H1 (B ) H 2 (B )... H m (B ) p 2 ... pm pi Lund valoarea medie a acestei variabile aleatoare, se obine nedeterminarea experimentului B condiionat de ntregul experiment A, adic:

H A (B ) = H(B / A ) = p k H k (B )
k =1

Numim aceast msur a nedeterminrii, entropia experimentului B condiionat de experimentul A. S observm c: q j = P( B j ) = P( Ai B j ) = P( Ai )P( B j / Ai ) = pi qij
i =1 j =1 i =1 m n m

Dac experimentele A i B sunt independente, atunci qij = qj i de aici rezult: H1 (B ) = H 2 (B ) =... = H m (B ) = q ij log q j = H(B )
j=1 n

i deci: HA (B ) = p i H i (B ) = H(B ) p i = H(B )


i =1 i =1

Dac ns nu mai presupunem independena experimentelor, atunci este adevrat urmtoarea proprietate. Propoziie Fiind date dou experimente oarecare, avem ndeplinit egalitatea: H(A; B) = H(A) + HA(B) Demonstraie: m n m n m n H(A ,B ) = H( 11 , 12 ,..., mn ) = ij log ij = p i q ij log p i q ij = p i log p i q ij j=1 i =1 j=1 i =1 j=1 i =1
m m p i q ij log q ij = H(A ) + p i H i (B ) = H(A ) + H A (B ) j=1 i =1 i =1 Propoziie Fiind date dou experimente oarecare, este adevrat inegalitatea: HA(B) H(B) Demonstraie: m m n inegalitatea lui Jensen pentru funcii concave: i f ( xi ) f i xi i =1 i =1 S punem f(x) = - x log x (care este funcie concav), xi = qij, i = pi; atunci, obinem: m m m pi qij log qij pi qij log pi qij i =1 i =1 i =1 m

Cum ns
m n

p q
i i =1

ij

= q j rezult inegalitatea pe care, dac o nsumm dup j, ne d:


n

pi qij log qij q j log q j ,


i =1 j =1 j =1

adic: HA(B) H(B) Din aceast inegalitate rezult urmtoarea observaie practic: cunoaterea rezultatelor experimentului A micoreaz nedeterminarea experimentului B (dac acestea nu sunt independente). Rezult, de asemenea, imediat o alt proprietate: Propoziie Fiind date dou experimente A, B oarecare, avem: H(A, B) H(A) + H(B) Demonstraie H(A, B) = H(A) + HA(B) H(A) + H(B). Propoziie Fiind date k experimente oarecare A1, A2, Ak , avem inegalitatea: H(A1, A2, ,AK)

H(A
l =1

egalitatea avnd loc atunci cnd experimentele sunt independente n totalitatea lor.

Demonstraie Se aplic proprietatea de inducie i se obine: H(A1, A2, , AK) = H(A1) + H(A2,, AK) H(A1) + H(A2) + + H(AK). Propoziie Fiind date dou experimente A, B oarecare, avem egalitatea: HB(A) = HA(B) + H(A) H(B) sau HB(A) + H(B) = HA(B) + H(A) Demonstraie Egalitile menionate rezult imediat din faptul c: H(A, B) = H(A) + HA(B) = H(B) + HB(A). O observaie important pentru aplicaii practice ce se obine de aici este urmtoarea: dac experimentul A determin complet experimentul B, adic HA(B) = 0, atunci HB(A) = H(A) H(B). Am vzut, deci, c relaia introdus de Shannon:

H ( p1 , p2 ,..., pn ) = pi log pi
i=2

poate fi considerat ca o bun msur a gradului de nedeterminare a unui experiment. Se pune ns ntrebarea dac mai exist i alte funcii care s aib proprietile pe care le are entropia. Vom formula rspunsul prin teorema de unicitate care urmeaz: Teorem Fie H(p1, p2, , pn) o funcie simetric definit pentru orice n i orice sistem de probabiliti: pi 0; 1 i n,

p
i =1

=1

Dac funcia H are urmtoarele proprieti: i) este continu n raport cu ansamblul 1 variabilelor; ii) H(p1, p2, , pn) este maxim pentru pi = , i = 1, 2, , n; iii) H(p1, p2, , n pn, 0) = H(p1, p2,, pn); iv) pentru orice n + 1 sisteme de probabiliti: p1, p2, , pn 0,

p
i =1

= 1 i qi1, qi2, , qim 0,

q
j =1

ij

= 1 , 1 i n cu ajutorul crora construim un nou sistem

de probabiliti: ij = piqij, 1 i n, 1 j m, este adevrat egalitatea: H(11, 12, , nm) = H(p1, p2, , pn) + H(p1, p2, , pn) = - pi log pi
i =1 n

p
i =1

. H(qi1, qi2, , qim), atunci:

Demonstraie Vom face demonstraia n trei etape. Mai nti vom arta c relaia este adevrat n 1 cazul cnd p1 = p2 = pn = . Apoi vom arta c rmne valabil cnd pi sunt numere n

raionale pozitive supuse la condiia

p
i =1

i n

= 1 i n fine, c relaia se menine adevrat cnd


i

pi sunt numere reale pozitive pentru care 1 1 1 S notm H , ,..., = L( n ) ; n n n

p
i =1

= 1.

1 1 1 1 1 1 atunci: L(n) = H , ,..., = H , ,..., ,0 n n n n n n

1 1 1 H , ,..., = L( n + 1) , n baza ipotezei (iii). n +1 n +1 n + 1 Deci funcia L are proprietatea L(n) L(n+1), nN

S artm c oricare ar fi r, s N este adevrat egalitatea: L(sr) = rL(s) Vom aplica procedeul induciei dup r. 1 1 Pentru r = 2, s punem n = s, m = s, pi = , 1 i s; qij = , 1 i s, 1 j s s s 1 Atunci ij = p i q ij = 2 i de aici, pe baza proprietii (IV), putem scrie: s 1 1 s 1 1 1 1 1 1 1 1 L( s2 ) = H 2 , 2 ,..., 2 = H , ...., + H , ,..., = L( s) + L( s) = 2 L( s) s s s s s s i =1 s s s s Deci proprietatea este adevrat pentru r = 2. S o presupunem adevrat pentru r 1 i s artm c se menine pentru r. 1 1 S presupunem n = s, m = sr-1, pi = , 1 i s, qij = r1 , 1 i s, 1 j sr-1 s s 1 Urmeaz c: ij = piqij = r , 1 i s, 1 j sr-1 s Atunci, proprietatea (IV) conduce la: 1 1 s 1 1 1 1 1 1 1 1 H r , r ,..., r = H , ,..., + H r 1 , r 1 ,..., r 1 , sau s s s s s s s i=1 s s s r r-1 L(s ) = L(s) + L(s ) Cum L(sr-1) = (r-1). L(s), rezult c L(sr) = rL(s). Fie acum s, v, t, numere naturale. Exist un numr r natural, astfel nct: sr vt < sr+1 Logaritmnd ntr-o baz mai mare ca unu aceast inegalitate, obinem: r log s t log v < (r+1) log s mprind n aceast dubl inegalitate cu t.log s, obinem: r log v r + 1 (*) < t log s t Pe de alt parte, aplicnd funcia L aceleiai inegaliti, avem: L(sr) L(vt) L(sr+1) sau r L(s) t L(v) (r+1) L(s), r L ( v) r + 1 de unde (**) t L ( s) t Scznd inegalitile (*) i (**), obinem: L( v) log v 1 < L( s) log s t Cum membrul nti este independent de t, fcnd pe t , va rezulta pentru orice s i L( v) log v v numere naturale: = sau L( s) log s L ( v ) L ( s) = = , log v log s adic L(n) = log n, cu 0. 1 Deci afirmaia este dovedit pentru p1 = p2 = pn = n S presupunem c p1, p2, , pn sunt numere raionale pozitive a cror sum este 1. Putem presupune c am exprimat probabilitile pi, i = 1, n astfel nct s aib n m acelai numitor, adic: pi = i , i = 1,2,..., n; mi = m m i =1

Definim acum sistemul de probabiliti qij n modul urmtor: 0 1 qij = mi 0


Atunci ij = p i q ij = 1 j mk
i i1 mk + 1 j mk k =1 k =1 k =1 i 1

mk j mk
k =1 k =1

1 i din proprietatea (IV) obinem: m n 1 1 1 1 1 1 H , ,..., = H ( p1 , p2 ,..., pn ) + pi H , ,..., m m m mi mi mi i =1


n i =1

adic:
n

log m = H ( p1 , p2 ,..., pn ) + pi log mi = H ( p1 , p2 ,..., pn ) + pi log( mpi )


i =1

sau: log m = H ( p1 , p2 ,..., pn ) + log m + pi log pi


i =1

Prin urmare, i n cazul cnd pi, i = 1, 2, , n sunt numere raionale avem: H ( p1 , p2 ,..., pn ) = pi log pi
i =1 n

Dac p1, p2, , pn sunt numere reale pozitive cu suma unu, atunci orice numr real este limita unui ir de numere raionale. Pe de alt parte, H(p1, p2, , pn) este continu n raport cu toate variabilele i deci: H ( p1 , p2 ,..., pn ) = pi log pi , pentru orice numere reale pi 0, i = 1, 2, , n;
n i =1 n

p
i =1

=1

S exprimm acum cantitatea de informaie coninut ntr-un experiment A, relativ la un experiment B. Dac s-ar efectua experimentul B am fi condui la cantitatea de informaie H(B). Efectund n prealabil experimentul A, obinem o anumit informaie relativ la experimentul B. Prin definiie, diferena H(B) HA(B) o vom numi cantitatea de informaie relativ la experimentul B coninut n experimentul A i o vom nota I(A, B). Deci: I(A, B) = H(B) HA(B). Am vzut c ntotdeauna este satisfcut inegalitatea HA(B) H(B) i, deci, I(A, B) 0. Egalitatea HA(B) = H(B) (sau I(A, B) = 0) are loc dac experimentele A i B sunt independente (deci, nu se influeneaz reciproc). Pe de alt parte, dac experimentul A determin complet experimentul B, ceea ce nseamn c realizarea experimentului A conduce la dispariia oricrei nedeterminri referitoare la experimentul B, vom avea HA(B) = 0. n acest caz, prin realizarea experimentului A se obine o cantitate de informaie asupra experimentului B egal cu cantitatea de informaie care s-ar obine prin efectuarea direct a experimentului B. Aadar, este adevrat dubla inegalitate: 0 I(A, B) H(B) Acest lucru este deosebit de important n aplicaiile practice, constituind o metod util de determinare a cantitii de informaie referitoare la rezultatul unui experiment.

Aceast metod const n efectuarea unei succesiuni de experimente auxiliare, succesiune pe care o dorim ct mai scurt, din motive economice, sau din motive ce in de timpul de realizare a unei astfel de succesiuni. B ..... B n Mai exact, pentru a putea scoate n relief rezultatul experimentului B : 1 , q 1..... q n vom efectua k experimente auxiliare A1, A2, Ak, fiecare dintre acestea putnd avea m < n rezultate posibile astfel nct ele s conin cel puin ntreaga cantitate de informaie pe care am cpta-o dac am efectua direct experimentul B. Stabilirea numrului minim de experiene revine la a determina cel mai mic numr natural k astfel nct: H(B ) H(A 1 , A 2 ,..., A N ) H(A J )
J =1 K

Metoda aceasta, dei foarte util, nu spune nimic asupra modului de alegere a experimentelor Aj, 1 j k, alegerea fcndu-se innd seama de natura concret a experimentului B. Totui, dac nu avem nici un fel de date referitoare la probabilitile evenimentelor ce intervin n experiment, putem s le considerm ca fiind egal probabile, ceea ce revine la a considera c experimentul respectiv are nedeterminare maxim, nedeterminare ce va trebui nlturat. Se constat imediat c I(A, B) este simetric, adic I(A, B) = I(B, A), deoarece: H(A, B) = H(A) + HA(B) = H(B) + HB(A), de unde rezult: H(B) HA(B) = H(A) HB(A), adic tocmai egalitatea menionat. De asemenea, I(A, B) se mai poate exprima, dac inem cont de entropia condiionat, de unde rezult iari imediat simetria prin relaia: I(A, B) = H(A) + H(B) H(A, B), funciei I(A, B). Cu notaiile utilizate anterior, din aceasta ultim relaie rezult imediat, dac exprimm H(A), H(B) i H(A, B), c : I ( A ,B) = sus.
Exemplu. Cineva i-a fixat n gnd un numr natural din mulimea {1, 2, , 63, 64}. Acest numr urmeaz s fie descoperit (ghicit) punndu-se ntrebri la care interlocutorul rspunde cu da sau nu. Care este numrul minim de ntrebri ce urmeaz a fi puse i cum trebuiesc formulate ntrebrile pentru a descoperi numrul? Soluie ntruct oricare din numerele 1, 2, , 63, 64 pot fi alese, rezult c avem de nlturat nedeterminarea urmtorului experiment: A 1 A 2 ... A 63 A 64 A : 1 1 1 1 , unde Ai nseamn c s-a fixat numrul 1 i 64. ... 64 64 64 64 Pentru nlturarea complet a acestei nedeterminri, este necesar o informaie egal cu: H(A) = log 64 bii Pentru aceasta, organizm o succesiune de experimente A1, A2, Ak, fiecare din experimentele respective fiind constituite din cte o ntrebare bine formulat. Prin fiecare ntrebare pus cutm s nlturm o nedeterminare ct mai mare (dac este posibil maxim). Cum la fiecare ntrebare se primete rspunsul da sau nu rezult c ( A1 j) A (2j) j = 1, 2, , k, fiecrei ntrebri i se asociaz experimentul: A j: 1 1 2 2 cu H(Aj) = log 2
pi q j n cele ce urmeaz vom da cteva exemple care s ilustreze noiunile introduse mai
i = 1 j =1

ij

log

ij

Vom organiza attea experimente astfel nct H(A) H(A1, A2, , Ak)

H(A
j=1

Cum H(Aj) = log 2, rezult c putem determina pe k, din relaia: log 64 k log 2 i lum ca valoare a lui k, cel mai mic numr natural ce verific aceast relaie. Rezult de aici c: k = 6. Deci, din 6 ntrebri bine puse putem descoperi numrul ales. Vom pune ntrebrile acum astfel ca prin fiecare s nlturm maximul de nedeterminare. Aadar, mprim numrele 1, 2, , 64 n dou i ntrebm dac numrul ales este mai mare dect 32, stabilind astfel dac se afl n prima jumtate sau n a doua. Cu jumtatea determinat se procedeaz la fel .a.m.d., pn cnd la a asea ntrebare se stabilete cu exactitate numrul. Generalizare. S se determine numrul minim de ntrebri care ne permite s aflm un numr ales la ntmplare din una dintre n valori admisibile. A 1 A 2 ... A n Atunci: A : 1 1 1 ... n n n Rezult c avem nevoie de H(A) = log n bii Se organizeaz k experimente succesive, astfel nct H(A) H(A1, A2, , An)
H(A j )
j=1 k

Se obine de aici valoarea lui k, (k 1) log 2 < log n k log 2 sau log n k ; (2k-1 < n 2k) k-1 < log 2 Exemplu. S se determine numrul minim de ntrebri prin care se pot descoperi 2 numere diferite din n numere i cum trebuie s punem ntrebrile astfel nct s dm rspunsul dup numrul minim de ntrebri determinat. 2 Soluie: Rezultatele experimentului A sunt n numr de Cn 2 Aadar, H(A) = log Cn Din H(A) H(A1, A2, , Ak)
2 obinem: log Cn k log 2. 2 log Cn va fi numrul Deci, cel mai mic numr natural ce satisface condiia: k log 2 minim de ntrebri cerute. i de data aceasta se vor pune ntrebrile astfel nct s se nlture maximul de 2 nedeterminare. Pentru aceasta, se mpart cele Cn rezultate n dou pri egale. Cu prile obinute se procedeaz analog, innd seama de faptul c la un moment dat nu mai putem mpri n dou pri egale, ci n pri care difer printr-o unitate. Exemplu. Avem 25 de piese identice ca form. Dintre acestea 24 au aceeai greutate, iar una defect, este mai uoar dect fiecare din celelalte. Pentru descoperirea ei dispunem de o balan fr greuti. Se pune ntrebarea cte cntriri trebuie s efectum cu o astfel de balan i cum trebuie organizate cntririle pentru a descoperi piesa defect. Soluie: Experimentul A al crui rezultat trebuie determinat are 25 de rezultate posibile i este natural s considerm aceste rezultate, echiprobabile. A 1 A 2 ... A n A : 1 1 1 ... 25 25 25 Deci H(A) = log 25, adic pentru identificarea piesei defecte avem nevoie de o cantitate de informaie egal cu log 25 bii. S efectum cntriri cu o balan fr greuti. Fiecare cntrire constituie un experiment Aj n care pot s apar cte trei rezultate posibile: balana este n echilibru, nclin talerul din stnga sau nclin talerul din dreapta.

H(A
j=1

),

( A ( j) A (2j) A 3j) A j: 1 pe pd ps Aadar, efectum cntriri succesive pn cnd H(A) H(A1, A2, , An)

H(A
j=1

) k log 3.

De aici, se obine: log 25 k log 3; 25 3k, adic k = 3 cntriri. S efectum cntririle astfel nct s obinem maximum de informaie ntr-o cntrire. Aezm pe un taler m piese i pe cellalt taler tot m piese, astfel balana va nclina ntr-o parte n mod cert. Avem experimentul: m m 25 m A ( m) : m m 25 2m 25 25 25 m m 25 2m Pentru a nltura o nedeterminare maxim va trebui ca probabilitile , , 25 25 25 s fie ct mai apropiate ca valoare. Acest lucru se ntmpl cnd m = 8; 25 2m = 9 Aadar, aeznd pe fiecare taler cte 8 piese, la prima cntrire se poate ca balana s fie n echilibru i atunci piesa defect se afl ntre cele 9 necntrite. Pe acestea le mprim n 3 grupe de cte 3 piese i punem pe un taler o grup, iar pe cellalt taler alt grup. Dac talerul nclin n dreapta, s zicem, cum tim c piesa defect este mai uoar, atunci ea se afl pe cellalt taler. Din cele trei piese situate pe talerul n care se afl cea defect, cntrim cte una pe un taler i n urma cestei cntriri (a treia) determinm exact care este piesa defect. Analog se raioneaz cu celelalte situaii care pot s apar. Problema se poate rezolva, n general, cnd avem n piese identice i printre ele se afl una defect care este mai uoar. n acest caz este nevoie de k cntriri, k fiind determinat din relaia: log n k log 3 Se organizeaz apoi cntririle astfel nct s se nlture la fiecare o nedeterminare maxim. Aceast problem se poate formula i rezolva ceva mai complicat i n cazul cnd nu mai avem informaie asupra naturii falsului (mai uoar sau mai grea) i trebuie descoperit piesa defect i totodat i natura falsului. Exemplu. Dou uniti economice realizeaz acelai produs pentru un beneficiar. Produsul are dou caracteristici n funcie de care se apreciaz calitatea lui de a fi corespunztor sau necorespunztor. La unitatea U1, 95% din produse sunt corespunztoare, iar 4% sunt necorespunztoare din cauza caracteristicii X i 4% din cauza caracteristicii Y. La unitatea U2 tot 95% sunt produse corespunztoare, ns 4,5% sunt necorespunztoare din cauza caracteristicii X i 3,5% din cauza caracteristicii Y. S se stabileasc la care dintre uniti avem o nedeterminare mai mare asupra caracteristicilor produsului. Soluie. Asimilm caracteristicile X i Y cu variabile aleatoare ce iau valorile 1 sau 0. Atunci, obinem urmtoarele repartiii: Y X 1 U1: 1 0 0,03 0,01 0,04 U2: X 1 0 Y 1 0 0,030 0,015 0,045 0,005 0,950 0,955 0,035 0,965 1

0 0,01 0,95 0,96 0,04 0,96 1

Rezult de aici: HU1 (x, y) = - (0,03 log 0,03 + 0,01 log 0,01 + 0,01 log 0,01 + 0,95 log 0,95)
HU 2 (x, y) = - (0,030 log 0,030 + 0,015 log 0,015 + 0,005 log 0,005 + 0,950 log 0,950) HU1 (x, y) = 0,3549; HU 2 (x, y) = 0,3512.

Cum HU1 (x, y) > HU 2 (x, y) rezult o nedeterminare mai mare la prima unitate.
Exemplu. Se tie c dou produse dintr-o sut au un anumit defect ascuns. Pentru depistarea produselor defecte se folosete o anumit reacie chimic care este totdeauna pozitiv cnd produsul este defect, iar dac produsul este corespunztor reacia este tot att de frecvent pozitiv ct i negativ. Considerm experimentul B care const n a determina dac un produs este corespunztor sau nu, iar experimentul A const n a determina rezultatul reaciei. Se cere s se calculeze entropiile H(B) i H A (B) . Soluie. B ( produs corespunztor) B2 ( produs corespunztor B: 1 0,98 0,02 De aici rezult: H(B) = - 0,98 log 0,98 0,02 log 0,02 = 0,1415 bii ie ie A (reac pozitiv) A 2 ( reac negativ) A : 1 0,51 0,49 cnd ( P(A1 ) = jumtate din cazurile cnd are loc B1 + toate cazurile100 are loc B2 = 49 + 2 = 100 100 = 0,51 i, analog, P(A2)) 49 49 2 2 49 2 ; PA1 (B2) = , rezult HA 1 (B) = log log 0,2377, Cum PA1 (B1) = 51 51 51 51 51 51 HA 2 (B) = 0 , deoarece, dac experimentul A are rezultatul A2, putem afirma cu certitudine c experimentul B a avut rezultatul B1 (produs corespunztor). Atunci: HA(B) = 0,51 HA 1 (B) + 0,49 H A 2 (B) = 0,51 0,2377 = 0,1212

6.3. Entropia relativ Pn acum am pus n eviden entropia corespunztoare experimentelor cu o mulime finit de rezultate posibile. Aceasta poate fi extins imediat pentru experimente cu o mulime numrabil de rezultate. Cum n expresia entropiei intervin numai probabiliti cu care apar rezultatele, putem spune c s-a introdus noiunea de entropie pentru variabilele aleatoare discrete, dat fiind faptul c nu intervin valorile luate de variabilele aleatoare, ci numai probabilitile cu care sunt luate valorile respective. Acest lucru constituie de altfel i un neajuns al noiunii de entropie, cci nu putem ptrunde n esena fenomenului, rmnnd cu gradul de cunoatere doar la nivelul de organizare sau dezorganizare a fenomenului (sistemului) fizic urmrit. n practic, ns, intervin adesea situaii cnd avem de a face cu variabile aleatoare continue ce caracterizeaz anumite experimente. n cele ce urmeaz, noi vom presupune c este vorba de variabile aleatoare care admit densiti de repartiie i pentru acestea vom cuta s introducem noiunea de entropie. Fie variabila aleatoare X cu densitatea de repartiie f(x). Atunci, dup cum se tie, dac x este suficient de mic, putem scrie egalitatea: P(x X < x + x) = f(x)x Dac admitem c X ia valori pe toat dreapta real, R, s considerm o diviziune a ei prin punctele , x-1, x0, x1, x2, , xi, (o mulime numrabil) astfel nct xi+1 xi = x, i Z. S considerm variabila aleatoare discret X, cu repartiia:

... x 1 x0 x1 x 2 ... x i ... X `: , unde pi = f(xi)x, i Z. ... p-1 p0 p1 p2 ... pi ... Atunci, conform definiiei lui Shannon, avem: H ( X `) = pi log pi
i =

H ( X ) = lim H ( X `) = lim f ( xi ) x log [ f(xi ) x] = lim f ( xi ) x log f(xi) ) x + x 0 x 0 i = x 0 i =


+ + lim f ( xi ) x log x = f ( x ) log f ( x ) dx - lim log x + x 0 i = x 0 Prin urmare, rezult c entropia oricrei variabile aleatoare continue tinde ctre + . Acest lucru are i un suport intuitiv, i anume gradul de nedeterminare al unei variabile aleatoare ce ia o infinitate de valori poate s fie orict de mare. Pentru a nltura acest inconvenient s-a convenit introducerea unei msuri relative a gradului de nedeterminare a unei variabile aleatoare X n raport cu o variabil aleatoare dat X0. Variabila aleatoare X0 poate fi aleas arbitrar i, pentru a simplifica ct mai mult expresia entropiei relative, vom lua pe X0 ca fiind repartizat uniform pe intervalul [a, b] de lungime = b a n acest caz rezult c densitatea de repartiie a variabilei X0 este: 1 dac x [ a,b] , ceea ce conduce la: g(x) = 0 n rest,

Obinem:

1 1 H ( X 0 ) = log dx lim log x = log lim log x


a

x 0

x 0

Dac alegem n plus = b a = 1 i dac vom considera diferena:


+

H(X) = H(X) H(X0) = -

f ( x )log f ( x )dx,

constatm c aceast diferen indic cu ct nedeterminarea variabilei aleatoare X cu densitatea de repartiie f(x) este mai mare (H(X) > 0) sau mai mic (H(X) < 0) dect nedeterminarea unei variabile aleatoare repartizat uniform pe un interval [a, b] de lungime = 1.
+

Prin definiie, vom numi expresia H(X) = -

f ( x) log f ( x)dx

entropia relativ a

variabilei aleatoare X. S punem n eviden unele proprieti ale acestei entropii. Propoziie. Entropia relativ este independent de valorile efective ale variabilei aleatoare X. Demonstraie. Este suficient s artm c variabila aleatoare Y = X a, a R, are aceeai entropie relativ ca i variabila aleatoare X. ntr-adevr,
H (Y ) = H ( X a ) = f ( x a ) log f ( x a )dx =

f ( x ) log f ( x )dx = H ( X )

Observaie. Se constat imediat c proprietatea este adevrat i pentru variabile aleatoare discrete. Propoziie. Dac f(x, y) i g(x, y) sunt densiti de repartiie bidimensionale, atunci f ( x, y ) are loc inegalitatea: f ( x , y ) log dxdy 0 g( x, y )

Demonstraie. S artm mai nti c oricare ar fi funcia u(x, y) > 0, are loc inegalitatea: 1 ln u( x , y ) 1 log 2 u( x , y ) = 1 ln 2 ln 2 u( x , y ) 1 1 ntr-adevr, dac u(x, y) 1 i dac t [1, u], atunci i, de aici: t u u 1 dt 1 1 1 ln u = dt = ( u 1) = 1 t uu u u 1

1 1 Dac u (0, 1), atunci oricare ar fi t [u, 1] i deci: t u 1 1 dt 1 1 1 ln u = - dt = (1 u ) = 1 t uu u u u Deci, are loc, totdeauna, inegalitatea menionat. Bazai pe aceast inegalitate, putem scrie: g( x, y) 1 1 f ( x, y) f ( x, y) log g( x, y) dxdy ln 2 f ( x, y)1 f ( x, y) dxdy = ln 2 f ( x, y) dxdy
1 g( x, y) dxdy = 0 , ln 2 ntruct f(x, y) i g(x, y) sunt densiti de repartiie bidimensionale. n plus, avem egalitate dac f(x, y) = g(x, y) Propoziie Dac X i Y sunt variabile aleatoare a cror entropie relativ compus este H(X, Y), atunci are loc inegalitatea: H(X, Y) H(X) + H(Y).
Demonstraie S exprimm membrul al doilea i s folosim inegalitatea dovedit anterior:

H ( X )+H (Y ) = f1 ( x ) log f1 ( x )dx

( y ) log f 2 ( y )dy =

f ( x, y )[ log f1 ( x ) + log f 2 ( y )] dxdy = -

f ( x, y )log f ( y / x ) f

f ( x, y )

( y ) dxdy =

f ( y / x) f ( x, y ) dxdy = = - f ( x, y )log f ( x, y )log f ( x, y ) log f 2 ( y ) ) dxdy = f ( y / x) f 2( y )


f ( x, y ) dxdy 1 2( y) Cum integrala dubl din ultima egalitate obinut este totdeauna pozitiv (pe baza proprietii anterioare) rezult c: H(X, Y) H(X) + H(Y), adic tocmai inegalitatea menionat. = H ( X , Y ) +

f ( x, y ) log f ( x ) f

Se constat imediat c relaia este identic cu cea gsit pentru entropia unui experiment compus, cu un numr finit de rezultate. Aadar, relaia este adevrat pentru entropia oricrei variabile aleatoare discrete. Din aceast relaie rezult c i n cazul discret avem egalitatea n cazul variabilelor aleatoare independente. Propoziie Pentru orice vector aleator (X, Y) sunt adevrate egalitile: H(X, Y) = H(X) + H(Y/X) = H(Y) + H(X/Y) Demonstraie Din definiia entropiei unui sistem de dou variabile aleatoare (X, Y) rezult:
H ( X , Y ) =
=

f ( x, y ) log f ( x, y )dxdy = f ( x, y ) log[ f ( x ) f ( y / x )]dxdy =


1

f ( x / y ) log f1 ( x )dxdy

f ( x, y ) log f ( y / x )dxdy = H ( X ) + H (Y / X ) ,
relativ condiionat a

unde am pus H (Y / X ) =

f ( x, y ) log f ( y / x )dxdy entropia

variabilei aleatoare Y. Analog se obine i cealalt inegalitate. S mai dm o propoziie care s stabileasc o legtur ntre entropia relativ a dou variabile aleatoare X i Y. Propoziie Dac X este o variabil aleatoare cu densitatea de repartiie f(x), iar Y este o variabil aleatoare a crei repartiie este caracterizat de densitatea: g ( y ) = c(x,y) este o funcie pondere care satisface condiiile: c(x, y) 0,

c( x, y ) f ( x )dx ,

unde

c( x, y )dx = c( x, y )dy = 1 , atunci: H(Y) - H(X) 0.

Demonstraie S exprimm diferena celor dou entropii relative: H(Y) - H(X) =


f ( x ) log f ( x )dx

c( x, y ) f ( x ) log g( y )dxdy =

f (x) c( x , y ) f ( x ) = c( x , y ) f ( x ) log dxdy = c( x , y ) f ( x ) log dxdy g( y ) c( x , y ) g ( y ) ntruct a(x, y) = c(x, y) i b(x, y) = c(x, y) g(y) sunt densiti de repartiie bidimensionale, pe baza unei propoziii date anterior rezult c: c( x , y ) f ( x ) c( x, y ) f ( x ) log c( x, y ) g( y ) dxdy 0

i deci H(Y) - H(X) 0. Pentru dou experimente (deci i pentru dou variabile aleatoare discrete) s-a introdus noiunea de cantitate de informaie continu n experimentul B relativ la experimentul A ca fiind dat de: I(A, B) = H(A) H(A/B) . Dac acum considerm dou variabile aleatoare X i Y cu densitatea de repartiie comun f(x, y), atunci definim cantitatea de informaie coninut n variabila aleatoare Y relativ la variabila aleatoare X ca diferena dintre entropia relativ H(X) i entropia relativ

condiionat H(X/Y). Notnd cu I(X, Y) aceast cantitate de informaie, atunci I(X, Y) = H(X) - H(X/Y). Aceast cantitate de informaie se bucur de o proprietate important exprimat n propoziia de mai jos. Propoziie Dac X, Y sunt dou variabile aleatoare continue (care au densiti de repartiie) atunci, I(X, Y) = H(X) - H(X/Y) este independent de . Demonstraie
H ( X ) = f1 ( x ) log f1 ( x )dx log

H ( X / Y ) =

f ( x, y ) log f ( x / y )dxdy log ,


atunci:

I ( X , Y ) = f1 ( x ) log f1 ( x )dx log +


f ( x, y ) log f ( x / y )dxdy + log =

f (x / y) f ( x, y ) dxdy = f ( x , y ) log dxdy f1 ( x ) f1 ( x ) f 2 ( y ) Se observ c relaia este ntrutotul analoag cu cea obinut pentru variabila aleatoare discret i, n plus fa de entropia relativ, cantitatea de informaie coninut n Y relativ la X are un caracter absolut. Exemplu. S se calculeze entropia relativ a unei variabile aleatoare exponenial negative de parametru i a unei variabile aleatoare normale N(0, ). Soluie Dac X este variabil aleatoare repartizat exponenial negativ, atunci e x , x 0, > 0 are densitatea: f ( x ) = . , x<0 0 = f ( x , y ) log H ( X ) = e x log e x dx = log e x dx +
0 0

+ 2 log e xe x dx = log
0

y2

2 1 Y este normal N(0, ) dac are densitatea f ( y ) = e 2 , y R 2 2 2 y y 1 2 2 1 2 2 Atunci: H (Y ) = e log e dy = 2 2

2 2 1 1 1 2 = log e 2 dy + 2 3 2 log e y e 2 dy = log 2e 2 2 Exemplu. S se arate c dintre toate repartiiile cu entropie dat, repartiia normal N (o,) are cea mai mic dispersie. Soluie. S determinm densitatea de repartiie cu cea mai mic dispersie:

y2

y2

2 =

x f ( x )dx ,
2

cu condiiile:

H ( X ) = f ( x ) log f ( x )dx i

f ( x )dx = 1 .

Alctuim funcia: ( f , x ) = x 2 f ( x ) 1 f ( x ) log f ( x ) + 2 f ( x ) Euler (calculul variaional):

i, din ecuaia lui

= x 2 1 log f ( x ) 1 + 2 = 0 obinem: f ln 2

x 2 ln 2 f ( x ) = exp( 2 ln 2 1 ) exp 1

Substituind f(x) n H ( X ) = f ( x ) log f ( x )dx

f ( x )dx = 1 , obinem:

ln 2

= exp( 2 H ln 2 1) i

exp( 2 ln 2 1 ) = exp( 2H ln 2 1 )
x2 1 exp 2 2 2

Determinnd 1 i 2 i nlocuind n f(x) avem:


f ( x ) = exp( 2 H ln 2 1 exp[- exp(2H ln 2 1) x 2 ] =

unde: =

2 exp( 2 H ln 2 1

Exemplu. S se determine cantitatea de informaie I(X, Y) pentru vectorul aleator (X, Y) cu densitatea de repartiie: x2 1 1 xy y2 2 2 f ( x, y ) = exp + 2 , 2) x y y 2 x y 1 2 2(1 x unde este coeficientul de corelaie al variabilelor X i Y. f ( x, y ) Soluie. I( X, Y ) = f ( x, y) log dxdy f1 ( x )f 2 ( y ) nlocuindu-se n aceast relaie f(x, y), f1(x), f2(x) (f1, f2 densitile de repartiie

marginale), se obine: I(X, Y) = - log 1 2

6.4. Transmiterea informaiei. Codificarea Oricare ar fi natura unui mesaj, el nu poate fi transmis fr existena unui anumit purttor material al mesajului, care servete drept semnal de transmitere a informaiei coninute n mesajul respectiv. Semnalele purttoare de informaii sunt emise de o anumit surs de semnale, se propag printr-un anumit mediu, numit canal de comunicaie i ajung la destinaie unde sunt recepionate. Prin intermediul semnalelor recepionate destinatarul ia cunotin de informaia transmis. O particularitate esenial a semnalului este independena informaiei pe care o transmite fa de energia consumat pentru producerea lui. Desigur, pentru emiterea semnalului este necesar un minim de energie, dar cantitatea de informaie nu depinde de valoarea acestui minim. O tire de importan capital poate fi transmis cu ajutorul unui semnal extrem de mic i de slab. Numai coninutul semnalului, i nu energia lui, determin cantitatea de informaie pe care o poart.

Orice sistem de comunicaie, de transmitere a informaiei indiferent de natura lui se ncadreaz n schema general de mai jos:

{X; x,

p(x)} S (surs)

C C (canal) P(Z/X) P (perturbaii)

{Y; y,
Y

p(y)} R (recepie)

H(X) = H(X/Y)

Informaia se transmite cu ajutorul unor semnale, emise de o surs. Semnalele se pot transforma prin codificare n alte semnale, a cror transmisie este mai avantajoas; ele se propag pe un canal de comunicaie, n care pot suferi diferite perturbaii (distorsionri) i ajung la recepie, unde cu ajutorul unui traductor se face decodificarea, obinndu-se n final, semnalele transmise iniial, care poart informaia transmis de surs i care a fost perturbat pe canal. Vom defini matematic un sistem de transmitere a informaiei (n cazul finit). Definiie. Numim sistem de transmitere a informaiei sistemul format din dou mulimi finite X, Y i o probabilitate p(y/x) definit pe Y pentru orice x X, pe care-l vom nota {X, p(y/x), Y}. Mulimea X se numete mulimea semnalelor care se emit; mulimea Y se numete mulimea semnalelor care se recepioneaz; probabilitatea p(y/x) se numete probabilitatea de recepionare condiionat de ceea ce se emite. Definiie. Fiind dat probabilitatea p(x) pentru fiecare x X, numit probabilitate de emisie, p( x ) = 1 , cmpul de probabilitate {X, x, p(x)} se numete sursa sistemului {X,
x X

p(y/x), Y} de transmitere a informaiei. Definiie. Fiind date sistemul de transmitere a informaiei sistemului {X, p(y/x), Y} i probabilitatea p(x) pe X, se numete recepia sistemului cmpul de probabilitate {Y, y, p(y)} unde probabilitatea p(y) de recepionare a semnalelor y se obine conform relaiei: p( y ) = p( x ) p( y / x )
x X

Definiie. Mediul prin care se propag semnalele de la surs la recepie se numete canalul sistemului de transmitere a informaiei. A cunoate canalul de comunicaie al unui sistem nseamn a cunoate probabilitile P(y/x) pentru toate semnalele x X, y Y. Dac p(y/x) ia numai valorile 0 sau 1 pentru orice x X, y Y canalul prezint perturbaii. reprezint cantitatea de P(Y/X) = (p(y/x))xX/yY; H ( X ) = p( x ) log p( x )
x X

informaie transmis la surs. H ( X / Y ) = p( x , y ) log p( x / y )


x X y Y

reprezint cantitatea de informaie care se

pierde pe canal. H(X) H(X/Y) reprezint cantitatea de informaie care se recepioneaz. Din proprietile entropiei, rezult: 0 H(X) H(X/Y) H(X) Dac H(X/Y) = 0 nseamn c pe canal nu se pierde nimic din informaia transmis. Dac H(X) = H(X/Y) nseamn c pe canal perturbaia este att de puternic nct la recepie nu se primete nici un fel de informaie. n condiii reale, n mod curent: 0 < H(X) H)X/Y) < H(X).

Definiie. Valoarea maxim a diferenei H(X) H(X/Y) pentru toate probabilitile p la surs o notm cu C i o vom numi capacitatea canalului de transmitere. C = max {H(X) H(X/Y)}
p

Cantitatea H(X) H(X/Y) reprezint cantitatea de informaie obinut n medie la trecerea prin canal a unui semnal al sursei i poart numele de vitez de transmitere a informaiei. Codificarea. n general, semnalele x X nu se transmit direct, ci codificat. Asocierea la un anumit sistem de semnale purttoare de informaie a unor succesiuni de alte semnale se numete codificare. Codificarea se realizeaz cu ajutorul unei mulimi de semnale simple, mulime cu nu prea multe elemente, care sunt nlnuite n anumite succesiuni. n cazul telegrafului, n mod uzual se ntrebuineaz dou tipuri de codificare: codificarea Morse - codificare mai veche i codificarea Baudot. n general, codificarea nseamn nlocuirea fiecrui semnal dintr-o anumit mulime, printr-o succesiune de o anumit lungime, de semnale numite semnale simple. Semnalele simple pot fi chiar semnalele de la care am plecat. n acest caz, codificarea semnalelor dintr-o anumit mulime, nseamn nlocuirea fiecrui semnal printr-o succesiune, de o anumit lungime, de semnale din aceeai mulime iniial. O codificare este cu att mai avantajoas, cu ct sunt mai reduse att numrul semnalelor simple care servesc la codificare, ct i lungimea succesiunilor de semnale simple. n cazul n care se face codificarea, la recepie trebuie s se efectueze decodificarea corespunztoare. Necesitatea introducerii codificrii, ine n primul rnd de natura concret a sistemului de transmitere a informaiei. Informaia este purtat de un anumit tip de semnale, iar sistemului de transmitere i sunt proprii alte tipuri de semnale i ca atare este impus realizarea unei corespondene ntre semnalele iniiale i semnalele care urmeaz a fi transmise. n al doilea rnd, codificarea este impus de prezena perturbaiei pe canal, care diminueaz cantitatea de informaie transmis, ceea ce impune codificarea. Vom considera o codificare n care drept semnale simple se consider tot semnale din mulimea X, un semnal x X nlocuindu-se printr-un ir de semnale tot din mulimea X. Pentru a lmuri lucrurile, s considerm un sistem de transmitere a informaiei {X, p(y/x), Y}. Cnd transmitem un ir de semnale x X, recepionm un ir de semnale y Y. S notm cu U mulimea tuturor irurilor de lungime n formate cu semnale din X i cu mulimea tuturor irurilor de lungime n formate cu semnale din Y. u U u = (x1, x2, , xn), (x1, x2, , xn) X x X x x X; V = (y1, y2, , yn), (y1, y2, , yn) Y x Y x x Y Introducem o probabilitate p(v/u) definit pe V, condiionat de elementele u U, n felul urmtor:
p( v / u) = p( y j / x j ) ;
j =1 n

p(v/u) reprezint probabilitatea ca s se recepioneze

irul de semnale v, dac s-a emis irul de semnale u; aceast probabilitate este complet determinat de p(y/x). Putem acum introduce urmtoarea definiie. Definiie. Fiind dat sistemul de transmitere a informaiei {X, p(y/x), Y} se numete extensie de lungime n, sistemul {U, p(v/u), V} unde U reprezint mulimea tuturor irurilor u, de lungime n de semnale x X, V reprezint mulimea tuturor irurilor v, de lungime n, de semnale y Y, iar p(v/u) =

p( y
j =1

/ xj)

Definiie. Trecerea de la sistemul de transmitere a informaiei {X, p(y/x), Y} la sistemul {U, p(v/u), V} se numete codificare. Definiie. Legea potrivit creia se asociaz semnalelor x X iruri u U se numete cod. Legtura ntre capacitatea sistemului {X, p(y/x), Y} i capacitatea sistemului {U, p(v/u), V} este dat de: Teorem. Fie {X, p(y/x), Y} un sistem de transmitere a informaiei, al crui canal are capacitatea C. Extensia de lungime n are capacitatea n C. Nu vom da demonstraie acestei teoreme. Vom da schema sistemului de transmitere {U, p(v/u), V}:
n x X j ; ( x1 ,..., x n ), p( x1 ,..., x n ) j =1 S (surs)

nC C (canal) P(v/u) P (perturbaii)

n x Y j ; ( y1 ,..., y n ), p( y1 ,..., y n ) j =1 R (recepie)

H(U) - H(U/V)

Codificarea realizat mai sus se face nlocuind fiecare semnal x X cu u = (x1, x2,,xn) U. Dar, n general, fiecare semnal din x X se nlocuiete cu o succesiune de o anumit lungime de semnale din A = {a1, a2, , aa} pe care le numim semnale simple. Un mesaj codificat trebuie s fie decodificat, adic este necesar s se poat ti, atunci cnd se recepioneaz un anumit ir lung de semnale simple, unde se termin subirul corespunztor semnalului iniial urmtor. O cale este aceea de a impune condiia ca semnalelor iniiale s li se ataeze iruri de semnale simple, care au aceeai lungime. n acest caz, cunoscndu-se aceast lungime comun, decodificarea se face extrem de uor, prin mprirea irului recepionat n blocuri avnd o lungime egal cu lungimea dat. Aceste coduri se numesc uniforme. (Acest caz l ntlnim n telegrafie, cnd se ntrebuineaz codificarea Baudot). Sunt posibile i codificri neuniforme, n care diversele iruri de semnale simple care se ataeaz semnalelor iniiale au lungimi diferite. Pentru unele codificri neuniforme se cere, ns, ca nici un ir de semnale simple ataat unui semnal iniial s nu coincid cu nceputul unui alt ir mai lung de semnale simple, pentru a nu avea dificulti la decodificare. Dm mai jos metoda lui Fano de codificare neuniform, cu ajutorul a dou semnale simple, A = {a1, a2,}, codificare care se numete binar (se poate pune a1 = 1, a2 = 0). Pentru a ataa fiecrui semnal iniial un ir de semnale simple se procedeaz astfel: Se ataeaz mulimea X = {x1, x2,, xn} ntr-o coloan, n ordinea descresctoare a probabilitilor p(xi), 1 i N, de apariie. mprim acum coloana de semnale n dou grupe, grupa de sus i grupa de jos, n aa fel ca probabilitatea unui semnal iniial de a aparine la grupa de sus s fie foarte apropiat de probabilitatea ca acest semnal s aparin grupei de jos. Pentru semnalele din grupa de sus folosim pe a1 ca prim semnal simplu, iar pentru semnalele din grupa de jos folosim pe a2 ca prim semnal simplu. Att grupa de sus, ct i cea de jos le mprim, la rndul lor, n dou subgrupe, avnd probabilitile totale ct mai aproape ntre ele. Pentru subgrupa de sus folosim ca cel de al doilea semnal pe a1, iar pentru subgrupa de jos folosim pe a2 ca al doilea semnal simplu. Fiecare din aceste subgrupe se mparte din nou n alte dou subgrupe, i aa mai departe, pn cnd n fiecare grup rmne cte un singur

element, epuiznd astfel semnalele iniiale. irurile de semnale simple ataate n acest mod semnalelor iniiale realizeaz codificarea. Codificarea realizat n acest mod este neuniform, iar irurile de semnale simple ataate semnalelor iniiale, ndeplinesc condiia de a nu cuprinde n ele nici un ir de lungime mai mic ataat unui alt semnal iniial. S codificm semnalele X = {x1, x2,, x12} cu ajutorul crora transmitem o cantitate de informaii H(X). Fiecrui semnal iniial i corespunde o probabilitate bine determinat de ntrebuinare n transmiterea cantitii de informaie respective. Semnalele iniiale, probabilitile p(xi), 1 i 12, mprirea pe grupe i irurile de codificare apar n tabelul de mai jos. S emnale iniiale x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 Probabil. p(xi) 0,28 0,22 0,16 0,09 0,08 0,05 0,03 0,03 0,03 0,01 0,01 0,01 mpririle succesive pe grupe I I II I II II I II I I II I II I II II I II I II I II irurile de codificare a1 a1 a1 a2 a2 a1 a1 a2 a1 a2 a2 a2 a1 a1 a2 a2 a1 a2 a2 a2 a2 a1 a1 a2 a2 a2 a1 a2 a2 a2 a2 a2 a1 a2 a2 a2 a2 a2 a1 a2 a2 a2 a2 a2 a1 a2 a2 a2 a2 a2 a2

6.5. Cantitatea de informaie coninut ntr-un model input-output i variaia ei prin agregare S considerm modelul dat de ecuaiile de balan n expresie valoric: X i = x ij + f i , 1 i m,
j =1 m

unde xij sunt fluxurile interramuri, iar fi produsul final al ramurii i. Dac lum n considerare i cadranul III n care apar elemente de valoare nou creat i adugat i notm cu ykj mrimea inputului k absorbit de ramura j, obinem alte relaii de balan: Xj =

x +
i =1 ij k =1

m'

J k , 1 j m,

unde m este numrul inputurilor referitoare la cadranul III. Introducnd coeficienii x ij cheltuielilor directe aij = , 1 i, j m, primele relaii de balan devin: Xj X i = a ij X j + f i , 1 i m, sau n scriere matriceal:
j =1 m

X = AX + f ; X = (I A)-1 f Lund n considerare i coeficienii cheltuielilor directe referitoare la elementele cuprinse n cadranul III : y kj b ij = , 1 k m ' , 1 j m, din al doilea grup de relaii de balan, obinem: Xj

a + b
ij i =1 k =1

m'

kj

= 1, 1 j m
m

Dac punem: y k = y kj , 1 k m'


j =1

pentru cererea total a tuturor ramurilor

din inputul k referitor la cadranul III, obinem relaia Y = BX. Vectorul Y se poate exprima acum cu ajutorul matricilor A, B i a vectorului f, astfel: Y = B(I A) 1 f n vederea efecturii de analize i prognoze este necesar cunoaterea coeficienilor ce constituie elementele matricilor A i B, cunoscui sub numele de coeficieni input output. Valenele analizei informaionale pe baza modelului input output sunt valorificate integral la modelele macroeconomice, cnd intervine frecvent problema omogenitii produselor. Dar, i pentru astfel de situaii, este necesar s agregm unele ramuri, agregare care conduce la un model de dimensiune mai mic, adecvat unor analize eficiente i rapide. Simplificnd schema modelului de balan, obinem: f U ( mxm) ( mxn ) , O V ( m' xm) ( m' xn ) unde matricea U (cadranul I) conine fluxurile interramuri, f(cadranul II) conine produsul final cu componentele sale (consum individual, consum social etc.), iar V(cadranul III) conine amortizri, retribuii etc. n condiiile n care ne intereseaz doar relaiile dintre ramuri, eliminm produsul final i pstrm matricea: O U ( mxm) ( mxm' ) , O V ( m' xm) ( m' xm' ) care este o matrice ptratic de ordinul m+m, asociat relaiilor de balan:

x
j =1 m j =1

ij

= X i fi , 1 i m
= y k , 1 k m'

kj

Dac mprim n ambii membri aceste m+m relaii prin

X
h =1

, atunci toi termenii

din membrul stng vor lua valori ntre 0 i 1 i vom putea constitui cu ajutorul lor o repartiie bidimensional. Vom nota astfel: x ij pij = m , 1 i, j m , fluxurile interramuri msurate ca fraciuni ale Xh
h =1

outputului (sau inputului) tuturor ramurilor, y kj p m+ k , j = m , 1 k m' , 1 j m Xh


h =1

inputurile corespunztoare cadranului III, msurate n fraciuni de inputuri totale. Vom nota n plus: pij = 0, 1 i m+m; m+1 j m+m

Deoarece pij 0, 1 i, j m + m' i

m+ m' m + m ' i=1 j =1

ij

= 1,

am definit astfel repartiia unui vector aleator (1 , 2 ) . Folosind membrul drept al relaiilor de balan, se obin repartiiile marginale ale componentelor 1 i 2: X fi pi = mi , 1 i m Xh
h =1

pm+ k , =

yk

X
h =1

, 1 k m' ,
h

care sunt, respectiv, cererea total intermediar de produse din ramura i i inputul k, corespunztor cadranului III, raportate la inputul total; Xj , 1 j m m pj = X h h =1 0, m + 1 j m + m' Vom pune, pentru uniformitatea scrierii, m+m = n. Cu aceste relaii, coeficienii cheltuielilor directe se pot exprima prin: xij pij aij = = , 1 i, j m , Xj p j
iar coeficienii cheltuielilor directe referitoare la elementele din cadranul III. ykj pm+ k , j bkj = = , 1 k m'; 1 j m' Xj p j n procesul de agregare s considerm c cele m+m = n inputuri (outputuri) se comaseaz n M+M = G inputuri (outputuri), M< m, M < m. Vom nota Sg mulimea ramurilor iniiale cuprinse n ramura g din tabelul agregat (1 g G). Fluxurile interramuri din tabelul agregat vor fi: x gh = x ij ,
iS g j S h

iar coeficienii cheltuielilor directe: xij a gh = unde: w j =


iS g j S h

X
j S h

=
j

iS g j S h

ij

Xi = a ij w j , X j iS g jSh
j S h

X
j S h

Xj

Deci, n general: wi =

j Sh

Xi , Xj

i Sg ,

1gM

(ponderea ramurii i n outputul corespunztor grupului de ramuri Sh). n mod analog se procedeaz cu coeficienii cheltuielilor directe corespunztori cadranului III: Transformnd tabelul agregat pentru a obine o repartiie bidimensional, vom avea:

Pgh =

iS g j S h G

p
h =1 G

ij

, 1 g, h G

Pg = Pgh = Ph = Pgh =
g =1

iS g

p p
j S h

, 1 g G , 1 h G

acestea reprezentnd, respectiv, fluxul de la Sg la Sh, fluxul total cu originea n Sg, fluxul total ce intr n Sh, toate exprimate n fraciuni ale inputului (outputului) total. S considerm acum cantitatea de informaie coninut ntr-un model input-output, ce poate fi exprimat prin intermediul entropiei asociate repartiiei bidimensionale. Fie I0 cantitatea de informaie coninut n tabelul input-output iniial, definit prin intermediul entropiei asociate repartiiei (pij)i,j 1, n n n pij I 0 = pij log pi p j i =1 j =1 Dup cum s-a demonstrat, avem: 0 I 0 log n 2 , cu semnificaiile cunoscute pentru cazurile extreme. Fie IA informaia coninut n modelul agregat (Pgh) 1 g, h G : G G Pgh I A = Pgh log Pg Ph g =1 k =1 Notnd: gj = (fluxurile din ramura agregat Sg la ramurile individuale j, msurate n fraciuni de output agregat al ramurilor), Cih = pij , 1 h G, 1 i n (fluxurile de la ramura i la ramura agregat Sh, exprimate ca mai sus) se obin imediat relaiile:
j S h iS g

ij

, 1 g G, 1 j n

g =1 iS g

gj

= p j ;

j S h G h=1

gj

= Pgh = pi
G G G

Cih = Pgh ;
G h =1

ih

Se constat c ponderea de informaie ntr-un proces de agregare este: I 0 I A = Ph I h + Pg I g + Pgh I gh


g =1 g =1 h =1

unde I.h este efectul coloan al ramurii agregate Sh: G P /P gh I h = Pgj log pgj / Pgh g =1 P h j S h gh j h Ig. este efectul linie al ramurii agregate Sg: G P C /P C gh I g = Pih log pih / Pgh , h =1 Pg iS g gh i g iar Igh este efectul celular ce se refer la fluxurile componentelor ramurii agregate Sg la componentele ramurii agregate Sh: pij pij / Pgh I gh = log gj / Pgh Cih / Pgh iS g j S h Pgh I.h, Ig., Igh pot fi interpretate ca informaii medii ale mesajelor indirecte. Deoarece apar cu coeficieni negativi n ecuaia de descompunere a informaiei, rezult c I0 IA 0 i, deci, n procesul de agregare informaia scade.

)(

Capitolul 7 ELEMENTE DE TEORIA SELECIEI I ESTIMAIEI 7.1. Noiuni generale


Orice cercetare statistic pornete de la o colectivitate sau populaie alctuit din elemente sau indivizi care au o caracteristic general i care se difereniaz prin anumite atribute. Elementele colectivitii (populaiei) le vom numi uniti. n studiul colectivitilor statistice, n majoritatea cazurilor suntem nevoii s studiem numai pri din ntreaga colectivitate. Ori, n acest caz, se pune n mod natural ntrebarea dac concluziile ce le obinem concord cu rezultatul ce l-am obine dac studiem ntreaga populaie. Apare astfel problema de a studia modul n care valorile tipice (pe baza crora tragem concluzii) ale colectivitii pariale investigate pot furniza informaii asupra valorilor tipice ale ntregii colectiviti. Vom presupune, n cele ce urmeaz, c urmrim o anumit caracteristic a colectivitii generale i c aceast caracteristic este descris de o variabil aleatoare X definit pe un cmp de probabilitate {, K, P}, n care elementele mulimii sunt tocmai elementele colectivitii generale, K este un corp borelian de pri ale lui , iar P este o probabilitate pe K. Dup cum se tie, dac este finit, atunci K coincide cu mulimea prilor lui , iar P este o repartiie discret uniform pe . Faptul c suntem obligai s cercetm numai o anumit parte din populaie este impus de natura concret a colectivitii. Astfel, dac numrul elementelor populaiei este infinit, n mod necesar nu putem cerceta dect un numr finit i deci obinem o informaie trunchiat. Dar, n cazul cnd numrul elementelor populaiei este finit, atunci cnd cercetarea calitii elementelor conduce la distrugerea lor, evident c se impune alegerea unui numr finit pentru cercetare. Dac inem seama de faptul c orice investigare (cercetare) implic i anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte din populaia total. Vom numi selecie (eantion) o colectivitate parial de elemente alese la ntmplare. Numrul elementelor dintr-o selecie l vom numi volumul seleciei. Spunem c o selecie este repetat, dac elementul ales la ntmplare este reintrodus n colectivitatea general naintea efecturii urmtoarei alegeri. Selecia este nerepetat dac, elementele alese nu se mai introduc n colectivitatea general. S efectum deci o selecie de volum n dintr-o colectivitate C i s notm cu x1, x2, , xn valorile de observaie. Acestea se refer la valorile unei variabile aleatoare X care d legitatea caracteristicii studiate. Considerate aposteriori, valorile de selecie x1, x2, , xn sunt valori bine determinate ale variabilei aleatoare X. Privite apriori, valorile X1, X2, , Xn pot fi considerate ca variabile aleatoare independente, identic repartizate cu variabila X, n cazul unei selecii repetate. Dac selecia este nerepetat, atunci variabilele X1, X2, , Xn sunt dependente, dependena fiind de tipul lanurilor cu legturi complete. Dac volumul colectivitii generale este suficient de mare iar volumul seleciei este suficient de mic, deosebirea dintre o selecie repetat i una nerepetat este nesemnificativ i, ca atare, n aplicaiile practice o selecie nerepetat se trateaz dup metodele seleciei repetate.

Orice funcie de datele de selecie o vom numi funcie de selecie sau statistic. S considerm acum o selecie de volum n: X1, X2, , Xn i s dispunem n ordine nedescresctoare aceste date: X(1) X(2) X(n) , unde X(1) = min {X1, X2, , Xn}. X(n) = max {X1, X2, , Xn}. Mulimea {X(1), X(2), , X(n)}, constituie o statistic a ordinei. Pornind de la selecia considerat, putem defini imediat amplitudinea de selecie. W ( X1 , X 2 ,..., X m ) = X ( m ) X (1) , care este evident o statistic (o funcie de selecie). Un rol deosebit de important l are n statistica matematic funcia empiric de repartiie, care se definete astfel: n Fn ( x ) = x , x R , unde n este volumul seleciei, iar nx este numrul valorilor de n selecie mai mici dect x. Funciei F(x) = P(: X() < x) i vom spune funcie teoretic de repartiie. Noi vom considera numai selecii repetate. Justificarea teoretic a metodei seleciei apare n mod natural din teorema lui V.I.Glivenko, cunoscut sub numele de teorema fundamental a statisticii matematice. Teorema lui Glivenko

Dac F(x) este funcie teoretic de repartiie, iar Fn(x) funcia empiric de repartiie, atunci: P lim sup Fn ( x ) F( x ) = 0 = 1 n xR Teorema lui A.N.Kolmogorov ofer posibilitatea de a evalua distana dintre Fn(x) i F(x). Teorem. Dac F(x) este o funcie continu, atunci: k k 2 2 lim P sup Fn ( x ) F( x ) , cu > 0 = K( ) = ( 1) e n < x < n 7.2. Momente de selecie Dac este dat selecia de volum n: X1, X2, , Xn , atunci vom numi momentul de selecie de ordinul r i-l vom nota M r , variabila aleatoare:
Mr =

1 n r Xj n j =1 1 n Xj n j =1

Pentru r = 1, obinem media de selecie: M1 = x =

S considerm media i dispersia variabilei aleatoare M r :

1 n 1 n M ( M r ) = M X rj = M ( X rj ) = M r ( X ) n j =1 n j =1

2 2 1 n 1 n r D 2 ( M r ) = M 2 ( M r ) M 2 ( M r ) = M X r M X j = j n j =1 n j =1

= =

1 n2 1 n2

1 1 M( X ) + n M( X ) M( X ) n M
n n j =1 n 2r j 2 j pk 2 r j r k 2 j =1

(X j)

1 n2

M( X ) M( X ) =
j pk r j r k

[ M ( X ) M ( X ) ] = n [ M
j =1 2 r j r j

2r

( X ) M r2 ( X )]

Aplicnd acum inegalitatea lui Cebev, obinem: M 2 r ( X ) M r2 ( X ) P Mr Mr ( X ) < 1 , de unde urmeaz c: n 2

justific nlocuirea n aplicaii a momentelor teoretice de ordinul r, cnd acestea exist, cu momentele empirice de ordinul r, dac n este suficient de mare.
Momentele centrate de selecie, r

lim P M r M r ( X ) < = 1, ceea ce ne conduce la:

M r n M r ( X ) , fapt care

Prin definiie: r =

1 n ( x j x )r n j =1 Pentru r = 2 se obine dispersia de selecie necorectat:

2 = 2 =

1 n ( x j x )2 n j=1

Ca i n cazul momentelor teoretice, putem exprima momentele centrate de selecie cu ajutorul momentelor obinuite de selecie i invers: r 1 n 1 n r r = ( 1) h C h X rj h X h = ( 1) h C h X h X rj h , r r n j=1 h =0 n j=1 h =0

deci r = ( 1) h C h X h M r h r
h =0

r( r 1) 2 X r 2 +... , r N * 2 Ne propunem acum s determinm repartiia asimptotic a mediei de selecie X . Teorem. Dac se efectueaz o selecie de volum n: X1, X2,, Xn, dintr-o colectivitate caracterizat de variabila aleatoare X pentru care exist M(X) = m, M[(X m)2] = 2 0, B xm Y N(0,1) / n n Xj Demonstraie: S notm Y j = , 1 j n n n Xj m Atunci: x = Y j si M(Y j ) = m j = M = n n j =1 i M r = r + rx r 1 +

X j m 2 2 M Y j m j = = M = 2 n n 3 X m 3 3 j = , 1 j n M Yj m j = 3 = M j n3 n3 S considerm condiiile lui Leapunov:


2 2 j

[(
(

)]

2 n n 2 j n j=1 Fiind ndeplinit condiia lui Leapunov, rezult conform teoremei: x 2 1 xm P < x = e z / 2 dz lim / n 2 n n mod analog, rezult: Teorem: Dac exist valorile medii M(Xr) = Mr(X); M(X2r) = M2r(X) i n

lim

n 3 j j= 2

1/ 3

1/ 2

= lim

3 2 n

1/ 3

1/ 2

= lim

1 1/ 6 = 0 n n

M Mr Mr ( X )

) , atunci M

M r Mr ( X )
2r

( X ) M r2 ( X ) n

1/ 2

B Y N(0,1) n

Pornind de la relaiile: 1 = 0
2 2 = M 2 M 1 3 3 = M 3 M 2 M 1 + 2 M 1 4 4 4 = M 4 4M 3 M 1 + 6M 2 M 1 3M 1

obinem: M ( 1 ) = 0
M ( 2 ) = M ( M 2 ) M ( M12 ) = n 1 2 ( X ) n

( n 1)( n 2) 3 ( X ) n2 M ( 4 ) = M ( M 4 ) 4 M ( M 3 M1 ) + 6 M ( M 2 M12 ) 3 M ( M14 ) = M ( 3 ) = M ( M 3 ) 3 M ( M 2 M1 ) + 2 M ( M13 ) = = ( n 1)( n 2 3n + 3) 3( n 1)( 2n 3) 2 4 ( X ) + 2 ( X ) 2 n n3

Aceste rezultate au loc oricare ar fi repartiia variabilei aleatoare X, ce caracterizeaz colectivitatea din care s-a efectuat selecia. Cu ajutorul momentelor de selecie putem pune n eviden i ali indicatori de selecie, ca: asimetria, excesul, coeficientul de corelaie, calculate pe baza datelor de selecie. Astfel, asimetria de selecie:

1 =

3 23/ 2

Excesul de selecie:

2 =

4 3 22

Coeficientul de corelaie de selecie (empiric): 1 n X j X Yj Y n j =1 = n 2 1 2 1 n X j X Yj Y n j =1 n j =1

)(

7.3. Selecia dintr-o populaie normal N(m, ) n multe situaii, ne intereseaz repartiia exact a diverselor statistici, Tn(X1, X2, ,Xn), chiar cnd n este mic. Toate rezultatele obinute anterior rmn valabile, inclusiv cele referitoare la repartiie asimptotic a unor funcii de selecie normate convenabil. Vom presupune acum c populaiile din care se efectueaz seleciile sunt normale N(m, ) i, n aceste condiii, vom cuta s stabilim repartiiile exacte ale celor mai importante funcii de selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit n practic este cel al erorilor de observaie ale msurtorilor, care, dup cum se tie, sunt repartizate dup o lege normal. Teorem. Dac X1, X2, ,Xn este o selecie de volum n dintr-o populaie caracterizat 1 n de o variabil aleatoare X N(m, ), atunci media de selecie X = X j are o lege de n j =1 repartiie N m, n Demonstraie. Cum Xj N(m, ), 1 j n, rezult c:

Xj ( t ) = e
Atunci:

itm

t 2 2 2

n it 1 X j t t 2 2 t 2 2 n it Xj n itm t n i n m 2 n 2 n j =1 itX n 2n = M e =e X (t ) = M (e ) = M e , = X j = e n j =1 j =1 j =1

care este funcia caracteristic a unei variabile aleatoare normale N m, n Urmeaz c densitatea de repartiie a variabilei X este:
n 2 fX (x) = e 2
n x m
2

x R

S artm c variabila abatere normat Z =

X m este repartizat normal N(0; 1). / n


n X

ntr-adevr:

Z (t ) = M (e
i t

itZ

it = Me

X m

it n m i t = Me e
2 2 2

t t t n t i nm i nm t n 2 2 n =e X e =e 2, =e care este funcia caracteristic a unei variabile normale N(0; 1).

nm

Deci densitatea de repartiie a variabilei Z =


z2

X m este: / n

1 2 f Z ( z) = e , z R 2 Teorem. Dac X1, X2, ,Xn este o selecie de volum n, dintr-o populaie normal N(m, ), atunci X i 2 sunt variabile aleatoare independente. Demonstraie. Putem presupune c m = 0, ntruct momentul de selecie 2 este invariabil la o schimbare a originii. 2 1 n ntruct: 2 = ( X k X ) , n k =1 s exprimm:

(X
k =1

X)

1 n = X 2 X X k + nX = X X k n k =1 k =1 k =1 k =1
n

2 k

2 k

ns:
n n Xk 2 Xk n n n 1 n2 1 = = X k2 n X k = n X1 kn2 1 + n 1 X 2 kn3 2 + k =1 k =1 2 2

+...+

1 ( X n1 X n )2 2
n n Xk Xk n 1 +...+ 1 ( X n1 X n ) 2 + n 2 X 2 k =3 = X1 k =2 n n 1 n 1 n2 n 2 2

Deci:

(X
k =1

X)

Urmeaz c:
n n Xk 2 Xk n n 1 1 n 1 n2 2 = = X k2 = n X k + n X1 kn2 1 + n 1 X 2 kn3 2 +...+ 2 ( X n1 X n ) k =1 k =1 2 2

n membrul doi al acestei egaliti avem o sum de n forme ptratice pozitiv definite, fiecare avnd rangul egal cu unu. Deoarece suma rangurilor acestor forme ptratice pozitiv definite este egal cu n, iar variabilele Xk N(0, ) , 1 k n, din teorema lui Cochran (pe care nu o vom demonstra)* rezult c variabilele:

* Teorema lui Cochran. Fie X1, X2, , Xn variabile aleatoare independente, repartizate normal N(0, ) i Q1, Q2, , QS , forme ptratice n X1, X2, , Xn avnd rangul k1, k2, , kS , respectiv. Dac:

Q j = X k2 , atunci
j =1 k =1

condiia necesar i suficient ca variabilele Q1, Q2, , QS s fie independente este ca k1+ k2 + + kS = n.

Y1 =

n Xk n 1 X1 k = 2 n n 1 n Xk n 2 X 2 k =3 n 1 n2

Y2 =

................................................... 1 Yn 1 = ( X n 1 X n ) 2 1 n Yn = Xk n k =1 sunt independente. 1 n1 Se constat imediat c: 2 = Yk2 i, prin urmare, rezult c X i 2 sunt n k =1 independente.
Teorem. Variabila aleatoare n2 are o repartiie 2 cu n 1 grade de libertate i parametrul , adic are densitatea de repartiie: , x 0 0 x n 1 n 1 1 1 f ( x) = x 2 e 2 , x > 0 n-1 n 1 n 1 2 2 2 n Variabila aleatoare 22 are o repartiie cu n 1 grade de libertate i parametrul = 1.

Variabila aleatoare = 2 are densitatea de repartiie:

, x 0 0 n-1 nx 2 2 f ( x ) = 2n 2 n 2 2 x e , x > 0 n-1 n 1 n 1 2 2 2 n 1 Y 2 + Y22 +...+Yn21 rezult: n2 = Yk2 , unde Y1, Y2,, Yn-1 Demonstraie. Din 2 = 1 n k =1 sunt variabile aleatoare independente, repartizate normal, de parametri M(Yk) = 0; D2(Yk) = 2. Deci n2 urmeaz o lege de repartiie X 2 cu n 1 grade de libertate i parametru . De asemenea: 2 n2 n 1 Yk = 2 k =1 Y Y M k = 0; D 2 k = 1 i, deci, variabila aleatoare n2 /2 urmeaz o lege de repartiie a crei densitate este:

, x 0 0 n 1 x 1 1 f ( x) = x 2 e 2 , x > 0 n-1 n 1 2 2 2 Pentru a obine densitatea de repartiie a variabilei = 2 , pornim de la funcia de repartiie: 0 , x 0 P( < x ) = = 2 P n2 < nx , x > 0

, x 0 0 y nx 2 n 3 2 1 = n 1 y 2 e 2 dy , x > 0 2 2 n 1 n 1 0 2 Derivnd, obinem: , x 0 0 n-1 2 nx 2 2 f ( x ) = n-1 2n x n 2 e 2 , x > 0 2 2 n 1 n 1 2

1 n 2 ( X k m) , unde X1, X2, , Xn este o selecie de n k =1 volum n dintr-o colectivitate normal N(m, ). Atunci: 2 n n *2 x k m = 2 k =1 X m independente, n membrul al doilea avem o sum de ptrate de variabile Yk = k S considerm acum *2 =

repartizate normal N(0, 1). Deci, variabila aleatoare

cu parametrul = 1 S considerm acum variabila aleatoare: 2 1 n s2 = ( X k X ) pe care o numim dispersia de selecie corectat. n 1 k =1 ntruct:

2 * 2

urmeaz o lege de repartiie (2n )

( X k X ) = ( X k m) ( X m) = ( X k m) 2( X m) ( X k m) +
2 2 2 k =1 k =1 k =1 k =1

+ n( X m) = ( X k m) n( X m)
2 2 k =1

rezult c: ( n 1)s 2

2
n

X m X m = k / n k =1
n 2

X m Dar, k k =1 independent de (2n ) .

este o variabil

2 (n)

X m iar / n

2 2 este o variabil (1)

Rezult c

( n 1)s 2

urmeaz o lege de repartiie (2n1) cu parametrul = 1

Am vzut c M ( (2n ) ) = n; D 2 ( (2n ) ) = 2 n cnd parametrul este 1. n Atunci M 22 = n 1 , de unde rezult:


n 1 2 n2 2 2 n 2 M ( 2 ) = ; D 2 = 2( n 1); D ( 2 ) = 2( n 1) i deci: n 4

2( n 1) 4 n2 n acelai timp: ( n 1)s 2 2 2 M = n 1 , care conduce la: M(s ) = 2 D 2 ( 2 ) =


( n 1)s 2 D2 = 2( n 1), 2

adic D 2 ( s 2 ) =

2 4 n 1

ntruct

xm (n - 1)s 2 N ( 0,1), iar = (2n 1) 2 / n Urmeaz c: xm xm / n = / n = x m are o lege de repartiie Student cu n 1 grade de s/ n (2n 1) ( n 1)s 2

n 1

( n 1) 2

libertate. S presupunem c dispunem de dou colectiviti, C1 i C2, caracterizate de o variabil aleatoare X1 N(m1, T1) respectiv X2 N(m2, T2), X1 i X2 independente. Din colectivitatea C1 se efectueaz o selecie de volum n1: X11, X12, , X 1n1 , iar din colectivitatea C2 se efectueaz o selecie de volum n2: X21, X22, , X 2 n2 . Pe baza acestor selecii, obinem mediile de selecie X 1 i X 2 , dispersiile de selecie:

s12 =

1 n1 X1 j x1 n1 1 j =1

2 , respectiv s2 =

1 n2 2 ( X 2k x2 ) . n2 1 k =1

Variabila aleatoare X 1 X 2 urmeaz o lege normal: 2 2 N m1 m 2 , 1 + 2 . De aici rezult c: n1 n 2 x1 x 2 ( m1 m2 ) N ( 0,1)

12
n1

2 2

Evident c: M ( X1 X 2 ) = m1 m 2

n2

D 2 ( X1 X 2 ) = D 2 ( X1 ) + D 2 ( X 2 ) =

12
n1

2 2

n2
1

2 Dac 12 = 2 = 2 , atunci variabila aleatoare

[( n 1)s
1

2 1

2 + ( n2 1)s2

are o

repartiie 2 cu n1 + n2 2 grade de libertate.

Rezult c variabila aleatoare: ( X1 X 2 ) ( m1 m2 )

12
n2

2 2

n2

2 2 ( n1 1)s12 + ( n2 1)s2 ( n1 1)s12 + ( n2 1)s2 ( n1 + n2 2) 2 n1 + n2 2 urmeaz o lege de repartiie Student cu n1 + n2 2 grade de libertate. n virtutea teoremei conform creia dac variabilele (2 1 ) , (2 2 ) sunt independente,

(X

X 2 ) ( m1 m2 )

n1 n2 n1 + n2

atunci variabilele aleatoare (2 1 ) / 1: (2 2 ) / 2 urmeaz o lege de repartiie Snedecor cu 1, 2 grade de libertate, respectiv, rezult c variabila: ( n1 1)s12 ( n 1) 2 s2 = 12 Fn1 1; n2 1 = 1 2 ( n2 1)s2 s2 2 ( n2 1) are o lege de repartiie Snedecor (este o variabil Fn1 1; n2 1 cu n1-1, n2-1 grade de libertate respectiv. n aplicaiile practice trebuie s se in seama de faptul c tabelele pentru repartiia Snedecor se construiesc pentru valori ale variabilei Fn1 1; n2 1 mai mari dect unu.
2 Ca atare este necesar s lum la numrtor s1 > s 2 i, totodat, s avem grij s nu 2 inversm ordinea gradelor de libertate. Inversiunea ordinei gradelor de libertate este echivalent cu: 2 s2 1 1 Fn1 1; n2 1 = 2 = 2 = s1 s1 Fn1 1; n2 1 2 s12 ceea ce justific de ce s-au construit tabele numai pentru F1 ,2 > 1 .

7.4. Elemente de teoria estimaiei n toate aplicaiile statisticii matematice, n economie, n tehnic i, n general, n tiinele experimentale este necesar s cunoatem legitatea dup care are loc evoluia fenomenului studiat, adic legea de repartiie a variabilei aleatoare prin intermediul creia este cuantificat caracteristica studiat a fenomenului. Adesea, cunotinele teoretice sau experiena practic n domeniul investigat ne dau dreptul s admitem c forma legii de repartiie este cunoscut. Pentru a utiliza efectiv o astfel de lege de repartiie, va trebui cunoscut care dintre funciile de repartiie din familia celor de o form dat este cea care trebuie efectiv utilizat. Cu alte cuvinte, trebuie precizat valoarea numeric a parametrului (sau valorile numerice ale parametrilor, n cazul unei legi de repartiie ce depinde de mai muli parametri). Pentru a nelege mai bine cum stau lucrurile, s dm unele exemple. Dac variabila aleatoare X reprezint numrul de apeluri la o central telefonic ntrun interval de timp determinat, ales ca unitate, atunci X are o lege de repartiie Poisson: x x X: a a e , x = 0, 1, 2, ... x! adic P( X = x; a ) = e a ax , pentru x = 0, 1, 2, ...; a > 0 i avem o lege de repartiie ce x! depinde de parametrul a > 0.

n cadrul unui proces de producie, o caracteristic important o constituie procentul p de rebut. Dac X este variabila aleatoare ce d numrul de produse necorespunztoare ce se obin ntr-o selecie repetat de volum n, atunci: P( X = x; p) = Cnx p x (1 p ) n x , x = 0, 1, 2, ..., n S considerm un alt exemplu, cu o variabil aleatoare care admite o densitate de repartiie. Fie T o variabil aleatoare ce reprezint durata de funcionare fr cderi a unei anumite componente. n multe situaii, variabila T este caracterizat de densitatea de repartiie: 1 t f T ( t ; ) = e , t > 0 0 , t0 >0 Este vorba, iari, de o lege de repartiie de form exponenial cu un singur parametru > 0 . n fine, dac X reprezint abaterile unei piese prelucrate de la cota nominal menionat n fia tehnologic, atunci X urmeaz o lege normal N(m, ) a crei densitate este:
1 2 f ( x; m, ) = e 2 , x R , 2 care este o lege de repartiie cu doi parametri (m, ) Rx(0, ). n toate aceste exemple s-a specificat forma, fr a se preciza care anume repartiie este adic valorile exacte ale parametrilor ce intervin. Ori de cte ori avem forma funciei prin care se exprim legea de repartiie, spunem c avem o problem specificat. Cunoaterea valorilor parametrilor conduce la cunoaterea complet a legii de repartiie adic avem o problem complet specificat. Operaia de evaluare a parametrilor poart numele de estimare a parametrilor, care se face pe baza unei selecii de volum n: X1, X2, , Xn, extras din populaia caracterizat de variabila aleatoare X, cu legea de repartiie specificat. Valorile parametrilor unic determinate pe baza seleciei X1, X2, , Xn, le vom numi estimaii punctuale. Valorile parametrilor le estimm cu ajutorul unei statistici (o funcie de datele de selecie) construite cu ajutorul seleciei X1, X2, , Xn i pe care o vom nota Tn(X1, X2, , Xn). Pentru a preciza ideile, vom presupune c selecia de volum n s-a efectuat dintr-o populaie caracterizat de o variabil aleatoare X care admite legea de repartiie dat de f(x; ), unde f(x; ) este o densitate de repartiie n cazul c exist densitate sau, n cazul unei variabile discrete este P(X = x; ). Cu ajutorul funciei de selecie Tn(X1, X2, , Xn) dorim s estimm parametrul (forma fiind cunoscut). Este clar c dispunem numai de informaie parial asupra populaiei i, ca atare, cu ct volumul de selecie crete, cu att informaia este mai bogat. Deci, Tn(X1, X2, , Xn) trebuie s se apropie tot mai mult de valoarea parametrului , fiind vorba aici de un proces de convergen. Evident c aceast convergen trebuie s aib loc n probabilitate, adic: lim P( Tn ( X1 , X 2 ,..., X n ) < ) = 1

( X m )2

Valoarea luat de Tn(X1, , Xn) pentru valori bine determinate ale variabilelor X1, X2, , Xn o vom numi estimaie a parametrului . Din cele prezentate rezult c funcia de estimaie este de natur teoretic, n timp ce estimaia este de natur empiric. P spunem c Tn(X1, X2, , Xn) este o estimaie Dac Tn(X1, X2, , Xn) n corect pentru parametrul .

Cum exist o infinitate de funcii Tn(X1, X2, , Xn) care converg n probabilitate ctre , pentru a mri precizia, vom recurge la convergene mai tari, deci care asigur convergena n probabilitate. O atare convergen este convergena n medie ptratic, care prezint avantajul c este comod n calcul. Funcia de estimaie Tn(X1, X2, , Xn) este o funcie de variabilele aleatoare independente X1, X2, , Xn i, deci, o variabil aleatoare cu o funcie de repartiie. Cum am presupus c lucrm cu convergen n medie ptratic, am admis implicit c Tn(X1, X2, , Xn) are momente de ordinul doi cel puin. Definiie. Spunem c statistica Tn(X1, X2, , Xn) este o estimaie nedeplasat a parametrului dac: M(Tn(X1, X2, , Xn)) = . Spunem c statistica Tn(X1, X2, , Xn) este o estimaie deplasat a parametrului , dac: M(Tn(X1, X2, , Xn)) = + h(n) Funcia h(n) pe care o vom numi deplasare a estimaiei are proprietatea c h( n) = 0. n Este clar c ntre eroarea de estimaie i deplasare exist o clar deosebire. n timp ce eroarea de estimare este Tn(X1, , Xn) - i este o variabil aleatoare, deplasarea h(n) = M(Tn(X1, X2, , Xn)) - este o funcie numeric, care depinde de volumul de selecie i eventual de parametrul de estimat i care reprezint o eroare sistematic n procesul de estimare. Dac deplasarea h(n) > 0 spunem c Tn(X1, X2, , Xn) este pozitiv deplasat, iar dac h(n) < 0 spunem c Tn(X1, X2, , Xn) este negativ deplasat. Din definiia funciei numerice deplasare, h(n), rezult importana cunoaterii n cazul seleciilor de volum mic. Exemple de estimaii nedeplasate sau deplasate putem pune imediat n eviden pe baza unor rezultate pe care le-am obinut deja. 1 n Aa de exemplu, Tn(X1, X2, , Xn) = X = X j este o estimaie nedeplasat a n j =1 mediei teoretice, m , a unei variabile aleatoare: M ( X ) = m De asemenea, frecvena relativ k este o estimaie nedeplasat a probabilitii, p, de n apariie a unui eveniment n cazul unei repartiii binomiale: np k 1 =p M = M (k ) = n n n Am vzut c, dac efectum o selecie dintr-o populaie normal i notm: 1 n 2 = ( X j X ) 2 (dispersia de selecie necorectat) i cu: n j =1

s2 =

1 n ( X j X )2 (dispersia de selecie corectat), atunci n 1 j =1


2

n Rezult c 2 este o estimaie negativ deplasat a dispersiei teoretice 2, n timp ce s2 este o estimaie nedeplasat a dispersiei teoretice 2 . Definiie. Spunem c Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul , dac: M(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn)) 0 n

M ( 2 ) =

, M(s 2 ) = 2

Spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru , dac: , h(n) n 0 M(Tn(X1, X2, , Xn)) = + h(n) D2(Tn(X1, X2, , Xn)) n 0 Utiliznd rezultate obinute anterior, se deduce c momentul de selecie de ordinul r, M r este o estimaie absolut corect pentru momentul teoretic de ordinul r, Mr(X). ntr-adevr: M( M r ) = Mr(X) M 2 r ( X ) M r2 ( X ) n 0 n n particular, X este estimaie absolut corect pentru M(X) = m. D2( M r ) = n 2 2( n 1) 4 D 2 ( s2 ) = n 0 D 2 ( 2 ) = n 0 n 1 n2 Urmeaz de aici c s2 este o estimaie absolut corect pentru 2, n timp ce 2 este numai corect pentru 2 (n selecii dintr-o populaie normal N(m, )). Este clar c vom prefera totdeauna s avem o estimaie nedeplasat pentru un parametru . Dar, pot exista, pentru acelai parametru , mai multe estimaii nedeplasate i atunci este natural s o preferm pe aceea care are dispersia mai mic, ntruct valorile statisticii Tn(X1, X2, , Xn) se vor grupa mai bine n jurul valorii . n felul acesta, ne punem problema existenei unei estimaii nedeplasate care s aib cea mai mic dispersie i ct de mic poate s fie dispersia unei estimaii. n acest sens, dm binecunoscuta teorem a minimului dispersiei, cunoscut i sub numele de teorema lui Rao-Cramer. 7.5. Teorema Rao-Cramer.Dac Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul din repartiia dat de f(x; ) a variabilei aleatoare X (discret sau continu), atunci: 1 , unde I( ) este cantitatea de informaie pe o D2(Tn(X1, X2, , Xn)) nI ( ) ln f ( x; 2 2 ln f ( x; ) observaie i are expresia: I ( ) = M = M 2
4

M(s2) = 2

M( 2 ) = 2

Demonstraie. Din relaia:

se obine, prin derivare n raport cu parametrul : f ( x; ) lnf(x; ) lnf(x; ) dx = 0 sau - f ( x; )dx = 0 , adic M = 0 Estimaia Tn(X1, X2, , Xn) fiind nedeplasat, obinem:
M(Tn(X1, X2, , Xn)) =

f ( x; )dx = 1

... Tn ( X1 , X 2 ,..., X n ) f ( x j ; )dx1... dx n =


j =1

Derivnd, i aici, n raport cu , se obine: n ln f ( x; ) n ... Tn ( X 1 , X 2 ,..., X n ) f ( x; )dx1... dx n = 1


j =1

j =1

Pe de alt parte: n ln f ( x j ; ) n ... f ( x j; )dx1... dx n = 0


j=1

j=1

nmulind aceast relaie cu i scznd din relaia anterioar, obinem: n ln f ( x ; ) n j ... [ Tn ( X1 , X 2 ,... X n ) ] f ( x j; )dx1... dx n = 1,

j=1

j=1

adic: n ln f ( x ; ) j M (Tn ( X1 , X 2 ,..., X n ) ) =1 j=1 Aplicnd inegalitatea lui Schwarz, se obine: n ln f ( x; ) 2 Tn ( X1 , X 2 ,..., X n ) 1 M j=1
n ln f ( x j ; ) D 2 ( Tn ( X1 , X 2 ,..., X n ) ) D 2 j=1 ntruct M(Tn(X1, X2, , Xn)) = i X1, X2, , Xn sunt independente, obinem: D2(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn)) n ln f(x j ; ) n 2 ln f(x j ; ) ln f(x; ) = D2 = nD 2 = D j =1 j =1 ln f(x; ) 2 = nI ( ) = nM Deci: D2(Tn(X1, X2, , Xn))
1 ln f(x; ) 2 nM

S artm c: ln f ( x; ) 2 2 ln f ( x; ) I ( ) = M = M 2 ntr-adevr, din: ns: 2 f ( x; )

f ( x; ) dx = 0

rezult:

2 f ( x; ) 2 dx = 0

2 f ( x; ) lnf ( x; ) ln f ( x; ) = f ( x; ) = f ( x; ) + 2 2

lnf ( x; ) f ( x; ) 2 ln f ( x; ) lnf ( x; ) + = f ( x; ) + f ( x; ) 2
Deci:

2 ln f ( x; ) ln f ( x; ) f ( x; )dx + f ( x; )dx = 0 2 2
i, deci: ln f ( x; ) 2 2 ln f ( x; ) M = M 2
Definiie. Spunem c estimaia Tn(X1, X2, , Xn) este eficient dac: 1 D2(Tn(X1, X2, , Xn)) nI( )

Fie acum Tn(X1, X2, , Xn) o estimaie absolut corect oarecare. Atunci, vom numi eficien a lui , raportul: 1 nI ( ) e(Tn(X1, X2, , Xn)) = 2 D (Tn (X 1 , X 2 , ..., X n ) ) i Tn(X1, X2, , Xn) este Este evident c: 0 e (Tn(X1, X2, , Xn)) 1 eficient dac e(Tn(X1, X2, , Xn)) = 1. Cum eficiena este o funcie de volumul n a seleciei i cum la limit trebuie s obinem cea mai mare informaie posibil, rezult c, dac: lim e( Tn (X1 , X 2 , ..., X n )) = 1 , atunci estimaia Tn(X1, X2, , Xn) este asimptotic
n

eficient. Ilustrm noiunea de eficien a unei estimaii prin dou exemple prin care s cuprindem o repartiie care admite densitate de repartiie i o repartiie de tip discret. 1 n (1) S se arate c Tn(X1, X2, , Xn) = X = X j este o estimaie eficient pentru n j =1 parametrul m al repartiiei normale N(m; ); (2) S se arate c: Tn(X1, X2, , Xn) = X parametrul al unei repartiii Poisson. (P(X = x / ) = e
Soluie

este

estimaie

eficient

pentru

x
x!

, x = 0, 1, 2, ... )

(1) Din consideraii anterioare, tim c: M ( X ) = m; D 2 ( X ) = Rmne s artm c: D 2 ( X ) =


1 f ( x; m, ) = e 2
( X m )2 2 2

2
n

1 nI ( )

, x R, > 0

ln f ( x; m, ) = ln( 2 )

( X m) 2 2 2

X m 2 ln f ( x; m, ) 2 ln f ( x; m, ) X m = ; M = = M 2 m 2 m 1

M ( X m) 2 =

2 1 = 2 4
1 1 2 = = i deci: nI ( m) n / 2 n

I ( m) =

Cum D 2 ( X ) = m.

1 , nI ( m)

rezult c X este estimaie eficient pentru parametrul D2 ( X ) = n n

(2) Pentru o repartiie Poisson, D 2 ( X ) =

ln P( X = x | ) = ln e

x
x!

= + x ln ln x !

ln P( X = x ) x = 1 +
x 2 x2 2 x 1 I ( ) = M 1 = M 2 2 + 1 = 2 M ( X 2 ) M ( X ) + 1 = 1 2 + 2 +1 = 2

1 , rezult eficiena estimaiei X pentru parametrul . nI ( ) Am vzut, aadar, cum putem s analizm estimaiile parametrilor n funcie de proprietile pe care le au, s le clasificm. Vom cuta acum s punem n eviden modaliti sau metode de obinere a unor estimaii. n cele ce urmeaz, ne vom opri asupra a dou metode de obinere a estimaiilor pe care le vom numi estimaii punctuale: metoda momentelor i metoda verosimilitii maxime. Cum D 2 ( X ) = 7.6. Metoda momentelor Am vzut c momentele de selecie de ordinul r sunt estimaii absolut corecte ale momentelor teoretice de acelai ordin: M ( Mr ) = Mr ( X )
M 2 r ( X ) M r2 ( X ) n 0 n Este natural ca, pentru n suficient de mare, s lum n locul momentului teoretic momentul empiric de acelai ordin. S presupunem c am efectuat o selecie de volum n:x1, x2, , xn, dintr-o populaie caracterizat de variabila aleatoare X care are legea de repartiie dat de f ( x; 1 , 2 ,..., k ) , unde f ( x; 1 ,..., k ) este densitatea de repartiie, dac aceasta exist, sau P( X = x; 1 , 2 ,..., k ) , dac variabila X este de tip discret. Am considerat, desigur, cazul cnd variabila X este unidimensional i legea depinde de k parametri. Admitem c variabila aleatoare X are moment cel puin pn la ordinul k inclusiv. Atunci: M s ( X 1 , 2 ,..., k ) sunt funcii de parametrii necunoscui 1 , 2 ,..., k . Alctuind sistemul de ecuaii: M s ( X 1 , 2 ,..., k ) = M s , 1 s k , D2 ( Mr ) =
1 n s Xj n j=1 i presupunnd c sistemul admite soluii reale, se obin: $ $ s = s ( M1 , M 2 ,..., M k ); 1 s k care sunt estimaiile parametrilor 1 , 2 ,..., k . prin metoda momentelor. S observm c nu este necesar s se ia neaprat primele k momente, din contr, putem lua alte momente, inclusiv momente centrate, care s constituie ns un sistem de k ecuaii cu necunoscutele 1 , 2 ,..., k . i din care s se obin ct mai uor posibil soluia cutat. Vom da acum unele exemple care s ilustreze metoda propus. Exemplu. S se estimeze prin metoda momentelor, pe baza unei selecii de volum n:x1, x2, , xn, extras dintr-o populaie caracterizat de: unde M s =

1 , dac x [1 , 2 ] f ( x; 1 , 2 ) = 2 1 , a parametrilor 1 , 2 . 0 , dac x [1 , 2 ] Soluie. ntruct + 2 2 + 1 2 + 22 ; M2 ( X ) = 1 M ( X 1 , 2 ) = 1 , 2 3 avem sistemul de ecuaii: 1 + 2 2 = M1 , 2 + + 2 1 1 2 2 = M2 3 a crui soluie este: 2 2 $ $ 1 = M 1 3 M 2 M 1 ; 2 = M 1 + 3 M 2 M 1 , sau

$ 1 = x s

3( n 1) ; n

$ $ 2 = x + s

3( n 1) n

Lungimea intervalului se estimeaz prin: 2 1 = 2s

3( n 1) n La aceleai rezultate se ajunge mai simplu, dac lum sistemul: 1 + 2 = 2 x 2 , ( 2 1 ) = 2 = M 2 M12 12

sau:

1 + 2 = 2 x 2 1 = 2 32

i se continu, ajungndu-se la acelai rezultat. Exemplu. Estimarea parametrilor a, b din repartiia Beta, care are densitatea: , x (0, 1) 0 ( a, b) f ( x; a , b ) = , x a 1 (1 x ) b1 , x (0, 1) ( a ) ( b) a > 0, b> 0.

Prin calcul direct, se obine: a M1 ( X | a , b ) = a+b ab D 2 ( X | a, b) = 2 ( a + b) ( a + b + 1) $ $ Estimaiile a, b se obin rezolvnd sistemul de ecuaii:
a a + b = X ab = s2 2 ( a + b) ( a + b + 1)

De aici rezult: X(1 - X) X 2 (1 X ) $ $ a= X ; b = (1 - X) 1 2 2 s s Exemplu. Cazul unei repartiii normale N(m; ). Dup cum se tie: M(X| m, ) = m M2(X| m, ) = m2 + 2 i avem, astfel, de rezolvat sistemul de ecuaii: $ m = X m=X care conduce la: 2 2 $ 2 = M 2 X 2 = 2 m + = M 2 7.7.Metoda verosimilitii maxime Metoda momentelor pe care am prezentat-o este simpl i uor de aplicat. Prezint, totui, o serie de neajunsuri n ceea ce privete calitile estimatorilor obinui pe aceast cale. De aceea, statisticienii au cutat alte metode de obinere a estimaiilor. Una dintre acestea este metoda verosimilitii maxime elaborat R.A.Fisher i prezint avantajul unui plus de eficacitate. S considerm pentru nceput cazul unui singur parametru i c legea de repartiie a variabilei X ce caracterizeaz populaia din care s-a efectuat selecia de volum n, x1, x2, , xn este dat de f(x; ). Atunci, repartiia vectorului aleator (x1, x2, , xn) este:
P(x1, x2, , xn; ) =

f ( x ; ) , pe care o considerm ca funcie de .


j j =1

Valorile x1, x2, , xn fiind considerate ca date, ele fiind rezultatul experienei, vom considera ca valoare cea mai verosimil a parametrului , valoarea pentru care probabilitatea P(x1, x2, , xn; ) devine maxim, ceea ce ne conduce la faptul c estimaia de verosimilitate maxim , este soluia ecuaiei: P( x1 , x 2 ,..., x n ; ) =0 Funcia P(x1, x2, , xn; ) poart numele de funcie de verosimilitate. ntruct lnP(x1, x2, , xn; ) i P(x1, x2, , xn; ) sunt n acelai timp cresctoare sau descresctoare, estimaia de verosimilitate maxim se obine ca soluie a ecuaiei. ln P( x1 , x 2 ,..., x n ; ) =0

Funcia L(x1, x2, , xn; ) = ln P(x1, x2, , xn; ) =

ln f ( x ; )
j j =1

vom

numi tot funcie de verosimilitate. n cazul cnd repartiia unidimensional depinde de mai muli parametri, f ( x; 1 , 2 ,..., k ) , funcia de verosimilitate devine: L( x1 , x 2 ,..., x n ; 1 , 2 ,..., k ) , iar estimaiile de verosimilitate maxim se obin ca soluii ale sistemului de ecuaii: L(x1 , x 2 ,... , x n ; 1 , 2 ,.., k ) = 0 ; 1 j k

$ $ Rezolvnd sistemul, se obin: j = j ( x1 , x 2 ,..., x n ), 1 j k , estimaii de

verosimilitate maxim. L Ecuaiile = 0, 1 j k

poart numele de ecuaii de verosimilitate.

Fr a intra n amnunte, vom sublinia unele proprieti ale estimaiilor de verosimilitate maxim, care le recomand pentru aplicaii. n cazul unui singur parametru , estimaia de verosimilitate maxim este consistent n probabilitate, dar, pentru valori mari ale lui n, repartiia ei este aproximativ normal, cu $ i cu dispersia: media M( ) = 1 $ D 2 ( ) = ln f ( x; ) 2 nM
$ Altfel spus, estimaia obinut prin metoda verosimilitii maxime este asimptotic eficient, n sensul c nu exist o alt estimaie asimptotic normal cu dispersie mai mic. Dac parametrul admite o estimaie eficient, atunci aceasta se obine n mod unic, rezolvnd ecuaia de verosimilitate. Exemple. Pe baza unei selecii de volum n, s se estimeze parametrul din repartiia Poisson: e x P( X = x ) = , x = 0,1,2, ... x!

P(x1 , x 2 ,..., x n ; ) = P( X = x j ; ) =
j =1 j =1

e x e n j =1 = n x! xj !
j =1 n

xj

lnP(x1, x2, , xn; ) = L(x1, x2, , xn; ) = n + x j ln ln ( x j !)


j =1 j =1

L( x1 , x 2 ,..., x n ; ) j=1 = n +
iar n+

x
j=1

=0

are soluia: n $=1 xj = x n j=1

2 L( x1 , x 2 ,..., x n ; ) j=1 = 2 2
n

x x

$ 2 L( x1 , x 2 ,..., x n ; ) j=1 = 2 <0, 2 x $ adic asigur maximul funciei de verosimilitate. Cazul repartiiei:
P(X = x; p) = px (1-p)1-x , x = 0, 1 1 0 X: , 0< p < 1 p q

Funcia de verosimilitate: L( x1 , x s ,..., x n ; p ) = x j ln p + (1 x j ) ln(1 p )


j =1 n

]
,

L( x1 , x s ,..., x n ; p ) = p
care are soluia: 1 n $ p = xj n j =1

xj
j =1

n xj
j =1

1 p

=0

n n xj n xj , 2 L( x1 , x 2 ,..., x n ; p ) j =1 j =1 <0 = 2 + 2 p p (1 p ) 2

ntruct:

x
j =1

n.

Cazul repartiiei normale N(m, ):


1 2 f ( x; m, ) = e 2 , x R, > 0 2 Funcia de verosimilitate: ( X m )2

2 ( xm ) 1 2 j=1 P(x1 , x 2 ,..., x n ; m, ) = e n ( 2 )

L( x1 , x 2 ,..., x n ; m, ) = n ln 2 n ln

1 2
2

(x m)
j=1

L( x1 , x 2 ,..., x n ; m, ) 1 n = 2 ( x j m )2 m j=1 n 1 n L( x1 , x 2 ,..., x n ; m, ) = + 3 ( x j m )2 j=1


Sistemul de ecuaii de verosimilitate devine:
n ( x j m) = 0 j =1 n n + 1 ( x m) 2 = 0 , 2 j =1 j cu soluia:
$ m=

1 n xj = x n j =1 1 n ( x j x ) 2 = 2 n j =1

$ 2 =

$ $ S artm c ( m, 2 ) este punct de maxim pentru L. 2 L( x1 , x 2 ,..., x n ; m, ) n = 2 <0 2 m 2 L( x1 , x 2 ,..., x n ; m, ) n 3 n = 2 4 ( x j m) 2 2

j =1

2 L( x1 , x 2 ,..., x n ; m, ) 2 n = 3 ( x j m) m j =1
Urmeaz c:

n 2 2L 2L $ 2 3 ( x j m) 2 $ $ j =1 m = = m 2 n n 3 n 2L 2L $) $ 3 (x j m 4 ( x j m) 2 2 2 $ $ $ j =1 j =1 m
n

Dar,

(x
j =1

$ $ $ m) = nm nm = 0

i atunci: n 2 $ = 0

0 3 n 4 2 $ $

(x
j =1

$ m) 2

n $ 2

0
n

3n 2 $ $ 4

n 3n 2n + = >0 $ $ $ 4 4 4

$ $ deci, ( m, 2 ) este punct de maxim pentru L.

Cazul repartiiei normale bidimensionale f ( x , y; m1 , m2 , 1 , 2 , ) =

2 1 2 1 2 L( x1 , y1 ;...; x n , y n ; m1 , m2 , 1 , 2 , ) =
=

1 ( x m1 )2 2 ( x m1 )( y m2 ) ( y m2 )2 + 2 1 2 2 1 2 12

1 1 2

1 2 1

( x j m1 ) 2
j =1

1 2

( x j m1 )( y j m2 ) +
j =1

2 2 j =1

( y

m2 ) 2

n ln(1 2 ) ln( 2 ) n 2 L L L L = 0; = 0; = 0; = 0; Rezolvnd sistemul: m1 m2 1 2 se obin estimaiile de verosimilitate maxim: 1 n $ $ 12 = ( x j x ) 2 m1 = x n j =1 n ln 1 n ln 2

L = 0,

$ m2 = y

$ 2 =

1 n ( y j y )2 n j =1

1 n ( x j x )( y j y ) n j =1 $ = $ $ 1 2

7.8. Intervale de ncredere S considerm variabila aleatoare X, caracterizat de familia de repartiii f(x; ), ce depind de parametrul , a crui valoare bine determinat nu o cunoatem i pe care dorim s-o estimm, pe baza unei selecii de volum n:x1, x2, , xn . n metoda punctual de estimare se caut o funcie de selecie Tn(x1, x2, , xn) pe P care, n cazul cnd Tn(x1, x2, , xn) , o numim funcie de estimaie a parametrului . n ntruct Tn(x1, x2, , xn) variaz ca precizie, este de dorit s dispunem de o indicaie asupra preciziei ei, iar metoda intervalelor de ncredere pe care o punem n eviden acum are astfel de virtui. S presupunem c, pe baza seleciei menionate, se pot determina dou funcii de selecie, 1 ( X 1 , X 2 ,..., X n ) i 2 ( X 1 , X 2 ,..., X n ) astfel nct probabilitatea inegalitii: 1 ( X1 , X 2 ,..., X n ) 2 ( X1 , X 2 ,..., X n ) este independent de i P( 1 ( X 1 , X 2 ,..., X n ) 2 ( X 1 , X 2 ,..., X n ) ) = ( independent de ) Numrul se ia foarte apropiat de 1, ceea ce nseamn c inegalitatea 1 2 este ndeplinit n majoritatea cazurilor. Pentru o selecie efectuat 1 ( X 1 , X 2 ,..., X n ) i 2 ( X 1 , X 2 ,..., X n ) iau valori bine determinate i prin urmare am gsit un interval [ 1 ( X 1 , X 2 ,..., X n ) ; 2 ( X 1 , X 2 ,..., X n ) ] care acoper parametrul cu o probabilitate apropiat de 1. Cu ct lungimea acestui interval este mai mic i probabilitatea este mai apropiat de 1, cu att vom avea o indicaie mai precis asupra valorii parametrului . Intervalul [ 1 ( X 1 , X 2 ,..., X n ) ; 2 ( X 1 , X 2 ,..., X n ) ] este numit interval de ncredere, iar numrul nivel de ncredere. Numrul = 1 - este numit nivel de semnificaie. Subliniem faptul c afirmaia intervalul [ 1, 2] acoper valoarea parametrului cu probabilitatea este corect, cci este fixat (dei necunoscut) iar 1, 2 capetele intervalului i variabile aleatoare, depinznd de variabilele de selecie x1, x2, , xn . Vom prezenta acum dou cazuri utilizate frecvent n aplicaii pentru determinarea unui interval de ncredere. 1. Exist o funcie de datele de selecie x1, x2, , xn i de parametrul , U(x1, x2, , xn; ), cu proprietile: a) U(x1, x2, , xn; ) este continu i strict monoton n raport cu ; b) Funcia de repartiie a variabilei aleatoare U(x1, x2, , xn; ) nu depinde de sau de ali parametri necunoscui. Atunci, putem determina dou numere 1 ( ) i 2 ( ) astfel nct: P 1 ( ) U ( x1 , x 2 ,..., x n ; ) 2 ( ) =

S folosim acum faptul c U(x1, x2, , xn; ) este continu i strict monoton n raport cu . Pentru a ne fixa ideile, s presupunem c este strict cresctoare n raport cu . n acest caz, evenimentul: [ 1() U(x1, x2, , xn; ) 2()] este echivalent cu evenimentul: [ 1(x1, x2, , xn; ) 2(x1, x2, , xn; n, )] i, prin urmare, au aceeai probabilitate : P [ 1(x1, x2, , xn; n, ) 2(x1, x2, , xn; n, )] = Am determinat astfel un interval: [ 1(x1, x2, , xn; n, ); 2(x1, x2, , xn; n, )] care acoper parametrul cu probabilitatea fixat . 2. S considerm o funcie de selecie U(x1, x2, , xn) care are funcia de repartiie: G(x; ) = P (U(x1, x2, , xn) < x). Presupunem c funcia de repartiie G(x; ) admite densitatea de repartiie g(x; ).

Fie acum r, s dou numere reale pozitive, r 0, s 0, astfel nct r + s = 1 i a1( ; ), b1( ; ) dou funcii de i pentru care au loc egalitile:
a1 ( , )

g( x; )dx = r(1 );

b1 ( , )

g( x; )dx = s(1 )

Dac [a, b] este intervalul n care funcia de selecie U(x1, x2, , xn) ia valori, atunci:

g( x; )dx = 1
a

n baza proprietilor numerelor r, s i a funciilor a1( ; ), b1( ; ), rezult:


b1 ( , ) a1 ( , )

g( x; )dx = g( x; )dx
a

a1 ( , )

g( x; )dx

b1 ( , )

g( x; )dx = 1 r(1 ) s(1 ) =

Urmeaz de aici c: P(a1( ; ) U(x1, x2, , xn) b1( ; ) = i, deci, probabilitatea inegalitii U1( ; ) U(x1, x2, , xn) b1( ; ) este independent de . S presupunem c funciile a1( ; ) i b1( ; ) sunt continue i strict cresctoare n raport cu . Atunci, exist un numr A(x1, x2, , xn; ) astfel nct inegalitile: A(x1, x2, , xn; ) a1( ; ) U(x1, x2, , xn) s fie echivalente; analog, exist un numr B(x1, x2, , xn; ) astfel nct inegalitile: B(x1, x2, , xn; ) U(x1, x2, , xn) b1( ; ) s fie echivalente. Dar, atunci, inegalitatea: a1( ; ) U(x1, x2, , xn) b1( ; ) este echivalent cu: A(x1, x2, , xn; ) B(x1, x2, , xn; ) Rezult c am determinat un interval [A(x1, x2, , xn; ); B(x1, x2, , xn; )] care acoper cu o probabilitate , parametrul . n cazul n care repartiia teoretic a variabilei aleatoare de selecie U(x1, x2, , xn) este discret, n loc s considerm un interval de ncredere care acoper cu probabilitatea parametrul , vom considera un interval de ncredere care acoper parametrul cu o probabilitate cel puin egal cu . n acest caz, egalitile:
a1 ( , )

g( x; )dx = r(1 );

b1 ( , )

g( x; )dx = s(1 )
x=b1 ( , )

devin:
a1 ( , )

x =a

P(U = x; ) r (1 );

P(U = x; ) s(1 )

Intervale de ncredere pentru parametrii m i 2, dintr-o repartiie normal N(m, )

Pentru a construi un interval de ncredere pentru parametrul m vom distinge dou cazuri: cunoscut i necunoscut.
Intervalul de ncredere pentru parametrul m cnd este cunoscut. Considerm funcia de selecie: X m U(X1, X2, , Xn;n, m) = / n

X m / n este normal N(0; 1) i, deci, funcia ei de repartiie este independent de parametrul m. X m este continu i strict descresctoare n variabila m. Pe de alt parte / n Din faptul c U(x1, x2, , xn, n, m) are o repartiie normal N(0, 1) urmeaz c, pentru orice (0, 1), apropiat de 1, putem determina dou numere z1, z2 astfel nct: z 1 2 x2 /2 X m P z1 z2 = dx = ( z 2 ) ( z1 ) = , e / n 2 1 z dar evenimentul: X m z1 este echivalent cu: z2 / n Selecia fiind efectuat dintr-o proporie normal N(m, ), variabila aleatoare z1

X m z2

, care este echivalent cu:

n n m x z1 Deci: P x z 2 = n n

x z2

m x z1

i am determinat un interval:

care, cu probabilitatea , acoper parametrul m. x z 2 n ; x - z1 n Pentru fixat, se pot determina o infinitate de numere z1, z2 care s satisfac condiia (z2) - (z1) = Pe noi ne intereseaz s obinem o precizie ct mai bun i aceasta se obine cnd lungimea intervalului este minim. Urmeaz s determinm minimul funciei:
L( z1 , z 2 ) =

( z 2 z1 )

(lungimea intervalului de ncredere),

cu legtura: z 1 2 x2 /2 e dx = 2 1 z Aplicnd metoda multiplicatorilor lui Lagrange, cutm minimul funciei: 1 z2 x 2 / 2 H ( z1 , z 2 , ) = ( z 2 z1 ) + e dx - n 2 z1 H H = 0; =0 rezult: Dar z1 z 2

, n n 2 adic z12 = z 2 sau z1= z2. Cum > 0, z1 = z2 nu convine i, deci, z1 = -z2; z2 = z . n acest caz, intervalul de ncredere devine: x z n ; x + z n ; z se determin din relaia: (z) - (-z) = , de unde urmeaz:
e1 e

z /2 z e = 0 i + e n 2 n 2 2 z / 2 2 z / 2

2 1
2

2 2 /2

=0

i de aici:

2 2

2(z) 1 = , sau (z) =


Deci: z este z
1

1+ 1+1 = = 1 2 2 2 1 cvantila unei repartiii normale N(0, 1). 2

n final, intervalul de ncredere pentru m, cu nivelul de ncredere = 1 - este: ; x+z x z1 1 n n 2 2


Intervalul de ncredere pentru m cnd este necunoscut.

n acest caz, se consider statistica: X m T(x1, x2, , xn; n, m) = , s/ n Dup cum am vzut, variabila

s2 =

1 n ( x j x )2 n 1 j =1

X m urmeaz o lege de repartiie Student cu n-1 s/ n X m grade de libertate. Dar legea de repartiie Student nu depinde de m i n plus este s/ n funcie continu i strict descresctoare de m. Atunci, pentru un dat, se pot determina numerele t1 i t2 astfel nct: n n/ 2 t2 2 X m t2 P t1 t2 = dt = 1 + n 1 n 1 s/ n t1 ( n 1) 2 X m t2 este echivalent cu evenimentul: s/ n s s x t2 m x t1 , rezult c: n n s s P( x t 2 m x t1 ) = i, deci, am determinat un interval de ncredere: n n s s care, cu probabilitatea , acoper parametrul m. x t 2 n ; x t1 n Ca i n cazul anterior, punem condiia ca lungimea intervalului s fie minim, cu restricia: n n t2 2 t2 2 1 + dt = n 1 n 1 t1 ( n 1) 2 Aplicnd, i de data aceasta, metoda multiplicatorilor lui Lagrange se obine din: n n t2 2 2 2 s t H ( t1 , t 2 , ) = ( t 2 t1 ) + 1 + dt n 1 n ( n 1) n 1 t1 2 H ( t1 , t 2 , ) H ( t1 , t 2 , ) i = 0, =0 t1 t2 Cum evenimentul t1

c t1 = - t2 ,

t2 = t

iar intervalul de ncredere devine:

s s ; x+t x t1 ;n 1 1 ; n 1 n n 2 2
Intervalul de ncredere pentru 2

Se consider statistica U(X1, X2, , Xn ; 2) = o lege de repartiie (2n1) (cu n-1 grade de libertate).

( n 1)s 2

care, dup cum se tie, are

2 Atunci pentru = 1 - fixat se pot determina dou numere 12 i 2 astfel nct:

( n 1)s 2 2 P 12 2 = 2

1 n 2 2
n 2

2 2

12

x2 e

x 2

dx =

Dar funcia de repartiie a variabilei ( n 1)s


2

( n 1)s 2

este independent de 2 i n plus

este funcie continu i strict descresctoare de 2 ceea ce ne conduce la faptul c ( n 1)s 2

evenimentul:

12
2 2

2 2 este echivalent cu evenimentul:

( n 1)s

( n 1)s 2

12
adic am determinat un interval:

Deci: P(

( n 1)s 2 ( n 1)s 2 )=, 2 2 X2 X12

( n 1)s 2 ( n 1)s 2 ; 2 12 2

care, cu o probabilitate , acoper parametrul 2.

2 S stabilim valorile 12 i 2 . Densitatea de repartiie a unei variabile X2 nemaifiind simetric, i lund numai valori pozitive adoptm urmtoarea regul:

P 2 < 12 = f(x)

2 P 2 < 2 =

numit i regula cozilor egale.

1- /2 0 /2 x

2/2

12 / 2

Din modul cum s-a construit tabelele pentru repartiia (2n ) , se obine:
P 2 < 12 =

( (

) )

, deci 12 = 2/ 2; n 1

2 Urmeaz c intervalul de ncredere de nivel = 1 - este: ( n 1)s 2 ( n 1)s 2 ; 2 2/ 2; n-1 1 / 2; n-1 Dac ne intereseaz intervalul de ncredere pentru , atunci inem seama de faptul c n 1 s are densitatea de repartiie: variabila

2 P 2 < 2 = 1

2 , deci 2 = 12 / 2; n 1

x0 0 , x2 1 n 2 x e 2 , x >0 f ( x ) = n 3 2 2 n 1 2 Pentru = 1 - fixat, se pot determina dou numere U1 , U2 astfel nct: U2 1 n 1 s n2 x 2 / 2 P U 1 U 2 = n 3 x e dx = n 1 U1 2 2 2 Se obine astfel intervalul: n 1 s n 1 s ; care acoper cu o probabilitate valoarea parametrului U1 U2

Valorile numerice se pot determina cu ajutorul cuantilelor unei variabile X2. S presupunem acum c dispunem de dou selecii: x11, x12, , x1n1 efectuat dintr-o populaie N(m1, 1) i x21, x22, , x 2 n2 efectuat

dintr-o populaie N(m2, 2). Pe baza acestor selecii, obinem: 1 n1 1 n1 2 x1 = x1 j s1 = x1 j x1 n1 j =1 n1 1 j =1

1 x2 = n2

x
j =1

n2

2j

1 n2 s = x2 j x2 n2 1 j =1
2 2

Intervalul de ncredere pentru m1 m2 n cazul cnd 1, 2 sunt cunoscute

Se consider statistica: U X11 ,..., X1n1 , X 21 ,..., X 2 n 2 ; m 1 m 2 =

X1 X 2 ( m1 m 2 )

12

n1 n 2 care este o variabil normal N(0; 1), de unde urmeaz, parcurgnd punct cu punct calea urmat n cazul unei singure selecii, intervalul de ncredere.

2 2

2 12 2 + ; x1 x 2 z 1 n1 n2 2

x1 x 2 z

12
n1

2 2

n2

Intervalul de ncredere pentru parametrul m1 m2 n cazul cnd 1, 2 sunt 2 necunoscute, dar 12 = 2 = 2

Se consider statistica:
X1 X 2 ( m1 m 2 ) 1 1 + n1 n 2

, 2 ( n1 1)s1 + ( n 2 1)s 2 2 n1 + n 2 2 care are repartiie Student cu n1 + n2 2 grade de libertate. Atunci procednd ca n cazul unei singure selecii dintr-o populaie normal N(m, ), obinem pentru un fixat, intervalul de ncredere:
x1 x 2 t x1 x 2 + t
1 ; n1 + n 2 2 2

U X11 ,..., X1n1 , X 21 ,..., X 2 n 2 ; m 1 m 2 =

2 n 1 + n 2 ( n 1 1)s1 + ( n 2 1)s 2 2 ; n1n 2 n1 + n 2 2 2 n 1 + n 2 ( n 1 1)s1 + ( n 2 1)s 2 2 n1n 2 n1 + n 2 2

1 ; n1 + n 2 2 2

Acest interval acoper cu probabilitatea valoarea m1 m2 .

12 Intervalul de ncredere pentru raportul 2 . 2


Am vzut c funcia de selecie:
2 U ( X 11 , X 12 ,..., X 1n1 , X 21 , X 22 ,..., X 2 n2 ; 12 , 2 ) =

12
2 2 2 s2

s12

are o repartiie Snedecor cu n1-1, n2-1 grade de libertate. Am notat: 2 s2 Fn1 1, n2 1 = 2 12 i am vzut c funcia de repartiie este independent de 1, 2, 12 s2 iar Fn1 1, n2 1 ca funcie de 2 1
2

este continu i strict cresctoare.

Atunci, pentru = 1 - dat, se pot determina dou numere F(1) i F(2), astfel nct: P F (1) Fn1 1, n2 1 F ( 2 ) = 1

n ipoteza c adoptm cozi egale, se obine: P F = 1 Fn1 1, n2 1 F n1 1, n2 1 ;1 n1 1, n2 1 ; 2 2

Cum evenimentul: 2 s2 2 12 F F 2 n1 1, n2 1 ;1 n1 1, n2 1 ; 2 1 s2 2 este echivalent cu evenimentul:

s1 s2 F

n1 1, n2 1;1

s 1 1 1 2 s2 F

n1 1, n2 1;

rezult c am obinut intervalul de ncredere: 2 2 s1 1 1 s1 ; s F , 2 s2 F n1 1, n2 1;1 n1 1, n2 1; 2 2


care, cu probabilitatea , acoper valoarea parametrului: 1 2 1 Observaie. ntruct Fk1 ,k2 = , rezult c intervalul de ncredere pentru raportul Fk2 ,k1
2 12 / 2 mai poate fi scris sub forma: 2 s 2 s1 1 F F ; s2 n2 1,n1 1;1 2 s2 n2 1,n1 1; 2 n problemele privind durata de funcionare a unui produs, adesea se utilizeaz o repartiie exponenial. x0 0, x f ( x, ) = 1 e , x > 0, > 0 Ne propunem s determinm un interval de ncredere pentru parametrul , care are semnificaie de durat medie de funcionare. Dup cum tim, funcia caracteristic a unei variabile exponenial negative de parametrul este: X ( t ) = (1 i t)-1 S efectum o selecie de volum n:x1, x2, , xn, din populaia caracterizat de aceast variabil aleatoare i s considerm statistica: 2 n U ( X 1 , X 2 ,..., X n ; ) = X j 2

j =1

Funcia ei caracteristic este: n 2it X j n n n 2t 2t 2t j =1 itU e = M ei X j = X =1 i u (t ) = M ( e ) = M j =1 j =1 j

Deci: U ( t ) = (1 2it )

care este funcia de repartiie a unei variabile (22 n ) (cu 2n

grade de libertate). Urmeaz c funcia de selecie: 2 n U ( X 1 , X 2 ,..., X n ; ) = X j

j =1

urmeaz o lege de repartiie

2 ( 2n )

cu 2n grade de libertate.

2 Atunci, pentru = 1 - dat, putem determina dou numere: 12 i 2 astfel nct:

2 2 n 1 n 1 x / 2 2 P 12 X j 2 = n x e dx = = 1 j=1 2 ( n ) 2 1

Adoptnd ipoteza construirii unui interval cu cozi egale, se obine intervalul de ncredere: n n 2 X j 2 X j j=1 j=1 ; 2 2 ;2 n 1 2; 2 n 2 care, cu probabilitatea = 1 - , acoper valoarea parametrului . 7.9 Intervale de ncredere pentru parametri n cazul seleciilor de volum mare Am vzut c determinarea unui interval de ncredere pentru parametrul care apare n legea de repartiie f(x; ) se baza pe construirea unei funcii de selecie care s depind de datele de selecie x1, x2, , xn, de volumul de selecie n i de parametrul de estimat . Pentru a putea determina efectiv intervalul de ncredere se fceau ipoteze suplimentare asupra funciei de repartiie a statisticii, printre care i faptul c aceast funcie de repartiie nu depinde de parametrul de estimat. n cazul unei legi normale N(m; ) se puteau obine relativ simplu intervale de ncredere pentru m sau/i , indiferent dac n (volumul seleciei) era mic sau nu. n multe alte situaii, aflarea funciei de repartiie a statisticii este o problem dificil, ns putem determina repartiia asimptotic a unei statistici care conine parametrul necunoscut i, deci, dac n este suficient de mare, erorile pe care le comitem utiliznd repartiia asimptotic sunt cu totul neglijabile. Fie variabila aleatoare X cu densitatea de repartiie f(x; ) ce caracterizeaz o populaie C, din care se efectueaz selecia de volum n; x1, x2, , xn . n ipoteza c valorile de selecie sunt independente, se obine funcia de verosimilitate: L(x1, x2, , xn,n; ) =

f ( x ; )
j j =1

De aici urmeaz c: ln L n ln f ( x j ; ) =

j =1

Notnd: y j = se obine:

ln f ( x j ; ) ,

1 j n,

ln f ( x; ) M(Yj) = M = Presupunem c:
ln f ( x; ) 0 < M2 =

ln f ( x; ) f ( x; )dx = 0

ln f ( x; ) f ( x; )dx <

Atunci: ln f ( x; ) ln f ( x; ) D2 = M2 , iar variabila:

ln L ln L M = ln L D

ln f ( x j ; ) n ln f ( x j ; ) M j =1 j =1 = n ln f ( x j ; ) D2 j =1
n

Y
j =1

nD

ln f ( x; ) 2 unde am notat D2 = D , n baza teoremei lui Liapunov, este asimptotic N(0; 1). Deci: n Yj 1 b 2 j=1 x / 2 < b = lim P a < e dx 2 a nD n i, prin urmare, pentru n suficient de mare, statistica:
1 ln L( x1 ,.., x n ; ) nD nD ln L( x1 ,..., x n ; ) Dac, n plus
j j =1

urmeaz aproximativ o lege de repartiie N(0; 1).


este strict monoton n raport cu , atunci,

urmnd calea obinuit, putem construi un interval de ncredere pentru oricare ar fi nivelul de semnificaie (0; 1). Vom aprecia metoda intervalelor de ncredere pentru selecii de volum mare n cazul repartiiei binomiale i Poisson, apoi vom arta c n cazul legii normale obinem rezultatele cunoscute anterior, ceea ce este natural.
Repartiia binomial

S considerm variabila aleatoare: 1 0 X: , p + q = 1 (p > 0) p q Atunci: f(x; p) = px(1-p)1-x x = 0, 1;p (0; 1) Pe baza unei selecii x1, x2, , xn din populaia C caracterizate de variabila aleatoare X, obinem: L(x1, x2, , xn; p) = Dac punem:

f ( x ; p) = p
j j=1

xj
j=1

(1 p ) j=1

(1 x j )

x
j=1

= k , atunci ln L(x1, x2, , xn, n;p) = k ln p + (n-k) ln(1-p) i, deci:

ln L k n k k np = = p 1 p p(1 p ) p x p ln f ( x; p ) x 1 x Cum: Y = = , = p 1 p p(1 p ) p


M (Y ) = M( X ) p =0 p(1 p )

avem imediat:

Xp p(1 p ) 1 1 D 2 (Y ) = D 2 D 2 ( X p) = 2 = = D2 = 2 2 2 p (1 p ) p(1 p ) p(1 p ) p (1 p )

Atunci variabila: k p 1 ln P 1 k np j =1 n = = = 1 p(1 p ) nD nD p p(1 p ) n p(1 p ) n are o lege de repartiie N(0; 1) i, deci, pentru n suficient de mare: k p n P < z z z = 1 1 p(1 p ) 1 2 1 2 2 n ns, inegalitatea:
j

k p $ $ n( p 2 2 pp + p 2 ) n < z2 , este echivalent cu: <z 1 1 p(1 p ) p(1 p ) 2 2 n k $ estimaia probabilitii p (care este tocmai frecvena relativ) unde am notat p = n Inegalitatea poate fi scris: $ $ (n + z2)p2 (2n p + z2)p + n p 2 < 0 Dac punem:

$ $ $ 2np + z 2 z 4np(1 p ) + z 2 p1 = 2 2( n + z ) $ $ $ 2np + z 2 + 2 4np(1 p ) + z 2 p2 = 2( n + z 2 ) adic rdcinile ecuaiei: $ $ (n + z2)p2 (2n p + z2) + n p 2 = 0 , atunci:

$ p p < z = P( p < p < p ) = 1 , sau: P 1 2 1 p(1 p ) 2 n 2np + z 2 z 4np(1 p) + z 2 $ $ $ $ $ $ 2np + z 2 + z 4np(1 p) + z 2 P < p< 2 2 2(n + z ) 2( n + z )

$ $ $ $ z2 z2 4 p(1 p) z 2 4 p(1 p) z 2 2p + z $ $ + 2 + 2 2p + + z n n n n n n = P < p< z2 z2 21 + 21 + n n Deci, un interval pentru parametrul p, cu nivelul de ncredere 1 - este dat de: $ $ z2 4 p(1 p ) z12 / 2 $ $ z2 4 p(1 p ) z12 / 2 $ 2 p + 1 / 2 z + 2 $ 2 p + 1 / 2 + z 21 + 2 1 2 n n n n n n 2 ; 2 2 z z 21 + 1 / 2 21 + 1 / 2 n n

Cum n este suficient de mare, termenii z12 / 2 z12 / 2 , pot fi neglijai, i atunci: n n2 $ $ $ $ p(1 p ) p(1 p ) $ $ P p z <p<p+z 1 1 1 n n 2 2

Repartiia Poisson

Fie variabila aleatoare: x X: x , x = 0, 1, 2, ... e x!

; x = 0,1,2,... Atunci, dac x1, x2, , xn este o x! selecie de volum n, efectuat din populaia caracterizat de variabila aleatoare X, se obine funcia de verosimilitate:
e n j =1 xj !
n

repartizat Poisson, deci f(x; ) = e

L( x1 , x 2 ,... x n , n; ) = f ( x j ; ) =
j =1

x
j =1

De aici urmeaz:

n lnL ln L( x1 , x 2 ,..., x n , n; ) = n + x j ln ln x j ! ; = n + j=1 j=1


n

x
j=1

Totodat: ln f(x; ) = - + x ln - ln x!

i:

ln f ( x; ) x x = 1 + = =Y 1 1 M( X) = 0; D 2 (Y ) = 2 D 2 ( X ) = = D 2 M (Y ) =

Yj
Deci:
j=1

X
j=1

nD

i, prin urmare:
X P < z = lim n n

1 2

x2 / 2

dx

Atunci pentru un nivel de ncredere 1 - dat, putem determina z n suficient de mare: X P z < < z z z = 1 1 1 2 1 2 1 2 2 n Din inegalitatea
X <z

astfel nct, pentru

care este echivalent cu:

z 2 sau n2 ( 2nX + z 2 ) + X 2 < 0 n rezult c putem determina 1, 2 astfel nct: z < X < z = P( 1 < < 2 ) z z , P 1 1 2 1 2 1 2 2 n cu 1, 2 rdcinile ecuaiei: n2 ( 2nX + z 2 ) + nX 2 = 0 Cum:

X 2 2 X + 2 <

1, 2 =

2nX + z ( 2nX + z ) 4n X = 2n
2 2 2 2 2

2nX + z 2 2nz 2n

X z2 + 4 n2 ,

z2 z2 z2 z2 1 1 1 1 X X P X + 2 z + 22 < < X + 2 + z + 22 1 , 1 1 2n n n 2n n n 2 2 sau, dac lum n consideraie faptul c n este suficient de mare, putem neglija termenul 1 2 z1 / 2 , iar intervalul de ncredere pentru se obine din: 2n X X 1 P X z < <x+z 1 1 n n 2 2

Repartiia normal N(m; )

Vom considera mai nti cazul cnd se cunoate . Atunci, dac x1, x2, , xn este o selecie de volum n din populaia C caracterizat de variabila aleatoare X repartizat N(m; ), funcia de verosimilitate va fi:
L( x1 , x 2 ,..., x n , n; m, ) = f ( x j ; m, ) =
j =1 n

1 2

1 2 2

( x j m )2
j =1

din care rezult:

ln L 1 = 2 m

( x j m) =
j =1

1 n x nm 2 j j =1

Totodat: ln f ( x; m, ) X m = =Y, m 2 de unde rezult: 1 2 1 X m 2 M (Y ) = 0, D 2 (Y ) = D 2 = 4 D (X m) = 2 = D 2 Rezult c: n 1 n X j nm n X j m X m 1 n = Yj = n j=1 2 = j=1 D n j =1 n n are o repartiie N(0; 1) (exact, nu numai asimptotic), deci: Xm P z < < z = 1 1 1 2 2 n sau P X z <m<x+z = 1 1 1 n n 2 2 obinnd astfel din nou un interval de ncredere pentru m, cnd este cunoscut. Dac este necunoscut, atunci: z Xm 1 x2 / 2 P < z = lim e dx s 2 n n deci, dac n este suficient de mare: Xm < z z z = 1 P z < 1 s 1 2 1 2 1 2 2 n Deci: s s <m<X+z P X z 1 1 1 n n 2 2

Capitolul 8 VERIFICAREA IPOTEZELOR STATISTICE 8.1. Noiuni generale n procesele de producie apar frecvent situaii cnd se pune problema trecerii de la un procedeu tehnologic la altul considerat a fi superior vechiului procedeu. Superioritatea unui procedeu se consider pe baza informaiilor de care dispunem n urma realizrii unui eantion. Dar acest fapt nu este dect o ipotez a crei valabilitate trebuie verificat opernd dup criterii tiinifice asupra datelor de observaie, adic pe baza unei selecii ntmpltoare. Un soi nou de cereale este considerat superior i urmeaz a fi utilizat; nainte, ns, trebuie verificat ipoteza fcut asupra superioritii soiului, ipotez care se accept sau nu, pe baza unei selecii efectuate din cantitile obinute pe loturi experimentale i abia dup aceasta soiul va putea fi omologat. Ipotezele pe care le facem se refer att la forma legii de repartiie, ct i la valorile parametrilor care intervin n legea de repartiie. Ne vom referi la nceput numai la ipotezele referitoare la valorile parametrilor. S considerm o repartiie unidimensional, a crei densitate de probabilitate f(x, 1, 2, , k) depinde de k parametrii 1, 2, , k. Aceti parametri pot fi interpretai ca fiind coordonatele unui punct = (1, 2, , k) din spaiul euclidian k-dimensional, Rk. Fie A o mulime borelian din Rk. Dac presupunem c A suntem n prezena unei ipoteze pe care o vom nota H0 : A. Este natural faptul c H0 : A reprezint o ipotez, cci, dei punctul Rk este bine determinat, el este totui necunoscut, iar apartenena lui la mulimea A poate s aib loc sau nu. Ipoteza fcut rmne s fie verificat. Din acest motiv, ipoteza H0 o vom numi ipoteza de verificat, sau ipoteza nul. Cum 1, 2, , k sunt parametrii unei repartiii, rezult c ipotezele nule sunt ipoteze restrictive i ele se refer numai la valorile numerice pe care le pot lua parametrii unei repartiii teoretice care este specificat. Dac mulimea A se reduce la un punct, A = ( 10 , 20 ,..., k0 ) vom spune c ipoteza H0 este o ipotez simpl, iar dac A conine mai mult de un punct vom spune c ipoteza H0 este o ipotez compus. Verificarea ipotezei H0 : A se face pe baza unei selecii de volum n : X1, X2, , Xn, efectuat dintr-o populaie caracterizat de variabila aleatoare X a crei densitate de probabilitate este f(x; 1, 2, , k). Vom presupune c selecia este repetat i c (X1, X2, , Xn) reprezint un punct din spaiul euclidian Rn. Dac exist o regiune W Rn astfel nct: P ( X 1 , X 2 ,..., X n ) W / A = , (0, 1), apropiat de zero i pe care-l numim nivel de semnificaie, respingem ipoteza H0 cnd (X1, X2, , Xn) W i acceptm ipoteza H0 cnd (X1, X2, , Xn) W. Regiunea W cu proprietatea menionat o vom numi regiunea critic. Aceast regiune W nu este unic determinat dac se fixeaz nivelul de semnificaie . Orice regiune critic W ne furnizeaz o regul (procedeu) pentru verificarea ipotezei H0 : A, regul pe care o vom numi test. Teoria testelor de verificare a ipotezelor a fost creat de J. Neuman i E. Pearson.

Existena mai multor regiuni critice conduce la existena mai multor teste pentru verificarea aceleiai ipoteze i este indicat s se aleag cel mai avantajos test, n ipoteza c acesta exist. Pentru a clarifica modul de determinare a unei regiuni critice, vom lua un exemplu. S considerm o repartiie normal N(m, ) i s verificm ipoteza H0 : m = m0, pe baza unei selecii X1, X2, , Xn. Suntem n cazul k = 2 i mulimea A = ( m0 , ) , adic o dreapt n planul (m, ) i, deci, avem o ipotez compus. Cum n n t 2 X m x2 2 P t t = 1 + dx s n 1 t n 1 ( n 1) 2 n dac H0 este adevrat, atunci: n n t 2 2 x X m0 2 P t t = 1 n 1 dx s n 1 t ( n 1) 2 n Pentru (0, 1) dat, apropiat de zero, putem determina t > 0, astfel nct X m0 t = 1 P t s n Am definit n Rn o regiune W X m0 X m0 W = ( X 1 , X 2 ,..., X n ) : < t ( X 1 , X 2 ,..., X n ) : > t . s s n n Dac (X1, X2, , Xn) W respingem ipoteza H0 : m = m0, iar dac (X1, X2, , Xn) W acceptm ipoteza H0 : m = m0. Din cele prezentate aici rezult c acceptarea sau respingerea unei ipoteze este o convenie. Dac efectum un numr mare de selecii, pe baza legii numerelor mari, numai ntr-un numr mic de cazuri punctul (X1, X2, , Xn) va cdea n regiunea critic W i n imensa majoritate a cazurilor va cdea n afara regiunii W. Considerm c ntr-o singur experien (X1, X2, , Xn) W este un eveniment rar ce se ntmpl n % cazuri i respingem ipoteza dac acest lucru se ntmpl. n acest fel nu este exclus s comitem o eroare, i anume ca punctul (X1, X2, , Xn) W, iar ipoteza H0 s fie adevrat. Vom respinge o ipotez adevrat cu probabilitatea ca acest lucru s se ntmple. Eroarea pe care o comitem n acest caz este o eroare de genul nti. Putem comite, ns, i alt gen de erori. Se poate ca punctul (X1, X2, , Xn) W. n acest caz se accept ipoteza H0, dar nu este exclus ca H0 s fie fals. Deci, putem comite eroarea de a accepta o ipotez fals. Eroarea pe care o facem n acest caz este o eroare de genul al doilea. Avnd n vedere notaiile fcute, avem de luat n considerare urmtoarele probabiliti: (1) P((X1, X2, , Xn) W / A)

(2) P((X1, X2, , Xn) W / A) (3) P((X1, X2, , Xn) W / A) (4) P((X1, X2, , Xn) W / A) Expresia (1) reprezint probabilitatea ca punctul (X1, X2, , Xn) s aparin regiunii critice, ipoteza H0 fiind adevrat, adic probabilitatea de a comite o eroare de genul nti. Vom numi aceast probabilitate risc de spea nti i o vom nota cu . Expresia (4) reprezint probabilitatea ca punctul (X1, X2, , Xn) s nu aparin regiunii critice cnd ipoteza H0 este fals, adic probabilitatea de a comite o eroare de genul doi. Vom numi aceast probabilitate risc de genul doi, sau risc de spea a doua i o vom nota cu . Alegnd un test, putem, dac mrim volumul seleciei, s facem astfel nct riscul de genul nti sau doi s fie arbitrar de mic. Nu putem face ns ca n acelai timp ambele riscuri s fie arbitrar de mici. S fixm unul din riscuri la un nivel suficient de mic, urmnd ca cellalt s rezulte ca o consecin. Alegerea riscului pe care-l fixm arbitrar de mic se face n funcie de problema pe care o avem de rezolvat, deoarece nu exist o regul general care s stabileasc eroarea ca fiind cea mai important de urmrit, creia va trebui s i se acorde o atenie deosebit. Aa, de exemplu, dac dorim s urmrim compoziia unui medicament ce conine o substan ce devine toxic peste un anumit nivel, comiterea unei erori de genul doi este mult mai primejdioas dect comiterea unei erori de spea nti. Ca atare, se alege arbitrar de mic riscul de spea a doua. Dac ns este vorba de acceptarea unui lot cu articole de mbrcminte, ce nu corespund ntocmai condiiilor de fabricaie, eroarea de genul nti este mai grav dect eroarea de genul al doilea i, drept urmare, va trebui s fie fixat arbitrar de mic riscul de spea nti. Prin definiie, P((X1, X2, , Xn) W / A) = 1 P((X1, X2, , Xn) W / A) se numete puterea testului, i l vom nota cu . Deci, = 1 - , adic puterea testului este egal cu unu minus riscul de spea a doua. nainte de a analiza un exemplu, s facem o sintez a celor prezentate. Pentru aceasta, s observm c ipoteza H0 : A, A Rk, = (1, 2, , k) constituie ipoteza de verificat pe care o presupunem adevrat. n acest caz ipoteza fals devine A, adic Rk \ A. Putem s ne fixm asupra ipotezei false considernd B Rk, A B = , dar nu neaprat A B = Rk i stabilim, odat cu ipoteza nul H0 : A o ipotez alternativ H1 : B. Avem, astfel, s decidem ntre cele dou ipoteze H0 i H1, fiecare dintre decizii comportnd un risc, iar probabilitile riscurilor sunt sintetizate n tabelul urmtor. D E C I Z I E REALITATE H0 1- H1 1-=

H0 H1

Rezult de aici urmtoarea concluzie referitoare la puterea testului: Dac ipoteza H0 este adevrat, puterea testului va trebui s fie ct mai mic, iar dac H1 este adevrat (H0 este fals), puterea testului s fie ct mai mare.

Vom urmri modul cum variaz puterea testelor pentru verificarea unei ipoteze H0, pe exemplul unei repartiii normale N(m, ), n care este cunoscut. xm Fie ipoteza de verificat H0 : m = m0. Atunci funcia de selecie are o repartiie / m normal N(0, 1) i, deci, pentru (0, 1) suficient de apropiat de zero putem determina dou numere a, b astfel nct: 2 1 b z2 X m P a b = e dz = 1 2 a n Dac ipoteza H0 : m = m0 este adevrat, vom avea 2 1 b z2 X m0 P a b = e dz = 1 2 a n i regiunea critic din spaiul de selecie Rn este a b ( X 1 , X 2 ,..., X n ) : X m0 + . W = ( X 1 , X 2 ,..., X n ) : X m0 + n n Se observ c regiunea critic W este format prin mprirea spaiului Rn n subspaii, cu ajutorul hiperplanelor.

X
k =1

k =1 n

= nm0 + a n

= nm0 + b n

Cum a, b sunt determinate de unica relaie (b) - (a) = 1 - , rezult c exist o infinitate de teste corespunztoare intervalelor (a, b), toate avnd nivelul de semnificaie (riscul de spea nti) , adic P ( X 1 , X 2 ,..., X n ) W / H 0 = Alegnd unul din aceste teste (a, b), s calculm puterea lui, adic ( m1 ) = P ( X 1 , X 2 ,..., X n ) W / H1 , unde H1 : m = m1 (m1 m0) Cum P ( X 1 , X 2 ,..., X n ) W / m = m1 + P ( X 1 , X 2 ,..., X n ) W / m = m1 = 1, obinem:

n ( m1 ) = 1 2

m0 +

b n

e
n

n ( y m1 ) 2
2

m0 +

dy , X N m, n

Dac H1 : m = m1 e adevrat, X N m1 , n n ( y m1 ) Efectund schimbarea de variabil = z, se obine:

1 ( m1 ) = 1 2

b+

( m0 m1 )

z2 2

a+

( m0 m1 )

n dz = 1 b + ( m0 m1 ) + a + n ( m0 m1 )

Se constat imediat c oricare ar fi testul (a, b), funcia (m1), numit funcia de putere a testului, are proprietatea c (m0) = . Fie acum dou teste (a, b) i ( a , b) , cu funciile de putere (m1), respectiv (m1).

Dac (m1) (m1), atunci testul (a, b) este preferat testului ( a , b) (deoarece are probabilitatea de a respinge o ipotez fals mai mare). Cu ct puterea testului ia o valoare mai apropiat de unu, cu att testul este mai bun. n general, (m1) (m1) nu este ndeplinit pentru orice valoare a lui m1. Deci, numai n cazuri particulare putem gsi un test mai bun dect toate celelalte teste. Se pot determina, totui, teste care, pentru anumite intervale de variaie ale lui m1, s fie mai puternice dect toate celelalte. ntr-adevr, fie funcia de putere n ( m1 ) = 1 b + ( m0 m1 ) + a + n ( m0 m1 ) Atunci 2 2 n 1 1 n ( m0 m1 ) a+ n 2 b+ ( m0 m1 ) 2 e ' ( m1 ) = e 2

' ( m1 ) = 0 dac m1 = m0 +

( a + b)

Atunci, dac ( a + b) , ( m1 ) < 0 m1 , m0 + 2 n

m1 = m0 +

( a + b) , , ( m1 ) > 0 m1 m0 + 2 n
Urmeaz c (m1) are un minim n punctul m1 = m0 +

2 n

( a + b) , ( m1 ) = 0

( a + b) 2 n Dac a + b = 0, atunci (m1) are un minim n m1 = m0. Dac a , atunci minimul funciei (m1) se obine pentru m1 = - ; dac b minimul funciei (m1) se obine pentru m1 = ntre aceste dou curbe extreme se situeaz toate celelalte situaii; astfel, pentru a + b < 0 minimul funciei putere este situat la stnga lui m0, iar pentru a + b > 0 minimul este situat la dreapta lui m0. (m1) 1 a -
A(m0, ) b

m0

n concluzie, nu exist un test care pentru orice m1 (-,), (m1) s ia valori mai mari dect toate celelalte. Pentru intervale de variaie ale lui m1 se pot determina teste mai puternice. Astfel, pentru toate valorile m1 (m0,), testul cel mai puternic corespunztor este (-,b), iar pentru m1 (-,m0), cel mai bun test este (a,). Pentru o selecie de volum dat n: X1, X2, , Xn, o funcie de selecie Tn (X1, X2, , Xn), un nivel de semnificaie dat (riscul de spea nti), puterea testului pentru verificarea ipotezei H0 : A, cu alternativa H0 : B, A, B Rk. A B = depinde de modul cum se construiete regiunea critic W. Regiunea critic se construiete astfel nct puterea testului s fie ct mai mare posibil (maxim). Testul care satisface aceast condiie am vzut c este cel mai puternic test, iar existena unui cel mai puternic test am examinat-o pe cazul legii normale N(m,) cu cunoscut. n cazul cnd ipotezele H0 i H1 sunt ipoteze simple, aceast problem este rezolvat de teorema Neuman-Pearson, pe care o prezentm mai jos. Teorema Neuman-Pearson Fie X o variabil aleatoare caracterizat de f(x; ) (densitatea de repartiie sau funcia de frecven). Pe baza seleciei de volum n : X1, X2, , Xn , extras din populaia caracterizat de X vrem s verificm ipoteza H0 : = 0, cu alternativa H1 : = 1 (1 0). n acest caz exist un test care are proprietatea c dintre toate testele pentru care P((X1, X2, , Xn) W / H0) = 0, el are proprietatea c P((X1, X2, , Xn) W / H0) = 1 - este maxim. Acest test este determinat prin domeniul critic W Rn, cu ajutorul inegalitii:

f (x
n j =1

; 1 C f x j ; 0 ,
j =1

constanta C rezultnd din egalitatea P((X1, X2, , Xn) W / H0) = 0 (cu condiia c f(x; ) s fie mrginit). Demonstraie. S considerm domeniul critic U corespunztor unui alt test cu proprietatea P((X1, X2, , Xn) U / H0) = 0 Dar, P[(X1, X2, , Xn) (W \ W U) / H0] = = P[(X1, X2, , Xn) W / H0] - P[(X1, X2, , Xn) W U / H0] = 0 - P[(X1, X2, , Xn) W U / H0] = P[(X1, X2, , Xn) U / H0] - P[(X1, X2, , Xn) W U / H0] = P[(X1, X2, , Xn) (U \ W U) / H0] Din ipotez rezult c P[(X1, X2, , Xn) (W \ W U) / H1] C P[(X1, X2, , Xn) (W \ W U) / H0], cci P[(X1, X2, , Xn) (W \ W U) / H1] =

W \W U

... f x j ; 1 dx1 ... dx n C


j =1

= CP ( X 1 ,..., X n ) ( W \ W U ) / H 0 Dar

W \W U

... f x j ; 0 dx1 ... dx n


J =1

CP[(X1, X2, , Xn) (W \ W U) / H0] = C P[(X1, X2, , Xn) (U \ W U) / H0] ns U \ W U CW i, deci, pe CW avem C f x j ; 0 f x j ; 1
j =1 j =1 n

i, deci: P[(X1, X2, , Xn) (W \ W U) / H1] C P[(X1, X2, , Xn) (U \ W U) / H0) (U \ W U) / H1] De aici rezult c P(X1, X2, , Xn) W / H1) P[(X1, X2, , Xn) U / H1], adic puterea testului avnd regiunea critic W este mai mare dect puterea testului avnd regiunea critic U. S dovedim acum existena domeniului critic W. Pentru aceasta s notm: (c) = P[(X1, X2, , Xn) W / H0] Se constat imediat c dac c = 0, atunci (0) = 1, ntruct regiunea W devine Rn, deoarece avem:

f (x
n j =1

; 1 0

Dac c crete, regiunea W descrete i, deci, funcia (0) este necresctoare de argumentul c. ns C ... f x j ; 0 dx1 ... dx n ... f x j ; 1 dx1 ... dx n ,
W j =1 W j =1 n

de unde rezult c (c) 1 (ntruct n membrul al doilea al inegalitii avem o probabilitate) Deci 1 0 (c) c i de aici lim ( c) = 0 Prin urmare, (c) = , [0,1] are loc totdeauna pentru o valoare unic determinat a lui c, dac c este punct de continuitate pentru . Dac c este punct de discontinuitate pentru , atunci (c+0)- (c-0) reprezint probabilitatea ca (X1, X2, , Xn) s cad n regiunea critic.
c

f x j ; 1 = C f x j ; 0
j =1 j =1

Eliminnd aceast mulime de puncte din regiunea W i adugnd-o la CW, am eliminat punctele c de discontinuitate pentru i problema este complet rezolvat.

Teste bazate pe metoda Neuman-Pearson Metodologia de elaborare a testelor bazate pe metoda Neuman-Pearson const n a acorda o situaie privilegiat ipotezei H0 : = 0 , fixnd apriori valoarea riscului de spea nti: = 0 , pe care-l vom numi i nivelul testului (nivel de semnificaie), apoi de a alege dintre toate testele posibile cu nivelul 0 pe acela care minimizeaz valoarea riscului de spea doua: . Procedeul practic const n a defini o regiune W Rn (regiunea critic), astfel nct, dac (X1, X2, , Xn) W se accept H1 : = 1 (1 0) (Suntem n cazul cnd att ipoteza nul, ct i ipoteza alternativ sunt simple). Se va decide, deci, H0 dac (X1, X2, , Xn) W Dac

f (x
n j =1

; 0

este verosimilitatea eantionului n ipoteza H0 i

f (x
n j =1

; 1

verosimilitatea n ipoteza H1, regiunea critic W este definit prin: n ... f x j ; 0 dx1 ... dx n = 0 j =1 ( ) W n ... f x j ; 1 dx1 ... dx n = (min) W j =1 (necunoscuta ce trebuie aflat este W) Conform teoremei Neuman-Pearson, sistemul (*) devine: n f x j ; 1 W = ( x , x ,..., x ) / j =1 C n n 1 2 f x j ; 0 ( ,) j =1 n 0 = ... f x j ; 0 dx1 ... dx n j =1 W Se spune c prima relaie din (*,*) furnizeaz forma regiunii critice W, adic statistica s fie ct mai mare posibil (n cazul testului pentru media unei legi N(m; ) se va obine x A ). Cea de-a doua relaie (*,*) determin frontiera regiunii critice W (n cazul parametrului m dintr-o repartiie N(m; ), fixeaz valoarea constant A). Se nelege c integralele care intervin sunt n Rn, care la nivelul acesta general nu se pot exprima. Numai n cazul particular al legilor de repartiie a parametrilor se poate evita calculul unei integrale n Rn.

( (

Metodologia verificrii ipotezei H0 simple cu alternativa H1 compus Adesea nu tim dac = 0, sau = 1. Atunci, problema care se pune este urmtoarea: se poate admite c = 0, sau nu? n acest caz, avem de luat n consideraie, cel mai frecvent, testarea urmtoarelor ipoteze: (1) H0: = 0 cu alternativa H1 : 1 (2) H0: = 0 cu alternativa H1 : > 0 (3) H0: = 0 cu alternativa H1 : < 0

Cnd vorbim de ipotezele (2) i (3) se subnelege c dispunem de informaii apriori asupra valorilor posibile ale parametrului unidimensional , H1 fiind o ipotez compus, adic o familie de ipoteze simple. Dac se aplic teorema Neuman-Pearson unei valori 1( k ) B1 (H1 : B1) se determin o regiune critic W(k) asociat valorii 1( k ) . Pot s apar urmtoarele situaii: (a) W(k) = W independent de 1( k ) , iar regiunea critic corespunztoare conduce la un test de cea mai mare putere, oricare ar fi 1( k ) B1. Acest test va fi numit uniform cel mai puternic, ceea ce nseamn c, dei puterea testului variaz cu 1, pentru fiecare dintre valorile 1 date el este cel mai puternic. (b) W(k) depinde de 1( k ) . Cum am presupus c nu se cunoate valoarea parametrului , se va alege atunci drept regiune critic o reuniune de regiuni critice, W = W(k), avnd grij s se menin nivelul de semnificaie 0 fixat. n acest caz, testul nu mai are proprietatea de a fi cel mai puternic, oricare ar fi valoarea 1( k ) . S aplicm aceste rezultate pentru verificarea unei ipoteze asupra parametrului m dintr-o lege normal N(m,) cu cunoscut. Vom verifica urmtoarele ipoteze: (1) H0 : m = m0 ; H1 : m = m1 (2) H0 : m = m0 ; H1 : m > m0 (3) H0 : m = m0 ; H1 : m < m0 (4) H0 : m = m0 ; H1 : m m0 , cu nivelul de semnificaie . (1) Trebuie s determinm mulimea punctelor (X1, X2, , Xn), astfel nct:
k

f (x
n j =1 n j =1

; m1 , ; m0 ,

f (x
adic:

)
j

C ,

1 2 e 2 2 Lund logaritmii naturali, se obine: 1 n 2 x j ( m1 m0 ) ( m12 m02 ) ln C = k , 2 2 j =1


j 0

j =1

1 e 2

( x m )
1

2 n

( x m )

=e

1 2
2

( x j m1 ) ( x j m0 )
2 j =1

adic:

m1 m0 2n X ( m1 + m0 ) k 2 2 Pentru a continua calculul, va trebui s precizm semnul diferenei m1-m0. Dac presupunem m1 m0 > 0, obinem: 1 2 k 2 X m + m0 + =a m1 m0 2n 1

Atunci forma regiunii critice este definit astfel: (X1, X2, , Xn) W dac i numai dac X a , n care caz decidem c H1 este adevrat. Rmne s determinm valoarea lui a, ceea ce conduce la rezolvarea ecuaiei:

W j =1

f ( x
n

; m0 dx1 ... dx n =

f
xa

( x ) dx

Aceasta nseamn c regiunea critic W Rn este complet determinat prin x R, adic este suficient s rezolvm ecuaia: = P( X a / H 0 ) ntruct selecia s-a efectuat dintr-o populaie normal N(m,), dac H0 este adevrat, rezult c: , iar X N m0 , n X m0 N ( 0,1) / n i, deci, X m a m0 0 = P( X a ) = P n n Deci, a m a m 0 0 = ; = 1 , 1 n n a m0 = z1 , iar, de aici: a = m0 + z1 care conduce la: n / n f X ( x)

m0

W=

X ( X1 ,..., X n ) : X a

n concluzie, se decide c H1 este adevrat dac: z1 = a n i H0 n caz contrar. S reamintim faptul c H0 : m = m0 ; H1 : m = m1 sunt ipoteze simple i c am presupus c m1 > m0. Dac m1 < m0, atunci: 1 2 k 2 ' X m1 + m0 + =a 2n m1 m0 X m0 +

Consideraii analoage asupra repartiiei variabilei X cnd H0 este adevrat ne conduc la rezolvarea ecuaiei: = P( X a ' / H 0 ) , care revine la: a' m a ' m0 0 = ; = z n n

a ' = m0 + X m0 +

z i se decide c H1 este adevrat dac: z = a '

n S calculm puterea testului, care am vzut c este: ( m1 ) = P ( X 1 , X 2 ,..., X N ) W / H1 : m = m1 = P( X a / H1 ) . Dar, cnd H1 este adevrat, X N m1 , n X m a m a m1 1 1 ( m1 ) = P( X a / H1 ) = P = 1 n n n

sau

a m a m1 1 = z1 ( m1 ) = 1 ( m1 ) ; n n Cum a, m1, , n sunt mrimi cunoscute, rezult c: a m 1 , cci a depinde de riscul de spea nti, , pe care l-am ( m1 , ) = 1 n

fixat. Analog, se calculeaz puterea testului n cea de a doua precizare a valorii lui m1: m1 m0 < 0. Grafic, problema apare explicat dup cum urmeaz:

f X / H ( x)
1

f X / H ( x)
0

m0

m1

Ne ocupm acum de verificarea ipotezei (2) H0 : m = m0 ; H1 : m > m0 La punctul anterior am vzut c limita este independent de m1, ceea ce nseamn c testul H0 : m = m0 ; H1 : m > m0 este un test uniform cel mai puternic, a crui regiune critic este: W = ( X 1 , X 2 ,..., X n ) : X a , a crui putere am determinat-o mai sus. (3) H0 : m = m0 ; H1 : m < m0

z este independent de valoarea lui m1, deci este n un test uniform cel mai puternic, a crui regiune critic este W = ( X 1 , X 2 ,..., X n ) : X a ' . (4) H0 : m = m0 ; H1 : m m0 Combinnd testele (2) i (3) se obin dou regiuni critice. W(1), cnd m < m0, W (1) = ( X 1 , X 2 ,..., X n ) : X a ' .

De asemenea, limita a ' = m0 +

' W(2), cnd m > m0, W ( 2 ) 1 2 ,..., X n Deci, n absena oricrei informaii asupra adevratei valori a parametrului m suntem condui la considerarea regiunii critice W = W(1) W(2). Pentru ca riscul de prima spe s rmn tot fixat de noi, nseamn c putem lua

{ = {( X , X

} ) : X a }.

pentru W(1) i W(2) riscul

W = ( X 1 , X 2 ,..., X n ) : X m0 + z ( X 1 , X 2 ,..., X n ) : X m0 + z n 2 n 1 2 n acest caz, regula de decizie va fi urmtoarea: Se accept H0 dac:


z n 2 n 1 2 i se accept H1 n caz contrar. Teste referitoare la parametrul n cazul unei repartiii Poisson. Pe baza unei selecii de volum n : X1, X2,,Xn ne propunem s verificm urmtoarele ipoteze. (1) H0 : = 0, H1 : = 1 nivelul de semnificaie fiind (2) H0 : = 0, H1 : > 0 (3) H0 : = 0, H1 : < 0 (4) H0 : = 0, H1 : 0 (1) Conform teoremei Neuman-Pearson, determinm mai nti forma regiunii critice: x n e 1 1 j n x! xj 1 j =1 j =1 j = e n( 0 1 ) C 0 x j n 0 e 0 x! j =1 j Logaritmnd, obinem: n( 0 1 ) + x j ln
j =1 n

, i atunci:

m0 +

z < X < m0 +

1 ln C = k 0

Va trebui s precizm iari unul din cazurile 1 > 0 sau 1 < 0. Presupunem c 1 > 0. Atunci:

x
j =1

k + n( 1 0 )

Valoarea lui a se determin cu ajutorul ecuaiei: x j a


j =1 n

1 ln 0 0
xj

=a

e
j =1

xj!

Ecuaia aceasta se poate transforma n alta mai simpl, innd cont de faptul c urmeaz tot o lege Poisson de parametru n. n acest caz, a se determin din ecuaia: P( Y = y k / n 0 ) = ,
yk a

x
j =1

unde:
P( Y = y k / n 0 ) = e
n 0

( n )
0

yk

yk !

yk = 0, 1, 2, 3, i, deci, se pot utiliza tabelele legii Poisson pentru variabila Z. Dac 1 < 0, atunci: ln
k + n( 1 0 )

1 < 0 , i, deci: 0

x
j =1

i ecuaia din care se determin a va fi: P( Y = y k / n 0 ) =


yk a '

ln 1 0

= a'

i, cu ajutorul tabelelor, se determin a. (2) H0 : = 0, H1 : > 0. Prelund calculele din cazul (1), regiunea critic a testului este: n W = ( X 1 , X 2 ,..., X n ) : x j a , j =1 cu a determinat de ecuaia: P( Y = y k / n 0 ) =
yk a

Testul este uniform cel mai puternic, ntruct regiunea critic este independent de valoarea 1 > 0. (3) H0 : = 0, H1 : < 0. Regiunea critic a testului este: n W = ( X 1 , X 2 ,..., X n ) : x j a ' , j =1 cu a determinat de ecuaia: P( Y = y k / n 0 ) =
yk a '

ntruct regiunea critic W este independent de valorile 1 < 0, urmeaz c testul este uniform cel mai puternic.

(4) Regiunea critic n acest caz este: W = W(1) W(2), unde: n W ( 1) = ( X 1 , X 2 ,..., X n ) : x j a j =1 n W ( 2 ) = ( X 1 , X 2 ,..., X n ) : x j a ' , j =1 unde a i a se determin din relaiile:
yk a

2 yk a ' 2 i acest test este uniform cel mai puternic, iar decizia se ia n modul urmtor: Dac a ' < x j < a , decidem H0, n caz contrar se decide H1.
j =1 n

P( Y = y

/ n 0 ) =

P( Y = y

/ n 0 ) =

Verificarea ipotezei referitoare la dispersia 2 a unei legi normale N(m,), pe baza unei selecii de volum: X1, X2, , Xn, presupunnd m cunoscut. 2 H 0 : 2 = 0 ; H1 : 2 = 12 cu nivelul de semnificaie .

j =1 n

1 e 2

( x m)
j 2 2 1

1 2 e 2 0 j =1 0 2 care, prin logaritmare, ne conduce la: 2 1 1 n 1 n ln 0 x j m 2 2 ln C = k 1 2 j =1 1 0 Preciznd 1 > 0, se obine: n 2 x j m 2 k + n ln 1 j =1 0 =a 2 2 0 0 1 1 Am obinut forma regiunii critice, care ne conduce la acceptarea ipotezei H1 : 2 = 12 , 2 1 n dac 2 x j m a .

n 0 2 ( x j m) e j =1 2 = x j m) ( 1 1

1 1 2 2 1 0

j =1

Valoarea a se determin din ecuaia:

1
2 0

( x j m)
j =1

j =1

2 0

1 e 2

( x m)
j 2 2 0

dx1dx 2 ... dx n = cont de faptul c dac H0 este adevrat,

2 0 j =1

( x
n

Aceast
j

ecuaie,

innd

= (2n ) , devine:

P (2n ) a = , adic a = (2n ) , , care se obine din tabelul legii de repartiie 2 .


Dac 1 < 0, atunci:

0 1 1 iar a se determin din ecuaia:

2 0 j =1

( x
n

1 2 k + n ln 0
2

= a' ,

1
2 0

( x j m)
j =1

1 2 e j =1 0 '

( x m)
j 2 2 0

dx1dx 2 ... dx n = ,

care este echivalent cu ecuaia: P (2n ) a ' = , adic a ' = (2n ) ,1 , care se obine din tabele.

2 2 Verificarea ipotezei: H 0 : 2 = 0 ; H1 : 2 > 0 . Se obine forma regiunii critice: 1 2 k + n ln 2 0 1 n =a , xj m 2 2 0 j =1 0 1 1 cu valoarea lui a determinat din ecuaia: P (2n ) a / H 0 = , adic a = (2n ) ,

n 2 2 W( X 1 , X 2 ,..., X n ) : x j m 0 (2n ) , j =1 2 2 i cum W este independent de valorile lui 1 > 0 , rezult c este uniform cel mai puternic. n cazul ipotezei: 2 2 H 0 : 2 = 0 ; H 1 : 2 < 0 1 2 k + n ln n 2 0 1 = a' , 2 xj m 2 0 j =1 0 1 1 cu valoarea lui a determinat din ecuaia: P (2n ) a ' / H 0 = , adic a ' = (2n ) ,1

n 2 2 W( X 1 , X 2 ,..., X n ) : x j m 0 (2n ) ,1 j =1 W fiind independent de 1 < 0, testul este uniform cel mai puternic. Verificarea ipotezei: 2 2 H 0 : 2 = 0 ; H1 : 2 0 , nivelul de semnificaie fiind . n 2 2 W ( 1) = ( X 1 , X 2 ,..., X n ) : x j m 0 2 ( n) , j =1 2 n 2 2 W ( 2 ) = ( X 1 , X 2 ,..., X n ) : x j m 0 2 ( n ) ,1 j =1 2 i

W = W ( 1) W ( 2 ) , cu decizia c H0 este adevrat dac:


2 0 2

( n ) ,1

< xj m
j =1

2 < 0 2

( n) ,

n caz contrar fiind adevrat H1. 8.2. Metoda intervalelor de ncredere pentru verificarea ipotezelor statistice asupra parametrilor legilor normale Verificarea ipotezei H0 : m = m0; H1 : m = m1 m0, cu nivelul de semnificaie , fiind cunoscut. xm Se consider statistica = Z N ( 0,1) .

n Dac H0 este adevrat: x m0 Z=

n
Atunci: xm 0 P < Z = 1 = , n care (am vzut la intervale de ncredere) ne conduce la regiunea critic: W = ( X 1 , X 2 ,..., X n ) : X m0 Z ( X 1 , X 2 ,..., X n ) : X m0 Z 1 1 n n 2 2 Puterea testului: m m m m 1 1 ( W1 , m1 ) = 0 n Z + 1 0 n+Z 1 1 2 2 Acesta este numit testul Z bilateral. Dac: H0 : m = m0; H1 : m2 > m0 Avem testul Z unilateral dreapta, cu regiunea critic: W = ( X 1 , X 2 ,..., X n ) : X m0 + Z1 n Dac X m0 + Z1

m m0 n + Z . Puterea testului este ( W , m1 ) = 1 Dac H0 : m = m0; H1 : m < m0, avem testul Z unilateral stnga, cu regiunea critic: W = ( X 1 , X 2 ,..., X n ) : X m0 Z1 , n m m1 iar puterea testului: ( m1 ) = 0 n + Z .

se accept H1, iar dac X < m0 + Z1

se accept H0.

8.3. Testul T pentru verificarea ipotezei referitoare la media unei populaii normale N(m,), (cu necunoscut)

Se consider statistica: xm T= , s n care, n cazul H0 este adevrat, devine: x m0 T= s n i are o repartiie Student cu n-1 grade de libertate. Atunci, pentru dat: xm 0 P < t1 = 1 n n cazul ipotezei: H0 : m = m0; H1 : m m0 avem testul T bilateral, cu regiunea critic: s s W = ( X 1 , X 2 ,..., X n ) : X m0 t ( X 1 , X 2 ,..., X n ) : X m0 t 1 1 n n 2 2 Un raionament analog cu testul Z ne conduce la: Testul T unilateral dreapta H0 : m = m0; H1 : m > m0, - necunoscut, cu regiunea critic: s W = ( X 1 , X 2 ,..., X n ) : X m0 + t1 n Testul T unilateral stnga H0 : m = m0; H1 : m < m0, - necunoscut, cu regiunea critic: s W = ( X 1 , X 2 ,..., X n ) : X m0 t1 n 2 2 Testul , referitor la dispersia a unei repartiii normale N(m,). 2 2 Ne propunem s verificm ipoteza: H 0 : 2 = 0 , fa de ipoteza H1 : 2 0 , cu nivelul de semnificaie . ( n 1) s 2 Considerm statistica , care are o repartiie (2n1) (hi-ptrat cu n-1 grade de 2

( n 1) s 2 libertate). Dac H0 este adevrat, atunci statistica devine i pentru dat se pot 2 0 2 determina 12 i 2 , astfel nct: ( n 1) s 2 2 P 12 < < 2 = 1 2 0
Dac adoptm metoda cozilor egale, atunci: ( n 1) s 2 2 P 2 < < = 1 2 ;n 1 0 1 2 ;n1 2

i regiunea critic pentru verificarea ipotezei H0 devine: 2 W = ( X 1 , X 2 ,..., X n ) : ( n - 1) s 2 0 2 1 ;n 1 2


2 2 ( X 1 , X 2 ,..., X n ) : ( n - 1) s 2 0 ;n 1 2 2 2 2 sau ( n 1) s 2 0 Ori de cte ori ( n 1) s 2 0 2
1 ;n 1 2 2

;n 1

decidem c H1 este

adevrat, iar dac: 2 2 2 0 2 < ( n 1) s 2 < 0


1 ;n 1 2 2

; n 1

decidem c H0 este adevrat. Avem, n felul acesta, testul 2 bilateral. Cnd dispunem de informaii apriori asupra dispersiei 2, avem unul din testele 2 unilaterale: 2 2 H 0 : 2 = 0 ; H1 : 2 > 0 - testul 2 unilateral dreapta, sau: 2 2 H 0 : 2 = 0 ; H1 : 2 < 0 - testul 2 unilateral stnga. n cazul testului 2 unilateral dreapta, regiunea critic corespunztoare nivelului de semnificaie dat este: 2 W = ( X 1 , X 2 ,..., X n ) : ( n - 1) s 2 0 12 ;n1

Regula de verificare este urmtoarea: Dac ( n 1) s 2 < 0 12 ;n1 se accept H0, iar dac ( n 1) s 2 0 12 ;n1 se accept H1. n cazul testului 2 unilateral stnga, regiunea critic corespunztoare nivelului de semnificaie este: 2 2 W = ( X 1 , X 2 ,..., X n ) : ( n - 1) s 2 0 ;n1
2 Se accept H0 dac ( n 1) s > 0 ;n1, iar dac ( n 1) s 2 0 ;n1 se accept H1. Testul Z relativ la mediile m1 i m2 a dou populaii normale N(m1,2). Se consider seleciile: x11 , x12 ,..., x1n1 din populaia normal N(m1,1) 2 2

i:

x 21 , x 22 ,..., x 2 n2 din populaia normal N(m2,2) Pe baza acestor selecii obinem: 2 1 n1 1 n1 2 x 1 = x1 j ; s1 = x x1 ; n1 j =1 n1 1 j =1 1 j

1 n2 1 n2 2 x2 = x 2 j ; s2 = x x2 n2 j =1 n2 1 j =1 2 j 2 n situaia 12 = 2 , s verificm ipoteza H0 : m1 = m2, cu alternativa H1 : m1 m2, nivelul de semnificaie fiind . 2 Dispersiile 12 i 2 fiind cunoscute, rezult c statistica:

Z=

x 1 x 2 ( m1 m2 )

12
n1

2 2

are o repartiie normal N(0;1).

n2

Dac H0 este adevrat, atunci: x1 x 2 Z= N ( 0,1) 2 2

n1 n2 Pentru nivelul de semnificaie dat, obinem regiunea critic: 2 12 2 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 z + n1 n2 1 2

2 12 2 x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 z + 1 n1 n2 2 Avem, n acest caz, testul Z bilateral pentru verificarea ipotezei H0 : m1 = m2; H1 : m1 m2. Testul Z unilateral dreapta: H0 : m1 = m2; H1 : m1 > m2 are regiunea critic: 2 12 2 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 z1 + n1 n2

i se accept H0 ori de cte ori x 1 x 2 < z1

12
n1

2 2

n2

, n caz contrar acceptnd ipoteza

H1 : m1 > m2. Testul Z unilateral stnga: H0 : m1 = m2; H1 : m1 < m2 are regiunea critic: 2 12 2 x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 z1 W= + n1 n2

cu regula de acceptare a ipotezei H0 sau H1, dup cum x 1 x 2 > z1


x 1 x 2 z1

12
n1

2 2

n2

, respectiv

. n1 n2 Testul T (Student) pentru verificarea ipotezei referitoare la egalitatea mediilor a dou 2 populaii normale N(m1,1), N(m2,2) cu 12 = 2 = 2 necunoscut. Testul T bilateral: Verificm ipoteza: H0 : m1 = m2; H1 : m1 m2, nivelul de semnificaie fiind . Dac se consider statistica:
2 1) s12 + ( n 2 1) s2 1 1 + n1 n 2 n1 + n 2 2 n1 n 2 aceasta are o repartiie Student cu n1 + n2 2 grade de libertate.

12

2 2

T=

x 1 x 2 ( m1 m2 )

12

2 2

(n

(n

2 1) s12 + ( n 2 1) s2 1

+ n 2 2 ) 2

x 1 x 2 ( m1 m2 )

(n

Dac H0 este adevrat, statistica T devine: x1 x 2 T= ( n1 1) s12 + ( n1 1) s22 1 1 + n1 + n 2 2 n1 n 2 Pentru nivelul de semnificaie dat se obine regiunea critic: ( n1 1) s12 + ( n2 1) s22 1 1 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 t + 1 n1 + n2 2 n1 n2 2

( n1 1) s12 + ( n2 1) s22 1 1 x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 t + n1 + n2 2 1 n1 n2 2 Testul T unilateral dreapta H0 : m1 = m2; H1 : m1 > m2 Pentru dat se obine regiunea critic: ( n1 1) s12 + ( n2 1) s22 1 1 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 t1 + n1 + n2 2 n1 n2 Testul T unilateral stnga H0 : m1 = m2; H1 : m1 < m2, cu regiunea critic: ( n1 1) s12 + ( n2 1) s22 1 1 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : x 1 x 2 t1 ;n1 + n2 2 + n1 + n2 2 n1 n2

Verificarea ipotezei referitoare la egalitatea dispersiilor a dou populaii normale Se consider seleciile x11 ,..., x1n1 din legea N(m1;1) i x 21 , x 22 ,..., x 2 n2 , din legea N(m2;2). Pe baza lor se obin: 2 2 1 n1 1 n2 1 n1 1 n2 2 2 x1 = x1 j ; x 2 = n x 2 j ; s1 = n 1 x1 j x 1 ; s2 = n 1 x 2 j x 2 n1 j =1 j =1 j =1 1 2 2 j =1 Atunci variabila: 2 2 s12 F= 2 2 1 s2 urmeaz o lege de repartiie Snedecor-Fisher cu n1 1, n2 1 grade de libertate, respectiv. Testul F bilateral 2 2 H 0 : 12 = 2 ; H1 : 12 2 s2 Dac ipoteza H0 este adevrat, atunci statistica F devine F = 12 , care are o lege s2 Snedecor-Fisher cu n1 1, n2 1 grade de libertate.

Pentru nivelul de semnificaie dat se pot determina cvantilele (numerele) Fn1 1,n2 1 ; i Fn1 1,n2 1 ;1

, astfel nct:

s2 P 12 F = n1 1,n2 1; 2 s2 2 i
s2 P 12 F = n1 1,n2 1;1 2 s2 2

i regiunea critic este dat de: 2 s1 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : 2 F n1 1,n2 1; s2 2

2 s1 x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : 2 F n1 1,n2 1;1 s2 2 Testul F unilateral dreapta Avem de verificat ipoteza: 2 2 H 0 : 12 = 2 , cu alternativa H1 : 12 > 2 , la nivelul de semnificaie . Atunci se determin 1 - cvantila Fn1 1,n2 1;1 , pentru care: s12 P 2 Fn1 1,n2 1;1 = s2 i de aici rezult regiunea critic: 2 s1 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : 2 Fn1 1,n2 1;1 s2 Testul F unilateral stnga 2 2 Ipoteza de verificat H 0 : 12 = 2 , cu alternativa H1 : 12 < 2 La nivelul de semnificaie determinm Fn1 1,n2 1; , pentru care: s12 P 2 Fn1 1,n2 1; = s2 i, deci, regiunea critic este: s2 W = x11 ,..., x1n1 ; x 21 ,..., x 2 n2 : 1 Fn1 1,n2 1; 2 s2

Puterea testului pentru o valoare dat a raportului

2 s12 2 s12 1 2 2 ( W , k ) = P 2 > Fn1 1,n2 1;1 1 = k 2 = P 2 2 > Fn1 1,n2 1;1 = P Fn1 1,n2 1 > Fn1 1,n2 1;1 k s2 1 s2 Tabelele pentru variabila Fh1 ,h2 fiind cu tripl intrare sunt mult mai complicate dect cele pentru variabila (2n ) sau variabila Student T(n). De aceea, s-a cutat s se simplifice ct mai mult i, n acest scop, ele sunt construite numai pentru valori ale variabilei Fn1 ,n2 mai mari dect unu. n aplicaii nu constituie nici un inconvenient, ntruct atunci cnd constituim s2 2 raportul 12 avem grij ca la numrtor s lum dispersia de selecie mai mare ( s12 > s2 ) . O s2 atenie deosebit va trebui s acordm ordinii n care scriem gradele de libertate, dat fiind faptul c:

12 2 = k este dat de expresia: 2

(2h )
1

Fh1 ,h2 =

h1

2 ( h2 )

2 ( h2 )

1 Fh2 ,h1

h2

h2

(2h )
1

h1 Aceast relaie ne d posibilitatea s determinm din aceleai tabele i valorile variabilei mai mici dect unu.

Teste pentru verificarea ipotezei privind egalitatea unui ir de dispersii. Testul lui Cochran i testul lui Hartley

Astfel de probleme se pun ori de cte ori se urmrete omogenitatea datelor, concret, omogenitatea produselor realizate n cadrul unui proces de producie. Problema care se pune este urmtoarea: efectundu-se seleciile xi1, xi2,,xin din populaiile normale N(m,i), 1 i k, dorim s verificm ipoteza: 2 2 H 0 : 12 = 2 =... = k , cu alternativa: H1 : exist i , j {1,2,..., k } , astfel nct i2 2 , la nivelul de semnificaie dat. j Dac pe baza seleciilor efectuate punem: 2 1 n 1 n x i = x ij , si2 = x ij x i ,1 i k , n j =1 n 1 j =1 atunci testul lui Cochran folosete statistica: s2 G = k max , si2

2 2 = max{ s12 , s2 ,..., sk } . Se demonstreaz c funcia de repartiie a variabilelor aleatoare G depinde numai de numrul de grade de libertate h = n-1 i numrul k al seleciilor. Valorile variabilei G sunt tabelate n funcie de n-1, de k i nivelul de semnificaie . Cu ajutorul valorii critice G(,n-1,k) se construiete regiunea critic: 2 s max xij ( , n 1, k ) W= : k G 1 i k,1 j n s2i i=1 Regula dup care se verific ipoteza H0 este urmtoarea: s2 Dac k max G( , n 1, k ) se accept H1; si2

i =1

unde s

2 max

( )

i =1

dac

2 smax

s
i =1

< G( , n 1, k ) , se accept H0.

2 i

Dac s-a verificat ipoteza H0 (dispersiile sunt omogene), se ia ca estimaie a dispersiei comune, media aritmetic a dispersiilor si2 , 1 i k, 1 k $ 2 = si2 k i =1 Testul lui Hartley Ca i testul prezentat anterior, se utilizeaz pentru verificarea ipotezei: 2 2 H 0 : 12 = 2 =... = k cu alternativa: H1 : exist i , j {1,2,..., k } , astfel nct i2 2 . j Statistica utilizat i care poart numele de statistica lui Hartley este: max si2 1 i k H= min si2
1 i k

are o funcie de repartiie ce depinde de numrul n-1 de grade de libertate i de k. Ea a fost tabelat de Hartley i pentru un nivel de semnificaie dat ne d posibilitatea s determinm (k) H n1;1 , astfel nct:
(k) P H < H n1;1 = 1

Urmeaz, de aici, regiunea critic: max si2 1 i k (k) W = x ij ,1 i k ;1 j n : H n 1;1 min si2 1 i k 2 max si 1i k (k) Se accept H0 dac 2 < Hn 1;1 , min si

1i k

iar n caz contrar se decide c este adevrat H1. Ipoteze referitoare la o caracteristic-calitativ S presupunem c se efectueaz un experiment ce const din probe independente n care n fiecare prob se realizeaz evenimentul A cu probabilitatea p sau contrariul su A , cu probabilitatea q, p+q = 1. Fiecrei probe i se asociaz variabila aleatoare Xj, cu repartiia: 1 0 x j : , j = 1,2,3,... p q Parametrul necunoscut este p asupra cruia formulm ipoteza: H0 : p = p0 cu alternativa H1 : p p0 Vom folosi pentru aceasta statistica frecven relativ de apariie a evenimentului A n n probe independente: k fn = n

Din teorema Maiore-Laplace, rezult c, pentru valori ale lui n suficient de mari, statistica: k p n Z= pq n urmeaz o lege de repartiie normal N(0;1). Dac H0 este adevrat, atunci: k p0 n N ( 0,1) Z= p 0 ( 1 p0 ) n i pentru dat putem determina z

, astfel nct:

k p0 n < z = 1 , P 1 p0 ( 1 p0 ) 2 n care ne conduce la regiunea critic: p0 ( 1 p 0 ) p0 ( 1 p0 ) k k ( x1 ,..., x n ) : p0 z ( x1 ,..., x n ) : p0 z W= 1 1 n n n n 2 2 pentru testul bilateral. n cazul testului unilateral dreapta: H0 : p = p0; H1 : p > p0 rezult regiunea critic: p0 ( 1 p0 ) k W = ( x1 , x 2 ,..., x n ) : p0 + z1 n n iar n cazul testului unilateral stnga: H0 : p = p0; H1 : p < p0 , avem regiunea critic: p0 ( 1 p0 ) k ( x1 , x 2 ,..., x n ) : p0 z1 W= n n S considerm acum cazul a dou populaii alternative (variabile calitative) de parametri p1, respectiv p2. k Pe baza a dou selecii de volume n1 i n2 respectiv se obin frecvenele relative 1 i n1 k2 respectiv. n2

Cu acestea se obin variabilele aleatoare (statisticile) independente: k2 k1 p1 p2 n2 n1 N ( 0,1) ; Z 2 = Z1 = N ( 0,1) p2 ( 1 p 2 ) p1 ( 1 p1 )

n2 n1 Rezult, de aici, c: k1 k 2 ( p1 p2 ) n1 n2 N ( 0,1) , Z = Z1 + Z 2 = p1 ( 1 p1 ) p2 ( 1 p2 ) + n1 n2 dac n1 i n2 sunt suficient de mari. Ne propunem s verificm ipoteza: H0 : p1 = p2, cu alternativa H1 : p1 p2 pentru un nivel de semnificaie dat. Dac H0 este adevrat, atunci: k1 k 2 n1 n2 Z= N ( 0,1) 1 1 p( 1 p) + n1 n2 Valoarea comun a celor dou probabiliti p1 i p2 cnd H0 este adevrat (pe care nu o cunoatem) o estimm ca o medie ponderat a celor dou frecvene relative: k1 k2 n1 + n2 n1 n2 k1 + k 2 p = = n1 + n2 n1 + n2 n aceste condiii, statistica Z devine: k1 k 2 n1 n2 Z= N ( 0,1) , 1 1 p ( 1 p ) + n1 n2 iar din: P z < z = 1 1 2 rezult regiunea critic: k 1 k2 1 1 k1 k 2 1 1 W= z p ( 1 p ) + z p ( 1 p ) + 1 1 n1 n2 n1 n2 n1 n2 n1 n2 2 2 Pentru testul unilateral dreapta: H0 : p1 = p2; H1 : p1 > p2 avem regiunea critic: k 1 k 1 W = 1 2 z1 p ( 1 p ) + n1 n2 n1 n2 iar pentru testul unilateral stnga: H0 : p1 = p2; H1 : p1 < p2

avem regiunea critic: k 1 k2 1 1 W= z1 p ( 1 p ) + n1 n2 n1 n2 Teste de concordan Ne-am ocupat de verificarea ipotezelor referitoare la parametrii unei legi de repartiie, adic am presupus c se cunoate forma repartiiei (este suficient repartiia teoretic). ntruct testele date pn acum s-au referit numai la parametrii unei repartiii, le numim teste parametrice. Adesea, ns, trebuie s verificm o ipotez chiar la legea de repartiie, adic s testm ipoteza: H0 : F(x) = F0(x) H1 : F(x) F0(x) , pe baza unei selecii de volum n : x1, x2,,xn. O ipotez care se refer la forma funciei de repartiie o vom numi ipotez neparametric, iar testele (regulile de decizie) prin care se verific o astfel de ipotez le vom numi teste neparametrice. Printr-un astfel de test stabilim existena sau neexistena unei concordane ntre datele de selecie x1, x2,,xn i ipoteza fcut referitor la forma funciei de repartiie. Din acest motiv, un astfel de test poart numele de test de concordan (sau criteriu de concordan). n cele ce urmeaz ne vom ocupa de dou teste de concordan: testul 2 al lui K. Pearson i testul lui Kolmogorov. Testul 2 a lui K. Pearson Fie X o variabil aleatoare care ia valori ntr-un interval (a,b) i a crei funcii de repartiie este F(x) = P(X<x). Capetele intervalului (a,b) pot fi i infinite (ambele sau numai unul). Din populaia caracterizat de variabila aleatoare X se efectueaz o selecie de volum n: x1, x2,,xn i pe baza acesteia vom verifica ipoteza H0 : F = F0, cu alternativa H1 : F F0. n acest scop, mprim intervalul (a,b) n r subintervale cu ajutorul punctelor de diviziune t1, t2,,tr-1. a t1 t2 ti-1 ti tr-1 b

Mrimea subintervalelor (ti-1,ti) se ia astfel nct fiecare subinterval s conin cel puin cinci valori de selecie. Este clar c subintervalele pot fi de lungimi diferite, iar dac ntr-un astfel de subinterval sunt mai puin de cinci valori de selecie, atunci acesta se reunete cu unul din subintervalele alturate. Notnd cu ni numrul valorilor observate din subintervalul (ti-1,ti), 1 i r, vom avea

n
i =1

= n.

Notnd cu pi probabilitatea ca variabila aleatoare X s ia valori n intervalul (ti-1,ti), vom putea scrie: p1 = P(X<t1) = F(t1) pi = P(ti-1 x < ti) = F(ti) - F(ti-1), 2 i r-1 pr = Pn(x tr-1) = 1 F(tr-1) i, n plus,

p
i =1

= 1.

Valoarea medie a numrului de valori de selecie situate ntr-un subinterval (ti-1,ti) va fi M(ni) = npi.

Abaterea funciei de repartiie empiric Fn(x) de funcia de repartiie teoretic F0(x) va putea fi evaluat cu ajutorul diferenelor: di = ni npi, 1 i r Cu ct diferenele di vor fi mai mici, cu att vom avea o concordan mai bun a datelor de selecie cu F0(x), adic o concordan ntre Fn(x) i F0(x). Evident c M(di) = 0,1 i r Dac r este suficient de mare, atunci pi vor fi suficient de mici i, deci, ni vor fi repartizate Poisson, ceea ce conduce la: D2(di) = D2(ni npi) = D2(ni) = M(ni) = npi, 1 i r Atunci, variabilele aleatoare: n npi zi = i ,1 i r npi vor fi asimptotic normale N(0;1). Urmeaz c: 2 r r ( n np ) i i S = zi2 = npi i =1 i =1 2 are o repartiie dac n este suficient de mare. Cum ntre variabilele Zi (deci i ntre ni) exist o legtur liniar:

zi npi = ( ni npi ) = ni n pi = 0
i =1 i =1 i =1 i =1

rezult c n suma S avem r-1 variabile normale N(0;1) independente i, deci: 2 r ( n np ) i i np = (2r 1) i =1 i Dac ntre repartiia empiric i repartiia teoretic F0 exist o bun concordan, atunci: r ( n np ) 2 i 2 i P > ( r 1) , = , npi i =1 fiind un nivel de semnificaie stabilit. Urmeaz, de aici, urmtoarea regul de acceptare sau respingere a ipotezei H0: Se alege un nivel de semnificaie i pentru ales se determin, din tabela valorilor variabilei 2 , valoarea (2r 1) , (valoarea tabelar). (valoarea calculat) este mai mic npi dect (2r1) , , atunci nu avem motive s respingem H0, deci acceptm H0 : F = F0.
i =1

Dac valoarea statisticii (2r 1) =

(n

npi )

Dac valoarea statisticii (2r1) depete valoarea tabelar (2r 1) , vom respinge ipoteza H0, dar acceptm H1 : F F0 cu nivelul de semnificaie considerat . Remarcm faptul c probabilitile pi = F(ti) F(ti-1) au fost calculate n ipoteza c funcia de repartiie F0(x) este complet specificat (nu conine parametri necunoscui). Adesea, ns, F0(x) conine un anumit numr de parametri care, nefiind cunoscui, vor trebui estimai tot cu ajutorul seleciei x1, x2,,xn. n felul acesta, n locul statisticii: 2 r ( n np ) i i (2r 1) = npi i =1

lucrm cu statistica: 2 r ( n np ) $i i

= (2r l 1) , $ npi unde p vor fi probabilitile estimate, adic cele obinute cnd am nlocuit valorile teoretice ale parametrilor cu valorile lor estimate pe baza acelorai date x1, x2,,xn. Dac l este numrul parametrilor estimai, atunci numrul legturilor devine l+1 i, 2 r ( n np ) $i i deci, statistica are asimptotic o repartiie (2r l 1) cu (r-l-1) grade de libertate. $ npi i =1 Regula de acceptare sau respingere se face acum exact ca i n cazul statisticii (2r1) . S observm c nu a intervenit faptul c funcia de repartiie F0 este continu sau nu. Deci, testul de concordan 2 se poate aplica att n cazul cnd F0 este continu, ct i n cazul cnd F0 are puncte de discontinuitate.
i =1

Vom meniona acum modul cum se testeaz faptul c F0 ( x ) =

k k , k = 0,1,2,... , adic este vorba de o variabil aleatoare repartizat Poisson. cnd X : e k! X N ( m, ) Testarea ipotezei H0 : F = F0 F0 ( x ) = P( X < x ) m m , ntruct P( X < ) = rezult c: ti m t m i 1 = ( zi ) ( zi 1 ) pi = F ( t i ) F ( t i 1 ) = $ Cum nu cunoatem valorile parametrilor m i , vom calcula probabilitile pi : t m zi = i ti x t i 1 x $ $ $ pi = = ( zi ) ( zi 1 ) , ti x s s $ zi = s Se trec rezultatele ntr-un tabel n care se menioneaz:
Nr. intervale i . . . Total Extremitile intervalului [ti-1,ti) . . .
r i =1

1 e 2

( y m) 2
2 2

dy , sau

ni . . .

$ zi =

ti x s . . .

$ ( zi )
. . .

$ $ $ pi = ( zi ) ( zi 1 )
. . .

n
2

=n
2

(n

$ npi )

(n

. . .

r2 l 1

$ npi ) $ npi . . .

$ npi

$ np
i =1

. . .
i

=n

Obs. l = 2 (2r 3)

Testarea ipotezei H0 : F = F0, e k P( x = k ) = , k = 0,1,2,... (repartiie Poisson de parametru ). k! k [ x] e 0 ( x) = n acest caz, F0 k! k =0 0 k e 0 P( x = k / 0 ) = ; k = 0,1,2,... k!
npi = nP( x = i ) ; P( x = i + 1) = pi +1 =

p0 = P( x = 0) = e 0 Valorile observate ale var. x i . . . Total Frecvenele empirice ni . . .

i +1

pi

Probele teoretice $ pi . . .

Frecvenele teoretice $ npi . . .


i

$ ni npi

ni = n
i =1
2

$ np
i =1

. . .
=n

(n

$ npi )

(n

. . .

(2r l 1)

$ npi ) $ npi . . .

Obs. l = 1 (2r 2 )

Criteriul de concordan al lui Kolmogorov Ca i n cazul anterior, dorim s verificm ipoteza H0 : F = F0, cu alternativa H1 : F F0 Criteriul pe care-l propunem are la baz teorema lui A. N. Kolmogorov, care stabilete legtura ntre funcia de repartiie F(x) a unei variabile aleatoare x i funcia de repartiie empiric stabilit pe baza unei selecii de volum n : x1, x2,,xn , extras din populaia caracterizat de variabila aleatoare X. Teorem: Dac Fn(x) este funcia de repartiie empiric determinat pe baza seleciei de volum n : x1, x2,,xn , extras dintr-o populaie caracterizat de variabila aleatoare X, care are funcia de repartiie F(x) continu, atunci: 2 2 k = k ( ) = ( 1) e 2 k , lim P sup Fn ( x ) F ( x ) n < x < n k = pentru > 0. Funcia K(), cunoscut sub numele de funcia lui Kolmogorov, este tabelat. Se dau, deci, valorile K() = 1 - . Aa, de exemplu, se obine un tabel prescurtat:
0,50 0,828 0,10 1,224 0,05 1,358 0,01 1,627 0,001 1,950

Pentru a uura calculele n aplicaii concrete, se tabeleaz i valorile raportului

pentru diversele valori ale lui n i pentru valori semnificative ale nivelului de semnificaie . Avem, spre exemplu:

n = 0,05 = 1,01

5 0,5633 0,6685 60 0,1723 0,2067

10 0,4087 0,4864 70 0,1197 0,1917

15 0,3375 0,4042

20 0,2939 0,3524 80 0,1496 0,1795

25 0,2639 0,3165 90 0,1412

30 0,2417 0,2898

40 0,2101 0,2521 100 0,1340

50 0,1884 0,2260

Regula dup care se accept ipoteza H0 : F = F0 sau se respinge ipoteza H0 este urmtoarea: Se fixeaz nivelul de semnificaie cruia i corespunde K() = 1 - . Pentru determinat se calculeaz raportul

= d n , . n Corespunztor valorilor de selecie x1, x2,,xn , se determin: nx d n = max F0 ( x ) Fn ( x ) ; Fn ( x ) = n

= d n , , n atunci nu avem motive s respingem ipoteza H0, deci vom accepta c legea de repartiie a variabilei X este dat de F0(x). = d n , , n nu avem motive s afirmm existena unei concordane ntre F0(x) i Fn(x) i ca atare respingem ipoteza H0. n scopul evitrii unor calcule cu frecvene relative, se nlocuiete inegalitatea:
max F0 ( x ) Fn ( x ) > Dac max F0 ( x ) Fn ( x )

Dac max F0 ( x ) Fn ( x ) <

cu inegalitatea echivalent: max nF0 ( x ) nFn ( x ) > n , care, evident, se exprim astfel: max nF0 ( x ) n x > n , care exprim diferena n valoare absolut a frecvenelor teoretice i empirice (cele teoretice fiind calculate cu funcia de repartiie F0 presupus a fi adevrat).

Verificarea ipotezei de normalitate N(m,) n acest caz avem, deci: F0 ( x ) =

1 e 2

( y m) 2
2 2

dy

n aceleai precizri ca n cazul testului 2, tabelul cu date prelucrate va trebui s cuprind: Nr. intervalelor i . . . Limitele intervalelor [ti-1,ti) . . .
$ ( z )

Frecvenele absolute ni . . .

Frecvenele relative ni / n . . .

Fn =

nx n

. . . F0 ( x ) Fn ( x ) . . .

$ z=

xx s . . .

$ F0 ( x ) = ( z ) . . .

. . .

Din tabel se citete max F0 ( x ) Fn ( x ) , apoi se aplic regula dup care se decide acceptarea sau respingerea ipotezei.
8.4. Elemente de analiz dispersional

Analiza dispersional este o metod statistic de cercetare prin care se pot analiza rezultatele observaiilor, rezultate ce depind de diveri factori ce acioneaz simultan. Prin aceast metod se pot depista factorii cu influen dominant i se estimeaz aceast influen. Ideea general a analizei dispersionale const n descompunerea dispersiei generale a unei variabile aleatoare X ntr-o sum de dispersii termeni aleatori independeni fiecare dintre acetia caracteriznd influena unuia sau a altuia dintre factori sau aciunea lor reciproc. Cnd se studiaz influena unui singur factor asupra caracteristicii cercetate, spunem c este vorba de analiz dispersional unifactorial, iar cnd se studiaz influena a doi factori avem un model de analiz dispersional bifactorial. Analiz dispersional unifactorial (variabilitatea unui fenomen n funcie de un singur factor) Se consider urmtorul tablou, comportnd n linii: x11x12.. x 1n1 x21x22.. x 2n 2 ... xh1xh2..x hn h n fiecare xij, 1 i h; 1 j ni, urmeaz aceeai lege normal N(m,). Dac notm: h 1 ni 1 h ni 1 h 1 ni 1 h xi . = x i = xij ; x.. = x = xij = ni xij = ni x i , cu n = ni , n j =1 n i =1 j =1 n i =1 ni j =1 n i =1 i =1

atunci:

(
h ni i =1 j =1 h

xij x

= xij x i + x i x
i =1 j =1

ni

) (
2

ni

i =1 j =1

xij x i

+ ni ( x i x ) +
2 i =1

+2 xij x i ( x i x )
i =1 j =1

ni

ntruct:

( x
h ni i =1 j =1
ni

ij

x ( x i x ) = ( x i x ) xij x i = 0,
i =1 j =1

ni

putem scrie egalitatea:

( x
h i =1 j =1

ij

) = ( x
2 h ni i =1 j =1

ij

) + n ( x
2 h i =1 i

x)

sau

T 2 = R 2 + L2 Aceast relaie poart numele de ecuaia analizei dispersionale unifactoriale, iar cantitile T2, L2 i R2 sunt numite, respectiv, variabiliti (adesea sunt numite impropriu dispersii): total, ntre linii (explicat prin linii) i reziduale. Teorema care urmeaz (i a crei demonstraie nu o vom da) st la baza verificrii ipotezelor ce se fac n modelul de analiz dispersional unifactorial. T 2 L2 R 2 Teorem. Cantitile 2 , 2 , 2 sunt variabile aleatoare ce urmeaz o lege de

repartiie 2 cu n-1, h-1, n-h grade de libertate, respectiv. L2 R2 Cantitile 2 i 2 sunt variabile aleatoare independente, de unde rezult c
L nh are o lege de repartiie Fisher Snedecor cu h-1, n-h grade de R2 h 1 L2 n h libertate respectiv, adic 2 = Fh1,n h . R h 1 Pe baza acestui model se poate rezolva urmtoarea problem: S presupunem c linia i din tabloul de date prezentat mai sus reprezint o selecie de volum ni : xi1, xi2, xi3,, xini dintr-o populaie normal N(mi, ), i = 1,2,3,..., ni . Ne propunem s verificm ipoteza H0 : m1 = m2 = = mh (media constant), cu alternativa: H1 : exist i, j {1,2,,h} astfel nct mi mj. ntruct, dac ipoteza H este adevrat, dispunem de o statistic a crei lege de repartiie este cunoscut i care este independent de care poate fi, deci, necunoscut, i anume: L2 n h = Fh 1,n h , R2 h 1 atunci, pentru fixat, regiunea critic este: L2 n h W= 2 Fh1,n h; R h 1 Decidem c H1 este adevrat dac: L2 n h Fh1,n h; , R2 h 1 iar dac: L2 n h < Fh1,n h; , R2 h 1 decidem c H0 este adevrat.
2

variabila aleatoare

S remarcm faptul c n acest caz nu mai intereseaz s avem la numrtor variabil L2 n h 2 care este mai mare, ntruct dac 2 este inferioar unitii, decidem c H0 este R h 1 adevrat. n practic, modelul se aplic n studiul unui fenomen caracterizat de o variabil X ale crei valori depind apriori de un factor A, numit factor de variabilitate al fenomenului. Efectund pentru fiecare nivel al factorului A, notat Ai , un numr de ni msurtori asupra variabilei X, procedeul de mai sus ne permite s decidem dac factorul A influeneaz semnificativ sau nu fenomenul investigat. n practic, acest test se utilizeaz frecvent fr a mai verifica dac populaia din care se obin observaiile urmeaz sau nu legi normale i nici dac aceste legi au aceeai dispersie, ceea ce este fundamental pentru ca statistica considerat s aib o repartiie F. Verificarea normalitii legilor de repartiie de ctre variabilele fiecrei linii a tabloului dat ar trebui s se fac pe baza unui test de concordan. ntruct numrul observaiilor este redus, nu vom fi n msur s respingem H0, adic normalitatea, cum de altfel nu vom putea respinge nici o alt lege de repartiie apriori specificat. Analiza dispersional bifactorial (variabilitatea unui fenomen n funcie de doi factori). Dac n tabloul precedent se consider ni = m, 1 i h, atunci: x11x12..x1m x21x22..x2m . xh1xh2..xhm S punem, ca i mai nainte: 1 m 1 h 1 h m xi . = xij ; x. j = xij ; x.. = xij m j =1 h i =1 n i =1 j =1 n = mh, atunci suma de ptrate unui calcul simplu.

( x
i, j
h

i. j

x..

se poate descompune, dup cum se constat n urma

( x
h m i =1 j =1

ij

x..

) = ( x
m i =1 j =1

ij

xi . x. j + x..

) + ( x
2 h i =1

i . x .. ) + h x. j x .. 2 j =1

sau:

T2 = R2 + L2 + C2 Cantitile T2, R2, C2, L2 sunt variabilele (dispersiile): total, ntre linii, ntre coloane i reziduale. mprite prin 2 ele urmeaz o lege 2 avnd respectiv n-1, h-1, m-1, (h-1) (m-1) L2 C 2 R 2 grade de libertate, iar 2 , 2 , 2 sunt n plus i independente.

Se obine atunci c: L2 ( m 1) = Fh1,( h1)( m1) (x) R2 C2 ( h 1) = Fm1,( h1)( m1) (xx) R2 Putem acum s rezolvm urmtoarea problem teoretic. Dac Xij N(mij,), 1 i h, L2 1 j m, atunci, utiliznd funcia de repartiie a variabilei 2 ( m 1) = Fh1,( h1)( m1) putem s R

verificm ipoteza H0 : mij = mj, pentru orice i = 1, 2, , h, cu alternativa H1 : mij mj, C2 utiliznd funcia de repartiie a variabilei 2 ( h 1) = Fh1,( h1)( m1) , putem s verificm ipoteza R H0 : mij = mi, pentru orice j = 1, 2, , m, cu alternativa H1 : mij mi Dac cele dou teste ne conduc la decizia H0, atunci vom avea mij = m, 1 i h; 1 j m. Aplicaie practic. Se consider un fenomen P ale crui valori pot depinde apriori de 2 factori numii adesea factori de variabilitate A i B : P = P(A, B). Fcnd s varieze independent factorii A i B i msurnd P n fiecare caz, procedeul de mai sus ne d posibilitatea s decidem dac A i/sau B au o influen semnificativ asupra lui P. A\B A1 A2 . . . Ah B1 P11 P21 B2 P12 P22 Bm P1m P2m

.. Ph1 Ph2 Phm

L2 Dac 2 ( m 1) > Fh1,( h1)( m1) ; , atunci A influeneaz semnificativ fenomenul P. R C2 Dac 2 ( m 1) > Fh1,( h1)( m1) ; , atunci B influeneaz semnificativ fenomenul P. R n studiul variabilitii unui fenomen n funcie de doi factori, ipoteza de normalitate a legii pe care o urmeaz variabilele Xij, precum i ipoteza de egalitate a dispersiilor acestor legi de repartiie, nu pot fi dect postulate i nu verificate, ntruct dispunem de o singur observaie pentru fiecare lege; adic, avem o singur observaie n celul. Rezultatele pot fi sintetizate n tabelul urmtor:
Componena dispersiei Suma ptratelor Nr. gradelor de libertate h-1 Estimaiile dispersiilor

ntre linii ntre coloane Rezidual


h m i =1 j =1

m( x

h( x
j =1

i =1 m

i . x .. )

.j

x..

m-1

1 h 2 m( xi. x.. ) = s12 h 1 i =1 2 1 m h x. j x.. = s22 m 1 j =1

(
h

xij xi . x. j + x..
m

(h-1) (m-1) n-1 = = mh-1

h m 1 x xi . x. j + x.. ( h 1)( m 1) ij i =1 j =1
h m 1 xij x.. mh 1 i =1 j =1

2 = s3

Total

( x
i =1 j =1

ij

x..

= s2

Un tabel analog se poate ntocmi i n cazul modelului unui factorial.

8.5. Elemente de analiz secvenial. Testul secvenial al raportului probabilitilor

n toate problemele studiate prin metoda seleciei s-a presupus c volumul de selecie este determinat, fixat apriori. Exist ns experimente n care se folosete informaia acumulat n timpul seleciei; deci, exist metode care ne permit s decidem asupra caracteristicilor studiate n succesiunea experimentelor, mai bine dect orice metod n care volumul seleciei este dinainte fixat. Aceste metode au fost introduse de statisticianul A. Wald i sunt cunoscute sub numele de metode secveniale, dat fiind faptul c se opereaz asupra termenilor succesivi ai irului de observaii pe msur ce acetia s-au obinut. n testarea ipotezelor, analiza secvenial d o regul dup care se ia una din urmtoarele decizii, la fiecare etap a experimentului: (a) acceptarea ipotezei (b) respingerea ipotezei (c) continuarea experimentului prin efectuarea unei alte probe, dup care se reia procesul de decizie. Acest procedeu este numit testul secvenial al raportului probabilitilor (TSRP) i n care numrul de probe este aleator. Vom descrie modul cum se apreciaz n procesul de luare a deciziei. Fie C caracteristica unui fenomen studiat, caracterizat de variabila aleatoare X, cu densitatea de repartiie f(x;), (sau, n cazul unei variabile discrete, P(X = x,)). Pe baza unei selecii ne propunem s verificm ipoteza H0 : = 0, cu alternativa H1 : = 1, utiliznd metoda Neuman-Pearson, cu ajutorul raportului:

f (x
n j =1 n j =1

, 1 , 0

f (x

s-a construit o regiune critic, pentru un volum de selecie, n, fixat, i pe baza acestei regiuni critice se decide dac este adevrat H0 sau H1. n cazul cnd volumul de selecie nu mai este fixat, ci este aleator, s considerm rapoartele:
p1 = p0

f (x
n j =1 n j =1

, 1 , 0

f (x

, = 1,2,3,...

Se fixeaz dou numere A i B i observaiile continu atta timp ct: p1 B< <A p0 p p Dac 1 A observaiile nceteaz i se accept H0, iar dac 1 A observaiile p0 p0 nceteaz i se accept H1. Dac se dau probabilitile i ale erorilor de genul unu i doi, se poate demonstra c cele dou numere A, B pot fi determinate n mod unic. Valori aproximative foarte bune 1 , B= . sunt A = 1

Se pune ntrebarea dac decizia de acceptare a ipotezei H0 sau H1 se poate lua dup un numr finit de probe. Referitor la aceasta, A. Wald a demonstrat c probabilitatea ca procedeul secvenial s se ncheie cu acceptarea ipotezei H0 sau H1 este egal cu 1, adic cu probabilitatea 1 numrul probelor, , este finit. ntruct este variabil aleatoare, vom determina valoarea medie a sa. Fie cel mai mic ntreg pentru care: p1 p1 Z = log sau Z = log log A . p0 p0 Corespunztor celor dou ipoteze, H0 i H1 , vom calcula: M( / H0) i M( / H1) Dac H0 este adevrat, probabilitatea de a accepta H0 este 1 - , iar probabilitatea de p a accepta H1 este . Primul caz corespunde aproximativ la log 1 = log B , iar al doilea la p0 p1 log = log A . p0 Pentru fiecare , cnd H0 este adevrat, obinem variabila Z: log B log A Z : , 1 atunci: M ( Z / H 0 ) = ( 1 ) log B + log A Dar:

Z = log

f x j , 1 p1 = log = Z j p0 j =1 j =1 f x j , 0

( (

) )

Cum Zi, 1 i sunt variabile aleatoare independente i identic repartizate, iar este o variabil aleatoare, rezult: M ( Z / H 0 ) = M Z j / H 0 = M (Z / H 0 ) = M ( / H 0 ) M ( Z / H 0 ) j =1 Deci: M ( Z / H 0 ) ( 1 ) log B + log A M ( / H 0 ) = = M ( Z / H0 ) M ( Z / H0 ) Analog, se obine: log B + ( 1 ) log A M ( / H1 ) = M ( Z / H1 ) Valorile medii M(Z/H0) i M(Z/H1) se pot calcula ndat ce f(x,) este dat. Textul secvenial al raportului probabilitilor este frecvent aplicat n controlul statistic de recepie a loturilor de produse. n acest caz, este probabilitatea de a respinge un lot corespunztor i este numit riscul furnizorului, iar este probabilitatea de a accepta un lot necorespunztor i este numit riscul beneficiarului. Fixarea riscurilor i conduce la determinarea numerelor A i B; de aici, planul de control secvenial. Ca aplicaii ale TRSP vom considera uzul repartiiei binomiale i cel al repartiiei normale N(m,).

Repartiia normal N(m,) Pentru o selecie ntr-o populaie caracterizat de variabila aleatoare X, repartizat N(m,), cu cunoscut, pentru verificarea ipotezei H0 : m = m0, cu alternativa H1 : m = m1 obinem:
p1 = p0
1 2 e j =1

( x m )
j

1 2

0 j 1 2 e 2 2 j =1 n condiia de continuare a probelor se obine: m1 m0 m0 + m1 ln B < < ln A x j 2 2 j =1

( x m )

=e

1 x j m1 2 2

) ( x m )
2 j 0

=e

m1 m0 2 2

x j
j =1

m0 + m1 2

m0 + m1 2 ln A m0 + m1 + + < xj < , m1 m0 m1 m0 2 2 j =1 dac m1 > m0. Folosind acum logaritmi zecimali i notnd: m + m1 2 log B 2 log A , h1 = 2,303 ; h2 = 2,303 ; h3 = 0 m1 m0 m1 m0 2 dubla inegalitate devine:

sau:

2 ln B

h1 + h3 < x j < h2 + h3
j =1

Regula de decizie la fiecare pas este urmtoarea: (1) dac (2) dac

x
j=1

h1 + h3 , se accept ipoteza H0; h2 + h3 , se accept ipoteza H1;

x
j=1

(3) dac h1 + h3 < x j < h2 + h3 , se continu selecia, cu luarea altei probe.


j =1

Pentru a calcula M(/H0) i M(/H1) va trebui s calculm M(Z/H0) i M(Z/H1). ( x m) 2 1 2 Dac f ( x , m, ) = e 2 , atunci: 2 1 1 2 Z = ln f ( x; m1 , ) ln f ( x; m0 , ) = 2 x( m1 m0 ) ( m12 m0 ) ; 2 urmeaz c: 1 1 2 M ( Z / H 0 ) = 2 x( m1 m0 ) ( m12 m0 ) f ( x; m0 , ) dx = 2
= Analog:
M ( Z / H1 ) =

1 1 2 1 ( m1 m02 ) = 2 2 ( m1 m0 ) 2 . 2 m0 ( m1 m0 ) 2
1 2
2

(m

m0 )

Deci: M ( / H 1 ) =

, M ( / H 0 ) = 2 m0 ) ( m1 m0 ) 2 1 Relaiile se pot exprima n funcie de h1, h2, h3 , dup cum urmeaz: h2 + ( 1 ) ( h1 h2 ) , M ( / H 0 ) = m0 h3

2 2 log B + ( 1 ) log A

(m

2 2 [ ( 1 ) log B + log A]

, m1 h3 iar numrul maxim de probe necesar lurii deciziei H0 sau H1 este: hh M ( ) max = 1 22

M ( / H1 ) =

h2 + ( h1 h2 )

Repartiia binomial n acest caz, selecia se face din populaia caracterizat de variabila aleatoare 1 0 X : , q = 1 p . Atunci: p q
P( X = x / p) = p x ( 1 p)

j =1 1 x

, x = 0,1

Dac notm cu d = x j , atunci calculele pentru verificarea ipotezei H0 : p = p0, cu alternativa H1 : p = p1 (p1 > p0) vor fi: d d p1 p1 1 p1 = p0 p0 1 p0 Dubla inegalitate: p1 < log A log B < log p0 este echivalent cu: p1 1 p1 + ( d ) ln < log A log B < d log p0 1 p0 Efectund unele calcule elementare, putem scrie: 1 p1 1 p1 log log 1 p0 1 p0 log B log A < d < + + 1 p1 1 p1 1 p1 1 p1 p1 p1 p1 p1 + log log log log log + log + log + log 1 p0 1 p0 1 p0 1 p0 p0 p0 p0 p0
1 p1 1 p0 log B log A , h1 = ; h2 = ; h3 = p1 p1 p1 1 p1 1 p1 1 p1 + log + log log log log + log p0 p0 p0 1 p0 1 p0 1 p0 dubla inegalitate devine: h1 + h3 < d < h2 + h3 Regula dup care se ia decizia este urmtoarea: (1) dac d h1 + h3 , se accept ipoteza H0; log

Sau, dac notm:

(2) dac d h2 + h3 , se accept ipoteza H1; (3) dac h1 + h3 < d < h2 + h3 , se continu experimentul cu luarea altei probe i se reia procesul de decizie. S calculm M(/H0) i M(/H1). Pentru aceasta, s calculm mai nti M(Z/H0). 1 x ntruct P( X = x , p) = p x ( 1 p) , x = 0,1 , vom putea scrie: 1 1 p1 1 p1 x 1 x + ( 1 x ) ln M ( Z / H 0 ) = zP( X = x , p) = x ln p0 ( 1 p0 ) = p0 1 p0 x=0 x=0 p1 1 p1 + p0 log = ( 1 p0 ) log p0 1 p0 De aici, rezult: ( 1 ) log B + log A M ( / H 0 ) = 1 p1 p p0 log 1 + ( 1 p0 ) log 1 p0 p0 Procednd n mod analog, obinem: log B + ( 1 ) log A M ( / H1 ) = p 1 p1 p1 log 1 + ( 1 p1 ) log p0 1 p0 Se poate demonstra c numrul mediu maxim de probe necesare pentru a decide H0 sau H1 este dat de: log B log A M ( ) max = 1 p1 p1 log log 1 p0 p0

Capitolul 9 ELEMENTE DE TEORIA CORELAIEI I REGRESIEI Una din principalele probleme ale teoriei probabilitilor i statisticii matematice este cea a studiului dependenei dintre dou sau mai multe variabile. Dou sau mai multe variabile pot fi sau independente sau dependente funcional sau dependente stochastic. Prin dependena funcional ntre Y i X1, X2,, Xn nelegem o aplicaie f care asociaz fiecrui (x1, x2,,xn) E un element Y F i numai unul, adic: Y = f(x1, x2,,xn) Exemple de dependen funcional se ntlnesc n toate domeniile n care pare T modelul matematic. Un astfel de exemplu l poate constitui legea gazelor perfecte P = R , V unde R este o constant caracteristic gazului. Dependena funcional poate exista i ntre variabile aleatoare, aa, de exemplu, avem variabila Student: X t ( n) = 1 n 2 x n j =1 j unde X, X1, X2,,Xn sunt variabile aleatoare independente repartizate normal N(0;1). De asemenea, 2 ( n1 ) / n1 F ( n1 , n2 ) = 2 , ( n 2 ) / n2

unde 2 ( n1 ) i 2 ( n2 ) sunt variabile hi ptrat independente. ntre variabilele aleatoare poate exista i o alt dependen dependena stochastic pe care o vom studia n cele ce urmeaz. O astfel de dependen apare atunci cnd acioneaz factori externi att asupra unei variabile, ct i asupra celeilalte (celorlalte). Acetia determin o anumit legitate probabilistic a variabilelor (X, Y, Z, ). Vom spune c ntre variabilele X1, X2,,Xn exist o dependen stochastic, dac se d legea de repartiie a vectorului aleator (X1, X2,,Xn), care d posibilitatea stabilirii legilor de repartiie condiionate. Aceast dependen i gsete o aplicaie fundamental n prognoz, adic n indicarea limitelor n care cu un anumit nivel de ncredere se va gsi o variabil, dac celelalte, cu care se afl n legtur stochastic, iau valori bine determinate. S studiem dependena stochastic n cazul a dou variabile aleatoare X i Y discrete, caz ntlnit deosebit de frecvent n aplicaii, apoi s menionm modul cum se obin rezultatele corespunztoare n cazul continuu. Fie vectorul aleator (X,Y) cu repartiia: ( x, y) ( X , Y ) : , ( x, y) I x J , p( x , y ) unde am pus p(x,y) = P(X=x; Y=y) De aici se obin probabilitile marginale: P( X = x ) = p( x ) , P( Y = y ) = p( y ) p( x ) = p( x , y ) ; x I
p( y ) =
y J
x I

p( x, y); y J

i repartiiile marginale: x y X : , x I ; Y: , y J P( x ) P( y ) Probabilitile condiionate sunt date de: p( x / y ) =


p( y / x ) =

p( x / y ) p( y )

, dac p(y) 0,

p( x / y ) , dac p(x) 0. p( x ) Problemele practice cer adesea s se stabileasc cum variaz media unei variabile, cnd cealalt ia o valoare determinat. S observm mai nti c dac variabilele aleatoare X i Y sunt independente, atunci p(x,y) = p(x)p(y) pentru orice x I i y J i reciproc. Rezult de aici c p(x/y) = p(x), p(y/x) = p(y). Definiie. Se numete regresie a lui Y asupra lui X, M ( Y / X = x ) = y( x ) . Se numete regresie a lui X asupra lui Y: M ( X / Y = y ) = x( y ) . Din definiie rezult: M ( Y / X = x ) = M ( Y / x ) = y( x ) = yp( y / x )
M ( X / Y = y ) = M ( x / y ) = x( y ) =

xp( x / y)
x I

y J

Observaie. Dac variabilele X i Y sunt independente, atunci: M ( Y / X = x ) = y( x ) = a y (constant)

Y asupra variabilei X. Analog, locul geometric al punctelor ( y , x( y ) ) poart numele de curb de regresie a variabilei X asupra variabilei Y. Se observ imediat c aceste curbe de regresie mai pot fi exprimate astfel: yp( x, y) p( x , y ) y J y( x ) = yp( y / x ) = y = p( x ) y J y J p( x, y)
y J

Locul geometric al punctelor ( x , y( x ) ) poart numele de curb de regresie a variabilei

M ( X / Y = y ) = x( y ) = a x (constant)

xp( x, y) x( y ) = xp( x / y ) = p( x, y)
x I x I x I

n jurul mediilor condiionate, ca i n jurul mediilor obinuite, mprtierea este supus de fiecare dat unei legi de repartiie determinat, lege care depinde pentru fiecare variabil de valoarea luat de cealalt variabil. S vedem cum msurm mprtierea valorilor variabilei Y n jurul mediei condiionate y( x ) . Prin definiie: 2 D 2 ( Y / x ) = 2 y / x = ( y y( x ) ) p( y / x )
y J

Odat cu curba de regresie y( x ) avem i curba dispersiilor condiionate 2 y / x , numit i linia schedastic.

Analog, pentru variabila X avem: 2 D 2 ( X / y ) = 2 x / y = ( x x( x ) ) p( x / y )


x I

Media condiionat introduce repartiia: y( x ) ,x I p( x ) i, de aici: M ( y( x ) ) = y( x ) p( x ) = p( x ) yp( y / x ) =


x I x I y J

x I y J

yp( y / x) p( x) = yp( x / y) = M ( Y ) = a
x I y J

(constant) i:

D 2 ( y( x ) ) = y ( x ) =

( y( x ) a )
x I y

p( x )

Relaiile anterioare pentru media condiionat x( y ) i: x( y ) , y J ; M x( y ) = xp( x , y ) = M ( x ) = a x (constant) x I p( y )

y J

i:

2 D 2 x( y ) = x ( y ) =

y J

( x( y) a ) p( y)
2 x

Dac lum acum n consideraie repartiia: 2 y / x ,x I p( x ) Suntem condui la valoarea medie: 2 2 2 M y / x = y / x p( x ) = y / x

x I

pe care o vom numi dispersie condiionat medie. Am introdus, aadar, relativ la componenta Y a vectorului aleator (X,Y) urmtoarele dispersii: 2 2 2 y , y( x ) , y / x
ntre aceste dispersii are loc egalitatea: 2 2 2 y = y( x ) + y / x
2 y = y a y p( y) = y a y 2 y J y J

Demonstraie:

) p( x) p( y / x) = ( y a )
2 x I x I y J y

p( x) p( y / x) = y a y p( y / x)
2 xI

ns: i, de aici:

( y a ) = ( y y( x ) )
2 y 2 y J y

+ 2( y y( x ) ) y( x ) a y + y( x ) a y
2

) (

( y a ) p( y / x) = ( y y( x) p( y / x) ) + 2( y( x) a ) ( y( x) a )
y J y y J y y J

Cum: ( y y( x) ) p( y / x) =
y J

yp( y / x) y( x) p( y / x) = y( x) y( x) = 0,
y J

avem:
2 y = x J 2

p( x) ( y y( x) ) p( y / x) + ( y( x) a ) p( y / x) =
2 2 y J y J y

D
x I

( Y / x ) p( x ) + y( x ) a y
x I

) p( x) p( y / x) =
2 y J

y( x ) + y / x
2

9.1. Raportul de corelaie Prin definiie, raportul de corelaie al variabilei Y n raport cu X, notat y / x , este dat de:

2 y/ x

Analog, raportul de corelaie al variabilei X n raport cu Y, notat x / y , este dat de:


2 2 x / y x( y ) = 1 2 = 2 x x Se vede imediat c 0 y / x 1, dac se convine s se ia raportul de corelaie pozitiv 2 x/ y

2 2 y / x y( x ) = 1 2 = 2 y y

sau nul. Raportul de corelaie este un indicator numeric al intensitii legturii de corelaie ntre variabilele X i Y. Proprietile raportului de corelaie: (1) Dac ntre variabilele X i Y exist o dependen univoc, atunci: 2 y/ x = 1 ntr-adevr, n acest caz nu exist mprtiere n jurul curbei de regresie y( x ) , cci unica valoare a variabilei Y pentru X = x coincide cu y( x ) . 2 (2) Dac y / x = 1, atunci Y este funcie univoc de X.
2 ntr-adevr, dac y / x = 1 rezult c y / x = 0 i, drept urmare, nu exist mprtiere n jurul curbei de regresie. Deci, fiecrei valori x a lui X i corespunde o valoare determinat Y = y( x ) . 2 (3) Dac x i y sunt necorelate, atunci: y / x = 0 . ntr-adevr, necorelarea variabilei Y n raport cu X nseamn c media condiionat ( x ) este constant: y y( x ) = M ( Y ) = a y 2 2 Deci, n acest caz, y ( x ) = 0 i, de aici, y / x = 0 .
2 n particular, y / x = 0 dac Y nu depinde de X, cci atunci y( x ) = a y . 2 (4) Dac y / x = 0 , atunci Y este necorelat cu X, adic y( x ) = M ( Y ) = const .

ntr-adevr,

2 y/ x

2 y( x )

y( x ) = a y = const . 2 2 S observm c ntre x / y i y / x nu exist nici o legtur. Se poate ca unul din coeficieni s ia valoarea zero, iar cellalt valoarea 1, cu toate consecinele ce se deduc din

2 y

=0

conduce

la

2 y ( x ) = 0 , ceea ce nseamn c

2 2 proprietile raportului de corelaie. Dac, ns, y / x = x / y = 1, atunci dependena funcional a lui Y n raport cu X este monoton.

9.2. Coeficientul de corelaie Un alt indicator ce msoar existena i intensitatea legturii stohastice este coeficientul de corelaie. S considerm variabilele aleatoare X i Y, despre care presupunem c au dispersii finite D 2 ( X ) < , D 2 ( Y ) < . Atunci definim corelaia variabilelor X i Y, sau covariana lor, i o vom nota xy = cov ( X , Y ) .

xy = cov ( X , Y ) = M ( X M ( x ) ) ( Y M ( y ) ) = M ( X , Y ) M ( X ) M ( Y ) XY = XY D( X ) D( Y )

Coeficientul de corelaie al variabilelor X i Y este, prin definiie:

Proprietile coeficientului de corelaie: (i) Dac variabilele X i Y sunt independente, atunci: XY = 0. Reciproc nu este adevrat. (ii) Oricare ar fi variabilele aleatoare X i Y, avem: 1 XY 1 (iii) Dac XY = 1, atunci ntre X i Y exist o relaie liniar, adic Y = aX + b, cu a =, b constante i reciproc. S demonstrm aceste proprieti: (i) Cum XY = M ( XY ) M ( X ) M ( Y ) i cum prin ipotez X i Y sunt independente, rezult c: M ( XY ) = M ( X ) M ( Y ) i, de aici, XY = 0 , adic XY = 0. Variabilele aleatoare X i Y pentru care XY = 0 se zic necorelate. Dac se consider vectorul aleator (X,Y), cu repartiia: Y X -1 0 1 0 2 9 3 9 2 9 7 9 1 1 9 0
1 9 2 9
1 3 1 3 1 3

Se constat imediat c M ( XY ) =

2 1 1 + = 0; M ( Y ) = , M ( X ) = 0 . 9 9 9 Deci, X ,Y = 0, dei variabilele aleatoare X i Y nu sunt independente. 1 7 = P( X = 0) P( Y = 0) . Se constat imediat c P( X = 0, Y = 0) = 3 27

(ii) Din definiia coeficientului de corelaie i din inegalitatea lui Schwartz obinem:

M [( X M ( X ) )( Y M ( Y ) )] M ( X M ( X ) )
Se observ c dac Y = X, atunci: X , X atunci: X , X =
M ( X M ( X ) )
2

( [

] ) ( M [( Y M ( Y ) ) ] ) = D( X ) D( Y ) M [( X M ( X ) ) ] = = 1 i dac Y = - X,
2 2
2

1 2

1 2

D ( X) adic sunt atinse valorile extreme. (iii) S artm c dac X ,Y = 1, atunci ntre X i Y exist o relaie liniar i reciproc. S presupunem c Y = aX + b. Atunci M ( Y ) = aM ( X ) + b i: 2 M [ ( X M ( X ) ) ( aX + b aM ( X ) b) ] M a( X M ( X ) ) X ,Y = = = D( X ) D( aX + b) a D2 ( X ) 1 , a < o aD 2 ( X ) = =0 , a=0 a D2 ( X ) 1 , a>0 S presupunem acum c = 1 i s notm: X M( X ) Y M(Y) X '= ,Y ' = D( X ) D( Y ) Se constat c: M ( X ' Y ') = xy = 1 i c: 2 2 M ( X M( X )) M (Y M (Y )) 2 M X 'Y ' = + 2 M ( X ' Y ') D2 ( X ) D2 (Y ) Deci: 2 M X 'Y ' = 2 2( 1) = 0 , de unde rezult c X 'Y ' = 0 aproape peste tot pe . De aici obinem: Y M (Y) X M( X ) = Y ' = X ' , adic , sau: D( Y ) D( X ) D( Y ) ( X M( X )) , Y = M(Y) D( X ) ceea ce dovedete afirmaia. Dreptele: x M( X ) y M(Y) = D( X ) D( Y ) y M(Y) x M( X ) = D( Y ) D( X ) se numesc drepte de regresie i trec prin punctul ( M ( X ) , M ( Y ) ) .

] = 1 ,

D2 ( X )

)
)

9.3. Corelaie i dependen stohastic n cazul variabilelor continue S considerm vectorul aleator (X,Y), cu densitatea de repartiie f(x,y). Atunci:
M ( Y / x ) = y( x ) = yf ( y / x ) dy ,
f ( x, y) ; f 1 ( x ) = f ( x , y ) dy f 1 ( x) sunt respectiv densitatea de repartiie condiionat i densitatea de repartiie marginal. Cu acestea mai putem scrie:

unde:

f ( y / x) =

M ( Y / x) = Analog:

yf ( x, y) dy f ( x, y) dy

2 Y/x

= D ( Y / x) =
2

[ y M ( Y / x)] f ( y / x) dy
2

i, de aici, dispersia condiionat medie: 2 2 ( x ) dx = ( y M ( Y / x ) ) f ( y / x ) dy f 1 ( x ) dx = Y / X = Y / x f1

[ y M ( Y / x)] f ( x, y) dxdy
2

n fine, dispersia mediilor condiionate este:


2 y ( x ) = [ M ( Y / x ) M ( Y ) ] f 1 ( x ) dx 2

S punem n eviden o proprietate general a curbei de regresie i anume: Propoziie. Curba de regresie are proprietatea c: 2 M ( Y M ( Y / x ) ) = min

i, analog:

M X M ( X / y)

[(
[

] = min
reprezint abaterea ptratic medie de la curba u(x) i
2

Demonstraie. Fie u(x) o curb oarecare i s considerm: 2 2 2 M ( Y u( x ) ) = ( y u( x ) ) f ( x , y ) dxdy = ( y u( x ) ) f ( y / x ) dy f 1 ( x ) dx R2

Cum

2 cum pentru variabila unidimensional avem x M [ ( X a ) ] cu egalitate dac i numai

( y u( x) ) f ( y / x) dy
2

dac a = M ( X ) , rezult c M ( Y u( x ) )

] = min dac i numai dac u( x) = M ( Y / x) .

Exemplul 1. Se consider vectorul aleator (X,Y) cu densitatea de repartiie e y daca 0 x < , x x < f ( x, y) = 0 in rest S se determine curbele de regresie M(Y/x) i M(X/y). Soluie. Conform definiiei:

M ( Y / x ) = yf ( y / x ) dx

ns: f 1 ( x) = i de aici:

f ( x, y) dy = e y dy = e x
x

e x y daca 0 x y < f ( y / x) = 0 in rest Urmeaz c:

M ( Y / x ) = ye
x

x y

dy = e

ye
x

dy = e x [ xe x + e x ]

S aflm curba de regresie a lui X asupra lui Y: M ( X / y) = Cum:


f 2 ( y) =

xf ( x / y) dx
y y

f ( x, y) dx = e
0

dx = ye y y 0

e y y ,0 x y , y > 0 f ( x , y ) = ye 0, in rest Atunci: y x y M ( X / y ) = dx = , y > 0 2 0 y Exemplul 2. Se consider vectorul aleator (X,Y) repartizat normal bidimensional de 2 x x y parametri mx , m y i . 2 y x y S se determine curbele de regresie M(Y/x) i M(X/y). Soluie. Vectorul (X,Y), fiind normal bidimensional, are densitatea de repartiie: 2 ( x m x ) y m y y m y ( x mx ) 2 1 1 f ( x, y) = exp 2 + 2 2 2 x y y 2 x y 1 2 2( 1 ) x Urmeaz c densitatea de repartiie marginal a lui X este:

) (

f 1 ( x) =

( x, y)dy =

2 ( x mx ) y m y y m y 1 1 ( x mx ) 2 = + exp 2(1 2 ) 2 x y y 2 x y 1 2 x

) (

dy

Fcnd schimbarea de variabile: y my x mx = u, = v , dy = y dv

y
1

2 u 2 + 2 u 2 2uv + v 2 ] dv = 2 2 x 1 2 u2 1 e = exp 2(1 2 ) ( v u) 2 dv 2 x 1 2 Dac punem acum: v u = z , dv = 1 2 dz , 2 1 obinem mai departe: f 1 ( x) =

obinem:

exp 2(1 ) [ u

1 f 1 ( x) = e 2 x 2 Prin simetrie, avem:


1 2 f 2 ( y) = e y 2 De aici:

1 x mx x

1 y my y

( x m ) 2 ( x mx ) y m y 1 x f ( x / y) = = exp 2 + 2 2 x y f 2 ( y) 2 x 1 2 2( 1 ) x 2 2 2 x mx y my y my y my 1 1 = exp + (1 2 ) 2 2 2 2( 1 2 ) 2( 1 ) x y y y x Deci: 2 x 1 1 f ( x / y) = exp y my x mx 2 y 2( 1 2 ) x x 2( 1 2 ) Cum avem de a face cu repartiie normal de parametrii: valoarea medie f ( x, y) 1

mx +

x 2 y m y i dispersiei ( 1 2 ) x avem M ( X / y ) = mx + x y m y y y 2 2 / y = ( 1 2 ) x X

Prin simetrie avem:


f ( y / x) = 1

y 2( 1 2 )

2 y 1 exp y my ( x mx ) 2 2 x 2( 1 ) y

i: M ( Y / x) = my +

y ( x mx ) Y2/ x = (1 2 ) y2 x

Graficul funciei M(X/y) (precum i al funciei M(Y/x)) este o dreapt. Deci, n cazul repartiiei normale bidimensionale curbele de regresie sunt drepte (dreptele de regresie).

Aceste drepte trec prin punctul P mx , m y , care este numit centrul repartiiei normale bidimensionale. 9.4. Ecuaiile de regresie. Coeficienii de regresie i corelaie Am vzut c fiind dat vectorul aleator (X,Y), curbele de regresie a lui Y fa de X i al lui X fa de Y sunt: M ( Y / x ) = y( x ) ; M ( X / y ) = x( y ) S admitem c aceste curbe de regresie sunt drepte: M ( Y / x ) = y( x ) = a + bx M ( X / y ) = x( y ) = c + dy lund valoarea medie obinem: M ( M ( Y / x ) ) = M ( y( x ) ) = a + bM ( X ) , sau m y = a + bmx . Scznd-o din relaia ce d pe y( x ) , obinem: y( x ) m y = b( x mx ) nmulind cu x mx i lund valoarea medie se obine: 2 XY = cov ( X , Y ) = b x , b=

adic:

X ,Y 2 x y x

De aici se obine c coeficientul unghiular al dreptei de regresie a lui Y n raport cu X este coeficientul de regresie pe care-l notm bY / X i care se mai poate exprima: bY / X =

Cu acestea obinem ecuaia dreptei de regresie: y( x ) m y = bY / X ( x mx ) S vedem care este expresia raportului de corelaie cnd avem o regresie liniar. 2 Pentru aceasta, s exprimm y ( x ) . Conform definiiei:

2 y( x )

= M y( x ) m y

y 2 2 2 2 2 2 = M bY / X ( X mx ) = bY / X x = 2 2 x = 2 y

De aici, rezult:

sau:

2 Y/ X

2 y( x ) 2 y

= 2

Y / X =
Dac regresia lui X fa de Y este, de asemenea, liniar, se obin rezultatele simetrice: x( y ) m x = b X / Y y m y b X /Y =

X /Y

XY x 2 = y y =

De aici se obine: Y / X = X /Y =
b X /Y bY / X =

Relaiile b X /Y

x y = 2 i = b X /Y bY / X y x y x = i bY / X = spun c b X /Y i bY / X au acelai semn ca i . y x

Dac > 0, ambele drepte de regresie (ce trec prin punctul mx , m y ) formeaz

unghiuri ascuite cu direciile axelor Ox i Oy respectiv. n acest caz spunem c avem o corelaie pozitiv, ceea ce nseamn c dac o variabil crete, crete i cealalt. Pentru = 0 , dreapta de regresie a lui Y fa de X este o paralel cu Ox, iar x( y ) este paralel cu Oy. n acest caz, unghiul dintre cele dou drepte este de 900. Cnd crete, unghiul ascuit dintre dreptele de regresie descrete, iar pentru = 1 dreptele coincid. y m y x mx = ,

n care caz fiecare dintre variabilele aleatoare X i Y sunt funcii liniare una de cealalt. Dac < 0, adic avem o corelaie negativ, dreptele de regresie ce trec prin punctul Unghiul ascuit dintre drepte descrete pe msur ce 1 i n cazul cnd = 1 ambele drepte coincid. 9.5. Dreapta de regresie ca aproximaie a curbei de regresie neliniar n cazul unei corelaii liniare, variabilele X i Y se exprim liniar una n funcie de cealalt: Y mY X mX X mX Y mY ; = =

(m ,m )
x y

formeaz un unghi obtuz cu direciile pozitive ale axelor Ox i Oy respectiv.

Se pot menine aceste drepte n cazul unei corelaii strnse, dar arbitrare n sensul pe care-l precizm mai jos. S exprimm variabila Y cu ajutorul unei funcii liniare de X: $ Y + X = y ( X ) Pentru a da un sens precis acestei aproximri, vom introduce o msur a abaterii de la
2 liniaritate prin SY = M Y ( + X )

[(

] = M [( Y ( y$( X ) ) ) ] i determinm parametrii i


2

2 astfel nct SY s fie minim. Putem presupune c X i Y sunt centrate, adic M ( X ) = M ( Y ) = 0 , ceea ce-i echivalent cu a face transformarea X ' = X M ( X ) ; Y ' = Y M ( Y ) . n acest caz, liniaritatea ntre X i Y este echivalent cu liniaritatea lui X i Y. Atunci: 2 SY = M

2 +( 1 2 ) Y + 2 Aceast expresie este minim dac se aleg parametrii i :

2 2 SY = M ( Y 2 ) 2 M ( XY ) + 2 M ( X 2 ) + 2 = Y 2 X Y + 2 2 = ( X Y ) + X 2

[ ( ( Y X ) ) ] = M [ ( Y X ) ] +
2 2

(cci M ( Y X ) = 0)

= 0, =

Y = bY / X X

De aici urmeaz: $ y( x ) = bY / X X care este o dreapt ce trece prin originea axelor de coordonate P( m X , mY ) . $ Lund pentru Y valoarea aproximativ y( x ) am realizat o descompunere ( x ) + Y0 , $ Y=y $ unde Y0 = Y y( x ) este abaterea care se nregistreaz dac se scade din Y cea mai bun dreapt n raport cu X, ca aproximaie a lui Y. Dispersia acestei abateri este dat de: 2 2 SY ( min) = Y ( 1 2 ) $ S calculm corelaia variabilelor Y i y( X ) :
$ $ M ( Y y( X ) ) M ( Y ) M ( y( X ) ) = M ( YbY / X X ) = bY / X M ( YX ) = bY / X XY =

Y 2 X Y = 2 Y X

Cum:
2 2 y$ ( X ) = bY2/ X x = 2

2 Y 2 2 2 2 X = Y , X

rezult c:

2 2 Y = Y y$ ( X ) Y Y S artm c variabilele Y0 i X sunt necorelate. ntruct M(x) = 0, este suficient s calculm M(Y0X) i avem: $ $ M ( Y0 X ) = M [ ( Y y( X ) ) X ] = M ( XY ) M ( y( X ) X ) = XY bY / X M ( X 2 ) =

Y , y$ ( X ) =

M Yy ( X ) $

)=

Y 2 =0 X X S considerm: 2 2 2 2 $ $ S Y = M ( Y y ( X ) ) = M ( Y y( X ) + y ( X ) y( X ) ) = M ( Y y ( X ) ) +
= XY
0

$ $ +2 M ( Y y ( X ) ) ( y ( X ) y ( X ) ) + M ( y ( X ) y ( X ) ) Dar M ( Y y( X ) )

] =

2 Y/ X

$ M ( Y y( X ) ) ( y ( X ) y( X ) ) =
=
1

$ ( y y( X ) )( y( X ) y( X ) ) f ( x, y) dxdy =

$ ( y( X ) y( X ) ) f ( X ) ( y y( X ) ) f ( y / x) dy dx = 0,

cci:

( y y( X ) ) f ( y / x) dy = 0

$ y2( X ) = M ( y( X ) y( X ) ) obinem: 2 2 SY0 = Y / X + y2( X ) ,

Notnd:

unde Y / X msoar gradul de mprtiere a valorilor variabilei Y n jurul liniei de regresie y( x ) , adic eroarea pe care-o facem cnd calculm Y cu ajutorul liniei de regresie.

$ y2( X ) msoar abaterea liniei de regresie y( x ) de la expresia aproximativ y( x ) . S observm acum c: 2 2 2 SY ( min) = S 0 = ( 1 2 ) Y , iar:
2 2 Y / X = ( 1 Y / X ) Y 2

Atunci: (1 2 ) Y2 = (1 Y2/ X ) Y2 + y2( X ) , iar, de aici:

y( X ) = + Y ceea ce ne conduce la: Y / X , cu egalitate dac i numai dac y ( X ) = 0, adic n cazul cnd linia de regresie este o dreapt.
2 2 Y/ X 2

9.6. Estimarea pe baza observaiilor a coeficienilor de corelaie i regresie, precum i a raportului de corelaie S determinm, mai nti, coeficientul de corelaie a dou nsuiri calitative A, B ale unui fenomen. Dac punem P( A B ) = p11 , P( A B) = p12 , P( A B) = p21 , P( A B) = p22 obinem urmtoarea repartiie a acestor nsuiri calitative:

B A
A

p11 p21 p.1

p12 p22 p.2

p1. p2.

Atam experimentului care conduce la observarea celor dou nsuiri calitative vectorul aleator (X,Y), cu repartiia: Y X 1 0 1 p11 p21 p.1 0 p12 p22
p.2

p1. p2.

Atunci: M ( XY ) = p11 M ( X ) = p1. ; M ( Y ) = p.1 D 2 ( X ) = p1. p12. ; D 2 ( Y ) = p.1 p.2 1

Se obine acum imediat: p11 p22 p12 p21 A, B = ( p11 + p12 )( p21 + p22 )( p11 + p21 )( p12 + p22 ) S presupunem acum c s-au fcut n observaii asupra fenomenului n care se urmresc caracteristicile A i B i c s-au obinut rezultatele:

A
A

n11 n21 n11 + n21

n12 n22 n12 + n22

n11 + n12 n21 + n22

n11 + n12 + n21 + n22 = n

Atunci coeficientul empiric de corelaie al caracteristicilor A i B este dat de: n11n22 n12 n21 rA , B = ( n11 + n12 )( n12 + n22 )( n11 + n12 )( n21 + n22 ) Dac se consider vectorul aleator (X,Y) i n observaii asupra acestui vector, atunci coeficientul empiric de corelaie este dat de: 1 1 1 1 n xy ( x x)( y y) n n xy xy n n x x n n y y y x n x y x y , r= = sx s y sx s y sau nc: n n xy xy n x x n y y x y x y r= 2 2 2 2 n n x x n x x n n y y n y y x y y x
n mod asemntor se obine coeficientul empiric de regresie pe care-l vom nota b Y / X : sy sx n n y y n y y y y
2 2

n nx x 2 nx x x x i raportul empiric de corelaie:


2

bY / X =

r=

Y/ X =

sy( x ) sy

n xy y 2 y n xy y n nx x y x n ny y n y y y y
2 2

Din expresia coeficientului empiric de corelaie se obine c: P > r ( n) n n cazul cnd cele n observaii se fac dintr-o populaie normal bidimensional se poate arta c: 1 M ( r ) (1 2 ) , 2n de unde rezult c M ( r ) < , deci c r este o estimaie negativ deplasat a coeficientului de corelaie . De asemenea, abaterea medie ptratic a lui r este: 1 2 r n S presupunem c sunt satisfcute urmtoarele cerine: (1) n cursul observaiilor se menine aceeai repartiie. (2) Observaiile sunt independente (3) Repartiia populaiei este normal sau aproximativ normal (4) Numrul n de observaii este suficient de mare n aceste condiii: 1 2 bY / X Y X n Fischer a artat c variabila aleatoare: e iZ 1 1 1+ r Z = ln , adic r = th Z = iZ 2 1 r e +1 urmeaz aproximativ o lege de repartiie normal, chiar pentru valori nu prea mari ale volumului de selecie n, de parametrii M(z) i D2(z), unde: 1 1+ M ( z ) = ln + 2 1 2( n 1) 1 1 ; D( z ) = z = D 2 ( z) = n3 n3 Pentru n mare i r mic (mai mic dect 0,5) se poate construi un interval de ncredere utiliznd legea normal, i anume: 1 r 2 1 r2 r u < < r + u n n unde u se determin cu nivelul de ncredere prin relaia: = 2 ( u) Analog se determin un interval de ncredere pentru coeficientul de regresie by/x: Y 1 r 2 Y 1 r2 b Y / X u < bY / X < b Y / X + u X X n n

9.7. Corelaie multipl n practic apar frecvent situaii cnd intervin mai mult de dou variabile ntre care se manifest o dependen stohastic. Studiul unei astfel de dependene ridic dificulti i complicaii. Ne vom opri mai nti asupra dependenei stochastice liniare care este mai simpl i totodat prezint importan practic deosebit. Vom efectua studiul pentru trei variabile aleatoare X1, X2, X3 i apoi vom prezenta rezultatele n cazul general. Dac (x1, x2, x3) sunt

rezultatele msurtorilor pentru vectorul aleator (X1, X2, X3) ntr-o observaie i dac repetm msurtorile de un numr mare de ori, obinem un nor de puncte din spaiul euclidian R3. Dac legtura dintre X1, X2, X3 are un caracter stochastic, atunci ne va interesa n primul rnd media fiecrei variabile cnd celelalte dou iau valori fixate. Aa de exemplu:

M ( X 1 / X 2 = x 2 ; X 3 = x 3 ) = x 1 ( x 2 , x 3 ) = x1 f 1 ( x1 / x 2 , x 3 ) dx1 =

x f (x ,x
1 1

, x 3 ) dx1

f (x ,x
1

, x 3 ) dx1

x 1 ( x 2 , x 3 ) = a10 + a12 x 2 + a13 x 3 , care este ecuaia planului de regresie a lui X1 fa de X2 i X3. Coeficienii planelor de regresie se pot exprima cu ajutorul momentelor de ordinul unu i doi i covarianelor variabilelor X1, X2, X3, pe care le vom estima cu datele de selecie. Ecuaiile de regresie se utilizeaz pentru prognozarea valorii variabilei X1 fa de valorile X2 = x2, X3 = x3 ale celorlalte variabile. Precizia prognozei depinde de intensitatea i forma legturii de corelaie. Considernd cazul unei legturi apropiate de cea liniar, vom cuta s descompunem $ $ variabila X1 n dou componente X 1 = X 1 + X 1.23 , unde X 1 este component complet prognozabil cu ajutorul unei funcii liniare i, n plus, cea de a doua component X1.23 s aib dispersie minim. Va trebui, deci, s determinm funcia liniar: $ X 1 ( X 2 , X 3 ) = a10 + a12 X 2 + a13 X 3 , $ astfel nct X 1 X 1 = X 1.23 s aib dispersie minim. Pentru a simplifica expunerea, vom presupune c: M ( X 1 ) = m X1 = 0; M ( X 2 ) = m X 2 = 0; M ( X 3 ) = m X 3 = 0 ceea ce se poate face totdeauna considernd variabilele: X 1' = X i m X i , i = 1,2,3 Atunci: $ $ 2 D2 ( X ) = D2 ( X X ) = M ( X X )
1.23

n spaiul euclidian R3 al punctelor (x1, x2, x3) funcia x 1 ( x 2 , x 3 ) reprezint o suprafa care poart numele de suprafa de regresie a lui X1 fa de X2 i X3. n mod analog se definesc suprafeele de regresie x 2 ( x1 , x 3 ) i x 3 ( x1 , x 2 ) . Corelaia dintre X1, X2, X3 se zice liniar dac suprafeele de regresie sunt plane. Atunci funcia x 1 ( x 2 , x 3 ) este liniar n raport cu argumentele:

Determinarea minimului:

2 $ 2 ( min) H ( a10 , a12 , a13 ) = M ( X 1 X 1 ) = M ( X 1 a10 a12 X 2 a13 X 3 )

revine la rezolvarea sistemului de ecuaii: 1 H = M ( X 1 a10 a12 X 2 a13 X 3 ) = 0 2 a10 1 H = M ( X 1 a10 a12 X 2 a13 X 3 ) X 2 = 0 2 a12 1 H = M ( X 1 a10 a12 X 2 a13 X 3 ) X 3 = 0 2 a13

Dac inem seama de faptul c M X j ; X K = jK j K j k (i jK = Kj ), sistemul de ecuaii scris mai jos devine: m X 1 a10 a12 m X 2 a13 m X 3 = 0
2 12 1 2 a10 m X a12 2 a13 23 2 3 = 0
2

2 13 1 3 a10 m X a12 23 2 3 a13 3 = 0 Avnd n vedere ipoteza fcut m X = 0, i = 1,2,3, rezult c a10 = 0, i obinem
3

sistemul de ecuaii: 2 a12 2 + a13 23 2 3 = 12 1 2


2 a12 23 2 3 + a13 3 = 13 1 3 Determinantul sistemului este:

liniar una n funcie de cealalt i deci n locul unei dependene ntre trei variabile apare o dependen ntre dou variabile. 2 Presupunem deci c 23 1. n acest caz: 2 12 1 2 23 2 3 1 2 3 12 23 1 = = 1 12 , a12 = 2 2 2 2 2 1 3 2 11 11 2 3 13 1 3 11 2 3 13 unde am pus:
12 =

23 2 3 2 2 2 2 2 = ( 1 23 ) 2 3 = 11 2 3 , 2 3 2 unde am pus 11 = 1 23 din motive pe care le vom explica mai trziu. 2 Acest determinant este nenul dac 23 1. Dac 2 = 1, atunci X2 i X3 se exprim

2 2 23 2 3

12 13
1

23
1

= 23 31 12

Analog:
a13 =
2 2 2 2 11 2 3 23 2 3

12 1 2 = 1 13 3 11 13 1 3

cu:
13 =

21 1 = 21 32 31 31 32

Se vede acum imediat c 11, 12, 13 sunt complemenii algebrici ai elementelor primei linii din determinantul: 1 12 13
= 21 1

23

1 $ Ecuaia funciei liniare X 1 se poate scrie acum sub forma: 1 12 1 13 $ X 1( X 2 , X 3 ) = X2 X , 2 11 3 11 3 sau dac revenim la variabilele necentrate. 1 12 1 13 $ X 1 m X1 = X 2 mX2 X mX3 2 11 3 11 3 $ Funcia liniar X 1 ( X 2 , X 3 ) astfel determinat are proprietatea c este cea mai bun estimaie liniar, pentru valori date ale variabilelor X2 i X3.

31 32

$ S artm c restul X 1.23 = X 1 X 1 este necorelat att cu X2, ct i cu X3, adic:

( X 1.23 , X 2 ) = ( X 1.23 , X 3 ) = 0

S presupunem iari c variabilele sunt centrate. Atunci: 1 12 1 13 $ X 1.23 = X 1 X 1 = X 1 + X2 + X 2 11 3 11 3 i, de aici: $ X 1.23 X 1 X 1 1 11 X 1 12 X 2 13 X 3 = = + + 1 1 2 3 11 1 Urmeaz c: X X 1 M 1.23 1 = ( 11 + 12 12 + 13 13 ) = 1 1 11 11 1 11 X 1.23 X 2 12 13 = M M X 1 X 2 + 2 X 22 + X 2 X 3 = 1 3 2 1 2 11 1 2 1 11 12 1 2 + 12 + 13 23 2 3 = = 2 11 1 2 2 2 3 1 = ( + 12 + 13 23 ) = 0 11 11 12 cci n parantez avem dezvoltarea dup prima linie a determinantului: 21 1 23

21 1 31 32

23 = 0
1

Analog: X X M 1.23 3 = 0 1 3

S calculm dispersia D 2 ( X 1.23 )

1 12 1 13 D 2 ( X 1.23 ) = 12.23 = M ( X 12.23 ) = M X 1.23 X 1 + X2 + X 3 = 2 11 3 11 1 12 1 13 = M ( X 1.23 X 1 ) + M ( X 1.23 X 2 ) + M ( X 1.23 X 3 ) 2 11 3 11 Avnd n vedere rezultatele obinute mai sus rezult: 2 12.23 = D 2 ( X 1.23 ) = 11 1 Sau, dezvoltnd determinanii i 11, obinem: 2 2 2 1 + 2 12 13 23 12 13 23 2 1 12.23 = 2 1 23 Acest indicator msoar precizia aproximaiei liniare a variabilei X1 prin variabilele X2 i X3. $ S calculm coeficientul de corelaie al variabilelor X1 i X 1 , pe care-l notm 1.( 23) $ M( X1, X1) 1.( 23) =

1 X$

2 2 $ M ( X 1 X 1 ) = M X 1 ( X 1 X 1.23 ) = 12 1 = 1 1 11 11 2 $ 2$ = M ( X 2 ) ' M ( X + X ) = M ( X 2 ) + 2 M ( X X ) + M ( X 2

Observm c:

X1

1.23

1.23

1.23

Deci:

2$ = 12 2 X
1

2 2 2 1 + 1 = 1 1 > 0 11 11 11
2 1 1 11 1 1 1 11
1/ 2

Urmeaz c:

1.( 23) =
sau:

$ M( X1 X1)

X X$
1

= 1 11

1/ 2

2 2 12.23 12 + 13 2 12 13 23 1.( 23) = 1 2 = 2 1 1 23 Se constat c 0 1.( 23) 1

1/ 2

1/ 2

$ X ( X 2 , X 3 ) care este o funcie liniar de variabilele X2 i X3. Putem s scriem: 12.23 = 12 1 12.( 23) Dac considerm corelaia dintre X1 i X2 i exprimm liniar pe X1 n funcie de X2, atunci dispersia restului aproximrii conduce la: 2 1.2 = ( 1 12 ) Aproximnd pe X1 printr-o funcie liniar de X2 i X3, se obine o aproximare mai bun dect printr-o singur variabil i, deci, avem urmtoarea relaie ntre dispersii: 12.23 12.2 , care conduce la: 2 1 12.( 23) 1 12 i, deci: 12 1.( 23) i, analog: 13 1.( 23) , ceea ce este echivalent cu: 1.( 23) max 12 , 13 De aici rezult c dac 1.( 23) = 0 , atunci 13 = 12 = 0 , ceea ce nseamn c X1 este necorelat att cu X2, ct i cu X3. Dac X2 i X3 sunt necorelate, urmeaz c 23 = 0 i, n acest caz, 2 2 12.23 = 12 + 13 S vedem n ce caz: 1.23 = 12

Dac 1.( 23) = 1, atunci 12.23 = 0 , adic X 1.23 = 0 , ceea ce nseamn c X1 coincide cu

S exprimm diferena:

de prognoz a lui X1 este inutil. Rezultate i interpretri analoage se obin cnd se schimb rolul variabilelor: $ X 1 m1 = a12.3 ( X 2 m2 ) + a13.2 ( X 3 m3 ) $ X m = a (X m )+a (X m ) cu mi = M ( X i ) , i = 1, 2, 3. Corespunztor acestor estimaii, avem dispersiile: 2 2 2 2 2 12.23 = 1 ; 2.13 = 2 ; 3.12 = 33 3 11 22 i coeficienii de corelaie: 223 2 13 2 12.( 23) = 1 1.2 = 1 ; 2.( 13) = 1 2.2 = 1 ; 11 22 1 2 2 3.12 2 2 2 2 3.( 12 ) = 1 2 = 1 , cu 11 = 1 23 , 22 = 1 13 , 33 = 1 12 ; 33 3 2 2 2 = 1 + 2 12 13 23 12 13 23

2 2 ( 13 12 23 ) 12 + 13 2 12 13 23 2 2 2 1.23 12 = 12 = 2 2 1 23 1 23 2 12.23 = 12 este echivalent cu 13 = 12 23 . n acest caz variabila X3 din relaia liniar 2

$ X 3 m3 = a 31.2 ( X 1 m1 ) + a 32.1 ( X 2 m2 )

21.3

23.1

9.8. Coeficientul de corelaie parial Pentru a clarifica ct mai bine intensitatea legturii stochastice dintre dou variabile, n situaii concrete vom cuta s estimm aceast legtur dup nlturarea influenei tuturor celorlalte variabile legate de variabilele considerate. Indicatorul astfel obinut msoar legtura dintre dou variabile i va fi numit coeficient de corelaie parial. S ne meninem n acelai cadru a trei variabile aleatoare X1, X2, X3. Se poate considera c dependena stochastic ntre variabilele X1 i X2 msurat prin coeficientul de corelaie 12 depinde ntr-o anumit msur de existena unei legturi att a variabilei X1, ct i a variabilei X2 de variabila X3. Pentru a elimina influena lui X3 asupra variabilelor X1 i X2 vom considera abaterile: ~ $ X 1.3 = X 1 X 1 ( X 3 ) = X 1 b1/ 3 X 3 ~ $ X = X X (X ) = X b X , unde am presupus c variabilele sunt centrate i unde am notat b1/ 3 = b X1 / X 3 ; b 2/3 = b X 2 / X 3 , care, dup cum tim, au expresiile:
b1/ 3 =
2 .3 2 2 3 2 2/3 3

~ ~ Coeficientul de corelaie al variabilelor X 1.3 i X 2.3 poart numele de coeficient de corelaie parial a variabilelor X1 i X2 n raport cu variabila X3 i-l vom nota 12.3 . Deci, din definiie (innd seama de ipotezele de lucru): ~ ~ M ( X 1.3 X 2.3 ) 12.3 =

1 13 ; b2 / 3 = 2 23 3 3

X X ~ ~
1.3

2 .3

Cum:

X = 1 (1 ~
1.3

1 2 2 13

, X 2 .3 = 2 ( 1 ~

1 2 2 23

iar:

~ ~ ~ ~ ~ ~ M ( X 1.3 X 2.3 ) = M X 1.3 ( X 2 b2 / 3 X 3 ) = M ( X 1.3 X 2 ) b2 / 3 M ( X 1.3 X 3 ) = M ( X 1.3 X 2 ) , ntruct: 1 ~ 2 2 13 3 = 0 M ( X 1.3 X 3 ) = M ( X 1 b1/ 3 X 3 ) X 3 = M ( X 1 X 3 ) b1/ 3 M ( X 3 ) = 13 1 3

ns: 1 ~ 13 23 2 3 M ( X 1.3 X 2 ) = M ( X 1 b1/ 3 X 3 ) X 2 = M ( X 1 X 2 ) b1/ 3 M ( X 3 X 2 ) = 12 1 2

Deci: ~ ~ M ( X 1.3 X 2.3 ) = 1 2 ( 12 13 23 ) i, de aici: 12 13 23 12.3 = 2 2 (1 13 )(1 23 ) Coeficientul de corelaie parial 12.3 este n general diferit de 12 . Aceti coeficieni pot avea semne diferite i, mai mult, unul poate fi nul iar cellalt s fie egal cu unitatea.
Ecuaiile liniilor de regresie pe baza datelor experimentale

S notm pentru simplificare variabilelor X1, X2, X3 prin X, Y Z respectiv i s presupunem c efectund n observaii asupra vectorului aleator (X, Y, Z) s-au obinut rezultatele (xi, yi, zi), i = 1, 2, , n. Dac n este suficient de mare atunci parametrii repartiiei tridimensionale se pot estima cu ajutorul indicatorilor empirici: x , y , z; s x , s y , sz ; rxy , ryz , rzx , cu expresiile cunoscute. Atunci, regresiile empirice sunt: sz 31 s $ zz = ( x x) s z 32 ( y y) s x 33 y 33 s y 21 s $ y y = ( x x) sy 23 ( z z) s x 22 22 z s x 12 s $ xx = ( y y) sx 13 ( z z) s y 11 z 11
1 = ryx rzx cu: rxy 1 rzy rxz
2 2 2 ryz = 1 + 2rxy ryz rxz rxy ryz rzx 1

rxy = ryx ; ryz = rzy ; rxz = rzx


2 2 2 11 = 1 ryz ; 22 = 1 rxz ; 33 = 1 rxy r rxz 3+1 xy 31 = ( 1) = rxy ryz rxz 1 rxy

rxz = rxy rxz ryz rxy ryz r rxz 2 +1 xy 21 = ( 1) = rxz rzy rxy rzy 1 Cu acestea, regresiile empirice se scriu: $ z z rxz rxy ryz x y ryz rxy rzx y y = + 2 2 sz sx sy 1 rxy 1 rxy $ y y rxy rxz rzy x x ryz rxy rxz z z = + 2 2 sy sx sz 1 rxz 1 rxz $ x x rxy ryz rxz y y rxz rxy ryz z z = + 2 2 sx sy sz 1 ryz 1 ryz Coeficienii empirici de corelaie general se obin astfel: 32 = ( 1)
3+ 2

, ; ry .xz = 1 ; rz .xy = 1 11 22 33 iar coeficienii empirici de corelaie parial: rxy rxz ryz rxy .z = 2 2 (1 rxz ) 1 ryz rx . yz = 1

rxz . y = ryz =

(1 r )(1 r )
2 xy 2 yz

rxz rxy ryz

(1 r )(1 r )
2 xy 2 xz

ryz ryx rzx

s > 3.

Nu prezint nici o dificultate acum trecerea la vectorii aleatori (X1, X2, , Xs), cu

S presupunem c vectorul aleator (X1, X2, , Xs) are densitatea de repartiie f(x1, x2, , xs) i c exist momentele mixte care intervin n consideraiile pe care le facem. Atunci: M ( X i ) = mi = ... xi f ( x1 ,..., x 3 ) dx1 ... dx s
Var ( X i ) = ii = i2 = M ( X i mi ) cov ( X i ) = ij = M ( X i mi ) X j m j
RS

] = ... ( x m )
i i
RS

f ( x1 ,..., x s ) dx1` ... dx s

)] = ... ( x m )( x
i i
R s

m j f ( x1 ,..., x s ) dx1 ... dx s

Natural, coeficientul de corelaie al variabilelor Xi i Xj, i 1, 2, , 1 este dat de:

X , X = ij =
i j

ij

ii jj

, i j = 1, 2,..., s

Exprimnd densitatea de repartiie condiionat: f ( x1 , x 2 ,..., x s ) f ( x1 ,..., x s ) f ( x1 / x 2 ,..., x s ) = = , f 2....s ( x 2 ,..., x s ) f ( x1 , x 2 ,..., x s ) dx1
R

definim valoarea medie a variabilei X1 condiionat de faptul c X2 = x2; X3 = x3; ; Xs = xs M ( X 1 / X 2 = x 2 ,..., X s = x s ) = x1 f ( x1 / x 2 ,..., x s ) dx1 = x 1 ( x 2 ,..., x s )
R

i2 ( x1 ,..., xi 1 , xi +1 ,..., x s ) =

n spaiul euclidian real s dimensional, x 1 ( x 2 ,..., x s ) reprezint o hipersuprafa pe care o vom numi suprafa de regresie a variabilelor X2, X3, , Xs fa de X1. Analog se definesc i celelalte s 1 suprafee de regresie: x i ( x1 ,..., xi 1 , xi +1 ,..., x s ) = M ( X i / X 1 = x1 ,..., X i 1 = xi 1 , X i +1 = xi +1 ,.., X s = x s ) Dispersia variabilei Xi fa de regresia variabilelor X2,, Xs, adic fa de media condiionat x i ( x1 ,..., xi 1 , xi +1 ,..., x s ) va fi:
R

[ x

x i ( xi ,..., xi 1 , xi +1 , x s ) f ( xi / x1 ,..., xi 1 xi +1 ,..., x s ) dxi


2

S considerm acum mediile condiionate: m1.34...s = R 2 x1 f ( x1 , x2 / x3 ,..., xs ) dx1dx2 m2.34...s = R 2 x 2 f ( x1 , x 2 / x 3 ,..., x s ) dx1dx 2 , f ( x1 , x 2 ,..., x s ) unde f ( x1 , x 2 / x 3 ,..., x s ) =

f 34...s ( x 3 ,..., x s ) Dispersiile variabilelor X1, respectiv X2, condiionate de variabilele X3, X4,.., Xs sunt date de: 2 12.34...s = R 2 ( x1 m1.34...s ) f ( x1 , x 2 / x 3 ... x s ) dx1dx 2

12.34...s 1.34...s 2.34...s n mod analog se definete coeficientul de corelaie parial al variabilelor Xi, Xj cnd celelalte iau valori determinate. ij .1...i 1,i +1,..., j +1,...s ij .1...i 1,i +1,..., j 1, j +1,...s = i .1...i 1,i +1... j 1, j +1...s j .1...i 1,i +1,... j 1, j +1,...s i j = 1, 2, ... s Putem acum s definim i coeficientul multiplu de corelaie, pe care-l vom nota R1.23s (coeficientul de corelaie al variabilei X1 cu toate celelalte variabile). Dac relum notaia ij pentru momentul centrat al variabilelor aleatoare Xi i Xj i notm: 11 12 ... 1s 22 23 ... 2 s 21 22 ... 2 s 32 33 ... 3s = ; 11 = , 12.34...s =
... ... ... ... ... ... ... ...

iar covariana variabilelor X1, X2 condiionate de X3, X4,, Xs este dat de expresia: 12.34...s = R 2 ( x1 m1.3...s )( x 2 m2.3...s ) f ( x1 , x 2 / x 3 ... x s ) dx1dx 2 Putem acum s definim coeficientul de corelaie parial al variabilelor X1, X2 fa de variabilele X3,, Xs prin expresia:

2 2.34...s = R ( x 2 m2.34...s ) f ( x1 , x 2 / x 3 ... x s ) dx1dx 2 , 2


2

s1 s 2 ... ss s 2 s 3 ... ss atunci coeficientul definit prin relaia: R1.23...s = 1 11 11 se numete coeficient multiplu de corelaie al variabilei X1 n raport cu toate celelalte. Dintre proprietile acestui coeficient amintim doar urmtoarele: (1) 0 R1.2...s 1

(2) Dac R1.2... s = 1, atunci repartiia are punctele sale situate aproximativ n acelai plan. 9.9. Coeficieni de corelaie a rangurilor Calculul coeficientului de corelaie a dou variabile aleatoare X i Y prin relaia: M ( XY ) M ( X ) M ( Y ) X ,Y = D2 ( X ) D2 (Y) presupune c se pot exprima cantitativ valorile variabilelor X i Y. Deci, atunci cnd exprimm coeficientul de corelaie empiric va trebui ca datele de observaie s fie msurate cu precizie, altfel nu vom putea determina acest coeficient de corelaie. Pot aprea ns adesea situaii cnd avem de stabilit intensitatea legturii ntre caracteristici calitative. Aa, de exemplu, la un concurs sportiv se prezint un numr de concureni care vor trebui clasificai. Pentru o clasificare ct mai obiectiv se folosesc doi arbitri judectori i vrem s cunoatem dac exist o legtur puternic ntre clasificrile date de cei doi arbitri. Un alt exemplu l poate constitui legtura dintre intensitatea culorii unor fibre textile i gradul de umiditate al lor pentru un numr dat de loturi. Rezult clar c nu este vorba de msurtori ce pot fi efectuate cu precizie. S presupunem c avem o populaie C n care unitilor ei notate Ui, 1 i n le asociem rangurile lor cnd le clasificm dup dou caracteristici A i B, conform cu tabelul ce urmeaz: Rangul Unitatea Proprietatea A Proprietatea B U1 U2 U3 Uk Un-1 Un i1 i2 i3 ik in-1 in j1 j2 j3 jk jn-1 jn

unde (i1, i2, , in-1, in) i (j1, j2, , jn-1, jn) sunt dou permutri ale numerelor 1, 2, , n din tabelul de n! permutri ale acestor numere. Se pune problema dac ntre cele dou clasificri exist o legtur stochastic i ct de puternic este aceast legtur. Vom realiza acest lucru cu ajutorul coeficientului de corelaie a rangurilor.
Coeficientul de corelaie a rangurilor al lui Spearman

C. Spearman a propus drept msur a corelaiei rangurilor coeficientul de corelaie alctuit pe baza rangurilor:
R=

AB A B

unde:
1 n AB = ( i k m A )( j k mB ) n k =1 1 n 1 n 1 n 2 1 n 2 2 2 2 2 m A = i k ; mB = j k ; A = i k m A ; B = j k mB n k =1 n k =1 n k =1 n k =1
2 S efectum calculele pentru obinerea expresiilor AB , m A , mB , 2 , B . A

1 n( n + 1) n + 1 ( 1 + 2+...+ n 1 + n) = = 2n 2 n ( n + 1) 2 n( n + 1)( 2n + 1) ( n + 1) 2 n 2 1 1 n 2 1 2 2 = i k m 2 = ( 1 + 2 2 +...+ n 2 ) = = A A n k =1 n 4 6 4 12 Analog, n2 1 2 B = 12 S calculm 1 n AB = ( i k m A )( j k mB ) n k =1 Pentru aceasta, s considerm identitatea: m A = mB =

Mai nti:

( a
k =1

bk ) = ( a + b
2 k =1 2 k

2 k

) 2 a b
k =1 k

De aici obinem: n n 1 n 2 2 a k bk = ( a k + bk2 ) ( a k bk ) 2 k =1 k =1 k =1 Dac n aceast egalitate facem: n +1 n +1 a k = ik ; bk = j k , 2 2 obinem: 2 2 1 n n + 1 n + 1 1 n n + 1 n + 1 n n + 1 i k + jk = j k i k AB = i k n k =1 2 2 2n k =1 2 2 k =1 2 2 n + 1 j k 2 sau: 1 n 2 1 n 2 1 1 n 2 AB = + ( ik jk ) 2 12 12 2n k =1 Notnd: i k j k = d k , K = 1,2,..., n , obinem: n2 1 1 n 2 AB = d 12 2 n k =1 k i, cu aceasta:
n ( n 1) Coeficientul de corelaie a rangurilor R (al lui Spearman) variaz ntre 1 i + 1. Pentru dou clasificri de ranguri identice, adic: d k = i k j k = 0, k = 1,2,..., n obinem imediat R = 1. Pentru dou clasificri de ranguri perfect inverse, obinem R = - 1. ntr-adevr, dac: i1 , i2 ,..., in1 , in este 1,2,..., n iar: j1 , j2 ,..., jn1 , jn este n, n 1,...,2,1 R = 1 6 d k2
k =1 2 n

atunci: d 1 , d 2 ,.., d n1 , d n vor fi 1 n,3 n,5 n,..., n 3, n . Dac acum n este par, adic n = 2m, atunci:

d
k =1

2m

2 k

= 2[12 + 2 2 +...+( 2m 1)

] = 2[1

+ 2 2 +...+( 2m) ( 2 2 + 4 2 +...+( 2m)


2

)] =

2m( 2m + 1)( 4m + 1) 4m( m + 1)( 2m + 1) 2 2 = 3 m( 2m + 1)( 2m 1) 6 6 nlocuind n expresia lui R, obinem:


2m( 4m 1) Dac n = 2m + 1, atunci:
2 2 m +1 k =1

R = 1

6 d k2
k =1

= 1

2 m( 2m + 1)( 2m 1) = 1 2m( 4m 1) 3
2 2

2 k

= 2[ 2 2 + 4 2 +...+( 2m) 6

]=

4m( m + 1)( 2m + 1) 3

Deci:
R = 1

4m ( m + 1)( 2m + 1) = 1 ( 2m + 1) ( 2m + 1) 2 1 3

9.10. Reunirea sau comasarea rangurilor n practic apar adesea probleme de ordonare n care este imposibil s distingem situaia de rang a unui numr de elemente alturate. n astfel de situaii este comod s facem media rangurilor i s asociem acelai rang fiecruia dintre unitile respective, chiar dac un astfel de rang este fracionar. S analizm efectul ntrunirii a l elemente care ocup rangurile h + 1, h + 2, , h + l. Suma ptratelor rangurilor nereunite este: 1 ( h + 1) 2 + ( h + 2) 2 +...+( h + l ) 2 = lh 2 + hl( 1 + l ) + l( l + 1)( 2l + 1) 6 Suma ptratelor rangurilor reunite este: 2 1 1 2 l h + ( l + 1) + lh 2 + hl( l + 1) + l( l + 1) 2 4 Diferena lor va fi: 1 1 1 2 l( l + 1)( 2l + 1) l( l + 1) = ( l 3 l ) 12 4 6 1 3 ( l l ) . Pe Prin urmare, dac se reunesc l ranguri, suma ptratelor se micoreaz cu 12 n+1 de alt parte, media rangurilor rmne neschimbat, adic i, deci, dispersia rangurilor 2 1 3 ( l l) . reunite se micoreaz cu 12n Evident, efectul reunirii rangurilor pentru diferite mulimi de ranguri este aditiv, astfel nct, dac avem ordonare cu ordonri reunite de cte l1 , l2 ,..., l s elemente i aportul total va fi pentru caracteristica A: s 1 3 LA = lp lp p =1 12

Rezult c: 2 n + 1 1 n 1 1 ik 2 = 12 ( n 2 1) n L A n k =1 i, analog, pentru caracteristica B: 2 n + 1 1 n 1 1 jk 2 = 12 ( n 2 1) n LB , n k =1 cu LB definit n mod asemntor cu LA. Calculnd acum AB , obinem: 1 n 2 1 1 1 n n + 1 n + 1 1 2 i k j k = ( n 1) d k 2n L A 2n L B 2n k =1 2 2 12 n k =1 Urmeaz, de aici, c n acest caz coeficientul de corelaie a rangurilor lui Spearman va fi dat de: n 1 2 ( n n) ( L A + LB ) d k2 6 k =1 R= 1 3 1 3 6 ( n n) 2 L A 6 ( n n) 2 LB Exemplu S se stabileasc dac exist corelaie ntre intensitatea culorii firelor n 10 loturi de materiale destinate industriei textile i umiditatea lor. Un expert a dispus loturile n urmtoarea ordine:

Lotul Intensitatea culorii Umiditatea d d2

L1 3 1 2 4
2 k

L2 8 9 -1 1

L3 5 10 -5 25

L4 4 2 2 4

L5 2 4 -2 4

L6 10 9 1 1

L7 1 3 -2 4

L8 7 5 2 4

L9 9 8 1 1

L10 6 6 0 0

d
k =1

10

= 4 + 1 + 25 + 4 + 4 + 1 + 4 + 4 + 1 + 0 = 48
6 48 = 0,709 1000 10 .

R = 1

Putem trage concluzia c exist o legtur ntre intensitatea culorii i umiditate i ea este destul de puternic. Exemplu. La concursul de figuri libere doi arbitri au dispus participanii n urmtoarea ordine: Participanii I. arbitru II. arbitru P1 1,5 1 P2 1,5 2 P3 3 4 P4 4 4 P5 6 4 P6 6 6 P7 6 7 P8 8 8 P9 9,5 9 P10 9,5 10

S se stabileasc ct de obiectiv este aprecierea arbitrilor, adic ct de puternic este legtura ntre aprecierile celor doi arbitri.

Soluie: Primul arbitru a mprit primul loc ntre participanii P1 i P2. Rangul lor 1+ 2 reunit este = 1,5 2 5+ 6+ 7 = 6 . La Participanii P5, P6, P7 mpart locurile 5, 6, 7. Rangul lor reunit este 3 fel i pentru celelalte situaii. Calculm acum mrimile LA i LB. Pentru calculul lui LA avem: P1 i P2 sunt dou ranguri reunite, P5, P6, P7 sunt ranguri reunite, P9, P10 iari dou ranguri reunite. Astfel: ( 2 3 2) + ( 33 3) + ( 2 3 2) LA = =3 12 Analog: 33 3 LB = =2 12 i: ( 103 10) / 6 ( 3 + 2) 7 1000 10 12.6 = R= = [(103 10) / 6 6][(103 10) / 6 4] (1000 10 36)(1000 10 24) 918 918 = = = 0,956 954.966 959,98 Se poate afirma c aprecierile arbitrilor date concurenilor sunt obiective, cci coeficientul de corelaie a rangurilor este foarte apropiat de unitate. Repartiia exact a coeficientului de corelaie a rangurilor R al lui Spearman se obine prin enumerarea celor n! permutri echiprobabile ale rangurilor i ea este tabelat. n cazul seleciilor de volum mare, repartiia lui R este aproximativ normal cu parametrii: 1 M ( R ) = 0, D 2 ( R ) = n 1 Aceasta rezult imediat din urmtoarele: n +1 n2 1 n +1 2 M ( ik ) = ; D ( i k ) = 12 ; cov( i k , ie ) = 2 12 2 ( n + 1) M ( i k jh ) = M ( i k ) M ( jh ) = 4 2 n( n + 1) n +1 12 ( R) = Cu acestea, M 3 =0 2 n 1 4 n( n 1)
2 12 12 2 D ( R) = D a k bk = M a k bk 2 k n( n 2 1) n( n 1) k Dac se ridic la ptrat expresia a k bk atunci avem de calculat: 2
k

M(a b i

2 2 k k

) = M( a ) M(b )
2 k 2 k

n 1 = 12
2

n + 1 M ( a k bk a l bl ) = M ( a k a l ) M ( bk bl ) = cov( a k , a l ) cov( bk , bl ) = 12

De aici urmeaz: 2 2 12 n 2 1 2 1 n + 1 2 = D ( R) = + n( n + 1) n 2 12 n 1 n( n 1) 12 Deci, dac n este suficient de mare, variabila n 1R urmeaz o lege normal N(0;1). 9.11. Coeficientul de corelaie a rangurilor al lui Kendall La deducerea coeficientului R de corelaie a rangurilor al lui Spearman, s-au luat n considerare n diferene dk = ik jk corespunztoare celor dou iruri de clasificri. M. G. Kendall a propus s fie luate n considerare toate diferenele ce le prezint cele dou iruri de clasificri, acestea fiind calculate ordonnd cresctor rangurile dup o proprietate, de obicei proprietatea A. Rangul Unitatea Proprietatea A Proprietatea B

U l1
1 j1'

U l2
2 ' j2

U l3
3 ' j3

U lk
k j k'

U ln
n ' jn

Clasificarea a fost fcut astfel: Unitatea U l1 avea rangurile ih = 1 i jh. Am pus aceast unitate pe poziia rangului i, totodat, am notat j1' = jh i tot aa mai departe cu toate celelalte uniti. Fa de noua clasificare considerm diferenele: ' ' ' ' ' ' ' ' ' j2 j1' ; j3 j1' ; j3 j2 ; j4 j1' ; j4 j2 ; j4 j3 ; ... Avem, aadar, diferenele: kl = j k' jl' k = 2,3,..., n; l = 1,2,..., k 1 Pentru o clasificare identic avem kl > 0; k , l cu valorile menionate, iar pentru clasificarea invers kl < 0 . n cazul unui tabel de corelaie oarecare avem i diferene pozitive i diferene negative. Introducem funcia: C : { kl , k = 2,3,..., n; l = 1,2,..., k 1} {11} , prin relaia: 1 kl > 0 C ( kl ) = 1 kl < 0 i efectum suma:
S = C ( kl )
k = 2 l =1 n k 1

Atunci coeficientul de corelaie a rangurilor al lui Kendall se definete prin: S 2S , AB = 2 = Cn n( n + 1) unde Cn2 este numrul tuturor diferenelor posibile. Coeficientul poate fi considerat, ntr-un anumit sens, ca o corelaie de tip general, dac procedm n felul urmtor: pentru orice ranguri i i j referitor la caracteristica A asociem variabila: 1 i> j a ij = , 1 i < j

iar pentru caracteristica B: 1 i> j bij = 1 i < j Atunci:

AB =

( a
i, j ij

ij

, bij
ij

( a ) (b )
2

i se constat imediat c se obine expresia pe care am menionat-o. Pentru selecii de volum mare (n practic, n superior lui 8-10), repartiia statisticii S este aproximativ normal de parametrii: n( n 1)( 2n + 5) M( S) = 0 D2 ( S) = 18 De aici rezult c nsui coeficientul de corelaie a rangurilor AB al lui Kendall pentru n mare are aproximativ repartiia normal de parametri: 2( 2n + 5) M ( AB ) = 0, D 2 ( AB ) = 9n( n + 1) Analiznd forma coeficientului AB exprimat cu ajutorul variabilelor aij i bij, precum i coeficientul de corelaie parial, se poate introduce i coeficientul de corelaie parial a rangurilor al lui Kendall i c acesta verific relaia: AB AC BC , AB .C = 2 2 (1 AC )(1 BC ) ntru-totul analoag cu XY .Z Coeficientul de corelaie a rangurilor al lui Kendall se utilizeaz cu succes n detectarea tendinei monotone ntr-o serie dinamic. O alt utilizare important o constituie estimarea parametrilor cu o anumit semnificaie. Dac este probabilitatea unei concordane, adic probabilitatea: unde X i , X j
i j

( ) dou valori extrase la ntmplare, aranjate n aceeai ordine ca i valorile ( Y , Y ) asociate.


Ipoteza nul H 0 : =
1 se testeaz cu ajutorul statisticii: 2

P X i X j Yi Y j > 0 = ,

[(

)(

) ]

Din faptul c M C( kl ) = 1. + ( 1)( 1 ) = 2 1 rezult c: n( n 1) ( 2 1) M( S) = 2 Deci: 1 1 M ( $) = ( 2 1) + = , 2 2

2C 1 = ( XY + 1) , n( n 1) 2 n( n 1) 1 unde C = S + 2 2

$ =

$ ceea ce arat c este un estimator nedeplasat pentru:

= P X i X j Yi Y j > 0

$ Dispersia exact a estimatorului depinde de repartiia vectorului aleator ( X , Y ) . M. G. Kendall a artat c: 5 ( 1 ) D 2 ( $) = , 9( n 1) care permite construirea unui interval de ncredere aproximativ pentru .

[(

)(

) ]

9.12. Coeficientul de contingen al lui Pearson S considerm vectorul aleator ( X , Y ) , cu repartiia: Y X x1 x2 . . . xm y1 P11 P21 y2 P12 P22 yn P1n P2n P1* P2*

Pm1 P*1

Pm2 P*2

Pmn P*n

Pm*

unde am pus P X = xi ; Y = y j = pij , iar pentru repartiiile marginale:

P
j =1

ij

= Pi ;

P
i =1

ij

= P j

Coeficientul introdus de K. Pearson prin relaia: Pi P j msoar dependena dintre variabilele X i Y. Acest coeficient are unele proprieti importante referitoare la dependena variabilelor. (1) 0 2 1 Acest lucru rezult imediat din faptul:
i =1 j =1

2 =

( m 1)( n 1

(P P P )
ij i
j

i =1 j =1

(P P P )
ij i
j

Pi P j
Pij P j Pij ' P j ' =

=
i =1 j =1

Pij Pi P j

P
j =1

Pij
i

Pij '

P
i =1

ij '

Deci, dac m n, atunci: m 1, Pi P j iar dac n m, aceast expresie este:


i j

(P P P )
ij ix j

2 = 1.

n1 Pi P j De aici rezult afirmaia: 2) Dac variabilele aleatoare X i Y sunt independente, atunci 2 = 0. Afirmaia este imediat, cci n acest caz: Pij = Pi P j 3) Dac ntre variabilele aleatoare X i Y exist o dependen funcional, atunci
i j

(P P P )
ij ix j

ntr-adevr, n acest caz: 0, i j Pij = Pi = P j , i = j i totodat m = n. Dar, atunci: Pij2 Pij 1 m 1 1 2 1 = 1 = = 1 1 = 1 m 1 i j Pi P j m 1 i =1 m 1 i j P j Proprietatea reciproc nu are loc i, deci, din egalitatea cu 1 a coeficientului de contingen al lui Pearson nu rezult c ntre X i Y este o dependen funcional. 9.13. Metoda celor mai mici ptrate S considerm modelul liniar n care cele n ecuaii ale modelului sunt de forma: Y = 1 X 1 + 2 X 2 +...+ p X p + , unde Y, X1, X2,, Xp sunt vectori (n,1), 1, 2,, p parametri. este vectorul rezidual al modelului. Se pune problema estimrii parametrilor 1, 2,, p astfel nct

i =1

2 i

min.

Se numete ajustare a modelului, orice soluie a sistemului de n ecuaii cu p necunoscute a1,, ap. yi = a j xij + ei 1 i n
j =1 p

Ecuaiile pot fi scrise matricial Y =


( n ,1)
n

( n , p )( p ,1) ( n ,1)

Xa + , cu

i =1

2 i

= e' e

Ajustarea prin metoda celor mai mici ptrate este cea care d coeficienii a1, a2,, ap care minimizeaz

e
i =1

2 i

, unde ei = yi a j xij .
i =1

Sintetic, o ajustare se definete prin Y = a j X j + e sau nc Y =


( n ,1)
j =1

( n ,1)

( n ,1)

( n ,1)

( n , p )( p ,1) ( n ,1)

Xa + .
n

Ajustarea prin metoda celor mai mici ptrate este cea care realizeaz ( min) e' e = ei2 .
i =1

Putem pune modelul sub forma: e = Y Xa , i atunci: e' e = ( Y Xa ) ' ( Y Xa ) = Y ' Y Y ' Xa a ' X ' Y '+ a ' X ' Xa = Y ' Y 2a ' X ' Y '+ a ' X ' Xa S aflm punctele de extrem:

( e' e) = 0 a

Cum

rezult condiia de extrem X ' Xa = X ' Y . Dac n p i dac rang X = p, atunci X ' X este o matrice de ordinul p i de rang p i, deci, este inversabil. Rezult: 1 a = ( X ' X ) X 'Y ~ ~ Rmne s artm c extremul atins prin e' e este un minim. Fie a o alt soluie i e vectorul ecarturilor corespunztor. Atunci: ~ ~ ~ ~ e = Y X a ( Y Xa ) + ( Xa X a ) = e + X ( a a ) ~ ' e = ( e + X ( a a ) ) ' ( e + X ( a a ) ) = e' e + 2( a a ) ' X ' ( Y Xa ) + ( a a ) ' X ' X ( a a ) ~ ~ ~ ~ ~ ~ e Cum X ' ( Y Xa ) = 0 Y Xa = 0 , obinem: ~~ ~ ~ e ' e = e' e + ( X ( a a ) ) ' ( X ( a a ) ) n aceast egalitate, cel de-al doilea termen este o sum de ptrate i, deci, este pozitiv sau nul. Prin urmare: ~~ e' e e ' e 1 Observaie. Dac n p i rang X = p, ajustarea a = ( X ' X ) X ' Y este unic. Relaia:

( e' e) = 2 X ' Y + 2 X ' Xa , a

Y = j X j +
j =1

se interpreteaz astfel: variabila endogen Y este suma vectorial a doi termeni;

j =1

X j , care aparine, prin construcie, subspaiului liniar generat de variabilele

exogene X 1 , X 2 ... X P ; Vectorul rezidual , oarecare n Rn. Analog, ajustarea Y = a j X j + e indic faptul c variabila endogen Y este suma
j =1 p

vectorial dintre elementul

a
j =1

X j din subspaiul liniar generat de X 1 , X 2 ... X P i elementul

e Rn, care este vectorul ecarturilor; (geometric, acest lucru rezult n figura de mai jos).

Rx

y Xa X

Din punct de vedere geometric, metoda celor mai mici ptrate aplicat modelului Y = X + const n a minimiza distana de la elementul Y la subspaiul Rx generat de X = X 1 ,...., X p .
Aadar, modelul Y = X + definete o descompunere a lui Y n doi termeni necunoscui X R X i Rn a crui lungime este apriori slab. Metoda celor mai mici ptrate propune drept soluie descompunerea lui Y = Xa + e, care minimizeaz lungimea lui e, proiectnd ortogonal vectorul Y pe RX. Vectorii Xa i e sunt ortogonali.

din:

Proiecia ortogonal a lui Y n RX este o transformare liniar a crei matrice se obine

a = ( X ' X ) X 'Y Imediat: 1 Xa = X ( X ' X ) X ' Y = Hy ,


1 1

unde:

H 2 = ( X ( X ' X ) X ') ( X ( X ' X ) X ') = X ( X ' X ) X ' = H S definim matricea Q = I H, unde I este matricea unitate de ordinul n: 1 Q = I X( X' X) X' Cum H este simetric i idempotent, rezult: Q' = I ' H ' = I H = Q Q 2 = ( I H )( I H ) = I H H + H 2 = I H = Q , adic Q este simetric i idempotent. Pentru orice Z Rn, Qz este proiecia lui Z pe un subspaiu din Rn ortogonal cu RX (complementul ortogonal al lui RX n Rn). Se verific imediat relaiile: e = Qy QX = 0 Q = Iy Hy = y Xa = e 1 QX = X HX = X X ( X ' X ) X ' X = X X = 0 Atunci: e' e = ( Qy ) ' Qy = y ' Q' Qy = y ' Q 2 y sau e' e = y ' Qy ns e = Qy = Q( X + ) = Qx + Q ne conduce la: e = Q i, de aici: e' e = ' Q Cazul n care se izoleaz un termen constant: Adesea n practic intervine cazul n care modelul conine un termen constant p. S notm cu X0 matricea cu p 1 coloane corespunztoare variabilelor exogene X1, X2,,Xp-1, i cu 0 vectorul de componente (1, 2,.., p-1). Atunci modelul se scrie: Y = X 0 0 + u p + (p termenul constant) Acest model apare ca un caz particular al modelului Y = X + , unde: 0 X = ( X 0 | u) , = p Relund calculul minimizrii sumei ptratelor ecarturilor e' e , vom observa c apare o matrice de ordinul n, de o form interesant. 1 P = I uu' n
1 1 1

H = X( X' X) X' Deci, proiecia Xa din RX se obine prin transformarea lui Y cu ajutorul matricei 1 H = X ( X ' X ) X '. Se verific imediat c matricea H este simetric i idempotent: H = H i H = H2. ntr-adevr: 1 1 1 H ' = ( X ( X ' X ) X ') ' = X ' ' [ ( X ' X ) ] ' X ' = X ( X ' X ) X ' = H

Aceast matrice este o form particular a matricei Q definit mai sus, obinut cnd 1 1 se nlocuiete X prin u (se observ c ( u' u) = ). n Ea este o matrice simetric i idempotent care realizeaz proiecia oricrui vector din Rn pe subspaiul ortogonal lui RX. Acest operator de proiecie joac un rol fundamental n statistic. Dac z este un punct oarecare din Rn: 1 Pz = z u( u' z ) , n unde: 1 1 u' z = xi = z media de selecie. n n Deci: $ Pz = z uz = z vectorul de componente abaterile componentelor Matricea P efectueaz, deci, operaia de centrare n jurul mediei, pe coloane. Aplicat asupra unei matrice X, matricea P efectueaz centrarea coloan pe coloana $ = PX . X Valorile a0 i ap pentru coeficienii 0 i p ai modelului pentru a minimiza expresia e' e vor trebui s anuleze derivatele pariale de ordinul nti:

( e' e) = 2u' Y X 0 a 0 ua p = 0 ( 1,1) a p ( e' e) = 2 X 0' Y X 0 a 0 ua p = 0 ( p1,1) a 0

Din prima ecuaie se obine: p 1 1 1 a p = u' y u' X 0 a 0 = y a k x k n n k =1 Dezvoltnd cea de-a doua relaie i nlocuind ap prin valoarea gsit obinem: 1 ' 1 X 0' Y X 0' X 0 a 0 X 0 u u' Y u' X 0 a 0 = 0 n n Grupnd termenii ce conin pe a0 se obine imediat: X 0' PX 0 a 0 = X ' Py ntruct P = P' = P 2 , ultima relaie se poate scrie: $ $ $ $ X 0' X 0 a 0 = X 0' y , $ $ unde X 0 = PX 0 i Y = Py sunt datele centrate. $ $ 1 $ $ n final a = ( X ' X ) X ' Y pentru coeficienii a1, a2,,ap-1;
a p = y a k x k pentru termenul constant.
k =1

0 p 1

Cu alte cuvinte, cei p 1 coeficieni ai variabilelor exogene se pot obine dup regula general, opernd ns asupra datelor centrate. Termenul constant se deduce exprimnd c mediile observaiilor satisfac exact ecuaia de ajustare. y = a1 x1 +...+ a p1 x p1 + a p

$ $ S considerm elementul de pe linia k i coloana k din matricea X 0' X 0 . Acest termen se exprim:

( x
i =1

ik

x k )( xik ' x k ' )

Lund n consideraie i coeficientul n, obinem matricea de covarian empiric a variabilelor exogene ale modelului, matrice notat Vxx: 1 $ $ V xx = X 0' X 0 n n acelai mod vom scrie: 1 V xy = X 0' y n pentru vectorul celor p 1 covariane ntre Y i Xk, K = 1, 2, , p 1. Dac se consider matricea W de ordinul p a covarianelor empirice ntre toate datele modelului, se poate face ipoteza c sunt aranjate ca n figura de mai jos: Vxx Vxy W = ' ( p , p ) V xy V yy Atunci coeficienii de ajustare se calculeaz uor cu ajutorul formulelor transformate: a 0 = V xx1V xy
( p 1,1)
' a p = y a 0 x (termen constant) S vedem cum se poate evalua suma ptratelor ecarturilor. Dac exist un termen constant, proprietatea de ortogonalitate implic u' e = 0 i, deci, e este centrat. Urmeaz c Pe = e i n plus Pu = 0. n aceste condiii: $ $ e = Pe = Py PX 0 a 0 Pua p = Py PX 0 a 0 = y X 0 a 0 Din formula de calcul a lui a0 se obine: ' $ ' $ $ $ a 0 X 0' y = a 0 X 0' X 0 a 0 Deci, ' $ ' $ $ $ $ $ $ $ e' e = y ' Y a 0 X 0' X 0 a 0 = Y ' Y a 0 X 0' Y , care, astfel exprimat, ne conduce la relaia: p 1 n 2 ( Y ) a k cov( Y , X k ) ei = nVar i =1 k =1 ~ = Xa = X a + ua ) c: Se poate verifica (pornind de la y

1 ' $ $ Var ( ~ ) = a 0 X 0' X 0 a 0 = Var ( X 0 a 0 ) = cov( Y , X 0 a 0 ) = cov( Y , ~ ) y y n n cazul ajustrii cu termen constant, se definete coeficientul de corelaie multipl prin R dat de: cov 2 ( Y , ~ ) y 2 R = y var( Y ) var( ~ )

Acest coeficient se mai poate exprima sub urmtoarele forme: var( ~ ) cov( Y , X 0 a 0 ) cov 2 ( Y , ~ ) y y R2 = = = var( Y ) var( Y ) var( ~ ) var( Y ) y sau:
' $ $ ' $ a 0 X 0' X 0 a 0 a 0 X 0' Y R = = = $ $ $ y' Y y' y 2

a
k =1

p 1

cov( Y , X k ) var( Y )

Coeficientul R2 capt un sens prin mprirea dispersiei totale n dispersie explicat i dispersie rezidual. ~ Dispersia explicat: R 2 var( Y ) = Var ( Y ) Dispersia rezidual: ( 1 R 2 ) var( Y ) = Var ( e) ~ Dispersia total: var( Y ) = var( Y ) + var( e) S mai menionm faptul c R2 se poate exprima i n modul urmtor:
i var( e) i =1 R2 = 1 = 1 var( Y ) n var( Y )

Din aceast relaie rezult c minimiznd

e
i =1

2 i

se maximizeaz R. Cu alte cuvinte,

ajustarea prin metoda celor mai mici ptrate determin combinaia liniar de variabile exogene care are o corelaie maximal cu variabila endogen Y. Se observ c introducerea n model a unei noi variabile exogene arbitrare, va conduce la micorarea sumei ptratelor ecarturilor i prin urmare implic o cretere a coeficientului R. 9.14. Ipotezele Gauss - Markov Pn acum ne-am ocupat de rezolvarea unei probleme pur matematice de minimizare. S presupunem acum c reziduul i (eroarea) este efectul rezultant al unui mare numr de factori neidentificai i., ca atare, va fi considerat ca o variabil aleatoare. Considernd acest lucru pentru fiecare din cele n relaii ale modelului, vom introduce vectorul aleator (cu n componente variabile aleatoare) i definim Y ca un vector aleator care n scrierea matricial este de forma: Y = X + Asupra variabilelor i vom face ipoteze apriori ct mai simple posibil i vom arta c ajustarea prin metoda celor mai mici ptrate este cea mai bun dintre toate tehnicile de ajustare, pentru identificarea modelului. Vom presupune c M ( i ) = 0, D 2 ( i ) = 2

cov i , j = 0, i j = 1,2,..., n De aici urmeaz imediat ipotezele Gauss - Markov M ( ) = 0; Var ( ) = M ( ') = 2 I
( n ,n )

i echivalent: M ( Y ) = X ; Var( Y ) = 2 I Ajustarea prin metoda celor mai mici ptrate proiecteaz pe Y n Xa pe RX, iar pe n e pe subspaiul ortogonal lui RX (notat R ) n Rn. X Repartiia vectorului Y n Rn determin n felul acesta repartiia lui Xa n RX. Vom cuta s determinm repartiia componentelor ak ale vectorului a, care vor estima coeficienii necunoscui k ai modelului. S artm c n ipotezele Gauss-Markov, estimatorii ak obinui prin metoda celor mai mici ptrate sunt cei mai buni, n sensul urmtor: orice alt estimator are o repartiie mai dispersat n jurul valorii k de estimat. O prim proprietate a estimatorilor ak obinui prin metoda celor mai mici ptrate este c ei au repartiii centrate n coeficienii k.

ntr-adevr: 1 1 M ( a) = M [( X ' X ) X ' Y] = ( X ' X ) X ' M ( Y ) ,


M ( a) = Aadar vectorul a, estimatorul obinut prin metoda celor mai mici ptrate a vectorului a coeficienilor necunoscui este un estimator nedeplasat. De asemenea, matricea de covarian a vectorului aleator are expresia: V ( a ) = M [ ( a )( a ) '] Cum: 1 1 1 a = ( X ' X ) X ' Y = ( X ' X ) X ' ( X + ) = + ( X ' X ) X ' , avem: 1 a = ( X ' X ) X ' i, de aici: 1 1 1 1 V ( a ) = M [ ( X ' X ) X ' ' X ( X ' X ) ] = ( X ' X ) X ' M [ '] X ( X ' X ) innd seama de ipotezele Gauss-Markov obinem expresia: 1 V ( a) = 2 ( X ' X ) Teorem (Gauss-Markov). n condiiile Gauss-Markov, estimatorii ak ai parametrilor k obinui prin metoda celor mai mici ptrate sunt optimali n sensul c orice alt estimator nedeplasat i care este o funcie liniar de Y, are o varian mai mare. Demonstraie. Estimatorul a, obinut prin metoda celor mai mici ptrate, este funcia liniar de Y: 1 a = [ ( X ' X ) X '] Y S considerm un alt estimator: b = By Cum b i a sunt liniari n Y, putem s scriem: b = a + CY 1 (este suficient s lum C = B ( X ' X ) X ' ) S punem acum condiia c b este nedeplasat: M ( b) = M ( a + CY ) = Atunci: + CX = , oricare ar fi , implic CX = 0 Dac evalum matricea de covarian a estimatorului b, atunci: V ( b) = M [ ( b )( b ) '] Cum 1 1 1 b = a + CY = ( X ' X ) X '+ C ( X + ) = ( X ' X ) X ' X + CX + ( X ' X ) X ' + C =

adic:

Deci, b = [ ( X ' X ) X '+ C] i, de aici: 1 V ( b) = 2 ( X ' X ) + 2 CC ' = V ( a ) + 2 CC ' Din modul cum s-a definit matricea C rezult c CC' este negativ definit, iar elementele de pe diagonal sunt pozitive sau nule. Aceasta demonstreaz teorema.
1

= + [ ( X ' X ) X '+ C]
1

9.15. Estimarea matricei de covarian

Am vzut c var (ak) sunt minime, dar nu le cunoatem, cci parametrul al modelului este n general necunoscut. Atunci, este natural s alegem drept estimator pentru 2 1 n statistica ei2 , ns acesta este un estimator deplasat. n i =1 ntr-adevr: 1 n M ei2 = M ( e' e) n i =1 Dar: e' e = tr ( e' e) = tr ( ' Q ) 1 Cum tr(AB) = tr(BA), putem scrie: e' e = tr ( ' Q ) = tr ( Q ') i, deoarece operatorii, urma i valoarea medie sunt liniari, putem interverti ordinea operatorilor, ceea ce ne conduce la M ( e' e) = M tr ( Q ') = tr [ QM ( ') ] . Deci:

M ( e' e) = tr ( Q) Urma matricii Q se calculeaz ns imediat: 1 1 1 trQ = tr I X ( X ' X ) X ' = n tr [ X ( X ' X ) X '] = n tr[ ( X ' X ) X ' X ] = n tr I = ( n ,n ) ( p, p) = n p i de aici rezult c: n ( e' e) = M ei2 = ( n p) 2 M i =1 Acum putem introduce statistica: 1 n 2 s2 = , n p i =1 i care este un estimator nedeplasat al parametrului 2. n final se obine estimatorul nedeplasat S al matricii de covarian, 1 S = s2 ( X ' X ) ( M ( S ) = V ( a) ) Estimatorii individuali ai dispersiilor coeficienilor ak sunt dai de elementele de pe 1 diagonala principal a matricii S = s 2 ( X ' X ) .
2

O schem de estimare a parametrilor prin metoda celor mai mici ptrate, utiliznd polinoame ortogonale: S considerm problema estimrii parametrilor a1 , a 2 ,..., a m din ecuaia:
Y = a k k ( x) ,
k =1 m

care constituie legtura ntre valorile observate Y i variabila independent x ce apare n relaie prin intermediul funciilor 1 ( x ) , 2 ( x ) ,..., m ( x ) presupuse cunoscute. Dac n particular 1 ( x ) = 1, 2 ( x ) = x ,..., m ( x ) = x m1 , obinem Y ca un polinom de gradul m 1, iar dac m = 2 obinem o dependen liniar.

Am notat tr(A) urma matricii A, adic suma elementelor de pe diagonala principal.

Vom presupune c valorile observate ale variabilei Y, pentru un anumit sistem de valori x j , 1 j n ale argumentului sunt afectate de erorile j , 1 j n , astfel c:
Yj = a k k x j + j , 1 j n
m k =1

k ( x ) = cos kx , k ( x ) = k cos x , k ( x ) = sin kx

n unele probleme tehnice ntlnim sisteme de funcii trigonometrice de forma:

( )

Asupra erorilor j facem ipoteza c sunt independente i c sunt repartizate normal de parametri M j = 0.
2 2

( ) D ( ) =
j

, j = 1,2,..., n

Vom estima parametrii a1 , a 2 ,..., a m minimiznd suma ptratelor erorilor. 2 n m S ( a1 , a 2 ,..., a m ) = y j a k k x j ( min) j =1 k =1 $ $ $ Estimaiile a1 , a 2 ,..., a m ale parametrilor prin metoda celor mai mici ptrate se obin rezolvnd sistemul de ecuaii: n m 1 S = y j a k k x j i x j = 0, 1 i m 2 a i j =1 k =1 Notnd pentru simplificare

( )

( ) ( )
k

( x ) ( x ) = ( , ) = (
n

y ( x ) = ( y , ) = ( , y )
j =1 m j i j i i

j =1 n

, i )

Sistemul de ecuaii se poate pune sub forma:

a ( , ) = ( y, ) i = 1,2,..., m
k =1 k i k i

$ $ $ Soluia acestui sistem constituie estimaiile a1 , a 2 ,..., a m . Rezolvarea sistemului se simplific considerabil dac sistemul de funcii { k ( x ) } constituie un sistem ortogonal pe mulimea valorilor argumentului x1, x2, , xn. Dup cum se tie, condiia de ortogonalitate const n faptul c pentru orice i k ,

( , ) = ( x ) ( x ) = 0
n
1

Dac funciile k sunt ortogonale, atunci i k ( x ) = Ck k ( x ) vor fi ortogonale, iar dac k nu sunt ortogonale, ele se pot ortogonaliza prin procedeul obinuit. Astfel, considernd sistemul de funcii 1 ( x ) = 1, 2 ( x ) = x ,..., m+1 ( x ) = x m , care nu este un sistem ortogonal, se construiete sistemul ortogonal: 1 ( x ) , 2 ( x ) ,..., m+1 ( x ) din aproape n aproape cu: ( x i1 , i1 ) ( ) ( x i1 , 1 ) ( ) i 1 i ( x ) = x x ... x ( i1 , i 1 ) i1 ( 1 , 1 ) 1 i = 2,..., m + 1, 1 ( x ) = ( x ) = 1

j =1

Aa, de exemplu:

x ( x, ) ( ) x = x ( x) = x n ( , )
1 j =1 2 1 1 1

= xx

3 ( x ) = x 2

( x , ) ( ) ( x , ) ( ) x =x x ( , ) ( , )
2 2 2 1 2 1 2 2 1 1

x (x
n 2

j =1 n

2 j

( x
j =1

( x x)

x
j =1

2 j

x
= x2
j =1 n

3 j

xx
j =1 n

2 j

x
j =1

2 j

xxj
j =1

( x x)

x
j =1

2 j

Deci, i ( x ) , i = 1, 2,..., m + 1 sunt polinoame de gradul i 1 cunoscute sub numele de polinoame Cebev. Din relaia scris n general se vede imediat c orice putere x i1 se poate reprezenta sub forma unei combinaii liniare de funciile 1 ( x ) , 2 ( x ) ,..., i ( x ) , i = 1, 2,..., m + 1. Aceasta ne conduce la faptul c orice combinaie liniar combinaie liniar

a ( x )
n j =1 k k j

se transform ntr-o

b ( x )
n j =1 k k j

de funcii ortogonale k obinute din k prin procedeul de

ortogonalizare menionat. S presupunem acum c sistemul de funcii 1 , 2 ,..., m constituie un sistem ortogonal, adic ( 1 2 ) = 0, i j . n acest caz, sistemul de ecuaii:

a ( , ) = ( y, ) , i = 1, 2,..., m ,
k =1 k i k i

se poate scrie: ai ( i , i ) = ( y , i ) , i = 1, 2,..., m i, deci,


n

$ ai

( y , ) y ( x ) , i = 1, 2,..., m , = = ( , ) ( x )
i j =1 j j j n i i j =1 2 i j m

$ care ne arat c estimaiile a i sunt funcii liniare de observaiile y j . ns y j sunt date de:

y j = a k k x j + j , j = 1, 2,..., n

innd seama de faptul c ( k ) 1 k m sunt ortogonale, putem scrie:


$ ai

k =1

( )
j

( x ) a ( ( x ) , ( x ) ) ( x ) = + = +a ( , ) ( , ) ( , )
n m n j =1 j i k =1 k k j i j j =1 j i j i i i i i i

De aici obinem:
n

$ ai ai

Cum j sunt variabile aleatoare independente, identic repartizate, normale N ( 0, ) i cum i sunt combinaii liniare de j , rezult c i i sunt variabile aleatoare repartizate normal de parametri: n 1 M ( i ) = x M j = 0, i = 1, 2,..., m ( i , i ) j =1 i j

( x ) = = ( , )
j =1 j i j i i

( ) ( )

D ( i ) = M (
2

2 i

m 2 2 ( i , i ) 2 = x M j + i x j i ( x k ) M j k = 2 , ( i , i ) jk ( i , i ) 2 j =1 i j 1

( ) ( )

( )

adic: D 2 ( i ) =

2 , i = 1, 2,..., m ( i , i )

$ O proprietate foarte important a estimaiilor a i dezvoltate dup funcii ortogonale, o constituie faptul c sunt necorelate, iar n cazul cnd j sunt variabile normale, sunt i independente. ntr-adevr, putem scrie: n ( i , i )( k , k ) M ( i , k ) = M j i ( xh ) = i x j k ( xh ) M j h j =1 j ,h Cum: 0, j h M j h = 2 , , j = h rezult:

( )

( , )(
i i

2 k , k ) M ( i k ) = i x j k x j n j =1

( ) ( )

Dar ( i ) 1 i m sunt ortogonale i, deci, M ( i k ) = 0 dac i k , ceea ce probeaz $ $ necorelarea variabilelor a i i a k .

Pentru estimarea dispersiei 2 vom folosi suma ptratelor abaterilor 2 = y j Y j j Se poate arta c: 2 1 n 2 1 n 2 sy = j = n m y j Yj , n m j =1 j =1 n ipotezele pe care le-am formulat, constituie o estimaie nedeplasat a dispersiei 2 . nm 2 2 ( n m) . Variabila 2 s y are o repartiie

Pentru a construi intervale de ncredere pentru coeficienii ak ne folosim de faptul c variabilele: $ ak ak ( ) tk = s y / ( k , k ) sunt variabile aleatoare repartizate Student cu n m grade de libertate i, deci, P t ((nk) m) < t ((nk) m) , = ( - nivelul de ncredere)

ne conduce la intervalul: sy (k) (k $ $ a k t n m, < a k < a k + t n )m, ( k , k )

sy

k , k )

, k = 1, 2, , m.

BIBLIOGRAFIE 1. 2. 3. 4. 5. 6. 7. 8. 9. Ciuci G. Ciucu, G., Craiu, V. Ciucu, G., Craiu, V., Scuiu, I. Ciucu, G., Craiu, V., Scuiu, I. Ciucu, G., Craiu, V., tefnescu, A. Ciucu, G., Tudor, C. Craiu, V. Cuculescu, I. Feller, W. Elemente de teoria probabilitilor i statistic matematic, Editura Didactic i Pedagogic, Bucureti, 1963 Introducere n teoria probabilitilor i statistic matematic, Editura Didactic i Pedagogic, Bucureti, 1971 Probleme de teoria probabilitilor, Editura Tehnic, 1974 Probleme de statistic matematic, Editura Tehnic, 1974 Statistic matematic i cercetri operaionale, Didactic i Pedagogic, Bucureti, 1974 Editura

10. Gnedenko, B. V. 11. Guiau, S., Theodorescu, R. 12. Iaglom, A. M., Iaglom, I. M. 13. Iosifescu, M., Mihoc Gh., Theodorescu, R. 14. Iosifescu, M. 15. Iosifescu, M., Tutu, P. 16. Kendall, M. G., Stuart, A. 17. Kai Lai Chung 18. Kalbleisch, J. G. 19. Mc Phersson, G. 20. Mihoc, Gh., Ciucu, G., Craiu, V. 21. Neveu, I. 22. Onicescu, O. 23. Onicescu, O., Mihoc, Gh., Ionescu Tulcea, C.

Probabiliti i procese stochastice, vol. I, Editura Academiei R.S.R., Bucureti, 1978 Verificarea ipotezelor statistice, Editura Didactic i Pedagogic, Bucureti, 1972 Curs de calculul probabilitilor, Topografia Universitii, Bucureti, 1976 An introduction to probability theory and its applications, vol. I (1957), vol. II (1966), John Wiley The Theory of probability, Mir Publishees Moscow, 1969 Matematica i informaia, Editura Didactic i Pedagogic, Bucureti, 1965 Probabilitate i informaie, Editura Didactic i Pedagogic, Bucureti, 1963 Teoria probabilitilor i statistic matematic, Editura Tehnic, Bucureti, 1966 Lanuri Markov finite i aplicaii, Editura Tehnic, Bucureti, 1977 Stochastic processe and applications in biology and medicine, Bucureti, Berlin, Editura Academiei & Springer, 1973 The advanced theory of Statistics, vol. I, II, Charles Griffin & Company Limited, London, 1961 Elementary Probability Theory with Stochastic Processes, Springer Verlag, New York Heidelberg Berlin, 1974 Probability and Statistical Inference, I, II, Springer Verlag, New York, Heidelberg, Berlin, 1979 Statistics in Scientific Investigation (Its Basis, Application and Interpretation), Springer Verlag, 1990 Teoria probabilitilor i Statistic matematic, Editura Didactic i Pedagogic, Bucureti, 1970 Cours de Probabilits, Ecole Polytechnique, Paris, 1970 Probabiliti i procese aleatoare, Editura tiinific i Enciclopedic, Bucureti, 1977 Calculul probabilitilor i aplicaii, Editura Academiei R.P.R., Bucureti, 1956

24. Reischer, C., Smboan, G., Theodorescu, R. 25. Renyi, A. 26. Schimetterer, L. 27. Trandafir, R. 28. Uilks, S. 29. Venzel, H. 30. Ya-lun Chou

Teoria probabilitilor, Editura Didactic i Pedagogic, Bucureti, 1967 Calcul de probabilits, Dunod, Paris, 1966 Einfuhrung in die matematische Statistik, Springer Verlag, Wien, New York, 1966 Introducere n teoria probabilitilor, Editura Albatros, Bucureti, 1979 Matematicescaia Statistica, Izdatelstvo Nauka, Moscova, 1967 Theorie de probabilits, Editura de Moscou, 1973 Statistical Analysis for Business and Economics, Elsevier, New York, Amsterdam, London, 1989

S-ar putea să vă placă și