Sunteți pe pagina 1din 402

Cuprins

Prefat a vii
1 Introducere n Matlab 1
1.1 Gestionarea unei sesiuni Matlab . . . . . . . . . . . . . . . . . . . 2
1.1.1 Lansarea si nchiderea unei sesiuni Matlab . . . . . . . . . 2
1.1.2 Comenzi help . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Comenzi sistem . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Constante. Variabile. Expresii aritmetice . . . . . . . . . . . . . . . 4
1.2.1 Constante . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 Instruct iunea format . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Constante speciale . . . . . . . . . . . . . . . . . . . . . . 6
1.2.4 Variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.5 Operatori aritmetici . . . . . . . . . . . . . . . . . . . . . . 8
1.2.6 Funct ii predenite . . . . . . . . . . . . . . . . . . . . . . 9
1.2.7 Comenzi pentru gestiunea variabilelor si a spat iului de lucru 10
1.3 Instruct iuni de atribuire . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Instruct iuni de citire si scriere . . . . . . . . . . . . . . . . . . . . . 13
1.4.1 Instruct iunea input . . . . . . . . . . . . . . . . . . . . . 13
1.4.2 Instruct iunea ginput . . . . . . . . . . . . . . . . . . . . 13
1.4.3 Instruct iunea fprintf . . . . . . . . . . . . . . . . . . . 13
1.5 Operatori relat ionali si operatori logici . . . . . . . . . . . . . . . . 14
1.5.1 Operatori relat ionali . . . . . . . . . . . . . . . . . . . . . 14
1.5.2 Operatori logici . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6 Fisiere script (mle) . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6.1 Comenzi pentru gestionarea sierelor . . . . . . . . . . . . 17
1.7 Grac a bidimensional a . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7.1 Instruct iunea plot . . . . . . . . . . . . . . . . . . . . . . 17
1.7.2 Comenzi si instruct iuni de gestionare a gracelor . . . . . . 21
1.7.3 Instruct iunile polar si ezpolar . . . . . . . . . . . . . . 24
i
ii Cuprins
1.7.4 Instruct iunea stairs . . . . . . . . . . . . . . . . . . . . 25
1.7.5 Instruct iunile bar si barh . . . . . . . . . . . . . . . . . . 28
1.7.6 Instruct iunea subplot . . . . . . . . . . . . . . . . . . . 28
1.7.7 Instruct iunea fplot . . . . . . . . . . . . . . . . . . . . . 30
1.7.8 Instruct iunea ezplot . . . . . . . . . . . . . . . . . . . . 30
1.7.9 Instruct iunea fill . . . . . . . . . . . . . . . . . . . . . . 31
1.8 Instruct iuni de ciclare si control . . . . . . . . . . . . . . . . . . . 32
1.8.1 Instruct iunea if . . . . . . . . . . . . . . . . . . . . . . . 32
1.8.2 Instruct iunea switch . . . . . . . . . . . . . . . . . . . . 33
1.8.3 Instruct iunea while . . . . . . . . . . . . . . . . . . . . . 34
1.8.4 Instruct iunea for . . . . . . . . . . . . . . . . . . . . . . 35
1.9 Instruct iuni de ntrerupere . . . . . . . . . . . . . . . . . . . . . . . 36
1.9.1 Instruct iunea try. . . catch . . . . . . . . . . . . . . . . . 36
1.9.2 Instruct iunea pause . . . . . . . . . . . . . . . . . . . . . 37
1.9.3 Instruct iunea return . . . . . . . . . . . . . . . . . . . . 37
1.9.4 Instruct iunea break . . . . . . . . . . . . . . . . . . . . . 37
1.9.5 Instruct iunea error . . . . . . . . . . . . . . . . . . . . . 38
1.10 Funct ii (proceduri) n Matlab . . . . . . . . . . . . . . . . . . . . . 38
1.10.1 Denirea si structura unei funct ii Matlab . . . . . . . . . . 39
1.10.2 Apelul unei funct ii (proceduri) Matlab . . . . . . . . . . . . 40
1.10.3 Subfunct ii . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.10.4 Funct ia feval . . . . . . . . . . . . . . . . . . . . . . . . 42
1.10.5 Comanda echo . . . . . . . . . . . . . . . . . . . . . . . . 42
1.11 Instruct iuni de evaluare a ecient ei . . . . . . . . . . . . . . . . . . 43
1.11.1 Instruct iunea flops . . . . . . . . . . . . . . . . . . . . . 43
1.11.2 Instruct iunile tic si toc . . . . . . . . . . . . . . . . . . 43
1.12 Grac a tridimensional a . . . . . . . . . . . . . . . . . . . . . . . . 43
1.12.1 Instruct iunea plot3 . . . . . . . . . . . . . . . . . . . . . 44
1.12.2 Instruct iunea ezplot3 . . . . . . . . . . . . . . . . . . . 45
1.12.3 Instruct iunile meshgrid, mesh si surf . . . . . . . . . . 45
1.12.4 Instruct iunile contour si contourf . . . . . . . . . . . 48
1.12.5 Instruct iunile ezcontour si ezcontourf . . . . . . . . 49
1.12.6 Instruct iunile ezmesh, ezsurf, ezmeshc si ezsurfc . 50
1.12.7 Instruct iunile bar3 si bar3h . . . . . . . . . . . . . . . . 51
2 Elemente de teoria probabilit atilor 53
2.1 C amp de probabilitate . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.2 Variabile aleatoare . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.3 Funct ie de repartit ie . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.4 Legi de probabilitate de tip discret . . . . . . . . . . . . . . . . . . 56
Cuprins iii
2.4.1 Funct iile Matlab pdf si cdf . . . . . . . . . . . . . . . . . 57
2.4.2 Legi de probabilitate de tip discret clasice . . . . . . . . . . 59
2.5 Legi de probabilitate continue . . . . . . . . . . . . . . . . . . . . 64
2.5.1 Legi de probabilitate continue clasice . . . . . . . . . . . . 65
2.5.2 Legi de probabilitate continue statistice . . . . . . . . . . . 70
2.5.3 Funct ia Matlab normspec . . . . . . . . . . . . . . . . . 75
2.5.4 Distribut ie marginal a . . . . . . . . . . . . . . . . . . . . . 76
2.5.5 Funct ie de repartit ie condit ionat a . . . . . . . . . . . . . . . 77
2.5.6 Funct ie de supraviet uire. Funct ie hazard . . . . . . . . . . . 80
2.6 Caracteristici numerice . . . . . . . . . . . . . . . . . . . . . . . . 80
2.6.1 Valoare medie. Dispersie (variant a). Covariant a . . . . . . . 80
2.6.2 Funct ii Matlab pentru valoare medie si dispersie . . . . . . 85
2.6.3 Valoare medie condit ionat a. Dispersie (variant a) condit ionat a 86
2.6.4 Funct ie caracteristic a . . . . . . . . . . . . . . . . . . . . . 90
2.6.5 Momente . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.6.6 Mediana. Cuartile. Cuantile . . . . . . . . . . . . . . . . . 90
2.6.7 Funct ia Matlab icdf . . . . . . . . . . . . . . . . . . . . . 91
2.6.8 Funct ia Matlab disttool . . . . . . . . . . . . . . . . . 93
2.7 S iruri de variabile aleatoare . . . . . . . . . . . . . . . . . . . . . . 93
2.7.1 Inegalitatea lui Cebsev . . . . . . . . . . . . . . . . . . . . 93
2.7.2 Tipuri de convergent a . . . . . . . . . . . . . . . . . . . . . 94
2.7.3 Legea numerelor mari . . . . . . . . . . . . . . . . . . . . 95
2.7.4 Teoreme limit a . . . . . . . . . . . . . . . . . . . . . . . . 95
3 Statistic a descriptiv a 99
3.1 Concepte de baz a ale statisticii . . . . . . . . . . . . . . . . . . . . 100
3.2 Culegerea, prezentarea si prelucrarea datelor statistice . . . . . . . . 101
3.2.1 Generarea numerelor aleatoare n Matlab . . . . . . . . . . 101
3.2.2 Tabele statistice . . . . . . . . . . . . . . . . . . . . . . . . 105
3.2.3 Funct iile tabulate si crosstab . . . . . . . . . . . . . 111
3.2.4 Funct iile caseread, casewrite, tblread si tblwrite113
3.2.5 Reprezent ari grace . . . . . . . . . . . . . . . . . . . . . 115
3.2.6 Funct ii Matlab pentru reprezentarea grac a a datelor statistice 119
3.2.7 Funct ia randtool . . . . . . . . . . . . . . . . . . . . . 129
3.2.8 Funct iile pie si pie3 . . . . . . . . . . . . . . . . . . . . 130
3.3 Parametrii distribut iilor statistice . . . . . . . . . . . . . . . . . . . 131
3.3.1 Parametri statistici ce m asoar a tendint a . . . . . . . . . . . 131
3.3.2 Funct iile mean, geomean si harmean . . . . . . . . . . 132
3.3.3 Funct ia trimmean . . . . . . . . . . . . . . . . . . . . . 132
3.3.4 Funct ia median . . . . . . . . . . . . . . . . . . . . . . . 133
iv Cuprins
3.3.5 Parametri statistici ce m asoar a dispersarea . . . . . . . . . . 133
3.3.6 Funct ia prctile . . . . . . . . . . . . . . . . . . . . . . 133
3.3.7 Funct ia moment . . . . . . . . . . . . . . . . . . . . . . . 138
3.3.8 Funct iile var si std . . . . . . . . . . . . . . . . . . . . . 138
3.3.9 Funct iile range, iqr, mad, skewness si kurtosis . . 138
3.3.10 Funct iile max si min . . . . . . . . . . . . . . . . . . . . . 139
3.3.11 Funct iile sort si sortrows . . . . . . . . . . . . . . . . 139
3.3.12 Funct iile sum, prod, cumsum si cumprod . . . . . . . . 139
3.3.13 Funct ia diff . . . . . . . . . . . . . . . . . . . . . . . . . 140
3.3.14 Funct iile nanmean, nanmedian, nanstd, nanmin,
nanmax si nansum . . . . . . . . . . . . . . . . . . . . . 140
3.3.15 Corect iile lui Sheppard . . . . . . . . . . . . . . . . . . . . 140
3.3.16 Funct ia grpstats . . . . . . . . . . . . . . . . . . . . . 145
3.3.17 Funct ia boxplot . . . . . . . . . . . . . . . . . . . . . . 147
3.4 Corelat ie si regresie . . . . . . . . . . . . . . . . . . . . . . . . . . 148
3.4.1 Funct iile cov si corrcoef . . . . . . . . . . . . . . . . . 161
3.4.2 Funct iile lsline, refline si gline . . . . . . . . . . 163
3.4.3 Funct iile polyfit si refcurve . . . . . . . . . . . . . . 164
3.4.4 Funct iile polyval, polyvalm, poly si roots . . . . . 165
3.4.5 Funct ia polytool . . . . . . . . . . . . . . . . . . . . . 166
3.4.6 Funct ia nlinfit . . . . . . . . . . . . . . . . . . . . . . 166
3.4.7 Funct ia nlintool . . . . . . . . . . . . . . . . . . . . . 168
3.4.8 Coecient ii Spearman si Kendall . . . . . . . . . . . . . . . 168
4 Teoria selectiei 179
4.1 Tipuri de select ie . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.2 Funct ii de select ie . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
4.2.1 Media de select ie . . . . . . . . . . . . . . . . . . . . . . . 181
4.2.2 Momente de select ie . . . . . . . . . . . . . . . . . . . . . 183
4.2.3 Coecient de corelat ie de select ie . . . . . . . . . . . . . . 189
4.2.4 Funct ie de repartit ie de select ie . . . . . . . . . . . . . . . . 198
4.2.5 Funct ia cdfplot . . . . . . . . . . . . . . . . . . . . . . 204
5 Teoria estimatiei 209
5.1 Funct ie de verosimilitate . . . . . . . . . . . . . . . . . . . . . . . 209
5.2 Funct ii de estimat ie . . . . . . . . . . . . . . . . . . . . . . . . . . 216
5.2.1 Funct ii de estimat ie absolut corecte . . . . . . . . . . . . . 217
5.2.2 Funct ii de estimat ie corecte . . . . . . . . . . . . . . . . . 219
5.2.3 Funct ii de estimat ie eciente . . . . . . . . . . . . . . . . . 221
5.2.4 Estimatori optimali . . . . . . . . . . . . . . . . . . . . . . 227
Cuprins v
5.3 Metode pentru estimarea parametrilor . . . . . . . . . . . . . . . . 231
5.3.1 Metoda momentelor . . . . . . . . . . . . . . . . . . . . . 231
5.3.2 Metoda verosimilit at ii maxime . . . . . . . . . . . . . . . . 232
5.3.3 Metoda minimului
2
. . . . . . . . . . . . . . . . . . . . 236
5.3.4 Metoda intervalelor de ncredere . . . . . . . . . . . . . . . 237
5.3.5 Metoda intervalelor de ncredere pentru select ii mari . . . . 253
5.3.6 Funct ii Matlab privind estimat ia . . . . . . . . . . . . . . . 256
6 Vericarea ipotezelor statistice 263
6.1 Concepte de baz a . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
6.2 Testul Z privind media teoretic a . . . . . . . . . . . . . . . . . . . 264
6.2.1 Funct iile zscore si ztest . . . . . . . . . . . . . . . . . 268
6.3 Puterea unui test . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
6.4 Testul T (Student) privind media teoretic a . . . . . . . . . . . . . . 282
6.4.1 Funct ia ttest . . . . . . . . . . . . . . . . . . . . . . . . 285
6.5 Testul raportului verosimilit at ilor . . . . . . . . . . . . . . . . . . . 286
6.6 Testul
2
privind dispersia teoretic a . . . . . . . . . . . . . . . . . 289
6.7 Testul F (FisherSnedecor) pentru compararea dispersiilor . . . . . 295
6.8 Teste pentru compararea mediilor . . . . . . . . . . . . . . . . . . 300
6.8.1 Dispersii cunoscute . . . . . . . . . . . . . . . . . . . . . . 300
6.8.2 Dispersii egale necunoscute . . . . . . . . . . . . . . . . . 302
6.8.3 Funct ia ttest2 . . . . . . . . . . . . . . . . . . . . . . . 305
6.8.4 Dispersii diferite necunoscute . . . . . . . . . . . . . . . . 306
6.8.5 Observat ii perechi . . . . . . . . . . . . . . . . . . . . . . 309
6.9 Testul
2
pentru concordant a . . . . . . . . . . . . . . . . . . . . . 312
6.10 Testul
2
pentru compararea mai multor caracteristici . . . . . . . . 323
6.11 Testul
2
pentru tabele de contingent a . . . . . . . . . . . . . . . . 327
6.12 Testul de concordant a al lui Kolmogorov . . . . . . . . . . . . . . . 331
6.12.1 Funct ia kstest . . . . . . . . . . . . . . . . . . . . . . . 338
6.12.2 Funct ia lillietest . . . . . . . . . . . . . . . . . . . . 339
6.13 Testul KolmogorovSmirnov . . . . . . . . . . . . . . . . . . . . . 341
6.13.1 Funct ia kstest2 . . . . . . . . . . . . . . . . . . . . . . 343
Anexa I 346
Anexa II 347
Anexa III 348
Anexa IV 349
vi Cuprins
Anexa V 353
Bibliograe 354
Index 361
Prefat a
Aspecte primare ale statisticii se pierd n negura timpului. Ast azi, putem spune, f ar a
a gresi, c a statistic a facem ecare dintre noi, cu stiint a sau f ar a. G andul la ziua de
m aine, cum ne organiz am si cum folosim timpul si mijloacele materiale de care dis-
punem, are la baz a date (statistice) ret inute (culese) si prelucrate n mod simplu sau
mai complex. Ne d am seama, prin urmare, c a statistica are o larg a r asp andire, de la
utilizarea ei n mod empiric, p an a la apelarea la metodele fundamentate matematic.
Statistic a f aceau chinezii antici, care dispuneau de date relative la populat ie,
p am anturi si recolte, dar si egiptenii, care efectuau cadastr ari (operat ii de determinare
a unor propriet at i agricole si imobiliare cu toate caracteristicile lor) si num ar ari de
populat ie. Num ararea populat iei era cunoscut a si la evrei, de exemplu, n texte biblice
sunt ment ionate num ar ari de populat ie, ca cea efectuat a de Moise, privind b arbat ii
buni de oaste. La grecii antici erau, de asemenea, efectuate num ar ari de populat ie, ale
bunurilor necesare pentru scopuri militare, pentru asezarea impozitelor si evaluarea
bog at iilor. Toate acestea au culminat cu recens amintele si anchetele romane .
Culegerea de date privind resursele umane si materiale aveau la baz a o g andire
practic a, folosirea acestora n scopuri scale, militare sau administrative. Putem
spune c a toate acestea erau utilizate n descrierea statului.
Tratarea stiint ic a a datelor relative la descrierea statului se nt alneste n Ger-
mania (sec. XVIIXVIII), iar denumirea de statistic a apare n cursul lui Martin
Schmeitzel (16791757), intitulat Collegium politico-statisticum (Universitatea
din Halle). Unii istorici atribuie nt aietate privind aceast a denumire lui Gottfried
Achenwall (1719-1772), care a introdus nv at am antul Staatskunde la Universitatea
din G ottingen.

In Anglia, n aceeasi perioad a, n afara universit at ilor, exista ca disciplin a descrip-


tiv a a statului ceea ce se numea aritmetic a politic a. Aritmetica politic a se ocupa n
special de cercetarea fenomenelor demograce.
Un moment important n dezvoltarea statisticii l reprezint a cristalizarea calculu-
lui probabilit at ilor.
Calculul probabilit at ilor si fundamentarea riguroas a din punct de vedere matema-
tic a teoriei probabilit at ilor reprezint a o problem a fundamental a n stabilirea locului
vii
viii Prefat a
si rolului acestei discipline matematice n evantaiul larg al matematicii, precum si al
fundament arii teoretice a statisticii matematice.
Desigur, faptul c a cineva, cu diferite ocazii, foloseste cuv antul probabil, nu
nseamn a c a este o persoan a init iat a n calculul probabilit at ilor. Am putea, eventual,
accepta c a sunt percepute anumite aspecte empirice ale calculului probabilit at ilor,
c and, relativ la un anumit fenomen care prezint a un anumit grad de nedeterminare,
se emit armat ii de forma: este put in probabil ca..., este foarte probabil ca..., este
improbabil ca.... De la astfel de armat ii si p an a la cunoasterea si nt elegerea n
profunzime a teoriei probabilit at ilor este un drum lung, care este de un larg interes
at at din punct practic c at si teoretic, si care prezint a o atract ie deosebit a, nu nu-
mai pentru matematicieni, dar si pentru specialisti din alte discipline ale cunoasterii
umane: zic a, chimie, biologie, economie, medicin a, inginerie etc. Aceste aspecte,
de-a lungul timpului, se reg asesc n aparit ia, dezvoltarea si fundamentarea axiomatic a
a teoriei probabilit at ilor, care se mbin a si se continu a cu diferite domenii de aplica-
bilitate, dintre care statistica ocup a un rol privilegiat.
Este unanim acceptat c a not iunea de probabilitate si are originea n jocurile de
noroc.

In antichitate, la egipteni, greci si romani erau cunoscute jocuri de noroc cu
zaruri, care s-au perpetuat p an a n zilele de ast azi. Se pare c a cel mai vechi zar dateaz a
din jurul anilor 3500 .e.n. si avea fet ele numerotate la nt amplare de la 1 la 6, fat a de
zarul actual, care are fet ele numerotate astfel ca suma numerelor de pe fet ele opuse
s a e 7. Proliferarea jocurilor de noroc s-a produs nu numai prin aria de r aspndire,
dar si prin diversitatea acestora. Ajunge s a amintim doar jocurile de rulet a care sunt
instalate n marile metropole ale lumii.
Problemele teoretice relative la jocurile de noroc, n special privind sansele parte-
nerilor, au atras atent ia savant ilor timpului. Astfel, fundamentarea elementar a a calcu-
lului probabilit at ilor poate atribuit a francezilor P. de Fermat (16011665) si B. Pas-
cal (16231662). Corespondent a din anul 1654, purtat a de cei doi, cont ine primele
aspecte privind calculul sanselor n jocurile de noroc. O parte din problemele con-
siderate au fost formulate si prezentate lui Pascal de c atre Cavalerul de M er e, un
renumit amator al jocurilor de noroc din acea vreme.
Prima carte de introducere n calculul probabilit at ilor este De Ratiociniis in Aleae
Ludo (Cum se rat ioneaz a n jocurile cu zarul), ap arut a n anul 1657 si are ca autor pe
olandezul Ch. Huygens (16291695).
Totusi, se remarc a faptul c a italianului G. Cardano (15011576) i se datoreaz a
lucrarea intitulat a Liber de Ludo Aleae (Cartea despre jocurile cu zarul), care a fost
cunoscut a si publicat a la mai bine de o sut a de ani de la disparit ia sa.
Un destin asem an ator a avut si lucrarea lui James Bernoulli (16541705), Ars
Conjectandi (Arta de a face presupuneri), care a fost publicat a de c atre fratele s au
John Bernoulli n anul 1713. Se remarc a n cont inutul c art ii, ceea ce se numeste azi
Prefat a ix
legea numerelor mari, unul din rezultatele str alucitoare ale teoriei probabilit at ilor.
Un alt rezultat de aceeasi dimensiune, teorema limit a central a, se g aseste n cartea
Doctrine of Chances, ap arut a n anul 1718 si care este opera lui A. de Moivre (1667
1754), ceea ce, se cunoaste, este str ans legat a de legea normal a de probabilitate.
Descoperirea legii normale de probabilitate este atribuit a, de cele mai multe ori,
lui K. F. Gauss (17771855), si care este considerat a ca ind specic a erorilor de
m asurare. Trebuie remarcat faptul c a n anul 1808, cu un an nainte de descoperirea
lui Gauss, topograful american Robert Adrain (17751843) publicase o lucrare n
care a sugerat utilizarea legii normale pentru descrierea erorilor de m asurare.
Rezultatele lui Moivre, privind teorema limit a central a, sunt extinse de c atre P. -
S. de Laplace (17701820), stabilind de asemenea leg atura cu legea normal a de pro-
babilitate, n cartea Th eorie Analytique des Probabilit es (Teoria analitic a a proba-
bilit at ilor), ap arut a n anul 1812.
Un statistician belgian de seam a al sec. XIX, unanim recunoscut pentru rezul-
tatele de pionerat n domeniul statisticii matematice este A. Quetelet (17961874).
De numele lui se leag a not iuni ale statisticii ca: repartit ie, medie, dispersie, obser-
vare de mas a, regularitate. Pentru el, statistica reprezenta singura metod a ce se poate
aplica fenomenelor de mas a.
Un salt remarcabil n dezvoltarea teoria probabilit at ilor a fost f acut prin contri-
but ia matematicienilor rusi L. P. Cebsev (18211884), A. A. Markov (18561922)
si A. M. Leapunov (18571918). Primul a introdus not iunea de variabil a aleatoare,
reformul and si generaliz and legea numerelor mari n limbajul variabilelor aleatoare.
Folosind not iunea de variabil a aleatoare, A. A. Markov si A. M. Leapunov au obt inut
apoi alte rezultate privind legea numerelor mari si teorema limit a central a.
Pasul decisiv privind fundamentarea modern a a teoriei probabilit at ilor este f acut
prin lucrarea matematicianului rus A. N. Kolmogorov (19031989), ap arut a n anul
1933. A. N. Kolmogorov, folosind teoria m asurii, reuseste s a construiasc a modelul
axiomatic al teoriei probabilit at ilor.
Se remarc a de asemenea preocup ari si rezultate importante obt inute de alt i ma-
tematicieni ca: S. D. Poisson (17811840),

E. Borel (18711956), S. N. Bernstein
(18801968), R. von Mises (18831953), A. I. Hincin (18941959).
Sf arsitul sec. XIX si nceputul sec. XX se consider a a nceputul statisticii mo-
derne. Este momentul c and se trece de la etapa descriptiv a, la interpretarea analitic a
a fenomenelor de mas a si obt inerea de concluzii inductive pe baza observat iilor
empirice. Statisticieni de renume, care au pus bazele statisticii matematice sunt
considerat i a englezii F. Galton (18221911) si K. Pearson (18571936). Opera
acestora este continuat a de celebrul statistician R. A. Fisher (18901962). Din-
tre reprezentant ii scolii engleze de statistic a amintim pe G. U. Yule (18711951),
W. S. Gosset (18761937), C. E. Spearman (18831945), M. Kendall (19071983).
x Prefat a
Pentru detalii privind istoricul statisticii recomand am lucrarea [38].
Ast azi, statistica matematic a, av and un suport teoretic al teoriei probabilit at ilor,
are o dezvoltare si aplicabilitate deosebit a. Care este motivul aplic arii statisticii ma-
tematice pe o scar a larg a si n at atea domenii ale cunoasterii umane? Am putea da
dou a r aspunsuri principale.

In primul r and, ecare cercet ator sau persoan a care anali-
zeaz a fenomene ale lumii reale, modeleaz a astfel de fenomene, caut a s a pun a la baza
metodelor sale de cercetare stiint ic a, de evaluare a fenomenelor reale, un instrument
de investigare obiectiv. S i este cvasiunanim recunoscut c a matematica are astfel de
instrumente de investigare, inclusiv prin metodele statisticii matematice.

In al doilea
r and, metodele statisticii matematice sunt usor de aplicat. Greutatea const a numai n
fundamentarea riguroas a din punct de vedere matematic a acestora. Acest aspect este
ascuns celui care aplic a statistica matematic a.

In materialul pe care l prezent am, con-
sider am not iunile (conceptele) de baz a n init ierea studiului si aplic arii statisticii ma-
tematice. Se consider a partea ascuns a a statisticii matematice, adic a fundamentarea
teoretic a, c at de c at riguroas a, a statisticii matematice, dar si partea care prezint a
modul de aplicare a metodelor statisticii matematice.
Dac a n tot acest demers avem la dispozit ie si mijlocul modern de lucru, reprezen-
tat ast azi printrun calculator performant sau mai put in performant, atunci statis-
tica devine foarte atractiv a. De aceea au fost elaborate o serie de produse soft, care
prezint a ntro concept ie unitar a reprezentarea, prelucrarea si studiul datelor statis-
tice. Amintim aici c ateva astfel de produse soft: Statgraphics, Statistica, SPlus, SAS,
StatXact, SPSS, Stata, GraphPad, ViSta etc. Remarc am de asemenea c a unele produse
soft elaborate n alte scopuri dec at cel al prelucr arii datelor statistice, cont in proceduri
privind prelucrarea mai elementar a sau mai complex a a datelor statistice.

In aceast a
categorie se ncadreaz a si produsul Matlab, care va invocat n prezenta lucrare, dar
tot n aceast a categorie putem aminti si Mathematica, Maple etc.
Capitolul 1
Introducere n Matlab
MATLAB (MATrix LABoratory) este un sistem interactiv de nivel si performant a
nalte pentru efectuarea de calcule stiint ice si tehnice, precum si de analiz a si
vizualizare a datelor si care dispune de un limbaj propriu de programare.
Prima versiune a fost realizat a n anii 70 de c atre Cleve Moler, iar versiunea
utilizat a n cele ce urmeaz a este Matlab 6.0.
Se pare c a acest produs are o larg a r asp andire din mai multe motive:
interactivitatea sistemului;
elementele de baz a sunt matricele, dup a cum spune si denumirea, ale c aror
tipuri si dimensiuni nu se declar a;
graca puternic a si foarte usor de utilizat;
posibilitatea integr arii unor proceduri proprii n limbaje de programare cum ar
Fortran, C;
arhitectura modular a, care permite ad augarea unor proceduri si funct ii proprii,
ceea ce a permis deja elaborarea unor pachete de proceduri si funct ii, numite
toolboxuri, orientate pe anumite domenii, cum ar
Statistica Statistics Toolbox;
Funct ii spline Spline Toolbox;
Analiz a wavelet Wavelet Toolbox;
Procesarea semnalelor Signal Processing Toolbox;
Procesarea imaginilor Image Processing Toolbox;
Modelare, simulare si analiza sistemelor dinamice Simulink;
1
2 Introducere n Matlab
Calcul simbolic Symbolic/Extended Symbolic Math Toolbox;
Ecuat ii cu derivate part iale PDE Toolbox;
Optimizare Optimization Toolbox.
1.1 Gestionarea unei sesiuni Matlab
1.1.1 Lansarea si nchiderea unei sesiuni Matlab
Trebuie s a remarc am de la nceput c a sistemul Matlab dispune de o puternic a baz a de
helpuri, dar care poate activat a doar dup a ce sistemul Matlab a fost lansat.
Lansarea sistemului Matlab se efectueaz a prin comenzi ce sunt specice sistemu-
lui de operare pe care este instalat. Vom considera n continuare sistemul de operare
Windows, caz n care lansarea se face prin activarea
icon-ului Matlab sau
aplicat iei Matlab din directorul n care a fost instalat sistemul Matlab.

In urma efectu arii acestei comenzi se deschide o fereastr a n care apare prompterul
specic sistemului Matlab
>>
Sistemul Matlab devine n acest fel interactiv, adic a la ecare comand a sau funct ie
tastat a si acceptat a de Matlab (editarea comenzii sau funct iei ncheinduse prin
Enter), sistemul o execut a si aseaz a pe ecran rezultatul, dac a este cazul.
Exist a posibilitatea de trecere de la modul interactiv la cel programat, prin tastarea
numelui unui sier (cu extensia .m), care cont ine un program n sistemul Matlab (suc-
cesiune de instruct iuni Matlab) si care mod se ncheie odat a cu terminarea execut arii
programului respectiv, dup a care se revenie la modul interactiv.

Incheierea unei sesiuni Matlab se poate face, e prin comenzi specice sistemului
de operare Windows, e prin tastarea uneia din comenzile
>>quit
>>exit
1.1.2 Comenzi help
Comanda help permite utilizatorilor s a aib a acces la o mare cantitate de informat ie
(n limba englez a) relativ a la ntreg sistemul Matlab.
Exist a diferite variante pentru lansarea comenzii help, anume prin:
tastarea comenzii help urmat a de domeniul (topic) n care suntem intere-
sat i, adic a
1.1. Gestionarea unei sesiuni Matlab 3
>>help topic
Remarc am faptul c a parametrul topic poate lipsi. Astfel, lansarea comenzii
>>help
are ca efect asarea pe ecran a unei liste ce cuprinde domeniile care opereaz a n
versiunea curent a Matlab
HELP topics:
matlab\general - General purpose commands.
matlab\ops - Operators and special characters.
matlab\lang - Programming language constructs.
matlab\elmat - Elementary matrices and matrix manipulation.
matlab\elfun - Elementary math functions.
matlab\specfun - Specialized math functions.
matlab\matfun - Matrix functions - numerical linear algebra.
matlab\datafun - Data analysis and Fourier transforms.
matlab\audio - Audio support.
matlab\polyfun - Interpolation and polynomials.
matlab\funfun - Function functions and ODE solvers.
matlab\sparfun - Sparse matrices.
matlab\graph2d - Two dimensional graphs.
matlab\graph3d - Three dimensional graphs.
matlab\specgraph - Specialized graphs.
matlab\graphics - Handle Graphics.
matlab\uitools - Graphical user interface tools.
matlab\strfun - Character strings.
matlab\iofun - File input/output.
matlab\timefun - Time and dates.
matlab\datatypes - Data types and structures.
matlab\verctrl - Version control.
matlab\winfun - Windows Operating System Interface Files
(DDE/ActiveX)
matlab\demos - Examples and demonstrations.
toolbox\local - Preferences.
toolbox\stats - Statistics Toolbox.
For more help on directory/topic, type "help topic".
tastarea comenzii lookfor urmat a de un cuv ant cheie (key), n care suntem
interesat i, adic a
>>lookfor key
va lista prima linie de comentariu din ecare sier cu extensia .m, care cont ine
cuv antul cheie key, precedat a de numele sierului.
4 Introducere n Matlab
tastarea comenzii helpwin urmat a de un domeniu (topic) n care suntem
interesat i, adic a
>>helpwin topic
produce deschiderea unei ferestre cu informat ii relative la domeniul precizat.
tastarea comenzii helpdesk, adic a
>>helpdesk
produce deschiderea unei ferestre prin care se permite c autarea n baza helpului
Matlab.
1.1.3 Comenzi sistem
Sistemul Matlab opereaz a cu o mult ime de comenzi pe care le nt alnim si n alte
sisteme. Enumer am o parte dintre acestea:
mkdir deschiderea unui subdirector nou n directorul curent;
cd schimarea directorului curent;
dir lista cont inutului directorului curent;
version asarea versiunii sistemului Matlab instalat;
!com iesire temporar a din sistemului Matlab instalat si execut ia comenzii
Windows precizat a prin com;
demo lansarea execut iei de programe demonstrative.

Inainte de nceperea unei sesiuni este de dorit s a se creeze un director prin co-
manda mkdir, pentru salvarea sierelor, iar apoi trecerea n acest director prin co-
manda cd.
1.2 Constante. Variabile. Expresii aritmetice
Av and n vedere c a sistemul Matlab opereaz a numai cu un singur tip de obiect, ma-
trice numeric a, care ar putea avea elemente numere complexe, rezult a c a orice scalar
este considerat ca o matrice cu o linie si o coloan a.

In plus, reprezentarea intern a
a elementelor matricelor si operat iile cu acestea se fac n dubl a precizie. Deoarece
reprezentarea intern a este prestabilit a, avem doar posibilitatea de precizare a tipului
(formatului) de asare (iesire) respectiv de intrare a datelor.
1.2. Constante. Variabile. Expresii aritmetice 5
1.2.1 Constante
Introducerea constantelor se poate face:
de la tastatur a;
prin generarea cu ajutorul unor instruct iuni Matlab;
dintrun sier creat cu ajutorul unui editor.
La intrare constantele numerice pot de tipul:
ntreg: 2002, -2002;
real: 3.14159, 0.314e1, -.314e+01, 31.4e-1, 31.4e-01;
complex: a+bi, unde a si b sunt dou a constante ntregi sau reale, iar i
reprezint a unitatea imaginar a (i =

1).
1.2.2 Instructiunea format
Sistemul Matlab dispune de c ateva sabloane (format ari) standard pentru asarea (ex-
tragera) datelor numerice. Instruct iunea format prin care se precizeaz a formatul
standard are sintaxa
>>format tip
unde tip poate lua una din valorile short, long, short e, long e, short g,
long g, hex, +, bank, rat, loose, compact.
Formatele short si long aseaz a pe ecran datele numerice n virgul a x a,
respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus, dac a
sunt negative).
Formatele short e si long e aseaz a pe ecran datele numerice n virgul a
otant a, respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul mi-
nus, dac a sunt negative).
Formatele short g si long g aseaz a pe ecran datele numerice cu cea mai
potrivit a reprezentare, virgul a x a sau virgul a otant a, respectiv cu 5 cifre zecimale
si 15 cifre zecimale (precedate de semnul minus, dac a sunt negative).
Formatele rat, bank, hex si + aseaz a pe ecran respectiv datele numerice sub
form a de fract ie ordinar a, sub form a bancar a (cu dou a zecimale), sub form a hexaze-
cimal a, iar n ultimul caz, prin + dac a num arul este pozitiv, respectiv -, dac a num arul
este negativ si spatiu dac a este zero.
Formatele loose si compact permite asare datelor la dou a r anduri (format
implicit), respectiv la un r and n cazul al doilea.
Pentru a aa la un moment dat, care format este n funct ie se poate apela la
comanda
>>get(0,Format)
6 Introducere n Matlab
1.2.3 Constante speciale
Sistemul Matlab are c ateva constante speciale, care au denumiri specice (identica-
tori specici):
inf rezultatul mp art irii la 0;
NaN (Not a Number) rezultatul operat iei de tipul 0/0;
realmax cel mai mare num ar real pozitiv reprezentat pe dublu cuv ant
(1.7977e+308);
realmin cel mai mic num ar real pozitiv reprezentat pe dublu cuv ant
(2.2251e-308);
pi =3.14159... (valoarea reprezentat a pe dublu cuv ant);
eps epsilonul masinii (eps=2.2204e-16=2
54
);
date data curent a;
clock timpul curent;
calendar calendarul lunii curente;
i, j unitatea imaginar a (i,j=

1 );
zeros(n) si zeros(m,n) genereaz a matricea p atratic a de ordin n, res-
pectiv matricea cu m linii si n coloane, av and toate elementele nule;
ones(n) si ones(m,n) genereaz a matricea p atratic a de ordin n, respectiv
matricea cu m linii si n coloane, av and toate elementele 1;
eye(n) si eye(m,n) genereaz a matricea p atratic a de ordin n, respectiv
matricea cu m linii si n coloane, av and pe diagonala principal a 1 si 0 n rest
(c and matricea este p atratic a avem matricea unitate);
magic(n) genereaz a matrice magic a p atratic a de ordin n.
Pentru introducerea elementelor unei matrice, linie cu linie, elemente ce pot ex-
primate si prin expresii aritmetice, acestea sunt incluse ntre paranteze drepte. Ele-
mentele ec arei linii sunt separate prin spat iu sau virgul a, iar liniile sunt separate
prin punctvirgul a (;) sau prin trecerea la r andul urm ator.
Astfel matricea
_
3 5 2
9 1 4
_
se poate introduce de la tastatur a prin
1.2. Constante. Variabile. Expresii aritmetice 7
>>[3 5 2;9 1 4]
sau
>>[3,5,2;9,1,4]
Dac a elementele matricei prezint a regularitatea, c a elementele unei linii sunt date
printro progresie aritmetic a, atunci avem o introducere prescurtat a. De exemplu,
introducerea matricei
_
3 5 7 9
9 6 3 0
_
se poate face de la tastatur a prin
>>[3:2:9;9:-3:0]
1.2.4 Variabile
Variabilele sunt matrice ce sunt utilizate ntrun program Matlab sau n mod interac-
tiv si ale c aror valori pot modicate. Numele lor ind precizate prin identicatori,
care sunt dat i de orice combinat ie de litere, cifre zecimale si liniut a de subliniere, din
care primul caracter este liter a: Matrice1, mat, Cluj Napoca.
Apelarea si vizualizarea unui element al unei variabile (matrice) se face prin
specicarea numelui variabilei urmat de lista indicilor corespunz atori, separat i prin
virgul a, nchis a ntre paranteze. De exemplu, A(i,j ) pune n evident a elementul
din linia i si coloana j al matricei A.
Facem observat ia c a matricele n sistemul Matlab nu accept a dec at indici strict
pozitivi.
Utiliz and operatorul dou a puncte (:) se pot obt ine submatrice ale unei matrice.
De exemplu, A(1:3,4:5) extrage submatricea format a din primele trei linii si
coloanele 4 si 5 ale matricei A, iar A(:,4) si A(1,:) extrag respectiv coloana a
patra a matricei A si prima linie a matricei A. O form a mai general a de obt inere a unei
submatrice se realizeaz a prin apelul de forma A([l],[c]), unde l si c reprezint a
liste de indici de linie si indici de coloane, separat i prin virgul a sau spat iu. Astfel va
obt inut a submatricea format a din liniile si coloanele precizate prin l, respectiv c ale
matricei A. Dac a se introduce comanda A(:), atunci matricea A este transformat a
ntrun vector coloan a, ce cont ine coloanele matricei.
Alte combinat ii ale acestor tipuri de specicare ale elementelor unei matrice pot
considerate.
Mai remarc am aici comanda
>>reshape(A,m,n)
care transform a matricea A ntro matrice cu m linii si n coloane. Dac a A nu are mn
elemente, atunci apare eroare la executare.
8 Introducere n Matlab
1.2.5 Operatori aritmetici
Expresiile aritmetice se construiesc dup a cunoscutele reguli ale limbajelor de pro-
gramare evoluate, folosind operatorii aritmetici cunoscut i, desigur cu unele operat ii
speciale specice sistemului Matlab.
Ordinea execut iilor operat iilor aritmetice este de asemenea cea cunoscut a si pe
care o reamintim aici, ncep and cu cel mai nalt nivel :
prima dat a sunt executate operat iile aritmetice dintre paranteze;
urmeaz a ridicarea la putere, iar dac a sunt mai multe operat ii consecutive de
acest tip, atunci ordinea execut iei este de la dreapta la st anga;
urm atorul nivel de prioritate include operat iile de nmult ire si mp art ire, iar
dac a sunt mai multe operat ii consecutive de acest tip, atunci ordinea execut iei
este de la st anga la dreapta;
ultimul nivel de prioritate cont ine operat iile de adunare si sc adere, iar dac a sunt
mai multe operat ii consecutive de acest tip, atunci ordinea execut iei este de la
st anga la dreapta.
Operatorii aritmetici matriceali de care dispune sistemul de baz a Matlab sunt:
A+B, A-B sau plus(A,B), minus(A,B) adun a, respectiv face dife-
rent a matricelor A si B de aceleasi dimensiuni, iar dac a unul dintre operanzi e
un scalar, acesta este extins la matricea constant a dat a prin scalarul respectiv,
av and dimensiunile celeilalte matrice, dup a care se efectueaz a operat ia;
A
*
B sau mtimes(A,B) nmult este matricele A si B, pentru care num arul
coloanelor matricei A este acelasi cu num arul liniilor matricei B, iar dac a una
din matrice e un scalar, acesta va nmult i toate elementele celeilalte matrice;
AB sau mpower(A,B) dac a B este un scalar p ntreg pozitiv, atunci se ob-
t ine puterea p a matricei p atratice A, iar dac a A este un scalar , atunci se ridic a
scalarul la puterea B, matricea B ind p atratic a, adic a, pentru exemplicare,
dac a = e, atunci e
B
=

n=0
B
n
n!
;
AB, AB, A\B, A/B, sau formele echivalente, respectiv times(A,B),
power(A,B), ldivide(A,B), rdivide(A,B) efectueaz a operat iile
de nmult ire, de ridicare la putere, mp art ire invers a, mp art ire direct a, toate de
tipul element cu element (ca la operat iile de adunare si sc adere), pentru ma-
tricele de aceleasi dimensiuni, iar dac a una dintre matrice e un scalar, aceasta
este extins a la matricea constant a dat a prin scalarul respectiv, av and dimensiu-
nile celeilalte matrice, dup a care este efectuat a operat ia;
1.2. Constante. Variabile. Expresii aritmetice 9
A\B sau mldivide(A,B) are ca rezultat matricea ce reprezint a solut ia
ecuat iei matriceale A
*
X=B, c and matricea p atratic a A este inversabil a, iar dac a
B este un vector coloan a se obt ine solut ia sistemului liniar corespunz ator;
A/B sau mrdivide(A,B) are ca rezultat matricea ce reprezint a solut ia
ecuat iei matriceale X
*
B=A, c and matricea p atratic a B este inversabil a;
[A B], [A;B] (concatenarea) produce concatenarea matricelor A si B pe
orizontal a, respectiv pe vertical a, cu condit ia ca la concatenarea pe orizontal a
trebuie ca num arul liniilor celor dou a matrice s a e acelasi, iar la concatenarea
pe vertical a se impune ca num arul coloanelor celor dou a matrice s a e acelasi.
1.2.6 Functii predenite
Sistemul Matlab dispune de numeroase funct ii matematice. Remarc am faptul c a toate
acestea, av and n vedere c a matricele sunt obiectele de baz a n Matlab, act ioneaz a
asupra matricelor.

Incerc am o clasicare a acestora:


abs (modul), sqrt (radical), sign (semn), conj (conjugat), angle (argu-
ment al num arului complex), imag (parte imaginar a), real (parte real a);
sin (sinus), cos (cosinus), tan (tangent a), cot (cotangent a), csc (cose-
cant a), sec (secant a);
asin (arcsinus), acos (arccosinus), atan (arctangent a), acot (arccotan-
gent a), acsc (arccosecant a), asec (arcsecant a), sinh (sinus hiperbolic),
cosh(cosinus hiperbolic), tanh(tangent a hiperbolic a), coth (cotangent a hi-
perbolic a), csch (cosecant a hiperbolic a), sech (secant a hiperbolic a), asinh
(arcsinus hiperbolic), acosh (arccosinus hiperbolic), atanh (arctangent a hi-
perbolic a), acoth (arccotangent a hiperbolic a), acsch (arccosecant a hiper-
bolic a), asech (arcsecant a hiperbolic a);
exp (exponent ial a), log (logaritm natural), log10 (logaritm zecimal), log2
(logaritm n baza doi);
round (rotunjire la cel mai apropiat ntreg), floor (rotunjire spre ), fix
(rotunjire spre zero), ceil (rotunjire spre +).
Facem observat ia c a pentru funct iile trigonometrice se impune ca argumentele s a e
date n radiani.
Dac a argumentul funct iilor predenite este matrice, atunci funct ia se aplic a
ec arui element al matricei.
10 Introducere n Matlab
atan2(A,B) (are acelasi efect cu atan(A.\B)), rem(A,B) (restul m-
p art irii lui A la B).
Dac a A si B sunt matrice, atunci trebuie s a e de aceeasi dimensiune, iar funct ia se
aplic a element cu element.
size(A) (dimensiunea matricei A), length(A) (lungimea vectorului A),
ndims(A) (num arul dimensiunilor matricei A), disp(A) (aseaz a ele-
mentele matricei A f ar a numele matricei), det(A) (determinantul matricei
p atratice A), inv(A) (inversa matricei p atratice A), rank(A) (rangul ma-
tricei A), A sau transpose(A) (transpusa matricei A, dac a matricea este
cu elemente numere reale, dac a are elemente numere complexe, atunci se
efectueaz a matricea transpus a a conjugatelor elementelor), A (transpusa ma-
tricei A), diag(A) (diagonala matricei p atratice A, iar dac a A este vector, ge-
nereaz a matricea p atratic a diagonal a cu elementele diagonalei date de vector),
trace(A) (urma matricei p atratice A, adic a

i
a
ii
).
Trebuie s a remarc am c a dac a A este un vector linie, atunci A

este un vector coloan a


si invers, dac a A este un vector coloan a, atunci A

este un vector linie.


factorial(n) (factorialul lui n), perms(1:n) sau perms(v) (gene-
reaz a toate pemut arile primelor n numere naturale, respectiv genereaz a toate
permut arile componentelor vectorului v), nchoosek(n,k) sau varianta
nchoosek(v,k)(calculeaz a num arul combin arilor de n elemente luate c ate
k, respectiv genereaz a toate combin arile elementelor vectorului v luate c ate k),
combnk(v,k) (genereaz a toate combin arile elementelor vectorului v luate
c ate k), factor(n)(factorii primi ai lui n repetat i de at atea ori c at reprezint a
puterea acestora), primes(n) (numerele prime mai mici dec at n), gcd (cm-
mdc), lcm (cmmmc).
1.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru
Sistemul Matlab se poate lansa din orice director, acesta devenind directorul curent.
Desigur este de dorit ca utilizatorul s a lucreze ntrun director propriu. Asa cum am
v azut, un astfel de director poate creat p an a nu se intr a n sistemul Matlab, ca apoi
acesta s a e lansat din acest director sau se poate lansa la nceput sistemul Matlab,
iar apoi prin comenzile cd si mkdir s a se ajung a ntrun director al utilizatorului
sau s a se creeze un director propriu nou.
Toate operat iile sunt executate n directorul curent.
Dac a se doresc informat ii relative la variabilele existente la un moment dat n
directorul curent se pot lansa una din comenzile:
1.2. Constante. Variabile. Expresii aritmetice 11
who produce lista variabilelor curente;
whos produce lista variabilelor curente, mpreun a cu informat ii privind
aceste variabile (dimensiune, num ar de elemente, memorie ocupat a, tipul);
clear sterge variabilele si funct iile temporare din directorul curent (sterge-
rea unei singure variabile se realizeaz a prin comanda clear urmat a de numele
variabilei);
diary file salveaz a toate informat iile ap arute pe ecran n timpul
derul arii unei sesiuni n sierul file, cu except ia gracelor;
save salveaz a variabilele de lucru pe disc;
load ncarc a variabilele de lucru de pe disc.
Comenzile
>>save file
>>save file x y z
vor salva n fsierul file.mat toate variabilele din sesiune curent a, respectiv numai
variabilele x, y, z.
Diferent a dintre comanda diary si comanda save este c a sierul obt inut prin
diary se poate modica (edita) cu ajutorul unui editor, pe c and celalalt nu se poate
edita.
De asemenea, remarc am faptul c a n sierul creat prin comanda diary cont ine
toate informat iile p an a la nt alnirea comenzii
>>diary off
Dac a nainte de nchiderea unei sesiuni Matlab nu se execut a o comand a save, atunci
toate variabilele mpreun a cu cont inutul lor se pierd.

Intro alt a sesiune Matlab, se pot recupera variabilele din sesiunea precedent a,
dac a au fost salvate prin comanda save, prin lansarea comenzii load. Anume, dac a
sierul salvat este file.mat atunci comanda
>>load file
va nc arca varaibilele cu cont inutul lor pentru sesiunea curent a.
Comanda load poate utilizat a si pentru nc arcarea unui sier ASCII creat cu
alt editor. Astfel comanda
>>load A.dat -ascii
va avea ca efect pentru sesiunea curent a a gener arii unei variabile cu numele A si care
cont ine ca valori datele din sierul A.dat.
12 Introducere n Matlab
1.3 Instructiuni de atribuire
Sistemul Matlab dispune de trei tipuri de instruct iuni de atribuire:
expresie
variabila = expresie
[lista de variabile] = func
Expresia se compune, dup a reguli cunoscute n programare, cu ajutorul operat iilor
aritmetice si al funct iilor, prin operarea asupra constantelor si asupra variabilelor.
Dac a se consider a prima form a a instruct iunii de atribuire, atunci rezultatul este
p astrat ntro variabil a de lucru numit a ans si care r am ane nemodicat a p ana la
execut ia unei alte instruct iuni de atribuire de aceast a form a. Forma a doua face
aceast a atribuire, variabilei din partea st ang a a semnului de egalitate.
Forma a treia este specic a pentru cazul n care se apeleaz a o procedur a (funct ie
Matlab), care returneaz a mai mult de o valoare.
Exist a expresii specice sistemului Matlab, care nu au corespondent n alte lim-
baje evoluate. Dac a vrem s a atribuim unei variabile valori care sunt obt inute ca si
elemente ale unei progresii aritmetice, atunci putem folosi una din instruct iunile de
atribuire
>>vi:pas:vf
>>x = vi:pas:vf
unde vi, pas, vf sunt expresii aritmetice, care pot evaluate la momentul exe-
cut arii instruct iunii.

In urma execut arii acestor instruct iuni variabila ans respectiv x
va cont ine valorile numerice ncep and cu vi p ana la vf cu pasul pas.
Dac a valoarea lui vf este mai mic a dec at cea a lui vi si pas are valaore negativ a,
atunci rezultatul instruct iunii de atribuire este matricea vid a, av and sintaxa [].
Dac a pas=1, atunci se pot considera formele echivalente
>>vi:vf
>>x = vi:vf
Un alt tip specic de instruct iune de atribuire a sistemului Matlab este acela c and
variabila primeste valoarea unei submatrice. De exemplu, instruct iunile de atribuire
>>x = A(:,2)
>>y = A(end,1:10)
au ca efect obt inerea n x a vectorului coloan a format din coloana a doua a matricei A,
iar y va un vector linie format din primele 10 elemente ale ultimei linii a matricei A.
Orice instruct iune poate continuat a pe linia urm atoare prin trei puncte (. . . ) .
O linie poate s a cont in a mai multe instruct iuni separate prin virgul a sau prin
punct-virgul a (;).
Dac a o instruct iune este urmat a de punct-virgul a (;), atunci valoarea variabilei nu
este asat a dup a executarea instruct iunii, n caz contrar valoarea curent a a variabilei
va asat a.
1.4. Instruct iuni de citire si scriere 13
1.4 Instructiuni de citire si scriere
1.4.1 Instructiunea input
Sintaxa comenzii input este:
>>v = input(s)
Prin executarea acestei instruct iuni se aseaz a pe ecran sirul de caractere dat prin s,
astept anduse tastarea datelor ce se doresc a atribuite pentru variabila v. C and
se ncheie operat iunea de tastarea datelor, se tasteaz a Enter, drept consecint a se
efectueaz a operat ia de atribuire.
1.4.2 Instructiunea ginput
Instruct iunea ginput permite introducerea de date cu ajutorul mouse-ului dintr-o
fereastr a ce are trasate axele de coordonate.
Exist a urm atoarele forme ale instruct iunii ginput:
>>[x,y] = ginput(n)
>>[x,y] = ginput
>>[x,y,buton] = ginput(n)
Executarea unei astfel de instruct iuni produce introducerea coordonatelor unor
puncte din gura curent a, n c and se folosesc prima si ultima variant a, respectiv un
num ar nedenit, c and se foloseste varianta a doua. La nceput apare pe ecran n fe-
reastra gurii curente cursorul realizat prin dou a drepte verticale. Prin pozit ion ari
succesive, cu ajutorul mouse-ului, ale cursorului pe anumite puncte, urmate de click-
uri, coordonatele acestora sunt introduse respectiv n vectorii x si y. Pentru prima si
ultima form a trebuie efectuate astfel de operat ii succesive n num ar de n, iar pentru a
doua succesiunea de operat ii se ncheie prin tastarea comenzii Enter. Forma a treia
va returna si vectorul buton, care specic a ce buton al mouselui a fost folosit la
ecare operat ie (1, 2 sau 3, ncep and de la st anga).
1.4.3 Instructiunea fprintf
Asarea pe ecran si nu numai, folosind un format propriu, se face cu ajutorul
instruct iunii fprintf. Vom prezenta n continuare numai modul de asare pe ecran
folosind aceast a instruct iune.
Cea mai simpl a sintax a a acestei instruct iuni este
>>fprintf(f,x)
prin care valoarea variabilei x este asat a pe ecran conform formatului f.
Formatul f poate , de exemplu: %md, %md\n, %m.zf, %m.zf\n, %m.ze,
%m.ze\n, unde md, m.zf si m.ze exprim a respectiv faptul c a valoarea lui x se
aseaz a pe m pozit ii ca un ntreg, ca un real cu z cifre zecimale, ca un real normalizat
14 Introducere n Matlab
cu z cifre zecimale. Parametrul \n specic a faptul c a dup a asare se trece la r andul
urm ator (t ine locul comenzii Enter).
1.5 Operatori relationali si operatori logici
1.5.1 Operatori relationali
A==B sau eq(A,B), A=B sau ne(A,B), A<B sau lt(A,B), A>B sau
gt(A,B), A<B sau lt(A,B), A>B sau gt(A,B), A<=B sau le(A,B),
A>=B sau ge(A,B) compar a element cu element matricele de aceleasi di-
mensiuni A si B si produce o matrice ce are valorile 1 si 0, c and condit ia este
adev arat a respectiv fals a, iar dac a unul din operanzi este un scalar, acesta este
extins la matricea constant a dat a prin scalarul respectiv, av and dimensiunile
celeilalte matrice, dup a care se efectueaz a operat ia relat ional a.
1.5.2 Operatori logici
A&B sau and(A,B) (conjunct ia) compar a element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, c and
ambele elemente sunt diferite de zero, respectiv cel put in unul din cele dou a
elemente este zero;
A|B sau or(A,B) (disjunct ia) compar a element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, c and cel
put in unul din cele dou a elemente este zero, respectiv ambele elemente sunt
zero;
xor(A,B) (disjunct ia exclusiv a) compar a element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, c and unul
si numai unul din cele dou a elemente este zero, respectiv ambele elemente sunt
zero sau ambele sunt diferite de zero;
Dac a unul din operanzi este un scalar, acesta este extins la matricea constant a dat a
prin scalarul respectiv, av and dimensiunile celeilalte matrice, dup a care se efectueaz a
operat ia logic a.
A sau not(A) (negat ia) produce o matrice de aceleasi dimensiuni cu cele
ale matricei A av and valorile 1 si 0, c and elementul corespunz ator al matricei
A este zero, respectiv c and este diferit de zero.
any(A) dac a A este vector, returnez a valoarea 1, dac a exist a componente ale
vectorului diferite de zero si 0n caz contrar, iar dac a A este o matrice, opereaz a
1.6. Fisiere script (mle) 15
asupra ec arei coloane a matricei si returneaz a corespunz ator un vector de 1 si
0 cu lungimea egal a cu cea a num arului coloanelor matrcei A;
all(A) dac a A este vector, returnez a valoarea 1, dac a toate componentele
vectorului sunt diferite de zero si 0 n caz contrar, iar dac a A este o matrice, o-
pereaz a asupra ec arei coloane a matricei si returneaz a corespunz ator un vector
de 1 si 0 cu lungimea egal a cu cea a num arului coloanelor matrcei A.
1.6 Fisiere script (mle)
Pentru a executa o secvent a de instruct iuni Matlab (program), f ar a intervent ia utiliza-
torului, se editeaz a un sier ASCII cu extensia .m, numit (sier script) sau mle,
care s a cont in a instruct iunile programului. Lansarea execut iei programului se face
prin tastarea numelui (f ar a extensia .m), dup a care se tasteaz a Enter. Astfel, dac a
utilizatorul sia creat un sier script cu numele exemplu.m, atunci linia de comand a
prin care se lanseaz a execut ia este
>>exemplu
Fsierul exemplu.m ar putea avea urm atorul cont inut
m = input(m (nr. natural > 0):);
A = magic(m);
d = ndims(A)
[l c] = size(A)
B = A
*
ones(m,1);
C = B

In urma lans arii execut iei acestui program, f ar a a putea interveni p an a la ncheierea
execut iei, se produc urm atoarele operat ii:
execut a instruct iunea din prima linie, prin asarea pe ecran a mesajului
m (nr. natural > 0):
si se asteap a tastarea unui num ar ntreg pozitiv, dup a care prin comanda Enter
se trece la instruct iunea din linia urm atoare;
instruct iunea din linia a doua va genera matricea magic a p atratic a A de ordin
m, care nu va asat a pe ecran deoarece instruct iunea se termin a cu simbolul
punctvirgul a;
se execut a funct ia ndim, iar rezultatul este atribuit variabilei d, care va avea
valoarea 2 si va asat pe ecran, deoarece instruct iunea nu se termin a cu
punctvirgul a, pe dou a r anduri
d =
2
16 Introducere n Matlab
urm atoarea instruct iune atribuie variabilelor l si c num arul liniilor si coloane-
lor matricei A, care n cazul de fat a coincid cu valoarea lui m, iar valorile lui l
si c vor asate pe ecran;
B va un vector coloan a cu m componente si cont ine produsul dintre matricea
A si vectorul coloan a de m componente, toate av and valoarea 1, iar dac a avem
n vedere c a A este o matrice magic a, toate componentele lui B vor egale;
ultima instruct iune ajut a la asarea pe ecran a componentelor vectorului linie
C, care este vectorul transpus al vectorului coloan a B.
Editarea unui sier script se poate face cu orice editor de text, dar sistemul Matlab
dispune de un editor propriu.
Editorul Matlab se poate lansa din fereastra de lucru Matlab prin comenzi speci-
ce sistemului Windows, aleg and din meniul File opt iunea New sau Open, dac a
se doreste crearea uni nou sier, respectiv se doreste editare unui sier deja existent.
Acelasi rezultat se obt ine prin comanda
edit file.m
n care file.m este opt ional. Dac a lipseste acest argument atunci urmeaz a crearea
(editarea) unui sier nou, iar dac a acest argument este prezent, sierul cu acest nume
urmeaz a s a e reactualizat (editat).
Editorul sistemului Matlab poate lansat din orice alt a parte prin activarea unui
sier cu extensia .m.
Editorul Matlab are capacitatea de a efectua unele veric ari sintactice, de exem-
plu corespondent a parantez a deschis a parantez a nchis a, dar este prev azut si cu un
set de comenzi (debuger) pentru depanarea programului prin evaluarea si modicarea
unor variabile si expresii, crearea si stergerea unor puncte de ntrerupere etc.
Comenzile specice sistemului de depanare Matlab sunt:
dbstop crearea unui punct de ntrerupere (breakpoint);
dbclear stergerea unui punct de ntrerupere;
dbstatus listeaz a punctele de ntrerupere;
dbstack listeaz a stiva apelurilor;
dbcont reluarea execut iei programului;
dbstep execut ia uneia sau mai multe instruct iuni;
dbtype genereaz a lista sierelor cu extensia .m, mpreun a cu num arul lini-
ilor acestora;
1.7. Grac a bidimensional a 17
dbup schimb a spat iul de lucru curent, cu cel al unui sier cu extensia .m,
care a fost apelat;
dbdown efectueaz a operat ia invers a comenzii dbup;
dbmex execu a depanarea unui sier cu extensia .mex (creat cu unul din
limbajele Fortran si C);
dbquit ncheierea depan arii.
1.6.1 Comenzi pentru gestionarea sierelor
type file listeaz a cont inutul sierului file din directorul curent;
delete file sterge sierului file din directorul curent;
what listeaz a sierele cu extensiile .m din directorul curent;
which numef listeaz a calea directorului n care se a a funct ia numef;
Comanda
>>what director
extrage lista sierelor directorului specicat ...\toolbox\matlab\director
Lista acestor directoare poat vizualizat a prin comanda help f ar a nici un parametru.
1.7 Grac a bidimensional a
Sistemul Matlab dispune de o larg a gam a de instruct iuni sau proceduri (funct ii) pen-
tru reprezentarea grac a a datelor, care permit o apelare simpl a si ecient a.
1.7.1 Instructiunea plot
Formele acceptate de sistemul Matlab pentru instruct iunea plot, privind reprezen-
tarea grac a n plan sunt
plot(y)
plot(x,y)
plot(x1,y1,x2,y2,...)
plot(y,s)
plot(x,y,s)
plot(y1,s1,y2,s2,...)
plot(x1,y1,s1,x2,y2,s2,...)

In cazul primei forme, dac a y este un vector de lungime m, se reprezint a grac


linia poligonal a ce trece prin punctele de coordonate (i, y
i
), i = 1, m.
18 Introducere n Matlab
Programul 1.7.1. S a consider am programul, care reprezint a grac linia poligonal a
ce uneste punctele de coordonate (i, y
i
), i = 1, m, unde y reprezint a elementele dia-
gonalei unei matrice magice de ordin m:
m = input(m:);
y = diag(magic(m));
plot(y)

In urma execut iei programului, pentru m=10, se obt ine gracul din Figura 1.1.
1 2 3 4 5 6 7 8 9 10
0
10
20
30
40
50
60
70
80
90
100
Figura 1.1: Linie poligonal a
Dac a y este o matrice de tipul (m,n), atunci se reprezint a grac n linii poligo-
nale, corespunz and celor n coloane ale matricei y, anume (i, y
ij
)
m
i=1
, j = 1, n.
Programul 1.7.2. S a consider am programul, care reprezint a grac liniile poligonale
ce unesc respectiv punctele de coordonate (i, y
ij
)
m
i=1
, pentru ecare j = 1, n, unde y
este o matrice magic a de ordin m, iar n este un num ar ntreg pozitiv cel mult m:
m = input(m:);
n = input(n (n<=m):);
y = magic(m);
plot(y(:,1:n))

In urma execut iei programului, pentru m=10 si n=2, se obt ine gracul din Figura 1.2.
Dac a y este de tip complex, atunci prima form a este echivalent a cu a doua form a
a instruct iunii plot, adic a cu
plot(real(y),imag(y))
1.7. Grac a bidimensional a 19
1 2 3 4 5 6 7 8 9 10
0
10
20
30
40
50
60
70
80
90
100
Figura 1.2: Linii poligonale
Programul 1.7.3. S a consider am programul, care reprezint a grac funct ia cu valori
complexe z = xcos (2 x) +ix
2
sin (2 x) , x [0, 1] .
m = input(m:);
h =1/m; x = 0:h:1;
z = x.
*
cos(2
*
pi
*
x)+i
*
x.2.
*
sin(2
*
pi
*
x);
plot(z)

In urma execut iei programului, pentru m=100, se obt ine gracul din Figura 1.3.
Remarc am faptul c a pentru toate celelalte forme, dac a avem parametri complecsi,
partea imaginar a este ignorat a.
Dac a se utilizeaz a a doua form a, iar x si y sunt vectori de aceasi lungime m, atunci
se reprezint a grac linia poligonal a ce trece prin punctele de coordonate (x
i
, y
i
),
i = 1, m.
Programul 1.7.4. Fie programul care reprezint a grac funct ia sin (2x) pe intervalul
[0, 1]:
m = input(m:);
h = 1/m; x = 0:h:1;
plot(x,sin(2
*
pi
*
x))
Execut ia programului, pentru m=200, genereaz a gracul din Figura 1.4.

In cazul n care x si y sunt matrice av and acelasi tip (m,n), se reprezint a grac
n linii poligonale, corespunz and celor n coloane ale matricelor, adic a (x
ij
, y
ij
)
m
i=1
,
pentru ecare j = 1, n. Dac a x este un vector de lungime m, iar y este un vector de
lungime m sau matrice de tipul (m,n), se reprezint a grac liniile poligonale ce trec
20 Introducere n Matlab
2 1.5 1 0.5 0 0.5 1 1.5 2
4
3
2
1
0
1
2
Figura 1.3: z = xcos (2 x) +ix
2
sin (2 x)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
1
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
1
Figura 1.4: y = sin (2x)
1.7. Grac a bidimensional a 21
prin punctele de coordonate (x
i
, y
i
)
m
i=1
, respectiv n linii poligonale ce trec respectiv
prin punctele date prin (x
i
, y
ij
)
m
i=1
, pentru ecare j = 1, n.
Forma a treia a instruct iunii plot implic a reprezentarea grac a pe aceeasi gur a,
conform formei precedente, a grupelor de date (x1,y1), (x2,y2) s.a.m.d.
Programul 1.7.5. Vom prezenta dou a variante de programe, care reprezint a pe
aceeasi gur a gracele funct iilor sin (2x) si cos (2x) pe intervalul [0, 1]:
m = input(m:);
h = 1/m; x = 0:h:1;
y = 2
*
pi
*
x;
plot(x,sin(y),x,cos(y))
respectiv
m = input(m:);
h = 1/m; x = 0:h:1;
y = 2
*
pi
*
x;
y = [sin(y) cos(y)]; x=[x x];
plot(x,y)
Execut and una din cele dou a variante, cu m=200, se genereaz a gracul din Figu-
ra 1.5.
Remarc am faptul c a prima variant a ar potrivit a dac a cele dou a funct ii se
reprezint a grac pe acelasi domeniu, iar a doua variant a c and cele dou a funct ii sunt
reprezentate grac pe domenii diferite.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
1
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
1
Figura 1.5: y
1
= sin (2x), y
2
= cos (2x)
Pentru o reprezentare neted a este de dorit ca num arul punctelor ce genereaz a
liniile poligonale s a e sucient de mare.
22 Introducere n Matlab
Pe de alt a parte, observ am c a prin primele trei tipuri de instruct iune plot nu
se specic a nici o caracteristic a a liniilor reprezentate grac. Sistemul Matlab face o
alegere implicit a a acestor caracteristici.
Ultimele patru forme ale instruct iunii plot permit utilizatorului specicarea
unor caracteristici ale liniilor reprezentate grac cu ajutorul parametrului s.
Parametrul de tipul s este un sir de cel mult trei caractere, prin care se precizeaz a
culoarea, tipul de marcaj al punctelor si tipul de linie.
Culoarea este specicat a cu unul din simbolurile urm atoare: y galben (yellow),
m violet (magenta), c ciclamen (cyan), r rosu (red), g verde (green), b
albastru (blue), w alb (white), k negru (black).
Tipul de marcaj este dat prin unul din simbolurile: punct (point), o cerculet
(circle), x cruciulit a diagonal a (xmark), + cruciulit a (plus), stelut a (star), s
p atr at el (square), d romb (diamond), v triunghi cu v arf n jos (triangle down),
triunghi cu v arf n sus (triangle up), < triunghi cu v arf spre st anga (triangle
left), > triunghi cu v arf spre dreapta (triangle right), p stelut a n cinci colt uri
(pentagram), h stelut a n sase colt uri (hexagram).
Urm atoarele patru tipuri de linie sunt disponibile: continu a (solid) (-), punctat a
(dotted) (:), ntrerupt a (dashed) (--), linie-punct (dashdot) (-.).
De exemplu, dac a s=c:, gracul este trasat cu linie punctat a ciclamen, iar
dac a s=bd punctele sunt marcate prin semnul romb de culoare albastr a, dar nu
sunt unite ntre ele.
Programul 1.7.6. Vom reprezenta grac funct iile sin (2x) si cos (2x) pe inter-
valul [0, 1], prima funct ie prin linie continu a, iar a doua prin linie ntrerup a, iar
punctele de pe cele dou a curbe, care au abscisele multipli de
1
6
, s a e marcate prin
cerculet e, respectiv prin stelut e.
m = input(m:);
h = 1/m; x = 0:h:1; y = 2
*
pi
*
x;
y = [sin(y) cos(y)];
h = 1/m; p = 0:1/6:1; pp = 2
*
pi
*
p;
plot(x,y,p,sin(pp),o,p,cos(pp),
*
)
Pentru m=200, gracul este cel din Figura 1.6.
1.7.2 Comenzi si instructiuni de gestionare a gracelor
Sistemul Matlab dispune de comenzi si instruct iuni prin care sunt gestionate si spe-
cicate anumite caracteristici ale gracelor produse privind titlul, etichetarea axelor,
inserarea unor texte, marcarea unor ret ele, delimitarea gracului etc:
hold on p astreaz a gracul curent, un nou grac va supraimprimat;
hold off gracul curent este abandonat, f ar a a sters;
1.7. Grac a bidimensional a 23
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
1
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
1
Figura 1.6: y
1
= sin (2x) si y
2
= cos (2x)
hold trece la modul off, dac a sistemul se aa n modul on, respectiv la
modul on, c and sistemul se a a n modul off;
clf sterge gracul curent;
cla sterge gracul curent, p astr and axele;
figure(n) activeaz a fereastra cu gracul n anterior obt inut;
axis([xmin xmax ymin ymax]) xeaz a limitele pentru axele absci-
selor si ordonatelor pentru gura curent a;
v = axis ntoarce un vector linie ce cont ine cele patru limite pentru axele
de coordonate, care pot si -Inf, Inf;
axis auto consider a forma implicit a a limitelor axelor de coordonate;
axis manual p astreaz a limitele curente, astfel dac a este utilizat a instruc-
t iunea hold, gurile urm atoare vor avea aceleasi limite pentru axele de coor-
donate;
axis tight atribuie pentru limitele axelor cele mai apropiate valori ce
rezult a din datele ce se reprezint a grac;
axis ij congureaz a axele n modul matrix, adic a originea axelor de
coordonate este colt ul din st anga sus, axa i ind vertical a si marcat a de sus n
jos, iar axa j este orizontal a si este marcat a de la st anga la dreapta;
24 Introducere n Matlab
axis xy congureaz a axele n modul cartezian, mod implicit;
axis equal unit at ile de m asur a pe cele dou a axe au aceeasi m arime;
axis image la fel cu axis equal, cu except ia c a gura este restr ans a
la domeniul datelor;
axis square pune unit at ile de m asura pe cele dou a axe de coordoante
astfel nc at gura s a e prezentat a ntrun p atrat;
axis normal rearanjeaz a axele n forma implicit a;
axis off elimin a axele de coordoante;
axis on insereaz a axele de coordoante;
title(text) aseaz a textul specicat n partea de sus a gracului;
legend(str1,str2,...) aseaz a legenda prin care se efectuea-
z a corespondent a dintre ecare tip de curb a a gracului si textele specicate
prin str1, str2 etc.;
legend(str1,str2,...,p) aseaz a legenda de tipul precizat
n pozit iile respectiv nafara axelor (p=-1), n interiorul axelor, dar pe c at e
posibil s a nu acopere gurile trasate (p=0), n partea dreapt a sus (p=1), care
este pozit ia implicit a, n partea st ang a sus (p=2), n partea st ang a jos (p=3), n
partea dreapt a jos (p=4);
legend off elimin a legenda;
xlabel(text) eticheteaz a axa abscielor cu textul precizat;
ylabel(text) eticheteaz a axa ordonatelor cu textul precizat;
text(x,y,text) insereaz a textul precizat prin text, n punctul de
coordonate (x,y), iar dac a x si y sunt vectori (de aceeasi lungime), atunci
insereaz a textul respectiv n toate punctele de coordoante (x
i
, y
i
), i = 1, 2, . . .,
pe c and dac a textul este dat printr-o matrice cu acelasi num ar de linii cu cel al
lungimilor vectorilor x si y, atunci textul din linia i este inserat n punctul de
coordonate (x
i
, y
i
), i = 1, 2, . . .
gtext(text) aseaz a gracul, mpreun a cu cursorul plus, unde urmea-
z a s a e inserat textul, cursorul put and pozit ionat cu ajutorul mouse-ului sau
tastele cu s aget i, dup a care prin ap asarea oric arei taste (mouse sau keyboard),
se obt ine inserarea textului;
1.7. Grac a bidimensional a 25
grid adaug a pe grac o ret ea rectangular a;
grid off grac f ar a ret ea rectangular a;
zoom permite m arirea unei p art i a gurii pentru urm arirea anumitor detalii.
Se xeaz a cursorul mouse-ului pe pozit ia n care suntem interesat i a m arit a. Prin
dubluclick pe butonul din st anga se produce o m arire a zonei de dou a ori, iar prin
dubluclick pe butonul din dreapta se produce o micsorare a zonei de dou a ori. Dac a
se p astreaz a ap asat butonul din dreapta si se deplaseaz a cursorul, se obt ine un drep-
tunghi, care prin eliberarea butonului mouseului, va umple ntreaga gur a.
Prin instruct iunile
zoom off
zoom out
se dezactiveaz a instruct iunea zoom, respectiv se revine la dimensiunile init iale ale
gurii.
Comenzile de tip axis se impun a inserate dup a instruct iunea plot.
Ment ion am c a textele introduse pe grac admit sintaxa sistemului L
A
T
E
X simpli-
cat.
Programul 1.7.7. Vom considera un exemplu de reprezentare grac a prin mascarea
unor p art i a gracului. S a reprezent am grac cu linie continu a pe intervalul [0,6]
funct ia care coincide cu sin (x), c and valorile acestei funct ii sunt pozitive, iar n rest
s a e zero. Pe aceasi gur a, s a reprezent am prin linie ntrerup a si sin (x).
m = input(m:);
h = 1/m; x = 0:h:6;
y = sin(pi
*
x); Y=ge(y,0).
*
y;
plot(x,y,k--,x,Y,k-)
Pentru m=200, gracul este cel din Figura 1.7.
1.7.3 Instructiunile polar si ezpolar
Instruct iunea polar este analog a cu instruct iunea plot, numai c a este considerat a
reprezentarea curbei n coordoante polare, iar instruct iunea ezpolar are sintaxa
ezpolar(f,[a,b])
si are ca efect reprezentarea grac a a funct iei n coordonate polare, dat a prin expre-
sia algebric a f, pe intervalul [a,b]. Al doilea parametru este opt ional. Valoarea
implicit a este [0,2].
De exemplu, comanda
ezpolar(1+cos(theta))
va produce gracul din Figura 1.8. Mai remarc am faptul c a parametrul f poate
numele unei funct ii Matlab predenite sau a utilizatorului.
26 Introducere n Matlab
0 1 2 3 4 5 6
1
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
1
Figura 1.7: y = sin(x)
0.5
1
1.5
2
30
210
60
240
90
270
120
300
150
330
180 0
r = 1+cos()
Figura 1.8: r = 1 + cos () , [0, 2]
1.7. Grac a bidimensional a 27
Programul 1.7.8. Urm atorul program
clf; t=0:0.01:pi;
r=sin(3
*
t).
*
exp(-0.3
*
t);
polar(t,r,k-), grid
are ca efect gracul din Figura 1.9.
0.2
0.4
0.6
0.8
1
30
210
60
240
90
270
120
300
150
330
180 0
Figura 1.9: r = sin (3t) e
0.3t
Instructiunea colormap
Sistemul Matlab dispune de un set de gestiune a culorilor n reprezent arile grace.
Intruct iunea colormappermite denirea unui set propriu pentru gestiunea culorilor.
Lansarea unei instruct iunii se face prin comanda
colormap(map)
colormap(default)
A doua comand a seteaz a setul de culori la forma standard (implicit a).
Parametrul map este o matrice cu trei coloane, ecare linie cont in and elemente
numere din intervalul [0,1], prin care se deneste c ate o culoare. Modul de denire
a culorii, dup a aceast a regul a, se numeste RGB (Red-Green-Blue), si specic a n
cadrul culorii, respectiv intensit at ile culorilor rosu, verde si albastru.
Sistemul Matlab dispune de asemenea de unele seturi de culori, care pot selec-
tate si specicate de utilizator. O parte din acestea sunt obt inute prin:
28 Introducere n Matlab
colormap spring
genereaz a nuant e de culori ntre violet (magenta) si galben;
colormap summer
genereaz a nuant e de culori ntre verde si galben;
colormap autumn
genereaz a nuant e de culori ntre rosu, trec and prin portocaliu spre galben;
colormap winter
genereaz a nuant e de culori ntre albastru si verde;
colormap gray
genereaz a nuant e de culori gri.
1.7.4 Instructiunea stairs
Sistemul Matlab dispune de procedura stairs pentru reprezentarea grac a a
funct iilor n scar a si care accept a formele instruct iunii plot.
Instruct iunea de forma
stairs(y)
reprezint a grac funct ia n scar a cu valorile precizate prin vectorul y de lungime m,
iar abscisele sunt considerate numerele de la 1 la m. Dac a y este o matrice de tipul
(m,n) vor reprezentate grac n funct ii n scar a, c ate una pentru ecare coloan a a
matricei y.
Dac a se consider a instruct iunea de forma
stairs(x,y)
se va reprezenta grac funct ia n scar a cu valorile precizate prin vectorul y si cu
abscisele corespunz atoare date prin vectorul x (componentele lui x trebuie s a e
cresc atoare).
Dac a y si x sunt matrice de acelasi tip (m,n), atunci se vor reprezenta grac n
funct ii n scar a, c ate una pentru ecare din coloanele celor dou a matrice (elementele
coloanelor matricei x trebuie s a e cresc atoare). Dac a matricea x este un vector
coloan a cu m componente cresc atoare, atunci funct iile n scar a corespunz atoare celor
n coloane ale matricei y se consider a c a au aceleasi abscise precizate prin vectorul x.
Instruct iunea de tipul
stairs(x,y,s)
permite prezentarea tipului liniei cu care se traseaz a gracul cu ajutorul parametrului
s si care are sintaxa cea precizat a la instruct iunea plot.
Prin urmare, putem spune c a toate variantele folosite n cadrul instruct iunii plot
au corespondente pentru instruct iunea stairs.
1.7. Grac a bidimensional a 29
Programul 1.7.9. Fie funct ia lui Haar, numit a n analiza wavelet funct ie wavelet
mam a
(x) =
_

_
1, dac a 0 x <
1
2
,
1, dac a
1
2
x < 1,
0, n rest.
Folosind funct ia se deneste familia de funct ii wavelet

j,k
(x) = 2
j
2

_
2
j
k
_
unde j si k se numesc indice de dilatare, respectiv indice de translatare. Dac a se are
n vedere formula de denit ie pentru funct ia , putem scrie

j,k
(x) =
_

_
2
j
2
, dac a
1
2
j
k x <
1
2
j
k +
1
2
j+1
,
2
j
2
, dac a
1
2
j
k +
1
2
j+1
x <
1
2
j
k +
1
2
j
,
0, n rest.
Vom scrie un program care s a reprezinte grac funct ia f denit a segementar cu aju-
torul funct iilor
j,k
, k = r, s, unde j, r si s sunt xat i (r < s).
Funct ia f este o funct ie n scar a, av and punctele de discontinuitate
k
2
j+1
, pen-
tru k = 2r, 2s + 2, cu valorile corespunz atoare acestor puncte, 2
j/2
, pentru k par,
respectiv 2
j/2
, pentru k impar.
Cu aceste preciz ari, avem urm atorul program Matlab pentru reprezentarea grac a
a funct iei f:
j = input(j=);
r = input(r=);
s = input(s (>r)=);
rs = 2
*
s-2
*
r+3;
fprintf(rs=2s-2r+3=%2d\n,rs);
y = input(rs valori alternative [1, -1 ... 1]:);
y = 2(j/2)
*
y;
x = 1/2j
*
[r:1/2:s+1];
stairs(x,y)
Execut ia programului, pentru j=1, s=1, r=-2, produce gracul din Figura 1.10.
Singurul inconvenient la execut ia acestui program este legat de instruct iunea
input prin care se init ializeaz a vectorul y. C and num arul funct iilor
j,k
prin care
se deneste funct ia f este mare, atunci rs este mare si introducerea listei lui y este
anevoioas a.
30 Introducere n Matlab
1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1
1.5
1
0.5
0
0.5
1
1.5
Figura 1.10: f = (
1,2
,
1,1
,
1,0
,
1,1
,
1,2
)
O variant a a programului precedent, pentru care nu este necesar a init ializarea lui
y de la tastatur a, ar putea urm atorul program:
j = input(j=);
r = input(r=);
s = input(s (>r)=);
rs = 2
*
s-2
*
r+3;
y = (-ones(1,rs)).[2
*
r:2
*
s+2];
y = 2(j/2)
*
y;
x = 1/2j
*
[r:1/2:s+1];
stairs(x,y)
Programul 1.7.10. S a relu am reprezentarea grac a a funct iilor wavelet Haar si s a
scriem un program care s a reprezinte pe aceeasi gur a dou a secvent e de funct ii
wavelet, pentru dou a valori consecutive ale indicelui de dilatare j, iar secvent ele
alese s a acopere intervalul [1, 1]. Pentru aceasta trebuie ca r=2
j
, iar s=2
j
1.
Totodat a s a tras am gracul primei secvent e cu linie continu a si punctele s a le marc am
prin cerculet e, iar pentru a doua secvent a s a alegem linie punctat a pentru reprezenta-
rea grac a, iar punctele s a e marcate cu stelut e n cinci colt uri:
clf, hold on, axis off
plot([-1.2 1.2],[0 0],k:)
j = input(j=);
r = -2\{}j; s=-r-1;
rs = 2
*
s-2
*
r+3;
y = (-ones(1,rs)).[2
*
r:2
*
s+2];
y = 2(j/2)
*
y;
x = 1/2j
*
[r:1/2:s+1];
stairs(x,y,ko-)
1.7. Grac a bidimensional a 31
j = j+1; r = -2j; s=-r-1;
rs = 2
*
s-2
*
r+3;
y = (-ones(1,rs)).[2
*
r:2
*
s+2];
y = 2(j/2)
*
y;
x = 1/2j
*
[r:1/2:s+1];
stairs(x,y,kp--)
Execut ia programului, pentru j=0, produce gracele din Figura 1.11. Se observ a
Figura 1.11: (
0,1
,
0,0
), (
1,2
,
1,1
,
1,0
,
1,1
)
c a programul mai elimin a axele sistemului Matlab, dar adaug a axa absciselor trasat a
punctat.
1.7.5 Instructiunile bar si barh
Aceste dou a instruct iuni, dup a cum spun si denumirile, reprezint a anumite date nu-
merice cu ajutorul barelor (batoanelor) verticale si respectiv orizontale.
Forme ale acestor instruct iuni sunt:
bar(y,w,tip,color)
bar(x,y,w,tip,color)
barh(y,w,tip,color)
barh(x,y,w,tip,color)
argumentele w, tip si color sunt opt ionale, dar c and sunt specicate, trebuie
s a p astreze aceast a ordine.
Parametrul x este un vector de lungime m.
Dac a y este un vector de aceeasi lungime ca si x, atunci vor reprezentate grac
n ecare din punctele de abscise x
i
, i = 1, m, c ate o bar a de n alt imile date prin y
i
,
32 Introducere n Matlab
i = 1, m, care pot s a e si negative. Dac a parametrul x lipseste, atunci se consider a
implicit c a x are componentele ca ind primele m numere naturale.
Dac a y este o matrice de tipul (m,n), reprezent arile sunt efectuate pentru ecare
din cele n coloane ale matricei, adic a n ecare punct x
i
, i = 1, m, de pe axa absci-
selor vor reprezentate c ate n bare (batoane).
Parametrul w specic a l at imea barelor, implicit ind w = 0.8, iar pentru w > 1
barele se suprapun.
Dac a parametrul tip=grouped, care este valoarea implicit a, atunci avem
reprezent arile precizate mai sus, iar dac a tip=stacked barele (batoanele) vor
stivuite pe vertical a.
Parametrul color specic a culoarea barelor (batoanelor) si are una din urm a-
toarele valori: r (rosu), g (verde), b (albastru), y (galben), m (violet), c (ciclamen),
k (negru), w (alb).
Tot ce sa spus despre bar se poate spune si pentru barh, numai c a orientarea
barelor este pe orizontal a.
1.7.6 Instructiunea subplot
Sistemul Matlab are posibilitatea de a mp art i o fereastr a, pentru reprezentare grac a,
n mn zone (ferestre), cu ajutorul instruct iunii subplot.
Forma general a a instruct iunii este
subplot(m,n,p)
unde m, n si p sunt numere naturale, care exprim a faptul c a fereastra init ial a se
mparte n mn ferestre aranjate pe m linii si n coloane, iar reprezentarea grac a,
la momentul execut iei instruct iunii, se va face n fereastra p, numerotarea ferestrelor
f ac anduse pe linii.
Programul 1.7.11. Reprezentarea grac a poate f acut a si cu ajutorul reprezent arilor
parametrice ale curbelor.
Pentru reprezentarea grac a a unui cerc cu centrul n originea axelor de coor-
doante am putea folosi secvent a de instruct iuni:
r = input(raza=);
t = 0:0.01:2
*
pi;
x = r
*
sin(t); y=r
*
cos(t);
subplot(2,1,1), plot(x,y)
axis normal
subplot(2,1,2), plot(x,y)
axis square
Pentru r=2, gracul din partea st ang a a Figurii 1.12, se obt ine c and nu sa impus ca
unit at ile de m asur a pe cele dou a axe de coordoanate s a e aceleasi, iar gracul din
partea dreapt a sa obt inut dup a ce sa nl aturat acest neajuns cu instruct iunea axis
square.
1.7. Grac a bidimensional a 33
2 1 0 1 2
2
1.5
1
0.5
0
0.5
1
1.5
2
2 1 0 1 2
2
1.5
1
0.5
0
0.5
1
1.5
2
Figura 1.12: x = r cos t, y = r sin t, r = 2, t [0, 2]
Programul 1.7.12. Pentru exemplicarea instruct iunilor bar, barh si subplot,
facem din nou apel la o matrice magic a de ordin m si s a reprezent am n patru feres-
tre de tipul 22, prin bare verticale grupate si prin bare verticale stivuite, valorile
primelor dou a coloane ale matricei, respectiv prin bare orizontale grupate si prin bare
orizontale stivuite valorile ultimelor dou a coloane:
m=input(m:); A=magic(m);
subplot(221), bar(A(:,[1 2]),grouped)
title(Primele doua coloane - grupate)
subplot(222), bar(A(:,[1 2]),stacked)
title(Primele doua coloane - stivuite)
subplot(223), barh(A(:,[m-1 m]),grouped)
title(Ultimele doua coloane - grupate)
subplot(224), barh(A(:,[m-1 m]),stacked)
title(Ultimele doua coloane - stivuite)
colormap summer
Reprezentarea grac a, pentru m=4, este dat a n Figura 1.13.
1.7.7 Instructiunea fplot
Pentru reprezentarea grac a a unei funct ii denite cu ajutorul unei proceduri Matlab,
se pot folosi una din urm atoarele variante ale instruct iunii fplot:
fplot(numef,lim)
fplot(numef,lim,s)
fplot(numef,lim,tol)
34 Introducere n Matlab
1 2 3 4
0
5
10
15
20
Primele doua coloane grupate
1 2 3 4
0
5
10
15
20
Primele doua coloane stivuite
0 5 10 15
1
2
3
4
Ultimele doua coloane grupate
0 5 10 15 20
1
2
3
4
Ultimele doua coloane stivuite
Figura 1.13: Bare verticale si bare orizontale
fplot(numef,lim,tol,s)
fplot(numef,lim,n)
[X,Y] = fplot(numef,lim,...)

In toate cazurile se reprezint a grac funct ia numef, cu limitele pentru axa abscise-
lor specicate prin lim=[xmin xmax] sau lim=[xmin xmax ymin ymax].
Tipul liniei folosit n reprezentarea grac a este specicat prin parametrul s, ca si
n cazul instruct iunii plot, iar eroarea relativ a folosit a n reprezentarea grac a este
precizat a prin parametrul tol, care are valoarea implicit a tol=2e-3. Parametrul n
specic a faptul c a gracul se traseaz a cu ajutorul a n+1 puncte, valoarea implicit a a
lui n este n=1, iar valoarea maxim a a pasului nu dep aseste
xmaxxmin
n

Remarc am faptul c a parametrii opt ionali s, tol si n pot luat i n orice ordine.
Funct ia numef poate s a ntoarc a, pentru un vector x, un vector y de aceeasi
lungime ca si x sau o matrice cu mai multe coloane si num ar de linii ca si lungimea
lui x.

In primul caz, se va reprezenta grac o singur a curb a, iar n al doilea caz, pentru
ecare coloan a a matricei y c ate o curb a. Parametrul numef poate nlocuit si cu un
sir de caractere de tipul [f(x),g(x),...], unde f, g,... sunt nume de funct ii
Matlab, caz n care, pe aceeasi gur a, se vor reprezenta grac funct iile respective.
De exemplu, instruct iunea
fplot([sin(2
*
pi
*
x), cos(2
*
pi
*
x)],[0 1])
va reprezenta grac, pe aceeasi gur a, funct iile sin (2x) si cos (2x), pe intervalul
[0, 1].
1.7. Grac a bidimensional a 35
Ultima form a a instruct iunii fplot nu produce nici un grac, ci p astreaz a
punctele gracului n X si Y, care pot apoi folosite efectiv, prin instruct iunea
plot(X,Y), la reprezentarea grac a.
1.7.8 Instructiunea ezplot
Sintaxa instruct iunii ezplot poate :
ezplot(f)
ezplot(f,[a,b])
ezplot(f,[a,b,c,d])
ezplot(x,y)
ezplot(x,y,[a,b])
Parametrul f reprezint a o expresie algebric a de una sau dou a variabile.
Dac a f este o expresie algebric a de o singur a variabil a, atunci este reprezentat a
grac funct ia denit a de aceast a expresie, pe intervalul [a,b]. Valoarea implicit a a
acestui parametru este [-2,2].
Dac a f este o expresie algebric a de dou a variabile, atunci este reprezentat a grac
funct ia implicit a denit a prin f=0, pe domeniul [-2,2][-2,2], dac a se
foloseste prima form a de apel, pe domeniul [a,b][a,b], pentru a doua form a,
respectiv pe [a,b][c,d], pentru a treia form a. Cele dou a variabile sunt conside-
rate ca ind ordonate lexicograc.
Ultimele dou a forme sunt folosite pentru reprezent arile parametrice, x repre-
zent and abscisa, iar y ordonata. Argumentul acestor parametri variaz a n intervalul
[a,b], iar dac a acesta lipseste, atunci se consider a intervalul implicit [0,2].
De exemplu, instruct iunea
ezplot(sin(3
*
t)
*
cos(t),sin(3
*
t)
*
sin(t),[0,pi])
produce gracul din Figura 1.14. Mai remarc am faptul c a parametrii f, x si y, pot
numele unor funct ii Matlab predenite sau ale utilizatorului.
1.7.9 Instructiunea fill
Instruct iunea fill este folosit a pentru umbrirea interiorului unui poligon specicat
prin v arfurile sale:
fill(x,y,c)
unde x si y specic a v arfurile poligonului, iar c reprezint a culoarea dorit a pentru
interiorul poligonului.
Instruct iunea poate utilizat a pentru umbrirea unei p art i dintro gur a.
Programul 1.7.13. S a scriem un program care s a umbreasc a aria cuprins a ntre axa
absciselor, curba lui Gauss si dreptele perpendiculare pe axa absciselor n punctele a
si b (-3<a<b<3).
36 Introducere n Matlab
0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8
0.8
0.6
0.4
0.2
0
0.2
0.4
x
y
x = sin(3 t) cos(t), y = sin(3 t) sin(t)
Figura 1.14: x = sin(3t) cos (t), y = sin (3t) sin (t), t [0, ]
Curba lui Gauss este dat a prin funct ia
f (x) =
1

2
e

x
2
2
, x R.
a = input{a=}; b = input(b=);
xmin = -3; xmax = 3;
fplot{1/sqrt(2
*
pi)
*
exp(-x2/2),[xmin xmax]}
x = a; y = 0;
t = a:0.01:b;
x = [x,t]; y = [y,1/sqrt(2
*
pi)
*
exp(-t.2/2)];
x = [x,b]; y = [y,0];
fill(x,y,c)
Pentru a=-2 si b=1.5, se obt ine gracul din Figura 1.15.
1.8 Instructiuni de ciclare si control
Ca si n celelalte limbaje de programare evoluate, sistemul Matlab dispune de
instruct iuni, care permit repetarea unei secvent e de instruct iuni de un num ar denit
sau indenit de ori, precum si de instruct iuni, care permit iesirea din executarea
secvent ial a a instruct iunilor unui program.
1.8. Instruct iuni de ciclare si control 37
3 2 1 0 1 2 3
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Figura 1.15: Curba lui Gauss
1.8.1 Instructiunea if
Trei forme de baz a ale instruct iunii if sunt:
if exp
secv
end
%%%%%%%%%%%%%%
if exp
secv
else
secv1
end
%%%%%%%%%%%%%%
if exp
secv
elseif exp1
secv1
else
secv2
end
unde exp si exp1 sunt expresii logice ce pot evaluate n acest punct, iar secv,
secv1 si secv2 sunt secvent e de instruct iuni Matlab.
Instruct iunea if sub prima form a face s a se execute secvent a de instruct iuni
secv numai dac a valoarea expresiei logice exp este adev arat a, dup a care se trece la
prima instruct iune ce urmeaz a liniei end.
38 Introducere n Matlab
A doua form a de instruct iune if are ca efect executarea uneia dintre secvent ele
de instruct iuni secv si secv1, n funct ie de faptul c a expresia logic a exp este
adev arat a, respectiv fals a, dup a care se trece la instruct iunea ce urmeaz a dup a linia
end.
Ultima form a are ca rezultat executarea uneia dintre secvent ele de instruct iuni
secv, secv1 si secv2, dup a cum valoarea lui exp este adev arat a, a lui exp este
fals a si a lui exp1 este adev arat a, respectiv valorile expresiilor logice exp si exp1
sunt false si exp2 are valoare adev arat a.
De exemplu secvent a de instruct iuni ce urmeaz a stabileste dac a elementele unui
vector v cu m componente ntregi sunt toate numere pare, toate impare sau sunt si
pare si impare:
if rem(v,2)==0
p=0;
elseif rem(v,2)==1
p=1;
else
p=2;
end
p
Rezultatul execut iei acestei secvent e atribuie lui p una din valorile 0, 1, 2, n funct ie
de faptul c a vectorul v are toate componentele numere pare, toate impare, respectiv
si pare si impare.
1.8.2 Instructiunea switch
Aceast a instruct iune are ca rezultat trecerea execut iei, n funct ie de valoarea unei
expresii, n diferite puncte ce urmeaz a.
Forma general a a instruct iunii switch este:
switch exp
case val1
secv1
case val2
secv2
. . . . .
otherwise
secv
end
unde exp este o expresie aritmetic a sau de tip caracter, iar secv1, secv2, . . . ,
secv sunt secvent e de instruct iuni Matlab. Dac a valoarea expresiei exp coincide
cu cu una din valorile val1, val2, . . . atunci se execut a secvent a de instruct iuni
corespunz atoare secv1, secv2, . . . , iar n caz contrar se execut a secvent a de
instruct iuni secv.
De exemplu, secvent a de instruct iuni
1.8. Instruct iuni de ciclare si control 39
m=input(m=);
switch expr
case ones
A=ones(m)
case eye
A=eye(m)
case magic
A=magic(m)
otherwise
A=zeros(m)
end
genereaz a matricea p atratic a A de ordin m, care poate de la caz la caz, respectiv
matrice cu toate elementele 1, matrice unitate, matrice magic a, matrice cu toate ele-
mentele zero.
1.8.3 Instructiunea while
Instruct iunea while este o instruct iune de ciclare prin care se repet a execut ia unei
secvent e de instruct iuni Matlab p an a c and o condit ie este satisf acut a. Forma general a
a instruct iuni este:
while exp
secv
end
si are ca efect executarea secvent ei de instruct iuni secv at ata timp c at valoarea ex-
presiei logice exp este adev arat a.
De exemplu, dac a vrem s a calcul am valoarea aproximativ a a solut iei ecuat iei
x = cos (x), folosind metoda iterativ a, impun and condit ia de oprire prin aceea ca
num arul iterat iilor s a nu dep aseasc a o valoare dat a n si distant a dintre dou a iterate
consecutive s a nu e mai mare dec at un epsilon>0 dat, atunci avem programul
n=input(n=);
epsilon=input(epsilon=);
xv=pi/4; k=1; d=1;
while d>epsilon & k<n
k=k+1; xn=cos(xv);
d=abs(xn-xv); xv=xn;
end
fprintf(k=%2d\n,k)
fprintf(d=%10.4f\n,d)
fprintf(x=%10.4f\n,xn)
Astfel, pentru valorile la intrare n=50 si epsilon=1e-5, sunt asate rezultatele:
k=25
d= 0.0000
x= 0.7391
40 Introducere n Matlab
1.8.4 Instructiunea for
Fat a de instruct iunea while, instruct iunea de ciclare for are xat num arul repet a-
rilor unei secvent e de instruct iuni.
Forma general a a instruct iunii este:
for v=vi:pas:vf
secv
end
unde v este variabila de ciclare, care ia toate valorile, ncep and cu valoarea expresiei
aritmetice vi p an a la valoarea expresiei vf, folosind pasul dat prin expresia arit-
metic a pas. Pentru ecare din aceste valori ale lui v se execut a succesiv secvent a
secv de instruct iuni Matlab.
Dac a pas=1, atunci putem folosi urm atoarea form a a instruct ii for:
for v=vi:vf
secv
end
Mai remarc am faptul c a n interiorul unui ciclu for poate exista un alt ciclu for
s.a.m.d.
De exemplu, secvent a urm atoare va genera matricea h de tipul (m,n), numit a
matricea lui Hilbert:
m=input(m=);
n=input(n=);
h=[];
for i=1:m
for j=1:n
h(i,j)=1/(i+j-1);
end
end
format rat
disp(h)

In urma execut arii acestui program, cu valorile m=3 si n=6, se obt in rezulatele
m=3
n=4
1 1/2 1/3 1/4
1/2 1/3 1/4 1/5
1/3 1/4 1/5 1/6
Mai consider am un exemplu de folosire a instruct iunii for. Vrem s a construim
matricea Vandermonde V, corespunz atoare numerelor a
i
, i = 1, m, care sunt date
1.9. Instruct iuni de ntrerupere 41
prin vectorul a. Reamintim c a forma general a a aceastei matrice este
V =
_
_
_
_
_
_
1 1 . . . 1
a
1
a
2
. . . a
m
a
2
1
a
2
2
. . . a
2
m
. . . . . . . . . . . . . . . . . . . . . . . .
a
m1
1
a
m1
2
. . . a
m1
m
_
_
_
_
_
_
.
Matricea V poate generat a prin secvent a de program urm atoare:
m=input(m=);
for i=1:m
a(i)=input(a(i)=);
end
V=[];
for i=0:m-1
V=[V;a.i];
end
disp(V)
Se observ a c a matricea V a fost int ializat a cu matricea vid a, care este specicat a prin
[], iar construct ia efectiv a sa f acut prin operat ia de concatenare.
Execut and programul pentru m=4 si a(i) = i, i = 1, 4, se obt ine
m=4
a(i)=1
a(i)=2
a(i)=3
a(i)=4
1 1 1 1
1 2 3 4
1 4 9 16
1 8 27 64
1.9 Instructiuni de ntrerupere
1.9.1 Instructiunea try. . . catch
Forma general a a instruct iunii este:
try
secv
catch
secv1
end
si are ca efect execut ia primei secvent e de instruct iuni, secv, p an a la aparit ia unei
erori, dup a care se execut a a doua secvent a de instruct iuni, secv1. Dac a nici o
42 Introducere n Matlab
eroare nu apare n execut ia secvent ei secv, dup a executarea acesteia, se trece la
prima instruct iune dup a linia end. Dac a la execut ia secvent ei de instruct iuni secv1
apare o eroare, execut ia programului este oprit a, dac a o alt a instruct iune de tipul
try...catch nu exist a.
1.9.2 Instructiunea pause
Instruct iunea pause are ca efect ntreruperi temporare ale execut iei programelor.
Instruct iunea pause are urm atoarele forme:
pause(n)
pause
pause off
pause on
Prima form a are ca efect ntreruperea execut arii programului timp de n secunde (n
este num ar pozitiv), c and se ajunge cu executarea n acest punct.
A doua form a, pause f ar a argument, ntrerupe executarea programului, reluarea
execut arii f ac anduse prin ap asarea oric arei taste.
Instruct iunea pause cu argumentul off are ca efect inhibarea tuturor instruc-
t iunilor pause si pause(n) ce urmeaz a, iar dac a are argumentul on, atunci se
produce reactivarea acestora.
1.9.3 Instructiunea return
Instruct iunea
return
are ca efect ntoarcerea n programul de pe nivelul imediat superior (programul care
apeleaz a unitatea n care se a a instruct iunea). Nivelul cel mai nalt este cel care
corespunde modului interactiv de lucru, prin urmare instruct iunea return, la acest
nivel nu are niciun efect.
1.9.4 Instructiunea break
Instruct iunea
break
are efecte diferite n funct ie de locul unde este pozit ionat a.
Dac a instruct iunea break se a a ntrun ciclu while, se produce iesirea fort at a
din ciclul respectiv, iar dac a se a a ntrun ciclu for se produce la fel o iesire fort at a
din ciclu, cu observat ia c a dac a exist a un ciclu for superior, se continu a cu exe-
cutarea acestuia.
1.10. Funct ii (proceduri) n Matlab 43
Dac a instruct iunea break se a a ntro instruct iune de tipul if, switch sau
try...catch, atunci se abandoneaz a execut ia acestei instruct iuni, iar dac a este
pozit ionat a n oricare alt a parte, se ncheie executarea programului.
1.9.5 Instructiunea error
Instruct iunea
error(mesaj)
are ca efect abandonarea execut iei si asarea mesajului precizat prin mesaj.
1.10 Functii (proceduri) n Matlab
Toate programele scrise p an a aici, numite siere script, ar putea considerate ca
ind programe principale. Un astfel de program principal poate s a apeleze alte pro-
grame, pe care le numim funct ii sau proceduri, care la r andul lor pot face apel la alte
proceduri.
Un program principal (sier script), nu poate apelat de o alt a unitate de pro-
gram. Lansarea execut iei unui astfel de program, se poate face numai c and sistemul
Matlab este n mod interactiv, adic a avem pe ecran cursorul >>al sistemului Matlab.
Lansarea se face n dou a moduri:
prin tastarea, dup a cursorul >>, a numelui s au, f ar a extensia .m;
prin copierea, dup a cursorul >>, a cont inutului sierului ce cont ine programul,
un exemplu ind cuplul de comenzi Copy Paste,
dup a care se tasteaz a comanda Enter.
Remarc am faptul c a toat a istoria unei sesiuni se a a pe ecran, chiar dac a unele
secvent e mai vechi nu sunt vizibile la un momnet dat, dar cu ajutorul mouseului,
folosind bara din dreapta a ecranului se poate aduce secvent a dorit a n partea vizi-
bil a a ecranului. Mai mult, cu ajutorul sistemului de s aget i pot readuse comenzi
mai vechi sau mai noi, care pot reeditate (modicate) si lansate dup a o astfel de
reeditare. Exist a chiar o c autare mai rapid a a unor instruct iuni din lista de instruct iuni
ce au fost utlizate ntro sesiune Matlab, anume se tasteaz a nceputul instruct iunii
urmat a de s ageat a n sus.

Inc a ceva, toate variabilele folosite n timpul unei sesiuni Matlab, e n mod
interactiv, e prin execut ia unui program principal (scriptle) au un caracter global
si sunt p astrate ntrun spat iu de lucru (workspace), care la ncheierea sesiunii
Matlab sunt pierdute. De aceea, avem la dispozit ie comenzile pe care le-am prezentat,
diary si save care permit, prin lansarea lor, salvarea acestor informat ii.
44 Introducere n Matlab
1.10.1 Denirea si structura unei functii Matlab
Colect ia de programe ale sistemului Matlab este constituit a, n mare parte, din funct ii
(proceduri) scrise n limbajul propriu. Acestea sunt siere cu extensia .m av and
urm atoarea structur a:
function [lista1] = numef(lista2)
% linia H1 (help line)
% comentariu
%
corp
unde lista1 si lista2 reprezint a respectiv lista variabilelor de iesire (desp art ite
prin spat ii sau virgule) si lista parametrilor de intrare (desp art it i prin spat ii sau vir-
gule), corp este secvent a de instruct iuni ale funct iei cu numele numef.
Variabilele din corpul procedurii au un caracter local, prin urmare la ntoarcerea
n unitatea care face apelul valorile acestora se pierd, desigur cu except ia valorilor
din lista1. Exist a posibilitatea schimb arii caracterului local, prin instruct iunea
global lista
care are ca efect obt inerea caracterului global pentru variabilele din lista.

In corpul unei funct ii Matlab variabilele nargin si nargout specic a num arul
parametrilor de intrare, adic a lungimea listei lista2, respectiv a parametrilor de
iesire, adic a lungimea listei lista1.
Dac a ntrun sier script sau de la tastatur a se d a una din comenzile
nargin(numef)
nargout(numef)
atunci se obt in num arul parametrilor de intrare si respectiv num arul parametrilor de
iesire pentru funct ia Matlab cu numele numef.
Liniile dinaintea corpului procedurii, care ncep cu % sunt linii de comentariu si
vor listate c and se lanseaz a comanda
help numef
Din acest motiv, partea de comentariu de la nceputul procedurii este bine s a cont in a
informat ii, care s a descrie pe scurt cum trebuie s a e apelat a si folosit a funct ia res-
pectiv a.
Mai remarc am prima linie de comentariu, notat a cu H1, care are o nsusire aparte.
C and se lanseaz a comanda
lookfor key
care caut a cuv antul cheie key, aceasta se face numai n liniile H1 ale sierelor cu
extensia .m, dup a care se listeaz a numele sierelor ce cont in cuv antul cheie precizat.

In cadrul liniilor ce alc atuiesc corpul funct iei pot exista de asemenea linii de
comentariu, care ncep cu simbolul %, dar care nu vor asate odat a cu lansarea
comenzii help. Mai mult aparit ia simbolului % n interiorul unei linii face ca tot ce
urmeaz a pe linia respectiv a s a e considerat comentariu.
1.10. Funct ii (proceduri) n Matlab 45
Numele unei funct ii Matlab, numef, scris a de utilizator, este de dorit s a e diferit
de numele funct iilor deja existente n sistemul Matlab, iar numele sierului, cu ex-
tensia .m, ce va cont ine funct ia s a e numef.m.
Dac a lista parametrilor de intrare, lista2, este vid a, atunci linia de denit ie a
funct iei este de forma
function [lista1] = numef
Dac a lista variabilelor de iesire, lista1, este format a dintro singur a variabil a,
atunci se poate renunt a la parantezele drepte, iar dac a este vid a se poate elimina
complet.
Cu aceste preciz ari, cea mai simpl a linie de dent ie a unei funct ii (proceduri) este
function numef
1.10.2 Apelul unei functii (proceduri) Matlab
Apelarea unei funct ii se poate face n dou a moduri.
Primul mod este cel interactiv, de exemplu, prin una din formele
[apel1] = numef(apel2)
numef(apel2)
unde apel2 este lista parametrilor actuali, care poate vid a sau format a din cel
mult at atea elemente c at are lista parametrilor formali, lista2, din linia de denit ie
a funct iei numef, de ecare dat a f ac anduse leg atura de tipul: primul parametru din
apel2 corespunde primului parametru din lista2, al doilea element din apel2
corespunde celui de al doilea parametru din lista2,..., corespondent a ncheindu
se c and se termin a lista apel2. Desigur, dac a apel2 are mai put ine elemente dec at
lista2, atunci trebuie gestionat a aceast a situat ie n corpul funct iei numef cu aju-
torul varaibilei nargin.
Rezultatele execut arii funct iei numef, se p astreaz a n lista apel1 n primul caz,
respectiv n ans n al doilea caz. O discut ie analog a asupra corespondent ei dintre
apel2 si lista2, se face si n cazul apel1 si lista1.
O alt a cale de apel a unei funct ii este dintrun alt program sau procedur a Matlab,
prin aparit ia ntro instruct iune Matlab a numelui funct iei, mpreun a cu lista parame-
trilor actuali de tipul listei apel2, mai sus precizat a.
1.10.3 Subfunctii
Funct iile pot avea n corpul lor apeluri la alte funct ii. Totdeauna ntoarcerea n uni-
tatea care cheam a se face, c and se ajunge la linia nal a a corpului unit at ii chemate
sau c and se nt alneste instruct iunea return.
Exist a dou a situat ii mai speciale n construct ia funct iilor n Matlab.
46 Introducere n Matlab

In primul r and, exist a posibilitatea ca dup a corpul unei funct ii s a e denite


una sau mai multe funct ii, pe care le numim subfunct ii si care pot apelate din
corpul funct iei. Forma unei astfel de funct ii ar :
function [lista1] = numef(lista2)
%
% comentariu
%
corp
function [list1] = numef1(list2)
%
% comentariu1
%
corp1
n secvent a de instruct iuni corp f ac anduse apel la funct ia numef1. Funct iile de
tipul funct iei numef1 nu se pot apela din exteriorul sierului numef.m. Drept
consecint a nici comentariu1 nu este vizibil din exteriorul funct iei numef.
Functia 1.10.1. S a scriem o procedur a, care reprezint a grac pe intervalul [1, 1]
o mult ime nit a precizat a de polinoame ale lui Cebsev de spet a I. Dac a num arul
acestora este par, atunci s a e reprezentate pe dou a coloane, iar n caz contrar pe o
singur a coloan a.
function cebisev(lista)
% Polinomul Cebisev
% lista -- contine gradele polinoamelor Cebisev
% care vor fi reprezentate grafic;
% daca lista are un numar par de elemente,
% polinoamele se vor reprezenta pe doua coloane;
% daca lista are un numar impar de elemente,
% polinoamele se vor reprezenta pe o coloana;
%
clf, x=-1:0.001:1; r=length(lista);
if rem(r,2)==0
m=fix(r/2); n=2;
else
m=r; n=1;
end
for i=1:r
y=cos(lista(i)
*
acos(x));
splots(m,n,i,x,y,lista(i))
end
function splots(m,n,k,u,v,gr)
subplot(m,n,k), plot(u,v,k-)
title([Polinom Cebisev de gradul n=,num2str(gr)])
Dac a se apeleaz a funct ia cebisev prin
cebisev([2:5])
se obt in gracele din Figura 1.16.
1.10. Funct ii (proceduri) n Matlab 47
1 0.5 0 0.5 1
1
0.5
0
0.5
1
Polinomul Cebisev de gradul n=2
1 0.5 0 0.5 1
1
0.5
0
0.5
1
Polinomul Cebisev de gradul n=3
1 0.5 0 0.5 1
1
0.5
0
0.5
1
Polinomul Cebisev de gradul n=4
1 0.5 0 0.5 1
1
0.5
0
0.5
1
Polinomul Cebisev de gradul n=5
Figura 1.16: Polinoamele lui Cebsev de grad n = 2, 3, 4, 5
1.10.4 Functia feval
Un alt caz special este acela c and printre parametrii formali de intrare din lista2
exist a si parametri ce pot lua valori nume ale unor funct ii. La apelul unei astfel de
funct ii pe pozit ia parametrului actual corespunz ator din lista apel2 trebuie s a se ae
un sir de caractere ce denumeste funct ia actual a.
Functia 1.10.2. Funct ia cu numele opmatrix opereaz a prin operatorii Matlab
cunoscut i asupra a dou a matrice:
function Z = opmatrix(op,X,Y)
%
% Efectueaza operatia definita prin op
% asupra matricelor X si Y.
% Rezultatul este returnat in Z
%
Z = feval(op,X,Y);
Folosind aceast a funct ie, de exemplu prin comenzile
opmatrix(plus,A,B)
opmatrix(minus,A,B)
opmatrix(and,A,B)
sau
opmatrix(+,A,B)
opmatrix(-,A,B)
opmatrix(&,A,B)
48 Introducere n Matlab
se obt in suma, diferent a si respectiv conjunct ia matricelor A si B.
1.10.5 Comanda echo
Instruct iunea echo are un comportament put in diferit pentru cele dou a tipuri de
siere cu extensia .m.
Dac a suntem n cazul unui sier script, atunci instruct iunile
echo on
echo off
echo
au respectiv urm atoarele efecte: prima are ca efect asarea pe ecran a sierului n
derulare, a doua anuleaz a acest efect, iar a treia are efectul primei forme, dac a sis-
temul se a a n mod off, iar dac a se a a n mod off se va face trecerea la modul
on.
Dac a suntem n cazul funct iilor Matlab cu extensia .m, atunci avem formele
echo numef on
echo numef off
echo numef
echo on all
echo off all
Primele trei forme sunt analoge celor trei din cazul script, numai c a se mai specic a si
numele funct iei la care se refer a. Celelalte dou a act ioneaz a asupra tuturor funct iilor.
1.11 Instructiuni de evaluare a ecientei
Compararea ecient ei algoritmului este posibil a n sistemul Matlab e prin num ara-
rea opert iilor n virgul a otant a, e prin determinarea duratei, n secunde, a execut iei
unei secvent e de instruct iuni, CPU (Central Processor Unit).
1.11.1 Instructiunea flops
Instruct iunea flops este ncorporat a n Matlab 6 prin pachetul LAPACK. Prin ur-
mare este funct ional a numai dac a sistemul cont ine si LAPACK.
Obt inerea num arului operat iilor n virgul a otant a efectuate pentru execut ia unei
secvent e secv de instruct iuni Matlab se realizeaz a prin:
flops(0)
secv
flops
La ncheierea execut iei acestei succesiuni de instruct iuni n variabila flops se a a
num arul acestor operat ii.
1.12. Grac a tridimensional a 49
1.11.2 Instructiunile tic si toc
Pentru obt inerea duratei execut iei unei secventt e secv de instruct iuni Matlab avem
urm atoarea succesiune de instruct iuni:
tic
secv
toc
unde tic marcheaz a nceputul contoriz arii timpului, iar toc anunt a ncheierea con-
toriz arii, variabila toc cont in and timpul m asurat n secunde.
1.12 Grac a tridimensional a
Graca tridimensional a sau altfel numit a 3D este axat a n sistemul Matlab pe dou a
direct ii: reprezentarea curbelor n spat iu si reprezentarea suprafet elor.
1.12.1 Instructiunea plot3
Instruct iunea plot3 este utilizat a pentru reprezentarea curbelor n spat iu si n prin-
cipiu nu se deosebeste mult de instruct iunea plot din graca bidimensional a.
Formele nt alnite pentru aceast a instruct iune sunt:
plot3(x,y,z)
plot3(x,y,z,s)
plot3(x1,y1,z1,x2,y2,z2,...)
plot3(x1,y1,z1,s1,x2,y2,z2,s2,...)
Dac a x, y, z sunt vectori de acceasi lungime m, atunci se unesc punctele de coor-
donate (x
i
, y
i
, z
i
), i = 1, m, printro linie poligonal a de tipul precizat prin para-
metrul s, de la instruct iunea plot, iar n lipsa acestui parametru, sistemul Matlab
efectueaz a o alegere implicit a a tipului curbei. Desigur c a netezimea curbei este cu
at at mai bun a cu c at num arul punctelor este mai mare.
Dac a x, y, z sunt matrice de acelasi tip (m,n), atunci pentru ecare coloan a se
obt ine c ate o linie poligonal a, adic a n linii poligonale. Acestea sunt generate respectiv
de punctele de coordonate
_
x
ij
, y
ij
, z
ij
_
m
i=1
, pentru ecare j = 1, n, cu aceeasi
observat ie privind parametrul s, care precizeaz a tipul curbei.

In acest caz pe aceeasi
gur a vor obt inute mai multe grace.
Ultimele dou a forme sunt extinderi ale primelor dou a, pentru a putea controla
mai bine n special tipul curbelor cu ajutorul parametrilor de tip s.
Remarc am de asemenea extinderea act iunilor comenzilor ce controleaz a un grac
din cazul bidimensional pentru cazul tridimensional.
Programul 1.12.1. Prezent am un program care ilustreaz a miscarea unei particule din
punctul A pe o spiral a p an a n punctul B.
50 Introducere n Matlab
pas=input(pas=); h=input(h=);
t=0:pas:h; r=exp(-0.2
*
t); th=pi
*
t
*
0.5;
x=r.
*
cos(th); y=r.
*
sin(th); z=t;
plot3(x,y,z), hold on
plot3([1,1],[-0.5,0],[0,0])
text(1,-0.7,0,A), n=length(t);
text(x(n),y(n),h+2,B)
xlabel(x), ylabel(x), zlabel(z)
S a explic am pe scurt o parte a instruct iunilor acestui program.
Figura este obt inut a n dou a etape, din cauza aceasta a fost introdus a instruct iunea
hold on. Prima instruct iune plot3 traseaz a efectiv gracul spiralei, care se
mai completeaz a prin segmentul din planul xoy delimitat de punctele de coordo-
nate (1,-0.5,0) si (1,0,0), trasat cu a doua instruct iune plot3. Cele dou a
instruct iuni au acelasi rezultat ca si instruct iunea
plot3(x,y,z,[1,1],[-0.5,0],[0,0])
doar c a spirala va trasat a cu o anumit a culoare, iar segmentul din planul xoy cu
alta. Dac a vrem ca ntreaga curb a s a e trasat a cu aceeasi culoare se poate apela la
parametrul de tip s.
Se mai observ a c a pozit ia init ial a A a punctului si pozit ia nal a B sunt asate
cu instruct iunile text, iar etichetele celor trei axe de coordoante sunt date prin
instruct iunile de tip label.
Dup a executarea programului, cu h=20 si pas=0.01, sa obt inut gracul din
Figura 1.17.
1
0.5
0
0.5
1
1
0.5
0
0.5
1
0
5
10
15
20
A
x
B
y
z
Figura 1.17: Miscarea pe spiral a
1.12. Grac a tridimensional a 51
1.12.2 Instructiunea ezplot3
Pentru reprezentarea grac a a curbelor n spat iu, poate folosit a instruct iunea
ezplot3, care se lanseaz a prin una din comenzile:
ezplot3(x,y,z)
ezplot3(x,y,z,[a,b])
ezplot3(x,y,z,animate)
ezplot3(x,y,z,[a,b],animate)
Parametrii x, y si z, cont in expresii algebrice ale reprezent arilor curbei n funct ie de
un parametru t, din [a,b]. Valoarea implicit a a acestui interval este [0,2].
Prezent a parametrului animateproduce pe gur a un buton cu numele repeat,
care prin activare prezint a modul de deplasare a unui punct pe curba reprezentat a
grac.
De exemplu, dac a se consider a comanda
ezplot3(sin(t),cos(t),t,[0,10
*
pi],animate)
se va obt ine gracul din Figura 1.18, n care se observ a si butonul repeat.
1
0.5
0
0.5
1
1
0.5
0
0.5
1
0
5
10
15
20
25
30
35
x
x = sin(t), y = cos(t), z = t
y
z
Figura 1.18: x(t) = sin (t), y (t) = cos (t), z(t) = t, t [0, 10]
1.12.3 Instructiunile meshgrid, mesh si surf
Reprezentarea grac a a unei suprafet e, dat a prin funct ia z = f (x, y), pe domeniul
D R
2
, cuprinde dou a etape.
52 Introducere n Matlab
Prima dat a se realizeaz a o ret ea rectangular a de puncte, cu ajutorul instruct iunii
meshgrid, care are sintaxa
[X,Y]=meshgrid(x,y)
unde x si y sunt vectori, n general de lungimi diferite, m si n, care cont in puncte
de pe axele ox si oy si care sunt folosite la generarea ret elei rectangulare
_
x
i
, y
j
_
i = 1, m, j = 1, n.
Rezultatul execut arii instruct iunii meshgrid, are ca efect generarea matricelor
X si Y av and acelasi tip (n,m). Fiecare linie a matricei X este format a din compo-
nentele vectorului x, iar ecare coloan a a matricei Y este format a din componentele
vectorului y.

In acest fel punctul de coordonate
_
x
i
, y
j
_
al ret elei rectangulare, se
poate exprima, cu ajutorul matricelor X si Y, prin perechea (X(j,i),Y(j,i)).

Inainte de a trece la a doua etap a, s a facem observat ia c a dac a x coincide cu y,


atunci se poate utiliza
[X,Y]=meshgrid(x)
Reprezentarea grac a a funct iei z = f (x, y), se face cu ajutorul instruct iunii
mesh, care are una din formele:
mesh(Z)
mesh(Z,C)
mesh(x,y,Z)
mesh(x,y,Z,C)
mesh(X,Y,Z)
mesh(X,Y,Z,C)
De la nceput, s a remarc am faptul c a parametrul C precizeaz a scara culorilor. C and
lipseste acest parametru, scara culorilor este dat a de parametrul Z, care reprezint a
valorile funct iei z = f (x, y) pe o ret eaua rectangular a.

In acest ultim caz culoarea
va proport ional a cu n alt imea z din punctul (x, y).
De asemenea, trebuie s a remarc am faptul c a reprezentarea grac a a suprafet ei
este de forma unei ret ele curbilinii sprijinit a pe n alt imile date prin matricea Z.
Parametrii X, Y si Z sunt matrice de aceleasi dimensiuni, dac a avem n vedere
cum au fost obt inute matricele X si Y, atunci toate aceste trei matrice sunt de tipul
(n,m).
Parametrii x si y sunt vectori de tipul celor ce genereaz a matricele X si Y prin
instruct iunea meshgrid, adic a dac a acestia au lungimile m si respectiv n, matricea Z
va de tipul (n,m), iar punctele pe care se sprijin a ret eaua curbilinie, care reprezint a
gracul funct iei, au coordonatele (x(j),y(i),Z(i,j)).
Dac a primii doi parametri lipsesc, adic a suntem n cazul primelor dou a forme
ale instruct iunii mesh, acestea sunt echivalente respectiv cu urm atoarele dou a, prin
considerarea valorilor implicite x=1:m si y=1:n.
Instruct iunea surf are aceeasi sintax a ca instruct iunea mesh, adic a
surf(Z)
surf(Z,C)
1.12. Grac a tridimensional a 53
surf(x,y,Z)
surf(x,y,Z,C)
surf(X,Y,Z)
surf(X,Y,Z,C)
unde parametrii au aceleasi caracteristici. Deosebirea n reprezentarea grac a este c a
prin instruct iunea surf se produce o colorare a patrulaterelor obt inute prin curbele
care genereaz a suprafat a corespunz atoare funct iei z = f (x, y).
Programul 1.12.2. Vom scrie un program care s a reprezinte grac funct ia
z = f (x, y) =
1
2
e

1
2
(x
2
+y
2
)
,
pe domeniul D = [1, 1] [1, 1], n dou a guri al aturate, odat a cu instruct iunea
mesh si apoi cu instruct iunea surf.
clear, clf
m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2
*
pi)
*
exp(-0.5
*
(X.2+Y.2));
subplot(1,2,1), mesh(X,Y,Z)
title(Grafica prin MESH)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,2,2), surf(X,Y,Z)
title(Grafica prin SURF)
xlabel(x), ylabel(y), zlabel(z)
Executarea programului, cu m = 6, conduce la reprezent arile grace din Figura 1.19.

In ncheierea acestui paragraf, amintim c a exist a posibilitatea de umbrire a unei


suprafet e cu ajutorul comenzii
shading tip
unde tip poate :
faceted (implicit) umbreste ecare patrulater de pe suprafat a trasat a cu o
intensitate x a si traseaz a laturile patrulaterelor;
flat umbreste ecare patrulater de pe suprafat a trasat a cu o intensitate x a,
f ar a trasarea laturilor patrulaterelor;
interp umbrirea ec arui patrulater de pe suprafat a trasat a se face n mod
gradat, printrun procedeu de interpolare, care asigur a o trecere neted a de la
un patrulater la altul, f ar a trasarea laturilor patrulaterelor.
Programul 1.12.3. S a scriem un program care efectueaz a umbrirea suprafet ei
reprezentat a grac prin Programul 1.12.2:
54 Introducere n Matlab
1
0.5
0
0.5
1
1
0.5
0
0.5
1
0.04
0.06
0.08
0.1
0.12
0.14
0.16
x
Grafica prin MESH
y
z
1
0.5
0
0.5
1
1
0.5
0
0.5
1
0.04
0.06
0.08
0.1
0.12
0.14
0.16
x
Grafica prin SURF
y
z
Figura 1.19: z =
1
2
e

1
2
(x
2
+y
2
)
m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2
*
pi)
*
exp(-0.5
*
(X.2+Y.2))
subplot(1,3,1), surf(X,Y,Z),
shading faceted
title(Umbrire - faceted)
subplot(1,3,2), surf(X,Y,Z),
shading flat
title(Umbrire - flat)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,3,3), surf(X,Y,Z),
shading interp
title(Umbrire - interp)
Rezultatul execut arii programului este n Figura 1.20.
1.12.4 Instructiunile contour si contourf
Reprezentarea curbelor de nivel ale suprafet ei, dat a prin funct ia z = f (x, y), se poate
face cu una din urm atoarele forme ale instruct iunii contour:
contour(Z)
contour(Z,n)
contour(Z,v)
contour(X,Y,Z)
1.12. Grac a tridimensional a 55
1
0
1
1
0.5
0
0.5
1
0.04
0.06
0.08
0.1
0.12
0.14
0.16
Umbrire faceted
1
0
1
1
0.5
0
0.5
1
0.04
0.06
0.08
0.1
0.12
0.14
0.16
Umbrire flat
1
0
1
1
0.5
0
0.5
1
0.04
0.06
0.08
0.1
0.12
0.14
0.16
Umbrire interp
Figura 1.20: Umbrirea unei suprafet e
contour(X,Y,Z,v)
contour(Z,[w w])
contour(X,Y,Z,[w w])
unde parametrii X, Y si Z au aceleasi interpret ari ca si n cazul instruct iunilor mesh
si surf.
Parametrul v este un vector prin care se specic a nivelurile curbelor de nivel ce
urmeaz a a reprezentate grac, iar n absent a sa, valorile acestui parametru sunt
automat calculate. Num arul curbelor de nivel se poate preciza prin parametrul n.
Formele instruct iunii contour cu parametrul de tipul [w w] are ca efect
trasarea curbei de nivel precizat a prin w. Aceste forme permit reprezentarea grac a
a funct iilor date sub form a implicit a. Astfel, dac a vrem s a reprezent am grac funct ia
y = y (x) dat a prin f (x, y) = 0, atunci gracul funct iei y = y (x) va dat de curba
de nivel pentru funct ia z = f (x, y), consider and w=0.
Instruct iunea contourf difer a de contour doar prin faptul c a ariile delimitate
de curbele de nivel sunt umbrite.
Programul 1.12.4. S a reprezent am n curbe de nivel pentru funct ia considerat a
n Programul 1.12.2. Reprezent arile acestor curbe de nivel s a e f acute at at cu
instruct iunea contour, c at si cu contourf.
clear, clf
m=input(m=); n=input(n=);
h=1/m; x=-1:h:1;
56 Introducere n Matlab
[X,Y]=meshgrid(x);
Z=1/(2
*
pi)
*
exp(-0.5
*
(X.2+Y.2));
subplot(1,2,1), contour(Z,n)
title([n=,num2str(n), curbe de nivel])
subplot(1,2,2), contourf(Z,n)
title([n=,num2str(n), curbe de nivel umbrite])
Executarea programului, cu m = 6 si n=5, conduce la reprezent arile grace din
Figura 1.21.
2 4 6 8 10 12
2
4
6
8
10
12
n=5 curbe de nivel
2 4 6 8 10 12
2
4
6
8
10
12
n=5 curbe de nivel umbrite
Figura 1.21: Curbe de nivel
1.12.5 Instructiunile ezcontour si ezcontourf
O form a simplicat a, pentru reprezentarea curbelor de nivel, pentru o funct ie dat a
prin z = f (x, y), se obt ine cu ajutorul instruct iunii ezcontour, av and una din
formele:
ezcontour(f)
ezcontour(f,lim)
ezcontour(f,n)
unde f este expresia matematic a a unei funct ii de dou a variabile, privit a ca un sir de
caractere.
Parametrul lim este e un vector de forma [xmin,xmax], e de forma
[xmin,xmax,ymin,ymax]. Dac a lipseste, se ia implicit [-2,2,-2,2],
iar dac a este de prima form a se ia [xmin,xmax,xmin,xmax].
Parametrul n specic a faptul c a n reprezentarea grac a se foloseste o ret ea de
nn puncte (implicit se consider a n=60).
De exemplu,
1.12. Grac a tridimensional a 57
f=sqrt(x2+y2)
ezcontour(f,[-2,2])
are acelasi efect cu
ezcontour(sqrt(x2+y2),[-2,2])
si produc curbele de nivel pentru funct ia z = f (x, y) =
_
x
2
+y
2
, pe domeniul
D = [2, 2] [2, 2].
Instruct iunea ezcontourf, fat a de ezcontour execut a si umbrirea ariilor
generate de curbele de nivel.
1.12.6 Instructiunile ezmesh, ezsurf, ezmeshc si ezsurfc
Sintaxa apelurilor funct iilor ezmesh, ezsurf, ezmeshcsi ezsurfceste aceeasi,
iar efectul execut arii lor este reprezentarea grac a a unei suprafet e, respectiv a unei
suprafet e, mpreun a cu sau f ar a curbele de nivel corespunz atoare. De aceea prezent am
modurile de apelare, numai pentru una dintre ele.
ezmesh(f)
ezmesh(f,lim)
ezmesh(x,y,z)
ezmesh(x,y,z,lim)
Parametrul f reprezint a o expresie algebric a, ce deneste suprafat a, care urmeaz a
s a e reprezentat a grac, pe domeniul denit prin lim. Implicit, n absent a para-
metrului lim, domeniul este [-2,2][-2,2]. Dac a lim=[a,b], atunci
domeniul va [a,b][a,b], iar dac a lim=[a,b,c,d], atunci domeniul va
[a,b][c,d].
Parametrii x, y, z, reprezint a expresii algebrice ce denesc suprafat a n modul
parametric.

In acest caz, corespunz ator, parametrul lim, precizeaz a domeniul n care
iau valori parametrii cu ajutorul c arora se deneste n mod parametric suprafat a ce
urmeaz a a reprezentat a.
Remarc am faptul c a formele mai sus prezentate, mai pot avea doi parametri.
Unul, n, de tip ntreg pozitiv, care precizeaz a num arul nn al punctelor ret elei. Im-
plicit se consider a n=60. Un altul este circ, care prin prezent a sa atrage repre-
zentarea lui f pe un disc centrat n domeniul mai sus precizat.
Pentru exemplicare, dac a se execut a programul Matlab format din urm atoarele
instruct iuni:
subplot(1,2,1)
ezmesh(sin(x)
*
sin(y),[-pi,pi],circ)
subplot(1,2,2)
ezmeshc(sin(x)
*
sin(y),[-pi,pi],circ)
colormap spring
se obt in gracele din Figura 1.22.
Mai remarc am faptul c a f, x, y, z pot numele unor funct ii predenite sau scrise
de utilizator.
58 Introducere n Matlab
5
0
5
5
0
5
1
0.5
0
0.5
1
x
sin(x) sin(y)
y
z
5
0
5
5
0
5
1
0.5
0
0.5
1
x
sin(x) sin(y)
y
z
Figura 1.22: Suprafat a f ar a si cu curbe de nivel
Pentru a ilustra c a cele dou a instruct iuni de tipul ezmesh si ezsurf au de
regul a acelasi efect, programul urm ator reprezint a grac aceeasi suprafat a, respectiv
cu ezmesh si ezsurf.
clf
subplot(1,2,1),
ezsurf(x
*
exp(-x2 - y2),[-2,2],20)
title(Reprezentare cu ezsurf)
subplot(1,2,2)
ezsurf(x
*
exp(-x2 - y2),[-2,2],20)
colormap autumn
title(Reprezentare cu ezmesh)
Gracele sunt prezentate n Figura 1.23.
1.12.7 Instructiunile bar3 si bar3h
Instruct iunile bar3 si bar3h corespund instruct iunilor bar si respectiv barh din
graca bidimensional a.
Forme ale acestor instruct iuni sunt:
bar3(z,w,tip,color)
bar3(y,z,w,tip,color)
bar3h(y,w,tip,color)
bar3h(y,z,w,tip,color)
1.12. Grac a tridimensional a 59
2
1
0
1
2
2
1
0
1
2
0.5
0
0.5
x
Reprezentare cu ezsurf
y
2
1
0
1
2
2
1
0
1
2
0.5
0
0.5
x
Reprezentare cu ezmesh
y
Figura 1.23: Suprafat a reprezentat a z = f(x, y) = xe
(x
2
+y
2
)
argumentele w, tip si color sunt opt ionale, dar c and sunt specicate, trebuie
s a p astreze aceast a ordine.
Parametrul y este un vector de lungime m, av and componentele ordonate
cresc ator sau descresc ator. Dac a y lipseste, atunci se consider a implicit y=1:m.
Dac a z este un vector de aceeasi lungime cu y, atunci vor reprezentate grac m
bare de lungimi z
i
n dreptul punctelor y
i
, i = 1, m, de pe axa oy. Dac a z este o ma-
trice de tipul (m,n), reprezent arile sunt efectuate pentru ecare din cele n coloane
ale matricei, adic a n ecare punct y
i
, i = 1, m, de pe axa oy, vor reprezentate c ate
n bare (batoane).
Parametrul w specic a grosimea barelor, implicit ind w = 0.8, iar pentru w > 1
barele se suprapun.
Dac a parametrul tip=detached, care este valoarea implicit a, atunci barele
din punctele y
i
de pe axa oy vor detasate n ad ancime dup a axa ox. Dac a
tip=grouped, barele (batoanele) vor grupate n punctele y
i
, de pe axa oy, iar
dac a tip=stacked, atunci barele vor stivuite n aceste puncte.
Parametrul color specic a culoarea barelor (batoanelor) si are una din urm a-
toarele valori: r (rosu), g (verde), b (albastru), y (galben), m (violet), c (ciclamen),
k (negru), w (alb).
Deosebirea ntre bar3 si bar3h este c a prima instruct iune act ioneaz a pe verti-
cal a, iar a doua pe orizontal a.
60 Introducere n Matlab
Programul 1.12.5. S a scriem un program care genereaz a o matrice magic a de ordin
m > 2. Folosind primele trei coloane ale matricei magice, s a reprezent am prin bare
verticale valorile acestora cu ecare din tipurile detached, groupedsi stacked.
Folosind ultimele trei coloane s a se fac a astfel de reprezent ari cu ajutorul barelor
orizontale.
m=input(m:); A=magic(m);
subplot(2,3,1), bar3(A(:,1:3),.6,detached)
title(Bar3 - detached)
subplot(2,3,2), bar3(A(:,1:3),grouped)
title(Bar3 - grouped)
subplot(2,3,3), bar3(A(:,m-2:m),.6,stacked)
title(Bar3 - stacked)
subplot(2,3,4), bar3h(A(:,m-2:m),.6,detached)
title(Bar3h - detached)
subplot(2,3,5), bar3h(A(:,m-2:m),grouped)
title(Bar3h - grouped)
subplot(2,3,6), bar3h(A(:,1:3),.6,stacked)
title(Bar3h - stacked)
colormap spring
Executarea acestui program, pentru m=4, produce gracele din Figura 1.24.
1
2
3
1
2
3
4
0
10
20
Bar3 detached
1
2
3
4
0
5
10
15
20
Bar3 grouped
1
2
3
4
0
20
40
Bar3 stacked
0
10
20
1
2
3
4
Bar3h detached
0
10
20
1
2
3
4
Bar3h grouped
0
20
40
1
2
3
4
Bar3h stacked
Figura 1.24: Bare verticale si bare orizontale n 3D
Capitolul 2
Elemente de teoria probabilit atilor
Teoria probabilit at ilor are ca obiect de studiu fenomene nedeterministe sau ale-
atoare (nt ampl atoare). Un fenomen nedeterminist E este rezultatul imposibilit at ii
cunoasterii exacte si complete a tuturor elementelor care concur a la realizarea aces-
tuia. Astfel de fenomene aleatoare ar putea apelurile dintr-o central a telefonic a,
accidentele de circulat ie dintr-o intersect ie, extragerile numerelor loto, rezultatele
de la rulet a, noii n ascut i la o maternitate, num arul particulelor dezintegrate dintr-
o substant a radioactiv a, miscarea brownian a a particulelor unei substant e dizolvat a
ntr-un uid, sosirea client ilor ntr-o stat ie de servire, r asp andirea erorilor de tipar
dintr-o carte, v anzarea p ainii la o unitate alimentar a si n ne r asp andirea stadelor
n pr ajitura cump arat a de la o cofet arie. Toate aceste fenomene sunt fenomene alea-
toare prin faptul c a nu sunt cunoscute toate condit iile n care sunt realizate, sau dac a
o parte din aceste condit ii pot precizate, ele nu sunt cunoscute cu exactitate. Fac-
torii necunoscut i, care se reg asesc n fenomenul real, conduc la astfel de fenomene
aleatoare (nedeterministe).
Teoria probabilit at ilor vine s a dea metode unitare pentru analiza si studiul unor
astfel de fenomene nedeterministe si care provin dintro gam a larg a a activit at ii si
cunoasterii umane. Pentru aceasta este necesar s a e formalizat limbajul prin care
se trateaz a fenomenele aleatoare, ca apoi prin particulariz ari s a e obt inute rezultate
specice fenomenului considerat.
Vom presupune c a avem anumite cunostint e de relative la teoria probabilit at ilor.
Reamintim n acest capitol doar o parte din not iunilor de baz a ale teoriei proba-
bilit at ilor, pentru stabilirea unui limbaj comun n abordarea capitolelor urm atoare.
T in and seama de aceast a motivat ie recomand am celor neinit iat i n aceast a disciplin a
a teoriei probabilit at ilor lucr arile [10], [6], [9], [8].
61
62 Elemente de teoria probabilit at ilor
2.1 C amp de probabilitate
Dac a se consider a fenomenul aleator ( experimentul ) E, vom numi probe rezultatele
experimentului, iar mult imea probelor relative la experimentul E o numim spat iul
probelor si pe care l not am prin .
Denitia 2.1.1. Spunem c a submult imea nevid a K P () este un corp (corp
borelian, -algebr a) dac a satisface urm atoarele condit ii:
(2.1.1) A K =

A K; A
i
K, i I =
_
iI
A
i
K,
iar perechea (, K) se numeste c amp de evenimente.
Mult imea de indici I este o mult ime cel mult num arabil a.
Denitia 2.1.2. Fiind dat c ampul de evenimente (, K), se numeste probabilitate o
aplicat ie P : K R, care veric a urm atoarele trei axiome:
(i) A K = P (A) 0,
(ii) P () = 1, ind evenimentul sigur (cert),
(iii) A
i
K, i I, A
i
A
j
= , i = j = P
_
_
iI
A
i
_
=

iI
P (A
i
) ,
iar tripletul (, K, P) se numeste c amp de probabilitate.
2.2 Variabile aleatoare
Fie c ampul de probabilitate (, K, P) si algebrele mult imilor Borel B (R),
B (R
n
), respectiv pe R si R
n
.
Denitia 2.2.1. Numim variabil a aleatoare, aplicat ia X: R, dac a este K
m asurabil a, adic a
(2.2.1) B B(R) = X
1
(B) =
_

X () B
_
K.
Observatia 2.2.2. Av and n vedere c a B(R) poate generat de familia de intervale
{(, x]}
xR
, condit ia (2.2.1) de Km asurabilitate poate nlocuit a prin
(2.2.2) X
1
((, x]) = (X x) =
_

X () x
_
K, x R.
2.3. Funct ie de repartit ie 63
Observatia 2.2.3. Cardinalul mult imii X () a valorilor unei variabile aleatoare X,
conduce la o clasicarea a mult imii variabilelor aleatoare:
variabile aleatoare de tip discret, dac a |X ()|
0
, adic a X are o mult ime
cel mult num arabil a de valori;
variabile aleatoare simple, dac a |X ()| <
0
, adic a X are o mult ime nit a
de valori;
variabile aleatoare de tip continuu, dac a |X ()| = , adic a X are o mult ime
valori de puterea continuumului.
Denitia 2.2.4. Numim vector aleator n(dimensional), aplicat ia X: R
n
,
dac a este Km asurabil a, adic a
B B(R
n
) =X
1
(B) =
_

X() B
_
K
sau av and n vedere Observat ia 2.2.2
(X x) = (X
1
x
1
, . . . , X
n
x
n
)
=
_

X
1
() x
1
, . . . , X
n
() x
n
_
K, x R
n
,
unde X
i
si x
i
, i = 1, n, reprezint a respectiv componentele vectorului aleator X si
ale vectorului x.
2.3 Functie de repartitie
Fie c ampul de probabilitate (, K, P) si variabila aleatoare X: R.
Denitia 2.3.1. Numim funct ie de repartit ie atasat a variabilei aleatoare X, aplicat ia
F : R R, denit a prin
(2.3.1) F (x) = P (X x) , x R.
Observatia 2.3.2. Marea majoritate a tratatelor de teoria probabilit at ilor denesc
funct ia de repartit ie prin formula
F (x) = P (X < x) , x R,
dar av and n vedere c a sistemul Matlab foloseste formula (2.3.1), n denirea funct iei
de repartit ie, vom considera aceast a abordare n cele ce urmeaz a.
64 Elemente de teoria probabilit at ilor
Denitia 2.3.3. Numim funct ie de repartit ie atasat a vectorului aleator ndimensio-
nal X, aplicat ia F : R
n
R, denit a prin
F (x) = F (x
1
, . . . , x
n
) = P (X
1
x
1
, . . . , X
n
x
n
) , x R
n
.
Fie vectorul aleator X cu funct ia de repartit ie F si e notat a respectiv prin F
i
funct ia de repartit ie a variabilei aleatoare X
i
, care este componenta i a vectorului
aleator, pentru ecare i = 1, n.
Denitia 2.3.4. Spunem c a variabilele aleatoare X
i
, i = 1, n, sunt independente
dac a
F (x) = F (x
1
, . . . , x
n
) = F
1
(x
1
) . . . F
n
(x
n
) , x R
n
.
2.4 Legi de probabilitate de tip discret
Dac a variabila aleatoare X este de tip discret, adic a are un num ar cel mult num arabil
de valori, e acestea x
i
R, i I, atunci funct ia de repartit ie F atasat a este o funct ie
n scar a si este dat a prin:
(2.4.1) F (x) =

iI
x
i
x
p
i
, x R,
unde p
i
= P (X = x
i
).
Denitia 2.4.1. Numim distribut ia sau repartit ia variabilei aleatoare X de tip discret,
tabloul
X
_
x
i
p
i
_
iI
,
unde x
i
R, i I, sunt valorile pe care le ia variabila aleatoare X, iar p
i
este
probabilitatea cu care variabila aleatoare X ia valoarea x
i
, adic a p
i
= P (X = x
i
),
pentru ecare i I.
Deoarece evenimentele (X = x
i
), i I, formeaz a un sistem complet de eveni-
mente, avem c a

iI
p
i
= 1. Remarc am de asemenea c a p
i
, reprezint a m arimea
saltului funct iei de repartit ie n punctul de discontinuitate x
i
, pentru ecare i I.

In teoria probabilit at ilor si n aplicat iile sale, se nt alnesc clase de variabile alea-
toare de tip discret. Forma cea mai general a a unei variabile aleatoare apart in and unei
clase se numeste lege de probabilitate de tip discret.
2.4. Legi de probabilitate de tip discret 65
2.4.1 Functiile Matlab pdf si cdf
Distribut ia variabilei aleatoare X poate precizat a prin ceea ce numim funct ie de
probabilitate ( pdf probability distribution function, n Matlab) denit a prin:
f (x
i
) = p
i
, i I,
sau prin funct ia de repartit ie ( cdf cumulative distribution function).
Dac a valorile p
i
, i I, sunt calculate, atunci folosind instruct iunile plot,
bar si stairs, se pot reprezenta grac funct ia de probabilitate (pdf) si funct ia
de repartit ie (cdf). Anume, dac a vectorul x cont ine valorile variabilei aleatoare X,
iar p probabilit at ile corespunz atoare, atunci intruct iunile
plot(x,p,s)
bar(x,p)
stairs(x,p)
vor reprezenta grac respectiv funct ia de probabilitate prin simbolul precizat prin s,
funct ia de probabilitate prin bare si funct ia de repartit ie (funct ie n scar a).
Remarc am faptul c a dac a X ia o innitate num arabil a de valori, atunci trebuie
s a ne limit am la un num ar nit de valori ale variabilei aleatoare, iar reprezent arile
grace se vor face pe domeniul cuprins ntre valorile minim a si maxim a ale acestora.
Programul 2.4.2. S a consider am variabila aleatoare X care are distribut ia
X
_
1 0 1
1
3
1
6
1
2
_
si vrem s a reprezent am grac funct ia de probabilitate (prin puncte si bare) si funct ia
de repartit ie pe aceeasi gur a.
Am putea presupune c a variabila aleatoare X se refer a la aruncarea unui zar.
Anume, dac a n urma arunc arii zarului se obt ine un num ar compus (4 sau 6), atunci
se pierde o miz a (X = 1), dac a se obt ine un num ar prim (2, 3 sau 5) se c astig a o
miz a (X = 1), altfel nu se c astig a si nu se pierde nimic (X = 0).
Urm atorul program
x = [-1:1]; p = [1/3,1/6,1/2];
pc = [1/3,1/2,1];
subplot(1,3,1), plot(x,p,o)
axis([-1.5 1.5 0 1])
title(Functia de probabilitate)
subplot(1,3,2), bar(x,p)
axis([-1.5 1.5 0 1])
title(Functia de probabilitate)
subplot(1,3,3), stairs(x,pc)
title(Functia de repartitie)
produce reprezent arile grace din Figura 2.1.
66 Elemente de teoria probabilit at ilor
1 0 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Functia de probabilitate
1 0 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Functia de probabilitate
1 0 1
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Functia de repartitie
Figura 2.1: Funct ia de frecvent a si funct ia de repartit ie
Sistemul Matlab dispune de funct ii (instruct iuni) care calculeaz a valorile funct iei
de probabilitate si ale funct iei de repartit ie pentru legile de probabilitate implementate
prin Statistics toolbox.
Functia pdf
Dou a moduri de apel pentru calculul valorilor funct iei pdf avem:
p=pdf(legea,x,par1,par2,...)
p=numef(x,par1,par2,...)
unde legea este un sir de caractere predenit pentru ecare din legile de probabili-
tate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt pdf, iar cele ce le preced sunt cele care dau numele predenit al legii de
probabilitate (ca si cele din parametrul legea).

In urma execut arii uneia din cele dou a instruct iuni, se calculeaz a matricea p
a probabilit at ilor legii precizat a prin parametrii legea, respectiv numef, core-
spunz atoare valorilor date prin matricea x si av and parametrii dat i prin matricele
par1, par2,... Aceste matrice trebuie s a e de aceleasi dimensiuni, cu except ia c a
dac a unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiuni
cu celelalte si care iau valorile scalarilor corespunz atori.
Functia cdf
S i pentru calculul valorilor funct iei de repartit ie funct ia cdf avem dou a forme de
apel
2.4. Legi de probabilitate de tip discret 67
cp=cdf(legea,x,par1,par2,...)
cp=numef(x,par1,par2,...)
unde legea este un sir de caractere predenit pentru ecare din legile de probabili-
tate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt cdf, iar cele ce le preced sunt cele care dau numele predenit al legii de
probabilitate (ca si cele din parametrul legea).

In urma execut arii uneia din cele dou a instruct iuni, se calculeaz a matricea cp a
probabilit at ilor cumulate (valorile funct iei de repartit ie) a legii precizat a prin legea
respectiv numef, corespunz atoare valorilor date prin matricea x si av and parametrii
dat i prin matricele par1, par2,... Aceste matrice trebuie s a e de aceleasi dimensi-
uni, cu except ia c a dac a unele sunt scalari, acestia se extind la matricele constante de
aceleasi dimensiuni cu celelalte si care iau valorile scalarilor corespunz atori.
2.4.2 Legi de probabilitate de tip discret clasice
Vom prezenta n continuare legile de probabilitate de tip discret recunoscute de sis-
temul Matlab, prin pachetul de programe Statistics toolbox.

In parantez a, pentru
ecare lege de probabilitate sunt trecute si denumirile acceptate de sistemul Matlab.
Facem observat ia c a pentru unele funct ii sunt acceptate si alte denumiri.
Legea lui Bernoulli
Variabila aleatoare X urmeaz a legea lui Bernoulli, pe care o not am Be (p), dac a are
distribut ia
(2.4.2) X
_
1 0
p q
_
, unde p (0, 1), q = 1 p.
Legea lui Bernoulli modeleaz a un fenomen aleator n desf asurarea c aruia suntem
interesat i n aparit ia unui eveniment xat A, pe care l vom numi succes, respectiv
a lui

A numit insucces. Probabilitatea obt inerii succesului este p, iar valoarea cores-
punz atoare a variabilei aleatoare X este 1, respectiv q = 1 p este probabilitatea
producerii insuccesului, cu valoarea 0 corespunz atoare pentru X.
Funct ia de probabilitate este
f (x| p) = p
x
q
1x
, x = 0, 1.
68 Elemente de teoria probabilit at ilor
Legea uniform a discret a (unid)
Variabila aleatoare X urmeaz a legea uniform a discret a, not am U (N), dac a are
distribut ia
(2.4.3) X
_
k
1
N
_
k=1,N
, unde N N.
Funct ia de probabilitate este
f (x| N) =
1
N
, x = 1, N.
Legea binomial a (bino)
Spunem c a variabila aleatoare X urmeaz a legea binomial a, not am B(n, p), dac a are
distribut ia
(2.4.4) X
_
k
P (n, k)
_
k=0,n
, unde P (n, k) =
_
n
k
_
p
k
q
nk
,
iar p (0, 1) si q = 1 p.
Variabila aleatoare X reprezint a num arul succeselor obt inute n n repet ari inde-
pendente ale unui experiment.
Descoperirea legii binomial a este atribuit a lui James Bernoulli si care se a a n
cartea Ars Conjectandi (1713). Pascal a considerat cazul particular p =
1
2

Funct ia de probabilitate este


f (x| n, p) =
_
n
x
_
p
x
q
nx
, x = 0, n.
Remarc am faptul c a variabila aleatoare X se obt ine ca suma a n variabile alea-
toare independente, ce urmeaz a ecare legea lui Bernoulli Be (p). Prin urmare, putem
spune si faptul c a legea lui Bernoulli Be (p) se obt ine din legea binomial a B (n, p),
pentru n = 1.
Programul 2.4.3. S a scriem un program Matlab care s a reprezinte grac funct ia de
probabilitate (prin puncte si prin bare) si funct ia de repartit ie ale legii de probabilitate
B (n, p).
Executarea programului
2.4. Legi de probabilitate de tip discret 69
n = input(n=);
p = input(p=); x = 0:n;
f = pdf(bino,x,n,p);
subplot(1,3,1), plot(x,f,o)
axis([-0.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
subplot(1,3,2), bar(x,f)
axis([-.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
f = cdf(bino,x,n,p);
subplot(1,3,3), stairs(x,f)
title(Functia de repartitie)
axis([0 n 0 1])
pentru n=7 si p=0.3, realizeaz a gracele din Figura 2.2.
0 2 4 6
0
0.05
0.1
0.15
0.2
0.25
0.3
Functia de probabilitate
0 1 2 3 4 5 6 7
0
0.05
0.1
0.15
0.2
0.25
0.3
Functia de probabilitate
0 2 4 6
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Functia de repartitie
Figura 2.2: Legea binomial a B(7, 0.3)
Legea hipergeometric a (hyge)
Spunem c a variabila aleatoare X urmeaz a legea hipergeometric a si vom nota prin
H(n, M, K), dac a are distribut ia
(2.4.5) X
_
k
P (n, k)
_
k=0,n
, unde P (n, k) =
_
K
k
__
MK
nk
_
_
M
n
_ , iar n K M.
Variabila aleatoare X reprezint a num arul succeselor obt inute n n extrageri dintr
o populat ie de volum M, f ar a ntoarcere, dac a num arul indivizilor cu proprietatea
cercetat a este K.
70 Elemente de teoria probabilit at ilor
Funct ia de probabilitate corespunz atoare este:
f (x| n, M, K) =
_
K
x
__
MK
nx
_
_
M
n
_ , x = 0, n.
Observatia 2.4.4. Dac a se noteaz a p =
K
M
si q =
MK
M
, adic a probabilit at ile ca la
prima extragere s a se obt in a succes, respectiv insucces, iar M , atunci
P (n, k)
_
n
k
_
p
k
q
nk
,
adic a se obt ine distribut ia binomial a.
Programul 2.4.5. Pentru a ilustra armat ia precedent a, s a scriem un program Matlab
care s a reprezinte grac prin bare funct iile de probabilitate pentru H(n, M, K) si
B (n, p), cu p =
K
M

Executarea programului
clf;
M = input(M:);
K = input(K(K<=M):);
n = input(n(n<=K):)
x = 0:n; p=K/M;
fh = pdf(hyge,x,M,K,n);
fb = pdf(bino,x,n,p);
bar(x,[fh,fb])
colormap winter
pentru M=100, K=40 si n=10, realizeaz a gracul din Figura 2.3.
Legea lui Poisson (poiss)
Variabila aleatoare X urmeaz a legea lui Poisson, vom nota Po (), dac a are
distribut ia
(2.4.6) X
_
k
p
k
()
_
k=0,1,2,...
, unde p
k
() =

k
k!
e

, iar > 0.
Funct ia de probabilitate corespunz atoare este
f (x| ) =

x
x!
e

, x = 0, 1, ...
Variabila aleatoare X, care urmeaz a legea lui Poisson, num ar a de c ate ori apare
un anumit eveniment ntrun interval de tip, pe o distant a, pe o suprafat a etc. Poisson
2.4. Legi de probabilitate de tip discret 71
0 1 2 3 4 5 6 7 8 9 10
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
Figura 2.3: Legea hipergeometric a H(10, 100, 40) si legea binomial a B(10, 0.4)
(1837) a ar atat c a legea, carei poart a numele, este un caz limit a a legii binomiale,
anume c and np , pentru n . Altfel spus, c and n este mare, p trebuie s a
e mic, adic a probabilitatea producerii evenimentului considerat este mic a, de aici
denumirea de lege a evenimentelor rare.
Mai remarc am un rezultat cunoscut, care stabileste leg atura dintre legea lui Pois-
son si legea exponent ial a, care va prezentat a mai ncolo. Anume, pe c and legea lui
Poisson num ar a evenimentele ce apar ntrun interval de timp, legea exponent ial a d a
lungimea intervalului dintre dou a aparit ii consecutive ale evenimentelor.
Programul 2.4.6. Vom scrie un program Matlab, care s a reprezinte grac prin bare
funct iile de probabilitate pentru B (n, p) si Po () cu = np.
Av and n vedere comportarea legii B (n, p), c and n , gracele funct iilor de
probabilitate pentru cele dou a legi de probabilitate trebuie s a se apropie.
Mai remarc am faptul c a legea Po () are o innitate (num arabil a) de valori, prin
urmare n reprezentarea grac a pentru aceast a lege de probabilitate ne vom limita la
un num ar nit de valori. Anume, vom considera numai valorile ntregi din intervalul
_
3

, + 3

_
, alegere care va justicat a mai t arziu.
Programul
clf;
n = input(n=); p = input(p=);
lambda = n
*
p;
vi = fix(lambda-3
*
sqrt(lambda));
vf = fix(lambda+3
*
sqrt(lambda));
x = vi:vf;
72 Elemente de teoria probabilit at ilor
fb = binopdf(x,n,p);
fl = poisspdf(x,lambda);
colormap autumn
bar(x,[fb,fl])
pentru n=100 si p=0.05, realizeaz a gracul din Figura 2.4.
1 0 1 2 3 4 5 6 7 8 9 10 11
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
Figura 2.4: Legea binomial a B (100, 0.05) si legea Poisson Po (5)
Legea binomial a negativ a (nbin)
Spunem c a variabila aleatoare X urmeaz a legea binomial a negativ a sau legea lui
Pascal, notat a BN (r, p), dac a are distribut ia
X
_
k
P (r, k)
_
k=0,1,2,...
, cu P (r, k) =
_
r +k 1
k
_
p
r
q
k
,
iar p (0, 1) si q = 1 p. Variabila aleatoare X ce urmeaz a legea BN (r, p)
reprezint a num arul insucceselor p an a la aparit ia succesului de rang r, dac a repet arile
sunt considerate independente.
Funct ia de probabilitate corespunz atoare legii BN (r, p) este
f (x| r, p) =
_
r +x 1
k
_
p
r
q
x
, x = 0, 1, ...
Observatia 2.4.7. Unele tratate consider a c a o variabil a aleatoare X ce urmeaz a
legea lui Pascal reprezint a rangul repet arii la care se produce succesul cu num arul r.
2.5. Legi de probabilitate continue 73
Dac a se are n vedere aceast a denit ie se obt ine distribut ia
(2.4.7) X
_
k
P (r, k)
_
k=1,2,...
, cu P (r, k) =
_
k 1
r 1
_
p
r
q
kr
.
Legea geometric a (geo)
Legea geometric a, notat a Ge (p), se obt ine ca si caz particular, r = 1, al legii
BN (r, p). Prin urmare variabila aleatoare X urmeaz a legea Ge (p), dac a are
distribut ia
X
_
k
pq
k
_
k=0,1,2,...
, p (0, 1) , p +q = 1,
si reprezint a num arul insucceselor p an a la aparit ia primului succes.
Funct ia de probabilitate pentru legea Ge (p) este
f (x| p) = pq
x
, x = 0, 1, ...
De remarcat faptul c a dac a se adun a r variabile aleatoare independente, ecare
urm and legea Ge (p), atunci se obt ine o variabil a aleatoare ce urmeaz a legea
BN (r, p).
Observatia 2.4.8. Corespunz ator observat iei de la legea lui Pascal, avem c a unele
tratate consider a c a o variabil a aleatoare X ce urmeaz a legea geometric a reprezint a
rangul repet arii la care se produce primul succes. Dac a se are n vedere aceast a
denit ie se obt ine distribut ia
(2.4.8) X
_
k
pq
k1
_
k=1,2,...
2.5 Legi de probabilitate continue
Denitia 2.5.1. Fie variabila aleatoare X av and funct ia de repartit ie F. Vom spune
c a X este variabil a aleatoare (absolut) continu a, dac a funct ia de repartit ie F este
absolut continu a, sau echivalent se poate reprezenta sub forma
F (x) =
_
x

f (t) dt, pentru orice x R,


funct ia f : R R, numinduse densitatea de probabilitate a variabilei alea-
toare X.
74 Elemente de teoria probabilit at ilor
Denitia 2.5.2. Fie vectorul aleator X av and funct ia de repartit ie F. Spunem c a X
este vector aleator de tip continuu, dac a funct ia de repartit ie F se poate reprezenta
sub forma
F (x) = F (x
1
, . . . , x
n
) =
_
x
1

. . .
_
xn

f (t
1
, . . . , t
n
) dt
1
. . . dt
n
, x R
n
,
funct ia f : R
n
R, numinduse densitatea de probabilitate a vectorului aleator X.
Ca la variabilele aleatoare de tip discret si la cele de tip continuu exist a clase
de variabile aleatoare. Forma cea mai general a a densit at ii de probabilitate a unei
variabile aleatoare din clasa respectiv a, ne d a o lege de probabilitate de tip continuu.
Functiile Matlab pdf si cdf
Distribut ia variabilei aleatoare X de tip continuu poate precizat a prin funct ie den-
sitate de probabilitate (pdf probability density function) sau prin funct ia de
repartit ie (cdf cumulative distribution function).
Reprezent arile grace ale densit at ii de probabilitate si funct iei de repartit ie n
Matlab se fac folosind instruct iunea de tip plot.
Valorile densit at ii de probabilitate f si ale funct iei de repartit ie F, pentru legile
de probabilitate implementate prin Statistics toolbox, ca si n cazul discret, se obt in
cu ajutorul funct iilor Matlab pdf si respectiv cdf. Trebuie ns a s a t inem seama c a
f este continu a (eventual cu o mult ime cel mult num arabil a de puncte de discontinu-
itate), iar F nu mai este o funct ie n scar a. Prin urmare, pentru asigurarea netezimii
gracelor se impune s a e considerat un num ar sucient de puncte ale gracelor
acestor funct ii.
2.5.1 Legi de probabilitate continue clasice
Prezent am si n acest caz legile de probabilitate de tip continue recunoscute de sis-
temul Matlab, prin pachetul de programe Statistics toolbox.
Legea uniform a (unif)
Spunem c a variabila aleatoare X urmeaz a legea uniform a pe intervalul [a, b], si vom
nota U (a, b), dac a are densitatea de probabilitate
f (x| a, b) =
_

_
1
b a
, dac a x [a, b],
0, dac a x / [a, b].
2.5. Legi de probabilitate continue 75
Funct ia de repartit ie pentru variabila aleatoare X, ce urmeaz a legea uniform a pe in-
tervalul [a, b], este
(2.5.1) F (x| a, b) =
_
x

f (t | a, b) dt =
_

_
0, dac a x < a,
x a
b a
, dac a a x b,
1, dac a x > b.
Denumirea de lege uniform a este legat a de faptul c a dac a se consider a subin-
tervale ale intervalului [a, b] de lungimi egale, s a zicem c a au lungimea , atunci
probabilitatea ca variabila aleatoare X s a ia valori ntrun astfel de interval este
/ (b a). Adic a, aceast a probabilitate nu depinde de pozit ia subintervalului, ci nu-
mai de lungimea lui. Intuitiv, am putea spune c a valorile nt ampl atoare (aleatoare) ale
funct iei X sunt uniform r asp andite pe intervalul [a, b]. Acest lucru nu se nt ampl a
la alte legi de probabilitate, c and aceste valori sunt grupate n jurul uneia sau mai
multor valori pe care le ia variabila aleatoare X.
Programul 2.5.3. S a reprezent am grac densitatea de probabilitate f si funct ia de
repartit ie F pentru legea U (a, b).
Programul Matlab care urmeaz a
clf;
a = input(a=); b = input(b=);
x = a-1:0.01:b+1;
f = pdf(unif,x,a,b);
F = cdf(unif,x,a,b);
subplot(1,2,1), plot(x,f,k-)
axis([a-1 b+1 -0.1 1/(b-a)+0.1])
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
axis([a-1 b+1 -0.1 1.1])
title(Functia de repartitie)
pentru a=1 si b=4, realizeaz a gracele din Figura 2.5.
Putem remarca faptul c a funct ia de repartit ie este continu a. Astfel valorile ar-
gumentului x = a si x = b n formula (2.5.1) pot atasate respectiv la cazurile
F (x) = 0 si F (x) = 1. Prin urmare intervalul pe care densitatea de probabilitate
este diferit a de zero poate interval nchis la ambele capete, nchis la un cap at si
deschis la cel alalt, respectiv deschis la ambele capete.

In toate aceste cazuri vom
considera c a avem legea uniform a de probabilitate U (a, b).
Proprietatea 2.5.4. Dac a variabila aleatoare U urmeaz a legea uniform a pe inter-
valul [0, 1], adic a U (0, 1), numit a si lege uniform a standard, si dac a a < b, atunci
variabila aleatoare
X = (b a) U +a,
76 Elemente de teoria probabilit at ilor
0 1 2 3 4 5
0.1
0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Densitatea de probabilitate
0 1 2 3 4 5
0
0.2
0.4
0.6
0.8
1
Functia de repartitie
Figura 2.5: Legea uniform a pe [1, 4]
urmeaz a legea uniform a U (a, b).
Legea normal a (norm)
Spunem c a variabila aleatoare X urmeaz a legea normal a (legea GaussLaplace) de
parametri R si > 0, not am aceasta prin N (m, ), dac a are densitatea de
probabilitate
f (x| , ) =
1

2
e

(x)
2
2
2
, pentru orice x R.
Funct ia de repartit ie pentru legea normal a standard N (0, 1) este
(x) =
1

2
_
x

t
2
2
dt, x R,
si se numeste funct ia lui Laplace.

In Matlab (si nu numai) exist a o funct ie erf (funct ia eroare):


erf(x) =
2

_
x
0
e
t
2
dt,
care veric a relat ia
erf(x) = 2
_
x

2
_
1.
2.5. Legi de probabilitate continue 77
Remarc am c a funct ia

(x) =
1

2
_
x
0
e

t
2
2
dt, x R,
se numeste de asemenea funct ia lui Laplace.

Intre cele dou a funct ii Laplace exist a
relat ia
(x) =
1
2
+

(x) .
Folosind cele dou a funct ii ale lui Laplace avem:
F (x| , ) =
_
x

f (t | , ) dt =
1

2
_
x

(t)
2
2
2
dt
=
_
x

_
=
1
2
+

_
x

_
.
Programul 2.5.5. Vom reprezenta grac densitatea de probabilitate f pentru legea
N (, ) si funct ia de repartit ie F corespunz atoare.
Execut ia programului
clf;
m = input(mu=); s = input(sigma=);
x = m-3
*
s:0.01:m+3
*
s;
f = pdf(norm,x,m,s);
F = cdf(norm,x,m,s);
subplot(1,2,1), plot(x,f,k-)
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
title(Functia de repartitie)
pentru mu=0 si sigma=1, produce gracele din Figura 2.6.
Observatia 2.5.6. Dac a se consider a variabilele aleatoare X
k
, k = 1, n, indepen-
dente, ecare urm and respectiv legile normale N (
k
,
k
), atunci combinat ia liniar a
Z =
n

k=1
a
k
X
k
, a
k
R,
n

k=1
a
2
k
> 0,
este o variabil a aleatoare ce urmeaz a legea normal a N (, ), unde
=
n

k=1
a
k

k
,
2
=
n

k=1
a
2
k

2
k
.
78 Elemente de teoria probabilit at ilor
4 2 0 2 4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Densitatea de probabilitate
4 2 0 2 4
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Functia de repartitie
Figura 2.6: Legea normal a standard
Legea lognormal a (logn)
Variabila aleatoare X urmeaz a legea lognormal a de probabilitate si vom nota aceasta
prin LN (, ), dac a are densitatea de probabilitate
f (x| , ) =
1
x

2
e

(ln x)
2
2
2
, x > 0; R, > 0.
Dac a X urmeaz a legea lognormal a de parametri si , atunci variabila aleatoare
Y = ln X urmeaz a legea normal a (X = e
Y
).
Legea gamma (gam)
Variabila aleatoare X urmeaz a legea gamma, not am aceasta prin Ga (a, b), dac a are
densitatea de probabilitate
f (x| a, b) =
1
b
a
(a)
x
a1
e

x
b
, x > 0; a, b > 0,
unde (a) este funct ia lui Euler de spet a a doua, adic a
(a) =
_

0
x
a1
e
x
dx, a > 0.
C and a , legea gamma tinde la legea normal a. Adic a, dac a X urmeaz a legea
Ga (a, b), atunci pentru a , variabila aleatoare poate considerat a ca urm and
legea N (, ), cu = ab si = b

a.
2.5. Legi de probabilitate continue 79
Programul 2.5.7. Pentru a ilustra aceast a ultim a armat ie, s a reprezent am grac, pe
aceeasi gur a, densit at ile de probabilitate pentru cele dou a legi, parametrii acestora
satisf ac and relat iile precizate mai sus.
Execut and programul
clf;
a = input(a=); b = input(b=);
m = a
*
b; s = b
*
sqrt(a);
x = m-3
*
s:0.01:m+3
*
s;
fn = pdf(norm,x,m,s);
fg = pdf(gam,x,a,b);
plot(x,fn,k-.,x,fg,k-)
legend(Legea normala,Legea gamma)
pentru a=100 si b=10, acesta produce gracele din Figura 2.7.
700 800 900 1000 1100 1200 1300
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
x 10
3
Legea normala
Legea gamma
Figura 2.7: Legile Ga (100, 10) si N (1000, 100)
Legea exponential a (exp)
Variabila aleatoare X urmeaz a legea exponent ial a, not am Exp (), dac a are densi-
tatea de probabilitate
f (x| ) =
1

, x > 0; > 0.
Observ am c a se obt ine ca si caz particular al legii Ga (a, b), c and se ia a = 1 si b = .
80 Elemente de teoria probabilit at ilor
Legea exponent ial a se aplic a la modelarea evenimentelor ce apar aleator n timp.
De asemenea are aplicat ii n studiile privind durata de viat a.
Legea beta (beta)
Variabila aleatoare X urmeaz a legea beta, notat a Beta (a, b), dac a are densitatea de
probabilitate:
f (x| a, b) =
1
B(a, b)
x
a1
(1 x)
b1
, x (0, 1) ; a, b > 0,
unde
B(a, b) =
_
1
0
x
a1
(1 x)
b1
,
este funct ia lui Euler de spet a nt ai.
Este cunoscut faptul c a dac a dou a variabile aleatoare independente U si V
urmeaz a legile Ga (a, 1) si Ga (b, 1), atunci variabila aleatoare X = U/(U + V )
urmeaz a legea Beta (a, b).
Dac a se consider a legea Beta (a, b), cu a = b =
1
2
, se obt ine legea de proba-
bililate arcsin, care are densitatea de probabilitate
f (x) =
1

_
(x(1 x))
, x (0, 1) .
Legea Weibull (weib)
Variabila aleatoare X urmeaz a legea lui Weibull, not am W(a, b), dac a are densitatea
de probabilitate
f (x| a, b) = abx
b1
e
ax
b
, x > 0; a, b > 0.
Legea a fost descoperit a de Weibull (1939) si modeleaz a rezistent a la rupere a ma-
terialelor. De asemenea se pare c a modeleaz a durata de viat a mai bine dec at legea
exponent ial a. Se observ a c a legea exponent ial a este un caz particular, anume se obt ine
c and a =
1

si b = 1.
Legea Rayleigh (rayl)
Variabila aleatoare X urmeaz a legea lui Rayleigh de probabilitate, notat a prin R(b),
dac a are densitatea de probabilitate:
f (x| b) =
x
b
2
e

x
2
2b
2
, x > 0; b > 0.
2.5. Legi de probabilitate continue 81
Se observ a c a este caz particular al legii Weibull, b = 2, a := 1/
_
2b
2
_
.
Dac a viteza unei particule n direct iile x si y sunt dou a variabile aleatoare in-
dependente, care urmeaz a legi normale de probabilitate, cu mediile zero si dispersi-
ile egale, atunci distant a parcurs a de particul a pe unitate de timp urmeaz a legea lui
Rayleigh.
2.5.2 Legi de probabilitate continue statistice
Prezent am legile de probabilitate de tip continuu, denumite astfel n sistemul Matlab,
prin pachetul de programe Statistics toolbox, deoarece utilizarea lor este str ans legat a
de statistic a.
Legea t (Student) (t)
Variabila aleatoare X urmeaz a legea t (Student) de probabilitate, notat a T (n), dac a
are densitatea de probabilitate
f (x| n) =

_
n+1
2
_

n
_
n
2
_
_
1 +
x
2
n
_

n+1
2
, x R,
n N (num arul gradelor de libertate).
Gosset (1908) a descoperit aceast a lege de probabilitate. Nu i-a fost permis s a
publice rezultatul, drept urmare a publicato sub pseudonimul Student.
Pentru n = 1, se obt ine legea de probabilitatea a lui Cauchy.
Dac a X
0
, X
1
, . . . , X
n
sunt independente, ecare urm and legea normal a de para-
metri = 0 si = 1, atunci
T =
X
0
_
1
n

n
k=1
X
2
k
,
urmeaz a legea T (n).
Dac a Y urmeaz a legea T (n), atunci
X =
1
2
+
1
2
Y

n +Y
2
urmeaz a legea Beta
_
n
2
,
n
2
_
.
C and n , se ajunge la legea normal a standard N (0, 1).
Programul 2.5.8. Pentru ilustrarea ultimei armat ii, vom scrie un program care s a
reprezinte pe aceeasi gur a gracele densit at ilor de probabilitate pentru legile T (n)
si N (0, 1).
Prin executarea programului Matlab
82 Elemente de teoria probabilit at ilor
clf;
n = input(n=); x = -3:0.01:3;
fn = normpdf(x,0,1); fs = tpdf(x,n);
plot(x,fn,k-.,x,fs,k-)
legend(Legea normala, Legea Student)
pentru n=10, acesta produce gracele din Figura 2.8.
3 2 1 0 1 2 3
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Legea normala
Legea Student
Figura 2.8: Legea T (10) si legea N (0, 1)
Legea t (Student) necentrat a (nct)
Legea t (Student) necentrat a, notat a T nc (n, ), generalizeaz a legea T (n) si are den-
sitatea de probabilitate
f (x| n, ) =

_
n+1
2
_

n
_
n
2
_e

2
2
_
1 +
x
2
n
_

n+1
2
h(x| n, ) , x R,
unde
h(x| n) =

k=0
_
t
_
(2)
n
_
k

_
n+k+1
2
_
k!
_
n+1
2
_
_
1 +
x
2
n
_

k
2
.
Programul 2.5.9. Programul Matlab ce urmeaz a reprezint a grac funct iile de
repartit ie pentru legile T (n) si T nc (n, ):
2.5. Legi de probabilitate continue 83
clf;
n = input(n=); d = input(delta=);
x = -5:0.01:5;
Fc = tcdf(x,n); Fnc = nctcdf(x,n,d);
plot(x,Fc,k-.,x,Fnc,k-)
legend(Legea Student,..
Legea Student necentrata,2)
Pentru n=10 si d=1, se obt in gracele din Figura 2.9.
5 4 3 2 1 0 1 2 3 4 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Legea Student
Legea Student necentrata
Figura 2.9: Legea T nc (10, 1) si legea T (10)
Legea
2
(chi2)
Variabila aleatoare X urmeaz a legea
2
sau legea HelmertPearson, vom nota prin

2
(n), dac a are densitatea de probabilitate:
f (x| n) =
1
2
n
2

_
n
2
_x
n
2
1
e

x
2
, x > 0,
n N (num arul gradelor de libertate).
Legea
2
(n) este un caz particular al legii Ga (a, b), c and a =
n
2
, iar b = 2.
Dac a X
1
, X
2
, . . . , X
n
sunt independente, ecare urm and legea normal a de para-
metri = 0 si = 1, atunci variabila aleatoare

2
=
n

k=1
X
2
k
,
84 Elemente de teoria probabilit at ilor
urmeaz a legea
2
(n), iar dac a variabilele aleatoare independente X si Y urmeaz a
respectiv legile N (0, 1) si
2
(n), atunci variabila aleatoare
T =
X
_
Y
n
urmeaz a legea T (n).
Dac a variabila aleatoare X urmeaz a legea
2
(n), atunci, pentru n , vari-
abila aleatoare urmeaz a legea N (, ), cu = n si =

2n.
Programul 2.5.10. Pentru ilustrarea armat iei, scriem un program care s a repre-
zinte pe aceeasi gur a gracele densit at ilor de probabilitate pentru legile
2
(n) si
N
_
n,

2n
_
.
Prin executarea programului Matlab
clf;
n = input(n=); s = sqrt(2
*
n);
x = n-3
*
s:0.01:n+3
*
s;
fn = normpdf(x,n,s); fchi = chi2pdf(x,n);
plot(x,fn,k-.,x,fchi,k-)
legend(Legea normala, Legea chi2,2)
pentru n=10, se obt in gracele din Figura 2.10.
0 5 10 15 20 25 30 35 40 45 50
0
0.01
0.02
0.03
0.04
0.05
0.06
Legea normala
Legea chi2
Figura 2.10: Legea
2
(10) si legea N
_
10, 2

5
_
2.5. Legi de probabilitate continue 85
Legea
2
necentrat a (ncx2)
S a not am prin
2
n
o variabil a aleatoare ce urmeaz a legea
2
(n). Spunem c a variabila
aleatoare X urmeaz a legea
2
necentrat a, dac a are funct ia de repartit ie:
F (x| n, ) =

k=0
_

2
_
k
e

2
k!
P
_

2
n+2k
x
_
.
Programul 2.5.11. Programul Matlab ce urmeaz a reprezint a grac densit at ile de
probabilitate pentru legea
2
(n) si legea
2
(n, ) necentrat a corespunz atoare:
clf;
n = input(n=); d = input(delta=);
x = 0:0.01:15;
c = chi2pdf(x,n); fnc = ncx2pdf(x,n,d);
plot(x,fc,k-.,x,fnc,k-)
legend(Legea chi2, Legea chi2 necentrata)
Pentru n=4 si d=2, se obt in gracele din Figura 2.11.
0 5 10 15
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
Legea chi2
Legea chi2 necentrata
Figura 2.11: Legea
2
(4, 2) si legea
2
(4)
Legea F (FisherSnedecor) (f)
Variabila aleatoare X urmeaz a legea F (FisherSnedecor), notat a F (m, n), dac a are
densitatea de probabilitate:
f (x| m, n) =

_
m+n
2
_

_
m
2
_

_
n
2
_
_
m
n
_m
2
x
m
2
1
_
1 +
m
n
x
_

m+n
2
, x > 0;
86 Elemente de teoria probabilit at ilor
m, n N (num arul gradelor de libertate)
Dac a variabilele aleatoare independente X si Y urmeaz a legile
2
(m) si
2
(n),
atunci
F =
X
m
_
Y
n
urmeaz a legea F (m, n).
Dac a variabila aleatoare T urmeaz a legea T (n), atunci T
2
va urma legea
F (1, n).
Dac a variabila aleatoare X urmeaz a legea F (m, n), atunci transformata lui
Fisher, adic a Z =
log X
2
, urmeaz a legea N (, ), c and m, n , unde
(2.5.2) =
1
2
_
1
n

1
m
_
, =

1
2
_
1
n
+
1
m
_

Programul 2.5.12. Programul care urmeaz a reprezint a pe aceeasi gur a gracele


densit at ilor de probabilitate pentru transformata lui Fisher Z si legea N (, ), unde
si au valorile date prin (2.5.2).
Remarc am faptul c a densitatea de probabilitate a variabilei aleatoare Z este
f
Z
(x) = 2e
2x
f
X
_
e
2x
| m, n
_
.
clf
m = input(m=); n = input(n=);
mu = (1/n-1/m)/2; s = sqrt((1/n+1/m)/2);
x = mu-3
*
s:0.01:mu+3
*
s;
f1 = normpdf(x,mu,s);
f2 = 2
*
exp(2
*
x).
*
fpdf(exp(2
*
x),m,n);
plot(x,f1,k-.,x,f2,k-)
legend(Legea normala,Transformata Fisher,2)
Pentru m=20 si n=30, se obt in gracele din Figura 2.12.
Legea F (FisherSnedecor) necentrat a (ncf)
Dac a variabilele aleatoare independente X si Y urmeaz a respectiv legile
2
(m, )
necentrat a si
2
(n, ) necentrat a, atunci
F =
X
m
_
Y
n
urmeaz a legea F (FisherSnedecor) necentrat a, notat a prin Fnc (m, n, ).
Funct ia de repartit ie pentru variabila aleatoare legea Fnc (m, n, ) este
F (x| m, n, ) =

k=0
_

2
_
k
e

2
k!
I
_
mx
n +mx

m
2
+k,
n
2
_
,
2.5. Legi de probabilitate continue 87
0.8 0.6 0.4 0.2 0 0.2 0.4 0.6
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
Legea normala
Transformata Fisher
Figura 2.12: Transformata Fisher si legea normal a corespunz atoare
unde I (x| a, b) este funct ia Beta incomplet a de parametrii a, b > 0.
Programul 2.5.13. Programul Matlab ce urmeaz a reprezint a grac densit at ile de
probabilitate pentru legile F (m, n) si Fnc (m, n, ):
clf;
m = input(m=); n = input(n=);
d = input(delta=);
x = 0:0.01:10.01;
Fc = fpdf(x,m,n); Fnc = ncfpdf(x,m,n,d);
plot(x,Fc,k-.,x,Fnc,k-)
legend(Legea F, Legea F necentrata)
Pentru m=5, n=20 si d=10, se obt in gracele din Figura 2.13.
2.5.3 Functia Matlab normspec
Av and n vedere c a legea normal a joac a un rol important n teoria probabilit at ilor
si n statistic a, sistemul Matlab i acord a la r andul s au o atent ie special a. Astfel, n
sistemul Matlab de baz a exist a funct ia normspec, cu urm atoarele moduri de apel:
normspec(sp,mu,sigma)
p = normspec(sp,mu,sigma)
Funct ia normspec reprezint a grac densitatea de probabilitate a legii normale de
parametrii mu si sigma si umbreste aria m arginit a de dreptele perpendiculare pe
axa absciselor ce trec prin punctele axei precizate prin cele dou a componente ale
vectorului sp, curba ce reprezint a gracul densit at ii de probabilitate si axa absciselor.
Parametrul p, dup a execut ia funct iei normspec, cont ine valoarea ariei umbrite,
adic a probabilitatea ca variabila aleatoare s a ia valori din intervalul precizat prin sp.
88 Elemente de teoria probabilit at ilor
0 2 4 6 8 10 12
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Legea F
Legea F necentrata
Figura 2.13: Legea Fnc (5, 20, 10) si legea F (5, 20)
Programul 2.5.14. Programul Matlab ce urmeaz a va reprezenta grac densitatea
de probabilitate a legii N (, ) si va umbri aria cuprins a ntre dreptele de ecuat ii
x = a si x = b (a < b), curba ce reprezint a gracul densit at ii de probabilitate si axa
absciselor.
m = input(mu=); s = input(sigma=);
a = input(a:); b = input(b (b>a):);
p = normspec([a,b],m,s);
xlabel([a= ,num2str(a), b= ,num2str(b)])
ylabel(Densitatea de probabilitate)
title([Probabilitatea intre a si b : ,num2str(p)])
Execut and acest program cu valorile de intrare mu=0, sigma=1, a=-1.5 si b=2,
se obt ine gracul din Figura 2.14.
Se observ a c a instruct iunea title cont ine parametrul num2str(p), care
transform a valoarea numeric a a lui p ntrun sir de caractere.
2.5.4 Distributie marginal a
Fie vectorul aleator X = (X
1
, . . . , X
n
) si vectorul aleator

X = (X
i
1
, . . . , X
i
k
),
unde 1 k n, iar 1 i
1
< < i
k
n.
Denitia 2.5.15. Numim distribut ie marginal a a vectorului distribut ia vectorului

X.
Dac a F este funct ia de repartit ie a vectorului X, iar F
i
1
...i
k
este funct ia vectorului
aleator

X, numinduse funct ie de repartit ie marginal a, atunci
F
i
1
...i
k
(x
i
1
, . . . , x
i
k
) = F (+, . . . , x
i
1
, . . . , x
i
k
, . . . , +) ,
2.5. Legi de probabilitate continue 89
4 3 2 1 0 1 2 3 4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Probabilitatea intre a si b : 0.91044
D
e
n
s
it
a
t
e
a

d
e

p
r
o
b
a
b
ilit
a
t
e
a= 1.5 b= 2
Figura 2.14: Legea N (0, 1)
adic a, pentru obt inerea funct iei de repartit ie a vectorului

X se fac s a tind a la toate
argumentele funct iei de repartit ie F, cu except ia argumentelor x
i
1
, . . . , x
i
k
.
Dac a vectorul aleator X este de tip continuu, av and densitatea de probabilitate f,
iar vectorul aleator

Xare densitatea de probabilitate f
i
1
...i
k
, care se numeste densitate
de probabilitate marginal a, atunci
f
i
1
...i
k
(x
i
1
, . . . , x
i
k
) =
_
+

. . .
_

f (x
1
, . . . , x
n
) dx
1
. . . / . . . / . . . dx
n
,
adic a f
i
1
...i
k
se obt ine integr and densitatea de probabilitate f pe R
nk
, n raport cu
toate variabilele independente, cu except ia variabilelor x
i
1
, . . . , x
i
k
.
2.5.5 Functie de repartitie conditionat a
Fie vectorul aleator bidimensional (X, Y ), av and funct ia de repartit ie F.
Denitia 2.5.16. Numim funct ie de repartit ie condit ionat a a variabilei aleatoare X
de c atre variabila aleatoare Y , funct ia F
X|Y
: R R, dat a prin
F
X|Y
(x|y) = P (X x| Y = y) , x R,
pentru ecare y R xat.
Trebuie s a remarc am faptul c a formula de denit ie se poate scrie sub forma
F
X|Y
(x|y) = lim
d0
P (X x| y d < Y y)
90 Elemente de teoria probabilit at ilor
sau
F
X|Y
(x|y) = lim
d0
P (X x, y d < Y y)
P (y d < Y y)
= lim
d0
F (x, y) F (x, y d)
F
Y
(y) F
Y
(y d)

Dac a vectorul aleator (X, Y ) este de tip discret, adic a are distribut ia dat a prin tabloul
bidimensional
X \ Y . . . y
j
. . .
.
.
.
.
.
.
x
i
. . . p
ij
. . .
.
.
.
.
.
.
atunci distribut ia variabilei aleatoare X condit ionat a de (Y = y
j
) este dat a prin
P (X = x
i
| Y = y
j
) =
P (X = x
i
, Y = y
j
)
P (Y = y
j
)
=
p
ij
p
j
,
unde p
j
= P (Y = y
j
) =

iI
p
ij
.
Remarc am de asemenea c a are loc formula
(2.5.3) p
i
= P (X = x
i
) =

jJ
p
j
p
i|j
,
unde p
i|j
= P (X = x
i
| Y = y
j
).
Dac a vectorul aleator (X, Y ) este de tip continuu, adic a are densitatea de proba-
bilitate f, atunci densitatea de probabilitate a variabilei aleatoare X condit ionat a de
(Y = y) este dat a prin
f
X|Y
(x| y) =
f (x, y)
f
Y
(y)
, pentru f
Y
(y) = 0.
Are loc formula (2.5.3) n variant a continu a:
f
X
(x) =
_
+

f
Y
(y) f
X|Y
(x|y) dy.
Exemplul 2.5.17 (Legea normal a multidimensional a). Vectorul aleator, notat prin
X, urmeaz a legea normal a multidimensional a, not am aceasta prin N (, V ), dac a
are densitatea de probabilitate
(2.5.4)
f (x| , V ) =
[det (A)]
1
2
(2)
n
2

exp
_

1
2
n

i,j=1
a
ij
(x
i

i
) (x
j

j
)
_
, x R
n
, R
n
,
2.5. Legi de probabilitate continue 91
unde V este o matrice p atratic a de ordin n pozitiv denit a, iar A este inversa matri-
cei V .
Dac a n = 2 si not am prin (X, Y ) vectorul aleator bidimensional corespunz ator,
densitatea de probabilitate devine
(2.5.5)
f (x, y) =
1
2
1

1 r
2

exp
_

1
2 (1r
2
)
_
(x
1
)
2

2
1
2r
(x
1
) (y
2
)

2
+
(y
2
)
2

2
2
__
,
unde
1
,
2
> 0 si | r | < 1.
Se cunoaste c a ecare din componentele X si Y ale vectorului aleator urmeaz a
legea normal a respectiv N (
1
,
1
) si N (
2
,
2
).
Densitatea de probabilitate condit ionat a se exprim a n acest fel prin:
(2.5.6) f
X|Y
(x|y) =
1

1
_
2 (1 r
2
)
e

(xm(y))
2
2(1r
2
)
2
1
,
unde m(y) =
1
+ r

2
(y
2
), adic a se obt ine densitatea de probabilitate a legii
normale N
_
m(y) ,
1

1 r
2
_
.
Programul 2.5.18. Scriem n cele ce urmeaz a un program Matlab, care reprezint a
grac densitatea de probabilitate a legii normale bidimensionale.
clf, clear
m1 = input(mu1=); m2 = input(mu2=);
s1 = input(sigma1=); s2 = input(sigma2=);
r = input(r(-1<r<1):);
x = m1-3
*
s1:.2:m1+3
*
s1; y = m2-3
*
s2:.2:m2+3
*
s2;
[X,Y] = meshgrid(x,y);
Z = 1/(2
*
pi
*
s1
*
s2
*
sqrt(1-r2))
*
exp(-1/(2
*
(1-r2))...
*
((X-m1).2/s12-2
*
r
*
(X-m1).
*
(Y-m2)/(s1
*
s2)...
+(Y-m2).2/s22));
mesh(X,Y,Z)
title(Legea normala bidimensionala)
Prin executarea acestui program, pentru m1=m2=0, s1=1, s2=2 si r=-0.5, se
obt ine gracul din Figura 2.15.
Programul 2.5.19. Programul Matlab care urmeaz a reprezint a grac densitatea de
probabilitate condit ionat a n cazul unui vector aleator ce urmeaz a legea normal a bidi-
mensional a.
clf, clear
m1 = input(mu1=); m2 = input(mu2=);
s1 = input(sigma1=); s2 = input(sigma2=);
92 Elemente de teoria probabilit at ilor
3
2
1
0
1
2
3
6
4
2
0
2
4
6
0
0.02
0.04
0.06
0.08
0.1
Legea normala bidimensionala
Figura 2.15: Legea N (0, 0; 1, 2; 0.5)
r = input(r(-1<r<1):);
Y(1:3) = input(Y(trei valori):);
m = m1+s1
*
r
*
(Y-m2)/s2; s = sqrt(1-r2)
*
s1;
MM = max(m); mm = min(m);
X = []; X = mm-3
*
s:0.01:MM+3
*
s;
hold on
for i=1:3
P = []; P = normpdf(X,m(i),s);
if i==1 plot(X,P,k-.), end
if i==2 plot(X,P,k-), end
if i==3 plot(X,P,k--), end
end
title(Legea normala conditionata)
Prin executarea acestui program, pentru m1=1, m2=0, s1=1, s2=2, r=-0.5 si
Y=[-2,0,2], se obt in gracele din Figura 2.16. Gracul marcat prin punctlinie
este pentru prima valoare a lui Y, cel cu linie continu a, pentru a doua valoare, iar prin
linie ntrerupt a, pentru a treia.
2.5.6 Functie de supravietuire. Functie hazard

In aplicat ii tehnice si nu numai, sunt utilizate si alte funct ii atasate variabilelor alea-
toare, pentru exprimarea mai potrivit a a fenomenului aleator cercetat.
Denitia 2.5.20. Dac a variabila aleatoare X are funct ia de repartit ie F, se numeste
2.5. Legi de probabilitate continue 93
2 1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Legea normala conditionata
Figura 2.16: Legea normal a condit ionat a pentru y = 2, 0, 2
funct ie de supraviet uire atasat a variabilei aleatoare X funct ia denit a prin:
S (x) = 1 F (x) = 1 P (X > x) , x R.
Se observ a c a dac a X reprezint a durata de viat a a unui individ, atunci S (x)
reprezint a probabilitatea ca durat a de viat a s a dep aseasc a un prag x dat.
Denitia 2.5.21. Dac a variabila aleatoare de tip continuu X are funct ia de repartit ie
F si densitatea de probabilitate f, se numeste funct ie hazard sau funct ie de risc
instantaneu atasat a variabilei aleatoare X funct ia denit a prin:
h(x) =
f (x)
S (s)
=
S

(x)
S (x)
, x R.
Av and n vedere denit ia densit at ii de probabilitate putem scrie
f (x) dx P (x X < x +dx) ,
de unde
h(x) dx
P (x X < x +dx)
P (X > x)
,
adic a
h(x) dx P (x X < x +dx| X > x) .
94 Elemente de teoria probabilit at ilor
Prin urmare h(x) ar reprezenta probabilitatea ca valoarea variabilei aleatoare X s a
r am an a neschimbat a ntrun interval imediat urm ator, de lungime mic a, dac a valoarea
ei a dep asit pragul x.
2.6 Caracteristici numerice
2.6.1 Valoare medie. Dispersie (variant a). Covariant a
Fie variabila aleatoare X av and funct ia de repartit ie F.
Denitia 2.6.1. Numim valoare medie sau sperant a matematic a, caracteristica nu-
meric a
(2.6.1) E (X) =
_
+

xdF (x) ,
unde integrala Stieltjes se impune s a e absolut convergent a pentru ca valoarea me-
die s a existe.
Observatia 2.6.2. Dac a variabila aleatoare este de tip discret, adic a are distribut ia
X
_
x
i
p
i
_
iI
, atunci integrala Stieltjes se reduce la o sum a, anume
E(X) =

iI
x
i
p
i
,
care exist a pentru cazul c and X este variabil a aleatoare simpl a, altfel se impune ca
seria ce apare n aceast a formul a s a e absolut convergent a.
Dac a variabila aleatoare este de tip continuu, adic a are densitatea de probabili-
tate f, atunci
E(X) =
_
+

xf (x) dx.
Mai remarc am faptul c a dac a X este un vector aleator ndimensional, iar funct ia
h: R
n
R este astfel nc at Y = h(X) s a e o variabil a aleatoare, atunci
E (Y ) =
_
+

xdF
Y
(x) =
_
+

. . .
_
+

h(x) dF
X
(x) ,
care n cazul continuu devine
E (Y ) =
_
+

xf
Y
(x) dx =
_
+

. . .
_
+

h(x) f
X
(x) .
2.6. Caracteristici numerice 95
Denitia 2.6.3. Numim dispersie sau variant a caracteristica numeric a atasat a vari-
abilei aleatoare X denit a prin:
(2.6.2) V ar (X) = E
_
(X E(X))
2
_
.
Remarc am formula de calcul V ar (X) = E
_
X
2
_
[E(X)]
2
.
Denitia 2.6.4. Dac a se consider a vectorul aleator bidimensional (X, Y ), numim
covariant a sau corelat ie, caracteristica numeric a
(2.6.3) Cov (X, Y ) = E [(X E(X)) (Y E (Y ))] ,
respectiv coecient de corelat ie, raportul
(2.6.4) r (X, Y ) =
Cov (X, Y )
_
V ar (X) V ar (Y )

Observatia 2.6.5. Pentru suma unui num ar nit de variabile aleatoare avem:
V ar
_
n

k=1
X
k
_
=
n

k=1
V ar (X
k
) + 2

i<k
Cov (X
i
, X
k
) ,
iar dac a variabilele aleatoare sunt independente dou a c ate dou a
V ar
_
n

k=1
X
k
_
=
n

k=1
V ar (X
k
) .
Denitia 2.6.6. Dac a avem vectorul aleator X = (X
1
, . . . , X
n
)

, numim valoare
medie, vectorul
E (X) = (E (X
1
) , . . . , E (X
n
))

,
respectiv matrice a covariant elor, matricea
V (X) = (Cov (X
i
, X
k
))
i,k=1,n
.
Observatia 2.6.7. Din cauza simetriei covariant ei, avem c a matricea covariant elor
este simetric a.
Dac a componentele vectorului aleator X sunt independente dou a c ate dou a,
atunci matricea covariant elor este o matrice diagonal a, pe diagonala principal a
a anduse dispersiile componentelor vectorului aleator.
Av and n vedere extinderea natural a a valorii medii la matrice aleatoare, putem
scrie:
V (X) = E [(X E(X)) (X E (X))

] .
96 Elemente de teoria probabilit at ilor
Teorema 2.6.8. Fie vectorul aleator X = (X
1
, . . . , X
n
)

si matricea A, de tipul
(m, n), cu elemente numere reale. Dac a se consider a vectorul Y = AX, atunci
(i) Y este un vector aleator;
(ii) valoarea medie a vectorului aleator Y este
E(Y ) = AE(X) sau E (Y

) = E(X

) A

;
(iii) matricea covariant elor vectorului aleator Y este dat a prin
(2.6.5) V (Y ) = AV (X) A

.
Demonstrat ie. (i) Transformarea liniar a a unui vector aleator este vector aleator.
(ii) Av and n vedere propriet at i ale valorii medii, pentru o component a a vectoru-
lui E(Y ), se poate scrie
E (Y
i
) = E
_
n

k=1
a
ik
X
k
_
=
n

k=1
a
ik
E(X
k
) ,
de unde rezult a E (Y ) = AE (X) .

In mod analog se arat a si a doua relat ie.


(iii) Se poate proceda ca si pentru valoarea medie, dac a se t ine seama de pro-
priet at i ale corelat iei. Se scrie succesiv:
Cov (Y
i
, Y
k
) = Cov
_
n

p=1
a
ip
X
p
,
n

q=1
a
kq
X
q
_
= E
__
n

p=1
a
ip
(X
p
E(X
p
))
__
n

q=1
a
kq
(X
q
E (X
q
))
__
=
n

p=1
n

q=1
a
ip
E[(X
p
E (X
p
)) (X
q
E(X
q
))] a
kq
=
n

p=1
n

q=1
a
ip
Cov (X
p
, X
q
) a
kq
,
de unde se obt ine relat ia (2.6.5).
Acelasi lucru se poate obt ine si prin folosirea relat iei de la punctul (ii). Anume,
2.6. Caracteristici numerice 97
se poate scrie:
V (Y ) = E [(Y E(Y )) (Y E (Y ))

]
= E [(AX AE(X)) (AX AE (X))

]
= E [A(X E(X)) (X E (X))

]
= AE [(X E(X)) (X E (X))

] A

= AV (X) A

,
de unde se obt ine din nou relat ia (2.6.5).
Proprietatea 2.6.9. Dac a V (X) este matricea covariant elor vectorului aleator X,
atunci aceasta este o matrice pozitiv semidenit a, adic a
a

V (X) a 0, a R
n
.
Demonstrat ie. Pornind din membrul drept al relat iei ce se doreste a demonstrat a,
putem scrie succesiv:
a

V (X) a =
n

i=1
n

k=1
a
i
a
k
Cov (X
i
, X
k
) = Cov
_
n

i=1
a
i
X
i
,
n

k=1
a
k
X
k
_
= V ar
_
n

i=1
a
i
X
i
_
0,
de unde se obt ine relat ia din enunt .
Proprietatea 2.6.10. Dac a matricea W este o matrice p atratic a pozitiv denit a,
adic a
a

V (X) a > 0, a R
n
\ { 0 } ,
atunci W poate considerat a matricea covariant elor unui vector aleator.
Demonstrat ie. Din algebra liniar a este cunoscut faptul c a o matrice pozitiv denit a
admite decompunerea
W = U

U sau = UWU

,
unde U

U = UU

= I, I ind matricea unitate, iar este o matrice diago-


nal a cu elementele numere pozitive. Putem face precizarea c a diagonala matricei
cont ine valorile proprii ale matricei W, iar matricea U este format a din vectorii pro-
prii ortonormat i corespunz atori.
98 Elemente de teoria probabilit at ilor
Consider am vectorul aleator Z av and matricea covariant elor I. Un astfel de vec-
tor aleator exist a, av and n vedere de exemplu vectorul aleator care are ca si compo-
nente variabile aleatoare independente ce urmeaz a ecare legea normal a N (0, 1).
Vectorul aleator X = U

1
2
Z va avea ca matrice a covariant elor chiar ma-
tricea W.

Intradev ar, dac a se t ine seama de relat ia (2.6.5), se obt ine:


V (X) = U

1
2
V (Z)
_
U

1
2
_

= U

1
2

1
2
U = U

U = W.
Din aceeast a succesiune de egalit at i se obt ine armat ia f acut a n enunt .
Corolarul 2.6.11. Dac a matricea covariant elor V (X) a unui vector aleator X este
pozitiv denit a, atunci exist a o transformare X Y astfel nc at pentru noul vector
aleator Y s a avem E(Y ) = 0 si V (Y ) = I.
Demonstrat ie. Folosind descompunerea V (X) = U

U si aleg and A =

1
2
U,
obt inem c a Y = A[X E(X)] este vectorul aleator c autat.
Pe de o parte avem
E (Y ) = A[E(X) E (X)] = A0 = 0.
Pe de alt a parte
V (Y ) = AV (X E(X)) A

= AV (X) A

1
2
UV (X) U

1
2
=

1
2

1
2
= I.
Din cel dou a succesiuni de relat ii se obt ine c a vectorul Y satisface condit iile dorite.
Corolarul 2.6.12. Dac a matricea covariant elor V (X) a unui vector aleator X este
pozitiv denit a, atunci variabila aleatoare
S
2
= [X E(X)]

[V (X)]
1
[X E (X)] ,
are valoarea medie E
_
S
2
_
= n.
Demonstrat ie. Cu notat iile din demonstrat ia corolarului precedent avem
A

A = U

1
2

1
2
U = U

1
U = [V (X)]
1
.
Prin urmare, avem succesiv:
S
2
= [X E(X)]

A[X E(X)] = Y

Y =
n

i=1
Y
2
i
.
Dar avem c a E(Y
i
) = 0 si V ar (Y
i
) = 1, astfel c a E
_
Y
2
i
_
= V ar (Y
i
) = 1, pentru
ecare i = 1, n, ceea ce conduce la E
_
S
2
_
= n.
2.6. Caracteristici numerice 99
2.6.2 Functii Matlab pentru valoare medie si dispersie
Sistemul Matlab dispune de proceduri pentru calulul valorilor medii si ale dispersiilor
legilor de probabilitate implementate prin Statistics toolbox.
Pentru calculul valorilor acestor caracteristici numerice se foloseste apelul
[m,v]=numef(x,par1,par2,...)
unde numef este un sir de caractere, care denesc legea de probabilitate, din care
ultimele patru sunt stat, iar cele ce le preced sunt cele care dau numele legii.

In urma execut arii instruct iunii, se calculeaz a matricele m si v ale valorilor medii
si ale dispersiilor pentru legea considerat a, av and parametrii precizat i prin matricele
par1, par2, ... Aceste matrice trebuie s a e de aceleasi dimensiuni, cu except ia c a
dac a unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiuni
cu celelalte si care iau valorile scalarilor corespunz atori.
Valorile medii si dispersiile se calculeaz a, pentru ecare lege de probabilitate n
parte, folosinduse formulele din Tabelul 2.1.
2.6.3 Valoare medie conditionat a. Dispersie (variant a) conditionat a
Fie vectorul aleator bidimensional (X, Y ) si F
X|Y
funct ia de repartit ie a lui X
condit ionat a de Y .
Denitia 2.6.13. Numim valoare medie condit ionat a a variabilei aleatoare X de
c atre Y , variabila aleatoare
E (X | Y ) =
_
+

xdF
X|Y
(x|Y ) ,
o realizare a variabilei aleatoare E (X | Y ) ind
E (X | y) =
_
+

xdF
X|Y
(x|y) , y R.
Dac a vectorul aleator (X, Y ) este de tip discret, cu distribut ia
X \ Y . . . y
j
. . .
.
.
.
.
.
.
x
i
. . . p
ij
. . .
.
.
.
.
.
.
atunci variabila aleatoare E(X|Y ) va avea distribut ia
E (X|Y )
_
E (X|y
j
)
p
j
_
jJ
,
100 Elemente de teoria probabilit at ilor
Legea Denumirea Valoarea medie si dispersia
U (N) unid E(X) =
N+1
2
, V ar (X) =
N
2
1
12
B (n, p) bino E(X) = np, V ar (X) = np(1 p)
H(n, M, K) hyge E(X) = n
K
M
, V ar (X) = n
K
M
MK
M
Mn
M1
Po () poiss E(X) = , V ar (X) =
BN (r, p) nbin E(X) =
r(1p)
p
, V ar (X) =
r(1p)
p
2
Ge (p) geo E(X) =
1p
p
, V ar (X) =
1p
p
2
U (a, b) unif E(X) =
a+b
2
, V ar (X) =
(ba)
2
12
N (, ) norm E(X) = , V ar (X) =
2
LN (, ) logn E(X) = e
+

2
2
, V ar (X) = e
2+2
2
e
2+
2
Ga (a, b) gam E(X) = ab, V ar (X) = ab
2
Exp () exp E(X) = , V ar (X) =
2
Beta (a, b) beta E(X) =
a
a+b
, V ar (X) =
ab
(a+b+1)(a+b)
2
W(a, b) weib E(X) = a

1
b

_
1 +
1
b
_
,
V ar (X) = a

2
b
_

_
1 +
2
b
_

2
_
1 +
1
b
_
R(b) rayl E(X) = b
_

2
, V ar (X) =
4
2
b
2
T (n) t E(X) = 0, V ar (X) =
n
n2
, n > 2
T nc (n, ) nct E(X) =

n
2
(
n1
2
)
(
n
2
)
,
V ar (X) =
n(1+
2
)
n2

n
2
2
_
(
n1
2
)
(
n
2
)
_
2
, n > 2

2
(n) chi2 E(X) = n, V ar (X) = 2n

2
(n, ) ncx2 E(X) = n +, V ar (X) = 2 (n + 2)
F (m, n) f E(X) =
n
n2
, n > 2,
V ar (X) =
2n
2
(m+n2)
m(n2)
2
(n4)
, n > 4
Fnc (m, n, ) ncf E(X) =
n(m+)
m(n2)
, n > 2,
V ar (X) = 2
_
n
m
_
2 (m+)
2
+(m+2)(n2)
(n2)
2
(n4)
, n > 4
Tabelul 2.1: Tabelul valorilor medii si dispersiilor
2.6. Caracteristici numerice 101
unde
E (X|y
j
) =

iI
x
i
P (X = x
i
| Y = y
j
) =

iI
x
i
p
ij
p
j
, j J.
Dac a vectorul aleator (X, Y ) este de tip continuu, av and densitatea de probabili-
tate f, atunci o realizare a variabilei aleatoare E(X|Y ) este dat a prin
E(X|y) =
_
+

xf
X|Y
(x| y) dx =
_
+

x
f (x, y)
f
Y
(y)
dy.
Proprietatea 2.6.14. E[E(X|Y )] = E (X).
Demonstrat ie. Demonstr am proprietatea n cazul continuu. Cazul discret se demon-
streaz a analog.
Folosind denit ia valorii medii avem succesiv:
E[E(X|Y )] =
_
+

E(X|y) f
Y
(y) dy =
_
+

f
Y
(y)
__
+

x
f (x, y)
f
Y
(y)
dx
_
dy
=
_
+

x
__
+

f (x, y) dy
_
dx =
_
+

xf
X
(dx) = E (X) .
Demonstrat ia se ncheie dac a se ret in extremit at ile acestui sir de egalit at i.
Denitia 2.6.15. Fie vectorul aleator (X, Y ). Numim dispersie condit ionat a sau
variant a condit ionat a a variabilei aleatoare X de c atre Y , variabila aleatoare
V ar (X | Y ) = E
_
(X E(X|Y ))
2
|Y
_
.
Proprietatea 2.6.16. V ar (X) = E [V ar (X|Y )] +V ar [E (X|Y )] .
Demonstrat ie. Pornind de la denit ia variant ei si folosind propriet at i ale ei, putem
scrie:
V ar (X) =E
_
(X E(X))
2
_
= E
_
(X E(X|Y ) +E(X|Y ) E(X))
2
_
=E
_
(X E(X|Y ))
2
_
+E
_
(E (X|Y ) E (X))
2
_
+ 2E [(X E(X|Y )) (E (X|Y ) E (X))] .
Vom calcula pe r and cei trei termeni din partea dreapt a a acestei relat ii.
Pentru primul termen, dac a se noteaz a Z = (X E (X|Y ))
2
si se aplic a propri-
etatea valorii medii condit ionate avem:
E(Z) = E[E (Z|Y )] = E
_
E
_
(X E (X|Y ))
2

Y
__
,
102 Elemente de teoria probabilit at ilor
de unde se obt ine c a
E
_
(X E (X|Y ))
2
_
= E [V ar (X|Y )] .
Pentru al doilea termen, dac a se noteaz a Z = E (X|Y ), se poate scrie:
E
_
(E (X|Y ) E (X))
2
_
= E
_
(E(X|Y ) E(E (X|Y )))
2
_
= E
_
(Z E (Z))
2
_
= V ar (Z) = V ar [E(X|Y )] ,
de unde
E
_
(E(X|Y ) E(X))
2
_
= V ar [E (X|Y )] .
A mai r amas s a ar at am ca al treilea termen este zero.
Fix am Y = y si av and n vedere c a E(X|y) E(X) = const., putem scrie:
E[(X E(X|y)) (E (X|y) E(X))] = [E(X|y) E(X)] E[X E(X|y)]
= [E (X|y) E (X)] [E (X) E (X)] = 0.
Ceea ce a mai r amas de ar atat.
Exemplul 2.6.17. S a consider am vectorul aleator (X, Y ), care urmeaz a legea nor-
mal a, av and densitatea dat a prin (2.5.5). Este cunoscut c a parametrii acestei legi de
probabilitate au urm atoarele interpret ari probabilistice:

1
= E (X) ,
2
= E(Y ) ,
2
1
= V ar (X) ,
2
2
= V ar (Y ) ,
iar r (1, 1) este coecientul de corelat ie dintre X si Y .
Mai mult, pentru legea normal a multidimensional a, av and densitatea de proba-
bilitate dat a prin (2.5.4), se arat a c a este valoarea medie a vectorului aleator ce
urmeaz a legea normal a multidimensional a, iar V este matricea covariant elor.
S a revenim la cazul bidimensional si s a constat am c a
E(X|Y = y) = m(y) =
1
+

1

2
r (y
2
) ,
V ar (X|Y = y) =
2
1
_
1 r
2
_
.

In mod analog, avem c a


E (Y |X = x) = m(x) =
2
+

2

1
r (x
1
) ,
V ar (Y |X = x) =
2
2
_
1 r
2
_
.
2.6. Caracteristici numerice 103
Curbele de ecuat ii
x(y) =
1
+

1

2
r (y
2
) ,
y (x) =
2
+

2

1
r (x
1
) ,
se numesc curbele de regresie a lui X n raport cu Y , respectiv a lui Y n raport cu X.
2.6.4 Functie caracteristic a
Fie variabila aleatoare X si vectorul aleator ndimensional X.
Denitia 2.6.18. Numim funct ie caracteristic a atasat a variabilei aleatoare X, res-
pectiv vectorului aleator X, funct ia denit a prin
(t) = M
_
e
itX
_
, t R,
(t) = M
_
e
i

n
k=1
t
k
X
k
_
, t R
n
.
Utilitatea funct iei caracteristice este dat a de netezimea ei, care este superioar a
funct iei de repartit ie, aceast a din urm a put and discontinu a, pe c and funct ia ca-
racteristic a este uniform continu a.

In plus, pe baza formulei de inversiune, exist a o
caracterizare complet a a distribut iei unei variabile aleatoare sau a unui vector aleator
cu ajutorul funct iei caracteristice.
2.6.5 Momente
Denitia 2.6.19. Fie variabila aleatoare X. Numim moment (init ial) si respectiv
moment centrat de ordin n, caracteristicile numerice

n
= E(X
n
) ,
n
= E[(X E (X))
n
] = E[(X
1
)
n
] .
Remarc am c a n statistic a sunt folosite n primul r and primele patru momente.
Astfel momentele centrate de ordinele doi si trei se folosesc pentru denirea
asimetriei (skewness)
a =

3

3
2
2
,
iar momentele centrate de ordinele doi si patru se folosesc pentru denirea excesului
(kurtosis)
e =

4

2
2
sau e =

4

2
2
3.

In sistemul Matlab, excesul este denit cu prima formul a.


104 Elemente de teoria probabilit at ilor
2.6.6 Mediana. Cuartile. Cuantile
Denitia 2.6.20. Fie variabila aleatoare X, care are funct ia de repartit ie F. Numim
median a, caracteristica numeric a m, care satisface condit iile
(2.6.6) P (X m)
1
2
P (X m) .
Av and n vedere propriet at i ale funct iei de repartit ie, condit iile (2.6.6) se pot scrie
echivalent sub forma
F (m0)
1
2
F (m) .
Dac a variabila aleatoare este de tip continuu, relat iile (2.6.6) se reduc la relat ia
F (m) =
1
2
, adic a m = F
1
_
1
2
_
.

In cazul discret, folosind (2.6.6) sar putea ca mediana s a nu e determinat a n


mod unic, de aceea se alege m ca ind cel mai mic num ar pentru care F (m)
1
2

Denitia 2.6.21. Fie variabila aleatoare X, care are funct ia de repartit ie F. Numim
cuantil a de ordin (0, 1), caracteristica numeric a x

, care satisface condit iile


(2.6.7) P (X x

) 1 si P (X m) .
Ca si n cazul medianei, aceste condit ii se pot scrie echivalent sub forma
F (x

0) F (x

) ,
care se reduce la relat ia F (x

) = , adic a x

= F
1
(), n cazul continuu.

In cazul discret, cuantila x

se ia ca ind cel mai mic num ar pentru care are loc


inegalitatea F (x

) .
Unele cuantile au denumiri speciale. Iat a de exemplu, cuantila de ordin =
1
2
este chiar mediana.
Dac a =
1
4
,
2
4
,
3
4
, se obt in ceea ce se numesc cuartile, respectiv cuartila infe-
rioar a, mediana si cuartila superioar a.
Dac a =
i
10
, i = 1, 9, =
k
100
, k = 1, 99, se obt in ceea ce poart a denumirile
decile si respectiv centile.
2.6.7 Functia Matlab icdf
Am v azut c a pentru calculul cuantilelor este necesar a inversarea funct iei de repartit ie.
Sistemul Matlab prin Statistics toolbox dispune de funct ii pentru inversarea funct iilor
de repartit ie ale legilor de probabilitate implementate.
Apelarea acestor funct ii se face cu una din urm atoarele forme:
x = icdf(legea,P,p1,p2,...)
x = numef(P,p1,p2,...)
2.6. Caracteristici numerice 105
unde legea este un sir de caractere predenit pentru ecare din legile de probabili-
tate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt inv, iar cele ce le preced sunt cele care dau numele predenit al legii de
probabilitate (ca si cele din parametrul legea).

In urma execut arii uneia din cele dou a instruct iuni, se calculeaz a matricea x a
cuantilelor legii precizat a prin parametrii legea, respectiv numef, corespunz atoare
valorilor date prin matricea P si av and parametrii dat i prin matricele par1, par2,...
Aceste matrice trebuie s a e de aceleasi dimensiuni, cu except ia c a dac a unele sunt
scalari, acestia se extind la matricele constante de aceleasi dimensiuni cu celelalte si
care iau valorile scalarilor corespunz atori.
Programul 2.6.22. Pentru a ilustra grac modul de calcul al cuantilelor, vom da un
program care calculeaz a mediana pentru legea uniform a discret a si reprezint a grac
acest lucru pentru dou a valori distincte ale parametrului N, precum si cuartilele legii
normale.
clf, clear
N1 = input(N1=); N2 = input(N2=);
m = input(mu=); s = input(sigma=);
xu1 = 0:N1+1; yu1 = unidcdf(xu1,N1);
xu2 = 0:N2+1; yu2 = unidcdf(xu2,N2);
xn = m-3
*
s:0.01:m+3
*
s; yn = normcdf(xn,m,s);
me1 = icdf(unid,1/2,N1);
me2 = icdf(unid,1/2,N2);
Q = icdf(norm,[1/4,2/4,3/4],m,s);
subplot(3,1,1), stairs(xu1,yu1)
set(gca,Xlim,[0,N1+1]), set(gca,xtick,[me1])
set(gca,xticklabel,[me1]), hold on
plot([0,me1],[1/2,1/2],k:,me1,1/2,o)
plot([me1,me1],[0,1/2],k-.)
subplot(3,1,2), stairs(xu2,yu2)
set(gca,Xlim,[0,N2+1]), set(gca,xtick,[me2])
set(gca,xticklabel,[me2]), hold on
plot([0,me2],[1/2,1/2],k:,me2,1/2,o)
plot([me2,me2],[0,1/2],k-.)
subplot(3,1,3),
plot(xn,yn,[Q(1),Q(2),Q(3)],[1/4,2/4,3/4],o)
set(gca,xtick,[Q(1),Q(2),Q(3)])
set(gca,xticklabel,[Q(1),Q(2),Q(3)])
hold on
X = [m-3
*
s,Q(1);m-3
*
s,Q(2);m-3
*
s,Q(3)];
plot(X,[1/4,1/4;1/2,1/2;3/4,3/4],k:)
plot([Q(1),Q(1)],[0,1/4],k-.)
plot([Q(2),Q(2)],[0,2/4],k-.)
plot([Q(3),Q(3)],[0,3/4],k-.)
Executarea programului pentru N=5 si N=6, respectiv pentru mu=0 si sigma=2, are
ca rezulatat gracele din Figura 2.17.
106 Elemente de teoria probabilit at ilor
3
0
0.5
1
3
0
0.5
1
1.34898 0 1.34898
0
0.5
1
Figura 2.17: Medianele pentru U (5) si U (6) si cuartilele pentru N (0, 2)
2.7. S iruri de variabile aleatoare 107
2.6.8 Functia Matlab disttool
Funct ia (comanda) disttool este un program de demonstrativ. Lansarea acestuia
se face prin:
>>disttool
n urma c areia se produce o fereastr a grac a interactiv a (demonstrativ a) privind
funct iile de repartit ie (cdf) si funct iile de probabilitate (pdf).
Fixarea (stabilirea) legii de probabilitate n scop demonstrativ se face prin
alegerea din meniul legilor de probabilitate situat n partea st ang a sus a ferestrei,
iar una din alternativele pdf si cdf se face folosind meniul din partea dreapt a sus a
ferestrei. Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se
poate proceda n dou a moduri. Fie prin introducerea n ferestrele corespunz atoare ale
valorilor dorite, e prin deplasarea barelor atasate acestora.

In plus, limite pentru pa-
rametrii legii de probabilitate considerate pot precizate prin introducerea acestora
n ferestrele considerate.
Determinarea valorii funct iei pdf respectiv cdf ntrun punct, se poate obt ine
prin introducerea argumentului funct iei n fereastra de pe axa absciselor sau prin
deplasarea dreptei verticale asat a pe grac, cu ajutorul mouselui, p an a c and aceasta
trece prin punctul respectiv. Inversa funct iei de repartit ie (icdf) se poate obt ine de
asemenea, prin introducerea valorii funct iei de repartit ie (cdf) n fereastra de pe
axa ordonatelor sau prin deplasarea dreptei orizontale asat a pe grac, cu ajutorul
mouselui, p an a c and aceasta trece prin punctul respectiv.
2.7 S iruri de variabile aleatoare
2.7.1 Inegalitatea lui Cebsev
Fie variabila aleatoare X, pentru care exist a valoarea medie si dispersia.
Inegalitatea lui Cebsev este cunoscut a sub una din formele
P (| X E(X)| < ) 1
V ar (X)

2
,
P (| X E(X)| )
V ar (X)

2
, > 0.
Observatia 2.7.1. Dac a n inegalitatea lui Cebsev se ia = k, unde sa notat
=
_
V ar (X) abaterea standard, atunci aceasta devine
P (| X E (X)| < k)
k
2
1
k
2

108 Elemente de teoria probabilit at ilor
Astfel, pentru k = 3 se obt ine P (| X E(X)| < 3)
8
9
= 0, 88..., ceea ce
nseamn a c a probabilitatea ca valorile lui X s a se abat a de la valoarea medie E (X)
mai put in de trei ori abaterea standard este mai mare dec at
8
9

Observatia 2.7.2. Fie variabilele aleatoare X


k
, k = 1, n, independente si identic
repartizate, av and valorile medii si dispersiile E(X
k
) = , V ar (X
k
) =
2
, pentru
ecare k = 1, n, cu ajutorul c arora construim variabila aleatoare
S
n
=
n

k=1
X
k
, cu E (S
n
) = n si V ar (S
n
) = n
2
.
Dac a se aplic a inegalitatea lui Cebsev se obt ine
P
_

S
n
n

<
_
1

2
n
2
, P
_

S
n
n

2
n
2
, > 0.
Cele dou a inegalit at i dau evalu ari ale probabilit at ilor ca media aritmetic a a vari-
abilelor aleatoare s a se abat a de la valoarea medie mai put in, respectiv mai mult,
dec at > 0 xat.
2.7.2 Tipuri de convergent a
S a consider am sirul de variabile aleatoare (X
n
)
n1
cu sirul funct iilor de repartit ie
corespunz atoare (F
n
)
n1
.
Denitia 2.7.3. Spunem c a sirul de variabile aleatoare (X
n
)
n1
converge n proba-
bilitate la variabila aleatoare X, si vom nota X
n
p
X, dac a pentru orice > 0,
avem c a
lim
n
P (| X
n
X| < ) = 1.
Denitia 2.7.4. Spunem c a sirul de variabile aleatoare (X
n
)
n1
converge n repar-
tit ie la variabila aleatoare X, si vom nota X
n
r
X, dac a avem c a
lim
n
F
n
(x) = F (x) ,
unde F este funct ia de repartit ie a variabilei aleatoare X, iar limita considerat a
exist a pentru orice punct de continuitate x R al funct iei F.
Observatia 2.7.5. Dac a X
n
p
X, atunci X
n
r
X. Implicat ia invers a nu are loc,
dar dac a X este o constant a a, atunci armat ia invers a are loc de asemenea, adic a
dac a X
n
r
a, pentru a R, atunci X
n
p
a.
2.7. S iruri de variabile aleatoare 109
2.7.3 Legea numerelor mari
S a consider am sirul de varaibile aleatoare (X
n
)
n1
.
Denitia 2.7.6. Spunem c a sirul de variabile aleatoare (X
n
)
n1
urmeaz a legea (sla-
b a) a numerelor mari, dac a pentru orice > 0 avem c a
lim
n
P
_

1
n
n

k=1
X
k

1
n
n

k=1
M (X
k
)

<
_
= 1,
adic a
1
n
n

k=1
X
k

1
n
n

k=1
M (X
k
)
p
0.
Observatia 2.7.7. Dac a variabilele aleatoare ale sirului (X
n
)
n1
sunt independente
si identic repartizate, iar E(X
n
) = , atunci
lim
n
P
_

S
n
n

<
_
= 1, adic a
1
n
S
n
p
,
unde S
n
=

n
k=1
X
k
.
Prin urmare, media aritmetic a a primelor n variabile aleatoare din sirul considerat
si pierde caracterul aleator, pentru n .
Evident, deoarece convergent a n probabilitate implic a convergent a n repartit ie,
avem si
1
n
S
n
r
, dar vom vedea imediat c a exist a chiar un rezultat mai bun n
ceea ce priveste convergent a n repartit ie.
2.7.4 Teoreme limit a
Am v azut c a legea numerelor mari este n str ans a leg atur a cu convergent a n pro-
babilitate, chiar si cu asa numita convergent a tare, dar care nu a fost prezentat a n
sect iunea precedent a.
Teoremele limit a abordeaz a problematica comport arii asimptotice a sirurilor de
varaibile aleatoare din perspectiva convergent ei n repartit ie.
Teorema 2.7.8 (LindebergLevy). Fie sirul de variabile aleatoare independente si
identic repartizate (X
n
)
n1
, pentru care se introduc notat iile
E (X
n
) = , V ar (X
n
) =
2
, S
n
=
n

k=1
X
k
.
110 Elemente de teoria probabilit at ilor
Dac a se construieste sirul de variabile aleatoare (Z
n
)
n1
, cu termenul general
Z
n
=
1
n
S
n

n
,
atunci Z
n
r
Z, unde Z este o variabil a aleatoare ce urmeaz a legea normal a
N (0, 1), adic a
lim
n
F
n
(x) =
1

2
_
x

t
2
2
dt, x R,
F
n
ind funct ia de repartit ie a variabilei aleatoare Z
n
.
Observatia 2.7.9. Teorema limit a de acest tip, n care legea de probabilitate limit a
este legea normal a se numeste teorem a limit a central a.
Teoremele limit a au un rol aparte n statistic a, unde sunt privite n urm atoarea
manier a. Dac a n este mare (n ), atunci variabila aleatoare Z
n
poate conside-
rat a ca urm and o lege de probabilitate cunoscut a, n cazul teoremei precedente legea
normal a N (0, 1).
Mai observ am c a variabila aleatoare
1
n
S
n
, c and n , urmeaz a legea normal a
N
_
,

n
_

Teorema 2.7.10 (MoivreLaplace). Dac a variabila aleatoare Z


n
urmeaz a legea bi-
nomial a, adic a are distribut ia
S
n
_
x
f (x | n, p)
_
x=0,n
, unde f (x | n, p) =
_
n
x
_
p
x
q
nx
, q = 1 p,
atunci
S
n
np

npq
r
Z,
unde Z este o variabil a aleatoare ce urmeaz a legea normal a N (0, 1).
Rezultatul teoremei se exprim a de regul a sub forma
(2.7.1) P
_
a
x np

npq
< b
_

2
_
b
a
e

t
2
2
dt.
Observatia 2.7.11. Teorema limit a MoivreLaplace este o consecint a imediat a a
Teoremei LindebergLevy, dac a se are n vedere c a variabila aleatoare S
n
este suma
2.7. S iruri de variabile aleatoare 111
a n variabile aleatoare independente X
k
, k = 1, n, ecare urm and aceeasi lege a lui
Bernoulli, adic a av and distibut ia
X
k
_
x
f (x | p)
_
x=1,0
, unde f (x | p) = p
x
q
1x
.
Mai remarc am faptul c a variabila aleatoare S
n
, care urmeaz a legea binomial a
B(n, p), poate privit a, pentru n , ca urm and legea normal a N
_
np,

npq
_
.
Observatia 2.7.12 (Regula celor trei ). Dac a n formula MoivreLaplace se con-
sider a b = a = 3, atunci
P
_
3
k np

npq
< 3
_
(3) (3) = 0.997.
Prin urmare, rezult a c a P
_
|k np| < 3

npq
_
0.99. Deoarece, abaterea medie
p atratic a a variabilei aleatoare X ce urmeaz a legea binomial a este =

npq, avem
regula urm atoare cunoscut a sub denumirea de regula celor trei : probabilitatea ca
frecvent a absolut a k s a se abat a de la valoarea medie E(X) = np mai put in de trei
ori abaterea medie p atratic a este mai mare dec at 0.99.
Observatia 2.7.13 (Corect ie de continuitate). Av and n vedere procesul de aproxi-
mare a unei legi de tip discret (legea binomial a) cu una de tip continuu (legea nor-
mal a), pentru obt inerea unor rezultate mai bune n aplicarea formulei (2.7.1), se im-
pune aplicarea unei corect ii de continuitate, dat a prin
f (x | n, p) = P (S
n
= x) P
_
x
1
2
np

npq
Z <
x +
1
2
np

npq
_
=
_
x +
1
2
np

npq
_

_
x
1
2
np

npq
_
,
unde
(x) =
1

2
_
x

t
2
2
dt,
reprezint a funct ia lui Laplace.
Folosind aceast a corect ie de continuitate avem urm atoarele formule de aproxi-
112 Elemente de teoria probabilit at ilor
mare:
F
n
(x) = P (S
n
x) P
_
Z
x +
1
2
np

npq
_
=
_
x +
1
2
np

npq
_
,
1 F
n
(x) = P (S
n
> x) P
_
Z >
x
1
2
np

npq
_
=1
_
x
1
2
np

npq
_
,
P (k
1
S
n
k
2
) P
_
k
2
+
1
2
np

npq
Z
k
1

1
2
np

npq
_
=
_
k
2
+
1
2
np

npq
_

_
k
1

1
2
np

npq
_
.
Programul 2.7.14. Pentru a ilustra rezultatele Teoremei MoivreLaplace, progra-
mul Matlab care urmeaz a, reprezint a grac prin bare funct ia de probabilitate a legii
binomiale B (n, p) mpreun a cu densitatea de probabilitate a legii normale core-
spunz atoare, adic a N
_
np,

npq
_
.
clf
n = input(n=); p = input(p=);
m = n
*
p; s = sqrt(n
*
p
*
(1-p));
x = 0:n; xx = -1:0.01:n+1;
P = binopdf(x,n,p); y = normpdf(xx,m,s);
bar(x,P,0.3), hold, plot(xx,y)
Executarea programului pentru n=15 si p=0.4, produce gracul din Figura 2.18.
2 0 2 4 6 8 10 12 14 16
0
0.05
0.1
0.15
0.2
0.25
Figura 2.18: Legea B (15, 0.4) si legea N
_
6,

3.6
_
Capitolul 3
Statistic a descriptiv a
Statistica se ocup a cu descrierea si analiza numeric a a fenomenelor de mas a,
dezv aluind particularit at ile lor de volum, structur a, dinamic a, conexiune, precum si
regularit at ile sau legile care le guverneaz a.
Etapele principale ce se disting n cercetarea statistic a a unui fenomen aleator se
pot considera ca ind:
a). Denirea (concept ia) obiectului studiat, care cont ine denirea unit at ilor sta-
tistice, conceperea chestionarului (ntreb arilor), planicarea culegerii datelor.
b). Observarea fenomenului (culegerea datelor) conform criteriilor stabilite la
etapa precedent a.
c). Descrierea statistic a, ce cuprinde reprezentarea grac a a datelor statistice,
sistematizarea acestora, precum si calcularea indicatorilor numerici pentru punerea
n evident a a unor propriet at i si pentru sugerarea unor ipoteze referitoare la legile
care guverneaz a fenomenul cercetat.
d). Modelarea probabilistic a a fenomenului cercetat, care are ca obiectiv prin-
cipal cercetarea fenomenului folosind ca instrument de lucru teoria probabilit at ilor
relativ la datele statistice obt inute conform etapelor precedente.
Dac a primele dou a etape pot considerate ca preliminare, etapa a treia conduce
la ceea ce numim statistic a descriptiv a, iar a patra etap a conduce la statistica mate-
matic a sau statistica inferent ial a.
Desigur, nu se poate face o delimitare exact a ntre statistica descriptiv a si sta-
tistica matematic a, mai mult o descriere statistic a fundamentat a matematic va con-
duce la realizarea unei model ari a fenomenului, care pune n evident a propriet at ile
esent iale ale acestuia si leg aturile dintre acestea. Ca o component a de baz a a statis-
ticii descriptive, care s-a dezvoltat n mod impresionant odat a cu explozia utiliz arii
calculatoarelor n statistic a, o reprezint a analiza datelor. Printre capitolele mai im-
portante ale analizei datelor amintim metodele de clasicare si metodele factoriale.
113
114 Statistic a descriptiv a
Pe de alt a parte, statistica matematic a cuprinde ca si capitole principale teoria
select iei, teoria estimat iei si vericarea ipotezelor statistice, str ans legat de teoria
deciziilor.
Din cele prezentate putem spune c a statistica descriptiv a are ca obiectiv principal
culegerea si clasicarea datelor statistice n vederea descrierii numerice si grace a
fenomenului cercetat. Statistica matematic a elaboreaz a modelul matematic, folosind
datele statistice, estimeaz a parametrii modelului, stabileste metode pentru validarea
ipotezelor statistice, toate acestea av and la baza teoria probabilit at ilor.
Amintim c a studiul statistic al fenomenelor economice face obiectul statisticii
economice, iar studiul statistic al fenomenelor ce pot constitui riscuri asigurate
reprezint a obiectul statisticii actuariale.
3.1 Concepte de baz a ale statisticii
Denitia 3.1.1. Numim colectivitate (populat ie) o mult ime C de elemente cerceta-
t a din punct de vedere a uneia sau mai multor propriet at i, elementele componente
numindu-se indivizi sau unit at i statistice, iar num arul elementelor lui C se numeste
volumul colectivit at ii.
Denitia 3.1.2. Numim caracteristic a sau variabil a a colectivit at ii C proprietatea su-
pus a investig arii statistice relativ a la C. C and o caracteristic a poate m asurat a o
numim caracteristic a cantitativ a sau numeric a, iar dac a aceasta se exprim a printr-o
nsusire o numim caracteristic a calitativ a sau atribut.

In unele tratate de statistic a variabilele (caracteristicile) calitative sunt numite


variabile nominale. O clas a intermediar a de variabile (caracteristici) este format a de
asa numitele variabile (caracteristici) ordinale.
Observatia 3.1.3. Dac a se consider a colectivitatea C a student ilor dintr-un an de stu-
diu, atunci n alt imea, greutatea, media obt inut a la sf arsitul anului sunt caracteristici
cantitative (numerice), pe c and sexul, culoarea ochilor, grupa sanguin a sunt carac-
teristici calitative (nominale). Un exemplu de caracteristic a ordinal a ar gradul de
preg atire (foarte bun, bun, satisf ac ator, nesatisf ac ator). Se observ a c a relativ la o vari-
abil a ordinal a se poate face ordonarea indivizilor, ca si pentru o variabil a numeric a,
ceea ce nu se nt ampl a pentru o variabil a nominal a, dar nu se pot face operat ii aritme-
tice, cum se nt ampl a si la variabilele nominale, pe c and pentru o variabil a numeric a
astfel de operat ii sunt posibile.
Observatia 3.1.4. Din punct de vedere al teoriei probabilit at ilor o caracteristic a a
unei populat ii C este o variabil a aleatoare X. Scopul principal al cercet arii statistice
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 115
este de a stabili legea de probabilitate pe care o urmeaz a caracteristica X, utiliz and
observat iile (datele statistice) relative la colectivitatea cercetat a.
Dac a avem n vedere mai multe caracteristici X
1
,. . . ,X
n
, acestea reprezint a com-
ponentele unui vector aleator X, iar cercetarea fenomenului aleator modelat prin X,
se poate extinde si la determinarea leg aturilor ce exist a ntre componentele vectorului
aleator.
Denitia 3.1.5. O caracteristic a X ce ia o mult ime cel mult num arabil a de valori o
numim caracteristic a de tip discret, iar dac a ia valori dintr-un interval nit sau innit
o numim caracteristic a de tip continuu.
Observatia 3.1.6. Dac a se consider a colectivitatea C a bolnavilor externat i dintr
un spital pe parcursul unei s apt am ani, atunci caracteristica X ce reprezint a num arul
zilelor de internare este o caracteristic a de tip discret, pe c and greutatea Y a bolna-
vilor externat i reprezint a o caracteristic a de tip continuu. Remarc am faptul c a pentru
caracteristica Y caracterul continuu este estompat prin imposibilitatea m asur arii e-
xacte a acestei caracteristici, de aceea, practic, se consider a ca ind de asemenea de
tip discret.
3.2 Culegerea, prezentarea si prelucrarea
datelor statistice
Modurile de culegere (observare) a datelor statistice cele mai des utilizate sunt:
a). Observarea total a (exhaustiv a, recens am ant), c and tot i indivizii colectivit at ii
C sunt nregistrat i.
b). Observare part ial a (sondaj, select ie), c and dup a criterii bine stabilite sunt
nregistrat i o parte din indivizii colectivit at ii C, numit a esantion sau select ie.
c). Observare curent a, c and nregistrarea indivizilor se efectueaz a odat a cu apa-
rit ia (producerea) lor.
d). Observarea periodic a, c and nregistrarea fenomenului se efectueaz a la inter-
vale de timp stabilite.
3.2.1 Generarea numerelor aleatoare n Matlab
Matematica, si prin teoria probabilit at ilor si statistica matematic a, printre multiplele
si larg r asp anditele aplicat ii, posed a, poate, una legat a de modelarea matematic a, care
se distinge n mod special prin vastul domeniu de aplicabilitate. Modelarea matema-
tic a, dup a cum spune si numele, are drept scop construirea de modele matematice
asociate unor fenomene sau sisteme pe care le nt alnim n diferite domenii: zic a,
chimie, biologie, demograe, medicin a, geograe, geologie, economie etc. Desigur,
116 Statistic a descriptiv a
astfel de modele matematice depind de niste parametri, e aleatori, e nealeatori.
Odat a modelul matematic construit se are n vedere realizarea practic a a acestuia.
Dar, apare o mare problem a, este acest model matematic (teoretic) construit via-
bil? Avem dou a alternative, sau realiz am practic modelul respectiv si urm arim cum
funct ioneaz a acesta (ceea ce, n general, nu e de dorit), sau simul am funct ionarea
modelului respectiv prin diferite particulariz ari ale parametrilor modelului si alegem
varianta convenabil a. Dac a relativ la parametrii nealeatori care intervin n modelul
teoretic nu se ridic a probleme speciale, n privint a parametrilor aleatori apare o nou a
problem a, anume obt inerea valorilor acestor parametri. Deoarece parametrii aleatori
sunt, din punct de vedere al teoriei probabilit at ilor, variabile aleatoare, apare asadar
problema gener arii de valori numerice ale acestor variabile aleatoare si care vor purta
denumirea de numere aleatoare. Desigur c a ntr-un fel vor generate aceste numere
aleatoare dac a parametrul urmeaz a, s a zicem, legea uniform a pe un anumit interval si
altfel c and urmeaz a legea normal a.
Deoarece pentru prezentarea not iunilor si rezultatelor teoretice ale statisticii ma-
tematice sunt necesare exemplic ari ale acestora, iar culegerea unor date statistice
reale nu este ntodeauna la ndem an a, de multe ori vom considera numerele aleatoare
ca ind date statistice c arora li se vor aplica metodele cercet arii statisticii.
Putem s a amintim de asemenea c a testarea programelor pe calculator, deter-
minarea statistic a a caracteristicilor numerice ale variabilelor aleatoare, care ne con-
duce la metoda Monte Carlo, fac de asemenea necesar a generarea numerelor alea-
toare.
Metodele de generare a numerelor aleatoare se mpart n trei categorii:
tabelele cu numere aleatoare (uniforme) obt inute, de exemplu, din aruncarea
monedei, aruncarea zarului, jocul de rulet a, tabele matematice, tabele de re-
cens am ant etc.
procedeele zice, care au la baza fenomene zice, cum ar emiterea particule-
lor de o surs a radioactiv a, intensitatea curentului la diferite momente, zgomotul
electronic etc.
procedeele aritmetice (analitice), care utilizeaz a o formul a de calcul de forma
x
n+1
= f (x
n
, x
n1
, . . . , x
nm
) , n m 0.
Deoarece, de regul a, se foloseste un volum mare de numere aleatoare, s-a impus ge-
nerarea acestora cu ajutorul procedeelor aritmetice. Inconvenientul acestor procedee
analitice este legat de faptul c a nu posed a caracterul strict aleator, din moment ce
exist a o leg atur a funct ional a ntre acestea. Dar exist a posibilitatea de a alege astfel
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 117
de procedee analitice care produc siruri de numere pseudoaleatoare, foarte apropiate
din punct de vedere statistic de numerele aleatoare propriuzise.

In lucr arile [3] si [5] sunt prezentate proceduri pentru generarea de numere alea-
toare pentru diferite legi de probabilitate.
Sistemul Matlab are implementate astfel de proceduri pentru generarea numerelor
aleatoare, e prin Statistics toolbox, e prin sistemul de baz a din Matlab.
Functia random
Instruct iunile prin care sunt generate numere aleatoare ce urmeaz a una din legile de
probabilitate recunoscute de sistemul Matlab prin Statistics toolbox sunt de forma:
x=random(legea,par1,par2,...,m,n)
x=numef(par1,par2,...,m,n)
unde legea este un sir de caractere predenit pentru ecare din legile de probabili-
tate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt rnd, iar cele ce le preced sunt cele care dau numele predenit al legii de
probabilitate (ca si cele din parametrul legea).
Executarea uneia din cele dou a forme ale instruct iunii random, are ca efect ge-
nerarea matricei x, cu m linii si n coloane, de numere aleatoare ce urmeaz a legea
de probabilitate corespunz atoare cu parametrii precizat i prin matricele p1, p2, . . . .
Aceste matrice trebuie s a aib a aceleasi dimensiuni cu matricea x, cu except ia c and
unele sunt scalari, caz n care acestea sunt extinse la matricele constante de aceleasi
dimensiuni cu celelalte si care iau valorile corespunz atoare scalarilor. Dac a tot i para-
metrii legii de probabilitate sunt scalari, c and lipsesc parametrii m si n se genereaz a
un num ar aleator, c and lipseste n, atunci trebuie ca m s a e un vector cu dou a compo-
nente, care cont ine dimensiunile matricei x. Dac a cel put in unul din parametrii legii
probabilitate nu este scalar si dac a parametrii m si n sunt prezent i, acestia trebuie s a
coincid a cu dimensiunile matricelor.
Functiile mvnrnd si mvtrnd
Funct iile mvnrnd si mvtrnd sunt singurele funct ii din Statistics toolbox, prin care
se genereaz a legi de probabilitate multidimensionale, respectiv legile normal a si t
(Student).
Apelurile acestor funct ii se pot face respectiv prin:
x=mvnrnd(mu,v,m)
x=mvtrnd(r,n,,m)

In primul caz, sunt generat i m vectori aleatori ce urmeaz a legea normal a multidi-
mensional a, av and vectorul valorilor medii mu si matricea covariant elor v (matrice
p atratic a pozitiv denit a). Cei m vectori aleatori generat i sunt obt inut i n matricea x,
118 Statistic a descriptiv a
care n consecint a va avea m linii, iar num arul coloanelor este dat de dimensiunea legii
de probabilitate si care trebuie s a coincid a cu lungimea vectorului mu si cu ordinul
matricei p atratice v.

In al doilea caz, vor generat i m vectori aleatori ce urmeaz a legea Student multi-
dimensional a.
Parametrul r reprezint a matricea coecient ilor de corelat ie, care este matrice po-
zitiv denit a av and pe diagonala principal a toate elementele 1. Dac a aceast a ultim a
condit ie nu este ndeplinit a, adic a dac a este matricea covariant elor, atunci sistemul
Matlab calculeaz a prima dat a, din matricea r, matricea coecient ilor de corelat ie.
Parametrul n reprezint a num arul gradelor de libertate, put and un scalar sau un
vector de lungime m.
Cei m vectori aleatori sunt obt inut i n cele m linii ale matricei x si care are at atea
coloane c at este dimensiunea legii de probabilitate.
Trebuie s a remarc am faptul c a o linie a matricei x se obt ine dintrun vector alea-
tor ce urmeaz a legea normal a multidimensional a, av and valoarea medie 0 si matricea
covariant elor dat a prin parametrul r, ale c arui componente se mpart la un num ar
aleator ce urmeaz a legea
2
cu n grade de libertate.
Functiile rand si randn
Sistemul Matlab de baz a cont ine dou a funct ii pentru generarea de numere aleatoare
ce urmeaz a legea uniform a U (0, 1), prin rand, respectiv legea normal a standard
N (0, 1), prin randn.
Apelul acestor funct ii se poate face prin instruct iuni de forma:
x=rand
x=rand(m)
x=rand(m,n)
x=randn
x=randn(m)
x=randn(m,n)

In urma execut arii unor astfel de instruct iuni este generat un num ar aleator ce
urmeaz a legea U (0, 1) respectiv N (0, 1), c and nu este folosit nici un argument, o
matrice p atratic a de ordin m de numere aleatoare, c and apare un argument si o ma-
trice de numere aleatoare de tipul (m,n), c and sunt folosite ambele argumente.
Unele situat ii impun reg asirea unui anumit sir de numere aleatoare generat prin
una din cele dou a funct ii rand si respectiv randn. Pentru aceasta avem la dispozit ie
ceea ce se numeste starea generatorului.
Obt inerea st arii generatorului rand si randn la un moment dat se poate face
prin:
s=rand(state)
s=randn(state)
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 119
Pentru reinit ializarea sau schimbarea st arii generatorului, se pot utiliza urm atoarele
instruct iuni:
rand(state,s)
randn(state,s)
rand(state,0)
randn(state,0)
rand(state,sum(100
*
clock))
randn(state,sum(100
*
clock))
Parametrul s precizeaz a starea la care urmeaz a s a e resetat generatorul, dac a
acesta este 0, generatorul va resetat la starea init ial a. Dac a apare parametrul
sum(100
*
clock), generatorul este resetat la ecare apel n funct ie de timpul cal-
culatorului.
Instruct iuni mostenite din Matlab 4 si Matlab 5 sunt de asemenea active:
rand(seed)
randn(seed)
rand(seed,0)
randn(seed,0)
rand(seed,r)
randn(seed,r)
Functia randperm
Generarea unei permut ari a primelor n numere naturale se realizeaz a prin instruct iu-
nea
perm=randperm(n)
si va avea ca efect obt inerea vectorului perm ce cont ine o astfel de permutare.
3.2.2 Tabele statistice
Denitia 3.2.1. Numim tabel statistic (simplu, nesistematizat) un tablou n care
nregistr arile sunt trecute n ordinea aparit iei lor.
Observatia 3.2.2. Dac a observat iile statistice s-au f acut relativ la p caracteristici,
e acestea X
1
, X
2
, . . . ,X
p
, asupra a n indivizi, atunci tabelul statistic simplu este
matricea X = (x
ij
)
i=1,n,j=1,p
, unde x
ij
este valoarea caracteristicii X
j
pentru indi-
vidul i.
Denitia 3.2.3. Numim tabel statistic (sistematizat) relativ la caracteristica X de tip
discret, tabloul n care sunt trecute valorile distincte ale caracteristicii si frecvent ele
cu care au ap arut aceste valori.
Observatia 3.2.4. Av and caracteristica X de tip discret, care ia valorile distincte
x
i
, i = 1, n, pentru care s-au obt inut datele primare x

1
, x

2
, . . . , x

N
, tabelul statistic
sistematizat are forma
120 Statistic a descriptiv a
x f
x
1
f
1
x
2
f
2
.
.
.
.
.
.
x
n
f
n
unde f
i
este frecvent a absolut a a aparit iei valorii x
i
n datele primare x

k
, k = 1, N.
Prin urmare are loc relat ia

n
i=1
f
i
= N.
Denitia 3.2.5. Fie caracteristica de tip continuu X, care ia valori din intervalul
(a, b), descompus n intervale disjuncte, numite clase, prin punctele care satisfac
relat iile
a = a
0
< a
1
< < a
n
= b.
Numim tabel statistic (sistematizat) relativ la caracteristica X, tabloul ce cont ine
clasele caracteristicii si frecvent ele cu care au ap arut aceste clase.
Observatia 3.2.6. Dac a datele primare ale caracteristicii continue X, care ia valori
n intervalul (a, b), sunt x

1
, x

2
, . . . , x

N
, atunci tabelul statistic sistematizat are forma
x f
[a
0
, a
1
) f
1
[a
1
, a
2
) f
2
.
.
.
.
.
.
[a
n1
, a
n
) f
n
sau
x f
x
1
f
1
x
2
f
2
.
.
.
.
.
.
x
n
f
n
unde f
i
este frecvent a absolut a a aparit iei clasei [a
i1
, a
i
) printre datele primare
x

k
, k = 1, N, iar x
i
=
a
i1
+a
i
2
Dac a se consider a varianta din dreapta pentru tabelul
sistematizat, se obt ine aceeasi form a de tabel ca si n cazul caracteristicii discrete.

In acest fel s-a ajuns la o unicare a prezent arii prin tabele sistematizate a tipurilor
discrete si continue de caracteristici.
Observatia 3.2.7. Prin stabilirea claselor unei caracteristici continue (care pot de
lungimi egale sau nu) s-a efectuat o grupare a datelor statistice primare, si care se
efectueaz a si n cazul caracteristicilor de tip discret, dac a au un num ar mare de valori
distincte.
Denitia 3.2.8. Numim amplitudinea clasei denit a de intervalul [a
i1
, a
i
) lungimea
acestui interval, d
i
= a
i
a
i1
.
Observatia 3.2.9. C and amplitudinile claselor sunt egale, dou a reguli de stabilire a
num arului claselor sunt utilizate mai des:
n = 1 +
10
3
lg N (regula lui Sturges) si d =
1
100
8 (x
max
x
min
) ,
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 121
unde
x
max
= max{ x

1
, x

2
, . . . , x

N
} si x
min
= min{ x

1
, x

2
, . . . , x

N
}.

In acest fel, din prima regul a, se obt ine c a


d =
b a
n
si a
i
= a +id, i = 0, n.
C and (a, b) este innit, atunci
d =
x
max
x
min
n
si a
i
= x
min
+id, i = 0, n.
Exemplul 3.2.10. Se consider a un lot de 70 becuri din punct de vedere al caracteris-
ticii X, ce reprezint a durata de viat a n mii ore. Datele statistice obt inute sunt:
1.318 3.128 2.758 1.583 2.517 2.304 1.155 3.156 2.807 2.879
3.426 1.690 3.537 2.214 2.219 2.072 2.726 1.403 2.493 1.560
3.972 2.637 0.842 2.256 1.708 1.628 2.345 1.855 1.546 3.852
2.128 2.465 2.316 2.262 1.962 1.802 2.230 3.460 1.493 3.093
1.548 2.298 1.875 3.394 1.931 1.179 1.946 1.355 3.006 2.455
1.937 1.977 2.206 1.681 1.960 3.281 2.838 2.525 1.553 2.676
2.500 2.641 1.631 1.864 2.015 2.502 2.444 2.636 2.337 1.966
Vrem s a scriem tabelul sistematizat al datelor statistice, consider and clase de
amplitudini egale.
Folosind regula lui Sturges avem c a num arul n al claselor poate calculat cu
ajutorul num arului N al datelor statistice prin
n = 1 +
10
3
lgN = 1 +
10
3
1.8451,
de unde rezult a c a n = 7.

In acest fel avem c a amplitudinea d a claselor este
d =
x
max
x
min
n
=
3.972 0.842
7
= 0.45.
C and se foloseste formula
d =
1
100
8 (x
max
x
min
)
pentru calculul amplitudinii claselor, se obt ine d = 0.25.

In acest caz num arul n al
claselor va
n =
x
max
x
min
d
=
3.972 0.842
0.25
,
de unde n = 12.
122 Statistic a descriptiv a
Se observ a c a folosind cele dou a metode s-au obt inut valori distincte pentru
num arul claselor. Aceste formule au mai mult rolul de a da o prim a informat ie re-
lativ a la num arul claselor.

In continuare vom considera num arul claselor n = 11, a


i
= 0.7+id, i = 0, 11,
si d = 0.3.
Folosind aceast a grupare se obt ine tabelul sistematizat
x f
[0.7; 1.0) 1
[1.0; 1.3) 2
[1.3; 1.6) 9
[1.6; 1.9) 9
[1.9; 2.2) 10
[2.2; 2.5) 15
[2.5; 2.8) 10
[2.8; 3.1) 5
[3.1; 3.4) 4
[3.4; 3.7) 3
[3.7; 4.0) 2
sau
x f
0.85 1
1.15 2
1.45 9
1.75 9
2.05 10
2.35 15
2.65 10
2.95 5
3.25 4
3.55 3
3.85 2
Programul 3.2.11.

In urma execut arii urm atorului program Matlab
load x.dat -ascii
N=length(x);
ns=fix(1+10/3
*
log10(N));
ds=(max(x)-min(x))/ns;
fprintf( ns= %2d, ds= %4.2f\n,ns,ds)
da=8
*
(max(x)-min(x))/100;
na=fix((max(x)-min(x))/da);
a=0.7:0.3:4; n=length(a)-1;
fprintf( na= %2d, da= %4.2f\n,na,da)
for i=1:N
for j=1:n
if (a(j)<=x(i))&(x(i)<a(j+1))
cl(i)=j;
end
end
end
t=tabulate(cl);
fprintf( Tabelul sistematizat\n)
for j=1:n
t(j,1)=(a(j)+a(j+1))/2;
fprintf(%10.2f | %2d\n,t(j,1),t(j,2))
end
se obt in rezultatele:
ns= 7, ds= 0.45
na= 12, da= 0.25
Tabelul sistematizat
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 123
0.85 | 1
1.15 | 2
1.45 | 9
1.75 | 9
2.05 | 10
2.35 | 15
2.65 | 10
2.95 | 5
3.25 | 4
3.55 | 3
3.85 | 2
Se observ a c a prima comand a citeste datele statistice din sierul x.dat, care este un
sier ascii.
Denitia 3.2.12. Numim frecvent a relativ a a clasei x
i
raportul p
i
=
f
i
N

Denitia 3.2.13. Numim frecvent e cumulate ascendente, respectiv frecvent e cumu-


late descendente frecvent ele date de relat iile
F
k
=
k

i=1
f
i
, F

k
=
n

i=k+1
f
i
, k = 0, n,
unde F
0
= 0 si F

n
= 0.
Observatia 3.2.14. Pentru frecvent ele relative are loc relat ia
n

i=1
p
i
= 1,
iar pentru cele cumulate au loc relat iile F
k
+F

k
= N, F
n
= N si F

0
= N.
Denitia 3.2.15. Numim distribut ie statistic a a caracteristicii X tabloul de forma
X
_
x
i
f
i
_
i=1,n
sau X
_
x
i
p
i
_
i=1,n
,
unde x
i
, i = 1, n, sunt clasele considerate, iar f
i
si p
i
, i = 1, n, sunt respectiv
frecvent ele absolute si frecvent ele relative.
Exemplul 3.2.16. Consider am datele statistice de la Exemplul 3.2.10. Atunci distri-
but ia statistic a a caracteristicii X poate scris a, e cu ajutorul frecvent elor absolute,
e cu ajutorul frecvent elor relative. Astfel avem c a
X
_
_
0.85 1.15 1.45 1.75 2.05 2.35 2.65 2.95 3.25 3.55 3.85
1 2 9 9 10 15 10 5 4 3 2
_
_
124 Statistic a descriptiv a
X \ Y y
1
y
2
. . . y
n
x
1
f
11
f
12
. . . f
1n
f
1
x
2
f
21
f
22
. . . f
2n
f
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
m
f
m1
f
m2
. . . f
mn
f
m
f
1
f
2
. . . f
n
f

= N
Tabelul 3.1: Tabel de contingent a
sau
X
_
_
0.85 1.15 1.45 1.75 2.05 2.35 2.65 2.95 3.25 3.55 3.85
1
70
2
70
9
70
9
70
10
70
15
70
10
70
5
70
4
70
3
70
2
70
_
_
Denitia 3.2.17. Fie colectivitatea C relativ la care sunt cercetate dou a caracteristici
X si Y . Numim tabel de contingent a, un tablou care cont ine clasele caracteristicilor
X si respectiv Y , mpreun a cu frecvent ele absolute ale acestor clase.
Observatia 3.2.18. Dac a pentru cele dou a caracteristici X si Y avem respectiv
clasele date prin x
i
, i = 1, m, si y
j
, j = 1, n, iar datele primare sunt date
prin perechile (x

1
, y

1
) , (x

2
, y

2
) , . . . , (x

N
, y

N
), atunci tabelul de contingent a este
Tabelul 3.1 unde f
ij
este frecvent a absolut a a aparit iei clasei (x
i
, y
j
) n datele pri-
mare (x

k
, y

k
), k = 1, N. Dup a cum se vede tabelul a fost completat cu o linie si o
coloan a ale c aror elemente sunt date prin formulele
f
j
=
m

i=1
f
ij
, j = 1, n, f
i
=
n

j=1
f
ij
, i = 1, m,
f

=
n

j=1
f
j
=
m

i=1
f
i
=
m

i=1
n

j=1
f
ij
= N.
Observatia 3.2.19. C and caracteristicile X si Y sunt caracteristici cantitative si ntre
ele exist a o relat ie de dependent a, tabelul de contingent a se numeste tabel de corela-
t ie.
Exemplul 3.2.20. Un astfel de tabel de corelat ie este prezentat pentru datele statistice
ce reprezint a 425 de copii de 10 ani cercetat i din punct de vedere al n alt imii X
(n centimetri) si al greut at ii Y (n kilograme). Datele au fost trecute n tabelul de
corelat ie care urmeaz a
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 125
X
_
Y 24 25 26 27 28 29 30 31 32 33 34 35 fi
126 1 1 3 1 6
127 3 4 1 1 9
128 1 4 5 7 1 2 1 21
129 1 2 6 9 6 4 1 29
130 1 7 36 17 6 2 1 70
131 1 6 27 56 39 18 4 1 152
132 2 10 16 26 7 2 1 64
133 1 7 10 11 6 2 1 38
134 1 2 4 7 3 1 18
135 1 2 3 1 1 8
136 1 2 2 1 6
137 1 2 1 4
fj 2 9 16 30 84 106 89 45 24 11 7 2 425
3.2.3 Functiile tabulate si crosstab
Obt inerea de tabele sistematizate, n Matlab, este posibil a cu ajutorul acestor dou a
funct ii din Statistics toolbox.
Functia tabulate
Apelul funct iei tabulate se poate face prin:
tabulate(x)
t=tabulate(x)
unde x este un vector cu valori pozitive. Prin executarea unei astfel de instruct iune,
se obt ine pe ecran respectiv n t un tabel statistic sistematizat av and trei coloane.
Prima coloan a cont ine valorile distincte ale lui x, a doua cont ine frecvent ele absolute
ale acestor valori distincte, iar ultima reprezint a frecvent ele relative n procente.
Programul 3.2.21. Vom scrie un program Matlab, care generea a N numere aleatoare
ce urmeaz a legea uniform a U (a, b), dup a care construieste tabelul sistematizat, con-
sider and num arul claselor n dat prin regula lui Sturges, iar clasele ind identicate
prin mijloacele lor.
clear
a=input(a:); b=input(b (a<b):);
N=input(N=); n=fix(1+10/3
*
log10(N));
xx=unifrnd(a,b,1,N); c=a:(b-a)/n:b;
for i=1:N
for j=1:n
if c(j)<=xx(i) & xx(i)<c(j+1)
x(i)=j;
end
end
end
126 Statistic a descriptiv a
t=tabulate(x);
for j=1:n
t(j,1) =(c(j)+c(j+1))/2;
end
fprintf( Clasa f frel\n)
fprintf( ______________________\n)
fprintf(%7.3f %5d %8.2f%%\n,t)
Executarea programului, cu datele de intrare a=0, b=5 si N=200, produce tabel
sistematizat:
Clasa f frel
______________________
0.313 22 11.00%
0.938 27 13.50%
1.563 27 13.50%
2.188 32 16.00%
2.813 27 13.50%
3.438 23 11.50%
4.063 25 12.50%
4.688 17 8.50%
Functia crosstab
Apelul funct iei crosstab se poate face prin:
crosstab(x,y,z,...)
t=crosstab(x,y,z,...)
unde x, y, z, ... sunt vectori cu valori nntregi pozitive av and aceleasi lungimi. Prin
executarea unei astfel de instruct iune, se obt ine pe ecran respectiv n t un tabel statis-
tic sistematizat t, cu at atea intr ari c at i parametri (vectori) exist a. Dac a sunt doi para-
metri, x si y, se obt ine tabelul de contingent a.
Programul 3.2.22. Programul Matlab care urmeaz a, genereaz a N vectori aleatori ce
urmeaz a legea normal a bidimensional a, dup a care construieste tabelul de corelat ie cu
m clase n raport cu prima variabil a, respectiv n clase n raport cu a doua variabil a.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
N=input(N=); m=input(m=); n=input(n=);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
X=mvnrnd(mu,v,N); xx=X(:,1); yy=X(:,2);
xmin=min(xx); xmax=max(xx);
ymin=min(yy); ymax=max(yy);
cx =xmin:(xmax-xmin)/m:xmax;
cy =ymin:(ymax-ymin)/n:ymax;
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 127
for k=1:N
for i=1:m-1
if (cx(i)<=xx(k)) & (xx(k)<cx(i+1))
x(k)=i;
end
end
if (cx(m)<=xx(k)) & (xx(k)<=cx(m+1))
x(k)=m;
end
for j=1:n-1
if (cy(j)<=yy(k)) & (yy(k)<cy(j+1))
y(k)=j;
end
end
if (cy(n)<=yy(k)) & (yy(k)<=cy(n+1))
y(k)=n;
end
end
t=crosstab(x,y);
disp(t)
Pentru N=100, mu=(5,10), v =
_
2 1
1 3
_
, m=6 si n=4, se obt ine tabelul de
corelat ie:
1 2 0 0
2 7 0 0
5 14 6 1
2 17 8 1
1 12 12 3
1 1 1 3
3.2.4 Functiile caseread, casewrite, tblread si tblwrite
Pentru completarea tabelului de contingent a construit prin funct ia crosstab, se
poate face apel la aceste funct ii.
Functia casewrite
Apelul funct iei casewrite are sintaxa
casewrite(obs,file)
si are ca efect scrierea datelor din matricea obs de tip caracter n sierul cu numele
file.
Functia caseread
Apelul funct iei caseread are sintaxa
obs=caseread(file)
si are ca efect citirea datelor din sierul cu numele file n matricea obs de tip
caracter.
128 Statistic a descriptiv a
Functia tblwrite
Sintaxa funct iei tblwrite este:
tblwrite(t,va,obs,file)
si are ca efect scrierea n sierul cu numele file a matricelor va, obs de tip
caracter si a datelor din matricea numeric a t.
Matricele va si obs trebuie s a aib a at atea linii c ate coloane, respectiv c ate linii
are matricea t. Liniile celor dou a matrice de tip caracter vor reprezenta etichete pen-
tru coloanele, respectiv liniile matricei t, si drept urmare vor asezate n dreptul
coloanelor si liniilor corespunz atoare.
Functia tblread
Sintaxa funct iei tblread este:
[t,va,obs]=tblread(file)
si are ca efect citirea din sierul cu numele file a matricelor va, obs de tip caracter
si a datelor din matricea numeric a t.
Programul 3.2.23. Programul care urmeaz a completeaz a Programul 3.2.22, pentru
obt inerea n tabelul de contingent a si a mijloacelor claselor pentru cele dou a variabile.
. . . . . . . . . . . . . .
t=crosstab(x,y);
fy=fopen(ly.txt,w+);
for j=1:n
laby(j)=(cy(j)+cy(j+1))/2;
ly=num2str(laby(j));
fprintf(fy,%s\n,ly);
end
fx=fopen(lx.txt,w+);
for i=1:m
labx(i)=(cx(i)+cx(i+1))/2;
lx=num2str(labx(i));
fprintf(fx,%s\n,lx);
end
va=caseread(ly.txt); obs=caseread(lx.txt);
tblwrite(t,va,obs,clase.txt);
type clase.txt, fclose(all);

In urma execut arii programului cu aceleasi date de intrare folosite n Progra-


mul 3.2.22, prin instruct iune type este asat pe ecran tabelul de contingent a:
7.5244 9.7152 11.906 14.0967
2.5895 4 6 2 0
3.8424 4 16 7 0
5.0952 1 13 12 0
6.348 2 12 9 1
7.6008 1 1 4 3
8.8537 0 0 1 1
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 129
Se observ a c a datele din tabelul obt inut nu sunt aceleasi cu cele obt inute prin exe-
cutarea Programului 3.2.22, desi se dau aceleasi date de intrare. Lucru de asteptat,
av and n vedere c a se genereaz a un alt set de numere aleatoare.
Se observ a de asemenea, n noul program, c a apar instruct iunile fopen,
fclose, caseread, tblwrite.
Instruct iunea fopen este folosit a pentru deschiderea sierelor lx.txt si
ly.txt, care vor cont ine etichetele claselor celor dou a variabile. Acestea sunt
date de mijloacele claselor si sunt transformate n siruri de caractere prin comanda
num2str. Parametrul w+, are ca efect crearea unui sier nou sau actualizarea
unuia deja existent, dup a ce a fost anulat cont inutul s au, n vederea scrierii sau citirii
n respectivul sier. Evident instruct iunea fclose este folosit a n vederea nchiderii
sierelor.
Prin instruct iunile casereadsunt citite etichetele claselor din sierele lx.txt
si ly.txt, care apoi sunt folosite pentru scrierea acestora n sierul clase.txt,
cu ajutorul comenzii tblwrite, mpreun a cu elementele tabelului de contingent a.
3.2.5 Reprezent ari grace
Denitia 3.2.24. Numim diagram a prin batoane (bare) a unei distribut ii statistice X
de tip discret, reprezentarea grac a ntr-un sistem de axe rectangulare a segmentelor
(batoanelor) date prin { (x
i
, y) | 0 y f
i
}, i = 1, n, > 0 ind un factor de
proport ionalitate, iar f
i
este frecvent a absolut a a valorii x
i
.
Denitia 3.2.25. Numim diagram a cumulativ a (ascendent a) a unei distribut ii sta-
tistice X de tip discret, linia poligonal a care uneste punctele de coordonate
(x
1
, F
0
), (x
1
, F
1
), (x
2
, F
1
), (x
2
, F
2
), (x
3
, F
2
) , . . ., (x
n
, F
n
), unde F
i
este
frecvent a cumulat a (ascendent a) atasat a valorii x
i
, iar > 0 este un factor de
proport ionalitate.
Denitia 3.2.26. Numim histograma unei distribut ii statistice X de tip continuu,
diagrama obt inut a prin construirea de dreptunghiuri av and drept baze clasele
distribut iei statistice si n alt imile astfel considerate nc at ariile dreptunghiurilor s a
e proport ionale cu frecvent ele claselor.
Observatia 3.2.27. C and clasele distribut iei statistice sunt de amplitudini egale,
atunci n alt imile dreptunghiurilor histogramei sunt proport ionale cu frecvent ele
claselor. Dac a factorul de proport ionalitate este
1
N
, atunci se obt ine histograma
frecvent elor relative.
Se stie c a aria delimitat a de curba ce reprezint a gracul unei densit at i de pro-
babilitate si axa absciselor este 1. Din acest motiv, este de preferat ca factorul de
proport ionalitate n construirea histogramei frecvent elor relative s a e astfel ales nct
130 Statistic a descriptiv a
aria total a a dreptunghiurilor histogramei s a e de asemenea 1. Se veric a usor c a
dac a N este volumul datelor, iar clasa [a
i1
, a
i
) are amplitudinea h
i
= a
i
a
i1
,
pentru i = 1, n, atunci funct ia n scar a ce delimiteaz a aceste dreptunghiuri este dat a
prin:

f (x) =
f
i
Nh
i
, x [a
i1
, a
i
) , i = 1, n.
Exemplul 3.2.28. Dac a se consider a datele statistice din Exemplul 3.2.10, si av and n
vedere sistematizarea acestora, atunci histograma frecvent elor absolute este prezen-
tat a n Figura 3.1.
0.4 0.7 1 1.3 1.6 1.9 2.2 2.5 2.8 3.1 3.4 3.7 4 4.3
0
2
4
6
8
10
12
14
16
Figura 3.1: Histograma frecvent elor absolute
Metoda ferestrei mobile
Histograma frecvent elor relative a distribut iei statistice reprezint a o aproximare
destul de rudimentar a a gracului densit at ii de probabilitate a caracteristicii X. O
ameliorare a acestei aproxim ari se obt ine dac a se aplic a metoda ferestrei mobile.
Metoda ferestrei mobile const a n construirea clasei
_
x
h
2
, x +
h
2
_
, h > 0, pen-
tru ecare x (a, b), si determinarea frecvent ei f
x
a acestei clase, cu ajutorul c areia
se obt ine curba dat a prin

f (x) =
fx
Nh
, x (a, b) .
Dac a se consider a funct ia indicatoare K a intervalului
_

1
2
,
1
2
_
, adic a
(3.2.1) K(x) =
_
_
_
1, dac a x
_

1
2
,
1
2
_
,
0, dac a x /
_

1
2
,
1
2
_
,
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 131
atunci

f (x) =
1
Nh
N

i=1
K
_
x x

i
h
_

Pentru a obt ine o form a mai regular a pentru



f se pot considera si alte tipuri de
funct ie nucleu K, care de regul a este o densitate de probabilitate simetric a.
Mai des se utilizeaz a nucleul Gaussian
(3.2.2) K(x) =
1

2
e

x
2
2
, x R,
sau nucleul parabolic (Epanechnikov)
(3.2.3) K (x) =
_

_
3
4

5
_
1
x
2
5
_
, dac a |x| <

5,
0, dac a |x|

5.
Alte nuclee ce sar putea folosi sunt:
K (x) =
_

_
15
16
_
1 x
2
_
2
, dac a |x| < 1,
0, dac a |x| 1,
(3.2.4)
K (x) =
_
_
_
1 + cos (2x) dac a 0 < x < 1,
0, dac a |x| 1,
(3.2.5)
K (x) =
_
_
_
1 |x| dac a |x| < 1,
0, dac a |x| 1.
(3.2.6)
Programul 3.2.29. Programul ce urmeaz a genereaz a N numere aleatoare ce urmeaz a
legea normal a N (0, 1), dup a care, folosind acelasi pas h pozitiv, reprezint a grac
funct ia

f mpreun a cu densitatea de probabilitate a legii normale, pentru ecare din
cele sase nuclee, mai sus denite.
Calculul valorilor celor sase nuclee se face cu urm atoarea funct ie Matlab:
function y = K(k,x)
switch k
case 1
y=(abs(x)<1/2);
case 2
y=1/(sqrt(2
*
pi))
*
exp(-x.2/2);
case 3
y=(abs(x)<sqrt(5));
132 Statistic a descriptiv a
y=3/(4
*
sqrt(5))
*
(1-x.2/5).
*
y;
case 4
y=(abs(x)<1);
y=15/16
*
(1-x.2).2.
*
y;
case 5
y=((x>0)&(x<1));
y=(1+cos(2
*
pi
*
x)).
*
y;
case 6
y=(abs(x)<1); y=abs(x).
*
y;
otherwise
error(Eroare)
end
iar programul Matlab este
clf,clear
N=input(N=); h=input(h=);
X=randn(1,N); x=-3:0.01:3;
n=length(x); p=pdf(norm,x,0,1);
for ka=1:6
s=zeros(1,n);
for i=1:N
s=s+K(ka,(x-X(i))/h);
end
f=s/(N
*
h);
subplot(3,2,ka), plot(x,f,-,x,p,--)
end

In urma execut arii programului, cu valorile N=500 si h=1, se obt in gracele din
Figura 3.2.
Denitia 3.2.30. Numim poligonul frecvent elor al unei distribut ii statistice X de tip
continuu, poligonul obt inut prin unirea punctelor de coordonate (x
i
,
i
f
i
), i = 1, n,
unde
i
este factor de proport ionalitate, iar f
i
este frecvent a clasei x
i
.
Exemplul 3.2.31. Dac a se consider a datele statistice din Exemplul 3.2.10, si av and n
vedere sistematizarea acestora, atunci poligonul frecvent elor absolute este prezentat a
n Figura 3.3.
Denitia 3.2.32. Numim diagrame integrale (cumulative) ale frecvent elor cumulate
ascendente, respectiv descendente, relative la distribut ia statistic a X de tip continuu,
liniile poligonale obt inute prin unirea punctelor de coordonate (a
k
, F
k
), k = 0, n,
si respectiv (a
k
, F

k
) , k = 0, n.
Exemplul 3.2.33. Dac a se consider a datele statistice din Exemplul 3.2.10, si av and n
vedere sistematizarea acestora, atunci diagramele integrale ale frecvent elor cumulate
(ascendente si descendente) sunt prezentate n Figura 3.4.
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 133
4 2 0 2 4
0
0.1
0.2
0.3
0.4
4 2 0 2 4
0
0.1
0.2
0.3
0.4
4 2 0 2 4
0
0.1
0.2
0.3
0.4
4 2 0 2 4
0
0.1
0.2
0.3
0.4
4 2 0 2 4
0
0.1
0.2
0.3
0.4
4 2 0 2 4
0
0.1
0.2
0.3
0.4
Figura 3.2: Grace pentru

f (x)
Pentru trasarea diagramelor integrale, n tabelul urm ator calcul am frecvent ele ab-
solute ascendente si respectiv descendente, conform formulelor
F
k
=
k

i=1
f
i
, F

k
=
n

i=k+1
f
i
, k = 0, n.
x a0a1 a1a2 a2a3 a3a4 a4a5 a5a6 a6a7 a7a8 a8a9 a9a10 a10a11
f 1 2 9 9 10 15 10 5 4 3 2
F 1 3 12 21 31 46 56 61 65 68 70
F

69 67 58 49 39 24 14 9 5 2 0
Denitia 3.2.34. Numim nor statistic atasat caracteristicilor X si Y , punctele din
plan obt inute prin reprezentarea grac a a datelor primare (x

k
, y

k
), k = 1, N.
Observatia 3.2.35. Norul statistic este utilizat pentru observarea formei leg aturii
funct ionale care exist a ntre cele dou a caracteristici. Amintim c ateva leg aturi mai
des nt alnite:
y =ax +b, x R, a, b R,
y =ax
b
, x > 0, a, b R,
134 Statistic a descriptiv a
0.55 0.85 1.15 1.45 1.75 2.05 2.35 2.65 2.95 3.25 3.55 3.85 4.15
0
2
4
6
8
10
12
14
16
Figura 3.3: Poligonul frecvent elor absolute
y =ab
x
, x > 0, a > 0, b > 0,
y =ax
2
+bx +c, x R, a, b, c R,
y =a +
b
x
, x = 0, a, b R.
Dac a leg atura liniar a y = ax + b este usor de observat din norul statistic, pen-
tru celelalte se ncearc a liniarizarea. De exemplu, dac a y = ax
b
, prin logaritmare se
ajunge la log y = log a + b log x. Se noteaz a log y = v, log a = A, log x = u si se
obt ine leg atura liniar a v = A+bu, pentru log X si log Y . Pentru aceasta se va repre-
zenta grac norul statistic dat de punctele (log x

k
, log y

k
), k = 1, N. Dac a punctele
din acest nor statistic sunt situate n jurul unei drepte, atunci se poate considera c a
leg atura dintre X si Y este de forma y = ab
x
.
3.2.6 Functii Matlab pentru reprezentarea grac a a datelor statistice
Sistemul Matlab, at at prin sistemul de baz a, c at si prin Statistics toolbox, dispune de
funct ii pentru reprezentarea grac a a datelor statistice.
Cazul discret
Dac a n cercetare se consider a o caracteristic a (variabil a) X de tip discret, funct iile
Matlab, deja prezentate, bar si stairs se pot utiliza cu succes.
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 135
0.4 0.7 1 1.3 1.6 1.9 2.2 2.5 2.8 3.1 3.4 3.7 4 4.3
0
10
20
30
40
50
60
70
Figura 3.4: Diagramele integrale ale frecvent elor absolute
Pentru exemplicarea modului de utilizare a acestor funct ii Matlab, vom scrie
dou a funct ii Matlab pentru construirea diagramei prin batoane si respectiv pentru
construirea diagramei cumulative ascendente.
Functia 3.2.36. Funct ia Matlab pe care o scriem, va genera N numere aleatoare ce
urmeaz a o lege de probabilitate de tip discret, va construi diagrama prin batoane pen-
tru datele astfel obt inute, iar pe aceeasi gur a va reprezenta, pentru comparat ie, tot
prin batoane, funct ia de probabilitate a legii de probabilitate considerate. Pentru o
vizualizare corect a a comparat iei, se impune, e amplicarea funct iei de probabili-
tate cu factorul N, e mp art irea frecvent elor distribut iei statistice cu N, adic a prin
considerarea frecvent elor relative.

In cele ce urmeaz a vom considera prima variant a.
function diag1(N,lege)
% Functia diag1 produce diagrama prin batoane
% N - reprezinta volumul datelor ce urmeaza a fi generate
% lege - reprezinta denumirea Matlab a legii de probabilitate
clf, colormap spring
switch lege
case unid
n = input(n (parametrul legii uniforme discrete):);
x = random(lege,n,1,N);
t = tabulate(x);
P =N
*
pdf(lege,t(:,1),n);
bar(t(:,1),[t(:,2),P])
legend(Frecvente observate, Frecvente teoretice,1)
return
case bino
n = input(n=); p = input(p=);
x = random(lege,n,p,1,N);
136 Statistic a descriptiv a
t = tabulate(x+1);
P =N
*
pdf(lege,t(:,1)-1,n,p);
case hyge
M = input(M=); K = input(K=);
n = input(n=);
x = random(lege,M,K,n,1,N);
t = tabulate(x+1);
P =N
*
pdf(lege,t(:,1)-1,M,K,n);
case poiss
lambda = input(lambda=);
x = random(lege,lambda,1,N);
t = tabulate(x+1);
P =N
*
pdf(lege,t(:,1)-1,lambda);
case nbin
r = input(r=); p = input(p=);
x = random(lege,r,p,1,N);
t = tabulate(x+1);
P =N
*
pdf(lege,t(:,1)-1,r,p);
case geo
p = input(p=);
x = random(lege,p,1,N);
t = tabulate(x+1);
P =N
*
pdf(lege,t(:,1)-1,p);
otherwise
error(Lege discreta necunoscuta)
end
bar(t(:,1),[t(:,2),P])
legend(Frecvente observate, Frecvente teoretice,1)
Apelul funct iei diag1 se face prin
>>diag1(N,lege)
unde valorile pentru N si lege, e c a sunt precizate n acest apel, e sunt precizate
nainte. De exemplu, comanda
>>diag1(50,poiss)
are ca efect apelul funct iei pentru legea lui Poisson, iar pe ecran se va cere introduce-
rea parametrului lambda, dup a care pe ecran va reprezentat gracul din Figura 3.5,
n cazul n care lambda=7. S a remarc am totusi c a la un nou apel, cu aceeasi para-
metri, gracul difer a, deoarece sunt generate alte numere aleatoare.
Functia 3.2.37. Urm atoarea funct ie Matlab, va genera N numere aleatoare ce
urmeaz a o lege de probabilitate de tip discret, va construi diagrama cumulativ a
ascendent a pentru datele astfel obt inute, iar pe aceeasi gur a va reprezenta, pen-
tru comparat ie, funct ia de repartit ie a legii de probabilitate considerate. Pentru o
vizualizare corect a a comparat iei, se impune, e amplicarea funct iei de repartit ie cu
factorul N, e mp art irea frecvent elor cumulate ale distribut iei statistice cu N, adic a
prin considerarea frecvent elor relative cumulate.

In cele ce urmeaz a vom considera a
doua variant a.
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 137
0 2 4 6 8 10 12 14 16 18
0
1
2
3
4
5
6
7
8
9
Frecvente observate
Frecvente teoretice
Figura 3.5: Legea Po (7)
function diag2(N,lege)
% Functia diag2 produce diagrama cumulativa
% N - reprezinta volumul datelor generate
% lege - reprezinta denumirea legii de probabilitate
clf
switch lege
case unid
n=input(n (parametrul legii uniforme discrete):);
x=random(lege,n,1,N);
t=tabulate(x);
xx=[t(1,1)-1;t(:,1);t(end,1)+1];
cf=[0;cumsum(t(:,2));N]/N;
P=cdf(lege,xx,n);
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.),return
case bino
n=input(n=); p=input(p=);
x=random(lege,n,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,n,p);1];
case hyge
M=input(M=); K=input(K=);
n=input(n=);
x=random(lege,M,K,n,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
138 Statistic a descriptiv a
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,M,K,n);1];
case poiss
lambda=input(lambda=);
x=random(lege,lambda,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,lambda);1];
case nbin
r=input(r=); p=input(p=);
x=random(lege,r,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,r,p);1];
case geo
p=input(p=);
x=random(lege,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,p);1];
otherwise
error(Lege discreta necunoscuta)
end
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.)
Apelul funct iei diag2 se face analog apelului funct iei diag1 prezentat a n
Funct ia 3.2.36:
>>diag2(N,lege)
De exemplu, comanda
>>diag2(50,bino)
are ca efect apelul funct iei pentru legea binomial a, iar pe ecran se vor cere introdu-
cerea parametrilor n si p, dup a care pe ecran va reprezentat gracul din Figura 3.6,
n cazul n care n=7 si p=0.4. Diagrama cumulativ a este reprezentat a prin line con-
tinu a, iar funct ia de repartit ie teoretic a prin linie-punct. S i aici remarc am c a la un
nou apel, cu aceeasi parametri, gracul difer a, deoarece sunt generate alte numere
aleatoare.
Cazul continuu
Reprezent ari grace pentru distribut ia statistic a a unei caracteristici (variabile) de tip
continuu se obt in, e prin utilizarea funct iei plot si bar, e prin funct iile hist,
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 139
1 0 1 2 3 4 5 6 7
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Figura 3.6: Legea B (7, 0.4)
histc. Remarc am faptul c a hist si histc sunt funct ii specice sistemului de
baz a Matlab.
Functia hist
Modurile de apel ale funct iei hist sunt:
hist(y)
hist(y,nb)
hist(y,x)
n=hist(y)
n=hist(y,nb)
n=hist(y,x)
[n,x]=hist(y)
[n,x]=hist(y,nb)
Primele trei forme au ca efect reprezentarea grac a a histogramei corespunz atoare
datelor cont inute de vectorul y. Parametrul nb reprezint a num arul claselor de ampli-
tudini egale, iar dac a acesta lipseste, se consider a nb=10. Amplitudinea acestor clase
este obt inut a prin mp art irea lungimii intervalului denit prin valoarea minim a si va-
loarea maxim a ale componentelor vectorului y la nb. C and se utilizeaz a parametrul
x, acesta trebuie s a cont in a mijloacele claselor.
Celelalte forme nu produc reprezent ari grace pentru histograme, ci doar cal-
culeaz a frecvent ele absolute si respectiv mijloacele claselor n vectorii n si x, care au
lungimea dat a prin nb.
140 Statistic a descriptiv a
Toate formele accept a parametrul y ca ind matrice, caz n care operat ia se exe-
cut a pentru ecare coloan a a matricei.
Functia histc
Apelul funct iei histc se poate face prin:
n=histc(y,a)
[n,nb]=hist(y,a)
care au ca efect, pentru datele vectorului y, obt inerea n n a frecvent elor claselor
precizate prin componentele vectorului a, care se impune a ordonate cresc ator.
Valorile lui y care sunt nafara componentelor lui a nu sunt luate n considerare.
De aceea e de dorit ca s a e folosite valorile -inf si inf pentru a incluse toate
valorile lui y.
Dac a y este o matrice, atunci funct ia opereaz a pentru ecare coloan a n parte.
Parametrul nb va cont ine numerele de ordine ale claselor n care au intrat ecare
din elementele lui y. Pentru elementele care nu au fost clasicate se obt ine valoarea 0.
S a remarc am c a Figura 3.1, Figura 3.3 si Figura 3.4 au fost realizate, respectiv cu
programele Matlab:
clear, clf, load x.dat -ascii2
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
for j=1:n
mij(j)=(a(j)+a(j+1))/2;
end
fr=histc(x,a); fr=fr(1:end-1);
bar(mij,fr,1)
axis([0.4 4.3 0 16])
set(gca,xtick,[0.4:0.3:4.3]), colormap spring
clear, clf, load x.dat -ascii
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
for j=1:n
mij(j)=(a(j)+a(j+1))/2;
end
fr=histc(x,a); fr=fr(1:end-1);
plot(mij,fr,k-o)
axis([0.55 4.15 0 16])
set(gca,xtick,[0.55:0.3:4.15]), grid on
clear, clf, load x.dat -ascii
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
fr=histc(x,a); fr=fr(1:end-1);
FA=[0;cumsum(fr)], FD=N-FA,
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 141
plot(a,FA,k-o,a,FD,k-o)
axis([0.4 4.3 0 70])
set(gca,xtick,[0.4:0.3:4.3]), grid on
care utilizeaz a funct iile histc si bar.
Functia 3.2.38. Urm atoarea funct ie Matlab, va genera N numere aleatoare ce
urmeaz a o lege de probabilitate de tip continuu si va construi histograma pentru datele
astfel obt inute.

Intro gur a al aturat a se va construi histograma folosind funct ia bar,
mpreun a cu densitatea de probabilitate a legii de probabilitate considerate. Pentru o
vizualizare corect a a comparat iei, se impune, mp art irea frecvent elor absolute cu Nh,
unde h este amplitudinea claselor.
function hist0(N,lege)
% Functia hist0 produce histograma
% N - reprezinta volumul datelor generate
% lege - reprezinta denumirea legii de probabilitate
clf, colormap spring
n=fix(1+10/3
*
log10(N));
switch lege
case unif
a=input(a:); b=input(b(a<b):);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case norm
mu=input(mu=); s=input(sigma=);
x=random(lege,mu,s,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu,s);
case logn
mu=input(mu=); s=input(sigma=);
x=random(lege,mu,s,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu,s);
case gam
a=input(a=); b=input(b=);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case exp
mu=input(mu=);
x=random(lege,mu,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu);
142 Statistic a descriptiv a
case beta
a=input(a=); b=input(b=);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case weib
a=input(a=); b=input(b=)
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case rayl
b=input(b=);
x=random(lege,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a);
otherwise
error(Lege continua necunoscuta)
end
subplot(1,2,1), hist(x,n)
subplot(1,2,2), bar(c,f/(N
*
h),1)
hold on, plot(t,y,k-)
Apelul funct iei hist0 se face prin
>>hist0(N,lege)
De exemplu, comanda
>>hist0(500,norm)
are ca efect apelul funct iei pentru legea normal a, iar pe ecran se va cere introdu-
cerea parametrilor mu si sigma, dup a care pe ecran va reprezentat gracul din
Figura 3.7, n cazul n care mu=0 si sigma=1.
Functia scatter
Sistemul Matlab este prev azut cu funct ia scatter pentru reprezentarea norului
statistic n cazul bidimensional. Apelul funct iei se face prin:
scatter(x,y)
scatter(x,y,s)
scatter(x,y,s,c)
scatter(x,y,s,c,m)
scatter(x,y,s,c,m,filled)
Efectul execut arii unei astfel de instruct inui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime.
Parametrul opt ional s specic a m arimea marcajelor (cerculet e) punctelor noru-
lui. Acesta poate s a e un scalar, n care caz toate marcajele vor avea aceleasi m arimi
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 143
4 2 0 2 4
0
20
40
60
80
100
120
140
4 2 0 2 4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
Figura 3.7: Legea N (0, 1)
sau poate s a e un vector de aceeasi lungime cu x si y, caz n care se pot specica
m arimi diferite pentru puncte diferite.
Parametrul c specic a culoarea marcajelor si poate lua una din cele opt culori
folosite si la funct ia plot. Dac a c este vector, atunci trebuie s a aib a aceeasi lungime
cu ceilalt i parametri de tip vector, caz n care se pot specica culorile ec arui marcaj
n parte.
Parametrul m permite nlocuirea marcajului implicit (cerculet ), prin marcajul pre-
cizat prin m.
Prezent a opt iunii filled atrage dup a sine umbrirea interiorului marcajului.
Remarc am faptul c a se poate folosi cu succes funct ia plot, dac a se foloseste un
singur tip de marcaj.
Functia scatter3
Sistemul Matlab este prev azut cu funct ia scatter3 pentru reprezentarea norului
statistic n cazul tridimensional. Apelul funct iei se face cu aceleasi instruct iuni ca si
n cazul funct iei scatter, doar c a se mai insereaz a nc a un parametru z, a treia
dimensiune, dup a primii doi parametri x si y.
144 Statistic a descriptiv a
Functia gscatter
Statistics toolbox dispune de funct ia gscatter pentru reprezentarea norului statis-
tic n cazul bidimensional pe grupe de puncte. Apelul funct iei se face prin:
gscatter(x,y,g)
gscatter(x,y,s)
gscatter(x,y,c,m,s)
gscatter(x,y,c,m,s,leg)
gscatter(x,y,c,m,s,leg,xl,yl)
Efectul execut arii unei astfel de instruct inui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime, folosind gruparea specicat a prin vec-
torul g de aceeasi lungime. Punctele norului vor marcate la fel pentru valori identice
corespunz atoare ale lui g.
Parametrul c specic a culorile marcajelor si are valoarea implicit a dat a
prinbgrcmyk.
Parametrul opt ional m este un tablou de tip caractere recunoscute de funct ia
plot, valoarea implicit a ind caracterul . (punct).
Parmetrul s specic a m arimea marcajelor punctelor norului. Acesta poate s a e
un scalar, n care caz toate marcajele vor avea aceleasi m arimi sau poate s a e un
vector.
Dac a nu sunt specicate valori suciente pentru toate grupele, sistemul Matlab
efectueaz a o ciclare a valorilor specicate.
Parametrul leg precizeaz a dac a se doreste asarea unei legende (implicit acesta
este on), sau nu se doreste legend a, c and se va specica valoarea off.
Parametrii xl si yl precizeaz a etichetele pentru cele dou a axe de coor-
doante. Dac a acesti parametri lipsesc, sistemul Matlab eticheteaz a axele de coor-
doante cu denumirile variabilelor x si respectiv y.
Programul 3.2.39. Programul ce urmeaz a genereaz a n vectori aleatori ce urmeaz a
legea normal a bidimensional a si n numere aleatoare ce urmeaz a legea uniform a dis-
cret a. Folosind aceste date, se va reprezenta norul vectorilor aleatori bidimensionali,
efectu and gruparea conform numerelor aleatoare uniforme generate.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N(parametrul legii uniforme):);
n=input(n=); X=mvnrnd(mu,v,n);
x=X(:,1); y=X(:,2); g=unidrnd(N,n,1);
gscatter(x,y,g,k,o
*
.+)
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 145
Pentru n=25, mu=(5,10), v =
_
2 -1
-1 3
_
si N=4, se obt ine Figura 3.8.
3 4 5 6 7 8 9
7
8
9
10
11
12
13
14
x
y
1
2
3
4
Figura 3.8: Nor statistic pe grupe
Functia plotmatrix
Sistemul de baz a Matlab cont ine funct ia plotmatrix, care reprezint a pe aceeasi
gur a mai mult i nori statistici. Formele de apel ale funct iei sunt
plotmatrix(x)
plotmatrix(x,y)
plotmatrix(x,y,s)
unde x si y sunt matrice cu aceleasi num ar de linii, dar num arul coloanelor poate
diferit, e acesta m si respectiv n. Executarea unei instruct ini de acest tip, produce
mn nori statistici, pentru ecare coloan a a matricei x cu ecare coloan a a matricei
y, cu marcajele specicate prin parametrul opt ional s, care are sintaxa de la funct ia
plot.
Prima form a este echivalent a cu
plotmatrix(x,x)
cu except ia c a pe diagonala principal a a matricei norilor statistici vor reprezentate
histogramele coloanelor matricei x.
Programul 3.2.40. Programul urm ator va genera o matrice x de tipul (N,3), care
cont ine vectori aleatori ce urmeaz a legea normal a tridimensional a, dup a care se va
aplica funct ia plotmatrix.
146 Statistic a descriptiv a
clear, mu(1)=input(m1=);
mu(2)=input(m2=); mu(3)=input(m3=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(3,3)=input(sigma32=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
v(1,3)=input(Cov(X,Z)=); v(3,1) =v(1,3);
v(2,3)=input(Cov(Y,Z)=); v(3,2) =v(1,3);
N=input(N=); X=mvnrnd(mu,v,N);
plotmatrix(X,o)
Pentru N=10, mu=(5,10,15) si v =
_
_
2 -1 1
-1 3 0
1 0 1
_
_
, se obt ine Figura 3.9.
10 15 20 5 10 15 0 5 10
12
14
16
18
5
10
15
4
6
8
10
Figura 3.9: Funct ia plotmatrix
Functia gplotmatrix
Statistics toolbox cont ine funct ia gplotmatrix, care are n principal acelasi
efect ca si funct ia plotmatrix, av and ns a posibilitatea as arii punctelor norului
statisitic n funct ie de grupele la care apart in.
Formele de apel sunt cele de la funct ia gscatter, doar c a x si y, n acest caz,
sunt matrice cu acelasi num ar de linii, iar num arul coloanelor put and diferite.
3.2. Culegerea, prezentarea si prelucrarea datelor statistice 147
3.2.7 Functia randtool
Av and la dispozit ie funct iile random si hist, putem s a prezent am funct ia demon-
strativ a randtool. Lansarea acestei funct ii se face prin:
>>randtool
n urma c areia se produce o fereastr a grac a interactiv a (demonstrativ a) privind ge-
nerarea numerelor aleatoare si ilustrarea acestora cu ajutorul histogramelor.
Fixarea (stabilirea) legii de probabilitate n scop demonstrativ se face prin
alegerea din meniul legilor de probabilitate situat n partea st ang a sus a ferestrei.
Volumul numerelor aleatoare, ce urmeaz a a generate, se precizeaz a prin intro-
ducerea acestuia n fereastra din partea dreapt a sus.
Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se poate
proceda n dou a moduri. Fie prin introducerea n ferestrele corespunz atoare ale va-
lorilor dorite, e prin deplasarea barelor atasate acestora.

In plus, limite pentru para-
metrii legii de probabilitate considerate pot precizate prin introducerea acestora n
ferestrele considerate.
Activarea butonului output are ca efect salvarea numerelor aleatoare curente n
varaibila ans sau n variabila precizat a de utilizator, iar butonul resample permite
repetarea gener arii de numere aleatoare cu acelasi volum si aceeasi parametri.
3.2.8 Functiile pie si pie3
Reprezent ari ale datelor prin sectoare circulare n plan, respectiv n spat iu, se obt in
prin funct iile pie si pie3, care se apeleaz a prin formele:
pie(x,ex,label)
pie3(x,ex,label)
unde x este un vector av and componentele pozitive si normalizate, adic a astfel nc at
suma acestora s a e 1. Dac a suma acestora va mai mic a dec at 1, atunci numai o
parte a cercului va reprezentat a grac.
Parametrul ex este opt ional si specic a sectoarele de cerc ce urmeaz a s a e
detasate pe gur a, acesta, dac a este prezent, trebuie s a e un vector numeric de
aceeasi lungime cu vectorul x.
Parametrul opt ional label, specic a etichetele sectoarele de cerc, acesta, dac a
este prezent, trebuie s a e un vector de aceeasi lungime cu vectorul x, dar care cont in
numai siruri de caractere.
Programul 3.2.41. Programul ce urmeaz a genereaz a n numere aleatoare ce urmeaz a
legea uniform a discret a U (N), construieste tabelul sistematizat, dup a care reprezint a
datele sistematizate folosind funct iile pie si pie3.
n=input(n=); N=input(N=);
x=unidrnd(N,1,n);
t=tabulate(x); d=length(t(:,3));
148 Statistic a descriptiv a
ex=zeros(1,d); ex(1)=1;
subplot(2,1,1), pie(t(:,3)/100,ex)
subplot(2,1,2), pie3(t(:,3)/100,ex)
colormap summer
Prin execut ia acestui program, cu datele n=50 si N=4, se obt in reprezent arile grace
din Figura 3.10.
32%
18%
22%
28%
22%
28%
18%
32%
Figura 3.10: Diagrame circulare
3.3 Parametrii distributiilor statistice
Se consider a datele statistice primare x

k
, k = 1, N, relative la caracteristica X, din
care se obt ine distribut ia statistic a
X
_
x
i
f
i
_
i=1,n
.
3.3.1 Parametri statistici ce m asoar a tendinta
Denitia 3.3.1. Media (aritmetic a) a distribut iei statistice a caracteristicii X este
dat a prin
x
a
=
1
N
N

k=1
x

k
=
1
N
n

k=1
f
k
x
k
=
n

k=1
p
k
x
k
.
Denitia 3.3.2. Media geometric a a distribut iei statistice a caracteristicii pozitive X
este dat a prin
x
g
=
N

_
N

k=1
x

k
=
N

_
n

k=1
x
f
k
k
.
3.3. Parametrii distribut iilor statistice 149
Observatia 3.3.3.

In aplicat ii se lucreaz a mai usor cu
log x
g
=
1
N
N

k=1
log x

k
=
1
N
n

k=1
f
k
log x
k
=
n

k=1
p
k
log x
k
.
Denitia 3.3.4. Media armonic a a distribut iei statistice a caracteristicii nenule X
este dat a prin
x
h
=
N

N
k=1
1
x

k
=
N

n
k=1
f
k
1
x
k
=
1

n
k=1
p
k
1
x
k

Observatia 3.3.5.

Intre cele trei medii denite mai nainte exist a relat iile cunoscute
x
h
x
g
x
a
.
3.3.2 Functiile mean, geomean si harmean
Sistemul de baz a Matlab cont ine funct ia mean, iar Statistics toolbox dispune de cele-
lalte dou a funct ii, geomean si harmmean.
Apelul acestor funct ii se face prin:
ma=mean(x)
mg=geomean(x)
mh=harmmean(x)
si au ca efect calculul mediilor corespunz atoare, pentru componentele vectorului x,
iar dac a x este matrice, atunci operat ia se execut a pentru ecare coloan a a matricei.
Prin urmare, n acest ultim caz, rezultatul este un vector av and at atea componente
c ate coloane are matricea x.
3.3.3 Functia trimmean
Sistemul Matlab, prin Statistics toolbox, dispune de funct ia trimmean, care se poate
apela prin
m=trimmean(x,p)
av and ca efect calculul mediei aritmetice a vectorului x, dup a ce au fost eliminate
cele mai mici
p
2
% componente si cele mai mari
p
2
% componente, iar dac a x este
matrice, aceast a operat ie se face pentru ecare coloan a n parte.
Denitia 3.3.6. Numim mediana distribut iei statistice a caracteristicii X, valoarea
numeric a m care mparte datele statistice, ordonate cresc ator, n dou a p art i egale.
Observatia 3.3.7. Fie datele statistice primare ordonate n mod nedescresc ator
x

(1)
x

(2)
x

(N)
,
150 Statistic a descriptiv a
atunci mediana va dat a prin
m =
_

_
x

(k)
, dac a N = 2k 1,
x

(k)
+x

(k+1)
2
, dac a N = 2k.
Observatia 3.3.8. C and datele statistice sunt grupate, atunci se determin a prima dat a
intervalul median [a
j1
, a
j
) astfel nc at pentru frecvent ele cumulate F
j1
si F
j
s a e
satisf acute inegalit at ile F
j1
<
N
2
si F
j
>
N
2
. Folosind apoi interpolarea liniar a se
ia ca median a
m = a
j1
+d
j
N
2
F
j1
f
j
,
unde d
j
este amplitudinea intervalului median.
C and caracteristica cercetat a este de tip discret, mediana este m = x
j
.
3.3.4 Functia median
Sistemul de baz a Matlab dispune de funct ia median. Apelarea acesteia se face prin
m=median(x)
si are ca efect calculul medianei pentru componentele vectorului x, iar dac a x este
matrice, atunci operat ia se execut a pentru ecare coloan a a matricei. Prin urmare, n
acest ultim caz, rezultatul este un vector av and at atea componente c ate coloane are
matricea x.
3.3.5 Parametri statistici ce m asoar a dispersarea
Denitia 3.3.9. Numim cuartile ale distribut iei statistice a caracteristicii X, valorile
numerice Q
1
(cuartila inferioar a), Q
2
= m, Q
3
(cuartila superioar a), care mpart
datele statistice, ordonate cresc ator, n patru p art i egale.
Observatia 3.3.10. C and datele statistice sunt grupate, ca si n cazul medianei, folo-
sind interpolarea liniar a consider am
Q
1
= a
i1
+d
i
N
4
F
i1
f
i
,
Q
3
= a
k1
+d
k
3N
4
F
k1
f
k
,
dup a ce s-a determinat intervalul cuartilic inferior [a
i1
, a
i
), astfel nc at s a aib a loc
F
i1
<
N
4
si F
i
>
N
4
, respectiv intervalul cuartilic superior [a
k1
, a
k
), astfel nc at
F
k1
<
3N
4
si F
k
>
3N
4

3.3. Parametrii distribut iilor statistice 151
C and caracteristica cercetat a este de tip discret, avem c a Q
1
= x
i
si Q
3
= x
k
.
Observatia 3.3.11.

In mod analog se denesc parametri numerici cum ar decilele
si centilele.
3.3.6 Functia prctile
Statistics toolbox cont ine funct ia prctile, care se poate apela prin
c=prctile(x,p)
si care calculeaz a pentru componentele vectorului x, dup a ce acestea au fost ordonate
cresc ator, centilele precizate prin parametrul p, care cont ine unul sau mai numere
ntregi de la 1 la 99. De exemplu, p=[25, 50, 75] produce respectiv cuartila
inferioar a ( Q
1
), mediana, cuartila superioar a ( Q
3
):
Q
1
=
x
(i)
+x
(j)
2
, i = floor
_
n + 1
4
_
, j = ceil
_
n
4
_
,
Q
3
=
x
(i)
+x
(j)
2
, i = floor
_
3 (n + 1)
4
_
, j = ceil
_
3n
4
_

Dac a x este matrice, atunci se opereaz a pentru ecare coloan a n parte.


Denitia 3.3.12. Numim mod al distribut iei statistice a caracteristicii X orice punct
mo de maxim local al distribut ei statistice.
Observatia 3.3.13. C and distribut ia statistic a are un singur mod spunem c a avem
distribut ie statistic a unimodal a. Dac a exist a dou a sau mai multe moduri spunem c a
avem distribut ii statistice bimodale, respectiv multimodale.
Observatia 3.3.14. C and datele statistice sunt grupate, pentru determinarea modului,
se determin a intervalul modal, adic a intervalul cu frecvent a maxim a local a. Dac a
intervalul modal este [a
k1
, a
k
), atunci se consider a
mo = a
k1
+d
k
f
k
f
k
f
k+1
,
unde d
k
= a
k
a
k1
, f
k
= f
k
f
k1
, f
k+1
= f
k+1
f
k
. Formula se obt ine
usor dac a se intersecteaz a interpolantul liniar al punctelor (a
k1
, f
k1
) , (a
k
, f
k
) cu
interpolantul liniar al punctelor (a
k1
, f
k
), (a
k
, f
k+1
)
C and caracteristica cercetat a este de tip discret, avem c a mo = x
k
.
Denitia 3.3.15. Numim moment de ordin k al distribut iei statistice a caracteristicii
X, valoarea numeric a

k
=
1
N
N

i=1
x
k
i
=
1
N
n

i=1
f
i
x
k
i
=
n

i=1
p
i
x
k
i
.
152 Statistic a descriptiv a
Denitia 3.3.16. Numim amplitudinea (interval de variat ie) distribut iei statistice a
caracteristicii X, valoarea numeric a
= max{ x

1
, x

2
, . . . , x

N
} min{ x

1
, x

2
, . . . , x

N
} = x
max
x
min
.
Denitia 3.3.17. Numim abatere cuartilic a (interval intercuartilic) a distribut iei sta-
tistice a lui X, diferent a dintre cuartila superioar a si cuartila inferioar a, adic a
diferent a Q
3
Q
1
.
Observatia 3.3.18. Mai nt alnim, n aplicat ii, variat ia intercuartilic a dat a prin for-
mula
Q =
_
Q
3
m
_
+
_
mQ
1
_
2
=
Q
3
Q
1
2
,
respectiv abaterea cuartil a relativ a
Q
r
=
Q
3
Q
1
Q
2
=
Q
3
Q
1
m

Observatia 3.3.19. Dac a Q
3
Q
1
<

2
, atunci distribut ia se consider a intens con-
centrat a, iar n caz contrar, intens dispersat a.
Denitia 3.3.20. Numim abatere medie (absolut a) a distribut iei statistice X, valoa-
rea numeric a
=
1
N
N

k=1
|x

k
x| =
1
N
n

k=1
f
k
|x
k
x| =
n

k=1
p
k
|x
k
x|,
unde x = x
a
.
Denitia 3.3.21. Numim moment centrat de ordin k al distribut iei statistice X, va-
loarea numeric a

k
=
1
N
N

i=1
_
x

i
x
_
k
=
1
N
n

i=1
f
i
(x
i
x)
k
=
n

i=1
p
i
(x
i
x)
k
.
Denitia 3.3.22. Momentul centrat de ordinul doi al distribut iei statistice X se
numeste dispersie si se noteaz a
2
=
2
, iar =

2
se numeste abatere medie
p atratic a sau abatere standard.
Observatia 3.3.23. Alte formule de calcul pentru dispersie sunt

2
=
1
N
_
n

i=1
f
i
x
2
i

1
N
_
n

i=1
f
i
x
i
_
2
_
,

2
=
1
N
n

i=1
f
i
(x
i
a)
2
(x a)
2
, a R, (formula lui K onig).
3.3. Parametrii distribut iilor statistice 153
Observatia 3.3.24. Se observ a c a pentru calculul dispersiei ar necesar s a e par-
curse datele statistice de dou a ori, odat a pentru calculul mediei aritmetice x, iar apoi
pentru calculul lui
2
, care foloseste pe x. Prezent am o metod a pentru calculul dis-
persiei printr-o singur a parcurgere a datelor statistice.
Pentru aceasta introducem notat iile
t
j
=
j

i=1
x

i
si s
2
j
=
j

i=1
_
x

i

t
j
j
_
2
, j = 1, N.
Vom ar ata, prima dat a, c a are loc relat ia de recurent a
s
2
j
= s
2
j1
+
1
j (j 1)
_
j x

j
t
j
_
2
, j = 2, N.
Pentru stabilirea relat iei de recurent a se scrie succesiv
s
2
j
s
2
j1
=
j

i=1
_
x

i

t
j
j
_
2

j1

i=1
_
x

i

t
j
x

j
j 1
_
2
=
j

i=1
x

2
i

2t
j
j
j

i=1
x

i
+
t
2
j
j

j1

i=1
x

2
i
+
2
_
t
j
x

j
_
j 1
j1

i=1
x

_
t
j
x

j
_
2
j 1
=x

2
j

2t
2
j
j
+
t
2
j
j
+
2
_
t
j
x

j
_
2
j 1

_
t
j
x

j
_
2
j 1
= x

2
j

t
2
j
j
+
_
t
j
x

j
_
2
j 1

Dac a ret inem extremit at ile sirului de egalit at i avem:
s
2
j
s
2
j1
=
1
j (j 1)
_
j
2
x

2
j
2j t
j
x

j
+t
2
j
_
=
1
j (j 1)
_
j x

j
t
j
_
2
,
ce trebuie ar atat.
Observ am c a x =
1
N
t
N
, iar
2
=
1
N
s
2
N
. Prin urmare formula de recurent a de
la punctul precedent permite calculul lui
2
odat a cu calculul lui x, deci printr-o
parcurgere a datelor statistice.
Algoritmul de calcul poate descris prin urm atoarele etape:
1. s := 0, t := x

1
.
2. Pentru j = 2, N: t := t +x

j
, s := s +
1
j (j 1)
_
j x

j
t
_
2
.
3. x =
t
N
;
2
=
s
N

154 Statistic a descriptiv a


Denitia 3.3.25. Numim coecient de variat ie al distribut iei statistice X, raportul
v =

x
,
care de regul a se exprim a n procente (100 v %).
Denitia 3.3.26. Numim coecient de variat ie intercuartil al distribut iei statistice X,
raportul
q =
Q
m
=
Q
3
Q
1
2
Q
2
=
Q
3
Q
1
2Q
2

Denitia 3.3.27. Numim coecientul de asimetrie intercuartil (Yule) al distribut iei


statistice X, raportul
Y =
_
Q
3
Q
2
_

_
Q
2
Q
1
_
_
Q
3
Q
2
_
+
_
Q
2
Q
1
_ =
Q
3
+Q
1
2m
Q
3
Q
1

Observatia 3.3.28. Coecientul lui Yule satisface relat iile 1 Y 1, iar dac a
Q
3
Q
2
> Q
2
Q
1
(Y > 0), atunci mo < m < x, n caz contrar mo > m > x.
Denitia 3.3.29. Numim coecient i ai lui Pearson relativ la distribut ia statistic a X,
rapoartele:
s =
x mo

(coecient de asimetrie),

1
=

2
3

3
2
(skewness),

2
=

2
2
(kurtosis). (3.3.1)
Denitia 3.3.30. Numim coecient i ai lui Fisher relativ la distribut ia statistic a a lui
X, valorile numerice

1
=
_

1
=

3

3
(asimetria), (3.3.2)

2
=
2
3 =

4

2
2
3 =

4

4
3 (excesul).
Observatia 3.3.31. Pentru curba lui Gauss avem c a
1
= 0, deci
1
= 0. C and

1
< 0, maximul curbei distribut iei este deplasat spre dreapta n raport cu valoarea
medie, iar c and
1
> 0, maximul este deplasat spre st anga.
3.3. Parametrii distribut iilor statistice 155
De asemenea, pentru curba lui Gauss avem c a
2
= 3, deci
2
= 0. Astfel, dac a

2
> 3 (
2
> 0) atunci curba distribut iei este mai ngustat a dec at curba lui Gauss,
distribut ia numindu-se leptocurtic a. Dac a
2
< 3 (
2
< 0) curba distribut iei este
mai turtit a, distribut ia numindu-se platicurtic a.
O parte din acesti parametri statistici exist a n sistemul de baz a Matlab, iar alt ii
se g asesc n Statistics toolbox. Facem prezentarea lor n cele ce urmeaz a.
3.3.7 Functia moment
Apelul funct iei moment se poate face prin
s=moment(x,k)
si are ca efect calculul, pentru componentele vectorului x, a momentului centrat de
ordin k, iar dac a x este matrice, atunci se opereaz a pe ecare coloan a n parte.
3.3.8 Functiile var si std
Apelurile funct iilor var si std se pot face prin:
v=var(x)
s=std(x)
v=var(x,w)
v=var(x,1)
Primele dou a forme calculeaz a, pentru componentele vectorului x, dispersia denit a
prin
v =
1
m1
m

i=1
(x
i
x)
2
,
unde m este lungimea vectorului, si respectiv abaterea standard s =

v.
Forma a doua pentru var, c and parametrul opt ional w este prezent, acesta trebuie
s a e un vector cu ponderi pozitive a c aror sum a este 1, si are ca efect calculul lui v
dup a formula
v =
m

i=1
w
i
(x
i
x)
2
, x =
m

i=1
w
i
x
i
.
Forma a treia pentru var, c and parametrul opt ional 1 este prezent, are ca efect
calculul lui v dup a formula momentului centrat de ordinul 2.

In toate cazurile, dac a x este matrice, se opereaz a pe ecare coloan a n parte.


3.3.9 Functiile range, iqr, mad, skewness si kurtosis
Apelurile funct iilor range, iqr, mad, skewness, kurtosis se fac prin
156 Statistic a descriptiv a
r=range(x)
iq=iqr(x)
md=mad(x)
sk=skewness(x)
k=kurtosis(x)
si calculeaz a pentru componentele vectorului x, respectiv amplitudinea, abaterea
cuartilic a, abaterea absolut a, asimetria (cu formula (3.3.2)) si excesul (cu formula
(3.3.1)).
Dac a x este matrice, se opereaz a pe ecare coloan a n parte.
3.3.10 Functiile max si min
Prezent am numai modul de apel pentru funct ia max, deoarece funct ia min se uti-
lizeaz a la fel.
Pentru max avem urm atoarele forme de apel:
r=max(x)
r=max(x,y)
[r,k]=max(x)
[r,k]=max(x,y)
Prin acestea se calculeaz a valoarea maxim a a componentelor vectorului x, iar n
k se obt in si indicii corespunz atori componentelor. Dac a este prezent parametrul
opt ional y, care este un vector de aceasi lungime cu cea a lui x, atunci r este un
vector ce va cont ine valorile maxime, prin compararea celor doi vectori pe compo-
nente. Dac a x este matrice, respectiv c and apare y matrice de aceasi dimensiune,
atunci comparat iile sunt efectuate pe coloane n primul caz, iar n al doilea caz se
face compararea element cu element.
3.3.11 Functiile sort si sortrows
Funct ia sort are urm atoarele forme de apel
y=sort(x)
y=sort(x,k)
[y,s]=sort(x)
[y,s]=sort(x,k)
si sortrows aceleasi forme de apel.
Funct ia sort ordoneaz a cresc ator elementele ec arei coloane a matricei x, c and
k=1 (care este valoarea implicit a), respectiv ordonarea cresc atoare pe linii, c and
k=2. Vectorul s p astreaz a indicii elementelor dinainte de ordonare. Dac a x este
vector, atunci parametrul opt ional lipseste si este efectuat a ordonarea cresc atoare a
componentelor vectorului, eventual cu p astrarea indicilor componentelor dinainte de
ordonare n s.
3.3. Parametrii distribut iilor statistice 157
Funct ia sortrows ordoneaz a lexicograc liniile matricei x, av and n vedere
toate elementele liniilor matricei (c and parametrul k lipseste) sau numai elementele
ce apart in coloanelor precizate prin vectorul k, cu posibilitatea p astr arii n s a indi-
cilor liniilor nainte de ordonare.
3.3.12 Functiile sum, prod, cumsum si cumprod
Apelurile funct iilor sum, prod, cumsum, cumprod, se pot realiza prin:
y=sum(x)
y=sum(x,k)
y=prod(x)
y=prod(x,k)
y=cumsum(x)
y=cumsum(x,k)
y=cumprod(x)
y=cumprod(x,k)
Execut ia acestor instruct iuni calculeaz a respectiv sumele, sumele part iale, produsele,
produsele part iale pentru ecare coloan a a matricei x, c and k=1 (valoare implicit a),
iar c and k=2, se execut a aceste operat ii pe linii. Dac a x este vector, atunci parametrul
opt ional k lipseste, iar operat iile se execut a asupra componentelor vectorului.
3.3.13 Functia diff
Apelul funct iei diff se realizeaz a prin:
y=diff(x)
y=diff(x,r)
y=diff(x,r,k)

In urma execut arii unei astfel de instruct iune, se calculeaz a diferent ele de ordin r ale
elementelor liniilor consecutive ale matricei x, c and k=1 (valoare implicit a), respec-
tiv diferent ele de ordin r ale elementelor coloanelor consecutive ale matricei x, c and
k=2, adic a
y
i,j
= x
i+1,j
x
i,j
, i = 1, m1, j = 1, n, (k=1)
y
i,j
= x
i,j+1
x
i,j
, i = 1, m, j = 1, n 1, (k=2).
Diferent ele de ordin doi pentru x sunt diferent ele de ordinul nt ai pentru y. Dac a x
este vector, atunci parametrul k lipseste, iar operat ia se execut a asupra componentelor
vectorului.
158 Statistic a descriptiv a
3.3.14 Functiile nanmean, nanmedian, nanstd,
nanmin, nanmax si nansum
Aceste funct ii din Statistics toolbox sunt denite ca si funct iile corespunz atoare
mean, median, std, min, max, sum, cu except ia faptului c a sunt excluse din cal-
cule valorile NaN.
3.3.15 Corectiile lui Sheppard
Dac a datele statistice relative la caracteristica X de tip continuu au fost grupate, n
unele cazuri, se cere s a e aplicate corect iile lui Sheppard pentru momentele
k
.
Dac a se noteaz a cu

k
momentul corectat de ordinul k, atunci

k
=
1
k + 1
[
k
2
]

i=0
_
k + 1
2i + 1
__
d
2
_
2i


k2i
, k = 1, 2, . . .
unde d este amplitudinea claselor.
Folosind formula precedent a scriem primele patru momente corectate:


1
=
1
,

2
=
2

d
2
12
,

3
=
3

d
2
4

1
,

4
=
4

d
2
2

2
+
7d
4
240

Av and n vedere c a

2
=
2

2
1
,
3
=
3
3
1

2
+ 2
3
1
,
4
=
4
4
1

3
+ 6
2
1

2
3
4
1
,
obt inem, de asemenea, momentele centrate corectate


2
=
2

d
2
12
,

3
=
3
,

4
=
4

d
2
2

2
+
7d
4
240

Corect iile lui Sheppard se aplic a, de regul a, c and avem distribut ie unimodal a si
pentru N > 1000, d >
1
20
.
Exemplul 3.3.32. S a revenim la datele statistice din Exemplul 3.2.10 si s a calcul am
parametrii statistici denit i p an a aici.
Printre parametrii statistici care m asoar a tendint a i calcul am pe urm atorii.
Media (aritmetic a), care este dat a prin
x
a
= x =
1
N
N

k=1
x

k
=
1
70
(1.318 + 3.128 + + 1.966) = 2.27077.
3.3. Parametrii distribut iilor statistice 159
Mediana, care se obt ine dup a ordonarea cresc atoare a datelor statistice. Anume, avem
c a
0.842 < 1.155 < 1.179 < 1.318 < 1.355 < 1.403 < 1.493 < 1.546 < 1.548 < 1.553
<1.560 < 1.583 < 1.628 < 1.631 < 1.681 < 1.690 < 1.708 < 1.802 < 1.855 < 1.864
<1.875 < 1.931 < 1.937 < 1.946 < 1.960 < 1.962 < 1.966 < 1.977 < 2.015 < 2.072
<2.128 < 2.206 < 2.214 < 2.219 < 2.230 < 2.256 < 2.262 < 2.298 < 2.304 < 2.316
<2.337 < 2.345 < 2.444 < 2.455 < 2.465 < 2.493 < 2.500 < 2.502 < 2.517 < 2.525
<2.636 < 2.637 < 2.641 < 2.676 < 2.726 < 2.758 < 2.807 < 2.838 < 2.879 < 3.006
<3.093 < 3.128 < 3.156 < 3.281 < 3.394 < 3.426 < 3.460 < 3.537 < 3.852 < 3.972
Datele statistice dublu ncadrate ind la mijlocul acestei ordon ari (num ar par de date
statistice) obt inem mediana ca ind
m =
2.230 + 2.256
2
= 2.243.
Cuartila inferioar a se obt ine din aceeasi ordonare a datelor statistice, lu and data
statistic a cu num arul de ordine 18, prima ncadrat a, adic a Q
1
= 1.802, iar cuartila
superioar a, lu and data statistic a cu num arul de ordine 53, a doua ncadrat a, adic a
Q
3
= 2.641.
Printre parametrii statistici care m asoar a gradul de mpr astiere i calcul am pe cei
care urmeaz a.
Intervalul de variat ie este
= x
max
x
min
= 3.972 0.842 = 3.130.
Abaterea cuartil a sau intervalul intercuartilic se obt ine prin
Q
3
Q
1
= 2.641 1.802 = 0.839.
Deoarece Q
3
Q
1
= 0.839 < 1.565 =

2
, avem c a distribut ia statistic a este intens
concentrat a.
Abaterea cuartil a relativ a este
Q
r
=
Q
3
Q
1
m
=
0.839
2.243
= 0.374.
Abaterea medie (absolut a) are valoarea dat a prin
=
1
N
N

k=1
| x

k
x| =
160 Statistic a descriptiv a
=
1
70
( | 1.318 2.271 | + | 3.128 2.271 | + + | 1.966 2.271 | )
= 0.5277.
Primele patru momente sunt

1
= x = 2.27077,

2
=
1
N
N

k=1
x

2
k
=
1
70
_
1.318
2
+ 3.128
2
+ + 1.966
2
_
= 5.59435,

3
=
1
N
N

k=1
x
3
k
=
1
70
_
1.318
3
+ 3.128
3
+ + 1.966
3
_
= 14.808,

4
=
1
N
N

k=1
x
4
k
=
1
70
_
1.318
4
+ 3.128
4
+ + 1.966
4
_
= 41.7278.
Folosind leg aturile dintre momentele obisnuite si momentele centrate se obt in aces-
tea din urm a cu formulele

2
=
2

2
1
= 0.437946,

3
=
3
3
1

2
+ 2
3
1
= 0.115571,

4
=
4
4
1

3
+ 6
2
1

2
3
4
1
= 0.540172.
Se pot calcula apoi coecient ii lui Pearson

1
=

2
3

3
2
= 0.159012 (skewness),
2
=

4

2
2
= 2.81637 (kurtosis),
respectiv coecient ii lui Fisher

1
=
_

1
= 0.3988 (asimetria),
2
=
2
3 = 0.18363 (excesul).
S a recalcul am parametrii statistici pe baza datelor statistice sistematizate (gru-
pate).
Media (aritmetic a) va
x =
1
N
n

k=1
f
k
x
k
=
1
70
(1 0.85 + 2 1.15 + + 2 3.85) = 2.29.
Pentru a calcula mediana folosim formula
m = a
j1
+d
j
N
2
F
j1
f
j

3.3. Parametrii distribut iilor statistice 161


Aici F
j1
este cea mai mare frecvent a cumulat a (ascendent a) ce nu dep aseste pe
N
2
,
deci F
5
= 31 <
70
2
< 46 = F
6
. Astfel se obt ine [a
5
; a
6
) = [2.2; 2.5), intervalul
median, care are amplitudinea d
6
= d = 0.3 si frecvent a absolut a f
6
= 15. Prin
urmare rezult a c a
m = 2.2 + 0.3
35 31
15
= 2.28.
Pentru a calcula cuartila inferioar a se determin a prima dat a intervalul cuartilic inferior
[a
i1
; a
i
) astfel nc at F
i1
s a e cea mai mare frecvent a cumulat a ascendent a ce nu
dep aseste pe
N
4
= 17.5. Aceasta este F
3
= 12. Prin urmare [a
3
; a
4
) = [1.6; 1.9), iar
d
4
= d = 0.3. Se foloseste apoi formula
Q
1
= a
i1
+d
i

N
4
F
i1
f
i
= 1.6 + 0.3
17.5 12
9
= 1.783.

In mod analog, pentru cuartila superioar a


Q
3
= 2.5 + 0.3
3 17.5 46
10
= 2.695.
Intervalul modal, cel cu frecvent a maxim a, este [a
5
; a
6
) = [2.2; 2.5). Prin urmare
modul va calculat cu formula
mo = a
5
+d
6

f
5
f
5
f
6
= 2.2 + 0.3
15 10
(15 10) (10 15)
= 2.35.
Abaterea (absolut a) este
=
1
N
n

k=1
f
k
| x
k
x|
=
1
70
( 1 | 0.85 2.29 | + 2 | 1.15 2.29 | + + 2 | 3.85 2.29 | )
= 0.5297.
Primele patru momente se calculeaz a prin

1
= x = 2.29,

2
=
1
N
n

k=1
f
k
x
2
k
=
1
70
_
1 0.85
2
+ 2 1.15
2
+ + 1 3.85
2
_
= 5.68792,

3
=
1
N
n

k=1
f
k
x
3
k
=
1
70
_
1 0.85
3
+ 2 1.15
3
+ + 1 3.85
3
_
= 15.1467,
162 Statistic a descriptiv a

4
=
1
N
n

k=1
f
k
x
4
k
=
1
70
_
1 0.85
4
+ 2 1.15
4
+ + 1 3.85
4
_
= 42.8038,
iar apoi se obt in momentele centrate

2
=
2

2
1
= 0.443829,

3
=
3
3
1

2
+ 2
3
1
= 0.088591,

4
=
4
4
1

3
+ 6
2
1

2
3
4
1
= 0.526822.
Coecient ii lui Pearson sunt

1
=

2
3

3
2
= 0.08977 (skewness),
2
=

4

2
2
= 2.67444 (kurtosis),
iar coecient ii lui Fisher sunt

1
=
_

1
= 0.2996 (asimetria),
2
=
2
3 = 0.3255 (excesul).
Programul 3.3.33. S a scriem un program, care s a calculeze o parte din acesti pa-
rametri statistici din exemplul precedent. Ne vom opri numai la acei parametri, care
sunt denit i prin funct ii Matlab, dar evident c a odat a deteminat i acesti parametri, se
pot calcula usor si ceilalt i parametri din exemplul precedent.
load x.dat -ascii% fisierul x.dat contine datele
% primare din exemplul precedent
ma=mean(x); fprintf(ma= %6.4f\n,ma)
mg=geomean(x); fprintf(mg= %6.4f\n,mg)
mh=harmmean(x); fprintf(mh= %6.4f\n,mh)
m=median(x); fprintf(mediana=%6.4f\n,m)
Q=prctile(x,[25,75]);
fprintf(Q1= %6.4f\n,Q(1)),
fprintf(Q3= %6.4f\n,Q(2))
md=mad(x); fprintf(md= %6.4f\n,md)
mu=moment(x,2); fprintf(mu2= %6.4f\n,mu)
mu=moment(x,3); fprintf(mu3= %6.4f\n,mu)
mu=moment(x,4); fprintf(mu4= %6.4f\n,mu)
r=range(x); fprintf(range= %6.4f\n,r)
iq=iqr(x); fprintf(iq= %6.4f\n,iq)
s=std(x); fprintf(s= %6.4f\n,s)
v=var(x); fprintf(v= %6.4f\n,v)
sk=skewness(x); fprintf(sk= %6.4f\n,sk)
k=kurtosis(x); fprintf(k= %6.4f\n,k)
Prin executarea programului se obt in rezultatele
ma= 2.2708
mg= 2.1725
3.3. Parametrii distribut iilor statistice 163
mh= 2.0704
mediana=2.2430
Q1= 1.8020
Q3= 2.6410
md= 0.5277
mu2= 0.4379
mu3= 0.1156
mu4= 0.5402
range= 3.1300
iq= 0.8390
s= 0.6666
v= 0.4443
sk= 0.3988
k= 2.8164
3.3.16 Functia grpstats
Funct ia grpstats, din Statistics toolbox, face posibil a determinarea unor parametri
statistici pentru date clasicate (grupate) dup a o anumit a variabil a de grupare.
Apelul funct iei se face prin
ma=grpstats(x,g)
[ma,s,fr,nume]=grpstats(x,g)
Parametrul g este un vector numeric sau de tip caracter, de aceeasi lungime cu
num arul liniilor matricei x, si care permite gruparea datelor cont inute de x. O astfel
de grupare este format a din acele date din x, pentru ecare coloan a n parte, pentru
care valorile corespunz atoare din g sunt aceleasi.
Executarea primei instruct iuni are ca efect calculul mediilor aritmetice pentru
ecare grup a a ec arei coloane din matricea x.
A doua instruct iune, fat a de prima instruct iune, mai calculeaz a abaterile standard
s, pentru ecare grup a din ecare coloan a a matricei x, precum si num arul datelor
fr si etichetele nume, pentru ecare grup a.
Programul 3.3.34. Programul care urmeaz a genereaz a 100 de numere aleatoare ce
urmeaz a legea uniform a discret a, cu N = 4, n vectorul g, care va reprezenta un
vector de grupare.

In matricea x cu 100 de linii si 3 coloane, vor generate numere aleatoare ce


urmeaz a legea normal a N (, ), unde parametrul = 1, iar parametrul , este
respectiv 1, 2 si 3 pentru cele trei coloane.
Folosind vectorul de grupare g, se calculeaz a valorile medii, abaterile standard,
frecvent ele absolute si se precizeaz a numele grupelor, pentru coloanele matricei x.
g=unidrnd(4,100,1);
t=1:3;
t=t(ones(100,1),:);
164 Statistic a descriptiv a
x=normrnd(t,1);
[ma,s,fr,nume]=grpstats(x,g);
fprintf( Mediile pe grupe \n)
disp(ma)
fprintf( Abaterile standard pe grupe \n)
disp(s)
fprintf( Frecventele grupelor \n)
disp(fr)
fprintf( Etichetele grupelor \n)
disp(nume)

In urma execut arii programului se obt in urm atoarele rezultate


Mediile pe grupe
1.2486 1.8376 3.0692
0.6895 2.0323 3.2620
1.0393 1.9893 3.0223
1.0034 1.8834 3.0419
Abaterile standard pe grupe
0.2024 0.1701 0.2033
0.2076 0.1793 0.2763
0.2051 0.1723 0.1574
0.1875 0.1670 0.1859
Frecventele grupelor
24 24 24
23 23 23
27 27 27
26 26 26
Etichetele grupelor
1 2 3 4
3.3.17 Functia boxplot
Sistemul Matlab, prin Statistics toolbox, dispune de funct ia boxplot, care se poate
apela cu una din urm atoarele forme:
boxplot(x)
boxplot(x,cr)
boxplot(x,cr,s)
boxplot(x,cr,s,v)
boxplot(x,cr,s,v,w)
Efectul execut arii acestor instruct iuni este reprezentarea grac a prin dreptunghiuri cu
prelungiri de segmente pentru ecare coloan a a matricei x. Laturile de jos si de sus
ale dreptunghiurilor au ordonatele date de cuartilele inferioare si superioare cores-
punz atoare, medianele ind si ele marcate la r andul lor prin segmente paralele situate
n interioarele dreptunghiurilor, pozit ionate prin ordonatele date de valorile acestora.
3.4. Corelat ie si regresie 165

In mijloacele laturilor de jos si de sus ale dreptunghiurilor sunt trasate spre exte-
rior segmente verticale de lungimi date prin
min
_
Q
1
x
(1)
, w

, respectiv min
_
x
(n)
Q
3
, w

,
unde avem valoarea implicit a w =
3
2
_
Q
3
Q
1
_
. Datele care se a a nafara acestor
prelungiri se numesc outliers (erori grosolane) si sunt marcate prin simbolul pre-
cizat prin parametrul s (implicit s=+). Dac a nu exist a astfel de date ntro parte sau
alta, atunci segmentul din partea de jos se termin a cu un marcaj.
Dac a cr=1, atunci dreptunghiurile sunt crestate pe laturile verticale, av and mij-
loacele crest aturilor n dreptul medianelor, iar deschiderile crest aturilor prezint a
estimat ii robuste pentru valorile medii teoretice. Valoarea cr=0 (valoare implicit a)
implic a faptul c a dreptunghiurile nu sunt crestate.
C and v=0 (valoare implicit a este v=1) reprezent arile prezentate p ana aici sunt
rotite cu 90
o
, adic a sunt prezentate pe orizontal a.
Remarc am faptul c a dac a x este un vector, atunci poate apare un parametru su-
plimentar g, imediat dup a parametrul x. Parametrul g este un vector numeric sau de
tip caracter, de aceeasi lungime cu x, si care permite gruparea datelor cont inute de x.
O astfel de grupare este format a din acele date din x, pentru care valorile corespun-
z atoare din g sunt aceleasi. Funct ia boxplot n acest caz va produce dreptunghiuri
pentru ecare grupare n parte.
Programul 3.3.35. Programul urm ator genereaz a n vectori aleatori, care urmeaz a
legea normal a bidimensional a, n matricea X de tipul n2, dup a care, folosind funct ia
boxplot, reprezint a grac datele pentru prima variabil a si respectiv pentru a doua
variabil a.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); X=mvnrnd(mu,v,n); boxplot(X)
xlabel(Numarul variabilelor),
ylabel(Valorile variabilelor)

In urma execut arii programului, cu valorile mu1=10, mu2=10, v =


_
2 -2
-2 3
_
si
n=50, se obt ine Figura 3.11.
3.4 Corelatie si regresie
Corelat ia (ntr-un sens larg) poate nt eleas a ca leg atura care exist a ntre o caracte-
ristic a dependent a si una sau mai multe caracteristici independente, iar regresia este
166 Statistic a descriptiv a
1 2
6
7
8
9
10
11
12
13
14
V
a
l
o
r
i
l
e

v
a
r
i
a
b
i
l
e
l
o
r
Numarul variabilelor
Figura 3.11: Reprezentare de date cu boxplot
X \ Y y
1
y
2
. . . y
n
x
1
f
11
f
12
. . . f
1n
f
1
x
2
f
21
f
22
. . . f
2n
f
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
m
f
m1
f
m2
. . . f
mn
f
m
f
1
f
2
. . . f
n
f

= N
Tabelul 3.2: Tabel de corelat ie
metoda prin care se stabileste acest a leg atur a.
S a consider am caracteristicile cantitative X si Y relative la colectivitatea C.
Datele statistice primare sunt (x

k
, y

k
) , k = 1, N, care dup a grupare sunt prezentate
n Tabelul de corelat ie 3.2. unde f
ij
reprezint a frecvent a absolut a a clasei (x
i
, y
j
). De
asemenea, avem c a
n

j=1
f
ij
= f
i
,
m

i=1
f
ij
= f
j
,
m

i=1
f
i
=
n

j=1
f
j
= f

= N.
Denitia 3.4.1. Numim moment de ordinul (k
1
, k
2
) al distribut iei statistice a carac-
teristicii bidimensionale (X, Y ), valoarea numeric a

k
1
k
2
=
1
N
N

i=1
x

k
1
i
y

k
2
i
=
1
N
m

i=1
n

j=1
f
ij
x
k
1
i
y
k
2
j
=
m

i=1
n

j=1
p
ij
x
k
1
i
y
k
2
j
,
3.4. Corelat ie si regresie 167
unde p
ij
=
f
ij
N
este frecvent a relativ a a clasei (x
i
, y
j
).
Denitia 3.4.2. Numim moment centrat de ordinul (k
1
, k
2
) al distribut iei statistice
bidimensionale (X, Y ), valoarea numeric a

k
1
k
2
=
1
N
N

i=1
_
x

i
x
_
k
1
_
y

i
y
_
k
2
=
1
N
m

i=1
n

j=1
f
ij
(x
i
x)
k
1
(y
j
y)
k
2
=
m

i=1
n

j=1
p
ij
(x
i
x)
k
1
(y
j
y)
k
2
,
unde
x =
10
=
1
N
m

i=1
f
i
x
i
, y =
01
=
1
N
n

j=1
f
j
y
j
.
Observatia 3.4.3. Remarc am, printre momentele centrate, dispersiile pentru distri-
but iile statistice ale caracteristicilor X si respectiv Y , anume

2
X
=
20
=
1
N
m

i=1
f
i
(x
i
x)
2
,
2
Y
=
02
=
1
N
n

j=1
f
j
(y
j
y)
2
.
Denitia 3.4.4. Numim coecient de corelat ie (al lui Pearson) al distribut iei statis-
tice bidimensionale (X, Y ), raportul
r =

11

20

02
=

11

10

01

Y
=

11
xy

Observatia 3.4.5. Folosind datele statistice negrupate avem formulele de calcul pen-
tru coecientul r de corelat ie
r =

N
i=1
(x

i
x) (y

i
y)
_

N
i=1
(x

i
x)
2
_

N
i=1
(y

i
y)
2
sau
r =

N
i=1
x

i
y

1
N
_

N
i=1
x

i
__

N
i=1
y

i
_

N
i=1
x

2
i

1
N
_

N
i=1
x

i
_
2

N
i=1
y

2
i

1
N
_

N
i=1
y

i
_
2

168 Statistic a descriptiv a


Observatia 3.4.6. Folosind inegalitatea CauchySchwarzBuniakovski
_
N

i=1
_
x

i
x
_ _
y

i
y
_
_
2

_
N

i=1
_
x

i
x
_
2
__
N

i=1
_
y

i
y
_
2
_
se stabileste c a | r | 1. De asemenea, dac a | r | = 1, atunci ntre cele dou a caracteris-
tici exist a o leg atur a liniar a, si invers. C and r = 0, spunem c a cele dou a caracteristici
sunt (liniar) necorelate. Prin urmare, coecientul de corelat ie poate folosit pentru
a stabili dac a ntre cele dou a caracteristici exist a sau nu o leg atur a liniar a.

In cazul
n care caracteristica bidimensional a (X, Y ) urmeaz a legea normal a bidimensional a
r = 0 implic a faptul c a cele dou a caracteristici sunt independente.
Exemplul 3.4.7. S a calcul am c at iva din parametrii denit i pentru datele statistice de
la Exemplul 3.2.20.
Pentru a calcula coecientul de corelat ie, calcul am prima dat a valorile medii ale
caracteristicilor X si Y . Remarc am, pentru aceasta, c a distribut iile statistice ale ca-
racteristicilor X si Y sunt respectiv
X
_
_
126 127 128 129 130 131 132 133 134 135 136 137
6 9 21 29 70 152 64 38 18 8 6 4
_
_
,
Y
_
_
24 25 26 27 28 29 30 31 32 33 34 35
2 9 16 30 84 106 89 45 24 11 7 2
_
_
.
Obt inem astfel c a
x =
1
425
(6 126 + 9 127 + + 4 137) = 131.054 cm,
y =
1
425
(2 24 + 9 25 + + 2 35) = 29.2447 kg.
De asemenea, calcul and dispersiile caracteristicilor se obt ine

2
X
=
1
N
_
m

i=1
f
i
x
2
i

1
N
_
m

i=1
f
i
x
i
_
2
_
=
1
425
_
_
6 126
2
+9 127
2
+. . .+4 137
2
_

1
425
(6 126+. . .+4 137)
2
_
=
1
425
_
7300920
1
425
55698
2
_
= 3.45354,
3.4. Corelat ie si regresie 169

2
Y
=
1
N
_
n

j=1
f
j
y
2
j

1
N
_
n

j=1
f
j
y
j
_
2
_
=
1
425
_
_
2 24
2
+9 25
2
+. . .+2 35
2
_

1
425
(2 24+9 25+. . .+2 35)
2
_
=
1
425
_
364907
1
425
12429
2
_
= 3.35188.
Covariant a dintre X si Y se calculeaz a cu formula
Cov (X, Y ) =
1
N
_
m

i=1
n

j=1
f
ij
x
i
y
j

1
N
_
m

i=1
f
i
x
i
__
n

j=1
f
j
y
j
__
=
1
425
_
1629961
1
425
55698 12429
_
= 2.56323.
Astfel se ajunge la coecientul de corelat ie
r =
Cov (X, Y )
_

2
X

2
Y
=
2.56323

3.45354 3.35188
= 0.753374.
Programul 3.4.8. Programul Matlab, care urmeaz a, efectueaz a aceste calcule
f=[1,1,3,1,zeros(1,8);
0,3,4,1,0,1,zeros(1,6);
1,4,5,7,1,2,1,zeros(1,5);
0,1,2,6,9,6,4,1,zeros(1,4);
zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);
zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);
zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);
zeros(1,4),1,7,10,11,6,2,1,0;
zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;
zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];
x=[126:137]; y=[24:35]; fx=sum(f); fy=sum(f);
xa=sum(fx.
*
x)/(sum(fx)); ya=sum(fy.
*
y)/(sum(fy));
vx=(sum(fx.
*
x.2)-(sum(fx.
*
x))2/sum(fx))/sum(fx);
vy=(sum(fy.
*
y.2)-(sum(fy.
*
y))2/sum(fy))/sum(fy);
cov=(x
*
f
*
y-sum(fx.
*
x)
*
sum(fy.
*
y)/sum(fx))/sum(fx);
r=cov/(sqrt(vx
*
vy));
fprintf( xa=%8.3f\n ya=%8.4f\n,xa,ya)
fprintf( vx=%8.5f\n vy=%8.5f\n,vx,vy)
fprintf( cov=%7.5f\n r=%9.6f,cov,r)
iar rezultatele sunt urm atoarele:
xa= 131.054
ya= 29.2447
vx= 3.45354
170 Statistic a descriptiv a
vy= 3.35188
cov=2.56323
r= 0.753374
Denitia 3.4.9. Numim valoare medie condit ionat a a distribut iei statistice a carac-
teristicii Y n raport cu X = x
j
, valoarea numeric a
y
i
= y (x
i
) =
1
f
i
n

j=1
f
ij
y
j
=
n

j=1
f
ij
f
i
y
j
, i = 1, m,
si respectiv valoare medie condit ionat a a distribut iei statistice a caracteristicii X n
raport cu Y = y
j
, valoarea numeric a
x
j
= x(y
j
) =
1
f
j
m

i=1
f
ij
x
i
=
m

i=1
f
ij
f
j
x
i
, j = 1, n.
Denitia 3.4.10. Curba de ecuat ie y = f (x) pe care se situeaz a punctele de co-
ordonate (x
i
, y
i
), i = 1, m, se numeste curba de regresie a lui Y n raport cu X,
iar curba de ecuat ie x = g (y) pe care se situeaz a punctele de coordonate ( x
j
, y
j
),
j = 1, n, se numeste curba de regresie a lui X n raport cu Y .
Denitia 3.4.11. Numim dispersie condit ionat a a distribut iei statistice a caracteris-
ticii Y n raport cu X = x
i
, valoarea numeric a

2
Y |x
i
=
1
f
i
n

j=1
f
ij
(y
j
y
i
)
2
=
n

j=1
f
ij
f
i
(y
j
y
i
)
2
, i = 1, m,
si respectiv dispersie condit ionat a a distribut iei statistice a caracteristicii X n raport
cu Y = y
j
, valoarea numeric a

2
X|y
j
=
1
f
j
m

i=1
f
ij
(x
i
x
j
)
2
=
m

i=1
f
ij
f
j
(x
i
x
j
)
2
, j = 1, n.
Denitia 3.4.12. Numim dispersia condit ionat a a distribut iei statistice a lui Y n
raport cu distribut ia statistic a a lui X, valoarea numeric a

2
Y |X
=
1
N
m

i=1
f
i

2
Y |x
i
=
m

i=1
p
i

2
Y |x
i
si respectiv dispersia condit ionat a a distribut iei statistice a lui X n raport cu distri-
but ia statistic a a lui Y , valoarea numeric a

2
X|Y
=
1
N
n

j=1
f
j

2
X|y
j
=
n

j=1
p
j

2
X|y
j
,
3.4. Corelat ie si regresie 171
unde p
i
=
f
i
N
este frecvent a relativ a a clasei x
i
, iar p
j
=
f
j
N
este frecvent a relativ a
a clasei y
j
.
Proprietatea 3.4.13. Dispersiile condit ionate denite mai nainte satisfac relat iile

2
Y
=
2
Y |X
+
2
Y |X
,
2
X
=
2
X|Y
+
2
X|Y
,
unde

2
Y |X
=
1
N
m

i=1
f
i
(y
i
y)
2
,
2
X|Y
=
1
N
n

j=1
f
j
(x
j
x)
2
,
adic a sunt dispersiile valorilor medii condit ionate.
Demonstrat ie. Se porneste de la identitatea
(y
j
y)
2
= (y
j
y
i
)
2
+ (y
i
y)
2
+ 2 (y
j
y
i
) (y
i
y) ,
care se nmult este cu
f
ij
f
i
si se nsumeaz a dup a j = 1, n. Astfel se obt ine
n

j=1
f
ij
f
i
(y
j
y)
2
=
n

j=1
f
ij
f
i
(y
j
y
i
)
2
+
n

j=1
f
ij
f
i
(y
i
y)
2
+
+ 2
n

j=1
f
ij
f
i
(y
j
y
i
) (y
i
y)
=
2
Y |x
i
+ (y
i
y)
2
+ 2 (y
i
y) (y
i
y
i
) =
2
Y |x
i
+ (y
i
y)
2
.
Ret inem extremit at ile acestui sir de egalit at i, le nmult im cu
f
i
N
si le nsum am dup a
i = 1, m. Rezult a n acest mod

2
Y
=
1
N
n

j=1
f
j
(y
j
y)
2
=
1
N
m

i=1
n

j=1
f
ij
(y
j
y)
2
=
1
N
m

i=1
f
i

2
Y |x
i
+
1
N
m

i=1
f
i
(y
i
y)
2
=
2
Y |X
+
2
Y |X
,
de unde se obt ine prima relat ie. Analog se obt ine si cealalt a relat ie.
Denitia 3.4.14. Numim raport de corelat ie al distribut iei statistice a caracteristicii
Y fat a de distribut ia statisticii X, valoarea numeric a

Y |X
=

2
Y |X

2
Y
=

2
Y |X

2
Y
172 Statistic a descriptiv a
si n mod analog avem

X|Y
=

2
X|Y

2
X
=

2
X|Y

2
X

Observatia 3.4.15. C and y


1
= y
2
= = y
m
, atunci y = y
i
, prin urmare

2
Y |X
= 0
_

Y |X
= 0
_
, ceea ce nseamn a absent a dependent ei n medie. Pe de
alt a parte,
Y |X
= 1 c and
2
Y |x
i
= 0, i = 1, m, adic a pentru ecare clas a x
i
valorile
caracteristicii Y sunt aceleasi.

In cazul n care, relativ la caracteristica X, exist a numai dou a clase avem


y =
f
1
N
y
1
+
f
2
N
y
2

Dac a se nlocuieste aceast a expresie n formula

2
Y |X
=
1
N
_
f
1
(y
1
y)
2
+f
2
(y
2
y)
2
_
se obt ine c a

2
Y |X
=
f
1
f
2
N
2
(y
1
y
2
)
2
,
deci

2
Y |X
=
f
1
f
2
(y
1
y
2
)
2
N
2

2
Y

Aplicatia 3.4.16. (Determinarea curbelor de regresie). Prezent am n continuare me-


toda celor mai mici p atrate pentru determinarea ecuat iilor curbelor de regresie.
Presupunem c a din reprezentarea n plan a punctelor (x
i
, y
i
), i = 1, m, curba de
regresie a lui Y n raport cu X este de forma y = y (x) = f (x; a
1
, a
2
, . . . , a
s
). Vom
determina parametrii a
k
, k = 1, s, astfel nc at
S (a
1
, a
2
, . . . , a
s
) =
N

i=1
_
y

i
y
_
x

i
_
_
2
=
m

i=1
n

j=1
f
ij
_
y
j
y (x
i
)
_
2
=
m

i=1
n

j=1
f
ij
_
y
j
f (x
i
; a
1
, a
2
, . . . , a
s
)
_
2
s a e minim a.
3.4. Corelat ie si regresie 173
Punctul de minim (a
1
, a
2
, . . . , a
s
) al funct iei S se obt ine prin rezolvarea sistemu-
lui normal de ecuat ii, rezultat din
S
a
k
= 2
m

i=1
n

j=1
f
ij
_
y
j
f (x
i
; a
1
, a
2
, . . . , a
s
)
_
f (x
i
; a
1
, a
2
, . . . , a
s
)
a
k
= 0
pentru k = 1, s. Ecuat ia curbei de regresie va
y = f (x; a
1
, a
2
, . . . , a
s
) .
La fel se determin a si ecuat ia curbei de regresie a lui X n raport cu Y .
Aplicatia 3.4.17. (Drepte de regresie). Consider am cazul liniar, adic a ecuat ia curbei
de regresie este y = y (x) = ax +b. Expresia minimizat a este
S (a, b) =
m

i=1
n

j=1
f
ij
(y
j
ax
i
b)
2
,
care conduce la sistemul normal de ecuat ii
_

_
_
m

i=1
n

j=1
f
ij
x
2
i
_
a +
_
m

i=1
n

j=1
f
ij
x
i
_
b =
m

i=1
n

j=1
f
ij
x
i
y
j
_
m

i=1
n

j=1
f
ij
x
i
_
a +
_
m

i=1
n

j=1
f
ij
_
b =
m

i=1
n

j=1
f
ij
y
j
,
sau
_

20
a +
10
b =
11

10
a +
00
b =
01
.
Solut ia acestui sistem liniar este
a =

11

10

01

20

2
10
=

11

10

01
_

20

2
10
_

02

2
01
_

02

2
01
_

20

2
10
= r

Y

X
,
b =
01
a
10
= y a x.
Se obt ine n acest fel ecuat ia dreptei de regresie a lui Y n raport cu X ca ind
y y = r

Y

X
(x x) .
174 Statistic a descriptiv a

In mod analog se ajunge la ecuat ia dreptei de regresie a lui X n raport cu Y


(3.4.1) x x = r

X

Y
(y y) .
Punctul de intersect ie al celor dou a drepte de regresie are coordonatele (x, y) si
se numeste centrul de greutate al distribut iei statistice a caracteristicii bidimensionale
(X, Y ).
Dac a se noteaz a
a
Y |X
= r

Y

X
coecientul unghiular al dreptei de regresie a lui Y n raport cu X (numit coecientul
de regresie al lui Y n raport cu X) si cu
a
X|Y
= r

X

Y
coecientul de regresie al lui X n raport cu Y , atunci
|r| =
_
a
Y |X
a
X|Y
.
De asemenea se constat a c a sign
_
a
X|Y
_
= sign
_
a
Y |X
_
. Se arat a c a unghiul
format de cele dou a drepte de regresie este dat prin relat ia
tg =
1 r
2
r
2

2
X
+
2
Y

Folosind aceast a relat ie se pot trage urm atoarele concluzii:


a) dac a |r| = 1 atunci = 0, deci dreptele de regresie se confund a, cu specicat ia
c a pentru r = 1 dreptele au panta (coecientul unghiular) negativ a, iar pentru r = 1
panta este pozitiv a.
b) dac a X si Y sunt independente atunci r = 0, deci =

2
(dreptele de regresie
sunt perpendiculare).
Observatia 3.4.18. Alte tipuri de curbe de regresie mai des nt alnite si care pot
liniarizate sunt:
1. y = ab
x
(exponent ial a), care prin logaritmare se liniarizeaz a dup a cum
urmeaz a log y = log a +x log b, lu and z = log y, A = log a, B = log b;
2. y =
a
x
+b (hiperbolic a), care se liniarizeaz a dac a se noteaz a z =
1
x
;
3.
1
y
=
a
x
+b sau y =
1
a
x
+b
, care se liniarizeaz a dac a se noteaz a u =
1
x
, v =
1
y
;
3.4. Corelat ie si regresie 175
4. y = a log x +b (logaritmic a), care se liniarizeaz a dac a se noteaz a z = log x;
5. y = be
ax
(exponent ial a), care prin logaritmare se liniarizeaz a ln y = ln b +ax,
lu and z = ln y;
6. y = be
a
x
, care prin logaritmare se liniarizeaz a ln y = ln b +
a
x
, lu and u =
1
x
,
v = ln y;
7. y = bx
a
, care prin logaritmare se liniarizeaz a, log y = log b + a log x, lu and
u = log x, v = log y;
8.
1
y
= ae
x
+ b sau y =
1
ae
x
+b
, care se liniarizeaz a dac a se ia u = e
x
si
v =
1
y

Aceast a ultim a leg atur a este un caz particular al leg aturii logistice denit a prin
y =
1
ae
cx
+b

Printre leg aturile ce nu pot liniarizate amintim:


y = ax
b
+c log x,
y = ax
b
e
cx
,
y = a +bx +ce
dx
,
a doua put and adus a la forma polinomial a.
Exemplul 3.4.19. S a consider am din nou datele statistice de la Exemplul 3.2.20, s a
calcul am noile caracteristici numerice denite si s a determin am ecuat iile dreptelor
de regresie.
Valorile medii condit ionate si dispersiile condit ionate ale lui Y n raport cu X se
calculeaz a cu formulele
y
i
=
1
f
i
n

j=1
f
ij
y
j
, i = 1, m,
si

2
Y | x
i
=
1
f
i
n

j=1
f
ij
(y
j
y
i
)
2
, i = 1, m.

In mod analog se obt in valorile medii condit ionate si dispersiile condit ionate ale lui
X in raport cu Y .
Aceste valori calculate sunt trecute n tabelele urm atoare.
176 Statistic a descriptiv a
i y
i

2
Y | x
i
1 25.67 0.889
2 26.11 1.432
3 26.62 2.141
4 28.14 1.843
5 28.43 1.045
6 29.32 1.363
7 29.56 1.340
8 30.63 1.706
9 31.67 1.444
10 31.88 1.359
11 33.50 0.917
12 34.00 0.500
si
j xj
2
X | y
j
1 127.00 1.000
2 127.56 0.691
3 127.81 1.902
4 129.43 2.112
5 130.46 0.844
6 130.94 1.204
7 131.44 1.280
8 132.00 1.778
9 133.12 2.276
10 134.09 2.992
11 135.43 1.959
12 136.50 0.250
Dispersia condit ionat a a lui Y n raport cu X va

2
Y |X
=
1
N
m

i=1
f
i

2
Y |x
i
=
1
425
(60.889 + 91.432 + + 40.500) =1.39279.

In mod analog dispersia condit ionat a a lui X n raport cu Y este

2
X|Y
=
1
N
n

j=1
f
j

2
X|y
j
=
1
425
(21.000 + 90.691 + + 20.250) =1.40291.
Dispersia condit ionat a a lui Y n raport cu X se poate calcula si cu formula

2
Y | X
=
2
Y

2
Y | X
,
unde

2
Y | X
=
1
N
m

i=1
f
i
(y
i
y)
2
este dispersia valorilor medii. Anume, avem c a

2
Y | X
=
1
425
_
6 (25.67 29.2447)
2
+ + 4 (34.00 29.2447)
2
_
= 1.95909,
de unde

2
Y | X
= 3.35188 1.95909 = 1.39279.

In mod analog,

2
X| Y
=
2
X

2
X| Y
,
3.4. Corelat ie si regresie 177
unde

2
X| Y
=
1
N
n

j=1
f
j
(x
j
x)
2
,
adic a

2
X| Y
=
1
425
_
2 (127 131.054)
2
+ + 2 (136.5 131.054)
2
_
= 2.05063.

In acest fel se obt ine c a

2
X| Y
= 3.45354 2.05063 = 1.40291.
Raportul de corelat ie al lui Y fat a de X este

Y | X
=

2
Y | X

2
Y
=

2
Y | X

2
Y
=
_
1.95909
3.35188
= 0.764509,
iar raportul de corelat ie al lui X fat a de Y este

X| Y
=

2
X| Y

2
X
=

2
X| Y

2
X
=
_
2.05063
3.45354
= 0.770568.
Ecuat iile dreptelor de regresie respectiv a lui Y n raport cu X si a lui X n raport cu
Y au ecuat iile
y y = r

Y

X
(x x) , x x = r

X

Y
(y y) .
Av and n vedere c a
r

Y

X
= 0.753374
_
3.35188
3.45354
= 0.742203,
r

X

Y
= 0.753374
_
3.45354
3.35188
= 0.764713,
avem ecuat iile
y29.2447 = 0.742203 (x 131.054) , x131.054 = 0.764713 (y 29.2447) .
Centrul de greutate al distribut iei statistice (X, Y ) este punctul de coordonate
(x; y) = (131.05; 29.24), adic a punctul de intersect ie a celor dou a drepte de regresie.
178 Statistic a descriptiv a
Coecientul de regresie al lui Y n raport cu X este coecientul unghiular al
dreptei de regresie a lui Y n raport cu X, adic a
a
Y |X
= r

Y

X
= 0.742203.

In mod analog, coecientul de regresie al lui X n raport cu Y este


a
X|Y
= r

X

Y
= 0.764713.
Pentru determinarea unghiului format de cele dou a drepte de regresie avem formula
tg =
1 r
2
r
2

2
X
+
2
Y
,
adic a
tg =
1 0.5675
0.5675

3.45354 3.35188
3.45354 + 3.35188
= 0.381,
de unde

= 21
0
= 0.364 rad.
Programul 3.4.20. Calculele de mai sus se pot face cu programul Matlab, care
urmeaz a:
f=[1,1,3,1,zeros(1,8);
0,3,4,1,0,1,zeros(1,6);
1,4,5,7,1,2,1,zeros(1,5);
0,1,2,6,9,6,4,1,zeros(1,4);
zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);
zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);
zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);
zeros(1,4),1,7,10,11,6,2,1,0;
zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;
zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];
x=[126:137]; y=[24:35]; fx=sum(f); fy=sum(f);
xa=sum(fx.
*
x)/(sum(fx)); ya=sum(fy.
*
y)/(sum(fy));
vx=(sum(fx.
*
x.2)-(sum(fx.
*
x))2/sum(fx))/sum(fx);
vy=(sum(fy.
*
y.2)-(sum(fy.
*
y))2/sum(fy))/sum(fy);
cov=(x
*
f
*
y-sum(fx.
*
x)
*
sum(fy.
*
y)/sum(fx))/sum(fx);
r=cov/(sqrt(vx
*
vy));
yb=f
*
y./fx; xb=f
*
x./fy;
for i=1:12
syb(i)=f(i,:)
*
(y-yb(i)).2/fx(i);
end
for j=1:12
sxb(j)=f(:,j)
*
(x-xb(j)).2/fy(j);
end
syx=sum(fx.
*
syb)/sum(fx);
3.4. Corelat ie si regresie 179
sxy=sum(fy.
*
sxb)/sum(fx);
syxb=sum(fx.
*
(yb-ya).2)/sum(fx);
sxyb=sum(fy.
*
(xb-xa).2)/sum(fx);
eyx=sqrt(syxb/vy); exy=sqrt(sxyb/vx);
ayx=r
*
sqrt(vy/vx); axy=r
*
sqrt(vx/vy);
tang=(1-r2)/r2
*
sqrt(vx
*
vy)/(vx+vy);
arctan=atan(tang); arc=180
*
arctan/pi;
fprintf( i | yb | syb | j | xb | sxb\n)
for i=1:12
fprintf(%3d |%6.2f |%6.3f |%7d |%6.3f |%6.3f\n,...
i,yb(i),syb(i),i,xb(i),sxb(i))
end
fprintf(\n syx=%8.5f, sxy=%8.5f,syx,sxy)
fprintf(\n eyx=%8.6f, exy=%8.6f,eyx,exy)
fprintf(\n ayx=%8.6f, axy=%8.6f,ayx,axy)
fprintf(\n tg=%9.3f, alpha=%6.0f,tang,arc)

In urma execut arii programului precedent, se obt in urm atoarele rezultate:


i | yb | syb | j | xb | sxb
1 | 25.67 | 0.889 | 1 |127.000 | 1.000
2 | 26.11 | 1.432 | 2 |127.556 | 0.691
3 | 26.62 | 2.141 | 3 |127.813 | 1.902
4 | 28.14 | 1.843 | 4 |129.433 | 2.112
5 | 28.43 | 1.045 | 5 |130.464 | 0.844
6 | 29.32 | 1.363 | 6 |130.943 | 1.204
7 | 29.56 | 1.340 | 7 |131.438 | 1.280
8 | 30.63 | 1.706 | 8 |132.000 | 1.778
9 | 31.67 | 1.444 | 9 |133.125 | 2.276
10 | 31.88 | 1.359 | 10 |134.091 | 2.992
11 | 33.50 | 0.917 | 11 |135.429 | 1.959
12 | 34.00 | 0.500 | 12 |136.500 | 0.250
syx= 1.39279, sxy= 1.40291
eyx=0.764509, exy=0.770568
ayx=0.742203, axy=0.764713
tg= 0.381, alpha= 21
3.4.1 Functiile cov si corrcoef
Aceste dou a funct ii sunt specice sistemului Matlab de baz a si pot apelate prin:
C=cov(x)
C=cov(x,y)
r=corrcoef(x)
Funct ia cov calculeaz a matricea covariant elor pentru matricea x, unde ecare
coloan a este considerat a a o variabil a:
C
ij
=
1
m1
m

k=1
(x
ki
x
i
) (x
kj
x
j
) , i, j = 1, m.
180 Statistic a descriptiv a
Dac a x este vector este returnat a variant a vectorului, caz n care se poate folosi si pa-
rametrul opt ional y, care este vector de aceeasi dimensiune cu x, c and este calculat a
covariant a dintre x si y, pe l ang a variant ele lui x respectiv y, adic a
C =
1
m1
m

k=1
(x
k
x) (y
k
y) .
Prin urmare, n acest caz, cov(x,y) produce acelasi rezultat ca si cov([x y]).
Remarc am faptul c a instruct iunea diag(cov(x)) genereaz a vectorul variant elor
ec arei coloane a matricei x, iar sqrt(diag(cov(x))) este vectorul abaterilor stan-
dard pentru ecare coloan a a matricei x.
Funct ia corrcoef calculeaz a matricea coecient ilor de corelat ie pentru ma-
tricea x, unde ecare coloan a este considerat a o variabil a:
r
ij
=
C
ij

C
ii
C
jj
, i, j = 1, m.
Programul 3.4.21. Programul urm ator genereaz a n vectori aleatori, care urmeaz a le-
gea normal a bidimensional a, n matricea X de tipul n2, dup a care, folosind funct iile
cov si corrcoef, calculeaz a matricele covariant elor si a coecient ilor de corelat ie,
pentru cele dou a coloane ale matricei X.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); X=mvnrnd(mu,v,n);
v=cov(X); r=corrcoef(X);
fprintf(Matricea covariantelor\n), disp(v)
fprintf(Matricea coeficientilor de corelatie\n), disp(r)

In urma execut arii programului, cu valorile mu1=100, mu2=-100, v =


_
5 4
4 4
_
si
n=1000, se obt in rezultatele
Matricea covariantelor
5.1327 4.0419
4.0419 4.0487
Matricea coeficientilor de corelatie
1.0000 0.8867
0.8867 1.0000
3.4. Corelat ie si regresie 181
3.4.2 Functiile lsline, refline si gline
Funct iile lsline, refline si gline apart in la Statistics toolbox, apelurile lor
f ac anduse prin:
lsline
refline
refline(m)
refline(m,n)
gline
gline(f)
Funct ia lsline reprezint a grac n gura curent a dreptele de regresie, obt inute
cu metoda celor mai mici p atrate, pentru ecare curb a a gurii, care a fost reprezen-
tat a grac cu instruct iunea plot, dar nu prin linie continu a, ntrerupt a sau de tipul
punctlinie.
Funct ia refline reprezint a grac n gura curent a dreapta de ecuat ie y=mx+n.
Dac a lipseste parametrul n, se impune ca parametrul m s a e un vector av and dou a
componente, m(1) reprezent and panta dreptei, iar m(2)=n. Adic a n acest caz
dreapta, ce se va reprezenta grac, va avea ecuat ia y=m(1)x+m(2). Dac a lipsesc
ambele argumente, m si n, efectul funct iei refline coincide cu cel al funct iei
lsline.
Funct ia gline reprezint a grac n gura precizat a prin parametrul f, iar dac a
acesta lipseste n gura curent a, segmentul de dreapt a prin marcarea cu ajutorul
mouse-lui a capetelor segmentului.
Programul 3.4.22. Vom prezenta un program Matlab, care genereaz a N vectori
aleatori ce urmeaz a legea normal a bidimensional a, reprezint a grac norul statistic
pentru aceste date, precum si cele dou a drepte de regresie, a lui Y n raport cu X,
respectiv a lui X n raport cu Y.
Dreapta de regresie a lui Y n raport cu X se va reprezenta grac cu funct ia
lsline, iar dreapta de regresie a lui Xn raport cu Y se va face cu funct ia refline,
av and n vedere parametrii m si n ai dreptei de regresie denit a prin (3.4.1), anume
m =
1
r

Y

X
, n = y m x.
clear,clf, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=Z(:,2);
182 Statistic a descriptiv a
ma=mean(Z); s=std(Z);r=corrcoef([X,Y]);
m=s(2)/(r(1,2)
*
s(1)); n=ma(2)-m
*
ma(1);
plot(X,Y,.), lsline, refline(m,n)
text(ma(1),ma(2),o Centrul de greutate)
Pentru datele de intrare N=20, mu=(0,0), v =
_
1 -0.8
-0.8 1
_
, se obt in gra-
cele din Figura 3.12.
2 1.5 1 0.5 0 0.5 1 1.5 2
3
2
1
0
1
2
3
o Centrul de greutate
Figura 3.12: Drepte de regresie
3.4.3 Functiile polyfit si refcurve
Funct ia polyfit este specic a sistemului de baz a Matlab, iar funct ia refcurve
este cont inut a de Statistics toolbox, ind folosite n ajustarea datelor prin funct ii poli-
nomiale.
Apelurile acestor funct ii se pot face prin:
p=polyfit(x,y,n)
refcurve(p)
Funct ia polyfit determin a coecient ii polinomului de ajustare de grad n, cu me-
toda celor mai mici p atrate, corespunz ator datelor statistice (x
i
, y
i
)
i=1,m
. Prima com-
ponent a a vectorului p este coecientul monomului de grad n. Dac a n=1, se obt in
coecient ii dreptei de regresie a variabilei Y n raport cu variabila X.
Funct ia refcurve reprezint a grac n gura curent a funct ia polinomial a pre-
cizat a prin coefcient ii p, cu precizarea c a p(1) reprezint a coecientul monomului
de grad maxim. Dac a parametrul p are dou a componente, funct ia este echivalent a cu
funct ia refline.
3.4. Corelat ie si regresie 183
Calculul valorilor unei funct ii polinomiale se face cu ajutorul funct iei polyval,
pe care o prezent am n continuare, mpreun a cu alte funct ii specice sistemului Mat-
lab de baz a, din acest grup de funct ii.
3.4.4 Functiile polyval, polyvalm, poly si roots
Forme de apel pentru funct iile polyval, polyvalm, poly si roots sunt:
y=polyval(p,x)
y=polyvalm(p,x)
p=poly(a)
p=roots(a)
Funct ia polyval calculeaz a valorile y ale polinomului precizat prin coecient ii
cont inut i de vectorul p, pe ecare punct al matricei sau vectorului x.
Funct ia polyvalm calculeaz a matricea p atratic a y, care reprezint a valoarea ma-
triceal a a polinomului precizat prin coecient ii cont inut i de vectorul p, pentru ma-
tricea p atratic a x, adic a
y = p
1
x
n
+p
2
x
n1
+ +p
n+1
,
dac a p are n + 1 componente.
Funct ia poly calculeaz a coecient ii polinomului caracteristic al matricei p atra-
tice a:
P () =

a
11
a
12
. . . a
1m
a
21
a
22
. . . a
1m
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
a
m1
a
m2
. . . a
mm

,
iar c and a este un vector calculeaz a coecient ii polinomului care are ca r ad acini
elementele vectorului, adic a ai lui
P (x) =
n

i=1
(x a
i
) .
Funct ia roots calculeaz a r ad acinile polinomului cu coecient ii dat i prin vec-
torul p.
Programul 3.4.23. Programul urm ator va genera matricea Z, care cont ine N vectori
aleatori ce urmeaz a legea normal a bidimensional a. Se transform a apoi componenta
a doua a vectorilor aleatori, prin ridicarea acestora la puterea a treia, iar apoi se de-
termin a polinomul de ajustare de grad trei, prin folosirea datelor transformate. Poli-
nomul de ajustare obt inut se reprezint a grac mpreun a cu norul statistic al datelor
transformate.
184 Statistic a descriptiv a
clf, clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=Z(:,2); p=polyfit(X,Y.3,3);
scatter(X,Y.3,7,filled), hold on,
m=mu(1); s=sqrt(v(1,1));
x=m-3
*
s:0.01:m+3
*
s;
y=polyval(p,x); plot(x,y)
Pentru datele de intrare N=25, mu=(0,0), v =
_
1 -0.9
-0.9 1
_
, se obt ine gra-
cul din Figura 3.13.
3 2 1 0 1 2 3
25
20
15
10
5
0
5
10
15
Figura 3.13: Polinom de ajustare de grad 3
3.4.5 Functia polytool
Funct ia demonstrativ a polytool se lanseaz a prin:
>>polytool(x,y)
>>polytool(x,y,n)

In urma lans arii se produce un grac interactiv (demonstrativ) privind polinomul de


ajustare pentru datele cont inute n vectorii coloan a x si y, av and gradul precizat
3.4. Corelat ie si regresie 185
prin parametrul n (valoarea implicit a este n=1). Schimbarea gradului polinomului
de ajustare se face prin introducerea noii valori n fereastra din partea de sus.
Pe gur a este reprezentat norul statistic pentru datele x si y, mpreun a cu gracul
polinomului de ajustare (cu linie continu a).
Prin introducerea valorii unui argument x n fereastra de jos sau prin deplasarea
dreptei verticale pe pozit ia abscisei x, pe axa ordonatelor se obt ine valoarea cores-
punz atoare.
Pe l ang a aceste elemente, gracul demonstrativ cont ine si alte elemente, care
se refer a la not iuni ce urmeaz a a prezentate n capitolele ce urmeaz a, cum ar
probabilitate de ncredere si intervale de ncredere.
De asemenea, exist a posibilitatea ajust arii datelor cu alte metode dec at metoda
celor mai mici p atrate. Alegerea unei astfel de metod a se face prin activarea butonului
method din meniu.
3.4.6 Functia nlinfit
Pentru ajustarea neliniar a, Statistics toolbox dispune de funct ia nlinfit, bazat a pe
metoda celor mai mici p atrate. Apelul funct iei se poate face prin:
a=nlinfit(x,y,numef,a0)
[a,r]=nlinfit(x,y,f,a0)
unde numef reprezint a numele funct iei, care deneste leg atura c autat a dintre vari-
abila dependent a, cu valorile cont inute de vectorul coloan a y, variabilele indepen-
dente, cu valorile cont inute n coloanele matricei x. Matricea x trebuie s a aib a acelasi
num ar de linii ca si lungimea vectorului y.
Parametrul a0 reprezint a valorile de pornire (init iale) ale parametrilor a, care
urmeaz a s a e calculat i.
Funct ia numef poate o funct ie Matlab proprie, care are linia de denit ie
function z=numef(a,x)

In urma execut arii primei instruct iuni, se obt in coecient ii a ai funct iei numef,
iar dac a se foloseste a doua instruct iune se mai obt in si erorile r=y-numef(a,x).
Programul 3.4.24. Vom considera N vectori aleatori ce urmeaz a legea normal a bidi-
mensional a, p astrat i n matricea Z de tipul (N,2). Asupra elementelor coloanei a
doua se efectueaz a transformarea dat a prin funct ia exp. Dac a a doua coloan a a lui
Z astfel transformat a o consider am c a reprezint a valorile unei variabile dependente
Y, iar prima coloan a consider am c a reprezint a valorile unei variabile independente X,
vrem s a determin am leg atura de forma
Y = be
aX
.
Proced am n dou a moduri, cu ajutorul funct iei nlinfit (linie continu a pe grac),
respectiv prin liniarizarea acestei relat ii (linie nrerupt a pe grac), adic a prin logarit-
mare: ln Y = ln b +aX.
186 Statistic a descriptiv a
clf, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=exp(Z(:,2));
a=nlinfit(X,Y,expo,[1,1]);
p=polyfit(X,log(Y),1);
a1=p(1); b1=exp(p(2));
scatter(X,Y,7,filled), hold on
m=mu(1); s=sqrt(v(1,1));
x=m-3
*
s:0.01:m+3
*
s;
y=expo(a,x); y1=b1
*
exp(a1
*
x);
plot(x,y,-,x,y1,--)
Consider and datele de intrare N=20, mu=(0,0), v =
_
1 -0.9
-0.9 1
_
, se obt in
gracele din Figura 3.14.
3 2 1 0 1 2 3
0
2
4
6
8
10
12
Figura 3.14: Ajustare neliniar a
3.4.7 Functia nlintool
Funct ia demonstrativ a polytool se lanseaz a prin:
>>nlintool(x,y,numef,a0)
3.4. Corelat ie si regresie 187

In urma lans arii se produce un grac interactiv (demonstrativ) privind ajustarea


datelor cont inute n vectorul coloan a y si matricea x, av and tipul leg aturii precizat
prin parametrul numef, care poate o funct ie Matlab proprie.
Pe gur a este reprezentat gracul de ajustare (cu linie continu a).
Prin introducerea valorii unui argument x n fereastra de jos sau prin deplasarea
dreptei verticale pe pozit ia abscisei x, pe axa ordonatelor se obt ine valoarea cores-
punz atoare pentru y.
Elementele obt inute, prin lansarea acestei funct ii, pot salvate n spat iul de lucru,
workspace, part ial sau n totalitate, prin utilizarea butonului export.
Pe l ang a aceste elemente, gracul demonstrativ cont ine si alte elemente, care
se refer a la not iuni ce urmeaz a a prezentate n capitolele ce urmeaz a, cum ar
intervale de ncredere.
3.4.8 Coecientii Spearman si Kendall
Denitia 3.4.25. Fie (u
k
, v
k
), k = 1, N, rangurile datelor statistice primare
(x

k
, y

k
), k = 1, N, obt inute prin ordonarea cresc atoare dup a prima, respectiv a
doua component a. Numim coecient de corelat ie al rangurilor sau coecientul lui
Spearman, valoarea numeric a
s = r (U, V ) ,
unde U si V sunt noile caracteristici care denesc rangurile datelor statistice, res-
pectiv pentru X si Y .
Proprietatea 3.4.26. Dac a not am d
k
= |u
k
v
k
| diferent a rangurilor aceluiasi
individ, atunci
s = 1
6
N (N
2
1)
N

k=1
d
2
k
.
Demonstrat ie. Conform denit iei lui s avem c a
s =

N
i=1
(u
i
u) (v
i
v)
_

N
i=1
(u
i
u)
2
_

N
i=1
(v
i
v)
2

Deoarece { u
1
, u
2
, . . . , u
N
} = { v
1
, v
2
, . . . , v
N
} = { 1, 2, . . . , N }, rezult a c a
u = v =
1
N
N

k=1
k =
N + 1
2
si
N

k=1
(u
k
u)
2
=
N

k=1
(v
k
v)
2
=
N

k=1
_
k
N + 1
2
_
2
188 Statistic a descriptiv a
=
N (N+1) (2N+1)
6

N (N+1)
2
2
+
N (N+1)
2
4
=
N
_
N
2
1
_
12
,
deci numitorul din expresia lui s este calculat.
Pentru calcularea num ar atorului pornim de la identitatea
2 (u
k
u) (v
k
v) =(u
k
u)
2
+ (v
k
v)
2
[(u
k
u) (v
k
v)]
2
=(u
k
u)
2
+ (v
k
v)
2
d
2
k
,
care se nsumeaz a pentru k = 1, N. Obt inem n acest fel
2
N

k=1
(u
k
u) (v
k
v) =
N

k=1
(u
k
u)
2
+
N

k=1
(v
k
v)
2

k=1
d
2
k
=
N
_
N
2
1
_
12
2
N

k=1
d
2
k
,
adic a
N

k=1
(u
k
u) (v
k
v) =
N
_
N
2
1
_
12

1
2
N

k=1
d
2
k
.
Dac a se nlocuiesc aceste expresii n formula lui s se obt ine relat ia din enunt ul pro-
priet at ii.
Corolarul 3.4.27. Coecientul lui Spearman veric a relat iile 1 s 1.
Demonstrat ie. Valoarea maxim a s = 1 se obt ine c and d
k
= 0, k = 1, N, adic a toate
rangurile corespunz atoare celor dou a caracteristici coincid. Valoarea minim a s = 1
se va obt ine c and diferent ele rangurilor sunt maxime, adic a rangurile sunt inverse
pentru cele dou a caracteristici.

In acest caz avem
N

k=1
d
2
k
= 2
_
(N 1)
2
+ (N 3)
2
+
_
= 2
N
_
N
2
1
_
6
,
de unde se obt ine, ntr-adev ar, s = 1.
Acelasi rezultat se obt ine si din faptul c a s este denit cu ajutorul coecientului
(pentru ranguri) Pearson, despre care stie ca ia valori n intervalul [1, 1].
Observatia 3.4.28. Pe baza corolarului precedent, vom spune c a pentru s = 1 cele
dou a clasamente pentru caracteristicile X si Y sunt identice, pentru s = 1 sunt
inverse unul celuilalt, iar pentru s = 0 sunt independente.
3.4. Corelat ie si regresie 189
Observatia 3.4.29. C and exist a dou a sau mai multe date statistice primare care au
aceeasi valoare, atunci rangurile acestora se consider a toate egale (ex-aequo) cu me-
dia aritmetic a a rangurilor pe care le ocup a aceste date n ordonarea cresc atoare.
corespunz ator vom face modicarea lui s.
Dac a n ordonarea dup a caracteristica X avem u grupe de date statistice care
coincid, ecare grup a cont in and g
i
, i = 1, u, date statistice si dac a n ordonarea dup a
caracteristica Y avem v grupe de date statistice ce coincid, ecare grup a cont in and
h
j
, j = 1, v, date statistice, atunci s se modic a dup a cum urmeaz a
s =
1
6
_
N
_
N
2
1
_
(t
x
+t
y
)

N
k=1
d
2
k
_
1
6
N (N
2
1) 2t
x
_
1
6
N (N
2
1) 2t
y
,
unde
t
x
=
1
12
u

i=1
g
i
_
g
2
i
1
_
si t
y
=
1
12
v

j=1
h
j
_
h
2
j
1
_
.
Denitia 3.4.30. Numim coecientul lui Kendall relativ la distribut ia statistic a a
caracteristicii bidimensionale (X, Y ), raportul
k =
2t
N (N 1)
, unde t =
N

i,j=1
i<j
sign
__
x

j
x

i
_ _
y

j
y

i
__
.
Proprietatea 3.4.31. Coecientul lui Kendall satisface relat iile 1 k 1.
Demonstrat ie. Valoarea maxim a a lui k se obt ine c and t este maxim, adic a atunci
c and
_
x

j
x

i
__
y

j
y

i
_
> 0, pentru ecare i < j.

In acest caz avem c a
t =
N

i,j=1
i<j
1 =
_
N
2
_
=
N (N 1)
2
,
deci k = 1.
Valoarea minim a a lui k se obt ine c and t este minim,
_
x

j
x

i
__
y

j
y

i
_
< 0,
pentru ecare i < j, caz n care
t =
N

i,j=1
i<j
1 =
_
N
2
_
=
N (N 1)
2
,
deci k = 1. Prin urmare avem 1 k 1.
190 Statistic a descriptiv a
Observatia 3.4.32. Din proprietatea precedent a, avem c a pentru k = 1 cele dou a
clasamente ale celor dou a caracteristici X si Y sunt identice, pentru k = 1 sunt
inverse unul celuilalt, iar pentru k = 0 sunt independente.
Observatia 3.4.33. Pentru calculul rapid al lui k, se poate proceda dup a cum
urmeaz a. Se ordoneaz a datele primare (x

k
, y

k
) , k = 1, N, n mod cresc ator dup a
prima component a. Fie aceasta
_
x

(k)
, y

(k)
_
, k = 1, N, cu x

(1)
x

(2)

x

(N)
. Se calculeaz a apoi num arul
t =

u,v=1
u<v
sign
_
y

(v)
y

(u)
_
,
obt in andu-se astfel k.
Remarc am de asemenea c a toate formulele relative la coecientul lui Kendall
r am an adev arate dac a se lucreaz a cu rangurile (u
i
, v
i
), corespunz atoare datelor statis-
tice primare (x

i
, y

i
), i = 1, N, asa cum s-au introdus pentru denirea coecientului
lui Spearman.
Observatia 3.4.34. C and n cele dou a clasamente sunt valori egale (ex-aequo) se
procedeaz a ca la Observat ia 3.4.29, adic a se nlocuiesc toate rangurile pentru valorile
egale prin media aritmetic a a rangurilor pe care le ocup a n ordonare. Corespunz ator
se face modicarea lui k prin formula
k =
t
_
N(N1)
2
u
x
_
N(N1)
2
u
y
,
unde u
x
=
1
2

u
i=1
g
i
(g
i
1) si u
y
=
1
2

v
j=1
h
j
(h
j
1) , cu g
i
, h
j
denit i la
Observat ia 3.4.29. Pentru calculul lui t pentru ecare pereche ex-aequo valoarea lui
t r am ane neschimbat a.
Exemplul 3.4.35. Echipele diviziei nat ionale de fotbal sunt clasicate dup a num arul
de goluri primite (X) si dup a num arul cartonaselor galbene primite (Y ) n primele
10 meciuri ale campionatului. Datele statistice sunt trecute n tabelul urm ator
Echipa E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 E11 E12 E13 E14 E15 E16 E17 E18
X 15 13 10 13 12 11 16 11 13 9 10 14 15 9 8 9 10 11
Y 13 9 11 11 12 8 7 6 9 8 8 10 11 9 5 10 13 14
S a calcul am coecient ii lui Spearman respectiv al lui Kendall. Pentru aceasta or-
don am cresc ator echipele dup a caracteristica X, dup a care folosind regula ex-aequo
stabilim rangurile datelor statistice.
Calculele sunt efectuate n tabelul urm ator.
3.4. Corelat ie si regresie 191
Echipa X Y Rang(X) Rang(Y ) d d
2
- +
E15 8 5 1 1 0 0 0 17
E
10
9 8 3 5 2 4 2 12
E14 9 9 3 8 5 25 4 9
E
16
9 10 3 10.5 7.5 56.25 6 7
E3 10 11 6 13 7 49 7 4
E11 10 8 6 5 1 1 2 9
E17 10 13 6 16.5 10.5 110.25 9 1
E6 11 8 9 5 4 16 2 8
E
8
11 6 9 2 7 49 0 9
E18 11 14 9 18 9 81 8 0
E5 12 12 11 15 4 16 6 1
E2 13 9 13 8 5 25 1 4
E4 13 11 13 13 0 0 3 1
E
9
13 9 13 8 5 25 1 3
E12 14 10 15 10.5 4.5 20.25 1 2
E
1
15 13 16.5 16.5 0 0 2 0
E13 15 11 16.5 13 3.5 12.25 1 0
E7 16 7 18 3 15 225 0 0
Total 715 55 87
Num arul grupelor ex-aequo este cinci at at pentru X c at si pentru Y . Avem astfel
t
x
=
1
12
[3 (9 1) + 3 (9 1) + 3 (9 1) + 3 (9 1) + 2 (4 1)] =
17
2
,
t
y
=
1
12
[3 (9 1) + 3 (9 1) + 2 (4 1) + 3 (9 1) + 2 (4 1)] = 7,
u
x
=
1
2
[3 (3 1) + 3 (3 1) + 3 (3 1) + 3 (3 1) + 2 (2 1)] = 13,
u
y
=
1
2
[3 (3 1) + 3 (3 1) + 2 (2 1) + 3 (3 1) + 2 (2 1)] = 11,
t =87 55 = 32.
Dac a se nlocuiesc aceste valori n formule se obt in coecient ii
s =
1
6
_
18 19 17
_
17
2
+ 7
_
715
_
1
6
18 17 19 2
17
2
_
1
6
18 17 19 2 7
= 0.263,
k =
3
2
_
18 17
2
13
_
18 17
2
11 = 0.227.
192 Statistic a descriptiv a
Programul 3.4.36. Programul Matlab, care urmeaz a, calculeaz a cei doi coecient i,
Spearman si Kendall, f ar a tratarea cazurilor ex-aequo.
x=[15,13,10,13,12,11,16,11,13,9,10,14,15,9,8,9,10,11];
y=[13,9,11,11,12,8,7,6,9,8,8,10,11,9,5,10,13,14];
[xord,ind]=sort(x); [yord,jnd]=sort(y);
for i=1:18
rx(ind(i))=i; ry(jnd(i))=i;
end
d=abs(rx-ry); d2=d.2;
sp=1-6
*
sum(d2)/18/(182-1);
ke=0;
for i=1:18
for j=1:18
if i<j
ke=ke+sign((rx(i)-rx(j))
*
(ry(i)-ry(j)));
end
end
end
ke=2
*
ke/(18
*
17);
fprintf( x | y |rang(x)|rang(y)| d | d2 \n)
for i=1:18
fprintf(%3d |%4d |%5d |%5d |%4d |%4d\n,...
x(i),y(i),rx(i),ry(i),d(i),d2(i))
end
fprintf(\n sp=%5.3f, ke=%5.3f,sp,ke)

In urma execut arii acestui program, se obt in urm atoarele rezultate:


x | y |rang(x)|rang(y)| d | d2
15 | 13 | 16 | 16 | 0 | 0
13 | 9 | 12 | 7 | 5 | 25
10 | 11 | 5 | 12 | 7 | 49
13 | 11 | 13 | 13 | 0 | 0
12 | 12 | 11 | 15 | 4 | 16
11 | 8 | 8 | 4 | 4 | 16
16 | 7 | 18 | 3 | 15 | 225
11 | 6 | 9 | 2 | 7 | 49
13 | 9 | 14 | 8 | 6 | 36
9 | 8 | 2 | 5 | 3 | 9
10 | 8 | 6 | 6 | 0 | 0
14 | 10 | 15 | 10 | 5 | 25
15 | 11 | 17 | 14 | 3 | 9
9 | 9 | 3 | 9 | 6 | 36
8 | 5 | 1 | 1 | 0 | 0
9 | 10 | 4 | 11 | 7 | 49
10 | 13 | 7 | 17 | 10 | 100
11 | 14 | 10 | 18 | 8 | 64
sp=0.269, ke=0.203
3.4. Corelat ie si regresie 193
Observatia 3.4.37. (Formula lui Daniels). Coecientul r de corelat ie (al lui Pear-
son), coecientul s al lui Spearman si coecientul k al lui Kendall se pot exprima
prin formula unic a
d =

N
i=1

N
j=1
a
ij
b
ij
_

N
i=1

N
j=1
a
2
ij
_

N
i=1

N
j=1
b
2
ij

Dac a se ia
a
ij
= x

i
x

j
, b
ij
= y

i
y

j
se obt ine coecientul de corelat ie r.

Intradev ar, prin calcule algebrice simple se poate scrie


N

i=1
N

j=1
_
x

i
x

j
_ _
y

i
y

j
_
= 2N
N

i=1
x

i
y

i
2
_
N

i=1
x

i
__
N

i=1
y

i
_
,
iar
N

i=1
N

j=1
_
x

i
x

j
_
2
= 2N
N

i=1
x

2
i
2
_
N

i=1
x

i
_
2
,
N

i=1
N

j=1
_
y

i
y

j
_
2
= 2N
N

i=1
y

2
i
2
_
N

i=1
y

i
_
2
,
astfel c a
d =

N
i=1
x

i
y

1
N
_

N
i=1
x

i
__

N
i=1
y

i
_

N
i=1
x

2
i

1
N
_

N
i=1
x

i
_
2

N
i=1
y

2
i

1
N
_

N
i=1
y

i
_
2
= r.
Dac a se ia
a
ij
= u
i
u
j
, b
ij
= v
i
v
j
se obt ine, ca mai nainte, coecientul s al lui Spearman, iar dac a se consider a
a
ij
= sign
_
x

i
x

j
_
, b
ij
= sign
_
y

i
y

j
_
se obt ine coecientul k al lui Kendall.
194 Statistic a descriptiv a
Denitia 3.4.38. Fie colectivitatea C cercetat a din punct de vedere a p caracteristici
X
1
, X
2
, . . . , X
p
si e datele statistice primare relative la aceste caracteristici scrise
n matricea
X =
_
_
_
_
x
11
x
12
. . . x
1p
x
21
x
22
. . . x
2p
. . . . . . . . . . . . . . . . . . . .
x
N1
x
N2
. . . x
Np
_
_
_
_
,
cu matricea R a rangurilor corespunz atoare pentru ecare caracteristic a dat a prin
R =
_
_
_
_
r
11
r
12
. . . r
1p
r
21
r
22
. . . r
2p
. . . . . . . . . . . . . . . . . . .
r
N1
r
N2
. . . r
Np
_
_
_
_
.
Numim coecientul de concordant a al lui Kendall raportul
w =
12s
p
2
(N
3
N)
,
unde
s =
N

i=1
_
r
i

N
_
2
, r
i
=
p

j=1
r
ij
, r

=
N

i=1
r
i

Observatia 3.4.39. Fiecare coloan a a tabloului rangurilor este o permutare a nu-


merelor 1, 2, . . . , N, deci suma elementelor din ecare coloan a este
N(N+1)
2
si prin
urmare
r

= p
N (N + 1)
2

C and cele p clasamente sunt identice, deci coloanele din matricea ranguri-
lor sunt identice, totalurile r
1
, r
2
, . . . , r
N
formeaz a o permutare a elementelor
p, 2p, . . . , Np.

In acest caz valoarea lui s va maxim a, anume
s =
N

i=1
_
p i
p (N + 1)
2
_
2
=
p
2
_
N
3
N
_
12

prin urmare w 1.
C and r
1
= r
2
= = r
N
atunci se obt ine valoarea minim a w = 0, caz n care
avem independent a ntre caracteristicile cercetate.
Observatia 3.4.40. Cazurile ex-aequo se trateaz a ca si pentru dou a caracteristici, iar
formula modicat a este
w =
12s
p
2
(N
3
N) p

p
j=1
_
t
3
j
t
j
_
3.4. Corelat ie si regresie 195
unde t
j
este num arul datelor ex-aequo pentru caracteristica X
j
.
Exemplul 3.4.41. Se consider a 12 familii pentru care sunt cercetate urm atoarele ca-
racteristici X
1
, X
2
, X
3
, X
4
reprezent and cheltuielile (n sute de lei) zilnice pentru
p aine, legume, fructe, carne respectiv. S-au obt inut urm atoarele date statistice
X1 X2 X3 X4
332 428 354 1437
293 559 388 1527
372 767 562 1948
406 563 341 1509
386 608 396 1501
438 843 689 2345
534 660 367 1620
460 699 483 1856
385 789 621 2366
655 776 423 1848
584 995 548 2056
515 1097 887 2630
Vrem s a calcul am coecientul de concordant a al lui Kendall.
Pentru a calcula coecientul de concordant a al lui Kendall, se determin a rangurile
datelor statistice pentru ecare caracteristic a n parte. Matricea rangurilor este
R =
_
r
ij
_
i=1,12
j=1,4
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
2 1 2 1
1 2 4 4
3 7 9 8
6 3 1 3
5 4 5 2
7 10 11 10
10 5 3 5
8 6 7 7
4 9 10 11
12 8 6 6
11 11 8 9
9 12 12 12
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_

De asemenea, avem c a sumele rangurilor de pe ecare line a matricei rangurilor sunt


6, 11, 27, 13, 16, 38, 23, 28, 34, 32, 39, 45, deci
s =
N

i=1
_
r
i

N
_
2
=
_
6
312
12
_
2
+
_
11
312
12
_
2
+ +
_
45
312
12
_
2
196 Statistic a descriptiv a
=(6 26)
2
+ (11 26)
2
+ + (45 26)
2
= 1682.
Coecientul de concordant a al lui Kendall va
w =
12 s
p
2
(N
3
N)
=
12 1682
4
2
(12
3
12)
=
841
1441

= 0.7351.
Programul 3.4.42. Un program Matlab, care efectueaz a aceste calcule, este prezen-
tat n continuare
x=[332,428,354,1437;293,559,388,1527;372,767,562,1948;
406,563,341,1509;386,608,396,1501;438,843,689,2345;
534,660,367,1620;460,699,483,1856;385,789,621,2366;
655,776,423,1848;584,995,548,2056;515,1097,887,2630];
N=12; p=4;
[x1,i1]=sort(x(:,1)); [x2,i2]=sort(x(:,2));
[x3,i3]=sort(x(:,3)); [x4,i4]=sort(x(:,4));
for i=1:12
r1(i1(i))=i; r2(i2(i))=i; r3(i3(i))=i; r4(i4(i))=i;
end
r=[r1,r2,r3,r4]; sb=sum((sum(r)-sum(sum(r))/12).2);
w=12
*
sb/(p2
*
(N3-N));
fprintf( Matricea rangurilor\n)
for i=1:12
fprintf(%6d |%3d |%3d |%3d\n,r1(i),r2(i),r3(i),r4(i))
end
fprintf(\n w=%5.3f,w)
iar rezultatele obt inute, n urma execut arii programului, sunt
Matricea rangurilor
2 | 1 | 2 | 1
1 | 2 | 4 | 4
3 | 7 | 9 | 8
6 | 3 | 1 | 3
5 | 4 | 5 | 2
7 | 10 | 11 | 10
10 | 5 | 3 | 5
8 | 6 | 7 | 7
4 | 9 | 10 | 11
12 | 8 | 6 | 6
11 | 11 | 8 | 9
9 | 12 | 12 | 12
w=0.735
Capitolul 4
Teoria selectiei
Studiul statistic al unei colectivit at i C din punct de vedere al uneia sau mai multor ca-
racteristici prin considerarea tuturor indivizilor colectivit at ii de multe ori este imposi-
bil de efectuat sau foarte costisitor. Dac a ne g andim, de exemplu, la studiul calit at ii
produselor unei fabrici de conserve, ne d am seama c a nu are sens considerarea tu-
turor acestor produse pentru efectuarea controlului, ceea ce ar duce la distrugerea
ntregii product ii. De asemenea, dac a se are n vedere recens am antul populat iei unei
t ari, ne d am seama de costul ridicat al acestei operat ii, motiv pentru care astfel de
recens aminte sunt destul de rare.
S i numai din cele dou a exemple amintite nainte, ne d am seama c a ar potrivit
ca s a e considerat a pentru studiu numai o parte a colectivit at ii cercetate, iar apoi
rezultatele obt inute relative la aceast a parte s a e extinse la ntreaga colectivitate.
4.1 Tipuri de selectie
Denitia 4.1.1. Numim esantion (select ie, sondaj) relativ la colectivitatea C o
submult ime de indivizi E a lui C, care urmeaz a s a e cercetat i din punct de vedere
a uneia sau mai multor caracteristici, iar num arul indivizilor din esantionul E se
numeste volumul esantionului.
Observatia 4.1.2. Modurile de obt inere a esantionului E ne conduc la metode neale-
atoare si respectiv metode aleatoare de select ie.
Dintre metodele nealeatoare amintim:
select ia sistematic a, c and indivizii care intr a n esantion sunt considerat i dup a
o anumit a regul a, de exemplu din 10 n 10;
197
198 Teoria select iei
select ie tipic a, c and, cunosc andu-se informat ii anterioare referitoare la colec-
tivitate, sunt considerat i indivizi cu valori medii apropiate de valoarea medie a
ntregii colectivit at i;
select ie straticat a, c and colectivitatea este clasicat a (straticat a) dup a anu-
mite criterii, cunosc anduse proport ia indivizilor pentru ecare strat. Esantio-
nul se ia astfel nc at s a e respectate aceste proport ii pentru ecare strat.
Pentru metodele aleatoare, ecare individ al colectivit at ii C poate s a intre n esantion
cu aceasi probabilitate (select ie cu probabilit at i egale) sau cu probabilit at i diferite.
Metodele aleatoare de select ie sunt:
repetate (bernoulliene), c and individul, ce intr a n esantion, dup a ce a fost cer-
cetat, este reintrodus n colectivitate;
nerepetate, c and individul ce intr a n esantion, dup a ce a fost cercetat, nu este
reintrodus n colectivitate.
Observatia 4.1.3. Dac a volumul colectivit at ii este mult mai mare dec at volumul e-
santionului, atunci o select ie nerepetat a poate considerat a ca ind de tip repetat.
Aceasta are la baz a rezultatul privind comportarea asimptotic a a legii hipergeometrice
ca si o lege binomial a (a se vedea Observat ia 2.4.4).
4.2 Functii de selectie

In cele ce urmeaz a vom considera c a avem de ecare dat a o select ie repetat a.


Denitia 4.2.1. Fie colectivitatea C cercetat a din punct de vedere al caracteristicii
X. Numimdate de select ie relative la caracteristica X datele statistice x
1
, x
2
, . . . , x
n
privind indivizii care intr a n esantion.
Observatia 4.2.2. Datele de select ie pot considerate ca ind valorile unor variabile
aleatoare X
1
, X
2
, . . . , X
n
, numite variabile de select ie si care n cazul unei select ii
repetate sunt variabile aleatoare independente, identic repartizate cu X.
Denitia 4.2.3. Numim funct ie de select ie sau statistic a variabila aleatoare
Z
n
= h
n
(X
1
, X
2
, . . . , X
n
) ,
unde h
n
: R
n
R este o funct ie m asurabil a, iar z
n
= h
n
(x
1
, x
2
, . . . , x
n
) se
numeste valoarea funct iei de select ie.
4.2. Funct ii de select ie 199
4.2.1 Media de selectie
Denitia 4.2.4. Numim medie de select ie funct ia de select ie

X =
1
n
n

k=1
X
k
, iar x =
1
n
n

k=1
x
k
se numeste valoarea mediei de select ie.
Proprietatea 4.2.5. Fie caracteristica X av and valoarea medie m = E(X) si dis-
persia
2
= V ar (X), atunci
E
_

X
_
= m si V ar
_

X
_
=
1
n

2
.
Demonstrat ie. Folosind propriet at ile valorii medii si ale dispersiei si av and n vedere
c a select ia este repetat a avem succesiv
E
_

X
_
=
1
n
n

k=1
E (X
k
) =
1
n
n

k=1
E(X) =
1
n
nm = m,
V ar
_

X
_
=
1
n
2
n

k=1
V ar (X
k
) =
1
n
2
n

k=1
V ar (X) =
1
n
2
n
2
=
1
n

2
.
Observatia 4.2.6.

In cazul n care caracteristica X urmeaz a legea normal a N (, ),
atunci

X, ind o combinat ie liniar a de variabile aleatoare independente, ce urmeaz a
ecare aceasi lege normal a, va urma de asemenea legea normal a (a se vedea
Observat ia 2.5.6). Pe baza propriet at ii precedente

X va urma asadar legea normal a
N
_
,

n
_
.
Proprietatea 4.2.7. Fie caracteristica X av and valoarea medie m = E(X) si dis-
persia
2
= V ar (X), atunci statistica
(4.2.1) Z
n
=

X m

n
converge n repartit ie la legea normal a N (0, 1), c and n , iar c and X urmeaz a
legea normal a N (m, ) armat ia are loc pentru orice valoare a lui n.
Proprietatea nu reprezint a altceva dec at Teorema 2.7.8.
200 Teoria select iei
Functia 4.2.8. Pentru ilustrarea propriet at ii precedente, scriem o funct ie Matlab, care
genereaz a o matrice de tipul (n,m), ale c arei elemente sunt numere aleatoare ce
urmeaz a o lege de probabilitate precizat a. Pentru ecare coloan a a matricei gene-
rate, se calculeaz a valoarea z
n
, folosind formula (4.2.1), dup a care se reprezint a
grac histograma valorilor z
n
, mpreun a cu densitatea de probabilitate a legii nor-
male N ( z, ).
function hist2(n,m,lege)
% Comportare asimptotica a mediei de selectie
% lege - legea de probabilitate
% (n,m) - tipul matricei generate
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,m); [med,var]=unidstat(N);
case bino
nn=input(n=); p=input(p=);
X=binornd(nn,p,n,m); [med,var]=binostat(nn,p);
case hyge
M=input(M=); K=input(K=); nn=input(n=);
X=hygernd(M,K,nn,n,m); [med,var]=hygestat(M,K,nn);
case poiss
la=input(lambda=);
X=poissrnd(la,n,m); [med,var]=poisstat(la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,m); [med,var]=nbinstat(r,p);
case geo
p=input(p=);
X=geornd(p,n,m); [med,var]=geostat(p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,m); [med,var]=unifstat(a,b);
case norm
mu=input(mu=); s=input(sigma=);
X=normrnd(mu,s,n,m); [med,var]=normstat(mu,s);
case logn
mu=input(mu=); s=input(sigma=);
X=lognrnd(mu,s,n,m); [med,var]=lognstat(mu,s);
case gam
a=input(a=); b=input(b=);
X=gamrnd(a,b,n,m); [med,var]=gamstat(a,b);
case exp
mu=input(mu=);
X=exprnd(mu,n,m); [med,var]=expstat(mu);
case beta
a=input(a=); b=input(b=);
X=betarnd(a,b,n,m); [med,var]=betastat(a,b);
case weib
4.2. Funct ii de select ie 201
a=input(a=); b=input(b=);
X=weibrnd(a,b,n,m); [med,var]=weibstat(a,b);
case rayl
b=input(b=);
X=raylrnd(b,n,m); [med,var]=raylstat(b);
case t
nn=input(n=);
X=trnd(nn,n,m); [med,var]=tstat(nn);
case chi2
nn=input(n=);
X=chi2rnd(nn,n,m); [med,var]=chi2stat(nn);
case f
mm=input(m=); nn=input(n=);
X=frnd(mm,nn,n,m); [med,var]=fstat(mm,nn);
otherwise
error(Lege necunoscuta)
end
Z=mean(X); Z=(Z-med)/sqrt(var/n);
hist(Z,fix(1+10/3
*
log10(m)), hold on
x=-3:0.01:3; f=normpdf(x,0,1);
plot(x,f,k-), colormap spring
Apelul funct iei hist2 se face prin
>>hist2(n,m,lege)
unde valorile pentru n, m si lege, e c a sunt precizate n acest apel, e sunt precizate
nainte. De exemplu, comanda
>>hist2(25,35,unif)
are ca efect apelul funct iei pentru legea uniform a, iar pe ecran se va cere introducerea
parametrilor a si b (a<b), dup a care pe ecran va reprezentat gracul din Figura 4.1,
n cazul n care a=-1 si b=1. S a remarc am totusi c a la un nou apel, cu aceeasi
parametri, gracul difer a, deoarece sunt generate alte numere aleatoare.
4.2.2 Momente de selectie
Denitia 4.2.9. Numim moment de select ie de ordin k funct ia de select ie

k
=
1
n
n

i=1
X
k
i
, iar
k
=
1
n
n

i=1
x
k
i
,
se numeste valoarea momentului de select ie de ordin k.
Observatia 4.2.10. Se vede imediat c a
1
=

X.
Proprietatea 4.2.11. Fie caracteristica X pentru care exist a momentul teoretic de
ordin 2k,
2k
= E
_
X
2k
_
, atunci
E(
k
) =
k
si V ar (
k
) =
1
n
_

2k

2
k
_
,
202 Teoria select iei
3 2 1 0 1 2 3
0
2
4
6
8
10
12
Figura 4.1: Legea N (0, 1)
iar pentru n , avem c a
Z
n
=

k

k

2k

2
k

n
converge n repartit ie la legea normal a N (0, 1).
Demonstrat ie. Deoarece select ia este repetat a putem scrie succesiv
E(
k
) =
1
n
n

i=1
E
_
X
k
i
_
=
1
n
n

i=1
E
_
X
k
_
=
1
n
n
k
=
k
,
V ar (
k
) =
1
n
2
n

i=1
V ar
_
X
k
i
_
=
1
n
2
n

i=1
V ar
_
X
k
_
=
1
n
2
n
_

2k

2
k
_
=
1
n
_

2k

2
k
_
.
Ultima armat ie rezult a prin aplicarea Teoremei 2.7.8 sirului
_
X
k
n
_
n1
de variabile
aleatoare independente si identic repartizate. Anume, deoarece E
_
X
k
n
_
=
k
si
V ar
_
X
k
n
_
=
2k

2
k
, avem
Z
n
=
n

i=1
X
k
i

k
_

2k

2
k

n
=
1
_

2k

2
k

n
_
n

i=1
X
k
i
n
k
_
=
1
_

2k

2
k

n
(n
k
n
k
) =

k

k

2k

2
k

n
,
4.2. Funct ii de select ie 203
dar Z
n
converge n repartit ie la legea normal a N (0, 1), ceea ce ncheie demonstrat ia.
Denitia 4.2.12. Numim moment centrat de select ie de ordin k funct ia de select ie

k
=
1
n
n

i=1
_
X
i


X
_
k
, iar
k
=
1
n
n

i=1
(x
i
x)
k
,
se numeste valoarea momentului centrat de select ie de ordin k.
Observatia 4.2.13. Se vede imediat c a
1
= 0, iar momentul centrat de ordinul doi
se poate scrie
2
=
2

2
1
.
Proprietatea 4.2.14. Fie caracteristica X pentru care exist a momentul teoretic
4
,
atunci pentru momentul centrat de ordinul doi avem
E(
2
) =
n 1
n

2
si V ar (
2
) =
n 1
n
3
_
(n 1)
4
(n 3)
4
_
,
unde
2
= V ar (X), si de asemenea
Cov
_

X ,
2
_
=
n 1
n
2

3

Demonstrat ie. Pentru prima relat ie scriem succesiv


E (
2
) =E(
2
) E
_

2
1
_
=
2

1
n
2
E
_
n

k=1
X
2
k
+ 2
n

i,j=1
i<j
X
i
X
j
_
=
2

1
n
2
_
n

k=1
E
_
X
2
k
_
+ 2
n

i,j=1
i<j
E (X
i
) E (X
j
)
_
=
2

1
n
2
_
n
2
+n(n 1)
2
1

=
2

1
n

n 1
n

2
1
=
n 1
n
_

2
1
_
=
n 1
n

2
.
Dac a se ret in extremit at ile sirului de egalit at i avem prima relat ie.
Pentru a calcula dispersia, consider am variabilele aleatoare reduse, notate prin
Y
k
= X
k
E(X
k
), k = 1, n, care sunt independente si identic repartizate si pentru
care E(Y
k
) = 0, V ar (Y
k
) =
2
, k = 1, n.
Se arat a usor c a

2
=
1
n
n

k=1
_
Y
k


Y
_
2
, unde

Y =
1
n
n

k=1
Y
k
.
204 Teoria select iei
Pe de alt a parte avem c a
V ar (
2
) = E
_

2
2
_

_
E(
2
)
_
2
= E
_

2
2
_

_
n 1
n
_
2

4
.
A r amas, prin urmare, de calculat E
_

2
2
_
. Pentru aceasta avem
E
_

2
2
_
=
1
n
2
E
__
n

k=1
_
Y
k


Y
_
2
_
2
_
=
1
n
2
E
__
n

k=1
Y
2
k
2

Y
n

k=1
Y
k
+n

Y
2
_
2
_
=
1
n
2
E
__
n

k=1
Y
2
k
n

Y
2
_
2
_
=
1
n
2
E
__
n

k=1
Y
2
k
_
2
2n

Y
2
n

k=1
Y
2
k
+n
2

Y
4
_
,
de unde se obt ine
E
_

2
2
_
=
1
n
2
E
__
n

k=1
Y
2
k
_
2
_

2
n
E
_

Y
2
n

k=1
Y
2
k
_
+E
_

Y
4
_
.
Calcul am pe r and termenii din membrul drept al aceste relat ii. Astfel avem
E
__
n

k=1
Y
2
k
_
2
_
=
n

k=1
E
_
Y
4
k
_
+ 2

i,j=1
i<j
E
_
Y
2
i
_
E
_
Y
2
j
_
= n
4
+n(n 1)
2
2
,
apoi
E
_

Y
2
n

k=1
Y
2
k
_
=
1
n
2
E
__
n

i=1
Y
2
i
+ 2
n

i,j=1
i<j
Y
i
Y
j
__
n

k=1
Y
2
k
__
=
1
n
2
E
_
n

k=1
Y
4
k
+ 2
n

i,j=1
i<j
Y
2
i
Y
2
j
+ 2
n

i,j,k=1
i<j
Y
i
Y
j
Y
2
k
_
=
1
n
2
_
n
4
+n(n 1)
2
2

=
1
n

4
+
n 1
n

2
2
,
deoarece E
_
Y
i
Y
j
Y
2
k
_
= 0, pentru orice i, j, k = 1, n, i = j. Pentru ultimul termen
avem
E
_

Y
4
_
=
1
n
4
E
_
n

k=1
Y
4
k
+ 6
n

i,j=1
i<j
Y
2
i
Y
2
j
+
_
=
1
n
4
_
n
4
+ 3n(n 1)
2
2

=
1
n
3

4
+
3 (n 1)
n
3

2
2
.
4.2. Funct ii de select ie 205
Termenii lui E
_

Y
4
_
, care nu au fost luat i n considerare, sunt nuli deoarece cont in
ca factor pe E (Y
i
) = 0. Obt inem n acest fel c a
E
_

2
2
_
=
1
n
2
_
n
4
+n(n1)
2
2

2
n
_
1
n

4
+
n1
n

2
2
_
+
1
n
3

4
+
3 (n1)
n
3

2
2
=
(n 1)
2
n
3

4
+
(n 1)
_
n
2
2n + 3
_
n
3

2
2
,
deci pentru dispersie avem succesiv
V ar (
2
) =
(n 1)
2
n
3

4
+
(n 1)
_
n
2
2n + 3
_
n
3

2
2

(n 1)
2
n
2

2
2
=
(n 1)
2
n
3

4

(n 1) (n 3)
n
3

2
2
=
n 1
n
3
_
(n 1)
4
(n 3)
2
2

,
adic a
V ar (
2
) =
n 1
n
3
_
(n 1)
4
(n 3)
2
2

.
Pentru ultima relat ie putem considera E (X) = 0, deci E
_

X
_
= 0, caz n care
avem
Cov
_

X ,
2
_
= E
_

X
2
_
=
1
n
2
E
__
n

k=1
X
k
__
n

k=1
X
2
k
n

X
2
__
=
1
n
2
E
__
n

k=1
X
k
__
n

i=1
X
2
i
__
E
_

X
3
_
=
1
n
2
n

k=1
E
_
X
3
k
_

1
n
3
n

k=1
E
_
X
3
k
_
,
deoarece E (X
i
X
j
) = E
_
X
i
X
2
j
_
= 0, c and i = j. Asadar
Cov
_

X ,
2
_
=

3
n


3
n
2
=
n 1
n
2

3

Observatia 4.2.15. Din proprietatea precedent a avem c a


V ar (
2
) =
1
n
_

4

2
2
_
+O
_
1
n
2
_
, deci V ar (
2
)
1
n
_

2
2
_
.
Deoarece Cov
_

X,
2
_
=
n1
n
2

3
, avem c a statisticile

X si
2
sunt necorelate
pentru n , iar dac a X are distribut ia simetric a (
3
= 0), atunci

X si
2
sunt
necorelate pentru orice n.
206 Teoria select iei
De asemenea se poate ar ata c a statistica
Z
n
=

2

2
2

n
converge n repartit ie la legea normal a N (0, 1), c and n .
Denitia 4.2.16. Numim dispersie de select ie funct ia de select ie

2
=
1
n 1
n

k=1
_
X
k


X
_
2
, iar valoarea numeric a
2
=
1
n 1
n

k=1
(x
k
x)
2
,
se numeste valoarea dispersiei de select ie.
Observatia 4.2.17.

Intre momentul centrat de select ie de ordinul doi si dispersia de
select ie exist a relat ia
(4.2.2)
2
=
n
n 1

2
.
Ca urmare avem c a
E
_

2
_
=
2
=
2
, Cov
_

X ,
2
_
=
1
n

3
,
V ar
_

2
_
=
1
n(n 1)
_
(n 1)
4
(n 3)
2
2
_
.
Proprietatea 4.2.18. Fie caracteristica X pentru care exist a momentul centrat teo-
retic
k
= E
__
X E (X)
_
k
_
, atunci E (
k
) =
k
+O
_
1
n
_
.
Demonstrat ie. Folosind formula binomului avem c a

k
=
1
n
n

i=1
_
X
i


X
_
k
=
1
n
n

i=1
_
X
k
i

_
k
1
_
X
k1
i

X + + (1)
k

X
k
_
=
k

_
k
1
_

X
k1
+ + (1)
k

X
k
.
F ar a a restr ange generalitatea, se poate considera c a E(X) = 0, deci au loc egalit a-
t ile
i
=
i
, i = 1, k. Putem scrie atunci
E(
k
) = E(
k
)
_
k
1
_
E
_

X
k1
_
+ + (1)
k
E
_

X
k
_
4.2. Funct ii de select ie 207
=
k

_
k
1
_
E
_

X
k1
_
+ + (1)
k
E
_

X
k
_
.
Pe de alt a parte, din inegalitatea lui Schwarz, se obt ine c a
E
2
_

X
i

ki
_
E
_

X
2i
_
E
_

2
ki
_
, i = 2, k.
Dac a se are n vedere Proprietatea 4.2.11, rezult a c a
E
_

2
ki
_
= V ar (
ki
) +E
2
(
ki
) =
1
n
_

2(ki)

2
ki

+
2
ki
=
2
ki
+
1
n
_

2(ki)

2
ki

.
Se poate ar ata, de asemenea, c a E
_

X
2i
_
= O
_
1
n
i
_
. Astfel din inegalitatea lui
Schwarz se obt ine
E
2
_

X
i

ki
_
O
_
1
n
i
_
sau E
_

X
i

ki
_
O
_
1
n
i
2
_
, i = 2, k.

In cazul i = 1, se calculeaz a direct


E
_

X
k1
_
=
1
n
2
E
__
n

i=1
X
i
__
n

j=1
X
k1
j
__
=
1
n
2
n

i=1
E
_
X
k
i
_
=
1
n

k
.
Lu and n considerare aceste evalu ari, se obt ine n nal
E (
k
) =
k

k
n

k
+O
_
1
n
_
=
k
+O
_
1
n
_

Observatia 4.2.19. Printro cale analog a, se poate obt ine c a


V ar (
k
) =

2k
2k
k1

k+1

2
k
+k
2

2
k1
n
+O
_
1
n
2
_

4.2.3 Coecient de corelatie de selectie


Denitia 4.2.20. Fie caracteristica bidimensinal a (X, Y ) si o select ie repetat a de
volum n, cu datele de select ie (x
k
, y
k
), k = 1, n, si respectiv variabilele de select ie
(X
k
, Y
k
), k = 1, n. Numim coecient de corelat ie de select ie funct ia de select ie
r =

n
i=1
_
X
i


X
_ _
Y
i


Y
_
_

n
i=1
_
X
i


X
_
2
_

n
i=1
_
Y
i


Y
_
2
,
208 Teoria select iei
iar valoarea numeric a
r =

n
i=1
(x
i
x) (y
i
y)
_

n
i=1
(x
i
x)
2
_

n
i=1
(y
i
y)
2
,
se numeste valoarea coecientului de corelat ie de select ie.
Observatia 4.2.21. Fisher a ar atat c a pentru o caracteristic a bidimensional a (X, Y ),
care urmeaz a legea normal a N (m
1
, m
2
;
1
,
2
; r), densitatea de probabilitate a coe-
cientului de corelat ie de select ie este
f
n
(x) =
n 2

_
(1 r
2
)
n1
_
(1 x
2
)
n4
_
1
0
u
n2
(1 rxu)
n1
du

1 u
2
=
2
n3
(n 3)!
_
(1 r
2
)
n1
_
(1 x
2
)
n4

k=0

2
_
n +k 1
2
_
(2rx)
k
k!
, x (1, 1) .
De asemenea, dac a se consider a transformarea (lui Fisher) Z =
1
2
ln
1+ r
1 r
si dac a
=
1
2
ln
1+r
1r
, atunci Z urmeaz a aproximativ legea normal a N
_
+
r
2(n1)
,
1

n3
_
.

In cazul particular r = 0, avem densitatea de probabilitate a lui r exprimat a prin


f
n
(x) =
1

_
n1
2
_

_
n2
2
_
_
(1 x
2
)
n4
, x (1, 1) ,
iar statistica
(4.2.3) T =

n 2
r

1 r
2
urmeaz a legea Student cu n 2 grade de libertate.
Programul 4.2.22. Vom scrie un program, care genereaz a de N ori c ate n vectori
aleatori, ce urmeaz a legea normal a bidimensional a, av and coecientul de corelat ie
dintre cele dou a componente nul, adic a r=0. Folosind aceste date se vor calcula
N numere aleatoare dup a regula precizat a prin statistica (4.2.3), iar histograma co-
respunz atoare acestor noi date va reprezentat a grac mpreun a cu densitatea de
probabilitate a legii Student cu n-2 grade de libertate.
clear,clf,
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=0; v(2,1)=0;
4.2. Funct ii de select ie 209
n=input(n=); N=input(N=);
for k=1:N
Z=mvnrnd(mu,v,n); r=corrcoef(Z); r12=r(1,2);
t(k)=sqrt(n-2)
*
r12/sqrt(1-r122);
end
x=-3:0.01:3; f=tpdf(x,n-2);
nn=fix(1+10/3
*
log10(N));
[fr,cl]=hist(t,nn); h=cl(2)-cl(1);
bar(cl,fr/(h
*
N),1),hold on, plot(x,f,k-)
colormap spring
Pentru N=50, n=20, mu=(5,10), v =
_
2 0
0 3
_
, se obt in gracele din Figura 4.2.
3 2 1 0 1 2 3
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
Figura 4.2: Legea T (18)
Lema 4.2.23 (Fisher). Dac a variabilele aleatoare X
1
, X
2
, . . . , X
n
sunt indepen-
dente, ecare urm and legea normal a N (0, 1) si dac a se consider a matricea ortonor-
mat a A = (a
ij
)
i,j=1,n
, atunci variabilele aleatoare
Y
i
=
n

k=1
a
ik
X
k
, i = 1, n,
sunt independente, ecare urm and legea normal a N (0, 1).
Demonstrat ie. Pentru a ar ata c a variabilele aleatoare Y
i
, i = 1, n, sunt independente
determin am funct ia caracteristic a a vectorului aleator (Y
1
, Y
2
, . . . , Y
n
). Pornind de
210 Teoria select iei
la denit ia funct iei caracteristice avem
(t
1
, t
2
, . . . , t
n
) =E
_
exp
_
i
n

k=1
t
k
Y
k
__
= E
_
exp
_
i
n

k=1
t
k
n

j=1
a
kj
X
j
__
=E
_
exp
_
i
n

j=1
_
n

k=1
t
k
a
kj
_
X
j
__
.
Variabilele aleatoare X
j
, j = 1, n, ind independente se obt ine
(t
1
, t
2
, . . . , t
n
) =
n

j=1
E
_
exp
_
i
n

k=1
t
k
a
kj
_
X
j
__
.
Fiecare factor din membrul drept este valoarea funct iei caracteristice a legii normale
N (0, 1), pe punctele, respectiv

n
k=1
t
k
a
kj
, j = 1, n, adic a
(t
1
, t
2
, . . . , t
n
) =
n

j=1
exp
_

1
2
_
n

k=1
t
k
a
kj
_
2
_
= exp
_

1
2
n

j=1
_
n

k=1
t
k
a
kj
_
2
_
=exp
_

1
2
n

j=1
_
n

k=1
t
2
k
a
2
kj
+ 2
n

i,s=1
i<s
t
i
t
s
a
ij
a
sj
__
=exp
_

1
2
_
n

k=1
t
2
k
n

j=1
a
2
kj
+ 2
n

i,s=1
i<s
t
i
t
s
n

j=1
a
ij
a
sj
__
.
Folosind condit iile de ortonormalitate relative la coecient ii a
ij
, se obt ine c a
(t
1
, t
2
, . . . , t
n
) = exp
_

1
2
n

k=1
t
2
k
_
,
adic a faptul c a Y
1
, Y
2
, . . . , Y
n
sunt variabile aleatoare independente, ce urmeaz a
ecare legea normal a N (0, 1).
Proprietatea 4.2.24. Fie caracteristica X, ce urmeaz a legea normal a N (0, 1)
si variabilele de select ie X
1
, X
2
, . . . , X
n
, ce corespund unei select ii repetate de
volum n, atunci statisticile
U
n
=

n

X =
1

n
n

k=1
X
k
, V
n
=
n

k=1
_
X
k


X
_
2
,
sunt variabile aleatoare independente, ce urmeaz a legea normal a N (0, 1) si respec-
tiv legea
2
cu n 1 grade de libertate.
4.2. Funct ii de select ie 211
Demonstrat ie. Se consider a matricea ortonormat a
A =
_
_
_
_
_
_
_
_
1

n
1

n
1

n
1

n
. . .
1

n
1

2

1

2
0 0 . . . 0
1

6
1

6

2

6
0 . . . 0
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1

n(n1)
1

n(n1)
1

n(n1)
1

n(n1)
. . .
n1

n(n1)
_
_
_
_
_
_
_
_
pentru care se aplic a Lema 4.2.23.
Pe de o parte avem c a
Y
1
=
n

k=1
a
1k
X
k
=
1

n
n

k=1
X
k
= U
n
si
Y
2
2
+ +Y
2
n
=
_
Y
2
1
+Y
2
2
+ +Y
2
n
_
Y
2
1
=
_
X
2
1
+ +X
2
n
_
U
2
n
=
n

k=1
_
X
k


X
_
2
= V
n
.
Deoarece Y
1
, Y
2
, . . . , Y
n
sunt independente rezult a c a U
n
si V
n
sunt independente.
Pe de alt a parte U
n
= Y
1
urmeaz a legea normal a N (0, 1), iar V
n
ind suma
p atratelor a n 1 variabile aleatoare independente, ecare urm and legea normal a
N (0, 1), obt inem c a V
n
urmeaz a legea
2
cu n 1 grade de libertate (a se vedea
legea
2
prezentat a n Capitolul 2).
Proprietatea 4.2.25. Fie caracteristica X, ce urmeaz a legea normal a N (m, )
si variabilele de select ie X
1
, X
2
, . . . , X
n
, ce corespund unei select ii repetate de
volum n, atunci statisticile
U
n
=

X m

n
, V
n
=
1

2
n

k=1
_
X
k


X
_
2
,
sunt variabile aleatoare independente, ce urmeaz a respectiv legea normal a N (0, 1)
si legea
2
cu n 1 grade de libertate.
Demonstrat ie. Se consider a variabilele aleatoare
Z
k
=
X
k
m

, k = 1, n,
212 Teoria select iei
care sunt variabile aleatoare independente ce urmeaz a ecare legea normal a N (0, 1).
Prin aplicarea Propriet at ii 4.2.24 pentru variabilele aleatoare Z
k
, k = 1, n, se obt ine
armat ia f acut a.

Intr-adev ar avem c a
1

n
n

k=1
Z
k
=
1

n
n

k=1
X
k
m

= U
n
si
n

k=1
_
Z
k


Z
_
2
=
n

k=1
_
X
k
m


1
n
n

i=1
X
i
m

_
2
=
1

2
n

k=1
_
X
k

1
n
n

i=1
X
i
_
2
=
1

2
n

k=1
_
X
k


X
_
2
= V
n
.
Proprietatea 4.2.26. Fie caracteristica X, ce urmeaz a legea normal a N (m, )
si variabilele de select ie X
1
, X
2
, . . . , X
n
, ce corespund unei select ii repetate de
volum n, atunci statistica
(4.2.4) T =

X m

n
=

X m
_

2
n1
,
urmeaz a legea Student cu n 1 grade de libertate.
Demonstrat ie. Cu notat iile de la Proprietatea 4.2.25, ar at am c a
T =
U
n
_
Vn
n1

Intr-adev ar, avem succesiv


U
n
_
Vn
n1
=

X m

n 1
1

n
k=1
_
X
k


X
_
2
=

X m
_
1
n1

n
k=1
(X
k

X)
2

n
=

X m

n
=T.
Din teoria probabilit at ilor se stie c a raportul dintre o variabil a aleatoare, ce urmeaz a
legea normal a N (0, 1) si radicalul unei variabile aleatoare ce urmeaz a legea
2
, ra-
portat a la num arul gradelor de libertate, n cazul n care cele dou a variabile aleatoare
sunt independente, este o variabil a aleatoare, ce urmeaz a legea Student cu acelasi
num ar al gradelor de libertate ca legea
2
considerat a (a se vedea legile
2
si t prezen-
tate n Capitolul 2). Av and n vedere cine sunt U
n
si V
n
rezult a armat ia din enunt ul
propriet at ii.
4.2. Funct ii de select ie 213
Programul 4.2.27. Pentru ilustrarea acestui rezultat, programul Matlab, care urmea-
z a, genereaz a o matrice de tipul (n,m) de numere aleatoare, ce urmeaz a legea nor-
mal a N (, ), dup a care pentru ecare coloan a a matricei generate, se construiesc
datele aleatoare conform statisticii (4.2.4). Pentru aceste date se reprezint a grac his-
tograma corespunz atoare, mpreun a cu densitatea de probabilitate a legii Student cu
n-1 grade de libertate.
clear,clf, mu=input(mu=); sigma=input(s=);
n=input(n=); m=input(m=);
Z=normrnd(mu,sigma,n,m);
t=(mean(Z)-mu)./sqrt(var(Z)/n);
x=-3:0.01:3; f=tpdf(x,n-1);
nn=fix(1+10/3
*
log10(m));
[fr,clasa]=hist(t,nn);
h=clasa(2)-clasa(1);
bar(clasa,fr/(h
*
m),1)
hold on, plot(x,f,k-)
colormap([.7,.7,.7])
Pentru n=15, m=100, mu=5 si sigma=2, se obt in gracele din Figura 4.3.
3 2 1 0 1 2 3 4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Figura 4.3: Legea T (14)
Proprietatea 4.2.28. Fie caracteristicile independente X

si X

, ecare urm and


legea normal a, respectiv N (m

, ) si N (m

, ) si variabilele de select ie
X

1
, . . . , X

, respectiv X

1
, . . . , X

, ce corespund unei select ii repetate de volum n

pentru caracteristica X

si unei select ii repetate de volum n

pentru caracteristica
214 Teoria select iei
X

, atunci statistica
(4.2.5) T =
_

X

_
(m

)
_
(n

1)

2
+ (n

1)

+n

2
1
n

+
1
n

,
unde

=
1
n

k=1
X

k
,

X

=
1
n

k=1
X

k
,

2
=
1
n

1
n

k=1
_
X

k


X

_
2
,

2
=
1
n

1
n

k=1
_
X

k


X

_
2
,
urmeaz a legea Student cu n

+n

2 grade de libertate.
Demonstrat ie. Conform Observat iei 4.2.6, avem c a mediile de select ie

X

si

X

urmeaz a ecare legea normal a respectiv N


_
m

_
si N
_
m

_
. Prin urmare
statistica
U =
_

X

_
(m

_
1
n

+
1
n

,
urmeaz a legea normal a N (0, 1).
Pe de alt a parte, folosind Proprietatea 4.2.25, se obt ine c a statistica
V =
1

2
n

k=1
_
X

k


X

_
2
+
1

2
n

k=1
_
X

k


X

_
2
,
urmeaz a legea
2
cu n

+ n

2 grade de libertate, ind suma a dou a variabile


aleatoare independente, ce urmeaz a legea
2
cu n

1 grade de libertate si respectiv


n

1 grade de libertate.
Ca si la demonstrat ia Propriet at ii 4.2.26, statistica U
__
V
n

+n

2
urmeaz a legea
Student cu n

+ n

2 grade de libertate. Mai r am ane de ar atat c a aceast a statistic a


este chiar statistica T.

Intr-adev ar, avem succesiv
U
_
V
n

+n

2
=
_

X

_
(m

_
1
n

+
1
n

+n

2
1

k=1
_
X

k


X

_
2
+

k=1
_
X

k


X

_
2
4.2. Funct ii de select ie 215
=
_

X

_
(m

)
_
(n

1)

2
+ (n

1)

+n

2
1
n

+
1
n

= T,
ceea ce trebuie demonstrat.
Observatia 4.2.29. Dac a se consider a caracteristicile independente X

si X

, ecare
urm and legea normal a N (m

) si respectiv N (m

) si dac a avem variabilele


de select ie X

1
, X

2
, . . . , X

, ce corespund unei select ii repetate de volum n

relativ a
la caracteristica X

si variabilele de select ie X

1
, X

2
, . . . , X

, ce corespund unei
select ii repetate de volum n

relativ a la caracteristica X

, atunci statistica
Z =
_

X

_
(m

)
_

2
n

2
n

,
urmeaz a legea normal a N (0, 1).
Proprietatea 4.2.30. Fie caracteristicile independente X

si X

, ecare urm and


legea normal a, respectiv N (m

) si N (m

) si variabilele de select ie
X

1
, . . . , X

, respectiv X

1
, . . . , X

, ce corespund unei select ii repetate de volum n

pentru caracteristica X

si unei select ii repetate de volum n

pentru caracteristica
X

, atunci statistica
(4.2.6) F =

2
_

2
urmeaz a legea FisherSnedecor cu m = n

1 si n = n

1 grade de libertate.
Demonstrat ie. Din Proprietatea 4.2.25, avem c a funct iile de select ie
V

=
_
n

1
_

2
, V

=
_
n

1
_

2
urmeaz a ecare legea
2
cu m = n

1 si n = n

1 grade de libertate.
Pe de alt a parte, deoarece X

si X

sunt independente, V

si V

sunt indepen-
dente. Din calculul probabilit at ilor (a se vedea legea f prezentat a n Capitolul 2) este
cunoscut c a raportul a dou a variabile aleatoare independente, ce urmeaz a legea
2
,
raportate ecare la num arul gradelor de libertate corespunz ator, este o variabil a ale-
atoare, ce urmeaz a legea FisherSnedecor cu num arul gradelor de libertate date de
numerele gradelor de libertate ale celor dou a legi
2
. Asadar avem c a
F =

2
_

2
=
V

1
_
V

1
urmeaz a legea FisherSnedecor cu m = n

1 si n = n

1 grade de libertate.
216 Teoria select iei
Observatia 4.2.31. Dac a F urmeaz a legea FisherSnedecor cu m si n grade de li-
bertate, atunci
1
F
urmeaz a legea FisherSnedecor cu n si m grade de libertate. Prin
urmare, dac a not am cu f
m,n;1
cuantila de ordin 1 a lui F, adic a, num arul pen-
tru care are loc P (F f
m,n;1
) = 1 , atunci avem c a
1
fn,m;
= f
m,n;1
, unde
f
n,m;
este cuantila de ordin a lui
1
F
.

Intr-adev ar avem c a relat ia care deneste
pe f
n,m;
, P
_
1
F
f
n,m;
_
= , este echivalent a cu P
_
F
1
fn,m;
_
= sau cu
relat ia P
_
F
1
fn,m;
_
= 1 . Compar and ultima relat ie cu relat ia care deneste
cuantila f
m,n;1
, se obt ine relat ia dintre cele dou a cuantile mai sus precizat a.
Programul 4.2.32. Pentru ilustrarea Propriet at ilor 4.2.28 si 4.2.30, vom genera dou a
matrice de tipurile (n1,m) si (n2,m), ale c aror elemente sunt numere aleatoare, ce
urmeaz a respectiv legile normale N (
1
,
1
) si N (
2
,
2
). Folosind cele dou a ma-
trice se vor determina, pentru ecare pereche de coloane cu acelasi num ar de ordine,
din cele dou a matrice, datele construite conform denit iilor statisticilor (4.2.5) si
(4.2.6). Datele astfel obt inute se reprezint a grac folosind histogramele corespunz a-
toare, mpreun a cu densitatea legii Student cu n1+n2-2 grade de libertate, respectiv
a legii FisherSnedecor cu n1-1 si n2-1 grade de libertate.
clear,clf
mu1=input(mu1=); s1=input(sigma1=);
mu2=input(mu2=); s2=input(sigma2=);
n1=input(n1=); n2=input(n2=); m=input(m=);
X1=normrnd(mu1,s1,n1,m); X2=normrnd(mu2,s2,n2,m);
t=(mean(X1)-mean(X2)-mu1+mu2);
t=t./sqrt((n1-1)
*
var(X1)+(n2-1)
*
var(X2));
t=t
*
sqrt((n1+n2-2)/(1/n1+1/n2));
f=(var(X1)/s12)./(var(X2)/s22);
x1=-3:0.01:3; x2=0:0.01:6;
f1=tpdf(x1,n1+n2-2); f2=fpdf(x2,n1-1,n2-1);
nn=fix(1+10/3
*
log10(m));
[fr1,c1]=hist(t,nn); [fr2,c2]=hist(f,nn);
h1=c1(2)-c1(1); h2=c2(2)-c2(1);
subplot(1,2,1)
bar(c1,fr1/(m
*
h1),1), hold on, plot(x1,f1,k-)
hold off
subplot(1,2,2)
bar(c2,fr2/(m
*
h2),1), hold on, plot(x2,f2,k-)
colormap([.7,.7,.7])
Pentru n1=15, n2=20, m=50, mu1=5, mu2=10, sigma1=2 si sigma2=3, se
obt in gracele din Figura 4.4.
4.2.4 Functie de repartitie de selectie
Denitia 4.2.33. Fie caracteristica X cercetat a, datele de select ie x
1
, x
2
, . . . , x
n
si variabilele de select ie X
1
, X
2
, . . . , X
n
. Numim funct ie de repartit ie de select ie,
4.2. Funct ii de select ie 217
4 2 0 2 4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0 2 4 6
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Figura 4.4: Legea T (33) si legea F (14, 19)
funct ia de select ie denit a prin

F
n
(x) =

n
(x)
n
, x R,
unde

n
(x) = card{ X
i
| X
i
x, i = 1, n},
iar

F
n
(x) =
card{ x
i
| x
i
x, i = 1, n }
n
, x R,
se numeste valoarea funct iei de repartit ie de select ie.
Observatia 4.2.34. Valoarea funct iei de repartit ie select ie este o funct ie n scar a de
o variabil a real a. Dac a datele de select ie sunt ordonate cresc ator, atunci

F
n
(x) =
_

_
0, dac a x < x
1
,
k
n
, dac a x
k1
x < x
k
, k = 1, n,
1, dac a x x
n
.
De asemenea, funct ia de repartit ie de select ie, se vede c a este o variabil a aleatoare
de tip discret si care are distribut ia

F
n
(x)
_
_
k
n
_
n
k
_
(F (x))
k
(1 F (x))
nk
_
_
k=0,n

218 Teoria select iei


Pentru demonstrat ia unui rezultat fundamental al statisticii matematicii, de-
scoperit de matematicianul rus Glivenko, vom prezenta dou a leme.
Lema 4.2.35. Fie sirul de evenimente (A
n
)
n1
astfel nc at P (A
n
) = 1, n 1,
atunci, pentru evenimentul A =

n=1
A
n
, avem P (A) = 1.
Demonstrat ie. Ar at am la nceput c a proprietatea enunt at a are loc pentru un num ar
nit m de evenimente. Demonstrat ia o facem prin induct ie dup a m.
Pentru m = 2, avem P (A
1
A
2
) P (A
1
) = 1, de unde P (A
1
A
2
) = 1,
care nlocuit a n relat ia
P (A
1
A
2
) = P (A
1
) +P (A
2
) P (A
1
A
2
) ,
conduce la P (A
1
A
2
) = 1.
Presupunem c a proprietatea are loc pentru msi ar at am c a este adev arat a si pentru
m + 1. Din nou avem c a P
_

m+1
n=1
A
n
_
P (A
m+1
) =1, deci P
_

m+1
n=1
A
n
_
=1.
Scriem formula lui Poincar e si t inem seama de ipoteza induct iei, ceea ce conduce la
1 = P
_
m+1
_
n=1
A
n
_
=
m+1

i=1
P(A
i
)
m+1

i,j=1
i<j
P(A
i
A
j
) + + (1)
m
P
_
m+1

n=1
A
n
_
=
_
m+ 1
1
_

_
m+ 1
2
_
+ + (1)
m1
_
m+ 1
m
_
+ (1)
m
P
_
m+1

n=1
A
n
_
.
Ret inem extremit at ile si vom obt ine
(1)
m
P
_
m+1

n=1
A
n
_
=
_
m+ 1
0
_

_
m+ 1
1
_
+
_
m+ 1
2
_
+(1)
m
_
m+ 1
m
_
sau
(1)
m
P
_
m+1

n=1
A
n
_
= (1 1)
m+1
(1)
m+1
_
m+ 1
m+ 1
_
,
adic a P
_

m+1
n=1
A
n
_
= 1.
C and sirul de evenimente este innit, avem n vedere scrierea lui Aca urm atoarea
intersect ie de evenimente
A = A
1
(A
1
A
2
) (A
1
A
2
A
3
)
unde evenimentele intersect iei satisfac relat iile
A
1
(A
1
A
2
) (A
1
A
2
A
3
)
4.2. Funct ii de select ie 219
Conform teoremei de continuitate din teoria probabilit at ilor si av and n vedere prima
parte a demonstrat iei putem ncheia prin P(A) = lim
m
P
_

m
n=1
A
n
_
= 1.
Din calculul probabilit at ilor este cunoscut a forma tare a teoremei lui Bernoulli
sau teorema lui Borel si care o d am sub forma unei leme.
Lema 4.2.36. Se consider a n repet ari independente ale unui experiment. La ecare
repetare evenimentul Aapare cu probabilitatea p. Fie k frecvent a absolut a a aparit iei
evenimentului An cele n repet ari, atunci
P
_
lim
n

k
n
p

= 0
_
= 1,
adic a frecvent a relativ a a aparit iei evenimentului A converge tare (aproape sigur) la
probabilitatea p de aparit ie a evenimentului A.
Teorema 4.2.37 (Glivenko). Fie caracteristica X care are funct ia de repartit ie teo-
retic a F si e o select ie repetat a de volum n relativ a la caracteristica X cu vari-
abilele de select ie X
1
, X
2
, . . . , X
n
si funct ia de repartit ie de select ie

F
n
corespunz a-
toare, atunci
P
_
lim
n
sup
xR


F
n
(x) F(x)

= 0
_
= 1,
adic a funct ia de repartit ie de select ie converge aproape sigur la funct ia de repartit ie
teoretic a.
Demonstrat ie. Se consider a r N oarecare, dar xat, si consider am numerele x
r,k
,
k = 0, r, denite prin relat ia
x
r,k
= inf
_
x R| F(x)
k
r
F(x + 0)
_
.
Geometric, punctul x
r,k
se obt ine dup a cum este ar atat n Figura 4.5 si reprezint a
cuantila de ordin
k
r

Dac a se consider a evenimentul B
r,k
= (X x
r,k
), atunci avem
P (B
r,k
) = P (X x
r,k
) = F (x
r,k
)
si

F
n
(x
r,k
) =

n
(x
r,k
)
n
=
card{ X
i
| X
i
x
r,k
, i = 1, n }
n

Prin urmare

F
n
(x
r,k
) este frecvent a relativ a a aparit iei evenimentului B
r,k
si conform
Lemei 4.2.36 rezult a c a
P
_
lim
n


F
n
(x
r,k
) F (x
r,k
)

= 0
_
= 1,
220 Teoria select iei
0
1
x
r,k
y=k/r
0
1
x
r,k
y=k/r
0
1
x
r,k
y=k/r
Figura 4.5: Determinarea cuantilei x
r,k
pentru ecare k = 1, r. Se poate renunt a la valoarea k = 0, deoarece x
r,0
= si

F
n
() = F() = 0.
Not am prin A
r,k
evenimentul


F
n
(x
r,k
) F (x
r,k
)

0, c and n .
Deoarece P (A
r,k
) = 1, k = 1, r, conform Lemei 4.2.35, rezult a c a
P (A
r
) = P
_
r

k=1
A
r,k
_
= 1,
unde evenimentul A
r
nseamn a
max
k=1,r


F
n
(x
r,k
) F (x
r,k
)

0, c and n .

In mod analog, consider and evenimentul C


r,j
= (X < x
r,j
), se obt ine c a
P
_
lim
n


F
n
(x
r,j
0) F (x
r,j
0)

= 0
_
= 1,
4.2. Funct ii de select ie 221
pentru ecare j = 1, r. Dac a se noteaz a prin D
r,j
evenimentul


F
n
(x
r,j
0) F (x
r,j
0)

0, c and n .
si D
r
=

r
j=1
D
r,j
, care nseamn a
max
j=1,r


F
n
(x
r,j
0) F (x
r,j
0)

0, c and n ,
atunci P(D
r
) = 1.
Dac a se consider a evenimentul E
r
= A
r
D
r
, care nseamn a
max
k,j=1,r
_


F
n
(x
r,k
) F (x
r,k
)


F
n
(x
r,j
0) F (x
r,j
0)

_
0,
atunci P(E
r
) = 1.

In acest fel, dac a E =

n=1
E
r
, conform Lemei 4.2.35, avem
P(E) = 1, adic a
P
_
sup
rN
max
k,j=1,r
_


F
n
(x
r,k
) F(x
r,k
)


F
n
(x
r,j
0) F(x
r,j
0)

_
0
_
= 1.
Ar at am n continuare implicat ia
E
_
lim
n
sup
xR


F
n
(x) F (x)

= 0
_
,
din care se va obt ine
1 = P (E) P
_
lim
n
sup
xR


F
n
(x) F (x)

= 0
_
1,
deci
P
_
lim
n
sup
xR


F
n
(x) F (x)

= 0
_
= 1.
Pentru aceasta s a consider am x R oarecare. Pentru orice r N va exista
k N astfel nc at x
r,k
< x x
r,k+1
. Av and n vedere c a

F
n
si F sunt funct ii
nedescresc atoare, putem s a scriem urm atoarele inegalit at i:

F
n
(x
r,k
)

F
n
(x)

F
n
(x
r,k+1
0)
si
F (x
r,k
) F(x) F (x
r,k+1
0) ,
de unde se obt ine

F
n
(x
r,k
) F (x
r,k+1
0)

F
n
(x) F (x)

F
n
(x
r,k+1
0) F (x
r,k
) .
222 Teoria select iei
Pe de alt a parte, din modul de denire a numerelor x
r,k
, k = 0, r, avem c a
0 F (x
r,k+1
0) F (x
r,k
)
1
r
,
de unde
F (x
r,k
) F (x
r,k+1
0)
1
r
si F (x
r,k+1
0) F (x
r,k
) +
1
r

Utilizate n dubla inegalitate de mai nainte, conduc la

F
n
(x
r,k
) F (x
r,k
)
1
r


F
n
(x) F(x)

F
n
(x
r,k+1
0) F (x
r,k+1
0) +
1
r

Din prima inegalitate se obt ine


F(x)

F
n
(x) F (x
r,k
)

F
n
(x
r,k
) +
1
r
,
de unde


F
n
(x) F(x)


F
n
(x
r,k
) F (x
r,k
)

+
1
r
max
j=1,r
_

F
n
(x
r,j
) F (x
r,j
)

_
+
1
r

Din a doua inegalitate se obt ine


F
n
(x) F(x)


F
n
(x
r,k+1
0) F (x
r,k+1
0)

+
1
r
max
k=1,r
_

F
n
(x
r,k
0) F (x
r,k
0)

_
+
1
r

Folosind cele dou a inegalit at i obt inute rezult a c a


F
n
(x) F (x)

M
n,r
, unde
M
n,r
= max
k,j=1,r
_

F
n
(x
r,k
) F (x
r,k
)


F
n
(x
r,j
0) F (x
r,j
0)

_
+
1
r
,
de unde


F
n
(x) F (x)

sup
rN
M
n,r
, pentru orice x R.

In nal avem c a sup


xR


F
n
(x) F (x)

sup
rN
M
n,r
, care conduce la
implicat ia care trebuia demonstrat a.
Teorema 4.2.38 (Kolmogorov). Fie caracteristica X care are funct ia de repartit ie
teoretic a F continu a si e o select ie repetat a de volum n relativ a la caracteristica X
4.2. Funct ii de select ie 223
cu variabilele de select ie X
1
, X
2
, . . . , X
n
si corespunz ator funct ia de repartit ie de
select ie

F
n
, atunci
lim
n
P
_
nD
n
x
_
= K (x) , x > 0,
unde
D
n
= sup
xR


F
n
(x) F (x)

, iar K (x) =
+

k=
(1)
k
e
2k
2
x
2
, x > 0,
este funct ia lui Kolmogorov.
Observatia 4.2.39. Teorema lui Kolmogorov reprezint a comportarea asimptotic a
a distant ei dintre funct ia de repartit ie de select ie si funct ia de repartit ie teoretic a.
Demonstrat ia poate g asit a n [56].
Observatia 4.2.40. Funct ia lui Kolmogorov este tabelat a, pentru anumite valori, n
Anexa V.
Observatia 4.2.41. Pentru calculul valorilor aproximative ale funct iei lui Kol-
mogorov se pot utiliza urm atoarele formule de aproximare
K(x)
_

_
0, dac a x 0.27

2
x
3

i=1
e
(2i1)
2

2
/(8x
2
)
, dac a 0.27 < x < 1,
1 2
4

i=1
(1)
i1
e
2i
2
x
2
, dac a 1 x < 3.1,
1, dac a x 3.1.
4.2.5 Functia cdfplot
Statistics toobox dispune de funct ia cdfplot, care reprezint a grac funct ia de
repartit ie de select ie. Apelul funct iei se poate face prin:
cdfplot(x)
h=cdfplot(x)
[h,stats]=cdfplot(x)
Prima form a reprezint a grac funct ia de repartit ie de select ie corespunz atoare datelor
cont inute de vectorul x, caracteristici cum ar culoarea, tipul liniei etc. sunt consi-
derate implicit de sistemul Matlab. Pentru modicarea unor astfel de caracteristici,
adic a alegerea acestora de c atre utilizator, se recomand a a doua form a, prin care pa-
rametrul h poate folosit n comanda set.
224 Teoria select iei
Parametrul stats cont ine, dup a executarea funct iei, o parte din parametrii stat-
sitici pentru x. Acestia sunt: valoarea minim a (stats.min), valoarea maxim a
(stats.max), valoarea mediei de select ie (stats.mean), valoarea medianei
(stats.median) si abaterea standard (stats.std).
Functia 4.2.42. Funct ia Matlab care urmeaz a genereaz a n numere aleatoare, care
urmeaz a o lege de probabilitate precizat a, dup a care reprezint a grac, pe aceeasi
gur a, funct ia de repartit ie teoretic a prin linie-punct, mpreun a cu funct ia de repartit ie
de select ie.
function compar(n,lege)
% Functie de repartitie de selectie
% lege - legea de probabilitate
% n - volumul datelor
clf
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,1); [med,var]=unidstat(N);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,N);
case bino
m=input(n=); p=input(p=);
X=binornd(m,p,n,1); [med,var]=binostat(m,p);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,m,p);
case hyge
M=input(M=); K=input(K=); m=input(n=);
X=hygernd(M,K,m,n,1); [med,var]=hygestat(M,K,m);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,M,K,m);
case poiss
la=input(lambda=);
X=poissrnd(la,n,1); [med,var]=poisstat(la);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,1); [med,var]=nbinstat(r,p);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,r,p);
case geo
p=input(p=);
X=geornd(p,n,1); [med,var]=geostat(p);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,1); [med,var]=unifstat(a,b);
4.2. Funct ii de select ie 225
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,a,b);
case norm
mu=input(mu=); s=input(sigma=);
X=normrnd(mu,s,n,1); [med,var]=normstat(mu,s);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,mu,s);
case logn
mu=input(mu=); s=input(sigma=);
X=lognrnd(mu,s,n,1); [med,var]=lognstat(mu,s);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,mu,s);
case gam
a=input(a=); b=input(b=);
X=gamrnd(a,b,n,1); [med,var]=gamstat(a,b);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,a,b);
case exp
mu=input(mu=);
X=exprnd(mu,n,1); [med,var]=expstat(mu);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,mu);
case beta
a=input(a=); b=input(b=);
X=betarnd(a,b,n,1); [med,var]=betastat(a,b);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,a,b);
case weib
a=input(a=); b=input(b=);
X=weibrnd(a,b,n,1); [med,var]=weibstat(a,b);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,a,b);
case rayl
b=input(b=);
X=raylrnd(b,n,1); [med,var]=raylstat(b);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,b);
case t
m=input(n=);
X=trnd(m,n,1); [med,var]=tstat(m);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,m);
case chi2
m=input(n=);
X=chi2rnd(m,n,1); [med,var]=chi2stat(m);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,m);
case f
m1=input(m=); m2=input(n=);
226 Teoria select iei
X=frnd(m1,m2,n,1); [med,var]=fstat(m1,m2);
x=med-3
*
sqrt(var):0.01:med+3
*
sqrt(var);
f=cdf(lege,x,m1,m2);
otherwise
error(Lege necunoscuta)
end
plot(x,f,k-.), hold on, cdfplot(X), grid off
title(Functia de repartitie de selectie)
Apelul funct iei compar se face prin
>>compar(n,lege)
unde valorile pentru n si lege, e c a sunt precizate n acest apel, e sunt precizate
nainte. De exemplu, comanda
>>compar(25,bino)
are ca efect apelul funct iei pentru legea binomial a, iar pe ecran se va cere introducerea
parametrilor n si p, dup a care pe ecran va reprezentat gracul din Figura 4.6, n
cazul n care n=7 si p=0.4.
2 1 0 1 2 3 4 5 6 7
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x
F
(
x
)
Functia de repartitie de selectie
Figura 4.6: Legea B(7, 0.4)
Comanda
>>compar(15,norm)
are ca efect apelul funct iei pentru legea normal a, iar pe ecran se va cere introdu-
cerea parametrilor mu si sigma, dup a care pe ecran va reprezentat gracul din
Figura 4.7, n cazul n care mu=5 si sigma=2.
4.2. Funct ii de select ie 227
2 0 2 4 6 8 10 12
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x
F
(
x
)
Functia de repartitie de selectie
Figura 4.7: Legea N (5, 2)
228 Teoria select iei
Capitolul 5
Teoria estimatiei
Relativ la colectivitatea C este cercetat a caracteristica X, care urmeaz a legea de pro-
babilitate dat a prin funct ia de probabilitate f (x; ), ce reprezint a funct ia de frecvent a
dac a X este de tip discret, respectiv densitatea de probabilitate n cazul continuu, iar
este un parametru real necunoscut. Se consider a o select ie repetat a de volum n
av and corespunz ator variabilele de select ie X
1
, X
2
, . . . , X
n
.
5.1 Functie de verosimilitate
Denitia 5.1.1. Numim funct ie de verosimilitate, funct ia de select ie
g (X
1
, X
2
, . . . , X
n
; ) =
n

k=1
f (X
k
; ) .
Observatia 5.1.2. Dac a se consider a funct ia de n variabile reale
g (x
1
, x
2
, . . . , x
n
; ) =
n

k=1
f (x
k
; ) ,
aceasta reprezint a funct ia frecvent a (n cazul discret), respectiv densitatea de proba-
bilitate (n cazul continuu) a vectorului aleator (X
1
, X
2
, . . . , X
n
).
Denitia 5.1.3. Statistica S = S (X
1
, X
2
, . . . , X
n
) este statistic a sucient a (exhaus-
tiv a) pentru parametrul , dac a exist a funct ia m asurabil a : R
n
R nenegativ a si
funct ia m asurabil a h

: R R nenegativ a, astfel nc at
g (x
1
, x
2
, . . . , x
n
; ) = (x
1
, x
2
, . . . , x
n
) h

(s) = (x
1
, x
2
, . . . , x
n
) h(s; ) ,
unde s = S (x
1
, x
2
, . . . , x
n
).
229
230 Teoria estimat iei
Observatia 5.1.4. Echivalent a cu condit ia precedent a pentru sucient a statisticii S
este condit ia ca funct ia de frecvent a (n cazul discret), respectiv densitatea de pro-
babilitate (n cazul continuu) f (x
1
, . . . , x
n
; | s) a vectorului aleator (X
1
, . . . , X
n
)
condit ionat a de evenimentul S (X
1
, . . . , X
n
) = s, s a nu depind a de parametrul .
Exemplul 5.1.5. Fie caracteristica X ce urmeaz a legea lui Poisson cu parametrul
> 0 necunoscut, adic a are funct ia de frecvent a
f (x; ) =

x
x!
e

, x = 0, 1, 2, . . . .
Consider am statistica S =
n

k=1
X
k
. Deoarece variabilele aleatoare X
1
, X
2
, . . . , X
n
sunt independente si identic repartizate cu X avem c a S urmeaz a legea lui Poisson
de parametru n, adic a
P(S = s) =
(n)
s
s!
e
n
, s = 0, 1, 2, . . .
Pe de o parte avem:
g (x
1
, x
2
, . . . , x
n
; ) =
n

k=1
f (x
k
; ) =
n

k=1
_

x
k
x
k
!
e

_
=

n
k=1
x
k

n
k=1
x
k
!
e
n
=

s
x
1
!x
2
! . . . x
n
!
e
n
.
Se poate considera
(x
1
, x
2
, . . . , x
n
) =
1
x
1
!x
2
! . . . x
n
!
, h(s; ) =
s
e
n
.
Av and n vedere c a putem scrie si
g (x
1
, x
2
, . . . , x
n
; ) =
(n)
s
s!
e
n

s!
n
s
x
1
!x
2
!. . .x
n
!
,
se poate considera de asemenea
(x
1
, x
2
, . . . , x
n
) =
s!
n
s
x
1
!x
2
! . . . x
n
!
, h(s; ) =
(n)
s
s!
e
n
.
Prin urmare, unicitatea acestei scrieri nu se impune.
Pe de alt a parte, av and n vedere c a S urmeaz a legea P (n), avem succesiv
f (x
1
, x
2
, . . . , x
n
; | s) =P (X
1
= x
1
, X
2
= x
2
, . . . , X
n
= x
n
| S = s)
5.1. Funct ie de verosimilitate 231
=
P (X
1
= x
1
, X
2
= x
2
, . . . , X
n
= x
n
, S = s)
P (S = s)
=
P
_
X
1
= x
1
, . . . , X
n1
= x
n1
, X
n
= s

n1
k=1
x
k
_
P (S = s)
=
P
_
X
n
= s

n1
k=1
x
k
_

n1
i=1
P (X
i
= x
i
)
P (S = s)
=

n1
k=1
x
k
(s

n1
k=1
x
k)!
e

n1
i=1
_

x
i
x
i
!
e

_
(n)
s
s!
e
n
=
s!
n
s
x
1
!x
2
! . . . x
n
!

Asadar f (x
1
, x
2
, . . . , x
n
; | s) nu depinde de parametrul , dec at prin intermediul
valorii statisticii S.
Exemplul 5.1.6 (Familia exponential a). Se consider a caracteristica X, care are
funct ia de probabilitate de forma
f (x; ) = exp
_
a (x) () +b (x) + ()
_
.
Vom ar ata c a, n acest caz, statistica
S = S (X
1
, X
2
, . . . , X
n
) =
n

k=1
a (X
k
)
este sucient a pentru parametrul .

Intr-adev ar avem c a
g (x
1
, x
2
, . . . , x
n
; ) =
n

k=1
f (x
k
; )
= exp
_
()
n

k=1
a (x
k
) +n () +
n

k=1
b (x
k
)
_
= exp
_
()
n

k=1
a (x
k
) +n ()
_
exp
_
n

k=1
b (x
k
)
_
.
Dac a se consider a
(x
1
, x
2
, . . . , x
n
) = exp
_
n

k=1
b (x
k
)
_
si h(s; ) = exp
_
() s +n ()
_
,
atunci
g (x
1
, x
2
, . . . , x
n
; ) = (x
1
, x
2
, . . . , x
n
) h(s; ) ,
deci condit ia sucient ei este ndeplinit a.
232 Teoria estimat iei
Denitia 5.1.7. Numim cantitate de informat ie (Fisher) a unei select ii de volum n
relativ a la parametrul R necunoscut, valoarea medie
I
n
() = E
__
ln g (X
1
, X
2
, . . . , X
n
; )

_
2
_
,
c and funct ia de verosimilitate este derivabil a n raport cu .
Observatia 5.1.8. Dac a parametrul este pdimensional, matricea
F =
_
Cov
_
ln g (X
1
, . . . , X
n
; )

i
,
ln g (X
1
, . . . , X
n
; )

j
__
i,j=1,p
se numeste matricea informat iei lui Fisher.
Teorema 5.1.9. Dac a domeniul valorilor caracteristicii X nu depinde de parame-
trul , iar funct ia de verosimilitate este derivabil a de dou a ori n raport cu , atunci
I
n
() = E
_

2
ln g (X
1
, X
2
, . . . , X
n
; )

2
_

Demonstrat ie. Se porneste de la relat ia cunoscut a


_
. . .
_
R
n
g (x
1
, x
2
, . . . , x
n
; ) dx
1
dx
2
. . . dx
n
= 1,
pe care o satisface densitatea de probabilitate. Se deriveaz a aceast a relat ie n raport
cu si se t ine seama de faptul c a
g (x
1
, x
2
, . . . , x
n
; )

= g (x
1
, x
2
, . . . , x
n
)
ln g (x
1
, x
2
, . . . , x
n
; )

,
obt in andu-se
_
. . .
_
R
n
ln g (x
1
, x
2
, . . . , x
n
; )

g (x
1
, x
2
, . . . , x
n
; ) dx
1
dx
2
. . . dx
n
= 0.
Deriv and nc a odat a n raport cu rezult a
_
. . .
_
R
n

2
ln g (x
1
, x
2
, . . . , x
n
; )

2
g (x
1
, x
2
, . . . , x
n
; ) dx
1
dx
2
. . . dx
n
+
_
. . .
_
R
n
ln g (x
1
, x
2
, . . . , x
n
; )

g (x
1
, x
2
, . . . , x
n
; )

dx
1
dx
2
. . . dx
n
= 0,
5.1. Funct ie de verosimilitate 233
sau, av and n vedere relat ia de mai nainte, rezult a c a
_
. . .
_
R
n

2
ln g (x
1
, x
2
, . . . , x
n
; )

2
g (x
1
, x
2
, . . . , x
n
; ) dx
1
dx
2
. . . dx
n
+
_
. . .
_
R
n
_
ln g (x
1
, x
2
, . . . , x
n
; )

_
2
g (x
1
, x
2
, . . . , x
n
; ) dx
1
dx
2
. . . dx
n
= 0.
Asadar am obt inut c a
E
_

2
ln g (X
1
, X
2
, . . . , X
n
; )

2
_
+E
__
ln g (X
1
, X
2
, . . . , X
n
; )

_
2
_
= 0,
de unde avem relat ia dorit a.
Observatia 5.1.10.

In demonstrat ia teoremei precedente am considerat cazul unei
caracteristici X de tip continuu.

In mod analog se procedeaz a si n cazul discret,
integrala multipl a este nlocuit a cu o sum a multipl a.
Corolarul 5.1.11. C and domeniul de denit ie al caracteristicii X nu depinde de
parametrul , atunci I
n
() = nI
1
().
Demonstrat ie. Deoarece select ia este repetat a, avem c a

2
ln g (x
1
, x
2
, . . . , x
n
; )

2
=
n

k=1

2
ln f (x
k
; )

2

Folosind Teorema 5.1.9, se obt ine
I
n
() =
n

k=1
E
_

2
ln f (X
k
; )

2
_
=
n

k=1
I
1
() = nI
1
() ,
deoarece
I
1
() = E
_

2
ln f (X; )

2
_

Observatia 5.1.12. Din demonstrat ia Teoremei 5.1.9 avem de asemenea c a


I
n
() = V ar
_
ln g (X
1
, X
2
, . . . , X
n
; )

_
,
deoarece
E
_
ln g (X
1
, X
2
, . . . , X
n
; )

_
= 0.
234 Teoria estimat iei
Exemplul 5.1.13. S a consider am caracteristica X, ce urmeaz a legea normal a
N (, ), unde R este necunoscut, iar > 0 este cunoscut.
Deoarece
f (x; ) =
1

2
e

(x)
2
2
2
, x R,
avem c a
I
1
() = E
__
ln f (X; )

_
2
_
= E
_
(X )
2

4
_
=
1

Prin urmare, cantitatea de informat ie cont inut a (adus a) de o observat ie, relativ la
parametrul , este cu at at mai mare cu c at dispersia este mai mic a.
Teorema 5.1.14. Fie caracteristica X, cu funct ia de probabilitate f (x; ) derivabil a
de dou a ori n raport cu si statistica S = S (X
1
, X
2
, . . . , X
n
) relativ a la caracte-
ristica X, cu funct ia de probabilitate h(s; ), atunci cantitatea de informat ie
I
S
() = E
_

2
ln h(S; )

2
_
,
relativ a la parametrul cont inut a n statistica S nu dep aseste cantitatea de
informat ie I
n
() cont inut a de select ia considerat a, adic a I
S
() I
n
().
Demonstrat ie. Dac a h(s; ) este funct ia de frecvent a (n cazul discret), respectiv
densitatea de probabilitate (n cazul continuu) pentru statistica S, atunci
g (x
1
, x
2
, . . . , x
n
; ) = h(s; ) f (x
1
, x
2
, . . . , x
n
; | s) ,
unde f (x
1
, x
2
, . . . , x
n
; | s) este funct ia de frecvent a (n cazul discret), respectiv
densitatea de probabilitate (n cazul continuu) pentru vectorul aleator (X
1
, . . . , X
n
)
condit ionat a de evenimentul (S = s).
Asadar avem c a
(5.1.1)

2
ln g (x
1
, x
2
, . . . , x
n
; )

2
=

2
ln h(s; )

2
+

2
ln f (x
1
, x
2
, . . . , x
n
; | s)

2
,
deci
I
n
() = I
S
() E
_

2
ln f (X
1
, X
2
, . . . , X
n
; | s)

2
_
I
S
() ,
ceea ce trebuia ar atat.
5.1. Funct ie de verosimilitate 235
Exemplul 5.1.15. Se consider a caracteristica X ce urmeaz a legea normal a N (, )
si o select ie repetat a de volum n. Vom compara informat ia dispersiei de select ie

2
=
1
n 1
n

k=1
_
X
k


X
_
2
,
relativ a la dispersia teoretic a V ar(X) =
2
, cu informat ia select iei relativ a la acelasi
parametru.
Calcul am prima dat a informat ia select iei de volum n relativ a la parametrul notat
cu =
2
= V ar (X). Av and n vedere c a densitatea de probabilitate a caracteristicii
X este
f (x; ) =
1

2
e

(x)
2
2
, x R,
se obt ine
ln f (x; )

=
1
2
+
1
2
2
(x )
2
si

2
ln f (x; )

2
=
1
2
2

1

3
(x )
2
.
Rezult a astfel c a
I
1
_

2
_
= I
1
() =
1
2
4
+
1

4
E
__
X

_
2
_
=
1
2
4
,
deci
I
n
_

2
_
=
n
2
4

Pe de alt a parte, se stie c a statistica

2
=
n 1

2

2
=
1

2
n

k=
_
X
k


X
_
2
urmeaz a legea
2
cu n 1 grade de libertate. Av and n vedere leg atura dintre statis-
ticile
2
si
2
rezult a c a densitatea de probabilitate pentru
2
este dat a prin
h(s; ) =
1
2
n1
2

_
n1
2
_
_
n 1

_n1
2
s
n1
2
1
e

(n1)s
2
, s > 0.
Astfel se obt ine c a
ln h(s; ) = C +
n 1
2
ln
n 1

+
n 3
2
ln s
(n 1)s
2
,
236 Teoria estimat iei
de unde
ln h(s; )

=
n 1
2
+
(n 1)s
2
2
si

2
ln h(s; )

2
=
n 1
2
2

(n 1)s

3

Calcul am acum informat ia dispersiei de select ie relativ a la
2
. Pentru aceasta t inem
seama de faptul c a
E
_

2
_
=

2
n 1
E
_

2
_
=

2
n 1
(n 1) =
2
.
Astfel obt inem:
I

2
_

2
_
=
n 1
2
4
+
n 1

6
E
_

2
_
=
n 1
2
4
+
n 1

4
,
deci
I

2
_

2
_
=
n 1
2
4
<
n
2
4
= I
n
_

2
_
.
Observatia 5.1.16. Deoarece, n cazul unei statistici S suciente, avem c a funct ia
f (x
1
, x
2
, . . . x
n
; | s) nu depinde de rezult a c a I
n
() = I
S
() n acest caz. Acest
lucru se obt ine imediat, dac a se are n vedere relat ia (5.1.1).
5.2 Functii de estimatie
Denitia 5.2.1. Fie caracteristica X cu funct ia de probabilitate f (x; ), parame-
trul A necunoscut si o select ie repetat a de volum n. Numim funct ie de estimat ie
(estimator) pentru parametrul , funct ia de select ie

=

(X
1
, X
2
, . . . , X
n
) ,
care ia valori n domeniul A, iar valoarea numeric a

=

(x
1
, x
2
, . . . , x
n
) se
numeste estimat ia lui .
Denitia 5.2.2. Estimatorul

=

(X
1
, X
2
, . . . , X
n
) este estimator (funct ie de es-
timat ie) nedeplasat pentru parametrul necunoscut , dac a E
_

_
= , iar valoarea
numeric a

=

(x
1
, x
2
, . . . , x
n
) se numeste estimat ie nedeplasat a pentru parame-
trul .
Denitia 5.2.3. Spunem c a estimatorul

=

(X
1
, X
2
, . . . , X
n
) este estimator con-
sistent, pentru parametrul necunoscut , dac a

p
, adic a
lim
n
P
_

<
_
= 1,
pentru orice > 0, iar valoarea numeric a

=

(x
1
, x
2
, . . . , x
n
) se numeste
estimat ie consistent a pentru parametrul .
5.2. Funct ii de estimat ie 237
5.2.1 Functii de estimatie absolut corecte
Denitia 5.2.4. Numim funct ie de estimat ie (estimator) absolut corect a pentru para-
metrul , funct ia de select ie

=

(X
1
, X
2
, . . . , X
n
), care satisface condit iile
(i) E
_

_
= ,
(ii) lim
n
V ar
_

_
= 0,
iar valoarea numeric a

=

(x
1
, x
2
, . . . , x
n
) se numeste estimat ie absolut corect a
pentru parametrul .
Proprietatea 5.2.5. Un estimator absolut corect este un estimator consistent.
Demonstrat ie. Fie estimatorul

=

(X
1
, X
2
, . . . , X
n
), un estimator absolut corect
pentru parametrul . Din inegalitatea lui Cebsev avem
1 P
_

<
_
1
V ar
_

2
,
pentru orice > 0. F ac and pe n , se obt ine
lim
n
P
_

<
_
= 1,
pentru orice > 0, ceea ce trebuie demonstrat.
Exemplul 5.2.6. Fie caracteristica X, ce urmeaz a legea normal a N (, ), unde pa-
rametrul R este cunoscut, iar > 0 este necunoscut. Consider and o select ie
repetat a de volum n, vom determina constanta
n
astfel nc at statistica

S =
n
n

k=1
|X
k
|
s a e estimator absolut corect pentru abaterea standard .
Av and n vedere c a variabilele de select ie X
1
, X
2
, . . . ,X
n
sunt variabile aleatoare
identic repartizate cu X, putem scrie succesiv
(5.2.1)
E
_

S
_
=
n
n

k=1
E(|X
k
|) =
n
n

k=1
E(|X |)
= n
n
E(|X |) .
238 Teoria estimat iei
T inem seama de faptul c a X urmeaz a legea normal a N (, ) si obt inem
E(|X |) =
_
+

|x | f (x; ) dx =
1

2
_
+

|x | e

(x)
2
2
2
dx.
Facem schimbarea de variabil a x = t si t inem seama de faptul c a funct ia obt inut a
este par a, iar intervalul de integrare este simetric fat a de origine:
E(|X |) =
1

2
_
+

|t| e

t
2
2
2
dt =
1

_
2

_
+
0
te

t
2
2
2
dt
=
1

_
2

2
e

t
2
2
2
_

+
0
=
_
2

Din condit ia de nedeplasare si din formula (5.2.1) avem


= E
_

S
_
= n
n

_
2

,
adic a
n
=
1
n
_

2

P an a aici am ar atat c a statistica

S =
1
n
_

2
n

k=1
|X
k
|
este un estimator nedeplasat pentru parametrul .
Deoarece select ia considerat a este repetat a rezult a c a variabilele de select ie sunt
independente, prin urmare se poate scrie
V ar
_

S
_
=

2n
2
n

k=1
V ar (|X
k
|)=

2n
2
n

k=1
V ar (|X|)=

2n
V ar (|X|) .
Astfel este ndeplinit a si condit ia (ii) din Denit ia 5.2.4, anume
V ar
_

S
_
=

2n
V ar (|X |) 0, c and n .
Remarc am c a
V ar (|X |) = E
_
(X )
2
_
[E (|X |)]
2
=
2

2
2

=
2


2
.
Proprietatea 5.2.7. Fie caracteristica X pentru care exist a momentul teoretic de
ordinul 2k,
2k
= E
_
X
2k
_
, si e o select ie repetat a de volum n, atunci momentul de
select ie de ordin k

k
=
1
n
n

i=1
X
k
i
este funct ie de estimat ie absolut corect a pentru parametrul
k
.
5.2. Funct ii de estimat ie 239
Demonstrat ie. Din Proprietatea 4.2.11 avem c a E (
k
) =
k
si de asemenea
lim
n
V ar (
k
) = lim
n

2k

2
k
n
= 0.
Condit iile Denit iei 5.2.4 sunt satisf acute, deci proprietatea este demonstrat a.
Observatia 5.2.8. Media de select ie

X ( =
1
) este funct ie de estimat ie absolut
corect a pentru media teoretic a E (X) ( =
1
).
5.2.2 Functii de estimatie corecte
Denitia 5.2.9. Numim funct ie de estimat ie (estimator) corect a, pentru parametrul
necunoscut , funct ia de select ie

=

(X
1
, X
2
, . . . , X
n
), care satisface condit iile
(i) lim
n
E
_

_
= ,
(ii) lim
n
V ar
_

_
= 0,
iar valoarea numeric a

=

(x
1
, x
2
, . . . , x
n
) se numeste estimat ie corect a pentru
parametrul .
Proprietatea 5.2.10. Un estimator corect este un estimator consistent.
Demonstrat ie. Fie estimatorul

=

(X
1
, X
2
, . . . , X
n
) corect pentru parametrul ,
atunci din condit iile (i) si (ii) avem c a pentru orice > 0 si > 0 exist a num arul
natural N = N (, ) astfel nc at

E
_

<

2
si V ar
_

_
<

2

4
,
pentru n > N. Asadar, putem scrie


E
_

E
_

<


E
_

+

2
,
pentru n > N, de unde dac a


E
_

<

2
, vom avea c a

< , pentru
n > N. Prin urmare avem
_


E
_

<

2
_

<
_
, n > N,
care conduce la inegalitatea
P
_


E
_

<

2
_
P
_

<
_
, n > N.
240 Teoria estimat iei
Pe de alt a parte, folosind inegalitatea lui Cebsev,
P
_


E
_

<

2
_
1
4V ar
_

2

Deoarece V ar
_

_
<

2

4
, pentru n > N, rezult a c a
P
_


E
_

<

2
_
1 , n > N.
Prin urmare se ajunge la
P
_

<
_
P
_


E
_

<

2
_
1 , n > N.
de unde

p
, ceea ce trebuie ar atat.
Proprietatea 5.2.11. Fie caracteristica X pentru care exist a momentul teoretic de
ordin 2k,
2k
= E
_
X
2k
_
, si e o select ie repetat a de volum n, atunci momentul
centrat de select ie de ordin k

k
=
1
n
n

i=1
_
X
i


X
_
k
este funct ie de estimat ie corect a pentru momentul centrat teoretic de ordin k, adic a
pentru
k
= E
_
(X E (X))
k
_
.
Demonstrat ie. Conform Observat iei 4.2.18 avem
lim
n
E (
k
) = lim
n
_

k
+O
_
1
n
__
=
k
.
De asemenea, avem
lim
n
V ar (
k
) = lim
n
_

2k
2k
k1

k+1

2
k
+k
2

2
k1
n
+O
_
1
n
2
__
= 0.
Asadar, condit iile Denit iei 5.2.9 sunt satisf acute.
Observatia 5.2.12. Momentul centrat de select ie de ordinul 2,
2
, este funct ie de
estimat ie corect a pentru dispersia teoretic a V ar (X) (=
2
).
Av and n vedere Observat ia 4.2.17 (formula (4.2.2)) avem c a dispersia de select ie

2
=
1
n 1
n

k=1
_
X
k


X
_
2
este funct ie de estimat ie absolut corect a pentru dispersia teoretic a V ar (X) (=
2
).
5.2. Funct ii de estimat ie 241
5.2.3 Functii de estimatie eciente
Teorema 5.2.13 (Inegalitatea Rao-Cramer). Se consider a caracteristica X av and
funct ia de probabilitate f (x; ), (a, b), pentru care exist a derivata part ial a de
ordinul nt ai n raport cu si e o statistic a

=

(X
1
, . . . , X
n
) absolut corect a
pentru parametrul , atunci
V ar
_

1
I
n
()

Demonstrat ie. Deoarece estimatorul



este nedeplasat, avem c a E
_

_
= , adic a
_
. . .
_
R
n

(x
1
, . . . , x
n
) g (x
1
, . . . , x
n
; ) dx
1
. . . dx
n
= ,
unde g (x
1
, . . . , x
n
; ) =

n
k=1
f (x
k
; ) este funct ia de verosimilitate.
Prin derivarea n raport cu a acestei relat ii se obt ine c a
_
. . .
_
R
n

(x
1
, . . . , x
n
)
n

k=1
f (x
1
; )
f (x
k
; )

f (x
n
; ) dx
1
. . . dx
n
= 1
sau
_
. . .
_
R
n

(x
1
, . . . , x
n
)
_
n

k=1
lnf (x
k
; )

__
n

i=1
f (x
i
; )
_
dx
1
. . . dx
n
= 1.
Pe de alt a parte, deoarece
_
R
lnf (x; )

f (x; ) dx = 0,
avem

k=1
_
. . .
_
R
n
lnf (x
k
; )

_
n

i=1
f (x
i
; )
_
dx
1
. . . dx
n
= 0,
care sc azut a din egalitatea obt inut a nainte conduce la
_
. . .
_
R
n
_

(x
1
, . . . , x
n
)
__
n

k=1
lnf (x
k
; )

_
g (x
1
, . . . , x
n
; ) dx
1
. . . dx
n
=1,
adic a
E
__

(X
1
, . . . , X
n
)
__
n

k=1
lnf (X
k
; )

__
= 1.
242 Teoria estimat iei
Se aplic a acum inegalitatea lui Schwarz si se obt ine
1 =
_
E
__

(X
1
, . . . , X
n
)
__
n

k=1
lnf (X
k
; )

___
2
E
__

(X
1
, . . . , X
n
)
_
2
_
E
__
n

k=1
lnf (X
k
; )

_
2
_
=V ar
_

_
V ar
_
n

k=1
lnf (X
k
; )

_
= V ar
_

_
nV ar
_
lnf (X; )

_
,
adic a
V ar
_

1
nV ar
_
ln f(X;)

_
Dar avem c a
I
n
() = nI
1
() = nE
__
lnf (X; )

_
2
_
= nV ar
_
lnf (X; )

_
,
care nlocuit a n inegalitatea dinainte conduce la inegalitatea RaoCramer.
Denitia 5.2.14. Se numeste ecient a a unei funct ii de estimat ie absolut corecte,

=

(X
1
, X
2
, . . . , X
n
), pentru parametrul , raportul
e
_

_
=
I
1
n
()
V ar
_

_
Denitia 5.2.15. Spunem c a funct ia de estimat ie absolut corect a pentru parame-
trul ,

=

(X
1
, X
2
, . . . , X
n
), este ecient a dac a inegalitatea RaoCramer este
vericat a prin egalitate, adic a e
_

_
= 1.
Exemplul 5.2.16. Se consider a caracteristica X ce urmeaz a legea normal a N (, )
si o select ie repetat a de volum n relativ a la aceast a caracteristic a. Vrem s a deter-
min am ecient a estimatorului lui =
_
V ar (X), construit n Exemplul 5.2.6, dat
prin

S =
1
n
_

2
n

i=1
| X
i
| .
S tim c a E
_

S
_
= si V ar
_

S
_
=
2
2n

2
, deci

S este estimator absolut corect pentru .
5.2. Funct ii de estimat ie 243
Pe de alt a parte avem
f (x; ) =
1

2
e

(x)
2
2
2
,
de unde

2
ln f (x; )

2
=
1

2

3

4
(x )
2
.
Se calculeaz a usor
I
n
() = nI
1
() = nE
_
1

2

3 (X )
2

4
_
=
2n

2

Avem astfel ecient a estimatorului

S
e
_

S
_
=
I
1
n
()
V ar
_

S
_ =

2
2n

2n
( 2)
2
=
1
2
< 1,
adic a estimatorul

S nu este estimator ecient pentru parametrul .
Teorema 5.2.17 (Rao-Cramer). Se consider a caracteristica X cu funct ia de proba-
bilitate f (x; ), (a, b), care satisface condit iile Teoremei 5.2.13 si e funct ia de
estimat ie absolut corect a

=

(X
1
, X
2
, . . . , X
n
) pentru parametrul . Condit ia
necesar a si sucient a ca

s a e funct ie de estimat ie ecient a pentru parametrul
este ca s a aib a loc reprezentarea
ln f (x; ) = A

() [L(x) ] +A() +N (x) ,


n plus are loc formula

=

(X
1
, X
2
, . . . , X
n
) =
1
n
n

k=1
L(X
k
) .
Demonstrat ie. Pentru necesitate, din demonstrat ia inegalit at ii RaoCramer, avem c a
egalitatea n aceast a inegalitate are loc dac a inegalitatea lui Schwarz este vericat a
prin egalitate. Aceasta are loc dac a si numai dac a variabilele aleatoare considerate
depind n mod liniar, adic a
K ()
_

(X
1
, X
2
, . . . , X
n
)
_
=
n

k=1
lnf (X
k
; )

, K = 0.
Consider and X
1
= x (x oarecare), X
2
= = X
n
= const., (=0 de exemplu) avem
K ()
_

(x, 0, . . . , 0)

=
lnf (x; )

+ (n 1)
lnf (0; )

,
244 Teoria estimat iei
de unde
lnf (x; )

= U () Q(x) +V () .
Astfel s-a obt inut c a
n

k=1
lnf (x
k
; )

= U ()
n

k=1
Q(x
k
) +nV ()
si prin urmare
K()
_

(x
1
, x
2
, . . . , x
n
)

= U ()
n

k=1
Q(x
k
) +nV () ,
de unde

(x
1
, x
2
, . . . , x
n
) =
U ()
K()
n

k=1
Q(x
k
) +
nV ()
K ()
+,
pentru orice x
1
, x
2
, . . . , x
n
. Rezult a de aici c a
h =
U ()
K ()
, g =
nV ()
K()
+
sunt constante (nu depind de ), deoarece

(x
1
, x
2
, . . . , x
n
) nu depinde de . Prin
urmare

(x
1
, x
2
, . . . , x
n
) = h
n

k=1
Q(x
k
) +g,
si dac a se noteaz a L(x) = nhQ(x) +g, atunci

(x
1
, x
2
, . . . , x
n
) = h
n

k=1
L(x
k
) g
nh
+g =
1
n
n

k=1
L(x
k
) .
Asadar s-a ajuns la

=

(X
1
, X
2
, . . . , X
n
) =
1
n
n

k=1
L(X
k
) .
Pe de alt a parte, deoarece
lnf (x; )

= U () Q(x) +V () ,
5.2. Funct ii de estimat ie 245
obt inem
lnf (x; )

= hK ()
L(x) g
nh
+
K () (g )
n
,
de unde
lnf (x; )

=
K ()
n
[L(x) ] .
Integr am, dup a ce am notat A

() =
K()
n
, ultima relat ie n raport cu si obt inem
_
lnf (x; )

d =
_
A

() [L(x) ] d = A

() [L(x) ] +
_
A

() d
= A

() [L(x) ] +A() +N (x) ,


de unde
lnf (x; ) = A

() [L(x) ] +A() +N (x) .


Pentru sucient a se porneste de la relat ia cunoscut a
_
R
f (x; ) dx = 1,
adic a
_
R
exp
_
A

() [L(x) ] +A() +N (x)

dx = 1,
pe care o deriv am n raport cu . Obt inem astfel c a
_
R
A

() [L(x) ] f (x; ) dx = 0,
de unde, deoarece A

= 0, rezult a c a
_
R
[L(x) ] f (x; ) dx = 0.
Deriv am din nou n raport cu si se ajunge la

_
R
f (x; ) dx +
_
R
[L(x) ]
f (x; )

dx = 0,
de unde
_
R
[L(x) ]
2
A

() f (x; ) dx = 1.
Deoarece E[L(X)] = , am obt inut astfel c a
V ar [L(X)] =
1
A

()
,
246 Teoria estimat iei
deci
V ar
_

_
= V ar
_
1
n
n

k=1
L(X
k
)
_
=
1
nA

()

Pe de alt a parte
I
n
() =nI
1
() = n
_
R
_
lnf (x; )

_
2
f (x; ) dx
=n
_
R
_
A

()

2
_
L(x)

2
f (x; ) dx = n
_
A

()

2
1
A

()
= nA

() .
Prin urmare putem scrie
e
_

_
=
I
1
n
()
V ar
_

_ =
1
nA

()
1
nA

()
= 1,
deci

=

(X
1
, X
2
, . . . , X
n
) este estimator ecient pentru parametrul .
Exemplul 5.2.18. Se consider a caracteristica X ce urmeaz a legea B(m, p), cu m
cunoscut si p necunoscut. Vrem s a ar at am c a media de select ie este estimator ecient
pentru parametrul necunoscut = E(X) = mp. Pentru aceasta vom considera o
select ie repetat a de volum n relativ a la aceast a caracteristic a.
Funct ia de frecvent a a caracteristicii X este
f (x; ) =
_
m
x
__

m
_
x
_
1

m
_
mx
,
de unde
ln f (x; ) = ln
_
m
x
_
+xln

m
+ (mx) ln
_
1

m
_
= (x ) ln

m
+ ln

m
+mln (m) + ln
_
m
x
_
mln m.
Consider and
A() = ln + (m) ln (m), avem A

() = ln

m
,
deci
f (x; ) = [L(x) ] A

() +A() +N (x) ,
unde L(x) = x si N (x) = ln
_
m
x
_
mlnm. Pe baza teoremei RaoCramer se obt ine
c a

=
1
n
n

k=1
L(X
k
) =
1
n
n

k=1
X
k
este estimator ecient pentru parametrul = mp.
5.2. Funct ii de estimat ie 247
5.2.4 Estimatori optimali
Denitia 5.2.19. Estimatorul nedeplasat

=

(X
1
, X
2
, . . . , X
n
), pentru parame-
trul , este optimal dac a are dispersia minim a dintre tot i estimatorii nedeplasat i ai
lui .
Observatia 5.2.20. Un estimator ecient este optimal, invers proprietatea nu are loc.
Proprietatea 5.2.21. Estimatorul optimal al unui parametru este unic.
Demonstrat ie. Fie

1
=

1
(X
1
, X
2
, . . . , X
n
) si

2
=

2
(X
1
, X
2
, . . . , X
n
) doi
estimatori optimali distinct i pentru parametrul . Dac a se consider a funct ia de select ie

=
1
2
_

1
+

2
_
, atunci

este estimator nedeplasat pentru , deoarece
E
_

_
=
1
2
E
_

1
_
+
1
2
E
_

2
_
=
1
2
( +) = .
Pe de alt a parte
V ar
_

_
=
1
4
_
V ar
_

1
_
+V ar
_

2
_
+ 2Cov
_

1
,

2
_
_
=
1
2
_

2
+Cov
_

1
,

2
__
,
unde
2
= V ar
_

1
_
= V ar
_

2
_
.
Din inegalitatea lui Schwarz se obt ine
Cov
2
_

1
,

2
_
=E
2
__

__

__
E
_
_

_
2
_
E
_
_

_
2
_
=
4
,
deci Cov
_

1
,

2
_

2
. Prin urmare, putem scrie c a V ar
_

_

2
, ceea
ce contrazice faptul c a

1
,

2
sunt estimatori optimali, afar a de cazul n care
V ar
_

_
=
2
, adic a Cov
_

1
,

2
_
=
2
. Av and n vedere aceste rezultate, putem
scrie:
V ar
_

2
_
= V ar
_

1
_
+V ar
_

2
_
2Cov
_

1
,

2
_
=
2
+
2
2
2
= 0,
adic a V ar
_

2
_
= 0. Dar avem c a E
_

1
_
= E
_

2
_
, ceea ce implic a
faptul c a E
_
_

2
_
2
_
= 0. Prin urmare se ajunge la

1
=

2
, n contradict ie
cu armat ia c a cei doi estimatori sunt distinct i.
248 Teoria estimat iei
Teorema 5.2.22 (Rao-Blackwell). Fie caracteristica X cu funct ia de probabilitate
f (x; ) si e

=

(X
1
, . . . , X
n
) un estimator nedeplasat pentru parametrul .
Dac a statistica S = S (X
1
, . . . , X
n
) este o statistic a sucient a pentru parametrul ,
atunci estimatorul

=

(X
1
, . . . , X
n
) = E
_

| S
_
este un estimator nedeplasat
pentru si are loc relat ia V ar
_

_
V ar
_

_
.
Demonstrat ie. Deoarece statistica S este sucient a rezult a c a funct ia de probabilitate
f (x
1
, . . . , x
n
; | s) condit ionat a a vectorului aleator (X
1
, . . . , X
n
) de evenimentul
(S = s) nu depinde de , deci
E
_

| S = s
_
=
_
. . .
_
R
n

(x
1
, . . . , x
n
) f (x
1
, . . . , x
n
; | s) dx
1
. . . dx
n
nu depinde de , adic a este o funct ie de select ie ce nu depinde de . Pe de alt a parte,
folosind propriet at i ale mediei condit ionate avem
E
_

_
= E
_
E
_

| S
__
= E
_

_
= ,
deci nedeplasarea are loc.
Pentru a stabili inegalitatea dintre dispersiile celor doi estimatori avem c a
V ar
_

_
=E
_
_

_
2
_
= E
_
_

E
_

S
_
+E
_

S
_

_
2
_
=E
_
_

E
_

S
__
2
_
+E
_
_
E
_

S
_

_
2
_
+2E
_
_

E
_

S
___
E
_

S
_

_
_
.
Dar avem c a
E
_
V ar
_

S
__
= E
_
E
_
_

E
_

S
__
_
2

S
_
= E
_
_

E
_

S
__
2
_
,
adic a primul termen din expresia lui V ar
_

_
. Al doilea termen din aceeasi expresie
este
E
_
_
E
_

S
_

_
2
_
= E
_
_

_
2
_
= V ar
_

_
,
iar ultimul termen este nul deoarece pentru S = s xat, avem E
_

|s
_
= const.,
deci
E
__

E
_

s
___
E
_

s
_

__
=
_
E
_

s
_

_
E
_

E
_

s
__
=
_
E
_

s
_

_ _
E
_

_
E
_

__
=0.
5.2. Funct ii de estimat ie 249
Am stabilit astfel relat ia V ar
_

_
= E
_
V ar
_

| S
__
+ V ar
_

_
, de unde
V ar
_

_
V ar
_

_
.
Denitia 5.2.23. Statistica S = S (X
1
, X
2
, . . . , X
n
) este complet a pentru familia
de legi de probabilitate f (x; ), A, dac a E[(S)] = 0, pentru orice A,
implic a faptul c a = 0 a.s.
Exemplul 5.2.24. Statistica S =

n
k=1
X
k
este complet a pentru familia de legi
Poisson cu parametrul > 0.
Prima dat a avem c a S urmeaz a legea lui Poisson de parametru n, deci
E[(S)] =

s=0
(s)
(n)
s
s!
e
n
= e
n

s=0
(s) n
s
s!

s
.
Pe de alt a parte E [(S)] = 0, pentru orice > 0, conduce la

s=0
(s) n
s
s!

s
= 0,
pentru orice > 0, ceea ce are loc numai dac a ecare coecient este nul, adic a
(s) = 0, c and s N.
Teorema 5.2.25 (LehmannScheff e).

In condit iile Teoremei RaoBlackwell, dac a
statistica S = S (X
1
, X
2
, . . . , X
n
) este complet a, atunci estimatorul

=

(X
1
, X
2
, . . . , X
n
) = E
_

S
_
este estimator optimal.
Demonstrat ie. Fie

=

(X
1
, X
2
, . . . , X
n
) un estimator nedeplasat pentru parame-
trul . Folosind Teorema RaoBlackwell, avem c a estimatorul

1
=
1
(X
1
, X
2
, . . . , X
n
) = E
_

| S
_
este nedeplasat pentru parametrul , adic a E (
1
) = , si V ar (
1
) V ar
_

_
.
Asadar avem c a E (
1
) = E
_

_
= sau E
_
E
_

S
__
= E
_
E
_

S
__
= ,
de unde E
_
E
_

S
_
E
_

S
__
= 0. Av and n vedere c a statistica S este
complet a rezult a c a E
_

| s
_
= E
_

| s
_
a.s., deci

=
1
a.s., de unde
V ar
_

_
= V ar (
1
).
250 Teoria estimat iei

In nal V ar
_

_
= V ar (
1
) V ar
_

_
, adic a V ar
_

_
V ar
_

_
, pentru
orice estimator nedeplasat

, ceea ce este chiar condit ia din denit ia optimalit at ii.
Exemplul 5.2.26. Fie caracteristica X, care urmeaz a legea lui Poisson de parametru
> 0. Vrem s a determin am un estimator optimal pentru parametrul = e

.
Funct ia de frecvent a a caracteristicii X este
f (x; ) =

x
x!
e

=
1
x!
_
ln
1

_
x

In Exemplul 5.2.24 am v azut c a statistica sucient a S =

n
k=1
X
k
este complet a
pentru familia de legi Poisson si urmeaz a legea lui Poisson de parametru n = nln
1


Dac a se consider a funct ia de select ie

(X
1
, X
2
, . . . , X
n
) =
1
n
card
_
X
i

X
i
= 0, i = 1, n
_
,
atunci

are distribut ia

_
_
k
n
_
n
k
_

k
(1 )
nk
_
_
k=0,n
, deci E
_

_
=
1
n
n = ,
adic a

este estimator nedeplasat pentru parametrul .
Dac a se introduc variabilele aleatoare Y
1
, Y
2
, . . . , Y
n
cu distribut iile date prin
Y
i
=
_
_
_
1, dac a X
i
= 0,
0, dac a X
i
= 0,
deci P (Y
i
= 1) = , P (Y
i
= 0) = 1 , atunci avem c a

=
1
n

n
k=1
Y
k
.
Aplic am Teorema RaoBlackwell si obt inem

= E
_

S
_
=
1
n
E
_
n

k=1
Y
k

S
_
= E
_
Y
1

S
_
.
Pentru S = s, avem
E
_
Y
1

S = s
_
= P
_
Y
1
= 1

S = s
_
1 = P
_
X
1
= 0

S = s
_
.
5.3. Metode pentru estimarea parametrilor 251
Folosind formula lui Bayes avem
P
_
X
1
= 0

S = s
_
=
P (X
1
= 0) P (S = s|X
1
= 0)
P (S = s)
=
P (X
1
= 0) P (X
2
+ +X
n
= s)
P (S = s)
=
exp ()
((n1))
s
s!
exp[(n 1) ]
(n)
s
s!
exp (n)
=
_
n 1
n
_
s
,
de unde se obt ine c a

= E
_

S
_
= E(Y
1
|S) =
_
1
1
n
_
S
.
Am ajuns astfel la estimatorul optimal pentru parametrul = e

, care este dat prin


formula

=

(X
1
, X
2
, . . . , X
n
) =
_
1
1
n
_
n

X

5.3 Metode pentru estimarea parametrilor


5.3.1 Metoda momentelor
Se consider a caracteristica X, care are funct ia de probabilitate f (x; ) cu parametrul
necunoscut = (
1
,
2
, . . . ,
p
) A R
p
si o select ie repetat a de volum n.
Denitia 5.3.1. Numim estimator pentru parametrul obt inut prin metoda momen-
telor solut ia

=
_

1
,

2
, . . . ,

p
_
a sistemului

k
=
k
, k = 1, p,
unde
k
este momentul teoretic de ordin k,
k
= E
_
X
k
_
, iar
k
este momentul de
select ie de ordinul k, adic a

k
=
1
n
n

i=1
X
k
i
.
Observatia 5.3.2. Metoda momentelor este una din cele mai vechi metode de es-
timare a parametrilor, folosit a init ial n mod empiric. Este fundamentat a teoretic pe
faptul c a momentele de select ie sunt estimatori absolut corect i pentru momentele
teoretice corespunz atoare. Este cunoscut de asemenea c a

a.s.
, c and n .
252 Teoria estimat iei
Exemplul 5.3.3. Se consider a caracteristica X, care urmeaz a legea gamma cu para-
metrii a, b > 0 necunoscut i. Densitatea de probabilitate pentru X este
f (x; a, b) =
1
(a) b
a
x
a1
e

x
b
, x > 0.
Vrem s a estim am parametrii a si b prin metoda momentelor.
Se stie c a

1
=E (X) =
_
+

xf (x; a, b) =
1
(a) b
a
_
+
0
x
a
e

x
b
dx = ab si

2
=E
_
X
2
_
=
_
+

x
2
f (x; a, b) =
1
(a) b
a
_
+
0
x
a+1
e

x
b
dx = ab
2
(a + 1) .
Prin urmare, avem sistemul de ecuat ii
_
ab =
1
=

X
ab
2
(a + 1) =
2
=

X
2
+
2
,
care are solut ia
a =

X
2

2
,

b =

2

5.3.2 Metoda verosimilit atii maxime


Se consider a caracteristica X cu funct ia de probabilitate f (x; ), unde parametrul
necunoscut A R
p
. Relativ la caracteristica X se consider a o select ie repetat a
de volum n.
Denitia 5.3.4. Numim estimator de verosimilitate maxim a, pentru parametrul ,
statistica

=

(X
1
, X
2
, . . . , X
n
)
pentru care se obt ine maximul funct iei de verosimilitate
g (X
1
, X
2
, . . . , X
n
; ) =
n

k=1
f (X
k
; ) ,
iar

=

(x
1
, x
2
, . . . , x
n
) se numeste estimat ie de verosimilitate maxim a, pentru
parametrul .
Observatia 5.3.5.

In denit ia estimatorului de verosimilitate maxim a

nu este
necesar ca f (x; ) s a e diferent iabil a n raport cu . De asemenea, nu este neap arat
unic si nedeplasat.
5.3. Metode pentru estimarea parametrilor 253
Observatia 5.3.6. Dac a funct ia de verosimilitate este diferent iabil a de dou a ori n
raport cu , atunci estimatorul de verosimilitate maxim a se obt ine ca solut ie a sis-
temului de ecuat ii
g (X
1
, X
2
, . . . , X
n
; )

k
= 0, k = 1, p.
Sistemul de ecuat ii este echivalent cu
ln g (X
1
, X
2
, . . . , X
n
; )

k
=
n

i=1
ln f (X
i
; )

k
= 0, k = 1, p,
numit sistemul ecuat iilor de verosimilitate maxim a.
Exemplul 5.3.7. S a determin am estimatorii de verosimilitate maxim a pentru valoa-
rea medie si abaterea standard, dac a se consider a caracteristica X, care urmeaz a legea
normal a N (, ).
Se stie c a E(X) = si (X) = , iar densitatea de probabilitate a lui X este
f (x; , ) =
1

2
e

(x)
2
2
2
.
Pentru a scrie sistemul de verosimilitate maxim a, avem c a
ln f (x; , ) = ln

2 ln
(x )
2
2
2
,
de unde
ln f (x; , )

=
x

2
,
ln f (x; , )

=
1

+
(x )
2

In acest mod se obt ine


_

_
ln g

=
n

k=1
lnf (X
k
; , )

=
n

k=1
X
k

2
= 0
ln g

=
n

k=1
lnf (X
k
; , )

=
n

k=1
_

+
(X
k
)
2

3
_
= 0,
sau
_

_
n

k=1
(X
k
) = 0
n

k=1
_

2
+ (X
k
)
2
_
= 0,
254 Teoria estimat iei
de unde se rezult a estimatorii de verosimilitate maxim a

=
1
n
n

k=1
X
k
=

X,

_
1
n
n

k=1
_
X
k


X
_
2
=


2
,
pentru parametrii si .
Exemplul 5.3.8. Caracteristica X urmeaz a legea uniform a pe intervalul (0, ), unde
parametrul > 0 este necunoscut. Relativ la caracteristica X se consider a o select ie
repetat a de volum n. Vrem s a se determin am estimatorul de verosimilitate maxim a

, pentru parametrul necunoscut .


Estimatorul

de verosimilitate maxim a pentru se determin a astfel nc at funct ia
de verosimilitate
g(X
1
, X
2
, . . . , X
n
; ) =
n

k=1
f (x
k
; ) =
1

n
s a e maxim a pentru

=

(X
1
, X
2
, . . . , X
n
). Deoarece
max
_
1

X
1
, . . . , X
n

_
=
_
1
max
_
X
i
, i = 1, n
_
_
n
,
se obt ine c a

=

(X
1
, X
2
, . . . , X
n
) = max
_
X
i
, i = 1, n
_
.
Se observ a c a n acest exemplu nu s-a putut folosi ecuat ia de verosimilitate
maxim a, deoarece domeniul valorilor caracteristicii X, care este (0, ), depinde de
parametrul estimat.
Vom ar ata, n continuare, c a estimatorul astfel construit este estimator corect pen-
tru parametrul . Apoi vom folosi acest estimator pentru obt inerea unui estimator
absolut corect pentru .
Funct ia de repartit ie a statisticii

este
F

(x; ) = P
_

x
_
=
n

i=1
P (X
i
x) = [F
X
(x; )]
n
,
deci

are densitatea de probabilitate
f

(x; ) =
F

(x; )
x
= nf (x; ) [F
X
(x; )]
n1
=
nx
n1

n
, c and x (0, ) .
Se calculeaz a usor
E
_

_
=
n

n
_

0
x x
n1
dx =
n
n + 1
, E
_

2
_
=
n

n
_

0
x
n+1
dx =
n
n + 2

2
.
5.3. Metode pentru estimarea parametrilor 255
Astfel se obt ine c a
lim
n
E
_

_
=
lim
n
V ar
_

_
= lim
n
_
n
n + 2

2

n
2
(n+1)
2

2
_
= lim
n
n
(n+1)
2
(n+2)

2
=0.
Prin urmare,

este estimator corect pentru .
Pun and condit ia E
_

_
= , rezult a c a
= E
_

_
=
n
E
_

_
=
n
n
n + 1
,
de unde se obt ine
n
=
n+1
n
si n nal

=
n + 1
n

=
n + 1
n
max
_
X
i
, i = 1, n
_
.
Deoarece
V ar
_

_
=
_
n + 1
n
_
2
V ar
_

_
=
n(n + 1)
2
n
2
(n + 1)
2
(n + 2)
=
1
n(n + 2)
0,
c and n , rezult a c a

este estimator absolut corect pentru parametrul .
Proprietatea 5.3.9. Dac a S = S (X
1
, X
2
, . . . , X
n
) este statistic a sucient a pentru
parametrul , iar

este estimator de verosimilitate maxim a pentru , atunci

este
funct ie de S.
Demonstrat ie. Deoarece statistica S este sucient a rezult a c a
g (x
1
, x
2
, . . . , x
n
; ) = (x
1
, x
2
, . . . , x
n
) h(s, ) ,
deci maximul lui g, dup a , se obt ine atunci si numai atunci c and se obt ine maximul
lui h dup a . Astfel c a

se exprim a n funct ie de S.
Teorema 5.3.10. Dac a

=

(X
1
, X
2
, . . . , X
n
) este funct ie de estimat ie ecient a
pentru parametrul , atunci

este estimator de verosimilitate maxim a pentru .
Demonstrat ie. Deoarece

este estimator ecient pentru , din inegalitatea Rao
Cramer (cu egalitate), avem c a
ln g (X
1
, X
2
, . . . , X
n
; )

= K ()
_


_
.
Astfel c a
ln g
_
X
1
, X
2
, . . . , X
n
;

= K
_

__

_
= 0,
deci

veric a ecuat ia verosimilit at ii maxime.
256 Teoria estimat iei
Observatia 5.3.11. Dac a valoarea adev arat a a parametrului este
0
, se arat a c a
funct ia de verosimilitate maxim a

pentru parametrul are urm atoarele comport ari
asimptotice:

a.s.

0
, c and n , iar

n
_


0
_
converge n repartit ie la
legea normal a N
_
0,
1

I(
0
)
_
.
5.3.3 Metoda minimului
2
Se consider a colectivitatea C si caracteristica X cercetat a, cu legea de probabilitate
dat a prin funct ia f (x; ), unde = (
1
, . . . ,
s
) A R
s
. Domeniul valorilor lui
X l consider am compus din clasele C
i
, i = 1, k. Vom introduce notat iile urm atoare
p
i
= p
i
() = P (X C
i
), adic a probabilitatea ca un individ luat la nt amplare din
colectivitatea C s a apart in a clasei C
i
.
Dac a se consider a o select ie repetat a de volum n cu datele de select ie x
1
, . . . , x
n
,
respectiv variabilele de select ie X
1
, . . . , X
n
, not am prin n
i
frecvent a absolut a a
datelor de select ie din clasa C
i
. Fie N
i
variabila aleatoare (de select ie) corespunz a-
toare lui n
i
, atunci vectorul aleator N = (N
1
, . . . , N
k
) urmeaz a legea multinomial a
de parametri p
i
= p
i
(), i = 1, k.
Denitia 5.3.12. Estimatorul cu
2
minim pentru parametrul este estimatorul
(funct ia de select ie)

=

(X
1
, X
2
, . . . , X
n
) , care realizeaz a valoarea minim a a
expresiei

2
=
k

i=1
[N
i
np
i
()]
2
np
i
()
n raport cu parametrul , iar

=

(x
1
, x
2
, . . . , x
n
) se numeste estimat ie cu
2
minim pentru parametrul .
Observatia 5.3.13. Dac a not am p
i
=
n
i
n
, atunci valoarea lui
2
se poate scrie n felul
urm ator:

2
=
k

i=1
(n
i
np
i
)
2
np
i
=
k

i=1
(n p
i
np
i
)
2
np
i
= n
_
k

i=1
p
2
i
p
i
1
_
,
prin urmare, minimul lui
2
se obt ine c and este minim a expresia

k
i=1
p
2
i
p
i

Observatia 5.3.14. Dac a p


i
(), i = 1, s, sunt diferent iabile de dou a ori n raport
cu , atunci

se obt ine ca solut ie a sistemului

j
_
k

i=1
(N
i
np
i
())
2
np
i
()
_
= 0, j = 1, s.
5.3. Metode pentru estimarea parametrilor 257
Observatia 5.3.15.

In locul expresiei lui
2
de mai sus, numit indicatorul lui Pear-
son, se pot utiliza alte expresii ca:
D
2
() =
k

i=1
[N
i
np
i
()]
2
N
i
, indicatorul lui Neyman,
D
2
() = 2
k

i=1
N
i
ln
_
N
i
np
i
()
_
, indicatorul de verosimilitate,
D
2
() = 2n
k

i=1
p
i
() ln
_
np
i
()
N
i
_
, indicatorul lui Kullbach,
D
2
() =
k

i=1
n p
i
(1 p
i
)
_
ln
p
i
1 p
i
ln
p
i
()
1 p
i
()
_
,
indicatorul lui Berkson.
5.3.4 Metoda intervalelor de ncredere
Se consider a caracteristica X cu legea de probabilitate f (x; ), unde parametrul ne-
cunoscut A R. Fie o select ie repetat a de volum n si num arul (0, 1), numit
probabilitate de risc, 1 numindu-se probabilitate de ncredere.
Denitia 5.3.16. Numim interval de ncredere pentru parametrul , intervalul aleator
_

1
,

2
_
=
_

1
(X
1
, X
2
, . . . , X
n
) ,

2
(X
1
, X
2
, . . . , X
n
)
_
,
unde statisticile

1
si

2
sunt astfel nc at P
_

1
< <

2
_
= 1 , iar intervalul
numeric
_

1
,

2
_
=
_

1
(x
1
, x
2
, . . . , x
n
) ,

2
(x
1
, x
2
, . . . , x
n
)
_
, se numeste valoarea
intervalului de ncredere pentru parametrul .
Observatia 5.3.17. Pentru determinarea intervalului de ncredere se consider a o
statistic a S = S (X
1
, X
2
, . . . , X
n
), care urmeaz a o lege de probabilitate cunos-
cut a, dar n expresia c areia apare parametrul . Se determin a apoi intervalul numeric
(s
1
, s
2
) astfel nc at P (S (s
1
, s
2
)) = 1 , relat ie care se va scrie, n mod echiva-
lent, P
_

1
< <

2
_
= 1 .
Observatia 5.3.18. Cu c at este mai mic si intervalul de ncredere are lungimea mai
mic a cu at at estimat ia parametrului necunoscut este mai bun a.
Observatia 5.3.19. Din relat ia P
_
S (s
1
, s
2
)
_
= 1 , intervalul (s
1
, s
2
) nu este
determinat n mod unic.
De la problem a la problem a se mai adaug a o condit ie suplimentar a, de exemplu
xarea valorii e a lui s
1
, e a lui s
2
. De asemenea, se poate considera o leg atur a
ntre s
1
si s
2
dat a de anumite ipoteze de lucru.
258 Teoria estimat iei
Interval de ncredere pentru media teoretic a dispersie cunoscut a
Se consider a caracteristica X ce urmeaz a legea normal a N (m, ), unde m R este
necunoscut, iar > 0 este cunoscut.
Pentru construirea unui interval de ncredere pentru media teoretic a m ne-
cunoscut a efectu am o select ie repetat a de volum n si consider am probabilitatea de
ncredere 1 dat a, (0, 1).
Se construieste statistica
Z =

X m

n
,
care urmeaz a legea normal a N (0, 1) (a se vedea Observat ia 4.2.6). Prin urmare, pen-
tru dat determin am intervalul numeric (z
1
, z
2
) astfel nc at
P
_
Z (z
1
, z
2
)
_
= (z
2
) (z
1
) = 1 ,
unde
(x) =
1

2
_
x
0
e

t
2
2
dt,
este funct ia lui Laplace. Funct ia lui Laplace este tabelat a n Anexa I pentru valori
pozitive ale argumentului, av and n vedere c a (x) = (x).
Deoarece dubla inegalitate
z
1
<

X m

n
< z
2
este echivalent a cu
m
1
=

X z
2

n
< m <

X z
1

n
= m
2
rezult a c a P ( m
1
< m < m
2
) = 1, adic a ( m
1
, m
2
) este un interval de ncredere
pentru media teoretic a m.
Desigur c a intervalul numeric (z
1
, z
2
) nu este n mod unic determinat. Dac a nu
exist a nici o informat ie suplimentar a relativ a la valoarea medie, atunci se va considera
intervalul de ncredere de lungime minim a, pentru xat, si se obt ine c and z
1
= z
2
.

In acest caz z
2
= z
1

2
, va dat prin relat ia
_
z
1

2
_

_
z
1

2
_
= 1, ceea
ce este echivalent cu
_
z
1

2
_
=
1
2

C and se foloseste funct ia lui Laplace denit a prin
(x) =
1

2
_
x

t
2
2
dt,
5.3. Metode pentru estimarea parametrilor 259
atunci z
1

2
se determin a din relat ia
_
z
1

2
_
= 1

2
si reprezint a de fapt cuantila
de ordin 1

2

Intervalul de ncredere pentru parametrul m are extremit at ile


(5.3.1)
m
1
= m
1
(X
1
, X
2
, . . . , X
n
) =

X z
1

n
,
m
2
= m
2
(X
1
, X
2
, . . . , X
n
) =

X +z
1

Observatia 5.3.20. Geometric, dac a se consider a gracele funct iei de repartit ie si


densit at ii de probabilitate a legii normale N (0, 1), modul de obt inere a cuantilei z

este prezentat n Figura 5.1. Adic a, e intersect and gracul funct iei de repartit ie a
legii normale N (0, 1) cu dreapta de ecuat ie y = , e aleg andul pe z

astfel ca aria
umbrit a de sub gracul densit at ii de probabilitate s a e .
0
1
z

y=

f
Figura 5.1: Determinarea cuantilei z

Observatia 5.3.21. Dac a exist a o informat ie relativ a la valoarea medie de forma c a


aceasta nu este limitat a superior, atunci intervalul numeric (z
1
, z
2
) = (, z
1
),
care conduce la intervalul de ncredere
( m
1
, m
2
) =
_

n
z
1
,
_
.

In mod analog, dac a se cunoaste c a valoarea medie nu este limitat a inferior, adic a
are tendint a de a avea valori mici n raport cu ceea ce ne astept am, atunci intervalul
260 Teoria estimat iei
numeric (z
1
, z
2
) = (z

, ), care conduce la intervalul de ncredere


( m
1
, m
2
) =
_
,

X

n
z

_
.
Pe baza teoremei limit a central a avem c a rezultatul obt inut se ment ine c and X
urmeaz a o lege de probabilitate oarecare, pentru n > 30 (a se vedea Proprieta-
tea 4.2.7).
Exemplul 5.3.22. Relativ la populat ia C se cerceteaz a caracteristica X privind me-
dia teoretic a E (X) = m. S tiind c a dispersia teoretic a a caracteristicii X este
V ar (X) = 0.35, s a se stabileasc a un interval de ncredere pentru media teoretic a
m cu probabilitatea de ncredere 1 = 0.95, utiliz and distribut ia empiric a de
select ie
X
_
22.7 22.8 22.9 23.0 23.1 23.2 23.3 23.4
1 3 7 4 6 7 5 2
_
.
Deoarece volumul select iei este n = 35 > 30, putem considera c a statistica
Z =

X m

n
, unde =
_
V ar (X),
urmeaz a legea normal a N (0, 1). Asadar, extremit at ile intervalului de ncredere pen-
tru media teoretic a m sunt date prin (5.3.1). Calcul am valorile acestor extremit at i pe
baza datelor de select ie.
Valoarea mediei de select ie

X este
x=
1
35
(122.7 +322.8 +722.9 +423 +623.1 +723.2 +523.3 +223.4)=23.077,
iar din Anexa I, pentru
1
2
= 0.475, se g aseste z
1

2
= 1.96.
De asemenea, avem c a

n
=
_
V ar (X)
n
=
_
0.35
35
=

0.01 = 0.1.
Obt inem, n acest fel, intervalul de ncredere pentru media teoretic a m = E(X)
_
x

n
z
1

2
; x +

n
z
1

2
_
=(23.077 0.196 ; 23.077 + 0.196)
=(22.881 ; 23.273) .
5.3. Metode pentru estimarea parametrilor 261
Programul 5.3.23. Calculele pot f acute cu urm atorul program Matlab:
x=[22.7,22.8
*
ones(1,3),22.9
*
ones(1,7),23
*
ones(1,4),...
23.1
*
ones(1,6),23.2
*
ones(1,7),23.3
*
ones(1,5),23.4
*
ones(1,2)];
s=sqrt(0.35)
*
norminv(0.975)/sqrt(35);ma=mean(x);
m1=ma-s; m2=ma+s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)
si care, n urma execut arii, aseaz a rezultatul
(m1,m2)=(22.881,23.273)
Interval de ncredere pentru media teoretic a dispersia necunoscut a

In condit iile sect iunii precedente, dar cu > 0 necunoscut, se va considera statistica
T =

X m

n
=

X m
_

2
n1
,
care, conform Propriet at ii 4.2.26, urmeaz a legea Student cu n 1 grade de libertate.
Se determin a intervalul numeric (t
1
, t
2
) astfel nc at
P
_
T (t
1
, t
2
)
_
= F
n1
(t
2
) F
n1
(t
1
) = 1 ,
unde
F
m
(x) =

_
m+1
2
_

m
_
m
2
_
_
x

_
1 +
t
2
m
_

m+1
2
dt, x R,
este funct ia de repartit ie a legii Student cu m grade de libertate si care este tabelat a,
pentru anumite valori, n Anexa II.
Lu and t
2
= t
n1,1

2
, t
1
= t
2
, avem c a F
n1
_
t
n1,1

2
_
= 1

2
, iar
P ( m
1
< m < m
2
) = 1 , deci, intervalul de ncredere pentru media teoretic a m
are extremit at ile date prin
(5.3.2)
m
1
=

X t
n1,1

n
,
m
2
=

X +t
n1,1

Observatia 5.3.24. Dac a exist a o informat ie relativ a la valoarea medie de forma c a


aceasta nu este limitat a superior, adic a are tendint a de a avea valori mai mari dec at
cele asteptate, atunci intervalul numeric (t
1
, t
2
) = (, t
n1,1
), care conduce la
intervalul de ncredere pentru m:
( m
1
, m
2
) =
_

n
t
n1,1
,
_
.
262 Teoria estimat iei

In mod analog, dac a se cunoaste c a valoarea medie nu este limitat a inferior, atunci
intervalul numeric (t
1
, t
2
) = (t
n1,
, ), care conduce la intervalul de ncredere
( m
1
, m
2
) =
_
,

X

n
t
n1,
_
.
Observatia 5.3.25. Geometric, dac a se consider a gracele funct iei de repartit ie si
densit at ii de probabilitate a legii Student cu n1grade de libertate, modul de obt inere
a cuantilei t
n1,
este prezentat n Figura 5.2.
0
1
t
n1,
y=

t
n1,
f
Figura 5.2: Determinarea cuantilei t
n1,
Din teorema limit a central a avem c a rezultatele pot aplicate pentru o caracte-
ristic a X ce urmeaz a o lege de probabilitate oarecare, pentru n > 30.
Exemplul 5.3.26. Pentru recept ionarea unei m ar ambalat a n cutii, se efectueaz a un
control, prin sondaj, privind greutatea X a cutiilor. Pentru 22 de cutii c ant arite s-a
obt inut distribut ia empiric a de select ie, relativ la caracteristica X:
X
_
_
2.7 2.8 2.9 3.0 3.1 3.2 3.3
1 2 5 3 5 4 2
_
_
.
Folosind probabilitatea de ncredere 0.98, s a determin am un interval de ncredere
pentru valoarea medie a greut at ii cutiilor, presupun and c a X urmeaz a legea normal a
N (m, ).
5.3. Metode pentru estimarea parametrilor 263
Deoarece abaterea standard =
_
V ar (X) este necunoscut a, se consider a sta-
tistica
T =

X m

n
,
care urmeaz a legea Student cu n 1 grade de libertate.
Extremit at ile intervalului de ncredere pentru valorea medie teoretic a m = E(X)
sunt date prin (5.3.2).
Pentru n 1 = 21 si 1 = 0.98 ( = 0.02), din Anexa II se determin a
t
n1,1

2
= 2.518.
De asemenea, folosind datele de select ie, obt inem valoarea x a mediei de select ie

X, anume
x =
1
22
(12.7 + 22.8 + 52.9 + 33 + 53.1 + 43.2 + 23.3) = 3.032
si valoarea abaterii standard de select ie
=

_
1
21
7

k=1
f
k
(x
k
x)
2
=
_
0.587728
21
= 0.167.
Putem scrie atunci intervalul (numeric) de ncredere
_
x t
n1,1

n
; x +t
n1,1

n
_
=
_
3.032
2.518 0.167

22
; 3.032+
2.518 0.167

22
_
=(2.942 ; 3.122) .
Programul 5.3.27. Dac a se execut a programul Matlab
x=[2.7,2.8
*
ones(1,2),2.9
*
ones(1,5),3
*
ones(1,3),...
3.1
*
ones(1,5),3.2
*
ones(1,4),3.3
*
ones(1,2)];
ma=mean(x); va=var(x);
s=tinv(0.99,21)
*
sqrt(va)/sqrt(22);
m1=ma-s; m2=ma+s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)
relativ la problema precedent a, se obt ine intervalul de ncredere:
(m1,m2)=( 2.942, 3.122)
Interval de ncredere pentru dispersie
Consider am caracteristica X ce urmeaz a legea normal a N (m, ) cu m R ne-
cunoscut si > 0 necunoscut. Determin am un interval de ncredere pentru dispersia
teoretic a
2
a caracteristicii X.
264 Teoria estimat iei
Statistica ce se consider a n acest caz este

2
=
(n 1)
2

2
=
1

2
n

k=1
_
X
k


X
_
2
,
care, conform Propriet at ii 4.2.25, urmeaz a legea
2
cu n 1 grade de libertate.
Se determin a intervalul numeric
_

2
1
,
2
2
_
astfel n at
P
_

2
1
,
2
2
__
= F
n1
_

2
2
_
F
n1
_

2
1
_
= 1 ,
unde
F
m
(x) =
1
2
m
2

_
m
2
_
_
x
0
t
m
2
1
e

t
2
dt, x > 0,
este funct ia de repartit ie a legii
2
cu m grade de libertate si este tabelat a, pentru
anumite valori, n Anexa III.
Dac a se alege
2
1
=
2
n1,

2
si
2
2
=
2
n1,1

2
, adic a astfel nc at
F
n1
_

2
n1,

2
_
=

2
si F
n1
_

2
n1,1

2
_
= 1

2
,
se obt ine P
_

2
<
2
<
2
_
= 1 , unde
(5.3.3)

2
1
=
2
1
(X
1
, X
2
, . . . , X
n
) =
(n 1)
2

2
n1,1

2
,

2
2
=
2
2
(X
1
, X
2
, . . . , X
n
) =
(n 1)
2

2
n1,

Observatia 5.3.28. Modul geometric de obt inere a cuantilei


2
n1,
este prezentat n
Figura 5.3, dac a se consider a gracele funct iei de repartit ie si densit at ii de probabili-
tate a legii
2
cu n 1 grade de libertate.
Exemplul 5.3.29. Fie X caracteristica ce reprezint a timpul de producere a unei
react ii chimice, m asurat n secunde. Dac a X urmeaz a legea normal a N (m, ) si
av and o select ie repetat a de volum n = 11, cu datele de select ie 4.21, 4.03, 3.99,
4.05, 3.89, 3.98 4.01, 3.92, 4.23, 3.85, 4.20, vom determina intervalul de ncredere
pentru dispersia
2
= V ar (X) si pentru abaterea standard =
_
V ar (X), cu
probabilitatea de ncredere 0.95.
Se consider a statistica

2
=
(n 1)
2

2
, unde
2
=
1
n 1
n

k=1
_
X
k


X
_
2
,

X =
1
n
n

k=1
X
k
,
5.3. Metode pentru estimarea parametrilor 265
0
1

2
n1,
y=

2
n1,
f
Figura 5.3: Determinarea cuantilei
2
n1,
care urmeaz a legea
2
cu n 1 grade de libertate. Extremit at ile intervalului de
ncredere pentru
2
vor date prin (5.3.3).
Pentru determinarea valorilor numerice ale acestor intervale de ncredere, cal-
cul am:
x =
1
11
11

k=1
x
k
=
1
11
(4.21 + 4.03 + + 4.20) = 4.033;

2
=
1
10
11

k=1
(x
k
x)
2
= 0.017;
2
10;0.975
= 20.5 si
2
10;0.025
= 3.25.
Asadar, intervalele de ncredere pentru
2
si sunt
_
10 0.017
20.5
;
10 0.017
3.25
_
= (0.008 ; 0.052) ,
respectiv
_
_
10 0.017
20.5
;
_
10 0.017
3.25
_
= (0.091 ; 0.229) .
Programul 5.3.30. Un program Matlab, care s a rezolve aceast a problem a, ar putea
urm atorul:
x=[4.21,4.03,3.99,4.05,3.89,3.98,4.01,3.92,4.23,3.85,4.20];
va=var(x); c1=chi2inv(0.025,10); c2=chi2inv(0.975,10);
266 Teoria estimat iei
v1=10
*
va/c2; v2=10
*
va/c1; s1=sqrt(v1); s2=sqrt(v2);
fprintf( (v1,v2)=(%6.3f,%6.3f)\n,v1,v2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)

In urma execut arii, se obt in intervalele de ncredere pentru dispersie si respectiv pen-
tru abaterea standard:
(v1,v2)=( 0.008, 0.052)
(s1,s2)=( 0.091, 0.229)
Interval de ncredere pentru raportul dispersiilor
Se consider a caracteristicile independente X

si X

ecare urm and legea normal a,


respectiv N (m

) si N (m

). Relativ la cele dou a caracteristici se consider a


c ate o select ie repetat a, respectiv de volume n

si n

. Vom determina un interval de


ncredere pentru raportul

2
_

2
corespunz ator probabilit at ii de ncredere 1
dat a.
Pentru aceasta se consider a statistica
F =

2
_

2
,
care, conform Propriet at ii 4.2.30, urmeaz a legea FisherSnedecor cu m = n

1 si
n = n

1 grade de libertate.
Se determin a intervalul numeric (f
1
, f
2
) astfel nc at
P
_
F (f
1
, f
2
)
_
= F
m,n
(f
2
) F
m,n
(f
1
) = 1 ,
unde
F
m,n
(x) =
_
m
n
_m
2

_
m+n
2
_

_
m
2
_

_
n
2
_
_
x
0
t
m
2
1
_
1 +
m
n
t
_

m+1
2
dt, x > 0,
este funct ia de repartit ie a legii FisherSnedecor cu m si n grade de libertate si care
este tabelat a pentru anumite valori n Anexa IV.
Dac a se alege f
1
= f
m,n;

2
si f
2
= f
m,n;1

2
, adic a astfel nc at
F
m,n
_
f
m,n;

2
_
=

2
si F
m,n
_
f
m,n;1

2
_
= 1

2
,
atunci
(5.3.4) P
_
f
m,n;

2
<

2
< f
m,n;1

2
_
= 1 .
Aceast a relat ie pune n evident a intervalul de ncredere pentru raportul celor dou a
dispersii.
5.3. Metode pentru estimarea parametrilor 267
Observatia 5.3.31. Modul geometric de obt inere a cuantilei f
m,n;
este prezentat n
Figura 5.4, dac a se consider a gracele funct iei de repartit ie si densit at ii de probabili-
tate a legii FisherSnedecor cu m si n grade de libertate.
0
1
f
m,n,
y=

f
m,n,
f
Figura 5.4: Determinarea cuantilei f
m,n;
Exemplul 5.3.32. Se cerceteaz a precizia cu care dou a masini produc conserve de
acelasi tip. Pentru aceasta, se consider a c ate un esantion din conservele produse de
cele dou a masini si se m asoar a greutatea acestora. Fie X

greutatea n grame a unei


conserve produs a de prima masin a, respectiv X

pentru a doua masin a. M asur atorile


obt inute sunt:
X

: 1021 980 988 1017 1005 998 1014 985 995 1004 1030
1015 995 1023 1008 1013
X

: 1003 988 993 1013 1006 1002 1014 997 1002 1010 975
S a se calculeze un interval de ncredere pentru raportul abaterilor standard, adic a
pentru

V ar(X

V ar(X

)
, folosind probabilitatea de risc = 0.05.
Vom considera c a cele dou a caracteristici X

si X

sunt independente si c a
urmeaz a legile normale N (m

) si respectiv N (m

).
Statistica ce se utilizeaz a pentru stabilirea intervalului de ncredere pentru rapor-
tul

este
F =

2
_

2
,
268 Teoria estimat iei
care urmeaz a legea FisherSnedecor cu m = n

1 = 10 si n = n

1 = 15 grade
de libertate.
Intervalul de ncredere este dat prin (5.3.4).
Pentru aceasta avem c a
x

=
1
n

k=1
x

k
=
1
16
(1021 + 980 + + 1013) = 1005.7,
x

=
1
n

k=1
x

k
=
1
11
(1003 + 988 + + 975) = 1000.3,

2
=
1
n

1
n

k=1
_
x

k
x

_
2
=
1
15
_
(1021 1005.7)
2
+ + (1013 1005.7)
2

= 210.63,

2
=
1
n

1
n

k=1
_
x

k
x

_
2
=
1
10
_
(1003 1000.3)
2
+ + (975 1000.3)
2

= 134.42.
Pe de alt a parte, se obt in cuantilele
f
m,n;

2
= f
10,15;0.025
= 0.28, f
m,n;1

2
= f
10,15;0.975
= 3.06,
pe baza Anexei IV. Facem observat ia c a n acest calcul s-a avut n vedere c a
f
m,n;

2
=
1
f
n,m;1

2
, adic a f
10,15;0.025
=
1
f
15,10;0.975
=
1
3.52
= 0.28.
Se ajunge astfel la faptul c a


_
_
0.28
210.63
134.42
,
_
3.06
210.63
134.42
_
= (0.66, 2.19) .
La acelasi rezultat se ajunge si dac a se consider a statistica
1
F

Programul 5.3.33. Programul Matlab, care urmeaz a, calculeaz a intervalele de


ncredere pentru raportul dispersiilor, respectiv al abaterilor standard, pentru datele
considerate n problema precedent a.
x1=[1021,980,988,1017,1005,998,1014,985,995,1004,...
1030,1015,995,1023,1008,1013];
x2=[1003,988,993,1013,1006,1002,1014,997,1002,1010,975];
v1=var(x1); v2=var(x2); r=v1/v2;
5.3. Metode pentru estimarea parametrilor 269
f1=finv(0.025,10,15); f2=finv(0.975,10,15);
r1=f1
*
r; r2=f2
*
r; s1=sqrt(r1); s2=sqrt(r2);
fprintf( (r1,r2)=(%6.3f,%6.3f)\n,r1,r2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)

In urma execut arii programului, sa obt inut:


(r1,r2)=( 0.445, 4.795)
(s1,s2)=( 0.667, 2.190)
Interval de ncredere pentru diferenta mediilor
Caracteristicile independente X

si X

urmeaz a respectiv legile normale N (m

)
si N (m

). Folosind c ate o select ie repetat a de volum n

si n

pentru cele dou a


caracteristici, vrem s a determin am un interval de ncredere pentru diferent a m

.
Distingem urm atoarele trei situat ii:
A. abaterile standard ale celor dou a caracteristici sunt cunoscute,
B. abaterile standard sunt necunoscute, dar se stie c a sunt egale,
C. abaterile standard sunt necunoscute si diferite,
pe care le trat am pe r and n continuare.
A. Abaterile standard

si

sunt cunoscute.
Se consider a statistica
(5.3.5) Z =
_

_
(m

)
_

2
n

2
n

,
care urmeaz a legea normal a N (0, 1) (a se vedea Observat ia 4.2.29). Astfel, pen-
tru probabilitatea de risc (0, 1) dat a, se poate determina intervalul numeric
(z
1
, z
2
) =
_
z
1

2
, z
1

2
_
astfel nc at P (z
1
< Z < z
2
) = 1 . Anume, z
1

2
se calculeaz a din relat ia
_
z
1

2
_
=
1
2
, unde
(x) =
1

2
_
x
0
e

t
2
2
dt,
este funct ia lui Laplace, tabelat a n Anexa I. Se ajunge astfel la relat ia
(5.3.6) P
_

< m

<

X

_
= 1 ,
270 Teoria estimat iei
unde

= z
1

2
n

2
n

,
care pune n evident a extremit at ile intervalului de ncredere pentru diferent a celor
dou a medii.
B. Abaterile standard

si

sunt egale cu , dar necunoscut.


Se consider a statistica
(5.3.7) T =
_

_
(m

)
_
(n

1)

2
+ (n

1)

+n

2
1
n

+
1
n

,
unde

2
=
1
n

1
n

k=1
_
X

k


X

_
,

2
=
1
n

1
n

k=1
_
X

k


X

_
si care urmeaz a legea Student cu m = n

+ n

2 grade de libertate (a se vedea


Proprietatea 4.2.28).
Ca la punctul precedent se obt in extremit at ile intervalului de ncredere
(5.3.8) m
1,2
=

X

t
m,1

1
n

+
1
n

+n

2
_
(n

1)

2
+ (n

1)

2
,
unde t
m,1

2
este cuantila de ordin 1

2
pentru legea Student cu mgrade de libertate.
C. Abaterile standard

si

sunt diferite si necunoscute.


Se consider a statistica
(5.3.9) T =
_

_
(m

)
_

2
n

2
n

,
care urmeaz a legea Student cu n grade de libertate si care se calculeaz a prin formula
(5.3.10)
1
n
=
c
2
n

1
+
(1 c)
2
n

1
, unde c =

2
n

_
_

2
n

2
n

_
.
Ca la punctul precedent se ajunge la extremit at ile intervalului de ncredere pentru
diferent a celor dou a medii:
(5.3.11) m
1,2
=

X

t
n,1

2
n

2
n


5.3. Metode pentru estimarea parametrilor 271
Exemplul 5.3.34. Masinile M
1
si M
2
ambaleaz a carne n pachete de 1000 grame.
Greutatea cutiilor este o caracteristic a X

, ce urmeaz a legea normal a N (m

) si
respectiv o caracteristic a X

, ce urmeaz a legea normal a N (m

).
C ant arind 100 de pachete din cele produse de masina M
1
sa obt inut valoarea
mediei de select ie x

= 1007 grame, iar din c ant arirea a 150 de pachete de la masina


M
2
sa obt inut x

= 1002 grame.
Folosind probabilitatea de ncredere 0.98, s a determin am intervalul de ncredere
pentru diferent a m

, dac a se stie c a abaterile standard sunt

= 3 si

= 4.
Se foloseste statistica (5.3.5), care urmeaz a legea normal a N (0, 1). Astfel, inter-
valul de ncredere pentru diferent a m

este dat prin (5.3.6), unde z


1

2
se deter-
min a astfel ca
_
z
1

2
_
=
1
2
= 0.49. Folosind Anexa I, obt inem z
1

2
= 2.33.
De asemenea, avem c a

2
n

2
n

=
_
9
100
+
16
150
=
_
59
300
= 0.4435.
Astfel, intervalul de ncredere pentru diferent a m

este
_
_
x

_
z
1

2
n

2
n

;
_
x

_
+z
1

2
n

2
n

_
= (5 2.33 0.4435 ; 5 + 2.33 0.4435) = (3.97 ; 6.03) .
Programul 5.3.35. Executarea programului Matlab:
z1=norminv(0.01,0,1); z2=norminv(0.99,0,1);
s=sqrt(9/100+16/150); d=1007-1002;
m1=d+z1
*
s; m2=d+z2
*
s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)
conduce la rezultatul:
(m1,m2)=( 3.968, 6.032)
Exemplul 5.3.36. Fie caracteristica X

ce urmeaz a legea normal a N (m

, ) si care
reprezint a v anz arile n milioane lei pe s apt am an a la magazinele alimentare n orasul
A si X

v anz arile n milioane lei la magazinele alimentare din orasul B si care


urmeaz a legea normal a N (m

, ). Sau efectuat dou a sondaje, respectiv pentru X

si X

si sau obt inut urm atoarele date de select ie:


X

: 226.5, 224.1, 218.6, 220.1, 228.8, 229.6, 222.5;


X

: 221.5, 230.2, 223.4, 224.3, 230.8, 223.8.


272 Teoria estimat iei
Cu probabilitatea de ncredere 0.95, vrem s a se construim un interval de ncredere
pentru diferent a m

, dac a > 0 este necunoscut.


Folosind statistica (5.3.7), care urmeaz a legea Student cu n = n

+n

2 = 11
grade de libertate, se va construi intervalul de ncredere pentru m

. Anume,
acest interval de ncredere este precizat prin (5.3.8).
Pentru a determina valoarea numeric a a intervalului de ncredere, se calculeaz a
pe r and
x

=
1
7
(226.5 + 224.1 + 218.6 + 220.1 + 228.8 + 229.6 + 222.5) = 224.314,
x

=
1
6
(221.5 + 230.2 + 223.4 + 224.3 + 230.8 + 223.8) = 225.667,

2
=
1
6
7

k=1
_
x

k
x

_
2
= 17.765,

2
=
1
5
6

k=1
_
x

k
x

_
2
= 14.951,
s =

1
7
+
1
6
11
(6 17.765 + 5 14.951) = 2.259.
De asemenea, din Anexa II, pentru 1 = 0.95 si n = 11, obt inem t
n,1

2
= 2.201,
astfel c a intervalul de ncredere pentru m

va
_
_
x

_
t
n,1

2
s ;
_
x

_
+t
n,1

2
s
_
= (1.353 2.201 2.259 ; 1.353 + 2.201 2.259) = (6.32 ; 3.62) .
Programul 5.3.37. Prin executarea programului Matlab:
x1=[226.5,224.1,218.6,220.1,228.8,229.6,222.5];
x2=[221.5,230.2,223.4,224.3,230.8,223.8];
ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;
v1=var(x1); v2=var(x2);
t1=tinv(0.025,11); t2=tinv(0.975,11);
s=sqrt((1/7+1/6)/11)
*
sqrt(6
*
v1+5
*
v2);
m1=md+t1
*
s; m2=md+t2
*
s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)
reg asim intervalul de ncredere pentru diferent a valorilor medii:
(m1,m2)=(-6.324, 3.619)
Exemplul 5.3.38. Se consider a dou a aparate de mbuteliat vin n sticle de 750 ml. Fie
caracteristica X

ce reprezint a cantitatea de vin (n ml) mbuteliat a de primul aparat


ntr-o sticl a si respectiv X

aceeasi caracteristic a pentru al doilea aparat. Pentru com-


pararea modului de mbutliere pentru cele dou a aparate, se consider a c ate o select ie
din sticlele mbuteliate de cele dou a aparate, respectiv
X

: 746 743 748 748 750 745 744 753 750 751 743 747 749 742
X

: 749 748 748 753 750 749 747 745 744 751
5.3. Metode pentru estimarea parametrilor 273
Vom construi un interval de ncredere pentru diferent a m

= E(X

)E (X

) ,
folosind probabilitatea de risc = 0.05. Vom considera c a cele dou a caracteristici
X

si X

sunt independente si c a urmeaz a legile normale N (m

) si N (m

).
Distingem dou a cazuri, unul c and se stie c a

, caz n care se foloseste


statistica (5.3.7), care urmeaz a legea Student cu n = n

+ n

2 grade de libertate,
respectiv c and se stie c a

, caz n care se foloseste statistica (5.3.9), care


urmeaz a legea Student cu n grade de libertate. Num arul n al gradelor de libertate se
calculeaz a, n acest caz, cu formula (5.3.10)

In cazul

, extremit at ile intervalului de ncredere pentru diferent a m

sunt date prin formulele


m
1
=
_
x

_
t
n,1

1
n

+
1
n

+n

2

_
(n

1)

2
+ (n

1)

2
,
m
2
=
_
x

_
+t
n,1

1
n

+
1
n

+n

2

_
(n

1)

2
+ (n

1)

2
.
Cuantila t
n,1

2
= t
22,0.975
= 2.07, s-a determinat, conform Anexei II, din relat ia
F
22
(t
22,0.975
) = 1

2
= 0.975.
Pe de alt a parte
x

=
1
14
(746 + 743 + + 742) = 747.1,
x

=
1
10
(749 + 748 + + 751) = 748.4,
_
n

1
_

2
=
n

k=1
_
x

k
x

_
= (746 747.1)
2
+ + (742 747.1)
2
= 146.94,
_
n

1
_

2
=
n

k=1
_
x

k
x

_
= (749 748.4)
2
+ + (751 748.4)
2
= 64.4.
Astfel avem c a
m
1
= (747.1 748.4) 2.07

1
14
+
1
10
14 + 10 2

146.94 + 64.4 = 4.0,


m
2
= (747.1 748.4) + 2.07

1
14
+
1
10
14 + 10 2

146.94 + 64.4 = 1.3.


274 Teoria estimat iei
Pentru cazul

, calcul am prima dat a num arul n al gradelor de libertate.


Astfel avem c a
c =

2
n

__

2
n

2
n

_
=
11.30
14
__
11.3
14
+
7.16
10
_
=
0.807
0.807 + 0.716
= 0.53,
iar apoi
1
n
=
c
2
n

1
+
(1 c)
2
n

1
=
0.281
13
+
0.221
9
= 0.046,
de unde avem c a n = 22.
Extremit at ile intervalului de ncredere sunt date prin
m
1
=
_
x

_
t
n,1

2
n

2
n

,
m
2
=
_
x

_
+t
n,1

2
n

2
n


Av and n vedere c a t
22,0.975
= 2.07 rezult a c a
m
1
= (747.1 748.4) 2.07

0.807 0.716 = 3.9,


m
2
= (747.1 748.4) + 2.07

0.807 0.716 = 1.2.


Programul 5.3.39. Programul Matlab, care urmeaz a, rezolv a problema precedent a,
adic a, va determina intervale de ncredere pentru diferent a mediilor, n cele dou a
cazuri, c and se consider a dispersii egale si necunoscute, respectiv dispersii diferite
necunoscute.
x1=[746,743,748,748,750,745,744,753,750,751,743,747,749,742];
x2=[749,748,748,753,750,749,747,745,744,751];
ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;
v1=var(x1); v2=var(x2);
t1=tinv(0.025,22); t2=tinv(0.975,22);
s=sqrt((1/14+1/10)/22)
*
sqrt(13
*
v1+9
*
v2);
m1=md+t1
*
s; m2=md+t2
*
s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)
c=(v1/14)/(v1/14+v2/10);n=c2/13+(1-c)2/9;
n=ceil(1/n); t1=tinv(0.025,n); t2=tinv(0.975,n);
s=sqrt(v1/14+v2/10); m1=md+t1
*
s; m2=md+t2
*
s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)
Dup a executarea programului, se obt in cele dou a intervale de ncredere:
(m1,m2)=(-3.990, 1.333)
(m1,m2)=(-3.888, 1.231)
5.3. Metode pentru estimarea parametrilor 275
5.3.5 Metoda intervalelor de ncredere pentru selectii mari
Fie caracteristica X cercetat a, cu legea de probabilitate f (x; ), unde A R
este un parametru necunoscut. Consider am o select ie repetat a de volum n relativ a la
caracteristica X, pentru care avem variabilele de select ie X
1
, X
2
, . . . , X
n
.
Proprietatea 5.3.40. Dac a se consider a variabilele aleatoare Y
1
, Y
2
, . . . , Y
n
denite
prin relat ia
Y
k
=
ln f (X
k
; )

,
si pentru care exist a dispersia V ar (Y
k
) = d
2
> 0, atunci statistica
Z =
1
d

n
n

k=1
Y
k
=
1
d

n
n

k=1
ln f (X
k
; )

,
pentru n , urmeaz a legea normal a N (0, 1).
Demonstrat ie. Variabilele aleatoare X
k
, k = 1, n, ind independente si identic
repartizate, rezult a c a si variabilele aleatoare Y
k
, k = 1, n, sunt independente si iden-
tic repartizate. Conform teoremei limit a central a, avem c a
Y
(n)
=
1
d

n
n

k=1
_
Y
k
E (Y
k
)
_
converge n repartit ie la legea normal a N (0, 1).
Deoarece
E(Y
k
) = E
_
ln f (X
k
; )

_
= 0,
rezult a c a Y
(n)
= Z, ceea ce ncheie demonstrat ia.
Pentru probabilitatea de ncredere 1 dat a se va determina intervalul numeric
_
z
1

2
, z
1

2
_
astfel nc at P
_
Z
_
z
1

2
, z
1

2
__
= 2
_
z
1

2
_
= 1 .
Ceea ce revine la determinarea cuantilei z
1

2
astfel nc at
_
z
1

2
_
=
1
2
Funct ia
a lui Laplace este aici, cea tabelat a n Anexa I.
Prin operat ii algebrice se nlocuieste inegalitatea | Z | < z
1

2
, cu dubla inega-
litate echivalent a de forma

1
(X
1
, X
2
, . . . , X
n
) < <

2
(X
1
, X
2
, . . . , X
n
) , care
deneste intervalul de ncredere pentru parametrul .
Aplicatia 5.3.41. Fie caracteristica X ce ia numai valorile 1 si 0 cu probabilit at ile p
si respectiv 1 p, adic a are funct ia de frecvent a f (x; p) = p
x
(1 p)
1x
, x = 0, 1,
unde p (0, 1) este un parametru necunoscut.
276 Teoria estimat iei
Vom folosi metoda intervalelor de ncredere pentru select ii mari n vederea es-
tim arii parametrului p. Consider am o select ie repetat a de volum (mare) n si probabi-
litatea de ncredere 1 . Deoarece ln f (x; p) = xln p + (1 x) ln (1 p) , avem
c a
ln f (x; p)
p
=
x
p

1 x
1 p
=
x p
p (1 p)
,
si prin urmare se obt ine statistica
Z =
1
d

n
n

k=1
X
k
p
p (1 p)
=

n
p (1 p) d
_

X p
_
.
S tiind c a V ar (X) = p (1 p) rezult a
d
2
=V ar
_
ln f (X
k
; p)
p
_
= V ar
_
X
k
p
p (1 p)
_
=
1
p
2
(1 p)
2
V ar (X
k
)
=
1
p
2
(1 p)
2
p (1 p) =
1
p (1 p)

Statistica Z devine asadar


Z =

n
_
p (1 p)
_

X p
_
si care urmeaz a legea normal a N (0, 1), c and n .
Pentru dat, se determin a z
1

2
= z astfel nc at P ( | Z | < z) = 1 .
Putem scrie c a | Z | < z este echivalent a cu
n
_

X p
_
2
p (1 p)
< z
2
sau
_
n +z
2
_
p
2

_
2n

X +z
2
_
p +n

X
2
< 0.
Discriminantul trinomului este pozitiv, anume = z
2
_
z
2
+ 4n

X
_
1

X
_
> 0,
deci inecuat ia n p are solut ia de forma unui interval ( p
1
, p
2
) si care va reprezenta
intervalul de ncredere pentru parametrul p.
Astfel extremit at ile intervalului de ncredere au urm atoarele expresii:
p
1
=
_
2

X +
z
2
n
_

_
z
4
n
2
+ 4

X
z
2
n
4

X
2
z
2
n
2
_
1 +
z
2
n
_ ,
p
2
=
_
2

X +
z
2
n
_
+
_
z
4
n
2
+ 4

X
z
2
n
4

X
2
z
2
n
2
_
1 +
z
2
n
_
5.3. Metode pentru estimarea parametrilor 277
Aceste formule de calcul sunt complicate. Av and n vedere c a aceste formule au
fost deduse pentru n mare, s a zicem n > 30, c and se obt in rezultate bune, putem
face simplic ari ale acestor formule.

In primul r and putem folosi urm atoarea scriere
asimptotic a
2

X +
z
2
n
2
_
1 +
z
2
n
_

X,
iar apoi

z
4
+ 4

Xnz
2
4

X
2
nz
2
4 (n +z
2
)
2
=

z
4
+ 4

Xnz
2
4

X
2
nz
2
4n
2
+ 8nz
2
+ 4z
4

_

Xnz
2


X
2
nz
2
n
2
= z


X
_
1

X
_
n

S-a ajuns, n acest mod, la intervalul de ncredre pentru p
( p
1
, p
2
) =
_

X z
1


X
_
1

X
_
n
,

X +z
1


X
_
1

X
_
n
_
.
Observatia 5.3.42. Dac a se doreste s a se determine parametrul p cu o incertitudine
p, pentru o probabilitate de ncredere 1, atunci volumul select iei se determin a
n felul urm ator. Av and n vedere c a
z
1


X
_
1

X
_
n

z
1

2
2

n
,
condit ia
z
1

2
2

n
p, echivalent a cu n
z
2
1

2
4(p)
2
, conduce la volumul optim al
select iei.
Mai jos prezent am un tabel cu valorile optime ale volumului select iei pentru
diferite valori ale nivelului de ncredere si ale lui p:
p \ 1 0.90 0.95 0.98
0.01 6760 9600 13530
0.02 1700 2400 3380
0.05 270 380 540
5.3.6 Functii Matlab privind estimatia
Sistemul Matlab, prin Statistics toolbox, dispune de funct ii corespunz atoare teoriei
estimat iei, pe care le prezent am n continuare.
278 Teoria estimat iei
Functia histfit
Funct ia histfit are drept rezultat reprezentarea pe aceeasi gur a a histogramei si
a densit at ii legii normale N ( x, ).
Lansarea execut arii funct iei se face prin una din formele
histfit(x)
histfit(x,nc)
unde x este un vector ce cont ine datele ce urmeaz a a prelucrate, iar nc este num arul
claselor. Dac a parametrul nc este absent, atunci num arul claselor se consider a ca
ind radicalul volumului datelor, adic a radicalul lungimii vectorului x.
Programul 5.3.43. Programul urm ator genereaz a n numere aleatoare, ce urmeaz a
legea normal a N (, ), dup a care apeleaz a la funct ia histfit, iar gracul obt inut,
pentru n=100, = 10 si = 2, este prezentat n Figura 5.5.
n=input(n=); mu=input(mu=);
s=input(sigma=);x=normrnd(mu,s,1,n);
histfit(x), colormap spring
4 6 8 10 12 14 16
0
2
4
6
8
10
12
14
16
18
20
Figura 5.5: Legea N (10, 2)
Functia mle
Pentru estimarea parametrilor, folosind metoda verosimilit at ii maxime, precum si
metoda intervalelor de ncredere, poate utilizat a funct ia mle. Apelul funct iei se
poate face prin una din instruct inile:
5.3. Metode pentru estimarea parametrilor 279
P=mle(lege,x)
[P,int]=mle(lege,x)
[P,int]=mle(lege,x,alpha)
[P,int]=mle(lege,x,alpha,n)
unde lege specic a una din legile: bernoulli, unid, bino, poiss, geo,
unif, norm, gam, exp, beta, weib si rayl. Parametrul x este un vector, iar
n urma execut arii unei astfel de instruct iune, P si int vor cont ine estimatori de
verosimilitate maxim a, respectiv intervale de ncredere, pentru parametrii legii con-
siderate, obt inute pe baza datelor cont inute de x.
Parametrul opt ional alpha, av and valoarea implicit a alpha=0.05, specic a
probabilitate de ncredere, 1-alpha, n construirea intervalelor de ncredere.
Ultima form a este specic a numai legii binomiale, adic a lege=bino, parame-
trul n ind parametrul cel de la legea B(n, p). Dac a x si n sunt scalari, se returneaz a
n P raportul acestora, dac a x este vector si n este scalar, se va returna n P ecare
element a lui x mp art it la n, iar dac a x si n sunt vectori de aceleasi dimensiuni, P va
cont ine rapoartele pe componente ale lui x si n.
Mai remarc am c a pentru prima dat a nt alnim legea lui Bernoulli, care reprezint a
cazul particular al legii binomiale, B(1, p). Dac a lege=bernoulli, atunci x, de-
sigur, trebuie s a cont in a numai valorile 0 si 1.
Functia 5.3.44. Vom scrie o funct ie, care genereaz a n numere aleatoare ce urmeaz a
una din legile de probabilitate: uniform a discret a, Poisson, uniform a, normal a,
Gamma, exponent ial a, Weibull si Rayleigh. Se va apela aceast a funct ie pentru
obt inerea estimat iilor de verosimilitate maxim a ale parametrilor legii de probabi-
litate considerate. De asemenea, se va reprezenta grac, pe aceeasi gur a, funct ia
de repartit ie a legii de probabilitate considerat a, mpreun a cu funct ia de repartit ie a
aceleasi legi, dar av and parametrii precizat i nlocuit i cu estimat iile acestora.
function veros(lege,n)
switch lege
case unid
P1=input(N=);
case poiss
P1=input(lambda=);
case unif
P1(1)=input(a=); P1(2)=input(b=);
case norm
P1(1)=input(mu=); P1(2)=input(sigma=);
case gam
P1(1)=input(a=); P1(2)=input(b=);
case exp
P1=input(mu=);
case beta
P1(1)=input(a=); P1(2)=input(b=);
case weib
P1(1)=input(a=); P1(2)=input(b=);
280 Teoria estimat iei
case rayl
P1=input(b=);
otherwise
error(Eroare)
end
if length(P1)==1
x=random(lege,P1,1,n);
else
x=random(lege,P1(1),P1(2),1,n);
end
P2=mle(lege,x); xx=min(x):0.01:max(x);
if length(P1)==1
F1=cdf(lege,xx,P1); F2=cdf(lege,xx,P2);
else
F1=cdf(lege,xx,P1(1),P1(2)); F2=cdf(lege,xx,P2(1),P2(2));
end
plot(xx,F1,k-.,xx,F2,k-)
legend(Functia de repartitie teoretica,...
Functia de repartitie estimata,2)
Apelul funct iei veros se face prin
>>veros(lege,n)
unde valorile pentru n si lege, e c a sunt precizate n acest apel, e sunt precizate
nainte. De exemplu, comanda
>>veros(poiss,50)
are ca efect apelul funct iei pentru legea lui Poisson, iar pe ecran se va cere introduce-
rea parametrului lambda, dup a care pe ecran va reprezentat gracul din Figura 5.6,
n cazul n care lambda=7. S a remarc am totusi c a la un nou apel, cu aceeasi para-
metri, gracul difer a, deoarece sunt generate alte numere aleatoare.
Dac a se consider a comanda
>>veros(norm,50)
are ca efect apelul funct iei pentru legea normal a, iar pe ecran se va cere introdu-
cerea parametrilor mu si sigma, dup a care pe ecran va reprezentat gracul din
Figura 5.7, n cazul n care mu=10 si sigma=2.
Functiile normlike, gamalike,betalike si weiblike
Funct iile normlike, gamlike, betalike si weiblike sunt specice pentru
Statistics toolbox si se pot apela cu una din comenzile
L=numef(par,x)
[L,cov]=numef(par,x)
unde numef reprezint a numele uneia din cele patru funct ii.
Parametrul par cont ine respectiv parametrii legilor normal a, gamma, beta si
Weibull, iar x este un vector, care cont ine datele de select ie.
5.3. Metode pentru estimarea parametrilor 281
2 4 6 8 10 12 14
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Functia de repartitie teoretica
Functia de repartitie estimata
Figura 5.6: Legea Po (7)
4 5 6 7 8 9 10 11 12 13 14
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Functia de repartitie teoretica
Functia de repartitie estimata
Figura 5.7: Legea N (10, 2)
282 Teoria estimat iei
Prima form a returneaz a n L valoarea logaritmului funct iei de verosimilitate de
parametrii precizat i prin par, nmult it a cu -1.
Dac a se foloseste a doua form a, se mai returneaz a matricea var, care reprezint a
valoarea asimptotic a a matricei covariant elor estimatorilor parametrilor legii con-
siderate, c and sau considerat parametrii de intrare par, ca ind estimat iile de
verosimilitate maxim a ale acestora. Remarc am faptul c a var reprezint a inversa ma-
tricei informat iei lui Fisher, c and volumul select iei tinde la innit.
Functiile binofit, poissfit, unifit, normfit,
gamfit, expfit, betafit, raylfit si weibfit
Funct iile Matlab din aceast a categorie returneaz a estimat ii punctuale si intervale de
ncredere pentru parametrii respectiv ai legilor de probabilitate binomial a , Poisson,
uniform a, normal a, Gamma, exponent ial a, Beta, Rayleigh si Weibull.
Apelul acestor funct ii nu are o sintax a general a.
Pentru funct ia binofit se pot folosi comenzile
P=binofit(x,n)
[P,int]=binofit(x,n)
[P,int]=binofit(x,n,alpha)
parametrul x ind un vector, iar n precizeaz a parametrul ntreg pozitiv al legii bino-
miale B(n, p). Pentru funct iile poiss si exp, respectiv pentru gam, beta, rayl
si weib, apelurile sunt de forma:
P=numef(x)
[P,int]=numef(x,alpha)
unde parametrul numef reprezint a numele funct iei, iar x este e un vector, e o
matrice, pentru prima grup a de funct ii, iar pentru a doua, numai vector. Dac a x este
matrice, atunci funct ia opereaz a pentru ecare coloan a n parte.
Pentru legile unif si norm, apelurile sunt:
[par1,par2,int1,int2]=unifit(x)
[par1,par2,int1,int2]=normfit(x,alpha)
unde x poate vector sau matrice.

In al doilea caz, operat iunea se execut a pentru
ecare coloan a n parte.
De regul a, estimat iile punctuale returnate, sunt obt inute prin metoda verosimili-
t at ii maxime, folosinduse datele cont inute n parametrul x, n parametrii P, par1
si par2. Intervalele de ncredere sunt returnate n parmetrii int, int1 si int2, si
sunt determinate folosind probabilitatea de ncredere 1-alpha. Valoarea implicit a
pentru alpha ind alpha=0.05.
Pentru legile unif si norm, n comenzile de apel pot lipsi int2, int1 si par2,
caz n care sunt returnate numai valorile parametrilor r amasi.
Mai remarc am faptul c a int, int1 si int2 au c ate dou a componente, ex-
tremit at ile intervalului de ncredere corespunz ator.
5.3. Metode pentru estimarea parametrilor 283
Functia 5.3.45. Vom scrie o funct ie, care genereaz a n numere aleatoare, ce urmeaz a
una din legile Gamma, Beta, Weibull si Rayleigh. Folosind aceste numere, se vor
da estimat ii punctuale pentru parametrii acestora, precum si intervale de ncredere,
consider and o probabilitate de ncredere 1-alpha specicat a. Folosind estimat iile
punctuale obt inute pentru parametri, se vor reprezenta grac densit at ile de proba-
bilitate, folosind parametrii estimat i si respectiv parametrii considerat i la generarea
numerelor aleatoare. De asemenea, se vor asa intervalele de ncredere obt inute.
function estimat(lege,n,alpha)
switch lege
case gam
a=input(a=); b=input(b=);
x=gamrnd(a,b,n,1); [P,I]=gamfit(x,alpha);
case beta
a=input(a=); b=input(b=);
x=betarnd(a,b,n,1); [P,I]=betafit(x,alpha);
case weib
a=input(a=); b=input(b=);
x=weibrnd(a,b,n,1); [P,I]=weibfit(x,alpha);
case rayl
b=input(b=); x=raylrnd(b,n,1);
[P,I]=raylfit(x,alpha);
otherwise
error(Eroare)
end
t=min(x):0.01:max(x);
if length(P)==1
y=pdf(lege,t,P); yy=pdf(lege,t,b);
fprintf( bbarat=%6.3f\n,P)
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I)
else
y=pdf(lege,t,P(1),P(2)); yy=pdf(lege,t,a,b);
fprintf( abarat=%6.3f, bbarat=%6.3f\n,P)
fprintf( (a1,a2)=(%6.3f,%6.3f)\n,I(1,1),I(2,1))
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I(1,2),I(2,2))
end
plot(t,y,k-,t,yy,k-.), plot(t,y,k-,t,yy,k-.)
legend(Legea estimata, Legea teoretica)
Apelul funct iei estimat se face prin
>>estimat(lege,n,alpha)
unde valorile pentru n, lege si alpha, e c a sunt precizate n acest apel, e sunt
precizate nainte. De exemplu, comanda
>>estimat(beta,500,0.01)
are ca efect apelul funct iei pentru legea Beta, iar pe ecran se va cere introducerea
parametrilor a si b, dup a care pe ecran va reprezentat gracul din Figura 5.8, n
cazul n care a=3 si b=7. S a remarc am totusi c a la un nou apel, cu aceeasi parametri,
gracul difer a, deoarece sunt generate alte numere aleatoare. De asemenea, se vor
asate si estimat iile punctuale, respectiv intervalele de ncredere:
284 Teoria estimat iei
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
0
0.5
1
1.5
2
2.5
3
Legea estimata
Legea teoretica
Figura 5.8: Legea Beta (3, 7)
abarat= 2.925, bbarat= 7.130
(a1,a2)=( 2.431, 3.418)
(b1,b2)=( 5.928, 8.333)
Capitolul 6
Vericarea ipotezelor statistice
6.1 Concepte de baz a
Fie colectivitatea C cercetat a din punct de vedere al caracteristicii X, care are le-
gea de probabilitate dat a prin funct ia de probabilitate f (x; ), ce reprezint a funct ia
de frecvent a n cazul discret, respectiv densitatea de probabilitate n cazul continuu,
pentru variabila aleatoare X.
Denitia 6.1.1. Numim ipotez a statistic a o presupunere relativ a la legea de probabi-
litate pe care o urmeaz a caracteristica X.
Denitia 6.1.2. Metoda de stabilire a veridicit at ii unei ipoteze statistice, se numeste
test (criteriu) de vericare a ipotezei statistice.
Denitia 6.1.3. C and ipoteza statistic a se refer a la parametri de care depinde legea
de probabilitate a caracteristicii X se obt ine un test parametric, iar n caz contrar se
obt ine un test neparametric.
Observatia 6.1.4. Pentru testele parametrice vom considera c a A = A
0
A
1
,
unde A
0
A
1
= . Ipoteza H
0
: A
0
o vom numi ipotez a nul a, iar ipoteza
H
1
: A
1
o vom numi ipotez a alternativ a.
Denitia 6.1.5. O ipotez a parametric a se numeste ipotez a simpl a, dac a mult imea la
care se presupune c a apart ine parametrul necunoscut este format a dintr-un singur
element, iar n caz contrar se numeste ipotez a compus a.
Observatia 6.1.6. Ipoteza nul a este aceea care o intuim a cea apropriat a de re-
alitate, intuit ie pe care o obt inem din informat iile pe care le det inem referitoare la
caracteristica cercetat a X.
285
286 Vericarea ipotezelor statistice
Observatia 6.1.7. Construirea unui test revine la obt inerea unui domeniu U R
n
,
numit regiune critic a, pentru un nivel de semnicat ie (probabilitate de risc) dat,
astfel nc at
P
_
(X
1
, X
2
, . . . , X
n
) U

H
0
_
= ,
unde X
1
, X
2
, . . . , X
n
sunt variabilele de select ie corespunz atoare unei select ii de
volum n considerat a.
Folosind datele de select ie si regiunea critic a U astfel determinat a, avem c a
ipoteza nul a H
0
va admis a (acceptat a) dac a (x
1
, x
2
, . . . , x
n
) / U, iar n caz contrar
va respins a, altfel spus ipoteza alternativ a H
1
va admis a (acceptat a) n al doilea
caz.
6.2 Testul Z privind media teoretic a
Se consider a caracteristica X care urmeaz a legea normal a N (m, ), unde m R
este necunoscut, iar > 0 este cunoscut.
Relativ la media teoretic a m = E (X) facem ipoteza nul a H
0
: m = m
0
, cu una
din alternativele:
H
1
: m = m
0
(testul Z bilateral),
H
1
: m > m
0
(testul Z unilateral dreapta),
H
1
: m < m
0
(testul Z unilateral st anga).
Pentru vericare ipotezei nule H
0
cu una din alternativele precizate mai nainte,
consider am o select ie repetat a de volum n si un nivel de semnicat ie (0, 1).
Se cunoaste c a statistica
Z =

X m

n
,
urmeaz a legea normal a N (0, 1). Prin urmare, pentru (0, 1), putem determina un
interval numeric (z
1
, z
2
) astfel nc at
P (z
1
< Z < z
2
| H
0
) = (z
2
) (z
1
) = 1 .
Intervalul (z
1
, z
2
) nu este determinat n mod unic, dar av and n vedere alternativa
H
1
considerat a, ad aug am condit ia suplimentar a:
z
1
= z
2
, dac a H
1
: m = m
0
, adic a
_
z
1

2
_
=
1
2
, unde z
1

2
= z
2
;
z
1
= , z
2
= z
1
, unde (z
1
) =
1
2
, dac a H
1
: m > m
0
;
6.2. Testul Z privind media teoretic a 287
z
1
= z

, z
2
= +, unde (z

) =
1
2
, dac a H
1
: m < m
0
.
Corespunz ator celor trei alternative denim regiunea critic a respectiv prin:
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

| u m
0
|

n
z
1

2
_
,
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0

n
z
1
_
,
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0

n
z

_
.
Aici s-a folosit notat ia u =
1
n

n
k=1
u
k
.

Intr-adev ar, pentru ecare din cele trei regiunui critice scrise mai nainte, avem
c a P
_
(X
1
, X
2
, . . . , X
n
) U | H
0
_
= . Modul n care am ales regiunea critic a ne
conduce respectiv la testul Z bilateral, unilateral dreapta si unilateral st anga.
Mai t arziu va fundamentat a riguros modalitatea de construire a regiunii critice
pentru alternativele considerate.
Odat a construit a regiunea critic a U, ipoteza nul a va admis a dac a datele de
select ie satisfac condit ia (x
1
, x
2
, . . . , x
n
) / U, iar n caz contrar va respins a.
Remarc am de asemenea c a regiunea critic a U corespunde mult imii comple-
mentare intervalului (z
1
, z
2
).
Etapele aplic arii testului Z
1. Se dau: ; x
1
, x
2
, . . . , x
n
; m
0
; ;
2. Se calculeaz a intervalul (z
1
, z
2
) astfel nc at (z
2
)(z
1
) = 1 (dup a cum
s-a precizat mai nainte);
3. Se calculeaz a z =
x m
0

n
, unde x =
1
n
n

k=1
x
k
;
4. Concluzia: dac a z (z
1
, z
2
) ipoteza H
0
este admis a, n caz contrar ipoteza
este respins a.
Observatia 6.2.1. Testul Z se poate aplica si n cazul unei caracteristici X care nu
urmeaz a legea normal a, dac a volumul select iei este mare (n > 30), consider andu-
se media teoretic a m = E(X) necunoscut a si abaterea standard =
_
V ar (X)
cunoscut a. Aceast a considerat ie se bazeaz a pe Teorema 2.7.8.
288 Vericarea ipotezelor statistice
Exemplul 6.2.2. Caracteristica X reprezint a cheltuielile lunare n mii lei pen-
tru abonamentele la ziare si reviste ale unei familii. S a se verice, cu nivelul de
semnicat ie = 0.01, dac a media acestor cheltuieli lunare pentru o familie este
de 16 mii lei, stiind c a abaterea standard = 3 mii lei si av and o select ie repetat a de
volum n = 40, care ne d a distribut ia empiric a de select ie
X
_
_
11 13 15 17 20
4 6 12 10 8
_
_
.
Deoarece n = 40 > 30 si abaterea standard = 3 este cunoscut a, vom folosi testul
Z pentru vericarea ipotezei nule
H
0
: m = E(X) = 16, cu ipoteza alternativ a H
1
: m = 16.
Pentru = 0.01, folosind Anexa I, se determin a z
1

2
= z
0.995
, astfel nc at
(z
0.995
) =
1
2
= 0.495.
Anume, se obt ine c a z
0.995
= 2.58, care ne d a intervalul numeric (2.58 ; 2.58)
pentru statistica notat a prin:
Z =

X m

Calcul am succesiv
x =
1
n
n

k=1
x
k
=
1
40
(4 11 + 6 13 + 12 15 + 10 17 + 8 20) = 15.8;
z =
x m
0

n
=
15.8 16
3

40
=
0.2

40
3
= 0.422.
Deoarece z = 0.422 (2.58 ; 2.58), rezult a c a se accept a ipoteza c a cheltuielile
medii lunare ale unei familii pentru abonamentele la ziare si reviste sunt de 16 mii
lei, cu nivelul de semnicat ie 0.01.
Programul 6.2.3. Programul Matlab, care urmeaz a, execut a aceste calcule si aseaz a
intervalul de ncredere, mpreun a cu valoarea calculat a a statsiticii Z.
x=[11 13 15 17 20]; f=[4 6 12 10 8];
z=(sum(x.
*
f)/40-16)/(3/sqrt(40));
z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);
fprintf( (z1,z2)=(%6.3f,%6.3f)\n,z1,z2)
fprintf( z=%6.3f,%6.3f),z)
6.2. Testul Z privind media teoretic a 289

In urma execut arii programului, sau obt inut rezultatele:


(z1,z2)=(-2.576, 2.576)
z=-0.422,
Observatia 6.2.4. Av and n vedere c a funct ia a lui Laplace este monoton
cresc atoare si c a pentru determinarea intervalului (z
1
, z
2
) este necesar a inversarea
funct iei lui Laplace, se poate renunt a la inversarea acesteia. Pentru aceasta se deter-
min a ceea ce se numeste valoare critic a si pe care o not am prin c. Vom analiza pe
r and cele trei alternative.
Dac a se consider a testul bilateral, f ac and notat ia
1
c
2
= (|z|) , adic a c = 1 2(|z|) ,
ipoteza nul a va respins a dac a 1
c
2
1

2
, adic a c .
Pentru testul unilateral dreapta, se noteaz a
1 c =
1
2
+(z) , adic a c =
1
2
(z) ,
iar ipoteza nul a este respins a, dac a 1 c 1 , adic a, la fel ca mai nainte, dac a
c .
Un rat ionament analog, pentru testul unilateral st anga ne conduce la valoarea
critic a, calculat a dup a formul a c =
1
2
+ (z). Drept urmare, ipoteza nul a este
respins a, dac a c .

In rezumat, ipoteza nul a este respins a, dac a c , unde


c =
_

_
1 2(|z|), dac a H
1
: m = m
0
,
1
2
(z), dac a H
1
: m > m
0
,
1
2
+(z), dac a H
1
: m < m
0
.
Pentru datele din Exemplul 6.2.2, se obt ine
c =
_

_
0.673, pentru testul bilateral,
0.663, pentru testul unilateral dreapta,
0.337, petru testul unilateral st anga.
290 Vericarea ipotezelor statistice
6.2.1 Functiile zscore si ztest
Sistemul Matlab, prin Statistics toolbox, dispune de funct iile zscore si ztest, cu
aplicabilitate la testul Z. Apelarea acestor funct ii se face prin:
z=zscore(d)
h=ztest(x,m0,sigma)
h=ztest(x,m0,sigma,alpha)
h=ztest(x,m0,sigma,alpha,tail)
[h,c,ci,zc]=ztest(x,m0,sigma,alpha,tail)

In urma execut arii primei instruct iuni, dac a d este un vector, se calculeaz a abaterile
componentelor vectorului de la valorea medie a componentelor, raportate la abaterea
standard a componentelor, adic a x
i
=
d
i

d

d
Dac a d este matrice, atunci operat ia
este executat a pentru ecare coloan a n parte.
Celelalte instruct iuni se refer a la funct ia ztest si efectueaz a testul Z asupra
datelor cont inute n vectorul x, folosind nivelul de semnicat ie alpha, care are va-
loarea implicit a alpha=0.05.
Parametrul tail specic a una din cele trei alternative, care conduc la tes-
tul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral st anga
(tail=-1). Dac a h=1, atunci ipoteza nul a va respins a, respectiv dac a h=0,
ipoteza nu poate respins a.
Ultima form a de apel permite, de asemenea, obt inerea valorii critice c, a valorii
zc a statisticii Z, precum si a intervalului de ncredere pentru media teoretic a, cores-
punz ator probabilit at ii de ncredere 1-alpha, obt inut n vectorul cu dou a compo-
nente ci.
Programul 6.2.5. Programul Matlab, ce urmeaz a, rezolv a problema din Exem-
plul 6.2.2. Mai mult, se consider a si testele unilateral dreapta si unilateral st anga,
precum si obt inerea intervalelor de ncredere.
x=[11
*
ones(1,4),13
*
ones(1,6),15
*
ones(1,12),...
17
*
ones(1,10),20
*
ones(1,8)];
fprintf( h c ci z\n)
fprintf(____________________________________\n)
for i=-1:1
[h,c,ci,zc]=ztest(x,16,3,0.01,i);
fprintf( %d %5.4f (%4.2f,%4.2f) %6.4f\n,...
h,c,ci,zc)
end

In urma execut arii programului, se obt in rezultatele:


h c ci z
____________________________________
0 0.3366 (-Inf,16.90) -0.4216
0 0.6733 (14.58,17.02) -0.4216
0 0.6634 (14.70, Inf) -0.4216
6.3. Puterea unui test 291
Se observ a c a pentru tail=-1 si tail=1, se construiesc intervale nem arginite,
respectiv la st anga si la dreapta.
6.3 Puterea unui test
Denitia 6.3.1. Dac a se consider a un test relativ la ipoteza nul a H
0
cu alternativa
H
1
, se numeste eroare de genul (spet a) nt ai respingerea unei ipoteze adev arate, iar
probabilitatea acestei erori se numeste risc de spet a nt ai (risc al furnizorului) si este
dat a de nivelul de semnicat ie, adic a
= P
_
(X
1
, X
2
, . . . , X
n
) U

H
0
_
.
Denitia 6.3.2. Se numeste eroare de genul (spet a) al doilea admiterea unei ipoteze
false, iar probabilitatea acestei erori se numeste risc de spet a a doua (risc al bene-
ciarului) si este notat a ,
= P
_
(X
1
, X
2
, . . . , X
n
) / U

H
1
_
.
Observatia 6.3.3. Producerea unei erori de genul al doilea este mai grav a dec at a
unei erori de genul nt ai, c and veric am concentrat ia unui medicament, care peste
un anumit grad de concentrat ie devine d aun ator. Pe de alt a parte, producerea unei
erori de genul nt ai este mai grav a dec at cea a unei erori de genul doi, c and veric am
calitatea unui articol de mbr ac aminte.
Denitia 6.3.4. Numim puterea unui test probabilitatea respingerii unei ipoteze false,
adic a

_
=
_
U;

_
= P
_
(X
1
, X
2
, . . . , X
n
) U

_
,
c and este parametrul asupra c aruia se face ipoteza statistic a, iar U este regiunea
critic a construit a sub ipoteza nul a cu nivelul de semnicat ie (0, 1) xat.
Observatia 6.3.5. Dac a testul considerat se refer a la ipoteza nul a H
0
: =
0
cu
ipoteza alternativ a H
1
: =
1
, atunci (
0
) = si (
1
) = 1 .
Aplicatia 6.3.6. Calcul am n continuare puterea testului Z, c and avem ipoteza alter-
nativ a H
1
: m = m
1
= m
0
.
Dup a cum am v azut la testul Z regiunea critic a n acest caz este
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

| u m
0
|

n
z
1

2
_
.
292 Vericarea ipotezelor statistice
Pentru calculul puterii (m
1
) a testului avem
(m
1
) = P
_
(X
1
, X
2
, . . . , X
n
) U

H
1
_
= P
_


X m
0

n
z
1

H
1
_
.
Dac a se consider a evenimentul contrar, vom putea scrie succesiv
=1 (m
1
) = P
_


X m
0

n
< z
1

H
1
_
=P
_
z
1

2
<

X m
1

m
0
m
1

n
< z
1

H
1
_
=P
_
m
0
m
1

n
z
1

2
<

X m
1

n
<
m
0
m
1

n
+z
1

H
1
_
,
de unde avem c a
(6.3.1) =
_
m
0
m
1

n
+z
1

2
_

_
m
0
m
1

n
z
1

2
_
,
adic a
(6.3.2) (m
1
) = 1
_
m
0
m
1

n
+z
1

2
_
+
_
m
0
m
1

n
z
1

2
_
.
Deoarece (+) = 0.5 si () = 0.5, rezult a c a pentru n , vom
avea 0, adic a (m
1
) 1. Asadar, putem determina, din relat ia precedent a
valoarea lui n (volumul select iei) astfel nc at puterea testului (corespunz ator riscul
de spet a a doua) s a e atins a pentru acel n.
Exemplul 6.3.7. Relativ la caracteristica X s-a efectuat o select ie de volum n = 24,
obt in andu-se datele de select ie
3.59 4.27 2.83 2.28 3.69 2.81 3.16 3.03 3.65 3.84 4.32 3.21
3.20 3.32 3.82 3.27 3.77 3.56 3.29 4.08 2.97 3.29 3.78 3.58 .
S tiind c a X urmeaz a legea normal a N (m, ) cu abaterea standard teoretic a cunos-
cut a =
_
V ar (X) = 0.5, vrem s a veric am ipoteza nul a H
0
: m = 3.5, c and
se consider a ipoteza alternativa H
1
: m = 3.5, cu nivelul de semnicat ie = 0.01,
iar apoi s a calcul am puterea testului, c and m = 3.4, 3.5, 3.6, 3.7, si s a determin am
volumul n optim al select iei c and se consider a alternativa H
1
: m = 3.4, si riscul de
spet a a doua = 0.05.
6.3. Puterea unui test 293
C and se consider a alternativa H
1
: m = 3.5 se foloseste testul Z bilateral. Se
determin a cuantila
z
1

2
= 2.58 din relat ia
_
z
1

2
_
=
1
2
=
0.99
2
= 0.495.
Pe de alt a parte avem c a
x =
1
n
n

k=1
x
k
=
1
24
(3.59 + 4.27 + + 3.58) = 3.44,
astfel c a
z =
x m
0

n
=
3.44 3.5
0.5

24
= 0.57.
Deoarece | z | = 0.57 < 2.58 = z
1

2
, ipoteza H
0
: m = 3.5 este admis a.
Formula de calcul a puterii testului Z bilateral este (6.3.2). Prin urmare, se obt ine
(3.4) = 1
_
0.4

6 + 2.58
_
+
_
0.4

6 2.58
_
= 0.06,
(3.5) = 1 (2.58) +(2.58) = 0.01,
(3.6) = 1
_
0.4

6 + 2.58
_
+
_
0.4

6 2.58
_
= 0.05,
(3.7) = 1
_
0.8

6 + 2.58
_
+

_
0.8

6 2.58
_
= 0.27.
Pentru determinarea volumului optim al select iei, c and se consider a alternativa
H
1
: m = 3.4, se foloseste formula (6.3.1). Astfel se obt ine
0.05 = =
_
3.5 3.4
0.5

n
+ 2.58
_

_
3.5 3.4
0.5

n
2.58
_
=
_
1
5

n + 2.58
_

_
1
5

n 2.58
_
.
C and n este astfel nc at
1
5

n 2.58 < 0, se observ a c a valoarea = 0.05 nu poate


atins a. Dac a
1
5

n2.58 > 0, atunci n > 166, astfel avem


_
1
5

n + 2.58
_
0.5.
Prin urmare, pentru determinarea lui n optim avem relat ia
_
1
5

n 2.58
_
= 0.45,
si folosind Anexa I se obt ine
1
5

n 2.58 = 1.65, adic a

n = 5 4.23 = 21.15, de
unde se obt ine n = 448.
Programul 6.3.8. Programul Matlab, ce urmeaz a, pe l ang a faptul c a va efectua cal-
culele din exemplul precedent, va reprezenta grac si funct ia putere. Punctele de pe
curba puterii, ale c aror valori au fost calculate n exemplul de mai sus, sunt marcate
prin cerculet e n Figura 6.1.
294 Vericarea ipotezelor statistice
clear,clf
x=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...
3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...
3.29,4.08,2.97,3.29,3.78,3.58];
z=(mean(x)-3.5)/(0.5/sqrt(24));
z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);
fprintf( z=%6.3f\n z1=%6.3f\n z2=%6.3f\n,z,z1,z2)
m=3:0.01:4; m1=3.4:0.1:3.7;
c1=norminv(0.005,0,1); c2=norminv(0.995,0,1);
pib=1-normcdf((3.5-m)./(0.5/sqrt(24))+c2,0,1)...
+normcdf((3.5-m)./(0.5/sqrt(24))+c1,0,1);
pib1=1-normcdf((3.5-m1)./(0.5/sqrt(24))+c2,0,1)...
+normcdf((3.5-m1)./(0.5/sqrt(24))+c1,0,1);
plot(m,pib,k-,m1,pib1,o), grid on, len=length(m1);
for i=1:len
fprintf( pi(%3.1f)=%5.3f\n,m1(i),pib1(i))
end
za=norminv(0.005,0,1); zb=norminv(0.95,0,1);
n=ceil(0.52
*
(zb-za)2/(3.5-3.4)2);
fprintf( nopt=%3d,n)
Rezultatele obt inute, n urma execut arii programului, sunt urm atoarele:
z=-0.567
z1=-2.576
z2= 2.576
pi(3.4)=0.055
pi(3.5)=0.010
pi(3.6)=0.055
pi(3.7)=0.269
nopt=446
Lema 6.3.9 (NeymanPearson). Fie caracteristica X cu legea de probabilitate dat a
prin f (x; ), unde A R este parametrul necunoscut asupra c aruia se face
ipoteza nul a simpl a H
0
: =
0
, cu ipoteza alternativ a simpl a H
1
: =
1
=
0
.
Se consider a o select ie repetat a de volum n relativ a la caracteristica X si nivelul de
semnicat ie dat (0, 1), atunci
max
_
P
_
(X
1
, . . . , X
n
) U

H
1
_

U R
n
, P
_
(X
1
, . . . , X
n
) U

H
0
_
=
_
= P
_
(X
1
, . . . , X
n
)

U

H
0
_
,
regiunea critic a

U, ind denit a prin

U =
_
(u
1
, . . . , u
n
) R
n

g (u
1
, . . . , u
n
;
1
)
g (u
1
, . . . , u
n
;
0
)
k

> 0
_
,
6.3. Puterea unui test 295
3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Figura 6.1: Curba funct iei putere
unde
g (u
1
, . . . , u
n
; ) =
n

k=1
f (u
k
; ) .
Demonstrat ie. Facem demonstrat ia n dou a etape.

In prima etap a, consider am c a se cunoaste constanta k

> 0 si ar at am c a
1 = P
_
(X
1
, . . . , X
n
) U

H
1
_
P
_
(X
1
, . . . , X
n
)

U

H
1
_
= 1

.
Pentru aceasta, dac a not am W = U

U, obt inem succesiv
_
. . .
_
U
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
= P
_
(X
1
, . . . , X
n
) U

H
0
_
=
= P
_
(X
1
, . . . , X
n
)

U

H
0
_
=
_
. . .
_

U
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
,
de unde avem c a
_
. . .
_
UW
g (u
1
, . . . , u
n
;
0
)du
1
. . . du
n
+
_
. . .
_
W
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
=
_
. . .
_

UW
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
+
+
_
. . .
_
W
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
,
296 Vericarea ipotezelor statistice
adic a
(6.3.3)
_
. . .
_
UW
g (u
1
, . . . , u
n
;
0
)du
1
. . . du
n
=
_
. . .
_

UW
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
.
Putem trece acum la calculul diferent ei

= (1

) (1 )
=P
_
(X
1
, . . . , X
n
)

U

H
1
_
P
_
(X
1
, . . . , X
n
) U

H
1
_
=
_
. . .
_

U
g (u
1
, . . . , u
n
;
1
) du
1
. . . du
n

_
. . .
_
U
g (u
1
, . . . , u
n
;
1
) du
1
. . . du
n
=
_
. . .
_

UW
g (u
1
, . . . , u
n
;
1
) du
1
. . . du
n

_
. . .
_
UW
g (u
1
, . . . , u
n
;
1
) du
1
. . . du
n
.
Scriem aceat a diferent a sub forma


=
_
. . .
_

UW
g (u
1
, . . . , u
n
;
1
)
g (u
1
, . . . , u
n
;
0
)
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n

_
. . .
_
UW
g (u
1
, . . . , u
n
;
1
)
g (u
1
, . . . , u
n
;
0
)
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
.
Pentru ecare integral a din membrul drept aplic am formula de medie. Prin urmare
exist a (
1
,
2
, . . . ,
n
)

UW si (
1
,
2
, . . . ,
n
) UW astfel nc at


=
g (
1
, . . . ,
n
;
1
)
g (
1
, . . . ,
n
;
0
)
_
. . .
_

UW
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n

g (
1
, . . . ,
n
;
1
)
g (
1
, . . . ,
n
;
0
)
_
. . .
_
UW
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
.
Folosind relat ia (6.3.3), stabilit a mai nainte, avem c a


=
_
g (
1
, . . . ,
n
;
1
)
g (
1
, . . . ,
n
;
0
)

g (
1
, . . . ,
n
;
1
)
g (
1
, . . . ,
n
;
0
)
_

_
. . .
_
UW
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
.
6.3. Puterea unui test 297
Dar integrala din membrul drept este pozitiv a, iar din modul cum s-a denit regiunea
critic a

U avem c a
g (
1
, . . . ,
n
;
1
)
g (
1
, , . . . ,
n
;
0
)
k

>
g (
1
, . . . ,
n
;
1
)
g (
1
, . . . ,
n
;
0
)
,
deci

> 0 si ca urmare 1

> 1. Ceea ce ncheie partea nt ai a demonstrat iei.

In partea a doua ar at am existent a constantei k

> 0.
Not am prin A(k) urm atoarea regiune
A(k) =
_
(u
1
, . . . , u
n
) R
n

g (u
1
, . . . , u
n
;
1
) k g (u
1
, . . . , u
n
;
0
)
_
,
si prin s (k), urm atoarea probabilitate
s (k)=P
_
(X
1
, . . . , X
n
) A(k) | H
0
_
=
_
. . .
_
A(k)
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
.
Se observ a c a s (+) = 0, iar
s (0) =
_
. . .
_
R
n
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
= 1.
De asemenea, avem c a funct ia s (k) este monoton descresc atoare. Prin urmare,
pentru (0, 1) xat, exist a k

> 0 astfel nc at s (k

) = , adic a
P
_
(X
1
, . . . , X
n
) A(k

) | H
0
_
= .
Ceea ce ncheie demonstrat ia lemei.
Observatia 6.3.10. Demonstrat ia lemei NeymanPearson a fost f acut a n cazul con-
tinuu.

In mod analog se demonstreaz a si pentru cazul discret, integralele multiple
care apar ind nlocuite cu sume multiple.
Denitia 6.3.11. Testul pentru care puterea este maxim a l numim cel mai puternic
test.
Denitia 6.3.12. Testul pentru care are loc inegalitatea
1 = P
_
(X
1
, X
2
, . . . , X
n
) U | H
1
_
> P
_
(X
1
, X
2
, . . . , X
n
) U | H
0
_
= ,
adic a puterea testului este mai mare dec at riscul de spet a nt ai se numeste test nede-
plasat.
298 Vericarea ipotezelor statistice
Proprietatea 6.3.13. Cel mai puternic test dat de lema NeymanPearson este un test
nedeplasat, adic a 1

> .
Demonstrat ie. Cu notat iile de la lema NeymanPearson, avem c a
_
. . .
_

U
g (u
1
, . . . , u
n
;
1
) du
1
. . . du
n
k

_
. . .
_

U
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
.
Distingem dou a cazuri.
Dac a avem k

> 1, atunci obt inem


1

=
_
. . .
_

U
g (u
1
, . . . , u
n
;
1
) du
1
. . . du
n
k

_
. . .
_

U
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
>
_
. . .
_

U
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
= ,
de unde 1

> .

In cazul c and k

1, avem

=
_
. . .
_

U
g (u
1
, . . . , u
n
;
1
) du
1
. . . du
n
< k

_
. . .
_

U
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n

_
. . .
_

U
g (u
1
, . . . , u
n
;
0
) du
1
. . . du
n
= 1 ,
de unde 1

> , ceea ce trebuie demonstrat.
Observatia 6.3.14. Prin micsorarea riscului de spet a nt ai, pentru n xat, creste con-
stanta k

si prin urmare scade puterea testului, 1



, deci creste riscul de spet a a
doua.
Aplicatia 6.3.15. Fie caracteristica X ce urmeaz a legea normal a N (m, ), unde
m R este necunoscut si > 0 este cunoscut. Fie ipoteza nul a H
0
: m = m
0
, cu
ipoteza alternativ a H
1
: m = m
1
= m
0
. Vrem s a determin am cel mai puternic test
pentru vericarea acestei ipoteze nule.
Pentru aceasta aplic am lema Neyman-Pearson.
Prima dat a determin am regiunea critic a

U.
Deoarece
g (u
1
, u
2
, . . . , u
n
; m) =
_
1

2
_
n
exp
_

1
2
2
n

k=1
(u
k
m)
2
_
,
6.3. Puterea unui test 299
rezult a c a
g (u
1
, u
2
, . . . , u
n
; m
1
)
g (u
1
, u
2
, . . . , u
n
; m
0
)
= exp
_
1
2
2
_
n

k=1
(u
k
m
0
)
2

k=1
(u
k
m
1
)
2
__
.
Condit ia care deneste regiunea critic a

U
g (u
1
, u
2
, . . . , u
n
; m
1
)
g (u
1
, u
2
, . . . , u
n
; m
0
)
k

,
devine prin logaritmare
n

k=1
(u
k
m
0
)
2

k=1
(u
k
m
1
)
2
2
2
ln k

,
sau
2 (m
1
m
0
)
n

k=1
u
k
n(m
1
m
0
) (m
1
+m
0
) 2
2
ln k

,
adic a
2 (m
1
m
0
)
n

k=1
u
k
2
2
ln k

+n(m
1
m
0
) (m
1
+m
0
) .
Distingem n continuare dou a cazuri.
Dac a m
0
> m
1
, avem
1
n
n

k=1
u
k
= u

2
ln k

(m
1
m
0
) n
+
m
1
+m
0
2
,
si not and constanta din membrul drept prin K

, avem c a u K

. Asadar regiunea
critic a a celui mai puternic test este

U =
_
(u
1
, u
2
, . . . , u
n
) R
n
| u K

_
.
Dac a m
0
< m
1
, proced and analog, se ajunge la regiunea critic a

U =
_
(u
1
, u
2
, . . . , u
n
) R
n

u K

_
.
Pentru determinarea constantei K

(cazul m
0
> m
1
), se scrie relat ia
= P
_
(X
1
, X
2
, . . . , X
n
)

U

H
0
_
= P
_

X K

| H
0
_
sau
P
_

X m
0

m
0

H
0
_
= .
300 Vericarea ipotezelor statistice
Prin urmare, K

se va determina astfel nc at
_
Km
0

n
_
= , unde funct ia a lui
Laplace este cea denit a prin
(x) =
1

2
_
x

t
2
2
dt.
Asadar avem cuantila z

, ca ind z

=
Km
0

n
, de unde K

= m
0
+

n
z

In acest fel, regiunea critic a se poate scrie

U =
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0
+

n
z

_
=
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0

n
z

_
.

In cazul m
0
< m
1
, proced and la fel, se ajunge la

U =
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0
+

n
z
1
_
=
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0

n
z
1
_
.
Observatia 6.3.16.

In aplicat ia precedent a, regiunea critic a

U nu depinde de m
1
numai prin faptul c a m
1
< m
0
, respectiv m
1
> m
0
. Drept urmare, ipoteza H
1
se
poate nlocui, pentru cele dou a situat ii prin H
1
: m > m
0
, ceea ce ne conduce
la testul Z unilateral dreapta, respectiv H
1
: m < m
0
, care ne conduce la testul Z
unilateral st anga. Aceasta conrm a justet ea alegerii regiunilor critice n cazul testului
Z unilateral dreapta si respectiv st anga.
Observatia 6.3.17. C and se consider a ipoteza alternativ a H
1
: m = m
0
(testul Z
bilateral), utiliz and lema NeymanPearson, nu putem construi un cel mai puternic
test. Alt a metod a va prezentat a pentru construirea acestuia n acest caz.
Aplicatia 6.3.18. Vrem s a determin am n continuare puterea testului Z stabilit la
Aplicat ia 6.3.15.
Din nou distingem cele dou a cazuri.
Dac a m
0
> m
1
, avem succesiv
(m
1
) = 1

= P
_
(X
1
, X
2
, . . . , X
n
)

U

m = m
1
_
= P
_

Xm
0
+z

m=m
1
_
= P
_

Xm
1

m
0
m
1

n
+z

m=m
1
_
=
_
m
0
m
1

n
+z

_
,
6.3. Puterea unui test 301
unde funct ia a lui Laplace este cea din Aplicat ia 6.3.15.
Dac a m
0
< m
1
, de asemenea, avem
(m
1
) = 1

= P
_
(X
1
, X
2
, . . . , X
n
)

U

m = m
1
_
= P
_

Xm
0
+z
1

m=m
1
_
= P
_

Xm
1

m
0
m
1

n
+z
1

m=m
1
_
=1
_
m
0
m
1

n
+z
1
_
.
Se vede, nc a odat a, n ambele cazuri, c a (m
1
) 1, c and n , adic a

0.
S a ncheiem prin modul de determinare a volumului n al select iei, pentru a se
atinge o putere a testului (sau un risc de spet a a doua) apriori xat a. Desigur c a
este considerat de asemenea dat.

In cazul m
0
> m
1
, din P
_
(X
1
, X
2
, . . . , X
n
)

U

H
0
_
= , am determinat
K

= m
0
+

n
z

. Pe de alt a parte, P
_
(X
1
, X
2
, . . . , X
n
)

U

H
1
_
= 1

se
rescrie n felul urm ator
P
_

X m
1

m
1

H
1
_
= 1

, adic a
_
K

m
1

n
_
= 1

,
de unde se obt ine o alt a relat ie ce l cont ine pe K

, anume
Km
1

n
= z
1

. Com-
par and cele dou a relat ii ce l cont in pe K

, avem c a m
0
+

n
z

= m
1
+

n
z
1

,
de unde se obt ine
(6.3.4) n =

2
_
z
1

_
2
(m
0
m
1
)
2

In cazul m
0
< m
1
, avem urm atoarele dou a relat ii, care l cont in pe K

,
K

= m
0
+

n
z
1
si
K

m
1

n
= z

,
de unde se obt ine
(6.3.5) n =

2
_
z

z
1
_
2
(m
0
m
1
)
2

302 Vericarea ipotezelor statistice
Exemplul 6.3.19. S a consider am aceleasi date de select ie de la Exemplul 6.3.7. Vom
verica ipoteza nul a H
0
: m = 3.5, c and se consider a respectiv ipotezele alternative
H
1
: m < 3.5, H
1
: m > 3.5, iar nivelul de semnicat ie este = 0.01. Vom
calcula puterea pentru ecare din testele considerate, c and m = 3.4, 3.5, 3.6, 3.7,
iar apoi vom determina volumul n optim al select iei c and se consider a alternativa
H
1
: m = 3.4, respectiv H
1
: m = 3.7, cu riscul de spet a a doua xat = 0.05.
C and se consider a alternativa H
1
: m > 3.5 se foloseste testul Z unilateral
dreapta.

In acest caz, cuantila z
1
= 2.33 se determin a din (z
1
) =
1
2
=0.49.
Deoarece z = 0.57 < 2.33 = z
1
, rezult a c a ipoteza nul a este admis a.
Pentru alternativa H
1
: m < 3.5 se foloseste testul Z unilateral st anga. Se deter-
min a z

= 2.33 din relat ia (z

) =
1
2
= 0.49. Deoarece are loc inegalitatea
z = 0.57 > 2.33 = z

, se admite ipoteza H
0
si n acest ultim caz.
Pentru testul Z unilateral dreapta, formula de calcul a puterii este
(m) =
1
2

_
m
0
m

n
+z
1
_
,
si prin urmare
(3.4) =
1
2

_
0.4

6 + 2.33
_
=0, (3.6) =
1
2

_
0.4

6 + 2.33
_
=0.09,
(3.5) =
1
2
(2.33) =0.01, (3.7) =
1
2

_
0.8

6 + 2.33
_
=0.36.

In cazul testului Z unilateral st anga, avem


(m) =
1
2
+
_
m
0
m

n
+z

_
,
deci
(3.4) =
1
2
+
_
0.4

6 2.33
_
=0.09, (3.6) =
1
2
+
_
0.4

6 2.33
_
=0,
(3.5) =
1
2
+(2.33) =0.01, (3.7) =
1
2
+
_
0.8

6 2.33
_
=0.
Pentru determinarea volumului optim al select iei, c and folosim testul unilateral
st anga, cu alternativa H
1
: m = 3.4, se utilizeaz a formula (6.3.4):
n =

2
(z
1
z

)
2
(m
0
m
1
)
2
=
0.25 (1.65 + 2.33)
2
(3.5 3.4)
2
,
de unde se obt ine n = 396.
6.3. Puterea unui test 303
Pentru determinarea volumului optim al select iei, c and folosim testul unilateral
dreapta, cu alternativa H
1
: m = 3.7, se utilizeaz a formula (6.3.5). Astfel volumul
optim n al select iei se calculeaz a cu formula:
n =

2
(z

z
1
)
2
(m
0
m
1
)
2
=
0.25 (1.65 2.33)
2
(3.5 3.7)
2
=
1584
16
,
de unde se obt ine n = 99.
Programul 6.3.20. Programul Matlab urm ator, efectueaz a calculele din exemplul
precedent, iar n plus, reprezint a grac curbele putere, n cazul celor dou a alterna-
tive. Punctele de pe curbele putere, care au fost calculate n exemplul precedent, sunt
marcate pe Figura 6.2 prin cerculet e.
clear,clf
x=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...
3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...
3.29,4.08,2.97,3.29,3.78,3.58];
z=(mean(x)-3.5)/(0.5/sqrt(24));
fprintf( z=%6.3f\n,z)
z1=norminv(0,0,1); z2=norminv(0.99,0,1);
fprintf( m gt 3.5\n)
fprintf( z1=%6.3f, z2=%6.3f\n,z1,z2)
z1=norminv(0.01,0,1); z2=norminv(1,0,1);
fprintf( m lt 3.5\n)
fprintf( z1=%6.3f, z2=%6.3f\n,z1,z2)
m=3:0.01:4; m1=3.4:0.1:3.7;
c2=norminv(0.99,0,1);
pib=1-normcdf(c2+(3.5-m)./(0.5/sqrt(24)),0,1);
pib1(1,:)=1-normcdf(c2+(3.5-m1)./(0.5/sqrt(24)),0,1);
subplot(2,1,1)
plot(m,pib,k-,m1,pib1(1,:),o), grid on
c1=norminv(0.01,0,1);
pib=normcdf(c1+(3.5-m)./(0.5/sqrt(24)),0,1);
pib1(2,:)=normcdf(c1+(3.5-m1)./(0.5/sqrt(24)),0,1);
subplot(2,1,2)
plot(m,pib,k-,m1,pib1(2,:),o), grid on
len=length(m1);
for i=1:len
for j=1:2
fprintf( pi(%3.1f)=%5.3f ,m1(i),pib1(j,i))
end
fprintf(\n)
end
zb=norminv(0.95,0,1); za=norminv(0.01,0,1);
nr=ceil(0.52
*
(zb-za)2/(3.5-3.4)2);
zb=norminv(0.05,0,1); za=norminv(0.99,0,1);
nl=ceil(0.52
*
(zb-za)2/(3.5-3.7)2);
fprintf( nr=%3d, nl=%3d,nr,nl)
304 Vericarea ipotezelor statistice

In urma execut arii programului, pe l ang a gracele curbelor de putere, sunt asate si
urm atoarele rezultate:
z=-0.567
m gt 3.5
z1= -Inf, z2= 2.326
m lt 3.5
z1=-2.326, z2= Inf
pi(3.4)=0.000 pi(3.4)=0.089
pi(3.5)=0.010 pi(3.5)=0.010
pi(3.6)=0.089 pi(3.6)=0.000
pi(3.7)=0.357 pi(3.7)=0.000
nr=395, nl= 99
care reprezint a intervalele numerice (z1,z2) si volumul optim, c and se consider a
cele dou a alternative.
3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4
0
0.2
0.4
0.6
0.8
1
3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4
0
0.2
0.4
0.6
0.8
1
Figura 6.2: Curbele funct iilor putere
6.4 Testul T (Student) privind media teoretic a
Fie caracteristica X ce urmeaz a legea normal a N (m, ), cu ambii parametri m R
si > 0 necunoscut i. Relativ la valoarea medie a acestei caracteristici, se face ipoteza
nul a H
0
: m = m
0
, cu una din alternativele
H
1
: m = m
0
, c and obt inem testul T bilateral,
H
1
: m > m
0
, c and obt inem testul T unilateral dreapta,
6.4. Testul T (Student) privind media teoretic a 305
H
1
: m < m
0
, c and obt inem testul T unilateral st anga.
Pentru vericarea acestei ipoteze se consider a o select ie repetat a de volum n, cu
datele de select ie x
1
, . . . , x
n
si corespunz ator variabilele de select ie X
1
, . . . , X
n
.
Conform Propriet at ii 4.2.26, statistica
T =

X m

n
=

X m
_

2
n1
,
unde

X =
1
n
n

k=1
X
k
,
2
=
1
n 1
n

k=1
_
X
k


X
_
2
=
n
n 1

2
,
urmeaz a legea Student cu n 1 grade de libertate.
Prin urmare, pentru nivelul de semnicat ie (0, 1) dat, se poate determina
intervalul numeric (t
1
, t
2
) astfel nc at
P
_
T (t
1
, t
2
)

H
0
_
= F
n1
(t
2
) F
n1
(t
1
) = 1 ,
unde
F
m
(t) =

_
m+1
2
_

m
_
m
2
_
_
t

_
1 +
x
2
m
_

m+1
2
dx, t R,
este funct ia de repartit ie pentru legea Student cu m grade de libertate (tabelat a n
Anexa II, pentru anumite valori).
Intervalul numeric (t
1
, t
2
) pentru statistica T nu este determinat n mod unic din
condit ia de mai sus.

In funct ie de alternativa H
1
aleas a, se consider a suplimentar:
t
1
= t
2
, t
2
= t
n1,1

2
, dac a H
1
: m = m
0
,
t
1
= , t
2
= t
n1,1
, dac a H
1
: m > m
0
,
t
1
= t
n1,
, t
2
= +, dac a H
1
: m < m
0
,
unde t
m,
este cuantila de ordin a legii Student cu m grade de libertate, adic a
F
m
(t
m,
) = .
Corespunz ator intervalului (t
1
, t
2
) se consider a respectiv regiunea critice U denite
prin:
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

| u m
0
|
u

n
t
n1,1

2
_
,
306 Vericarea ipotezelor statistice
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0
u

n
t
n1,1
_
,
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

u m
0
u

n
t
n1,
_
.
Aici s-au utilizat notat iile u =
1
n

n
k=1
u
k
, respectiv
2
u
=
1
n1

n
k=1
(u
k
u)
2
.
Se veric a imediat c a P
_
(X
1
, X
2
, . . . , X
n
) U | H
0
_
= , iar cele trei moduri de
denire a regiunii critice U ne conduc respectiv la testul T bilateral, unilateral dreapta
si unilateral st anga.
Odat a construit a regiunea critic a U, folosind datele de select ie x
1
, x
2
, . . . , x
n
,
ipoteza nul a H
0
va admis a dac a (x
1
, x
2
, . . . , x
n
) / U, iar n caz contrar va
respins a. Remarc am de asemenea c a regiunea critic a U corespunde mult imii comple-
mentare intervalului (t
1
, t
2
).
Etapele aplic arii testului T
1. Se dau: ; x
1
, x
2
, . . . , x
n
; m
0
;
2. Se calculeaz a intervalul (t
1
, t
2
) astfel nc at F
n1
(t
1
) F
n1
(t
2
) = 1 ,
(dup a cum s-a prezentat nainte);
3. Se calculeaz a
t =
x m
0

n
, unde x =
1
n
n

k=1
x
k
,
2
=
1
n 1
n

k=1
(x
k
x)
2
;
4. Concluzia: dac a t (t
1
, t
2
) ipoteza H
0
este admis a, n caz contrar ipoteza este
respins a.
Observatia 6.4.1. C and num arul gradelor de libertate tinde la innit, conform teo-
remei limit a central a, avem c a legea Student converge n repartit ie la legea normal a
N (0, 1). Prin urmare, dac a volumul n al select iei este mare (n > 30) se poate utiliza
testul Z pentru vericarea ipotezei nule H
0
: m = m
0
, prin utilizarea statisticii T n
loc de statistica Z. Toate rezultatele de la testul Z r am an, asadar, adev arate n acest
caz.
Observatia 6.4.2. Av and n vedere c a funct ia de repartit ie a legii Student este strict
cresc atoare, iar pentru determinarea intervalului (t
1
, t
2
) este necesar a inversarea
acestei funct ii, se poate renunt a la operat ia de inversare. Pentru aceasta se determin a
ceea ce se numeste valoare critic a, ca si la testul Z, si pe care o not am prin c. Vom
analiza pe r and cele trei alternative.
6.4. Testul T (Student) privind media teoretic a 307
Dac a se consider a testul bilateral, f ac and notat ia
1
c
2
= F
n1
(|t|) , adic a c = 2 (1 F
n1
(|t|)) ,
ipoteza nul a va respins a dac a 1
c
2
1

2
, adic a c .
Pentru testul unilateral dreapta, se noteaz a
1 c = F
n1
(t) , adic a c = 1 F
n1
(t) ,
iar ipoteza nul a este respins a, dac a 1 c 1 , adic a, la fel ca mai nainte, dac a
c .
Un rat ionament analog, pentru testul unilateral st anga ne conduce la valoa-
rea critic a, calculat a dup a formul a c = F
n1
(t). Drept urmare, ipoteza nul a este
respins a, dac a c .

In rezumat, ipoteza nul a este respins a, dac a c , unde


c =
_

_
2 (1 F
n1
(|t|)), dac a H
1
: m = m
0
,
1 F
n1
(t), dac a H
1
: m > m
0
,
F
n1
(t), dac a H
1
: m < m
0
.
6.4.1 Functia ttest
Sistemul Matlab, prin Statistics toolbox, dispune de funct ia ttest, cu aplicabilitate
la testul T. Apelarea acestei funct ii se face prin:
h=ttest(x,m0)
h=ttest(x,m0,alpha)
h=ttest(x,m0,alpha,tail)
[h,c,ci]=ttest(x,m0,alpha,tail)

In urma execut arii acestor instruct iuni, se efectueaz a testul T asupra datelor cont inute
n vectorul x, folosind nivelul de semnicat ie alpha, care are valoarea implicit a
alpha=0.05.
Parametrul tail specic a una din cele trei alternative, care conduc la tes-
tul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral st anga
(tail=-1). Dac a h=1, atunci ipoteza nul a va respins a, respectiv dac a h=0,
ipoteza nu poate respins a.
Ultima form a de apel permite, de asemenea, obt inerea valorii critice c, precum
si a intervalului de ncredere pentru media teoretic a, corespunz ator probabilit at ii de
ncredere 1-alpha, obt inut n vectorul cu dou a componente ci.
Programul 6.4.3. Programul Matlab, ce urmeaz a, aplic a testul T, pentru datele
din Exemplul 6.2.2, consider and c a dispersia este necunoscut a. Ipoteza nul a este
308 Vericarea ipotezelor statistice
H: m = 16, iar ca ipoteze alternative se consider a, pe r and, cele trei, care con-
duc, respectiv la testele bilateral, unilateral st anga si unilateral dreapta. Programul va
determina, de asemenea, intervalele de ncredere pentru media teoretic a, n cele trei
cazuri, folosind alpha=0.01.
x=[11
*
ones(1,4),13
*
ones(1,6),15
*
ones(1,12),...
17
*
ones(1,10),20
*
ones(1,8)];
fprintf( h c ci \n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(x,16,0.01,i);
fprintf( %d %5.4f (%4.2f,%4.2f) \n,h,c,ci)
end

In urma execut arii programului, se obt in rezultatele:


h c ci
___________________________
0 0.3261 (-Inf,16.87)
0 0.6522 (14.61,16.99)
0 0.6739 (14.73, Inf)
Se observ a c a pentru tail=-1 si tail=1, se construiesc intervale nem arginite,
respectiv la st anga si la dreapta.
6.5 Testul raportului verosimilit atilor
Fie caracteristica X cu legea de probabilitate f(x; ), unde parametrul necunoscut
A R
p
. Relativ la parametrul , se consider a ipoteza nul a H
0
: A
0
cu
alternativa H
1
: AA
0
. Se consider a o select ie repetat a de volum n cu ajutorul
c areia se construieste statistica

=

(X
1
, . . . , X
n
) =
sup
A
0
g(X
1
, . . . , X
n
; )
sup
A
g(X
1
, . . . , X
n
; )
,
unde
g(u
1
, . . . , u
n
; ) =
n

k=1
f(u
k
; )
este funct ia de verosimilitate. Din felul cum a fost denit a statistica

, avem c a
0 <

< 1, iar ipoteza H
0
va putea acceptat a dac a

este apropiat a de 1.
Folosind aceast a observat ie, pentru un nivel de semnicat ie (0, 1) dat, se de-
termin a regiunea critic a din relat ia P
_

H
0
_
= , unde

este cuantila de
ordin , pentru legea de probabilitate a statisticii

.
6.5. Testul raportului verosimilit at ilor 309
Exemplul 6.5.1. Fie caracteristica X ce urmeaz a legea normal a N(m, ), unde pa-
rametrii m R si > 0 sunt necunoscut i. Vrem s a veric am urmatoarea ipotez a
nul a H
0
: (m = m
0
, > 0), cu alternativa H
1
: (m = m
0
, > 0). Pentru aceasta
consider am o select ie repetat a de volum n si nivelul de semnicat ie (0, 1) xat.
Funct ia de verosimilitate este dat a prin
g (u
1
, . . . , u
n
; m, ) =
_
1

2
_
n
exp
_

1
2
2
n

k=1
(u
k
m)
2
_
.
C and ipoteza H
0
este adev arat a, atunci estimatorul de verosimilitate maxim a pentru
este dat prin

1
=

_
1
n
n

k=1
(X
k
m
0
)
2
.
Obt inem astfel, n acest caz, c a
sup
>0
g(X
1
, . . . , X
n
; m
0
, ) =
_
1

1

2
_
n
exp
_

1
2
2
1
n

k=1
(X
k
m
0
)
2
_
=
_
n
2e

n
k=1
(X
k
m
0
)
2
_n
2

Pe de alt a parte, pentru determinarea numitorului statisticii



, vom c auta estima-
torii de verosimilitate maxim a pentru parametrii m R si > 0 necunoscut i.
Sistemul de verosimilitate maxim a
_

_
ln g(X
1
, X
2
, . . . , X
n
; m, )
m
= 0
ln g(X
1
, X
2
, . . . , X
n
; m, )

= 0,
ne d a estimatorii de verosimilitate maxim a pentru m si , anume
m =
1
n
n

k=1
X
k
=

X,
=

_
1
n
n

k=1
_
X
k


X
_
2
=


2
.
310 Vericarea ipotezelor statistice
Obt inem astfel c a
sup
mR,>0
g(X
1
, X
2
, . . . , X
n
; m, ) =
_
1

2
2
_
n
exp
_

1
2
2
n

k=1
_
X
k


X
_
2
_
=
_
n
2e

n
k=1
_
X
k


X
_
2
_n
2

Putem scrie acum statistica raportului verosimilit at ilor

=
_
n

k=1
_
X
k


X
_
2
_
n

k=1
( X
k
m
0
)
2
_n
2
.
Folosind formula lui K onig (Observat ia 3.3.23):
n

k=1
(X
k
m
0
)
2
=
n

k=1
_
X
k


X
_
2
+n(

X m
0
)
2
,
avem c a

=
_
1 +
n(

X m
0
)
2

n
k=1
_
X
k


X
_
2
_

n
2
.
Dac a se introduce statistica T denit a prin
T =

X m
0

n
=

X m
0
_
1
n1

n
k=1
_
X
k


X
_
2
_

n
,
atunci

=
_
1
1 +
T
2
n1
_n
2

Regiunea critic a U, pentru (0, 1), se obt ine din P


_

H
0
_
= , care este
acelasi lucru cu P
_
| T | < t

m = m
0
_
= 1. Altfel spus, determinarea cuantilei

revine la determinarea lui t > 0, astfel nc at P


_
| T | < t

m = m
0
_
= 1 .
Dar statistica T, n ipoteza H
0
, urmeaz a legea Student cu n 1 grade de libertate
(Proprietatea 4.2.26), deci t = t
n1,1

2
, adic a cuantila de ordin 1

2
a legii Student
cu n 1 grade de libertate. Putem scrie n nal regiunea critic a:
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

| u m
0
|

n
t
n1,1

2
_
,
adic a chiar regiunea critic a de la testul T bilateral. Prin urmare, cu aceast a metod a
obt inem testul T bilateral.
6.5. Testul raportului verosimilit at ilor 311
Teorema 6.5.2. Fie statistica

a raportului verosimilit at ilor, atunci statistica
2 ln

urmeaz a legea
2
cu p grade de libertate, c and n , p ind num arul
parametrilor necunoscut i.
Demonstrat ie. Vom considera numai cazul p = 1.
Folosind formula lui Taylor cu doi termeni avem c a
ln g(X
1
, . . . , X
n
;
0
) ln g(X
1
, . . . , X
n
;

)
= (
0


)
ln g(X
1
, . . . , X
n
;

)

+
1
2
(
0


)
2

2
ln g(X
1
, . . . , X
n
; )

2
,
unde (
0
,

) sau (

,
0
). Dar

este estimator de verosimilitate maxim a
pentru , prin urmare
ln g(X
1
, . . . , X
n
;

)

= 0
deci avem c a
2 ln

= (
0


)
2

2
ln g(X
1
, . . . , X
n
; )

2

Pe de alt a parte, dac a ipoteza H
0
: =
0
este adev arat a, se stie c a

a.s.

0
, deci

a.s.

0
, c and n . Putem scrie atunci c a

2
ln g(X
1
, . . . , X
n
; )

=

2
ln g(X
1
, . . . , X
n
;
0
)

2
=
n

k=1

2
ln f(X
k
;
0
)

2
= n
1
n
n

k=1

2
ln f(X
k
;
0
)

2

Folosind legea numerelor mari avem c a
1
n
n

k=1

2
ln f(X
k
;
0
)

2
a.s.
E
_

2
ln f(X;
0
)

2
_
= I
1
(
0
),
de unde

2
ln g(X
1
, . . . , X
n
; )

= nI
1
(
0
) = I
n
(
0
),
sau
2 ln


=
_

_
2
I
n
(
0
) .
Conform Observat iei 5.3.11, statistica

I
1
n
(
0
)
urmeaz a legea normal a N(0, 1),
c and n , de unde avem c a statistica (
0


)
2
I
n
(
0
) urmeaz a legea
2
cu un
grad de libertate, ceea ce trebuia ar atat.
312 Vericarea ipotezelor statistice
6.6 Testul
2
privind dispersia teoretic a
Fie caracteristica X ce urmeaz a legea normal a N (m, ), unde
2
= V ar (X) este
necunoscut a si m R, de asemenea necunoscut.
Relativ la dispersia teoretic a se face ipoteza nul a H
0
:
2
=
2
0
, cu una din
alternativele:
H
1
:
2
=
2
0
, c and obt inem testul
2
bilateral,
H
1
:
2
>
2
0
, c and obt inem testul
2
unilateral dreapta,
H
1
:
2
<
2
0
, c and obt inem testul
2
unilateral st anga.
Pentru vericarea ipotezei nule H
0
, cu una din alternativele H
1
precizate, se con-
sider a o select ie repetat a de volum n, cu datele de select ie x
1
, x
2
, . . . , x
n
si cores-
punz ator variabilele de select ie X
1
, X
2
, . . . , X
n
. Conform Propriet at ii 4.2.25, avem
c a statistica

2
=
1

2
n

k=1
_
X
k


X
_
2
=
(n 1)
2

2
,
urmeaz a legea
2
cu n 1 grade de libertate.
Folosind un nivel de semnicat ie (0, 1) dat, se poate determina un interval
numeric
_

2
1
,
2
2
_
astfel nc at
P
_

2
1
,
2
2
_

H
0
_
= F
n1
_

2
2
_
F
n1
_

2
1
_
= 1 ,
unde
F
m
(x) =
1
2
m
2

_
m
2
_
_
x
0
t
m
2
1
e

t
2
dt, x > 0,
este funct ia de repartit ie pentru legea
2
cu m grade de libertate (tabelat a pentru
anumite valori n Anexa III).
Intervalul numeric
_

2
1
,
2
2
_
pentru statistica
2
nu este determinat n mod unic
din condit ia de mai sus.

In funct ie de alternativa H
1
aleas a se consider a suplimentar:

2
1
=
2
n1,

2
,
2
2
=
n1,1

2
, dac a H
1
:
2
=
2
0
,

2
1
= 0,
2
2
=
2
n1,1
, dac a H
1
:
2
>
2
0
,

2
1
=
2
n1,
,
2
2
= +, dac a H
1
:
2
<
2
0
,
unde
2
m,
este cuantila de ordin a legii
2
cu m grade de libertate, adic a
F
m
_

2
m,
_
= .
6.6. Testul
2
privind dispersia teoretic a 313
Cu ajutorul intervalului numeric
_

2
1
,
2
2
_
, astfel determinat, se consider a respec-
tiv regiunile critice:
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

2
0
n

k=1
(u
k
u)
2
/
_

2
n1,

2
,
2
n1,1

2
_
_
,
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

2
0
n

k=1
(u
k
u)
2

2
n1,1
_
,
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

2
0
n

k=1
(u
k
u)
2

2
n1,
_
.
Usor se veric a faptul c a P
_
(X
1
, X
2
, . . . , X
n
) U | H
0
_
= , iar cele trei moduri
de denire a regiunii critice U ne conduc respectiv la testul
2
bilateral, unilateral
dreapta si unilateral st anga.
Odat a construit a regiunea critic a U, folosind datele de select ie, ipoteza nul a H
0
va admis a dac a (x
1
, x
2
, . . . , x
n
) / U, iar n caz contrar va respins a. Remarc am
de asemenea c a regiunea critic a U corespunde mult imii complementare intervalului
_

2
1
,
2
2
_
.
Etapele aplic arii testului
2
1. Se dau: ; x
1
, x
2
, . . . , x
n
; =
0
;
2. Se determin a intervalul
_

2
1
,
2
2
_
astfel nc at F
n1
_

2
2
_
F
n1
_

2
1
_
= 1,
(dup a cum s-a precizat nainte);
3. Se calculeaz a
2
=
1

2
0
n

k=1
( x
k
x)
2
, unde x =
1
n
n

k=1
x
k
;
4. Concluzia: dac a
2

2
1
,
2
2
_
ipoteza H
0
este admis a, n caz contrar este
respins a.
Exemplul 6.6.1. Se consider a caracteristica X ce urmeaz a legea normal a N (m, )
cu parametrii m R si > 0 necunoscut i. Relativ la caracteristica X se consider a o
select ie repetat a de volum n = 15. Fie datele de select ie
24.03 25.92 26.92 23.04 25.44 26.31 26.13 25.97 24.44 24.82
24.17 25.53 23.78 26.06 24.29.
Vrem s a veric am ipoteza nul a H
0
: = 1.8, cu ecare din urm atoarele alternative
H
1
: = 1.8, H
1
: >1.8, H
1
: <1.8, c and se consider a = 0.05. Vom calcula
apoi valorile funct iei putere pentru = 1.5, 1.6, 1.7, 1.8, 1.9, pentru ecare din
alternativele considerate.
314 Vericarea ipotezelor statistice
C and H
1
: = 1.8 avem testul
2
bilateral. Se calculeaz a cuantilele

2
n1,

2
=
2
14,0.025
= 5.63 si
2
n1,1

2
=
2
14,0.975
= 26.12.
Pe de alt a parte avem
x =
1
n
n

k=1
x
k
=
1
15
(24.03 + 25.92 + + 24.29) = 25.11,

2
=
1
n1
n

k=1
(x
k
x)
2
=
1
14
_
(24.0325.11)
2
+. . .+(24.2925.11)
2

=1.27.
Deoarece

2
=
(n 1)
2

2
0
=
14 1.27
1.8
2
= 5.49 / (5.63, 26.12) ,
ipoteza H
0
este respins a.
C and H
1
: > 1.8, avem testul
2
unilateral dreapta si se calculeaz a cuantila

2
n1,1
=
2
14,0.95
= 23.69. Astfel, av and n vedere c a
2
= 5.49 < 23.69, ipoteza
nul a este admis a.
C and H
1
: < 1.8, avem testul
2
unilateral st anga.

In acest caz se calculeaz a
cuantila
2
n1,
=
2
14,0.05
= 6.57 si deoarece
2
= 5.49 < 6.57, ipoteza nul a este
respins a.
C and se consider a testul
2
bilateral, puterea se obt ine din
1 () = = P
_

2
n1,

2
<
(n 1)
2

2
0
<
2
n1,1

H
1
_
= P
_

2
0

2

2
n1,

2
<
(n 1)
2

2
<

2
0

2

2
n1,1

H
1
_
,
deci
() = 1 F
n1
_

2
0

2

2
n1,1

2
_
+F
n1
_

2
0

2

2
n1,

2
_
.

In cazul de fat a, obt inem


(1.5) = 1 F
14
_
1.8
2
1.5
2
26.14
_
+F
14
_
1.8
2
1.5
2
5.63
_
= 0.117,
(1.6) = 1 F
14
_
1.8
2
1.6
2
26.14
_
+F
14
_
1.8
2
1.6
2
5.63
_
= 0.073,
(1.7) = 1 F
14
_
1.8
2
1.7
2
26.14
_
+F
14
_
1.8
2
1.7
2
5.63
_
= 0.052,
6.6. Testul
2
privind dispersia teoretic a 315
(1.8) = 1 F
14
_
1.8
2
1.8
2
26.14
_
+F
14
_
1.8
2
1.8
2
5.63
_
= 0.050,
(1.9) = 1 F
14
_
1.8
2
1.9
2
26.14
_
+F
14
_
1.8
2
1.9
2
5.63
_
= 0.068.
Pentru testul unilateral dreapta, n mod analog, se ajunge la
() = 1 F
n1
_

2
0

2

2
n1,1
_
,
de unde
(1.5) = 1 F
14
_
1.8
2
1.5
2
23.69
_
= 0.002,
(1.6) = 1 F
14
_
1.8
2
1.6
2
23.69
_
= 0.008,
(1.7) = 1 F
14
_
1.8
2
1.7
2
23.69
_
= 0.022,
(1.8) = 1 F
14
_
1.8
2
1.8
2
23.69
_
= 0.050,
(1.9) = 1 F
14
_
1.8
2
1.9
2
23.69
_
= 0.095.
C and se consider a testul
2
unilateral st anga, se obt ine
() = F
n1
_

2
0

2

2
n1,
_
,
deci
(1.5) = F
14
_
1.8
2
1.5
2
6.57
_
= 0.200, (1.8) = F
14
_
1.8
2
1.8
2
6.57
_
= 0.050,
(1.6) = F
14
_
1.8
2
1.6
2
6.57
_
= 0.128, (1.9) = F
14
_
1.8
2
1.9
2
6.57
_
= 0.031.
(1.7) = F
14
_
1.8
2
1.7
2
6.57
_
= 0.080,
Programul 6.6.2. Programul urm ator, efectueaz a calculele cerute n exemplul prece-
dent.

In plus, reprezint a grac funct ia putere, cea din Figura 6.3, n cazul testului
bilateral, marc and prin cerculet e punctele curbei putere, care au fost determinate n
exemplu.
316 Vericarea ipotezelor statistice
clf
x=[24.03,25.92,26.92,23.04,25.44,26.31,...
26.13,25.97,24.44,24.82,24.17,25.53,...
23.78,26.06,24.29];
x2=14
*
var(x)/1.82;
c1=chi2inv(0.025,14); c2=chi2inv(0.975,14);
fprintf( x2=%6.3f\n,x2)
fprintf( sigma ne 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
c1=chi2inv(0,14); c2=chi2inv(0.95,14);
fprintf( sigma gt 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
c1=chi2inv(0.05,14); c2=chi2inv(1,14);
fprintf( sigma lt 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
s=1.2:0.01:2.4; s1=1.5:0.1:1.9;
c1=1.82
*
chi2inv(0.025,14); c2=1.82
*
chi2inv(0.975,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(1,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
plot(s,pib,k-,s1,pib1(1,:),o), grid on
c1=1.82
*
chi2inv(0,14); c2=1.82
*
chi2inv(0.95,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(2,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
c1=1.82
*
chi2inv(0.05,14); c2=1.82
*
chi2inv(1,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(3,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
len=length(s1);
for i=1:len
for j=1:3
fprintf( pi(%3.1f)=%5.3f ,s1(i),pib1(j,i))
end
fprintf(\n)
end

In urma execut arii programului sau obt inut rezultatele:


x2= 5.446
sigma ne 1.8
c1= 5.629, c2=26.119
sigma gt 1.8
c1= 0.000, c2=23.685
sigma lt 1.8
c1= 6.571, c2= Inf
pi(1.5)=0.117 pi(1.5)=0.002 pi(1.5)=0.200
pi(1.6)=0.073 pi(1.6)=0.008 pi(1.6)=0.128
pi(1.7)=0.052 pi(1.7)=0.022 pi(1.7)=0.080
pi(1.8)=0.050 pi(1.8)=0.050 pi(1.8)=0.050
pi(1.9)=0.068 pi(1.9)=0.095 pi(1.9)=0.031
6.6. Testul
2
privind dispersia teoretic a 317
1 1.5 2
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
Figura 6.3: Curba funct iei putere - cazul bilateral
Observatia 6.6.3. C and caracteristica X nu urmeaz a legea normal a, pentru a veri-
ca ipoteza nul a de forma dinainte, cu una din alternativele precizate, unde dispersia
teoretic a este
2
= V ar (X), se t ine seama de faptul c a statistica
S
2
=

2

2
n
, unde
2
=
1
n 1
n

k=1
_
X
k


X
_
2
,
urmeaz a legea normal a N (0, 1), c and n .
De exemplu, dac a ipoteza alternativ a este H
1
:
2
=
2
0
, se va ajunge la regiunea
critic a
U =
_
(u
1
, u
2
, . . . , u
n
) R
n

n
|
2
u

2
0
|

2
0

2
z
1

2
_
,
unde z
1

2
este cuantila de ordin 1

2
de la legea normal a N (0, 1).
Observatia 6.6.4. Dac a se consider a statistica
H
2
=

2

2
=
1
(n 1)
2
n

k=1
_
X
k


X
_
2
,
atunci ntre statisticile H
2
si
2
exist a relat ia
2
= (n 1) H
2
.
Deoarece se cunoaste legea de probabilitate pentru statistica
2
(legea
2
cu n1
grade de libertate), se poate determina si legea de probabilitate a statisticii H
2
. Sunt
manuale care cont in tabelat a legea de probabilitate a lui H
2
. Descrierea testului
2
,
folosind statistica H
2
, urmeaz a aceeasi cale ca cea c and se foloseste statistica
2
.
318 Vericarea ipotezelor statistice
Observatia 6.6.5. C and se cunoaste parametrul m R (ceea ce se nt ampl a mai rar)
se poate considera statistica

2
=
1

2
n

k=1
(X
k
m)
2
=
n

k=1
_
X
k
m

_
2

Deoarece
X
k
m

urmeaz a legea normal a N (0, 1), avem c a statistica


2
urmeaz a le-
gea
2
cu n grade de libertate. Cele prezentate mai nainte pot rescrise cu aceast a
statistic a.
6.7 Testul F (FisherSnedecor)
pentru compararea dispersiilor
Se consider a dou a populat ii independente C

si C

cercetate din punct de vedere al


aceleasi caracteristici. Aceast a caracteristic a este X

pentru C

si urmeaz a legea nor-


mal a N (m

) si respectiv X

pentru C

si urmeaz a legea normal a N (m

).
Relativ la dispersiile teoretice ale celor dou a caracteristici se face ipoteza nul a com-
pus a H
0
:

2
=

2
, cu una din alternativele:
H
1
:

2
=

2
, c and obt inem testul F bilateral,
H
1
:

2
>

2
, c and obt inem testul F unilateral dreapta,
H
1
:

2
<

2
, c and obt inem testul F unilateral st anga.
Pentru vericarea ipotezei nule H
0
, cu una din alternativele H
1
considerate, se e-
fectueaz a c ate o select ie repetat a de volume respectiv n

si n

din cele dou a populat ii


C

si C

. Not am datele de select ie prin x

1
, x

2
, . . . , x

si respectiv x

1
, x

2
, . . . , x

,
cu variabilele de select ie X

1
, X

2
, . . . , X

si X

1
, X

2
, . . . , X

. Conform Pro-
priet at ii 4.2.30, statistica
F =

2
_

2
,
unde

2
=
1
n

1
n

k=1
_
X

k


X

_
2
,

X

=
1
n

k=1
X

k
,

2
=
1
n

1
n

k=1
_
X

k


X

_
2
,

X

=
1
n

k=1
X

k
,
6.7. Testul F (FisherSnedecor) pentru compararea dispersiilor 319
urmeaz a legea FisherSnedecor cu m = n

1 si n = n

1 grade de libertate.
Pentru un nivel de semnicat ie (0, 1) xat, se poate determina un interval
numeric (f
1
, f
2
), astfel ca P
_
F (f
1
, f
2
)

H
0
_
= F
m,n
(f
2
) F
m,n
(f
1
) = 1 ,
unde
F
m,n
(f) =
_
m
n
_m
2

_
m+n
2
_

_
m
2
_

_
n
2
_
_
f
0
x
n
2
1
_
1 +
m
n
x
_

m+n
2
dx, f > 0,
este funct ia de repartit ie pentru legea FisherSnedecor cu m si n grade de libertate
(tabelat a pentru anumite valori n Anexa IV). Intervalul de ncredere (f
1
, f
2
) pentru
statistica F nu este unic determinat.

In funct ie de alternativa H
1
aleas a, se consider a
suplimentar:
f
1
= f
m,n;

2
, f
2
= f
m,n;1

2
, dac a H
1
:

2
=

2
,
f
1
= 0, f
2
= f
m,n;1
, dac a H
1
:

2
>

2
,
f
1
= f
m,n;
, f
2
= +, dac a H
1
:

2
<

2
.
Cu ajutorul intervalului numeric (f
1
, f
2
) astfel determinat, se consider a respectiv
regiunile critice
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n


2
u

2
v
/
_
f
m,n;

2
, f
m,n;1

2
_
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n


2
u

2
v
f
m,n;1
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n


2
u

2
v
f
m,n;
_
.
S-au folosit notat iile

2
u
=
1
n

1
n

k=1
(u
k
u)
2
, u =
1
n

k=1
u
k
,

2
v
=
1
n

1
n

k=1
(v
k
v)
2
, v =
1
n

k=1
v
k
.
Se veric a imediat c a P
__
X

1
, X

2
, . . . , X

; X

1
, X

2
, . . . , X

_
U | H
0
_
= , iar
cele trei alternative ne conduc la cele trei regiuni critice, care denesc respectiv testul
F bilateral, unilateral dreapta si unilateral st anga.
Odat a construit a regiunea critic a U, folosind datele de select ie, ipoteza nul a va
admis a dac a
_
x

1
, x

2
, . . . , x

; x

1
, x

2
, . . . , x

_
/ U, iar n caz contrar va respins a.
Remarc am de asemenea c a regiunea critic a U corespunde mult imii complementare
intervalului (f
1
, f
2
).
320 Vericarea ipotezelor statistice
Etapele aplic arii testului F
1. Se dau: ; x

1
, x

2
, . . . , x

; x

1
, x

2
, . . . , x

;
2. Se determin a intervalul (f
1
, f
2
) astfel nc at F
m,n
(f
2
) F
m,n
(f
1
) = 1
(dup a cum s-a prezentat nainte);
3. Se calculeaz a f =

2
, unde

2
=
1
n

1
n

k=1
_
x

k
x

_
2
, x

=
1
n

k=1
x

k
,

2
=
1
n

1
n

k=1
_
x

k
x

_
2
, x

=
1
n

k=1
x

k
;
4. Concluzia: dac a f (f
1
, f
2
) ipoteza H
0
este admis a, n caz contrar este
respins a.
Observatia 6.7.1. Dac a se noteaz a prin =

, atunci ipoteza nul a se poate rescrie


H
0
:
2
=1, iar ipotezele alternative se scriu corespunz ator H
1
:
2
=1, H
1
:
2
>1,
respectiv H
1
:
2
<1, iar statistica F, se scrie sub forma F =
1

2

Exemplul 6.7.2. Se cerceteaz a precizia cu care dou a masini produc conserve de
acelasi tip. Pentru aceasta, se consider a c ate un esantion din conservele produse de
cele dou a masini si se m asoar a greutatea acestora. Fie X

greutatea n grame a unei


conserve produs a de prima masin a, respectiv X

pentru a doua masin a. M asur atorile


obt inute sunt:
X

: 1021 980 988 1017 1005 998 1014 985 995 1004 1030
1015 995 1023 1008 1013
X

: 1003 988 993 1013 1006 1002 1014 997 1002 1010 975
Consider and nivelul de semnicat ie = 0.05, vrem s a veric am ipoteza nul a com-
pus a H
0
:

, respectiv cu ecare din alternativele H


1
:

, H
1
:

>

,
H
1
:

<

. Vom considera c a cele dou a caracteristici X

si X

sunt independente
si c a urmeaz a legile normale N (m

) si respectiv N (m

).
Se consider a statistica
F =

2
_

2
,
6.7. Testul F (FisherSnedecor) pentru compararea dispersiilor 321
ce urmeaz a legea FisherSnedecor cu m = n

1 si n = n

1 grade de libertate,
care ne conduce la testul F. Pentru aceasta avem
x

=
1
n

k=1
x

k
=
1
16
(1021 + 980 + + 1013) = 1005.7,
x

=
1
n

k=1
x

k
=
1
11
(1003 + 988 + + 975) = 1000.3,

2
=
1
n

1
n

k=1
_
x

k
x

_
2
=
1
15
_
(1021 1005.7)
2
+ + (1013 1005.7)
2

= 210.63,

2
=
1
n

1
n

k=1
_
x

k
x

_
2
=
1
10
_
(1003 1000.3)
2
+ + (975 1000.3)
2

= 134.42.
Valoarea calculat a a statisticii F este
f =

2
=
210.63
134.42
= 1.57.
De asemenea, avem calculate, conform Anexei IV, cuantilele
f
m,n;

2
=
1
f
n,m;1

2
=
1
f
10,15;0.975
=
1
3.06
= 0.33,
f
m,n;1

2
= f
15,10;0.975
= 3.52, f
m,n;1
= f
15,10;0.95
= 2.85,
f
m,n;
=
1
f
n,m;1
=
1
f
10,15;0.95
=
1
2.54
= 0.39.
C and se consider a alternativa H
1
:

, avem testul F bilateral. Deoarece


f = 1.57 (0.33, 3.52) =
_
f
m,n;

2
, f
m,n;1

2
_
,
ipoteza H
0
este admis a.
Pentru alternativa H
1
:

>

, avem testul F unilateral dreapta. Astfel c a


f = 1.57 < 2.85 = f
m,n;1
,
prin urmare ipoteza H
0
este admis a.
De asemenea, pentru alternativa H
1
:

<

, se obt ine testul F unilateral


st anga. Deoarece avem f = 1.57 > 0.39 = f
m,n;
, ipoteza H
0
este admis a.
322 Vericarea ipotezelor statistice
Programul 6.7.3. Programul Matlab, care urmeaz a, efectueaz a calculele din exem-
plul precedent, dup a care aseaz a valoarea f a statisticii F, precum si intervalele
numerice (f1,f2), pentru ecare din cele trei alterantive.
x1=[1021,980,988,1017,1005,998,1014,985,995,...
1004,1030,1015,995,1023,1008,1013];
x2=[1003,988,993,1013,1006,1002,1014,997,...
1002,1010,975];
f=var(x1)/var(x2);
fprintf( Bilateral\n)
f1=finv(0.025,15,10); f2=finv(0.975,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf( Unilateral dreapta\n)
f1=finv(0,15,10); f2=finv(0.95,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf( Unilateral stanga\n)
f1=finv(0.05,15,10); f2=finv(1,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)

In urma execut arii programului se obt in rezultatele:


Bilateral
f= 1.567, (f1,f2)=(0.327,3.522)
Unilateral dreapta
f= 1.567, (f1,f2)=(0.000,2.845)
Unilateral stanga
f= 1.567, (f1,f2)=(0.393, Inf)
6.8 Teste pentru compararea mediilor
Se consider a dou a populat ii independente C

si C

, cercetate din punct de vedere


al aceleasi caracteristici. Aceast a caracteristic a este X

pentru C

si urmeaz a legea
normal a N (m

) si respectiv X

pentru C

si urmeaz a legea normal a N (m

).
Relativ la mediile teoretice ale celor dou a caracteristici independente, se face
ipoteza nul a H
0
: m

= m

, cu una din alternativele:


H
1
: m

= m

, c and obt inem un test bilateral,


H
1
: m

> m

, c and obt inem un test unilateral dreapta,


H
1
: m

< m

, c and obt inem un test unilateral st anga.


Ca si n cazul testului F se consider a c ate o select ie repetat a de volum n

si
respectiv n

. P astr am n continuare notat iile de la testul F.


Distingem trei cazuri.
6.8. Teste pentru compararea mediilor 323
6.8.1 Dispersii cunoscute
Dispersiile

2
si

2
sunt cunoscute.

In acest caz se consider a statistica
(6.8.1) Z =
_

_
(m

)
_

2
n

2
n

2
,
care urmeaz a legea normal a N (0, 1).
Se aplic a prin urmare testul Z pentru compararea celor dou a medii teoretice.
Pentru nivelul de semnicat ie (0, 1) dat, se obt in regiunile critice corespun-
z atoare celor trei alternative:
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

| u v |
_

2
n

2
n

z
1

2
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

u v
_

2
n

2
n

z
1
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

u v
_

2
n

2
n

_
.
Etapele aplic arii testului Z
1. Se dau: ; x

1
, x

2
, . . . , x

; x

1
, x

2
, . . . , x

;
2. Se determin a intervalul (z
1
, z
2
) astfel nc at (z
2
)(z
1
) = 1, unde (x)
este funct ia lui Laplace tabelat a n Anexa I. Intervalul numeric (z
1
, z
2
) este res-
pectiv pentru cele trei alternative considerate:
_
z
1

2
, z
1

2
_
, (, z
1
),
(z

, +);
3. Se calculeaz a z =
x

2
n

2
n

2
, unde x

=
1
n

k=1
x

k
, x

=
1
n

k=1
x

k
;
4. Concluzia: dac a z (z
1
, z
2
) ipoteza H
0
este admis a, n caz contrar este
respins a.
Exemplul 6.8.1. La o unitate de mbuteliere a laptelui exist a dou a masini care efec-
tueaz a aceast a operat ie n sticle de 1 litru. Pentru a cerceta reglajul de mbuteliere
la cele dou a masini sau efectuat dou a select ii relative la sticlele mbuteliate de cele
dou a masini si sau obt inut datele de select ie:
324 Vericarea ipotezelor statistice
x

k
(n ml) 990 995 1000 1005 1010
f

k
7 9 11 8 5
,
x

k
(n ml) 985 990 995 1000 1005 1010
f

k
5 5 6 7 6 4

Folosind nivelul de semnicat ie = 0.01, vrem s a veric am dac a mediile de


umplere a sticlelor de c atre cele dou a masini sunt aceleasi, n cazul n care abaterile
standard sunt

= 6 ml si

= 7.5 ml.
Caracteristicile X

si X

, ce reprezint a cantitatea de lapte (n ml) cont inut a de


o sticl a mbuteliat a de prima masin a, respectiv de a doua masin a, se consider a ca
urm and legile de probabilitate normale N (m

, 6) si N (m

, 7.5).
Vericarea ipotezei nule H
0
: m

= m

, cu alternativa H
1
: m

= m

, se va
face cu testul Z, deoarece sunt cunoscute abaterile standard.
Folosind nivelul de semnicat ie = 0.01, se determin a din Anexa I valoarea
z
1

2
= z
0.995
, astfel nc at
_
z
1

2
_
=
1
2
= 0.495.
Anume, se obt ine c a z
0.995
= 2.58, care ne d a intervalul (2.58 ; 2.58) pentru sta-
tistica Z, dat a prin formula (6.8.1).
Se calculeaz a succesiv:
x

=
1
n

k=1
x

k
=
1
40
(7 990 + 9 995 + + 5 1010) = 999.375;
x

=
1
n

k=1
x

k
=
1
33
(5 985 + 5 990 + + 4 1010) = 997.424;
z =
x

2
n

2
n

=
999.375 997.424
_
36
40
+
56.25
33
=
1.951

2.6046
= 1.209
Deoarece z = 1.209 (2.58 ; 2.58), rezult a c a mediile de umplere a sticlelor nu
difer a semnicativ pentru cele dou a masini.
Programul 6.8.2. Programul Matlab, care urmeaz a, efectueaz a calculele din exem-
plul precedent.
x1=[990
*
ones(1,7),995
*
ones(1,9),1000
*
ones(1,11),...
1005
*
ones(1,8),1010
*
ones(1,5)];
x2=[985
*
ones(1,5),990
*
ones(1,5),995
*
ones(1,6),...
1000
*
ones(1,7),1005
*
ones(1,6),1010
*
ones(1,4)];
ma1=mean(x1); ma2=mean(x2);
z=(ma1-ma2)/sqrt(62/40+7.52/33);
z2=norminv(0.995); z1=-z2;
fprintf( z=%7.3f\n z1=%6.3f\n z2=%6.3f,z,z1,z2)
6.8. Teste pentru compararea mediilor 325
Rezultatele obt inute n urma execut arii programului sunt:
z= 1.209
z1=-2.576
z2= 2.576
6.8.2 Dispersii egale necunoscute
Dispersiile

2
si

2
sunt necunoscute si

2
=

2
=
2
. Se consider a statistica
(6.8.2) T =
_

_
(m

)
_
(n

1)

2
+ (n

1)

+n

2
1
n

+
1
n

,
care urmeaz a, conform Propriet at ii 4.2.28, legea Student cu n = n

+ n

2 grade
de libertate.

In acest caz se va aplica testul T. Pentru nivelul de semnicat ie (0, 1) dat, se


obt in regiunile critice corespunz atoare celor trei alternative:
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

K| u v | t
n,1

2
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

K ( u v) t
n,1
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

K ( u v) t
n,
_
,
unde
u =
1
n

k=1
u
k
, v =
1
n

k=1
v
k
, K =
1
_
(n

1)
2
u
+ (n

1)
2
v
_
n
1
n

+
1
n

,

2
u
=
1
n

1
n

k=1
(u
k
u)
2
,
2
v
=
1
n

1
n

k=1
(v
k
v)
2
.
Etapele aplic arii testului T
1. Se dau: ; x

1
, x

2
, . . . , x

; x

1
, x

2
, . . . , x

;
2. Se determin a intervalul (t
1
, t
2
) astfel nc at F
n
(t
2
) F
n
(t
1
) = 1 , unde
F
n
(x) este funct ia de repartit ie pentru legea Student cu n = n

+ n

2
grade de libertate, iar intervalul numeric (t
1
, t
2
) este respectiv, pentru cele trei
alternative considerate,
_
t
n,1

2
; t
n,1

2
_
, (; t
n,1
), (t
n,
; +);
326 Vericarea ipotezelor statistice
3. Se calculeaz a t =
x

_
(n

1)

2
+ (n

1)

+n

2
1
n

+
1
n

, unde

2
=
1
n

1
n

k=1
_
x

k
x

_
2
, x

=
1
n

k=1
x

k
,

2
=
1
n

1
n

k=1
_
x

k
x

_
2
, x

=
1
n

k=1
x

k
;
4. Concluzia: dac a t (t
1
, t
2
) ipoteza H
0
este admis a, n caz contrar este
respins a.
Exemplul 6.8.3. Se cerceteaz a dou a loturi de ulei pentru automobile, din punct de
vedere al v ascozit at ii, obt in anduse datele de select ie
x

k
10.27 10.28 10.29 10.30 10.32
f

k
3 2 1 1 1
pentru primul lot, respectiv
x

k
10.26 10.27 10.29 10.30 10.31
f

k
2 1 1 1 3
pentru al doilea lot.
Analizele fac anduse cu acelasi aparat, se consider a c a abaterile standard sunt
aceleasi. Consider and nivelul de semnicat ie = 0.05, s a se verice dac a mediile
de v ascozitate pentru cele dou a loturi nu difer a semnicativ.
Caracteristicile X

si X

, ce reprezint a v ascozit at ile pentru cele dou a loturi


de ulei, se consider a c a urmeaz a ecare legea normal a, respectiv N (m

, ) si
N (m

, ), cu abaterea standard > 0 necunoscut a.


Vericarea ipotezei nule H
0
: m

= m

, cu alternativa H
1
: m

= m

, se va
face cu testul T, deoarece abaterea standard este necunoscut a.
Folosind nivelul de semincat ie = 0.05, se determin a, din Anexa II, valoarea
t
n,1

2
, astfel nc at F
n
_
t
n,1

2
_
= 1

2
, unde num arul gradelor de libertate este
n = n

+ n

2 = 8 + 8 2 = 14. Adic a, se determin a t


14;0.975
astfel nc at
F
14
(t
14;0.975
) = 0.975, obt in anduse t
14;0.975
= 2.145.

In acest mod, sa obt inut
intervalul (2.145 ; 2.145) pentru statistica dat a prin formula (6.8.2), care urmeaz a
legea Student cu n = n

+n

2 grade de libertate.
Se calculeaz a pe r and
x

=
1
n

k=1
x

k
=
1
8
(3 10.27 + 2 10.28 + + 1 10.32) = 10.285;
6.8. Teste pentru compararea mediilor 327
x

=
1
n

k=1
x

k
=
1
8
(2 10.26 + 1 10.27 + + 3 10.31) = 10.289;

2
=
1
n

1
n

k=1
_
x

k
x

_
2
= 3.14 10
4
;

2
=
1
n

1
n

k=1
_
x

k
x

_
2
= 4.98 10
4
;
t =
x

_
(n

1)

2
+ (n

1)

+n

2
1
n

+
1
n

=
10.285 10.289
_
(22.001 + 34.881) 10
4

14
1
8
+
1
8
=
4 10
1

56.882

56 = 0.37.
Deoarece t = 0.37 (2.145 ; 2.145), rezult a c a v ascozit at ile medii ale celor
dou a loturi de ulei nu difer a semnicativ.
Programul 6.8.4. Programul Matlab urm ator efectueaz a calculele de mai sus, dup a
care aseaz a valoarea t a statisticii T, mpreun a cu capetele intervalului (t1,t2).
x1=[10.27
*
ones(1,3),10.28
*
ones(1,2),10.29,10.3,10.32];
x2=[10.26,10.26,10.27,10.29,10.3,10.31
*
ones(1,3)];
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2);
t=(ma1-ma2)/sqrt(7
*
v1+7
*
v2)
*
sqrt(14/(1/8+1/8));
t2=tinv(0.975,14); t1=-t2;
fprintf( t=%7.3f\n t1=%6.3f\n t2=%6.3f,t,t1,t2)

In urma execut arii programului, se obt in rezultatele:


t= -0.372
t1=-2.145
t2= 2.145
6.8.3 Functia ttest2
Sistemul Matlab, prin Statistics toolbox, dispune de funct ia ttest2, cu aplicabi-
litate la testul T pentru compararea a dou a medii, c and dispersiile sunt egale, dar
necunoscute. Apelarea acestei funct ii se face prin:
h=ttest2(x,y)
h=ttest2(x,y,alpha)
h=ttest2(x,y,alpha,tail)
[h,c,ci]=ttest(x,y,alpha,tail)
328 Vericarea ipotezelor statistice

In urma execut arii acestor instruct iuni, se efectueaz a testul T asupra datelor cont inute
n vectorii x si y, folosind nivelul de semnicat ie alpha, care are valoarea implicit a
alpha=0.05.
Parametrul tail specic a una din cele trei alternative, care conduc la tes-
tul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral st anga
(tail=-1). Dac a h=1, atunci ipoteza nul a va respins a, respectiv dac a h=0,
ipoteza nu poate respins a.
Ultima form a de apel permite, de asemenea, obt inerea valorii critice c, precum si
a intervalului de ncredere pentru diferent a mediilor teoretice, corespunz ator proba-
bilit at ii de ncredere 1-alpha, obt inut n vectorul cu dou a componente ci. Valoarea
critic a c are aceeasi semnicat ie cu cea precizat a la Observat ia 6.4.2 si se calculeaz a
cu formulele prezentate acolo.
Programul 6.8.5. Programul Matlab, ce urmeaz a, aplic a testul T, pentru datele
din Exemplul 6.8.3. Mai mult, se consider a si testele unilateral dreapta si unilateral
st anga, precum si obt inerea intervalelor de ncredere, c and alpha=0.05.
x=[10.27
*
ones(1,3),10.28
*
ones(1,2),10.29,10.3,10.32];
y=[10.26
*
ones(1,2),10.27,10.29,10.3,10.31
*
ones(1,3)];
fprintf( h c ci \n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest2(x,y,0.05,i);
fprintf( %d %5.4f (%4.2f,%4.2f) \n,h,c,ci)
end

In urma execut arii programului, se obt in rezultatele:


h c ci
___________________________
0 0.3577 (-Inf,0.01)
0 0.7154 (-0.03,0.02)
0 0.6423 (-0.02, Inf)
Se observ a c a pentru tail=-1 si tail=1, se construiesc intervale nem arginite,
respectiv la st anga si la dreapta.
6.8.4 Dispersii diferite necunoscute
Dispersiile

2
si

2
sunt necunoscute si diferite. Se va considera statistica
(6.8.3) T =
_

_
(m

)
_

2
n

2
n

2
,
6.8. Teste pentru compararea mediilor 329
care urmeaz a legea Student cu n grade de libertate. Num arul n al gradelor de libertate
se calculeaz a cu formula
(6.8.4)
1
n
=
c
2
n

1
+
(1 c)
2
n

1
, unde c =

2
n

_
_

2
n

2
n

_
.
Sa ajuns la testul T, care pentru nivelul de semnicat ie (0, 1) dat, conduce
la regiunile critice corespunz atoare alternativelor considerate, respectiv:
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

| u v |
_

2
u
n

+

2
v
n

t
n,1

2
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

u v
_

2
u
n

+

2
v
n

t
n,1
_
,
U =
_
(u
1
, . . . , u
n
; v
1
, . . . , v
n
) R
n

+n

u v
_

2
u
n

2
v
n

t
n,
_
.
Etapele aplic arii testului T
1. Se dau: ; x

1
, x

2
, . . . , x

; x

1
, x

2
, . . . , x

;
2. Se determin a intervalul (t
1
, t
2
) astfel nc at F
n
(t
2
) F
n
(t
1
) = 1 , unde
F
n
(x) este funct ia de repartit ie pentru legea Student cu n grade de liber-
tate calculat cu formula (6.8.4), iar intervalul numeric (t
1
, t
2
) este respec-
tiv, pentru cele trei alternative considerate,
_
t
n,1

2
; t
n,1

2
_
, (; t
n,1
),
(t
n,
; +);
3. Se calculeaz a t =
x

2
n

2
n

2
, unde

2
=
1
n

1
n

k=1
_
x

k
x

_
2
, x

=
1
n

k=1
x

k
,

2
=
1
n

1
n

k=1
_
x

k
x

_
2
, x

=
1
n

k=1
x

k
;
4. Concluzia: dac a t (t
1
, t
2
) ipoteza H
0
este admis a, n caz contrar este
respins a.
330 Vericarea ipotezelor statistice
Exemplul 6.8.6. Se cerceteaz a capacitatea olelor farmaceutice de 100 ml, care
provin de la dou a fabrici.

In acest scop, se consider a c ate o select ie pentru dou a loturi
de ole provenite respectiv de la cele dou a fabrici. Select iile obt inute au distribut iile
empirice de select ie
X

_
_
100 101 102 103 104 105 106 107 108 109
1 1 2 3 4 5 4 1 3 1
_
_
,
respectiv, pentru X

: 110, 101, 112, 120, 117, 105, 109, 111, 118, 113, 106, 108,
115, 113, 112, 100, 116, 112, 114, 112.
Folosind nivelul de semnicat ie = 0.02, vom compara dispersiile celor dou a
caracteristici. Apoi, pe baza acestui rezultat, vom compara mediile celor dou a carac-
teristici, utiliz and acelasi nivel de semnicat ie = 0.02.
Vom considera c a cele dou a caractersitici X

si X

sunt repartizate normal, res-


pectiv N (m

) si N (m

). Se poate aplica testul F, pentru compararea disper-


siilor teoretice

2
si

2
.
Calcul am pe r and:
x

=
1
n

k=1
x

k
=
1
25
(1 100 + + 1 109) =104.76; x

=
1
n

k=1
x

k
=111.2;

2
=
1
n

1
n

k=1
_
x

k
x

_
2
= 5.19;

2
=
1
n

1
n

k=1
_
x

k
x

_
2
= 27.537.
Deoarece

2
<

2
, se consider a statistica F =

2
_

2
, care urmeaz a legea
FisherSnedecor cu (m, n) = (n

1, n

1) = (19 , 24) grade de libertate.


Dac a se consider a ipoteza nul a H
0
:

2
=

2
, cu alternativa H
1
:

2
=

2
,
avem c a f =

2
=
27.537
5.19
= 5.31.
Pe de alt a parte, pentru = 0.02, avem din Anexa IV c a
f
m,n;1

2
= f
19.24;0.99
= 2.76, f
m,n;

2
= f
19.24;0.01
=
1
f
24.19;0.99
=
1
2.92
= 0.34.

In acest fel, am obt inut intervalul (0.34 ; 2.76), pentru statistica F.


Deoarece f = 5.31 / (0.34 ; 2.76), respingem ipoteza c a

2
=

2
.
Av and n vedere c a dispersiile teoretice

2
si

2
sunt necunoscute, iar conform
rezultatului precedent difer a n mod semnicativ, folosim testul T pentru compararea
mediilor m

si m

. Statistica T, ce se consider a, n acest caz, este cea dat a prin for-


mula (6.8.3), care urmeaz a legea Student cu n grade de libertate, unde n se calculeaz a
din relat ia (6.8.4).
6.8. Teste pentru compararea mediilor 331
Astfel, pentru determinarea lui n, avem succesiv
c =
5.19
25
5.19
25
+
27.537
20
= 0.131 si
1
n
=
0.131
2
24
+
(1 0.131)
2
19
= 0.0404604,
de unde n = 25. Folosind Anexa II, se obt ine c a t
25;0.99
= 2.485, prin urmare inter-
valul pentru statistica T este (2.485 ; 2.485).
Pe de alt a parte, avem c a
t =
x

2
n

2
n

=
104.76 111.2

0.2076 + 1.3768
=
6.44
1.26
= 5.11.
Deoarece t = 5.11 / (2.485 ; 2.485), respingem ipoteza c a mediile teoretice
pentru olele produse de cele dou a fabrici nu difer a semnicativ.
Programul 6.8.7. Calculele din exemplul de mai sus, se pot efectua cu urm atorul
program Matlab:
x1=[100,101,102
*
ones(1,2),103
*
ones(1,3),...
104
*
ones(1,4),105
*
ones(1,5),106
*
ones(1,4),...
107,108
*
ones(1,3),109];
x2=[110,101,112,120,117,105,109,111,118,113,...
106,108,115,113,112,100,116,112,114,112];
f=var(x2)/var(x1);
c1=finv(0.01,19,24); c2=finv(0.99,19,24);
fprintf( f=%6.2f, c1=%5.2f, c2=%5.2f\n,f,c1,c2)
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2); c=(v1/25)/(v1/25+v2/20);
n=c2/24+(1-c)2/19; n=ceil(1/n);
t=(ma1-ma2)/sqrt(v1/25+v2/20);
t2=tinv(0.99,n); t1=-t2;
fprintf( t=%7.3f, t1=%6.3f, t2=%6.3f,t,t1,t2)
Rezultatele obt inute, n urma execut arii programului, sunt:
f= 5.31, c1= 0.34, c2= 2.76
t= -5.116, t1=-2.485, t2= 2.485
Observatia 6.8.8. Dac a se noteaz a prin = m

, atunci ipoteza compus a nul a


devine H
0
: =0, iar ipotezele alternative se rescriu dup a cum urmeaz a: H
1
: = 0,
H
1
: >0 si respectiv H
1
: <0, iar statisticile care au fost date mai nainte se pot
rescrie cu acest nou parametru necunoscut .
Observatia 6.8.9. C and select iile sunt de volum mare, n

, n

> 50, pentru legi de


probabilitate oarecari, respectiv n

, n

> 20, pentru legi de probabilitate normale,


statistica
Z =
_

_
(m

)
_

2
n

2
n

2
,
332 Vericarea ipotezelor statistice
poate considerat a ca urm and legea normal a N (0, 1). Asadar n acest caz se poate
aplica testul Z.
6.8.5 Observatii perechi
Dac a cele dou a select ii sunt de tip pereche, adic a variabilele de select ie sunt perechile
(X

k
, X

k
), k = 1, n, atunci se pot considera diferent ele D
k
= X

k
X

k
, pentru care
E(D
k
) = m = m

, oricare a k = 1, n.
Problema poate reformulat a.
Se consider a o populat ie C, pentru care se cerceteaz a caracteristica D, care
urmeaz a legea normal a N (m, ), cu > 0 necunoscut.
Vrem s a veric am ipoteza nul a H
0
: m = 0, cu una din alternativele
H
1
: m = 0, c and obt inem testul T bilateral,
H
1
: m > 0, c and obt inem testul T unilateral dreapta,
H
1
: m < 0, c and obt inem testul T unilateral st anga.
Conform Propriet at ii 4.2.26, statistica
T =

D m

D

n
,
unde

D =
1
n
n

k=1
D
k
=
n

k=1
_
X

k
X

k
_
,
2
=
1
n 1
n

k=1
_
D
k


D
_
2
,
urmeaz a legea Student cu n 1 grade de libertate.
Prin urmare, pentru nivelul de semnicat ie (0, 1) dat, se poate determina
intervalul numeric (t
1
, t
2
) astfel nc at
P
_
T (t
1
, t
2
)

H
0
_
= F
n1
(t
2
) F
n1
(t
1
) = 1 ,
unde
F
m
(t) =

_
m+1
2
_

m
_
m
2
_
_
t

_
1 +
x
2
m
_

m+1
2
dx, t R,
este funct ia de repartit ie pentru legea Student cu m grade de libertate (tabelat a n
Anexa II, pentru anumite valori).
Intervalul numeric (t
1
, t
2
) pentru statistica T nu este determinat n mod unic din
condit ia de mai sus.

In funct ie de alternativa H
1
aleas a, se consider a suplimentar:
6.8. Teste pentru compararea mediilor 333
t
1
= t
2
, t
2
= t
n1,1

2
, dac a H
1
: m = 0,
t
1
= , t
2
= t
n1,1
, dac a H
1
: m > 0,
t
1
= t
n1,
, t
2
= +, dac a H
1
: m < 0,
unde t
n1,
este cuantila de ordin a legii Student cu n 1 grade de libertate.
Etapele aplic arii testului T
1. Se dau: ; x

1
, x

2
, . . . , x

n
; x

1
, x

2
, . . . , x

n
;
2. Se calculeaz a intervalul (t
1
, t
2
) astfel nc at F
n1
(t
1
) F
n1
(t
2
) = 1 ,
(dup a cum s-a prezentat nainte);
3. Se calculeaz a
t =

d

D

n
,

d =
1
n
n

k=1
d
k
=
1
n
n

k=1
_
x

k
x

k
_
,
2
D
=
1
n 1
n

k=1
_
d
k


d
_
2
;
4. Concluzia: dac a t (t
1
, t
2
) ipoteza H
0
este admis a, n caz contrar ipoteza este
respins a.
Programul 6.8.10. Vom scrie un program, care genereaz a n vectori aleatori, care
urmeaz a legea normal a bidimensional a. Folosind testul T pentru perechi, vom veri-
ca ipoteza nul a, c a mediile celor dou a variabile sunt egale, precum si intervalul de
ncredere pentru diferent a mediilor, respectiv c and se aplic a testele bilateral, unilate-
ral dreapta si unilateral st anga. Nivelul de semnicat ie folosit este alpha=0.05.
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); Z=mvnrnd(mu,v,n);
d=diff(Z,1,2);
fprintf( h c ci \n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(d,0,0.05,i);
fprintf( %d %5.4f (%4.2f,%4.2f) \n,h,c,ci)
end
Rezultatele obt inute, pentru mu1=mu2=10, v =
_
2 2
2 3
_
si n=30, sunt
334 Vericarea ipotezelor statistice
h c ci
___________________________
0 0.6715 (-Inf,0.35)
0 0.6570 (-0.26,0.41)
0 0.3285 (-0.20, Inf)
Deoarece h=0, pentru ecare alternativ a n parte, testul T nu respinge ipoteza c a cele
dou a medii sunt egale. Acest lucru se vede si din faptul c a valoarea critic a satisface
inegalitatea c>alpha=0.05.
Programul mai calculeaz a intervalul de ncredere pentru diferent a celor dou a
medii. Se observ a c a acesta difer a, n funct ie de parametrul tail=-1,0,1. De
asemenea, se observ a c a am considerat nivelul de semnicat ie alpha=0.05, dar
acesta poate usor modicat n apelul funct iei ttest.
6.9 Testul
2
pentru concordant a
Se consider a colectivitatea C cercetat a din punct de vedere al caracteristicii X can-
titativ a sau calitativ a. Fie k num arul claselor caracteristicii X si E
i
evenimentul ca
un individ luat la nt amplare din colectivitatea C s a apart in a clasei cu num arul de
ordine i.
Not and p
i
= P (E
i
), i = 1, k, atunci

k
i=1
p
i
= 1.
Relativ la caracteristica X facem ipoteza nul a H
0
: p
i
= p
(0)
i
, i = 1, k, cu ipoteza
alternativ a H
1
: exist a i
0
astfel nc at p
i
0
= p
(0)
i
0
.
Pentru a verica aceast a ipotez a se consider a o select ie repetat a de volum n. Fie
datele de select ie x
1
, x
2
, . . . , x
n
. Folosind aceste date de select ie se obt in frecvent ele
absolute ale claselor caracteristicii X. Vom nota prin n
i
frecvent a absolut a a clasei
cu num arul de ordine i. Altfel spus, n
i
num ar a de c ate ori a ap arut evenimentul E
i
n
select ia considerat a.
Corespunz ator frecvent elor absolute n
i
, i = 1, k, avem variabilele aleatoare (de
select ie) N
i
, i = 1, k, ce iau aceste valori.
Asadar, pornind de la caracteristica X, care poate si calitativ a, s-a ajuns la
variabilele de select ie N
i
, i = 1, k, care sunt componentele unui vector aleator k-
dimensional N = (N
1
, N
2
, . . . , N
k
), ce urmeaz a legea multinomial a. Anume, avem:
P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
) =
n!
n
1
!n
2
! . . . n
k
!
p
n
1
1
p
n
2
2
. . . p
n
k
k
,
unde n = n
1
+n
2
+ +n
k
, n
i
= 0, n, i = 1, k, p
1
+p
2
+ +p
k
= 1.
Dac a privim ipoteza nul a H
0
, constat am c a aceasta se refer a la parametrii unei
legi multinomiale.
6.9. Testul
2
pentru concordant a 335
Proprietatea 6.9.1. Cu notat iile dinainte avem c a statistica

2
=
k

i=1
(N
i
np
i
)
2
np
i
,
urmeaz a legea
2
cu k 1 grade de libertate, c and n .
Demonstrat ie. Se porneste de la formula lui Stirling n!

=

2nn
n
e
n
. Astfel,
avem c a
P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
)

=

2n n
n
e
n

k
i=1
_

2n
i
n
n
i
i
e
n
i
_p
n
1
1
p
n
2
2
. . . p
n
k
k
,
sau
P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
)

=
k

i=1
_
np
i
n
i
_
n
i
+
1
2
K,
unde K este o constant a pozitiv a. Logaritm and aceast a relat ie obt inem
ln P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
)

= ln K +
k

i=1
_
n
i
+
1
2
_
ln
np
i
n
i
,
si not and
x
i
=
n
i
np
i

np
i
, adic a
n
i
np
i
= 1 +
x
i

np
i
,
rezult a c a
ln P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
)

= ln K
k

i=1
_
n
i
+
1
2
_
ln
_
1 +
x
i

np
i
_

P astr and primii doi termeni din dezvoltarea n serie a logaritmului avem
ln
_
1 +
x
i

np
i
_

=
x
i

np
i

x
2
i
2np
i
,
deci
ln P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
)

= ln K
k

i=1
_
n
i
+
1
2
__
x
i

np
i

x
2
i
2np
i
_
= ln K
k

i=1
_
np
i
+x
i

np
i
+
1
2
__
x
i

np
i

x
2
i
2np
i
_

= ln K
k

i=1
_
x
i

np
i
+
x
2
i
2
_

336 Vericarea ipotezelor statistice


Dar avem c a
k

i=1
x
i

np
i
=
k

i=1
(n
i
np
i
) = n n = 0,
deci
ln P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
)

= ln K
1
2
k

i=1
x
2
i
sau
P (N
1
= n
1
, N
2
= n
2
, . . . , N
k
= n
k
)

= Ke

1
2

k
i=1
x
2
i
.
Dac a se noteaz a X
i
=
N
i
np
i

np
i
, obt inem
P (X
1
= x
1
, X
2
= x
2
, . . . , X
k
= x
k
)

= Ke

1
2

k
i=1
x
2
i
,
adic a vectorul aleator
(X
1
, X
2
, . . . , X
k
) =
_
N
1
np
1

np
1
,
N
2
np
2

np
2
, . . . ,
N
k
np
k

np
k
_
,
pentru n , urmeaz a o lege normal a k dimensional a degenerat a, deoarece ecare
component a X
i
se poate exprima ca si combinat ie liniar a a celorlalte componente.
Din teoria probabilit at ilor se cunoaste c a suma p atratelor componentelor unui
vector aleator ce urmeaz a legea normal a si ntre care exist a o leg atur a liniar a este
o variabil a aleatoare ce urmeaz a legea
2
cu num arul gradelor de libertate dat de
num arul componentelor vectorului mai put in unu. Ceea ce trebuie demonstrat.
Pe baza propriet at ii precedente, pentru nivelul de semnicat ie (0, 1) dat, se
poate determina cuantila
2
k1,1
astfel nc at
F
k1
_

2
k1,1
_
= P
_

2

2
k1,1

H
0
_
= 1 ,
unde F
k1
noteaz a funct ia de repartit ie a legii
2
cu k 1 grade de libertate.
Regiunea critic a U se poate scrie si n acest caz, anume
U =
_
(u
1
, u
2
, . . . , u
k
) R
k

i=1
_
u
i
np
(0)
i
_
2
np
(0)
i

2
k1,1
,
k

i=1
u
i
= n
_
.
Astfel, pentru n mare, are loc relat ia P
_
(N
1
, N
2
, . . . , N
k
) U | H
0
_
= , deci
ipoteza H
0
va admis a dac a (n
1
, n
2
, . . . , n
k
) / U, respectiv va respins a n caz
contrar.
6.9. Testul
2
pentru concordant a 337
Etapele aplic arii testului
2
1. Se dau: ; x
1
, x
2
, . . . , x
n
; p
i
= p
(0)
i
, i = 1, k. (sirul datelor de select ie
x
1
, x
2
, . . . , x
n
este un sir av and ca elemente evenimentele E
i
, i = 1, k, din
care se obt in frecvent ele absolute n
1
, n
2
, . . . , n
k
);
2. Se calculeaz a
2
k1,1
astfel nc at F
k1
_

2
k1,1
_
= 1 ;
3. Se calculeaz a x
2
=

k
i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
;
4. Concluzia: dac a x
2
<
2
k1,1
ipoteza H
0
este admis a, n caz contrar ipoteza
este respins a.
Observatia 6.9.2. La utilizarea testului
2
privind concordant a trebuie ca s a e n-
deplinite condit iile np
i
> 4, c and k > 4, iar dac a num arul claselor k 4, atunci np
i
s a e mult mai mare dec at 4. C and aceste condit ii nu sunt ndeplinite, se efectueaz a
o regrupare a datelor de select ie.
Exemplul 6.9.3. S-a aruncat un zar de 60 de ori si s-au obt inut urm atoarele rezultate:
Fat a 1 2 3 4 5 6
Frecvent a 15 7 4 11 6 17
Folosind nivelul de semnicat ie = 0.05, s a veric am dac a zarul respectiv este fals
sau nu.
Se aplic a testul
2
, privind parametrii legii multinomiale.

Intr-adev ar, evenimen-
tul E
i
reprezint a aparit ia fet ei cu num arul i, i = 1, 6. Se face ipoteza nul a
H
0
: p
i
=
1
6
, i = 1, 6, adic a zarul nu este fals,
cu alternativa
H
1
: i
0
astfel nc at p
i
0
=
1
6
, adic a zarul este fals.
Se calculeaz a valoarea statisticii
2
, care are k 1 = 5 grade de libertate, anume
x
2
=
k

i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
=
_
1560
1
6
_
2
60
1
6
+
_
760
1
6
_
2
60
1
6
+ +
_
1760
1
6
_
2
60
1
6
=13.6.
Pe de alt a parte, din Anexa III, avem cuantila
2
k1,1
=
2
5,0.95
= 11.1, deci
rezult a x
2
= 13.6 > 11.1 =
2
5,0.95
, ceea ce conduce la respingerea ipotezei nule,
adic a accept am ipoteza c a zarul este fals.
338 Vericarea ipotezelor statistice
Programul 6.9.4. Programul Matlab, care urmeaz a, efectueaz a calculele din exem-
plul precedent:
x=1:6; f=[15,7,4,11,6,17]; p=1/6
*
ones(1,6);
x2=sum((f-60
*
p).2./(60
*
p));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)
iar rezultatele obt inute sunt:
x2= 13.6
cuant= 11.07
Aplicatia 6.9.5. (Testul
2
neparametric privind concordant a). Fie caracteristica X,
care urmeaz a legea de probabilitate cu funct ia de repartit ie F necunoscut a. Relativ
la legea de probabilitate, se face ipoteza nul a H
0
: F = F
0
, cu ipoteza alternativ a
H
1
: F = F
0
. C and consider am testul
2
neparametric, funct ia de repartit ie F
0
nu
depinde de nici un parametru necunoscut.
Dac a domeniul valorilor caracteristicii X este, s a zicem, intervalul (a, b) si dac a
vom considera clasele obt inute prin punctele a = a
0
< a
1
< < a
k
= b, atunci
apar parametrii necunoscut i
p
i
= P (a
i1
< X a
i
) = F (a
i
) F (a
i1
) , i = 1, k.
De asemenea, evenimentul E
i
va evenimentul ca un individ luat la nt amplare din
colectivitatea cercetat a s a apart in a clasei [a
i1
, a
i
). Prin urmare, s-a ajuns la aplicarea
testului
2
privind concordant a. Ipoteza nul a, mai sus precizat a, devine n acest fel
H
0
: p
i
= p
(0)
i
, i = 1, k, iar ipoteza alternativ a se va rescrie H
1
: exist a i
0
astfel nc at
p
i
0
= p
(0)
i
0
, unde p
(0)
i
= P (a
i1
< X a
i
| H
0
) = F
0
(a
i
) F
0
(a
i1
) .
Etapele aplic arii testului
2
neparametric
1. Se dau: ; x
1
, x
2
, . . . , x
n
; a
0
, a
1
, . . . , a
k
; F
0
;
2. Se calculeaz a frecvent ele absolute n
i
, i = 1, k, si probabilit at ile
p
(0)
i
= F
0
(a
i
) F
0
(a
i1
) , i = 1, k;
3. Se calculeaz a
2
k1,1
astfel nc at F
k1
_

2
k1,1
_
= 1 , F
k1
ind
funct ia de repartit ie a legii
2
cu k 1 grade de libertate;
4. Se calculeaz a x
2
=
k

i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
;
6.9. Testul
2
pentru concordant a 339
5. Concluzia: dac a x
2
<
2
k1,1
se admite ipoteza c a legea de probabilitate a
caracteristicii X este dat a de funct ia de repartit ie F
0
, n caz contrar ipoteza este
respins a.
Exemplul 6.9.6. Fie caracteristica X ce reprezint a num arul fetelor dintro familie cu
patru copii. Pentru vericarea ipotezei c a X urmeaz a o lege binomial a de parametru
p =
1
2
, s-a efectuat o select ie de volum n = 32. Distribut ia select iei lui X este
X
_
_
0 1 2 3 4
4 10 8 7 3
_
_
.
Folosind nivelul de semnicat ie = 0.05, s a veric am dac a X urmeaz a legea bino-
mial a. Dac a X urmeaz a legea binomial a cu p =
1
2
, atunci are distribut ia teoretic a
X
_
_
0 1 2 3 4
1
16
1
4
3
8
1
4
1
16
_
_
.
Ipoteza privind faptul c a X urmeaz a legea binomial a, se scrie sub forma
H
0
: p
0
= p
4
=
1
16
, p
1
= p
3
=
1
4
, p
2
=
3
8

Se va aplica testul
2
neparametric, unde num arul gradelor de libertate este dat
de k 1 = 5 1 = 4. Valoarea calculat a a caracteristicii
2
este
x
2
=
4

i=0
_
n
i
np
(0)
i
_
2
np
(0)
i
=
_
432
1
16
_
2
32
1
16
+
_
1032
1
4
_
2
32
1
4
+ +
_
332
1
16
_
2
32
1
16
=4.5.
Cum x
2
= 4.5 < 9.49 =
2
4,0.95
=
2
k1,1
, avem c a ipoteza nul a este admis a.
Programul 6.9.7. Prin executarea programului Matlab:
x=0:4; f=[4,10,8,7,3];
p=[1/16,1/4,3/8,1/4,1/16];
x2=sum((f-32
*
p).2./(32
*
p));
cuant=chi2inv(0.95,4);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)
se obt ine
x2= 4.5
cuant= 9.49
340 Vericarea ipotezelor statistice
Aplicatia 6.9.8. (Testul
2
neparametric privind exponent ialitatea). Relativ la ca-
racteristica X se face ipoteza nul a H
0
: F = F
0
, unde F
0
(x) = 1 e

, x > 0 si
parametrul > 0 cunoscut, adic a X urmeaz a legea exponent ial a.
Deoarece domeniul valorilor caracteristicii X este intervalul (0, +), se con-
sider a clasele caracteristicii X date prin 0 = a
0
< a
1
< < a
k
= +. Astfel
avem:
p
(0)
i
= F
0
(a
i
) F
0
(a
i1
) = e

a
i1
e

a
i
, i = 1, k 1 si p
(0)
k
= e

a
k1
.
Etapele aplic arii testului
1. Se dau: ; x
1
, x
2
, . . . , x
n
; a
1
, a
2
, . . . , a
k1
; ;
2. Se calculeaz a frecvent ele absolute n
i
, i = 1, k, si probabilit at ile
p
(0)
1
= 1 e

a
1
, p
(0)
i
= e

a
i1
e

a
i
, i = 2, k 1, p
(0)
k
= e

a
k1
;
3. Se calculeaz a
2
k1,1
astfel nc at F
k1
_

2
k1,1
_
= 1 ;
4. Se calculeaz a x
2
=
k

i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
;
5. Concluzia: dac a x
2
<
2
k1,1
se accept a ipoteza c a X urmeaz a legea expo-
nent ial a de parametru , n caz contrar ipoteza este respins a.
Aplicatia 6.9.9. (Testul
2
parametric privind concordant a). Se consider a caracte-
ristica X care urmeaz a legea de probabilitate cu funct ia de repartit ie F necunos-
cut a. Relativ la legea de probabilitate se face ipoteza nul a H
0
: F = F
0
cu ipoteza
alternativ a H
1
: F = F
0
. Fat a de cazul neparametric, funct ia de repartit ie F
0
se
consider a c a depinde de s parametri necunoscut i. Fie acesti parametri
1
,
2
, . . . ,
s
,
adic a F
0
= F
0
(x;
1
,
2
, . . . ,
s
).

In acest caz, fat a de cazul neparametric, la nceput se estimeaz a parametrii ne-


cunoscut i, folosind datele de select ie considerate, cu ajutorul metodei verosimilit at ii
maxime. Fie estimat iile de verosimilitate maxim a ale parametrilor mai sus precizat i,
respectiv

1
,

2
, . . . ,

s
.

In continuare, cele expuse la cazul neparametric r am an neschimbate cu dou a ob-


servat ii.

In primul r and, probabilit at ile claselor considerate se calculeaz a prin formula
p
(0)
i
= P (a
i1
<Xa
i
| H
0
)= F
0
_
a
i
;

1
,

2
, . . . ,

s
_
F
0
_
a
i1
;

1
,

2
, . . . ,

s
_
,
pentru i = 1, k.

In al doilea r and, legea
2
, n acest caz, are k s 1 grade de
libertate.
6.9. Testul
2
pentru concordant a 341
Etapele aplic arii testului
2
parametric
1. Se dau: ; x
1
, x
2
, . . . , x
n
; a
0
, a
1
, . . . , a
k
; F
0
= F
0
(x;
1
,
2
, . . . ,
s
) ;
2. Se determin a estimat iile de verosimilitate maxim a

1
,

2
, . . . ,

s
pentru para-
metrii
1
,
2
, . . . ,
s
;
3. Se calculeaz a frecvent ele absolute n
i
, i = 1, k, si probabilit at ile
p
(0)
i
= F
0
_
a
i
;

1
,

2
, . . . ,

s
_
F
0
_
a
i1
;

1
,

2
, . . . ,

s
_
, i = 1, k;
4. Se calculeaz a
2
ks1,1
astfel nc at F
ks1
_

2
ks1,1
_
= 1 ;
5. Se calculeaz a x
2
=
k

i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
;
6. Concluzia: dac a x
2
<
2
ks1,1
se accept a ipoteza c a X urmeaz a legea de
probabilitate dat a prin funct ia de repartit ie F
0
= F
0
_
x;

1
,

2
, . . . ,

s
_
, n caz
contrar ipoteza este respins a.
Exemplul 6.9.10. O substant a radioactiv a este observat a n 2608 intervale de timp de
lungimi egale (7.5 secunde). Pentru ecare interval de timp este nregistrat num arul
particulelor emise. Rezultatele obt inute sunt:
Nr. part. 0 1 2 3 4 5 6 7 8 9 10
ni 57 203 383 525 532 408 273 139 45 27 16
Not and cu X caracteristica ce reprezint a num arul de particule emise ntr-un interval
de timp de lungime 7.5 secunde, vrem s a veric am dac a X urmeaz a legea lui Poisson,
folosind nivelul de semnicat ie = 0.01.
Folosim testul
2
parametric privind concordant a, deoarece parametrul legii lui
Poisson, = E(X), este necunoscut. Asadar, num arul gradelor de libertate va
k s 1 = 11 1 1 = 9. Avem c a estimatorul de verosimilitate maxim a pentru
este media de select ie. Prin urmare avem

=
1
n
k

i=0
n
i
x
i
=
1
2608
(0 57 + 1 203 + + 10 16) = 3.87.
Se calculeaz a apoi probabilit at ile de la legea lui Poisson, cu parametrul

= 3.87,
adic a p
(0)
i
=

i
i!
e

, i = 0, 1, 2, . . . . Astfel se obt in valorile:


342 Vericarea ipotezelor statistice
i 0 1 2 3 4 5 6 7 8 9 10
p
(0)
i
0.021 0.081 0.156 0.202 0.195 0.151 0.097 0.054 0.026 0.011 0.006
de unde
x
2
=
10

i=0
_
n
i
np
(0)
i
_
2
np
(0)
i
= 14.9.
Pe de alt a parte, folosind Anexa III, avem cuantila
2
9,0.99
= 21.7 si prin urmare
x
2
= 14.9 < 21.7 =
2
9,0.99
, deci ipoteza c a X urmeaz a legea lui Poisson este
acceptat a.
Programul 6.9.11. Ilustrarea calculelor este f acut a prin programul Matlab
x=0:10;
f=[57,203,383,525,532,408,273,139,45,27,16];
la=sum(f.
*
x)/2608; p=poisspdf(x,la);
x2=sum((f-2608
*
p).2./(2608
*
p));
cuant=chi2inv(0.99,9);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)
care prin executare conduce la urm atoarele rezultate:
x2= 14.9
cuant= 21.67
Aplicatia 6.9.12. (Testul
2
parametric privind normalitatea). Relativ la caracteris-
tica X se consider a ipoteza nul a H
0
: F = F
0
, unde
F
0
(x) = F
0
(x; m, ) =
1

2
_
x

(tm)
2
2
2
dt, x R,
m Rsi > 0 sunt parametri necunoscut i, adic a faptul c a X urmeaz a legea normal a
cu cei doi parametri necunoscut i.
Folosind metoda verosimilit at ii maxime se determin a, pe baza datelor de select ie
x
1
, x
2
, . . . , x
n
, estimat iile de verosimilitate maxim a pentru m si respectiv , anume
m =
1
n
n

i=1
x
i
= x si =

_
1
n
n

i=1
(x
i
x)
2
=


2
(a se vedea Exemplul 5.3.7). Deoarece domeniul valorilor caracteristicii X este R se
consider a clasele date prin = a
0
< a
1
< < a
k
= +.
Pe de alt a parte probabilit at ile corespunz atoare acestor clase se obt in cu formulele
p
(0)
i
= F
0
_
a
i
; x,


2
_
F
0
_
a
i1
; x,


2
_
, i = 1, k.
6.9. Testul
2
pentru concordant a 343
Av and n vedere c a
F
0
(x; m, ) =
1
2
+
_
x m

_
,
unde este funct ia lui Laplace, adic a
(x) =
1

2
_
x
0
e

t
2
2
dt,
rezult a c a
p
(0)
i
=
_
a
i
x


2
_

_
a
i1
x


2
_
, i = 1, k.
Etapele aplic arii testului
1. Se dau: ; x
1
, x
2
, . . . , x
n
; a
1
, a
2
, . . . , a
k1
;
2. Se calculeaz a frecvent ele absolute n
i
, i = 1, k, estimat iile
x =
1
n
n

i=1
x
i
,
2
=
1
n
n

i=1
(x
i
x)
2
si probabilit at ile
p
(0)
1
=
1
2
+
_
a
1
x


2
_
, p
(0)
k
=
1
2

_
a
k1
x


2
_
,
p
(0)
i
=
_
a
i
x


2
_

_
a
i1
x


2
_
, i = 2, k 1;
3. Se calculeaz a
2
k3,1
astfel nc at F
k3
_

2
k3,1
_
= 1 ;
4. Se calculeaz a x
2
=
k

i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
;
5. Concluzia: dac a x
2
<
2
k3,1
se accept a ipoteza c a X urmeaz a legea nor-
mal a N ( x,


2
), n caz contrar ipoteza este respins a.
Exemplul 6.9.13. Se consider a caracteristica X, ce reprezint a rezistent a, n K, a
unor tronsoane de ceramic a acoperite cu carbon. S a se verice normalitatea lui X,
folosind o select ie de volum n = 124, pentru care sau obt inut datele de select ie
clasa (; 1.65) (1.65; 1.70] (1.70; 1.75] (1.75; 1.80] (1.80; 1.85]
frecv. 11 14 17 17 18
344 Vericarea ipotezelor statistice
(1.85; 1.90] (1.90; 1.95] (1.95; 2.00] (2.0; +)
16 13 10 8
utiliz and testul de concordant a
2
, cu nivelul de semnicat ie = 0.05.
Prima dat a se estimeaz a parametrii de la legea normal a N (m, ), adic a media
teoretic a m = E(X) si abaterea standard teoretic a =
_
V ar (X), folosind metoda
de verosimilitate maxim a. Se cunoaste c a estimat iile de verosimilitate maxim a pentru
m si sunt respectiv
m =
1
n
=
k

i=1
x
i
= x, =

_
1
n
k

i=1
(x
i
x)
2
=


2
,
(a se vedea Exemplul 5.3.7). Avem distribut ia empiric a de select ie pentru caracteris-
tica X
X
_
_
1.625 1.675 1.725 1.775 1.825 1.875 1.925 1.975 2.125
11 14 17 17 18 16 13 10 8
_
_
de unde calcul am
m = x =
1
n
n

i=1
x
i
=
1
124
(11 1.625 + 14 1.675 + + 8 2.125) = 1.82;
=


2
=

_
1
n
n

i=1
(x
i
x)
2
= 0.129.
Se consider a valoarea numeric a
x
2
=
k

i=1
(f
i
n p
i
)
2
n p
i
,
unde k este num arul claselor (k = 9, n cazul de fat a), f
i
este frecvent a clasei i, iar
p
i
este dat prin
p
i
=
_
a
i
x

_

_
a
i1
x

_
,
subintervalul [a
i1
, a
i
) denind clasa i. Dup a cum este cunoscut, x
2
este valoarea
unei variabile aleatoare care urmeaz a legea
2
cu k s 1 grade de libertate, s ind
num arul parametrilor estimat i.

In cazul de fat a avem c a s = 2, deci avem 921 = 6
grade de libertate.
6.9. Testul
2
pentru concordant a 345
Se determin a intervalul
_
0,
2
k3,1
_
, pentru statistica
2
, folosind Anexa III.
Anume, se obt ine c a
2
k3,1
=
2
6;0.95
= 12.59, adic a intervalul numeric pentru
statistica
2
este (0 ; 12.59).
Calculele pentru valoarea numeric a x
2
se aranjeaz a n urm atorul tabel:
ai fi
a
i
x


_
a
i
x

_
pi n pi
(f
i
n p
i
)
2
n p
i
1.65 11 1.40 0.4188 0.0812 10.0647 0.0869
1.70 14 0.97 0.3238 0.0861 10.6711 1.0385
1.75 17 0.53 0.2030 0.1298 16.0891 0.0516
1.80 17 0.10 0.0402 0.1628 20.1848 0.5025
1.85 18 0.33 0.1297 0.1699 21.0714 0.4477
1.90 16 0.76 0.2773 0.1476 18.3036 0.2899
1.95 13 1.20 0.3840 0.1067 13.2299 0.0040
2.00 10 1.63 0.4482 0.0642 7.9568 0.5247
+ 8 + 0.5000 0.0518 6.4286 0.3841
n = 124 x
2
= 3.3
Valorile funct iei lui Laplace se iau din Anexa I si se are n vedere c a funct ia este
impar a, adic a (x) = (x). De asemenea, facem observat ia c a
p
1
=
_
a
1
x

_

_
a
0
x

_
= (1.4) ()
= 0.4188 + 0.5 = 0.0812.
Deoarece x
2
= 3.3 (0 ; 12.59), rezult a c a se accept a ipoteza normalit at ii caracte-
risticii X.
Programul 6.9.14. Toate calculele din tabelul precedent pot efectuate prin progra-
mul Matlab:
x=1.625:0.05:2.025; f=[11,14,17,17,18,16,13,10,8];
ma=sum(f.
*
x)/124; s=sqrt(sum(f.
*
(x-ma).2)/124);
a=[-inf,1.65:0.05:2,inf];
F=normcdf(a,ma,s); p=diff(F);
x2=sum((f-124
*
p).2./(124
*
p));
cuant=chi2inv(0.95,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)
Rezultatele obt inute n urma execut arii programului sunt:
x2= 3.3
cuant= 12.59
346 Vericarea ipotezelor statistice
6.10 Testul
2
pentru compararea
mai multor caracteristici
Se consider a colectivit at ile C
i
, i = 1, r, independente, cercetate din punct de vedere al
aceleasi caracteristici (calitative sau cantitative). Fie aceast a caracteristic a X
i
pentru
colectivitatea C
i
. Relativ la caracteristicile X
i
, i = 1, r, se face ipoteza nul a H
0
,
c a acestea urmeaz a aceeasi lege de probabilitate. Se noteaz a cu s num arul claselor
caracteristicii cercetate si E
j
evenimentul ca un individ luat la nt amplare din una din
colectivit at ile cercetate s a apart in a clasei cu num arul de ordine j.
Dac a se noteaz a prin p
ij
= P (E
j
| C
i
), adic a probabilitatea ca un individ luat
la nt amplare din colectivitatea C
i
s a apart in a clasei cu num arul de ordine j, atunci
ipoteza nul a se poate rescrie H
0
: p
ij
= p
j
, i = 1, r, j = 1, s.
Probabilit at ile astfel denite satisfac relat iile
s

j=1
p
ij
= 1, i = 1, r,
iar c and ipoteza H
0
este satisf acut a, avem de asemenea

s
j=1
p
j
= 1.
Pentru a verica aceast a ipotez a se consider a c ate o select ie repetat a de volum n
i
,
i = 1, r. Datele de select ie sunt trecute n tabelul urm ator.
Select ia Vol. select iei E
1
E
2
E
s
Total
S
1
n
1
n
11
n
12
. . . n
1s
n
1
= n
1
S
2
n
2
n
21
n
22
. . . n
2s
n
2
= n
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
S
r
n
r
n
r1
n
r2
. . . n
rs
n
r
= n
r
Total n n
1
n
2
. . . n
s
n

= n
Elementul n
ij
al tabelului reprezint a frecvent a absolut a a aparit iei clasei i n select ia
S
j
, iar
n
i
=
s

j=1
n
ij
, i = 1, r, n
j
=
r

i=1
n
ij
, j = 1, s, n

=
r

i=1
n
i
=
s

j=1
n
j
.
Proprietatea 6.10.1. Estimat iile de verosimilitate maxim a pentru parametrii necu-
noscut i p
j
, j = 1, s, sunt date prin
p
j
=
n
j
n
, j = 1, s.
6.10. Testul
2
pentru compararea mai multor caracteristici 347
Demonstrat ie. Funct ia de verosimilitate are expresia
g =
r

i=1
s

j=1
p
n
ij
ij
=
r

i=1
s

j=1
p
n
ij
j
=
s

j=1
_
r

i=1
p
n
ij
j
_
=
s

j=1
p
n
j
j
,
c and ipoteza nul a H
0
este adev arat a. Av and n vedere relat ia dintre probabilit at ile p
j
,
j = 1, s, se obt ine c a
g =
_
1
s1

j=1
p
j
_
ns
s1

j=1
p
n
j
j
sau prin logaritmare, se ajunge la
ln g = n
s
ln
_
1
s1

j=1
p
j
_
+
s1

j=1
n
j
ln p
j
.
Sistemul ecuat iilor de verosimilitate maxim a va
ln g
p
k
=
n
s
1

s1
j=1
p
j
+
n
k
p
k
= 0, k = 1, s 1,
de unde rezult a c a
n
k
p
k
=
n
s
p
s
, k = 1, s,
sau, av and n vedere propriet at i ale sirului de rapoarte egale, se obt ine
n
k
p
k
=
n
1
, k = 1, s.
S-a ajuns astfel la estimat iile
p
k
=
n
k
n
, k = 1, s.
Observatia 6.10.2. Dac a se are n vedere c a n
ij
sunt valorile unor variabile aleatoare
binomiale N
ij
, rezult a c a statistica

2
=
r

i=1
_
s

j=1
(N
ij
N
i
p
j
)
2
N
i
p
j
_
=
r

i=1
s

j=1
_
N
ij

N
i
N
j
n
_
2
N
i
N
j
n
,
cu
s

j=1
N
ij
= N
i
i = 1, r,
r

i=1
N
ij
= N
j
, j = 1, s,
s

j=1
N
j
=
r

i=1
N
i
= n

= n.
348 Vericarea ipotezelor statistice
urmeaz a o lege
2
. Pentru a stabili num arul m al gradelor de libertate se t ine seama
de faptul c a num arul variabilelor aleatoare N
ij
este rs, num arul leg aturilor ntre p
ij
este r, iar num arul parametrilor estimat i este s 1. Prin urmare, num arul gradelor de
libertate este m = rs r (s 1) = (r 1) (s 1) .
Etapele aplic arii testului
1. Se dau: ; n
ij
, i = 1, r, j = 1, s;
2. Se calculeaz a n
i
=
s

j=1
n
ij
, i = 1, r, n
j
=
r

i=1
n
ij
, j = 1, s;
3. Se calculeaz a
2
m,1
, astfel nc at F
m
_

2
m,1
_
= 1 ;
4. Se calculeaz a x
2
=
r

i=1
s

j=1
_
n
ij

n
i
n
j
n
_
2
n
i
n
j
n
;
5. Concluzia: dac a x
2
<
2
m,1
se accept a ipoteza nul a H
0
, n caz contrar se
respinge.
Observatia 6.10.3. C and probabili at ile p
j
, j = 1, r, sunt cunoscute (caz mai rar
nt alnit), deci nu se cere a estimate, atunci statistica

2
=
r

i=1
s

j=1
(N
ij
N
i
p
j
)
2
N
i
p
j
urmeaz a legea
2
cu m = rs r = r (s 1) grade de libertate. Aplicarea testului,
n acest caz, se adapteaz a n mod corespunz ator.
Exemplul 6.10.4. S-au considerat trei loturi de bolnavi de emzem pulmonar, n
funct ie de num arul t ig arilor fumate zilnic: mai put in de un pachet, unul sau dou a
pachete si respectiv mai mult de dou a pachete. Pentru emzemul pulmonar sunt con-
siderate 4 stadii notate de la I la IV. Rezultatele cercet arilor sunt trecute n urm atorul
tabel sistematizat
Categoria
_
Stadiul I II III IV
< 1 pachet 41 28 25 6 100
1 2 pachete 24 116 46 14 200
> 2 pachete 4 50 34 12 100
69 194 105 32 400
6.11. Testul
2
pentru tabele de contingent a 349
Vrem s a s a veric am, cu nivelul de semnicat ie = 0.01, ipoteza c a num arul
de t ig ari fumate zilnic nu inuent eaz a repartizarea bolnavilor n cele patru stadii
ale bolii. Veric am ipoteza f acut a cu ajutorul testului
2
privind compararea ace-
luiasi atribut, dar pentru populat ii diferite. Num arul gradelor de libertate este dat
prin formula (r1) (s1) = (31) (41) = 6, pentru care se obt ine cuantila

2
k,1
=
2
6,0.99
= 16.8.
Se calculeaz a apoi valoarea
x
2
=
r

i=1
s

j=1
_
n
ij

n
i
n
j
n
_
2
n
i
n
j
n
=
_
41
10069
400
_
2
10069
400
+
_
28
100194
400
_
2
100194
400
+ +
_
12
10032
400
_
2
10032
400
= 64.41.
Deoarece x
2
= 64.41 > 16.8 =
2
k,1
, se respinge ipoteza c a repartizarea pe cele
patru stadii ale bolii nu depinde de num arul t ig arilor fumate zilnic.
Programul 6.10.5. Programul Matlab
f=[41,28,25,6;24,116,46,14;4,50,34,12];
fip=sum(f); fpj=sum(f); x2=0;
for i=1:3
for j=1:4
t=fip(i)
*
fpj(j)/400;
x2=x2+(f(i,j)-t)2/t;
end
end
cuant=chi2inv(0.99,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)
n urma execut arii, conduce la rezultatele din exemplul precedent:
x2= 64.4
cuant= 16.81
6.11 Testul
2
pentru tabele de contingent a
Se consider a colectivitatea C cercetat a din punct de vedere a dou a caracteristici X si
Y (calitative sau cantitative). Se pune problema independent ei celor dou a caracteris-
tici. Fie r num arul claselor pentru caracteristica X si respectiv s pentru caracteristica
Y . Not am cu A
i
evenimentul ca un individ luat la nt amplare din colectivitatea C s a
apart in a clasei cu num arul de ordine i n raport cu X si not am cu B
j
evenimentul ca
un individ luat la nt amplare din C s a apart in a clasei cu num arul de ordine j n raport
350 Vericarea ipotezelor statistice
cu Y . Fie p
ij
= P (A
i
B
j
), i = 1, r, j = 1, s. Dac a se noteaz a
p
i
=
s

j=1
p
ij
, i = 1, r si p
j
=
r

i=1
p
ij
, j = 1, s,
atunci ipoteza nul a relativ a la independent a celor dou a caracteristici se scrie
H
0
: p
ij
= p
i
p
j
, i = 1, r, j = 1, s,
cu ipoteza alternativ a H
1
, c a H
0
este fals a.
Pentru vericarea acestei ipoteze se consider a datele de select ie (x
i
, y
i
), i = 1, n.
Datele de select ie sunt sistematizate n tabelul de contingent a
X \ Y B
1
B
2
. . . B
s
A
1
n
11
n
12
. . . n
1s
n
1
A
2
n
21
n
22
. . . n
2s
n
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A
r
n
r1
n
r2
. . . n
rs
n
r
n
1
n
2
. . . n
s
n

= n
unde n
ij
reprezint a frecvent a absolut a a clasei (i, j), iar
n
i
=
s

j=1
n
ij
, i = 1, r, n
j
=
r

i=1
n
ij
, j = 1, s.
Proprietatea 6.11.1. Estimat iile de verosimilitate maxim a pentru parametrii necu-
noscut i p
i
, i = 1, r, si p
j
, j = 1, s, sunt date prin formulele:
p
i
=
n
i
n
, i = 1, r, p
j
=
n
j
n
, j = 1, s.
Demonstrat ie. Funct ia de verosimilitate are expresia
g =
r

i=1
s

j=1
(p
ij
)
n
ij
=
r

i=1
s

j=1
_
p
i
p
j
_
n
ij
=
_
r

i=1
p
n
i
i
__
s

j=1
p
n
j
j
_
=
_
1
r1

i=1
p
i
_
nr
_
r1

i=1
p
n
i
i
__
s

j=1
p
n
j
j
_
,
c and ipoteza nul a H
0
este adev arat a. Prin logaritmare se obt ine
ln g = n
r
ln
_
1
r1

i=1
p
i
_
+
r1

i=1
n
i
ln p
i
+ ln
_
s

j=1
p
n
j
j
_
,
6.11. Testul
2
pentru tabele de contingent a 351
de unde se ajunge la sistemul ecuat iilor de verosimilitate maxim a
ln g
p
k
=
n
r
1

r1
i=1
p
i
+
n
k
p
k
= 0, k = 1, r 1,
sau
n
r
p
r
=
n
k
p
k
, k = 1, r.
Av and n vedere propriet at ile unui sir de rapoarte egale se obt ine c a
n
k
p
k
=
n
1
, k = 1, r, deci p
k
=
n
k
n
, k = 1, r.

In mod analog se obt ine si faptul c a


p
k
=
n
k
n
, k = 1, s.
Observatia 6.11.2. Valoarea numeric a
x
2
=
r

i=1
s

j=1
(n
ij
n
i
p
ij
)
2
n p
ij
=
r

i=1
s

j=1
_
n
ij

n
i
n
j
n
_
2
n
i
n
j
n
,
este cea a unei variabile aleatoare ce urmeaz a legea
2
cu m=(r1) (s1) grade
de libertate. Num arul m al gradelor de libertate s-a determinat av and n vedere c a au
fost estimat i (r 1) + (s 1) parametri, iar ntre p
i
si p
j
exist a o singur a leg atur a
r

i=1
p
i
=
s

j=1
p
j
= 1, adic a
r

i=1
s

j=1
p
ij
= 1.
Asadar m = rs (r 1) (s 1) 1 = (r 1) (s 1).
Etapele aplic arii testului
1. Se dau: ; n
ij
, i = 1, r, j = 1, s;
2. Se calculeaz a: n
i
=
s

j=1
n
ij
, i = 1, r, n
j
=
r

i=1
n
ij
, j = 1, s;
3. Se calculeaz a
2
m,1
, astfel nc at F
m
_

2
m,1
_
= 1 ;
352 Vericarea ipotezelor statistice
4. Se calculeaz a x
2
=
r

i=1
s

j=1
_
n
ij

n
i
n
j
n
_
2
n
i
n
j
n
;
5. Concluzia: dac a x
2
<
2
m,1
se accept a ipoteza nul a H
0
, n caz contrar se
respinge.
Observatia 6.11.3. C and probabilit at ile p
i
si p
j
sunt cunoscute (caz mai rar
nt alnit), avem c a
x
2
=
r

i=1
s

j=1
(n
ij
np
ij
)
2
np
ij

i=1
(n
i
np
i
)
2
np
i

j=1
(n
j
np
j
)
2
np
j
este valoarea unei variabile aleatoare ce urmeaz a legea
2
cu m = (r1) (s1)
grade de libertate. Aceasta rezult a din faptul c a prima sum a corespunde unei legi
2
cu rs 1 grade de libertate, a doua sum a corespunde unei legi
2
cu r 1 grade de
libertate, iar a treia unei legi
2
cu s 1 grade de libertate. Prin urmare
m+ (r 1) + (s 1) = rs 1, de unde m = (r 1) (s 1) .
Aplicarea testului, n acest caz, se face prin adaptarea corespunz atoare a cazului
precedent.
Observatia 6.11.4. Testul
2
pentru tabele de contingent a si respectiv pentru com-
pararea mai multor caracteristici, pare s a e acelasi . Dar, remarc am faptul c a proble-
mele de la care se porneste sunt complet diferite.
Exemplul 6.11.5. Pentru cercetarea dependent ei dintre culoarea A a ochilor si cu-
loarea B a p arului, s-a considerat un esantion format din 6800 indivizi. Rezultatele
sunt trecute n tabelul sistematizat urm ator
A
_
B Blonzi S ateni Brunet i Roscat i
Albastri 1768 807 189 47 2811
Gri sau verzi 946 1387 746 53 3132
C aprui 115 438 288 16 857
2829 2632 1223 116 6800
Folosind nivelul de semnicat ie = 0.01, vom verica ipoteza c a cele dou a carac-
teristici (atribute) sunt independente.
Se foloseste testul
2
pentru tabele de contingent a cu num arul gradelor de liber-
tate k = (r 1) (s 1) = (3 1) (4 1) = 6.
6.12. Testul de concordant a al lui Kolmogorov 353
Pe de o parte avem c a
x
2
=
r

i=1
s

j=1
_
n
ij

n
i
n
j
n
_
2
n
i
n
j
n
=
_
1768
28112829
6800
_
2
28112829
6800
+
_
807
28112632
6800
_
2
28112632
6800
+ +
_
16
857116
6800
_
2
857116
6800
= 1075.
Pe de alt a parte, avem cuantila
2
6,0.99
= 16.8 < 1075 = x
2
, deci se respinge ipoteza
c a cele dou a atribute sunt independente.
Programul 6.11.6. Calculele din exemplul precedent pot efectuate cu programul
Matlab
f=[1768,807,189,47;946,1387,746,53;115,438,288,16];
fip=sum(f); fpj=sum(f); x2=0;
for i=1:3
for j=1:4
t=fip(i)
*
fpj(j)/6800;
x2=x2+(f(i,j)-t)2/t;
end
end
cuant=chi2inv(0.99,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

In urma execut arii acestui program, se obt in rezultatele:


x2= 1073.5
cuant= 16.81
6.12 Testul de concordant a al lui Kolmogorov
Se consider a caracteristica X de tip continuu cu funct ia teoretic a de repartit ie F
necunoscut a. Relativ la funct ia F se face ipoteza nul a H
0
: F = F
0
, cu una din
(1) H
1
: F = F
0
(testul lui Kolmogorov bilateral),
(2) H
1
: F > F
0
(testul lui Kolmogorov unilateral dreapta),
(3) H
1
: F < F
0
(testul lui Kolmogorov unilateral st anga).
Pentru vericarea ipotezei nule H
0
, cu una din alternativele precizate, se con-
sider a o select ie repetat a de volum n, cu datele de select ie x
1
, x
2
, . . . , x
n
, respectiv
variabilele de select ie X
1
, X
2
, . . . , X
n
corespunz atoare. Se consider a statisticile
D
n
= sup
xR
_
|

F
n
(x) F
0
(x) |
_
,
354 Vericarea ipotezelor statistice
D
+
n
= sup
xR
_

F
n
(x) F
0
(x)
_
,
D

n
= sup
xR
_
F
0
(x)

F
n
(x)
_
,
unde

F
n
(x) este funct ia de repartit ie de select ie.
Conform teoremei lui Kolmogorov (Teorema 4.2.38) statistica
D
n
= sup
xR
|

F
n
(x) F
0
(x) |,
urmeaz a o lege de probabilitate dat a prin legea lui Kolmogorov, c and n . Anu-
me, avem c a
lim
n
P
_
nD
n
x

H
0
_
= K (x) =
k=+

k=
(1)
k
e
2k
2
x
2
, x > 0,
funct ia K (x) a lui Kolmogorov ind tabelat a pentru anumite valori n Anexa V.
De asemenea,
lim
n
P
_
nD
+
n
x
_
= lim
n
P
_
nD

n
x
_
= K

(x) = 1 e
2x
2
, x > 0,
ce poart a numele de lege cu dou a grade de libertate.
Pentru un nivel de semnicat ie (0, 1) xat, se pot determina cuantilele k
1
si k

1
astfel nc at
P
_
nD
n
k
1
_
= 1 , adic a K(k
1
) = 1 ,
pentru testul bilateral al lui Kolmogorov,
P
_
nD
+
n
k

1
_
= 1 si P
_
nD

n
k

1
_
= 1 ,
adic a K

_
k

1
_
= 1 , pentru testele unilaterale dreapta si st anga ale lui Kol-
mogorov.
Corespunz ator celor trei alternative, ipoteza H
0
va admis a c and valorile calcu-
late d
n
, d
+
n
, d

n
, pe baza datelor de select ie x
1
, x
2
, . . . , x
n
ale statisticilor D
n
, D
+
n
,
D

n
, satisfac respectiv condit iile
(1)

nd
n
< k
1
, c and H
1
: F = F
0
,
(2)

nd
+
n
< k

1
, c and H
1
: F > F
0
,
(3)

nd

n
< k

1
, c and H
1
: F < F
0
,
iar n caz contrar va respins a.
Prezent am, n cele ce urmeaz a, mpreun a, cele trei teste (bilateral, unilateral
dreapta, unilateral st anga) ale lui Kolmogorov. Remarc am c a cele trei teste sunt teste
distincte, alegerea unuia dintre ele se face apriori.
6.12. Testul de concordant a al lui Kolmogorov 355
Etapele aplic arii testului lui Kolmogorov
1. Se dau: ; x
1
, x
2
, . . . , x
n
; F = F
0
;
2. Se determin a
(1) k
1
astfel nc at K(k
1
) = 1 , c and H
1
: F = F
0
,
(2) k

1
astfel nc at K

_
k

1
_
= 1 , c and H
1
: F > F
0
,
(3) k

1
astfel nc at K

_
k

1
_
= 1 , c and H
1
: F < F
0
;
3. Se calculeaz a
(1) k =

nd
n
, c and H
1
: F = F
0
,
(2) k =

nd
+
n
, c and H
1
: F > F
0
,
(3) k =

nd

n
, c and H
1
: F < F
0
;
4. Concluzia: dac a
(1) k < k
1
ipoteza H
0
este admis a, c and H
1
: F = F
0
,
(2) k < k

1
ipoteza H
0
este admis a, c and H
1
: F > F
0
,
(3) k < k

1
ipoteza H
0
este admis a, c and H
1
: F < F
0
,
Observatia 6.12.1. Av and n vedere c a funct iile (de repartit ie) K si K

sunt mono-
ton cresc atoare si c a pentru determinarea cuantilelor k
1
si k

1
este necesar a in-
versarea acestor funct ii de repartit ie, se poate evita aceast a operat ie. Pentru aceasta
se determin a valorile funct iilor K si K

pe valorile calculate ale statisticilor D


n
,
D
+
n
, D

n
, adic a se calculeaz a respectiv 1 c = K (

nd
n
), 1 c = K

nd
+
n
),
1c = K

nd

n
). Astfel, se va respinge ipoteza nul a H
0
, dac a c , c numindu
se valoare critic a.
Observatia 6.12.2. Pentru calculul valorilor statisticilor D
n
, D
+
n
, D

n
putem con-
sidera c a datele de select ie sunt ordonate cresc ator, adic a x
1
< x
2
< . . . < x
n
,
altfel se poate face o astfel de ordonare. De asemnea, remarc am faptul c a are loc
D
n
= max {D
+
n
, D

n
}.
Folosind aceste preciz ari, precum si faptul c a at at funct ia de repartit ie de select ie

F
n
, c at si funct ia de repartit ie F
0
sunt funct ii nedescresc atoare, obt inem urm atoarele
356 Vericarea ipotezelor statistice
formule de calcul
d
+
n
= sup
xR
_

F
n
(x) F
0
(x)
_
= max
k=1,n
_

F
n
(x
k
) F
0
(x
k
)
_
= max
k=1,n
_
k
n
F
0
(x
k
)
_
,
d

n
= sup
xR
_
F
0
(x)

F
n
(x)
_
= max
k=1,n
_
F
0
(x
k
)

F
n
(x
k
0)
_
= max
k=1,n
_
F
0
(x
k
)
k 1
n
_
,
d
n
= max
_
d
+
n
, d

n
_
.
Observatia 6.12.3. C and datele sunt grupate, av and clasele date prin punctele
a = a
0
< a
1
< < a
m
= b,
atunci se folosesc formulele
d
n
= max
k=0,m


F
n
(a
k
) F
0
(a
k
)

,
d
+
n
= max
k=0,m
_

F
n
(a
k
) F
0
(a
k
)
_
,
d

n
= max
k=0,m
_
F
0
(a
k
)

F
n
(a
k
)
_
.
Exemplul 6.12.4. Rezultatele m asur atorilor asupra diametrului X, pentru 1000 de
piese de acelasi tip (n mm), sunt cele ce urmeaz a
Diam. 97.7598.25 98.2598.75 98.7599.25 99.2599.75 99.75100.25
Frecv. 21 47 87 158 181
100.25100.75 100.75101.25 101.25101.75 101.75102.25 102.25102.75
201 142 97 41 25
Folosind nivelul de semnicat ie = 0.05, stiind m = E (X) = 100.25 mm si
abaterea standard =
_
V ar (X) = 1 mm, se cere vericarea normalit at ii caracte-
risticii X, cu ajutorul testului lui Kolmogorov bilateral, iar apoi cu ajutorul testului

2
neparametric.
Ipoteza care se face este c a funct ia de repartit ie a lui X este
F
0
(x) =
1

2
_
x

(tm)
2
2
2
dt, x R,
6.12. Testul de concordant a al lui Kolmogorov 357
unde m = 100.25, = 1. Pentru vericarea acestei ipoteze, folosind criteriul lui
Kolmogorov, se calculeaz a
d
n
= sup
xR


F
n
(x) F
0
(x)

= sup
i=0,10


F
n
(a
i
) F
0
(a
i
)

,
unde a
i
= 97.75 + 0.5 i, i = 0, 10, iar

F
n
(x) =

F
1000
(x) este funct ia de repartit ie
de select ie.
Pentru calculul valorilor funct iei de repartit ie F
0
se t ine seama de faptul c a
F
0
(x) =
1

2
_
x

(tm)
2
2
2
dt =
1
2
+
_
x m

_
=
1
2
+(x 100.25) ,
cu funct ia lui Laplace (x) tabelat a n Anexa I.
Pe de alt a parte, valorile funct iei de repartit ie de select ie se calculeaz a cu formula

F
1000
(a
i
) =
1
1000
i

j=1
n
j
, pentru i = 0, 10.
Calculele sunt aranjate n urm atorul tabel.
ai ni ai m F0 (ai)

F1000 (ai) |

F1000 (ai) F0 (ai) |
97.75 2.5 0.0062 0.000 0.0062
98.25 21 2.0 0.0228 0.021 0.0018
98.75 47 1.5 0.0668 0.068 0.0012
99.25 87 1.0 0.1587 0.155 0.0037
99.75 158 0.5 0.3085 0.313 0.0045
100.25 181 0.0 0.5000 0.494 0.0060
100.75 201 0.5 0.6915 0.695 0.0035
101.25 142 1.0 0.8413 0.837 0.0043
101.75 97 1.5 0.9332 0.934 0.0008
102.25 41 2.0 0.9772 0.975 0.0022
102.75 25 2.5 0.9938 1.000 0.0062
Din calculele f acute avem c a d
1000
= 0.0062, de unde rezult a c a

nd
n
=

1000 d
1000
= 10

10 0.0062 = 0.196.
Din Anexa V, se determin a cuantila k
1
= k
0.95
= 1.36 si admitem ipoteza de
normalitate pentru caracteristica X, deoarece

nd
n
= 0.196 < 1.36 = k
1
.
358 Vericarea ipotezelor statistice
Pentru a verica normalitatea caracteristicii X, cu testul
2
neparametric, cal-
cul am prima dat a probabilit at ile
p
(0)
i
= P (a
i1
< X a
i
| F = F
0
) = (a
i
m) (a
i1
m) , i = 1, 10,
unde a
0
= si a
10
= +. Astfel avem
X (, a1] (a1, a2] (a2, a3] (a3, a4] (a4, a5] (a5, a6] (a6, a7]
p
(0)
i
0.0228 0.0440 0.0919 0.1498 0.1915 0.1915 0.1498
(a7, a8] (a8, a9] (a9, +)
0.0919 0.0440 0.0228
de unde
x
2
=
10

i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
=
(21 22.8)
2
22.8
+
(47 44)
2
44
+ +
(25 22.8)
2
22.8
= 3.21.
Pe de alt a parte, avem cuantila
2
k1,1
=
2
9,0.95
= 16.9, conform Anexei III.
Deoarece x
2
= 3.21 < 16.9 =
k1,1
, rezult a c a ipoteza de normalitate este
acceptat a.
Programul 6.12.5. Vom scrie un program Matlab, pentru aplicarea testului lui Kol-
mogorov si a testului
2
, n cazul datelor din exemplul precedent.
% Testul lui Kolmogorov
a=97.75:0.5:102.75;
n=[0,21,47,87,158,181,201,142,97,41,25];
F0=normcdf(a,100.25,1); Fn=cumsum(n)/1000;
dn=max(abs(F0-Fn)); ks=sqrt(1000)
*
dn;
fprintf( ks= %6.4f\n,ks)
% Testul chi2
F0(1)=0; F0(end)=1;n=n(2:end);
p0=diff(F0); x2=sum((n-1000
*
p0).2./(1000
*
p0));
cuant=chi2inv(0.95,9);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant=%6.2f,cuant)
Rezultatele obt inute n urma execut arii programului sunt:
ks= 0.1964
x2= 3.2117
cuant= 16.92
Ceea ce conrm a rezultatele mai sus obt inute.
Exemplul 6.12.6. Se t in sub observat ie n = 50 motoare electrice p an a la defectarea
ultimului dintre ele. Se consider a caracteristica X, ce reprezint a num arul miilor de
ore de funct ionare p an a la defectare. Rezultatele observat iilor sunt date n tabelul
urm ator
6.12. Testul de concordant a al lui Kolmogorov 359
Durata 030 3060 6090 90120 120150 150180 180300
Frecv. 13 10 5 5 5 5 7
S a se cerceteze exponent ialitatea caracteristicii X, folosind testul
2
cu nivelul
de semnicat ie = 0.05, iar apoi folosind testul lui Kolmogorov cu acelasi nivel de
semnicat ie.
Legea exponent ial a are funct ia de repartit ie
F (x; ) = 1 e

, x > 0, > 0 parametru necunoscut.


Folosind metoda verosimilit at ii maxime avem estimat ia pentru
= x =
1
50
(13 15 + 10 45 + + 7 240) = 94.5.
Se calculeaz a prima dat a probabilit at ile:
p
(0)
i
= P
_
a
i1
< X a
i

F = F
0
_
= F
0
(a
i
; ) F
0
(a
i1
; ) , i = 1, 7,
unde
F
0
(x; ) = 1 e

x

= 1 e

x
94.5
.
Rezultatele sunt trecute n tabelul urm ator
X (0, a1] (a1, a2] (a2, a3] (a3, a4] (a4, a5] (a5, a6] (a6, )
p
(0)
i
0.2720 0.1980 0.1442 0.1049 0.0764 0.0556 0.1489
si care conduce la
x
2
=
k

i=1
_
n
i
np
(0)
i
_
2
np
(0)
i
=
(1350 0.2720)
2
50 0.2720
+ +
(750 0.1489)
2
50 0.1489
=2.877.
Din Anexa III obt inem cuantila
2
k2,1
=
2
5,0.95
= 11.07. Deoarece avem valoa-
rea calculat a x
2
= 2.877 < 11.07 =
2
k2,1
accept am ipoteza exponent ialit at ii.
Pentru aplicarea testului lui Kolmogorov, din Anexa V se determin a cuantila
k
1
= k
0.95
= 1.36. Ipoteza exponent ialit at ii lui X va acceptat a dac a

nd
n
=

n sup
i=0,7


F
n
(a
i
) F
0
(a
i
; )

< k
1
.
Aici a
7
= +, iar

F
n
este funct ia de repartit ie de select ie. Calculele sunt efectuate
n tabelul urm ator.
360 Vericarea ipotezelor statistice
ai 30 60 90 120 150 180 300
ni 13 10 5 5 5 5 7

Fn (ai) 0.26 0.46 0.56 0.66 0.76 0.86 1


F0 (ai; ) 0.2720 0.4700 0.6142 0.7191 0.7955 0.8511 0.9582


Fn (ai)F0 (ai; )

0.0120 0.0100 0.0542 0.0591 0.0355 0.0089 0.0418


Asadar avem c a

nd
n
=

50 0.0591 = 0.418 < 1.36 = k


1
, deci
exponent ialitatea lui X este admis a.
Programul 6.12.7. Vom scrie un program Matlab, care efectueaz a calculele din
exemplul precedent:
% Testul chi2
clear
a=[0:30:180,300]; f=[13,10,5
*
ones(1,4),7];
mij=[15:30:165,240]; mu=sum(mij.
*
f)/50;
F0=expcdf(a,mu);F0(end)=1; p0=diff(F0);
x2=sum((f-50
*
p0).2./(50
*
p0));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant= %4.2f\n,cuant)
% Testul lui Kolmogorov
F0=F0(2:end);F0(end)=expcdf(a(end),mu);
Fn=cumsum(f)/50;
dn=max(abs(F0-Fn)); ks=sqrt(50)
*
dn;
fprintf( ks= %6.4f,ks)

In urma execut arii programului se obt ine:


x2= 2.8770
cuant= 11.07
ks= 0.4181
6.12.1 Functia kstest
Statistics toolbox cont ine funct ia kstest, care efectueaz a testul lui Kolmogorov.
Apelul funct iei se poate face cu una din instruct iunile:
h=kstest(x)
h=kstest(x,cdf)
h=kstest(x,cdf,alpha)
h=kstest(x,cdf,alpha,tail)
[h,c,ks]=kstest(x,cdf,alpha,tail)
Comenzile de acest tip lanseaz a execut ia testului lui Kolmogorov bilateral (c and
tail=0, valoare implicit a), unilateral dreapta (c and tail=1), respectiv unilateral
st anga (c and tail=-1), prin considerarea datelor cont inute de vectorul x, iar funct ia
6.12. Testul de concordant a al lui Kolmogorov 361
de repartit ie ipotezat a ind precizat a prin prametrul cdf. Implicit se consider a cdf
corespunz and legii normale standard.
Dac a parametrul cdf este prezent, trebuie s a e o matrice cu dou a coloane, care
cont ine n coloana a doua valorile funct iei de repartit ie ipotezate pe punctele precizate
n prima coloan a. Ar de dorit ca prima coloan a a matricei cdf s a coincid a cu
vectorul x, altfel funct ia va efectua un proces de interpolare pentru calculul valorilor
funct iei ipotezate pe punctele lui x, folosind punctele precizate prin matricea cdf.
Din acest motiv, se impune ca toate componentele lui x s a aib a valorile cont inute n
intervalul determinat de valoare minim a si valoarea maxim a a componentelor primei
coloane a lui cdf.
Parametrul alpha (implicit alpha=0.05) reprezint a nivelul de semnicat ie.
Rezultatele obt inute au urm atoarele semnicat ii. Dac a h=1 ipoteza nul a se res-
pinge, ceea ce corespunde faptului c a valoarea critic a c satisface relat ia calpha,
iar dac a h=0, ipoteza nul a nu poate respins a. Mai remarc am faptul c a ks va
cont ine respectiv valoarea calculat a a statisticilor D
n
, D
+
n
si D

n
, si veric a relat iile
c = 1 K (

nd
n
), pentru testul bilateral, respectiv c = 1 K

nd
+
n
) si,
c = 1 K

nd

n
) pentru testele unilaterale.
Programul 6.12.8. S a aplic am testele lui Kolmogorov (bilateral, unilateral dreapta
si unilateral st anga) pentru datele x=-2:1:4, consider and legea ipotezat a ca -
ind legea normal a standard si nivelul de semnicat ie alpha=0.05. Programul ce
urmeaz a, s a reprezinte grac si funct ia de repartit ie de select ie, mpreun a cu funct ia
de repartit ie ipotezat a.
x=-2:4;
fprintf( h c ks\n)
fprintf(__________________\n)
for i=-1:1
[h,c,ks]=kstest(x,[],0.05,i);
fprintf( %d %5.4f %4.2f \n,h,c,ks)
end
cdfplot(x), hold on, title([])
t=-3:0.01:3; plot(t,normcdf(t,0,1),k--)

In urma execut arii programului, se obt in rezultatele:


h c ks
__________________
0 0.0682 0.41
0 0.1363 0.41
0 0.7753 0.13
respectiv gracele din Figura 6.4 Se observ a, n mod surprinz ator, ipoteza nul a nu
poate respins a. Acest lucru se datoreaz a faptului c a testul lui Kolmogorov este bazat
pe un rezultat asimptotic, adic a se aplic a pentru valori mari ale volumului select iei.
362 Vericarea ipotezelor statistice
3 2 1 0 1 2 3 4
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x
F
(
x
)
Figura 6.4: Testul lui Kolmogorov
6.12.2 Functia lillietest
Funct ia lillietest efectueaz a testul Lilliefors, care reprezint a o modicare a
testului lui Kolmogorov, n care ipoteza nul a presupune c a funct ia de repartit ie este
cea de la legea normal a, dar parametrii nu mai sunt precizat i, ci sunt estimat i folosind
datele de select ie.
Apelul funct iei se poate face cu una din comenzile
h=lillietest(x)
h=lillietest(x,alpha)
[h,c,ls]=lillietest(x,alpha)
Comenzile de acest tip lanseaz a execut ia testului Lilliefors, prin considerarea datelor
cont inute de vectorul x, iar funct ia de repartit ie ipotezat a ind cea de la legea normal a
N ( x, ).
Parametrul alpha (implicit alpha=0.05) reprezint a nivelul de semnicat ie.
Rezultatele obt inute au urm atoarele semnicat ii. Dac a h=1 ipoteza nul a se res-
pinge, ceea ce corespunde faptului c a valoarea critic a c satisface relat ia calpha,
iar dac a h=0, ipoteza nul a nu poate respins a.
Mai remarc am faptul c a ls va cont ine respectiv valoarea calculat a a statisticii
D
n
, iar c este valoarea critic a, care se calculeaz a cu ajutorul lui ls, folosinduse
tabelele construite de Lilliefors. Dac a n aceste tabele nu se a a valoarea corespun-
z atoare, atunci c=NaN, dar h indic a nc a dac a ipoteza nul a este respins a sau nu.
Programul 6.12.9. S a aplic am testul lui Lilliefors pentru n numere aleatoare ce
urmeaz a legea normal a N (, ), cont inute de vectorul x, cu nivelul de semnicat ie
6.13. Testul KolmogorovSmirnov 363
alpha=0.05. Programul ce urmeaz a s a reprezinte grac si funct ia de repartit ie de
select ie, mpreun a cu funct ia de repartit ie ipotezat a, adic a cea de la legea normal a
N ( x, ).
clf
n=input(n=); mu=input(mu=); s=input(sigma=);
x=normrnd(mu,s,1,n);
[h,c,ls]=lillietest(x);
fprintf( h=%d\n c= %5.4f\n ls=%5.4f,h,c,ls)
ma=mean(x); va=sqrt(var(x));
cdfplot(x), hold on, title([])
t=ma-3
*
va:0.01:ma+3
*
va;
plot(t,normcdf(t,ma,va),k--)

In urma execut arii programului pentru n=10, mu=100 si sigma=2, se obt in rezul-
tatele:
h=0
c= 0.1433
ls=0.1093
si gracele din Figura 6.5
4 6 8 10 12 14 16
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x
F
(
x
)
Figura 6.5: Testul Lilliefors
6.13 Testul KolmogorovSmirnov
Se consider a dou a caracteristici independente X si Y de tip continuu cu funct iile
teoretice de repartit ie F
X
si F
Y
necunoscute. Privind cele dou a caracteristici vrem
s a veric am dac a sunt identic repartizate. Astfel, consider am ipoteza nul a dat a prin
H
0
: F
X
=F
Y
, cu una din alternativele:
364 Vericarea ipotezelor statistice
(1) H
1
: F
X
= F
Y
(testul KolmogorovSmirnov bilateral),
(2) H
1
: F
X
> F
Y
(testul KolmogorovSmirnov unilateral dreapta),
(3) H
1
: F
X
< F
Y
(testul KolmogorovSmirnov unilateral st anga).
Pentru vericarea ipotezei nule H
0
, cu una din alternativele precizate, se con-
sider a c ate o select ie repetat a de volum n
1
si respectiv n
2
, cu datele de select ie
x
1
, x
2
, . . . , x
n
1
si variabilele de select ie X
1
, X
2
, . . . , X
n
1
, corespunz atoare pen-
tru caracteristica X si datele de select ie y
1
, y
2
, . . . , y
n
2
si variabilele de select ie
Y
1
, Y
2
, . . . , Y
n
2
, corespunz atoare pentru caracteristica Y .
Se consider a statisticile
D
n
1
n
2
= sup
xR
_
|

F
X
(x)

F
Y
(x) |
_
,
D
+
n
1
n
2
= sup
xR
_

F
X
(x)

F
Y
(x)
_
,
D

n
1
n
2
= sup
xR
_

F
Y
(x)

F
X
(x)
_
,
unde

F
X
si

F
Y
sunt funct iile de repartit ie de select ie.
Pentru n
1
, n
2
, funct iile de repartit ie ale acestor funct ii de select ie au
urm atoarele comport ari asimptotice:
lim
n
1
,n
2

P
__
n
1
n
2
n
1
+n
2
D
n
1
n
2
x
_
= K (x) =
k=+

k=
(1)
k
e
2k
2
x
2
, x > 0,
funct ia lui Kolmogorov K (x), ind tabelat a pentru anumite valori n Anexa V, res-
pectiv
lim
n
1
,n
2

P
__
n
1
n
2
n
1
+n
2
D
+
n
1
n
2
x
_
= lim
n
1
,n
2

P
__
n
1
n
2
n
1
+n
2
D

n
1
n
2
x
_
= K

(x) = 1 e
2x
2
, x > 0,
ce poart a numele de lege cu dou a grade de libertate.
Pentru un nivel de semnicat ie (0, 1) xat, se pot determina cuantilele k
1
,
k
+
1
si k

1
astfel nc at
P
__
n
1
n
2
n
1
+n
2
D
n
1
n
2
k
1

H
0
_
= 1 , adic a K (k
1
) = 1 ,
pentru testul bilateral KolmogorovSmirnov,
P
__
n
1
n
2
n
1
+n
2
D
+
n
1
n
2
k
+
1

H
0
_
= 1 , adic a K

_
k
+
1
_
= 1 ,
6.13. Testul KolmogorovSmirnov 365
pentru testul unilateral dreapta KolmogorovSmirnov,
P
__
n
1
n
2
n
1
+n
2
D

n
1
n
2
k

H
0
_
= 1 , adic a K

_
k

1
_
= 1 ,
pentru testul unilateral st anga KolmogorovSmirnov,
Corespunz ator celor trei alterantive, ipoteza H
0
va admis a c and valorile cal-
culate d
n
1
n
2
, d
+
n
1
n
2
, d

n
1
n
2
pe baza datelor de select ie x
1
, . . . , x
n
1
si y
1
, . . . , y
n
2
, ale
statisticilor D
n
1
n
2
, D
+
n
1
n
2
, satisfac respectiv condit iile
(1)
_
n
1
n
2
n
1
+n
2
d
n
1
n
2
< k
1
, c and H
1
: F
X
= F
Y
,
(2)
_
n
1
n
2
n
1
+n
2
d
+
n
1
n
2
< k
+
1
, c and H
1
: F
X
> F
Y
,
(3)
_
n
1
n
2
n
1
+n
2
d

n
1
n
2
< k

1
, c and H
1
: F
X
< F
Y
,
iar n caz contrar va respins a.
Prezent am, n cele ce urmeaz a, mpreun a cele trei teste (bilateral, unilateral
dreapta si unilateral st anga) KolmogorovSmirnov. Remarc am c a cele trei teste sunt
teste distincte, alegerea unuia dintre ele se face apriori.
Etapele aplic arii testului lui KolmogorovSmirnov
1. Se dau: ; x
1
, x
2
, . . . , x
n
1
; y
1
, y
2
, . . . , y
n
2
;
2. Se determin a
(1) k
1
astfel nc at K(k
1
) = 1 , c and H
1
: F
X
= F
Y
,
(2) k
+
1
astfel nc at K

_
k
+
1
_
= 1 , c and H
1
: F
X
> F
Y
;
(3) k

1
astfel nc at K

_
k

1
_
= 1 , c and H
1
: F
X
< F
Y
;
3. Se calculeaz a
(1) k =
_
n
1
n
2
n
1
+n
2
d
n
1
n
2
, c and H
1
: F
X
= F
Y
,
(2) k =
_
n
1
n
2
n
1
+n
2
d
+
n
1
n
2
, c and H
1
: F
X
> F
Y
;
(3) k =
_
n
1
n
2
n
1
+n
2
d

n
1
n
2
, c and H
1
: F
X
< F
Y
;
4. Concluzia: dac a
366 Vericarea ipotezelor statistice
(1) k < k
1
ipoteza H
0
este admis a, c and H
1
: F
X
= F
Y
,
(2) k < k
+
1
ipoteza H
0
este admis a, c and H
1
: F
X
> F
Y
,
(3) k < k

1
ipoteza H
0
este admis a, c and H
1
: F
X
< F
Y
,
Observatia 6.13.1. Av and n vedere c a funct iile (de repartit ie) K si K

sunt mono-
ton cresc atoare si c a pentru determinarea cuantilelor k
1
, k
+
1
si k

1
este nece-
sar a inversarea acestor funct ii de repartit ie, se poate evita aceast a operat ie. Pentru
aceasta se determin a valorile funct iilor K si K

pe valorile calculate ale statisticilor


D
n
1
n
2
, D
+
n
1
n
2
, D

n
1
n
2
, adic a se calculeaz a, respectiv 1 c = K
__
n
1
n
2
n
1
+n
2
d
n
1
n
2
_
,
1 c = K

__
n
1
n
2
n
1
+n
2
d
+
n
1
n
2
_
, 1 c = K

__
n
1
n
2
n
1
+n
2
d

n
1
n
2
_
. Astfel, se va respinge
ipoteza nul a H
0
dac a valoarea critic a c satisface inegalitatea c .
6.13.1 Functia kstest2
Statistics toolbox cont ine funct ia kstest2, care efectueaz a testul Kolmogorov
Smirnov. Apelul funct iei se poate face cu una din instruct iunile:
h=kstest(x,y)
h=kstest(x,y,alpha)
h=kstest(x,y,alpha,tail)
[h,c,ks]=kstest(x,y,alpha,tail)
Comenzile de acest tip lanseaz a execut ia testului KolmogorovSmirnov bilateral
(c and tail=0, valoare implicit a), unilateral dreapta (c and tail=1), respectiv uni-
lateral st anga (c and tail=-1), prin considerarea datelor cont inute n vectorii x si y.
Parametrul alpha (implicit alpha=0.05) reprezint a nivelul de semnicat ie.
Rezultatele obt inute au urm atoarele semnicat ii. Dac a h=1, ipoteza nul a se res-
pinge, ceea ce corespunde faptului c a valoarea critic a c satisface relat ia calpha,
iar dac a h=0, ipoteza nul a nu poate respins a. Mai remarc am faptul c a ks va cont ine
respectiv valoarea calculat a a statisticilor D
n
1
,n
2
, D
+
n
1
,n
2
si D

n
1
,n
2
, si veric a relat iile
c = 1 K (

nd
n
), pentru testul bilateral, respectiv c = 1 K

nd
+
n
) si
c = 1 K

nd

n
), pentru testele unilaterale.
Programul 6.13.2. S a aplic am testele KolmogorovSmirnov (bilateral, unilateral
dreapta si unilateral st anga) pentru datele x=-1:1:5 si y reprezent and 20 de nu-
mere aleatoare, ce urmeaz a legea normal a standard, iar nivelul de semnicat ie s a e
alpha=0.05. Programul ce urmeaz a, s a reprezinte grac si cele dou a funct ii de
repartit ie de select ie.
clf
x=-1:5; y=randn(1,20);
fprintf( h c ks\n)
fprintf(__________________\n)
for i=-1:1
6.13. Testul KolmogorovSmirnov 367
[h,c,ks]=kstest2(x,y,[],i);
fprintf( %d %5.4f %4.2f\n,h,c,ks)
end
h1=cdfplot(x); hold on, h2=cdfplot(y);
title(Functiile de repartitie de selectie)
set(h1,linestyle,--)
set(h2,linestyle,-)

In urma execut arii programului, se obt in rezultatele:


h c ks
__________________
1 0.0110 0.61
1 0.0219 0.61
0 0.9783 0.04
respectiv gracele din Figura 6.6. Testul KolmogorovSmirnov este bazat pe un
2 1 0 1 2 3 4 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x
F
(
x
)
Functiile de repartitie de selectie
Figura 6.6: Testul KolmogorovSmirnov
rezultat asimptotic, adic a se aplic a pentru valori mari ale volului select iei, dar aici
sau folosit select ii de volum mic, n mod special pentru a urm ari pe gur a modul de
calcul a celor trei statistici d
n
1
,n
2
, d
+
n
1
,n
2
si d

n
1
,n
2
.
368 Vericarea ipotezelor statistice
Anexe 369
Anexa I (Funct ia lui Laplace) (x) =
1

2
_
x
0
e

t
2
2
dt, (x) = (x)
Sutimi ale lui x
x 0 1 2 3 4 5 6 7 8 9
0.0 0.0000 0040 0080 0120 0160 0199 0239 0279 0319 0359
0.1 0.0398 0438 0478 0517 0557 0596 0636 0675 0714 0753
0.2 0.0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0.3 0.1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0.4 0.1554 1591 1628 1664 1700 1736 1772 1808 1844 1879
0.5 0.1915 1950 1985 2019 2054 2088 2123 2157 2190 2224
0.6 0.2257 2291 2324 2357 2389 2422 2454 2486 2517 2549
0.7 0.2580 2611 2642 2673 2703 2734 2764 2794 2823 2852
0.8 0.2881 2910 2939 2967 2995 3023 3051 3078 3106 3137
0.9 0.3159 3186 3212 3238 3264 3289 3315 3340 3365 3389
1.0 0.3413 3437 3461 3485 3508 3531 3554 3577 3599 3621
1.1 0.3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
1.2 0.3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1.3 0.4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1.4 0.4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1.5 0.4332 4345 4357 4370 4382 4394 4406 4418 4429 4441
1.6 0.4452 4463 4474 4484 4495 4505 4515 4525 4535 4545
1.7 0.4554 4564 4573 4582 4591 4599 4608 4616 4625 4633
1.8 0.4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1.9 0.4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
2.0 0.4772 4778 4783 4788 4793 4798 4803 4808 4812 4817
2.1 0.4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2.2 0.4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2.3 0.4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2.4 0.4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2.5 0.4938 4931 4941 4943 4945 4946 4948 4949 4951 4952
2.6 0.4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
2.7 0.4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2.8 0.4974 4075 4976 4977 4977 4978 4979 4980 4980 4981
2.9 0.4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
3.0 0.4986 4987 4987 4988 4988 4989 4989 4989 4990 4990
3.1 0.4990 4991 4991 4991 4992 4992 4992 4992 4993 4993
3.2 0.4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3.3 0.4995 4995 4996 4996 4996 4996 4996 4996 4996 4996
3.4 0.4997 4997 4997 4997 4997 4997 4997 4997 4998 4998
3.5 0.4998 4998 4998 4998 4998 4998 4998 4998 4998 4998
3.6 0.4998 4998 4999 4999 4999 4999 4999 4999 4999 4999
370 Anexe
Anexa II (Legea Student) F
n
(t
n;
) =

_
n+1
2
_

n
_
n
2
_
_
tn;

_
1 +
x
2
n
_

n+1
2
dx =
0.70 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
n tn;
1 0.727 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.617 0.817 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.584 0.765 0.979 1.250 1.638 2.353 3.182 4.541 5.841
4 0.569 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.559 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.553 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.549 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.500
8 0.546 0.706 0.889 1.108 1.397 1.860 2.306 2.897 3.355
9 0.544 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.542 0.700 0.879 1.093 1.372 1.813 2.228 2.764 3.169
11 0.540 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.539 0.696 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.538 0.694 0.870 1.080 1.350 1.771 2.160 2.650 3.012
14 0.537 0.692 0.868 1.076 1.345 1.761 2.145 2.625 2.977
15 0.536 0.691 0.866 1.074 1.341 1.753 2.131 2.603 2.947
16 0.535 0.690 0.865 1.071 1.337 1.746 2.120 2.584 2.921
17 0.534 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.534 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.533 0.688 0.861 1.066 1.328 1.729 2.093 2.540 2.861
20 0.533 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.533 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.532 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.532 0.685 0.858 1.060 1.320 1.714 2.069 2.500 2.807
24 0.531 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.531 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.531 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.531 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.530 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.530 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.530 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
35 0.529 0.682 0.852 1.052 1.306 1.690 2.030 2.438 2.724
40 0.529 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.705
50 0.528 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678
60 0.527 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
80 0.526 0.679 0.847 1.044 1.291 1.671 2.000 2.390 2.660
120 0.526 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
0.524 0.674 0.842 1.036 1.282 1.645 1.956 2.326 2.576
Anexe 371
Anexa III (Legea
2
) F
n
_

2
n;
_
=
1
2
n
2

_
n
2
_
_

2

0
x
n
2
1
e

x
2
dx =
0.005 0.010 0.025 0.050 0.100 0.900 0.950 0.975 0.990 0.995
n
2
n;
1 0.000 0.000 0.001 0.004 0.016 2.71 3.84 5.02 6.63 7.88
2 0.010 0.020 0.051 0.103 0.211 4.61 5.99 7.38 9.21 10.60
3 0.072 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84
4 0.207 0.297 0.484 0.711 1.06 7.78 9.49 11.14 13.28 14.86
5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.83 15.09 16.75
6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55
7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19
11 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.72 26.76
12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30
13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32
15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80
16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27
17 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.1 11.65 27.20 30.14 32.85 36.19 38.58
20 7.43 8.26 9.59 10.9 12.44 28.41 31.41 34.17 37.57 40.00
21 8.03 8.90 10.3 11.6 13.24 29.62 32.67 35.48 38.93 41.40
22 8.64 9.54 11.0 12.3 14.04 30.81 33.92 36.78 40.29 42.80
23 9.26 10.2 11.7 13.1 14.85 32.01 35.17 38.08 41.64 44.18
24 9.89 10.9 12.4 13.8 15.66 33.20 36.42 39.36 42.98 45.56
25 10.5 11.5 13.1 14.6 16.47 34.38 37.65 40.65 44.31 46.93
26 11.2 12.2 13.8 15.4 17.29 35.56 38.89 41.92 45.64 48.29
27 11.8 12.9 14.6 16.2 18.11 36.74 40.11 43.19 46.96 49.64
28 12.5 13.6 15.3 16.9 18.94 37.92 41.34 44.46 48.28 50.99
29 13.1 14.3 16.0 17.7 19.77 39.09 42.56 45.72 49.59 52.34
30 13.8 15.0 16.8 18.5 20.60 40.26 43.77 46.98 50.89 53.67
35 17.2 18.5 20.6 22.5 24.8 46.1 49.8 53.2 57.3 60.3
40 20.7 22.2 24.4 26.5 29.1 51.8 55.8 59.3 63.7 6.68
60 35.5 37.5 40.5 43.2 46.5 74.4 79.1 83.3 88.4 91.9
372 Anexe
Anexa IV (Legea FisherSnedecor)
F
m,n
(f
m,n;
) =
_
m
n
_m
2

_
m+n
2
_

_
m
2
_

_
n
2
_
_
fm,n;
0
x
m
2
1
_
1 +
m
n
x
_

m+n
2
dx=
m 1 2 3 4 5 6 7 8
n fm,n;
0.95 161.4 199.5 216 225 230 234 237 239
0.975 1 648 800 864 900 922 937 948 957
0.99 4052 4999 5403 5625 5764 5859 5930 5981
0.95 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37
0.975 2 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4
0.99 98.49 99.00 99.17 99.25 99.30 99.33 99.35 99.36
0.95 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85
0.975 3 17.4 16.0 15.1 15.4 14.9 14.7 14.6 14.5
0.99 34.12 30.84 29.46 28.71 28.24 27.91 27.7 27.49
0.95 17.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04
0.975 4 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98
0.99 21.20 18.00 16.69 15.98 15.52 15.21 15.0 14.80
0.95 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82
0.975 5 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76
0.99 16.26 13.27 12.06 11.39 10.97 10.67 10.5 10.27
0.95 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15
0.975 6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60
0.99 13.74 10.91 9.78 9.15 8.75 8.47 8.26 8.10
0.95 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73
0.975 7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90
0.99 12.25 9.55 8.45 7.85 7.45 7.19 6.99 6.84
0.95 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44
0.975 8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43
0.99 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03
0.95 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23
0.975 9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10
0.99 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47
0.95 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07
0.975 10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85
0.99 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06
0.95 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95
0.975 11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66
0.99 9.65 7.20 6.22 5.67 5.32 5.07 4.89 4.74
Anexe 373
Anexa IV (continuare)
m 1 2 3 4 5 6 7 8
n fm,n;
0.95 4.75 3.88 3.49 3.26 3.11 3.00 2.91 2.85
0.975 12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51
0.99 9.33 6.93 5.95 5.41 5.06 4.82 4.54 4.50
0.95 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77
0.975 13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39
0.99 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30
0.95 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70
0.975 14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29
0.99 8.86 6.51 5.56 5.04 4.70 4.46 4.28 4.14
0.95 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64
0.975 15 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20
0.99 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00
0.95 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59
0.975 16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12
0.99 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89
0.95 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55
0.975 17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06
0.99 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79
0.95 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51
0.975 18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01
0.99 8.29 7.01 5.09 4.58 4.25 4.01 3.84 3.71
0.95 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48
0.975 19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96
0.99 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63
0.95 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45
0.975 20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91
0.99 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56
0.95 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42
0.975 21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87
0.99 8.02 5.78 4.87 4.37 4.04 3.84 3.64 3.51
0.95 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40
0.975 22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84
0.99 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45
0.95 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37
0.975 23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81
0.99 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41
0.95 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36
0.975 24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78
0.99 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36
374 Anexe
Anexa IV (continuare)
m 9 10 11 12 13 14 15 16
n fm,n;
0.95 19.4 19.4 19.4 19.4 19.4 19.4 19.4 19.4
0.975 2 39.4 39.4 39.4 39.4 39.4 39.4 39.4 39.4
0.99 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.4
0.95 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69
0.975 3 14.5 14.4 14.4 14.3 14.3 14.3 14.3 14.2
0.99 27.3 27.1 27.1 27.1 27.0 26.9 26.9 26.8
0.95 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84
0.975 4 8.90 8.84 8.79 8.75 8.72 8.69 8.66 8.64
0.99 14.7 14.5 14.4 14.4 14.3 14.2 14.2 14.2
0.95 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60
0.975 5 6.68 6.62 6.57 6.52 6.49 6.46 6.43 6.41
0.99 10.2 10.1 9.96 9.89 9.82 9.77 9.72 9.68
0.95 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92
0.975 6 5.52 5.46 5.41 5.37 5.33 5.30 5.27 5.25
0.99 7.98 7.89 7.79 7.72 7.66 7.60 7.56 7.52
0.95 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49
0.975 7 4.82 4.76 4.71 4.67 4.63 4.60 4.57 4.54
0.99 6.72 6.62 6.54 6.47 6.41 6.36 6.31 6.27
0.95 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20
0.975 8 4.36 4.30 4.24 4.20 4.16 4.13 4.10 4.08
0.99 5.91 5.81 5.73 5.67 5.61 5.56 5.52 5.48
0.95 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99
0.975 9 4.03 3.96 3.91 3.87 3.83 3.80 3.77 3.74
0.99 5.35 5.26 5.18 5.11 5.05 5.00 4.96 4.92
0.95 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83
0.975 10 3.78 3.72 3.66 3.62 3.58 3.55 3.52 3.50
0.99 4.94 4.85 4.77 4.71 4.65 4.60 4.56 4.52
0.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70
0.975 11 3.59 3.53 3.47 3.43 3.39 3.36 3.33 3.30
0.99 4.63 4.54 4.46 4.40 4.34 4.29 4.25 4.21
0.95 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60
0.975 12 3.44 3.37 3.32 3.28 3.24 3.21 3.18 3.15
0.99 4.39 4.30 4.22 4.16 4.10 4.05 4.01 3.97
0.95 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51
0.975 13 3.31 3.25 3.20 3.15 3.12 3.08 3.05 3.03
0.99 4.19 4.10 4.02 3.96 3.91 3.86 3.82 3.78
0.95 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44
0.975 14 3.21 3.15 3.09 3.05 3.01 2.98 2.95 2.92
0.99 4.03 3.94 3.86 3.80 3.75 3.70 3.66 3.62
Anexe 375
Anexa IV (continuare)
m 9 10 11 12 13 14 15 16
n fm,n;
0.95 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38
0.975 15 3.12 3.06 3.01 2.96 2.92 2.89 2.86 2.84
0.99 3.89 3.80 3.73 3.67 3.61 3.56 3.52 3.49
0.95 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33
0.975 16 3.05 2.99 2.93 2.89 2.85 2.82 2.79 2.76
0.99 3.78 3.69 3.62 3.55 3.50 3.45 3.41 3.37
0.95 2.49 2.45 2.41 2.38 2.35 2.33 2.29 2.27
0.975 17 2.98 2.92 2.87 2.82 2.79 2.75 2.72 2.70
0.99 3.68 3.59 3.52 3.46 3.40 3.35 3.31 3.27
0.95 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25
0.975 18 2.93 2.87 2.81 2.77 2.73 2.70 2.67 2.64
0.99 3.60 3.51 3.43 3.37 3.32 3.27 3.23 3.19
0.95 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21
0.975 19 2.88 2.82 2.76 2.72 2.68 2.65 2.62 2.59
0.99 3.52 3.43 3.36 3.30 3.24 3.19 3.15 3.12
0.95 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.19
0.975 20 2.84 2.77 2.72 2.68 2.64 2.60 2.57 2.55
0.99 3.46 3.37 3.29 3.23 3.18 3.13 3.09 3.05
0.95 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16
0.975 21 2.80 2.73 2.68 2.64 2.60 2.56 2.53 2.51
0.99 3.40 3.31 3.24 3.17 3.12 3.07 3.03 2.99
0.95 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13
0.975 22 2.76 2.70 2.65 2.60 2.56 2.53 2.50 2.47
0.99 3.35 3.26 3.18 3.12 3.07 3.02 2.98 2.94
0.95 2.32 2.27 2.23 2.20 2.18 2.15 2.13 2.11
0.975 23 2.73 2.67 2.62 2.57 2.53 2.50 2.47 2.44
0.99 3.30 3.21 3.14 3.07 3.02 2.97 2.93 2.89
0.95 2.30 2.25 2.21 2.18 2.15 2.13 2.11 2.09
0.975 24 2.70 2.64 2.59 2.54 2.50 2.47 2.44 2.41
0.99 3.26 3.17 3.09 3.03 2.98 2.93 2.89 2.85
376 Anexe
Anexa V (Funct ia lui Kolmogorov) K (x) =
+

k=
(1)
k
e
2k
2
x
2
Sutimi ale lui x
x 0 1 2 3 4 5 6 7 8 9
0.3 0.0000 0000 0000 0001 0002 0003 0005 0008 0013 0019
0.4 0.0028 0039 0054 0073 0097 0125 0160 0200 0246 0300
0.5 0.0360 0428 0503 0585 0674 0771 0875 0986 1103 1227
0.6 0.1357 1492 1632 1777 1926 2079 2236 2395 2557 2721
0.7 0.2887 3054 3222 3391 3559 3727 3896 4063 4230 4395
0.8 0.4558 4720 4880 5038 5193 5346 5497 5645 5790 5933
0.9 0.6072 6209 6342 6473 6600 6725 6896 6964 7079 7191
1.0 0.7300 7405 7508 7607 7704 7797 7888 7976 8061 8143
1.1 0.8222 8299 8373 8445 8513 8580 8644 8706 8765 8822
1.2 0.8877 8930 8981 9029 9076 9121 9164 9205 9245 9282
1.3 0.9319 9353 9386 9418 9448 9477 9505 9531 9556 9580
1.4 0.9603 9624 9645 9665 9683 9701 9718 9734 9749 9764
1.5 0.9777 9790 9803 9814 9825 9836 9846 9855 9864 9872
1.6 0.9880 9887 9894 9901 9907 9913 9919 9924 9929 9933
1.7 0.9938 9942 9946 9949 9953 9956 9959 9962 9964 9967
1.8 0.9969 9971 9973 9975 9977 9979 9980 9981 9983 9984
1.9 0.9985 9986 9987 9988 9989 9990 9991 9991 9992 9993
2.0 0.9993 9994 9994 9995 9995 9996 9996 9996 9996 9997
2.1 0.9997 9997 9998 9998 9998 9998 9998 9998 9999 9999
Bibliograe
[1] Abramowitz, M., Stegun, I. A., Handbook of Mathematical Functions with For-
mulas, Graphs, and Mathematical Tables, tenth ed., Dover Publications, Inc.,
New York, 1972.
[2] Blaga, P., Calculul probabilit at ilor. Culegere de probleme, Universitatea
BabesBolyai, ClujNapoca, 1984.
[3] , Metode statistice n modelarea cu calculatorul. Lucr ari de laborator,
Universitatea BabesBolyai, ClujNapoca, 1993.
[4] , Calculul probabilit at ilor si statistic a matematic a. Vol. II. Curs si
culegere de probleme, Universitatea BabesBolyai, ClujNapoca, 1994.
[5] , Statistic a matematic a. Lucr ari de laborator, Universitatea Babes
Bolyai, ClujNapoca, 1999.
[6] , Statistic a matematic a, Universitatea BabesBolyai, ClujNapoca,
2000.
[7] , Statistic a matematic a (edit ia II), Universitatea BabesBolyai, Cluj
Napoca, 2001.
[8] Blaga, P., Lupas, A., Muresan A. S., Matematici aplicate, Vol.III, Promedia
Plus, ClujNapoca, 1999.
[9] Blaga, P., Muresan A. S., Matematici aplicate n economie, Vol.III, Transilva-
nia Press, ClujNapoca, 1996.
[10] Blaga, P., R adulescu, M., Calculul probabilit at ilor, Universitatea Babes
Bolyai, ClujNapoca, 1987.
[11] Ciucu, G., Elemente de teoria probabilit at ilor si statistic a matematic a, Editura
didactic a si pedagogic a, Bucuresti, 1963.
377
378 Bibliograe
[12] Ciucu, G., Craiu, V., Probleme de statistic a matematic a, Editura didactic a si
pedagogic a, Bucuresti, 1968.
[13] , Teoria estimat iei si vericarea ipotezelor statistice, Editura didactic a
si pedagogic a, Bucuresti, 1968.
[14] , Introducere n teoria probabilit at ilor si statistic a matematic a, Editura
didactic a si pedagogic a, Bucuresti, 1971.
[15] , Inferent a statistic a, Editura didactic a si pedagogic a, Bucuresti, 1974.
[16] Ciucu, G., Craiu, V., S tef anescu, A., Statistic a matematic a si cercet ari operat i-
onale, Vol. I, Editura didactic a si pedagogic a, Bucuresti, 1974.
[17] Ciucu, G., Tudor, C., Probabilit at i si procese stochastice. Vol. I, Editura
Academiei, Bucuresti, 1978.
[18] Craiu, V., Vericarea ipotezelor statistice, Editura stiint ic a si enciclopedic a,
Bucuresti, 1972.
[19] Craiu, V., Enache, R., B asc a, O., Teste de concordant a cu programe n FOR-
TRAN, Editura stiint ic a si enciclopedic a, Bucuresti, 1974.
[20] Cram er, H., Mathematical methods of statistics, Princeton University Press,
Princeton, 1951.
[21] DacunhaCastelle, D., Duo, M., Exercises de probabilit es et statistiques.
1. Probl` emes ` a temps xe. Tome 1, Masson, Paris, 1990.
[22] , Probabilit es et statistiques. 1. Probl` emes ` a temps xe. Tome 1, Mas-
son, Paris, 1990.
[23] De ak, I., Random number generators and simulation, Akad emiai Kiad o, Bu-
dapest, 1990.
[24] Dumitrescu, M., Florea, D., Tudor, C., Probleme de teoria probabilit at ilor si
statistic a matematic a, Editura Tehnic a, Bucuresti, 1985.
[25] Enders, W., Applied econometric. Time series, John Wiley & Sons, 1995.
[26] Ermakov, S. M., Metoda Monte Carlo si probleme nrudite, Editura Tehnic a,
Bucuresti, 1976.
[27] Feller, W., An introduction to probability theory and its applications. Vol. I,
John Wiley, New York, 1957.
Bibliograe 379
[28] , An introduction to probability theory and its applications. Vol. II, John
Wiley, New York, 1966.
[29] Gnedenko, B. V., The theory of probability, Mir Publishers, Moscow, 1976.
[30] Good, Ph. I., Resampling Methods. A Practical Guide to Data Analysis,
Birkh auser, Boston Basel Berlin, 1999.
[31] Grifths, D. F., An Introduction to Matlab, Version 2.1, University of Dundee,
1997.
[32] Grinstead, Ch. M., Snell, J. L., Introduction in probability, Second edition,
American Mathematical Society, 1997.
[33] Gurski, E. I., Culegere de probleme pentru teoria probabilit at ilor si statistica
matematic a (l. rus a), Edit.

Inv. superior Minsk, Minsk, 1984.
[34] Hoel, P. J., Introduction to mathematical statistics, Fourth edition, John Wiley
& Sons, New YorkLondonSydneyToronto, 1971.
[35] , Statistique math ematique, Tome II, Armand Colin, Paris, 1991.
[36] HoffmannJrgensen, J., Probability with a view toward statistics, Vol. I-II,
Chapman & Hall, New YorkLondon, 1994.
[37] Iosifescu, M., Mihoc, Gh., Theodorescu, R., Teoria probabilit at ilor si statistica
matematic a, Editura Tehnic a, Bucuresti, 1966.
[38] Iosifescu, M., Moineanu, C., Trebici, V., Ursianu, E., Mic a enciclopedie de
statistic a, Editura stiint ic a si enciclopedic a, Bucuresti, 1985.
[39] Jansson, B., Random number generators, Victor Petterson Bokindustri Aktiebo-
lag, Stockholm, 1966.
[40] Johnson, N. L., Kotz, S., Distributions in statistics. Discrete distributions,
Houghton Mifin Company, Boston, 1969.
[41] Kendall, M. G., Stuart, A., The advanced theory of statistics. Vol. 1. Distribution
theory, Second edition, Charles Grifn & Company Limited, London, 1961.
[42] , The advanced theory of statistics. Vol. 2. Inference and relationship,
Charles Grifn & Company Limited, London, 1963.
[43] , The advanced theory of statistics. Vol. 3. Design and analysis, and
timeseries, Charles Grifn & Company Limited, London, 1966.
380 Bibliograe
[44] Knuth, D. E., The art of computer programming, Vol. II. Seminumerical algo-
rithms, Addison-Wesley, Mass., 1969.
[45] Lebart, L., Morineau, M. G., F enelon, J.-P., Traitment des donn ees statistiques.
m ethodes et programmes, Dunod, Paris, 1982.
[46] Lecoutre, J.-P., Tassi, Ph., Statistique non param etrique et robustesse, Econo-
mica, Paris, 1987.
[47] Lehmann, E. L., Testing statistical hypotheses, Second edition, Springer, New
YorkBerlin, 1997.
[48] Malit a, M., Zid aroiu, C., Incertitudine si decizie, Editura stiint ic a si enciclo-
pedic a, Bucuresti, 1980.
[49] Mihoc, Gh., Ciucu, G., Craiu, V., Teoria probabilit at ilor si statistic a matema-
tic a, Editura didactic a si pedagogic a, Bucuresti, 1970.
[50] Mihoc, Gh., Ciucu, G., Muja, A., Modele matematice ale astept arii, Editura
Academiei, Bucuresti, 1973.
[51] Mihoc, Gh., Craiu, V., Tratat de statistic a matematic a. Vol. I. Select ie si
estimat ie, Editura Academiei, Bucuresti, 1976.
[52] , Tratat de statistic a matematic a. Vol. II. Vericarea ipotezelor statis-
tice, Editura Academiei, Bucuresti, 1977.
[53] Mihoc, Gh., Firescu, D., Statistic a matematic a, Editura didactic a si pedagogic a,
Bucuresti, 1966.
[54] Mihoc, I., Calculul probabilit at ilor si statistic a matematic a. Part. I, II, lito.
Univ. BabesBolyai, ClujNapoca, 1994,1995.
[55] Nakamura, S., Numerical Analysis and Graphic Visualization with MATLAB,
Prentice Hall PTR, Upper Saddle River, New Jersey, 1996.
[56] Oancea, E., R adulescu, M., Calculul probabilit at ilor si statistic a matematic a,
lito. Univ. BabesBolyai, ClujNapoca, 1974.
[57] Ogden, R. T., Essential wavelets for statistical applications and data analysis,
Birkh auser, Boston Basel Berlin, 1997.
[58] Onicescu, O., Numere si sisteme aleatoare, Editura Academiei, Bucuresti, 1962.
Bibliograe 381
[59] Onicescu, O., Botez, M. C., Incertitudine si modelare economic a (econometrie
informat ional a), Editura stiint ic a si enciclopedic a, Bucuresti, 1985.
[60] Parzen, E., Modern probability theory and its applications, John Wiley, New
YorkLondon, 1960.
[61] Press, W. H., Flannery, B. P., Teukolsky, S. A., Vetterling, W. T., Numerical
Recipes. The Art of Scientic Computing, Cambridge University Press, Cam-
bridge, 1986.
[62] Rancu, N., T ovissi, L., Statistica matematic a cu aplicat ii n product ie, Editura
Academiei, Bucuresti, 1963.
[63] Rao, M. M., Probability theory with applications, Academic Press, New York,
1984.
[64] R enyi, A., Probability theory, Akad emiai Kiad o, Budapest, 1970.
[65] Rumsiski, L. Z., Prelucrarea matematic a a datelor experimentale, Editura
Tehnic a, Bucuresti, 1974.
[66] Saporta, G., Probabilit es, analyse des donn ees et statistique,

Editions Technip,
Paris, 1990.
[67] Schervish, M. J., Theory of statistics, Springer, New YorkBerlin, 1995.
[68] Shiryaev, A. N., Probability, Springer, New YorkBerlin, 1995.
[69] Sigmon, K., Matlab Primer, Third edition, University of Florida, 1993.
[70] Snedecor, G. W, Cochran, W. G., Statistical methods, Iowa State University
Press, 1989.
[71] Stapleton, J. H., Linear statistical models, John Wiley & Sons, New York
ChichesterBrisbane, 1995.
[72] Stark, H., Woods, J. W., Probability, random processes, and estimation theory
for engineers, Prentice-Hall, New Jersey, 1986.
[73] Stoyanov, J., Mirazchiiski, I., Ignatov, Z., Tanushev, M., Exercise manual in
probability theory, Kluwer Academic Publishers, DordrechtBostonLondon,
1988.
[74] S acuiu, I., Zorilescu, D., Numere aleatoare. Aplicat ii n economie, industrie si
studiul fenomenelor naturale, Editura Academiei, Bucuresti, 1978.
382 Bibliograe
[75] Sveshnikov, A. A., Problems in probability theory, mathematical statistics and
theory of random functions, W. B. Saunders Company, PhiladelphiaLondon
Toronto, 1968.
[76] Tassi, Ph., M ethodes statistiques, 2
e
edition, Economica, Paris, 1989.
[77] V aduva, I., Analiz a dispersional a, Editura Tehnic a, Bucuresti, 1970.
[78] , Modele de simulare cu calculatorul, Editura Tehnic a, Bucuresti, 1977.
[79] Wahba, G., Spline models for observational data, Society for Industrial and
Applied Mathematics, Philadelphia, 1990.
[80] Yule, G. U., Kendall, M. G., Introducere n teoria statisticii, Editura stiint ic a,
Bucuresti, 1969.
Index
Abatere
cuartilic a, 134
medie absolut a, 135
medie p atratic a, 135
standard, 93, 135
abs, 9
acos, 9
acosh, 9
acot, 9
acoth, 9
acsc, 9
acsch, 9
all, 15
Amplitudinea, 134
clasei, 106
and, 14
angle, 9
ans, 12
any, 14
asec, 9
asech, 9
Asimetrie, 90, 137
asin, 9
asinh, 9
atan, 9
atan2, 9
atanh, 9
Atribut, 100
axis, 21
bar, 28, 57, 120, 123
bar3, 51
bar3h, 51
barh, 28
beta, 69
betafit, 260
betalike, 259
bino, 59
binofit, 260
boxplot, 147
C amp de evenimente, 54
C amp de probabilitate, 54
calendar, 6
Cantitate de informat ie, 212
Caracteristic a, 100
calitativ a (atribut), 100
cantitativ a, 100
continu a, 101
discret a, 101
caseread, 113
casewrite, 113
cd, 4, 10
cdf, 57, 58, 64, 65, 93
cdfplot, 204
ceil, 9
Centile, 91, 133
Centru de greutate, 156
chi2, 72
cla, 21
Clase, 106
clear, 11
clf, 21
clock, 6
383
384 Index
Coecient ii
lui Fisher, 137
lui Pearson, 137
Coecient de asimetrie
intercuartil, 137
Coecient de corelat ie, 81
al lui Pearson, 149
al rangurilor, 168
de select ie, 189
Coecient de regresie, 156
Coecient de variat ie, 136
intercuartil, 137
Coecientul
lui Kendall, 170
lui Spearman, 168
Coecientul de concordant a
al lui Kendall, 175
Colectivitate, 100
colormap, 24
combnk, 10
Concatenare, 9
conj, 9
contour, 48
contourf, 48
Convergent a
n probabilitate, 94
n repartit ie, 94
Corect iile
Sheppard, 140
Corelat ie, 81, 148
Corp borelian, 54
corrcoef, 162
cos, 9
cosh, 9
cot, 9
coth, 9
cov, 162
Covariant a, 81
crosstab, 112
csc, 9
csch, 9
Cuantil a, 91
Cuartila, 91, 133
inferioar a, 91, 133
superioar a, 91, 133
cumprod, 139
cumsum, 139
Curb a de regresie, 89, 152
date, 6
Date de select ie, 180
dbclear, 16
dbcont, 16
dbdown, 16
dbmex, 17
dbquit, 17
dbstack, 16
dbstatus, 16
dbstep, 16
dbstop, 16
dbtype, 16
dbup, 17
Decile, 91, 133
delete, 17
demo, 4
Densitate de probabilitate, 64
marginal a, 76
det, 10
diag, 10
Diagram a
cumulativ a ascendent a, 115
integral a cumulativ a, 118
prin batoane (bare), 115
diary, 11, 38
diff, 140
dir, 4
disp, 10
Dispersie, 81, 135
condit ionat a, 88, 152, 153
Index 385
de select ie, 188
Distribut ie, 56
statistic a, 109
Distribut ie marginal a, 76
disttool, 93
Drepte de regresie, 155
Esantion, 179
echo, 42
edit, 16
Ecient a, 222
eps, 6
eq, 14
erf, 67
Eroare
de spet a nt ai, 269
de spet a a doua, 269
Estimat ie, 216
absolut corect a, 217
consistent a, 216
corect a, 219
cu
2
minim, 236
de verosimilitate maxim a, 232
nedeplasat a, 216
Estimator, 216
absolut corect, 217
consistent, 216
corect, 219
cu
2
minim, 236
de verosimilitate maxim a, 232
nedeplasat, 216
optimal, 227
Eveniment
cert, sigur, 54
Exces, 90
exit, 2
exp, 9, 69
Experiment, 54
expfit, 260
eye, 6
ezcontour, 49
ezcontourf, 50
ezmesh, 50
ezmeshc, 50
ezplot, 30
ezplot3, 45
ezpolar, 24
ezsurf, 50
ezsurfc, 50
f, 74
factor, 10
factorial, 10
feval, 42
Fisiere script, 15, 38
figure, 21
file, 17
fill, 31
fix, 9
floor, 9
flops, 43
format, 5
Formula lui Daniels, 174
fplot, 30
fprintf, 13
Frecvent a
absolut a, 106, 110
cumulat a
ascendent a, 109
descendent a, 109
relativ a, 109
Funct ia eroare, 67
Funct ia Laplace, 67
Funct ia lui Euler
de spet a nt ai, 69
de spet a a doua, 68
Funct ie caracteristic a, 90
Funct ie de estimat ie, 216
absolut corect a, 217
corect a, 219
386 Index
ecient a, 222
nedeplasat a, 216
Funct ie de probabilitate, 57
Funct ie de repartit ie, 5557, 64
condit ionat a, 77
de select ie, 198
marginal a, 76
Funct ie de select ie, 180
Funct ie de supraviet uire, 80
Funct ie de verosimilitate, 209
Funct ie hazard, 80
Funct ie nucleu, 116
Gaussian, 116
parabolic (Epanechnikov), 117
Funct ie wavelet, 26
mam a, 26
Funct ii Matlab, 38
Funct iile lui Haar, 26
gam, 68
gamfit, 260
gamlike, 259
gcd, 10
ge, 14
geo, 63
geomean, 132
ginput, 13
gline, 163
global, 39
gplotmatrix, 129
grid, 23
grpstats, 145
Grupare, 106
gscatter, 127
gt, 14
gtext, 22
harmmean, 132
help, 2, 39
helpdesk, 4
helpwin, 3
hist, 123
histc, 123, 124
histfit, 256
Histograma, 115
hold, 21
hyge, 61
i, 6
icdf, 91, 93
imag, 9
Indicatorul
de verosimilitate, 237
lui Berkson, 237
lui Kullbach, 237
lui Neyman, 237
lui Pearson, 237
Indice
de dilatare, 26
de translatare, 26
inf, 6
input, 13
Instruct iunea
break, 37
de atribuire, 12
error, 38
for, 35
if, 32
pause, 37
return, 37
switch, 33
try...catch, 36
while, 34
Instruct iuni
de citire, 13
de scriere, 13
Interval
intercuartilic, 134
Interval de ncredere, 166, 168, 237
inv, 10
Index 387
Ipotez a statistic a, 263
alternativ a, 263
compus a, 263
nul a, 263
simpl a, 263
iqr, 138
j, 6
kstest, 338
kstest2, 343
kurtosis, 138
lcm, 10
ldivide, 8
le, 14
Lege de probabilitate
de tip continuu, 64
clasic a, 65
statistic a, 70
de tip discret, 56
clasic a, 59
Legea

2
, 72
necentrat a, 73
arcsin, 70
Bernoulli, 59
beta, 69
binomial a, 59
binomial a negativ a, 63
Cauchy, 71
evenimentelor rare, 62
exponent ial a, 62, 69
F (FisherSnedecor), 74
necentrat a, 75
gamma, 68
geometric a, 63
hipergeometric a, 61
lognormal a, 68
normal a, 66
normal a multidimensional a, 78
Pascal, 63
Poisson, 62
Rayleigh, 70
t (Student), 70
necentrat a, 71
uniform a, 65
discret a, 59
Weibull, 70
Legea numerelor mari, 95
legend, 22
length, 10
lillietest, 339
load, 11
log, 9
log10, 9
log2, 9
logn, 68
lookfor, 3, 39
lsline, 163
lt, 14
mad, 138
magic, 6
Matrice vid a, 12
Matricea covariant elor, 82
Matricea informat iei lui Fisher, 212
max, 139
mean, 132
median, 133
Mediana, 90, 132
Medie
aritmetic a, 131
armonic a, 131
geometric a, 131
Medie de select ie, 181
mesh, 46
meshgrid, 45
Metoda ferestrei mobile, 116
Metode de select ie
nerepetate, 180
388 Index
repetate(bernoulliene), 180
min, 139
minus, 8
mkdir, 4, 10
mldivide, 8
mle, 257
Mod, 134
Moment, 134, 148
centrat, 90, 135, 149
centrat de selet ie, 184
de seelct ie, 183
init ial, 90
moment, 138
mpower, 8
mrdivide, 9
mtimes, 8
mvnrnd, 103
mvtrnd, 103
NaN, 6
nanmax, 140
nanmean, 140
nanmedian, 140
nanmin, 140
nanstd, 140
nansum, 140
nargin, 39
nargout, 39
nbin, 63
ncf, 75
nchoosek, 10
nct, 71
ncx2, 73
ndims, 10
ne, 14
Nivel de semnicat ie, 264
nlinfit, 166
nlintool, 168
Nor statistic, 119
norm, 66
normfit, 260
normlike, 259
normspec, 75
not, 14
Numere
aleatoare, 102
pseudoaleatoare, 103
Observare
curent a, 101
part ial a, 101
periodic a, 101
total a, 101
ones, 6
or, 14
pdf, 57, 58, 64, 65, 93
perms, 10
pi, 6
pie, 130
pie3, 130
plot, 17, 24, 25, 57, 64, 123
plot3, 44
plotmatrix, 128
plus, 8
poiss, 62
poissfit, 260
polar, 24
poly, 165
polyfit, 164
polytool, 166
polyval, 165
polyvalm, 165
Populat ie, 100
power, 8
prctile, 133
primes, 10
Prob a, 54
Probabilitate, 54
Probabilitate de ncredere, 166
Index 389
Proceduri Matlab, 38
prod, 139
Puterea unui test, 269
quit, 2
rand, 104
randn, 104
random, 103
randperm, 105
randtool, 129
range, 138
rank, 10
Raport de corelat ie, 154
rayl, 70
raylfit, 260
rdivide, 8
real, 9
realmax, 6
realmin, 6
refcurve, 164
refline, 163
Regiune critic a, 264
Regula lui Sturges, 106
rem, 9
Repartit ie, 56
reshape, 7
Risc
de spet a nt ai, 269
de spet a a doua, 269
roots, 165
round, 9
save, 11, 38
scatter, 126
scatter3, 127
sec, 9
sech, 9
Select ie, 179
cu probabilit at i egale, 180
sistematic a, 179
straticat a, 180
tipic a, 180
shading, 47
sign, 9
sin, 9
sinh, 9
Sistemul ecuat iilor
de verosimilitate maxim a, 233
size, 10
skewness, 138
Sondaj, 179
sort, 139
sortrows, 139
Spat iul probelor, 54
sqrt, 9
stairs, 25, 57, 120
Statistic a, 180
complet a, 229
sucient a, 209
std, 138
Subfunct ii Matlab, 40
subplot, 28
sum, 139
surf, 46
t, 70
Tabel de contingent a, 110, 327
Tabel de corelat ie, 110
Tabel statistic
nesistematizat, 105
sistematizat, 105, 106
tabulate, 111
tan, 9
tanh, 9
tblread, 114
tblwrite, 114
Teorem a limit a
central a, 96
MoivreLaplace, 96
Test, 263
390 Index
cel mai puternic, 275
nedeplasat, 275
neparametric, 263
parametric, 263
Testul
F, 295, 298
bilateral, 295, 299
unilateral dreapta, 295, 299
unilateral st anga, 295, 299
T, 282, 302, 306
bilateral, 282, 288, 309
unilateral dreapta, 282, 309
unilateral st anga, 282, 309
Z, 264, 300
bilateral, 264
unilateral dreapta, 264
unilateral st anga, 264

2
, 289, 312, 323, 327
bilateral, 289
neparametric, 316
parametric, 318, 320
unilateral dreapta, 289
unilateral st anga, 289
FisherSnedecor, 295
bilateral, 295
unilateral dreapta, 295
unilateral st anga, 295
Kolmogorov, 331
bilateral, 331
unilateral dreapta, 331
unilateral st anga, 331
Kolmogorov-Smirnov, 341
bilateral, 341
unilateral dreapta, 341
unilateral st anga, 341
raportului verosimilit at ilor, 286
Student, 282
bilateral, 282, 309
unilateral dreapta, 282, 309
unilateral st anga, 282, 309
text, 22
tic, 43
times, 8
title, 22
toc, 43
trace, 10
transpose, 10
trimmean, 132
ttest, 285
ttest2, 305
unid, 59
unif, 65
unifit, 260
Valoare medie, 80, 82
condit ionat a, 86, 152
Valoarea funct iei de select ie, 180
var, 138
Variat ie
intercuartilic a, 135
Variabil a
nominal a, 100
ordinal a, 100
Variabil a aleatoare, 54
(absolut) continu a, 64
de tip continuu, 55
de tip discret, 55
simpl a, 55
Variabile aleatoare
independente, 56
Variabile de select ie, 180
Variant a, 81
condit ionat a, 88
Vector aleator, 55
(absolut) continuu, 64
version, 4
Volumul
colectivit at ii, 100
Index 391
weib, 70
weibfit, 260
weiblike, 259
what, 17
which, 17
who, 11
whos, 11
workspace, 38
xlabel, 22
xor, 14
ylabel, 22
zeros, 6
zoom, 23
zscore, 268
ztest, 268
392 Index

S-ar putea să vă placă și