Sunteți pe pagina 1din 186

MINISTERUL NVMNTULUI

Program TEMPUS S_JEP 09781/1


GESTION ET PROTECTION DE LA
RESSOURCE EN EAU
Radu DROBOT



BAZELE STATISTICE
ALE HIDROLOGIEI








Serie coordonat de:

Radu DROBOT - Universitatea Tehnic
de Construcii Bucureti

Jean Pierre CARBONNEL
Universitatea Pierre et Marie Curie - Paris 6






EDITURA DIDACTIC I PEDAGOGIC, R.A. - BUCURETI, 1996































ISBN 973 - 30 - 4832 - 1


Copyright 1997. Toate drepturile asupra acestei ediii sunt rezervate
Editurii Didactice i Pedagogice, R.A., Bucureti


Redactori: Iuliana ARHANGHELSCHI i Tincua ANTON
Grafician: Dumitru MALENIC
PREFA


Cursul BAZELE STATISTICE ALE HIDROLOGIEI i propune o prezentare
didactic a noiunilor de baz ale statisticii matematice i ale utilizrii acesteia
n domeniul resurselor de ap.
Materialul este prezentat gradat, trecerea de la noiunile elementare la cele
de mare complexitate fcndu-se foarte lent. S-a urmrit, n special, nelege-
rea pe baze intuitive a unor noiuni matematice considerate adesea dificile,
renunndu-se, din acest motiv, la demonstraii matematice care fac de altfel
obiectul altor cursuri.
Numeroase exemplificri din domeniul practic au rolul de a permite
nelegerea corect a noiunilor prezentate, n vederea formrii unui mod de
gndire statistic, att de necesar n hidrologie i gospodrirea apelor, unde
informaiile de care se dispune sunt adesea insuficiente.
Far a idealiza calculul statistic, s-a insistat mult asupra premizelor sale,
pentru a-i nelege corespunztor posibilitile, dar i limitele. Nu trebuie uitat
c probabilitatea constituie o msur a incertitudinii i c abia pe msura
cunoaterii aprofundate a unui fenomen i se pot descifra corect mecanismele i
deci, se poate ajunge la formularea unor dependene de tip determinist, de la
cauz la efect.
Pn la realizarea acestui deziderat, abordarea statistic este n msur s
ofere rspunsuri i soluii la o serie de probleme practice din domeniul
cunoaterii i utilizrii resurselor de ap.
Terminologia utilizat este n concordan cu STAS-urile n vigoare, dar i
cu limbajul matematic al teoriei probabilitilor i statisticii matematice.
Lucrarea BAZELE STATISTICE ALE HIDROLOGIEI se adreseaz specialiti-
lor din domeniul resurselor de ap, cursanilor de la cursurile colii de Studii
Postuniversitare INGINERIA RESURSELOR DE AP, ca i studenilor de la
cursurile de zi, care au hidrologia ca obiect de studiu: Hidrotehnic,
Hidroenergetic, Agronomie, Geografie, etc.


Autorul
CUPRINS

1. GENERALITI ...................................................................................
1.1. Statistic matematic. Definiie.........................................................
1.2. Variabile deterministe. Variabile aleatoare .......................................
1.3. Clasificarea variabilelor aleatoare .....................................................
1.4. Populaie statistic. Selecie ..............................................................
1.5. Frecven absolut. Frecven relativ. Probabilitate..........................
1.6. Repartiii teoretice. Repartiii empirice ..............................................

2. VARIABILE ALEATOARE DISCRETE .............................................
2.1. Repartia unei variabile aleatoare discrete .........................................
2.1.1. Exemple de repartiii discrete .....................................................
2.1.2. Reprezentarea grafic a repartiiilor discrete ...............................
2.2. Funcia de repartiie a unei variabile discrete ....................................
2.2.1. Proprieti ale funciei de repartiie .............................................
2.2.2.Reprezentarea grafic a funciei de repartiie pentru o
variabil discret .........................................................................
2.2.3. Probabilitatea apariiei unei variabile discrete ntr-un
anumit interval ............................................................................
2.2.4. Reprezentarea funciei de repartiie a unei variabile discrete
(sau discretizate) cu valorile grupate pe intervale ........................
2.3. Complementara funciei de repartiie (probabilitatea de depire) .....
2.3.1. Interpretarea geometric a probabilitii de depire ...................
2.3.2. Reprezentarea grafic a probabilitii de depire .......................
2.3.3. Relaia de calcul a probabilitii de depire ...............................
2.3.4. Calculul probabilitii de depire a valorilor x
i
n hidrologie ......
2.4. Modul de reprezentare a funciilor de repartiie n hidrologie ............
2.4.1. Semnificaia probabilitii de depire n hidrologie ....................

3. VARIABILE ALEATOARE CONTINUE ...........................................
3.1. Densitate de repartiie. Funcie de repartiie ......................................
3.2. Reprezentarea grafic a probabilitii de depire n hidrologie ........
3.3. Extrapolarea repartiiilor empirice prin repartiii teoretice ................

4. VALORI TIPICE ALE VARIABILELOR ALEATOARE .................
4.1. Parametri ai tendinei centrale ...........................................................
4.2. Parametri ai variabilitii ..................................................................
4.3. Parametri ai formei ............................................................................
4.4. Calculul parametrilor statistici ai repartiiilor empirice ......................
4.5 Evaluarea parametrilor repartiiilor teoretice .....................................
4.5.1. Metoda momentelor ....................................................................
4.5.2. Metoda verosimilitii maxime ...................................................
4.5.3. Metoda celor mai mici ptrate .....................................................
4.6. Erori i limite ale calculului statistic ..................................................
7
7
7
8
9
10
12

13
13
15
17
21
22

25

27

30
32
34
35
36
39
42
45

48
48
53
54

57
57
61
67
69
73
73
75
77
81
5
5. REPARTIII CONTINUE UTILIZATE N HIDROLOGIE ..............
5.1. Repartiia normal ............................................................................
5.2. Aplicaii ale repartiiei normale n hidrologie ....................................
5.3. Repartiia log-normal (logaritmic normal) ......................................
5.4. Repartiiile Gama ..............................................................................
5.4.1. Repartiia
1
................................................................................
5.4.2. Repartiia
2
................................................................................
5.4.3. Repartiia
3
................................................................................
5.4.4. Corecia de siguran Q
p%
..........................................................
5.5. Repartiia Gumbell ............................................................................
5.6. Repartiii statistice auxiliare ..............................................................

6. INTERVALE DE NCREDERE ...........................................................

7. VERIFICAREA IPOTEZELOR STATISTICE ...................................

8. VARIABILE ALEATOARE N-DIMENSIONALE ..............................
8.1. Funcie de repartiie i densitate de repartiie ....................................
8.2. Variabile aleatoare bi-dimensionale ..................................................
8.2.1. Repartiia normal bi-dimensional ............................................
8.2.2. Repartiii empirice bi-dimensionale ............................................
8.3. Reprezentri i repartiii empirice bi-dimensionale n hidrologie.
Corelaii ............................................................................................
8.3.1. Clasificarea corelaiilor ...............................................................
8.3.2. Coeficientul de corelaie al variabilelor bi-dimensionale ............
8.3.3. Interpretarea coeficientului de corelaie. Proprieti ....................
8.3.4. Estimarea parametrilor regresiei liniare simple ...........................
8.3.5. Intervale de ncredere n cazul regresiei liniare simple ................
8.3.6. Regresia neliniar simpl ............................................................
8.3.7. Raportul de corelaie ...................................................................
8.4. Corelaii liniare multiple ...................................................................
8.4.1. Coeficientul corelaiei liniare multiple ........................................
8.4.2. Autocorelaia sau corelaia serial ...............................................
8.5. Generarea debitelor ...........................................................................

BIBLIOGRAFIE ....................................................................................
85
85
92
100
105
106
108
115
125
126
127

132

138

144
144
147
150
150

152
156
158
162
164
169
171
174
177
179
180
182

185



6




1. GENERALITI


1.1. STATISTIC MATEMATIC. DEFINIIE

Prin teoria statisticii sau statistic matematic se nelege disciplina care se
ocup cu formularea i interpretarea legilor de comportare att ale fenomenelor
de mas (inaccesibile metodelor deterministe), ct i ale fenomenelor rare,
avnd o frecven redus de apariie (V. Bobancu, 1974).
n cazul fenomenelor de mas, legitile statistice trebuie interpretate ca
tendine predominante i pot fi evideniate numai n condiiile unui numr
suficient de mare de observaii asupra ansamblului studiat (C. Moineagu .a.,
1976).
n domeniul hidrologiei, sarcina de a obine informaii primare asupra
mrimilor hidrologice (niveluri, debite, viteze etc.) revine hidrometriei, iar
totalitatea datelor privind rspndirea, cantitatea i variaia apelor de suprafa
i subterane constituie fondul hidrologic. Prin prelucrarea statistic a datelor din
fondul hidrologic se obin n principal parametri necesari pentru dimensionarea
lucrrilor hidrotehnice.


1.2. VARIABILE DETERMINISTE. VARIABILE ALEATOARE

ntruct baza teoretic a metodelor utilizate n statistica matematic o
constituie teoria probabilitilor, este necesar reamintirea unor noiuni de baz
din acest capitol al matematicii.
De la nceput trebuie fcut distincia ntre mrimile deterministe i cele
aleatoare. Dac un anumit fenomen depinde de un numr restrns de cauze
cunoscute (sau eventual influenele altor factori sunt nesemnificative i deci nu
mai are sens cercetarea lor), variabilele care definesc acest fenomen sunt de tip
determinist; caracteristic mrimilor deterministe este legtura direct ntre cauz
i efect (n sensul mecanicii newtoniene).
n alte cazuri ns, fenomenul studiat depinde de o multitudine de cauze,
principale sau secundare, eseniale sau neeseniale, de multe ori greu de
descifrat i de natur s imprime o mare variabilitate cazurilor singulare
(C. Moineagu .a., 1976); n aceste condiii, fenomenul este tratat independent

7
de cauzele care l produc, iar variabilele care l caracterizeaz capt un
pronunat caracter aleator.
ntr-un limbaj simplist, o variabil aleatoare este o mrime care, ca rezultat
al unui experiment, poate lua o valoare oarecare din domeniul su de definiie,
fr s se poat preciza dinainte care va fi aceast valoare. Realizarea unei
anumite valori a variabilei aleatoare are deci un caracter pur ntmpltor;
termenul sinonim de variabil stohastic evideniaz tocmai acest aspect (n
limba greac stohosis nseamn presupunere sau conjunctur). De exemplu, prin
aruncarea unui zar perfect omogen nu se poate anticipa care fa va fi deasupra
dup cdere. La fel nu se pot preciza dinainte debitele maxime anuale care se
vor realiza n viitor pe un curs de ap.
n hidrologie sunt utilizate att metode i modele deterministe, ct i metode
i modele probabilistice, alegerea unei abordri sau a celeilalte depinznd de
cantitatea de informaii disponibile sau de gradul de cunoatere a fenomenului
analizat. La transformarea precipitaiilor n componente ale scurgerii, se poate
admite de exemplu c distribuia acestora depinde numai de intensitatea ploii i
umiditatea solului, ignornd restul factorilor care au o influen mai redus. n
aceste condiii este posibil stabilirea unei legturi cauz-efect, de tip
determinist. n mod similar se petrec lucrurile i la evaluarea evapotranspiraiei
de la suprafaa apei, considerndu-se c aceasta depinde numai de viteza
vntului i deficitul de umiditate al aerului.
n schimb, dac se examineaz regimul debitelor maxime viitoare ale unui
ru - regim care depinde att de factori locali cum sunt cei fiziografici, ct i
generali, de tip climatic (i a cror evoluie nu este cunoscut) - o abordare de
tip determinist este imposibil de realizat, pentru evaluarea debitelor maxime
necesare proiectrii construciilor hidrotehnice utilizndu-se metode statistice.


1.3. CLASIFICAREA VARIABILELOR ALEATOARE

Variabilele aleatoare sunt de tip discret, atunci cnd iau o mulime finit sau
cel mult numrabil de valori (se reamintete c o mulime numrabil este
infinit, putnd fi pus n coresponden cu irul numerelor naturale care este
infinit). Variabilele aleatoare care pot lua doar un numr finit de valori se
numesc variabile simple i constituie un caz particular al variabilelor discrete;
acestea sunt de altfel utilizate n prelucrrile hidrologice.
Variabilele aleatoare sunt continue, atunci cnd mulimea valorilor lor este
nenumrabil; cu alte cuvinte o variabil aleatoare continu, poate lua orice
valoare n intervalul ei de variaie sau la limit ntre - i +.
Variabilele aleatoare mai pot fi clasificate n variabile dependente i
independente. Din punct de vedere intuitiv, dou sau mai multe variabile
aleatoare sunt independente dac probabilitatea producerii uneia nu depinde de

8
faptul dac celelalte s-au realizat sau nu. n caz contrar, variabilele vor fi
dependente.


1.4. POPULAIE STATISTIC. SELECIE

Prin populaie statistic se nelege orice colectivitate care face obiectul unui
studiu statistic. Deoarece scopul unui astfel de studiu l constituie stabilirea unei
legi cantitative referitor la colectivitatea analizat, populaia statistic poate fi
interpretat drept mulimea tuturor valorilor posibile ale unei variabile
aleatoare. Elementele componente ale unei populaii se numesc uniti ale
populaiei. Numrul N al unitilor unei populaii constituie volumul populaiei.
n funcie de volumul populaiei, se disting populaii finite (cu numr finit de
uniti) i populaii infinite (cu un numr nelimitat de uniti).
Cercetarea statistic a unei populaii se realizeaz urmrind o anumit
caracteristic a unitilor ce formeaz populaia respectiv. Cercetarea total
(a tuturor unitilor unei populaii) nu este ns nici posibil i nici necesar n
anumite cazuri; se recurge atunci la cercetarea unor eantioane sau selecii,
putndu-se trage concluzii referitoare la caracteristicile ntregii populaii.
n hidrologie, de exemplu, nu se dispune de ntrega gam de valori posibile
ale unor variabile aleatoare ca: debite, niveluri, precipitaii, temperaturi. Aceast
situaie se explic prin faptul c marea majoritate a staiilor hidrologice sau
posturilor hidrometrice au o durat de funcionare care de obicei nu depete
30-40 ani, singura excepie constituind-o la noi n ar Dunrea, pentru care se
dispune de nregistrri din anul 1838.
Cu alte cuvinte, n locul populaiei statistice se dispune de o mulime finit
de elemente observate : x
1
, x
2
,... x
n
, adic de o selecie sau eantion de volum n,
unde n este numrul elementelor observate. Ca urmare, n hidrologie se pune
problema de a determina o serie de caracteristici (debit cu o anumit
probabilitate de depire, valoare medie, abatere medie ptratic etc.) ale unei
populaii statistice, dei datele disponibile au un volum limitat n.
Mai mult dect att, dac s-ar considera o alt selecie, de asemenea de
volum n (dar referitoare la alt perioad de observaii), parametrii celor dou
selecii ar fi diferii, dei seleciile fac parte din aceeai populaie statistic.
Variaiile rezultate de la o selecie la alta se numesc fluctuaii de selecie.
Este evident c, cu ct numrul observaiilor (sau volumul seleciei) este mai
mare, cu att semnificaia rezultatelor obinute va fi mai ridicat.
n hidrologie se consider n mod obinuit c o selecie de volum n > 30
ofer o precizie suficient a calculului; atunci cnd volumul seleciei este prea
mic (n < 30), pentru a se elimina erorile la determinarea parametrilor statistici

9
vor trebui introduse anumite corecii (de exemplu pentru coeficientul de variaie
sau coeficientul de asimetrie).
Statistica matematic utilizeaz metode care permit obinerea unor
caracteristici ale unei populaii, numai prin cercetarea direct a unei pari nu
prea mari din unittile populaiei. O asemenea cercetare selectiv va conduce la
concluzii care au un anumit grad de incertitudine care nu trebuie pierdut din
vedere la valorificarea i interpretarea rezultatelor.
Pentru ca rezultatele obinute prin studierea unui eantion s reflecte ct mai
corect caracteristicile populaiei din care a fost selecionat, trebuie ndeplinite
urmtoarele condiii (C.Dinescu, V.Svulescu, 1978):
a) populaia din care se extrage selecia s fie ct mai omogen;
b) volumul seleciei s fie ct mai mare;
c) toate unitile care formeaz selecia s fie extrase la ntmplare din
populaia studiat;
d) fiecare unitate a populaiei s aib aceeai probabilitate de a face parte
din selecie.
n cazul hidrologiei, unele condiii nu sunt ndeplinite dect ntr-o msur
redus (de exemplu condiia b), n timp ce despre alte condiii nu se poate
afirma dac sunt sau nu ndeplinite (condiiile a, c i d).


1.5. FRECVEN ABSOLUT. FRECVEN RELATIV.
PROBABILITATE
Fie o selecie de volum n i x
1
, x
2
,..., x
n
valorile caracteristicii n ordinea
extragerii, msurate la cele n unitti ale eantionului.
De obicei, aceste valori se ordoneaz cresctor (sau eventual descresctor);
innd seama de faptul c unele valori pot fi egale, valorile discrete consecutive
vor fi notate acum prin x
1
, x
2
, ..., x
k
(k n). Trebuie menionat c valorile
corespunztoare indicilor din noua numerotare nu mai corespund cu cele din
vechea numerotare. Fie n
1
, n
2
, ..., n
k
numrul de apariii sau frecvenele absolute
ale fiecrei valori; deci valoarea x
1
se caracterizeaz prin frecvena absolut n
1
,
valoarea x
2
a variabilei prin frecvena absolut n
2
etc. Evident suma frecvenelor
absolute este egal cu volumul seleciei:

n n
i
i
k
=
=
1
. (1.1)

Raportnd frecvenele absolute la volumul seleciei (deci numrul cazurilor
favorabile, de apariie a unei valori, la numrul total de cazuri posibile) se obin
frecvene relative.

10
Frecvena relativ este prin urmare definit astfel:

f
n
n
i
i
= . (1.2)

Dac experimentul se repet, considernd un volum n al seleciei din ce n ce
mai mare, se constat c frecvenele relative f
i
tind s se stabilizeze; valorile
ctre care tind la limit frecvenele relative n condiiile n care fenomenul ar fi
supus n aceleai condiii unui numr nelimitat de probe, reprezint de fapt
probabilitile p
i
de realizare a valorilor x
i
(i = 1, 2, ..., k).
Aceast lege statistic poart denumirea de legea numerelor mari i permite
ca n practic probabilitile s fie aproximate prin frecvene relative; deci:

p
n
n
n
n
i
n
i
=

lim
i
. (1.3)

Cu alte cuvinte, frecvena relativ obinut dup un numr mare de
experimente, poate fi folosit pentru aprecierea probabilitilor de producere a
unui eveniment aleator.
Evident, p
n
n n
n
n
n
i
i
k
i
i
k
i
i
k
= = =
= = = =
1 1 1
1
1 adic suma probabilitilor este
unitar.
n continuare vor fi prezentate cteva situaii particulare interesante.
a) n cazul n care volumul seleciei nu este prea mare, se consider pentru
scopuri practice c probabilitile de apariie ale diverselor valori sunt egale
ntre ele, avnd valoarea 1/n.
Aceast situaie se ntlnete de altfel curent n prelucrarea datelor
hidrologice, mai precis a curbei probabilitilor de depire. Se pot da ca
exemple irul debitelor maxime sau minime anuale, al debitelor medii lunare, al
debitelor medii anuale, al precipitaiilor anuale, al evapotranspiraiei etc. n
toate aceste cazuri se dispune de regul de un numr de circa 20 ... 40 valori.
b) n cazul n care numrul n de msurtori este mare, se poate recurge la o
grupare a acestor valori pe intervale egale. Frecvena absolut n acest caz va
reprezenta numrul de apariii n cadrul fiecrui interval, iar probabilitatea
raportul dintre frecvena absolut a intervalului i numrul total de probe. n
hidrologie, acest procedeu este utilizat la construirea practic a graficului de
frecven al nivelurilor, plecnd de la hidrograful de nivel dintr-o seciune dat.
Pentru studiul acestor variabile, domeniul de variaie al caracteristicii
examinate (debit, nivel etc.) se mparte n intervale elementare, fiecare

11
coninnd un anumit numr de valori ale irului de date. Mrimea intervalului se
poate alege dup formula (V. Panaite, R. Munteanu, 1982):

d
x x
n
=

+
max min
, lg 1 3 222
; (1.4)

unde x
max
i x
min
sunt valorile extreme din selecia considerat, iar n este
volumul seleciei. Evident d se va rotunji prin lips sau adaus la numrul ntreg
cel mai apropiat.
n relaia anterioar, numitorul reprezint numrul total m al intervalelor de
grupare.
Pentru n > 100, numrul de intervale se poate calcula cu una din relaiile:

( )
m n =

4
1
4
1
1
5
, (1.5)

sau

m = n . (1.6)

n general, se consider (V. Panaite, R. Munteanu, 1982) c pentru n < 250
este suficient mprirea n 10 intervale; dac n < 25 gruparea valorilor nu se
mai aplic. Frecvenele obinute dup grupare se atribuie mijlocului fiecrui
interval, intervalul fiind considerat nchis la stnga i deschis la dreapta.


1.6. REPARTIII TEORETICE. REPARTIII EMPIRICE

Prin repartiia (funcia de probabilitate sau distribuia) unei variabile
aleatoare se nelege exprimarea legii ei probabilistice (adic a probabilitii cu
care variabila poate lua diverse valori din domeniul ei de variaie).
S-a artat c studiul unei colectiviti sau al unui fenomen de mas se
efectueaz n general folosind selecii de volum limitat. Din acest motiv,
rezultatele investigaiei statistice conin un anumit grad de incertitudine, care nu
poate fi eliminat dect prin cercetarea ntregii populaii statistice. Variabila
aleatoare corespunztoare studierii ntregii colectiviti se numete variabil
teoretic i este evident diferit de variabila empiric, corespunztoare seleciei
efectuate. Deci pe baza datelor obinute din msurtori se dispune de repartiia
variabilei empirice (numit i repartiie empiric) i care este mai mult sau mai
puin diferit de repartiia teoretic (necunoscut de altfel cu certitudine),
corespunztoare ntregii populaii (P. Meylan, A. Musy, 1996).

12




2. VARIABILE ALEATOARE DISCRETE


2.1. REPARTIIA UNEI VARIABILE ALEATOARE DISCRETE

Repartiia unei variabile aleatoare X de tip discret const n enumerarea
tuturor valorilor posibile ale variabilei, precum i a frecvenelor
(probabilitilor) corespunztoare; reprezentarea rezultatelor se face sub forma
unui tabel, numit tabloul repartiiei (tab. 2.1).

Tabelul 2.1

Valori x
i
x
1
x
2
... x
n
Frecvene f
i
f
1
f
2
... f
n

Se mai poate utiliza una din formele:

X
x x x
f f f
n
n
:
1 2
1 2
L
L

; ;
( )
X
x
f x
x
f
i
i
i
i
:

i = 1, n (2.1)

n cazul repartiiilor empirice, f
i
sunt valori numerice i reprezint frecvene
de apariie a valorilor x
i
.
Pentru variabilele teoretice de tip discret funcia de probabilitate se scrie sub
o form similar:

( ) ( )
X
x
ob X x
x
p
x
f x
i
i
i
i
i
i
:
Pr =

; (2.2)

n acest caz, probabilitile p
i
de realizare a valorilor x
i
au de regul
exprimri analitice (ex: repartiia Poisson, repartiia Bernoulli etc.).
Mrimile p
i
= Prob (X=x
i
) definesc probabilitile de realizare a evenimen-
telor elementare (X = x
i
); valorile lor sunt cuprinse n intervalul [0,1].

13
Deoarece evenimentele (X = x
i
) formeaz un sistem complet de evenimente
(reuniunea lor este evenimentul sigur) trebuie ca:

p
i
i
n
=

=
1
1 . (2.3)

Reprezentri similare ale repartiiei frecvenelor se utilizeaz i n cazul n
care se dispune de un numr mare de valori discrete ale variabilei i este
necesar gruparea lor. Alteori nregistrrile din msurtori sunt continue (de
exemplu cazul nivelurilor msurate cu un limnigraf), dar pentru prelucrare se
recurge la discretizare, adic la aproximarea funciei continue prin valori
punctuale. i n aceste situaii se impune gruparea valorilor pe intervale.
Tabloul repartiiei frecvenelor conine de regul pe lng intervalul de
discretizare, att frecvenele absolute, ct i pe cele relative.
Fie o variabil avnd pe a ca limit inferioar i pe b ca limit superioar a
valorilor; se mparte domeniul de variaie n m intervale egale i se noteaz
capetele intervalelor de discretizare prin:

x
1
= a + D, x
2
= a + 2D, ..., x
i
= a + iD, ...

unde D este mrimea intervalului. n acest caz tabloul repartiiei frecvenelor
va fi urmtorul:

Tabelul 2.2

Intervalul Frecvene absolute Frecvene relative
[a, x
1
)
[x
1
, x
2
)
[x
2
, x
3
)
...
[x
m-1
,x
m
)
n
1
n
2
n
3
...
n
m

f
1
f
2
f
3
...
f
m

n n
i
i
m
=
=
1
f
i
i
m
=
=
1
1



14
Din motive de alegere a unui numr ntreg de intervale de discretizare,
x
m
= a + m . D b, deci b sau coincide cu x
m
sau este situat ntre x
m-1
i x
m
.
Numrul de valori discrete ale variabilei s-a notat prin n.


2.1.1. EXEMPLE DE REPARTIII DISCRETE

Distribuia discret uniform. n cazul n care probabilitile elementare
p
i
=f(x
i
) sunt egale, distribuia se numete uniform.
Cel mai simplu exemplu de distribuie uniform este al variabilei aleatoare X
care reprezint numrul de puncte de pe faa superioar a unui zar dup
aruncare. Dezvoltat, funcia de probabilitate (repartiia) se poate scrie astfel:

X :
1 2 3 4 5 6
1
6
1
6
1
6
1
6
1
6
1
6

. (2.4)
iar condensat:

X :
x
i
1
6

; x
i
= 1, 2, ... , 6 . (2.5)

Probabilitile evenimentelor elementare au valorile p
i
= f (x
i
) = 1/6.
n mod similar, fie cazul unui ir de debite maxime anuale pentru o perioad
de 25 ani. Fiecare debit realizndu-se o singur dat n cei 25 ani, probabilitatea
sa de apariie se consider 1/25, iar repartiia variabilei aleatoare va fi:

Q
max.anual
:
Q
i
1
25

; i = 1, 2, ..., 25 . (2.6)

n acest caz, probabilitile elementare sunt p
i
= f(x
i
) = 1/25.
Distribuia Bernoulli (binomial). Repartiia binomial se aplic acelor
variabile care au doar dou stri posibile, dar complementare, adic realizarea
sau nerealizarea unui eveniment (zi ploioas - zi fr ploaie, plus-minus, zero-
mai mare dect zero etc.).
Pentru un numr infinit de ncercri, se noteaz cu p probabilitatea de
realizare a unui eveniment aleator i cu q = 1 - p nerealizarea sa. Atunci proba-

15
bilitatea de realizare a evenimentului aleator de ori n n experimente este dat
de termenul general al dezvoltrii binomului lui Newton:
( )
p q C p q C p q C p q C p q
n
n
n n o
n
n p
n
n
n
o o n o
+ = + + + + +
1 1 1
... ...

. (2.7)

n aceast formul
( )
C
n
n
n

!
! !
. Evident p i q fiind complementare,
p + q = 1.
Legea de repartiie va fi deci de forma:

X
n n
p C p q C p q C p q
n
n
n n
n
n
n
n
:
...
...


1 0
1 1 1 0 0 0


. (2.8)

Deoarece p + q = 1, din relaia (2.7) rezult c suma tuturor probabilitilor
va fi de asemenea egal cu 1.
Prima valoare p
n
reprezint probabilitatea ca variabila X s ia valoarea n,
adic evenimentul aleator s se realizeze n toate cele n experimente. Se observ
c pentru n mare, p
n
0 (p fiind subunitar), ceea ce era de ateptat. Termenul
general reprezint probabilitile evenimentelor elementare i
exprim valoarea probabilitii ca n cursul celor n experimente, evenimentul s
se realizeze de ori. Cele n experimente au fost presupuse independente, dup
modelul urnei lui Bernoulli.
C p q
n
n
Repartiia Poisson. Dac n repartiia Bernoulli, probabilitatea p de
realizare a evenimentului aleator tinde ctre zero (p 0, deci are valori infinit
mici), dar produsul np = este finit i destul de mic cnd n , se obine o
alt repartiie numit distribuia Poisson (sau legea evenimentelor rare, deoarece
p este foarte mic).
Se poate demonstra urmtoarea relaie:

( )
lim ;
!
n
p
n
n
n
C p q P
e


= =
0



; 0 , (2.9)

unde = np este numrul mediu de sosiri. Aceast formul definete repartiia
Poisson. Fiecrei valori ntregi = 0, 1, 2, ..., n, ..., i corespunde o
probabilitate P(; ), iar legea de repartiie este:

16
X
e e e e
:
... ...
!
...
!
...
0 1 2
2
2

(2.10)

Probabilitile elementare sunt:

( )
p f e

= =

!
(2.11)

Se observ c:

( )
P e e e


;
! ! =


= = = =
0 0 0
1 e , (2.12)

adic suma probabilitilor este egal cu 1.
Se reamintete c este numrul de realizri ale unui eveniment de
probabilitate foarte mic p, ntr-un mare numr de ncercri n.


2.1.2. REPREZENTAREA GRAFIC A REPARTIIILOR DISCRETE

Un rol important ntr-o prim examinare a variabilelor de selecie l joac
graficele care se pot ntocmi cu ajutorul lor (ele pot sugera tipul de repartiie
teoretic cel mai adecvat pentru aproximarea repartiiei empirice). Cele mai
uzuale reprezentri sunt urmtoarele:
Reprezentare sub form de batoane (fig. 2.1). Din dreptul fiecrei valori
de selecie x
i
(i = 1, 2, ..., n) se ridic o perpendicular (un baton) de lungime
egal cu frecvena relativ (probabilitatea) sau frecvena absolut
corespunztoare.


Fig. 2.1. Repartiia frecvenelor sub form de batoane i de poligon:
a - variabile discrete cu numr redus de valori; b - variabile discrete grupate.

17
Aceast modalitate de reprezentare se utilizeaz i n cazul repartiiilor
teoretice, iar batoanele vor fi proporionale cu mrimea probabilitilor de
realizare a diverselor valori ale variabilei.
Fie repartiia discret empiric:

X
x x x
f f f
n
n
:
...
...
1 2
1 2

(2.13)

Reprezentarea repartiiei sub form de batoane se poate urmri n figura 2.1.
n cazul variabilelor grupate, frecvenele absolute sau relative se vor
reprezenta de asemenea proporional cu valoarea lor, dar n mijlocul fiecrui
interval de grupare.
Poligonul frecvenelor (poligonul repartiiei probabilitilor). Fiecare
punct din reprezentarea sub form de batoane are coordonatele (x
i
, f
i
) n cazul
repartiiilor empirice i (x
i
, p
i
) n cazul repartiiilor teoretice discrete.
Unind aceste puncte se obine o reprezentare mai expresiv (fig. 2.1 - linia
ntrerupt) numit poligonul frecvenelor (n cazul repartiiilor empirice) sau
poligonul repartiiei probabilitilor (n cazul repartiiilor teoretice).
Tot ca o exemplificare a acestui mod de reprezentare se prezint poligonul
repartiiei probabilitilor n cazul distribuiei binomiale (repartiie teoretic)
pentru diferite valori ale lui n (fig. 2.2).



Fig. 2.2. Poligonul repartiiei probabilitilor pentru distribuia binomial.

18
Histograma (reprezentarea sub form de dreptunghiuri). Considernd c
fiecare valoare x
i
a variabilei discrete de selecie reprezint mijlocul bazei unui
dreptunghi de nlime n
i
sau f
i
se obine reprezentarea sub form de histogram.
Pentru a sesiza diferena ntre modul de reprezentare grafic utiliznd
poligonul frecvenelor, respectiv histograma, se va recurge la un exemplu din
domeniul hidrologiei. Fie irul precipitaiilor zilnice, nregistrate la o staie
meteo; numrul de zile consecutive n care precipitaiile depesc zilnic 10 mm
este prezentat n tabelul 2.3 (V.Al.Stnescu, 1985).

Tabelul 2.3

Numr zile 1 2 3 4 5 6 7
Numr cazuri 189 370 280 155 83 46 23

Plecnd de la tabelul 2.3 se poate defini o variabil aleatoare cu funcia de
probabilitate:

X:
, , , , , , ,
1 2 3 4 5 6 7
0 165 0 322 0 244 0 135 0 073 0 040 0 021

. (2.14)

Reprezentarea grafic se poate urmri n figura 2.3.


Fig. 2.3. Reprezentarea sub form de histogram (a) i poligon al frecvenelor (b)
pentru numrul zilelor consecutive cu precipitaii mai mari de 10 mm.

Reprezentarea sub form de histogram sau de poligon al frecvenelor
(probabilitilor) se folosete i n cazul unei variabile aleatoare continue, dar
discretizate pentru prelucrare; numrul de valori fiind de regul destul de mare,
se recurge la gruparea acestora pe intervale.

19
n reprezentarea grafic, fiecare interval constituie baza unui dreptunghi al
histogramei; unind mijloacele laturilor de sus ale acestor dreptunghiuri prin
segmente de dreapt, se obine poligonul repartiiei (absolute sau relative).
Fie, de exemplu, irul debitelor maxime anuale de pe Dunre pentru o
perioad de 129 ani. Tabloul repartiiei frecvenelor va fi urmtorul:

Tabelul 2.4

Intervalul Numr de apariii
(frecvene absolute)
Frecvene relative
[5.000 - 6.000) 2 1,55%
[6.000 - 7.000) 6 4,65%
[7.000 - 8.000) 18 13,95%
[8.000 - 9.000) 22 17,05%
[9.000 - 10.000) 24 18,61%
[10.000 - 11.000) 20 15,50%
[11.000 - 12.000) 13 10,80%
[12.000 - 13.000) 6 4,65%
[13.000 - 14.000) 11 8,53%
[14.000 - 15.000) 3 2,33%
[15.000 - 16.000) 4 3,10%
Total: 129 100,00%

Repartizarea sub form de histogram i poligon al frecvenelor se poate
urmri n figura 2.4.



Fig. 2.4. Histograma i poligonul repartiiei frecvenelor n cazul debitelor maxime
anuale ale Dunrii (dup gruparea valorilor pe intervale).

20
2.2. FUNCIA DE REPARTIIE A UNEI VARIABILE DISCRETE

Notaiile utilizate n continuare sunt cele de la repartiiile discrete teoretice;
consideraiile expuse sunt valabile i pentru repartiiile empirice (la care intervin
frecvene relative i nu probabiliti). Singura difereniere ntre cele dou
categorii de repartiii se va face la reprezentarea grafic, cnd se va utiliza
denumirea de poligon al frecvenelor sau al probabilitilor, dup cum este
cazul. n mod obinuit nu se insist prea mult asupra diferenelor de limbaj
referitoare la cele dou categorii de repartiii, avnd n vedere legea numerelor
mari (dei n hidrologie, n general nu se dispune de un numr suficient de mare
de msurtori).
O alt modalitate de a caracteriza repartiia unei variabile aleatoare discrete,
n afara celei prezentate n cadrul paragrafului 2.1 o constituie utilizarea funciei
de repartiie.
Fie variabila aleatoare X cu funcia de probabilitate:

X
x x x
p p p
n
n
:
...
...
1 2
1 2

. (2.15)

Se reamintete c valorile x
1
, x
2
, ..., x
n
sunt ordonate n ordine cresctoare:
x
1
< x
2
< ... < x
n
.
Prin definiie, funcia de repartiie F(x) reprezint probabilitatea ca variabila
aleatoare X s fie mai mic dect o valoare oarecare, particular x:

F(x) = Prob (X < x) . (2.16)

Cu alte cuvinte funcia de repartiie reprezint o probabilitate de nedepire.
Variabila aleatoare X va lua valori la stnga lui x, n intervalul [x
min
, x), cu o
probabilitate egal cu F(x).
Fie repartiia anterioar i o valoare oarecare x fixat ntre x
k
i x
k+1
.


x

X
x x x x x
p p p p p
k k n
k k n
:
... ...
... ...
1 2 1
1 2 1
+
+

(2.17)


21
Singurele valori pe care le poate lua X la stnga lui x sunt doar x
1
, x
2
, ..., x
k
,
variabila aleatoare fiind discret.
Deoarece evenimentele constnd n realizarea valorilor x
1
, x
2
, ..., x
k
, sunt
incompatibile dou cte dou, rezult c probabilitatea ca variabila aleatoare X
s fie mai mic dect valoarea fixat x poate fi calculat cu relaia:

( ) ( ) ( )
( ) ( )
Pr Pr Pr ...
... Pr Pr ...
ob X x ob X x ob X x
ob X x ob X x p p p
k i
x x
k
i
< = = + = +
+ = = =

= + + +
<
1 2
1 2
. (2.18)

Deci probabilitatea de nedepire a valorii x este egal cu suma
probabilitilor pentru acele valori ale variabilei care sunt mai mici dect x. Din
acest motiv funcia de repartiie se mai numete i funcia probabilitilor
cumulate sau funcia cumulativ a probabilitilor.


2.2.1. PROPRIETI ALE FUNCIEI DE REPARTIIE

Funcia de repartiie are urmtoarele proprieti:
a) Deoarece funcia F(x) reprezint o probabilitate, conform definiiei
probabilitilor va avea valori cuprinse ntre 0 i 1 (sau 0% i 100%):

0 F(x) 1 (2.19)

b) Fie o serie de poziii particulare ale lui x: x
I
, x
II
, x
III
etc., aceste valori fiind
situate ntre valorile discrete x
1
, x
2
, ..., x
n
.


x
I

x
II

x
III

x
IV

x
N

X
x x x x x
p p p p p
k n
k n
:
... ...
... ...
1 2 3
1 2 3

(2.20)

Examinnd tabloul (2.20) se constat urmtoarele:
F(x
I
) = Prob(X < x
I
) = 0 (deoarece la stnga lui x
I
nu se gsete nici o
valoare posibil a variabilei aleatoare X.

22
F(x
II
) = Prob(X < x
II
) = Prob(X = x
1
) = p
1
(deoarece singura valoare
posibil a variabilei, mai mic dect x
II
este x
1
).
n mod similar:

F(x
III
) = Prob(X < x
III
) = Prob(X = x
1
) + Prob(X = x
2
) = p
1
+p
2

F(x
IV
) = Prob(X < x
IV
) = Prob(X = x
1
) + Prob(X = x
2
) = p
1
+p
2


Att x
III
ct i x
IV
au la stnga aceleai dou valori posibile ale variabilei X (i
anume x
1
i x
2
) i ca urmare probabilitile lor de nedepire vor fi egale.
Se observ c: x
I
< x
II
F(x
I
) < F(x
II
);
n schimb pentru x
III
< x
IV
F(x
III
) = F(x
IV
);
Se poate deduce urmtoarea regul, care s nglobeze ambele situaii:

x
(i)
< x
(j)
F(x
(i)
) F(x
(j)
) (2.21)

adic funcia de repartiie este nedescresctoare.
c) Fie acum cazul n care x
I
= x
1
(deci x
I
nu mai este situat la stnga lui x
1
, ci
coincide chiar cu x
1
).
Conform definiiei: F(x
I
) = Prob(X < x
I
) = Prob(X < x
1
).
Dar aceast probabilitate este nul, pentru c la stnga lui x
1
variabila
aleatoare X nu mai poate lua nici o alt valoare.
Deci: F(x) = Prob(X < x) = 0, dac x = x
1
.
Aceeai valoare a lui F(x) se obine ns i pentru x ocupnd o poziie
oarecare la stnga lui x
1
. A rezultat c valoarea funciei F(x) la stnga punctului
x
1
este egal cu valoarea funciei n x
1
adic funcia F(x) este continu la stnga.
Simbolic acest lucru se va exprima astfel:

F(x - 0) = F(x) (2.22)

n momentul n care punctul x n deplasarea lui pe ax depete valoarea x
1

funcia de repartiie are un salt i F(x) = p
1
. Cu alte cuvinte, valoarea funciei la

23
dreapta punctului x
1
notat F(x
1
+ 0) difer de valoarea n punctul x
1
prezentnd
o discontinuitate; simbolic acest lucru se exprim astfel:

F(x + 0) F(x) (2.23)

Discontinuitile se vor manifesta la dreapta oricrui punct x
i
, ntre aceste
puncte funcia fiind continu i prezentndu-se sub forma de palier.
Mai trebuie artat c n ciuda faptului c variabila aleatoare X este discret,
funcia F(x) este definit pentru orice valoare a lui x.
d) Fie acum valoarea particular x
N
; se observ c toate valorile posibile ale
lui X sunt mai mici dect x
N
i deci:

F(x
N
) = Prob (X < x
N
) = Prob (X = x
1
) + Prob (X = x
2
) + ... + Prob (X = x
n
) =

= p
1
+ p
2
+ ... + p
n
= 1 . (2.24)

Deci F(x
N
) = 1 (unde x
N
este situat la dreapta celei mai mari valori posibile a
lui x).
De asemenea, F(x
I
) = 0 (unde x
I
este situat la stnga celei mai mici valori
posibile a lui x).
Aceste observaii pot fi sintetizate n urmtoarea regul: dac variabila
aleatoare poate lua valori doar n cadrul intervalului [a, b), probabilitatea de
nedepire este nul la stnga intervalului analizat i unitar la dreapta lui.

)
[
X a b F x
dac x a
dac x b
=

>

, ( )
,
,
0
1
(2.25)

Ca o consecin rezult: F(-) = 0 i F(+) = 1 (trebuie subliniat c aceste
relaii sunt valabile att n cazul n care domeniul de definiie al variabilei
aleatoare este ntreaga dreapt real, ct i n cazul n care este un interval mai
restrns).
Rezumnd proprietile prezentate pn n prezent, rezult c fiind dat o
variabil aleatoare discret cu repartiia (2.15):

X
x x x
p p p
n
n
:
...
...
1 2
1 2

,


24
funcia sa de repartiie are urmtoarele valori:


F x
dac x x
p dac x x x
p p dac x x x
p dac x x x
p dac x x x
dac x x
i
i
k
k k
i
i
n
n n
n
( ) =
<
<
+ <
<
<
< <

=
+
=

0
1
1
1 1
1 2 2 3
1
1
1
1
1
L L
L L

2
(2.26)

Acest mod de definire al funciei de repartiie rmne valabil i n cazul
gruprii valorilor pe intervale, fiecare interval [x
k
, x
k+1
) fiind caracterizat de
probabilitatea de realizare p
k
.
Funcia de repartiie poate fi scris i sub alt form (Gh. Mihoc .a., 1976).
Se noteaz prin S
x
= F(x+0) - F(x-0) saltul funciei n punctul x.
Dac S
x
= 0, x este un punct de continuitate al funciei F(x) (corespunde unui
palier), iar dac S
x
> 0, atunci x este un punct de discontinuitate (funcia are un
salt).
Funcia de repartiie poate fi deci definit ca suma salturilor din punctele x
i

situate la stnga punctului x:

F x S
x
x x
i
i
( ) =
<
, (2.27)

ntre punctele de discontinuitate, funcia fiind constant.



2.2.2. REPREZENTAREA GRAFIC A FUNCIEI DE REPARTIIE
PENTRU O VARIABIL DISCRET

Reprezentarea grafic a funciei de repartiie se face fie sub form de
diagram discontinu n trepte, fie sub form de poligon al frecvenelor
(probabilitilor) cumulate (fig. 2.5).

25




Fig. 2.5. Reprezentarea distribuiei i a funciei de repartiie pentru
variabila aleatoare (2.14): a - distribuia variabilei sub form de batoane;
b - idem, sub form de histogram; c - construcia diagramei n trepte;
d - obinerea poligonului frecvenelor cumulate.


Fie variabila aleatoare (2.14) reprezentnd numrul de zile consecutive cu
precipitaii superioare valorii de 10 mm (fig. 2.5,a i 2.5,b):


X:
, , , , , , ,
1 2 3 4 5 6 7
0 165 0 322 0 244 0 135 0 073 0 040 0 021

.


Funcia ei de repartiie va fi:


26
F x
x
x
x
x
x
x
x
x
( )
,
,
,
,
,
,
,
,
=

<
<
<
<
<
<
<

0 000 1
0 165 1 2
0 487 2 3
0 731 3 4
0 866 4 5
0 939 5 6
0 979 6 7
1 000 7
(2.28)

Diagrama n trepte (fig. 2.5,c) poate fi pus n coresponden cu repartiia
probabilitilor sub form de batoane. Funcia prezint salturi n dreptul fiecrui
baton (de valoare egal cu acesta) i este constant ntre batoane.
Reprezentarea sub form de poligon a funciei de repartiie (fig. 2.5,d) este
asociat n general cu histograma frecvenelor (probabilitilor) i se obine
construind n prealabil histograma valorilor cumulate, dup care se unesc
colurile din dreapta ale figurii astfel obinute.
Dup cum se observ din figura 2.5,d, valoarea funciei de repartiie F(x)
pentru o valoare x fixat (n reprezentarea sub form de poligon al frecvenelor
cumulate) reprezint acea parte a ariei histogramei situat la stnga lui x.
Fie de exemplu x = 2,2; din poligonul frecvenelor, rezult:

F( , ) ,
, ,
, ,
( , , ) , , , 2 2 0 165
2 2 1 5
2 2 1 5
0 487 0 165 0 165 0 2254 0 3904 = +

= + =

Aceeai valoare se obine calculnd aria histogramei de la stnga lui x = 2,2.
ntr-adevr, aria haurat (fig. 2.5,b) este egal cu:

(1,5 - 0,5) 0,165 + (2,2 - 1,5) 0,322 = 0,165 + 0,2254 = 0,3904

Poligonul frecvenelor cumulate se mai poate obine unind mijloacele
palierelor diagramei n trepte a funciei de repartiie (fig. 2.5,c).


2.2.3. PROBABILITATEA APARIIEI UNEI VARIABILE DISCRETE
NTR-UN ANUMIT INTERVAL

Pentru a calcula probabilitatea ca variabila aleatoare X s ia valori n
intervalul [a, b), domeniul de variaie va fi definit (fig. 2.6) ca diferen a unor
segmente cuprinse ntre (-, b), respectiv (-, a).

27



Fig. 2.6. Exprimarea segmentului [a, b) ca diferen a dou segmente
de lungime infinit.


Deci:

[a, b) = (-, b) - (-, a) . (2.29)

Mai departe se poate scrie:

Prob (a X < b) = Prob (X [a, b)) =


= Prob (X (-, b)) - Prob (X (-, a)) =


= Prob (X < b) - Prob (X < a) = F(b) - F(a) (2.30)


Acest rezultat se poate verifica de altfel i geometric (fig. 2.7).
Pentru exemplificare se consider: a = 2,5 i b = 5,5 i se calculeaz aria
histogramei cuprins ntre aceste valori:

Prob (2,5 X < 5,5) = Prob (2,5 X < 3,5) + Prob (3,5 X < 4,5) +


+ Prob (4,5 X < 5,5) = 0,244 + 0,135 + 0,073 = 0,452

Acelai rezultat se obine utiliznd graficul funciei F(x) sub form de
poligon al frecvenelor. ntr-adevr F(5,5) = 0,939, iar F(2,5) = 0,487, deci:

F(b) - F(a) = 0,939 - 0,487 = 0,452




28




Fig. 2.7. Interpretarea geometric a apartenenei variabilei
la intervalul [a, b).


Rezult c probabilitatea apartenenei la un anumit interval [a, b) se poate
obine fie prin calculul ariei histogramei cuprins ntre a i b, fie prin diferena
ordonatelor corespunztoare lui a i b din poligonul frecvenelor cumulate
(adic F(b) - F(a)).
n exemplul prezentat, s-a considerat c valorile x
i
(i = 1, 2, ..., 7) sunt
echidistante. Consideraiile expuse i modul de calcul rmn adevrate i n
cazul n care valorile variabilei sunt oarecare.
Fie acum cazul n care limita inferioar a = - , iar b este o valoare finit. n
acest caz se poate scrie:

Prob (- < X < ) = Prob (X < b) =F(b) - F(-) = F(b) - 0 = F(b) (2.31)


29
S-a ajuns la un rezultat cunoscut i anume c probabilitatea de nedepire a
unei valori oarecare este egal cu aria histogramei situat la stnga punctului
respectiv.
Fie acum cazul n care amndou limitele intervalului devin infinite:

a = - i b = +

Prob (- < X < ) = F(+) - F(-) = 1 - 0 = 1 (2.32)

i acest rezultat era de ateptat, ntruct probabilitatea ca variabila aleatoare
s ia o valoare oarecare n cadrul intervalului su de variaie este evident egal
cu 1 (sau 100%). Ca interpretare geometric rezult faptul c aria histogramei
calculat pe ntreg domeniul de variaie al variabilei este unitar.
Rezultatul obinut este n concordan i cu faptul c n cazul variabilei
aleatoare discrete X, care ia valorile x
1
, x
2
, ..., x
n
, cu probabilitile p
1
, p
2
, ..., p
n
,
suma probabilitilor este unitar.
Consideraiile expuse rmn valabile i n cazul n care domeniul de variaie
nu mai este ntreaga ax real, ci un interval mai restrns: [x
min
, x
max
); de fapt n
acest din urm caz, considernd intervalul de variaie al variabilei de la - la
+ se obine o problem echivalent, deoarece aria histogramei cuprins ntre
(-, x
min
) i [x
max
, +) este nul. Din acest motiv, pentru generalitate se va
considera ca limit inferioar a valorilor variabilei -, iar ca limit superioar a
acestora +.


2.2.4. REPREZENTAREA FUNCIEI DE REPARTIIE A UNEI
VARIABILE DISCRETE (SAU DISCRETIZATE) CU VALORILE
GRUPATE PE INTERVALE

Calculul funciei de repartiie, i reprezentrile grafice sunt similare ca n
cazul variabilelor aleatoare negrupate.
Pentru exemplificare se va considera (C. Diaconu, D. Lzrescu, 1977) cazul
debitelor medii anuale ale unui ru (tab. 2.5), la care valorile au fost grupate pe
intervale.



30

Tabelul 2.5

Intervalul
(m
3
/s)
Frecvene relative
(probabiliti)
30-40 4%
40-50 20%
50-60 24%
60-70 32%
70-80 12%
80-90 8%

Distribuia frecvenelor i funcia de repartiie a acestei variabile sunt
prezentate n relaiile (2.33), respectiv (2.34):


( ) ( )
)
[
)
[
)
[
)
[
)
[
)
[
f x ob X x
x
x
x
x
x
x
= = =

Pr
, ,
, ,
, ,
, ,
, ,
, ,
0 04 30 40
0 20 40 50
0 24 50 60
0 32 60 70
0 12 70 80
0 08 80 90
(2.33)


( ) ( )
F x ob X x
x
x
x
x
x
x
x
= < =

<
<
<
<
<
<

Pr
,
,
,
,
,
,
,
0 00 30
0 04 30 40
0 24 40 50
0 48 50 60
0 80 60 70
0 92 70 80
1 00 80
(2.34)

Palierele histogramei i ale reprezentrii funciei de repartiie sub form de
diagram cumulat a probabilitilor corespund acum intervalelor de grupare
(fig. 2.8); poligonul frecvenelor cumulate se obine unind punctele din partea
dreapt a palierelor diagramei n trepte.

31


Fig. 2.8. Reprezentarea grafic a funciei de repartiie sub form
de diagram n trepte i de poligon al frecvenelor cumulate.

Ca i n cazul variabilei discrete simple, valorile poligonului frecvenelor
cumulate pentru o valoare oarecare a lui x sunt egale cu ariile histogramei
situate la stnga lui x (mrimea intervalului de grupare x fiind considerat
unitar); de asemenea probabilitatea apartenenei la un anumit interval [a, b) se
obine ca diferen a valorilor F(b) i F(a), ceea ce reprezint n fond aria
histogramei cuprins ntre punctele de abscis a i b.


2.3. COMPLEMENTARA FUNCIEI DE REPARTIIE
(PROBABILITATEA DE DEPIRE)

S-a artat c funcia de repartiie F(x) reprezint probabilitatea de nedepire
a valorii x, cu alte cuvinte F(x) msoar probabilitatea ca variabila aleatoare X
s ia valori la stnga lui x. n multe cazuri, n hidrologie ns intereseaz
probabilitatea de depire a unei valori oarecare x. De exemplu, probabilitatea
de depire a unui nivel minim (care nc mai permite navigaia pe un ru)

32
constituie o msur a posibilitii de valorificare a rului respectiv drept cale de
navigaie. De asemenea, probabilitatea de depire a nivelului care nc mai
permite accesul la priza de ap a unui debit egal cu cerina unei folosine
reprezint gradul de asigurare cu ap al folosinei respective. Probabilitatea de
depire a cotei coronamentului unui dig de aprare mpotriva inundaiilor
constituie o msur a riscului de inundare, etc.
n loc de niveluri, n practic se folosesc n mod curent debite cu diverse
probabiliti de depire; aceasta nu schimb prea mult datele problemei, debitul
putnd fi exprimat n funcie de nivel prin intermediul cheii limnimetrice (sau
cheia debitelor).
Pentru calculul probabilitii de depire a unei valori oarecare x de ctre
variabila aleatoare X se poate pleca de exemplu de la relaia apartenenei la un
anumit interval:

Prob (a X < b) = F(b) - F(a) . (2.35)

Fie acum b = +. Se obine:

Prob (a X < +) = F(+) - F(a) = 1 - F(a) . (2.36)

Dar:

Prob (a X < +) = Prob (X a) (2.37)

sau:
Prob (X a) = 1 - F(a) (2.38)

n cazul general, se poate scrie:

Prob (X x) = 1 - F(x) (2.38')

Acelai rezultat se putea obine i prin raionamentul urmtor:

Prob (X < x) + Prob (X x) = Prob (- < X < +) = 1 ,


deci Prob (X x) = 1 - Prob (X < x) = 1 - F(x) . (2.39)

Deoarece Prob (X x) = 1 - F(x), aceast funcie se mai numete i funcie
de repartiie complementar. n continuare, pentru probabilitatea de depire a
valorii x se va utiliza att notaia 1 - F(x), ct i . F x
c
( )

33
2.3.1. INTERPRETAREA GEOMETRIC A PROBABILITII DE DEPIRE

Se reamintete c, pentru o valoare fixat x, mrimea funciei de repartiie
F(x) este egal cu aria histogramei situat la stnga lui x.
Avnd n vedere faptul c aria ntregii histograme este unitar, aria de la
dreapta lui x va fi egal cu 1 - F(x). Dar aceasta este chiar funcia de repartiie
complementar . Rezult c, probabilitatea de depire a valorii x
(probabilitatea ca variabila aleatoare X s ia valori mai mari sau egale cu x) este
egal cu aria histogramei situat la dreapta lui x (fig. 2.9).
F x
c
( )
La reprezentarea funciei de repartiie sub form de poligon, ordonata
cuprins ntre axa Ox i curba F(x) reprezint probabilitatea de nedepire a lui
x. Rezult c probabilitatea de depire a lui x, deci 1-F(x), va fi egal cu
segmentul complementar cuprins ntre curba F(x) i paralela la abscis dus prin
punctele de ordonat egal cu 1.





Fig. 2.9. Interpretarea geometric a probabilitii de depire.



34
2.3.2. REPREZENTAREA GRAFIC A PROBABILITII DE DEPIRE

Reprezentarea grafic se poate face ca i la funcia de repartiie fie sub form
de diagram n trepte, fie sub form de poligon al frecvenelor (probabilitilor)
cumulate. n mod obinuit, pentru scopuri hidrologice se prefer ultimul mod de
reprezentare.
Din interpretarea geometric a probabilitii de depire, rezult c aceasta
va avea valoarea maxim pentru cea mai mic valoare a lui x; ntr-adevr, dac
x = x
min
, atunci variabila X poate lua orice valoare din domeniul ei de variaie:
x
1
= x
min
, x
2
, ..., x
n
= x
max
i deci Prob(X x
min
) = 100%. Valorile
probabilitii de depire vor fi apoi din ce n ce mai mici pe msur ce numrul
x ales este mai mare.
n reprezentarea sub form de diagram n trepte, funcia este
constant sau descresctoare; poligonul frecvenelor se va reprezenta ca o
funcie descresctoare.
F x
c
( )



Fig. 2.10. Reprezentarea grafic a probabilitilor de depire
i nedepire pentru funcia de probabilitate (2.14).

n figura 2.10 sunt desenate comparativ att funcia de repartiie (2.28), ct i
funcia de repartiie complementar (cu linie plin) pentru variabila aleatoare
(2.14).
n figura 2.11 s-a procedat la reprezentarea grafic a probabilitilor de
depire i de nedepire n cazul repartiiei (2.33).

35
Valorile probabilitii de depire rezult fie din relaia = 1 - F(x), fie
prin calculul suprafeelor din histogram situate la dreapta valorilor particulare x
ale variabilei; la calculul suprafeelor se va avea n vedere c intervalul de
discretizare x este considerat de mrime unitar.
F x
c
( )



Fig. 2.11. Reprezentarea grafic a probabilitii de nedepire i depire
n cazul variabilelor grupate definite de repartiia (2.33).


2.3.3. RELAIA DE CALCUL A PROBABILITII DE DEPIRE

Se reamintete c pentru o variabil aleatoare discret cu repartiia 2.15:

X
x x x
p p p
n
n
:
...
...
1 2
1 2
< < <

,

36
probabilitatea de nedepire F(x) = Prob (X < x) este definit prin relaia
2.26:

( ) ( )
F x ob X x
x x
p x
p p x x x
p x x
p x
p x x
i
i
k
k k
i
i
n
n n
i
i
n
n
= < =
<
<
+ <
<
<
= <

=
+
=

=
Pr
0
1
1
1 1
1 2 2 3
1
1
1
1
1
1
L L
L L
x x
x
x x

< +
2
x
x
n

+
2


Dup cum se observ, valorile variabilei x
i
au fost ordonate cresctor:

x
1
< x
2
< ... < x
n
.

innd seama de relaia existent ntre probabilitatea de depire i
probabilitatea de nedepire F(x), rezult c F x este definit prin:
F x
c
( )
c
( )

( ) ( )
F x ob X x
x x
p x x
p x x
p p x x x
p x x
c
i
i
k
k k
i
i
n
n n
i
i
n
n
= =
<
<
<
= <
= < <

=
+
=

=
Pr
,
,
... ...
,
... ...
,
... ...
,
1
1
1
1
1 0
1
1 1
1
1
1
1
1
1
(2.40)

n general ns, n cazul n care se calculeaz probabilitatea de depire,
valorile variabilei aleatoare nu se mai ordoneaz cresctor, ci descresctor (de la
cea mai mare valoare a variabilei pn la cea mai mic).

37
Ca atare, se recurge la o operaie de renumerotare a valorilor variabilei, n
noua numerotare ele fiind notate tot prin x
1
, x
2
, ..., x
n
, dar fiind ordonate de data
aceasta descresctor (fig. 2.12).




Fig. 2.12. Renumerotarea variabilelor n vederea calculrii
probabilitilor de depire.

Probabilitatea de depire a variabilei aleatoare cu funcia de probabilitate:

X
x x x
p p p
n
n
:
...
...
1 2
1 2
> > >

(2.41)

va fi definit prin:

( ) ( )
F x ob X x
x x
p x
p p x x x
p x
p p x x x
p x
c
i
i
k
k
i n
i
n
n n
i
i
n
n
= =
<
<
+ <

<
=

<

= <

=
+
=

=
Pr
0
1
1
1
1 2
1 2 3 2
1
1
1
1
1
1
L L
L L
x x
x x
x
k

<
1
(2.42)

38
n cazul particular n care cele n valori ale variabilei au probabiliti egale de
realizare (i anume 1/n), probabilitatea de depire se va calcula cu relaia:

F x ob X x
x x
n
x x x
n
x x x
i
n
x x x
n
n
x x x
n
n
x x
c
i i
n n
n
( ) Pr ( ) = =
< <
<
<
<

<
<

0
1
2
1
1
2 1
3 2
1
1
L L
L L
(2.43)


2.3.4. CALCULUL PROBABILITII DE DEPIRE A VALORILOR x
i
N HIDROLOGIE

n practica hidrologic intereseaz de cele mai multe ori probabilitatea cu
care valorile discrete x
i
obinute din msurtori sunt egalate sau depite.
Considernd n relaia de calcul anterioar c x = x
i
se va obine:

F x
n
x x
n
x x
i
n
x x
n
n
x x
n
n
x x
c
i i
n
n
( ) =
=
=
=

=
=

1
2
1
1
2
1
L L
L L
(2.44)

Fie, deocamdat, exemplul banal al zarului perfect omogen, la care
probabilitile de apariie ale celor 6 fee sunt egale cu 1/6.
n figura 2.13 este construit att funcia de probabilitate elementar sub
form de histogram ct i histograma cumulativ a probabilitilor de depire.

39


Fig. 2.13. Funcia de probabilitate elementar i probabilitatea de depire
n cazul zarului cu 6 fee.

Avnd n vedere faptul c la reprezentarea sub form de poligon
probabilitile de depire sunt egale cu suma ariilor histogramei situate la
dreapta punctului curent, rezult c probabilitile de depire se vor afla
pe dreapta marcat cu linie continu n figura 2.13 (dreapta care unete colurile
din stnga ale histogramei cumulative).
F x
c
i
( )
Probabilitile de depire calculate cu relaia:

p
i
n
i
i
= =
6
(2.45)

(unde i este numrul de ordine din irul ordonat descresctor al celor 6 valori
posibile: x
1
= 6; x
2
= 5; ..; x
6
= 1) sunt majorate n mod artificial, ele situndu-
se pe linia ntrerupt, decalat fa de linia plin cu valoarea 1/12 (adic 1/2 din
probabilitatea de apariie a fiecrei valori).
n hidrologie, o problem frecvent ntlnit este aceea a determinrii
probabilitii de depire a debitelor maxime anuale; numrul n de valori de
care se dispune este n general cuprins ntre 20 ... 40. Se admite analog ca n
cazul zarului c cele n debite maxime anuale au probabiliti egale de apariie
(i anume 1/n).
Un aspect asupra cruia trebuie atras atenia este faptul c, n cazul zarului
perfect omogen probabilitatea de apariie a unei fee (egal cu 1/6), rezult n
urma unui numr extrem de mare de experimente (teoretic un numr infinit). n
cazul irului debitelor maxime anuale se admite de asemenea c valorile

40
acestora sunt egal probabile, dei fiecare valoare n sine nu s-a realizat dect o
singur dat.
Acest mod de evaluare a probabilitii de apariie a diverselor valori are la
baz definiia clasic a probabilitii (aproximat prin raportul dintre numrul
cazurilor favorabile i numrul total de cazuri posibile); fiecare valoare
realizndu-se o singur dat, probabilitatea ei de realizare este apreciat la 1/n.
Evident, acest mod de abordare constituie o aproximare, dar este singura
posibil n condiiile unei perioade de msurtori relativ reduse.
Calculul probabilitii de depire a debitelor maxime anuale cu relaia
(2.45) ar conduce urmnd un raionament similar ca n cazul zarului cu 6 fee la
o majorare artificial a valorilor p
i
egal cu 1/(2n).
Probabilitatea real de depire a valorilor respective este deci:

p
i
n n
i
n
i
= =
1
2
2 1
2
. (2.46)

Aceast relaie pentru calculul probabilitii de depire a fost de altfel
propus de Hazen nc din anul 1930.
Cea mai mic valoare a irului de date ordonat descresctor (deci valoarea cu
rangul i = n) are conform acestei relaii probabilitatea de depire:

p
n
n
n
=
2 1
2
. (2.47)

Tabelul 2.6

Formula Anul
p
i
= Prob (X x
i
)
Hazen 1930

2 1
2
i
n


Weibull 1939

i
n +1

Cegodaev 1955

i
n

+
0 3
0 4
,
,

Blum 1958

i
n

+
3 8
1 4
/
/

Tukey 1962

3 1
3 1
i
n

+

Gringorten 1963

i
n

+
0 44
0 12
,
,


41
Se observ c valoarea lui p
n
este diferit de 100%, cum s-ar fi
obinut pentru valoarea de rang n n cazul aplicrii relaiei necorectate de tip i/n.
Acest rezultat era de altfel de ateptat i din punct de vedere intuitiv. Cea mai
mic valoare nregistrat n perioada de msurtori x
n
nu este n mod obligatoriu
i cea mai mic valoare a populaiei statistice. Exist deci posibilitatea
nregistrrii n viitor i a unor valori mai mici; ca atare, probabilitatea de
depire a lui x
n
este mai mic de 100%, chiar dac este foarte apropiat de
aceast valoare. Diferena de la 100% pn la p
n
% reprezint riscul apariiei
unor valori inferioare lui x
n
.
n afar de formula lui Hazen, pentru evaluarea probabilitilor de depire
se mai utilizeaz i alte relaii (I.Vladimirescu, 1978), care au ca element comun
faptul c pentru i=n se obin probabiliti de depire subunitare (tab.2.6).
Dup cum s-a mai artat, n toate aceste relaii i reprezint numrul de ordine
al valorii x
i
din irul ordonat descresctor (x
1
> x
2
> ... > x
i
> ... > x
n
).
n hidrologie, pentru calculul probabilitii de depire se utilizeaz, n mod
curent, relaia Weibull:


p
i
n
i
=
+1
, (2.48)

n timp ce n gospodrirea apelor este preferat formula lui Cegodaev:

p
i
n
i
=

+
0 3
0 4
,
,
. (2.49)


2.4. MODUL DE REPREZENTARE A FUNCIILOR DE REPARTIIE
N HIDROLOGIE

n toate exemplele precedente variabila aleatoare X a fost considerat
variabil independent, iar probabilitatea reprezenta variabila dependent.
n hidrologie ns, de cele mai multe ori intereseaz determinarea valorii
variabilei care corespunde unei probabiliti prestabilite prin STAS-urile n
vigoare. De exemplu, n STAS 4068/2-82, sunt definite probabilitile de
depire ale debitelor de calcul i verificare ale construciilor hidrotehnice.
Probabilitatea capt deci caracter de variabil independent, iar mrimea

42
corespunztoare acestei probabiliti este variabila dependent, care trebuie
evaluat.
Ca urmare, se procedeaz la o rotire i rsturnare a tuturor reprezentrilor
uzuale n matematic, astfel nct abscisa s devin ordonat i ordonata
abscis.
Ca exemplificare, n figura 2.14, sunt desenate comparativ, n ambele
sisteme de reprezentare, o serie de grafice prezentate anterior. n hidrologie,
probabilitatea de nedepire intereseaz mai rar; ca urmare, pe graficele
hidrologice se reprezint numai curba probabilitilor de depire. Deoarece
variabila aleatoare notat n matematic prin X se reprezint acum pe ordonat,
n continuare pentru a nu crea confuzii ea se va identifica prin Y, iar valorile sale
particulare prin y.
Valoarea variabilei Y corespunztoare probabilitii de depire p% va fi
notat prin y
p
%



Fig. 2.14. Reprezentri ale repartiiei frecvenelor (a) i
ale funciilor de repartiie (b), utilizate n matematic i n hidrologie.

43
Fie din nou cazul zarului perfect omogen, pentru care probabilitile de
depire sunt calculate cu relaia (2.46); deoarece valorile variabilei sunt
echidistante i echiprobabile, probabilitile de depire se situeaz dup cum s-
a mai artat pe o dreapt. Cu totul altfel stau lucrurile n cazul valorilor
hidrologice. Fie de exemplu irul debitelor maxime anuale; debitele sunt
considerate tot echiprobabile, dar nu mai sunt echidistante. Ca urmare,
probabilitile lor de depire nu se vor situa pe o dreapt, ci pe o curb
(fig.2.15).



Fig. 2.15. Reprezentarea comparativ a probabilitilor de depire: a - valori
echidistante (cazul zarului); b - valori oarecare (cazul debitelor maxime anuale).

Aceast curb va avea gradieni diferii n zona central unde se nregistreaz
valori n mod frecvent, comparativ cu zona debitelor extreme (foarte mari sau
foarte mici) unde variabila ia mai rar valori. O reprezentare aproximativ a
alurii graficului probabilitilor de depire (n cazul zarului omogen i al
debitelor maxime anuale) se poate urmri n figura 2.15. Pentru ambele grafice,
probabilitile de depire au fost calculate conform celor artate anterior cu
relaia lui Hazen.
Aceeai alur a graficelor s-ar fi obinut i n cazul utilizrii formulei
Weibull (preferat n hidrologie, deoarece conduce pentru o probabilitate de
depire dat, la valori mai mari ale variabilelor aleatoare i deci la un calcul
mai acoperitor).
O exemplificare a modului de reprezentare a curbei probabilitilor de
depire n hidrologie n cazul valorilor grupate se poate urmri n figura 2.16 (a
se vedea comparativ cu fig. 2.8 i fig. 2.11).
Probabilitatea de depire a unei valori y oarecare, se obine prin calculul
suprafeei histogramei situat deasupra lui y (aria haurat); probabilitatea de
nedepire a valorii y este egal cu aria nehaurat.

44


Fig. 2.16. Reprezentarea hidrologic a probabilitilor de depire n cazul valorilor
grupate pentru repartiia (2.33).


2.4.1. SEMNIFICAIA PROBABILITII DE DEPIRE N HIDROLOGIE

n practic, pentru probabilitatea de depire se mai utilizeaz i denumirea
de asigurare, denumire care cel puin n anumite cazuri este nejustificat.
Noiunea de asigurare a fost preluat din gospodrirea apelor medii, domeniu
n care se pune problema livrrii apei la beneficiari, cu o probabilitate ridicat
(95%, 97% etc.). n aceste cazuri, probabilitatea reprezint ntr-adevr gradul de
asigurare cu ap al folosinei respective.
n hidrologie n schimb, intereseaz n special probabiliti de depire foarte
mici (5%, 1%, 0,1% etc.) n vederea dimensionrii la debitele corespunztoare a
unor lucrri hidrotehnice.
Fie de exemplu, debitul maxim anual cu probabilitatea de depire de 1%; n
acest caz 1% reprezint probabilitatea ca ntr-un an oarecare (deci n oricare an)
s se produc un debit mai mare sau egal cu Q
1%
. Considernd c s-au executat
lucrri de combatere a inundaiilor dimensionate la acest debit, gradul de
siguran al sistemului este de 99 %, iar 1% reprezint riscul anual de depire a
capacitii sistemului i care evident, nu poate fi interpretat ca asigurare
(el semnificnd de fapt o neasigurare).
Prin urmare, probabilitatea de depire p% capt semnificaia unui risc
anual R
1
de depire a valorii Q
p%
.
n aceste condiii, ncepe s prezinte interes riscul de depire a valorii Q
p%

ntr-o perioad de n ani, corespunztoare duratei de funcionare a lucrrii
hidrotehnice. Dac p% reprezint un risc anual, atunci 1 - p% semnific
sigurana sistemului n decurs de 1 an. n cazul n care realizarea valorii

45
debitului maxim dintr-un anumit an poate fi considerat independent de
valorile din ceilali ani, gradul de siguran dintr-un numr de n ani poate fi
apreciat cu relaia: (1 - p)
n
.
Rezult atunci c riscul hidrologic R
n
ca debitul Q
p%
s fie egalat sau depit
ntr-o perioad de n ani, are o valoare complementar siguranei sistemului
pentru acelai interval de timp:

R
n
= 1 - (1 - p)
n
. (2.50)

Cu ct n este mai mare, cu att R
n
tinde ctre 1 (sau 100%); deci ntr-o
perioad foarte mare riscul de a se produce debite superioare lui Q
p%
se apropie
de certitudine.
Fie, pentru exemplificare, cazul n care p = 1%, iar n = 100 (C. Prvulescu,
1978):

R
100
= 1 - (1 - 0,01)
100
= 1 - 0,37 = 0,63 = 63%

Cu alte cuvinte probabilitatea ca ntr-o sut de ani s se produc un debit
egal sau mai mare dect Q
1%
nu este de loc neglijabil (deci dimensionarea
evacuatorilor de ape mari, a ndiguirilor, etc. trebuie fcut foarte atent, ntruct
este posibil o solicitare a lucrrilor la acest debit). n acelai timp, riscul R
100

este nc departe de certitudine, ceea ce nseamn c n decurs de 100 de ani
este foarte posibil ca debitul Q
1%
sau debite superioare acestuia s nu se
produc niciodat.
De asemenea, pot exista intervale de 100 ani n care acest debit sau debite
superioare s se produc de dou, trei sau chiar de mai multe ori.
n figura 2.17 este reprezentat o situaie posibil a depirii sau egalrii
debitelor Q
1%
ntr-o perioad lung de timp. Ca medie, aceste debite se produc
o dat la 100 de ani, fr a exista ns nici o regularitate n realizarea lor (deci
dac debitul Q
1%
s-a nregistrat ntr-un anumit an, nu nseamn c el se va mai
realiza exact dup 100 de ani).



Fig. 2.17. Depirea sau egalarea valorilor Q
1%
n timp.


46
Perioada de repetare T, definit prin raportul:

T
p
=
1
%
(2.51)

trebuie neleas ca o valoare medie, caracteristic unei perioade foarte lungi de
timp (de ordinul miilor sau zecilor de mii de ani).
n practic, se utilizeaz pentru Q
1%
, Q
1
etc, n mod frecvent formularea:
debitul care apare o dat la 100 de ani, o dat la 1.000 de ani etc. Aceast
exprimare trebuie neleas cu rezerva expus anterior, de timp mediu de
repetare, calculat pe perioade lungi de ordinul timpului geologic. Mult mai
indicat este cealalt formulare de risc anual de depire de 1%, 1 etc.


47



3. VARIABILE ALEATOARE CONTINUE


3.1. DENSITATE DE REPARTIIE. FUNCIE DE REPARTIIE

Variabila aleatoare X fiind continu poate lua orice valoare din domeniul ei
de variaie. n mod obinuit n hidrologie acest interval este semiaxa [0, +)
sau chiar un interval mai restrns [a, b); pentru generalitate, n continuare se va
admite ca domeniu de variaie axa numerelor reale (-, +).
Acest domeniu este divizat n intervale infinitezimale de lungime dx.
Probabilitatea elementar ca variabila aleatoare X s ia valori n cadrul
intervalului [x, x + dx) este egal (fig. 3.1) cu produsul dintre lungimea
intervalului i valoarea funciei f (denumit densitate de probabilitate sau
densitate de repartiie) n punctul x:

Prob (X (x; x+dx)) = f(x) dx . (3.1)

Denumirea de densitate pentru funcia f(x) este preluat din fizic (prin
analogie cu densitatea (x) a unei bare neomogene).



Fig. 3.1. Densitatea de repartiie a unei variabile aleatoare continue.

Se reamintete c repartiia unei variabile discrete X, se reprezint simbolic
prin:

X
x
f x
i
:
( )

, (3.2)

48
unde f(x
i
) este probabilitatea elementar. n mod similar, n cazul variabilei
continue, la care probabilitatea elementar este dup cum s-a artat f(x)dx, ar
trebui utilizat notaia:

)
[
X
x x dx
f x dx
:
,
( )
+

. (3.3)

n practic ns se folosete reprezentarea simplificat:

X
x
f x
:
( )

, (3.4)

unde, aa cum s-a mai artat, f(x) definete o densitate de probabilitate:

)
[ ( )
f x
ob X x x x
x
x
( ) lim
Pr ,
=
+

0
. (3.5)

Cu alte cuvinte f(x) Prob(X = x), care este de altfel nul; raionnd chiar
intuitiv probabilitatea aferent unei valori punctuale (n condiiile n care
variabila poate lua o infinitate de astfel de valori) este zero:

Prob (X = x) = 0 . (3.6)

O repartiie continu poate fi privit i ca limit a unei repartiii discrete,
care ia un numr din ce n ce mai mare de valori (n final, o mulime de puterea
continuului). Ca urmare, toate consideraiile expuse la variabilele discrete se
pstreaz, cu mici diferene. Una dintre aceste diferene este faptul c semnul
sum se va nlocui prin operatorul de integrare.
De exemplu, suma probabilitilor elementare la variabilele discrete este
unitar:

p
i
i
n
=
=
1
1
. (3.7)

n cazul variabilelor continue relaia echivalent este urmtoarea:

f x dx ( )

= 1 . (3.8)

49
n mod similar se va defini funcia de repartiie F(x).
n cazul variabilei discrete probabilitatea de nedepire a valorii particulare x
rezult prin nsumarea probabilitilor aferente valorilor variabilei mai mici
dect x:

F x ob X x
i
x x
i
( ) Pr ( ) = =
<
. (3.9)

n cazul variabilei continue, semnul sum se transform n integral; limita
inferioar de integrare este x
min
sau pentru generalitate -, iar limita superioar
este evident valoarea particular x. Probabilitatea de nedepire n cazul unei
variabile aleatoare continue este prin definiie:

F x f x dx
x
( ) ( ) =

. (3.10)

Valoarea probabilitii de nedepire a lui x este egal deci cu aria densitii
de repartiie situat la stnga punctului x (fig. 3.2).



Fig. 3.2. Interpretarea geometric a probabilitii de nedepire.

n mod similar se poate obine probabilitatea apartenenei la un anumit
interval:

Prob (x
1
X < x
2
) = Prob (X (-, x
2
)) - Prob (X (-, x
1
)) =

= Prob (X < x
2
) - Prob (X < x
1
) = F(x
2
) - F(x
1
) . (3.11)

50
Dar:

Pr ( ) Pr ( ) ( ) ( ) ( ) ob X x ob X x f x dx f x dx f x dx
x x
x
x
< < =



=


2 1
2 1
1
2
. (3.12)

Rezult deci:

Pr ( ) ( ) ob x X x f x dx
x
x
1 2
1
2
< =

(3.13)

Cu alte cuvinte, probabilitatea apartenenei la un interval este egal cu aria
trapezului curbiliniu haurat pe graficul din figura 3.3; aceeai probabilitate se
poate obine i ca diferen a ordonatelor funciei de repartiie corespunztoare
absciselor x
2
, respectiv x
1
.



Fig. 3.3. Probabilitatea apartenenei la un anumit interval.

Dac intervalul [x
1
, x
2
) devine din ce n ce mai mic, fie el [x, x + x),
raportul:

F x x F x
x
( ) ( + )



reprezint valoarea tangentei (derivata) funciei de repartiie n punctul x.
Dar acest raport este chiar densitatea de repartiie f(x). ntr-adevr, din relaiile
(3.5), respectiv (3.11) rezult:


51
)
[ [ ]
f x
ob X x x x
x
F x x F x
x
F x
x x
( ) lim
Pr ,
lim
( ) ( )
'( ) =
+
=
+
=

0 0
. (3.14)

Cu alte cuvinte densitatea de repartiie f(x) este derivata funciei de repartiie
F(x) n punctul x. Acest lucru era, de altfel, de ateptat, operaiile de integrare i
derivare fiind operaii inverse.
n practic, aa cum s-a artat, intereseaz n mare msur pe lng
probabilitatea de nedepire i probabilitatea evenimentului contrar Prob(X x)
numit probabilitate de depire:

F x ob X x ob X x F x f x dx
f x dx f x dx f x dx f x dx f x dx
c
x
x
x x
( ) Pr ( ) Pr ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) .
= = < = =

=
=



=

+

=

+ +
1 1 1
(3.15)

n figura 3.4 se poate urmri reprezentarea grafic a celor 2 curbe; se observ
caracterul de complementaritate n raport cu valoarea 1 (sau 100%).



Fig. 3.4. Probabilitatea de nedepire i probabilitatea de depire.



Fig. 3.5. Interpretarea geometric a probabilitii de depire.

52
n timp ce probabilitatea de nedepire F(x) reprezint acea parte a ariei
densitii de repartiie situat la stnga punctului x, probabilitatea de depire
este egal cu valoarea ariei de la dreapta aceluiai punct x (fig. 3.5).


3.2. REPREZENTAREA GRAFIC A PROBABILITII DE DEPIRE
N HIDROLOGIE

Dup cum s-a mai artat, n hidrologie probabilitatea capt caracter de
variabil independent; ca urmare, se va proceda la o rsturnare i rotire a
reprezentrilor precedente n aa fel nct ordonata s devin abscis, iar abscisa
ordonat. Procednd n acest mod, graficul din figura 3.5 devine cel din figura 3.6.
Probabilitatea de depire a valorii y
p%
este egal cu aria haurat a densitii
de repartiie, iar probabilitatea de nedepire cu aria nehaurat.
Dup cum s-a mai artat, n hidrologie intereseaz n special probabilitatea
de depire; din acest motiv probabilitatea de nedepire nici nu a mai fost
reprezentat pe graficul din figura 3.6.
Cu ct valoarea y
p%
este mai mare, cu att aria cuprins ntre densitatea de
repartiie, ordonat i paralela dus prin y
p%
la abscis este mai mic (deci pro-
babilitatea de depire p% este mai redus).



Fig. 3.6. Reprezentarea curbei probabilitilor de depire n hidrologie.

De aici rezult c unei probabiliti de depire mai mici i vor corespunde
valori ale variabilei aleatoare mai mari. Deci, dac p
1%
< p
2%
atunci
y
p1%
> y
p2%
.

53
De exemplu, debitul cu probabilitatea de depire 1 % este mai mare dect
debitul cu probabilitatea de depire 10%, dar este mai mic dect valoarea
corespunztoare probabilitii de 0,1% etc. (fig. 3.7).



Fig. 3.7. Curba probabilitilor de depire a debitelor maxime anuale.


3.3. EXTRAPOLAREA REPARTIIILOR EMPIRICE
PRIN REPARTIII TEORETICE

La proiectarea unei lucrri hidrotehnice sunt necesare anumite mrimi
hidrologice (debite, niveluri etc.) caracterizate de probabiliti de depire care
nu se situeaz de obicei n domeniul valorilor msurate. Astfel, dac
msurtorile hidrologice sistematice au o durat de 20 de ani, utiliznd formula
i/(n+1), rezult c debitele msurate corespund unor probabiliti empirice de
depire cuprinse aproximativ ntre 5% i 95%; pentru 50 de ani de msurtori
domeniul probabilitilor empirice este cuprins ntre 2% i 98%.
De fapt acesta este cazul rurilor interioare din ar, unde msurtorile
hidrologice acoper n general o perioad de 20 - 40 ani. Dar la proiectarea sau
verificarea unor pri ale sistemelor hidrotehnice sunt necesare mrimi
(de ex.: debite) cu probabiliti de depire de 1% sau 0,1% etc. n aceste
condiii se recurge la prelungirea repartiiilor empirice prin repartiii teoretice
(fig. 3.8), care permit extrapolri n afara domeniului valorilor msurate.
Cu alte cuvinte, aproximnd repartiiile empirice prin repartiii teoretice este
posibil extinderea rezultatelor cercetrii unei selecii la ntreaga populaie, cu
un grad de siguran relativ ridicat; legitile statistice descifrate pe eantion
sunt considerate ca reprezentative pentru ntreaga populaie statistic.
Dup cum se tie, repartiiile teoretice caracterizeaz ntreaga populaie
statistic i sunt definite prin expresii analitice depinznd n general de 2-3
parametri. Repartiiile empirice sunt obinute n urma cercetrii unei selecii

54
(eantion) de volum redus i sunt definite prin mulimea cuplurilor {(x
i
, p
i
)},
unde p
i
este probabilitatea empiric de depire.



Fig. 3.8. Extrapolarea repartiiei empirice printr-o repartiie teoretic:
M - domeniul valorilor msurate; E - domeniul valorilor extrapolate.

Pentru unele cazuri particulare, funciile de repartiie teoretice sunt
cunoscute apriori. n mare majoritate a cazurilor ns, alegerea funciei de
repartiie teoretic este mai dificil; uneori dou sau trei funcii teoretice se
preteaz la fel de bine pentru aproximarea repartiiei empirice.
Selecionarea unei funcii de repartiie cu un numr mai mare sau mai mic de
parametri, constituie n fond o problem de optimizare, avnd de ales ntre
flexibilitatea funciei i gradul de siguran al parametrilor estimai. Astfel, dac
numrul de parametri este mai mare (3-4, de ex.), erorile de calcul la aprecierea
lor sunt mai mari i deci sunt mai puin precis determinai; invers, la un numr
mic de parametri, precizia evalurii acestora este ridicat, dar funcia teoretic
este prea puin flexibil i deci aproximarea repartiiei empirice va fi grosolan.
Adevrata funcie de repartiie a populaiei statistice este, de altfel, greu de
obinut; astfel, dac dintr-o populaie statistic se realizeaz o selecie de volum
n i se determin funcia de repartiie, aceasta poate s difere de funcia gsit
pentru alt selecie de acelai volum i, de asemenea, ambele pot s difere de
funcia de repartiie a populaiei statistice.
n principiu, n cazul setului de date hidrologice nregistrate, trebuie propuse
mai multe funcii teoretice pentru aproximarea distribuiei empirice; dup
determinarea parametrilor acestor funcii, pe baza testelor de verificare a
ipotezelor statistice, se reine o singur funcie teoretic. Calitatea aproximrii
repartiiei empirice prin repartiia teoretic va depinde de mrimea eantionului,

55
alegerea adecvat a funciei i utilizarea celor mai corespunztoare metode de
estimare a parametrilor.
n practica hidrologic acest proces de cutare a celei mai adecvate repartiii
teoretice nu mai are loc, admindu-se c distribuia mrimilor analizate
urmeaz o lege de tip Gama (cu 2 sau 3 parametri) sau o lege logaritmic
normal.
Experiena a artat de fapt c aceste funcii se preteaz foarte bine pentru
analiza fenomenelor hidrologice din Romnia.
Estimarea variabilelor (parametrilor) care intervin n funciile de repartiie
teoretice are la baz prelucrarea informaiilor coninute n irul de date msurat.
Plecnd de la valorile nregistrate se calculeaz o serie de valori tipice
(caracteristice) ale variabilelor de selecie cum sunt: valoarea medie, dispersia,
abaterea medie ptratic etc. Se consider apoi c aceste valori tipice sau
parametri ai repartiiei empirice sunt n acelai timp i parametrii repartiiei
teoretice, utilizate pentru ajustarea i extrapolarea repartiiei empirice (cu alte
cuvinte parametrii populaiei statistice sunt estimai pe baza seleciei de care se
dispune prin msurtori); evident acest procedeu reprezint o aproximaie, care
constituie o surs de erori a calculului statistic.





56




4. VALORI TIPICE ALE VARIABILELOR ALEATOARE

Variabilele aleatoare sunt complet caracterizate prin densitatea de repartiie
sau funcia de repartiie.
De multe ori, n practic este necesar o definire mai sumar a variabilelor
aleatoare analizate; n acest scop se utilizeaz anumite valori caracteristice
ataate variabilelor aleatoare i care pot fi grupate n parametri ai tendinei
centrale, ai variabilitii i ai formei.


4.1. PARAMETRI AI TENDINEI CENTRALE

Aceti parametri definesc zona de grupare a celor mai frecvente valori.
Valoarea medie. Fie o variabil aleatoare discret X, definit prin
distribuia:

X
x x x
p p p
n
n
:
...
...
1 2
1 2

. (4.1)

n aceast caz valoarea medie a variabilei X, notat prin M(X), m sau este
prin definiie egal cu:

M X x p
i i
i
n
( ) =
=1
. (4.2)

Dac cele n valori sunt echiprobabile (p
i
= 1/n), atunci se obine cunoscuta
relaie a mediei aritmetice (denumit i medie de selecie):

M X
n
x
n
x
i
i
n
i
i
n
( ) =

=

= =
1 1
1 1
. (4.3)

Media de selecie va fi notat n continuare prin x pentru a o deosebi de
media m a populaiei. Se poate demonstra c valoarea x poate fi considerat
drept indicator de estimare a mediei m a ntregii populaii; acest procedeu de
estimare are o deplin justificare teoretic i este utilizat n practic, chiar i
pentru valori ale lui n < 30. Estimarea mediei pe baza acestei relaii este cea mai

57
bun, n sensul c dispersia ei este mai mic dect cea care se poate obine cu
ajutorul oricrui alt procedeu de estimare a mediei. Totui, dac spaiul de
selecie este redus, apariia din ntmplare a unor valori foarte mari sau foarte
mici poate influena media aritmetic.
Pentru numeroase mrimi hidrologice, densitatea de repartiie a valorilor
nregistrate este asimetric; prin logaritmare se obin distribuii simetrice, iar media
aritmetic a acestor valori poate fi utilizat ca parametru al tendinei centrale.
Se poate scrie:

log log ... log log( ... )
log( ... ) log .
/
x x x
n
x x x
n
x x x X
n n
n
n
g
1 2 1 2
1 2
1
+ + +
=

=
= =
(4.4)

Mrimea X
g
= (x
1
. x
2
. ... . x
n
)
1/n
se numete medie geometric. Prin
calculul mediei geometrice i logaritmarea ei se obine destul de comod media
aritmetic a logaritmilor valorilor x
i
ale variabilei aleatoare.
n cazul n care variabila aleatoare este continu, suma din expresia (4.2) se
transform n integral, iar probabilitile p
i
se nlocuiesc prin probabilitile
elementare f(x)dx. Deci, n cazul unei variabile aleatoare continue, valoare
medie este prin definiie:

M X x f x dx ( ) ( ) =

+
. (4.5)

Ca interpretare geometric (M. Mihil, 1965), valoarea medie reprezint
abscisa centrului de greutate al ariei delimitate de graficul distribuiei
probabilitilor i abscis (fig. 4.1).



Fig. 4.1. Interpretarea geometric a valorii medii a unei variabile aleatoare:
a - variabil discret; b - variabil continu.

58
Mediana. Mediana M
e
reprezint valoarea central a unei repartiii
statistice.
Cu alte cuvinte, probabilitatea ca variabila aleatoare X s ia valori mai mici
dect M
e
este egal cu probabilitatea ca X s ia valori mai mari dect M
e
.
Avnd n vedere faptul c:

F(M
e
) + F
c
(M
e
) = 1 (4.6)

i c:

F(M
e
) = F
c
(M
e
) , (4.7)

rezult:

Prob (X < M
e
) = Prob (X M
e
) = 0,5 . (4.8)

Fie, pentru nceput, cazul unei variabile discrete, avnd valorile ordonate
cresctor sau descresctor.
Dac repartiia are 2k+1 valori, mediana este valoarea avnd rangul k+1.
Dac repartiia are 2k valori, mediana este ntre valorile de rangul k i k+1, i n
general se obine ca medie aritmetic a celor dou valori. Reprezentnd
probabilitile empirice de depire i nedepire, mediana este situat la
intersecia celor dou grafice.
n cazul unei variabile aleatoare continue, mediana reprezint abscisa acelui
punct de pe curba densitii de repartiie, a crui ordonat mparte suprafaa
cuprins ntre curb i axa x n dou suprafee egale.
Interpretarea geometric a medianei se poate urmri n figura 4.2.



Fig. 4.2. Interpretarea geometric a medianei: a - variabil discret;
b - variabil continu.

59
Modul. Modul M
o
sau valoarea dominant reprezint acea valoare a
variabilei care corespunde frecvenei celei mai mari.
Pentru o variabil aleatoare de tip discret, avnd valorile x
i
ordonate,
cresctor sau descresctor, caracterizate de probabilitile empirice p
i
, punctul
x
m
se numete mod dac este satisfcut relaia:

p
m
> p
i
; i m . (4.9)

Cu alte cuvinte, probabilitatea de realizare a valorii x
i
este mai mare dect
probabilitatea aferent oricrei alte valori a variabilei.
Pentru o variabil continu se numete mod orice punct de maxim al
densitii de repartiie (deci pentru care
df
dx
= 0 i
d f
dx
2
2
0 < ).
Densitatea de repartiie f(x) se numete unimodal, bimodal sau
multimodal, dup cum admite unul, dou sau mai multe moduri.
n cazul unei repartiii unimodale simetrice, media aritmetic, mediana i
modul sunt identice; pentru o repartiie uor asimetric i unimodal, mediana
se gsete ntre medie i mod, distana sa fa de mod fiind aproximativ, dublul
distanei sale fa de media aritmetic (fig. 4.3).



Fig. 4.3. Poziia relativ a mediei aritmetice,
medianei i modului.

Momente de ordin superior. n cazul unei variabile aleatoare discrete,
momentul de ordinul r este prin definiie:

M x
r i
r
i
n
i
=
=1
p , (4.10)

60
unde, prin p
i
s-au notat probabilitile de apariie a valorilor x
i
.
Dac valorile x
i
sunt echiprobabile p
n
i
=

1
, rezult:

M
n
x
r
r
i
n
=

=
1
1
i
. (4.11)

Pentru r = 1, se obine chiar expresia mediei aritmetice (media de selecie):

M x
n
x
i
i
n
1
1
1
= =
=
. (4.3')

n cazul unei variabile aleatoare continue definite prin densitatea de
repartiie f(x), momentul de ordinul r se calculeaz cu expresia:

M x f x
r
r
=

+
( )dx
x
. (4.12)

i n acest caz, pentru r = 1 se obine valoare medie a variabilei:

M m x f x d
1
= =

+
( ) . (4.5')

Denumirea de moment este mprumutat din mecanic: probabilitile
elementare joac rolul forelor al cror moment se calculeaz, iar valorile x
i
ale
variabilei reprezint braul forei. Conform definiiei, momentul se calculeaz n
raport cu originea axelor de coordonate. Un interes special l prezint
momentele centrate, care se calculeaz n raport cu valoarea medie a variabilei.
Deoarece momentele centrate de ordin superior intervin n calculul unor
parametri ai variabilitii i formei, ele vor fi definite dup prezentarea acestor
parametri.


4.2. PARAMETRI AI VARIABILITII

Valorile tipice prezentate anterior caracterizeaz poziia centrului de grupare,
aceste mrimi nefurniznd nici un fel de informaii privind gradul de dispersare
al valorilor pe care le poate lua variabila aleatoare fa de valoarea central.

61
S-au imaginat mai muli parametri pentru msurarea dispersiei, bazai n general
pe noiunea de abatere:
Amplitudinea sau extinderea repartiiei reprezint abaterea dintre cea
mai mare valoare observat x
max
i cea mai mic x
min
:

a = x
max
- x
min
. (4.6)

Este cel mai simplu parametru din aceast categorie, dar i cel mai
aproximativ.
Abaterea medie reprezint media abaterilor n valoare absolut dintre
valorile curente i media aritmetic x :

e
x x
n
M
i
i
n
=

=1
. (4.7)

Cu acest parametru nu se pot efectua ns calcule algebrice.
Dispersia sau variana. Un alt mod de a evidenia valorile absolute ale
abaterii fa de medie const n definirea dispersiei variabilei aleatoare.
Dispersia se calculeaz cu expresia:

D x m
i
i
n
2 2 2
1
= =
=
( ) p
i
x dx
, (4.8)

n cazul variabilelor aleatoare discrete i cu:

D x m f
2 2 2
= =

+
( ) ( ) , (4.9)

pentru variabilele continue.
n cazul unei selecii de volum limitat, pentru dispersie n loc de
2

(rezervat pentru populaia statistic) se va utiliza notaia s
2
(care reprezint, de
fapt, un indicator de estimare al dispersiei populaiei analizate).
n cazul unei selecii de volum n > 30 40, admind c valorile x
i
ale
variabilei sunt egal probabile, pentru calculul dispersiei se poate utiliza relaia:

s x x p
n
x x
i
i
n
i i
i
n
2
1
2
1
1
= =
= =
( ) (
2
) , (4.10)

unde x este media de selecie (media aritmetic a valorilor nregistrate).

62
Dac numrul de valori n < 30, dispersia se poate estima cu ajutorul relaiei:

s
n
x x
i
i
n
2
1
1
1
=

=
(
2
) . (4.11)

Pentru a exemplifica modul n care dispersia reflect gradul de mprtiere al
valorilor variabilei, n figura 4.4, s-au considerat dou densiti de repartiie
continue i simetrice, avnd aceeai valoare medie.



Fig. 4.4. Caracterizarea mprtierii valorilor variabilei prin intermediul dispersiei.

Este evident c la repartiia f
2
(x) punctele mai deprtate de valoarea medie m,
dein o pondere mai mare dect n cazul repartiiei f
1
(x) i deci
(dispersia valorilor celei de-a doua repartiii este mai mare dect dispersia
asociat primei repartiii). Este de remarcat faptul c dispersia accentueaz
efectul abaterilor mari, acestea intervenind n formula de definiie la puterea a
doua.
s s
2
2
1
2
>
Abaterea medie ptratic (abaterea standard). Dispersia prezint
dezavantajul c se exprim n unitile de msur ale variabilei ridicate la ptrat.
Pentru a elimina acest neajuns s-a introdus un alt indicator i anume abaterea
medie ptratic, definit ca radicalul de ordinul doi al dispersiei:

=
2
(pentru populaii statistice) (4.12)

sau:

s s =
2
(pentru selecii) . (4.12')

Avnd n vedere numrul n general redus al valorilor hidrologice din
msurtori (selecii cu n < 30), pentru calculul abaterii medii ptratice se
utilizeaz relaia:

63
s
x x
n
i
i
n
=

=
( )
2
1
1
. (4.13)

Coeficientul de variaie. Pentru a elimina complet influena unitilor de
msur ale variabilei, s-a introdus un parametru de dispersie relativ, definit ca
raportul dintre abaterea medie ptratic i media aritmetic:

C
m
v
=

, respectiv C
s
x
v
= , (4.14)

dup cum este vorba de populaia statistic sau de o selecie.
Rezult c acest coeficient de variaie are aceeai semnificaie ca i dispersia
sau abaterea medie ptratic: cu ct coeficientul de variaie C
v
este mai mare, cu
att valorile variabilei aleatoare au o mprtiere mai mare (sau ceea ce este
acelai lucru, au un domeniu de variaie mai larg).
n cazul unei selecii de volum limitat n, coeficientul de variaie se
calculeaz cu formula:

C
x
x x
n
x x
n x
n
x x
x n
x
x
v
i
i
n
i
i
n
i
i
n
i
i
n
=

=
=


= =
= =
1
1 1
1
1
1
1
1
2
1
2
1
2
2
1
2
1
( ) ( )
( )
. (4.15)

Notnd cu:

k
x
x
i
i
= , (4.16)

relaia de calcul devine:

C
k
n
v
i
i
n
=

=
( ) 1
1
2
1
. (4.17)

Coeficientul de variaie este cuprins de regul ntre zero i doi, avnd o
valoare medie de 0,5.

64
Valoarea coeficientului de variaie exercit o influen direct asupra
dimensiunilor lucrrilor de gospodrire a apelor; pentru ruri cu variabilitate
mare a debitelor (deci cu C
v
mare) sunt necesare volume mai mari de lacuri de
acumulare pentru a putea realiza acelai grad de regularizare a debitelor cursului
de ap respectiv.
Momente centrate. La momentele de ordin superior s-a artat c acestea
sunt calculate n raport cu originea axelor de coordonate. Efectund calculul
momentelor fa de valoarea medie a variabilei se obin aa numitele momente
centrate.
Momentul centrat de ordinul r este prin definiie:

m x m
r i
r
i
i
n
=
=
( )
1
p
dx
(pentru variabile discrete) (4.18)

i:

m x m f x
r i
r
=

+
( ) ( ) (pentru variabile continue) (4.19)

Momentele de ordin par au valori pozitive, n timp ce momentele de ordin
impar pot fi pozitive sau negative.
n cazul unei selecii, la care toate valorile variabilei sunt echiprobabile,
momentul centrat de ordinul r se calculeaz cu relaia:

m
n
x x
r i
r
i
n
=

=
1
1
( ) . (4.20)

Particulariznd expresia lui m
r
pentru r = 1, se obine:

( )
( )
m
n
x x
n
x x
n
x
n
x x x
n
x
n x
n
x x
i
i
n
i
i
n
i
n
i
i
n
i
i
n
1
1 1 1
1 1
1 1
1 1 1
0
=

=
=

+ + + =

= =
= = =
= =
...
. (4.21)

Deci momentul centrat de ordinul 1 (valoarea medie a abaterilor fa de
medie) este nul.

65
Momentul centrat de ordinul 2 este chiar dispersia variabilei aleatoare;
ntr-adevr:

( )
m
n
x x s
i
i
n
2
2
1
2
1
= =
=
. (4.22)

n acelai timp, abaterea medie ptratic este radicalul momentului centrat de
ordinul 2:

s m =
2
, (4.23)

iar coeficientul de variaie C
v
este:

C
s
x
m
M
v
= =
2
1
, (4.24)

unde M
1
este media aritmetic sau momentul de ordinul unu al variabilei.
Momentul centrat de ordinul 2 (sau dispersia) poate fi calculat numai n
funcie de momentele centrate de ordinul unu i doi:

( )
m
n
x x
n
x x
n
x
n
x
i
i
n
i
i
n
i
i
n
i
n
2
2
1
2
1 1
2
1
1 1
2
1 1
=

=



+

= = = =
(4.25)

Dar:

1
1 n
x
i
i
n
=

= x , (4.26)

iar:

1
2
1
2
2
n
x
nx
n
x
i
n
=

= = . (4.27)

Se obine deci:

m
n
x x x
n
x x
i
i
n
i
i
n
2
2
1
2 2 2
1
2
1
2
1
=

+ =


= =
. (4.28)

Deoarece:

66
1
2
1
2
n
x M
i
i
n
=

= , (4.29)

x M
2
1
2
= , (4.30)

rezult:
m s M M
2
2
2
2
= =
1
. (4.31)

Aceast relaie este deosebit de util pentru calculul dispersiei (respectiv al
abaterii medii ptratice i al coeficientului de variaie), ntruct micoreaz mult
volumul de calcule. n practica hidrologic aceast relaie este mai puin
utilizat, preferndu-se relaia de definiie:

( )
m s
n
x x
i
i
n
2
2
2
1
1
= =

=
.

n mod similar, se poate arta c momentul centrat de ordinul 3 se poate
calcula cu relaia:
m M M M M
3 3 2 1
3
3 2 = +
1
. (4.32)

i n acest caz, n hidrologie este preferat relaia de definiie a momentelor
de ordinul 3, dei calculele sunt mai laborioase.
Pentru a ine cont de numrul limitat de valori disponibile din nregistrri
(selecii de volum redus), n expresia momentului centrat de ordinul 2 sau 3,
numitorul nu va avea valoarea n, ci n - 1.
n final, mai trebuie artat cu ct ordinul r al momentului centrat m
r
este mai
mare, cu att apariia din ntmplare n cadrul seleciei a unor valori foarte mari
sau foarte mici (deci care se abat mult de la medie) va influena n mai mare
msur valoarea momentului. Rezult c cu ct r este mai mare, cu att
parametrii statistici ai seleciei difer mai mult de parametrii populaiei
analizate.


4.3. PARAMETRI AI FORMEI

Dac valorile variabilei sunt egal dispersate de o parte i de alta a valorii
centrale, variabila aleatoare are o repartiie simetric; n caz contrar repartiia
este asimetric.
Pentru o repartiie simetric media, mediana i modul coincid, iar valorile
densitii de repartiie sunt egale n raport cu valoarea medie:

67

f(m - x) = f(m + x) . (4.33)

Singurul indicator utilizat n hidrologie pentru caracterizarea formei este
coeficientul de asimetrie, notat prin C
s
.
Prin definiie:

C
m
s
=
3
3

, (4.34)

unde m
3
este momentul centrat de ordinul 3, iar este abaterea medie
ptratic.
n cazul unei variabile aleatoare de selecie coeficientul de asimetrie se
calculeaz cu relaia:

( ) ( )
( )
C
n
x x
s n
x x
x C
n
x x
x C n
x
x C
s i
i
n
i
i
n
v
i
i
n
v
i
i
n
v
= =

=
=


= =
= =
1 1 1 1
1 1 1
1
1
3
1
3
3
1
3
3
1
3
3
1
3
. (4.35)

Notnd, ca i la calculul coeficientului de variaie, raportul
x
x
i
prin k
i
, relaia
devine:

( )
C
k
nC
s
i
i
n
v
=

=
1
3
1
3
. (4.36)

n cazul n care n < 30, n relaia (4.36) la numitor n va fi nlocuit prin n-1.
Coeficientul de asimetrie este nul n cazul unei repartiii simetrice, deoarece
ponderea punctelor din stnga valorii medii este egal cu ponderea celor din
dreapta, semnele fiind ns contrare (fig.4.5).


68


Fig. 4.5. Alura densitii de repartiie pentru valori ale lui C
s
pozitive,
nule sau negative (variabile aleatoare continue).

n cazul unei repartiii asimetrice, deplasat spre zona valorilor mici,
coeficientul de asimetrie este pozitiv, deoarece, dei mai puine, valorile x
i
> x
conduc la o sum
( )
x x
i

3
mai mare dect valorile x
i
< x (mai numeroase,
dar cu abateri mai mici fa de medie).
n mod similar, dac distribuia este deplasat spre zona valorilor mari,
coeficientul de asimetrie este negativ.
n general, n cazul variabilelor hidrologice, coeficientul de asimetrie este
pozitiv. Rareori (de exemplu la prelucrarea irului nivelurilor maxime n cazul
unui ru la care albia major are o capacitate ridicat de transport) coeficientul
de asimetrie rezult negativ.
Pentru caracterizarea formei se mai poate utiliza i coeficientul de boltire; n
expresia lui intervin ns momente de ordinul 4 care sunt evaluate mai puin
precis. Din acest motiv coeficientul de boltire nu este utilizat n hidrologie.


4.4. CALCULUL PARAMETRILOR STATISTICI
AI REPARTIIEI EMPIRICE

Datele hidrologice se prezint n general n ordine cronologic, mulimea
valorilor nregistrate formnd seria hidrologic complet. De obicei, nu sunt
utilizate seriile complete, ci se practic selectarea din serie a valorilor care
prezint interes n funcie de scopul urmrit, restul valorilor excluzndu-se.
Rezult astfel serii de date pariale (STAS 4068/1 - 82).
Deosebit de utilizate sunt seriile valorilor extreme (maxime sau minime),
care se obin discretiznd axa timpului n intervale egale i alegnd n cadrul

69
fiecrui interval de timp valorile care intereseaz. Dac intervalul de timp ales
este de 1 an, rezult serii extreme anuale (de exemplu irul debitelor maxime
anuale); pentru intervale mai mici rezult serii sezoniere.
n marea majoritate a cazurilor, prelucrrile statistice din hidrologie au ca
scop trasarea curbei teoretice a probabilitilor de depire a debitelor maxime
sau minime anuale. Calculele respective au la baz aproximaia c parametrii
populaiei statistice (deci parametrii curbei teoretice a probabilitilor) sunt
aceeai cu parametrii irului de date nregistrate (adic parametrii curbei
empirice a probabilitilor).
Justificarea teoretic a acestui mod de rezolvare o constituie teorema lui
Glivenko (Gh. Mihoc .a., 1976). Conform teoremei lui Glivenko rezult c
odat cu creterea volumului seleciei, funcia empiric de repartiie tinde ctre
funcia de repartiie teoretic a variabilei X. n studiul repartiiilor empirice se
pot, deci, utiliza repartiiile teoretice.
Ca urmare, prima operaie const n calculul parametrilor de selecie. Dup
aceea este util s se cunoasc erorile de care sunt afectai parametrii astfel
determinai, aducnd eventual corecii unora dintre ei. n sfrit cu parametrii
astfel alei se construiete curba teoretic a probabilitilor de depire, curb
care permite extrapolarea irului de date nregistrate n afara domeniului de
msurtori curente.
Succesiunea operaiilor pentru construirea curbei empirice a probabilitilor
de depire i calculul parametrilor statistici ai irului de date nregistrate este
urmtoarea:
Se selecioneaz din hidrograful debitelor irul valorilor maxime (sau
minime) anuale;
Se reordoneaz acest ir n ordine descresctoare, de la cea mai mare
valoare nregistrat la cea mai mic; fie i (i = 1, ..., n) numrul de ordine al
debitului din irul ordonat descresctor;
Se atribuie fiecrui debit Q
i
probabilitatea de depire empiric:

p
i
n
i
=
+1
; (4.37)

Se reprezint grafic punctele de coordonate (p
i
, Q
i
), obinndu-se astfel
curba empiric a probabilitilor de depire (fig. 4.6);


70




Fig. 4.6. Curba empiric a probabilitilor de depire.

n continuare, se calculeaz valoarea medie a irului de date:

Q
n
Q
i
i
n
=
=
1
1
.

Suma se poate calcula utiliznd att coloana valorilor nregistrate n ordine
cronologic, ct i coloana valorilor rearanjate n ordine descresctoare,
rezultatul fiind evident acelai.
Se calculeaz valorile:

k
Q
Q
i
i
=

Calculul se conduce, dup cum urmeaz n tabelul 4.1.
Ultimele dou coloane servesc pentru calculul coeficientului de variaie,
respectiv de asimetrie (relaiile 4.17, respectiv 4.36). Dup cum se va vedea mai
departe, de multe ori coeficientul de asimetrie nu se mai calculeaz, fiind ales
funcie de C
v
.
De o deosebit utilitate la determinarea parametrilor curbei probabilitilor
de depire este debitul istoric (determinat dup urme).



71
Tabelul 4.1


Anul

Q
(cronologic)
Q
i
(ordonat
descresctor)

i

p
i

k
Q
Q
i
i
=

(k
i
-1)
2

(k
i
-1)
3
19...
Q
19...
Q
1

1
1
1 n +

19...
Q
19...
Q
2

2
2
1 n +

19...
Q
19...
.
.
.
19...
Q
19...
.
.
.
... ... ...
...
...
19...
Q
19...
Q
n

n
n
n + 1


Q
Q
i
n
=



( )
k
i
i
n

=
1
2
1
( )
k
i
i
n

=
1
3
1



n cazul n care se dispune de irul debitelor maxime anuale Q
i
pentru o
perioad de n ani i de debitul maxim istoric Q
N
dintr-o perioad de N ani (care
ns nu s-a produs n intervalul cu date nregistrate), pentru calculul
parametrilor se utilizeaz formulele (C. Mociornia .a., 1979):

Q
N
Q
N
n
Q
N
i
n
'
= +

=
1 1
1
i
; (4.38)

( ) ( )
C
N
k
N
n
k
v N i
i
n
'
= +

=
1
1
1
1
2
1
2
. (4.39)

Dac n irul celor n valori maxime anuale ale debitelor exist o valoare
foarte mare n raport cu celelalte (i care constituie debitul maxim istoric pentru
o perioad de N > n ani), pentru calcul se vor utiliza relaiile (C. Mociornia
.a., 1979):

Q
N
Q
N
n
Q
N
i
n
'
= +

1 1
1
1
i
; (4.40)

72
( ) ( )
C
N
k
N
n
k
v N i
i
n
'
=

1
1
1
1
1
1
2
1
1
2
(4.41)

n relaiile anterioare:

k Q Q
N N
= /
'
. (4.42)

Parametrii, Q , C
v
i C
s
au fost calculai prin metoda momentelor (n
evaluarea lor au intervenit momente de ordinul unu, doi, respectiv trei); aceast
metod este de altfel i cea mai utilizat n practic. Pentru estimarea
parametrilor se mai poate folosi metoda verosimilitii maxime, metoda celor
mai mici ptrate, metoda intervalelor de ncredere etc. (M. Shahin, .a., 1993).
n continuare vor fi prezentate cteva aspecte metodologice referitoare la
unele din aceste metode de calcul.


4.5. EVALUAREA PARAMETRILOR REPARTIIILOR TEORETICE

n hidrologie tipul de repartiie teoretic este cunoscut n general, din
experiena trecut. n practica hidrologic din ara noastr sunt utilizate curbele
de repartiie triparametrice Kriki - Menkel i curbele de repartiie binomial
Pearson III. n principiu, legea de repartiie teoretic se intuiete pe baza
reprezentrilor grafice ale variabilelor de selecie; calculele urmtoare se vor
efectua apoi pe baza ipotezei de repartiie teoretice admise.
Presupunnd tipul de repartiie cunoscut se pune acum problema evalurii
(estimrii) parametrilor repartiiei teoretice. Numai dup aceast operaiune
repartiia este complet determinat. Valorile parametrilor variabilei teoretice
(care caracterizeaz populaia statistic) sunt estimate pe baza variabilelor de
selecie (adic a valorilor nregistrate).


4.5.1. METODA MOMENTELOR

Fie f(x, a, b, c, ...), funcia de probabilitate (n cazul unei repartiii discrete),
respectiv densitatea de repartiie (n cazul unei repartiii continue), funcie care
depinde de un numr de parametri a, b, c, ... necunoscui i care trebuie
determinai. Fie k numrul acestor parametri.
Metoda momentelor const n calcularea primelor k momente att ale
variabilei teoretice avnd repartiia f(x, a, b, c, ...), ct i ale variabilei de

73
selecie. Momentele teoretice vor avea expresii funcie de parametrii
necunoscui a, b, c, ...:

M
1
(a, b, c, ...); M
2
(a, b, c, ...); ... ; M
k
(a, b, c, ...)

Fie M M - primele k momente empirice ale variabilei de selecie,
calculate cu ajutorul valorilor nregistrate x
M
k 1 2
* *
, , , K
*
1
, x
2
, ..., x
n
. Prin egalarea celor 2
rnduri de momente se obine un sistem (neliniar n general) de k ecuaii cu k
necunoscute, ale crei soluii estimeaz parametrii repartiiei teoretice.
Fie, de exemplu, repartiia Gama cu 2 parametri:

f x a b
a b
x e
a
a x
( , , )
( )
/
=

1
1

b
b =
2
+
(x0; a>0; b>0) (4.43)

Se pune problema evalurii parametrilor a i b, utiliznd metoda
momentelor.
Momentele teoretice de ordinul 1 i 2, innd seama i de definiia funciei
euleriene de spea a doua (funcia gama), sunt (C. Dinescu, V. Svulescu,
1978):

M xf x a b dx a
1
0
=

( , , ) ; (4.44)

M x f x ab dx a a b
2
2
0
1 = =

( , ) ( ) . (4.45)

Primele dou momente empirice sunt:

M
n
x
i
i
n
1
1
1
*
=

=
; (4.46)

M
n
x
i
i
n
2
2
1
1
*
=

=
. (4.47)

Egalnd momentele teoretice cu momentele empirice se obine un sistem de
dou ecuaii cu dou necunoscute:

ab
n
x
i
i
n
=

=
1
1
; (4.48)

74
a a b
n
x
i
i
n
( ) + =
=
1
1
2
1
2
. (4.49)

Rezolvarea acestui sistem conduce la evaluarea parametrilor a i b ; cu
aceasta, repartiia variabilei teoretice este complet determinat.
Metoda momentelor este dup cum s-a mai artat cea mai utilizat n
practica hidrologic.


4.5.2. METODA VEROSIMILITII MAXIME

Aceast metod pleac de asemenea de la valorile nregistrate x
1
, x
2
, ..., x
n
i
de la expresia funciei f(x, a, b, ...), unde a, b, ... sunt parametrii care trebuie
estimai.
Se numete funcie de verosimilitate funcia:

( ) ( ) ( ) ( ) ( )
V a b f x a b f x a b f x a b f x a b
n i
i
n
, , ... , , , ... , , , ... , , , ... , , , ... = =
=
1 2
1
. (4.50)

Valorile cele mai verosimile pentru a, b, c, ... sunt acelea care maximizeaz
funcia V(a, b, c, ...). n continuare trebuie aplicate tehnici de gsire a
extremului unei funcii care depinde de mai multe variabile (derivarea funciei
de verosimilitate V n raport cu cele k necunoscute, anularea celor k derivate
pariale i rezolvarea sistemului rezultat). Pentru efectuarea mai comod a
calculelor acest procedeu nu se aplic funciei de verosimilitate V, ci
logaritmului ei, innd seama de faptul c o funcie oarecare i atinge maximul
odat cu logaritmul su natural.
Fie, de exemplu, densitatea de repartiie:

( )
f x a b
b
e
x a
b
, , =

1
2
1
2
2

; xR , (4.51)

i valorile de selecie x
1
, x
2
, ..., x
n
.
n acest caz funcia de verosimilitate este (C. Dinescu, V. Svulescu, 1978):

( )
( )
V a b
b
e
b
e
i
n
x a
b
n
n
x a
i
i
i
n
( , ) =

=

=


=
1
2
1
2
1
1
2
1
2b
2
2
2
1


. (4.52)


75
Prin logaritmare se obine:

( ) ( )
ln , ln ln V a b n b n
b
x a
i
i
n
=
=
2
1
2
2
2
1
. (4.53)

n continuare se calculeaz derivatele pariale de ordinul unu ale funciei
ln V, n raport cu necunoscutele a i b:

( )

ln ( , ) V a b
a b
x a
i
i
n
=

=
1
2
1
(4.54)

( )

ln ( , ) V a b
b
n
b b
x a
i
i
n
= +
=
1
3
2
1
(4.55)

Anulnd cele dou derivate se obine urmtorul sistem:

( )
x a
i
i
n
=
=1
0 (4.56)

( )
+

=
=
n
b b
x a
i
i
n
1
0
3
2
1
. (4.57)

Din ecuaia (4.56) rezult:

( )
x a x a x na
i
i
n
i
i
n
i
n
i
i
n

=



=

=
= = = = 1 1 1 1
0 (4.58)

Deci:

na x
i
i
n
=
=1
(4.59)

sau:

a
n
x
i
i
n
=

=
1
1
. (4.60)

Cu alte cuvinte, estimatorul de maxim verosimilitate al parametrului a este
chiar media de selecie x .


76
nlocuindu-l pe a prin x n ecuaia (4.57), se obine:

( )
n
b b
x x
i
i
n
=
=
1
3
2
1
, (4.61)

adic:

( )
b
n
x x
i
i
n
2
2
1
1
=

=
sau b = s . (4.62)

Rezult c parametrul b are drept estimator de maxim verosimilitate
abaterea medie ptratic de selecie s. Cu alte cuvinte parametrii a i b din
expresia densitii de repartiie teoretic sunt chiar valoarea medie m, respectiv
abaterea medie ptratic a populaiei. Funcia avnd densitatea de repartiie:

( )
f x m e
x m
, ,


=

1
2
1
2
2
, x R (4.63)

poart numele de repartiie normal i poate fi luat drept model teoretic
pentru cercetarea probabilistic a unui numr foarte mare de fenomene
aleatoare.


4.5.3. METODA CELOR MAI MICI PTRATE

Fie f(x, a, b, c, ...) densitatea de repartiie ai crei parametri trebuie
determinai.
Din punct de vedere matematic, problema const n gsirea acelei
configuraii a parametrilor a, b, c, ... astfel nct suma ptratelor (sau suma
modulilor) abaterilor dintre probabilitile teoretice p
i
t
i probabilitile empirice
p
i
e
s fie minim:

( )
F p p i
i
t
i
e
i
n
=
=
2
1
min m
dx
. (4.64)

Probabilitile teoretice p de depire ale valorilor nregistrate x
i
t
i
se
evalueaz cu relaiile:

( )
p f x a b c
i
t
x
i
=

+
, , , , ... , (4.65)

77
n timp ce probabilitile empirice p
i
e
se obin cu relaia Weibull:

p
i
n
i
e
=
+ 1
. (4.66)

Funcia obiectiv are deci expresia (R. Drobot, 1989):

F f x a b c dx
i
n
im
x i
n
i
=
+


+
=
( , , , ,...) min
1 1
2
. (4.67)

Pentru integrarea densitii de repartiie se utilizeaz metode numerice, ca de
exemplu metoda Gauss cu 8 sau 16 puncte (G. Vraciu, A. Popa, 1982). n
vederea creterii preciziei calculului, integrarea se poate efectua din aproape n
aproape ntre dou valori succesive x
i
, respectiv x
i+1
, iar acolo unde ecartul
ntre dou valori succesive este prea mare, se poate recurge chiar la divizarea
acestuia.
Cutarea minimului se face prin procedee numerice de programare neliniar
care nu apeleaz la calculul derivatelor funciei obiectiv; cele mai bune rezultate
se obin cu algoritmul Nelder-Mead.
Avantajul metodei celor mai mici ptrate const n flexibilitatea sa n
evaluarea parametrilor. Astfel, n metoda momentelor calculul ordonatelor
curbei Kriki-Menkel a probabilitilor de depire are loc admind valori fixe,
prestabilite ale raportului C
s
/C
v
, care variaz de la 1,0 la 4,0 cu un pas de
discretizare de 0,5. Metoda celor mai mici ptrate permite obinerea optimului
global al funciei (4.67), valorile optime ale parametrilor a, b, c, ... , putnd
conduce la orice raport C
s
/C
v
, fr nici o restricie.
Dup evaluarea parametrilor, probabilitatea de depire teoretic
corespunztoare unei valori x
i
oarecare se obine prin integrarea relaiei (4.65).
Dac intereseaz valoarea x
i
, creia i corespunde o probabilitate de depire
dat (de ex: p%=1%), calculul se efectueaz prin ncercri succesive: se propun
diverse valori x
i
ca limit inferioar de integrare n relaia (4.65), obinndu-se
valorile corespunztoare pentru probabilitile teoretice ; prin interpolare
rezult imediat valoarea x cutat, procedeul fiind rapid convergent.
p
i
t

78
Pentru exemplificare, se consider ca repartiie teoretic, distribuia Gama cu
trei parametri, care va fi utilizat pentru calculul probabilitilor teoretice de
depire n cazul unui ir scurt (n = 25) de debite maxime anuale:

( )
f x x e
x
( )
( )
( )
( ) /
=


1 1

, (4.68)

unde notaiile au urmtoarea semnificaie:
este parametrul de form;
- parametrul de scar;
- limita inferioar a valorilor distribuiei.

Fie repartiia empiric:

x Q p
i
n
i i i
= =
+

;
1
,

unde debitele Q
i
sunt ordonate n ordine descresctoare, i fiind numrul de
ordine din acest ir:

Q
1
> Q
2
> ... > Q
i
> ... > Q
n
. (4.69)

Probabilitile teoretice p
i
t
de depire ale debitelor nregistrate se obin cu
relaia:

p f x dx x e
i
t
Q Q
x
i i
=

=


+ +

( ) ( )
( ( )/
1
1)

dx . (4.70)

Funcia obiectiv are expresia:

F x e dx
i
n
im
Q
x
i
n
i
=


+


+

=
1
1
1)
1
2

( ) min
( ( )/
(4.71)

Coordonatele minimului sunt n cazul de fa cei trei parametri necunoscui
, i care asigur aproximarea cea mai bun a curbei empirice de ctre curba
teoretic.

79
Pentru repartiia Gama cu 3 parametri, momentul de ordinul 1 (media
aritmetic), respectiv momentele centrate de ordinul 2 i 3 au expresiile (V.
Yevdjevitch, 1972):

m xf x dx =

= +
+
( )

;

( )
m x m f x dx
2
2
2
2
= =

=
+

( ) ; (4.72)

( )
m x m f x dx
3
3
3
2 =

=
+
( )

.
Ca urmare, coeficienii de variaie i asimetrie sunt:

C
m
v
= =
+


,
(4.73)
C
m
s
= =
3
3
2

.

De aici rezult imediat raportul C
s
/C
v
n funcie de parametrii , , i
determinai prin procedeul de optimizare.



Fig. 4.7. Trasarea curbei teoretice a probabilitilor de depire
prin procedeul clasic i prin optimizare.

80
n figura 4.7 sunt reprezentate curba empiric a probabilitilor de depire
precum i curbele teoretice calculate cu parametrii obinui prin metoda
momentelor (curba 1), respectiv prin optimizare (curba 2).
Chiar i n cazul unei alegeri foarte bune a raportului C
s
/C
v
(ceea ce nu este
ntotdeauna sigur n practic), aproximarea curbei empirice este mai slab dect
n cazul utilizrii parametrilor obinui prin optimizare.


4.6. ERORI I LIMITE ALE CALCULULUI STATISTIC

Efectund mai multe selecii de acelai volum dintr-o populaie statistic i
calculnd parametrii statistici uzuali (valoare medie, coeficient de variaie i
coeficient de asimetrie) se obin valori ale acestora, diferite de la selecie la
selecie. Cu ct volumul seleciei este mai mare, cu att fluctuaiile parametrilor
vor fi mai mici, tinznd la limit ctre parametrii populaiei examinate; invers,
pentru un volum redus al seleciei, parametrii statistici corespunztori pot
prezenta abateri importante de la parametrii populaiei. Cu alte cuvinte, nsi
parametrii statistici sunt nite variabile aleatoare, valorile acestora depinznd n
general de lungimea irului de date de baz.
Abaterea medie ptratic a coeficienilor C
s
i C
v
se calculeaz cu relaiile:

C
s
n
=
6
(4.74)

C
v
v
v
C
n
C = +
2
1 2
2
. (4.75)

Volumul redus al seleciei constituie o important surs de erori n calculul
statistic. Lund drept msur a erorii abaterea medie ptratic a parametrilor C
s

i C
v
se constat c cel mai afectat de lungimea irului statistic este coeficientul
de asimetrie.
Astfel, considernd o populaie pentru care C
v
= 0,5, din formulele (4.74) i
(4.75) rezult c, pentru o selecie de volum n = 100, eroarea la determinarea lui
C
s
este de 25%, n timp ce pentru C
v
este 4,25%. Pentru n = 20, respectiv 25,
erorile pentru C
v
sunt 9,7%, respectiv 8,6%, n timp ce pentru C
s
sunt
inacceptabile depind 50%. Admind erori n calculul statistic de pn la 10%,
rezult c pentru un ir de date cu cel puin 20 25 valori, pentru C
v
se poate
admite valoarea calculat, n timp ce coeficientul de asimetrie trebuie ales pe

81
baz de experien n funcie de valorile coeficientului de variaie (care este
determinat cu o precizie mult mai bun).
Coeficientul de asimetrie are (C. Mociorni .a., 1979) urmtoarele valori
(funcie de C
v
):

C
s
= 2 C
v
- pentru debite maxime provenite din topirea zpezilor;
C
s
= 4 C
v
- pentru debite maxime provenite din ploi;
C
s
= (3 4) C
v
- pentru debite maxime anuale indiferent de genez,
adoptndu-se valoarea minim n cazurile n care
marea majoritate a debitelor din ir provin din
opirea zpezilor i valoarea maxim n cazul n
care sunt cauzate de ploi.

Alte valori ale lui C
s
sunt urmtoarele (Hncu .a., 1975):
C
s
= 0 - pentru niveluri maxime;
C
s
= 1,5C
v
- pentru debite medii anuale pe rurile care seac;
C
s
= (3 3,5)C
v
- pentru precipitaii maxime;
C
s
= (3,5 4)C
v
- pentru debite maxime pe ruri mici;
C
s
= 2C
v
- pentru debite medii anuale i debite minime de var.

n sfrit, pentru calculul volumelor maxime de durat T cu diverse
probabiliti de depire, coeficientul de asimetrie are urmtoarele valori (C.
Mociorni .a., 1979):

C
s
= 2C
v
- pentru volume maxime provenite din topirea
zpezilor;
C
s
= 4C
v
- pentru volume maxime provenite din ploi;
C
s
= (2 4)C
v
- pentru volume maxime indiferent de genez,
funcie de proveniena celei mai mari pri a datelor
din irul analizat.

Dup calculul parametrilor irului de date de care se dispune din msurtori
se procedeaz la calculul ordonatelor curbei teoretice avnd aceiai parametri.
Urmeaz apoi reprezentarea pe un format special a curbei teoretice i a
curbei empirice; n mod normal curba teoretic trebuie s treac printre punctele
curbei empirice.

82
n anumite situaii acest lucru poate s nu se realizeze. n acest caz sunt de
suspectat erori de determinare a unora dintre debitele din ir; se mai poate
ntmpla ca n cadrul intervalului de n ani analizat s se fi produs debite cu
probabiliti de apariie extrem de reduse (prima sau primele valori din irul
ordonat descresctor pot avea probabiliti de depire cu mult mai mici dect
frecvenele empirice calculate cu relaii de tipul i/(n+1)).
Pentru obinerea unei concordane ct mai bune ntre conturul curbei
teoretice i valorile msurate se pot adopta diverse msuri (C. Mociorni .a.,
1979, R. Drobot, 1989):
Modificarea valorii parametrilor C
v
i C
s
; admind c eroarea la
determinarea coeficientului de variaie este n limitele
C
v
se vor
propune noi valori pentru coeficientul de variaie cuprinse n domeniul
[C
v
-
C
v
; C
v
+
C
v
]. n ceea ce privete coeficientul de asimetrie, acesta va fi
ales n funcie de noua valoare a lui C
v
.
Utilizarea altor curbe teoretice de probabilitate (n afara curbelor Kriki-
Menkel sau Pearson III) cum sunt de exemplu curbele log-normale, Johnson
etc; tipul de curb adecvat irului statistic de valori nregistrate se va alege pe
baza unor teste de concordan ca de exemplu criteriul
2
sau testul lui
Kolmogorov.
Utilizarea metodei celor mai mici ptrate pentru determinarea
parametrilor care intervin n relaiile de definiie ale densitii de repartiie sau
funciei de repartiie i implicit ale parametrilor statistici uzuali; trebuie
menionat c metoda celor mai mici ptrate are o flexibilitate superioar
metodei bazat pe calculul momentelor, care este condiionat de utilizarea unor
valori fixe, prestabilite ale raportului C
s
/C
v
(curbele Kriki-Menkel sunt definite
pentru valori ale acestui raport egale cu 1,0; 1,5; 2,0; ... ; 4,0, excluzndu-se
valorile intermediare).
Principala cauz a erorilor inerente calculului statistic o constituie volumul
relativ redus al irului de date din nregistrri. Se reamintete c n hidrologie
perioada de msurtori este cuprins n general ntre 20 - 40 de ani.
Chiar dac s-ar dispune de date pe perioade ndelungate, aceasta nu
constituie o garanie deplin n special n cazul unor bazine mici sau foarte mici.
La aceste bazine influena activitilor umane (despduriri masive, urbanizare
progresiv etc.) se resimte foarte puternic, conducnd n timp la o cretere a
valorii coeficientului de scurgere i o micorare a timpului de concentrare a
precipitaiilor n reeaua hidrografic); ca urmare se constat o cretere a
frecvenei cu care se nregistreaz debite de probabiliti considerate reduse. n
aceste situaii este necesar renunarea la valorile mai vechi ale irului (care nu
mai reflect corect actuala situaie a bazinului hidrografic), cu toate implicaiile

83
defavorabile pe care le are micorarea numrului de valori disponibile pentru
prelucrarea statistic.


84




5. REPARTIII CONTINUE UTILIZATE N HIDROLOGIE


5.1. REPARTIIA NORMAL

Aceast repartiie, cunoscut i sub denumirea de legea lui Gauss sau legea
Gauss-Laplace, ocup un loc deosebit printre distribuiile teoretice, constituind
de altfel o lege limit ctre care tind unele distribuii (binomial, Poisson) n
anumite condiii. Pentru ca o variabil aleatoare s aib distribuie normal,
trebuie ca ea s depind de un mare numr de factori, cu o influen individual
relativ redus, efectul fiecrui factor s fie aditiv i independent de al celorlali
factori cauzali (V. Yevjevich, 1972).
Distribuia normal de parametri m i este definit dup cum s-a artat
(4.5.2) prin urmtoarea densitate de repartiie:

( )
f x m e x R
x m
; , ;


=

1
2
1
2
2
(5.1)

Repartiia normal are urmtoarele proprieti:
funcia f(x; m, ) este continu, fiind definit pentru orice valoare real a
lui x de la - la +;
densitatea de repartiie normal are un singur maxim (este o repartiie
unimodal) pe care l atinge n punctul x = m; valoarea maxim a funciei este:


( )
f m x R =
1
2
; (5.2)

densitatea de repartiie normal este simetric fa de verticala dus prin
x=m i scade simetric la stnga i la dreapta de aceast valoare, tinznd
ctre axa absciselor care este asimptot orizontal.
ntr-adevr:

lim ( ; , ) lim ( ; , )
x x
f x m f x m
+
= = 0 . (5.3)


85
repartiia normal fiind simetric media, mediana i modul coincid; n
plus, coeficientul de asimetrie este nul (se reamintete c la repartiiile
asimetrice acest coeficient este diferit de zero);
funcia f(x; m, ) are form de clopot (de altfel, se mai numete i
clopotul lui Gauss) cu punctele de inflexiune n x = .
Reprezentarea grafic a repartiiei normale (exprimat prin intermediul
densitii de repartiie) este redat n figura 5.1.


Fig. 5.1. Graficul densitii de repartiie pentru distribuia normal.

Referitor la forma funciei f(x; m, ) trebuie artat (fig. 5.2) c, cu ct
abaterea medie ptratic este mai mic, clopotul este mai ascuit, iar cu ct
este mai mare clopotul este mai turtit (mprtierea este mai mare).


Fig. 5.2. Influena lui asupra densitii de repartiie i a funciei de repartiie.

86
Deoarece parametrii distribuiei normale sunt m i , rezult c avnd media
i dispersia variabilei aleatoare, funcia de repartiie este perfect determinat.
Fcnd, n expresia densitii de repartiie schimbarea de variabil:

t
x m
=

, (5.4)

se obine distribuia normal de parametri m = 0 i = 1:

( )
f t e t R
t
; ; ;
/
0 1
1
2
2
2
=

. (5.5)

Variabila t
x m
=

se numete variabil standard sau normat, iar


distribuia f(t; 0; 1) poart numele de repartiie normal normat.
Valorile densitii de repartiie a distribuiei normale normate sunt date n
tabelul 5.1; valorile oricrei alte repartiii normale, avnd parametrii estimai pe
baza datelor din msurtori se obin cu relaiile (V. Yevjevich, 1972):

x = m + t , (5.6)
respectiv:

( )
f x f m t e f t
t
= + = =

( )
/



1
2
1
2
2
( ) . (5.7)

Mai trebuie artat c variabila aleatoare normat avnd media egal cu zero
este simetric fa de verticala dus prin origine.



Fig. 5.3. Trecerea de la repartiia normal normat (a) la o repartiie normal de
medie m i abatere (b).

87

88
n figura 5.3 este prezentat graficul densitii de repartiie f(t; 0; 1) i
respectiv graficul funciei f(x; m, ) obinut din aceasta.
Funcia de repartiie a varibilei normale normate, numit funcia lui Laplace
este:

( ) x e
t
x
=

1
2
2
2

dt . (5.8)

Fiind o funcie de repartiie, (-) = 0, iar (+) = 1. n plus, deoarece
f(t; 0; 1) este simetric fa de dreapta m = 0, rezult c:

( ) ( ) ( ) ( ) ( ) = =

x f t dt f t dt f t dt x
x
x
x
1 1 . (5.9)

Funcia lui Laplace este, de asemenea, tabelat (tab.5.2) i servete la
calculul probabilitilor evenimentelor referitoare la orice variabil aleatoare
normal.
De exemplu, probabilitatea ca o variabil normal s ia valori n intervalul
[x
1
, x
2
) poate fi evaluat cu ajutorul funciei (x).
Efectund schimbarea de variabil (5.6), rezult:

dx = dt . (5.10)

Limitele de integrare se schimb dup cum urmeaz:
pentru X = x
1
, t
x m
1
1
=

; (5.11)
pentru X = x
2
, t
x m
2
2
=

. (5.11')
n acelai timp, dx = dt. Ca urmare:

Prob(x
1
X < x
2
) =
1
2
2
1
2
2

e dt
t
x m
x m

/

(5.12)
=


1
2
2
2
2
1
2 2


e dt e dt
t
x m
t
x m
/ /



89

90
innd seama de definiia (5.8) a funciei de repartiie normal normat, cu
parametrii m = 0 i = 1, rezult:

( )
Pr ob x X x
x m x m
1 2
2 1
< =



. (5.13)

Din relaia apartenenei la intervalul [x
1
, x
2
) se poate calcula i probabilitatea
de nedepire a unei valori oarecare a variabilei aleatoare de distribuie normal.
Considernd, de pild, x
1
= - n relaia (5.13) se obine:

( ) ( )
Pr ob X x
x m
< < =


2
2

. (5.14)

Dar (-) = 0, deci:

( ) ( )
Pr ob X x
x m
t < =

. (5.15)

Cunoscnd media m i abaterea a variabilei aleatoare, se calculeaz
variabila normal normat t. Probabilitatea de nedepire a lui t este n acelai
timp i probabilitatea de nedepire a valorii x.
n mod similar se calculeaz probabilitatea de depire, obinndu-se:

( ) ( )
Pr ob X x
x m
t =

= 1 1

. (5.16)

Relaia apartenenei la un anumit interval poate servi i pentru determinarea
probabilitii ca abaterea variabilei X fa de medie s nu depeasc o anumit
mrime.
Astfel:

( ) ( )
Pr Pr ob X m ob m X m < = + < + =
=


. (5.17)



91
Dar:

(-x) = 1 - (x), (5.18)

deci:

( )
Pr ob X m < =

2 1 . (5.19)

Dac = 3 i innd cont de faptul c (3) = 0,9987 rezult:

( ) ( )
Pr , ob X m < = = 3 2 3 1 0 9974 . (5.20)

Deci domeniul (m - 3, m + 3) acoper marea majoritate a observaiilor
(99,74%) i doar 0,26% se gsesc n afar. Aceast relaie foarte important
poart numele de regula celor trei sigma.
n mod similar, n domeniul (m - , m + ) sunt situate aproape 68% din
valori i mai puin de 32% n afara acestui interval.


5.2. APLICAII ALE REPARTIIEI NORMALE N HIDROLOGIE

1. Ca oricare alte date obinute pe baz de msurtori, mrimile hidrologice
sunt afectate de erori sistematice i erori aleatoare. Erorile aleatoare sunt n
marea majoritate a cazurilor simetric distribuite i pot fi exprimate printr-o
distribuie normal; ca indicator al erorilor se va utiliza abaterea standard.
2. Anumite repartiii care nu sunt normale pot fi aduse la distribuia normal
printr-o schimbare de variabil. De exemplu, o variabil distribuit asimetric
poate fi simetrizat prin logaritmare, sau considernd radicalii variabilei etc.;
dac coeficientul de asimetrie al noii variabile este cuprins n intervalul
(-0,10; +0,10) sau, i mai strict, ntre (-0,05; 0,05), se poate admite pentru
aceast variabil ipoteza repartiiei normale i deci se pot utiliza toate rezultatele
obinute la repartiia normal.
3. Funcia de repartiie normal este de asemenea utilizat n probleme de
generare a debitelor.
Pentru nceput se genereaz numere aleatoare distribuite uniform n
intervalul [0, 1]. O variabil aleatoare discret U este uniform dac toate
valorile ei sunt egal probabile (fiecare valoare are probabilitatea de apariie
egal cu 1/n).

92

Dac variabila este continu, densitatea de repartiie este de forma:

[ ]
[ ]
f x
k dacx a b
dacx a b
( )
, ,
, ,
=

0
(5.21)

Constanta k va fi determinat din condiia ca f(x) s reprezinte o densitate de
repartiie:

f x dx k dx kx k b a
a
b
a
b
a
b
( ) ( )

=

= = = 1 . (5.22)

Rezult:

k
b a
=

1
. (5.23)

Pentru generarea numerelor aleatoare uniform distribuite n intervalul [0, 1]
se folosesc fie procedee fizice (de exemplu, o urn cu 10, 100 sau 1000 de bile
din care se fac extracii la ntmplare cu revenire), fie procedee matematice.
Procedeele matematice, utiliznd relaii de recuren, conduc de fapt la
obinerea unor numere pseudo-aleatoare (funcie de capacitatea calculatorului
folosit, la un moment dat, numerele generate ncep s se repete).
Cel mai frecvent, pentru generarea numerelor pseudo-aleatoare uniform
repartizate n intervalul [0, 1] se folosete metoda congruenial liniar:

X
n+1
= (a X
n
+ c) (mod M), n = 0, 1, 2, ... (5.24)

unde a, c i M sunt ntregi nenegativi.
Numrul ntreg pozitiv X
o
este termenul iniial al irului de numere pseudo-
aleatoare. Din cerina ca perioada de repetare s fie ct mai mare, modulul M
este suficient de mare (fiind egal cu mrimea cuvntului calculatorului minus 1,
sau apropiat de acesta); constantele a i c trebuie s respecte de asemenea
anumite criterii astfel nct perioada de revenire s fie maxim (Vduva, 1977).
Dispunnd de numerele pseudo-aleatoare uniform distribuite pe intervalul
[0, 1] , se pot genera imediat numere pseudo-aleatoare de distribuie normal
normat.


93
Din punct de vedere practic lucrurile decurg ca n figura 5.4.



Fig. 5.4. Generarea numerelor aleatoare cu densitatea
de repartiie f(x) cerut.

Fie y
n
un numr aleator uniform repartizat pe [0, 1], generat iniial. Se
determin valoarea abscisei x
n
, pentru care valoarea funciei de repartiie
F(x
n
) = y
n
. Valorile x
n
astfel obinute reprezint numere aleatoare cu densitatea
f(x) cerut.
Din punct de vedere matematic, procedeul expus revine la inversarea funciei
de repartiie (Scuiu, Zorilescu, 1978). Se noteaz prin {y
n
} un ir de numere
uniform repartizate pe [0, 1] i prin F(x) funcia de repartiie a variabilei
aleatoare X (presupus continu):

y
n
= F(x
n
) , (5.25)

unde x
n
sunt realizri ale variabilei aleatoare X.
Deoarece F(x) este continu, admite invers i deci:

x F y
n
=
1
(
n
) . (5.26)


94
Dac funcia F
-1
se poate explicita algebric, valorile x
n
rezult imediat ce au
fost generate valorile y
n
.
n cazul repartiiei normale, funcia F
-1
nu poate fi exprimat algebric; ca
atare se utilizeaz o aproximare a acesteia sau se folosesc tabele ale repartiiei
normale normate, care permit determinarea numrului x
n
care corespunde
probabilitii de nedepire y
n
(Scuiu, Zorilescu, 1978).
n continuare, se aplic procedee de transformare a variabilelor normale
normate n variabile normale oarecare (de medie m i abatere medie ptra-
tic ); alte transformri permit trecerea la variabile cu distribuii asimetrice.
4. Funcia de repartiie normal normat constituie elementul de plecare
pentru construirea formatului de probabilitate pe care se reprezint curbele
asimetrice care caracterizeaz fenomenele hidrologice.
Acest format este conceput astfel nct s permit transformarea curbei n
form de S a funciei de repartiie normale normate ntr-o linie dreapt (fig.5.5),
dilatnd zona probabilitilor foarte mari i foarte mici.




Fig. 5.5. Reprezentarea funciei de repartiie n format aritmetic (a)
i n format de probabilitate (b).

Modul de realizare al acestui format va fi explicat pe baza unui exemplu. Se
caut un format astfel nct orice curb din familia:

y = f(x) = a + b x
2
(5.27)

s se reprezinte sub forma unei drepte (fig. 5.6).


95


Fig. 5.6. Construirea formatului care liniarizeaz curbele y = a + bx
2
:
a - schem de principiu; b - exemplificare pentru curba y = 8 + 0,5 x
2
.

Fie, pentru nceput, funcia y = f (x) = x
2
.
Att pe abscis, ct i pe ordonat se utilizeaz un format aritmetic sau
cartezian (la intervale egale corespund segmente egale, indiferent de poziia
acestora pe ax), rezultnd curba cu linie plin din figura 5.6, a.
n continuare, fiecrei valori x' = y de pe abscis i se asociaz o valoare:

~
( ) x f y y = =
1
, (5.28)

ceea ce reprezint un alt mod de divizare pentru abscis.
Pstrnd vechiul format pentru ordonat i utiliznd noul format pentru
abscis, funcia:

( )
~
(
~
)
~
' y f x x y y x = = = = =
2
2
(5.29)

constituie de fapt funcia identic i deci se reprezint ca o dreapt (fig. 5.6,a
curba = x).
~
y
n acelai format, o curb de tipul y = f(x) = a + bx
2
devine de asemenea o
dreapt; ntr-adevr:


96
( ) ( ) ( )
~
(
~
) ' ' y f x f y f x a b x a bx = = = = + = +
2
' ; (5.30)

rezult deci o dreapt de ordonat la origine a i pant b.
Fie de reprezentat de exemplu curba:

y = f(x) = 8 + 0,5 x
2
.

Dup cum se observ i din figura 5.6,b, pe formatul obinut anterior, aceast
curb se reprezint sub forma unei drepte.
Procedeul folosit se poate rezuma astfel: se stabilete o scar aritmetic de
divizare a axei Ox i se trec deasupra axei absciselor valorile y
i
= f(x
i
);
corespunztor, n dreptul fiecrui punct y
i
astfel obinut se trece valoarea
= f
~
x
i
-1
(y
i
) , aceste valori constituind noul sistem de divizare a abscisei.
Utiliznd aceste gradaii pentru abscis i vechiul sistem de divizare pentru
ordonate, curba y = f(x), ca i orice curb din aceeai familie, se reprezint n
noul sistem de coordonate sub forma unei drepte (M. Shahin, .a., 1993).
Acelai procedeu se va folosi i n cazul repartiiei normale normate. Fie
graficul repartiiei pe care s-au trecut valorile funciei (10%, 20%, 30%, etc.),
precum i abscisele corespunztoare att n reprezentare matematic uzual
(fig.5.7), ct i n cea utilizat n hidrologie (fig.5.8).



Fig. 5.7. Funcia de repartiie normal normat i cteva din valorile ei.

97


Fig. 5.8. Funcia de repartiie normal normat n reprezentarea hidrologic.

n continuare se utilizeaz un format aritmetic pentru reprezentarea valorilor
y
p%
(care vor fi trecute deasupra axei); n dreptul acestora, sub abscis se vor
marca probabilitile (fig. 5.9):

p% = f
-1
(y
p%
)



Fig. 5.9. Construirea formatului de probabilitate.

Valoarea y
p%
= 0 va fi reprezentat la mijlocul axei absciselor, acestei valori
particulare corespunzndu-i probabilitatea de 50%. Lund ca origine punctul
0,00 se va figura la stnga i la dreapta lui segmentul de valoare -0,253,
respectiv +0,253. Punctele astfel obinute corespund probabilitii de nedepire
de 40%, respectiv de 60%. n mod similar, se poziioneaz punctele -0,524 i
+0,524 corespunznd probabilitilor de 30%, respectiv 70% etc.
Pe un astfel de format, funcia de repartiie F ca i probabilitatea de depire
F
c
a repartiiei normale normate (m=0; =1) se vor reprezenta sub forma unor
drepte, paralele cu prima, respectiv a doua bisectoare (fig. 5.10).

98


Fig. 5.10. Reprezentarea funciei de repartiie normale normate i a curbei
probabilitilor de depire pe formatul de probabilitate.

n realitate, repartiiile normale au parametrii m i oarecare; mai mult dect
att, repartiiile sunt definite numai pentru valori pozitive ale variabilei. Ca
urmare, curba probabilitilor de depire a unei repartiii normale oarecare este
o dreapt care se deseneaz doar n primul cadran i a crei pant depinde de
mrimea lui (fig. 5.11).



Fig. 5.11. Reprezentarea curbei probabilitatilor de depaire a distribuiei normale
pe formatul de probabilitate.

99
Proprietatea repartiiei normale de a se reprezenta ca o dreapt pe formatul
de probabilitate poate fi utilizat pentru testarea ipotezei de normalitate: dac
curba empiric a probabilitilor de depire se situeaz aproximativ dup o
dreapt, poate fi luat n considerare ipoteza unei repartiii normale.
Dimpotriv, dac se manifest o tendin de curbare a repartiiei empirice,
distribuia este asimetric i deci pentru modelarea statistic a fenomenului
analizat trebuie utilizat alt repartiie teoretic (lognormal, Pearson III etc.).


5.3. REPARTIIA LOG-NORMAL (LOGARITMIC - NORMAL)

Pentru anumite mrimi hidrologice (precipitaii, debite) se constat c
logaritmii datelor msurate sunt normal distribuii; repartiia acestor variabile va
fi numit logaritmic normal sau log-normal. Aceast distribuie se realizeaz
atunci cnd efectul factorilor cauzali este multiplicativ (se reamintete c la
distribuia normal este aditiv).
Densitatea de repartiie normal a logaritmilor valorilor variabilei este:

(ln ) exp
ln
x
x
n
n
n
=

1
2
1
2
2
, (5.31)
unde
n
i
n
sunt media, respectiv abaterea medie ptratic a logaritmilor
valorilor pe care le ia variabila x.
Aceast repartiie este simetric (fig. 5.12, b), rezultnd din distribuia
asimetric (fig. 5.12, a) a lui f(x) prin logaritmarea valorilor variabilei.



Fig. 5.12. Trecerea de la o distribuie asimetric (a) la o repartiie simetric (b)
prin logaritmarea valorilor variabilei.


100

Se poate pune i problema invers de a trece de la distribuia simetric (lnx)
la distribuia f(x); cu alte cuvinte, se caut expresia matematic a densitii de
repartiie asimetric f(x).
Probabilitatea elementar ca variabila s ia valori n cadrul unui interval dat
trebuie s fie aceeai n ambele reprezentri. Se poate scrie deci (V. Yevjevich,
1972):

f x dx x d x x
x
dx x
x
dx ( ) (ln ) (ln ) (ln ) (ln ) = = =
1 1
. (5.32)

Rezult:

f x
x
x ( ) (ln ) =
1
. (5.32')

Densitatea de repartiie f(x) a distribuiei log-normale este definit numai
pentru valori pozitive ale lui x (x>0) i are expresia:

f x
x
x
n
n
n
( ) exp
ln
=


1
2
1
2
2

(5.33)

Parametrii statistici ai distribuiei sunt (V. T. Chow, 1964):

( )
( )

= +
=
=
= +
e
e
C e
C C C
n
n
n
n
v
s v v
2
1 2
1 2
3
2
1
1
3
2
2
(5.34)

Distribuia f(x) este asimetric, aa cum se vede i din figura 5.13 n care
s-au reprezentat pentru comparaie mai multe repartiii log-normale
(V. Yevjevich, 1972).


101


Fig. 5.13. Reprezentarea comparativ a unor repartiii log-normale.

Cazurile reprezentate sunt urmtoarele:

n
= 0 i
n
2
= 0,1; 0,5 i 2,0 (linia plin),

n
2
= 0,5 i
n
= 0; 0,5 i 1,0 (linia punctat).

Repartiia log-normal are urmtoarele proprieti: are ca limit inferioar
valoarea zero i este unimodal (prezint un singur maxim). Mai trebuie
menionat c ecuaia densitii de repartiie nu depinde de baza logaritmilor,
aceasta intervenind ca o constant.
Utiliznd un format special: logaritmic pentru ordonate i format de
probabilitate pentru abscise, funcia de repartiie pentru distribuia log-normal
se va reprezenta ca o dreapt. n cazul unei repartiii empirice, dac valorile
msurate se distribuie aproximativ dup o dreapt pe acest format, se poate
admite ipoteza repartiiei log-normale.
n general, o valoare x a unei variabile aleatoare poate fi reprezentat prin
valoarea medie x la care se adun o abatere x de la medie (V. T. Chow,
1964):

x x x
p% p%
= + . (5.35)


102
Mrimea x
p%
depinde de abaterea medie ptratic a variabilei i de un
factor de frecven K
p%
:
Deci:

x
p%
= K
p%
. (5.36)


Se obine:

x x K
p% p%
= + . (5.37)

innd seama de faptul c C
v
= / x rezult:

( )
x x C K
p% v p%
= + 1 . (5.38)

Valorile factorului de frecven K
p%
sunt date n tabelul 5.3 (V. T. Chow,
1964) i sunt exprimate n funcie de valorile lui C
s
(ales drept parametru), care
la rndul lui se calculeaz n funcie de C
v
, conform relaiei (5.34).
n tabel mai sunt trecute i valorile probabilitii corespunztoare valorii
medii a variabilei.
Factorul de frecven este pozitiv pentru probabilitile de 0,01; 0,1; 5; 20%
etc. i negativ pentru probabiliti mai mari de 50% (fig. 5.14).



Fig. 5.14. Semnificaia factorului de frecven.

103

104
5.4. REPARTIIILE GAMA

n formula densitii de repartiie a tuturor acestor funcii intervine funcia
gama a crei expresie este:

( )

=

x e dx
x 1
0
. (5.39)

Convergena integralei este asigurat pentru > 0.
Valorile funciei gama pentru cuprins ntre 1 i 2 sunt date n tabelul 5.4.
Valoarea funciei gama pentru > 2 se poate exprima n funcie de valorile
funciei pentru cuprins ntre 1 i 2.
ntr-adevr:

( )
( )


+ =

=

+

=
=

=

1
0
0
1
0
1
0
x e dx e x x e dx
x e dx
x x x
x

(5.40)
Tabelul 5.4

Funcia gama
x (x) x (x) x (x)
1,00 1,0000 1,34 0,8922 1,68 0,9050
1,02 0,9888 1,36 0,8902 1,70 0,9086
1,04 0,9784 1,38 0,8885 1,72 0,9126
1,06 0,9687 1,40 0,8873 1,74 0,9168
1,08 0,9597 1,42 0,8864 1,76 0,9214
1,10 0,9513 1,44 0,8858 1,78 0,9262
1,12 0,9436 1,46 0,8856 1,80 0,9314
1,14 0,9364 1,48 0,8857 1,82 0,9368
1,16 0,9298 1,50 0,8862 1,84 0,9426
1,18 0,9237 1,52 0,8870 1,86 0,9487
1,20 0,9182 1,54 0,8882 1,88 0,9551
1,22 0,9131 1,56 0,8896 1,90 0,9618
1,24 0,9085 1,58 0,8914 1,92 0,9688
1,26 0,9040 1,60 0,8935 1,94 0,9761
1,28 0,9007 1,62 0,8959 1,96 0,9837
1,30 0,8975 1,64 0,8986 1,98 0,9917
1,32 0,8946 1,66 0,9017 2,00 1,0000

De exemplu: (3,7) = 2,7 (2,7) = 2,7 1,7 (1,7) = 2,7 1,7 0,9086.

105
Dac 0 < < 1, din relaia (5.40) se obine:

() = 1/ ( + 1) (5.41)

De exemplu (0,7)=1/0,7 (1,7)
Alte proprieti ale acestei funcii sunt urmtoarele:

( ) 1
0
1
0
=

=

=

e dx e
x x
. (5.42)

Dac numrul este ntreg, relaia de recuren devine:

(n + 1) = n(n-1) ... 2(1) = n! (5.43)


5.4.1. REPARTIIA
1

Repartiia Gama cu 1 parametru (
1
) este definit numai pentru valori
nenegative ale lui x (x 0) i are densitatea de repartiie (fig. 5.15):

f x x e
x
( ; )
( )


=

1
1

, (5.44)

unde este un parametru al formei curbei. Din figura 5.15 (V. Yevjevich,
1972), se constat c:
pentru 0 < 1, curba este asimptotic la amndou axele;
pentru = 1, se obine o funcie exponenial f(x) = e
-x
;
pentru > 1, curba are form de clopot cu att mai turtit cu ct ia
valori mai mari; pentru > 30, distribuia Gama cu un parametru tinde ctre
repartiia normal.


Fig. 5.15. Alura repartiiei
1
pentru diferite valori ale parametrului .

106
Parametrii distribuiei sunt urmtorii:

m = ;

2
= ; = ; C
m

= =
1
;
C
s
= =
2
2


C . (5.45)

Repartiia Gama cu un parametru,
1
, nu are aplicaii directe n hidrologie,
din cauza flexibilitii ei reduse. n schimb este utilizat ca etap intermediar n
generarea numerelor aleatoare distribuite asimetric.
Dac X este o variabil normal distribuit lund valorile x
i
, atunci variabila
Y, cu valorile:

y
x m
i
i
=

1
2
2

, (5.46)

urmeaz distribuia
1
, parametrul fiind egal cu 1/2.
Suma a dou variabile independente distribuite
1
cu parametrii
1
,
respectiv
2
este distribuit de asemenea
1
cu parametrul =
1
+
2
. Prin
generalizare, suma a n variabile aleatoare independente, urmnd repartiia
1
cu
parametrii
i
(i = 1, 2, ..., n) va urma aceeai distribuie
1
, parametrul fiind
(V. Yevjevich, 1972):

=
=
i
i
n
1
. (5.47)

Fie cazul a n variabile independente normal distribuite, care se
standardizeaz cu relaia (5.4).
Variabila
1
2
2
1
t
i
i
n
=

va urma legea de repartiie


1
(V. Yevjevich, 1972), cu
parametrul:

=

=

=
= =
i
i
n
i
n
n
1 1
1
2 2
. (5.48)


107
Acest rezultat este util pentru a genera numere aleatoare distribuite
1
,
plecnd de la numere aleatoare cu repartiie normal.


5.4.2. REPARTIIA
2

Repartiia Gama cu 2 parametri (
2
) se obine din repartiia
1
, nlocuind
variabila independent x prin x/. Densitatea de repartiie
2
este definit numai
pentru valori nenegative (x 0) ale lui x:

f x x e
x
( ; , )
( )
/


. (5.49) =

1
1


Se reamintete c parametrul de form trebuie s fie mai mare dect zero,
pentru a avea asigurat convergena funciei gama. n ceea ce l privete pe ,
acesta este un parametru de scar, care este de asemenea pozitiv; pentru = 1,
se obine repartiia
1
. O reprezentare grafic a repartiiei
2
pentru constant
( = 2) se poate urmri n figura 5.16. Parametrii repartiiei sunt (V. Yevjevich,
1972):

m = ; ;
2 2
= = ; C
v
=
1

; C
s v
= =
2
2

C . (5.50)

Se observ c C
s
= 2C
v
n condiiile n care originea axelor este aleas n
punctul n care f(x) = 0.



Fig. 5.16. Densitatea de repartiie
2
.

108




Fig. 5.17. Translaia funciei
2
cu valoarea x
min
.

La schimbarea originii axelor de coordonate (ceea ce revine la o translaie de
valoare x
min
, fig. 5.17), coeficientul de variaie se modific, n timp ce
coeficientul de asimetrie este invariant; ca urmare, raportul
~
~
C
C
s
v
2 (prin i
s-au notat parametrii variabilei translatate).
~
C
s
~
C
v
Fie u
i
= x
i
+ x
min
noile valori ale abscisei. Valoarea medie este:

( )
u
u
n
x x
n
x x
i
i
n
i
i
n
=

=
+
= +
= = 1 1
min
min
. (5.51)


Abaterea medie ptratic a variabilei u (notat prin
~
) este:

( ) ( )
~
=

=
= =
u u
n
x x
n
i
i
n
i
i
n
2
1
2
1
1 1
. (5.52)


Noul coeficient de variaie , se modific astfel:
~
C
v

~
~
min min min
C
u x x x
x
x x
x
x x
C
v v
= =
+
=
+
=
+
1


. (5.53)


109

Coeficientul de asimetrie, dup cum s-a artat este invariant la translaie:

( ) ( )
~
~
C
n
u u
n
x x C
s i
i
n
i
i
n
s
= = =
= =
1 1 1 1 3
1
3
3
1
3

. (5.54)


Se noteaz cu raportul
x x
x
+
min
, care pentru x
min
> 0 este evident
supraunitar:

> 1 . (5.55)


Ca urmare:

~
~
C
C
C
C
C
C
s
v
s
v
s
v
= =
1

. (5.56)


Deoarece C
s
/C
v
= 2, iar > 1, rezult / > 2 pentru x
~
C
s
~
C
v
min
> 0.
O form echivalent a repartiiei
2
a fost obinut de K. Pearson studiind
limitele unor repartiii binomiale asimetrice; n expresia densitii de repartiie
intervin 3 parametri, dar numai doi dintre acetia sunt independeni.
Densitatea de repartiie n forma dat de Pearson (fig. 5.18) este:

f x f a d f e
x
a
x d
a d
( ; , , )
/
/
0 0
1 = +

. (5.57)

Notaiile au urmtoarea semnificaie:

f
o
este ordonata maxim (corespunztoare modului);
d - distana dintre medie i mod;
a - diferena dintre mod i x
min
(valoarea variabilei pentru care
f(x) = 0).


110


Fig. 5.18. Semnificaia notaiilor din forma Pearson III a distribuiei
2
.

Domeniul de valabilitate al funciei este cuprins ntre x = - a i x = +
(M. Constantinescu .a., 1956).
Un parametru din forma Pearson III (de regul f
o
) poate fi eliminat
impunnd condiia ca f(x) s reprezinte o densitate de repartiie (deci suprafaa
cuprins ntre curb i axa Ox s fie egal cu unitatea):

f e
x
a
dx
x d
a d
0
1

+
+


=
/
/
1 . (5.58)

Ca rezultat al integrrii, f
o
va fi exprimat n funcie de ceilali doi parametri:
a i d.
Funciile:

f x x e
x
( ; , )
( )
/


=

1
1


(5.59)

i:

f x f a d f e
x
a
x d
a d
( ; , , )
/
/
0 0
1 = +

(5.59')

reprezint aceeai distribuie
2
i amndou au doar doi parametri
independeni. Relaiile dintre aceti parametri sunt urmtoarele:

a
d
= 1 . (5.60)

111
d = (5.61)

De aici rezult:

a = ( - 1) (5.62)

i:

d = (5.63)

De asemenea, se pot obine parametrii i n funcie de a i b:

= d (5.64)

= + =
+
1
a
d
a d
d
.

Dup cum s-a artat, curbele de tip Pearson III sunt deosebit de adecvate
pentru studiul repartiiei debitelor maxime de pe rurile din Romnia; n general
d 0, iar asimetria este pozitiv.
Relaia de calcul a debitelor Q
p%
cu probabilitatea de depire p% prin
metoda momentelor este similar cu cea utilizat la repartiia log-normal:

( )
Q Q C
p% v p%
= + 1 . (5.65)

n aceast relaie Q este debitul mediu, C
v
coeficientul de variaie, iar
p
%
reprezint abaterile ordonatelor curbei probabilitilor de depire fa de medie,
n cazul unei curbe standardizate avnd Q =1 i C
v
=1 (fig. 5.19).


Fig. 5.19. Semnificaia abaterii
p%
.

112


113





114
Prin calcule se determin valoarea medie Q i coeficientul de variaie C
v
;
coeficientul de asimetrie se alege n funcie de C

. Valorile
p%
sunt date n
tabelul 5.5, n funcie de coeficientul de asimetrie C
s
i de probabilitatea de
depire p%. Se reamintete c repartiia Pearson III este valabil pentru
C
s
> 2C

(deoarece x
min
> 0).
Pentru C
s
= 0, curba obinut este simetric, reprezentnd de fapt ordonatele
probabilitii de depire a repartiiei normale. Utiliznd pentru reprezentare
formatul de probabilitate, repartiia normal se va desena ca o dreapt. Pe
acelai format, curbele Pearson III avnd C
s
> 0 au o curbur cu att mai
pronunat, cu ct coeficientul de asimetrie este mai mare.
n figura 5.20 se poate urmri influena parametrilor C

i C
s
asupra curbei
probabilitilor de depire: cu linie punctat s-au figurat situaii n care C
s
= 0
(variind C

), iar cu linie plin s-au desenat curbe ale probabilitilor de depire


pentru valori cresctoare ale lui C
s
, meninnd C

constant (C

= 1).
Metoda momentelor reprezint un mod de calcul, deosebit de expeditiv, dar
cu o flexibilitate redus, utiliznd valori prestabilite ale raportului C
s
/C
v
.
O metod cu performane superioare este metoda celor mai mici ptrate care
conduce direct la evaluarea parametrilor i ai densitii de repartiie. n
continuare, dispunnd de valorile lui i se poate obine prin ncercri
debitul Q
p%
care corespunde unei probabiliti p% date; acest debit reprezint
limita inferioar de integrare a densitii de repartiie f(x; , ):

( )
f x dx p
Q
p
; , %
%

+

= . (5.66)


5.4.3. REPARTIIA
3

Repartia Gama cu 3 parametri (
3
) se obine dac n repartiia
1
se
nlocuiete x prin
x

:

( ) ( )
( )
f x x e
x
; , ,
( )
/



=
1 1

, (5.67)
unde:

115
este parametrul de form;
- parametrul de scar;
- limita inferioar a valorilor distribuiei: 0 x < ( 0).
Schimbarea de variabil y=x- reduce distribuia
3
la
2
, iar relaia
z = (x -)/ transform repatiia
3
n
1
. Transformrile inverse sunt utilizate n
procedeele de generare a numerelor aleatoare, pentru a obine din variabile
aleatoare independente distribuite
1
variabile cu repartiia
2
sau
3
.
O repartiie triparametric a fost obinut de S. N. Kriki i M. F. Menkel
din distribuia Pearson III printr-o transformare de tipul u = ax
b
.
Curbele binomiale-exponeniale Kriki-Menkel sunt valabile pentru orice
raport C
s
/C

(se reamintete c n cazul repartiiei Pearson III C


s
> 2C

);
densitatea de repartiie este (Manoliu, Roman, 1983):

f(u) = u
-1
e
-u
/ () , (5.68)

unde:

( )
( )
u
b
x
m
b
=
+

1
. (5.69)

Cei trei parametri ai repartiiei sunt: , b i m; parametrul m este chiar
valoarea medie a repartiiei.
Din cauza expresiei foarte complicate a densitii de repartiie, aceti
parametri nu pot fi exprimai direct n funcie de datele empirice. n aceste
condiii ordonatele teoretice ale curbei probabilitilor de depire sunt tabelate
pentru anumite situaii particulare ( Q = 1 i valori precizate ale raportului
C
s
/C

).
Pentru utilizarea practic a acestor tabele, trebuie ca pe baza datelor empirice
s se evalueze coeficientul de variaie i coeficientul de asimetrie (calculul are
la baz metoda momentelor).
Dup determinarea lui C
s
i C


, ordonatele teoretice cu diverse probabiliti
de depire p% se obin cu relaia:

Q Q k
p% p%
= , (5.70)
unde k
p%
reprezint coeficieni modul, tabelai de Kriki-Menkel, i care sunt
definii n funcie de raportul C
s
/C

de valoarea lui C

i de probabilitatea de
depire p% (tab. 5.6).

116

117

118

119

120

121

122

123
Fcnd comparaia cu relaia:

( )
Q Q C
p% v p%
= + 1 ,

utilizat la repartiia Pearson III, rezult c mrimea k
p%
joac acelai rol ca
factorul 1 + C


p%
.
Cu alte cuvinte, coeficienii modul reprezint nsi ordonatele curbei pro-
babilitilor de depire pentru o repartiie Kriki-Menkel avnd valoarea medie
unitar (fig. 5.21).



Fig. 5.21. Interpretarea coeficienilor modul.

n cazul n care raportul C
s
/C

= 2, ordonatele curbei probabilitilor de


depire sunt aceleai, indiferent dac s-au folosit curbele Kriki-Menkel sau
Pearson III; cu alte cuvinte, n acest caz particular, valorile k
p%
i (1 + C


p%
)
sunt egale.
n general ns, n zona probabilitilor mici, curbele Kriki-Menkel conduc
la calcule mai acoperitoare (valori ale debitelor maxime mai mari pentru o
probabilitate dat i pentru acelai C

i C
s
) fa de repartiia Pearson III
(Diaconu, Lzrescu, 1977). Diferene sensibile ntre cele dou curbe se
nregistreaz de asemenea n cazul unor coeficieni de variaie mari.
i n cazul repartiiei Kriki-Menkel, utilizarea metodei celor mai mici
ptrate permite o determinare rapid a parametrilor cu condiia de a dispune de
un program de calcul adecvat; n lipsa acestuia calculele pot fi efectuate, n mod
expeditiv, utiliznd procedeul expus anterior.



124
5.4.4. CORECIA DE SIGURAN Q
P%

Debitele maxime teoretice cu probabilitatea de depire p% (notate prin
Q
p%
) calculate conform metodologiei expuse n paragrafele 5.3, 5.4.2 i 5.4.3
sunt utilizate pentru dimensionarea unor lucrri hidrotehnice (evacuatori de ape
mari la baraje, alegerea nlimii batardourilor i a diametrului galeriilor de
deviere a apelor n faza de construcie, stabilirea cotei digurilor de aprare
mpotriva inundaiilor etc.)
Subevaluarea mrimii debitului Q
p%
ar avea, consecine foarte grave; se
apreciaz c circa 20% din accidentele nregistrate la baraje n exploatare se
datoresc subdimensionrii descrctorilor de ape mari.
Ca urmare, pentru construcii din clasa I, II, III de importan, stabilite
conform STAS 4273-80, la debitele maxime corespunztoare probabilitilor de
verificare se adaug o corecie de siguran Q
p%
evaluat cu formula
(C. Mociornia .a., 1979, M. Constantinescu .a., 1956):

Q
a E
n
Q
p%
p%
p%
= . (5.71)



Fig. 5.22. Valorile coeficientului de corecie E
p%
.


125
n aceast relaie:
Q
p%
este debitul cu probabilitatea de depire p%;
a - un factor care ine cont de calitatea observaiilor i are urmtoarele
valori:
a = 0,70 pentru rurile care se gsesc n regiuni bine studiate
din punct de vedere hidrologic;
a = 0,50 pentru fluviul Dunrea;
a = 1,00 pentru rurile din zone slab studiate din punct de
vedere hidrologic.
E
p%
- un factor de corecie care depinde att de valoarea coeficientului de
variaie C
v
, ct i de probabilitatea de calcul p%.
Valorile coreciei E
p%
se obin din figura 5.22 (C. Mociornia .a., 1979).
Mai trebuie menionat c valoarea coreciei Q
p%
nu trebuie s depeasc
20% din valoarea debitului la care se aplic.


5.5. REPARTIIA GUMBEL

Spre deosebire de repartiiile analizate pn n prezent, care erau definite
prin densitatea f(x), n acest caz distribuia este exprimat sub forma funciei de
repartiie, datorit simplitii acesteia:

( ) ( )
( )
F x a c ob X x
a x
c
; , Pr exp exp = < =
+

(5.72)

unde x (-, +); a i c sunt parametrii distribuiei i pot fi evaluai prin
metoda momentelor (V. T. Chow, 1964):

a = c - m ;

c =
6

. (5.73)

Constanta lui Euler are valoarea = 0,57721; m i sunt: valoarea medie,
respectiv abaterea standard. Coeficientul de asimetrie C
s
este constant:
C
s
= 1,139.


126
Prin transformarea y = (a + x)/c, se obine:

F x e
e
y
( ) =


. (5.74)

Dezvoltnd aceast expresie n serie de puteri i neglijnd termenii de
ordinul 2, rezult:

F x e
y
( )

1 , (5.75)

care constituie o expresie aproximativ pentru funcia de repartiie.
Considernd funcia:

F x e
e
y
( ) =


. (5.76)

prin dubl logaritmare se obine relaia liniar:

( ) [
1
c
x a F x + = ln ln ( )
]
2
. (5.77)

Deci o scar dublu logaritmic pe abscis i o scar cartezian pentru
ordonat vor conduce la o distribuie liniarizat (V. Yevjevich, 1972).
Gumbel a utilizat primul aceast repartiie pentru studiul probabilistic al
debitelor de viitur; distribuia Gumbel conduce ns, pentru probabiliti de
depire p% reduse, la valori Q
p%
mai mici dect cele obinute prin utilizarea
repartiiei Pearson III sau Kriki - Menkel i din acest motiv este mai puin
folosit.


5.6. REPARTIII STATISTICE AUXILIARE

Aceste repartiii nu sunt folosite ca modele ale distribuiei unor variabile
hidrologice, ci pentru verificarea ipotezelor statistice sau pentru obinerea
intervalelor de ncredere pentru media sau dispersia teoretic (J.W. van der
Made, 1987).
Repartiia
2
(hi - ptrat). Dac X
1
, X
2
, ..., X
n
sunt variabile aleatoare
independente, normale, normate, atunci suma ptratelor variabilelor X
i

reprezint o variabil aleatoare, notat prin
2
:

2
1
2
2
2
= + + + X X X
n
... . (5.78)

127
Densitatea de repartiie a distribuiei
2
cu n grade de libertate este definit
numai pentru valori nenegative ale lui x:

( )
f x n
n
x e
n
n x
;
/
=


1
2
2
2
2
1
2

. (5.79)

Numrul gradelor de libertate reprezint numrul valorilor variabilei ale
cror probabiliti de realizare sunt independente.
Distibuia
2
este de tip continuu, fiind definit pentru orice valoare din
intervalul [0, +).
Argumentul x rezultnd ca o sum de ptrate, va fi notat n continuare prin

2
; funciile f(x) sau f(
2
) sunt asimetrice pentru valori mici ale lui n, tinznd
ctre repartiia normal pe msur ce n crete (fig. 5.23).



Fig. 5.23. Densitatea de repartiie i funcia de repartiie a distribuiei
2
.

Media repartiiei este n, iar dispersia este egal cu 2n.
n practic, pentru verificarea ipotezelor statistice, prezint interes funcia de
probabilitate complementar F
c
(
2
):

( ) ( )
F ob
c

2 2 2
= Pr = . (5.80)

n relaia de definiie a lui F
c
(
2
), valoarea a reprezint o probabilitate care
se numete prag de semnificaie; valorile uzuale ale lui sunt: = 0,01; 0,05 i
0,10 (Iliescu, Vod, 1977). Mrimea (notat i prin sau ) se mai
numete punct critic i reprezint acea valoare a variabilei

0
2

cr
2
2
a crei
probabilitate de depire este (fig. 5.24).

128

129


Fig. 5.24. Semnificaia punctului critic n distribuia
2
.

Valorile punctului critic sunt tabelate n funcie de numrul de grade de
libertate i de probabilitatea de a fi depite (tab. 5.7).

0
2
Repartiia
2
este de asemenea utilizat n definirea unor intervale de
ncredere. Aceste intervale conin cu o probabilitate (1 - ) valoarea adevrat a
parametrului; probabilitatea ca valoarea teoretic s se gseasc n afara
intervalului ( ) este deci egal cu (aria haurat din fig. 5.25).
min max
;
2 2



Fig. 5.25. Interval de ncredere
( )

min max
,
2 2
.

Repartiia
2
intervine n definirea altor dou distribuii auxiliare; repartiia t
(sau Student) a lui Gosset i repartiiile Z i F ale lui Fischer.
Repartiia t (Student). Dac X i Y sunt dou variabile aleatoare
independente, X urmnd o repartiie normal de medie 0 i abatere medie
ptratic , iar Y o repartiie
2
, cu n grade de libertate, atunci variabila
aleatoare:

t
x
y n
=
/
(5.81)

130

urmeaz o repartiie Student cu n grade de libertate. Variabila t este continu
i aparine intervalului (-, +), iar densitatea ei de repartiie este:

( )
f t n
n
n
n
t
n
n
; =
+

+
1
1
2
2
1
2
1
2

. (5.82)

Aceast funcie este simetric: f(-t)= f(t) i F(-t)= 1 - F(t); cnd numrul
gradelor de libertate crete foarte mult, repartiia t tinde ctre repartiia normal.
Valorile t, corespunztoare unei probabiliti de depire sunt de asemenea
tabelate (Panaite, Munteanu, 1982; Moineagu .a., 1976).
Repartiia F a lui Fisher-Snedecor. Dac Y
1
i Y
2
sunt dou variabile
aleatoare independente, urmnd amndou o repartiie
2
cu n
1
, respectiv n
2

grade de libertate, atunci raportul:

x
y n
y n
=
1 1
2 2
/
/
, x > 0 . (5.83)

reprezint o variabil aleatoare care are densitatea de repartiie:

( ) ( )
f x n n
n n
n n
n n
x n n x
n n
n
n n
; ,
/ /
1 2
1
2
2
2 1 2
1 2
2
1
2 1
2
1 2
1
1 2
2
2 2
=

+


. (5.84)

Aceast densitate de repartiie definete distibuia F a lui Fisher cu n
1
i n
2

grade de libertate; aceast repartiie este, de asemenea, tabelat (Panaite,
Munteanu, 1982; Moineagu .a., 1976).

131




6. INTERVALE DE NCREDERE

Valorile teoretice ale parametrilor repartiiilor statistice sunt estimate n
funcie de valorile de selecie (x
1
, x
2
, ..., x
n
) prin diverse metode (metoda
momentelor, metoda verosimilitii maxime sau metoda celor mai mici ptrate).
Valorile teoretice astfel calculate au un caracter punctual; n acelai timp,
valorile rezultate depind de volumul seleciei. Este evident c, cu ct volumul
seleciei va fi mai mare, cu att estimaiile punctuale ale parametrilor se apropie
din ce n ce mai mult de valorile reale ale parametrilor populaiei.
Cu alte cuvinte, fiecare parametru determinat pe baza unei selecii aleatoare
este el nsui o variabil aleatoare, a crei distribuie depinde de volumul
seleciei.
O metod de evaluare a valorii teoretice, care s in seama i de volumul
seleciei, const n definirea unui interval de ncredere care s conin (cu o
anumit probabilitate) valoarea teoretic a parametrului estimat pe baz de
msurtori.
Se noteaz cu (1-) coeficientul de ncredere sau probabilitatea apartenenei
la interval; reprezint deci probabilitatea ca parametrul s se gseasc n afara
intervalului estimat. Evident, trebuie s fie ct mai redus (de obicei calculul se
efectueaz considernd = 1% sau 5%).
Stabilirea intervalului de ncredere constituie o operaie ulterioar evalurii
punctuale a parametrilor. n mod uzual se stabilesc intervale de ncredere pentru
media i dispersia teoretic.
Interval de ncredere pentru media teoretic. Fie m i
2
media,
respectiv dispersia teoretic, iar x i s
2
media, respectiv dispersia de selecie.
Media de selecie x este o variabil aleatoare, avnd:

media M( x ) = m .
(6.1)
dispersia D
2
( x )=

2
n
.

Se poate arta ca media m este cuprins n intervalul:

( ) ( )
x z
s
n
x z
s
n
+

; , (6.2)

132
unde z(a) se determin, dup cum se va arta n continuare, din tabelele
repartiiei normale sau Student, funcie de volumul n al seleciei.
Se va nota prin U, valoarea normat a mediei de selecie:

( )
( )
U
x M x
D x
x m
n
=

=

2

, (6.3)

unde pentru M( x ), i D
2
( x ) s-au utilizat expresiile (6.1), respectiv (6.2).
Se consider intervalul (-z, z) simetric n raport cu originea, care conine
variabila normat U cu o probabilitate egal cu 1-:

Prob ( |U| < z ) = 1 - . (6.4)

Referitor la distribuia variabilei U, se disting urmtoarele cazuri (Dinescu,
Svulescu, 1978):
a) Pentru un volum mare al seleciei (n > 30), variabila U are o repartiie
normal (indiferent care este repartiia variabilei teoretice); proprietatea se
menine i n cazul n care
2
este necunoscut fiind estimat prin dispersia de
selecie s
2
.
Se reamintete c n cazul repartiiei normale normate se poate scrie:

Prob ( |U| < z ) = Prob (-z < U < z) = (z) - (-z) =

= (z) - (1 - (z)) = 2(z) - 1 (6.5)

Deci:

2(z) - 1 = 1 - (6.6)

sau:

( ) z = 1
2

. (6.6')

n aceast ecuaie, probabilitatea (1 - ) a apartenenei la interval este
cunoscut, fiind fixat apriori; din tabelul funciei lui Laplace rezult imediat
necunoscuta z().
Astfel, pentru 1 - = 90% rezult z = 1,64 ;
1 - = 95% z = 1,96 ;
1 - = 99% z = 2,58 .

133
b) Pentru un volum redus al seleciei (n < 30), dac repartiia variabilei este
normal, iar dispersia
2
este aproximat prin s
2
, variabila U are o repartiie
Student cu (n - 1) grade de libertate.
Repartiia Student este tabelat cu ajutorul funciei complementare
F
c
(z)=1-F(z). Prin urmare, marginile intervalului (-z, +z) corespunztoare
coeficienilor de ncredere (1 - ) se determin prin rezolvarea ecuaiei:

Prob ( |U| < z ) = , (6.7)

unde variabila U urmeaz o repatiie Student cu n-1 grade de libertate.
n continuare se dau orientativ valorile z() corespunztoare lui (1-)=95%,
respectiv 99% pentru grade de libertate cuprinse ntre 11 i 30.

Tabelul 6.1

n-1
1-
11 12 13 14 15 16 17 18 19 20
1-=95% 2,201 2,179 2,160 2,144 2,131 2,120 2,110 2,100 2,093 2,086
1-=99% 3,106 3,054 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845

n-1
1-
21 22 23 24 25 26 27 28 29 30
1-=95% 2,080 2,074 2,069 2,064 2,059 2,055 2,052 2,048 2,045 2,042
1-=99% 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750

Dup determinarea valorilor z = z(), intervalul de ncredere pentru media
teoretic rezult imediat:

<

< z
x m
n
z ( ) ( )

(6.8)

sau, aproximnd dispersia teoretic prin dispersia de selecie, rezult aa cum
s-a artat deja:

x z
s
n
m x z
s
n
< < + ( ) ( ) . (6.9)

Interval de ncredere pentru dispersia teoretic. Ca estimator punctual al
dispersiei teoretice
2
se va utiliza dispersia de selecie:

134
( )
s
n
x x
i
i
n
2
2
1
1
1
=


=
. (6.10)

Dispersia de selecie este o variabil aleatoare (Dinescu, Svulescu, 1978)
avnd:

media
( )
M s
n
2 2
1
1
=


2
; (6.11)

(pentru n suficient de mare media acestui estimator este egal cu dispersia
teoretic);

dispersia
( )
D s
m
n
2 2 4
4


. (6.12)

Presupunnd n plus c repartiia dispersiei de selecie este normal,
momentul centrat de ordinul patru m
4
= 3
4
i deci:

( )
D s
n
2 2 4
2
. (6.13)

Intervalul de ncredere pentru dispersia teoretic se calculeaz cu relaia
(Dinescu, Svulescu, 1978):

( ) ( )
n s n s
< <
1 1
2
2
2
2
2

max min
. (6.14)

Dac coeficientul de ncredere (1-) este foarte apropiat de 1 (probabilitatea
% este mic), cele dou suprafee haurate din figura 5.26 pot fi presupuse
egale, fiecare avnd o probabilitate egal cu /2.
Marginea inferioar i superioar a intervalului de ncredere rezult deci din
rezolvarea ecuaiilor:
( )
Pr
max
ob

2 2
2
> = ; (6.15)

( )
Pr
min
ob

2 2
1
2
> = . (6.16)


135
De exemplu, pentru = 5% i un numr de grade de libertate cuprins ntre 9
i 20, marginile i au urmtoarele valori (tab. 6.2):
min
2

max
2

Tabelul 6.2

n-1

2
9 10 11 12 13 14 15 16 17 18 19 20

min
2

2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,81 7,56 8,23 8,91 9,59

max
2

19,00 20,50 21,90 23,30 24,70 26,10 27,50 28,80 30,20 31,30 32,90 34,20

Dup obinerea lui i i evaluarea dispersiei de selecie s
min
2

max
2
2
,
intervalul care conine cu probabilitatea (1 - ) valoarea adevrat
2
a
dispersiei se calculeaz cu relaia (6.14).
Interval de ncredere pentru abaterea standard. Abaterea standard, la fel
ca i dispersia din care deriv, este de asemenea o variabil aleatoare.
Valoarea medie a acestei variabile este (V. Yevjevich, 1972):

M(s) = , (6.17)

iar dispersia:

D s
m
n
2
4
4
2
4
( ) =

. (6.18)

Admind c abaterea standard de selecie este normal distribuit
(deci m
4
=3
4
), se pot utiliza urmtoarele expresii simplificate:

M(s) = (6.17')

D s
n
2
2
2
( ) =

. (6.18')

Intervalul de ncredere pentru abaterea standard de selecie va fi deci:

s z s n s z s n < < + ( ) / ( ) / 2 2 . (6.19)

De cele mai multe ori n hidrologie intereseaz intervalele de ncredere
pentru doi sau trei parametri simultan (adic pentru toi parametrii din
distribuiile hidrologice uzuale).

136



Fig. 6.1. Elipsa de ncredere pentru parametrii m i .

n acest caz vor fi definite regiuni de ncredere: pentru doi parametri rezult
o elips, iar pentru trei parametri un elipsoid de ncredere (V. Yevjevich, 1972).
Cu alte cuvinte zona de ncredere nu este un dreptunghi sau un paralelipiped
construit prin limitele intervalelor de ncredere al fiecrui parametru ci are o
extindere mai restrns. O exemplificare pentru cazul a doi parametri (m i ) se
poate urmri n figura 6.1.




137




7. VERIFICAREA IPOTEZELOR STATISTICE

O problem important n hidrologie o constituie determinarea probabilitii
de depire a debitelor maxime anuale; poate fi necesar de asemenea repartiia
nivelurilor sau a debitelor minime dintr-o anumit seciune.
n toate aceste situaii intereseaz care este repartiia teoretic cea mai
adecvat datelor din observaiile empirice. Ca urmare, se propune o anumit
ipotez statistic (de exemplu o repartiie de tip log-normal), urmnd ca pe
baza unui test statistic aceast ipotez s fie confirmat sau respins. Acceptarea
sau respingerea unei ipoteze statistice are un caracter probabilistic i nu implic
siguran absolut (certitudine sau probabilitate de 100%).
n limbaj statistic, ipoteza iniial (care trebuie testat) se numete ipoteza
nul i se noteaz prin H
0
.
Erorile care se fac n verificarea ipotezelor statistice sunt de dou tipuri
(B. Bobe, 1991):
a) respingerea ipotezei H
0
cnd ea este adevrat; riscul acceptat al acestei
situaii notat prin are n mod uzual valori reduse: = 0,01 ; 0,05 sau 0,10;

= Prob (respingere H
0
H
0
adevrat) , (7.1)

b) acceptarea ipotezei H
0
cnd ea este fals; riscul respectiv se noteaz
prin :

= Prob (acceptare H
0
H
0
fals) . (7.2)

Probabilitatea se numete pragul de semnificaie al testului, iar 1-
(probabilitatea de respingere a lui H
0
cnd ea este fals) puterea testului.
Cele mai utilizate teste statistice n hidrologie sunt urmtoarele (Cicioni .a.,
1984): hi - ptrat, Kolmogorov - Smirnov i Cramer - Von Mises.
Testul hi - ptrat (
2
). Fie un numr de n valori obinute din nregistrri
(niveluri de exemplu pentru construirea graficului de frecven i durat).
Aceste date se grupeaz ntr-un numr de k intervale; se noteaz cu n
i
numrul
de valori din intervalul i.


138
Evident, este verificat relaia:
n
1
+ n
2
+ ... +n
k
= n , (7.3)

unde n
i
reprezint frecvene absolute empirice (numrul de apariii ale
variabilei n cadrul fiecrui interval). n acelai timp, numrul de grade de
libertate ale variabilei este k-1 (numrul intervalelor minus unu); cu alte cuvinte
cunoscnd k-1 valori ale lui n
i
, valoarea n
k
rezult din relaia (7.3).
Se presupune c variabila empiric urmeaz o anumit repartiie teoretic
(sugerat eventual i de reprezentarea grafic a datelor din msurtori).
Pentru fiecare clas (interval) i se poate calcula probabilitatea teoretic p
i
a
apartenenei la acel interval. Dac x
i-1
i x
i
sunt marginile intervalului, p
i
se va
obine cu una din relaiile:

p f x
i
x
x
i
i
=

( )
1
dx (7.4)

sau:

p
i
= F(x
i
) - F(x
i-1
) . (7.5)

Pentru orice repartiie teoretic, f(x) sau F(x) sunt cunoscute i deci evaluarea
lui p
i
nu ridic probleme. Cunoscndu-l pe p
i
se pot calcula imediat frecvenele
absolute teoretice ale fiecrui interval, acestea fiind reprezentate de produsul np
i
Abaterile n
i
- np
i
dintre frecvenele absolute teoretice i cele empirice
reprezint o variabil aleatoare; se poate demonstra c variabila auxiliar:


calculat c
i i
i
i
k
k k
k
n np
np
n np
np
n np
np
n np
np
2 2
2
1
1 1
2
1
2 2
2
2
2
= =

=
=

+

+ +

=
( )
( ) ( )
...
( )
(7.6)

urmeaz la limit o repartiie
2
. Numrul de grade de libertate al acestei
variabile nu este, ns, k - 1, ci k - - 1, unde reprezint numrul parametrilor
repartiiei teoretice, care au fost estimai cu ajutorul datelor din msurtori.

139
Variabila urmeaz deci o repartiie
c
2
2
cu = k - - 1 grade de libertate.
Pentru un numr dat de grade de libertate din tabelele repartiiei
2
se poate
determina valoarea (sau ) corespunztoare pragului de semnificaie
ales; reprezint valoarea

,
2

c
2

,
2
2
cu grade de libertate i a crei probabilitate
de depire este (fig. 5.23).
Ipoteza statistic propus este acceptat dac < (concordana
ntre repartiia teoretic propus i cea empiric este bun) i este respins dac:
> .

calculat
2

,
2

calculat
2

,
2
Fie de exemplu cazul unor niveluri hidrologice la care domeniul de variaie a
fost mprit n 11 clase; se testeaz ipoteza distribuiei normale (=2, deoarece
doi parametri: m i sunt estimai pe baza datelor din msurtori). Numrul de
grade de libertate este : = 11 - 2 - 1 = 8; variabila
2
cu 8 grade de libertate i
un prag de semnificaie de 1% are valoarea = 20,1.
8 1%
2
;
Presupunnd c = 18, ipoteza normalitii poate fi acceptat,
deoarece < .
calculat
2

calculat
2

8 1%
2
;
mprirea n clase de echivalen egale a domeniului de variaie al variabilei
presupune existena unui numr mare de valori din msurtori (cel puin cte 5
n fiecare clas - Dinescu, Svulescu, 1978); aceast situaie se ntlnete mai
rar n hidrologie.
n cazul n care n < 30 se recurge (Cicioni .a., 1984) la mprirea n clase
de probabiliti empirice egale, probabilitatea fiecrei clase fiind egala cu 1/k
(unde k este numrul intervalelor). n acest caz intervalele corespunztoare
crora li se calculeaz probabilitile teoretice nu mai sunt egale; marginile
intervalelor sunt: x
i
-(x
i
-x
i-1
)/2, respectiv x
i
+(x
i+1
-x
i
)/2.
Testul Kolmogorov - Smirnov. Fie F
*
(x) funcia de repartiie empiric a
celor n date obinute pe baz de msurtori i F(x) funcia de repartiie teoretic
propus pentru aproximarea distribuiei empirice.
Se noteaz cu d valoarea maxim a diferenei dintre valorile celor dou
funcii:

d F x F = max ( ) ( )
*
x , (7.7)

unde F
*
(x) este calculat cu formula i/(n+1).
Conform teoremei lui Kolmogorov:

Pr ( ) ob d
n
K

= =

1 . (7.8)

140
unde:

K e
k k
( ) ( )

=

+
1
2
2 2
, (7.9)

iar este un numr real care depinde de valoarea aleas pentru pragul de
semnificaie : =().
Funcia K() se calculeaz conform relaiei (7.9) i este tabelat; ca urmare
pentru un prag de semnificaie ales rezult imediat .

De exemplu: pentru = 1% K() = 0,99 = 1,63 ;
= 5% K() = 0,95 = 1,36 ;
= 10% K() = 0,90 = 1,23 .
Cu astfel determinat se calculeaz raportul / n ; dac d < / n se
accept ipoteza concordanei dintre repartiia teoretic i cea empiric; n caz
contrar, ipoteza este respins.
Testul Cramer - von Mises. i n acest caz se calculeaz abaterile dintre
valorile funciei de repartiie empirice i cele ale unei repartiii teoretice
propuse. Se noteaz cu C aceast variabil aleatoare, definit ca o integral
Stieltjes:

[ ]
C F x F x df =

+
*
( ) ( ) ( )
2
x . (7.10)

n practic se folosete o relaie mai comod pentru calcule (Cicioni .a.,
1984):

C
n
F x
i
n
calculat i
i
n
= +

=
1
12
2 1
2 1
2
( . (7.11)

Variabila C este distribuit dup legea definit de Anderson-Darling n anul
1952. Valorile cele mai des utilizate ale lui sunt: C
1

= 1% C
0,99
= 0,743

= 5% C
0,95
= 0,461
= 10% C
0,90
= 0,347


141
Ipoteza H
0
este acceptat dac C
calculat
i este respins n caz contrar. C
1
Cele trei teste prezentate (
2
, Kolmogorov - Smirnov i Cramer von Mises)
au fost utilizate comparativ pentru verificarea ipotezelor statistice privind
debitele maxime anuale la circa 108 staii hidro (Cicioni .a., 1984) i perioade
cuprinse ntre 27 i 46 de ani. Pragul de semnificaie a fost considerat de 5%
i 10%. Cea mai mare satisfacie a oferit testul
2
, iar dintre repartiiile
examinate distribuia lognormal cu 2 parametri. Testele
2
, Kolmogorov -
Smirnov i Cramer von Mises pot fi aplicate indiferent de ipoteza privind tipul
repartiiei statistice teoretice.
Exist o serie de alte teste (Lilliefors, Massey, Shapiro Wilk, D'Agostino
etc.), utilizabile numai pentru verificarea ipotezei de normalitate i care pot fi
aplicate chiar n cazul unui numr mai mic de valori. Evident, pentru aplicarea
acestor teste valorile variabilelor trebuie simetrizate prin logaritmare.
Teste pentru analiza omogenitii hidrologice. Deducerea unor relaii de
sintez este posibil numai pe zone omogene din punct de vedere hidrologic.
Pentru testarea ipotezei de omogenitate se poate folosi testul F (care utilizeaz
repartiia F a lui Fisher - Snedecor).
Omogenitatea se refer la o anumit caracteristic hidrologic
(Vladimirescu, 1978): debit mediu anual, precipitaie medie anual etc. Dac
dispersiile teoretice ale acestor variabile pentru dou staii sunt egale
omogenitatea poate fi admis.
Din punct de vedere matematic problema poate fi formulat astfel: fiind date
dou populaii normale (sau eventual normalizate prin logaritmare) avnd
dispersiile teoretice i se cere s se verifice ipoteza statistic:
1
2

2
2

H
0
: = cu alternativa H
1
2

2
2
1
:
1
2

2
2

Dispersiile teoretice sunt estimate cu ajutorul dispersiilor de selecie
i , unde este o variabil aleatoare cu n s
1
2
s
2
2
s
1
2
1
- 1 grade de libertate, iar
are n
s
2
2
2
- 1 grade de libertate (n
1
, respectiv n
2
reprezint numrul de valori
nregistrate la fiecare staie).
Se calculeaz raportul:

F
s
s
calculat
=
2
2
1
2
(unde > ) (7.12) s
1
2
s
2
2


142
Dac F
calculat
> ipoteza H F
n n
2 1
1 1 1 ; ;
0
este respins ( este pragul de
semnificaie al testului, iar se obine din tabelele repartiiei
Fisher - Snedecor).
F
n n
2 1
1 1 1 ; ;
n cazul n care intereseaz omogenitatea unui teritoriu mai larg (care
cuprinde mai multe staii), se calculeaz coeficientul de neomogenitate F
calculat

cu relaia (7.12); dac aceasta depete limita critic F, omogenitatea este
exclus (V. T. Chow, 1964; Vladimirescu, 1978).
Dac se pune problema excluderii unei singure staii (dispersia ataat
variabilei examinate este diferit de a celorlalte staii) se poate utiliza testul
Cochran (Iliescu, Vod, 1977).


143




8. VARIABILE ALEATOARE N - DIMENSIONALE


8.1. FUNCIE DE REPARTIIE I DENSITATE DE REPARTIIE

Prin generalizare, noiunile de funcie de repartiie i densitate de repartiie
de la variabilele unidimensionale se pot extinde i la variabilele aleatoare
n-dimensionale.
Dac X = (X
1
, X
2
, ....., X
n
) este o variabil aleatoare n-dimensional (sau un
vector aleator de componente X
1
, X
2
, ....., X
n
), atunci funcia:

F(x)= F(x
1
, x
2
, ..., x
n
) = Prob [(X
1
< x
1
), (X
2
< x
2
), ..., (X
n
< x
n
)]
(8.1)

se numete funcie de repartiie a variabilei n-dimensionale X; x reprezint un
punct aleator de coordonate x
i
n spaiul n-dimensional.
Cu alte cuvinte, funcia de repartiie reprezint n acest caz (Moineagu .a.,
1976) probabilitatea realizrii simultane a unui numr de n inegaliti de tipul:

X
i
< x
i
(i = 1, ...., n). (8.2)

Funcia f cu proprietatea c:

... ( , ,..., ) ... ( , ,..., )


=

x x
n n
x
f u u u du du du F x x x
n 2 1
1 2 1 2 1 2 n
(8.3)

se numete densitatea de repartiie sau densitatea de probabilitate a
variabilei n-dimensionale X.
i pentru cazul n-dimensional se pstreaz o serie de proprieti de la
variabilele uni-dimensionale; de exemplu:

f(x) = f(x
1
,, x
2
, ..., x
n
) 0 (8.4)


144
... ( , ,..., ) ...

+

=

x x
n
f u u u du du du
2 1
1 2 1 2
1
n
(8.5)

f(x) = f(x
1
,, x
2
, ..., x
n
)=


n
n
n
F x x x
x x x
( , , ... , )
...
1 2
1 2
. (8.6)

Cunoscnd funciile F(x) sau f(x), adic repartiia ntregului sistem de
variabile aleatoare, se pot obine expresiile funciei de repartiie sau a densitii
de repartiie pentru orice variabil (aa numitele repartiii marginale).
Astfel funcia de repartiie a unei variabile oarecare, rezult fcnd s tind
la + restul argumentelor din funcia de repartiie a sistemului:

F
1
(x
1
) = F(x
1
, , ,...,) . (8.7)

Densitatea de repartiie a unei variabile oarecare se obine integrnd
densitatea de repartiie a sistemului pentru toate celelalte variabile i pe ntregul
lor domeniu de definiie:

f x f x x x dx dx
n 1 1 1 2 2
( ) ( , ,..., ) ... =

+
n
n
. (8.8)

Prin generalizare, se pot defini subsisteme de variabile aleatoare i
repartiiile marginale ale acestora.
Din sistemul de variabile aleatoare X
1
, X
2
, ..., X
n
se poate separa subsistemul
X
1
, X
2
, ..., X
k
, avnd funcia de repartiie:

F
1, 2, ..., k
(x
1
, x
2
, ..., x
k
) = F(x
1
, x
2
, ...,x
k
, , ,...,) (8.9)

i densitatea de repartiie:

f x x x f x x x dx dx
k k n k 1 2 1 2 1 2 1 , ,...,
( , ,..., ) ... ( , ,..., ) ... =
+

+
. (8.10)

O alt noiune care se poate defini n legtur cu un sistem de variabile
aleatoare este aceea de repartiie condiionat.
Un subsistem (X
1
, X
2
, ..., X
k
) are repartiia condiionat dac legea sa de
repartiie se calculeaz dup ce restul variabilelor din sistem (X
k+1
, X
k+2
, ..., X
n
)
au luat valorile particulare x
k+1
, x
k+2
, ..., x
n
.

145
Densitatea de repartiie condiionat se calculeaz cu relaia:

f x x x x x x
f x x x
f x x
n k k n
n
k n k n
( , , ... , , , ... , )
( , , ... , )
( , ... , )
...,
1 2 1 2
1 2
1, 1
+ +
+ +
= . (8.11)

i n cazul variabilelor n-dimensionale se pot defini o serie de valori tipice
(sau caracteristice) ale sistemului de variabile aleatoare. Acestea sunt:
valorile medii m
i
(i = 1, ..., n) ale celor n variabile aleatoare,
caracteriznd tendina de grupare;
dispersiile D
2
(X
i
) (i = 1, ..., n) sau abaterile medii ptratice (X
i
)
(i=1,...,n) definind mprtierea valorilor variabilelor;
momentele de corelaie K
ij
= M[(X
i
- m
i
)(X
j
- m
j
)], caracteriznd relaiile
reciproce dintre variabilele X
i
i X
j
; momentele K
ij
sunt definite ca valorile
medii ale produsului abaterilor dintre valorile fiecrei variabile i media
acesteia, sau altfel spus, momentele de corelaie reprezint valoarea medie a
variabilei (X
i
- m
i
) (X
j
- m
j
).
Momentul de corelaie K
ij
se mai numete i corelaie sau covarian a
variabilelor X
i
i X
j
, i se noteaz prin cov(X
i
, X
j
). Se observ c momentul de
corelaie al unei variabile fa de ea nsi este chiar dispersia variabilei
respective:

K
ii
= M(X
i
- m
i
)
2
= D
2
(X
i
) =
2
(X
i
) . (8.12)

Din definiia momentului de corelaie rezult de asemenea: K
ij
= K
ji

(proprietate de simetrie).
Cu ajutorul momentelor de corelaie se poate alctui matricea de corelaie a
variabilelor sistemului:

K
K K K
K K K
K K K
n
n
n n nn
=

11 12 1
21 22 2
1 2
...
...
.
.
.
...
...
. (8.13)

n baza proprietilor de simetrie a momentelor de corelaie, rezult c i
matricea de corelaie este simetric n raport cu diagonala principal.

146
Dou variabile X
i
i X
j
din sistem se numesc corelate (sau dependente), dac
momentul K
ij
0 (aceasta nseamn c variaia variabilei X
i
antreneaz i
variaia variabilei X
j
). Cnd variabilele sunt necorelate (adic sunt indepen-
dente) K
ij
= 0.
Se atrage ns atenia c propoziia reciproc nu este adevrat, deci dac
covariana este nul, nu rezult neaprat c variabilele respective sunt
independente (Mihil, 1965).
Avnd n vedere dependena dintre variabilele unui sistem, rezult c
proprietile acestuia nu pot fi complet i corect descrise numai prin
proprietile variabilelor componente, fiind necesar i examinarea relaiilor
reciproce dintre aceste variabile.
Momentele de corelaie intr n definirea coeficienilor de corelaie, care
reprezint de fapt momente de corelaie normate:

( )
r
K X X
D X D X
ij
ij
i j
i j
i j
= =


cov ,
( ) ( )
2 2
. (8.14)

Mrimile r
ij
sunt coeficieni adimensionali; matricea coeficienilor de
corelaie este:

r
r r r
r r
r
ij
n
n
n
=

1
1
1
1
12 13 1
23 2
3
...
...
...
...
. (8.15)

innd seama de proprietatea de simetrie a coeficienilor s-a completat
numai partea superioar a acestei matrici.
Dup cum se remarc, deoarece K
ii
=
i
2
, elementele de pe diagonala
principal sunt egale cu unitatea. Dac variabilele din sistem ar fi necorelate
s-ar obine o matrice band, avnd valoarea 1 pe diagonala principal, iar restul
elementelor ar fi nule.


8.2. VARIABILELE ALEATOARE BI-DIMENSIONALE

n practic, un interes special l prezint repartiiile bi-dimensionale (definite
deci de variabilele aleatoare X
1
i X
2
sau pentru comoditatea scrierii, de
variabilele X i Y).

147
Foarte multe fenomene hidrologice sunt de tip bi-dimensional, ca de
exemplu perechile de valori: debitul maxim - volumul undei de viitur; debitul
rului - debitul solid transportat, etc..
Chiar dac anumite fenomene hidrologice ar fi mai complexe (de tip tri sau
n-dimensional) lipsa datelor din msurtori face necesar simplificarea
dependenelor constatate sau estimate i conduce la utilizarea unui aparat
matematic mai simplu (repartiii unidimensionale, cel mult bi-dimensionale).
Prin particularizarea noiunilor de la sistemele de variabile n-dimensionale,
n cazul bi-dimensional se obin urmtoarele relaii de definiie:

funcia de repartiie F(x,y) = Prob [(X < x);(Y < y)]; (8.16)

densitatea de repartiie f(x,y) =


2
F x y
x y
( , )
; (8.16')

i n plus: (8.17) f x y dxdy F x y
y x
( , ) ( , ) =



repartiiile marginale ale lui X i Y sunt definite prin:

F
1
(x) = F(x, ) ; F2(y) = F(, y) (8.18)

sau:

f x f x y dy f x f x y dx
1 2
( ) ( , ) ; ( ) ( , ) =

=

+
; (8.19)

repartiiile condiionate:

f x y
f x y
f y
( )
( , )
( )
=
2
; (8.20)

(adic densitatea de repartiie a lui X condiionat de o valoare fix y a lui Y
este raportul dintre densitatea de repartiie bi-dimensional f(x,y) i densitatea
de repartiie f
2
(y) a lui Y); similar:

f x y
f x y
f x
( )
( , )
( )
=
1
; (8.21)
matricea de corelaie a sistemului de variabile aleatoare:

148

K
K K
K K
xx xy
yx yy
=

, (8.22)

unde:

K
xx
= M[(X - m
x
)(X - m
x
)] =
x
2
, (8.23)

K
xy
= M[(X - m
x
)(Y - m
y
)] = K
yx
, (8.24)

K
yy
= M[(Y - m
y
)(Y - m
y
)] =
y
2
, (8.25)

Prin m
x
i m
y
s-au notat valorile medii ale variabilelor X i Y, iar prin
i dispersiile acelorai variabile.
x
2

y
2

K
xy
= K
yx
= cov (X,Y) = cov (Y,X) (8.26)

reprezint corelaia sau covariana varibilelor X i Y.
coeficientul de corelaie:

r X Y
X Y
D X D Y
r Y X ( , )
cov ( , )
( ) ( )
( , ) =

=
2 2
(8.27)

Notnd pentru simplificare:

r = r(X,Y) ;
x
D X =
2
( ) i
y
D Y =
2
( ) (8.28)

se poate scrie:

cov(X,Y) = cov(Y,X) = r
x

y
(8.29)

Matricea de corelaie devine deci n cazul variabilei bi-dimensionale:

K
r
r
x x
x y y
=



2
2
y

(8.30)
8.2.1. REPARTIIA NORMAL BI-DIMENSIONAL

149

Este cea mai utilizat repartiie bi-dimensioanl.
Din punct de vedere teoretic se pot formula, la fel ca i la variabilele
unidimensionale, o multitudine de repartiii (simetrice sau asimetrice). Practic
ns se admite apriori c repartiia normal bi-dimensional aproximeaz
satisfctor aproape toate tipurile de valori experimentale.
Densitatea de repartiie a variabilei bi-dimensionale, normal distribuit, este
dat de formula:

f x y
r
E
r
x y
( , ) exp =

1
2 1
1
2 1
2
2
2

, (8.31)

unde r este coeficientul de corelaie, exp semnific funcia exponenial, iar
E
2
are expresia:

( ) ( ) ( )( )
E
x m y m
r
x m y m
x
x
y
y
x
x y
2
2
2
2
2
2 =

+



y
. (8.32)

Repartiia variabilelor X, respectiv Y este dat de formulele:
( )
f x
x m
x
x
x
( ) exp =

1
2 2
2
2

, (8.33)

respectiv:

( )
f y
y m
y
y
y
( ) exp =

1
2 2
2
2

. (8.34)

Repartiia este simetric n x i y dup cum rezult din nsi relaia de
definiie.


8.2.2. REPARTIII EMPIRICE BI-DIMENSIONALE

Fie o populaie statistic descris prin dou variabile aleatoare X i Y; notnd
valorile observate prin x
1
, x
2
, ..., x
m
, respectiv y
1
, y
2
, ..., y
n
i prin f
ij
numrul
unitilor populaiei statistice care au caracteristica X = x
i
i Y = y
j
, repartiia
poate fi descris ca n tabelul 8.1.
Tabelul 8.1

150

y

x

y
1

y
2

.

.

.

y
i

.

.

.

y
n
Repartiia
marginal
a lui X
x
1
f
11
f
12
. . .
f
1j
. . .
f
1n
f
1

x
2
f
21
f
22
. . .
f
2j
. . .
f
2n
f
2

. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
x
i
f
i1
f
i2
. . .
f
ij
. . .
f
in
f
i

. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
x
m
f
m1
f
m2
. . .
f
mj
. . .
f
mn
f
m

Repartiia
marginal
a lui Y

f

1

f

2

.

.

.

f

j

.

.

.

f

n

f


Acest tip de tabel se utilizeaz att n cazul variabilelor discrete, ct i al
variabilelor continue (n acest caz coloanelor i rndurilor li se asociaz
intervale din domeniul de variaie, iar prin x
i
i y
j
se noteaz centrul
intervalelor).
Efectund totalurile pe linii:

f f
ij i
j
n
=

=1
(i = 1, ..., m) , (8.34)

respectiv pe coloane:
f f
ij j
i
m
=


=1
(j = 1, ..., n) , (8.35)

se obin la marginile tabelului dou repartiii simple: repartiia integral a
variabilei X, respectiv repartiia integral a variabilei Y n populaia total
(cu alte cuvinte repartiiile marginale ale celor dou variabile).
Repartiia marginal a lui X este deci:

X
x x x x
f f f f
i
i m
:
1 2
1 2

m
, (8.36)
iar repartiia marginal a lui Y:

151

Y
y y y y
f f f f
j
j n
:
1 2
1 2

n
n
. (8.36)

Repartiiile marginale ale unei variabile sunt repartiii libere, n sensul c nu
depind de loc de valorile celeilalte variabile.
n opoziie cu acestea sunt repartiiile condiionate, n care repartiia unei
variabile este funcie de valoarea celeilalte variabile. De exemplu, repartiia lui
y condiionat de valoarea particular X=x
i
este urmtoarea:

Y
y y y y
f f f f
i
i i ij in
:
1 2
1 2

. (8.37)

Pentru fiecare valoare x
i
(i = 1, ..., m) a lui X se poate defini repartiia lui Y
condiionat de x
i
; n mod similar pentru fiecare valoare y
j
(j = 1, ..., n) a lui Y
exist o repartiie a lui X condiionat de y
j
.
Cu alte cuvinte, repartiia bi-dimensional f(x, y) mai definete n afar de
cele dou repartiii marginale i m + n repartiii condiionate.
Fiecare repartiie condiionat este caracterizat sintetic printr-o valoare
medie condiionat i o abatere medie ptratic condiionat.
Un interes special n prelucrrile statistice l prezint mulimea valorilor
medii condiionate, care definesc aa-numitele curbe de regresie sau curbe de
dependen statistic ntre valorile medii ale variabilei explicate (sau deter-
minate) i valorile variabilei explicative (sau determinante).


8.3. REPREZENTRI I REPARTIII EMPIRICE
BI-DIMENSIONALE N HIDROLOGIE. CORELAII

n hidrologie, numrul de msurtori este redus, ceea ce face ca o bun parte
a frecvenelor absolute f
ij
s fie egale cu zero. De regul, unei valori a lui x i
corespunde o valoare y, care se nregistreaz o singur dat; ca urmare, tabelul
8.1 al repartiiei este ptrat (m=n). Variabila aleatoare bi-dimensional va lua
valorile (x
i
, y
i
; i=1,...,n), astfel nct doar termenii diagonali ai matricii sunt
egali cu unitatea, restul termenilor fiind nuli.
Aceasta face s se renune la ideea definirii unei densiti de repartiie
bi-dimensionale f(x,y), preferndu-se s se recurg la grafice pe care se

152
reprezint punctele de coordonate (x
i
, y
i
). Imaginea grafic obinut permite
formularea unor ipoteze privind dependena sau independena componentelor
X i Y ale variabilei aleatoare bi-dimensionale analizate.
Stabilirea acestui lucru este foarte important: dac variabilele sunt
independente, ele pot fi analizate separat, ca repartiii uni-dimensionale; n cazul
n care variabilele sunt dependente este important s se determine cel puin care
este influena modificrii unei variabile asupra valorilor celeilalte variabile. Se
ajunge astfel la prelucrri statistice mai simple de o deosebit importan
practic, cunoscute sub numele de analize de corelaie i regresie.
Fie de exemplu precipitaiile X czute pe un bazin hidrografic, respectiv
debitele Y ale rului n profilul de nchidere al bazinului. Reprezentnd
diversele situaii nregistrate se obine n principiu dependena din figura 8.1.



Fig. 8.1. Legtura dintre precipitaii i debitul unui ru:
1 - densitatea de repartiie a variabilei Y condiionat de valoarea X = x
i
;
2 - densitatea de repartiie marginal a lui Y; 2' - densitatea de repartiie
marginal a lui X; 3 - dreapta de regresie a lui Y fa de X.


Valorile (x
i
, y
i
) definesc o variabil aleatoare bi-dimensional, ntre compo-
nente existnd o relaie de dependen probabilistic; unei valori a lui X

153
(sau mai corect unei vecinti a acesteia) i corespund o multitudine de valori
ale lui Y.
Acest lucru se explic prin influena pe care o are gradul de umiditate iniial
a solului asupra descompunerii precipitaiilor n scurgere de suprafa i
infiltraie. Pentru o precipitaie dat, dac solul este uscat o mare parte se
infiltreaz, deci scurgerea de suprafa (i implicit debitul rului) au valori mai
mici; dimpotriv, dac umiditatea iniial a solului este ridicat, scurgerea
superficial respectiv debitul rului vor fi mai mari.
Considernd c punctul x
i
de pe abscis reprezint centrul unui interval:

x
x
x
x
i i
+


2 2
, ,

se obine densitatea de repartiie a lui Y condiionat de valoarea X = x
i

(curba 1 din fig. 8.1). n mod similar se obin repartiiile condiionate ale lui X
de valorile lui Y.
n figura 8.1 s-a reprezentat i repartiia marginal a lui Y, liber deci de
valorile lui X (curba 2). Aceast repartiie se poate obine diviznd domeniul de
variaie al lui Y n intervale y i contoriznd numrul de puncte din cadrul
fiecrui interval; rezult o repartiie empiric a lui Y, care este apoi ajustat
printr-o lege teoretic. Similar, se construiete repartiia marginal a lui X
(curba 2' din fig. 8.1).
n sfrit, pe aceeai figur s-au reprezentat (curba 3) i valorile medii ale lui
Y condiionate de valorile lui X (dreapta de regresie a lui Y fa de X). i n acest
caz se poate defini, respectiv reprezenta, dreapta de regresie a lui X fa de Y.
Trebuie menionat c cele dou drepte de regresie nu coincid dect n cazuri cu
totul speciale i anume atunci cnd dependena dintre Y i X este de tip
determinist, deci cnd se poate defini o relaie de tipul Y=f(X). n mod normal,
cele dou drepte de regresie fac ntre ele un unghi, care este cu att mai mare, cu
ct legtura dintre variabilele Y i X este mai slab.
n opoziie cu dependena funcional dintre Y i X este independena
variabilelor, caz n care cele dou drepte de regresie sunt perpendiculare.
O reprezentare grafic a celor 3 tipuri de situaii este dat n figura 8.2.


154


Fig. 8.2. Tipuri de dependen ntre variabilele Y i X: a - legtur determinist
ntre Y i X (variabile total dependente); b - legtur statistic (dependena dintre
cele dou variabile mai slab dect n primul caz); c - lipsa oricrei legturi ntre
Y i X (variabile independente).

Rezumnd, o legtur de tip determinist ntre variabilele X i Y este de tipul:

Y = f(X), (8.38)

n timp ce o legtur probabilistic implic un element aleator :

Y = f(X) + (8.39)

n relaia (8.39), f(X) reprezint curba de regresie a lui Y fa de X (deci
valorile medii condiionate ale lui Y), iar este o variabil aleatoare, indicnd
abaterile lui Y fa de curba de regresie.
n practic intereseaz n special ecuaia curbei de regresie, ceea ce face ca o
legtur de tip probabilistic s se exprime simplificat tot sub forma (8.38).
n acest caz, curba f(X) trece printre punctele provenite din msurtori,
puncte care nu mai sunt pe curb ca n cazul dependenei de tip determinist, ci
sunt situate de o parte i de alta a ei.


Fig. 8.3. Corelaie L-t
cr
. Fig. 8.4. Corelaie H F h /
1%
.

155
n mod similar se pot stabili (I.M.H., 1971) corelaii ntre:
timpul de cretere t
cr
al unei unde de viitur i L sau L/ I
r
(fig. 8.3),
unde L este lungimea, iar I
r
panta rului;
durata total T
t
a undei de viitur i L, L / I
b
sau F / I I
b r
, unde L
este lungimea rului, I
b
- panta bazinului, I
r
- panta rului, iar F suprafaa
bazinului hidrografic;
stratul scurs h
1%
i H/ F (fig. 8.4), unde H este altitudinea medie a
bazinului hidrografic;
coeficientul scurgerii medii i altitudine;
coeficientul evaporaiei multianuale i altitudine, etc.
n toate aceste exemple, cunoscnd caracteristicile fizico-geografice ale
reelei hidrografice sau bazinului (H, F, I
b
, I
r
, L etc.) din graficele dependenelor
rezultate se pot determina o serie de mrimi hidrologice (caracteristici ale
undelor de viitur, scurgere medie, evaporaie etc.).
Din reprezentrile grafice se observ c valorile variabilei explicate (Y)
prezint abateri mai mult sau mai puin importante fa de curba valorilor medii;
cu ct punctele (x
i
, y
i
) sunt mai apropiate de curba de regresie, cu att
dependena (sau corelaia) dintre cele dou variabile este mai strns.


8.3.1. CLASIFICAREA CORELAIILOR

a) n funcie de numrul variabilelor care intervin n corelaie se deosebesc:
corelaii simple, n care valorile medii ale variabilei explicate (Y) se
exprim n funcie de o singur variabil explicativ (X):

Y = F(X) (8.40)

corelaii multiple, n care intervin mai multe variabile explicative
(X
1
, X
2
, ... X
n
):

Y = f(X
1
, X
2
, ...). (8.41)

Cu ct numrul variabilelor explicative este mai mare, cu att dependena
dintre variabila explicat Y i ansamblul variabilelor explicative este mai bun.
La limit, dac s-ar introduce toate variabilele care definesc un proces sau
fenomen, s-ar obine legturi legice, de tip determinist. n general ns, n

156
practica nu este nici necesar si nici posibil s se evalueze influenele tuturor
acestor factori. Ca urmare, se recurge la alegerea unui numr de factori care
intervin n mod esenial n definirea variabilei explicate Y, restul factorilor
neglijndu-se; ei intervin sub forma factorului aleator , deci a unor perturbaii
ale valorilor lui Y n raport cu valoarea sa medie, dedus pe baza variabilelor X
1
,
X
2
, ..., reinute.
Influenele factorilor reinui se evalueaz fie individual (permind corelaii
multiple), fie global, sub form de produs al acestor factori n general (rezultnd
corelaii simple ntre Y i ansamblul factorilor considerai).
corelaii pariale; n anumite cazuri intereseaz doar influena unui
factor sau a unui grup de factori asupra valorilor lui Y. De exemplu, se tie c
Y=f(X
1
,X
2
) i intereseaz doar corelaia parial Y = f(X
1
) sau Y = f(X
2
), pentru a
determina variabila care intervine n mod esenial n variaia lui Y. Variabila
reinut poate fi supus apoi unor procedee mai atente de msurare sau control,
n vederea ntririi sau diminurii influenei ei, dup cum implicaiile
dependenei rezultate sunt favorabile sau defavorabile.
b) n funcie de tipul legturii dintre variabile se deosebesc:
corelaii liniare:

simple:

Y = A + BX (8.42)


multiple

Y = A + BX
1
+ CX
2
+ ... (8.43)

corelaii neliniare:

simple sau multiple.

c) O alt clasificare a corelaiilor este n funcie de sensul variaiei
variabilelor (fig. 8.5):
dac la creterea valorii variabilei explicative X corespunde o cretere a
variabilei explicate Y, atunci legtura dintre cele dou variabile este direct
(fig, 8.5, a);
dac la creterea lui X corespunde o micorare a lui Y, legtura este
invers (fig. 8.5, b).

157



Fig. 8.5. Corelaie direct (a) i invers (b) ntre variabilele X i Y.

Gradul de intensitate (sau trie) a unei corelaii se apreciaz cu doi indicatori
diferii, dup cum corelaia este liniar sau neliniar. Acetia sunt:
coeficientul de corelaie (n cazul dependenei liniare ntre Y i X);
raportul de corelaie (n cazul legturii neliniare).


8.3.2. COEFICIENTUL DE CORELAIE AL VARIABILELOR
BI-DIMENSIONALE

Dup cum s-a artat, coeficientul de corelaie al variabilelor aleatoare X i Y
este prin definiie:

r
X Y
D X D Y
=

cov( , )
( ) ( )
2 2
(8.44)

n cazul n care variabilele X i Y sunt continue i au densitatea de repartiie
bi-dimensional f(x, y), covariana sau momentul de corelaie care reprezint
valoarea medie a variabilei (X-m
x
)(Y-m
y
) are urmtoarea expresie:

( )( )
[ ]
( )( )
cov( , )
( , )
X Y K M X m Y m
x m y m f x y dxdy
XY x y
x y
= =
=

+
=
. (8.45)


158
Valoarea medie a variabilei bi-dimensionale s-a obinut dup aceleai reguli
ca valoarea medie a variabilei aleatoare uni-dimensionale. Se reamintete c, n
cazul variabilei unidimensionale X cu densitatea de repartiie f(x), valoarea sa
medie M(X) este:

M X x f x dx ( ) ( ) =

+
. (8.46)

n cazul bi-dimensional, variabila este [(X - m
x
)(Y - m
y
)] iar densitatea de
repartiie f(x, y); relaia de calcul a valorii medii rezult acum imediat.
nlocuind valoarea covarianei n expresia lui r, se obine n cazul variabilei
continue:

( )( ) ( )
r
X Y
D X D Y
x m y m f x y dxdy
x y
=

+
cov( , )
( ) ( )
,
2 2
(8.47)

n cazul variabilei bi-dimensionale discrete, notnd cu:

p
ij
= Prob (X=x
i
; Y= y
j
) (8.48)

i cu r coeficientul de corelaie de selecie, rezult:

( )( )
r
D X D Y
x x y y p
i i
j
n
i
m
=

= =
1
2 2
1 1
( ) ( )
ij
. (8.49)

Se reamintete c valoarea medie a variabilei unidimensionale X lund
valorile x
i
cu probabilitile p
i
este:

M X x p
i i
i
n
( ) =

=1
. (8.50)

Cu o relaie similar s-a obinut n cazul bi-dimensional valoarea medie
pentru variabila
( )( )
X x Y y .
n expresia coeficientului de corelaie s-a notat prin p
ij
raportul:

p
f
f
ij
ij

, (8.51)

159

unde f
ij
reprezint frecvene absolute, adic numrul de cazuri n care
variabila X ia valorile x
i
(i = 1, ..., m), iar Y ia valorile y
j
(j = 1, ..., n); f

este
volumul seleciei:

f
ij
j
n
i
m

= =
=
1 1
f . (8.52)

n hidrologie, dup cum s-a mai artat, numrul de valori de care se dispune
din msurtori este redus.
Admind c fiecare pereche de valori (X
i
, Y
j
) s-a nregistrat o singur dat,
rezult f
ij
= 1 i deci:

p
n
ij
=
1
. (8.53)

Considernd c unei valori X
i
i corespunde o singur valoare a variabilei
explicate (notat Y
i
), suma dup j dispare din relaia (8.49), care devine:

( )( )
r
s X s Y
x x y y
n
x y
ns s
i i
i
n
i i
i
n
x y
=

=
=
1
2 2
1
1
( ) ( )

. (8.54)

Lucrnd cu o selecie de volum limitat, n expresia (8.54) s-au nlocuit
dispersiile i abaterile medii ptratice teoretice prin valorile lor de selecie; prin
x
i
i y
i
s-au notat abaterile valorilor x
i
i y
i
fa de media x , respectiv y .
Se reamintete c:

( ) ( )
s
n
x x
n
x
x i
i
n
i
i
n
= =
= =
1 1 2
1
2
1
(8.55)

( )
s
n
y
y
i
n
=

=
1 2
1

i
. (8.55')

Deci expresia lui r devine:


160
( ) ( )
r
x y
x y
i i
i
n
i i
i
n
i
n
=


=
= =


1
2 2
1 1
. (8.56)

Calculul coeficientului de corelaie se desfoar tabelar, dup urmtorul
model (tab.8.2):

Tabelul 8.2

i

x
i
y
i
x
i
y
i
x
i
. y
i
x
i
2
y
i
2

1
.
.
.
n
.
.
.
.
.
.
.
.
.
.

x
y


Calculul se poate simplifica, dezvoltnd factorii care intervin n expresia
coeficientului de corelaie. Se reamintete c:

2
= M
2
- M
1
2
(8.57)

unde M
1
i M
2
sunt momentele de ordinul 1, respectiv 2 ale variabilei.
n cazul seleciei de volum n se obine:

s
n
x
n
x
n
n x x
x i
i
n
i
i
n
i
i
n
i
i
n
=


= = = =
1 1 1
2
1
2
1
2
2
1 1
2
(8.58)

s
n
n y y
y i
i
n
i
i
n
=


= =
1
2
1 1
2
. (8.58')

n ceea ce privete covariana cov (X, Y), se poate scrie:

cov (X, Y) = M[(X - m
x
)(Y - m
y
)] = M(XY - Xm
y
- m
x
Y + m
x
m
y
) =
(8.59)
= M(XY) - M(X)M(Y) - M(X)M(Y) + M(X)M(Y) = M(XY) - M(X)M(Y) .


161
n cazul unei selecii de volum n, prin particularizare covariana se
calculeaz cu expresia:

cov( , ) X Y
n
x y
n
x
n
y
i i
i
n
i
i
n
i
i
n
=
= =
1 1 1
1 1 =1
. (8.60)

nlocuind relaiile (8.60) i (8.18) n expresia coeficientului de corelaie
(8.49), se obine:

r
n x y x y
n x x n y y
i i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
=

= = =
= = = =
1 1 1
2
1 1
2
2
1 1
2
. (8.61)

Calculul lui r se desfoar tabelar dup urmtorul model (tab.8.3):

Tabelul 8.3

i

x
i
y
i
x
i
. y
i
x
2
i
y
2
i
1
.
.
.
n



Se observ c spre deosebire de tabelul 8.2, nu mai este necesar calculul
mediei i al diferenelor x
i
i y
i
.


8.3.3. INTERPRETAREA COEFICIENTULUI DE CORELAIE. PROPRIETI

Coeficientul de corelaie are urmtoarele proprieti:
Coeficientul de corelaie reprezint o msur simetric global a
dependenei dintre variabilele X i Y, privite ca repartiii marginale ale unor
variabile bi-dimensionale (Dinescu .a., 1986).
Deoarece cov (X, Y) = cov (Y, X), din relaia de definiie a coeficientului de
corelaie rezult c acesta este acelai (proprietate de simetrie), indiferent dac

162
se evalueaz dependena probabilistic (stohastic) a lui Y fa de X sau a lui X
fa de Y.
Coeficientul de corelaie nu se poate utiliza dect n cazul a dou
variabile X i Y cu repartiii normale, pentru alte situaii conceptul respectiv
nefiind fundamentat teoretic i putnd caracteriza cel mult un grad de asociere
al variabilelor respective (Panaite, Munteanu, 1982).
n practica hidrologic se stabilesc de exemplu corelaii liniare ntre debitele
maxime anuale (avnd distribuie asimetric) i volumele undelor de viitur
respective. Este evident c n acest exemplu premiza normalitii variabilelor nu
mai este verificat.
Coeficientul de corelaie are valori cuprinse ntre -1 i +1. Se poate
demonstra matematic (Mihoc .a., 1986) c ntre dou variabile aleatoare exist
o relaie liniar, dac i numai dac r
2
= 1.
Coeficientul de corelaie constituie o msur a gradului de dependen dintre
variabile. Cu ct r este mai apropiat de 1, cu att legtura probabilistic dintre
variabile este mai puternic (atingnd maximul n cazul dependenei
deterministe de tip liniar).
Dac cele dou variabile aleatoare sunt independente, atunci r = 0. Reciproca
acestei propoziii nu este adevrat, deci dac r = 0 nu rezult c variabilele sunt
independente (Mihoc .a., 1986), dependena ntre variabile putnd fi neliniar
(Moineagu .a., 1976).
Valorile coeficientului de corelaie sunt pozitive n cazul n care creterea
variabilei explicative antreneaz creterea variabilei explicate (corelaie
pozitiv) i negative n caz contrar (corelaie negativ).
n figura 8.6 sunt reperezentate cteva situaii caracteristice de drepte de
regresie i valorile corespunztoare ale coeficientului de corelaie (Panaite,
Munteanu, 1982).

Fig. 8.6. Diverse situaii de drepte de regresie i valorile corespunztoare
ale coeficientului de corelaie.

163
n aceste reprezentri s-a notat prin A dreapta de regresie a lui Y n funcie de
X, iar prin B dreapta de regresie a lui X n funcie de Y.
Este de remarcat faptul c, n cazul dependenei de tip determinist, dreptele
A i B coincid, n timp ce, n cazul variabilelor independente, dreptele A i B
sunt perpendiculare i paralele cu cele dou axe (Dinescu .a., 1986). Din
examinarea celorlalte cazuri se constat c, cu ct A i B fac un unghi mai mic
ntre ele, cu att coeficientul de corelaie r este mai mare n valoare absolut,
deci corelaia este mai bun.


8.3.4. ESTIMAREA PARAMETRILOR REGRESIEI LINIARE SIMPLE

Prin definiie funcia de regresie a variabilei aleatoare Y fa de variabila
aleatoare X const n exprimarea analitic a valorii medii condiionate M(Y | X)
a variabilei Y n funcie de valorile lui X.
Fie o regresie liniar simpl pentru care M(Y | X) = a + bX. Ecuaia acestei
drepte va fi notat mai departe pentru comoditate prin:

y = a + bx . (8.62)

Valorile y ale dreptei de regresie reprezint valori teoretice i sunt evident
diferite de valorile empirice (msurate) y
e
pentru acelai x (fig. 8.7).



Fig. 8.7. Semnificaia valorilor i ale corelaiei. y
i
t
y
i
e

Deoarece, de regul, se dispune de un numr finit de valori ale lui x, acestea
vor fi notate prin x
i
, iar valorile variabilei explicate prin , respectiv , dup
cum este vorba despre valori teoretice sau empirice.
y
i
t
y
i
e

164
Estimarea parametrilor dreptei de regresie se face de regul prin metoda
celor mai mici ptrate a lui Gauss: se impune condiia ca suma ptratelor
abaterilor dintre valorile empirice (din msurtori) i cele teoretice (situate pe
dreapt i deci verificnd ecuaia) s fie minim:

( )
G y y
i
t
i
e
i
n
=
=
2
1
minim . (8.63)

Deoarece y verific ecuaia dreptei de regresie se poate scrie:
i
t

y
i
t
= a + bx
i
(8.64)

i nlocuind n expresia lui G, se obine:

( )
G a bx y
i i
e
i
n
= +
=
2
1
. (8.65)

A rezultat o funcie de doi parametri (a i b), care pot fi determinai
impunnd condiiile necesare pentru existena unui punct de extrem (anularea
derivatelor de ordinul unu n raport cu a i b):

( )

G
a
a bx y
i i
e
i
n
= + =
=
2
1
1 0 (8.66)

( )

G
b
a bx y x
i i
e
i
n
i
= + =
=
2
1
0 . (8.67)

Se obine sistemul:

a bx y
i
n
i
i
n
i
e
i
n
= = =
+ =
1 1 1
(8.68)

ax bx x y
i
i
n
i
i
n
i i
e
i
n
= = =
+ =
1
2
1 1
(8.69)

sau:

na b x y
i
i
n
i
e
i
n
+ =
= = 1 1
(8.70)

165
a x b x x y
i
i
n
i
i
n
i i
e
i
n
= = =
+ =
1
2
1 1
. (8.71)

A rezultat un sistem de dou ecuaii cu dou necunoscute; utiliznd
determinanii, dup dezvoltrile respective se obine:

a
y x x x y
n x x
i
e
i
n
i
i
n
i
i
n
i i
e
i
n
i
i
n
i
i
n
=


= = = =
= =
1
2
1 1 1
2
1 1
2
(8.72)

b
n x y x y
n x x
i i
e
i
n
i
i
n
i
e
i
n
i
i
n
i
i
n
=


= = =
= =
1 1
2
1 1
2
1
(8.73)

O alt evaluare pentru parametrii a i b se obine mprind n expresia lui b
att numrtorul, ct i numitorul cu n
2
:

b
n
x y
n
x
n
y
n
x
n
x
n
x
i i
e
i
n
i
i
n
i
e
i
n
i
i
n
i
i
n
i
i
n
=








= =
= = =
1 1 1
1 1 1
1 1
2
1 1 1
=1
(8.74)

Conform relaiei (8.59), covariana variabilelor X i Y se poate scrie sub
forma:

cov (X, Y) = M(XY) - M(X) M(Y) .

n expresia (8.74) se fac urmtoarele nlocuiri:

1
1 n
x y M XY
i i
e
i
n
e
=

= ( ) (8.75)

1 1
1 1 n
x
n
y M X M Y
i
i
n
i
e
i
n
e
= =
= ( ) ( ) (8.76)

Conform relaiei (8.59), numrtorul lui b reprezint covariana cov (X, Y
e
).


166
Deoarece:

1
1 n
x
i
i
n
=
= x , (8.77)

rezult c numitorul se poate scrie sub forma:

1
2
1
2
n
x x
i
i
n
=



Dar, conform relaiilor (4.25), respectiv (4.28) aceasta este tocmai dispersia
de selecie a variabilei X:

( )
s
n
x x
n
x x
x i
i
n
i
i
n
2
2
1
2
1
1 1
=

= =
2
(8.78)

Cu alte cuvinte, b se poate scrie sub forma:

( )
b
X Y
s
e
x
=
cov ,
2
. (8.79)

Pe de alt parte, se tie c:

( )
r
X Y
s s
x y
=

cov ,
2 2
, (8.80)

adic:

cov (X,Y) = r s
x
s
y
. (8.81)


Rezult:

b
r s s
s
r
s
s
x y
x
y
x
=

=
2
. (8.82)


n ceea ce l privete pe a, acesta se poate obine n funcie de b din relaia:

167

G
a
na b x y
i
i
n
i
e
i
n
= + =
= =
0
1 1
(8.83)

sau:

a
n
y b
n
x y b
i
e
i
n
i
i
n
=



=
= =
1 1
1 1
x . (8.84)

Aceeai expresie pentru a se putea obine aplicnd operatorul medie ecuaiei
(8.62):

M(y) = M(a + bx) = a + b M(x) . (8.85)

Rezult:

a M y b M x y bx = = ( ) ( ) . (8.86)

innd cont de relaia (8.82) se obine:

a y bx y r
s
s
x
y
x
= = (8.87)

Calculul corelaiei i regresiei liniare se defoar deci n modul urmtor: se
determin coeficientul de corelaie r i dac acesta pune n eviden o legtur
puternic ntre cele dou variabile (n hidrologie se admite existena unei
corelaii pentru |r| 0,7), se procedeaz la estimarea parametrilor dreptei de
regresie cu relaiile (8.82), respectiv (8.87).
Utiliznd aceleai relaii, dreapta de regresie a lui Y fa de X se poate scrie i
sub forma:

y a bx y bx bx y b x x = + = + = + ( ) . (8.88)

sau:

( )
y y r
s
s
x x
y
x
= . (8.89)

n mod similar, dreapta de regresie a lui X fa de Y are expresia:

168

( )
x x r
s
s
y y
x
y
= . (8.89')

Din aceste relaii rezult c n sens geometric r este panta dreptei de regresie
n uniti ale abaterii standard (Moineagu .a., 1976).
Constantele:

r
s
s
y
x
i r
s
s
x
y


se numesc coeficieni de regresie liniar.


8.3.5. INTERVALE DE NCREDERE N CAZUL
REGRESIEI LINIARE SIMPLE

Intervale de ncredere bilaterale ale parametrilor a i b cu un prag de
semnificaie . Pe baza datelor din nregistrri se calculeaz conform relaiilor
(8.72), (8.73) sau a relaiilor (8.82) i (8.87) parametrii a i b ai dreptei de
regresie. Valorile obinute reprezint nite estimri ale valorilor adevrate ale
parametrilor, care se gsesc n cadrul unor intervale de ncredere, cu a i b ca
valori centrale.
Limitele intervalelor pot fi obinute cu relaiile:

A = a t .
a
(8.90)

B = b t .
b
. (8.91)

Dispersiile parametrilor a i b se calculeaz cu formulele (Panaite,
Munteanu, 1982):

( )


a
y
i
i
n
n
x
x x
2
2
2
2
1
1
=
+

=
(8.92)


169
( )


b
y
i
i
n
x x
2
2
2
1
=

=
(8.93)

Deoarece dispersia
y
2
nu este cunoscut, ea se evalueaz prin dispersia
rezidual definit de abaterile valorilor msurate fa de dreapta de regresie,
ai crei parametri au fost obinui cu relaiile (8.72) i (8.73) sau (8.82) i (8.87):
y
i
e

( )
s
n
y a bx
y i
e
i
i
n
2
2
1
1
2
=


=
. (8.94)

De notat c dispersia rezidual este o variabil aleatoare Student cu n-2
grade de libertate (pe baza celor n valori au fost determinai 2 parametri: a i b).
Fcnd nlocuirile respective, rezult pentru un nivel de semnificaie
urmtoarele expresii ale intervalelor de ncredere:

( )
A a t s
n
x x x
n
y
i
n
= +

=
2
2
2
2
1
1
;
/
i
(8.95)

( )
B b t s x x
n
y i
i
n
=

=
2
2
2
1
;

, (8.96)

unde t
n2
2
;

este o variabil Student cu n-2 grade de libertate i pragul


bilateral

2
.
Interval de ncredere bilateral a valorii medii y
*
obinut prin regresie
pentru o valoare x
*
oarecare. n principiu, dac a i b sunt cunoscui, valoarea
medie y
*
a variabilei explicate se calculeaz pentru o valoare oarecare x
*
a
variabilei explicative cu relaia:

y
*
= a + bx
*
. (8.97)

Intervalul de ncredere bilateral care conine valoarea medie y
*
cu un prag de
semnificaie este (Panaite, Munteanu, 1982):


170
( )
( )
Y y t s
x x
x x
n
y
i
i
n
* *
;
*
= +

=
1
2
2
2
1
1

(8.98)

Interval de ncredere bilateral pentru panta dreptei de regresie care
trece prin origine. n foarte multe cazuri practice dreapta de regresie trece prin
origine, adic x = 0 y = 0. Ecuaia dreptei va fi: y = bx.
Dispersia lui b este:


b y
i
n
x
2 2
1
=
=
/
i
2
(8.99)

Pentru un nivel de semnificaie , conform relaiei (8.91) intervalul bilateral
care l conine pe b este:


B b t s x
n
y
i
n
=

=
1
2
2
1
;
i
, (8.100)


unde:

( )
s
n
y bx
y i
e
i
i
n
=


=
1
1
2
1
, (8.101)

iar t
n1
2
;

are n-1 grade de libertate (s-a determinat un singur parametru i


anume b).


8.3.6. REGRESIA NELINIAR SIMPL

n cazul n care curba de regresie este neliniar, parametrii curbei pot fi
determinai prin urmtoarele metode:
aplicarea metodei celor mai mici ptrate, care revine la anularea
derivatelor funciei obiectiv n raport cu parametrii, rezultnd un sistem de
ecuaii neliniare, dificil de rezolvat n general;
prin trecerea la un nou sistem de coordonate, n care dependena ntre
variabile este de tip liniar (J. Llamas, 1993).

171
Ultimul procedeu este aplicat curent n hidrologie. Fie de exemplu legtura
ntre debitele maxime specifice cu probabilitatea de depire de 1% (q
1%
) i
suprafeele F ale bazinelor de recepie. Evident, dependena dintre cele dou
rnduri de valori este neliniar (fig. 8.8, a); prin logaritmare rezult ns o
relaie liniar (fig. 8.8, b).



Fig. 8.8. Dependena F-q
1%
(a) i log F - log q
1%
(b).


Ecuaia dreptei prin tieturi n noul sistem de coordonate este:

log log q
a
F
b
1%
1 + = . (8.102)

n continuare, se obine:

log log log log log q a
a
b
F A B F
A
F
B
1%
= = = . (8.103)

Rezult tipul de dependen n vechiul sistem de coordonate:

q
A
F
B
1%
= , (8.104)

unde A i B reprezint parametrii relaiei neliniare dintre F i q
1%
.
n acest caz tipul de dependen a rezultat indirect, pornind de la
reprezentarea grafic a datelor din msurtori.

172



Fig. 8.9. Liniarizarea prin schimbarea sistemului de coordonate:
a - sistemul iniial; b - noul sistem de coordonate.

n general, funcia de regresie neliniar cea mai adecvat pentru diversele
dependene hidrologice este cunoscut i se pune doar problema determinrii
parametrilor. Acetia se obin aa cum s-a artat prin liniarizarea ecuaiei
propuse.
Fie de exemplu o curb exponenial de tipul: y = ae
bx
.
Prin logaritmare se obine: ln y = ln a + bx, care poate fi scris sub forma
Y = A + BX (ecuaia unei drepte).
Se obine deci corespondena (fig. 8.9):

Y = ln y; X = x

A = ln a; B = b . (8.105)

Cu alte cuvinte, un punct avnd coordonatele (x
i
, y
i
) n vechiul sistem se va
transforma n punctul (X
i
, Y
i
) din noul sistem de coordonate dup regula:

X
i
= x
i

Y
i
= ln y
i
. (8.106)

n acest sistem de coordonate se caut apoi parametrii A i B ai dreptei de
regresie care trece cel mai bine printre puncte (ponderea punctelor de deasupra
dreptei s fie egal cu ponderea celor de dedesubtul ei).
Dup determinarea lui A i B, se obin prin transformare invers parametrii
a i b. Astfel, n cazul considerat:
a = e
A

173
b = B . (8.107)

Dispunnd acum de a i b, se pot calcula valorile cele mai probabile (valorile
medii) ale variabilei explicate Y pentru orice valoare X = x a variabilei
explicative.
Cteva exemple de liniarizare a relaiilor neliniare curent utilizate n
hidrologie sunt prezentate n tabelul 8.4 (Vladimirescu, 1984).

Tabelul 8.4

Ecuaia Schimbarea de variabile Ecuaia liniarizat
y = ab
x
Y = log y X = x Y = log a + X log b
y = ax
b
Y = log y X = log x Y = log a + bx
y = ae
bx
Y = ln y X = x Y = ln a + bx
y
a
b cx
=
+
Y
y
=
1
X = x Y
b
a
c
a
X = +


8.3.7. RAPORTUL DE CORELAIE

Raportul de corelaie sau indicele de corelaie curbilinie constituie o msur
nesimetric a dependenei stohastice a dou variabile aleatoare.
Prin definiie, raportul de corelaie al variabilei Y n raport cu variabila X
este:

R
Y
yx
ye X
= 1
2
0
2

, (8.108)
unde:

ye X
Y
2
- reprezint dispersia valorilor empirice fa de valorile
teoretice (estimate prin ecuaia de regresie neliniar
y
i
e
Y
X
);

0
2
- dispersia valorilor empirice de la media acestora: y
i
e

y
n
y
i
e
i
n
0
1
1
=

=
. (8.109)

Expresiile dispersiilor sunt:

y
X
e
Y
2
=
( )
1
2
1 n
Y y
X i
e
i
n
i

=
(8.110)

174

0
2
1
0
2
1
=


= n
y y
i
e
i
n
( ) . (8.111)

n expresia dispersiei valorilor empirice fa de valorile teoretice, Y
X
i

reprezint valoarea medie condiionat a lui Y
X
pentru valoarea X=x
i
a
variabilei explicative.
Fcnd nlocuirile n expresia raportului de corelaie se obine:

( )
( )
R
Y y
y y
yx
X i
e
i
n
i
e
i
n
i
=

=
=
1
2
1
0
2
1
. (8.112)

n continuare se va obine o expresie echivalent pentru calculul lui R
yx
.
Fie variaia total ( y y
i
e
i
n
=

1
0
2
) a valorilor variabilei empirice fa de
valoarea medie y
0
.
Se poate scrie:

( ) ( )
( ) ( ) ,
y y y Y Y y
y Y Y y
i
e
i
n
i
e
i
n
X X
i
e
i
n
X
i
n
X
i i
i i
= =
= =

=

+
=

+


1
0
2
1
0
2
1
2
1
0
2
=
(8.113)

deoarece ( )( ) y Y Y y
i
e
i
n
X X
i i
=


1
0
0 = .
Rezult:

( ) ( ) ( y Y y y Y y
i
e
i
n
X i
e
i
n
i
n
X
i i
= = =

=




1
2
1
0
2
1
0
2
) . (8.114)

nlocuind relaia (8.114) n expresia raportului de corelaie se obine:

( )
( )
R
Y y
y y
yx
X
i
n
i
e
i
n
i
=

=
=
0
2
1
0
2
1
(8.115)


175
n aceast relaie Y
X
i
reprezint valorile teoretice ale variabilei Y (obinute
prin particularizarea variabilei explicative X = x
i
n ecuaia neliniar de
regresie); y
i
e
sunt valorile nregistrate, iar y
0
media lor.
Raportul de corelaie este n fond o comparaie ntre dispersia valorilor
teoretice (de pe ecuaia de regresie) fa de medie i dispersia valorilor empirice
fa de medie (Moineagu .a., 1976).
Este evident c: R
yx
R
xy
(raportul de corelaie este nesimetric spre
deosebire de coeficientul de corelaie care este simetric: r
yx
= r
xy
).
n principiu, sunt valabile urmtoarele relaii:

0 r
2
x,y
R
2
x,y
1

i (8.116)

0 r
2
y,x
R
2
y,x
1 .

Dac curba de regresie este o dreapt, raportul de corelaie i coeficientul de
corelaie sunt egale. n general ns coeficientul de corelaie este inferior
raportului de corelaie.
Explicaia const n faptul c coeficientul de corelaie presupune automat o
relaie liniar de dependen stohastic ntre variabile; n condiiile n care
legtura dintre variabile este curbilinie, este evident c o relaie neliniar va
aproxima mai bine aceast dependen i deci intensitatea legturii (exprimat
prin raportul de corelaie) va fi mai bun dect n cazul liniar (adic mai aproape
de 1).
Dac legtura dintre variabile este de tip liniar, coeficientul de corelaie se
poate calcula i cu formula raportului de corelaie:


( )
( )
r
Y y
y y
x
i
n
i
e
i
n
i
=

=
=
0
2
1
0
2
1
. (8.115')


176
Se atrage ns atenia c valorile teoretice Y
x
i
sunt obinute cu o relaie de
tipul:

Y a b
x
i
= + x
i
(8.117)
(cu alte cuvinte trebuie nti estimai parametrii a i b ai dreptei de regresie).
Dac variabilele X i Y sunt independente, atunci:

r = 0 ; R
x,y
= 0 ; R
y,x
= 0 , (8.118)

iar graficele funciilor de regresie sunt drepte paralele cu axele de
coordonate.
n sfrit, dac variabilele sunt n dependen de tip determinist y = f(x),
atunci R
x,y
= R
y,x
= 1, iar graficele funciilor de regresie coincid cu graficul
funciei y = f(x).


8.4. CORELAII LINIARE MULTIPLE

Principiile care stau la baza calculelor unei corelaii liniare simple se aplic
i n cazul corelaiei liniare multiple.
Fie de exemplu o regresie de tipul:

Y a b x b x b
x x m m
m 1
1 1 2 2 ,...,
... = + + + + x . (8.119)

Calculul parametrilor se face tot prin metoda celor mai mici ptrate,
urmrindu-se gsirea hiperplanului care trece cel mai bine printre punctele
empirice y
i
e
.

( )
G Y y
x x x i
e
i
n
m
i
=


=
1 2
2
1
, ...,
minim (8.120)

G
a
= 0 ;

G
b
1
0 = ; ... ;

G
b
m
= 0 . (8.121)

Rezult urmtorul sistem de ecuaii:


177
na b x b x b x y
a x b x b x x b x x y x
a x b x x b x b x x
i
i
n
i
n
m mi
i
n
i
e
i
n
i
i
n
i
i
n
i
i
n
m i mi
i
n
i
e
i
i
n
i
n
i
i
n
i
n
m mi
i
+

+

+ +

=

+

+

+ +

=

+

+

+ +
= = = =
= = = = =
= = = =
1 1
1
2 2i
1 1 1
1
1
1 1
2
1
2 1 2i
1
1
1
1
1
2i
1
1 1 2i
1
2 2i
2
1
2i
...
...
...
1
2i
1
1
1 1
1
2 2i
1
2
1 1
n
i
e
i
n
mi
i
n
i mi
i
n
mi
i
n
m mi
i
n
i
e
mi
i
n
y x
a x b x x b x x b x y x

+

+

+ +

=

=
= = = = =
...........................................................................
...
(8.122)

sau scris matricial:

AX = B , (8.123)

unde X = (a, b
1
, b
2
, ....., b
m
)
t
este vectorul necunoscutelor, A matricea
coeficienilor, iar B termenul liber.
De aici rezult:

X = A
-1
B (8.124)

adic evaluarea necunoscutelor presupune inversarea matricii coeficienilor
i nmulirea cu vectorul termenilor liberi.
La o relaie asemntoare se ajunge i n cazul n care ecuaia de regresie
este de tipul:

Y a b x b x b
x x x m m
m
m 1 2
1 1 2 2
2
...
... = + + + + x (8.125)

(ecuaia este o regresie liniar multipl n raport cu parametrii a, b
1
, b
2
, ... etc).
n sfrit, dac regresia este de tipul:

Y ax x
x x x
b b
m
b
m
m
1 2
1 2
1 2 ...
... = x , (8.126)

prin logaritmare se ajunge din nou la o regresie liniar multipl i deci se
poate aplica procedeul expus anterior.


178
8.4.1. COEFICIENTUL CORELAIEI LINIARE MULTIPLE

Intensitatea legturii liniare multiple ntre variabila explicat Y i variabilele
explicative X
1
, X
2
, ..., X
m
se msoar prin coeficientul corelaiei multiple
(Moineagu .a., 1976): r
yx x x
m 1 2
...

( )
( )
r
Y y
y y
yx x x
x x x i
e
i
n
i
e
i
n m
mi
1 2
1 2
1
2
1
0
2
1
...
...
=

=
=
(8.127)

Cu ct valorile empirice se abat mai puin fa de curba de regresie
multipl, cu att coeficientul de corelaie are o valoare mai mare i corelaia este
mai intens.
y
i
e
La limit, dac toate punctele verific ecuaia de regresie atunci:

( )
y Y x
i
e
x x x i
m
=
1 2
...
(8.128)

i deci:

r
yx x x
m 1 2
1
...
= . (8.129)

Coeficientul de corelaie liniar multipl se poate determina i cu
relaia (Moineagu .a., 1976):
r
yx x x
m 1 2
...

( )
r
a y b x y b x y
n
y
y
n
y
y x x x
i
e
i
n
i i
e
i
n
m mi i
e
i
n
i
e
i
n
i
e
i
n
i
e
i
n
m 1 2
1
1 1
1 1
2
2
1 1
2
1
1
...
...
=

+

+ +


= = = =
= =
1
. (8.130)

Acest coeficient msoar influena global a ansamblului variabilelor
X
1
, X
2
, ... X
m
asupra variabilei Y. Se pot defini i coeficieni ai corelaiei pariale
dintre variabila Y i o singur variabil X
j
, j {1, ..., n}, restul variabilelor fiind
considerate constante.
Astfel, n cazul a trei variabile se pot defini:
coeficientul corelaiei pariale dintre Y i X
1
, variabila X
2
fiind constant
(se elimin n acest fel influena variaiei lui X
2
):

179
r
r r r
r r
y x x
y x y x x x
y x x x
1 2
1 2 1 2
2 1
1 1
2 2

=
2


(8.131)

coeficientul corelaiei pariale dintre Y i X
2
, variabila X
1
fiind constant:

r
r r r
r r
y x x
y x y x x x
y x x x
2 1
2 1 1 2
1 1
1 1
2 2

=
2


. (8.132)

n aceste relaii coeficienii corelaiei simple
( )
r r r
y x y x x x
1 2 1 2
, , se numesc
coeficieni de ordinul zero, iar i - coeficienii corelaiei pariale
de ordinul 1.
r
yx x
1 2

r
yx x
2 1

Cu ajutorul coeficienilor corelaiei simple se poate calcula i coeficientul


corelaiei multiple; astfel:

r
r r r r r
r
y x x
y x y x y x y x x x
x x
1 2
1 2 1 2 1
1 2
2 2
2
2
1
=
+

2
. (8.133)

n cazul a patru variabile, coeficienii corelaiei pariale se calculeaz cu
ajutorul coeficienilor pariali de ordinul 1 (Moineagu .a., 1976):

r
r r r
r r
y x x x
y x x y x x x x x
y x x x x x
1 2 3
1 2 3 2 1 3 2
3 2 1 3 2
1 1
2 2



=


. (8.134)

Ceilali coeficieni
(
i
)
r
y x x x
2 1 3
( )
r
y x x x
3 1 2

se obin din relaia anterioar prin


permutri circulare ale indicilor.


8.4.2. AUTOCORELAIA SAU CORELAIA SERIAL

n hidrologie prezint interes n ce msur fenomenele analizate au memorie;
considernd de exemplu irul debitelor medii lunare, medii anuale sau maxime
anuale se pune problema dac valorile dintr-un anumit interval sunt dependente
de valorile din intervalul sau intervalele anterioare.

180
Dac o asemenea corelaie poste fi identificat, regularizarea debitelor
necesit volume mai mari ale lacurilor de acumulare dect n lipsa corelaiei
respective.
Dependena dintre o mrime lund valorile x
i
i ea nsi dar decalat (avnd
valorile x
i-k
) se numete autocorelaie sau corelaie serial. Decalajul k, avnd
semnificaia unui numr de intervale, reprezint ordinul autocorelaiei.
O corelaie serial de ordinul 1 nseamn o legtur ntre irurile:

{x
1
x
2
... x
n
}

{x
2
x
3
... x
n+1
}

iar o corelaie serial de ordinul 2 va urmri stabilirea dependenei dintre
irurile:

{x
1
x
2
... x
n
}

{x
3
x
4
... x
n+2
}

Gradul de legtur dintre aceste iruri poart numele de coeficient de
corelaie serial sau de autocorelaie.
Coeficientul de ordinul k se calculeaz cu relaia (Vladimirescu, 1984):


( )
( ) ( )
r
n k
x x
n k
x x
n k
x
n k
x
n k
x
n k
x
k
i i k i
i
n k
i k
i
n k
i
n k
i
i
n k
i
i
n k
i k
i
n k
i k
i
n k
=

+
=

+
=

+
=

+
=

1 1
1 1 1 1
2
1 1 1
2
1
2
1
2
2
1
2
1
2
(8.135)

Cu ct ordinul k este mai mare, cu att coeficientul de autocorelaie r
k
este
mai slab. n practic prezint un interes special coeficientul de autocorelaie de
ordinul unu, care este utilizat n problemele de generare matematic a debitelor.


181
8.5. GENERAREA DEBITELOR

Exist numeroase situaii n hidrologie i n special n gospodrirea apelor n
care irul de date nregistrate este insuficient.
De exemplu, se pune problema stabilirii volumului unui lac de acumulare
pentru care se cunosc cerinele de ap care trebuie satisfcute n perspectiv
(peste 10 ... 20 ani sau chiar mai mult). Este evident c nu se pot anticipa
debitele rului (i mai ales succesiunea lor) n situaia corespunztoare
funcionrii lacului. Se folosesc atunci debitele medii lunare nregistrate n
trecut (debite care acoper n general o perioad de 20 ... 40 ani).
Bineneles aceste debite nu se vor nregistra identic n viitor, dar dac au
fost prinse situaii caracteristice pe ru (ani ploioi, ani secetoi, succesiuni de
ani ploioi i ani secetoi etc.) atunci se pot trage concluzii de natur statistic
privind volumul necesar al lacului de acumulare, care s satisfac cu o
probabilitate dat cerinele de ap.
Eventual, pentru a obine i alte succesiuni de debite n afara celor
nregistrate se poate proceda la amestecarea irurilor de date anuale (de exemplu
se pot grupa toi anii secetoi la nceputul perioadei de calcul, iar anii ploioi la
sfrit); evident procedeul este criticabil. O modalitate mai elegant de a
produce alte succesiuni de date n afara celor nregistrate, const n generarea
artificial de noi valori hidrologice. Dintr-un ir de 20 .... 40 de ani de valori
nregistrate se pot obine debite generate pentru perioade orict de mari (100,
500, 1000 de ani etc.).
Ca o condiie esenial, procedeul de generare utilizat trebuie s conduc la
conservarea valorii medii, a coeficientului de variaie i asimetrie; cu alte
cuvinte se urmrete obinerea unor valori ale irului generat sau subirurilor
sale cu caracteristici statistice apropiate de ale irului de date de baz.
Generarea de valori sintetice nu conduce la obinerea de noi informaii
privind hidrologia rului, ci permite doar obinerea unei diversiti de succesiuni
posibile ale debitelor n condiiile conservrii informaiei iniiale sau a celei mai
mari pri a acesteia.
Dispunnd de aceast varietate de situaii posibile a se realiza n viitor,
dimensionarea i exploatarea lacului sunt mai temeinic fundamentate.
Un aspect important de care trebuie s se in seama este faptul c debitele
unui ru reprezint n general iruri cu autocorelaie; cel mai des este utilizat
autocorelaia dup un pas.
Pentru exemplificarea procedeului de generare se vor prezenta cazurile
debitelor medii anuale cu autocorelaie.
Fie pentru nceput cazul generrii debitelor anuale cu repartiie normal.
Relaia de recuren a modelului de generare este (Simon, Vian, 1974):


182
( )
Q Q r Q Q t r
i i i
= + +
1 1 1
2
1 , (8.136)

unde:
Q
i
este debitul mediu generat al anului i;
Q
i-1
are aceiai semnificaie, dar pentru anul i-1;

Q este debitul mediu multianual al datelor ntegistrate;
- abaterea standard a acelorai valori;
r
1
- coeficientul de autocorelaie de ordinul 1 al valorilor
nregistrate;
t
i
- variabila aleatoare normal normat, generat, avnd media
zero i abaterea standard unu.

Acest model conserv media, abaterea medie ptratic i coeficientul de
autocorelaie introdui ca parametri iniiali.
n cazul generrii debitelor medii anuale autocorelate cu alte repartiii dect
cea normal, relaia de generare utilizat este asemntoare (Simon, Vian,
1974):

( )
Q Q r Q Q r
i i i
= + +
1 1 1
2
1 , (8.137)

unde:

i
sr
sr i sr
sr
C
C t C
C
= +


2
1
6 36
2
3
, (8.138)

iar:

( )
C C
r
r
sr s
=

1
1
1
3
1
2
3 2 /
. (8.139)

Restul mrimilor i pstreaz semnificaiile anterioare. Acest model asigur
conservarea n procesul de generare a parametrilor Q , , C
s
i r
1
.
Generarea debitelor medii lunare autocorelate constituie o problem mai
delicat din cauza caracterului nestaionar al procesului (mediile lunare

183
multianuale ca i abaterea medie ptratic, coeficientul de autocorelaie i
coeficientul de asimetrie difer de la lun la lun).
i mai dificil este generarea debitelor medii lunare n mai multe seciuni ale
unui bazin hidrografic, caracterizat de existena unor legturi spaiale i
temporale ale variabilelor aleatoare (Simon, Vian, 1974; Giurma, Hogea,
1985 etc).

184




BIBLIOGRAFIE


1. Bobe, B., Elments de statistiques. Universit Pierre et Marie Curie -
Paris 6; Ecole des Mines de Paris, Paris, 1991.

2. Chow, V. T., Handbook of applied hydrology, New York, 1964.

3. Cicioni, G., Giuliano, G., Spaziani, F., Best fitting of probability functions
to a set of data for flood studies, Institute for Water Research, National
Research Council, Italy, 1982.

4. Constantinescu, M., Goldstein, M., Haram, V., Solomon, S., Hidrologie,
Editura Tehnic, Bucureti, 1956.

5. Diaconu, C., Lzrescu, D., Hidrologie general; prelegeri pentru
cursuri postuniversitate, I.C.B., 1977.

6. Diaconu, C., Lzrescu, D., Hidrologie, Editura Didactic i Pedagogic,
Bucureti, 1965.

7. Dinescu, C., Svulescu, V., Decizii n probleme economice, Probleme,
cazuri, Editura Didactic i Pedagogic, Bucureti, 1978.

8. Dinescu, C., Svulescu, B., Vasiliu, D., Metode matematice pentru
fundamentarea deciziilor n producie, Editura Tehnic, Bucureti, 1986.

9. Drobot, R., Estimarea raportului C
s
/ C
v
, utiliznd tehnici ale cercetrii
operaionale, Revista Hidrotehnica, Bucureti, vol. 34, nr. 10, 1989.

10. Giurma, I., Hogea, V., Contribuii la generarea de iruri de valori
hidrologice, care se succed n mod cronologic, Revista Hidrotehnica, Bucureti,
vol. 30, nr. 6, 1985.

11. Hncu, S., Stnescu, P., Platagea, Gh., Hidrologie agricol, Editura
Ceres, Bucureti, 1975.

185
12. Iliescu, D. V., Vod, V., Gh., Statistic i tolerane, Editura Tehnic,
Bucureti, 1977.

13. Llamas, J., Hydrologie gnrale. 2
e
dition. Gatan Morin - diteur,
Qubec, 1993.

14. van der Made, J.W., Casebook of methods for computing hydrological
parameters of water projects, UNESCO, 1987.

15. Manoliu, M., Roman, P., Metode statistice de calcul i prelucrare a
datelor hidrologice i de calitate a apelor, Institutul Politehnic Bucureti, 1983.

16. Meylan, P., Musy, A., Hydrologie frquentielle, EPFL, 1996.

17. Mihil, M., Introducere n teoria probabilitilor i statistic
matematic, Editura Didactic i Pedagogic. Bucureti, 1965.

18. Mihoc, Gh., Muja, A., Diatcu, E., Bazele matematice ale teoriei
fiabilitii, Editura Dacia, Cluj-Napoca, 1976.

19. Mociorni, C., Dinc, A., Blindru, Al., Instruciuni pentru calculul
viiturilor teoretice pe ruri mari, I.M.H., 1979.

20. Moineagu, C., Negur, I., Urseanu, V. , Statistic, Editura tiinific
i Enciclopedic, Bucureti, 1976.

21. Panaite, V., Munteanu, R., Control statistic i fiabilitate. Editura
didactic i Pedagogic, Bucureti, 1982.

22. Prvulescu, C., Economia apelor, I.C.B., 1978.

23. Scuiu, I., Zorilescu, D., Numere aleatoare. Editura Academiei,
Bucureti, 1978.

24. Schulz, E.F., Problems in Applied Hydrology, Water Resources
Publications, 1989.

25. Shahin, M., van Oorschot, H.J.L., de Lange, S.J., Statistical Analysis
in Water Resources Engineering. A.A. Balkema, Rotterdam, 1993.


186
26. Simon, Al., Vian, V., Generarea debitelor medii lunare n mai multe
seciuni ale bazinului hidrografic. Studii de Economia apelor. ICPGA-CNA,
Bucureti, 1974.

27. Stnescu, V. Al., Statistic matematic aplicat n hidrologie
(nepublicat), Bucureti, 1985.

28. STAS 4068/1-82, Determinarea debitelor i volumelor maxime ale
cursurilor de ap.

29. Vduva, I., Modele de simulare cu calculatorul, Editura Tehnic,
Bucureti, 1977.

30. Vladimirescu, I., Hidrologie, Prelegeri pentru cursurile
postuniversitare, I.C.B., 1978.

31. Vladimirescu, I., Hidrologie, Editura Didactic i Pedagogic,
Bucureti, 1978.

32. Vladimirescu, I., Bazele hidrologiei tehnice, Editura Tehnic,
Bucureti, 1984.

33. Yevjevich, V., Probability and statistics in Hydrology, Water
Resources Publications, Fort Collins, Colorado, USA, 1972.

34. XXX, Rurile Romniei. Monografie hidrologic. I.M.H. Bucureti,
1971.

35. XXX, Dicionar de matematici generale, Editura Enciclopedic
Romn, Bucureti, 1974.

187

S-ar putea să vă placă și