Sunteți pe pagina 1din 186

MINISTERUL ¥NVźÅMÂNTULUI

Program TEMPUS S_JEP 09781/1


GESTION ET PROTECTION DE LA Radu DROBOT
RESSOURCE EN EAU

BAZELE STATISTICE
ALE HIDROLOGIEI

Serie coordonatå de:

Radu DROBOT - Universitatea Tehnicå


de Construc¡ii Bucure¿ti

Jean Pierre CARBONNEL


Universitatea Pierre et Marie Curie - Paris 6

EDITURA DIDACTICÅ ªI PEDAGOGICÅ, R.A. - BUCUREªTI, 1996


ISBN 973 - 30 - 4832 - 1

Copyright © 1997. Toate drepturile asupra acestei edi¡ii sunt rezervate


Editurii Didactice ¿i Pedagogice, R.A., Bucure¿ti

Redactori: Iuliana ARHANGHELSCHI ¿i Tincu¡a ANTON


Grafician: Dumitru ªMALENIC
PREFAºÅ

Cursul BAZELE STATISTICE ALE HIDROLOGIEI î¿i propune o prezentare


didacticå a no¡iunilor de bazå ale statisticii matematice ¿i ale utilizårii acesteia
în domeniul resurselor de apå.
Materialul este prezentat gradat, trecerea de la no¡iunile elementare la cele
de mare complexitate fåcându-se foarte lent. S-a urmårit, în special, în¡elege-
rea pe baze intuitive a unor no¡iuni matematice considerate adesea dificile,
renun¡ându-se, din acest motiv, la demonstra¡ii matematice care fac de altfel
obiectul altor cursuri.
Numeroase exemplificåri din domeniul practic au rolul de a permite
în¡elegerea corectå a no¡iunilor prezentate, în vederea formårii unui mod de
gândire statistic, atât de necesar în hidrologie ¿i gospodårirea apelor, unde
informa¡iile de care se dispune sunt adesea insuficiente.
Farå a idealiza calculul statistic, s-a insistat mult asupra premizelor sale,
pentru a-i în¡elege corespunzåtor posibilitå¡ile, dar ¿i limitele. Nu trebuie uitat
cå probabilitatea constituie o måsurå a incertitudinii ¿i cå abia pe måsura
cunoa¿terii aprofundate a unui fenomen i se pot descifra corect mecanismele ¿i
deci, se poate ajunge la formularea unor dependen¡e de tip determinist, de la
cauzå la efect.
Pânå la realizarea acestui deziderat, abordarea statisticå este în måsurå så
ofere råspunsuri ¿i solu¡ii la o serie de probleme practice din domeniul
cunoa¿terii ¿i utilizårii resurselor de apå.
Terminologia utilizatå este în concordan¡å cu STAS-urile în vigoare, dar ¿i
cu limbajul matematic al teoriei probabilitå¡ilor ¿i statisticii matematice.
Lucrarea BAZELE STATISTICE ALE HIDROLOGIEI se adreseazå speciali¿ti-
lor din domeniul resurselor de apå, cursan¡ilor de la cursurile ªcolii de Studii
Postuniversitare INGINERIA RESURSELOR DE APÅ, ca ¿i studen¡ilor de la
cursurile de zi, care au hidrologia ca obiect de studiu: Hidrotehnicå,
Hidroenergeticå, Agronomie, Geografie, etc.

Autorul
CUPRINS

1. GENERALITźI ................................................................................... 7
1.1. Statisticå matematicå. Defini¡ie......................................................... 7
1.2. Variabile deterministe. Variabile aleatoare ....................................... 7
1.3. Clasificarea variabilelor aleatoare ..................................................... 8
1.4. Popula¡ie statisticå. Selec¡ie .............................................................. 9
1.5. Frecven¡å absolutå. Frecven¡å relativå. Probabilitate.......................... 10
1.6. Reparti¡ii teoretice. Reparti¡ii empirice .............................................. 12

2. VARIABILE ALEATOARE DISCRETE ............................................. 13


2.1. Repart¡ia unei variabile aleatoare discrete ......................................... 13
2.1.1. Exemple de reparti¡ii discrete ..................................................... 15
2.1.2. Reprezentarea graficå a reparti¡iilor discrete ............................... 17
2.2. Func¡ia de reparti¡ie a unei variabile discrete .................................... 21
2.2.1. Proprietå¡i ale func¡iei de reparti¡ie ............................................. 22
2.2.2.Reprezentarea graficå a func¡iei de reparti¡ie pentru o
variabilå discretå ......................................................................... 25
2.2.3. Probabilitatea apari¡iei unei variabile discrete într-un
anumit interval ............................................................................ 27
2.2.4. Reprezentarea func¡iei de reparti¡ie a unei variabile discrete
(sau discretizate) cu valorile grupate pe intervale ........................ 30
2.3. Complementara func¡iei de reparti¡ie (probabilitatea de depå¿ire) ..... 32
2.3.1. Interpretarea geometricå a probabilitå¡ii de depå¿ire ................... 34
2.3.2. Reprezentarea graficå a probabilitå¡ii de depå¿ire ....................... 35
2.3.3. Rela¡ia de calcul a probabilitå¡ii de depå¿ire ............................... 36
2.3.4. Calculul probabilitå¡ii de depå¿ire a valorilor xi în hidrologie ...... 39
2.4. Modul de reprezentare a func¡iilor de reparti¡ie în hidrologie ............ 42
2.4.1. Semnifica¡ia probabilitå¡ii de depå¿ire în hidrologie .................... 45

3. VARIABILE ALEATOARE CONTINUE ........................................... 48


3.1. Densitate de reparti¡ie. Func¡ie de reparti¡ie ...................................... 48
3.2. Reprezentarea graficå a probabilitå¡ii de depå¿ire în hidrologie ........ 53
3.3. Extrapolarea reparti¡iilor empirice prin reparti¡ii teoretice ................ 54

4. VALORI TIPICE ALE VARIABILELOR ALEATOARE ................. 57


4.1. Parametri ai tendin¡ei centrale ........................................................... 57
4.2. Parametri ai variabilitå¡ii .................................................................. 61
4.3. Parametri ai formei ............................................................................ 67
4.4. Calculul parametrilor statistici ai reparti¡iilor empirice ...................... 69
4.5 Evaluarea parametrilor reparti¡iilor teoretice ..................................... 73
4.5.1. Metoda momentelor .................................................................... 73
4.5.2. Metoda verosimilitå¡ii maxime ................................................... 75
4.5.3. Metoda celor mai mici påtrate ..................................................... 77
4.6. Erori ¿i limite ale calculului statistic .................................................. 81

5
5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE .............. 85
5.1. Reparti¡ia normalå ............................................................................ 85
5.2. Aplica¡ii ale reparti¡iei normale în hidrologie .................................... 92
5.3. Reparti¡ia log-normalå (logaritmic normalå) ...................................... 100
5.4. Reparti¡iile Gama .............................................................................. 105
5.4.1. Reparti¡ia Γ1 ................................................................................ 106
5.4.2. Reparti¡ia Γ2 ................................................................................ 108
5.4.3. Reparti¡ia Γ3 ................................................................................ 115
5.4.4. Corec¡ia de siguran¡å ∆Qp% .......................................................... 125
5.5. Reparti¡ia Gumbell ............................................................................ 126
5.6. Reparti¡ii statistice auxiliare .............................................................. 127

6. INTERVALE DE ¥NCREDERE ........................................................... 132

7. VERIFICAREA IPOTEZELOR STATISTICE ................................... 138

8. VARIABILE ALEATOARE N-DIMENSIONALE .............................. 144


8.1. Func¡ie de reparti¡ie ¿i densitate de reparti¡ie .................................... 144
8.2. Variabile aleatoare bi-dimensionale .................................................. 147
8.2.1. Reparti¡ia normalå bi-dimensionalå ............................................ 150
8.2.2. Reparti¡ii empirice bi-dimensionale ............................................ 150
8.3. Reprezentåri ¿i reparti¡ii empirice bi-dimensionale în hidrologie.
Corela¡ii ............................................................................................ 152
8.3.1. Clasificarea corela¡iilor ............................................................... 156
8.3.2. Coeficientul de corela¡ie al variabilelor bi-dimensionale ............ 158
8.3.3. Interpretarea coeficientului de corela¡ie. Proprietå¡i .................... 162
8.3.4. Estimarea parametrilor regresiei liniare simple ........................... 164
8.3.5. Intervale de încredere în cazul regresiei liniare simple ................ 169
8.3.6. Regresia neliniarå simplå ............................................................ 171
8.3.7. Raportul de corela¡ie ................................................................... 174
8.4. Corela¡ii liniare multiple ................................................................... 177
8.4.1. Coeficientul corela¡iei liniare multiple ........................................ 179
8.4.2. Autocorela¡ia sau corela¡ia serialå ............................................... 180
8.5. Generarea debitelor ........................................................................... 182

BIBLIOGRAFIE .................................................................................... 185

6
1. GENERALITźI

1.1. STATISTICÅ MATEMATICÅ. DEFINIºIE

Prin teoria statisticii sau statisticå matematicå se în¡elege disciplina care se


ocupå cu formularea ¿i interpretarea legilor de comportare atât ale fenomenelor
de maså (inaccesibile metodelor deterministe), cât ¿i ale fenomenelor rare,
având o frecven¡å reduså de apari¡ie (V. Bobancu, 1974).
¥n cazul fenomenelor de maså, legitå¡ile statistice trebuie interpretate ca
tendin¡e predominante ¿i pot fi eviden¡iate numai în condi¡iile unui numår
suficient de mare de observa¡ii asupra ansamblului studiat (C. Moineagu ¿.a.,
1976).
¥n domeniul hidrologiei, sarcina de a ob¡ine informa¡ii primare asupra
mårimilor hidrologice (niveluri, debite, viteze etc.) revine hidrometriei, iar
totalitatea datelor privind råspândirea, cantitatea ¿i varia¡ia apelor de suprafa¡å
¿i subterane constituie fondul hidrologic. Prin prelucrarea statisticå a datelor din
fondul hidrologic se ob¡in în principal parametri necesari pentru dimensionarea
lucrårilor hidrotehnice.

1.2. VARIABILE DETERMINISTE. VARIABILE ALEATOARE

¥ntrucât baza teoreticå a metodelor utilizate în statistica matematicå o


constituie teoria probabilitå¡ilor, este necesarå reamintirea unor no¡iuni de bazå
din acest capitol al matematicii.
De la început trebuie fåcutå distinc¡ia între mårimile deterministe ¿i cele
aleatoare. Dacå un anumit fenomen depinde de un numår restrâns de cauze
cunoscute (sau eventual influen¡ele altor factori sunt nesemnificative ¿i deci nu
mai are sens cercetarea lor), variabilele care definesc acest fenomen sunt de tip
determinist; caracteristic mårimilor deterministe este legåtura directå între cauzå
¿i efect (în sensul mecanicii newtoniene).
¥n alte cazuri înså, fenomenul studiat depinde de o multitudine de cauze,
principale sau secundare, esen¡iale sau neesen¡iale, de multe ori greu de
descifrat ¿i de naturå så imprime o mare variabilitate cazurilor singulare
(C. Moineagu ¿.a., 1976); în aceste condi¡ii, fenomenul este tratat independent

7
de cauzele care îl produc, iar variabilele care îl caracterizeazå capåtå un
pronun¡at caracter aleator.
¥ntr-un limbaj simplist, o variabilå aleatoare este o mårime care, ca rezultat
al unui experiment, poate lua o valoare oarecare din domeniul såu de defini¡ie,
fårå så se poatå preciza dinainte care va fi aceastå valoare. Realizarea unei
anumite valori a variabilei aleatoare are deci un caracter pur întâmplåtor;
termenul sinonim de variabilå stohasticå eviden¡iazå tocmai acest aspect (în
limba greacå stohosis înseamnå presupunere sau conjuncturå). De exemplu, prin
aruncarea unui zar perfect omogen nu se poate anticipa care fa¡å va fi deasupra
dupå cådere. La fel nu se pot preciza dinainte debitele maxime anuale care se
vor realiza în viitor pe un curs de apå.
¥n hidrologie sunt utilizate atât metode ¿i modele deterministe, cât ¿i metode
¿i modele probabilistice, alegerea unei abordåri sau a celeilalte depinzând de
cantitatea de informa¡ii disponibile sau de gradul de cunoa¿tere a fenomenului
analizat. La transformarea precipita¡iilor în componente ale scurgerii, se poate
admite de exemplu cå distribu¡ia acestora depinde numai de intensitatea ploii ¿i
umiditatea solului, ignorând restul factorilor care au o influen¡å mai reduså. ¥n
aceste condi¡ii este posibilå stabilirea unei legåturi cauzå-efect, de tip
determinist. ¥n mod similar se petrec lucrurile ¿i la evaluarea evapotranspira¡iei
de la suprafa¡a apei, considerându-se cå aceasta depinde numai de viteza
vântului ¿i deficitul de umiditate al aerului.
¥n schimb, dacå se examineazå regimul debitelor maxime viitoare ale unui
râu - regim care depinde atât de factori locali cum sunt cei fiziografici, cât ¿i
generali, de tip climatic (¿i a cåror evolu¡ie nu este cunoscutå) - o abordare de
tip determinist este imposibil de realizat, pentru evaluarea debitelor maxime
necesare proiectårii construc¡iilor hidrotehnice utilizându-se metode statistice.

1.3. CLASIFICAREA VARIABILELOR ALEATOARE

Variabilele aleatoare sunt de tip discret, atunci când iau o mul¡ime finitå sau
cel mult numårabilå de valori (se reaminte¿te cå o mul¡ime numårabilå este
infinitå, putând fi puså în coresponden¡å cu ¿irul numerelor naturale care este
infinit). Variabilele aleatoare care pot lua doar un numår finit de valori se
numesc variabile simple ¿i constituie un caz particular al variabilelor discrete;
acestea sunt de altfel utilizate în prelucrårile hidrologice.
Variabilele aleatoare sunt continue, atunci când mul¡imea valorilor lor este
nenumårabilå; cu alte cuvinte o variabilå aleatoare continuå, poate lua orice
valoare în intervalul ei de varia¡ie sau la limitå între -∞ ¿i +∞.
Variabilele aleatoare mai pot fi clasificate în variabile dependente ¿i
independente. Din punct de vedere intuitiv, douå sau mai multe variabile
aleatoare sunt independente dacå probabilitatea producerii uneia nu depinde de

8
faptul dacå celelalte s-au realizat sau nu. ¥n caz contrar, variabilele vor fi
dependente.

1.4. POPULAºIE STATISTICÅ. SELECºIE

Prin popula¡ie statisticå se în¡elege orice colectivitate care face obiectul unui
studiu statistic. Deoarece scopul unui astfel de studiu îl constituie stabilirea unei
legi cantitative referitor la colectivitatea analizatå, popula¡ia statisticå poate fi
interpretatå drept mul¡imea tuturor valorilor posibile ale unei variabile
aleatoare. Elementele componente ale unei popula¡ii se numesc unitå¡i ale
popula¡iei. Numårul N al unitå¡ilor unei popula¡ii constituie volumul popula¡iei.
¥n func¡ie de volumul popula¡iei, se disting popula¡ii finite (cu numår finit de
unitå¡i) ¿i popula¡ii infinite (cu un numår nelimitat de unitå¡i).
Cercetarea statisticå a unei popula¡ii se realizeazå urmårind o anumitå
caracteristicå a unitå¡ilor ce formeazå popula¡ia respectivå. Cercetarea totalå
(a tuturor unitå¡ilor unei popula¡ii) nu este înså nici posibilå ¿i nici necesarå în
anumite cazuri; se recurge atunci la cercetarea unor e¿antioane sau selec¡ii,
putându-se trage concluzii referitoare la caracteristicile întregii popula¡ii.
¥n hidrologie, de exemplu, nu se dispune de întrega gamå de valori posibile
ale unor variabile aleatoare ca: debite, niveluri, precipita¡ii, temperaturi. Aceastå
situa¡ie se explicå prin faptul cå marea majoritate a sta¡iilor hidrologice sau
posturilor hidrometrice au o duratå de func¡ionare care de obicei nu depå¿e¿te
30-40 ani, singura excep¡ie constituind-o la noi în ¡arå Dunårea, pentru care se
dispune de înregistråri din anul 1838.
Cu alte cuvinte, în locul popula¡iei statistice se dispune de o mul¡ime finitå
de elemente observate : x1, x2,... xn, adicå de o selec¡ie sau e¿antion de volum n,
unde n este numårul elementelor observate. Ca urmare, în hidrologie se pune
problema de a determina o serie de caracteristici (debit cu o anumitå
probabilitate de depå¿ire, valoare medie, abatere medie påtraticå etc.) ale unei
popula¡ii statistice, de¿i datele disponibile au un volum limitat n.
Mai mult decât atât, dacå s-ar considera o altå selec¡ie, de asemenea de
volum n (dar referitoare la altå perioadå de observa¡ii), parametrii celor douå
selec¡ii ar fi diferi¡i, de¿i selec¡iile fac parte din aceea¿i popula¡ie statisticå.
Varia¡iile rezultate de la o selec¡ie la alta se numesc fluctua¡ii de selec¡ie.
Este evident cå, cu cât numårul observa¡iilor (sau volumul selec¡iei) este mai
mare, cu atât semnifica¡ia rezultatelor ob¡inute va fi mai ridicatå.
¥n hidrologie se considerå în mod obi¿nuit cå o selec¡ie de volum n > 30
oferå o precizie suficientå a calculului; atunci când volumul selec¡iei este prea
mic (n < 30), pentru a se elimina erorile la determinarea parametrilor statistici

9
vor trebui introduse anumite corec¡ii (de exemplu pentru coeficientul de varia¡ie
sau coeficientul de asimetrie).
Statistica matematicå utilizeazå metode care permit ob¡inerea unor
caracteristici ale unei popula¡ii, numai prin cercetarea directå a unei par¡i nu
prea mari din unitåtile popula¡iei. O asemenea cercetare selectivå va conduce la
concluzii care au un anumit grad de incertitudine care nu trebuie pierdut din
vedere la valorificarea ¿i interpretarea rezultatelor.
Pentru ca rezultatele ob¡inute prin studierea unui e¿antion så reflecte cât mai
corect caracteristicile popula¡iei din care a fost selec¡ionat, trebuie îndeplinite
urmåtoarele condi¡ii (C.Dinescu, V.Såvulescu, 1978):
a) popula¡ia din care se extrage selec¡ia så fie cât mai omogenå;
b) volumul selec¡iei så fie cât mai mare;
c) toate unitå¡ile care formeazå selec¡ia så fie extrase la întâmplare din
popula¡ia studiatå;
d) fiecare unitate a popula¡iei så aibå aceea¿i probabilitate de a face parte
din selec¡ie.
¥n cazul hidrologiei, unele condi¡ii nu sunt îndeplinite decât într-o måsurå
reduså (de exemplu condi¡ia b), în timp ce despre alte condi¡ii nu se poate
afirma dacå sunt sau nu îndeplinite (condi¡iile a, c ¿i d).

1.5. FRECVENºÅ ABSOLUTÅ. FRECVENºÅ RELATIVÅ.


PROBABILITATE
Fie o selec¡ie de volum n ¿i x1, x2,..., xn valorile caracteristicii în ordinea
extragerii, måsurate la cele n unitåti ale e¿antionului.
De obicei, aceste valori se ordoneazå crescåtor (sau eventual descrescåtor);
¡inând seama de faptul cå unele valori pot fi egale, valorile discrete consecutive
vor fi notate acum prin x1, x2, ..., xk (k ≤ n). Trebuie men¡ionat cå valorile
corespunzåtoare indicilor din noua numerotare nu mai corespund cu cele din
vechea numerotare. Fie n1, n2, ..., nk numårul de apari¡ii sau frecven¡ele absolute
ale fiecårei valori; deci valoarea x1 se caracterizeazå prin frecven¡a absolutå n1,
valoarea x2 a variabilei prin frecven¡a absolutå n2 etc. Evident suma frecven¡elor
absolute este egalå cu volumul selec¡iei:

k
∑ ni = n . (1.1)
i =1

Raportând frecven¡ele absolute la volumul selec¡iei (deci numårul cazurilor


favorabile, de apari¡ie a unei valori, la numårul total de cazuri posibile) se ob¡in
frecven¡e relative.

10
Frecven¡a relativå este prin urmare definitå astfel:

ni
fi = . (1.2)
n

Dacå experimentul se repetå, considerând un volum n al selec¡iei din ce în ce


mai mare, se constatå cå frecven¡ele relative fi tind så se stabilizeze; valorile
cåtre care tind la limitå frecven¡ele relative în condi¡iile în care fenomenul ar fi
supus în acelea¿i condi¡ii unui numår nelimitat de probe, reprezintå de fapt
probabilitå¡ile pi de realizare a valorilor xi (i = 1, 2, ..., k).
Aceastå lege statisticå poartå denumirea de legea numerelor mari ¿i permite
ca în practicå probabilitå¡ile så fie aproximate prin frecven¡e relative; deci:

ni ni
p i = lim ≈ . (1.3)
n →∞ n n

Cu alte cuvinte, frecven¡a relativå ob¡inutå dupå un numår mare de


experimente, poate fi folositå pentru aprecierea probabilitå¡ilor de producere a
unui eveniment aleator.
k k n 1 k n
Evident, ∑ p i = ∑ i = ∑ ni = = 1 adicå suma probabilitå¡ilor este
i =1 i =1 n n i =1 n
unitarå.
¥n continuare vor fi prezentate câteva situa¡ii particulare interesante.
a) ¥n cazul în care volumul selec¡iei nu este prea mare, se considerå pentru
scopuri practice cå probabilitå¡ile de apari¡ie ale diverselor valori sunt egale
între ele, având valoarea 1/n.
Aceastå situa¡ie se întâlne¿te de altfel curent în prelucrarea datelor
hidrologice, mai precis a curbei probabilitå¡ilor de depå¿ire. Se pot da ca
exemple ¿irul debitelor maxime sau minime anuale, al debitelor medii lunare, al
debitelor medii anuale, al precipita¡iilor anuale, al evapotranspira¡iei etc. ¥n
toate aceste cazuri se dispune de regulå de un numår de circa 20 ... 40 valori.
b) ¥n cazul în care numårul n de måsuråtori este mare, se poate recurge la o
grupare a acestor valori pe intervale egale. Frecven¡a absolutå în acest caz va
reprezenta numårul de apari¡ii în cadrul fiecårui interval, iar probabilitatea
raportul dintre frecven¡a absolutå a intervalului ¿i numårul total de probe. ¥n
hidrologie, acest procedeu este utilizat la construirea practicå a graficului de
frecven¡å al nivelurilor, plecând de la hidrograful de nivel dintr-o sec¡iune datå.
Pentru studiul acestor variabile, domeniul de varia¡ie al caracteristicii
examinate (debit, nivel etc.) se împarte în intervale elementare, fiecare

11
con¡inând un anumit numår de valori ale ¿irului de date. Mårimea intervalului se
poate alege dupå formula (V. Panaite, R. Munteanu, 1982):

x max − x min
d= ; (1.4)
1 + 3,222 lg n

unde xmax ¿i xmin sunt valorile extreme din selec¡ia consideratå, iar n este
volumul selec¡iei. Evident d se va rotunji prin lipså sau adaus la numårul întreg
cel mai apropiat.
¥n rela¡ia anterioarå, numitorul reprezintå numårul total m al intervalelor de
grupare.
Pentru n > 100, numårul de intervale se poate calcula cu una din rela¡iile:

1
⎡1 ⎤ 5
m = 4 ⎢ (n − 1)⎥ , (1.5)
⎣4 ⎦

sau

m= n . (1.6)

¥n general, se considerå (V. Panaite, R. Munteanu, 1982) cå pentru n < 250


este suficientå împår¡irea în 10 intervale; dacå n < 25 gruparea valorilor nu se
mai aplicå. Frecven¡ele ob¡inute dupå grupare se atribuie mijlocului fiecårui
interval, intervalul fiind considerat închis la stânga ¿i deschis la dreapta.

1.6. REPARTIºII TEORETICE. REPARTIºII EMPIRICE

Prin reparti¡ia (func¡ia de probabilitate sau distribu¡ia) unei variabile


aleatoare se în¡elege exprimarea legii ei probabilistice (adicå a probabilitå¡ii cu
care variabila poate lua diverse valori din domeniul ei de varia¡ie).
S-a aråtat cå studiul unei colectivitå¡i sau al unui fenomen de maså se
efectueazå în general folosind selec¡ii de volum limitat. Din acest motiv,
rezultatele investiga¡iei statistice con¡in un anumit grad de incertitudine, care nu
poate fi eliminat decât prin cercetarea întregii popula¡ii statistice. Variabila
aleatoare corespunzåtoare studierii întregii colectivitå¡i se nume¿te variabilå
teoreticå ¿i este evident diferitå de variabila empiricå, corespunzåtoare selec¡iei
efectuate. Deci pe baza datelor ob¡inute din måsuråtori se dispune de reparti¡ia
variabilei empirice (numitå ¿i reparti¡ie empiricå) ¿i care este mai mult sau mai
pu¡in diferitå de reparti¡ia teoreticå (necunoscutå de altfel cu certitudine),
corespunzåtoare întregii popula¡ii (P. Meylan, A. Musy, 1996).

12
2. VARIABILE ALEATOARE DISCRETE

2.1. REPARTIºIA UNEI VARIABILE ALEATOARE DISCRETE

Reparti¡ia unei variabile aleatoare X de tip discret constå în enumerarea


tuturor valorilor posibile ale variabilei, precum ¿i a frecven¡elor
(probabilitå¡ilor) corespunzåtoare; reprezentarea rezultatelor se face sub forma
unui tabel, numit tabloul reparti¡iei (tab. 2.1).

Tabelul 2.1

Valori xi x1 x2 ... xn
Frecven¡e fi f1 f2 ... fn

Se mai poate utiliza una din formele:

⎛x x2 L xn⎞ ⎛ xi ⎞ ⎛xi⎞
X: ⎜ 1 ⎟ ; X: ⎜ ⎟ =⎜ ⎟ ; i = 1, n (2.1)
⎝ f1 f2 L fn ⎠ ⎝ f ( x i )⎠ ⎝ f i ⎠

¥n cazul reparti¡iilor empirice, fi sunt valori numerice ¿i reprezintå frecven¡e


de apari¡ie a valorilor xi.
Pentru variabilele teoretice de tip discret func¡ia de probabilitate se scrie sub
o formå similarå:

⎛ xi ⎞ ⎛xi⎞ ⎛ xi ⎞
X: ⎜ ⎟ =⎜ ⎟ =⎜ ⎟ ; (2.2)
⎝ Pr ob ( X = x i )⎠ ⎝ p i ⎠ ⎝ f ( x i )⎠

¥n acest caz, probabilitå¡ile pi de realizare a valorilor xi au de regulå


exprimåri analitice (ex: reparti¡ia Poisson, reparti¡ia Bernoulli etc.).
Mårimile pi = Prob (X=xi) definesc probabilitå¡ile de realizare a evenimen-
telor elementare (X = xi); valorile lor sunt cuprinse în intervalul [0,1].

13
Deoarece evenimentele (X = xi) formeazå un sistem complet de evenimente
(reuniunea lor este evenimentul sigur) trebuie ca:

n
∑ pi = 1 . (2.3)
i=1

Reprezentåri similare ale reparti¡iei frecven¡elor se utilizeazå ¿i în cazul în


care se dispune de un numår mare de valori discrete ale variabilei ¿i este
necesarå gruparea lor. Alteori înregistrårile din måsuråtori sunt continue (de
exemplu cazul nivelurilor måsurate cu un limnigraf), dar pentru prelucrare se
recurge la discretizare, adicå la aproximarea func¡iei continue prin valori
punctuale. ªi în aceste situa¡ii se impune gruparea valorilor pe intervale.
Tabloul reparti¡iei frecven¡elor con¡ine de regulå pe lângå intervalul de
discretizare, atât frecven¡ele absolute, cât ¿i pe cele relative.
Fie o variabilå având pe a ca limitå inferioarå ¿i pe b ca limitå superioarå a
valorilor; se împarte domeniul de varia¡ie în m intervale egale ¿i se noteazå
capetele intervalelor de discretizare prin:

x1 = a + D, x2 = a + 2D, ..., xi = a + iD, ...

unde D este mårimea intervalului. ¥n acest caz tabloul reparti¡iei frecven¡elor


va fi urmåtorul:

Tabelul 2.2

Intervalul Frecven¡e absolute Frecven¡e relative

[a, x 1) n1 f1
[x1, x2) n2 f2
[x2, x3) n3 f3
... ... ...
[xm-1,xm) nm fm

m m
∑ ni = n ∑ fi = 1
i=1 i=1

14
Din motive de alegere a unui numår întreg de intervale de discretizare,
xm = a + m . D ≥ b, deci b sau coincide cu xm sau este situat între xm-1 ¿i xm.
Numårul de valori discrete ale variabilei s-a notat prin n.

2.1.1. EXEMPLE DE REPARTIºII DISCRETE

• Distribu¡ia discretå uniformå. ¥n cazul în care probabilitå¡ile elementare


pi=f(xi) sunt egale, distribu¡ia se nume¿te uniformå.
Cel mai simplu exemplu de distribu¡ie uniformå este al variabilei aleatoare X
care reprezintå numårul de puncte de pe fa¡a superioarå a unui zar dupå
aruncare. Dezvoltat, func¡ia de probabilitate (reparti¡ia) se poate scrie astfel:

⎛1 2 3 4 5 6⎞
⎜ ⎟
X: ⎜ ⎟ . (2.4)
⎜1 1 1 1 1 1⎟
⎜ ⎟
⎝6 6 6 6 6 6⎠
iar condensat:

⎛ xi ⎞
⎜ ⎟
X: ⎜ ⎟ ; xi = 1, 2, ... , 6 . (2.5)
⎜ 1⎟
⎜ ⎟
⎝ 6⎠

Probabilitå¡ile evenimentelor elementare au valorile pi = f (xi) = 1/6.


¥n mod similar, fie cazul unui ¿ir de debite maxime anuale pentru o perioadå
de 25 ani. Fiecare debit realizându-se o singurå datå în cei 25 ani, probabilitatea
sa de apari¡ie se considerå 1/25, iar reparti¡ia variabilei aleatoare va fi:

⎛ Qi ⎞
⎜ ⎟
Qmax.anual :⎜ ⎟ ; i = 1, 2, ..., 25 . (2.6)
⎜ 1⎟
⎜ ⎟
⎝ 25 ⎠

¥n acest caz, probabilitå¡ile elementare sunt pi = f(xi) = 1/25.


• Distribu¡ia Bernoulli (binomialå). Reparti¡ia binomialå se aplicå acelor
variabile care au doar douå ståri posibile, dar complementare, adicå realizarea
sau nerealizarea unui eveniment (zi ploioaså - zi fårå ploaie, plus-minus, zero-
mai mare decât zero etc.).
Pentru un numår infinit de încercåri, se noteazå cu p probabilitatea de
realizare a unui eveniment aleator ¿i cu q = 1 - p nerealizarea sa. Atunci proba-

15
bilitatea de realizare a evenimentului aleator de α ori în n experimente este dat
de termenul general al dezvoltårii binomului lui Newton:
( p + q) = C nn p n qo + C nn − 1 p p − 1q1 +...+C αn pα q n − α +...+C no p o q n − o .
n
(2.7)

n!
¥n aceastå formulå C αn = . Evident p ¿i q fiind complementare,
α !( n − α ) !
p + q = 1.
Legea de reparti¡ie va fi deci de forma:

⎛n n −1 ... α 0 ⎞
X: ⎜ n n −1 n −1 1 α α n −α ⎟ . (2.8)
⎝ p C n p q ... C n p q C n0 p 0 q n − 0 ⎠

Deoarece p + q = 1, din rela¡ia (2.7) rezultå cå suma tuturor probabilitå¡ilor


va fi de asemenea egalå cu 1.
n
Prima valoare p reprezintå probabilitatea ca variabila X så ia valoarea n,
adicå evenimentul aleator så se realizeze în toate cele n experimente. Se observå
n
cå pentru n mare, p → 0 (p fiind subunitar), ceea ce era de a¿teptat. Termenul
general C αn pα q n −α reprezintå probabilitå¡ile evenimentelor elementare ¿i
exprimå valoarea probabilitå¡ii ca în cursul celor n experimente, evenimentul så
se realizeze de α ori. Cele n experimente au fost presupuse independente, dupå
modelul urnei lui Bernoulli.
• Reparti¡ia Poisson. Dacå în reparti¡ia Bernoulli, probabilitatea p de
realizare a evenimentului aleator tinde cåtre zero (p → 0, deci are valori infinit
mici), dar produsul np = λ este finit ¿i destul de mic când n → ∞, se ob¡ine o
altå reparti¡ie numitå distribu¡ia Poisson (sau legea evenimentelor rare, deoarece
p este foarte mic).
Se poate demonstra urmåtoarea rela¡ie:

λα e − λ
lim Cnα pα q n−α = Pn (α ; λ ) = ; λ≥0, (2.9)
n→∞
p→ 0
α!

unde λ = np este numårul mediu de sosiri. Aceastå formulå define¿te reparti¡ia


Poisson. Fiecårei valori întregi α = 0, 1, 2, ..., n, ..., îi corespunde o
probabilitate P(α; λ), iar legea de reparti¡ie este:

16
⎛ 0 1 2 ... α ...⎞
X : ⎜ −λ −λ λ2 −λ λα − λ ⎟ (2.10)
⎜e λe e ... e ...⎟
⎝ 2! α! ⎠

Probabilitå¡ile elementare sunt:

λα − λ
pα = f (α ) = e (2.11)
α!
Se observå cå:
∞ ∞ λα − λ ∞ λα
∑ P(α ; λ ) = ∑ e = e−λ ∑ = e−λ ⋅ eλ = 1 , (2.12)
α =0 α =0 α ! α =0 α !

adicå suma probabilitå¡ilor este egalå cu 1.


Se reaminte¿te cå α este numårul de realizåri ale unui eveniment de
probabilitate foarte micå p, într-un mare numår de încercåri n.

2.1.2. REPREZENTAREA GRAFICÅ A REPARTIºIILOR DISCRETE

Un rol important într-o primå examinare a variabilelor de selec¡ie îl joacå


graficele care se pot întocmi cu ajutorul lor (ele pot sugera tipul de reparti¡ie
teoreticå cel mai adecvat pentru aproximarea reparti¡iei empirice). Cele mai
uzuale reprezentåri sunt urmåtoarele:
• Reprezentare sub formå de batoane (fig. 2.1). Din dreptul fiecårei valori
de selec¡ie xi (i = 1, 2, ..., n) se ridicå o perpendicularå (un baton) de lungime
egalå cu frecven¡a relativå (probabilitatea) sau frecven¡a absolutå
corespunzåtoare.

Fig. 2.1. Reparti¡ia frecven¡elor sub formå de batoane ¿i de poligon:


a - variabile discrete cu numår redus de valori; b - variabile discrete grupate.

17
Aceastå modalitate de reprezentare se utilizeazå ¿i în cazul reparti¡iilor
teoretice, iar batoanele vor fi propor¡ionale cu mårimea probabilitå¡ilor de
realizare a diverselor valori ale variabilei.
Fie reparti¡ia discretå empiricå:

⎛x x2 ... x n ⎞
X: ⎜ 1 ⎟ (2.13)
⎝ f1 f2 ... f n ⎠

Reprezentarea reparti¡iei sub formå de batoane se poate urmåri în figura 2.1.


¥n cazul variabilelor grupate, frecven¡ele absolute sau relative se vor
reprezenta de asemenea propor¡ional cu valoarea lor, dar în mijlocul fiecårui
interval de grupare.
• Poligonul frecven¡elor (poligonul reparti¡iei probabilitå¡ilor). Fiecare
punct din reprezentarea sub formå de batoane are coordonatele (xi , fi) în cazul
reparti¡iilor empirice ¿i (xi , pi) în cazul reparti¡iilor teoretice discrete.
Unind aceste puncte se ob¡ine o reprezentare mai expresivå (fig. 2.1 - linia
întreruptå) numitå poligonul frecven¡elor (în cazul reparti¡iilor empirice) sau
poligonul reparti¡iei probabilitå¡ilor (în cazul reparti¡iilor teoretice).
Tot ca o exemplificare a acestui mod de reprezentare se prezintå poligonul
reparti¡iei probabilitå¡ilor în cazul distribu¡iei binomiale (reparti¡ie teoreticå)
pentru diferite valori ale lui n (fig. 2.2).

Fig. 2.2. Poligonul reparti¡iei probabilitå¡ilor pentru distribu¡ia binomialå.

18
• Histograma (reprezentarea sub formå de dreptunghiuri). Considerând cå
fiecare valoare xi a variabilei discrete de selec¡ie reprezintå mijlocul bazei unui
dreptunghi de înål¡ime ni sau fi se ob¡ine reprezentarea sub formå de histogramå.
Pentru a sesiza diferen¡a între modul de reprezentare graficå utilizând
poligonul frecven¡elor, respectiv histograma, se va recurge la un exemplu din
domeniul hidrologiei. Fie ¿irul precipita¡iilor zilnice, înregistrate la o sta¡ie
meteo; numårul de zile consecutive în care precipita¡iile depå¿esc zilnic 10 mm
este prezentat în tabelul 2.3 (V.Al.Stånescu, 1985).
Tabelul 2.3

Numår zile 1 2 3 4 5 6 7
Numår cazuri 189 370 280 155 83 46 23

Plecând de la tabelul 2.3 se poate defini o variabilå aleatoare cu func¡ia de


probabilitate:

⎛ 1 2 3 4 5 6 7 ⎞
X: ⎜ ⎟ . (2.14)
⎝ 0 ,165 0 ,322 0 ,244 0 ,135 0 ,073 0 ,040 0 ,021⎠

Reprezentarea graficå se poate urmåri în figura 2.3.

Fig. 2.3. Reprezentarea sub formå de histogramå (a) ¿i poligon al frecven¡elor (b)
pentru numårul zilelor consecutive cu precipita¡ii mai mari de 10 mm.

Reprezentarea sub formå de histogramå sau de poligon al frecven¡elor


(probabilitå¡ilor) se folose¿te ¿i în cazul unei variabile aleatoare continue, dar
discretizate pentru prelucrare; numårul de valori fiind de regulå destul de mare,
se recurge la gruparea acestora pe intervale.

19
¥n reprezentarea graficå, fiecare interval constituie baza unui dreptunghi al
histogramei; unind mijloacele laturilor de sus ale acestor dreptunghiuri prin
segmente de dreaptå, se ob¡ine poligonul reparti¡iei (absolute sau relative).
Fie, de exemplu, ¿irul debitelor maxime anuale de pe Dunåre pentru o
perioadå de 129 ani. Tabloul reparti¡iei frecven¡elor va fi urmåtorul:

Tabelul 2.4

Intervalul Numår de apari¡ii Frecven¡e relative


(frecven¡e absolute)
[5.000 - 6.000) 2 1,55%
[6.000 - 7.000) 6 4,65%
[7.000 - 8.000) 18 13,95%
[8.000 - 9.000) 22 17,05%
[9.000 - 10.000) 24 18,61%
[10.000 - 11.000) 20 15,50%
[11.000 - 12.000) 13 10,80%
[12.000 - 13.000) 6 4,65%
[13.000 - 14.000) 11 8,53%
[14.000 - 15.000) 3 2,33%
[15.000 - 16.000) 4 3,10%
Total: 129 100,00%

Repartizarea sub formå de histogramå ¿i poligon al frecven¡elor se poate


urmåri în figura 2.4.

Fig. 2.4. Histograma ¿i poligonul reparti¡iei frecven¡elor în cazul debitelor maxime


anuale ale Dunårii (dupå gruparea valorilor pe intervale).

20
2.2. FUNCºIA DE REPARTIºIE A UNEI VARIABILE DISCRETE

Nota¡iile utilizate în continuare sunt cele de la reparti¡iile discrete teoretice;


considera¡iile expuse sunt valabile ¿i pentru reparti¡iile empirice (la care intervin
frecven¡e relative ¿i nu probabilitå¡i). Singura diferen¡iere între cele douå
categorii de reparti¡ii se va face la reprezentarea graficå, când se va utiliza
denumirea de poligon al frecven¡elor sau al probabilitå¡ilor, dupå cum este
cazul. ¥n mod obi¿nuit nu se insistå prea mult asupra diferen¡elor de limbaj
referitoare la cele douå categorii de reparti¡ii, având în vedere legea numerelor
mari (de¿i în hidrologie, în general nu se dispune de un numår suficient de mare
de måsuråtori).
O altå modalitate de a caracteriza reparti¡ia unei variabile aleatoare discrete,
în afara celei prezentate în cadrul paragrafului 2.1 o constituie utilizarea func¡iei
de reparti¡ie.
Fie variabila aleatoare X cu func¡ia de probabilitate:

⎛x x2 ... x n ⎞
X: ⎜ 1 ⎟ . (2.15)
⎝ p1 p2 ... p n ⎠

Se reaminte¿te cå valorile x1, x2, ..., xn sunt ordonate în ordine crescåtoare:


x1< x2 < ... < xn.
Prin defini¡ie, func¡ia de reparti¡ie F(x) reprezintå probabilitatea ca variabila
aleatoare X så fie mai micå decât o valoare oarecare, particularå x:

F(x) = Prob (X < x) . (2.16)

Cu alte cuvinte func¡ia de reparti¡ie reprezintå o probabilitate de nedepå¿ire.


Variabila aleatoare X va lua valori la stânga lui x, în intervalul [xmin , x), cu o
probabilitate egalå cu F(x).
Fie reparti¡ia anterioarå ¿i o valoare oarecare x fixatå între xk ¿i xk+1.

x

⎛x x2 ... x k x k +1 ... x n ⎞
X: ⎜ 1 ⎟ (2.17)
⎝ p1 p2 ... p k p k +1 ... p n ⎠

21
Singurele valori pe care le poate lua X la stânga lui x sunt doar x1, x2, ..., xk,
variabila aleatoare fiind discretå.
Deoarece evenimentele constând în realizarea valorilor x1, x2, ..., xk, sunt
incompatibile douå câte douå, rezultå cå probabilitatea ca variabila aleatoare X
så fie mai micå decât valoarea fixatå x poate fi calculatå cu rela¡ia:

Pr ob ( X < x ) = Pr ob ( X = x 1 ) + Pr ob ( X = x 2 )+...
. (2.18)
...+ Pr ob ( X = x k ) = ∑ Pr ob ( X = x i ) = p1 + p2 +...+ pk
xi < x

Deci probabilitatea de nedepå¿ire a valorii x este egalå cu suma


probabilitå¡ilor pentru acele valori ale variabilei care sunt mai mici decât x. Din
acest motiv func¡ia de reparti¡ie se mai nume¿te ¿i func¡ia probabilitå¡ilor
cumulate sau func¡ia cumulativå a probabilitå¡ilor.

2.2.1. PROPRIETźI ALE FUNCºIEI DE REPARTIºIE

Func¡ia de reparti¡ie are urmåtoarele proprietå¡i:


a) Deoarece func¡ia F(x) reprezintå o probabilitate, conform defini¡iei
probabilitå¡ilor va avea valori cuprinse între 0 ¿i 1 (sau 0% ¿i 100%):

0 ≤ F(x) ≤ 1 (2.19)

I II III
b) Fie o serie de pozi¡ii particulare ale lui x: x , x , x etc., aceste valori fiind
situate între valorile discrete x1, x2, ..., xn.

xI x II x III x IV xN
↓ ↓ ↓ ↓ ↓
⎛ x1 x2 x 3 ... x k ... x n ⎞
X: ⎜ ⎟ (2.20)
⎝ p1 p2 p3 ... p k ... p n ⎠

Examinând tabloul (2.20) se constatå urmåtoarele:


I I I
F(x ) = Prob(X < x ) = 0 (deoarece la stânga lui x nu se gåse¿te nici o
valoare posibilå a variabilei aleatoare X.

22
II II
F(x ) = Prob(X < x ) = Prob(X = x1) = p1 (deoarece singura valoare
II
posibilå a variabilei, mai micå decât x este x1).
¥n mod similar:

III III
F(x ) = Prob(X < x ) = Prob(X = x1) + Prob(X = x2) = p1 +p2

IV IV
F(x ) = Prob(X < x ) = Prob(X = x1) + Prob(X = x2) = p1 +p2

III IV
Atât x cât ¿i x au la stânga acelea¿i douå valori posibile ale variabilei X (¿i
anume x1 ¿i x2) ¿i ca urmare probabilitå¡ile lor de nedepå¿ire vor fi egale.
I II I II
Se observå cå: x < x → F(x ) < F(x );
III IV III IV
¥n schimb pentru x < x → F(x ) = F(x );
Se poate deduce urmåtoarea regulå, care så înglobeze ambele situa¡ii:
(i) (j) (i) (j)
x < x → F(x ) ≤ F(x ) (2.21)

adicå func¡ia de reparti¡ie este nedescrescåtoare.


I I
c) Fie acum cazul în care x = x1 (deci x nu mai este situat la stânga lui x1, ci
coincide chiar cu x1).
I I
Conform defini¡iei: F(x ) = Prob(X < x ) = Prob(X < x1).
Dar aceastå probabilitate este nulå, pentru cå la stânga lui x1 variabila
aleatoare X nu mai poate lua nici o altå valoare.
Deci: F(x) = Prob(X < x) = 0, dacå x = x1.
Aceea¿i valoare a lui F(x) se ob¡ine înså ¿i pentru x ocupând o pozi¡ie
oarecare la stânga lui x1. A rezultat cå valoarea func¡iei F(x) la stânga punctului
x1 este egalå cu valoarea func¡iei în x1 adicå func¡ia F(x) este continuå la stânga.
Simbolic acest lucru se va exprima astfel:

F(x - 0) = F(x) (2.22)

¥n momentul în care punctul x în deplasarea lui pe axå depå¿e¿te valoarea x1


func¡ia de reparti¡ie are un salt ¿i F(x) = p1. Cu alte cuvinte, valoarea func¡iei la

23
dreapta punctului x1 notatå F(x1 + 0) diferå de valoarea în punctul x1 prezentând
o discontinuitate; simbolic acest lucru se exprimå astfel:

F(x + 0) ≠ F(x) (2.23)

Discontinuitå¡ile se vor manifesta la dreapta oricårui punct xi, între aceste


puncte func¡ia fiind continuå ¿i prezentându-se sub forma de palier.
Mai trebuie aråtat cå în ciuda faptului cå variabila aleatoare X este discretå,
func¡ia F(x) este definitå pentru orice valoare a lui x.
N
d) Fie acum valoarea particularå x ; se observå cå toate valorile posibile ale
N
lui X sunt mai mici decât x ¿i deci:

N N
F(x ) = Prob (X < x ) = Prob (X = x1) + Prob (X = x2) + ... + Prob (X = xn) =

= p1 + p2 + ... + pn = 1 . (2.24)

N N
Deci F(x ) = 1 (unde x este situat la dreapta celei mai mari valori posibile a
lui x).
I I
De asemenea, F(x ) = 0 (unde x este situat la stânga celei mai mici valori
posibile a lui x).
Aceste observa¡ii pot fi sintetizate în urmåtoarea regulå: dacå variabila
aleatoare poate lua valori doar în cadrul intervalului [a, b), probabilitatea de
nedepå¿ire este nulå la stânga intervalului analizat ¿i unitarå la dreapta lui.

⎧0 , dacå x ≤ a
[
X ∈ a, b) → F( x ) = ⎨ (2.25)
⎩ 1, dacå x > b

Ca o consecin¡å rezultå: F(-∞) = 0 ¿i F(+∞) = 1 (trebuie subliniat cå aceste


rela¡ii sunt valabile atât în cazul în care domeniul de defini¡ie al variabilei
aleatoare este întreaga dreaptå realå, cât ¿i în cazul în care este un interval mai
restrâns).
Rezumând proprietå¡ile prezentate pânå în prezent, rezultå cå fiind datå o
variabilå aleatoare discretå cu reparti¡ia (2.15):

⎛x x2 ... x n ⎞
X: ⎜ 1 ⎟ ,
⎝ p1 p2 ... p n ⎠

24
func¡ia sa de reparti¡ie are urmåtoarele valori:

⎧ 0 dacå − ∞ < x ≤ x 1
⎪ p dacå x 1 < x ≤ x 2
⎪ 1
⎪ p1 + p2 dacå x 2 < x ≤ x 3

⎪ L L
F( x ) = ⎨ k (2.26)
∑p dacå x k < x ≤ x k +1
⎪ i=1 i
⎪ L L
⎪ n− 1
⎪ ∑ pi dacå x n−1 < x ≤ x n
⎪ i = 11 dacå x n < x < ∞

Acest mod de definire al func¡iei de reparti¡ie råmâne valabil ¿i în cazul


grupårii valorilor pe intervale, fiecare interval [xk, xk+1) fiind caracterizat de
probabilitatea de realizare pk.
Func¡ia de reparti¡ie poate fi scriså ¿i sub altå formå (Gh. Mihoc ¿.a., 1976).
Se noteazå prin Sx = F(x+0) - F(x-0) saltul func¡iei în punctul x.
Dacå Sx = 0, x este un punct de continuitate al func¡iei F(x) (corespunde unui
palier), iar dacå Sx > 0, atunci x este un punct de discontinuitate (func¡ia are un
salt).
Func¡ia de reparti¡ie poate fi deci definitå ca suma salturilor din punctele xi
situate la stânga punctului x:

F( x ) = ∑ S x i , (2.27)
x i <x

între punctele de discontinuitate, func¡ia fiind constantå.

2.2.2. REPREZENTAREA GRAFICÅ A FUNCºIEI DE REPARTIºIE


PENTRU O VARIABILÅ DISCRETÅ

Reprezentarea graficå a func¡iei de reparti¡ie se face fie sub formå de


diagramå discontinuå în trepte, fie sub formå de poligon al frecven¡elor
(probabilitå¡ilor) cumulate (fig. 2.5).

25
Fig. 2.5. Reprezentarea distribu¡iei ¿i a func¡iei de reparti¡ie pentru
variabila aleatoare (2.14): a - distribu¡ia variabilei sub formå de batoane;
b - idem, sub formå de histogramå; c - construc¡ia diagramei în trepte;
d - ob¡inerea poligonului frecven¡elor cumulate.

Fie variabila aleatoare (2.14) reprezentând numårul de zile consecutive cu


precipita¡ii superioare valorii de 10 mm (fig. 2.5,a ¿i 2.5,b):

⎛ 1 2 3 4 5 6 7 ⎞
X: ⎜ ⎟ .
⎝ 0 ,165 0 ,322 0 ,244 0 ,135 0 ,073 0 ,040 0 ,021⎠

Func¡ia ei de reparti¡ie va fi:

26
⎧0,000 x≤1
⎪0,165 1< x ≤ 2

⎪0,487 2< x ≤ 3

⎪0,731 3< x ≤ 4
F( x ) = ⎨ (2.28)
⎪0,866 4< x ≤ 5
⎪0,939 5< x ≤ 6

⎪0,979 6< x≤7
⎪⎩1,000 7<x

Diagrama în trepte (fig. 2.5,c) poate fi puså în coresponden¡å cu reparti¡ia


probabilitå¡ilor sub formå de batoane. Func¡ia prezintå salturi în dreptul fiecårui
baton (de valoare egalå cu acesta) ¿i este constantå între batoane.
Reprezentarea sub formå de poligon a func¡iei de reparti¡ie (fig. 2.5,d) este
asociatå în general cu histograma frecven¡elor (probabilitå¡ilor) ¿i se ob¡ine
construind în prealabil histograma valorilor cumulate, dupå care se unesc
col¡urile din dreapta ale figurii astfel ob¡inute.
Dupå cum se observå din figura 2.5,d, valoarea func¡iei de reparti¡ie F(x)
pentru o valoare x fixatå (în reprezentarea sub formå de poligon al frecven¡elor
cumulate) reprezintå acea parte a ariei histogramei situatå la stânga lui x.
Fie de exemplu x = 2,2; din poligonul frecven¡elor, rezultå:

2 ,2 − 1,5
F( 2 ,2 ) = 0 ,165 + ( 0 ,487 − 0 ,165 ) = 0 ,165 + 0 ,2254 = 0 ,3904
2 ,2 − 1,5

Aceea¿i valoare se ob¡ine calculând aria histogramei de la stânga lui x = 2,2.


¥ntr-adevår, aria ha¿uratå (fig. 2.5,b) este egalå cu:

(1,5 - 0,5) 0,165 + (2,2 - 1,5) 0,322 = 0,165 + 0,2254 = 0,3904

Poligonul frecven¡elor cumulate se mai poate ob¡ine unind mijloacele


palierelor diagramei în trepte a func¡iei de reparti¡ie (fig. 2.5,c).

2.2.3. PROBABILITATEA APARIºIEI UNEI VARIABILE DISCRETE


ÎNTR-UN ANUMIT INTERVAL

Pentru a calcula probabilitatea ca variabila aleatoare X så ia valori în


intervalul [a, b), domeniul de varia¡ie va fi definit (fig. 2.6) ca diferen¡å a unor
segmente cuprinse între (-∞, b), respectiv (-∞, a).

27
Fig. 2.6. Exprimarea segmentului [a, b) ca diferen¡å a douå segmente
de lungime infinitå.

Deci:

[a, b) = (-∞, b) - (-∞, a) . (2.29)

Mai departe se poate scrie:

Prob (a ≤ X < b) = Prob (X ∈ [a, b)) =

= Prob (X ∈ (-∞, b)) - Prob (X ∈ (-∞, a)) =

= Prob (X < b) - Prob (X < a) = F(b) - F(a) (2.30)

Acest rezultat se poate verifica de altfel ¿i geometric (fig. 2.7).


Pentru exemplificare se considerå: a = 2,5 ¿i b = 5,5 ¿i se calculeazå aria
histogramei cuprinså între aceste valori:

Prob (2,5 ≤ X < 5,5) = Prob (2,5 ≤ X < 3,5) + Prob (3,5 ≤ X < 4,5) +

+ Prob (4,5 ≤ X < 5,5) = 0,244 + 0,135 + 0,073 = 0,452

Acela¿i rezultat se ob¡ine utilizând graficul func¡iei F(x) sub formå de


poligon al frecven¡elor. ¥ntr-adevår F(5,5) = 0,939, iar F(2,5) = 0,487, deci:

F(b) - F(a) = 0,939 - 0,487 = 0,452

28
Fig. 2.7. Interpretarea geometricå a apartenen¡ei variabilei
la intervalul [a, b).

Rezultå cå probabilitatea apartenen¡ei la un anumit interval [a, b) se poate


ob¡ine fie prin calculul ariei histogramei cuprinså între a ¿i b, fie prin diferen¡a
ordonatelor corespunzåtoare lui a ¿i b din poligonul frecven¡elor cumulate
(adicå F(b) - F(a)).
¥n exemplul prezentat, s-a considerat cå valorile xi (i = 1, 2, ..., 7) sunt
echidistante. Considera¡iile expuse ¿i modul de calcul råmân adevårate ¿i în
cazul în care valorile variabilei sunt oarecare.
Fie acum cazul în care limita inferioarå a = -∞ , iar b este o valoare finitå. ¥n
acest caz se poate scrie:

Prob (-∞ < X < ∞) = Prob (X < b) =F(b) - F(-∞) = F(b) - 0 = F(b)(2.31)

29
S-a ajuns la un rezultat cunoscut ¿i anume cå probabilitatea de nedepå¿ire a
unei valori oarecare este egalå cu aria histogramei situatå la stânga punctului
respectiv.
Fie acum cazul în care amândouå limitele intervalului devin infinite:

a = -∞ ¿i b = +∞

Prob (-∞ < X < ∞) = F(+∞) - F(-∞) = 1 - 0 = 1 (2.32)

ªi acest rezultat era de a¿teptat, întrucât probabilitatea ca variabila aleatoare


så ia o valoare oarecare în cadrul intervalului såu de varia¡ie este evident egalå
cu 1 (sau 100%). Ca interpretare geometricå rezultå faptul cå aria histogramei
calculatå pe întreg domeniul de varia¡ie al variabilei este unitarå.
Rezultatul ob¡inut este în concordan¡å ¿i cu faptul cå în cazul variabilei
aleatoare discrete X, care ia valorile x1, x2, ..., xn, cu probabilitå¡ile p1, p2, ..., pn,
suma probabilitå¡ilor este unitarå.
Considera¡iile expuse råmân valabile ¿i în cazul în care domeniul de varia¡ie
nu mai este întreaga axå realå, ci un interval mai restrâns: [xmin, xmax); de fapt în
acest din urmå caz, considerând intervalul de varia¡ie al variabilei de la -∞ la
+∞ se ob¡ine o problemå echivalentå, deoarece aria histogramei cuprinså între
(-∞, xmin) ¿i [xmax, +∞) este nulå. Din acest motiv, pentru generalitate se va
considera ca limitå inferioarå a valorilor variabilei -∞, iar ca limitå superioarå a
acestora +∞.

2.2.4. REPREZENTAREA FUNCºIEI DE REPARTIºIE A UNEI


VARIABILE DISCRETE (SAU DISCRETIZATE) CU VALORILE
GRUPATE PE INTERVALE

Calculul func¡iei de reparti¡ie, ¿i reprezentårile grafice sunt similare ca în


cazul variabilelor aleatoare negrupate.
Pentru exemplificare se va considera (C. Diaconu, D. Låzårescu, 1977) cazul
debitelor medii anuale ale unui râu (tab. 2.5), la care valorile au fost grupate pe
intervale.

30
Tabelul 2.5

Intervalul Frecven¡e relative


3 (probabilitå¡i)
(m /s)
30-40 4%
40-50 20%
50-60 24%
60-70 32%
70-80 12%
80-90 8%

Distribu¡ia frecven¡elor ¿i func¡ia de reparti¡ie a acestei variabile sunt


prezentate în rela¡iile (2.33), respectiv (2.34):

⎧0,04

[
x ∈ 30, 40)
⎪0,20 [
x ∈ 40, 50)
⎪⎪0,24 x ∈[ 50, 60)
f ( x ) = Pr ob ( X = x ) = ⎨
x ∈[ 60, 70)
(2.33)
⎪0,32
⎪0,12 x ∈[ 70, 80)

⎪⎩0,08 x ∈[ 80, 90)

⎧0,00 x ≤ 30
⎪0,04 30 < x ≤ 40

⎪0,24 40 < x ≤ 50

F( x ) = Pr ob ( X < x ) = ⎨0,48 50 < x ≤ 60 (2.34)
⎪0,80 60 < x ≤ 70

⎪0,92 70 < x ≤ 80
⎪1,00 80 < x

Palierele histogramei ¿i ale reprezentårii func¡iei de reparti¡ie sub formå de


diagramå cumulatå a probabilitå¡ilor corespund acum intervalelor de grupare
(fig. 2.8); poligonul frecven¡elor cumulate se ob¡ine unind punctele din partea
dreaptå a palierelor diagramei în trepte.

31
Fig. 2.8. Reprezentarea graficå a func¡iei de reparti¡ie sub formå
de diagramå în trepte ¿i de poligon al frecven¡elor cumulate.

Ca ¿i în cazul variabilei discrete simple, valorile poligonului frecven¡elor


cumulate pentru o valoare oarecare a lui x sunt egale cu ariile histogramei
situate la stânga lui x (mårimea intervalului de grupare ∆x fiind consideratå
unitarå); de asemenea probabilitatea apartenen¡ei la un anumit interval [a, b) se
ob¡ine ca diferen¡å a valorilor F(b) ¿i F(a), ceea ce reprezintå în fond aria
histogramei cuprinså între punctele de absciså a ¿i b.

2.3. COMPLEMENTARA FUNCºIEI DE REPARTIºIE


(PROBABILITATEA DE DEPŪIRE)

S-a aråtat cå func¡ia de reparti¡ie F(x) reprezintå probabilitatea de nedepå¿ire


a valorii x, cu alte cuvinte F(x) måsoarå probabilitatea ca variabila aleatoare X
så ia valori la stânga lui x. ¥n multe cazuri, în hidrologie înså intereseazå
probabilitatea de depå¿ire a unei valori oarecare x. De exemplu, probabilitatea
de depå¿ire a unui nivel minim (care încå mai permite naviga¡ia pe un râu)

32
constituie o måsurå a posibilitå¡ii de valorificare a râului respectiv drept cale de
naviga¡ie. De asemenea, probabilitatea de depå¿ire a nivelului care încå mai
permite accesul la priza de apå a unui debit egal cu cerin¡a unei folosin¡e
reprezintå gradul de asigurare cu apå al folosin¡ei respective. Probabilitatea de
depå¿ire a cotei coronamentului unui dig de apårare împotriva inunda¡iilor
constituie o måsurå a riscului de inundare, etc.
¥n loc de niveluri, în practicå se folosesc în mod curent debite cu diverse
probabilitå¡i de depå¿ire; aceasta nu schimbå prea mult datele problemei, debitul
putând fi exprimat în func¡ie de nivel prin intermediul cheii limnimetrice (sau
cheia debitelor).
Pentru calculul probabilitå¡ii de depå¿ire a unei valori oarecare x de cåtre
variabila aleatoare X se poate pleca de exemplu de la rela¡ia apartenen¡ei la un
anumit interval:

Prob (a ≤ X < b) = F(b) - F(a) . (2.35)

Fie acum b = +∞. Se ob¡ine:

Prob (a ≤ X < +∞) = F(+∞) - F(a) = 1 - F(a) . (2.36)


Dar:
Prob (a ≤ X < +∞) = Prob (X ≥ a) (2.37)

sau:
Prob (X ≥ a) = 1 - F(a) (2.38)

¥n cazul general, se poate scrie:

Prob (X ≥ x) = 1 - F(x) (2.38')

Acela¿i rezultat se putea ob¡ine ¿i prin ra¡ionamentul urmåtor:

Prob (X < x) + Prob (X ≥ x) = Prob (-∞ < X < +∞) = 1 ,

deci Prob (X ≥ x) = 1 - Prob (X < x) = 1 - F(x) . (2.39)

Deoarece Prob (X ≥ x) = 1 - F(x), aceastå func¡ie se mai nume¿te ¿i func¡ie


de reparti¡ie complementarå. ¥n continuare, pentru probabilitatea de depå¿ire a
valorii x se va utiliza atât nota¡ia 1 - F(x), cât ¿i F c ( x ) .

33
2.3.1. INTERPRETAREA GEOMETRICŠA PROBABILITźII DE DEPŪIRE

Se reaminte¿te cå, pentru o valoare fixatå x, mårimea func¡iei de reparti¡ie


F(x) este egalå cu aria histogramei situatå la stânga lui x.
Având în vedere faptul cå aria întregii histograme este unitarå, aria de la
dreapta lui x va fi egalå cu 1 - F(x). Dar aceasta este chiar func¡ia de reparti¡ie
complementarå F c ( x ) . Rezultå cå, probabilitatea de depå¿ire a valorii x
(probabilitatea ca variabila aleatoare X så ia valori mai mari sau egale cu x) este
egalå cu aria histogramei situatå la dreapta lui x (fig. 2.9).
La reprezentarea func¡iei de reparti¡ie sub formå de poligon, ordonata
cuprinså între axa Ox ¿i curba F(x) reprezintå probabilitatea de nedepå¿ire a lui
x. Rezultå cå probabilitatea de depå¿ire a lui x, deci 1-F(x), va fi egalå cu
segmentul complementar cuprins între curba F(x) ¿i paralela la absciså duså prin
punctele de ordonatå egalå cu 1.

Fig. 2.9. Interpretarea geometricå a probabilitå¡ii de depå¿ire.

34
2.3.2. REPREZENTAREA GRAFICŠA PROBABILITźII DE DEPŪIRE

Reprezentarea graficå se poate face ca ¿i la func¡ia de reparti¡ie fie sub formå


de diagramå în trepte, fie sub formå de poligon al frecven¡elor (probabilitå¡ilor)
cumulate. ¥n mod obi¿nuit, pentru scopuri hidrologice se preferå ultimul mod de
reprezentare.
Din interpretarea geometricå a probabilitå¡ii de depå¿ire, rezultå cå aceasta
va avea valoarea maximå pentru cea mai micå valoare a lui x; într-adevår, dacå
x = xmin, atunci variabila X poate lua orice valoare din domeniul ei de varia¡ie:
x1 = xmin, x2, ..., xn = xmax ¿i deci Prob(X ≥ xmin) = 100%. Valorile
probabilitå¡ii de depå¿ire vor fi apoi din ce în ce mai mici pe måsurå ce numårul
x ales este mai mare.
¥n reprezentarea sub formå de diagramå în trepte, func¡ia F c ( x ) este
constantå sau descrescåtoare; poligonul frecven¡elor se va reprezenta ca o
func¡ie descrescåtoare.

Fig. 2.10. Reprezentarea graficå a probabilitå¡ilor de depå¿ire


¿i nedepå¿ire pentru func¡ia de probabilitate (2.14).

¥n figura 2.10 sunt desenate comparativ atât func¡ia de reparti¡ie (2.28), cât ¿i
func¡ia de reparti¡ie complementarå (cu linie plinå) pentru variabila aleatoare
(2.14).
¥n figura 2.11 s-a procedat la reprezentarea graficå a probabilitå¡ilor de
depå¿ire ¿i de nedepå¿ire în cazul reparti¡iei (2.33).

35
Valorile probabilitå¡ii de depå¿ire rezultå fie din rela¡ia F c ( x ) = 1 - F(x), fie
prin calculul suprafe¡elor din histogramå situate la dreapta valorilor particulare x
ale variabilei; la calculul suprafe¡elor se va avea în vedere cå intervalul de
discretizare ∆x este considerat de mårime unitarå.

Fig. 2.11. Reprezentarea graficå a probabilitå¡ii de nedepå¿ire ¿i depå¿ire


în cazul variabilelor grupate definite de reparti¡ia (2.33).

2.3.3. RELAºIA DE CALCUL A PROBABILITźII DE DEPŪIRE

Se reaminte¿te cå pentru o variabilå aleatoare discretå cu reparti¡ia 2.15:

⎛ x < x2 < ... < xn ⎞


X: ⎜ 1 ⎟ ,
⎝ p1 p2 ... pn ⎠

36
probabilitatea de nedepå¿ire F(x) = Prob (X < x) este definitå prin rela¡ia
2.26:

⎧0 − ∞ < x ≤ x1
⎪p x1 < x ≤ x 2
⎪ 1
⎪ p1 + p2 x2 < x ≤ x3

⎪L L
⎪k
F( x ) = Pr ob ( X < x ) = ⎨ ∑ pi x k < x ≤ x k +1
⎪i = 1
⎪Ln− 1
L
⎪ ∑ pi x n− 1 < x ≤ x n
⎪ i=1
⎪n p =1 x n < x < +∞
⎪⎩i∑
=1
i

Dupå cum se observå, valorile variabilei xi au fost ordonate crescåtor:

x1 < x2 < ... < xn.

ºinând seama de rela¡ia existentå între probabilitatea de depå¿ire Fc( x) ¿i


probabilitatea de nedepå¿ire F(x), rezultå cå Fc( x) este definitå prin:

⎧1 , − ∞ < x ≤ x1
⎪1 − p , x1 < x ≤ x 2
⎪ 1
⎪... ...
⎪ k
⎪ 1 − ∑ pi , x k < x ≤ x k +1

F c ( x ) = Pr ob ( X ≥ x ) = ⎨... i =1 ... (2.40)
⎪ n −1
⎪1 − ∑ p i = p n , x n −1 < x ≤ x n
⎪ i =1
⎪... n ...
⎪1 − ∑ p i = 0 , x n < x < +∞
⎪⎩ i =1

¥n general înså, în cazul în care se calculeazå probabilitatea de depå¿ire,


valorile variabilei aleatoare nu se mai ordoneazå crescåtor, ci descrescåtor (de la
cea mai mare valoare a variabilei pânå la cea mai micå).

37
Ca atare, se recurge la o opera¡ie de renumerotare a valorilor variabilei, în
noua numerotare ele fiind notate tot prin x1, x2, ..., xn, dar fiind ordonate de data
aceasta descrescåtor (fig. 2.12).

Fig. 2.12. Renumerotarea variabilelor în vederea calculårii


probabilitå¡ilor de depå¿ire.

Probabilitatea de depå¿ire a variabilei aleatoare cu func¡ia de probabilitate:

⎛ x > x2 > ... > xn ⎞


X: ⎜ 1 ⎟ (2.41)
⎝ p1 p2 ... pn ⎠

va fi definitå prin:

⎧0 x1 < x ≤ ∞
⎪p x 2 < x ≤ x1
⎪ 1
⎪ p1 + p2 x3 < x ≤ x2

⎪L L
⎪k
F ( x ) = Pr ob ( X ≥ x ) = ⎨ ∑ pi
c
x k +1 < x ≤ x k (2.42)
⎪i = 1
⎪Ln− 1
L
⎪ ∑ pi = 1 − pn x n < x ≤ x n− 1
⎪ i=1
⎪n p =1 − ∞ < x < xn
⎪⎩i∑
=1
i

38
¥n cazul particular în care cele n valori ale variabilei au probabilitå¡i egale de
realizare (¿i anume 1/n), probabilitatea de depå¿ire se va calcula cu rela¡ia:

⎧0 x1 < x < ∞
⎪1
⎪ x 2 < x ≤ x1
⎪ n2
⎪ x3 < x ≤ x2
⎪n
⎪⎪L L
F c ( x ) = Pr ob ( X ≥ x ) = ⎨ i (2.43)
x i+1 < x ≤ x i
⎪n
⎪L L
⎪n − 1
⎪ x n < x ≤ x n− 1
⎪ n
⎪n − ∞ < x ≤ xn
⎪⎩ n

2.3.4. CALCULUL PROBABILITźII DE DEPŪIRE A VALORILOR xi


ÎN HIDROLOGIE

¥n practica hidrologicå intereseazå de cele mai multe ori probabilitatea cu


care valorile discrete xi ob¡inute din måsuråtori sunt egalate sau depå¿ite.
Considerând în rela¡ia de calcul anterioarå cå x = xi se va ob¡ine:

⎧1
⎪n x = x1
⎪2
⎪ x = x2
⎪n
⎪L L
⎪i
F ( xi ) = ⎨
c
x = xi (2.44)
⎪n
⎪L L
⎪n − 1 x = x n− 1
⎪ n
⎪n
⎪⎩ n x = xn

Fie, deocamdatå, exemplul banal al zarului perfect omogen, la care


probabilitå¡ile de apari¡ie ale celor 6 fe¡e sunt egale cu 1/6.
¥n figura 2.13 este construitå atât func¡ia de probabilitate elementarå sub
formå de histogramå cât ¿i histograma cumulativå a probabilitå¡ilor de depå¿ire.

39
Fig. 2.13. Func¡ia de probabilitate elementarå ¿i probabilitatea de depå¿ire
în cazul zarului cu 6 fe¡e.

Având în vedere faptul cå la reprezentarea sub formå de poligon


probabilitå¡ile de depå¿ire sunt egale cu suma ariilor histogramei situate la
dreapta punctului curent, rezultå cå probabilitå¡ile de depå¿ire Fc ( x i ) se vor afla
pe dreapta marcatå cu linie continuå în figura 2.13 (dreapta care une¿te col¡urile
din stânga ale histogramei cumulative).
Probabilitå¡ile de depå¿ire calculate cu rela¡ia:

i i
pi = = (2.45)
n 6

(unde i este numårul de ordine din ¿irul ordonat descrescåtor al celor 6 valori
posibile: x1= 6; x2 = 5; ..; x6 = 1) sunt majorate în mod artificial, ele situându-
se pe linia întreruptå, decalatå fa¡å de linia plinå cu valoarea 1/12 (adicå 1/2 din
probabilitatea de apari¡ie a fiecårei valori).
¥n hidrologie, o problemå frecvent întâlnitå este aceea a determinårii
probabilitå¡ii de depå¿ire a debitelor maxime anuale; numårul n de valori de
care se dispune este în general cuprins între 20 ... 40. Se admite analog ca în
cazul zarului cå cele n debite maxime anuale au probabilitå¡i egale de apari¡ie
(¿i anume 1/n).
Un aspect asupra cåruia trebuie atraså aten¡ia este faptul cå, în cazul zarului
perfect omogen probabilitatea de apari¡ie a unei fe¡e (egalå cu 1/6), rezultå în
urma unui numår extrem de mare de experimente (teoretic un numår infinit). ¥n
cazul ¿irului debitelor maxime anuale se admite de asemenea cå valorile

40
acestora sunt egal probabile, de¿i fiecare valoare în sine nu s-a realizat decât o
singurå datå.
Acest mod de evaluare a probabilitå¡ii de apari¡ie a diverselor valori are la
bazå defini¡ia clasicå a probabilitå¡ii (aproximatå prin raportul dintre numårul
cazurilor favorabile ¿i numårul total de cazuri posibile); fiecare valoare
realizându-se o singurå datå, probabilitatea ei de realizare este apreciatå la 1/n.
Evident, acest mod de abordare constituie o aproximare, dar este singura
posibilå în condi¡iile unei perioade de måsuråtori relativ reduse.
Calculul probabilitå¡ii de depå¿ire a debitelor maxime anuale cu rela¡ia
(2.45) ar conduce urmând un ra¡ionament similar ca în cazul zarului cu 6 fe¡e la
o majorare artificialå a valorilor pi egalå cu 1/(2n).
Probabilitatea realå de depå¿ire a valorilor respective este deci:

i 1 2i − 1
pi = − = . (2.46)
n 2n 2n

Aceastå rela¡ie pentru calculul probabilitå¡ii de depå¿ire a fost de altfel


propuså de Hazen încå din anul 1930.
Cea mai micå valoare a ¿irului de date ordonat descrescåtor (deci valoarea cu
rangul i = n) are conform acestei rela¡ii probabilitatea de depå¿ire:

2n − 1
pn = . (2.47)
2n
Tabelul 2.6

Formula Anul
pi = Prob (X ≥ xi )
Hazen 1930 2i − 1
2n
Weibull 1939 i
n +1
Cegodaev 1955 i − 0 ,3
n + 0 ,4
Blum 1958 i−3/ 8
n +1/ 4
Tukey 1962 3i − 1
3n + 1
Gringorten 1963 i − 0 ,44
n + 0 ,12

41
Se observå cå valoarea lui pn este diferitå de 100%, cum s-ar fi
ob¡inut pentru valoarea de rang n în cazul aplicårii rela¡iei necorectate de tip i/n.
Acest rezultat era de altfel de a¿teptat ¿i din punct de vedere intuitiv. Cea mai
micå valoare înregistratå în perioada de måsuråtori xn nu este în mod obligatoriu
¿i cea mai micå valoare a popula¡iei statistice. Existå deci posibilitatea
înregistrårii în viitor ¿i a unor valori mai mici; ca atare, probabilitatea de
depå¿ire a lui xn este mai micå de 100%, chiar dacå este foarte apropiatå de
aceastå valoare. Diferen¡a de la 100% pânå la pn% reprezintå riscul apari¡iei
unor valori inferioare lui xn.
¥n afarå de formula lui Hazen, pentru evaluarea probabilitå¡ilor de depå¿ire
se mai utilizeazå ¿i alte rela¡ii (I.Vladimirescu, 1978), care au ca element comun
faptul cå pentru i=n se ob¡in probabilitå¡i de depå¿ire subunitare (tab.2.6).
Dupå cum s-a mai aråtat, în toate aceste rela¡ii i reprezintå numårul de ordine
al valorii xi din ¿irul ordonat descrescåtor (x1 > x2 > ... > xi > ... > xn).
¥n hidrologie, pentru calculul probabilitå¡ii de depå¿ire se utilizeazå, în mod
curent, rela¡ia Weibull:

i
pi = , (2.48)
n+1

în timp ce în gospodårirea apelor este preferatå formula lui Cegodaev:

i − 0 ,3
pi = . (2.49)
n + 0 ,4

2.4. MODUL DE REPREZENTARE A FUNCºIILOR DE REPARTIºIE


¥N HIDROLOGIE

¥n toate exemplele precedente variabila aleatoare X a fost consideratå


variabilå independentå, iar probabilitatea reprezenta variabila dependentå.
¥n hidrologie înså, de cele mai multe ori intereseazå determinarea valorii
variabilei care corespunde unei probabilitå¡i prestabilite prin STAS-urile în
vigoare. De exemplu, în STAS 4068/2-82, sunt definite probabilitå¡ile de
depå¿ire ale debitelor de calcul ¿i verificare ale construc¡iilor hidrotehnice.
Probabilitatea capåtå deci caracter de variabilå independentå, iar mårimea

42
corespunzåtoare acestei probabilitå¡i este variabila dependentå, care trebuie
evaluatå.
Ca urmare, se procedeazå la o rotire ¿i råsturnare a tuturor reprezentårilor
uzuale în matematicå, astfel încât abscisa så devinå ordonatå ¿i ordonata
absciså.
Ca exemplificare, în figura 2.14, sunt desenate comparativ, în ambele
sisteme de reprezentare, o serie de grafice prezentate anterior. ¥n hidrologie,
probabilitatea de nedepå¿ire intereseazå mai rar; ca urmare, pe graficele
hidrologice se reprezintå numai curba probabilitå¡ilor de depå¿ire. Deoarece
variabila aleatoare notatå în matematicå prin X se reprezintå acum pe ordonatå,
în continuare pentru a nu crea confuzii ea se va identifica prin Y, iar valorile sale
particulare prin y.
Valoarea variabilei Y corespunzåtoare probabilitå¡ii de depå¿ire p% va fi
notatå prin yp%

Fig. 2.14. Reprezentåri ale reparti¡iei frecven¡elor (a) ¿i


ale func¡iilor de reparti¡ie (b), utilizate în matematicå ¿i în hidrologie.

43
Fie din nou cazul zarului perfect omogen, pentru care probabilitå¡ile de
depå¿ire sunt calculate cu rela¡ia (2.46); deoarece valorile variabilei sunt
echidistante ¿i echiprobabile, probabilitå¡ile de depå¿ire se situeazå dupå cum s-
a mai aråtat pe o dreaptå. Cu totul altfel stau lucrurile în cazul valorilor
hidrologice. Fie de exemplu ¿irul debitelor maxime anuale; debitele sunt
considerate tot echiprobabile, dar nu mai sunt echidistante. Ca urmare,
probabilitå¡ile lor de depå¿ire nu se vor situa pe o dreaptå, ci pe o curbå
(fig.2.15).

Fig. 2.15. Reprezentarea comparativå a probabilitå¡ilor de depå¿ire: a - valori


echidistante (cazul zarului); b - valori oarecare (cazul debitelor maxime anuale).

Aceastå curbå va avea gradien¡i diferi¡i în zona centralå unde se înregistreazå


valori în mod frecvent, comparativ cu zona debitelor extreme (foarte mari sau
foarte mici) unde variabila ia mai rar valori. O reprezentare aproximativå a
alurii graficului probabilitå¡ilor de depå¿ire (în cazul zarului omogen ¿i al
debitelor maxime anuale) se poate urmåri în figura 2.15. Pentru ambele grafice,
probabilitå¡ile de depå¿ire au fost calculate conform celor aråtate anterior cu
rela¡ia lui Hazen.
Aceea¿i alurå a graficelor s-ar fi ob¡inut ¿i în cazul utilizårii formulei
Weibull (preferatå în hidrologie, deoarece conduce pentru o probabilitate de
depå¿ire datå, la valori mai mari ale variabilelor aleatoare ¿i deci la un calcul
mai acoperitor).
O exemplificare a modului de reprezentare a curbei probabilitå¡ilor de
depå¿ire în hidrologie în cazul valorilor grupate se poate urmåri în figura 2.16 (a
se vedea comparativ cu fig. 2.8 ¿i fig. 2.11).
Probabilitatea de depå¿ire a unei valori y oarecare, se ob¡ine prin calculul
suprafe¡ei histogramei situatå deasupra lui y (aria ha¿uratå); probabilitatea de
nedepå¿ire a valorii y este egalå cu aria neha¿uratå.

44
Fig. 2.16. Reprezentarea hidrologicå a probabilitå¡ilor de depå¿ire în cazul valorilor
grupate pentru reparti¡ia (2.33).

2.4.1. SEMNIFICAºIA PROBABILITźII DE DEPŪIRE ÎN HIDROLOGIE

¥n practicå, pentru probabilitatea de depå¿ire se mai utilizeazå ¿i denumirea


de asigurare, denumire care cel pu¡in în anumite cazuri este nejustificatå.
No¡iunea de asigurare a fost preluatå din gospodårirea apelor medii, domeniu
în care se pune problema livrårii apei la beneficiari, cu o probabilitate ridicatå
(95%, 97% etc.). ¥n aceste cazuri, probabilitatea reprezintå într-adevår gradul de
asigurare cu apå al folosin¡ei respective.
¥n hidrologie în schimb, intereseazå în special probabilitå¡i de depå¿ire foarte
mici (5%, 1%, 0,1% etc.) în vederea dimensionårii la debitele corespunzåtoare a
unor lucråri hidrotehnice.
Fie de exemplu, debitul maxim anual cu probabilitatea de depå¿ire de 1%; în
acest caz 1% reprezintå probabilitatea ca într-un an oarecare (deci în oricare an)
så se producå un debit mai mare sau egal cu Q1%. Considerând cå s-au executat
lucråri de combatere a inunda¡iilor dimensionate la acest debit, gradul de
siguran¡å al sistemului este de 99 %, iar 1% reprezintå riscul anual de depå¿ire a
capacitå¡ii sistemului ¿i care evident, nu poate fi interpretat ca asigurare
(el semnificând de fapt o neasigurare).
Prin urmare, probabilitatea de depå¿ire p% capåtå semnifica¡ia unui risc
anual R1 de depå¿ire a valorii Qp%.
¥n aceste condi¡ii, începe så prezinte interes riscul de depå¿ire a valorii Qp%
într-o perioadå de n ani, corespunzåtoare duratei de func¡ionare a lucrårii
hidrotehnice. Dacå p% reprezintå un risc anual, atunci 1 - p% semnificå
siguran¡a sistemului în decurs de 1 an. ¥n cazul în care realizarea valorii

45
debitului maxim dintr-un anumit an poate fi consideratå independentå de
valorile din ceilal¡i ani, gradul de siguran¡å dintr-un numår de n ani poate fi
n
apreciat cu rela¡ia: (1 - p) .
Rezultå atunci cå riscul hidrologic Rn ca debitul Qp% så fie egalat sau depå¿it
într-o perioadå de n ani, are o valoare complementarå siguran¡ei sistemului
pentru acela¿i interval de timp:

n
Rn = 1 - (1 - p) . (2.50)

Cu cât n este mai mare, cu atât Rn tinde cåtre 1 (sau 100%); deci într-o
perioadå foarte mare riscul de a se produce debite superioare lui Qp% se apropie
de certitudine.
Fie, pentru exemplificare, cazul în care p = 1%, iar n = 100 (C. Pârvulescu,
1978):

100
R100 = 1 - (1 - 0,01) = 1 - 0,37 = 0,63 = 63%

Cu alte cuvinte probabilitatea ca într-o sutå de ani så se producå un debit


egal sau mai mare decât Q1% nu este de loc neglijabilå (deci dimensionarea
evacuatorilor de ape mari, a îndiguirilor, etc. trebuie fåcutå foarte atent, întrucât
este posibilå o solicitare a lucrårilor la acest debit). ¥n acela¿i timp, riscul R100
este încå departe de certitudine, ceea ce înseamnå cå în decurs de 100 de ani
este foarte posibil ca debitul Q1% sau debite superioare acestuia så nu se
producå niciodatå.
De asemenea, pot exista intervale de 100 ani în care acest debit sau debite
superioare så se producå de douå, trei sau chiar de mai multe ori.
¥n figura 2.17 este reprezentatå o situa¡ie posibilå a depå¿irii sau egalårii
debitelor Q1% într-o perioadå lungå de timp. Ca medie, aceste debite se produc
o datå la 100 de ani, fårå a exista înså nici o regularitate în realizarea lor (deci
dacå debitul Q1% s-a înregistrat într-un anumit an, nu înseamnå cå el se va mai
realiza exact dupå 100 de ani).

Fig. 2.17. Depå¿irea sau egalarea valorilor Q1% în timp.

46
Perioada de repetare T, definitå prin raportul:

1
T = (2.51)
p%

trebuie în¡eleaså ca o valoare medie, caracteristicå unei perioade foarte lungi de


timp (de ordinul miilor sau zecilor de mii de ani).
¥n practicå, se utilizeazå pentru Q1%, Q1‰ etc, în mod frecvent formularea:
debitul care apare o datå la 100 de ani, o datå la 1.000 de ani etc. Aceastå
exprimare trebuie în¡eleaså cu rezerva expuså anterior, de timp mediu de
repetare, calculat pe perioade lungi de ordinul timpului geologic. Mult mai
indicatå este cealaltå formulare de risc anual de depå¿ire de 1%, 1‰ etc.

47
3. VARIABILE ALEATOARE CONTINUE

3.1. DENSITATE DE REPARTIºIE. FUNCºIE DE REPARTIºIE

Variabila aleatoare X fiind continuå poate lua orice valoare din domeniul ei
de varia¡ie. ¥n mod obi¿nuit în hidrologie acest interval este semiaxa [0, +∞)
sau chiar un interval mai restrâns [a, b); pentru generalitate, în continuare se va
admite ca domeniu de varia¡ie axa numerelor reale (-∞, +∞).
Acest domeniu este divizat în intervale infinitezimale de lungime dx.
Probabilitatea elementarå ca variabila aleatoare X så ia valori în cadrul
intervalului [x, x + dx) este egalå (fig. 3.1) cu produsul dintre lungimea
intervalului ¿i valoarea func¡iei f (denumitå densitate de probabilitate sau
densitate de reparti¡ie) în punctul x:

Prob (X ∈(x; x+dx)) = f(x) dx . (3.1)

Denumirea de densitate pentru func¡ia f(x) este preluatå din fizicå (prin
analogie cu densitatea ρ(x) a unei bare neomogene).

Fig. 3.1. Densitatea de reparti¡ie a unei variabile aleatoare continue.

Se reaminte¿te cå reparti¡ia unei variabile discrete X, se reprezintå simbolic


prin:

⎛ x ⎞
X: ⎜ i ⎟ , (3.2)
⎝ f ( x )⎠

48
unde f(xi) este probabilitatea elementarå. ¥n mod similar, în cazul variabilei
continue, la care probabilitatea elementarå este dupå cum s-a aråtat f(x)⋅dx, ar
trebui utilizatå nota¡ia:

X: ⎜ [
⎛ x, x + dx )⎞
⎟. (3.3)
⎝ f ( x ) ⋅ dx ⎠

¥n practicå înså se folose¿te reprezentarea simplificatå:

⎛ x ⎞
X: ⎜ ⎟ , (3.4)
⎝ f ( x )⎠

unde, a¿a cum s-a mai aråtat, f(x) define¿te o densitate de probabilitate:

f ( x ) = lim
( [
Pr ob X ∈ x , x + ∆x ) ). (3.5)
∆x → 0 ∆x

Cu alte cuvinte f(x) ≠ Prob(X = x), care este de altfel nulå; ra¡ionând chiar
intuitiv probabilitatea aferentå unei valori punctuale (în condi¡iile în care
variabila poate lua o infinitate de astfel de valori) este zero:

Prob (X = x) = 0 . (3.6)

O reparti¡ie continuå poate fi privitå ¿i ca limitå a unei reparti¡ii discrete,


care ia un numår din ce în ce mai mare de valori (în final, o mul¡ime de puterea
continuului). Ca urmare, toate considera¡iile expuse la variabilele discrete se
påstreazå, cu mici diferen¡e. Una dintre aceste diferen¡e este faptul cå semnul
sumå se va înlocui prin operatorul de integrare.
De exemplu, suma probabilitå¡ilor elementare la variabilele discrete este
unitarå:

n
∑ pi = 1 . (3.7)
i =1

¥n cazul variabilelor continue rela¡ia echivalentå este urmåtoarea:

+∞
∫ f ( x )dx = 1 . (3.8)
−∞

49
¥n mod similar se va defini func¡ia de reparti¡ie F(x).
¥n cazul variabilei discrete probabilitatea de nedepå¿ire a valorii particulare x
rezultå prin însumarea probabilitå¡ilor aferente valorilor variabilei mai mici
decât x:

F( x ) = ∑ Pr ob( X = x i ) . (3.9)
x i <x

¥n cazul variabilei continue, semnul sumå se transformå în integralå; limita


inferioarå de integrare este xmin sau pentru generalitate -∞, iar limita superioarå
este evident valoarea particularå x. Probabilitatea de nedepå¿ire în cazul unei
variabile aleatoare continue este prin defini¡ie:

x
F( x ) = ∫ f ( x ) dx . (3.10)
−∞

Valoarea probabilitå¡ii de nedepå¿ire a lui x este egalå deci cu aria densitå¡ii


de reparti¡ie situatå la stânga punctului x (fig. 3.2).

Fig. 3.2. Interpretarea geometricå a probabilitå¡ii de nedepå¿ire.

¥n mod similar se poate ob¡ine probabilitatea apartenen¡ei la un anumit


interval:

Prob (x1 ≤ X < x2) = Prob (X ∈ (-∞, x2)) - Prob (X ∈ (-∞, x1)) =

= Prob (X < x2) - Prob (X < x1) = F(x2) - F(x1) . (3.11)

50
Dar:

x2 x1 x2
Pr ob ( X < x 2 ) − Pr ob ( X < x 1 ) = ∫ f ( x )dx − ∫ f ( x )dx = ∫ f ( x )dx . (3.12)
−∞ −∞ x1

Rezultå deci:

x2
Pr ob ( x 1 ≤ X < x 2 ) = ∫ f ( x ) dx (3.13)
x1

Cu alte cuvinte, probabilitatea apartenen¡ei la un interval este egalå cu aria


trapezului curbiliniu ha¿urat pe graficul din figura 3.3; aceea¿i probabilitate se
poate ob¡ine ¿i ca diferen¡å a ordonatelor func¡iei de reparti¡ie corespunzåtoare
absciselor x2, respectiv x1.

Fig. 3.3. Probabilitatea apartenen¡ei la un anumit interval.

Dacå intervalul [x1, x2) devine din ce în ce mai mic, fie el [x, x + ∆x),
raportul:

F( x + ∆x ) − F( x )
∆x

reprezintå valoarea tangentei (derivata) func¡iei de reparti¡ie în punctul x.


Dar acest raport este chiar densitatea de reparti¡ie f(x). ¥ntr-adevår, din rela¡iile
(3.5), respectiv (3.11) rezultå:

51
f ( x ) = lim
[ [
Pr ob X ∈ x, x + ∆x ) ] = lim F( x + ∆x ) − F( x ) = F'( x ) . (3.14)
∆x → 0 ∆x ∆x → 0 ∆x

Cu alte cuvinte densitatea de reparti¡ie f(x) este derivata func¡iei de reparti¡ie


F(x) în punctul x. Acest lucru era, de altfel, de a¿teptat, opera¡iile de integrare ¿i
derivare fiind opera¡ii inverse.
¥n practicå, a¿a cum s-a aråtat, intereseazå în mare måsurå pe lângå
probabilitatea de nedepå¿ire ¿i probabilitatea evenimentului contrar Prob(X ≥ x)
numitå probabilitate de depå¿ire:

x
F c ( x ) = Pr ob ( X ≥ x ) = 1 − Pr ob( X < x ) = 1 − F ( x ) = 1 − ∫ f ( x ) dx =
−∞
+∞ x −∞ +∞ +∞
(3.15)
= ∫ f ( x ) dx − ∫ f ( x ) dx = ∫ f ( x ) dx + ∫ f ( x ) dx = ∫ f ( x ) dx.
−∞ −∞ x −∞ x

¥n figura 3.4 se poate urmåri reprezentarea graficå a celor 2 curbe; se observå


caracterul de complementaritate în raport cu valoarea 1 (sau 100%).

Fig. 3.4. Probabilitatea de nedepå¿ire ¿i probabilitatea de depå¿ire.

Fig. 3.5. Interpretarea geometricå a probabilitå¡ii de depå¿ire.

52
¥n timp ce probabilitatea de nedepå¿ire F(x) reprezintå acea parte a ariei
densitå¡ii de reparti¡ie situatå la stânga punctului x, probabilitatea de depå¿ire
este egalå cu valoarea ariei de la dreapta aceluia¿i punct x (fig. 3.5).

3.2. REPREZENTAREA GRAFICŠA PROBABILITźII DE DEPŪIRE


¥N HIDROLOGIE

Dupå cum s-a mai aråtat, în hidrologie probabilitatea capåtå caracter de


variabilå independentå; ca urmare, se va proceda la o råsturnare ¿i rotire a
reprezentårilor precedente în a¿a fel încât ordonata så devinå absciså, iar abscisa
ordonatå. Procedând în acest mod, graficul din figura 3.5 devine cel din figura 3.6.
Probabilitatea de depå¿ire a valorii yp% este egalå cu aria ha¿uratå a densitå¡ii
de reparti¡ie, iar probabilitatea de nedepå¿ire cu aria neha¿uratå.
Dupå cum s-a mai aråtat, în hidrologie intereseazå în special probabilitatea
de depå¿ire; din acest motiv probabilitatea de nedepå¿ire nici nu a mai fost
reprezentatå pe graficul din figura 3.6.
Cu cât valoarea yp% este mai mare, cu atât aria cuprinså între densitatea de
reparti¡ie, ordonatå ¿i paralela duså prin yp% la absciså este mai micå (deci pro-
babilitatea de depå¿ire p% este mai reduså).

Fig. 3.6. Reprezentarea curbei probabilitå¡ilor de depå¿ire în hidrologie.

De aici rezultå cå unei probabilitå¡i de depå¿ire mai mici îi vor corespunde


valori ale variabilei aleatoare mai mari. Deci, dacå p1% < p2% atunci
yp1% > yp2%.

53
De exemplu, debitul cu probabilitatea de depå¿ire 1 % este mai mare decât
debitul cu probabilitatea de depå¿ire 10%, dar este mai mic decât valoarea
corespunzåtoare probabilitå¡ii de 0,1% etc. (fig. 3.7).

Fig. 3.7. Curba probabilitå¡ilor de depå¿ire a debitelor maxime anuale.

3.3. EXTRAPOLAREA REPARTIºIILOR EMPIRICE


PRIN REPARTIºII TEORETICE

La proiectarea unei lucråri hidrotehnice sunt necesare anumite mårimi


hidrologice (debite, niveluri etc.) caracterizate de probabilitå¡i de depå¿ire care
nu se situeazå de obicei în domeniul valorilor måsurate. Astfel, dacå
måsuråtorile hidrologice sistematice au o duratå de 20 de ani, utilizând formula
i/(n+1), rezultå cå debitele måsurate corespund unor probabilitå¡i empirice de
depå¿ire cuprinse aproximativ între 5% ¿i 95%; pentru 50 de ani de måsuråtori
domeniul probabilitå¡ilor empirice este cuprins între 2% ¿i 98%.
De fapt acesta este cazul râurilor interioare din ¡arå, unde måsuråtorile
hidrologice acoperå în general o perioadå de 20 - 40 ani. Dar la proiectarea sau
verificarea unor pår¡i ale sistemelor hidrotehnice sunt necesare mårimi
(de ex.: debite) cu probabilitå¡i de depå¿ire de 1% sau 0,1% etc. ¥n aceste
condi¡ii se recurge la prelungirea reparti¡iilor empirice prin reparti¡ii teoretice
(fig. 3.8), care permit extrapolåri în afara domeniului valorilor måsurate.
Cu alte cuvinte, aproximând reparti¡iile empirice prin reparti¡ii teoretice este
posibilå extinderea rezultatelor cercetårii unei selec¡ii la întreaga popula¡ie, cu
un grad de siguran¡å relativ ridicat; legitå¡ile statistice descifrate pe e¿antion
sunt considerate ca reprezentative pentru întreaga popula¡ie statisticå.
Dupå cum se ¿tie, reparti¡iile teoretice caracterizeazå întreaga popula¡ie
statisticå ¿i sunt definite prin expresii analitice depinzând în general de 2-3
parametri. Reparti¡iile empirice sunt ob¡inute în urma cercetårii unei selec¡ii

54
(e¿antion) de volum redus ¿i sunt definite prin mul¡imea cuplurilor {(xi, pi)},
unde pi este probabilitatea empiricå de depå¿ire.

Fig. 3.8. Extrapolarea reparti¡iei empirice printr-o reparti¡ie teoreticå:


M - domeniul valorilor måsurate; E - domeniul valorilor extrapolate.

Pentru unele cazuri particulare, func¡iile de reparti¡ie teoretice sunt


cunoscute apriori. ¥n mare majoritate a cazurilor înså, alegerea func¡iei de
reparti¡ie teoreticå este mai dificilå; uneori douå sau trei func¡ii teoretice se
preteazå la fel de bine pentru aproximarea reparti¡iei empirice.
Selec¡ionarea unei func¡ii de reparti¡ie cu un numår mai mare sau mai mic de
parametri, constituie în fond o problemå de optimizare, având de ales între
flexibilitatea func¡iei ¿i gradul de siguran¡å al parametrilor estima¡i. Astfel, dacå
numårul de parametri este mai mare (3-4, de ex.), erorile de calcul la aprecierea
lor sunt mai mari ¿i deci sunt mai pu¡in precis determina¡i; invers, la un numår
mic de parametri, precizia evaluårii acestora este ridicatå, dar func¡ia teoreticå
este prea pu¡in flexibilå ¿i deci aproximarea reparti¡iei empirice va fi grosolanå.
Adevårata func¡ie de reparti¡ie a popula¡iei statistice este, de altfel, greu de
ob¡inut; astfel, dacå dintr-o popula¡ie statisticå se realizeazå o selec¡ie de volum
n ¿i se determinå func¡ia de reparti¡ie, aceasta poate så difere de func¡ia gåsitå
pentru altå selec¡ie de acela¿i volum ¿i, de asemenea, ambele pot så difere de
func¡ia de reparti¡ie a popula¡iei statistice.
¥n principiu, în cazul setului de date hidrologice înregistrate, trebuie propuse
mai multe func¡ii teoretice pentru aproximarea distribu¡iei empirice; dupå
determinarea parametrilor acestor func¡ii, pe baza testelor de verificare a
ipotezelor statistice, se re¡ine o singurå func¡ie teoreticå. Calitatea aproximårii
reparti¡iei empirice prin reparti¡ia teoreticå va depinde de mårimea e¿antionului,

55
alegerea adecvatå a func¡iei ¿i utilizarea celor mai corespunzåtoare metode de
estimare a parametrilor.
¥n practica hidrologicå acest proces de cåutare a celei mai adecvate reparti¡ii
teoretice nu mai are loc, admi¡ându-se cå distribu¡ia mårimilor analizate
urmeazå o lege de tip Gama (cu 2 sau 3 parametri) sau o lege logaritmic
normalå.
Experien¡a a aråtat de fapt cå aceste func¡ii se preteazå foarte bine pentru
analiza fenomenelor hidrologice din România.
Estimarea variabilelor (parametrilor) care intervin în func¡iile de reparti¡ie
teoretice are la bazå prelucrarea informa¡iilor con¡inute în ¿irul de date måsurat.
Plecând de la valorile înregistrate se calculeazå o serie de valori tipice
(caracteristice) ale variabilelor de selec¡ie cum sunt: valoarea medie, dispersia,
abaterea medie påtraticå etc. Se considerå apoi cå aceste valori tipice sau
parametri ai reparti¡iei empirice sunt în acela¿i timp ¿i parametrii reparti¡iei
teoretice, utilizate pentru ajustarea ¿i extrapolarea reparti¡iei empirice (cu alte
cuvinte parametrii popula¡iei statistice sunt estima¡i pe baza selec¡iei de care se
dispune prin måsuråtori); evident acest procedeu reprezintå o aproxima¡ie, care
constituie o surså de erori a calculului statistic.

56
4. VALORI TIPICE ALE VARIABILELOR ALEATOARE

Variabilele aleatoare sunt complet caracterizate prin densitatea de reparti¡ie


sau func¡ia de reparti¡ie.
De multe ori, în practicå este necesarå o definire mai sumarå a variabilelor
aleatoare analizate; în acest scop se utilizeazå anumite valori caracteristice
ata¿ate variabilelor aleatoare ¿i care pot fi grupate în parametri ai tendin¡ei
centrale, ai variabilitå¡ii ¿i ai formei.

4.1. PARAMETRI AI TENDINºEI CENTRALE

Ace¿ti parametri definesc zona de grupare a celor mai frecvente valori.


• Valoarea medie. Fie o variabilå aleatoare discretå X, definitå prin
distribu¡ia:

⎛x x2 ... x n ⎞
X :⎜ 1 ⎟ . (4.1)
⎝ p1 p2 ... p n ⎠

¥n aceast caz valoarea medie a variabilei X, notatå prin M(X), m sau µ este
prin defini¡ie egalå cu:

n
M ( X ) = ∑ x i pi . (4.2)
i =1

Dacå cele n valori sunt echiprobabile (pi = 1/n), atunci se ob¡ine cunoscuta
rela¡ie a mediei aritmetice (denumitå ¿i medie de selec¡ie):

n 1 1 n
M( X ) = ∑ xi = ∑ xi . (4.3)
i=1 n n i =1

Media de selec¡ie va fi notatå în continuare prin x pentru a o deosebi de


media m a popula¡iei. Se poate demonstra cå valoarea x poate fi consideratå
drept indicator de estimare a mediei m a întregii popula¡ii; acest procedeu de
estimare are o deplinå justificare teoreticå ¿i este utilizat în practicå, chiar ¿i
pentru valori ale lui n < 30. Estimarea mediei pe baza acestei rela¡ii este cea mai

57
bunå, în sensul cå dispersia ei este mai micå decât cea care se poate ob¡ine cu
ajutorul oricårui alt procedeu de estimare a mediei. Totu¿i, dacå spa¡iul de
selec¡ie este redus, apari¡ia din întâmplare a unor valori foarte mari sau foarte
mici poate influen¡a media aritmeticå.
Pentru numeroase mårimi hidrologice, densitatea de reparti¡ie a valorilor
înregistrate este asimetricå; prin logaritmare se ob¡in distribu¡ii simetrice, iar media
aritmeticå a acestor valori poate fi utilizatå ca parametru al tendin¡ei centrale.
Se poate scrie:

log x 1 + log x 2 +...+ log x n log( x 1 ⋅ x 2 ⋅...⋅ x n )


= =
n n (4.4)
= log( x 1 ⋅ x 2 ⋅...⋅x n ) 1/n = log X g .
1/n
Mårimea X g = (x1 . x2 . ... . xn) se nume¿te medie geometricå. Prin
calculul mediei geometrice ¿i logaritmarea ei se ob¡ine destul de comod media
aritmeticå a logaritmilor valorilor xi ale variabilei aleatoare.
¥n cazul în care variabila aleatoare este continuå, suma din expresia (4.2) se
transformå în integralå, iar probabilitå¡ile pi se înlocuiesc prin probabilitå¡ile
elementare f(x)⋅dx. Deci, în cazul unei variabile aleatoare continue, valoare
medie este prin defini¡ie:
+∞
M( X ) = ∫ x f ( x )dx . (4.5)
−∞

Ca interpretare geometricå (M. Mihåilå, 1965), valoarea medie reprezintå


abscisa centrului de greutate al ariei delimitate de graficul distribu¡iei
probabilitå¡ilor ¿i absciså (fig. 4.1).

Fig. 4.1. Interpretarea geometricå a valorii medii a unei variabile aleatoare:


a - variabilå discretå; b - variabilå continuå.

58
• Mediana. Mediana Me reprezintå valoarea centralå a unei reparti¡ii
statistice.
Cu alte cuvinte, probabilitatea ca variabila aleatoare X så ia valori mai mici
decât Me este egalå cu probabilitatea ca X så ia valori mai mari decât Me .
Având în vedere faptul cå:
c
F(Me) + F (Me) = 1 (4.6)
¿i cå:
c
F(Me) = F (Me) , (4.7)
rezultå:

Prob (X < Me) = Prob (X ≥ Me) = 0,5 . (4.8)

Fie, pentru început, cazul unei variabile discrete, având valorile ordonate
crescåtor sau descrescåtor.
Dacå reparti¡ia are 2k+1 valori, mediana este valoarea având rangul k+1.
Dacå reparti¡ia are 2k valori, mediana este între valorile de rangul k ¿i k+1, ¿i în
general se ob¡ine ca medie aritmeticå a celor douå valori. Reprezentând
probabilitå¡ile empirice de depå¿ire ¿i nedepå¿ire, mediana este situatå la
intersec¡ia celor douå grafice.
¥n cazul unei variabile aleatoare continue, mediana reprezintå abscisa acelui
punct de pe curba densitå¡ii de reparti¡ie, a cårui ordonatå împarte suprafa¡a
cuprinså între curbå ¿i axa x în douå suprafe¡e egale.
Interpretarea geometricå a medianei se poate urmåri în figura 4.2.

Fig. 4.2. Interpretarea geometricå a medianei: a - variabilå discretå;


b - variabilå continuå.

59
• Modul. Modul Mo sau valoarea dominantå reprezintå acea valoare a
variabilei care corespunde frecven¡ei celei mai mari.
Pentru o variabilå aleatoare de tip discret, având valorile xi ordonate,
crescåtor sau descrescåtor, caracterizate de probabilitå¡ile empirice pi, punctul
xm se nume¿te mod dacå este satisfåcutå rela¡ia:

pm > pi ; i≠m. (4.9)

Cu alte cuvinte, probabilitatea de realizare a valorii xi este mai mare decât


probabilitatea aferentå oricårei alte valori a variabilei.
Pentru o variabilå continuå se nume¿te mod orice punct de maxim al
df d 2f
densitå¡ii de reparti¡ie (deci pentru care = 0 ¿i < 0 ).
dx dx 2
Densitatea de reparti¡ie f(x) se nume¿te unimodalå, bimodalå sau
multimodalå, dupå cum admite unul, douå sau mai multe moduri.
¥n cazul unei reparti¡ii unimodale simetrice, media aritmeticå, mediana ¿i
modul sunt identice; pentru o reparti¡ie u¿or asimetricå ¿i unimodalå, mediana
se gåse¿te între medie ¿i mod, distan¡a sa fa¡å de mod fiind aproximativ, dublul
distan¡ei sale fa¡å de media aritmeticå (fig. 4.3).

Fig. 4.3. Pozi¡ia relativå a mediei aritmetice,


medianei ¿i modului.

• Momente de ordin superior. ¥n cazul unei variabile aleatoare discrete,


momentul de ordinul r este prin defini¡ie:

n
Mr = ∑ x ir pi , (4.10)
i=1

60
unde, prin pi s-au notat probabilitå¡ile de apari¡ie a valorilor xi.
⎛ 1⎞
Dacå valorile xi sunt echiprobabile ⎜ p i = ⎟ , rezultå:
⎝ n⎠

1 n r
Mr = ∑ xi . (4.11)
n i =1

Pentru r = 1, se ob¡ine chiar expresia mediei aritmetice (media de selec¡ie):

1 n
M1 = x = ∑ xi . (4.3')
n i=1

¥n cazul unei variabile aleatoare continue definite prin densitatea de


reparti¡ie f(x), momentul de ordinul r se calculeazå cu expresia:

+∞
Mr = ∫ x r f ( x )dx . (4.12)
−∞

ªi în acest caz, pentru r = 1 se ob¡ine valoare medie a variabilei:

+∞
M1 = m = ∫ x f ( x )dx . (4.5')
−∞

Denumirea de moment este împrumutatå din mecanicå: probabilitå¡ile


elementare joacå rolul for¡elor al cåror moment se calculeazå, iar valorile xi ale
variabilei reprezintå bra¡ul for¡ei. Conform defini¡iei, momentul se calculeazå în
raport cu originea axelor de coordonate. Un interes special îl prezintå
momentele centrate, care se calculeazå în raport cu valoarea medie a variabilei.
Deoarece momentele centrate de ordin superior intervin în calculul unor
parametri ai variabilitå¡ii ¿i formei, ele vor fi definite dupå prezentarea acestor
parametri.

4.2. PARAMETRI AI VARIABILITźII

Valorile tipice prezentate anterior caracterizeazå pozi¡ia centrului de grupare,


aceste mårimi nefurnizând nici un fel de informa¡ii privind gradul de dispersare
al valorilor pe care le poate lua variabila aleatoare fa¡å de valoarea centralå.

61
S-au imaginat mai mul¡i parametri pentru måsurarea dispersiei, baza¡i în general
pe no¡iunea de abatere:
• Amplitudinea sau extinderea reparti¡iei reprezintå abaterea dintre cea
mai mare valoare observatå xmax ¿i cea mai micå xmin:

a = xmax - xmin . (4.6)

Este cel mai simplu parametru din aceastå categorie, dar ¿i cel mai
aproximativ.
• Abaterea medie reprezintå media abaterilor în valoare absolutå dintre
valorile curente ¿i media aritmeticå x :

n
∑ xi − x
i =1
eM = . (4.7)
n

Cu acest parametru nu se pot efectua înså calcule algebrice.


• Dispersia sau varian¡a. Un alt mod de a eviden¡ia valorile absolute ale
abaterii fa¡å de medie constå în definirea dispersiei variabilei aleatoare.
Dispersia se calculeazå cu expresia:
n
D 2 = σ 2 = ∑ ( x i − m ) 2 ⋅ pi , (4.8)
i =1

în cazul variabilelor aleatoare discrete ¿i cu:


+∞
D 2 = σ 2 = ∫ ( x − m ) 2 ⋅ f ( x )dx , (4.9)
−∞

pentru variabilele continue.


2
¥n cazul unei selec¡ii de volum limitat, pentru dispersie în loc de σ
2
(rezervatå pentru popula¡ia statisticå) se va utiliza nota¡ia s (care reprezintå, de
fapt, un indicator de estimare al dispersiei popula¡iei analizate).
¥n cazul unei selec¡ii de volum n > 30 ÷ 40, admi¡ând cå valorile xi ale
variabilei sunt egal probabile, pentru calculul dispersiei se poate utiliza rela¡ia:

n 1 n
s 2 = ∑ ( x i − x ) 2 ⋅ pi = ∑ ( xi − x ) ,
2
(4.10)
i =1 n i=1

unde x este media de selec¡ie (media aritmeticå a valorilor înregistrate).

62
Dacå numårul de valori n < 30, dispersia se poate estima cu ajutorul rela¡iei:

1 n
s2 = ∑ ( xi − x ) .
2
(4.11)
n − 1 i=1
Pentru a exemplifica modul în care dispersia reflectå gradul de împrå¿tiere al
valorilor variabilei, în figura 4.4, s-au considerat douå densitå¡i de reparti¡ie
continue ¿i simetrice, având aceea¿i valoare medie.

Fig. 4.4. Caracterizarea împrå¿tierii valorilor variabilei prin intermediul dispersiei.

Este evident cå la reparti¡ia f2(x) punctele mai depårtate de valoarea medie m,


de¡in o pondere mai mare decât în cazul reparti¡iei f1(x) ¿i deci s22 > s12
(dispersia valorilor celei de-a doua reparti¡ii este mai mare decât dispersia
asociatå primei reparti¡ii). Este de remarcat faptul cå dispersia accentueazå
efectul abaterilor mari, acestea intervenind în formula de defini¡ie la puterea a
doua.
• Abaterea medie påtraticå (abaterea standard). Dispersia prezintå
dezavantajul cå se exprimå în unitå¡ile de måsurå ale variabilei ridicate la påtrat.
Pentru a elimina acest neajuns s-a introdus un alt indicator ¿i anume abaterea
medie påtraticå, definit ca radicalul de ordinul doi al dispersiei:

σ = σ 2 (pentru popula¡ii statistice) (4.12)

sau:

s = s 2 (pentru selec¡ii) . (4.12')

Având în vedere numårul în general redus al valorilor hidrologice din


måsuråtori (selec¡ii cu n < 30), pentru calculul abaterii medii påtratice se
utilizeazå rela¡ia:

63
n
∑( xi − x )
2

s= i =1
. (4.13)
n −1

• Coeficientul de varia¡ie. Pentru a elimina complet influen¡a unitå¡ilor de


måsurå ale variabilei, s-a introdus un parametru de dispersie relativ, definit ca
raportul dintre abaterea medie påtraticå ¿i media aritmeticå:

σ s
Cv = , respectiv Cv = , (4.14)
m x

dupå cum este vorba de popula¡ia statisticå sau de o selec¡ie.


Rezultå cå acest coeficient de varia¡ie are aceea¿i semnifica¡ie ca ¿i dispersia
sau abaterea medie påtraticå: cu cât coeficientul de varia¡ie Cv este mai mare, cu
atât valorile variabilei aleatoare au o împrå¿tiere mai mare (sau ceea ce este
acela¿i lucru, au un domeniu de varia¡ie mai larg).
¥n cazul unei selec¡ii de volum limitat n, coeficientul de varia¡ie se
calculeazå cu formula:

n n
∑ ( xi − x ) ∑ ( xi − x )
2 2
1 i =1 i=1
Cv = = =
x n−1 (n − 1) x 2
. (4.15)
2 2
1 n ⎛ xi − x ⎞ 1 n ⎛ xi ⎞
= ∑⎜ ⎟ = ∑ ⎜ − 1⎟
n − 1 i =1⎝ x ⎠ n − 1 i =1⎝ x ⎠

Notând cu:

xi
ki = , (4.16)
x
rela¡ia de calcul devine:

n
∑ ( ki − 1)
2

Cv = i =1
. (4.17)
n−1

Coeficientul de varia¡ie este cuprins de regulå între zero ¿i doi, având o


valoare medie de 0,5.

64
Valoarea coeficientului de varia¡ie exercitå o influen¡å directå asupra
dimensiunilor lucrårilor de gospodårire a apelor; pentru râuri cu variabilitate
mare a debitelor (deci cu Cv mare) sunt necesare volume mai mari de lacuri de
acumulare pentru a putea realiza acela¿i grad de regularizare a debitelor cursului
de apå respectiv.
• Momente centrate. La momentele de ordin superior s-a aråtat cå acestea
sunt calculate în raport cu originea axelor de coordonate. Efectuând calculul
momentelor fa¡å de valoarea medie a variabilei se ob¡in a¿a numitele momente
centrate.
Momentul centrat de ordinul r este prin defini¡ie:

n
m r = ∑ ( x i − m ) r ⋅ pi (pentru variabile discrete) (4.18)
i =1

¿i:

+∞
mr = ∫ ( x i − m ) r f ( x )dx (pentru variabile continue) (4.19)
−∞

Momentele de ordin par au valori pozitive, în timp ce momentele de ordin


impar pot fi pozitive sau negative.
¥n cazul unei selec¡ii, la care toate valorile variabilei sunt echiprobabile,
momentul centrat de ordinul r se calculeazå cu rela¡ia:

1 n
mr = ∑ ( xi − x ) .
r
(4.20)
n i =1

Particularizând expresia lui mr pentru r = 1, se ob¡ine:

1⎛n ⎞
∑ ( xi − x ) = ⎜ ∑ xi − ∑ x⎟ =
1 n n
m1 =
n i=1 n ⎝ i=1 i=1 ⎠

. (4.21)

∑ x i − ( x + x +...+ x ) = ∑ x i −
1 n 1 1 n nx
= =x−x=0
n i=1 n n i=1 n

Deci momentul centrat de ordinul 1 (valoarea medie a abaterilor fa¡å de


medie) este nul.

65
Momentul centrat de ordinul 2 este chiar dispersia variabilei aleatoare;
într-adevår:

1 n
∑ ( xi − x ) = s .
2
m2 = 2
(4.22)
n i=1

¥n acela¿i timp, abaterea medie påtraticå este radicalul momentului centrat de


ordinul 2:

s = m2 , (4.23)

iar coeficientul de varia¡ie Cv este:

s m2
Cv = = , (4.24)
x M1

unde M1 este media aritmeticå sau momentul de ordinul unu al variabilei.


Momentul centrat de ordinul 2 (sau dispersia) poate fi calculat numai în
func¡ie de momentele centrate de ordinul unu ¿i doi:

∑ ( x i − x ) = ∑ x i − 2x ∑ x i + ∑ x
1 n 2 1 n 2 1 n 1 n 2
m2 = (4.25)
n i=1 n i=1 n i=1 n i=1

Dar:

1 n
∑ xi = x , (4.26)
n i =1

iar:

1 n 2 nx 2
∑x = = x2 . (4.27)
n i=1 n

Se ob¡ine deci:

1 n 2 1 n 2
m2 = ∑ x i − 2x + x = ∑ x i − x .
2 2 2
(4.28)
n i =1 n i=1

Deoarece:

66
1 n 2
∑ x i = M2 , (4.29)
n i =1

x 2 = M 12 , (4.30)

rezultå:
m 2 = s 2 = M 2 − M 12 . (4.31)

Aceastå rela¡ie este deosebit de utilå pentru calculul dispersiei (respectiv al


abaterii medii påtratice ¿i al coeficientului de varia¡ie), întrucât mic¿oreazå mult
volumul de calcule. ¥n practica hidrologicå aceastå rela¡ie este mai pu¡in
utilizatå, preferându-se rela¡ia de defini¡ie:

∑ ( xi − x ) .
1 n 2
m2 = s 2 =
n i=1
¥n mod similar, se poate aråta cå momentul centrat de ordinul 3 se poate
calcula cu rela¡ia:
m 3 = M 3 − 3 M 2 M 1 + 2 M 13 . (4.32)

ªi în acest caz, în hidrologie este preferatå rela¡ia de defini¡ie a momentelor


de ordinul 3, de¿i calculele sunt mai laborioase.
Pentru a ¡ine cont de numårul limitat de valori disponibile din înregistråri
(selec¡ii de volum redus), în expresia momentului centrat de ordinul 2 sau 3,
numitorul nu va avea valoarea n, ci n - 1.
¥n final, mai trebuie aråtat cu cât ordinul r al momentului centrat mr este mai
mare, cu atât apari¡ia din întâmplare în cadrul selec¡iei a unor valori foarte mari
sau foarte mici (deci care se abat mult de la medie) va influen¡a în mai mare
måsurå valoarea momentului. Rezultå cå cu cât r este mai mare, cu atât
parametrii statistici ai selec¡iei diferå mai mult de parametrii popula¡iei
analizate.

4.3. PARAMETRI AI FORMEI

Dacå valorile variabilei sunt egal dispersate de o parte ¿i de alta a valorii


centrale, variabila aleatoare are o reparti¡ie simetricå; în caz contrar reparti¡ia
este asimetricå.
Pentru o reparti¡ie simetricå media, mediana ¿i modul coincid, iar valorile
densitå¡ii de reparti¡ie sunt egale în raport cu valoarea medie:

67
f(m - x) = f(m + x) . (4.33)

Singurul indicator utilizat în hidrologie pentru caracterizarea formei este


coeficientul de asimetrie, notat prin Cs.
Prin defini¡ie:

m3
Cs = , (4.34)
σ3

unde m3 este momentul centrat de ordinul 3, iar σ este abaterea medie


påtraticå.
¥n cazul unei variabile aleatoare de selec¡ie coeficientul de asimetrie se
calculeazå cu rela¡ia:

1 n
∑ ( xi − x ) 3 = ∑ (xi − x)
3 1 1 n 3 1
Cs = =
n i=1 s n i=1 ( x ⋅ Cv ) 3
. (4.35)
3 3
1 n ⎛ xi − x ⎞ 1 1 n ⎛ xi ⎞ 1
= ∑⎜ ⎟ = ∑ ⎜ − 1⎟
n i = 1⎝ x ⎠ C v n i = 1⎝ x
3
⎠ Cv3

xi
Notând, ca ¿i la calculul coeficientului de varia¡ie, raportul prin ki, rela¡ia
x
devine:

∑ ( k i − 1)
n 3

Cs = i =1
. (4.36)
nC v3

¥n cazul în care n < 30, în rela¡ia (4.36) la numitor n va fi înlocuit prin n-1.
Coeficientul de asimetrie este nul în cazul unei reparti¡ii simetrice, deoarece
ponderea punctelor din stânga valorii medii este egalå cu ponderea celor din
dreapta, semnele fiind înså contrare (fig.4.5).

68
Fig. 4.5. Alura densitå¡ii de reparti¡ie pentru valori ale lui Cs pozitive,
nule sau negative (variabile aleatoare continue).

¥n cazul unei reparti¡ii asimetrice, deplasatå spre zona valorilor mici,


coeficientul de asimetrie este pozitiv, deoarece, de¿i mai pu¡ine, valorile xi > x
conduc la o sumå ∑ ( x i − x )
3
mai mare decât valorile xi < x (mai numeroase,
dar cu abateri mai mici fa¡å de medie).
¥n mod similar, dacå distribu¡ia este deplasatå spre zona valorilor mari,
coeficientul de asimetrie este negativ.
¥n general, în cazul variabilelor hidrologice, coeficientul de asimetrie este
pozitiv. Rareori (de exemplu la prelucrarea ¿irului nivelurilor maxime în cazul
unui râu la care albia majorå are o capacitate ridicatå de transport) coeficientul
de asimetrie rezultå negativ.
Pentru caracterizarea formei se mai poate utiliza ¿i coeficientul de boltire; în
expresia lui intervin înså momente de ordinul 4 care sunt evaluate mai pu¡in
precis. Din acest motiv coeficientul de boltire nu este utilizat în hidrologie.

4.4. CALCULUL PARAMETRILOR STATISTICI


AI REPARTIºIEI EMPIRICE

Datele hidrologice se prezintå în general în ordine cronologicå, mul¡imea


valorilor înregistrate formând seria hidrologicå completå. De obicei, nu sunt
utilizate seriile complete, ci se practicå selectarea din serie a valorilor care
prezintå interes în func¡ie de scopul urmårit, restul valorilor excluzându-se.
Rezultå astfel serii de date par¡iale (STAS 4068/1 - 82).
Deosebit de utilizate sunt seriile valorilor extreme (maxime sau minime),
care se ob¡in discretizând axa timpului în intervale egale ¿i alegând în cadrul

69
fiecårui interval de timp valorile care intereseazå. Dacå intervalul de timp ales
este de 1 an, rezultå serii extreme anuale (de exemplu ¿irul debitelor maxime
anuale); pentru intervale mai mici rezultå serii sezoniere.
¥n marea majoritate a cazurilor, prelucrårile statistice din hidrologie au ca
scop trasarea curbei teoretice a probabilitå¡ilor de depå¿ire a debitelor maxime
sau minime anuale. Calculele respective au la bazå aproxima¡ia cå parametrii
popula¡iei statistice (deci parametrii curbei teoretice a probabilitå¡ilor) sunt
aceea¿i cu parametrii ¿irului de date înregistrate (adicå parametrii curbei
empirice a probabilitå¡ilor).
Justificarea teoreticå a acestui mod de rezolvare o constituie teorema lui
Glivenko (Gh. Mihoc ¿.a., 1976). Conform teoremei lui Glivenko rezultå cå
odatå cu cre¿terea volumului selec¡iei, func¡ia empiricå de reparti¡ie tinde cåtre
func¡ia de reparti¡ie teoreticå a variabilei X. ¥n studiul reparti¡iilor empirice se
pot, deci, utiliza reparti¡iile teoretice.
Ca urmare, prima opera¡ie constå în calculul parametrilor de selec¡ie. Dupå
aceea este util så se cunoascå erorile de care sunt afecta¡i parametrii astfel
determina¡i, aducând eventual corec¡ii unora dintre ei. ¥n sfâr¿it cu parametrii
astfel ale¿i se construie¿te curba teoreticå a probabilitå¡ilor de depå¿ire, curbå
care permite extrapolarea ¿irului de date înregistrate în afara domeniului de
måsuråtori curente.
Succesiunea opera¡iilor pentru construirea curbei empirice a probabilitå¡ilor
de depå¿ire ¿i calculul parametrilor statistici ai ¿irului de date înregistrate este
urmåtoarea:
− Se selec¡ioneazå din hidrograful debitelor ¿irul valorilor maxime (sau
minime) anuale;
− Se reordoneazå acest ¿ir în ordine descrescåtoare, de la cea mai mare
valoare înregistratå la cea mai micå; fie i (i = 1, ..., n) numårul de ordine al
debitului din ¿irul ordonat descrescåtor;
− Se atribuie fiecårui debit Qi probabilitatea de depå¿ire empiricå:

i
pi = ; (4.37)
n+1

− Se reprezintå grafic punctele de coordonate (pi , Qi), ob¡inându-se astfel


curba empiricå a probabilitå¡ilor de depå¿ire (fig. 4.6);

70
Fig. 4.6. Curba empiricå a probabilitå¡ilor de depå¿ire.

− ¥n continuare, se calculeazå valoarea medie a ¿irului de date:

1 n
Q= ∑ Qi .
n i=1

Suma se poate calcula utilizând atât coloana valorilor înregistrate în ordine


cronologicå, cât ¿i coloana valorilor rearanjate în ordine descrescåtoare,
rezultatul fiind evident acela¿i.
− Se calculeazå valorile:

Qi
ki =
Q

Calculul se conduce, dupå cum urmeazå în tabelul 4.1.


Ultimele douå coloane servesc pentru calculul coeficientului de varia¡ie,
respectiv de asimetrie (rela¡iile 4.17, respectiv 4.36). Dupå cum se va vedea mai
departe, de multe ori coeficientul de asimetrie nu se mai calculeazå, fiind ales
func¡ie de Cv .
De o deosebitå utilitate la determinarea parametrilor curbei probabilitå¡ilor
de depå¿ire este debitul istoric (determinat dupå urme).

71
Tabelul 4.1

Qi pi
Anul Q i Qi 2 3
(cronologic) (ordonat ki = (ki-1) (ki-1)
descrescåtor) Q

19... 1
Q19... Q1 1
n+1
19... 2
Q19... Q2 2
n +1
19... . . .
Q19...
19... . . .
Q19...
... ... ... ... ...
19... n
Q19... Qn n
n+1
∑ Qi
∑ ( k i − 1) ∑ ( k i − 1)
n 2 n 3
Q= i =1
n i =1

¥n cazul în care se dispune de ¿irul debitelor maxime anuale Qi pentru o


perioadå de n ani ¿i de debitul maxim istoric QN dintr-o perioadå de N ani (care
înså nu s-a produs în intervalul cu date înregistrate), pentru calculul
parametrilor se utilizeazå formulele (C. Mociorni¡a ¿.a., 1979):

1⎛ N−1 n ⎞
Q' = ⎜ QN + ∑ Qi ⎟ ; (4.38)
N⎝ n i =1 ⎠

1⎡ N−1 n 2⎤
( ) ∑ ( ki − 1) ⎥ .
2
Cv' = ⎢ k N − 1 + (4.39)
N⎣ n i=1 ⎦

Dacå în ¿irul celor n valori maxime anuale ale debitelor existå o valoare
foarte mare în raport cu celelalte (¿i care constituie debitul maxim istoric pentru
o perioadå de N > n ani), pentru calcul se vor utiliza rela¡iile (C. Mociorni¡a
¿.a., 1979):

1⎛ N − 1 n− 1 ⎞
Q' = ⎜ QN + ∑ Qi ⎟ ; (4.40)
N⎝ n i=1 ⎠

72
1 ⎡ N − 1 n− 1 2⎤
Cv' = ⎢
N − 1⎣
( k N − 1) 2
+ ∑ ( ki − 1) ⎥
n − 1 i=1
(4.41)

¥n rela¡iile anterioare:

k N = QN / Q ' . (4.42)

Parametrii, Q , Cv ¿i Cs au fost calcula¡i prin metoda momentelor (în


evaluarea lor au intervenit momente de ordinul unu, doi, respectiv trei); aceastå
metodå este de altfel ¿i cea mai utilizatå în practicå. Pentru estimarea
parametrilor se mai poate folosi metoda verosimilitå¡ii maxime, metoda celor
mai mici påtrate, metoda intervalelor de încredere etc. (M. Shahin, ¿.a., 1993).
¥n continuare vor fi prezentate câteva aspecte metodologice referitoare la
unele din aceste metode de calcul.

4.5. EVALUAREA PARAMETRILOR REPARTIºIILOR TEORETICE

¥n hidrologie tipul de reparti¡ie teoreticå este cunoscut în general, din


experien¡a trecutå. ¥n practica hidrologicå din ¡ara noastrå sunt utilizate curbele
de reparti¡ie triparametrice Kri¡ki - Menkel ¿i curbele de reparti¡ie binomialå
Pearson III. ¥n principiu, legea de reparti¡ie teoreticå se intuie¿te pe baza
reprezentårilor grafice ale variabilelor de selec¡ie; calculele urmåtoare se vor
efectua apoi pe baza ipotezei de reparti¡ie teoretice admise.
Presupunând tipul de reparti¡ie cunoscut se pune acum problema evaluårii
(estimårii) parametrilor reparti¡iei teoretice. Numai dupå aceastå opera¡iune
reparti¡ia este complet determinatå. Valorile parametrilor variabilei teoretice
(care caracterizeazå popula¡ia statisticå) sunt estimate pe baza variabilelor de
selec¡ie (adicå a valorilor înregistrate).

4.5.1. METODA MOMENTELOR

Fie f(x, a, b, c, ...), func¡ia de probabilitate (în cazul unei reparti¡ii discrete),
respectiv densitatea de reparti¡ie (în cazul unei reparti¡ii continue), func¡ie care
depinde de un numår de parametri a, b, c, ... necunoscu¡i ¿i care trebuie
determina¡i. Fie k numårul acestor parametri.
Metoda momentelor constå în calcularea primelor k momente atât ale
variabilei teoretice având reparti¡ia f(x, a, b, c, ...), cât ¿i ale variabilei de

73
selec¡ie. Momentele teoretice vor avea expresii func¡ie de parametrii
necunoscu¡i a, b, c, ...:

M1(a, b, c, ...); M2(a, b, c, ...); ... ; Mk(a, b, c, ...)

Fie M1* , M2* ,K, Mk* - primele k momente empirice ale variabilei de selec¡ie,
calculate cu ajutorul valorilor înregistrate x1, x2, ..., xn. Prin egalarea celor 2
rânduri de momente se ob¡ine un sistem (neliniar în general) de k ecua¡ii cu k
necunoscute, ale cårei solu¡ii estimeazå parametrii reparti¡iei teoretice.
Fie, de exemplu, reparti¡ia Gama cu 2 parametri:

1
f ( x , a, b ) = x a −1e − x / b (x≥0; a>0; b>0) (4.43)
Γ ( a)b a

Se pune problema evaluårii parametrilor a ¿i b, utilizând metoda


momentelor.
Momentele teoretice de ordinul 1 ¿i 2, ¡inând seama ¿i de defini¡ia func¡iei
euleriene de spe¡a a doua (func¡ia gama), sunt (C. Dinescu, V. Såvulescu,
1978):

M1 = ∫ xf ( x, a, b ) dx = ab ; (4.44)
0


M 2 = ∫ x 2 f ( x, a b )dx = a( a + 1)b 2 . (4.45)
0

Primele douå momente empirice sunt:

1 n
M1* = ∑ xi ; (4.46)
n i=1

1 n 2
M2* = ∑ xi . (4.47)
n i=1

Egalând momentele teoretice cu momentele empirice se ob¡ine un sistem de


douå ecua¡ii cu douå necunoscute:

1 n
ab = ∑ xi ; (4.48)
n i =1

74
1 n 2
a( a + 1)b 2 = ∑ xi . (4.49)
n i=1

Rezolvarea acestui sistem conduce la evaluarea parametrilor a ¿i b ; cu


aceasta, reparti¡ia variabilei teoretice este complet determinatå.
Metoda momentelor este dupå cum s-a mai aråtat cea mai utilizatå în
practica hidrologicå.

4.5.2. METODA VEROSIMILITźII MAXIME

Aceastå metodå pleacå de asemenea de la valorile înregistrate x1, x2, ..., xn ¿i


de la expresia func¡iei f(x, a, b, ...), unde a, b, ... sunt parametrii care trebuie
estima¡i.
Se nume¿te func¡ie de verosimilitate func¡ia:

V (a, b ,...) = f ( x 1 , a, b ,...) ⋅ f ( x 2 , a, b ,...) ⋅ f ( x n , a, b ,...) = ∏ f ( x i , a, b ,...) . (4.50)


n

i =1

Valorile cele mai verosimile pentru a, b, c, ... sunt acelea care maximizeazå
func¡ia V(a, b, c, ...). ¥n continuare trebuie aplicate tehnici de gåsire a
extremului unei func¡ii care depinde de mai multe variabile (derivarea func¡iei
de verosimilitate V în raport cu cele k necunoscute, anularea celor k derivate
par¡iale ¿i rezolvarea sistemului rezultat). Pentru efectuarea mai comodå a
calculelor acest procedeu nu se aplicå func¡iei de verosimilitate V, ci
logaritmului ei, ¡inând seama de faptul cå o func¡ie oarecare î¿i atinge maximul
odatå cu logaritmul såu natural.
Fie, de exemplu, densitatea de reparti¡ie:
2
1 ⎛ x −a⎞
− ⎜ ⎟
f ( x , a, b) =
1
e 2⎝ b ⎠
; x∈R , (4.51)
b 2π

¿i valorile de selec¡ie x1, x2, ..., xn.


¥n acest caz func¡ia de verosimilitate este (C. Dinescu, V. Såvulescu, 1978):
2 n
1⎛ x − a ⎞
∑ ( xi − a)
1 2
− ⎜ i ⎟ −
n 1 2⎝ b ⎠ 1 2
V ( a, b ) = ∏ e = e 2b i=1
. (4.52)
i = 1 b 2π
( 2π )
n
n
b

75
Prin logaritmare se ob¡ine:

lnV (a, b) = − n ⋅ ln b − n ⋅ ln 2π − 2 ∑( i
x − a) .
1 n 2
(4.53)
2b i = 1

¥n continuare se calculeazå derivatele par¡iale de ordinul unu ale func¡iei


ln V, în raport cu necunoscutele a ¿i b:

∂ ln V ( a, b ) 1 n
= 2 ∑ ( x i − a) (4.54)
∂a b i=1

∂ ln V ( a, b )
= − + 3 ∑ ( x i − a)
n 1 n 2
(4.55)
∂b b b i =1

Anulând cele douå derivate se ob¡ine urmåtorul sistem:

∑ ( x i − a) = 0
n
(4.56)
i =1

∑ ( x i − a) = 0 .
n 1 n 2
− + (4.57)
b b 3 i =1

Din ecua¡ia (4.56) rezultå:

∑ ( x i − a) = ∑ x i − ∑ a = ∑ x i − na = 0
n n n n
(4.58)
i =1 i =1 i =1 i =1

Deci:

n
na = ∑ x i (4.59)
i =1

sau:

1 n
a= ∑ xi . (4.60)
n i =1

Cu alte cuvinte, estimatorul de maximå verosimilitate al parametrului a este


chiar media de selec¡ie x .

76
¥nlocuindu-l pe a prin x în ecua¡ia (4.57), se ob¡ine:

n 1 n
= 3 ∑ ( xi − x ) ,
2
(4.61)
b b i=1
adicå:

∑ ( xi − x )
1 n 2
b2 = sau b = s . (4.62)
n i =1
Rezultå cå parametrul b are drept estimator de maximå verosimilitate
abaterea medie påtraticå de selec¡ie s. Cu alte cuvinte parametrii a ¿i b din
expresia densitå¡ii de reparti¡ie teoreticå sunt chiar valoarea medie m, respectiv
abaterea medie påtraticå σ a popula¡iei. Func¡ia având densitatea de reparti¡ie:
2
1 ⎛ x −m⎞
−− ⎜ ⎟
f (x , m,σ ) =
1
e 2⎝ σ ⎠
, x∈R (4.63)
σ 2π

poartå numele de reparti¡ie normalå ¿i poate fi luatå drept model teoretic


pentru cercetarea probabilisticå a unui numår foarte mare de fenomene
aleatoare.

4.5.3. METODA CELOR MAI MICI PÅTRATE

Fie f(x, a, b, c, ...) densitatea de reparti¡ie ai cårei parametri trebuie


determina¡i.
Din punct de vedere matematic, problema constå în gåsirea acelei
configura¡ii a parametrilor a, b, c, ... astfel încât suma påtratelor (sau suma
t
modulilor) abaterilor dintre probabilitå¡ile teoretice pi ¿i probabilitå¡ile empirice
e
pi så fie minimå:

( )
n 2
F = ∑ pti − p ei → min im . (4.64)
i =1

Probabilitå¡ile teoretice pit de depå¿ire ale valorilor înregistrate xi se


evalueazå cu rela¡iile:

+∞
pit = ∫ f ( x, a, b, c,...) dx , (4.65)
xi

77
e
în timp ce probabilitå¡ile empirice pi se ob¡in cu rela¡ia Weibull:

i
pie = . (4.66)
n+ 1

Func¡ia obiectiv are deci expresia (R. Drobot, 1989):

2
n ⎡ +∞ i ⎤
F = ∑ ⎢ ∫ f ( x, a, b, c,...)dx − ⎥ → min im . (4.67)
i = 1 ⎣ xi n + 1⎦

Pentru integrarea densitå¡ii de reparti¡ie se utilizeazå metode numerice, ca de


exemplu metoda Gauss cu 8 sau 16 puncte (G. Vraciu, A. Popa, 1982). ¥n
vederea cre¿terii preciziei calculului, integrarea se poate efectua din aproape în
aproape între douå valori succesive xi , respectiv xi+1, iar acolo unde ecartul
între douå valori succesive este prea mare, se poate recurge chiar la divizarea
acestuia.
Cåutarea minimului se face prin procedee numerice de programare neliniarå
care nu apeleazå la calculul derivatelor func¡iei obiectiv; cele mai bune rezultate
se ob¡in cu algoritmul Nelder-Mead.
Avantajul metodei celor mai mici påtrate constå în flexibilitatea sa în
evaluarea parametrilor. Astfel, în metoda momentelor calculul ordonatelor
curbei Kri¡ki-Menkel a probabilitå¡ilor de depå¿ire are loc admi¡ând valori fixe,
prestabilite ale raportului Cs /Cv , care variazå de la 1,0 la 4,0 cu un pas de
discretizare de 0,5. Metoda celor mai mici påtrate permite ob¡inerea optimului
global al func¡iei (4.67), valorile optime ale parametrilor a, b, c, ... , putând
conduce la orice raport Cs /Cv , fårå nici o restric¡ie.
Dupå evaluarea parametrilor, probabilitatea de depå¿ire teoreticå
corespunzåtoare unei valori xi oarecare se ob¡ine prin integrarea rela¡iei (4.65).
Dacå intereseazå valoarea xi , cåreia îi corespunde o probabilitate de depå¿ire
datå (de ex: p%=1%), calculul se efectueazå prin încercåri succesive: se propun
diverse valori xi ca limitå inferioarå de integrare în rela¡ia (4.65), ob¡inându-se
valorile corespunzåtoare pentru probabilitå¡ile teoretice pit ; prin interpolare
rezultå imediat valoarea x cåutatå, procedeul fiind rapid convergent.

78
Pentru exemplificare, se considerå ca reparti¡ie teoreticå, distribu¡ia Gama cu
trei parametri, care va fi utilizatå pentru calculul probabilitå¡ilor teoretice de
depå¿ire în cazul unui ¿ir scurt (n = 25) de debite maxime anuale:

f (x) = α
1
β Γ (α )
( x −γ )
( α − 1) − ( x − γ ) / β
e , (4.68)

unde nota¡iile au urmåtoarea semnifica¡ie:


α este parametrul de formå;
β - parametrul de scarå;
γ - limita inferioarå a valorilor distribu¡iei.

Fie reparti¡ia empiricå:

⎧⎛ i ⎞⎫
⎨⎜ x i = Qi ; p i = ⎟⎬ ,
⎩⎝ n + 1⎠ ⎭

unde debitele Qi sunt ordonate în ordine descrescåtoare, i fiind numårul de


ordine din acest ¿ir:

Q1 > Q2 > ... > Qi > ... > Qn . (4.69)

t
Probabilitå¡ile teoretice pi de depå¿ire ale debitelor înregistrate se ob¡in cu
rela¡ia:

+∞ +∞ 1
pit = ∫ f ( x )dx = ∫ α α
( x − γ ) (α −1) e −( x −γ )/β dx . (4.70)
Qi Qi β Γ

Func¡ia obiectiv are expresia:

2
n ⎡ +∞ 1 i ⎤
F = ∑ ⎢ ∫ α α ( x − γ ) (α −1) e −( x −γ )/ β dx − ⎥ → min im (4.71)
i = 1 ⎣ Qi β Γ n + 1⎦

Coordonatele minimului sunt în cazul de fa¡å cei trei parametri necunoscu¡i


α, β ¿i γ care asigurå aproximarea cea mai bunå a curbei empirice de cåtre curba
teoreticå.

79
Pentru reparti¡ia Gama cu 3 parametri, momentul de ordinul 1 (media
aritmeticå), respectiv momentele centrate de ordinul 2 ¿i 3 au expresiile (V.
Yevdjevitch, 1972):

+∞
m = ∫ xf ( x ) dx = γ + αβ ;
γ

+∞
m2 = σ 2 = ∫ ( x − m) f ( x )dx = αβ 2 ;
2
(4.72)
γ

+∞
m3 = ∫ ( x − m) f ( x )dx = 2αβ 3 .
3

γ
Ca urmare, coeficien¡ii de varia¡ie ¿i asimetrie sunt:

σ β α
Cv = = ,
m γ + αβ
(4.73)
m3 2
Cs = = .
σ3 α

De aici rezultå imediat raportul Cs /Cv în func¡ie de parametrii α, β, ¿i γ


determina¡i prin procedeul de optimizare.

Fig. 4.7. Trasarea curbei teoretice a probabilitå¡ilor de depå¿ire


prin procedeul clasic ¿i prin optimizare.

80
¥n figura 4.7 sunt reprezentate curba empiricå a probabilitå¡ilor de depå¿ire
precum ¿i curbele teoretice calculate cu parametrii ob¡inu¡i prin metoda
momentelor (curba 1), respectiv prin optimizare (curba 2).
Chiar ¿i în cazul unei alegeri foarte bune a raportului Cs /Cv (ceea ce nu este
întotdeauna sigur în practicå), aproximarea curbei empirice este mai slabå decât
în cazul utilizårii parametrilor ob¡inu¡i prin optimizare.

4.6. ERORI ªI LIMITE ALE CALCULULUI STATISTIC

Efectuând mai multe selec¡ii de acela¿i volum dintr-o popula¡ie statisticå ¿i


calculând parametrii statistici uzuali (valoare medie, coeficient de varia¡ie ¿i
coeficient de asimetrie) se ob¡in valori ale acestora, diferite de la selec¡ie la
selec¡ie. Cu cât volumul selec¡iei este mai mare, cu atât fluctua¡iile parametrilor
vor fi mai mici, tinzând la limitå cåtre parametrii popula¡iei examinate; invers,
pentru un volum redus al selec¡iei, parametrii statistici corespunzåtori pot
prezenta abateri importante de la parametrii popula¡iei. Cu alte cuvinte, înså¿i
parametrii statistici sunt ni¿te variabile aleatoare, valorile acestora depinzând în
general de lungimea ¿irului de date de bazå.
Abaterea medie påtraticå a coeficien¡ilor Cs ¿i Cv se calculeazå cu rela¡iile:

6
σ Cs = (4.74)
n

Cv
σ Cv = 1 + 2Cv2 . (4.75)
2n

Volumul redus al selec¡iei constituie o importantå surså de erori în calculul


statistic. Luând drept måsurå a erorii abaterea medie påtraticå a parametrilor Cs
¿i Cv se constatå cå cel mai afectat de lungimea ¿irului statistic este coeficientul
de asimetrie.
Astfel, considerând o popula¡ie pentru care Cv = 0,5, din formulele (4.74) ¿i
(4.75) rezultå cå, pentru o selec¡ie de volum n = 100, eroarea la determinarea lui
Cs este de 25%, în timp ce pentru Cv este 4,25%. Pentru n = 20, respectiv 25,
erorile pentru Cv sunt 9,7%, respectiv 8,6%, în timp ce pentru Cs sunt
inacceptabile depå¿ind 50%. Admi¡ând erori în calculul statistic de pânå la 10%,
rezultå cå pentru un ¿ir de date cu cel pu¡in 20 ÷ 25 valori, pentru Cv se poate
admite valoarea calculatå, în timp ce coeficientul de asimetrie trebuie ales pe

81
bazå de experien¡å în func¡ie de valorile coeficientului de varia¡ie (care este
determinat cu o precizie mult mai bunå).
Coeficientul de asimetrie are (C. Mociorni¡å ¿.a., 1979) urmåtoarele valori
(func¡ie de Cv):

Cs = 2 Cv - pentru debite maxime provenite din topirea zåpezilor;


Cs = 4 Cv - pentru debite maxime provenite din ploi;
Cs = (3 ÷ 4) Cv - pentru debite maxime anuale indiferent de genezå,
adoptându-se valoarea minimå în cazurile în care
marea majoritate a debitelor din ¿ir provin din
opirea zåpezilor ¿i valoarea maximå în cazul în
care sunt cauzate de ploi.

Alte valori ale lui Cs sunt urmåtoarele (Hâncu ¿.a., 1975):


Cs = 0 - pentru niveluri maxime;
Cs = 1,5Cv - pentru debite medii anuale pe râurile care seacå;
Cs = (3 ÷ 3,5)Cv - pentru precipita¡ii maxime;
Cs = (3,5 ÷ 4)Cv - pentru debite maxime pe râuri mici;
Cs = 2Cv - pentru debite medii anuale ¿i debite minime de varå.

¥n sfâr¿it, pentru calculul volumelor maxime de duratå T cu diverse


probabilitå¡i de depå¿ire, coeficientul de asimetrie are urmåtoarele valori (C.
Mociorni¡å ¿.a., 1979):

Cs = 2Cv - pentru volume maxime provenite din topirea


zåpezilor;
Cs = 4Cv - pentru volume maxime provenite din ploi;
Cs = (2 ÷ 4)Cv - pentru volume maxime indiferent de genezå,
func¡ie de provenien¡a celei mai mari pår¡i a datelor
din ¿irul analizat.

Dupå calculul parametrilor ¿irului de date de care se dispune din måsuråtori


se procedeazå la calculul ordonatelor curbei teoretice având aceia¿i parametri.
Urmeazå apoi reprezentarea pe un format special a curbei teoretice ¿i a
curbei empirice; în mod normal curba teoreticå trebuie så treacå printre punctele
curbei empirice.

82
¥n anumite situa¡ii acest lucru poate så nu se realizeze. ¥n acest caz sunt de
suspectat erori de determinare a unora dintre debitele din ¿ir; se mai poate
întâmpla ca în cadrul intervalului de n ani analizat så se fi produs debite cu
probabilitå¡i de apari¡ie extrem de reduse (prima sau primele valori din ¿irul
ordonat descrescåtor pot avea probabilitå¡i de depå¿ire cu mult mai mici decât
frecven¡ele empirice calculate cu rela¡ii de tipul i/(n+1)).
Pentru ob¡inerea unei concordan¡e cât mai bune între conturul curbei
teoretice ¿i valorile måsurate se pot adopta diverse måsuri (C. Mociorni¡å ¿.a.,
1979, R. Drobot, 1989):
− Modificarea valorii parametrilor Cv ¿i Cs; admi¡ând cå eroarea la
determinarea coeficientului de varia¡ie este în limitele ± σ Cv se vor
propune noi valori pentru coeficientul de varia¡ie cuprinse în domeniul
[Cv- σ Cv ; Cv + σ Cv ]. ¥n ceea ce prive¿te coeficientul de asimetrie, acesta va fi

ales în func¡ie de noua valoare a lui Cv.


− Utilizarea altor curbe teoretice de probabilitate (în afara curbelor Kri¡ki-
Menkel sau Pearson III) cum sunt de exemplu curbele log-normale, Johnson
etc; tipul de curbå adecvat ¿irului statistic de valori înregistrate se va alege pe
2
baza unor teste de concordan¡å ca de exemplu criteriul χ sau testul lui
Kolmogorov.
− Utilizarea metodei celor mai mici påtrate pentru determinarea
parametrilor care intervin în rela¡iile de defini¡ie ale densitå¡ii de reparti¡ie sau
func¡iei de reparti¡ie ¿i implicit ale parametrilor statistici uzuali; trebuie
men¡ionat cå metoda celor mai mici påtrate are o flexibilitate superioarå
metodei bazatå pe calculul momentelor, care este condi¡ionatå de utilizarea unor
valori fixe, prestabilite ale raportului Cs /Cv (curbele Kri¡ki-Menkel sunt definite
pentru valori ale acestui raport egale cu 1,0; 1,5; 2,0; ... ; 4,0, excluzându-se
valorile intermediare).
Principala cauzå a erorilor inerente calculului statistic o constituie volumul
relativ redus al ¿irului de date din înregistråri. Se reaminte¿te cå în hidrologie
perioada de måsuråtori este cuprinså în general între 20 - 40 de ani.
Chiar dacå s-ar dispune de date pe perioade îndelungate, aceasta nu
constituie o garan¡ie deplinå în special în cazul unor bazine mici sau foarte mici.
La aceste bazine influen¡a activitå¡ilor umane (despåduriri masive, urbanizare
progresivå etc.) se resimte foarte puternic, conducând în timp la o cre¿tere a
valorii coeficientului de scurgere ¿i o mic¿orare a timpului de concentrare a
precipita¡iilor în re¡eaua hidrograficå); ca urmare se constatå o cre¿tere a
frecven¡ei cu care se înregistreazå debite de probabilitå¡i considerate reduse. ¥n
aceste situa¡ii este necesarå renun¡area la valorile mai vechi ale ¿irului (care nu
mai reflectå corect actuala situa¡ie a bazinului hidrografic), cu toate implica¡iile

83
defavorabile pe care le are mic¿orarea numårului de valori disponibile pentru
prelucrarea statisticå.

84
5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE

5.1. REPARTIºIA NORMALÅ

Aceastå reparti¡ie, cunoscutå ¿i sub denumirea de legea lui Gauss sau legea
Gauss-Laplace, ocupå un loc deosebit printre distribu¡iile teoretice, constituind
de altfel o lege limitå cåtre care tind unele distribu¡ii (binomialå, Poisson) în
anumite condi¡ii. Pentru ca o variabilå aleatoare så aibå distribu¡ie normalå,
trebuie ca ea så depindå de un mare numår de factori, cu o influen¡å individualå
relativ reduså, efectul fiecårui factor så fie aditiv ¿i independent de al celorlal¡i
factori cauzali (V. Yevjevich, 1972).
Distribu¡ia normalå de parametri m ¿i σ este definitå dupå cum s-a aråtat
(§4.5.2) prin urmåtoarea densitate de reparti¡ie:

2
1 ⎛ x −m ⎞
− ⎜ ⎟
f (x; m,σ ) =
1
e 2⎝ σ ⎠
; x ∈R (5.1)
σ 2π

Reparti¡ia normalå are urmåtoarele proprietå¡i:


− func¡ia f(x; m, σ) este continuå, fiind definitå pentru orice valoare realå a
lui x de la -∞ la +∞;
− densitatea de reparti¡ie normalå are un singur maxim (este o reparti¡ie
unimodalå) pe care îl atinge în punctul x = m; valoarea maximå a func¡iei este:

f (m ) =
1
; x ∈R (5.2)
σ 2π

− densitatea de reparti¡ie normalå este simetricå fa¡å de verticala duså prin


x=m ¿i scade simetric la stânga ¿i la dreapta de aceastå valoare, tinzând
cåtre axa absciselor care este asimptotå orizontalå.
¥ntr-adevår:

lim f ( x ; m , σ ) = lim f ( x ; m , σ ) = 0 . (5.3)


x → −∞ x → +∞

85
− reparti¡ia normalå fiind simetricå media, mediana ¿i modul coincid; în
plus, coeficientul de asimetrie este nul (se reaminte¿te cå la reparti¡iile
asimetrice acest coeficient este diferit de zero);
− func¡ia f(x; m, σ) are formå de clopot (de altfel, se mai nume¿te ¿i
clopotul lui Gauss) cu punctele de inflexiune în x = ±σ.
Reprezentarea graficå a reparti¡iei normale (exprimatå prin intermediul
densitå¡ii de reparti¡ie) este redatå în figura 5.1.

Fig. 5.1. Graficul densitå¡ii de reparti¡ie pentru distribu¡ia normalå.

Referitor la forma func¡iei f(x; m, σ) trebuie aråtat (fig. 5.2) cå, cu cât
abaterea medie påtraticå σ este mai micå, clopotul este mai ascu¡it, iar cu cât σ
este mai mare clopotul este mai turtit (împrå¿tierea este mai mare).

Fig. 5.2. Influen¡a lui σ asupra densitå¡ii de reparti¡ie ¿i a func¡iei de reparti¡ie.

86
Deoarece parametrii distribu¡iei normale sunt m ¿i σ, rezultå cå având media
¿i dispersia variabilei aleatoare, func¡ia de reparti¡ie este perfect determinatå.
Fåcând, în expresia densitå¡ii de reparti¡ie schimbarea de variabilå:

x−m
t= , (5.4)
σ

se ob¡ine distribu¡ia normalå de parametri m = 0 ¿i σ = 1:

f (t ;0 ;1) =
1 −t 2 / 2
e ; t ∈R . (5.5)

x−m
Variabila t = se nume¿te variabilå standard sau normatå, iar
σ
distribu¡ia f(t; 0; 1) poartå numele de reparti¡ie normalå normatå.
Valorile densitå¡ii de reparti¡ie a distribu¡iei normale normate sunt date în
tabelul 5.1; valorile oricårei alte reparti¡ii normale, având parametrii estima¡i pe
baza datelor din måsuråtori se ob¡in cu rela¡iile (V. Yevjevich, 1972):

x = m + tσ , (5.6)
respectiv:

f ( x ) = f ( m + tσ ) =
1 1
e −t / 2 = f ( t ) .
2
(5.7)
σ 2π σ

Mai trebuie aråtat cå variabila aleatoare normatå având media egalå cu zero
este simetricå fa¡å de verticala duså prin origine.

Fig. 5.3. Trecerea de la reparti¡ia normalå normatå (a) la o reparti¡ie normalå de


medie m ¿i abatere σ (b).

87
88
¥n figura 5.3 este prezentat graficul densitå¡ii de reparti¡ie f(t; 0; 1) ¿i
respectiv graficul func¡iei f(x; m, σ) ob¡inut din aceasta.
Func¡ia de reparti¡ie a varibilei normale normate, numitå func¡ia lui Laplace
este:

1 x −t 2 2
Φ(x) = ∫e dt . (5.8)
2π −∞

Fiind o func¡ie de reparti¡ie, Φ(-∞) = 0, iar Φ(+∞) = 1. ¥n plus, deoarece


f(t; 0; 1) este simetricå fa¡å de dreapta m = 0, rezultå cå:

−x +∞ x
Φ ( − x ) = ∫ f ( t )dt = ∫ f ( t )dt =1 − ∫ f ( t )dt =1 − Φ ( x ) . (5.9)
−∞ x −∞

Func¡ia lui Laplace este, de asemenea, tabelatå (tab.5.2) ¿i serve¿te la


calculul probabilitå¡ilor evenimentelor referitoare la orice variabilå aleatoare
normalå.
De exemplu, probabilitatea ca o variabilå normalå så ia valori în intervalul
[x1, x2) poate fi evaluatå cu ajutorul func¡iei Φ(x).
Efectuând schimbarea de variabilå (5.6), rezultå:

dx = σ dt . (5.10)

Limitele de integrare se schimbå dupå cum urmeazå:


x −m
− pentru X = x1, t1 = 1 ; (5.11)
σ
x2 − m
− pentru X = x2, t2 = . (5.11')
σ
¥n acela¿i timp, dx = σdt. Ca urmare:

x2 − m
1 σ
Prob(x1 ≤ X < x2) = −t 2
∫ e
/2
⋅σdt =
σ 2π x1 − m
σ
(5.12)
⎛ x2 − m x1 − m

1 ⎜ σ −t 2 /2 σ
−t 2 / 2 ⎟
= ⎜ ∫ e dt − ∫ e dt ⎟
2π ⎜ −∞ −∞ ⎟
⎝ ⎠

89
90
ºinând seama de defini¡ia (5.8) a func¡iei de reparti¡ie normalå normatå, cu
parametrii m = 0 ¿i σ = 1, rezultå:

⎛ x − m⎞ ⎛ x1 − m ⎞
Pr ob ( x 1 ≤ X < x 2 ) = Φ ⎜ 2 ⎟ − Φ⎜ ⎟ . (5.13)
⎝ σ ⎠ ⎝ σ ⎠

Din rela¡ia apartenen¡ei la intervalul [x1, x2) se poate calcula ¿i probabilitatea


de nedepå¿ire a unei valori oarecare a variabilei aleatoare de distribu¡ie normalå.
Considerând, de pildå, x1 = -∞ în rela¡ia (5.13) se ob¡ine:

⎛ x − m⎞
Pr ob ( − ∞ < X < x 2 ) = Φ ⎜ 2 ⎟ − Φ ( − ∞) . (5.14)
⎝ σ ⎠

Dar Φ(-∞) = 0, deci:

⎛ x − m⎞
Pr ob ( X < x ) = Φ ⎜ ⎟ = Φ (t ) . (5.15)
⎝ σ ⎠

Cunoscând media m ¿i abaterea σ a variabilei aleatoare, se calculeazå


variabila normalå normatå t. Probabilitatea de nedepå¿ire a lui t este în acela¿i
timp ¿i probabilitatea de nedepå¿ire a valorii x.
¥n mod similar se calculeazå probabilitatea de depå¿ire, ob¡inându-se:

⎛ x − m⎞
Pr ob ( X ≥ x ) = 1 − Φ ⎜ ⎟ = 1 − Φ (t ) . (5.16)
⎝ σ ⎠

Rela¡ia apartenen¡ei la un anumit interval poate servi ¿i pentru determinarea


probabilitå¡ii ca abaterea variabilei X fa¡å de medie så nu depå¿eascå o anumitå
mårime.
Astfel:

Pr ob ( )
X − m < α = Pr ob ( − α + m ≤ X < α + m) =
. (5.17)
⎛α⎞ ⎛ α⎞
=Φ ⎜ ⎟ − Φ ⎜− ⎟
⎝σ ⎠ ⎝ σ⎠

91
Dar:

Φ(-x) = 1 - Φ(x), (5.18)

deci:

⎛α⎞
Pr ob ( )
X − m < α = 2Φ ⎜ ⎟ − 1 .
⎝σ ⎠
(5.19)

Dacå α = 3σ ¿i ¡inând cont de faptul cå Φ(3) = 0,9987 rezultå:

Pr ob ( )
X − m < 3σ = 2Φ ( 3) − 1 = 0,9974 . (5.20)

Deci domeniul (m - 3σ, m + 3σ) acoperå marea majoritate a observa¡iilor


(99,74%) ¿i doar 0,26% se gåsesc în afarå. Aceastå rela¡ie foarte importantå
poartå numele de regula celor trei sigma.
¥n mod similar, în domeniul (m - σ, m + σ) sunt situate aproape 68% din
valori ¿i mai pu¡in de 32% în afara acestui interval.

5.2. APLICAºII ALE REPARTIºIEI NORMALE ¥N HIDROLOGIE

1. Ca oricare alte date ob¡inute pe bazå de måsuråtori, mårimile hidrologice


sunt afectate de erori sistematice ¿i erori aleatoare. Erorile aleatoare sunt în
marea majoritate a cazurilor simetric distribuite ¿i pot fi exprimate printr-o
distribu¡ie normalå; ca indicator al erorilor se va utiliza abaterea standard.
2. Anumite reparti¡ii care nu sunt normale pot fi aduse la distribu¡ia normalå
printr-o schimbare de variabilå. De exemplu, o variabilå distribuitå asimetric
poate fi simetrizatå prin logaritmare, sau considerând radicalii variabilei etc.;
dacå coeficientul de asimetrie al noii variabile este cuprins în intervalul
(-0,10; +0,10) sau, ¿i mai strict, între (-0,05; 0,05), se poate admite pentru
aceastå variabilå ipoteza reparti¡iei normale ¿i deci se pot utiliza toate rezultatele
ob¡inute la reparti¡ia normalå.
3. Func¡ia de reparti¡ie normalå este de asemenea utilizatå în probleme de
generare a debitelor.
Pentru început se genereazå numere aleatoare distribuite uniform în
intervalul [0, 1]. O variabilå aleatoare discretå U este uniformå dacå toate
valorile ei sunt egal probabile (fiecare valoare are probabilitatea de apari¡ie
egalå cu 1/n).

92
Dacå variabila este continuå, densitatea de reparti¡ie este de forma:

⎪⎧k , dacå x ∈[a, b]


f (x) = ⎨ (5.21)
⎪⎩0 , dacå x ∉[a, b]

Constanta k va fi determinatå din condi¡ia ca f(x) så reprezinte o densitate de


reparti¡ie:

b b
∫ f ( x )dx = ∫ k dx = kx a = k ( b − a) = 1 .
b
(5.22)
a a

Rezultå:

1
k= . (5.23)
b −a

Pentru generarea numerelor aleatoare uniform distribuite în intervalul [0, 1]


se folosesc fie procedee fizice (de exemplu, o urnå cu 10, 100 sau 1000 de bile
din care se fac extrac¡ii la întâmplare cu revenire), fie procedee matematice.
Procedeele matematice, utilizând rela¡ii de recuren¡å, conduc de fapt la
ob¡inerea unor numere pseudo-aleatoare (func¡ie de capacitatea calculatorului
folosit, la un moment dat, numerele generate încep så se repete).
Cel mai frecvent, pentru generarea numerelor pseudo-aleatoare uniform
repartizate în intervalul [0, 1] se folose¿te metoda congruen¡ialå liniarå:

Xn+1 = (a Xn + c) (mod M), n = 0, 1, 2, ... (5.24)

unde a, c ¿i M sunt întregi nenegativi.


Numårul întreg pozitiv Xo este termenul ini¡ial al ¿irului de numere pseudo-
aleatoare. Din cerin¡a ca perioada de repetare så fie cât mai mare, modulul M
este suficient de mare (fiind egal cu mårimea cuvântului calculatorului minus 1,
sau apropiat de acesta); constantele a ¿i c trebuie så respecte de asemenea
anumite criterii astfel încât perioada de revenire så fie maximå (Våduva, 1977).
Dispunând de numerele pseudo-aleatoare uniform distribuite pe intervalul
[0, 1] , se pot genera imediat numere pseudo-aleatoare de distribu¡ie normalå
normatå.

93
Din punct de vedere practic lucrurile decurg ca în figura 5.4.

Fig. 5.4. Generarea numerelor aleatoare cu densitatea


de reparti¡ie f(x) cerutå.

Fie yn un numår aleator uniform repartizat pe [0, 1], generat ini¡ial. Se


determinå valoarea abscisei xn, pentru care valoarea func¡iei de reparti¡ie
F(xn) = yn. Valorile xn astfel ob¡inute reprezintå numere aleatoare cu densitatea
f(x) cerutå.
Din punct de vedere matematic, procedeul expus revine la inversarea func¡iei
de reparti¡ie (Såcuiu, Zorilescu, 1978). Se noteazå prin {yn} un ¿ir de numere
uniform repartizate pe [0, 1] ¿i prin F(x) func¡ia de reparti¡ie a variabilei
aleatoare X (presupuså continuå):

yn = F(xn) , (5.25)

unde xn sunt realizåri ale variabilei aleatoare X.


Deoarece F(x) este continuå, admite inverså ¿i deci:

x n = F −1( y n ) . (5.26)

94
-1
Dacå func¡ia F se poate explicita algebric, valorile xn rezultå imediat ce au
fost generate valorile yn.
-1
¥n cazul reparti¡iei normale, func¡ia F nu poate fi exprimatå algebric; ca
atare se utilizeazå o aproximare a acesteia sau se folosesc tabele ale reparti¡iei
normale normate, care permit determinarea numårului xn care corespunde
probabilitå¡ii de nedepå¿ire yn (Såcuiu, Zorilescu, 1978).
¥n continuare, se aplicå procedee de transformare a variabilelor normale
normate în variabile normale oarecare (de medie m ¿i abatere medie påtra-
ticå σ); alte transformåri permit trecerea la variabile cu distribu¡ii asimetrice.
4. Func¡ia de reparti¡ie normalå normatå constituie elementul de plecare
pentru construirea formatului de probabilitate pe care se reprezintå curbele
asimetrice care caracterizeazå fenomenele hidrologice.
Acest format este conceput astfel încât så permitå transformarea curbei în
formå de S a func¡iei de reparti¡ie normale normate într-o linie dreaptå (fig.5.5),
dilatând zona probabilitå¡ilor foarte mari ¿i foarte mici.

Fig. 5.5. Reprezentarea func¡iei de reparti¡ie în format aritmetic (a)


¿i în format de probabilitate (b).

Modul de realizare al acestui format va fi explicat pe baza unui exemplu. Se


cautå un format astfel încât orice curbå din familia:
2
y = f(x) = a + b x (5.27)

så se reprezinte sub forma unei drepte (fig. 5.6).

95
2
Fig. 5.6. Construirea formatului care liniarizeazå curbele y = a + bx :
2
a - schemå de principiu; b - exemplificare pentru curba y = 8 + 0,5 x .

2
Fie, pentru început, func¡ia y = f (x) = x .
Atât pe absciså, cât ¿i pe ordonatå se utilizeazå un format aritmetic sau
cartezian (la intervale egale corespund segmente egale, indiferent de pozi¡ia
acestora pe axå), rezultând curba cu linie plinå din figura 5.6, a.
¥n continuare, fiecårei valori x' = y de pe absciså i se asociazå o valoare:

~
x = f −1( y ) = y , (5.28)

ceea ce reprezintå un alt mod de divizare pentru absciså.


Påstrând vechiul format pentru ordonatå ¿i utilizând noul format pentru
absciså, func¡ia:

( y)
2
~
y = f (~
x) = ~
x2 = = y = x' (5.29)

constituie de fapt func¡ia identicå ¿i deci se reprezintå ca o dreaptå (fig. 5.6,a


curba ~
y = x′).
2
¥n acela¿i format, o curbå de tipul y = f(x) = a + bx devine de asemenea o
dreaptå; într-adevår:

96
( y ) = f ( x') = a + b( x')
2
~
y = f ( x~ ) = f = a + bx' ; (5.30)

rezultå deci o dreaptå de ordonatå la origine a ¿i pantå b.


Fie de reprezentat de exemplu curba:
2
y = f(x) = 8 + 0,5 x .

Dupå cum se observå ¿i din figura 5.6,b, pe formatul ob¡inut anterior, aceastå
curbå se reprezintå sub forma unei drepte.
Procedeul folosit se poate rezuma astfel: se stabile¿te o scarå aritmeticå de
divizare a axei Ox ¿i se trec deasupra axei absciselor valorile yi = f(xi);
corespunzåtor, în dreptul fiecårui punct yi astfel ob¡inut se trece valoarea
~ -1
x = f (y ) , aceste valori constituind noul sistem de divizare a abscisei.
i i
Utilizând aceste grada¡ii pentru absciså ¿i vechiul sistem de divizare pentru
ordonate, curba y = f(x), ca ¿i orice curbå din aceea¿i familie, se reprezintå în
noul sistem de coordonate sub forma unei drepte (M. Shahin, ¿.a., 1993).
Acela¿i procedeu se va folosi ¿i în cazul reparti¡iei normale normate. Fie
graficul reparti¡iei pe care s-au trecut valorile func¡iei (10%, 20%, 30%, etc.),
precum ¿i abscisele corespunzåtoare atât în reprezentare matematicå uzualå
(fig.5.7), cât ¿i în cea utilizatå în hidrologie (fig.5.8).

Fig. 5.7. Func¡ia de reparti¡ie normalå normatå ¿i câteva din valorile ei.

97
Fig. 5.8. Func¡ia de reparti¡ie normalå normatå în reprezentarea hidrologicå.
¥n continuare se utilizeazå un format aritmetic pentru reprezentarea valorilor
yp% (care vor fi trecute deasupra axei); în dreptul acestora, sub absciså se vor
marca probabilitå¡ile (fig. 5.9):
-1
p% = f (yp%)

Fig. 5.9. Construirea formatului de probabilitate.

Valoarea yp% = 0 va fi reprezentatå la mijlocul axei absciselor, acestei valori


particulare corespunzându-i probabilitatea de 50%. Luând ca origine punctul
0,00 se va figura la stânga ¿i la dreapta lui segmentul de valoare -0,253,
respectiv +0,253. Punctele astfel ob¡inute corespund probabilitå¡ii de nedepå¿ire
de 40%, respectiv de 60%. ¥n mod similar, se pozi¡ioneazå punctele -0,524 ¿i
+0,524 corespunzând probabilitå¡ilor de 30%, respectiv 70% etc.
Pe un astfel de format, func¡ia de reparti¡ie F ca ¿i probabilitatea de depå¿ire
c
F a reparti¡iei normale normate (m=0; σ=1) se vor reprezenta sub forma unor
drepte, paralele cu prima, respectiv a doua bisectoare (fig. 5.10).

98
Fig. 5.10. Reprezentarea func¡iei de reparti¡ie normale normate ¿i a curbei
probabilitå¡ilor de depå¿ire pe formatul de probabilitate.

¥n realitate, reparti¡iile normale au parametrii m ¿i σ oarecare; mai mult decât


atât, reparti¡iile sunt definite numai pentru valori pozitive ale variabilei. Ca
urmare, curba probabilitå¡ilor de depå¿ire a unei reparti¡ii normale oarecare este
o dreaptå care se deseneazå doar în primul cadran ¿i a cårei pantå depinde de
mårimea lui σ (fig. 5.11).

Fig. 5.11. Reprezentarea curbei probabilitatilor de depa¿ire a distribu¡iei normale


pe formatul de probabilitate.

99
Proprietatea reparti¡iei normale de a se reprezenta ca o dreaptå pe formatul
de probabilitate poate fi utilizatå pentru testarea ipotezei de normalitate: dacå
curba empiricå a probabilitå¡ilor de depå¿ire se situeazå aproximativ dupå o
dreaptå, poate fi luatå în considerare ipoteza unei reparti¡ii normale.
Dimpotrivå, dacå se manifestå o tendin¡å de curbare a reparti¡iei empirice,
distribu¡ia este asimetricå ¿i deci pentru modelarea statisticå a fenomenului
analizat trebuie utilizatå altå reparti¡ie teoreticå (lognormalå, Pearson III etc.).

5.3. REPARTIºIA LOG-NORMALÅ (LOGARITMIC - NORMALÅ)

Pentru anumite mårimi hidrologice (precipita¡ii, debite) se constatå cå


logaritmii datelor måsurate sunt normal distribui¡i; reparti¡ia acestor variabile va
fi numitå logaritmic normalå sau log-normalå. Aceastå distribu¡ie se realizeazå
atunci când efectul factorilor cauzali este multiplicativ (se reaminte¿te cå la
distribu¡ia normalå este aditiv).
Densitatea de reparti¡ie normalå a logaritmilor valorilor variabilei este:

1 ⎡ 1 ⎛ ln x − µ ⎞ 2 ⎤
ϕ (ln x ) = exp ⎢ − ⎜ n
⎟ ⎥ , (5.31)
σn 2π ⎢⎣ 2 ⎝ σ n ⎠ ⎥⎦

unde µn ¿i σn sunt media, respectiv abaterea medie påtraticå a logaritmilor


valorilor pe care le ia variabila x.
Aceastå reparti¡ie este simetricå (fig. 5.12, b), rezultând din distribu¡ia
asimetricå (fig. 5.12, a) a lui f(x) prin logaritmarea valorilor variabilei.

Fig. 5.12. Trecerea de la o distribu¡ie asimetricå (a) la o reparti¡ie simetricå (b)


prin logaritmarea valorilor variabilei.

100
Se poate pune ¿i problema inverså de a trece de la distribu¡ia simetricå ϕ(lnx)
la distribu¡ia f(x); cu alte cuvinte, se cautå expresia matematicå a densitå¡ii de
reparti¡ie asimetricå f(x).
Probabilitatea elementarå ca variabila så ia valori în cadrul unui interval dat
trebuie så fie aceea¿i în ambele reprezentåri. Se poate scrie deci (V. Yevjevich,
1972):

1 1
f ( x ) ⋅ dx = ϕ (ln x ) ⋅ d(ln x ) = ϕ (ln x ) ⋅ dx = ϕ (ln x ) ⋅ ⋅ dx . (5.32)
x x

Rezultå:

1
f (x) = ϕ (ln x ) . (5.32')
x

Densitatea de reparti¡ie f(x) a distribu¡iei log-normale este definitå numai


pentru valori pozitive ale lui x (x>0) ¿i are expresia:

1 ⎡ 1 ⎛ ln x − µ ⎞ 2 ⎤
f (x) = exp ⎢− ⎜ n
⎟ ⎥ (5.33)
x ⋅ σ n ⋅ 2π ⎢⎣ 2 ⎝ σ ⎠ ⎥
n

Parametrii statistici ai distribu¡iei sunt (V. T. Chow, 1964):

µ = e µn + σ n2 2

( )
12
σ = µ eσn − 1
2

(5.34)
( )
12
σ n2
Cv = e −1

Cs = 3Cv + Cv3

Distribu¡ia f(x) este asimetricå, a¿a cum se vede ¿i din figura 5.13 în care
s-au reprezentat pentru compara¡ie mai multe reparti¡ii log-normale
(V. Yevjevich, 1972).

101
Fig. 5.13. Reprezentarea comparativå a unor reparti¡ii log-normale.

Cazurile reprezentate sunt urmåtoarele:

2
µn = 0 ¿i σn = 0,1; 0,5 ¿i 2,0 (linia plinå),

2
σn = 0,5 ¿i µn = 0; 0,5 ¿i 1,0 (linia punctatå).

Reparti¡ia log-normalå are urmåtoarele proprietå¡i: are ca limitå inferioarå


valoarea zero ¿i este unimodalå (prezintå un singur maxim). Mai trebuie
men¡ionat cå ecua¡ia densitå¡ii de reparti¡ie nu depinde de baza logaritmilor,
aceasta intervenind ca o constantå.
Utilizând un format special: logaritmic pentru ordonate ¿i format de
probabilitate pentru abscise, func¡ia de reparti¡ie pentru distribu¡ia log-normalå
se va reprezenta ca o dreaptå. ¥n cazul unei reparti¡ii empirice, dacå valorile
måsurate se distribuie aproximativ dupå o dreaptå pe acest format, se poate
admite ipoteza reparti¡iei log-normale.
¥n general, o valoare x a unei variabile aleatoare poate fi reprezentatå prin
valoarea medie x la care se adunå o abatere ∆x de la medie (V. T. Chow,
1964):

x p% = x + ∆x p% . (5.35)

102
Mårimea ∆xp% depinde de abaterea medie påtraticå a variabilei ¿i de un
factor de frecven¡å Kp%:
Deci:

∆xp% = σKp% . (5.36)

Se ob¡ine:

x p% = x + σK p% . (5.37)

ºinând seama de faptul cå Cv = σ / x rezultå:

( )
x p% = x 1 + Cv K p% . (5.38)

Valorile factorului de frecven¡å Kp% sunt date în tabelul 5.3 (V. T. Chow,
1964) ¿i sunt exprimate în func¡ie de valorile lui Cs (ales drept parametru), care
la rândul lui se calculeazå în func¡ie de Cv, conform rela¡iei (5.34).
¥n tabel mai sunt trecute ¿i valorile probabilitå¡ii corespunzåtoare valorii
medii a variabilei.
Factorul de frecven¡å este pozitiv pentru probabilitå¡ile de 0,01; 0,1; 5; 20%
etc. ¿i negativ pentru probabilitå¡i mai mari de 50% (fig. 5.14).

Fig. 5.14. Semnifica¡ia factorului de frecven¡å.

103
104
5.4. REPARTIºIILE GAMA

¥n formula densitå¡ii de reparti¡ie a tuturor acestor func¡ii intervine func¡ia


gama a cårei expresie este:

Γ ( α ) = ∫ x α −1e − x dx . (5.39)
0

Convergen¡a integralei este asiguratå pentru α > 0.


Valorile func¡iei gama pentru α cuprins între 1 ¿i 2 sunt date în tabelul 5.4.
Valoarea func¡iei gama pentru α > 2 se poate exprima în func¡ie de valorile
func¡iei pentru α cuprins între 1 ¿i 2.
¥ntr-adevår:
∞ ∞ ∞
Γ (α + 1) = ∫ x α e − x dx = − e − x x α + α ∫ x α −1e − x dx =
0 0 0
(5.40)

α −1 − x
=α∫x e dx = αΓ (α )
0
Tabelul 5.4

Func¡ia gama
x Γ(x) x Γ(x) x Γ(x)
1,00 1,0000 1,34 0,8922 1,68 0,9050
1,02 0,9888 1,36 0,8902 1,70 0,9086
1,04 0,9784 1,38 0,8885 1,72 0,9126
1,06 0,9687 1,40 0,8873 1,74 0,9168
1,08 0,9597 1,42 0,8864 1,76 0,9214
1,10 0,9513 1,44 0,8858 1,78 0,9262
1,12 0,9436 1,46 0,8856 1,80 0,9314
1,14 0,9364 1,48 0,8857 1,82 0,9368
1,16 0,9298 1,50 0,8862 1,84 0,9426
1,18 0,9237 1,52 0,8870 1,86 0,9487
1,20 0,9182 1,54 0,8882 1,88 0,9551
1,22 0,9131 1,56 0,8896 1,90 0,9618
1,24 0,9085 1,58 0,8914 1,92 0,9688
1,26 0,9040 1,60 0,8935 1,94 0,9761
1,28 0,9007 1,62 0,8959 1,96 0,9837
1,30 0,8975 1,64 0,8986 1,98 0,9917
1,32 0,8946 1,66 0,9017 2,00 1,0000

De exemplu: Γ(3,7) = 2,7 ⋅ Γ(2,7) = 2,7 ⋅ 1,7 Γ(1,7) = 2,7 ⋅ 1,7 ⋅ 0,9086.

105
Dacå 0 < α < 1, din rela¡ia (5.40) se ob¡ine:

Γ(α) = 1/α ⋅ Γ(α + 1) (5.41)

De exemplu Γ(0,7)=1/0,7 ⋅ Γ(1,7)


Alte proprietå¡i ale acestei func¡ii sunt urmåtoarele:
∞ ∞
Γ ( 1) = ∫ e − x dx = −e − x =1 . (5.42)
0 0

Dacå numårul α este întreg, rela¡ia de recuren¡å devine:

Γ(n + 1) = n(n-1) ... 2⋅Γ(1) = n! (5.43)

5.4.1. REPARTIºIA Γ1

Reparti¡ia Gama cu 1 parametru (Γ1) este definitå numai pentru valori


nenegative ale lui x (x ≥ 0) ¿i are densitatea de reparti¡ie (fig. 5.15):

1
f ( x;α ) = x α − 1e − x , (5.44)
Γ (α )

unde α este un parametru al formei curbei. Din figura 5.15 (V. Yevjevich,
1972), se constatå cå:
− pentru 0 ≤ α < 1, curba este asimptoticå la amândouå axele;
-x
− pentru α = 1, se ob¡ine o func¡ie exponen¡ialå f(x) = e ;
− pentru α > 1, curba are formå de clopot cu atât mai turtit cu cât α ia
valori mai mari; pentru α > 30, distribu¡ia Gama cu un parametru tinde cåtre
reparti¡ia normalå.

Fig. 5.15. Alura reparti¡iei Γ1 pentru diferite valori ale parametrului α .

106
Parametrii distribu¡iei sunt urmåtorii:

m=α;
2 σ 1
σ =α; σ= α ; Cυ = = ;
m α
2
Cs = = 2Cυ . (5.45)
α

Reparti¡ia Gama cu un parametru, Γ1, nu are aplica¡ii directe în hidrologie,


din cauza flexibilitå¡ii ei reduse. ¥n schimb este utilizatå ca etapå intermediarå în
generarea numerelor aleatoare distribuite asimetric.
Dacå X este o variabilå normal distribuitå luând valorile xi, atunci variabila
Y, cu valorile:

2
1 ⎛ x − m⎞
yi = ⎜ i ⎟ , (5.46)
2⎝ σ ⎠

urmeazå distribu¡ia Γ1, parametrul α fiind egal cu 1/2.


Suma a douå variabile independente distribuite Γ1 cu parametrii α1,
respectiv α2 este distribuitå de asemenea Γ1 cu parametrul α = α1 + α2. Prin
generalizare, suma a n variabile aleatoare independente, urmând reparti¡ia Γ1 cu
parametrii αi (i = 1, 2, ..., n) va urma aceea¿i distribu¡ie Γ1, parametrul α fiind
(V. Yevjevich, 1972):

n
α = ∑αi . (5.47)
i =1

Fie cazul a n variabile independente normal distribuite, care se


standardizeazå cu rela¡ia (5.4).
1 n 2
Variabila ∑ ti va urma legea de reparti¡ie Γ1 (V. Yevjevich, 1972), cu
2 i =1
parametrul:

n n 1 n
α = ∑αi = ∑ = . (5.48)
i=1 i=1 2 2

107
Acest rezultat este util pentru a genera numere aleatoare distribuite Γ1,
plecând de la numere aleatoare cu reparti¡ie normalå.

5.4.2. REPARTIºIA Γ2

Reparti¡ia Gama cu 2 parametri (Γ2) se ob¡ine din reparti¡ia Γ1, înlocuind


variabila independentå x prin x/β. Densitatea de reparti¡ie Γ2 este definitå numai
pentru valori nenegative (x ≥ 0) ale lui x:

1
f ( x; α , β ) = α
x α −1e − x /β . (5.49)
β Γ (α )

Se reaminte¿te cå parametrul de formå α trebuie så fie mai mare decât zero,


pentru a avea asiguratå convergen¡a func¡iei gama. ¥n ceea ce îl prive¿te pe β,
acesta este un parametru de scarå, care este de asemenea pozitiv; pentru β = 1,
se ob¡ine reparti¡ia Γ1. O reprezentare graficå a reparti¡iei Γ2 pentru α constant
(α = 2) se poate urmåri în figura 5.16. Parametrii reparti¡iei sunt (V. Yevjevich,
1972):

1 2
m = αβ ; σ 2 = αβ 2 ; σ = β α ; Cv = ; Cs = = 2C v . (5.50)
α α

Se observå cå Cs = 2Cv în condi¡iile în care originea axelor este aleaså în


punctul în care f(x) = 0.

Fig. 5.16. Densitatea de reparti¡ie Γ2 .

108
Fig. 5.17. Transla¡ia func¡iei Γ2 cu valoarea xmin .

La schimbarea originii axelor de coordonate (ceea ce revine la o transla¡ie de


valoare xmin, fig. 5.17), coeficientul de varia¡ie se modificå, în timp ce
~
C ~
coeficientul de asimetrie este invariant; ca urmare, raportul ~ s ≠ 2 (prin C s ¿i
Cv
~
C v s-au notat parametrii variabilei translatate).
Fie ui = xi + xmin noile valori ale abscisei. Valoarea medie este:

∑ ( x i + x min )
n n
∑ ui
i =1 i =1
u= = = x + x min . (5.51)
n n

Abaterea medie påtraticå a variabilei u (notatå prin σ~ ) este:

∑ ( ui − u ) ∑ ( xi − x )
n 2 n 2

σ~ = i =1
= i=1
=σ . (5.52)
n−1 n−1

~
Noul coeficient de varia¡ie C v , se modificå astfel:

~ 1 σ σ x x
Cv = σ~ = = ⋅ = Cv . (5.53)
u x + x min x x + x min x + x min

109
Coeficientul de asimetrie, dupå cum s-a aråtat este invariant la transla¡ie:

~ 1 n
Cs = ∑ (ui − u ) ⋅ ~ 3 = ∑ ( x i − x ) ⋅ 3 = Cs .
3 1 1 n 3 1
(5.54)
n i=1 σ n i=1 σ

x + x min
Se noteazå cu ρ raportul , care pentru xmin > 0 este evident
x
supraunitar:

ρ>1. (5.55)

Ca urmare:
~
Cs Cs C
~ = 1 =ρ s . (5.56)
Cv Cv Cv
ρ

~ ~
Deoarece Cs /Cv = 2, iar ρ > 1, rezultå C s / C v > 2 pentru xmin > 0.
O formå echivalentå a reparti¡iei Γ2 a fost ob¡inutå de K. Pearson studiind
limitele unor reparti¡ii binomiale asimetrice; în expresia densitå¡ii de reparti¡ie
intervin 3 parametri, dar numai doi dintre ace¿tia sunt independen¡i.
Densitatea de reparti¡ie în forma datå de Pearson (fig. 5.18) este:

a/ d
− x /d ⎛ x⎞
f ( x; f 0 , a , d ) = f 0 e ⎜1+ ⎟ . (5.57)
⎝ a⎠

Nota¡iile au urmåtoarea semnifica¡ie:

fo este ordonata maximå (corespunzåtoare modului);


d - distan¡a dintre medie ¿i mod;
a - diferen¡a dintre mod ¿i xmin (valoarea variabilei pentru care
f(x) = 0).

110
Fig. 5.18. Semnifica¡ia nota¡iilor din forma Pearson III a distribu¡iei Γ2.

Domeniul de valabilitate al func¡iei este cuprins între x = - a ¿i x = +∞


(M. Constantinescu ¿.a., 1956).
Un parametru din forma Pearson III (de regulå fo) poate fi eliminat
impunând condi¡ia ca f(x) så reprezinte o densitate de reparti¡ie (deci suprafa¡a
cuprinså între curbå ¿i axa Ox så fie egalå cu unitatea):

+∞ a/ d
− x /d ⎛ x⎞
∫ f0 e ⎜1+ ⎟ dx = 1 . (5.58)
−∞ ⎝ a⎠

Ca rezultat al integrårii, fo va fi exprimat în func¡ie de ceilal¡i doi parametri:


a ¿i d.
Func¡iile:

1
f ( x; α , β ) = α
x α −1e − x /β (5.59)
β Γ (α )

¿i:

a/ d
⎛ x⎞
f ( x; f 0 , a , d ) = f 0 e − x / d ⎜ 1 + ⎟ (5.59')
⎝ a⎠

reprezintå aceea¿i distribu¡ie Γ2 ¿i amândouå au doar doi parametri


independen¡i. Rela¡iile dintre ace¿ti parametri sunt urmåtoarele:

a
= α −1 . (5.60)
d

111
d=β (5.61)

De aici rezultå:

a =β (α - 1) (5.62)

¿i:

d=β (5.63)

De asemenea, se pot ob¡ine parametrii α ¿i β în func¡ie de a ¿i b:

β=d (5.64)

a a+d
α = 1+ = .
d d

Dupå cum s-a aråtat, curbele de tip Pearson III sunt deosebit de adecvate
pentru studiul reparti¡iei debitelor maxime de pe râurile din România; în general
d ≠ 0, iar asimetria este pozitivå.
Rela¡ia de calcul a debitelor Qp% cu probabilitatea de depå¿ire p% prin
metoda momentelor este similarå cu cea utilizatå la reparti¡ia log-normalå:

(
Qp% = Q 1 + Cv φ p% .) (5.65)

¥n aceastå rela¡ie Q este debitul mediu, Cv coeficientul de varia¡ie, iar φp%


reprezintå abaterile ordonatelor curbei probabilitå¡ilor de depå¿ire fa¡å de medie,
în cazul unei curbe standardizate având Q =1 ¿i Cv =1 (fig. 5.19).

Fig. 5.19. Semnifica¡ia abateriiφp% .

112
113
114
Prin calcule se determinå valoarea medie Q ¿i coeficientul de varia¡ie Cv;
coeficientul de asimetrie se alege în func¡ie de Cν. Valorile φp% sunt date în
tabelul 5.5, în func¡ie de coeficientul de asimetrie Cs ¿i de probabilitatea de
depå¿ire p%. Se reaminte¿te cå reparti¡ia Pearson III este valabilå pentru
Cs > 2Cν (deoarece xmin > 0).
Pentru Cs = 0, curba ob¡inutå este simetricå, reprezentând de fapt ordonatele
probabilitå¡ii de depå¿ire a reparti¡iei normale. Utilizând pentru reprezentare
formatul de probabilitate, reparti¡ia normalå se va desena ca o dreaptå. Pe
acela¿i format, curbele Pearson III având Cs > 0 au o curburå cu atât mai
pronun¡atå, cu cât coeficientul de asimetrie este mai mare.
¥n figura 5.20 se poate urmåri influen¡a parametrilor Cν ¿i Cs asupra curbei
probabilitå¡ilor de depå¿ire: cu linie punctatå s-au figurat situa¡ii în care Cs = 0
(variind Cν), iar cu linie plinå s-au desenat curbe ale probabilitå¡ilor de depå¿ire
pentru valori crescåtoare ale lui Cs, men¡inând Cν constant (Cν = 1).
Metoda momentelor reprezintå un mod de calcul, deosebit de expeditiv, dar
cu o flexibilitate reduså, utilizând valori prestabilite ale raportului Cs /Cv .
O metodå cu performan¡e superioare este metoda celor mai mici påtrate care
conduce direct la evaluarea parametrilor α ¿i β ai densitå¡ii de reparti¡ie. ¥n
continuare, dispunând de valorile lui α ¿i β se poate ob¡ine prin încercåri
debitul Qp% care corespunde unei probabilitå¡i p% date; acest debit reprezintå
limita inferioarå de integrare a densitå¡ii de reparti¡ie f(x; α, β ):
+∞
∫ f ( x; α , β ) dx = p% . (5.66)
Qp %

5.4.3. REPARTIºIA Γ3

Reparti¡a Gama cu 3 parametri (Γ3) se ob¡ine dacå în reparti¡ia Γ1 se


x −γ
înlocuie¿te x prin :
β

α − 1 − ( x −γ ) / β
f ( x; α , β , γ )= (x − γ )
1
α
e , (5.67)
β Γ (α )
unde:

115
α este parametrul de formå;
β - parametrul de scarå;
γ - limita inferioarå a valorilor distribu¡iei: 0 ≤ γ ≤ x <∞ (γ ≠ 0).
Schimbarea de variabilå y=x-γ reduce distribu¡ia Γ3 la Γ2, iar rela¡ia
z = (x -γ)/β transformå repati¡ia Γ3 în Γ1. Transformårile inverse sunt utilizate în
procedeele de generare a numerelor aleatoare, pentru a ob¡ine din variabile
aleatoare independente distribuite Γ1 variabile cu reparti¡ia Γ2 sau Γ3.
O reparti¡ie Γ triparametricå a fost ob¡inutå de S. N. Kri¡ki ¿i M. F. Menkel
b
din distribu¡ia Pearson III printr-o transformare de tipul u = ax .
Curbele binomiale-exponen¡iale Kri¡ki-Menkel sunt valabile pentru orice
raport Cs /Cν (se reaminte¿te cå în cazul reparti¡iei Pearson III Cs > 2Cν);
densitatea de reparti¡ie este (Manoliu, Roman, 1983):
γ-1 -u
f(u) = u e / Γ(γ) , (5.68)

unde:

⎛ Γ (γ + b ) x ⎞
1
b
u = ⎜⎜ ⋅ ⎟⎟ . (5.69)
⎝ Γ (γ ) m ⎠

Cei trei parametri ai reparti¡iei sunt: γ, b ¿i m; parametrul m este chiar


valoarea medie a reparti¡iei.
Din cauza expresiei foarte complicate a densitå¡ii de reparti¡ie, ace¿ti
parametri nu pot fi exprima¡i direct în func¡ie de datele empirice. ¥n aceste
condi¡ii ordonatele teoretice ale curbei probabilitå¡ilor de depå¿ire sunt tabelate
pentru anumite situa¡ii particulare ( Q = 1 ¿i valori precizate ale raportului
Cs /Cν).
Pentru utilizarea practicå a acestor tabele, trebuie ca pe baza datelor empirice
så se evalueze coeficientul de varia¡ie ¿i coeficientul de asimetrie (calculul are
la bazå metoda momentelor).
Dupå determinarea lui Cs ¿i Cν , ordonatele teoretice cu diverse probabilitå¡i
de depå¿ire p% se ob¡in cu rela¡ia:

Q p% = Q k p% , (5.70)

unde kp% reprezintå coeficien¡i modul, tabela¡i de Kri¡ki-Menkel, ¿i care sunt


defini¡i în func¡ie de raportul Cs /Cν de valoarea lui Cν ¿i de probabilitatea de
depå¿ire p% (tab. 5.6).

116
117
118
119
120
121
122
123
Fåcând compara¡ia cu rela¡ia:

( )
Q p% = Q 1 + Cv φ p% ,

utilizatå la reparti¡ia Pearson III, rezultå cå mårimea kp% joacå acela¿i rol ca
factorul 1 + Cν φp%.
Cu alte cuvinte, coeficien¡ii modul reprezintå înså¿i ordonatele curbei pro-
babilitå¡ilor de depå¿ire pentru o reparti¡ie Kri¡ki-Menkel având valoarea medie
unitarå (fig. 5.21).

Fig. 5.21. Interpretarea coeficien¡ilor modul.

¥n cazul în care raportul Cs /Cν = 2, ordonatele curbei probabilitå¡ilor de


depå¿ire sunt acelea¿i, indiferent dacå s-au folosit curbele Kri¡ki-Menkel sau
Pearson III; cu alte cuvinte, în acest caz particular, valorile kp% ¿i (1 + Cν φp%)
sunt egale.
¥n general înså, în zona probabilitå¡ilor mici, curbele Kri¡ki-Menkel conduc
la calcule mai acoperitoare (valori ale debitelor maxime mai mari pentru o
probabilitate datå ¿i pentru acela¿i Cν ¿i Cs) fa¡å de reparti¡ia Pearson III
(Diaconu, Låzårescu, 1977). Diferen¡e sensibile între cele douå curbe se
înregistreazå de asemenea în cazul unor coeficien¡i de varia¡ie mari.
ªi în cazul reparti¡iei Kri¡ki-Menkel, utilizarea metodei celor mai mici
påtrate permite o determinare rapidå a parametrilor cu condi¡ia de a dispune de
un program de calcul adecvat; în lipsa acestuia calculele pot fi efectuate, în mod
expeditiv, utilizând procedeul expus anterior.

124
5.4.4. CORECºIA DE SIGURANºÅ ∆QP%

Debitele maxime teoretice cu probabilitatea de depå¿ire p% (notate prin


Qp%) calculate conform metodologiei expuse în paragrafele 5.3, 5.4.2 ¿i 5.4.3
sunt utilizate pentru dimensionarea unor lucråri hidrotehnice (evacuatori de ape
mari la baraje, alegerea înål¡imii batardourilor ¿i a diametrului galeriilor de
deviere a apelor în faza de construc¡ie, stabilirea cotei digurilor de apårare
împotriva inunda¡iilor etc.)
Subevaluarea mårimii debitului Qp% ar avea, consecin¡e foarte grave; se
apreciazå cå circa 20% din accidentele înregistrate la baraje în exploatare se
datoresc subdimensionårii descårcåtorilor de ape mari.
Ca urmare, pentru construc¡ii din clasa I, II, III de importan¡å, stabilite
conform STAS 4273-80, la debitele maxime corespunzåtoare probabilitå¡ilor de
verificare se adaugå o corec¡ie de siguran¡å ∆Qp% evaluatå cu formula
(C. Mociorni¡a ¿.a., 1979, M. Constantinescu ¿.a., 1956):

a E p%
∆Qp% = Qp% . (5.71)
n

Fig. 5.22. Valorile coeficientului de corec¡ie Ep%.

125
¥n aceastå rela¡ie:
Qp% este debitul cu probabilitatea de depå¿ire p%;
a - un factor care ¡ine cont de calitatea observa¡iilor ¿i are urmåtoarele
valori:
a = 0,70 pentru râurile care se gåsesc în regiuni bine studiate
din punct de vedere hidrologic;
a = 0,50 pentru fluviul Dunårea;
a = 1,00 pentru râurile din zone slab studiate din punct de
vedere hidrologic.
Ep% - un factor de corec¡ie care depinde atât de valoarea coeficientului de
varia¡ie Cv, cât ¿i de probabilitatea de calcul p%.
Valorile corec¡iei Ep% se ob¡in din figura 5.22 (C. Mociorni¡a ¿.a., 1979).
Mai trebuie men¡ionat cå valoarea corec¡iei ∆Qp% nu trebuie så depå¿eascå
20% din valoarea debitului la care se aplicå.

5.5. REPARTIºIA GUMBEL

Spre deosebire de reparti¡iile analizate pânå în prezent, care erau definite


prin densitatea f(x), în acest caz distribu¡ia este exprimatå sub forma func¡iei de
reparti¡ie, datoritå simplitå¡ii acesteia:

⎧⎪ ⎡ − ( a + x ) ⎤ ⎫⎪
F( x; a, c) = Pr ob ( X < x ) = exp ⎨exp ⎢ ⎥⎬ (5.72)
⎪⎩ ⎢⎣ c ⎥⎦ ⎪⎭

unde x ∈ (-∞, +∞); a ¿i c sunt parametrii distribu¡iei ¿i pot fi evalua¡i prin


metoda momentelor (V. T. Chow, 1964):

a=γc-m;

6
c= σ . (5.73)
π

Constanta lui Euler are valoarea γ = 0,57721; m ¿i σ sunt: valoarea medie,


respectiv abaterea standard. Coeficientul de asimetrie Cs este constant:
Cs = 1,139.

126
Prin transformarea y = (a + x)/c, se ob¡ine:
−y
F( x ) = e −e . (5.74)

Dezvoltând aceastå expresie în serie de puteri ¿i neglijând termenii de


ordinul 2, rezultå:

F( x ) ≅ 1 − e − y , (5.75)

care constituie o expresie aproximativå pentru func¡ia de reparti¡ie.


Considerând func¡ia:
−y
F( x ) = e −e . (5.76)

prin dublå logaritmare se ob¡ine rela¡ia liniarå:

1
c
( x + a) = − ln[− ln F( x )] . (5.77)

Deci o scarå dublu logaritmicå pe absciså ¿i o scarå cartezianå pentru


ordonatå vor conduce la o distribu¡ie liniarizatå (V. Yevjevich, 1972).
Gumbel a utilizat primul aceastå reparti¡ie pentru studiul probabilistic al
debitelor de viiturå; distribu¡ia Gumbel conduce înså, pentru probabilitå¡i de
depå¿ire p% reduse, la valori Qp% mai mici decât cele ob¡inute prin utilizarea
reparti¡iei Pearson III sau Kri¡ki - Menkel ¿i din acest motiv este mai pu¡in
folositå.

5.6. REPARTIºII STATISTICE AUXILIARE

Aceste reparti¡ii nu sunt folosite ca modele ale distribu¡iei unor variabile


hidrologice, ci pentru verificarea ipotezelor statistice sau pentru ob¡inerea
intervalelor de încredere pentru media sau dispersia teoreticå (J.W. van der
Made, 1987).
2
• Reparti¡ia χ (hi - påtrat). Dacå X1, X2, ..., Xn sunt variabile aleatoare
independente, normale, normate, atunci suma påtratelor variabilelor Xi
2
reprezintå o variabilå aleatoare, notatå prin χ :

χ 2 = X 12 + X 22 +...+ X n2 . (5.78)

127
2
Densitatea de reparti¡ie a distribu¡iei χ cu n grade de libertate este definitå
numai pentru valori nenegative ale lui x:

n x
−1 −
f ( x; n) =
1
x e 2
2 . (5.79)
Γ ⎛⎜ ⎞⎟
n/ 2 n
2
⎝ 2⎠

Numårul gradelor de libertate reprezintå numårul valorilor variabilei ale


cåror probabilitå¡i de realizare sunt independente.
2
Distibu¡ia χ este de tip continuu, fiind definitå pentru orice valoare din
intervalul [0, +∞).
Argumentul x rezultând ca o sumå de påtrate, va fi notat în continuare prin
2 2
χ ; func¡iile f(x) sau f(χ ) sunt asimetrice pentru valori mici ale lui n, tinzând
cåtre reparti¡ia normalå pe måsurå ce n cre¿te (fig. 5.23).

2
Fig. 5.23. Densitatea de reparti¡ie ¿i func¡ia de reparti¡ie a distribu¡iei χ .

Media reparti¡iei este n, iar dispersia este egalå cu 2n.


¥n practicå, pentru verificarea ipotezelor statistice, prezintå interes func¡ia de
c 2
probabilitate complementarå F (χ ):

( ) (
F c χ 2 = Pr ob χ 2 ≥ χα2 = α . ) (5.80)

c 2
¥n rela¡ia de defini¡ie a lui F (χ ), valoarea a reprezintå o probabilitate care
se nume¿te prag de semnifica¡ie; valorile uzuale ale lui α sunt: α = 0,01; 0,05 ¿i
0,10 (Iliescu, Vodå, 1977). Mårimea χ α2 (notatå ¿i prin χ 02 sau χ cr2 ) se mai
2
nume¿te punct critic ¿i reprezintå acea valoare a variabilei χ a cårei
probabilitate de depå¿ire este α (fig. 5.24).

128
129
2
Fig. 5.24. Semnifica¡ia punctului critic în distribu¡ia χ .

Valorile punctului critic χ 02 sunt tabelate în func¡ie de numårul de grade de


libertate ¿i de probabilitatea α de a fi depå¿ite (tab. 5.7).
2
Reparti¡ia χ este de asemenea utilizatå în definirea unor intervale de
încredere. Aceste intervale con¡in cu o probabilitate (1 - α) valoarea adevåratå a
parametrului; probabilitatea ca valoarea teoreticå så se gåseascå în afara
intervalului ( χ min
2
; χ max
2
) este deci egalå cu α (aria ha¿uratå din fig. 5.25).

( )
Fig. 5.25. Interval de încredere χ min , χ max .
2 2

2
Reparti¡ia χ intervine în definirea altor douå distribu¡ii auxiliare; reparti¡ia t
(sau Student) a lui Gosset ¿i reparti¡iile Z ¿i F ale lui Fischer.
• Reparti¡ia t (Student). Dacå X ¿i Y sunt douå variabile aleatoare
independente, X urmând o reparti¡ie normalå de medie 0 ¿i abatere medie
2
påtraticå σ, iar Y o reparti¡ie χ , cu n grade de libertate, atunci variabila
aleatoare:

x
t= (5.81)
y/n

130
urmeazå o reparti¡ie Student cu n grade de libertate. Variabila t este continuå
¿i apar¡ine intervalului (-∞, +∞), iar densitatea ei de reparti¡ie este:

⎛ n + 1⎞
Γ⎜ ⎟ −
n+ 1
⎝ 2 ⎠⎛ t2 ⎞ 2
f (t; n) =
1
⋅ ⎜1 + ⎟ . (5.82)
nπ ⎛ n⎞
Γ⎜ ⎟ ⎝
n⎠
⎝ 2⎠

Aceastå func¡ie este simetricå: f(-t)= f(t) ¿i F(-t)= 1 - F(t); când numårul
gradelor de libertate cre¿te foarte mult, reparti¡ia t tinde cåtre reparti¡ia normalå.
Valorile t, corespunzåtoare unei probabilitå¡i de depå¿ire α sunt de asemenea
tabelate (Panaite, Munteanu, 1982; Moineagu ¿.a., 1976).
• Reparti¡ia F a lui Fisher-Snedecor. Dacå Y1 ¿i Y2 sunt douå variabile
2
aleatoare independente, urmând amândouå o reparti¡ie χ cu n1, respectiv n2
grade de libertate, atunci raportul:

y1 / n1
x= , x>0. (5.83)
y 2 / n2

reprezintå o variabilå aleatoare care are densitatea de reparti¡ie:

⎛ n + n2 ⎞
n1n1 / 2 ⋅ n2n2 / 2 ⋅ Γ ⎜ 1 ⎟ n
⎝ 2 ⎠ 21 − 1 n +n
f ( x; n1 , n2 ) = ( n2 + n1 x ) 2 .
− 1 2
x (5.84)
⎛n ⎞ ⎛n ⎞
Γ⎜ 1⎟ ⋅Γ⎜ 2⎟
⎝ 2⎠ ⎝ 2⎠

Aceastå densitate de reparti¡ie define¿te distibu¡ia F a lui Fisher cu n1 ¿i n2


grade de libertate; aceastå reparti¡ie este, de asemenea, tabelatå (Panaite,
Munteanu, 1982; Moineagu ¿.a., 1976).

131
6. INTERVALE DE ¥NCREDERE

Valorile teoretice ale parametrilor reparti¡iilor statistice sunt estimate în


func¡ie de valorile de selec¡ie (x1, x2, ..., xn ) prin diverse metode (metoda
momentelor, metoda verosimilitå¡ii maxime sau metoda celor mai mici påtrate).
Valorile teoretice astfel calculate au un caracter punctual; în acela¿i timp,
valorile rezultate depind de volumul selec¡iei. Este evident cå, cu cât volumul
selec¡iei va fi mai mare, cu atât estima¡iile punctuale ale parametrilor se apropie
din ce în ce mai mult de valorile reale ale parametrilor popula¡iei.
Cu alte cuvinte, fiecare parametru determinat pe baza unei selec¡ii aleatoare
este el însu¿i o variabilå aleatoare, a cårei distribu¡ie depinde de volumul
selec¡iei.
O metodå de evaluare a valorii teoretice, care så ¡inå seama ¿i de volumul
selec¡iei, constå în definirea unui interval de încredere care så con¡inå (cu o
anumitå probabilitate) valoarea teoreticå a parametrului estimat pe bazå de
måsuråtori.
Se noteazå cu (1-α) coeficientul de încredere sau probabilitatea apartenen¡ei
la interval; α reprezintå deci probabilitatea ca parametrul så se gåseascå în afara
intervalului estimat. Evident, α trebuie så fie cât mai redus (de obicei calculul se
efectueazå considerând α = 1% sau 5%).
Stabilirea intervalului de încredere constituie o opera¡ie ulterioarå evaluårii
punctuale a parametrilor. ¥n mod uzual se stabilesc intervale de încredere pentru
media ¿i dispersia teoreticå.
2
• Interval de încredere pentru media teoreticå. Fie m ¿i σ media,
2
respectiv dispersia teoreticå, iar x ¿i s media, respectiv dispersia de selec¡ie.
Media de selec¡ie x este o variabilå aleatoare, având:
− media M( x ) = m .
(6.1)
2 σ 2
− dispersia D ( x )= .
n
Se poate aråta ca media m este cuprinså în intervalul:

⎛ s ⎞
⎜ x − z (α ) ; x + z (α )
s
⎟ , (6.2)
⎝ n n⎠

132
unde z(a) se determinå, dupå cum se va aråta în continuare, din tabelele
reparti¡iei normale sau Student, func¡ie de volumul n al selec¡iei.
Se va nota prin U, valoarea normatå a mediei de selec¡ie:

x − M( x ) x−m
U= = , (6.3)
D2 ( x) σ n

2
unde pentru M( x ), ¿i D ( x ) s-au utilizat expresiile (6.1), respectiv (6.2).
Se considerå intervalul (-z, z) simetric în raport cu originea, care con¡ine
variabila normatå U cu o probabilitate egalå cu 1-α:

Prob ( |U| < z ) = 1 - α . (6.4)

Referitor la distribu¡ia variabilei U, se disting urmåtoarele cazuri (Dinescu,


Såvulescu, 1978):
a) Pentru un volum mare al selec¡iei (n > 30), variabila U are o reparti¡ie
normalå (indiferent care este reparti¡ia variabilei teoretice); proprietatea se
2
men¡ine ¿i în cazul în care σ este necunoscutå fiind estimatå prin dispersia de
2
selec¡ie s .
Se reaminte¿te cå în cazul reparti¡iei normale normate se poate scrie:

Prob ( |U| < z ) = Prob (-z < U < z) = Φ(z) - Φ(-z) =

= Φ(z) - (1 - Φ(z)) = 2Φ(z) - 1 (6.5)

Deci:
2Φ(z) - 1 = 1 - α (6.6)

sau:
α
Φ( z ) = 1 − . (6.6')
2

¥n aceastå ecua¡ie, probabilitatea (1 - α) a apartenen¡ei la interval este


cunoscutå, fiind fixatå apriori; din tabelul func¡iei lui Laplace rezultå imediat
necunoscuta z(α).
Astfel, pentru 1 - α = 90% rezultå z = 1,64 ;
1 - α = 95% z = 1,96 ;
1 - α = 99% z = 2,58 .

133
b) Pentru un volum redus al selec¡iei (n < 30), dacå reparti¡ia variabilei este
2 2
normalå, iar dispersia σ este aproximatå prin s , variabila U are o reparti¡ie
Student cu (n - 1) grade de libertate.
Reparti¡ia Student este tabelatå cu ajutorul func¡iei complementare
c
F (z)=1-F(z). Prin urmare, marginile intervalului (-z, +z) corespunzåtoare
coeficien¡ilor de încredere (1 - α) se determinå prin rezolvarea ecua¡iei:

Prob ( |U| < z ) = α , (6.7)

unde variabila U urmeazå o repati¡ie Student cu n-1 grade de libertate.


¥n continuare se dau orientativ valorile z(α) corespunzåtoare lui (1-α)=95%,
respectiv 99% pentru grade de libertate cuprinse între 11 ¿i 30.

Tabelul 6.1

n-1 11 12 13 14 15 16 17 18 19 20
1-α
1-α=95% 2,201 2,179 2,160 2,144 2,131 2,120 2,110 2,100 2,093 2,086
1-α=99% 3,106 3,054 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845

n-1 21 22 23 24 25 26 27 28 29 30
1-α
1-α=95% 2,080 2,074 2,069 2,064 2,059 2,055 2,052 2,048 2,045 2,042
1-α=99% 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750

Dupå determinarea valorilor z = z(α), intervalul de încredere pentru media


teoreticå rezultå imediat:

x−m
− z (α ) < < z (α ) (6.8)
σ n

sau, aproximând dispersia teoreticå prin dispersia de selec¡ie, rezultå a¿a cum
s-a aråtat deja:

s s
x − z (α ) < m < x + z (α ) . (6.9)
n n

• Interval de încredere pentru dispersia teoreticå. Ca estimator punctual al


2
dispersiei teoretice σ se va utiliza dispersia de selec¡ie:

134
∑ ( xi − x ) .
1 n 2
s2 = (6.10)
n − 1 i=1

Dispersia de selec¡ie este o variabilå aleatoare (Dinescu, Såvulescu, 1978)


având:

− ( ) ⎛
media M s 2 = σ 2 ⎜ 1 −

1⎞
⎟ ≈σ ;
n⎠
2
(6.11)

(pentru n suficient de mare media acestui estimator este egalå cu dispersia


teoreticå);

m4 − σ 4
− ( )
dispersia D 2 s 2 ≈
n
. (6.12)

Presupunând în plus cå reparti¡ia dispersiei de selec¡ie este normalå,


4
momentul centrat de ordinul patru m4 = 3σ ¿i deci:

( )
D2 s 2 ≈
2 4
n
σ . (6.13)

Intervalul de încredere pentru dispersia teoreticå se calculeazå cu rela¡ia


(Dinescu, Såvulescu, 1978):

(n − 1)s 2 < σ 2 < (n − 1)s 2 . (6.14)


χ max
2
χ min
2

Dacå coeficientul de încredere (1-α) este foarte apropiat de 1 (probabilitatea


α% este micå), cele douå suprafe¡e ha¿urate din figura 5.26 pot fi presupuse
egale, fiecare având o probabilitate egalå cu α/2.
Marginea inferioarå ¿i superioarå a intervalului de încredere rezultå deci din
rezolvarea ecua¡iilor:
α
(
Pr ob χ 2 > χ max
2
= ) 2
; (6.15)

α
(
Pr ob χ 2 > χ min
2
)
= 1−
2
. (6.16)

135
De exemplu, pentru α = 5% ¿i un numår de grade de libertate cuprins între 9
¿i 20, marginile χ min
2
¿i χ max
2
au urmåtoarele valori (tab. 6.2):

Tabelul 6.2

n-1 9 10 11 12 13 14 15 16 17 18 19 20
2
χ
χ min
2 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,81 7,56 8,23 8,91 9,59
χ 2
max
19,00 20,50 21,90 23,30 24,70 26,10 27,50 28,80 30,20 31,30 32,90 34,20

2
Dupå ob¡inerea lui χ min
2
¿i χ max
2
¿i evaluarea dispersiei de selec¡ie s ,
2
intervalul care con¡ine cu probabilitatea (1 - α) valoarea adevåratå σ a
dispersiei se calculeazå cu rela¡ia (6.14).
• Interval de încredere pentru abaterea standard. Abaterea standard, la fel
ca ¿i dispersia din care derivå, este de asemenea o variabilå aleatoare.
Valoarea medie a acestei variabile este (V. Yevjevich, 1972):

M(s) = σ , (6.17)

iar dispersia:

m4 − σ 4
D2 ( s) = . (6.18)
4 nσ 2

Admi¡ând cå abaterea standard de selec¡ie este normal distribuitå


4
(deci m4=3σ ), se pot utiliza urmåtoarele expresii simplificate:

M(s) = σ (6.17')

σ2
D2(s) = . (6.18')
2n

Intervalul de încredere pentru abaterea standard de selec¡ie va fi deci:

s − z (α ) ⋅ s / 2n < σ < s + z (α ) ⋅ s / 2n . (6.19)

De cele mai multe ori în hidrologie intereseazå intervalele de încredere


pentru doi sau trei parametri simultan (adicå pentru to¡i parametrii din
distribu¡iile hidrologice uzuale).

136
Fig. 6.1. Elipsa de încredere pentru parametrii m ¿i σ.

¥n acest caz vor fi definite regiuni de încredere: pentru doi parametri rezultå
o elipså, iar pentru trei parametri un elipsoid de încredere (V. Yevjevich, 1972).
Cu alte cuvinte zona de încredere nu este un dreptunghi sau un paralelipiped
construit prin limitele intervalelor de încredere al fiecårui parametru ci are o
extindere mai restrânså. O exemplificare pentru cazul a doi parametri (m ¿i σ) se
poate urmåri în figura 6.1.

137
7. VERIFICAREA IPOTEZELOR STATISTICE

O problemå importantå în hidrologie o constituie determinarea probabilitå¡ii


de depå¿ire a debitelor maxime anuale; poate fi necesarå de asemenea reparti¡ia
nivelurilor sau a debitelor minime dintr-o anumitå sec¡iune.
¥n toate aceste situa¡ii intereseazå care este reparti¡ia teoreticå cea mai
adecvatå datelor din observa¡iile empirice. Ca urmare, se propune o anumitå
ipotezå statisticå (de exemplu o reparti¡ie de tip log-normalå), urmând ca pe
baza unui test statistic aceastå ipotezå så fie confirmatå sau respinså. Acceptarea
sau respingerea unei ipoteze statistice are un caracter probabilistic ¿i nu implicå
siguran¡å absolutå (certitudine sau probabilitate de 100%).
¥n limbaj statistic, ipoteza ini¡ialå (care trebuie testatå) se nume¿te ipoteza
nulå ¿i se noteazå prin H0.
Erorile care se fac în verificarea ipotezelor statistice sunt de douå tipuri
(B. Bobée, 1991):
a) respingerea ipotezei H0 când ea este adevåratå; riscul acceptat al acestei
situa¡ii notat prin α are în mod uzual valori reduse: α = 0,01 ; 0,05 sau 0,10;

α = Prob (respingere H0⏐H0 adevåratå) , (7.1)

b) acceptarea ipotezei H0 când ea este falså; riscul respectiv se noteazå


prin β:

β = Prob (acceptare H0⏐H0 falså) . (7.2)

Probabilitatea α se nume¿te pragul de semnifica¡ie al testului, iar 1-β


(probabilitatea de respingere a lui H0 când ea este falså) puterea testului.
Cele mai utilizate teste statistice în hidrologie sunt urmåtoarele (Cicioni ¿.a.,
1984): hi - påtrat, Kolmogorov - Smirnov ¿i Cramer - Von Mises.
2
• Testul hi - påtrat (χ ). Fie un numår de n valori ob¡inute din înregistråri
(niveluri de exemplu pentru construirea graficului de frecven¡å ¿i duratå).
Aceste date se grupeazå într-un numår de k intervale; se noteazå cu ni numårul
de valori din intervalul i.

138
Evident, este verificatå rela¡ia:
n1 + n2 + ... +nk = n , (7.3)

unde ni reprezintå frecven¡e absolute empirice (numårul de apari¡ii ale


variabilei în cadrul fiecårui interval). ¥n acela¿i timp, numårul de grade de
libertate ale variabilei este k-1 (numårul intervalelor minus unu); cu alte cuvinte
cunoscând k-1 valori ale lui ni, valoarea nk rezultå din rela¡ia (7.3).
Se presupune cå variabila empiricå urmeazå o anumitå reparti¡ie teoreticå
(sugeratå eventual ¿i de reprezentarea graficå a datelor din måsuråtori).
Pentru fiecare claså (interval) i se poate calcula probabilitatea teoreticå pi a
apartenen¡ei la acel interval. Dacå xi-1 ¿i xi sunt marginile intervalului, pi se va
ob¡ine cu una din rela¡iile:
xi
pi = ∫ f ( x )dx (7.4)
xi − 1

sau:

pi = F(xi) - F(xi-1) . (7.5)

Pentru orice reparti¡ie teoreticå, f(x) sau F(x) sunt cunoscute ¿i deci evaluarea
lui pi nu ridicå probleme. Cunoscându-l pe pi se pot calcula imediat frecven¡ele
absolute teoretice ale fiecårui interval, acestea fiind reprezentate de produsul npi
Abaterile ni - npi dintre frecven¡ele absolute teoretice ¿i cele empirice
reprezintå o variabilå aleatoare; se poate demonstra cå variabila auxiliarå:

k ( ni − np i ) 2
χ calculat
2
= χ c2 = ∑ =
i=1 npi
(7.6)
( n1 − np 1 ) 2 (n2 − np 2 ) 2 ( n − np k ) 2
= + +...+ k
np1 np2 npk

2
urmeazå la limitå o reparti¡ie χ . Numårul de grade de libertate al acestei
variabile nu este, înså, k - 1, ci k - λ - 1, unde λ reprezintå numårul parametrilor
reparti¡iei teoretice, care au fost estima¡i cu ajutorul datelor din måsuråtori.

139
2
Variabila χ c2 urmeazå deci o reparti¡ie χ cu ν = k - λ - 1 grade de libertate.
2
Pentru un numår ν dat de grade de libertate din tabelele reparti¡iei χ se poate
determina valoarea χ ν2,α (sau χ c2 ) corespunzåtoare pragului de semnifica¡ie α
2
ales; χ ν2,α reprezintå valoarea χ cu ν grade de libertate ¿i a cårei probabilitate
de depå¿ire este α (fig. 5.23).
Ipoteza statisticå propuså este acceptatå dacå χ calculat
2
< χ ν2,α (concordan¡a
între reparti¡ia teoreticå propuså ¿i cea empiricå este bunå) ¿i este respinså dacå:
χ calculat
2
> χ ν2,α .
Fie de exemplu cazul unor niveluri hidrologice la care domeniul de varia¡ie a
fost împår¡it în 11 clase; se testeazå ipoteza distribu¡iei normale (λ=2, deoarece
doi parametri: m ¿i σ sunt estima¡i pe baza datelor din måsuråtori). Numårul de
2
grade de libertate este : ν = 11 - 2 - 1 = 8; variabila χ cu 8 grade de libertate ¿i
un prag de semnifica¡ie de 1% are valoarea χ 2
8; 1% = 20,1.
Presupunând cå χ calculat
2
= 18, ipoteza normalitå¡ii poate fi acceptatå,
deoarece χ calculat
2
< χ 2
8; 1% .

¥mpår¡irea în clase de echivalen¡å egale a domeniului de varia¡ie al variabilei


presupune existen¡a unui numår mare de valori din måsuråtori (cel pu¡in câte 5
în fiecare claså - Dinescu, Såvulescu, 1978); aceastå situa¡ie se întâlne¿te mai
rar în hidrologie.
¥n cazul în care n < 30 se recurge (Cicioni ¿.a., 1984) la împår¡irea în clase
de probabilitå¡i empirice egale, probabilitatea fiecårei clase fiind egala cu 1/k
(unde k este numårul intervalelor). ¥n acest caz intervalele corespunzåtoare
cårora li se calculeazå probabilitå¡ile teoretice nu mai sunt egale; marginile
intervalelor sunt: xi-(xi-xi-1)/2, respectiv xi+(xi+1-xi)/2.
*
• Testul Kolmogorov - Smirnov. Fie F (x) func¡ia de reparti¡ie empiricå a
celor n date ob¡inute pe bazå de måsuråtori ¿i F(x) func¡ia de reparti¡ie teoreticå
propuså pentru aproximarea distribu¡iei empirice.
Se noteazå cu d valoarea maximå a diferen¡ei dintre valorile celor douå
func¡ii:

d = max F * ( x ) − F( x ) , (7.7)
*
unde F (x) este calculat cu formula i/(n+1).
Conform teoremei lui Kolmogorov:

⎛ λ ⎞
Pr ob ⎜ d ≤ ⎟ = 1 − α = K( λ ) . (7.8)
⎝ n⎠

140
unde:

+∞
λ
K ( λ ) = ∑ ( −1) k e − 2 k
2 2
, (7.9)
−∞

iar λ este un numår real care depinde de valoarea aleaså pentru pragul de
semnifica¡ie α: λ=λ(α).
Func¡ia K(λ) se calculeazå conform rela¡iei (7.9) ¿i este tabelatå; ca urmare
pentru un prag de semnifica¡ie α ales rezultå imediat λ.

De exemplu: pentru α = 1% → K(λ) = 0,99


λ = 1,63 ; →
α = 5% → K(λ) = 0,95
λ = 1,36 ; →
α = 10% → K(λ) = 0,90
λ = 1,23 . →
Cu λ astfel determinat se calculeazå raportul λ / n ; dacå d < λ / n se
acceptå ipoteza concordan¡ei dintre reparti¡ia teoreticå ¿i cea empiricå; în caz
contrar, ipoteza este respinså.
• Testul Cramer - von Mises. ªi în acest caz se calculeazå abaterile dintre
valorile func¡iei de reparti¡ie empirice ¿i cele ale unei reparti¡ii teoretice
propuse. Se noteazå cu C aceastå variabilå aleatoare, definitå ca o integralå
Stieltjes:

[ F ( x ) − F ( x )]
+∞ 2
C= ∫ *
df ( x ) . (7.10)
−∞

¥n practicå se folose¿te o rela¡ie mai comodå pentru calcule (Cicioni ¿.a.,


1984):

2
1 n ⎡ 2i − 1⎤
Ccalculat = +∑ ⎢⎣ F ( x i − 2n ⎥⎦ . (7.11)
12n i = 1

Variabila C este distribuitå dupå legea definitå de Anderson-Darling în anul


1952. Valorile cele mai des utilizate ale lui C1−α sunt:

α = 1% C0,99 = 0,743

α = 5% C0,95 = 0,461
α = 10% C0,90 = 0,347

141
Ipoteza H0 este acceptatå dacå Ccalculat ≤ C1−α ¿i este respinså în caz contrar.
2
Cele trei teste prezentate (χ , Kolmogorov - Smirnov ¿i Cramer von Mises)
au fost utilizate comparativ pentru verificarea ipotezelor statistice privind
debitele maxime anuale la circa 108 sta¡ii hidro (Cicioni ¿.a., 1984) ¿i perioade
cuprinse între 27 ¿i 46 de ani. Pragul de semnifica¡ie α a fost considerat de 5%
2
¿i 10%. Cea mai mare satisfac¡ie a oferit testul χ , iar dintre reparti¡iile
2
examinate distribu¡ia lognormalå cu 2 parametri. Testele χ , Kolmogorov -
Smirnov ¿i Cramer von Mises pot fi aplicate indiferent de ipoteza privind tipul
reparti¡iei statistice teoretice.
Existå o serie de alte teste (Lilliefors, Massey, Shapiro Wilk, D'Agostino
etc.), utilizabile numai pentru verificarea ipotezei de normalitate ¿i care pot fi
aplicate chiar în cazul unui numår mai mic de valori. Evident, pentru aplicarea
acestor teste valorile variabilelor trebuie simetrizate prin logaritmare.
• Teste pentru analiza omogenitå¡ii hidrologice. Deducerea unor rela¡ii de
sintezå este posibilå numai pe zone omogene din punct de vedere hidrologic.
Pentru testarea ipotezei de omogenitate se poate folosi testul F (care utilizeazå
reparti¡ia F a lui Fisher - Snedecor).
Omogenitatea se referå la o anumitå caracteristicå hidrologicå
(Vladimirescu, 1978): debit mediu anual, precipita¡ie medie anualå etc. Dacå
dispersiile teoretice ale acestor variabile pentru douå sta¡ii sunt egale
omogenitatea poate fi admiså.
Din punct de vedere matematic problema poate fi formulatå astfel: fiind date
douå popula¡ii normale (sau eventual normalizate prin logaritmare) având
dispersiile teoretice σ 12 ¿i σ 22 se cere så se verifice ipoteza statisticå:

H0 : σ 12 = σ 22 cu alternativa H1 : σ 12 ≠ σ 22

Dispersiile teoretice sunt estimate cu ajutorul dispersiilor de selec¡ie


s12 ¿i s22 , unde s12 este o variabilå aleatoare cu n1 - 1 grade de libertate, iar s22
are n2 - 1 grade de libertate (n1, respectiv n2 reprezintå numårul de valori
înregistrate la fiecare sta¡ie).
Se calculeazå raportul:

s22
Fcalculat = (unde s12 > s22 ) (7.12)
s12

142
Dacå Fcalculat > Fn2 −1; n1 − 1; 1−α ipoteza H0 este respinså (α este pragul de
semnifica¡ie al testului, iar Fn2 −1; n1 − 1; 1−α se ob¡ine din tabelele reparti¡iei
Fisher - Snedecor).
¥n cazul în care intereseazå omogenitatea unui teritoriu mai larg (care
cuprinde mai multe sta¡ii), se calculeazå coeficientul de neomogenitate Fcalculat
cu rela¡ia (7.12); dacå aceasta depå¿e¿te limita criticå F, omogenitatea este
excluså (V. T. Chow, 1964; Vladimirescu, 1978).
Dacå se pune problema excluderii unei singure sta¡ii (dispersia ata¿atå
variabilei examinate este diferitå de a celorlalte sta¡ii) se poate utiliza testul
Cochran (Iliescu, Vodå, 1977).

143
8. VARIABILE ALEATOARE N - DIMENSIONALE

8.1. FUNCºIE DE REPARTIºIE ªI DENSITATE DE REPARTIºIE

Prin generalizare, no¡iunile de func¡ie de reparti¡ie ¿i densitate de reparti¡ie


de la variabilele unidimensionale se pot extinde ¿i la variabilele aleatoare
n-dimensionale.
Dacå X = (X1, X2, ....., Xn) este o variabilå aleatoare n-dimensionalå (sau un
vector aleator de componente X1, X2, ....., Xn), atunci func¡ia:

F(x)= F(x1, x2, ..., xn) = Prob [(X1 < x1), (X2 < x2), ..., (Xn < xn)]
(8.1)

se nume¿te func¡ie de reparti¡ie a variabilei n-dimensionale X; x reprezintå un


punct aleator de coordonate xi în spa¡iul n-dimensional.
Cu alte cuvinte, func¡ia de reparti¡ie reprezintå în acest caz (Moineagu ¿.a.,
1976) probabilitatea realizårii simultane a unui numår de n inegalitå¡i de tipul:

Xi < xi (i = 1, ...., n). (8.2)

Func¡ia f cu proprietatea cå:

x1 x2 xn
∫ ∫ ... ∫ f ( u1 , u2 ,..., un )du1du2 ... dun = F( x 1 , x 2 ,..., x n ) (8.3)
−∞ −∞ −∞

se nume¿te densitatea de reparti¡ie sau densitatea de probabilitate a


variabilei n-dimensionale X.
ªi pentru cazul n-dimensional se påstreazå o serie de proprietå¡i de la
variabilele uni-dimensionale; de exemplu:

f(x) = f(x1,, x2, ..., xn) ≥ 0 (8.4)

144
x1 x2 +∞
∫ ∫ ... ∫ f (u1 , u2 ,..., un )du1du2 ... dun = 1 (8.5)
−∞ −∞ −∞

∂ n F( x 1 , x 2 ,..., x n )
f(x) = f(x1,, x2, ..., xn)= . (8.6)
∂x 1∂x 2 ... ∂x n

Cunoscând func¡iile F(x) sau f(x), adicå reparti¡ia întregului sistem de


variabile aleatoare, se pot ob¡ine expresiile func¡iei de reparti¡ie sau a densitå¡ii
de reparti¡ie pentru orice variabilå (a¿a numitele reparti¡ii marginale).
Astfel func¡ia de reparti¡ie a unei variabile oarecare, rezultå fåcând så tindå
la +∞ restul argumentelor din func¡ia de reparti¡ie a sistemului:

F1(x1) = F(x1, ∞ ,∞ ,...,∞) . (8.7)

Densitatea de reparti¡ie a unei variabile oarecare se ob¡ine integrând


densitatea de reparti¡ie a sistemului pentru toate celelalte variabile ¿i pe întregul
lor domeniu de defini¡ie:
+∞ +∞
f1 ( x 1 ) = ∫ ∫ f ( x 1 , x 2 ,..., x n )dx 2 ... dx n . (8.8)
−∞ −∞

Prin generalizare, se pot defini subsisteme de variabile aleatoare ¿i


reparti¡iile marginale ale acestora.
Din sistemul de variabile aleatoare X1, X2, ..., Xn se poate separa subsistemul
X1, X2, ..., Xk, având func¡ia de reparti¡ie:

F1, 2, ..., k(x1, x2, ..., xk) = F(x1, x2, ...,xk, ∞ ,∞ ,...,∞) (8.9)

¿i densitatea de reparti¡ie:
+∞ +∞
f1, 2,...,k ( x 1 , x 2 ,..., x k ) = ∫ ... ∫ f ( x 1 , x 2 ,..., x n )dx k + 1 ... dx n . (8.10)
−∞ −∞

O altå no¡iune care se poate defini în legåturå cu un sistem de variabile


aleatoare este aceea de reparti¡ie condi¡ionatå.
Un subsistem (X1, X2, ..., Xk) are reparti¡ia condi¡ionatå dacå legea sa de
reparti¡ie se calculeazå dupå ce restul variabilelor din sistem (Xk+1, Xk+2, ..., Xn)
au luat valorile particulare xk+1, xk+2, ..., xn.

145
Densitatea de reparti¡ie condi¡ionatå se calculeazå cu rela¡ia:

f ( x 1 , x 2 ,..., x n )
f ( x 1 , x 2 ,..., x n x k +1 , x k + 2 ,..., x n ) = . (8.11)
f k +1, ..., n ( x k +1 ,..., x n )

ªi în cazul variabilelor n-dimensionale se pot defini o serie de valori tipice


(sau caracteristice) ale sistemului de variabile aleatoare. Acestea sunt:
− valorile medii mi (i = 1, ..., n) ale celor n variabile aleatoare,
caracterizând tendin¡a de grupare;
2
− dispersiile D (Xi) (i = 1, ..., n) sau abaterile medii påtratice σ (Xi)
(i=1,...,n) definind împrå¿tierea valorilor variabilelor;
− momentele de corela¡ie Kij = M[(Xi - mi)(Xj - mj)], caracterizând rela¡iile
reciproce dintre variabilele Xi ¿i Xj ; momentele Kij sunt definite ca valorile
medii ale produsului abaterilor dintre valorile fiecårei variabile ¿i media
acesteia, sau altfel spus, momentele de corela¡ie reprezintå valoarea medie a
variabilei (Xi - mi) (Xj - mj).
Momentul de corela¡ie Kij se mai nume¿te ¿i corela¡ie sau covarian¡å a
variabilelor Xi ¿i Xj, ¿i se noteazå prin cov(Xi, Xj). Se observå cå momentul de
corela¡ie al unei variabile fa¡å de ea înså¿i este chiar dispersia variabilei
respective:
2 2 2
Kii = M(Xi - mi) = D (Xi) = σ (Xi) . (8.12)

Din defini¡ia momentului de corela¡ie rezultå de asemenea: Kij = Kji


(proprietate de simetrie).
Cu ajutorul momentelor de corela¡ie se poate alcåtui matricea de corela¡ie a
variabilelor sistemului:

⎡ K 11 K 12 ... K 1n ⎤
⎢K K 22 ... K 2 n ⎥⎥
⎢ 21
K = ⎢⎢ ⎥ .
.
⎥ (8.13)
. ...
⎢ ⎥
⎢ . ⎥
⎢⎣ K n1 K n2 ... K nn ⎥⎦

¥n baza proprietå¡ilor de simetrie a momentelor de corela¡ie, rezultå cå ¿i


matricea de corela¡ie este simetricå în raport cu diagonala principalå.

146
Douå variabile Xi ¿i Xj din sistem se numesc corelate (sau dependente), dacå
momentul Kij ≠ 0 (aceasta înseamnå cå varia¡ia variabilei Xi antreneazå ¿i
varia¡ia variabilei Xj ). Când variabilele sunt necorelate (adicå sunt indepen-
dente) Kij = 0.
Se atrage înså aten¡ia cå propozi¡ia reciprocå nu este adevåratå, deci dacå
covarian¡a este nulå, nu rezultå neapårat cå variabilele respective sunt
independente (Mihåilå, 1965).
Având în vedere dependen¡a dintre variabilele unui sistem, rezultå cå
proprietå¡ile acestuia nu pot fi complet ¿i corect descrise numai prin
proprietå¡ile variabilelor componente, fiind necesarå ¿i examinarea rela¡iilor
reciproce dintre aceste variabile.
Momentele de corela¡ie intrå în definirea coeficien¡ilor de corela¡ie, care
reprezintå de fapt momente de corela¡ie normate:

rij =
K ij
=
(
cov X i , X j ) . (8.14)
σ iσ j D2 ( X i ) ⋅ D2 ( X j )

Mårimile rij sunt coeficien¡i adimensionali; matricea coeficien¡ilor de


corela¡ie este:

⎡1 r12 r13 ... r1n ⎤


⎢ 1 r23 ... r2 n ⎥⎥
rij = ⎢ . (8.15)
⎢ 1 ... r3 n ⎥
⎢ ⎥
⎣ ... 1 ⎦

ºinând seama de proprietatea de simetrie a coeficien¡ilor s-a completat


numai partea superioarå a acestei matrici.
2
Dupå cum se remarcå, deoarece Kii = σi , elementele de pe diagonala
principalå sunt egale cu unitatea. Dacå variabilele din sistem ar fi necorelate
s-ar ob¡ine o matrice bandå, având valoarea 1 pe diagonala principalå, iar restul
elementelor ar fi nule.

8.2. VARIABILELE ALEATOARE BI-DIMENSIONALE

¥n practicå, un interes special îl prezintå reparti¡iile bi-dimensionale (definite


deci de variabilele aleatoare X1 ¿i X2 sau pentru comoditatea scrierii, de
variabilele X ¿i Y).

147
Foarte multe fenomene hidrologice sunt de tip bi-dimensional, ca de
exemplu perechile de valori: debitul maxim - volumul undei de viiturå; debitul
râului - debitul solid transportat, etc..
Chiar dacå anumite fenomene hidrologice ar fi mai complexe (de tip tri sau
n-dimensional) lipsa datelor din måsuråtori face necesarå simplificarea
dependen¡elor constatate sau estimate ¿i conduce la utilizarea unui aparat
matematic mai simplu (reparti¡ii unidimensionale, cel mult bi-dimensionale).
Prin particularizarea no¡iunilor de la sistemele de variabile n-dimensionale,
în cazul bi-dimensional se ob¡in urmåtoarele rela¡ii de defini¡ie:

− func¡ia de reparti¡ie F(x,y) = Prob [(X < x);(Y < y)]; (8.16)

∂ 2 F( x , y )
− densitatea de reparti¡ie f(x,y) = ; (8.16')
∂x ∂y

x y
¿i în plus: ∫ ∫ f ( x, y )dxdy = F( x, y ) (8.17)
−∞ −∞

− reparti¡iile marginale ale lui X ¿i Y sunt definite prin:

F1(x) = F(x, ∞) ; F2(y) = F(∞, y) (8.18)

sau:

+∞ +∞
f 1( x ) = ∫ f ( x , y )dy ; f 2 ( x ) = ∫ f ( x , y )dx ; (8.19)
−∞ −∞

− reparti¡iile condi¡ionate:

f ( x, y )
f ( x y) = ; (8.20)
f2 ( y)

(adicå densitatea de reparti¡ie a lui X condi¡ionat de o valoare fixå y a lui Y


este raportul dintre densitatea de reparti¡ie bi-dimensionalå f(x,y) ¿i densitatea
de reparti¡ie f2(y) a lui Y); similar:

f ( x, y )
f ( x y) = ; (8.21)
f1 ( x )
− matricea de corela¡ie a sistemului de variabile aleatoare:

148
⎡ K xx K xy ⎤
K=⎢
K yy ⎥⎦
, (8.22)
⎣ K yx

unde:

2
Kxx = M[(X - mx)(X - mx)] = σx , (8.23)

Kxy = M[(X - mx)(Y - my)] = Kyx , (8.24)

2
Kyy = M[(Y - my)(Y - my)] = σy , (8.25)

Prin mx ¿i my s-au notat valorile medii ale variabilelor X ¿i Y, iar prin


σ 2
x ¿i σ y2 dispersiile acelora¿i variabile.

Kxy = Kyx = cov (X,Y) = cov (Y,X) (8.26)

reprezintå corela¡ia sau covarian¡a varibilelor X ¿i Y.


− coeficientul de corela¡ie:

cov ( X, Y )
r ( X, Y ) = = r(Y , X ) (8.27)
D 2 ( X ) ⋅ D 2 (Y )

Notând pentru simplificare:

r = r(X,Y) ; σ x = D 2 ( X ) ¿i σ y = D 2 ( Y ) (8.28)

se poate scrie:

cov(X,Y) = cov(Y,X) = r⋅σx⋅σy (8.29)

Matricea de corela¡ie devine deci în cazul variabilei bi-dimensionale:

⎡ σ x2 r ⋅σ x ⋅σ y ⎤
K= ⎢ ⎥ (8.30)
⎢⎣ r ⋅ σ x ⋅ σ y σ y2 ⎥⎦
8.2.1. REPARTIºIA NORMALÅ BI-DIMENSIONALÅ

149
Este cea mai utilizatå reparti¡ie bi-dimensioanlå.
Din punct de vedere teoretic se pot formula, la fel ca ¿i la variabilele
unidimensionale, o multitudine de reparti¡ii (simetrice sau asimetrice). Practic
înså se admite apriori cå reparti¡ia normalå bi-dimensionalå aproximeazå
satisfåcåtor aproape toate tipurile de valori experimentale.
Densitatea de reparti¡ie a variabilei bi-dimensionale, normal distribuitå, este
datå de formula:

1 ⎛ 1 E2 ⎞
f ( x, y ) = exp⎜ − ⎟ , (8.31)
2πσ x σ y 1 − r 2 ⎝ 2 1− r2 ⎠

unde r este coeficientul de corela¡ie, exp semnificå func¡ia exponen¡ialå, iar


2
E are expresia:

(x − m x ) (y − m ) ( x − m x )( y − m y )
2 2
y
E 2
= + − 2r . (8.32)
σ x2 σ y2 σ xσ y

Reparti¡ia variabilelor X, respectiv Y este datå de formulele:


1 ⎛ ( x − mx ) 2 ⎞
f (x) = exp⎜ − ⎟ , (8.33)
σ x 2π ⎜ 2σ 2 ⎟
⎝ x ⎠

respectiv:

⎛ y−m ( ) ⎞
2

exp⎜ − ⎟ .
1 y
f ( y) = (8.34)
σy 2π ⎜ 2σ y
2 ⎟
⎝ ⎠

Reparti¡ia este simetricå în x ¿i y dupå cum rezultå din înså¿i rela¡ia de


defini¡ie.

8.2.2. REPARTIºII EMPIRICE BI-DIMENSIONALE

Fie o popula¡ie statisticå descriså prin douå variabile aleatoare X ¿i Y; notând


valorile observate prin x1, x2, ..., xm, respectiv y1, y2, ..., yn ¿i prin fij numårul
unitå¡ilor popula¡iei statistice care au caracteristica X = xi ¿i Y = yj, reparti¡ia
poate fi descriså ca în tabelul 8.1.
Tabelul 8.1

150
y Reparti¡ia
. . . . . . marginalå
y1 y2 yi yn
x a lui X
. . . . . .
x1 f11 f12 f1j f1n f1•
. . . . . .
x2 f21 f22 f2j f2n f2•
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . .
xi fi1 fi2 fij fin fi•
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . .
xm fm1 fm2 fmj fmn fm•
Reparti¡ia
marginalå . . . . . . f••
f•1 f•2 f•j f•n
a lui Y

Acest tip de tabel se utilizeazå atât în cazul variabilelor discrete, cât ¿i al


variabilelor continue (în acest caz coloanelor ¿i rândurilor li se asociazå
intervale din domeniul de varia¡ie, iar prin xi ¿i yj se noteazå centrul
intervalelor).
Efectuând totalurile pe linii:

n
∑ f ij = f i • (i = 1, ..., m) , (8.34)
j =1

respectiv pe coloane:
m
∑ fij = f• j (j = 1, ..., n) , (8.35)
i =1

se ob¡in la marginile tabelului douå reparti¡ii simple: reparti¡ia integralå a


variabilei X, respectiv reparti¡ia integralå a variabilei Y în popula¡ia totalå
(cu alte cuvinte reparti¡iile marginale ale celor douå variabile).
Reparti¡ia marginalå a lui X este deci:

⎛x x2 xi xm ⎞
X: ⎜ 1 ⎟ , (8.36)
⎝ f 1• f 2 • f i• f •m ⎠
iar reparti¡ia marginalå a lui Y:

151
⎛ y1 y2 yj yn⎞
Y: ⎜ ⎟ . (8.36′)
⎝ f •1 f •2 f• j f•n ⎠

Reparti¡iile marginale ale unei variabile sunt reparti¡ii libere, în sensul cå nu


depind de loc de valorile celeilalte variabile.
¥n opozi¡ie cu acestea sunt reparti¡iile condi¡ionate, în care reparti¡ia unei
variabile este func¡ie de valoarea celeilalte variabile. De exemplu, reparti¡ia lui
y condi¡ionatå de valoarea particularå X=xi este urmåtoarea:

⎛ y1 y2 yi y n⎞
Y:⎜ ⎟ . (8.37)
⎝ f i1 f i2 f ij f in ⎠

Pentru fiecare valoare xi (i = 1, ..., m) a lui X se poate defini reparti¡ia lui Y


condi¡ionat de xi ; în mod similar pentru fiecare valoare yj (j = 1, ..., n) a lui Y
existå o reparti¡ie a lui X condi¡ionat de yj.
Cu alte cuvinte, reparti¡ia bi-dimensionalå f(x, y) mai define¿te în afarå de
cele douå reparti¡ii marginale ¿i m + n reparti¡ii condi¡ionate.
Fiecare reparti¡ie condi¡ionatå este caracterizatå sintetic printr-o valoare
medie condi¡ionatå ¿i o abatere medie påtraticå condi¡ionatå.
Un interes special în prelucrårile statistice îl prezintå mul¡imea valorilor
medii condi¡ionate, care definesc a¿a-numitele curbe de regresie sau curbe de
dependen¡å statisticå între valorile medii ale variabilei explicate (sau deter-
minate) ¿i valorile variabilei explicative (sau determinante).

8.3. REPREZENTÅRI ªI REPARTIºII EMPIRICE


BI-DIMENSIONALE ¥N HIDROLOGIE. CORELAºII

¥n hidrologie, numårul de måsuråtori este redus, ceea ce face ca o bunå parte


a frecven¡elor absolute fij så fie egale cu zero. De regulå, unei valori a lui x îi
corespunde o valoare y, care se înregistreazå o singurå datå; ca urmare, tabelul
8.1 al reparti¡iei este påtrat (m=n). Variabila aleatoare bi-dimensionalå va lua
valorile (xi , yi ; i=1,...,n), astfel încât doar termenii diagonali ai matricii sunt
egali cu unitatea, restul termenilor fiind nuli.
Aceasta face så se renun¡e la ideea definirii unei densitå¡i de reparti¡ie
bi-dimensionale f(x,y), preferându-se så se recurgå la grafice pe care se

152
reprezintå punctele de coordonate (xi , yi). Imaginea graficå ob¡inutå permite
formularea unor ipoteze privind dependen¡a sau independen¡a componentelor
X ¿i Y ale variabilei aleatoare bi-dimensionale analizate.
Stabilirea acestui lucru este foarte importantå: dacå variabilele sunt
independente, ele pot fi analizate separat, ca reparti¡ii uni-dimensionale; în cazul
în care variabilele sunt dependente este important så se determine cel pu¡in care
este influen¡a modificårii unei variabile asupra valorilor celeilalte variabile. Se
ajunge astfel la prelucråri statistice mai simple de o deosebitå importan¡å
practicå, cunoscute sub numele de analize de corela¡ie ¿i regresie.
Fie de exemplu precipita¡iile X cåzute pe un bazin hidrografic, respectiv
debitele Y ale râului în profilul de închidere al bazinului. Reprezentând
diversele situa¡ii înregistrate se ob¡ine în principiu dependen¡a din figura 8.1.

Fig. 8.1. Legåtura dintre precipita¡ii ¿i debitul unui râu:


1 - densitatea de reparti¡ie a variabilei Y condi¡ionatå de valoarea X = xi ;
2 - densitatea de reparti¡ie marginalå a lui Y; 2' - densitatea de reparti¡ie
marginalå a lui X; 3 - dreapta de regresie a lui Y fa¡å de X.

Valorile (xi , yi) definesc o variabilå aleatoare bi-dimensionalå, între compo-


nente existând o rela¡ie de dependen¡å probabilisticå; unei valori a lui X

153
(sau mai corect unei vecinåtå¡i a acesteia) îi corespund o multitudine de valori
ale lui Y.
Acest lucru se explicå prin influen¡a pe care o are gradul de umiditate ini¡ialå
a solului asupra descompunerii precipita¡iilor în scurgere de suprafa¡å ¿i
infiltra¡ie. Pentru o precipita¡ie datå, dacå solul este uscat o mare parte se
infiltreazå, deci scurgerea de suprafa¡å (¿i implicit debitul râului) au valori mai
mici; dimpotrivå, dacå umiditatea ini¡ialå a solului este ridicatå, scurgerea
superficialå respectiv debitul râului vor fi mai mari.
Considerând cå punctul xi de pe absciså reprezintå centrul unui interval:

⎡ ∆x ∆x ⎤
⎢⎣ x i − 2 , x i + 2 ⎥⎦ ,

se ob¡ine densitatea de reparti¡ie a lui Y condi¡ionatå de valoarea X = xi


(curba 1 din fig. 8.1). ¥n mod similar se ob¡in reparti¡iile condi¡ionate ale lui X
de valorile lui Y.
¥n figura 8.1 s-a reprezentat ¿i reparti¡ia marginalå a lui Y, liberå deci de
valorile lui X (curba 2). Aceastå reparti¡ie se poate ob¡ine divizând domeniul de
varia¡ie al lui Y în intervale ∆y ¿i contorizând numårul de puncte din cadrul
fiecårui interval; rezultå o reparti¡ie empiricå a lui Y, care este apoi ajustatå
printr-o lege teoreticå. Similar, se construie¿te reparti¡ia marginalå a lui X
(curba 2' din fig. 8.1).
¥n sfâr¿it, pe aceea¿i figurå s-au reprezentat (curba 3) ¿i valorile medii ale lui
Y condi¡ionate de valorile lui X (dreapta de regresie a lui Y fa¡å de X). ªi în acest
caz se poate defini, respectiv reprezenta, dreapta de regresie a lui X fa¡å de Y.
Trebuie men¡ionat cå cele douå drepte de regresie nu coincid decât în cazuri cu
totul speciale ¿i anume atunci când dependen¡a dintre Y ¿i X este de tip
determinist, deci când se poate defini o rela¡ie de tipul Y=f(X). ¥n mod normal,
cele douå drepte de regresie fac între ele un unghi, care este cu atât mai mare, cu
cât legåtura dintre variabilele Y ¿i X este mai slabå.
¥n opozi¡ie cu dependen¡a func¡ionalå dintre Y ¿i X este independen¡a
variabilelor, caz în care cele douå drepte de regresie sunt perpendiculare.
O reprezentare graficå a celor 3 tipuri de situa¡ii este datå în figura 8.2.

154
Fig. 8.2. Tipuri de dependen¡å între variabilele Y ¿i X: a - legåturå deterministå
între Y ¿i X (variabile total dependente); b - legåturå statisticå (dependen¡a dintre
cele douå variabile mai slabå decât în primul caz); c - lipsa oricårei legåturi între
Y ¿i X (variabile independente).

Rezumând, o legåturå de tip determinist între variabilele X ¿i Y este de tipul:

Y = f(X), (8.38)

în timp ce o legåturå probabilisticå implicå un element aleator ε :

Y = f(X) + ε (8.39)

¥n rela¡ia (8.39), f(X) reprezintå curba de regresie a lui Y fa¡å de X (deci


valorile medii condi¡ionate ale lui Y), iar ε este o variabilå aleatoare, indicând
abaterile lui Y fa¡å de curba de regresie.
¥n practicå intereseazå în special ecua¡ia curbei de regresie, ceea ce face ca o
legåturå de tip probabilistic så se exprime simplificat tot sub forma (8.38).
¥n acest caz, curba f(X) trece printre punctele provenite din måsuråtori,
puncte care nu mai sunt pe curbå ca în cazul dependen¡ei de tip determinist, ci
sunt situate de o parte ¿i de alta a ei.

Fig. 8.3. Corela¡ie L-tcr. Fig. 8.4. Corela¡ie H / F − h1% .

155
¥n mod similar se pot stabili (I.M.H., 1971) corela¡ii între:
− timpul de cre¿tere tcr al unei unde de viiturå ¿i L sau L/ I r (fig. 8.3),
unde L este lungimea, iar Ir panta râului;
− durata totalå Tt a undei de viiturå ¿i L, L / I b sau F / I b I r , unde L
este lungimea râului, Ib - panta bazinului, Ir - panta râului, iar F suprafa¡a
bazinului hidrografic;
− stratul scurs h1% ¿i H/ F (fig. 8.4), unde H este altitudinea medie a
bazinului hidrografic;
− coeficientul scurgerii medii η ¿i altitudine;
− coeficientul evapora¡iei multianuale ¿i altitudine, etc.
¥n toate aceste exemple, cunoscând caracteristicile fizico-geografice ale
re¡elei hidrografice sau bazinului (H, F, Ib, Ir, L etc.) din graficele dependen¡elor
rezultate se pot determina o serie de mårimi hidrologice (caracteristici ale
undelor de viiturå, scurgere medie, evapora¡ie etc.).
Din reprezentårile grafice se observå cå valorile variabilei explicate (Y)
prezintå abateri mai mult sau mai pu¡in importante fa¡å de curba valorilor medii;
cu cât punctele (xi , yi) sunt mai apropiate de curba de regresie, cu atât
dependen¡a (sau corela¡ia) dintre cele douå variabile este mai strânså.

8.3.1. CLASIFICAREA CORELAºIILOR

a) ¥n func¡ie de numårul variabilelor care intervin în corela¡ie se deosebesc:


− corela¡ii simple, în care valorile medii ale variabilei explicate (Y) se
exprimå în func¡ie de o singurå variabilå explicativå (X):

Y = F(X) (8.40)

− corela¡ii multiple, în care intervin mai multe variabile explicative


(X1, X2, ... Xn):

Y = f(X1, X2, ...). (8.41)

Cu cât numårul variabilelor explicative este mai mare, cu atât dependen¡a


dintre variabila explicatå Y ¿i ansamblul variabilelor explicative este mai bunå.
La limitå, dacå s-ar introduce toate variabilele care definesc un proces sau
fenomen, s-ar ob¡ine legåturi legice, de tip determinist. ¥n general înså, în

156
practica nu este nici necesar si nici posibil så se evalueze influen¡ele tuturor
acestor factori. Ca urmare, se recurge la alegerea unui numår de factori care
intervin în mod esen¡ial în definirea variabilei explicate Y, restul factorilor
neglijându-se; ei intervin sub forma factorului aleator ε, deci a unor perturba¡ii
ale valorilor lui Y în raport cu valoarea sa medie, deduså pe baza variabilelor X1,
X2, ..., re¡inute.
Influen¡ele factorilor re¡inu¡i se evalueazå fie individual (permi¡ând corela¡ii
multiple), fie global, sub formå de produs al acestor factori în general (rezultând
corela¡ii simple între Y ¿i ansamblul factorilor considera¡i).
− corela¡ii par¡iale; în anumite cazuri intereseazå doar influen¡a unui
factor sau a unui grup de factori asupra valorilor lui Y. De exemplu, se ¿tie cå
Y=f(X1,X2) ¿i intereseazå doar corela¡ia par¡ialå Y = f(X1) sau Y = f(X2), pentru a
determina variabila care intervine în mod esen¡ial în varia¡ia lui Y. Variabila
re¡inutå poate fi supuså apoi unor procedee mai atente de måsurare sau control,
în vederea întåririi sau diminuårii influen¡ei ei, dupå cum implica¡iile
dependen¡ei rezultate sunt favorabile sau defavorabile.
b) ¥n func¡ie de tipul legåturii dintre variabile se deosebesc:
− corela¡ii liniare:

simple:

Y = A + BX (8.42)

multiple

Y = A + BX1 + CX2 + ... (8.43)

− corela¡ii neliniare:

simple sau multiple.

c) O altå clasificare a corela¡iilor este în func¡ie de sensul varia¡iei


variabilelor (fig. 8.5):
− dacå la cre¿terea valorii variabilei explicative X corespunde o cre¿tere a
variabilei explicate Y, atunci legåtura dintre cele douå variabile este directå
(fig, 8.5, a);
− dacå la cre¿terea lui X corespunde o mic¿orare a lui Y, legåtura este
inverså (fig. 8.5, b).

157
Fig. 8.5. Corela¡ie directå (a) ¿i inverså (b) între variabilele X ¿i Y.

Gradul de intensitate (sau tårie) a unei corela¡ii se apreciazå cu doi indicatori


diferi¡i, dupå cum corela¡ia este liniarå sau neliniarå. Ace¿tia sunt:
− coeficientul de corela¡ie (în cazul dependen¡ei liniare între Y ¿i X);
− raportul de corela¡ie (în cazul legåturii neliniare).

8.3.2. COEFICIENTUL DE CORELAºIE AL VARIABILELOR


BI-DIMENSIONALE

Dupå cum s-a aråtat, coeficientul de corela¡ie al variabilelor aleatoare X ¿i Y


este prin defini¡ie:

cov( X ,Y )
r= (8.44)
D 2 ( X ) ⋅ D 2 (Y )

¥n cazul în care variabilele X ¿i Y sunt continue ¿i au densitatea de reparti¡ie


bi-dimensionalå f(x, y), covarian¡a sau momentul de corela¡ie care reprezintå
valoarea medie a variabilei (X-mx)(Y-my) are urmåtoarea expresie:

[ (
cov( X , Y ) = K XY = M ( X − m x ) Y − m y = )]
. (8.45)
+∞ +∞
= ∫ ∫ ( x − m x )( y − m y ) f ( x, y )dxdy
−∞ −∞

158
Valoarea medie a variabilei bi-dimensionale s-a ob¡inut dupå acelea¿i reguli
ca valoarea medie a variabilei aleatoare uni-dimensionale. Se reaminte¿te cå, în
cazul variabilei unidimensionale X cu densitatea de reparti¡ie f(x), valoarea sa
medie M(X) este:

+∞
M( X ) = ∫ x f ( x ) dx . (8.46)
−∞

¥n cazul bi-dimensional, variabila este [(X - mx)(Y - my)] iar densitatea de


reparti¡ie f(x, y); rela¡ia de calcul a valorii medii rezultå acum imediat.
¥nlocuind valoarea covarian¡ei în expresia lui r, se ob¡ine în cazul variabilei
continue:

+∞ +∞
r=
cov( X, Y )
∫ ∫ ( x − m x )( y − m y ) f ( x, y)dxdy (8.47)
D 2 ( X ) ⋅ D 2 (Y ) −∞ −∞

¥n cazul variabilei bi-dimensionale discrete, notând cu:

pij = Prob (X=xi; Y= yj) (8.48)

¿i cu r coeficientul de corela¡ie de selec¡ie, rezultå:

1
( x i − x )( yi − y ) pij
m n
r= ∑ ∑ . (8.49)
D 2 ( X ) D 2 (Y ) i=1 j =1

Se reaminte¿te cå valoarea medie a variabilei unidimensionale X luând


valorile xi cu probabilitå¡ile pi este:

n
M( X ) = ∑ x i pi . (8.50)
i =1

Cu o rela¡ie similarå s-a ob¡inut în cazul bi-dimensional valoarea medie


pentru variabila ( X − x )(Y − y ) .

¥n expresia coeficientului de corela¡ie s-a notat prin pij raportul:

f ij
p ij ≈ , (8.51)
f ••

159
unde fij reprezintå frecven¡e absolute, adicå numårul de cazuri în care
variabila X ia valorile xi (i = 1, ..., m), iar Y ia valorile yj (j = 1, ..., n); f•• este
volumul selec¡iei:

m n
f•• = ∑ ∑ fij . (8.52)
i=1 j =1

¥n hidrologie, dupå cum s-a mai aråtat, numårul de valori de care se dispune
din måsuråtori este redus.
Admi¡ând cå fiecare pereche de valori (Xi, Yj) s-a înregistrat o singurå datå,
rezultå fij = 1 ¿i deci:

1
p ij = . (8.53)
n

Considerând cå unei valori Xi îi corespunde o singurå valoare a variabilei


explicate (notatå Yi), suma dupå j dispare din rela¡ia (8.49), care devine:

( xi − x )( yi − y ) ∑ ∆x i ⋅ ∆yi
1 n
r= ∑ = i =1
. (8.54)
s ( X )s 2 (Y )
2 i =1 n ns x s y

Lucrând cu o selec¡ie de volum limitat, în expresia (8.54) s-au înlocuit


dispersiile ¿i abaterile medii påtratice teoretice prin valorile lor de selec¡ie; prin
∆xi ¿i ∆yi s-au notat abaterile valorilor xi ¿i yi fa¡å de media x , respectiv y .
Se reaminte¿te cå:

∑ ( xi − x ) = ∑ ( ∆x i )
1 n 2 1 n 2
sx = (8.55)
n i =1 n i=1

∑ ( ∆yi ) .
1 n 2
sy = (8.55')
n i =1

Deci expresia lui r devine:

160
n
∑ ∆x i ∆yi
r= i=1
. (8.56)
∑ ( ∆x i ) ∑ ( ∆yi )
n 2 n 2

i=1 i =1

Calculul coeficientului de corela¡ie se desfå¿oarå tabelar, dupå urmåtorul


model (tab.8.2):

Tabelul 8.2

i xi yi ∆xi ∆yi ∆xi . ∆yi ∆xi2 ∆yi2


1 . .
. . .
. . .
. . .
n . .
x y Σ Σ Σ

Calculul se poate simplifica, dezvoltând factorii care intervin în expresia


coeficientului de corela¡ie. Se reaminte¿te cå:

2 2
σ = M2 - M1 (8.57)

unde M1 ¿i M2 sunt momentele de ordinul 1, respectiv 2 ale variabilei.


¥n cazul selec¡iei de volum n se ob¡ine:

2 2
1 n 2 1⎛n ⎞
n ∑ x i2 − ⎛⎜ ∑ x i ⎞⎟
1 n n
sx = ∑ xi − 2 ⎜ ∑ xi ⎟ = (8.58)
n i=1 ⎝
n i=1 ⎠ n i=1 ⎝ i=1 ⎠

2
n ∑ yi2 − ⎛⎜ ∑ yi ⎞⎟
1 n n
sy = . (8.58')
n i=1 ⎝ i=1 ⎠

¥n ceea ce prive¿te covarian¡a cov (X, Y), se poate scrie:

cov (X, Y) = M[(X - mx)(Y - my)] = M(XY - Xmy - mxY + mxmy) =


(8.59)
= M(XY) - M(X)M(Y) - M(X)M(Y) + M(X)M(Y) = M(XY) - M(X)M(Y) .

161
¥n cazul unei selec¡ii de volum n, prin particularizare covarian¡a se
calculeazå cu expresia:

1 n 1 n 1 n
cov( X, Y ) = ∑ x i yi − ∑ x i ⋅ ∑ y i . (8.60)
n i=1 n i =1 n i =1

¥nlocuind rela¡iile (8.60) ¿i (8.18) în expresia coeficientului de corela¡ie


(8.49), se ob¡ine:

n n n
n ∑ x i yi − ∑ x i ∑ yi
i=1 i=1 i=1
r= . (8.61)
⎡ n
⎛ n

2
⎤ ⎡ n 2 ⎛ n ⎞ 2⎤
⎢n ∑ x i − ⎜⎝ ∑ x i ⎟⎠ ⎢n ∑ yi − ⎜⎝ ∑ yi ⎟⎠ ⎥
2

⎢⎣ i = 1 i=1 ⎥⎦ ⎢⎣ i = 1 i=1 ⎥⎦

Calculul lui r se desfå¿oarå tabelar dupå urmåtorul model (tab.8.3):

Tabelul 8.3

2 2
i xi yi xi . yi x i
y i
1
.
.
.
n
Σ Σ Σ

Se observå cå spre deosebire de tabelul 8.2, nu mai este necesar calculul


mediei ¿i al diferen¡elor ∆xi ¿i ∆yi.

8.3.3. INTERPRETAREA COEFICIENTULUI DE CORELAºIE. PROPRIETźI

Coeficientul de corela¡ie are urmåtoarele proprietå¡i:


− Coeficientul de corela¡ie reprezintå o måsurå simetricå globalå a
dependen¡ei dintre variabilele X ¿i Y, privite ca reparti¡ii marginale ale unor
variabile bi-dimensionale (Dinescu ¿.a., 1986).
Deoarece cov (X, Y) = cov (Y, X), din rela¡ia de defini¡ie a coeficientului de
corela¡ie rezultå cå acesta este acela¿i (proprietate de simetrie), indiferent dacå

162
se evalueazå dependen¡a probabilisticå (stohasticå) a lui Y fa¡å de X sau a lui X
fa¡å de Y.
− Coeficientul de corela¡ie nu se poate utiliza decât în cazul a douå
variabile X ¿i Y cu reparti¡ii normale, pentru alte situa¡ii conceptul respectiv
nefiind fundamentat teoretic ¿i putând caracteriza cel mult un grad de asociere
al variabilelor respective (Panaite, Munteanu, 1982).
¥n practica hidrologicå se stabilesc de exemplu corela¡ii liniare între debitele
maxime anuale (având distribu¡ie asimetricå) ¿i volumele undelor de viiturå
respective. Este evident cå în acest exemplu premiza normalitå¡ii variabilelor nu
mai este verificatå.
− Coeficientul de corela¡ie are valori cuprinse între -1 ¿i +1. Se poate
demonstra matematic (Mihoc ¿.a., 1986) cå între douå variabile aleatoare existå
2
o rela¡ie liniarå, dacå ¿i numai dacå r = 1.
Coeficientul de corela¡ie constituie o måsurå a gradului de dependen¡å dintre
variabile. Cu cât r este mai apropiat de 1, cu atât legåtura probabilisticå dintre
variabile este mai puternicå (atingând maximul în cazul dependen¡ei
deterministe de tip liniar).
Dacå cele douå variabile aleatoare sunt independente, atunci r = 0. Reciproca
acestei propozi¡ii nu este adevåratå, deci dacå r = 0 nu rezultå cå variabilele sunt
independente (Mihoc ¿.a., 1986), dependen¡a între variabile putând fi neliniarå
(Moineagu ¿.a., 1976).
Valorile coeficientului de corela¡ie sunt pozitive în cazul în care cre¿terea
variabilei explicative antreneazå cre¿terea variabilei explicate (corela¡ie
pozitivå) ¿i negative în caz contrar (corela¡ie negativå).
¥n figura 8.6 sunt reperezentate câteva situa¡ii caracteristice de drepte de
regresie ¿i valorile corespunzåtoare ale coeficientului de corela¡ie (Panaite,
Munteanu, 1982).

Fig. 8.6. Diverse situa¡ii de drepte de regresie ¿i valorile corespunzåtoare


ale coeficientului de corela¡ie.

163
¥n aceste reprezentåri s-a notat prin A dreapta de regresie a lui Y în func¡ie de
X, iar prin B dreapta de regresie a lui X în func¡ie de Y.
Este de remarcat faptul cå, în cazul dependen¡ei de tip determinist, dreptele
A ¿i B coincid, în timp ce, în cazul variabilelor independente, dreptele A ¿i B
sunt perpendiculare ¿i paralele cu cele douå axe (Dinescu ¿.a., 1986). Din
examinarea celorlalte cazuri se constatå cå, cu cât A ¿i B fac un unghi mai mic
între ele, cu atât coeficientul de corela¡ie r este mai mare în valoare absolutå,
deci corela¡ia este mai bunå.

8.3.4. ESTIMAREA PARAMETRILOR REGRESIEI LINIARE SIMPLE

Prin defini¡ie func¡ia de regresie a variabilei aleatoare Y fa¡å de variabila


aleatoare X constå în exprimarea analiticå a valorii medii condi¡ionate M(Y | X)
a variabilei Y în func¡ie de valorile lui X.
Fie o regresie liniarå simplå pentru care M(Y | X) = a + bX. Ecua¡ia acestei
drepte va fi notatå mai departe pentru comoditate prin:

y = a + bx . (8.62)

Valorile y ale dreptei de regresie reprezintå valori teoretice ¿i sunt evident


e
diferite de valorile empirice (måsurate) y pentru acela¿i x (fig. 8.7).

Fig. 8.7. Semnifica¡ia valorilor yit ¿i yie ale corela¡iei.

Deoarece, de regulå, se dispune de un numår finit de valori ale lui x, acestea


vor fi notate prin xi, iar valorile variabilei explicate prin yit , respectiv yie , dupå
cum este vorba despre valori teoretice sau empirice.

164
Estimarea parametrilor dreptei de regresie se face de regulå prin metoda
celor mai mici påtrate a lui Gauss: se impune condi¡ia ca suma påtratelor
abaterilor dintre valorile empirice (din måsuråtori) ¿i cele teoretice (situate pe
dreaptå ¿i deci verificând ecua¡ia) så fie minimå:

(y )
n 2
G= ∑ t
i − yie → minim . (8.63)
i =1

Deoarece yit verificå ecua¡ia dreptei de regresie se poate scrie:

t
yi = a + bxi (8.64)

¿i înlocuind în expresia lui G, se ob¡ine:

( )
n 2
G = ∑ a + bx i − yie . (8.65)
i =1

A rezultat o func¡ie de doi parametri (a ¿i b), care pot fi determina¡i


impunând condi¡iile necesare pentru existen¡a unui punct de extrem (anularea
derivatelor de ordinul unu în raport cu a ¿i b):

∂G
( )
n
= 2 ∑ a + bx i − y ei ⋅1 = 0 (8.66)
∂a i =1

∂G
( )
n
= 2 ∑ a + bx i − y ei ⋅x i = 0 . (8.67)
∂b i =1

Se ob¡ine sistemul:

n n n
∑ a + ∑ bx i = ∑ y i
e
(8.68)
i =1 i =1 i =1

n n n
∑ ax i + ∑ bx i = ∑ x i y i
2 e
(8.69)
i =1 i =1 i =1

sau:

n n
na + b ∑ x i = ∑ y ei (8.70)
i =1 i =1

165
n n n
a ∑ x i + b ∑ x i2 = ∑ x i y ei . (8.71)
i =1 i =1 i =1

A rezultat un sistem de douå ecua¡ii cu douå necunoscute; utilizând


determinan¡ii, dupå dezvoltårile respective se ob¡ine:

n n n n
∑ yi ∑ x i − ∑ x i ∑ x i yi
e 2 e

a = i =1 i=1 i=1 i=1


2
(8.72)
− ⎛⎜ ∑ x i ⎞⎟
n n
∑ xi
2
n
i=1 ⎝ i=1 ⎠

n n n
n ∑ x i yie − ∑ x i ∑ yie
b = i =1 i=1 i=1
2
(8.73)
− ⎛⎜ ∑ x i ⎞⎟
n n
∑ xi
2
n
i=1 ⎝ i=1 ⎠

O altå evaluare pentru parametrii a ¿i b se ob¡ine împår¡ind în expresia lui b


2
atât numåråtorul, cât ¿i numitorul cu n :

1 n 1 n 1 n e
∑ x i yi − ∑ x i ⋅ ∑ yi
e

b = n i = 1n n i = 1 n i =1 (8.74)
1 1 n 1 n
∑ xi − ∑ xi ⋅ ∑ xi
2
n i=1 n i=1 n i=1

Conform rela¡iei (8.59), covarian¡a variabilelor X ¿i Y se poate scrie sub


forma:

cov (X, Y) = M(XY) - M(X) ⋅ M(Y) .

¥n expresia (8.74) se fac urmåtoarele înlocuiri:

1 n
∑ x i yi = M( XY )
e e
(8.75)
n i=1

1 n 1 n e
∑ x i ⋅ ∑ yi = M ( X ) ⋅ M ( Y )
e
(8.76)
n i=1 n i=1

e
Conform rela¡iei (8.59), numåråtorul lui b reprezintå covarian¡a cov (X, Y ).

166
Deoarece:

1 n
∑ xi = x , (8.77)
n i =1

rezultå cå numitorul se poate scrie sub forma:

1 n 2
∑ xi − x
2
n i =1

Dar, conform rela¡iilor (4.25), respectiv (4.28) aceasta este tocmai dispersia
de selec¡ie a variabilei X:

∑ ( xi − x ) = ∑ xi − x
1 n 2 1 n 2
s x2 = 2
(8.78)
n i =1 n i =1

Cu alte cuvinte, b se poate scrie sub forma:

b=
(
cov X ,Y e ). (8.79)
s x2

Pe de altå parte, se ¿tie cå:

cov ( X ,Y )
r= , (8.80)
s x2 ⋅ s y2

adicå:

cov (X,Y) = r ⋅ sx ⋅ sy . (8.81)

Rezultå:

r ⋅ sx ⋅ sy sy
b= =r . (8.82)
s x2 sx

¥n ceea ce îl prive¿te pe a, acesta se poate ob¡ine în func¡ie de b din rela¡ia:

167
∂G n n
= 0 → na + b ∑ x i = ∑ y ei (8.83)
∂a i =1 i =1

sau:

1 n e 1 n
a= ∑ yi − b ⋅ ∑ x i = y − bx . (8.84)
n i=1 n i =1

Aceea¿i expresie pentru a se putea ob¡ine aplicând operatorul medie ecua¡iei


(8.62):

M(y) = M(a + bx) = a + b M(x) . (8.85)

Rezultå:

a = M( y ) − b M( x ) = y − bx . (8.86)

ºinând cont de rela¡ia (8.82) se ob¡ine:

sy
a = y − bx = y − r x (8.87)
sx

Calculul corela¡iei ¿i regresiei liniare se defå¿oarå deci în modul urmåtor: se


determinå coeficientul de corela¡ie r ¿i dacå acesta pune în eviden¡å o legåturå
puternicå între cele douå variabile (în hidrologie se admite existen¡a unei
corela¡ii pentru |r| ≥ 0,7), se procedeazå la estimarea parametrilor dreptei de
regresie cu rela¡iile (8.82), respectiv (8.87).
Utilizând acelea¿i rela¡ii, dreapta de regresie a lui Y fa¡å de X se poate scrie ¿i
sub forma:

y = a + bx = y − bx + bx = y + b( x − x ) . (8.88)

sau:

sy
y −y =r
sx
(x − x ) . (8.89)

¥n mod similar, dreapta de regresie a lui X fa¡å de Y are expresia:

168
x −x =r
sx
sy
(y − y ) . (8.89')

Din aceste rela¡ii rezultå cå în sens geometric r este panta dreptei de regresie
în unitå¡i ale abaterii standard (Moineagu ¿.a., 1976).
Constantele:

sy sx
r ¿i r
sx sy

se numesc coeficien¡i de regresie liniarå.

8.3.5. INTERVALE DE ÎNCREDERE ÎN CAZUL


REGRESIEI LINIARE SIMPLE

• Intervale de încredere bilaterale ale parametrilor a ¿i b cu un prag de


semnifica¡ie α. Pe baza datelor din înregistråri se calculeazå conform rela¡iilor
(8.72), (8.73) sau a rela¡iilor (8.82) ¿i (8.87) parametrii a ¿i b ai dreptei de
regresie. Valorile ob¡inute reprezintå ni¿te estimåri ale valorilor adevårate ale
parametrilor, care se gåsesc în cadrul unor intervale de încredere, cu a ¿i b ca
valori centrale.
Limitele intervalelor pot fi ob¡inute cu rela¡iile:

A = a ± t . σa (8.90)

B = b ± t . σb . (8.91)

Dispersiile parametrilor a ¿i b se calculeazå cu formulele (Panaite,


Munteanu, 1982):

σ y2
σ = 2
a (8.92)
1 x2
+ n
( i )
n ∑ x −x 2
i =1

169
σ y2
σ b2 = (8.93)
∑ ( xi − x )
n 2

i=1

Deoarece dispersia σ y2 nu este cunoscutå, ea se evalueazå prin dispersia


rezidualå definitå de abaterile valorilor måsurate yie fa¡å de dreapta de regresie,
ai cårei parametri au fost ob¡inu¡i cu rela¡iile (8.72) ¿i (8.73) sau (8.82) ¿i (8.87):

1 n
( )
2
s y2 = ∑ yi − a − bx i
e
. (8.94)
n − 2 i=1

De notat cå dispersia rezidualå este o variabilå aleatoare Student cu n-2


grade de libertate (pe baza celor n valori au fost determina¡i 2 parametri: a ¿i b).
Fåcând înlocuirile respective, rezultå pentru un nivel de semnifica¡ie α
urmåtoarele expresii ale intervalelor de încredere:

+ x 2 / ∑ ( xi − x )
1 n 2
A=a ± t α ⋅ sy (8.95)
n− 2; n i=1
2

∑ ( xi − x ) ,
n 2
B=b ± t α ⋅ sy (8.96)
n− 2; i=1
2

unde t α este o variabilå Student cu n-2 grade de libertate ¿i pragul


n− 2 ;
2
α
bilateral .
2
*
• Interval de încredere bilateral a valorii medii y ob¡inutå prin regresie
*
pentru o valoare x oarecare. ¥n principiu, dacå a ¿i b sunt cunoscu¡i, valoarea
* *
medie y a variabilei explicate se calculeazå pentru o valoare oarecare x a
variabilei explicative cu rela¡ia:
* *
y = a + bx . (8.97)

*
Intervalul de încredere bilateral care con¡ine valoarea medie y cu un prag de
semnifica¡ie α este (Panaite, Munteanu, 1982):

170
(x )
2
*
−x
Y * = y* ± t α ⋅ sy 1+ (8.98)
∑ ( xi − x )
n− 1; n 2
2
i=1

• Interval de încredere bilateral pentru panta dreptei de regresie care


trece prin origine. ¥n foarte multe cazuri practice dreapta de regresie trece prin
origine, adicå x = 0 → y = 0. Ecua¡ia dreptei va fi: y = bx.
Dispersia lui b este:

n
σ b2 = σ y2 / ∑ x i2 (8.99)
i =1

Pentru un nivel de semnifica¡ie α, conform rela¡iei (8.91) intervalul bilateral


care îl con¡ine pe b este:

n
B=b ± t α ⋅ sy ∑ xi ,
2
(8.100)
n− 1; i=1
2

unde:

1 n e
( )
2
sy = ∑ yi − bx i , (8.101)
n − 1 i=1

iar t α are n-1 grade de libertate (s-a determinat un singur parametru ¿i


n−1;
2
anume b).

8.3.6. REGRESIA NELINIARÅ SIMPLÅ

¥n cazul în care curba de regresie este neliniarå, parametrii curbei pot fi


determina¡i prin urmåtoarele metode:
− aplicarea metodei celor mai mici påtrate, care revine la anularea
derivatelor func¡iei obiectiv în raport cu parametrii, rezultând un sistem de
ecua¡ii neliniare, dificil de rezolvat în general;
− prin trecerea la un nou sistem de coordonate, în care dependen¡a între
variabile este de tip liniar (J. Llamas, 1993).

171
Ultimul procedeu este aplicat curent în hidrologie. Fie de exemplu legåtura
între debitele maxime specifice cu probabilitatea de depå¿ire de 1% (q1%) ¿i
suprafe¡ele F ale bazinelor de recep¡ie. Evident, dependen¡a dintre cele douå
rânduri de valori este neliniarå (fig. 8.8, a); prin logaritmare rezultå înså o
rela¡ie liniarå (fig. 8.8, b).

Fig. 8.8. Dependen¡a F-q1% (a) ¿i log F - log q1% (b).

Ecua¡ia dreptei prin tåieturi în noul sistem de coordonate este:

log q1% log F


+ =1 . (8.102)
a b

¥n continuare, se ob¡ine:

a A
log q1% = a − log F = log A − B log F = log B . (8.103)
b F

Rezultå tipul de dependen¡å în vechiul sistem de coordonate:

A
q1% = , (8.104)
FB

unde A ¿i B reprezintå parametrii rela¡iei neliniare dintre F ¿i q1%.


¥n acest caz tipul de dependen¡å a rezultat indirect, pornind de la
reprezentarea graficå a datelor din måsuråtori.

172
Fig. 8.9. Liniarizarea prin schimbarea sistemului de coordonate:
a - sistemul ini¡ial; b - noul sistem de coordonate.

¥n general, func¡ia de regresie neliniarå cea mai adecvatå pentru diversele


dependen¡e hidrologice este cunoscutå ¿i se pune doar problema determinårii
parametrilor. Ace¿tia se ob¡in a¿a cum s-a aråtat prin liniarizarea ecua¡iei
propuse.
bx
Fie de exemplu o curbå exponen¡ialå de tipul: y = ae .
Prin logaritmare se ob¡ine: ln y = ln a + bx, care poate fi scriså sub forma
Y = A + BX (ecua¡ia unei drepte).
Se ob¡ine deci coresponden¡a (fig. 8.9):

Y = ln y; X=x

A = ln a; B=b. (8.105)

Cu alte cuvinte, un punct având coordonatele (xi, yi) în vechiul sistem se va


transforma în punctul (Xi, Yi) din noul sistem de coordonate dupå regula:

Xi = xi

Yi = ln yi . (8.106)

¥n acest sistem de coordonate se cautå apoi parametrii A ¿i B ai dreptei de


regresie care trece cel mai bine printre puncte (ponderea punctelor de deasupra
dreptei så fie egalå cu ponderea celor de dedesubtul ei).
Dupå determinarea lui A ¿i B, se ob¡in prin transformare inverså parametrii
a ¿i b. Astfel, în cazul considerat:
A
a=e

173
b=B. (8.107)

Dispunând acum de a ¿i b, se pot calcula valorile cele mai probabile (valorile


medii) ale variabilei explicate Y pentru orice valoare X = x a variabilei
explicative.
Câteva exemple de liniarizare a rela¡iilor neliniare curent utilizate în
hidrologie sunt prezentate în tabelul 8.4 (Vladimirescu, 1984).

Tabelul 8.4

Ecua¡ia Schimbarea de variabile Ecua¡ia liniarizatå


x
y = ab Y = log y X=x Y = log a + X log b
b
y = ax Y = log y X = log x Y = log a + bx
bx
y = ae Y = ln y X=x Y = ln a + bx
a 1 b c
y= Y= X=x Y= + X
b + cx y a a

8.3.7. RAPORTUL DE CORELAºIE

Raportul de corela¡ie sau indicele de corela¡ie curbilinie constituie o måsurå


nesimetricå a dependen¡ei stohastice a douå variabile aleatoare.
Prin defini¡ie, raportul de corela¡ie al variabilei Y în raport cu variabila X
este:

σ ye2 Y X
R yx = 1 − , (8.108)
σ 02
unde:
σ ye2 Y X - reprezintå dispersia valorilor empirice yie fa¡å de valorile
teoretice (estimate prin ecua¡ia de regresie neliniarå Y X );
2
σ0 - dispersia valorilor empirice yie de la media acestora:

1 n e
y0 = ∑ yi . (8.109)
n i =1

Expresiile dispersiilor sunt:

1 n
( )
2
σ y2e YX = ∑ YXi − yi
e
(8.110)
n i=1

174
1 n
σ 02 = ∑ ( yi − y 0 ) .
e 2
(8.111)
n i =1

¥n expresia dispersiei valorilor empirice fa¡å de valorile teoretice, Y X i

reprezintå valoarea medie condi¡ionatå a lui Y X pentru valoarea X=xi a


variabilei explicative.
Fåcând înlocuirile în expresia raportului de corela¡ie se ob¡ine:

( )
n 2
∑ YXi − yi
e

Ryx = 1− i=1
. (8.112)
∑ (y −y )
n 2
e
i 0
i=1

¥n continuare se va ob¡ine o expresie echivalentå pentru calculul lui Ryx.


n
Fie varia¡ia totalå ∑ ( y ei − y 0 ) 2 a valorilor variabilei empirice fa¡å de
i =1
valoarea medie y 0 .
Se poate scrie:

n n
∑ ( yi − y0 ) = ∑ ( yi − YXi + YXi − y0 ) =
e 2 e 2

i=1 i=1
(8.113)
n n
=∑ ( yie − YXi ) + ∑ (YXi − y0 ) ,
2 2

i=1 i=1

n
deoarece ∑ ( yie − YXi )(YXi − y0 ) = 0 .
i=1
Rezultå:

n n n
∑ ( yi − YXi ) = ∑ ( yi − y0 ) − ∑ (YXi − y0 ) .
e 2 e 2 2
(8.114)
i=1 i =1 i=1

¥nlocuind rela¡ia (8.114) în expresia raportului de corela¡ie se ob¡ine:

( )
n 2
∑ YXi − y0
Ryx = i =1
(8.115)
( )
n 2
∑ yie − y0
i=1

175
¥n aceastå rela¡ie Y X i reprezintå valorile teoretice ale variabilei Y (ob¡inute

prin particularizarea variabilei explicative X = xi în ecua¡ia neliniarå de


e
regresie); yi sunt valorile înregistrate, iar y 0 media lor.
Raportul de corela¡ie este în fond o compara¡ie între dispersia valorilor
teoretice (de pe ecua¡ia de regresie) fa¡å de medie ¿i dispersia valorilor empirice
fa¡å de medie (Moineagu ¿.a., 1976).
Este evident cå: Ryx ≠ Rxy (raportul de corela¡ie este nesimetric spre
deosebire de coeficientul de corela¡ie care este simetric: ryx = rxy).
¥n principiu, sunt valabile urmåtoarele rela¡ii:

2 2
0 ≤ r x,y
≤ R x,y ≤ 1

¿i (8.116)

2 2
0 ≤ r y,x
≤ R y,x ≤ 1 .

Dacå curba de regresie este o dreaptå, raportul de corela¡ie ¿i coeficientul de


corela¡ie sunt egale. ¥n general înså coeficientul de corela¡ie este inferior
raportului de corela¡ie.
Explica¡ia constå în faptul cå coeficientul de corela¡ie presupune automat o
rela¡ie liniarå de dependen¡å stohasticå între variabile; în condi¡iile în care
legåtura dintre variabile este curbilinie, este evident cå o rela¡ie neliniarå va
aproxima mai bine aceastå dependen¡å ¿i deci intensitatea legåturii (exprimatå
prin raportul de corela¡ie) va fi mai bunå decât în cazul liniar (adicå mai aproape
de 1).
Dacå legåtura dintre variabile este de tip liniar, coeficientul de corela¡ie se
poate calcula ¿i cu formula raportului de corela¡ie:

( )
n 2
∑ Yxi − y 0
r= i=1
. (8.115')
( )
n 2
∑ yie − y0
i =1

176
Se atrage înså aten¡ia cå valorile teoretice Y x i sunt ob¡inute cu o rela¡ie de
tipul:

Y x i = a + bx i (8.117)
(cu alte cuvinte trebuie întâi estima¡i parametrii a ¿i b ai dreptei de regresie).
Dacå variabilele X ¿i Y sunt independente, atunci:

r=0; Rx,y = 0 ; Ry,x = 0 , (8.118)

iar graficele func¡iilor de regresie sunt drepte paralele cu axele de


coordonate.
¥n sfâr¿it, dacå variabilele sunt în dependen¡å de tip determinist y = f(x),
atunci Rx,y = Ry,x = 1, iar graficele func¡iilor de regresie coincid cu graficul
func¡iei y = f(x).

8.4. CORELAºII LINIARE MULTIPLE

Principiile care stau la baza calculelor unei corela¡ii liniare simple se aplicå
¿i în cazul corela¡iei liniare multiple.
Fie de exemplu o regresie de tipul:

Yx1 ,..., xm = a + b1 x 1 + b2 x 2 +...+ bm x m . (8.119)

Calculul parametrilor se face tot prin metoda celor mai mici påtrate,
urmårindu-se gåsirea hiperplanului care trece cel mai bine printre punctele
e
empirice yi .

( )
n 2
G = ∑ Yx1 , x2 ..., xm − yie → minim (8.120)
i
i =1

∂G ∂G ∂G
=0 ; =0 ; ... ; =0 . (8.121)
∂a ∂b1 ∂bm

Rezultå urmåtorul sistem de ecua¡ii:

177
n n n n
na + b1 ∑ x 1i + b2 ∑ x 2i +...+ bm ∑ x mi = ∑ yie
i=1 i=1 i=1 i=1

n n n n n
a ∑ x 1i + b1 ∑ x 12i + b2 ∑ x 1i x 2i +...+ bm ∑ x 1i x mi = ∑ yie x 1i
i=1 i=1 i=1 i=1 i=1

(8.122)
n n n n n
a ∑ x 2i + b1 ∑ x 1i x 2i + b2 ∑ x 2i2 +...+ bm ∑ x 2i x mi = ∑ yie x 2i
i=1 i=1 i=1 i=1 i=1

...........................................................................
n n n n n
a ∑ x mi + b1 ∑ x 1i x mi + b2 ∑ x 2i x mi +...+ bm ∑ x mi
2
= ∑ yie x mi
i=1 i=1 i=1 i=1 i=1

sau scris matricial:

AX = B , (8.123)

t
unde X = (a, b1, b2, ....., bm) este vectorul necunoscutelor, A matricea
coeficien¡ilor, iar B termenul liber.
De aici rezultå:
-1
X=A ⋅B (8.124)

adicå evaluarea necunoscutelor presupune inversarea matricii coeficien¡ilor


¿i înmul¡irea cu vectorul termenilor liberi.
La o rela¡ie asemånåtoare se ajunge ¿i în cazul în care ecua¡ia de regresie
este de tipul:

Yx1x2 ...xm = a + b1 x 1 + b2 x 22 +...+ bm x mm (8.125)

(ecua¡ia este o regresie liniarå multiplå în raport cu parametrii a, b1, b2, ... etc).
¥n sfâr¿it, dacå regresia este de tipul:

Y x 1 x 2 ... x m = ax 1b1 x b22 ... x bmm , (8.126)

prin logaritmare se ajunge din nou la o regresie liniarå multiplå ¿i deci se


poate aplica procedeul expus anterior.

178
8.4.1. COEFICIENTUL CORELAºIEI LINIARE MULTIPLE

Intensitatea legåturii liniare multiple între variabila explicatå Y ¿i variabilele


explicative X1, X2, ..., Xm se måsoarå prin coeficientul corela¡iei multiple
ryx 1 x 2 ... x m (Moineagu ¿.a., 1976):

( )
n 2
∑ Yx1 x 2 ...x m i − yi
e

ryx1 x 2 ...x m = 1− i=1


(8.127)
( )
n 2
∑ yie − y0
i=1

Cu cât valorile empirice yie se abat mai pu¡in fa¡å de curba de regresie
multiplå, cu atât coeficientul de corela¡ie are o valoare mai mare ¿i corela¡ia este
mai intenså.
La limitå, dacå toate punctele verificå ecua¡ia de regresie atunci:

y ei = Y x 1 x 2 ... x m ( x i ) (8.128)

¿i deci:

ryx 1 x 2 ... x m = 1 . (8.129)

Coeficientul de corela¡ie liniarå multiplå ryx 1 x 2 ... x m se poate determina ¿i cu


rela¡ia (Moineagu ¿.a., 1976):
2
− ⎛⎜ ∑ yie ⎞⎟
n n n 1 n
a ∑ yie + b1 ∑ x 1i yie +...+ bm ∑ x mi yie
ry x1x2 ...xm = i=1 i =1 i=1 n ⎝ i=1 ⎠ . (8.130)
( )
2
n 2 1⎛ n e⎞
∑ i y e
− ⎜∑ i ⎟y
i =1 n ⎝ i =1 ⎠

Acest coeficient måsoarå influen¡a globalå a ansamblului variabilelor


X1, X2, ... Xm asupra variabilei Y. Se pot defini ¿i coeficien¡i ai corela¡iei par¡iale
dintre variabila Y ¿i o singurå variabilå Xj, j ∈ {1, ..., n}, restul variabilelor fiind
considerate constante.
Astfel, în cazul a trei variabile se pot defini:
− coeficientul corela¡iei par¡iale dintre Y ¿i X1, variabila X2 fiind constantå
(se eliminå în acest fel influen¡a varia¡iei lui X2):

179
ry x1 − ry x2 ⋅ rx1 x2
ry x1⋅x2 = (8.131)
1 − ry2x2 1 − rx21 x2

− coeficientul corela¡iei par¡iale dintre Y ¿i X2, variabila X1 fiind constantå:

ry x2 − ry x1 ⋅ rx1 x2
ry x2⋅x1 = . (8.132)
1 − ry2x1 1 − rx21 x2

¥n aceste rela¡ii coeficien¡ii corela¡iei simple (ry x1 , ry x 2 , rx1 x 2 ) se numesc


coeficien¡i de ordinul zero, iar ryx 1 ⋅ x 2 ¿i ryx 2 ⋅ x 1 - coeficien¡ii corela¡iei par¡iale
de ordinul 1.
Cu ajutorul coeficien¡ilor corela¡iei simple se poate calcula ¿i coeficientul
corela¡iei multiple; astfel:

ry2x1 + ry2x2 − 2ry x1 ⋅ ry x2 ⋅ rx1 x2


ry x1 x2 = . (8.133)
1 − rx21 x2

¥n cazul a patru variabile, coeficien¡ii corela¡iei par¡iale se calculeazå cu


ajutorul coeficien¡ilor par¡iali de ordinul 1 (Moineagu ¿.a., 1976):

ry x1⋅x2 − ry x3 x2 rx1⋅x3 ⋅x2


ry x1⋅x2⋅x3 = . (8.134)
1 − ry2x3 ⋅x2 1 − rx21⋅x3 ⋅x2

(
Ceilal¡i coeficien¡i ry x2⋅x1x3 ) ¿i ( r y x 3 ⋅ x1x 2 ) se ob¡in din rela¡ia anterioarå prin
permutåri circulare ale indicilor.

8.4.2. AUTOCORELAºIA SAU CORELAºIA SERIALÅ

¥n hidrologie prezintå interes în ce måsurå fenomenele analizate au memorie;


considerând de exemplu ¿irul debitelor medii lunare, medii anuale sau maxime
anuale se pune problema dacå valorile dintr-un anumit interval sunt dependente
de valorile din intervalul sau intervalele anterioare.

180
Dacå o asemenea corela¡ie poste fi identificatå, regularizarea debitelor
necesitå volume mai mari ale lacurilor de acumulare decât în lipsa corela¡iei
respective.
Dependen¡a dintre o mårime luând valorile xi ¿i ea înså¿i dar decalatå (având

valorile xi-k) se nume¿te autocorela¡ie sau corela¡ie serialå. Decalajul k, având


semnifica¡ia unui numår de intervale, reprezintå ordinul autocorela¡iei.
O corela¡ie serialå de ordinul 1 înseamnå o legåturå între ¿irurile:

{x1 x2 ... xn}

{x2 x3 ... xn+1}

iar o corela¡ie serialå de ordinul 2 va urmåri stabilirea dependen¡ei dintre


¿irurile:

{x1 x2 ... xn}

{x3 x4 ... xn+2}

Gradul de legåturå dintre aceste ¿iruri poartå numele de coeficient de


corela¡ie serialå sau de autocorela¡ie.
Coeficientul de ordinul k se calculeazå cu rela¡ia (Vladimirescu, 1984):

1 n− k 1 ⎛ n − k x ⎞ ⎛ n− k x ⎞
∑ xi xi+ k − ⎜
2 ⎝ ∑ i⎟ ⎜ ∑ i+ k ⎟

rk =
n − k i =1 (n − k ) i =1 ⎠ ⎝ i=1 ⎠
2 2
1 n− k 2 1 ⎛ n− k x ⎞ 1 n− k 2 1 ⎛ n− k x ⎞
∑ xi − ⎜
2 ⎝ ∑ i⎟ ∑ xi+ k − ⎜
2 ⎝ ∑ i+k ⎟
n − k i=1 (n − k ) i=1 ⎠ n − k i =1 (n − k ) i=1 ⎠
(8.135)

Cu cât ordinul k este mai mare, cu atât coeficientul de autocorela¡ie rk este


mai slab. ¥n practicå prezintå un interes special coeficientul de autocorela¡ie de
ordinul unu, care este utilizat în problemele de generare matematicå a debitelor.

181
8.5. GENERAREA DEBITELOR

Existå numeroase situa¡ii în hidrologie ¿i în special în gospodårirea apelor în


care ¿irul de date înregistrate este insuficient.
De exemplu, se pune problema stabilirii volumului unui lac de acumulare
pentru care se cunosc cerin¡ele de apå care trebuie satisfåcute în perspectivå
(peste 10 ... 20 ani sau chiar mai mult). Este evident cå nu se pot anticipa
debitele râului (¿i mai ales succesiunea lor) în situa¡ia corespunzåtoare
func¡ionårii lacului. Se folosesc atunci debitele medii lunare înregistrate în
trecut (debite care acoperå în general o perioadå de 20 ... 40 ani).
Bineîn¡eles aceste debite nu se vor înregistra identic în viitor, dar dacå au
fost prinse situa¡ii caracteristice pe râu (ani ploio¿i, ani seceto¿i, succesiuni de
ani ploio¿i ¿i ani seceto¿i etc.) atunci se pot trage concluzii de naturå statisticå
privind volumul necesar al lacului de acumulare, care så satisfacå cu o
probabilitate datå cerin¡ele de apå.
Eventual, pentru a ob¡ine ¿i alte succesiuni de debite în afara celor
înregistrate se poate proceda la amestecarea ¿irurilor de date anuale (de exemplu
se pot grupa to¡i anii seceto¿i la începutul perioadei de calcul, iar anii ploio¿i la
sfâr¿it); evident procedeul este criticabil. O modalitate mai elegantå de a
produce alte succesiuni de date în afara celor înregistrate, constå în generarea
artificialå de noi valori hidrologice. Dintr-un ¿ir de 20 .... 40 de ani de valori
înregistrate se pot ob¡ine debite generate pentru perioade oricât de mari (100,
500, 1000 de ani etc.).
Ca o condi¡ie esen¡ialå, procedeul de generare utilizat trebuie så conducå la
conservarea valorii medii, a coeficientului de varia¡ie ¿i asimetrie; cu alte
cuvinte se urmåre¿te ob¡inerea unor valori ale ¿irului generat sau sub¿irurilor
sale cu caracteristici statistice apropiate de ale ¿irului de date de bazå.
Generarea de valori sintetice nu conduce la ob¡inerea de noi informa¡ii
privind hidrologia râului, ci permite doar ob¡inerea unei diversitå¡i de succesiuni
posibile ale debitelor în condi¡iile conservårii informa¡iei ini¡iale sau a celei mai
mari pår¡i a acesteia.
Dispunând de aceastå varietate de situa¡ii posibile a se realiza în viitor,
dimensionarea ¿i exploatarea lacului sunt mai temeinic fundamentate.
Un aspect important de care trebuie så se ¡inå seama este faptul cå debitele
unui râu reprezintå în general ¿iruri cu autocorela¡ie; cel mai des este utilizatå
autocorela¡ia dupå un pas.
Pentru exemplificarea procedeului de generare se vor prezenta cazurile
debitelor medii anuale cu autocorela¡ie.
Fie pentru început cazul generårii debitelor anuale cu reparti¡ie normalå.
Rela¡ia de recuren¡å a modelului de generare este (Simon, Vi¿an, 1974):

182
( )
Qi = Q + r1 Qi−1 − Q + σ t i 1 − r12 , (8.136)

unde:
Qi este debitul mediu generat al anului i;
Qi-1 are aceia¿i semnifica¡ie, dar pentru anul i-1;

Q este debitul mediu multianual al datelor întegistrate;


σ - abaterea standard a acelora¿i valori;
r1 - coeficientul de autocorela¡ie de ordinul 1 al valorilor
înregistrate;
ti - variabila aleatoare normalå normatå, generatå, având media
zero ¿i abaterea standard unu.

Acest model conservå media, abaterea medie påtraticå ¿i coeficientul de


autocorela¡ie introdu¿i ca parametri ini¡iali.
¥n cazul generårii debitelor medii anuale autocorelate cu alte reparti¡ii decât
cea normalå, rela¡ia de generare utilizatå este asemånåtoare (Simon, Vi¿an,
1974):

( )
Q i = Q + r1 Q i −1 − Q + σγ i 1 − r12 , (8.137)

unde:

3
2 ⎡ C srt i C sr ⎤ 2
γi = ⎢1 + 6 − 36 ⎥ − C , (8.138)
C sr ⎣ ⎦ sr

iar:

1 − r13
C sr = C s . (8.139)
( )
3/ 2
1 − r12

Restul mårimilor î¿i påstreazå semnifica¡iile anterioare. Acest model asigurå


conservarea în procesul de generare a parametrilor Q , σ, Cs ¿i r1.
Generarea debitelor medii lunare autocorelate constituie o problemå mai
delicatå din cauza caracterului nesta¡ionar al procesului (mediile lunare

183
multianuale ca ¿i abaterea medie påtraticå, coeficientul de autocorela¡ie ¿i
coeficientul de asimetrie diferå de la lunå la lunå).
ªi mai dificilå este generarea debitelor medii lunare în mai multe sec¡iuni ale
unui bazin hidrografic, caracterizat de existen¡a unor legåturi spa¡iale ¿i
temporale ale variabilelor aleatoare (Simon, Vi¿an, 1974; Giurma, Hogea,
1985 etc).

184
BIBLIOGRAFIE

1. Bobée, B., Eléments de statistiques. Université Pierre et Marie Curie -


Paris 6; Ecole des Mines de Paris, Paris, 1991.

2. Chow, V. T., Handbook of applied hydrology, New York, 1964.

3. Cicioni, G., Giuliano, G., Spaziani, F., Best fitting of probability functions
to a set of data for flood studies, Institute for Water Research, National
Research Council, Italy, 1982.

4. Constantinescu, M., Goldstein, M., Haram, V., Solomon, S., Hidrologie,


Editura Tehnicå, Bucure¿ti, 1956.

5. Diaconu, C., Låzårescu, D., Hidrologie generalå; prelegeri pentru


cursuri postuniversitate, I.C.B., 1977.

6. Diaconu, C., Låzårescu, D., Hidrologie, Editura Didacticå ¿i Pedagogicå,


Bucure¿ti, 1965.

7. Dinescu, C., Såvulescu, V., Decizii în probleme economice, Probleme,


cazuri, Editura Didacticå ¿i Pedagogicå, Bucure¿ti, 1978.

8. Dinescu, C., Såvulescu, B., Vasiliu, D., Metode matematice pentru


fundamentarea deciziilor în produc¡ie, Editura Tehnicå, Bucure¿ti, 1986.

9. Drobot, R., Estimarea raportului Cs/ Cv, utilizând tehnici ale cercetårii
opera¡ionale, Revista Hidrotehnica, Bucure¿ti, vol. 34, nr. 10, 1989.

10. Giurma, I., Hogea, V., Contribu¡ii la generarea de ¿iruri de valori


hidrologice, care se succed în mod cronologic, Revista Hidrotehnica, Bucure¿ti,
vol. 30, nr. 6, 1985.

11. Hâncu, S., Stånescu, P., Platagea, Gh., Hidrologie agricolå, Editura
Ceres, Bucure¿ti, 1975.

185
12. Iliescu, D. V., Vodå, V., Gh., Statisticå ¿i toleran¡e, Editura Tehnicå,
Bucure¿ti, 1977.
e
13. Llamas, J., Hydrologie générale. 2 édition. Gaëtan Morin - éditeur,
Québec, 1993.

14. van der Made, J.W., Casebook of methods for computing hydrological
parameters of water projects, UNESCO, 1987.

15. Manoliu, M., Roman, P., Metode statistice de calcul ¿i prelucrare a


datelor hidrologice ¿i de calitate a apelor, Institutul Politehnic Bucure¿ti, 1983.

16. Meylan, P., Musy, A., Hydrologie fréquentielle, EPFL, 1996.

17. Mihåilå, M., Introducere în teoria probabilitå¡ilor ¿i statisticå


matematicå, Editura Didacticå ¿i Pedagogicå. Bucure¿ti, 1965.

18. Mihoc, Gh., Muja, A., Diatcu, E., Bazele matematice ale teoriei
fiabilitå¡ii, Editura Dacia, Cluj-Napoca, 1976.

19. Mociorni¡å, C., Dincå, A., Blindåråu, Al., Instruc¡iuni pentru calculul
viiturilor teoretice pe râuri mari, I.M.H., 1979.

20. Moineagu, C., Negurå, I., Urseanu, V. , Statisticå, Editura ªtiin¡ificå


¿i Enciclopedicå, Bucure¿ti, 1976.

21. Panaite, V., Munteanu, R., Control statistic ¿i fiabilitate. Editura


didacticå ¿i Pedagogicå, Bucure¿ti, 1982.

22. Pârvulescu, C., Economia apelor, I.C.B., 1978.

23. Såcuiu, I., Zorilescu, D., Numere aleatoare. Editura Academiei,


Bucure¿ti, 1978.

24. Schulz, E.F., Problems in Applied Hydrology, Water Resources


Publications, 1989.

25. Shahin, M., van Oorschot, H.J.L., de Lange, S.J., Statistical Analysis
in Water Resources Engineering. A.A. Balkema, Rotterdam, 1993.

186
26. Simon, Al., Vi¿an, V., Generarea debitelor medii lunare în mai multe
sec¡iuni ale bazinului hidrografic. Studii de Economia apelor. ICPGA-CNA,
Bucure¿ti, 1974.

27. Stånescu, V. Al., Statisticå matematicå aplicatå în hidrologie


(nepublicatå), Bucure¿ti, 1985.

28. STAS 4068/1-82, Determinarea debitelor ¿i volumelor maxime ale


cursurilor de apå.

29. Våduva, I., Modele de simulare cu calculatorul, Editura Tehnicå,


Bucure¿ti, 1977.

30. Vladimirescu, I., Hidrologie, Prelegeri pentru cursurile


postuniversitare, I.C.B., 1978.

31. Vladimirescu, I., Hidrologie, Editura Didacticå ¿i Pedagogicå,


Bucure¿ti, 1978.

32. Vladimirescu, I., Bazele hidrologiei tehnice, Editura Tehnicå,


Bucure¿ti, 1984.

33. Yevjevich, V., Probability and statistics in Hydrology, Water


Resources Publications, Fort Collins, Colorado, USA, 1972.

34. XXX, Râurile României. Monografie hidrologicå. I.M.H. Bucure¿ti,


1971.

35. XXX, Dic¡ionar de matematici generale, Editura Enciclopedicå


Românå, Bucure¿ti, 1974.

187

S-ar putea să vă placă și