Documente Academic
Documente Profesional
Documente Cultură
Chinese Knotting Tutorial
Chinese Knotting Tutorial
BAZELE STATISTICE
ALE HIDROLOGIEI
Autorul
CUPRINS
1. GENERALITźI ................................................................................... 7
1.1. Statisticå matematicå. Defini¡ie......................................................... 7
1.2. Variabile deterministe. Variabile aleatoare ....................................... 7
1.3. Clasificarea variabilelor aleatoare ..................................................... 8
1.4. Popula¡ie statisticå. Selec¡ie .............................................................. 9
1.5. Frecven¡å absolutå. Frecven¡å relativå. Probabilitate.......................... 10
1.6. Reparti¡ii teoretice. Reparti¡ii empirice .............................................. 12
5
5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE .............. 85
5.1. Reparti¡ia normalå ............................................................................ 85
5.2. Aplica¡ii ale reparti¡iei normale în hidrologie .................................... 92
5.3. Reparti¡ia log-normalå (logaritmic normalå) ...................................... 100
5.4. Reparti¡iile Gama .............................................................................. 105
5.4.1. Reparti¡ia Γ1 ................................................................................ 106
5.4.2. Reparti¡ia Γ2 ................................................................................ 108
5.4.3. Reparti¡ia Γ3 ................................................................................ 115
5.4.4. Corec¡ia de siguran¡å ∆Qp% .......................................................... 125
5.5. Reparti¡ia Gumbell ............................................................................ 126
5.6. Reparti¡ii statistice auxiliare .............................................................. 127
6
1. GENERALITźI
7
de cauzele care îl produc, iar variabilele care îl caracterizeazå capåtå un
pronun¡at caracter aleator.
¥ntr-un limbaj simplist, o variabilå aleatoare este o mårime care, ca rezultat
al unui experiment, poate lua o valoare oarecare din domeniul såu de defini¡ie,
fårå så se poatå preciza dinainte care va fi aceastå valoare. Realizarea unei
anumite valori a variabilei aleatoare are deci un caracter pur întâmplåtor;
termenul sinonim de variabilå stohasticå eviden¡iazå tocmai acest aspect (în
limba greacå stohosis înseamnå presupunere sau conjuncturå). De exemplu, prin
aruncarea unui zar perfect omogen nu se poate anticipa care fa¡å va fi deasupra
dupå cådere. La fel nu se pot preciza dinainte debitele maxime anuale care se
vor realiza în viitor pe un curs de apå.
¥n hidrologie sunt utilizate atât metode ¿i modele deterministe, cât ¿i metode
¿i modele probabilistice, alegerea unei abordåri sau a celeilalte depinzând de
cantitatea de informa¡ii disponibile sau de gradul de cunoa¿tere a fenomenului
analizat. La transformarea precipita¡iilor în componente ale scurgerii, se poate
admite de exemplu cå distribu¡ia acestora depinde numai de intensitatea ploii ¿i
umiditatea solului, ignorând restul factorilor care au o influen¡å mai reduså. ¥n
aceste condi¡ii este posibilå stabilirea unei legåturi cauzå-efect, de tip
determinist. ¥n mod similar se petrec lucrurile ¿i la evaluarea evapotranspira¡iei
de la suprafa¡a apei, considerându-se cå aceasta depinde numai de viteza
vântului ¿i deficitul de umiditate al aerului.
¥n schimb, dacå se examineazå regimul debitelor maxime viitoare ale unui
râu - regim care depinde atât de factori locali cum sunt cei fiziografici, cât ¿i
generali, de tip climatic (¿i a cåror evolu¡ie nu este cunoscutå) - o abordare de
tip determinist este imposibil de realizat, pentru evaluarea debitelor maxime
necesare proiectårii construc¡iilor hidrotehnice utilizându-se metode statistice.
Variabilele aleatoare sunt de tip discret, atunci când iau o mul¡ime finitå sau
cel mult numårabilå de valori (se reaminte¿te cå o mul¡ime numårabilå este
infinitå, putând fi puså în coresponden¡å cu ¿irul numerelor naturale care este
infinit). Variabilele aleatoare care pot lua doar un numår finit de valori se
numesc variabile simple ¿i constituie un caz particular al variabilelor discrete;
acestea sunt de altfel utilizate în prelucrårile hidrologice.
Variabilele aleatoare sunt continue, atunci când mul¡imea valorilor lor este
nenumårabilå; cu alte cuvinte o variabilå aleatoare continuå, poate lua orice
valoare în intervalul ei de varia¡ie sau la limitå între -∞ ¿i +∞.
Variabilele aleatoare mai pot fi clasificate în variabile dependente ¿i
independente. Din punct de vedere intuitiv, douå sau mai multe variabile
aleatoare sunt independente dacå probabilitatea producerii uneia nu depinde de
8
faptul dacå celelalte s-au realizat sau nu. ¥n caz contrar, variabilele vor fi
dependente.
Prin popula¡ie statisticå se în¡elege orice colectivitate care face obiectul unui
studiu statistic. Deoarece scopul unui astfel de studiu îl constituie stabilirea unei
legi cantitative referitor la colectivitatea analizatå, popula¡ia statisticå poate fi
interpretatå drept mul¡imea tuturor valorilor posibile ale unei variabile
aleatoare. Elementele componente ale unei popula¡ii se numesc unitå¡i ale
popula¡iei. Numårul N al unitå¡ilor unei popula¡ii constituie volumul popula¡iei.
¥n func¡ie de volumul popula¡iei, se disting popula¡ii finite (cu numår finit de
unitå¡i) ¿i popula¡ii infinite (cu un numår nelimitat de unitå¡i).
Cercetarea statisticå a unei popula¡ii se realizeazå urmårind o anumitå
caracteristicå a unitå¡ilor ce formeazå popula¡ia respectivå. Cercetarea totalå
(a tuturor unitå¡ilor unei popula¡ii) nu este înså nici posibilå ¿i nici necesarå în
anumite cazuri; se recurge atunci la cercetarea unor e¿antioane sau selec¡ii,
putându-se trage concluzii referitoare la caracteristicile întregii popula¡ii.
¥n hidrologie, de exemplu, nu se dispune de întrega gamå de valori posibile
ale unor variabile aleatoare ca: debite, niveluri, precipita¡ii, temperaturi. Aceastå
situa¡ie se explicå prin faptul cå marea majoritate a sta¡iilor hidrologice sau
posturilor hidrometrice au o duratå de func¡ionare care de obicei nu depå¿e¿te
30-40 ani, singura excep¡ie constituind-o la noi în ¡arå Dunårea, pentru care se
dispune de înregistråri din anul 1838.
Cu alte cuvinte, în locul popula¡iei statistice se dispune de o mul¡ime finitå
de elemente observate : x1, x2,... xn, adicå de o selec¡ie sau e¿antion de volum n,
unde n este numårul elementelor observate. Ca urmare, în hidrologie se pune
problema de a determina o serie de caracteristici (debit cu o anumitå
probabilitate de depå¿ire, valoare medie, abatere medie påtraticå etc.) ale unei
popula¡ii statistice, de¿i datele disponibile au un volum limitat n.
Mai mult decât atât, dacå s-ar considera o altå selec¡ie, de asemenea de
volum n (dar referitoare la altå perioadå de observa¡ii), parametrii celor douå
selec¡ii ar fi diferi¡i, de¿i selec¡iile fac parte din aceea¿i popula¡ie statisticå.
Varia¡iile rezultate de la o selec¡ie la alta se numesc fluctua¡ii de selec¡ie.
Este evident cå, cu cât numårul observa¡iilor (sau volumul selec¡iei) este mai
mare, cu atât semnifica¡ia rezultatelor ob¡inute va fi mai ridicatå.
¥n hidrologie se considerå în mod obi¿nuit cå o selec¡ie de volum n > 30
oferå o precizie suficientå a calculului; atunci când volumul selec¡iei este prea
mic (n < 30), pentru a se elimina erorile la determinarea parametrilor statistici
9
vor trebui introduse anumite corec¡ii (de exemplu pentru coeficientul de varia¡ie
sau coeficientul de asimetrie).
Statistica matematicå utilizeazå metode care permit ob¡inerea unor
caracteristici ale unei popula¡ii, numai prin cercetarea directå a unei par¡i nu
prea mari din unitåtile popula¡iei. O asemenea cercetare selectivå va conduce la
concluzii care au un anumit grad de incertitudine care nu trebuie pierdut din
vedere la valorificarea ¿i interpretarea rezultatelor.
Pentru ca rezultatele ob¡inute prin studierea unui e¿antion så reflecte cât mai
corect caracteristicile popula¡iei din care a fost selec¡ionat, trebuie îndeplinite
urmåtoarele condi¡ii (C.Dinescu, V.Såvulescu, 1978):
a) popula¡ia din care se extrage selec¡ia så fie cât mai omogenå;
b) volumul selec¡iei så fie cât mai mare;
c) toate unitå¡ile care formeazå selec¡ia så fie extrase la întâmplare din
popula¡ia studiatå;
d) fiecare unitate a popula¡iei så aibå aceea¿i probabilitate de a face parte
din selec¡ie.
¥n cazul hidrologiei, unele condi¡ii nu sunt îndeplinite decât într-o måsurå
reduså (de exemplu condi¡ia b), în timp ce despre alte condi¡ii nu se poate
afirma dacå sunt sau nu îndeplinite (condi¡iile a, c ¿i d).
k
∑ ni = n . (1.1)
i =1
10
Frecven¡a relativå este prin urmare definitå astfel:
ni
fi = . (1.2)
n
ni ni
p i = lim ≈ . (1.3)
n →∞ n n
11
con¡inând un anumit numår de valori ale ¿irului de date. Mårimea intervalului se
poate alege dupå formula (V. Panaite, R. Munteanu, 1982):
x max − x min
d= ; (1.4)
1 + 3,222 lg n
unde xmax ¿i xmin sunt valorile extreme din selec¡ia consideratå, iar n este
volumul selec¡iei. Evident d se va rotunji prin lipså sau adaus la numårul întreg
cel mai apropiat.
¥n rela¡ia anterioarå, numitorul reprezintå numårul total m al intervalelor de
grupare.
Pentru n > 100, numårul de intervale se poate calcula cu una din rela¡iile:
1
⎡1 ⎤ 5
m = 4 ⎢ (n − 1)⎥ , (1.5)
⎣4 ⎦
sau
m= n . (1.6)
12
2. VARIABILE ALEATOARE DISCRETE
Tabelul 2.1
Valori xi x1 x2 ... xn
Frecven¡e fi f1 f2 ... fn
⎛x x2 L xn⎞ ⎛ xi ⎞ ⎛xi⎞
X: ⎜ 1 ⎟ ; X: ⎜ ⎟ =⎜ ⎟ ; i = 1, n (2.1)
⎝ f1 f2 L fn ⎠ ⎝ f ( x i )⎠ ⎝ f i ⎠
⎛ xi ⎞ ⎛xi⎞ ⎛ xi ⎞
X: ⎜ ⎟ =⎜ ⎟ =⎜ ⎟ ; (2.2)
⎝ Pr ob ( X = x i )⎠ ⎝ p i ⎠ ⎝ f ( x i )⎠
13
Deoarece evenimentele (X = xi) formeazå un sistem complet de evenimente
(reuniunea lor este evenimentul sigur) trebuie ca:
n
∑ pi = 1 . (2.3)
i=1
Tabelul 2.2
[a, x 1) n1 f1
[x1, x2) n2 f2
[x2, x3) n3 f3
... ... ...
[xm-1,xm) nm fm
m m
∑ ni = n ∑ fi = 1
i=1 i=1
14
Din motive de alegere a unui numår întreg de intervale de discretizare,
xm = a + m . D ≥ b, deci b sau coincide cu xm sau este situat între xm-1 ¿i xm.
Numårul de valori discrete ale variabilei s-a notat prin n.
⎛1 2 3 4 5 6⎞
⎜ ⎟
X: ⎜ ⎟ . (2.4)
⎜1 1 1 1 1 1⎟
⎜ ⎟
⎝6 6 6 6 6 6⎠
iar condensat:
⎛ xi ⎞
⎜ ⎟
X: ⎜ ⎟ ; xi = 1, 2, ... , 6 . (2.5)
⎜ 1⎟
⎜ ⎟
⎝ 6⎠
⎛ Qi ⎞
⎜ ⎟
Qmax.anual :⎜ ⎟ ; i = 1, 2, ..., 25 . (2.6)
⎜ 1⎟
⎜ ⎟
⎝ 25 ⎠
15
bilitatea de realizare a evenimentului aleator de α ori în n experimente este dat
de termenul general al dezvoltårii binomului lui Newton:
( p + q) = C nn p n qo + C nn − 1 p p − 1q1 +...+C αn pα q n − α +...+C no p o q n − o .
n
(2.7)
n!
¥n aceastå formulå C αn = . Evident p ¿i q fiind complementare,
α !( n − α ) !
p + q = 1.
Legea de reparti¡ie va fi deci de forma:
⎛n n −1 ... α 0 ⎞
X: ⎜ n n −1 n −1 1 α α n −α ⎟ . (2.8)
⎝ p C n p q ... C n p q C n0 p 0 q n − 0 ⎠
λα e − λ
lim Cnα pα q n−α = Pn (α ; λ ) = ; λ≥0, (2.9)
n→∞
p→ 0
α!
16
⎛ 0 1 2 ... α ...⎞
X : ⎜ −λ −λ λ2 −λ λα − λ ⎟ (2.10)
⎜e λe e ... e ...⎟
⎝ 2! α! ⎠
λα − λ
pα = f (α ) = e (2.11)
α!
Se observå cå:
∞ ∞ λα − λ ∞ λα
∑ P(α ; λ ) = ∑ e = e−λ ∑ = e−λ ⋅ eλ = 1 , (2.12)
α =0 α =0 α ! α =0 α !
17
Aceastå modalitate de reprezentare se utilizeazå ¿i în cazul reparti¡iilor
teoretice, iar batoanele vor fi propor¡ionale cu mårimea probabilitå¡ilor de
realizare a diverselor valori ale variabilei.
Fie reparti¡ia discretå empiricå:
⎛x x2 ... x n ⎞
X: ⎜ 1 ⎟ (2.13)
⎝ f1 f2 ... f n ⎠
18
• Histograma (reprezentarea sub formå de dreptunghiuri). Considerând cå
fiecare valoare xi a variabilei discrete de selec¡ie reprezintå mijlocul bazei unui
dreptunghi de înål¡ime ni sau fi se ob¡ine reprezentarea sub formå de histogramå.
Pentru a sesiza diferen¡a între modul de reprezentare graficå utilizând
poligonul frecven¡elor, respectiv histograma, se va recurge la un exemplu din
domeniul hidrologiei. Fie ¿irul precipita¡iilor zilnice, înregistrate la o sta¡ie
meteo; numårul de zile consecutive în care precipita¡iile depå¿esc zilnic 10 mm
este prezentat în tabelul 2.3 (V.Al.Stånescu, 1985).
Tabelul 2.3
Numår zile 1 2 3 4 5 6 7
Numår cazuri 189 370 280 155 83 46 23
⎛ 1 2 3 4 5 6 7 ⎞
X: ⎜ ⎟ . (2.14)
⎝ 0 ,165 0 ,322 0 ,244 0 ,135 0 ,073 0 ,040 0 ,021⎠
Fig. 2.3. Reprezentarea sub formå de histogramå (a) ¿i poligon al frecven¡elor (b)
pentru numårul zilelor consecutive cu precipita¡ii mai mari de 10 mm.
19
¥n reprezentarea graficå, fiecare interval constituie baza unui dreptunghi al
histogramei; unind mijloacele laturilor de sus ale acestor dreptunghiuri prin
segmente de dreaptå, se ob¡ine poligonul reparti¡iei (absolute sau relative).
Fie, de exemplu, ¿irul debitelor maxime anuale de pe Dunåre pentru o
perioadå de 129 ani. Tabloul reparti¡iei frecven¡elor va fi urmåtorul:
Tabelul 2.4
20
2.2. FUNCºIA DE REPARTIºIE A UNEI VARIABILE DISCRETE
⎛x x2 ... x n ⎞
X: ⎜ 1 ⎟ . (2.15)
⎝ p1 p2 ... p n ⎠
x
↓
⎛x x2 ... x k x k +1 ... x n ⎞
X: ⎜ 1 ⎟ (2.17)
⎝ p1 p2 ... p k p k +1 ... p n ⎠
21
Singurele valori pe care le poate lua X la stânga lui x sunt doar x1, x2, ..., xk,
variabila aleatoare fiind discretå.
Deoarece evenimentele constând în realizarea valorilor x1, x2, ..., xk, sunt
incompatibile douå câte douå, rezultå cå probabilitatea ca variabila aleatoare X
så fie mai micå decât valoarea fixatå x poate fi calculatå cu rela¡ia:
Pr ob ( X < x ) = Pr ob ( X = x 1 ) + Pr ob ( X = x 2 )+...
. (2.18)
...+ Pr ob ( X = x k ) = ∑ Pr ob ( X = x i ) = p1 + p2 +...+ pk
xi < x
0 ≤ F(x) ≤ 1 (2.19)
I II III
b) Fie o serie de pozi¡ii particulare ale lui x: x , x , x etc., aceste valori fiind
situate între valorile discrete x1, x2, ..., xn.
xI x II x III x IV xN
↓ ↓ ↓ ↓ ↓
⎛ x1 x2 x 3 ... x k ... x n ⎞
X: ⎜ ⎟ (2.20)
⎝ p1 p2 p3 ... p k ... p n ⎠
22
II II
F(x ) = Prob(X < x ) = Prob(X = x1) = p1 (deoarece singura valoare
II
posibilå a variabilei, mai micå decât x este x1).
¥n mod similar:
III III
F(x ) = Prob(X < x ) = Prob(X = x1) + Prob(X = x2) = p1 +p2
IV IV
F(x ) = Prob(X < x ) = Prob(X = x1) + Prob(X = x2) = p1 +p2
III IV
Atât x cât ¿i x au la stânga acelea¿i douå valori posibile ale variabilei X (¿i
anume x1 ¿i x2) ¿i ca urmare probabilitå¡ile lor de nedepå¿ire vor fi egale.
I II I II
Se observå cå: x < x → F(x ) < F(x );
III IV III IV
¥n schimb pentru x < x → F(x ) = F(x );
Se poate deduce urmåtoarea regulå, care så înglobeze ambele situa¡ii:
(i) (j) (i) (j)
x < x → F(x ) ≤ F(x ) (2.21)
23
dreapta punctului x1 notatå F(x1 + 0) diferå de valoarea în punctul x1 prezentând
o discontinuitate; simbolic acest lucru se exprimå astfel:
N N
F(x ) = Prob (X < x ) = Prob (X = x1) + Prob (X = x2) + ... + Prob (X = xn) =
= p1 + p2 + ... + pn = 1 . (2.24)
N N
Deci F(x ) = 1 (unde x este situat la dreapta celei mai mari valori posibile a
lui x).
I I
De asemenea, F(x ) = 0 (unde x este situat la stânga celei mai mici valori
posibile a lui x).
Aceste observa¡ii pot fi sintetizate în urmåtoarea regulå: dacå variabila
aleatoare poate lua valori doar în cadrul intervalului [a, b), probabilitatea de
nedepå¿ire este nulå la stânga intervalului analizat ¿i unitarå la dreapta lui.
⎧0 , dacå x ≤ a
[
X ∈ a, b) → F( x ) = ⎨ (2.25)
⎩ 1, dacå x > b
⎛x x2 ... x n ⎞
X: ⎜ 1 ⎟ ,
⎝ p1 p2 ... p n ⎠
24
func¡ia sa de reparti¡ie are urmåtoarele valori:
⎧ 0 dacå − ∞ < x ≤ x 1
⎪ p dacå x 1 < x ≤ x 2
⎪ 1
⎪ p1 + p2 dacå x 2 < x ≤ x 3
⎪
⎪ L L
F( x ) = ⎨ k (2.26)
∑p dacå x k < x ≤ x k +1
⎪ i=1 i
⎪ L L
⎪ n− 1
⎪ ∑ pi dacå x n−1 < x ≤ x n
⎪ i = 11 dacå x n < x < ∞
⎩
F( x ) = ∑ S x i , (2.27)
x i <x
25
Fig. 2.5. Reprezentarea distribu¡iei ¿i a func¡iei de reparti¡ie pentru
variabila aleatoare (2.14): a - distribu¡ia variabilei sub formå de batoane;
b - idem, sub formå de histogramå; c - construc¡ia diagramei în trepte;
d - ob¡inerea poligonului frecven¡elor cumulate.
⎛ 1 2 3 4 5 6 7 ⎞
X: ⎜ ⎟ .
⎝ 0 ,165 0 ,322 0 ,244 0 ,135 0 ,073 0 ,040 0 ,021⎠
26
⎧0,000 x≤1
⎪0,165 1< x ≤ 2
⎪
⎪0,487 2< x ≤ 3
⎪
⎪0,731 3< x ≤ 4
F( x ) = ⎨ (2.28)
⎪0,866 4< x ≤ 5
⎪0,939 5< x ≤ 6
⎪
⎪0,979 6< x≤7
⎪⎩1,000 7<x
2 ,2 − 1,5
F( 2 ,2 ) = 0 ,165 + ( 0 ,487 − 0 ,165 ) = 0 ,165 + 0 ,2254 = 0 ,3904
2 ,2 − 1,5
27
Fig. 2.6. Exprimarea segmentului [a, b) ca diferen¡å a douå segmente
de lungime infinitå.
Deci:
Prob (2,5 ≤ X < 5,5) = Prob (2,5 ≤ X < 3,5) + Prob (3,5 ≤ X < 4,5) +
28
Fig. 2.7. Interpretarea geometricå a apartenen¡ei variabilei
la intervalul [a, b).
Prob (-∞ < X < ∞) = Prob (X < b) =F(b) - F(-∞) = F(b) - 0 = F(b)(2.31)
29
S-a ajuns la un rezultat cunoscut ¿i anume cå probabilitatea de nedepå¿ire a
unei valori oarecare este egalå cu aria histogramei situatå la stânga punctului
respectiv.
Fie acum cazul în care amândouå limitele intervalului devin infinite:
a = -∞ ¿i b = +∞
30
Tabelul 2.5
⎧0,04
⎪
[
x ∈ 30, 40)
⎪0,20 [
x ∈ 40, 50)
⎪⎪0,24 x ∈[ 50, 60)
f ( x ) = Pr ob ( X = x ) = ⎨
x ∈[ 60, 70)
(2.33)
⎪0,32
⎪0,12 x ∈[ 70, 80)
⎪
⎪⎩0,08 x ∈[ 80, 90)
⎧0,00 x ≤ 30
⎪0,04 30 < x ≤ 40
⎪
⎪0,24 40 < x ≤ 50
⎪
F( x ) = Pr ob ( X < x ) = ⎨0,48 50 < x ≤ 60 (2.34)
⎪0,80 60 < x ≤ 70
⎪
⎪0,92 70 < x ≤ 80
⎪1,00 80 < x
⎩
31
Fig. 2.8. Reprezentarea graficå a func¡iei de reparti¡ie sub formå
de diagramå în trepte ¿i de poligon al frecven¡elor cumulate.
32
constituie o måsurå a posibilitå¡ii de valorificare a râului respectiv drept cale de
naviga¡ie. De asemenea, probabilitatea de depå¿ire a nivelului care încå mai
permite accesul la priza de apå a unui debit egal cu cerin¡a unei folosin¡e
reprezintå gradul de asigurare cu apå al folosin¡ei respective. Probabilitatea de
depå¿ire a cotei coronamentului unui dig de apårare împotriva inunda¡iilor
constituie o måsurå a riscului de inundare, etc.
¥n loc de niveluri, în practicå se folosesc în mod curent debite cu diverse
probabilitå¡i de depå¿ire; aceasta nu schimbå prea mult datele problemei, debitul
putând fi exprimat în func¡ie de nivel prin intermediul cheii limnimetrice (sau
cheia debitelor).
Pentru calculul probabilitå¡ii de depå¿ire a unei valori oarecare x de cåtre
variabila aleatoare X se poate pleca de exemplu de la rela¡ia apartenen¡ei la un
anumit interval:
sau:
Prob (X ≥ a) = 1 - F(a) (2.38)
33
2.3.1. INTERPRETAREA GEOMETRICŠA PROBABILITźII DE DEPŪIRE
34
2.3.2. REPREZENTAREA GRAFICŠA PROBABILITźII DE DEPŪIRE
¥n figura 2.10 sunt desenate comparativ atât func¡ia de reparti¡ie (2.28), cât ¿i
func¡ia de reparti¡ie complementarå (cu linie plinå) pentru variabila aleatoare
(2.14).
¥n figura 2.11 s-a procedat la reprezentarea graficå a probabilitå¡ilor de
depå¿ire ¿i de nedepå¿ire în cazul reparti¡iei (2.33).
35
Valorile probabilitå¡ii de depå¿ire rezultå fie din rela¡ia F c ( x ) = 1 - F(x), fie
prin calculul suprafe¡elor din histogramå situate la dreapta valorilor particulare x
ale variabilei; la calculul suprafe¡elor se va avea în vedere cå intervalul de
discretizare ∆x este considerat de mårime unitarå.
36
probabilitatea de nedepå¿ire F(x) = Prob (X < x) este definitå prin rela¡ia
2.26:
⎧0 − ∞ < x ≤ x1
⎪p x1 < x ≤ x 2
⎪ 1
⎪ p1 + p2 x2 < x ≤ x3
⎪
⎪L L
⎪k
F( x ) = Pr ob ( X < x ) = ⎨ ∑ pi x k < x ≤ x k +1
⎪i = 1
⎪Ln− 1
L
⎪ ∑ pi x n− 1 < x ≤ x n
⎪ i=1
⎪n p =1 x n < x < +∞
⎪⎩i∑
=1
i
⎧1 , − ∞ < x ≤ x1
⎪1 − p , x1 < x ≤ x 2
⎪ 1
⎪... ...
⎪ k
⎪ 1 − ∑ pi , x k < x ≤ x k +1
⎪
F c ( x ) = Pr ob ( X ≥ x ) = ⎨... i =1 ... (2.40)
⎪ n −1
⎪1 − ∑ p i = p n , x n −1 < x ≤ x n
⎪ i =1
⎪... n ...
⎪1 − ∑ p i = 0 , x n < x < +∞
⎪⎩ i =1
37
Ca atare, se recurge la o opera¡ie de renumerotare a valorilor variabilei, în
noua numerotare ele fiind notate tot prin x1, x2, ..., xn, dar fiind ordonate de data
aceasta descrescåtor (fig. 2.12).
va fi definitå prin:
⎧0 x1 < x ≤ ∞
⎪p x 2 < x ≤ x1
⎪ 1
⎪ p1 + p2 x3 < x ≤ x2
⎪
⎪L L
⎪k
F ( x ) = Pr ob ( X ≥ x ) = ⎨ ∑ pi
c
x k +1 < x ≤ x k (2.42)
⎪i = 1
⎪Ln− 1
L
⎪ ∑ pi = 1 − pn x n < x ≤ x n− 1
⎪ i=1
⎪n p =1 − ∞ < x < xn
⎪⎩i∑
=1
i
38
¥n cazul particular în care cele n valori ale variabilei au probabilitå¡i egale de
realizare (¿i anume 1/n), probabilitatea de depå¿ire se va calcula cu rela¡ia:
⎧0 x1 < x < ∞
⎪1
⎪ x 2 < x ≤ x1
⎪ n2
⎪ x3 < x ≤ x2
⎪n
⎪⎪L L
F c ( x ) = Pr ob ( X ≥ x ) = ⎨ i (2.43)
x i+1 < x ≤ x i
⎪n
⎪L L
⎪n − 1
⎪ x n < x ≤ x n− 1
⎪ n
⎪n − ∞ < x ≤ xn
⎪⎩ n
⎧1
⎪n x = x1
⎪2
⎪ x = x2
⎪n
⎪L L
⎪i
F ( xi ) = ⎨
c
x = xi (2.44)
⎪n
⎪L L
⎪n − 1 x = x n− 1
⎪ n
⎪n
⎪⎩ n x = xn
39
Fig. 2.13. Func¡ia de probabilitate elementarå ¿i probabilitatea de depå¿ire
în cazul zarului cu 6 fe¡e.
i i
pi = = (2.45)
n 6
(unde i este numårul de ordine din ¿irul ordonat descrescåtor al celor 6 valori
posibile: x1= 6; x2 = 5; ..; x6 = 1) sunt majorate în mod artificial, ele situându-
se pe linia întreruptå, decalatå fa¡å de linia plinå cu valoarea 1/12 (adicå 1/2 din
probabilitatea de apari¡ie a fiecårei valori).
¥n hidrologie, o problemå frecvent întâlnitå este aceea a determinårii
probabilitå¡ii de depå¿ire a debitelor maxime anuale; numårul n de valori de
care se dispune este în general cuprins între 20 ... 40. Se admite analog ca în
cazul zarului cå cele n debite maxime anuale au probabilitå¡i egale de apari¡ie
(¿i anume 1/n).
Un aspect asupra cåruia trebuie atraså aten¡ia este faptul cå, în cazul zarului
perfect omogen probabilitatea de apari¡ie a unei fe¡e (egalå cu 1/6), rezultå în
urma unui numår extrem de mare de experimente (teoretic un numår infinit). ¥n
cazul ¿irului debitelor maxime anuale se admite de asemenea cå valorile
40
acestora sunt egal probabile, de¿i fiecare valoare în sine nu s-a realizat decât o
singurå datå.
Acest mod de evaluare a probabilitå¡ii de apari¡ie a diverselor valori are la
bazå defini¡ia clasicå a probabilitå¡ii (aproximatå prin raportul dintre numårul
cazurilor favorabile ¿i numårul total de cazuri posibile); fiecare valoare
realizându-se o singurå datå, probabilitatea ei de realizare este apreciatå la 1/n.
Evident, acest mod de abordare constituie o aproximare, dar este singura
posibilå în condi¡iile unei perioade de måsuråtori relativ reduse.
Calculul probabilitå¡ii de depå¿ire a debitelor maxime anuale cu rela¡ia
(2.45) ar conduce urmând un ra¡ionament similar ca în cazul zarului cu 6 fe¡e la
o majorare artificialå a valorilor pi egalå cu 1/(2n).
Probabilitatea realå de depå¿ire a valorilor respective este deci:
i 1 2i − 1
pi = − = . (2.46)
n 2n 2n
2n − 1
pn = . (2.47)
2n
Tabelul 2.6
Formula Anul
pi = Prob (X ≥ xi )
Hazen 1930 2i − 1
2n
Weibull 1939 i
n +1
Cegodaev 1955 i − 0 ,3
n + 0 ,4
Blum 1958 i−3/ 8
n +1/ 4
Tukey 1962 3i − 1
3n + 1
Gringorten 1963 i − 0 ,44
n + 0 ,12
41
Se observå cå valoarea lui pn este diferitå de 100%, cum s-ar fi
ob¡inut pentru valoarea de rang n în cazul aplicårii rela¡iei necorectate de tip i/n.
Acest rezultat era de altfel de a¿teptat ¿i din punct de vedere intuitiv. Cea mai
micå valoare înregistratå în perioada de måsuråtori xn nu este în mod obligatoriu
¿i cea mai micå valoare a popula¡iei statistice. Existå deci posibilitatea
înregistrårii în viitor ¿i a unor valori mai mici; ca atare, probabilitatea de
depå¿ire a lui xn este mai micå de 100%, chiar dacå este foarte apropiatå de
aceastå valoare. Diferen¡a de la 100% pânå la pn% reprezintå riscul apari¡iei
unor valori inferioare lui xn.
¥n afarå de formula lui Hazen, pentru evaluarea probabilitå¡ilor de depå¿ire
se mai utilizeazå ¿i alte rela¡ii (I.Vladimirescu, 1978), care au ca element comun
faptul cå pentru i=n se ob¡in probabilitå¡i de depå¿ire subunitare (tab.2.6).
Dupå cum s-a mai aråtat, în toate aceste rela¡ii i reprezintå numårul de ordine
al valorii xi din ¿irul ordonat descrescåtor (x1 > x2 > ... > xi > ... > xn).
¥n hidrologie, pentru calculul probabilitå¡ii de depå¿ire se utilizeazå, în mod
curent, rela¡ia Weibull:
i
pi = , (2.48)
n+1
i − 0 ,3
pi = . (2.49)
n + 0 ,4
42
corespunzåtoare acestei probabilitå¡i este variabila dependentå, care trebuie
evaluatå.
Ca urmare, se procedeazå la o rotire ¿i råsturnare a tuturor reprezentårilor
uzuale în matematicå, astfel încât abscisa så devinå ordonatå ¿i ordonata
absciså.
Ca exemplificare, în figura 2.14, sunt desenate comparativ, în ambele
sisteme de reprezentare, o serie de grafice prezentate anterior. ¥n hidrologie,
probabilitatea de nedepå¿ire intereseazå mai rar; ca urmare, pe graficele
hidrologice se reprezintå numai curba probabilitå¡ilor de depå¿ire. Deoarece
variabila aleatoare notatå în matematicå prin X se reprezintå acum pe ordonatå,
în continuare pentru a nu crea confuzii ea se va identifica prin Y, iar valorile sale
particulare prin y.
Valoarea variabilei Y corespunzåtoare probabilitå¡ii de depå¿ire p% va fi
notatå prin yp%
43
Fie din nou cazul zarului perfect omogen, pentru care probabilitå¡ile de
depå¿ire sunt calculate cu rela¡ia (2.46); deoarece valorile variabilei sunt
echidistante ¿i echiprobabile, probabilitå¡ile de depå¿ire se situeazå dupå cum s-
a mai aråtat pe o dreaptå. Cu totul altfel stau lucrurile în cazul valorilor
hidrologice. Fie de exemplu ¿irul debitelor maxime anuale; debitele sunt
considerate tot echiprobabile, dar nu mai sunt echidistante. Ca urmare,
probabilitå¡ile lor de depå¿ire nu se vor situa pe o dreaptå, ci pe o curbå
(fig.2.15).
44
Fig. 2.16. Reprezentarea hidrologicå a probabilitå¡ilor de depå¿ire în cazul valorilor
grupate pentru reparti¡ia (2.33).
45
debitului maxim dintr-un anumit an poate fi consideratå independentå de
valorile din ceilal¡i ani, gradul de siguran¡å dintr-un numår de n ani poate fi
n
apreciat cu rela¡ia: (1 - p) .
Rezultå atunci cå riscul hidrologic Rn ca debitul Qp% så fie egalat sau depå¿it
într-o perioadå de n ani, are o valoare complementarå siguran¡ei sistemului
pentru acela¿i interval de timp:
n
Rn = 1 - (1 - p) . (2.50)
Cu cât n este mai mare, cu atât Rn tinde cåtre 1 (sau 100%); deci într-o
perioadå foarte mare riscul de a se produce debite superioare lui Qp% se apropie
de certitudine.
Fie, pentru exemplificare, cazul în care p = 1%, iar n = 100 (C. Pârvulescu,
1978):
100
R100 = 1 - (1 - 0,01) = 1 - 0,37 = 0,63 = 63%
46
Perioada de repetare T, definitå prin raportul:
1
T = (2.51)
p%
47
3. VARIABILE ALEATOARE CONTINUE
Variabila aleatoare X fiind continuå poate lua orice valoare din domeniul ei
de varia¡ie. ¥n mod obi¿nuit în hidrologie acest interval este semiaxa [0, +∞)
sau chiar un interval mai restrâns [a, b); pentru generalitate, în continuare se va
admite ca domeniu de varia¡ie axa numerelor reale (-∞, +∞).
Acest domeniu este divizat în intervale infinitezimale de lungime dx.
Probabilitatea elementarå ca variabila aleatoare X så ia valori în cadrul
intervalului [x, x + dx) este egalå (fig. 3.1) cu produsul dintre lungimea
intervalului ¿i valoarea func¡iei f (denumitå densitate de probabilitate sau
densitate de reparti¡ie) în punctul x:
Denumirea de densitate pentru func¡ia f(x) este preluatå din fizicå (prin
analogie cu densitatea ρ(x) a unei bare neomogene).
⎛ x ⎞
X: ⎜ i ⎟ , (3.2)
⎝ f ( x )⎠
48
unde f(xi) este probabilitatea elementarå. ¥n mod similar, în cazul variabilei
continue, la care probabilitatea elementarå este dupå cum s-a aråtat f(x)⋅dx, ar
trebui utilizatå nota¡ia:
X: ⎜ [
⎛ x, x + dx )⎞
⎟. (3.3)
⎝ f ( x ) ⋅ dx ⎠
⎛ x ⎞
X: ⎜ ⎟ , (3.4)
⎝ f ( x )⎠
unde, a¿a cum s-a mai aråtat, f(x) define¿te o densitate de probabilitate:
f ( x ) = lim
( [
Pr ob X ∈ x , x + ∆x ) ). (3.5)
∆x → 0 ∆x
Cu alte cuvinte f(x) ≠ Prob(X = x), care este de altfel nulå; ra¡ionând chiar
intuitiv probabilitatea aferentå unei valori punctuale (în condi¡iile în care
variabila poate lua o infinitate de astfel de valori) este zero:
Prob (X = x) = 0 . (3.6)
n
∑ pi = 1 . (3.7)
i =1
+∞
∫ f ( x )dx = 1 . (3.8)
−∞
49
¥n mod similar se va defini func¡ia de reparti¡ie F(x).
¥n cazul variabilei discrete probabilitatea de nedepå¿ire a valorii particulare x
rezultå prin însumarea probabilitå¡ilor aferente valorilor variabilei mai mici
decât x:
F( x ) = ∑ Pr ob( X = x i ) . (3.9)
x i <x
x
F( x ) = ∫ f ( x ) dx . (3.10)
−∞
Prob (x1 ≤ X < x2) = Prob (X ∈ (-∞, x2)) - Prob (X ∈ (-∞, x1)) =
50
Dar:
x2 x1 x2
Pr ob ( X < x 2 ) − Pr ob ( X < x 1 ) = ∫ f ( x )dx − ∫ f ( x )dx = ∫ f ( x )dx . (3.12)
−∞ −∞ x1
Rezultå deci:
x2
Pr ob ( x 1 ≤ X < x 2 ) = ∫ f ( x ) dx (3.13)
x1
Dacå intervalul [x1, x2) devine din ce în ce mai mic, fie el [x, x + ∆x),
raportul:
F( x + ∆x ) − F( x )
∆x
51
f ( x ) = lim
[ [
Pr ob X ∈ x, x + ∆x ) ] = lim F( x + ∆x ) − F( x ) = F'( x ) . (3.14)
∆x → 0 ∆x ∆x → 0 ∆x
x
F c ( x ) = Pr ob ( X ≥ x ) = 1 − Pr ob( X < x ) = 1 − F ( x ) = 1 − ∫ f ( x ) dx =
−∞
+∞ x −∞ +∞ +∞
(3.15)
= ∫ f ( x ) dx − ∫ f ( x ) dx = ∫ f ( x ) dx + ∫ f ( x ) dx = ∫ f ( x ) dx.
−∞ −∞ x −∞ x
52
¥n timp ce probabilitatea de nedepå¿ire F(x) reprezintå acea parte a ariei
densitå¡ii de reparti¡ie situatå la stânga punctului x, probabilitatea de depå¿ire
este egalå cu valoarea ariei de la dreapta aceluia¿i punct x (fig. 3.5).
53
De exemplu, debitul cu probabilitatea de depå¿ire 1 % este mai mare decât
debitul cu probabilitatea de depå¿ire 10%, dar este mai mic decât valoarea
corespunzåtoare probabilitå¡ii de 0,1% etc. (fig. 3.7).
54
(e¿antion) de volum redus ¿i sunt definite prin mul¡imea cuplurilor {(xi, pi)},
unde pi este probabilitatea empiricå de depå¿ire.
55
alegerea adecvatå a func¡iei ¿i utilizarea celor mai corespunzåtoare metode de
estimare a parametrilor.
¥n practica hidrologicå acest proces de cåutare a celei mai adecvate reparti¡ii
teoretice nu mai are loc, admi¡ându-se cå distribu¡ia mårimilor analizate
urmeazå o lege de tip Gama (cu 2 sau 3 parametri) sau o lege logaritmic
normalå.
Experien¡a a aråtat de fapt cå aceste func¡ii se preteazå foarte bine pentru
analiza fenomenelor hidrologice din România.
Estimarea variabilelor (parametrilor) care intervin în func¡iile de reparti¡ie
teoretice are la bazå prelucrarea informa¡iilor con¡inute în ¿irul de date måsurat.
Plecând de la valorile înregistrate se calculeazå o serie de valori tipice
(caracteristice) ale variabilelor de selec¡ie cum sunt: valoarea medie, dispersia,
abaterea medie påtraticå etc. Se considerå apoi cå aceste valori tipice sau
parametri ai reparti¡iei empirice sunt în acela¿i timp ¿i parametrii reparti¡iei
teoretice, utilizate pentru ajustarea ¿i extrapolarea reparti¡iei empirice (cu alte
cuvinte parametrii popula¡iei statistice sunt estima¡i pe baza selec¡iei de care se
dispune prin måsuråtori); evident acest procedeu reprezintå o aproxima¡ie, care
constituie o surså de erori a calculului statistic.
56
4. VALORI TIPICE ALE VARIABILELOR ALEATOARE
⎛x x2 ... x n ⎞
X :⎜ 1 ⎟ . (4.1)
⎝ p1 p2 ... p n ⎠
¥n aceast caz valoarea medie a variabilei X, notatå prin M(X), m sau µ este
prin defini¡ie egalå cu:
n
M ( X ) = ∑ x i pi . (4.2)
i =1
Dacå cele n valori sunt echiprobabile (pi = 1/n), atunci se ob¡ine cunoscuta
rela¡ie a mediei aritmetice (denumitå ¿i medie de selec¡ie):
n 1 1 n
M( X ) = ∑ xi = ∑ xi . (4.3)
i=1 n n i =1
57
bunå, în sensul cå dispersia ei este mai micå decât cea care se poate ob¡ine cu
ajutorul oricårui alt procedeu de estimare a mediei. Totu¿i, dacå spa¡iul de
selec¡ie este redus, apari¡ia din întâmplare a unor valori foarte mari sau foarte
mici poate influen¡a media aritmeticå.
Pentru numeroase mårimi hidrologice, densitatea de reparti¡ie a valorilor
înregistrate este asimetricå; prin logaritmare se ob¡in distribu¡ii simetrice, iar media
aritmeticå a acestor valori poate fi utilizatå ca parametru al tendin¡ei centrale.
Se poate scrie:
58
• Mediana. Mediana Me reprezintå valoarea centralå a unei reparti¡ii
statistice.
Cu alte cuvinte, probabilitatea ca variabila aleatoare X så ia valori mai mici
decât Me este egalå cu probabilitatea ca X så ia valori mai mari decât Me .
Având în vedere faptul cå:
c
F(Me) + F (Me) = 1 (4.6)
¿i cå:
c
F(Me) = F (Me) , (4.7)
rezultå:
Fie, pentru început, cazul unei variabile discrete, având valorile ordonate
crescåtor sau descrescåtor.
Dacå reparti¡ia are 2k+1 valori, mediana este valoarea având rangul k+1.
Dacå reparti¡ia are 2k valori, mediana este între valorile de rangul k ¿i k+1, ¿i în
general se ob¡ine ca medie aritmeticå a celor douå valori. Reprezentând
probabilitå¡ile empirice de depå¿ire ¿i nedepå¿ire, mediana este situatå la
intersec¡ia celor douå grafice.
¥n cazul unei variabile aleatoare continue, mediana reprezintå abscisa acelui
punct de pe curba densitå¡ii de reparti¡ie, a cårui ordonatå împarte suprafa¡a
cuprinså între curbå ¿i axa x în douå suprafe¡e egale.
Interpretarea geometricå a medianei se poate urmåri în figura 4.2.
59
• Modul. Modul Mo sau valoarea dominantå reprezintå acea valoare a
variabilei care corespunde frecven¡ei celei mai mari.
Pentru o variabilå aleatoare de tip discret, având valorile xi ordonate,
crescåtor sau descrescåtor, caracterizate de probabilitå¡ile empirice pi, punctul
xm se nume¿te mod dacå este satisfåcutå rela¡ia:
n
Mr = ∑ x ir pi , (4.10)
i=1
60
unde, prin pi s-au notat probabilitå¡ile de apari¡ie a valorilor xi.
⎛ 1⎞
Dacå valorile xi sunt echiprobabile ⎜ p i = ⎟ , rezultå:
⎝ n⎠
1 n r
Mr = ∑ xi . (4.11)
n i =1
1 n
M1 = x = ∑ xi . (4.3')
n i=1
+∞
Mr = ∫ x r f ( x )dx . (4.12)
−∞
+∞
M1 = m = ∫ x f ( x )dx . (4.5')
−∞
61
S-au imaginat mai mul¡i parametri pentru måsurarea dispersiei, baza¡i în general
pe no¡iunea de abatere:
• Amplitudinea sau extinderea reparti¡iei reprezintå abaterea dintre cea
mai mare valoare observatå xmax ¿i cea mai micå xmin:
Este cel mai simplu parametru din aceastå categorie, dar ¿i cel mai
aproximativ.
• Abaterea medie reprezintå media abaterilor în valoare absolutå dintre
valorile curente ¿i media aritmeticå x :
n
∑ xi − x
i =1
eM = . (4.7)
n
n 1 n
s 2 = ∑ ( x i − x ) 2 ⋅ pi = ∑ ( xi − x ) ,
2
(4.10)
i =1 n i=1
62
Dacå numårul de valori n < 30, dispersia se poate estima cu ajutorul rela¡iei:
1 n
s2 = ∑ ( xi − x ) .
2
(4.11)
n − 1 i=1
Pentru a exemplifica modul în care dispersia reflectå gradul de împrå¿tiere al
valorilor variabilei, în figura 4.4, s-au considerat douå densitå¡i de reparti¡ie
continue ¿i simetrice, având aceea¿i valoare medie.
sau:
63
n
∑( xi − x )
2
s= i =1
. (4.13)
n −1
σ s
Cv = , respectiv Cv = , (4.14)
m x
n n
∑ ( xi − x ) ∑ ( xi − x )
2 2
1 i =1 i=1
Cv = = =
x n−1 (n − 1) x 2
. (4.15)
2 2
1 n ⎛ xi − x ⎞ 1 n ⎛ xi ⎞
= ∑⎜ ⎟ = ∑ ⎜ − 1⎟
n − 1 i =1⎝ x ⎠ n − 1 i =1⎝ x ⎠
Notând cu:
xi
ki = , (4.16)
x
rela¡ia de calcul devine:
n
∑ ( ki − 1)
2
Cv = i =1
. (4.17)
n−1
64
Valoarea coeficientului de varia¡ie exercitå o influen¡å directå asupra
dimensiunilor lucrårilor de gospodårire a apelor; pentru râuri cu variabilitate
mare a debitelor (deci cu Cv mare) sunt necesare volume mai mari de lacuri de
acumulare pentru a putea realiza acela¿i grad de regularizare a debitelor cursului
de apå respectiv.
• Momente centrate. La momentele de ordin superior s-a aråtat cå acestea
sunt calculate în raport cu originea axelor de coordonate. Efectuând calculul
momentelor fa¡å de valoarea medie a variabilei se ob¡in a¿a numitele momente
centrate.
Momentul centrat de ordinul r este prin defini¡ie:
n
m r = ∑ ( x i − m ) r ⋅ pi (pentru variabile discrete) (4.18)
i =1
¿i:
+∞
mr = ∫ ( x i − m ) r f ( x )dx (pentru variabile continue) (4.19)
−∞
1 n
mr = ∑ ( xi − x ) .
r
(4.20)
n i =1
1⎛n ⎞
∑ ( xi − x ) = ⎜ ∑ xi − ∑ x⎟ =
1 n n
m1 =
n i=1 n ⎝ i=1 i=1 ⎠
. (4.21)
∑ x i − ( x + x +...+ x ) = ∑ x i −
1 n 1 1 n nx
= =x−x=0
n i=1 n n i=1 n
65
Momentul centrat de ordinul 2 este chiar dispersia variabilei aleatoare;
într-adevår:
1 n
∑ ( xi − x ) = s .
2
m2 = 2
(4.22)
n i=1
s = m2 , (4.23)
s m2
Cv = = , (4.24)
x M1
∑ ( x i − x ) = ∑ x i − 2x ∑ x i + ∑ x
1 n 2 1 n 2 1 n 1 n 2
m2 = (4.25)
n i=1 n i=1 n i=1 n i=1
Dar:
1 n
∑ xi = x , (4.26)
n i =1
iar:
1 n 2 nx 2
∑x = = x2 . (4.27)
n i=1 n
Se ob¡ine deci:
1 n 2 1 n 2
m2 = ∑ x i − 2x + x = ∑ x i − x .
2 2 2
(4.28)
n i =1 n i=1
Deoarece:
66
1 n 2
∑ x i = M2 , (4.29)
n i =1
x 2 = M 12 , (4.30)
rezultå:
m 2 = s 2 = M 2 − M 12 . (4.31)
∑ ( xi − x ) .
1 n 2
m2 = s 2 =
n i=1
¥n mod similar, se poate aråta cå momentul centrat de ordinul 3 se poate
calcula cu rela¡ia:
m 3 = M 3 − 3 M 2 M 1 + 2 M 13 . (4.32)
67
f(m - x) = f(m + x) . (4.33)
m3
Cs = , (4.34)
σ3
1 n
∑ ( xi − x ) 3 = ∑ (xi − x)
3 1 1 n 3 1
Cs = =
n i=1 s n i=1 ( x ⋅ Cv ) 3
. (4.35)
3 3
1 n ⎛ xi − x ⎞ 1 1 n ⎛ xi ⎞ 1
= ∑⎜ ⎟ = ∑ ⎜ − 1⎟
n i = 1⎝ x ⎠ C v n i = 1⎝ x
3
⎠ Cv3
xi
Notând, ca ¿i la calculul coeficientului de varia¡ie, raportul prin ki, rela¡ia
x
devine:
∑ ( k i − 1)
n 3
Cs = i =1
. (4.36)
nC v3
¥n cazul în care n < 30, în rela¡ia (4.36) la numitor n va fi înlocuit prin n-1.
Coeficientul de asimetrie este nul în cazul unei reparti¡ii simetrice, deoarece
ponderea punctelor din stânga valorii medii este egalå cu ponderea celor din
dreapta, semnele fiind înså contrare (fig.4.5).
68
Fig. 4.5. Alura densitå¡ii de reparti¡ie pentru valori ale lui Cs pozitive,
nule sau negative (variabile aleatoare continue).
69
fiecårui interval de timp valorile care intereseazå. Dacå intervalul de timp ales
este de 1 an, rezultå serii extreme anuale (de exemplu ¿irul debitelor maxime
anuale); pentru intervale mai mici rezultå serii sezoniere.
¥n marea majoritate a cazurilor, prelucrårile statistice din hidrologie au ca
scop trasarea curbei teoretice a probabilitå¡ilor de depå¿ire a debitelor maxime
sau minime anuale. Calculele respective au la bazå aproxima¡ia cå parametrii
popula¡iei statistice (deci parametrii curbei teoretice a probabilitå¡ilor) sunt
aceea¿i cu parametrii ¿irului de date înregistrate (adicå parametrii curbei
empirice a probabilitå¡ilor).
Justificarea teoreticå a acestui mod de rezolvare o constituie teorema lui
Glivenko (Gh. Mihoc ¿.a., 1976). Conform teoremei lui Glivenko rezultå cå
odatå cu cre¿terea volumului selec¡iei, func¡ia empiricå de reparti¡ie tinde cåtre
func¡ia de reparti¡ie teoreticå a variabilei X. ¥n studiul reparti¡iilor empirice se
pot, deci, utiliza reparti¡iile teoretice.
Ca urmare, prima opera¡ie constå în calculul parametrilor de selec¡ie. Dupå
aceea este util så se cunoascå erorile de care sunt afecta¡i parametrii astfel
determina¡i, aducând eventual corec¡ii unora dintre ei. ¥n sfâr¿it cu parametrii
astfel ale¿i se construie¿te curba teoreticå a probabilitå¡ilor de depå¿ire, curbå
care permite extrapolarea ¿irului de date înregistrate în afara domeniului de
måsuråtori curente.
Succesiunea opera¡iilor pentru construirea curbei empirice a probabilitå¡ilor
de depå¿ire ¿i calculul parametrilor statistici ai ¿irului de date înregistrate este
urmåtoarea:
− Se selec¡ioneazå din hidrograful debitelor ¿irul valorilor maxime (sau
minime) anuale;
− Se reordoneazå acest ¿ir în ordine descrescåtoare, de la cea mai mare
valoare înregistratå la cea mai micå; fie i (i = 1, ..., n) numårul de ordine al
debitului din ¿irul ordonat descrescåtor;
− Se atribuie fiecårui debit Qi probabilitatea de depå¿ire empiricå:
i
pi = ; (4.37)
n+1
70
Fig. 4.6. Curba empiricå a probabilitå¡ilor de depå¿ire.
1 n
Q= ∑ Qi .
n i=1
Qi
ki =
Q
71
Tabelul 4.1
Qi pi
Anul Q i Qi 2 3
(cronologic) (ordonat ki = (ki-1) (ki-1)
descrescåtor) Q
19... 1
Q19... Q1 1
n+1
19... 2
Q19... Q2 2
n +1
19... . . .
Q19...
19... . . .
Q19...
... ... ... ... ...
19... n
Q19... Qn n
n+1
∑ Qi
∑ ( k i − 1) ∑ ( k i − 1)
n 2 n 3
Q= i =1
n i =1
1⎛ N−1 n ⎞
Q' = ⎜ QN + ∑ Qi ⎟ ; (4.38)
N⎝ n i =1 ⎠
1⎡ N−1 n 2⎤
( ) ∑ ( ki − 1) ⎥ .
2
Cv' = ⎢ k N − 1 + (4.39)
N⎣ n i=1 ⎦
Dacå în ¿irul celor n valori maxime anuale ale debitelor existå o valoare
foarte mare în raport cu celelalte (¿i care constituie debitul maxim istoric pentru
o perioadå de N > n ani), pentru calcul se vor utiliza rela¡iile (C. Mociorni¡a
¿.a., 1979):
1⎛ N − 1 n− 1 ⎞
Q' = ⎜ QN + ∑ Qi ⎟ ; (4.40)
N⎝ n i=1 ⎠
72
1 ⎡ N − 1 n− 1 2⎤
Cv' = ⎢
N − 1⎣
( k N − 1) 2
+ ∑ ( ki − 1) ⎥
n − 1 i=1
(4.41)
⎦
¥n rela¡iile anterioare:
k N = QN / Q ' . (4.42)
Fie f(x, a, b, c, ...), func¡ia de probabilitate (în cazul unei reparti¡ii discrete),
respectiv densitatea de reparti¡ie (în cazul unei reparti¡ii continue), func¡ie care
depinde de un numår de parametri a, b, c, ... necunoscu¡i ¿i care trebuie
determina¡i. Fie k numårul acestor parametri.
Metoda momentelor constå în calcularea primelor k momente atât ale
variabilei teoretice având reparti¡ia f(x, a, b, c, ...), cât ¿i ale variabilei de
73
selec¡ie. Momentele teoretice vor avea expresii func¡ie de parametrii
necunoscu¡i a, b, c, ...:
Fie M1* , M2* ,K, Mk* - primele k momente empirice ale variabilei de selec¡ie,
calculate cu ajutorul valorilor înregistrate x1, x2, ..., xn. Prin egalarea celor 2
rânduri de momente se ob¡ine un sistem (neliniar în general) de k ecua¡ii cu k
necunoscute, ale cårei solu¡ii estimeazå parametrii reparti¡iei teoretice.
Fie, de exemplu, reparti¡ia Gama cu 2 parametri:
1
f ( x , a, b ) = x a −1e − x / b (x≥0; a>0; b>0) (4.43)
Γ ( a)b a
∞
M 2 = ∫ x 2 f ( x, a b )dx = a( a + 1)b 2 . (4.45)
0
1 n
M1* = ∑ xi ; (4.46)
n i=1
1 n 2
M2* = ∑ xi . (4.47)
n i=1
1 n
ab = ∑ xi ; (4.48)
n i =1
74
1 n 2
a( a + 1)b 2 = ∑ xi . (4.49)
n i=1
i =1
Valorile cele mai verosimile pentru a, b, c, ... sunt acelea care maximizeazå
func¡ia V(a, b, c, ...). ¥n continuare trebuie aplicate tehnici de gåsire a
extremului unei func¡ii care depinde de mai multe variabile (derivarea func¡iei
de verosimilitate V în raport cu cele k necunoscute, anularea celor k derivate
par¡iale ¿i rezolvarea sistemului rezultat). Pentru efectuarea mai comodå a
calculelor acest procedeu nu se aplicå func¡iei de verosimilitate V, ci
logaritmului ei, ¡inând seama de faptul cå o func¡ie oarecare î¿i atinge maximul
odatå cu logaritmul såu natural.
Fie, de exemplu, densitatea de reparti¡ie:
2
1 ⎛ x −a⎞
− ⎜ ⎟
f ( x , a, b) =
1
e 2⎝ b ⎠
; x∈R , (4.51)
b 2π
75
Prin logaritmare se ob¡ine:
lnV (a, b) = − n ⋅ ln b − n ⋅ ln 2π − 2 ∑( i
x − a) .
1 n 2
(4.53)
2b i = 1
∂ ln V ( a, b ) 1 n
= 2 ∑ ( x i − a) (4.54)
∂a b i=1
∂ ln V ( a, b )
= − + 3 ∑ ( x i − a)
n 1 n 2
(4.55)
∂b b b i =1
∑ ( x i − a) = 0
n
(4.56)
i =1
∑ ( x i − a) = 0 .
n 1 n 2
− + (4.57)
b b 3 i =1
∑ ( x i − a) = ∑ x i − ∑ a = ∑ x i − na = 0
n n n n
(4.58)
i =1 i =1 i =1 i =1
Deci:
n
na = ∑ x i (4.59)
i =1
sau:
1 n
a= ∑ xi . (4.60)
n i =1
76
¥nlocuindu-l pe a prin x în ecua¡ia (4.57), se ob¡ine:
n 1 n
= 3 ∑ ( xi − x ) ,
2
(4.61)
b b i=1
adicå:
∑ ( xi − x )
1 n 2
b2 = sau b = s . (4.62)
n i =1
Rezultå cå parametrul b are drept estimator de maximå verosimilitate
abaterea medie påtraticå de selec¡ie s. Cu alte cuvinte parametrii a ¿i b din
expresia densitå¡ii de reparti¡ie teoreticå sunt chiar valoarea medie m, respectiv
abaterea medie påtraticå σ a popula¡iei. Func¡ia având densitatea de reparti¡ie:
2
1 ⎛ x −m⎞
−− ⎜ ⎟
f (x , m,σ ) =
1
e 2⎝ σ ⎠
, x∈R (4.63)
σ 2π
( )
n 2
F = ∑ pti − p ei → min im . (4.64)
i =1
+∞
pit = ∫ f ( x, a, b, c,...) dx , (4.65)
xi
77
e
în timp ce probabilitå¡ile empirice pi se ob¡in cu rela¡ia Weibull:
i
pie = . (4.66)
n+ 1
2
n ⎡ +∞ i ⎤
F = ∑ ⎢ ∫ f ( x, a, b, c,...)dx − ⎥ → min im . (4.67)
i = 1 ⎣ xi n + 1⎦
78
Pentru exemplificare, se considerå ca reparti¡ie teoreticå, distribu¡ia Gama cu
trei parametri, care va fi utilizatå pentru calculul probabilitå¡ilor teoretice de
depå¿ire în cazul unui ¿ir scurt (n = 25) de debite maxime anuale:
f (x) = α
1
β Γ (α )
( x −γ )
( α − 1) − ( x − γ ) / β
e , (4.68)
⎧⎛ i ⎞⎫
⎨⎜ x i = Qi ; p i = ⎟⎬ ,
⎩⎝ n + 1⎠ ⎭
t
Probabilitå¡ile teoretice pi de depå¿ire ale debitelor înregistrate se ob¡in cu
rela¡ia:
+∞ +∞ 1
pit = ∫ f ( x )dx = ∫ α α
( x − γ ) (α −1) e −( x −γ )/β dx . (4.70)
Qi Qi β Γ
2
n ⎡ +∞ 1 i ⎤
F = ∑ ⎢ ∫ α α ( x − γ ) (α −1) e −( x −γ )/ β dx − ⎥ → min im (4.71)
i = 1 ⎣ Qi β Γ n + 1⎦
79
Pentru reparti¡ia Gama cu 3 parametri, momentul de ordinul 1 (media
aritmeticå), respectiv momentele centrate de ordinul 2 ¿i 3 au expresiile (V.
Yevdjevitch, 1972):
+∞
m = ∫ xf ( x ) dx = γ + αβ ;
γ
+∞
m2 = σ 2 = ∫ ( x − m) f ( x )dx = αβ 2 ;
2
(4.72)
γ
+∞
m3 = ∫ ( x − m) f ( x )dx = 2αβ 3 .
3
γ
Ca urmare, coeficien¡ii de varia¡ie ¿i asimetrie sunt:
σ β α
Cv = = ,
m γ + αβ
(4.73)
m3 2
Cs = = .
σ3 α
80
¥n figura 4.7 sunt reprezentate curba empiricå a probabilitå¡ilor de depå¿ire
precum ¿i curbele teoretice calculate cu parametrii ob¡inu¡i prin metoda
momentelor (curba 1), respectiv prin optimizare (curba 2).
Chiar ¿i în cazul unei alegeri foarte bune a raportului Cs /Cv (ceea ce nu este
întotdeauna sigur în practicå), aproximarea curbei empirice este mai slabå decât
în cazul utilizårii parametrilor ob¡inu¡i prin optimizare.
6
σ Cs = (4.74)
n
Cv
σ Cv = 1 + 2Cv2 . (4.75)
2n
81
bazå de experien¡å în func¡ie de valorile coeficientului de varia¡ie (care este
determinat cu o precizie mult mai bunå).
Coeficientul de asimetrie are (C. Mociorni¡å ¿.a., 1979) urmåtoarele valori
(func¡ie de Cv):
82
¥n anumite situa¡ii acest lucru poate så nu se realizeze. ¥n acest caz sunt de
suspectat erori de determinare a unora dintre debitele din ¿ir; se mai poate
întâmpla ca în cadrul intervalului de n ani analizat så se fi produs debite cu
probabilitå¡i de apari¡ie extrem de reduse (prima sau primele valori din ¿irul
ordonat descrescåtor pot avea probabilitå¡i de depå¿ire cu mult mai mici decât
frecven¡ele empirice calculate cu rela¡ii de tipul i/(n+1)).
Pentru ob¡inerea unei concordan¡e cât mai bune între conturul curbei
teoretice ¿i valorile måsurate se pot adopta diverse måsuri (C. Mociorni¡å ¿.a.,
1979, R. Drobot, 1989):
− Modificarea valorii parametrilor Cv ¿i Cs; admi¡ând cå eroarea la
determinarea coeficientului de varia¡ie este în limitele ± σ Cv se vor
propune noi valori pentru coeficientul de varia¡ie cuprinse în domeniul
[Cv- σ Cv ; Cv + σ Cv ]. ¥n ceea ce prive¿te coeficientul de asimetrie, acesta va fi
83
defavorabile pe care le are mic¿orarea numårului de valori disponibile pentru
prelucrarea statisticå.
84
5. REPARTIºII CONTINUE UTILIZATE ¥N HIDROLOGIE
Aceastå reparti¡ie, cunoscutå ¿i sub denumirea de legea lui Gauss sau legea
Gauss-Laplace, ocupå un loc deosebit printre distribu¡iile teoretice, constituind
de altfel o lege limitå cåtre care tind unele distribu¡ii (binomialå, Poisson) în
anumite condi¡ii. Pentru ca o variabilå aleatoare så aibå distribu¡ie normalå,
trebuie ca ea så depindå de un mare numår de factori, cu o influen¡å individualå
relativ reduså, efectul fiecårui factor så fie aditiv ¿i independent de al celorlal¡i
factori cauzali (V. Yevjevich, 1972).
Distribu¡ia normalå de parametri m ¿i σ este definitå dupå cum s-a aråtat
(§4.5.2) prin urmåtoarea densitate de reparti¡ie:
2
1 ⎛ x −m ⎞
− ⎜ ⎟
f (x; m,σ ) =
1
e 2⎝ σ ⎠
; x ∈R (5.1)
σ 2π
f (m ) =
1
; x ∈R (5.2)
σ 2π
85
− reparti¡ia normalå fiind simetricå media, mediana ¿i modul coincid; în
plus, coeficientul de asimetrie este nul (se reaminte¿te cå la reparti¡iile
asimetrice acest coeficient este diferit de zero);
− func¡ia f(x; m, σ) are formå de clopot (de altfel, se mai nume¿te ¿i
clopotul lui Gauss) cu punctele de inflexiune în x = ±σ.
Reprezentarea graficå a reparti¡iei normale (exprimatå prin intermediul
densitå¡ii de reparti¡ie) este redatå în figura 5.1.
Referitor la forma func¡iei f(x; m, σ) trebuie aråtat (fig. 5.2) cå, cu cât
abaterea medie påtraticå σ este mai micå, clopotul este mai ascu¡it, iar cu cât σ
este mai mare clopotul este mai turtit (împrå¿tierea este mai mare).
86
Deoarece parametrii distribu¡iei normale sunt m ¿i σ, rezultå cå având media
¿i dispersia variabilei aleatoare, func¡ia de reparti¡ie este perfect determinatå.
Fåcând, în expresia densitå¡ii de reparti¡ie schimbarea de variabilå:
x−m
t= , (5.4)
σ
f (t ;0 ;1) =
1 −t 2 / 2
e ; t ∈R . (5.5)
2π
x−m
Variabila t = se nume¿te variabilå standard sau normatå, iar
σ
distribu¡ia f(t; 0; 1) poartå numele de reparti¡ie normalå normatå.
Valorile densitå¡ii de reparti¡ie a distribu¡iei normale normate sunt date în
tabelul 5.1; valorile oricårei alte reparti¡ii normale, având parametrii estima¡i pe
baza datelor din måsuråtori se ob¡in cu rela¡iile (V. Yevjevich, 1972):
x = m + tσ , (5.6)
respectiv:
f ( x ) = f ( m + tσ ) =
1 1
e −t / 2 = f ( t ) .
2
(5.7)
σ 2π σ
Mai trebuie aråtat cå variabila aleatoare normatå având media egalå cu zero
este simetricå fa¡å de verticala duså prin origine.
87
88
¥n figura 5.3 este prezentat graficul densitå¡ii de reparti¡ie f(t; 0; 1) ¿i
respectiv graficul func¡iei f(x; m, σ) ob¡inut din aceasta.
Func¡ia de reparti¡ie a varibilei normale normate, numitå func¡ia lui Laplace
este:
1 x −t 2 2
Φ(x) = ∫e dt . (5.8)
2π −∞
−x +∞ x
Φ ( − x ) = ∫ f ( t )dt = ∫ f ( t )dt =1 − ∫ f ( t )dt =1 − Φ ( x ) . (5.9)
−∞ x −∞
dx = σ dt . (5.10)
x2 − m
1 σ
Prob(x1 ≤ X < x2) = −t 2
∫ e
/2
⋅σdt =
σ 2π x1 − m
σ
(5.12)
⎛ x2 − m x1 − m
⎞
1 ⎜ σ −t 2 /2 σ
−t 2 / 2 ⎟
= ⎜ ∫ e dt − ∫ e dt ⎟
2π ⎜ −∞ −∞ ⎟
⎝ ⎠
89
90
ºinând seama de defini¡ia (5.8) a func¡iei de reparti¡ie normalå normatå, cu
parametrii m = 0 ¿i σ = 1, rezultå:
⎛ x − m⎞ ⎛ x1 − m ⎞
Pr ob ( x 1 ≤ X < x 2 ) = Φ ⎜ 2 ⎟ − Φ⎜ ⎟ . (5.13)
⎝ σ ⎠ ⎝ σ ⎠
⎛ x − m⎞
Pr ob ( − ∞ < X < x 2 ) = Φ ⎜ 2 ⎟ − Φ ( − ∞) . (5.14)
⎝ σ ⎠
⎛ x − m⎞
Pr ob ( X < x ) = Φ ⎜ ⎟ = Φ (t ) . (5.15)
⎝ σ ⎠
⎛ x − m⎞
Pr ob ( X ≥ x ) = 1 − Φ ⎜ ⎟ = 1 − Φ (t ) . (5.16)
⎝ σ ⎠
Pr ob ( )
X − m < α = Pr ob ( − α + m ≤ X < α + m) =
. (5.17)
⎛α⎞ ⎛ α⎞
=Φ ⎜ ⎟ − Φ ⎜− ⎟
⎝σ ⎠ ⎝ σ⎠
91
Dar:
deci:
⎛α⎞
Pr ob ( )
X − m < α = 2Φ ⎜ ⎟ − 1 .
⎝σ ⎠
(5.19)
Pr ob ( )
X − m < 3σ = 2Φ ( 3) − 1 = 0,9974 . (5.20)
92
Dacå variabila este continuå, densitatea de reparti¡ie este de forma:
b b
∫ f ( x )dx = ∫ k dx = kx a = k ( b − a) = 1 .
b
(5.22)
a a
Rezultå:
1
k= . (5.23)
b −a
93
Din punct de vedere practic lucrurile decurg ca în figura 5.4.
yn = F(xn) , (5.25)
x n = F −1( y n ) . (5.26)
94
-1
Dacå func¡ia F se poate explicita algebric, valorile xn rezultå imediat ce au
fost generate valorile yn.
-1
¥n cazul reparti¡iei normale, func¡ia F nu poate fi exprimatå algebric; ca
atare se utilizeazå o aproximare a acesteia sau se folosesc tabele ale reparti¡iei
normale normate, care permit determinarea numårului xn care corespunde
probabilitå¡ii de nedepå¿ire yn (Såcuiu, Zorilescu, 1978).
¥n continuare, se aplicå procedee de transformare a variabilelor normale
normate în variabile normale oarecare (de medie m ¿i abatere medie påtra-
ticå σ); alte transformåri permit trecerea la variabile cu distribu¡ii asimetrice.
4. Func¡ia de reparti¡ie normalå normatå constituie elementul de plecare
pentru construirea formatului de probabilitate pe care se reprezintå curbele
asimetrice care caracterizeazå fenomenele hidrologice.
Acest format este conceput astfel încât så permitå transformarea curbei în
formå de S a func¡iei de reparti¡ie normale normate într-o linie dreaptå (fig.5.5),
dilatând zona probabilitå¡ilor foarte mari ¿i foarte mici.
95
2
Fig. 5.6. Construirea formatului care liniarizeazå curbele y = a + bx :
2
a - schemå de principiu; b - exemplificare pentru curba y = 8 + 0,5 x .
2
Fie, pentru început, func¡ia y = f (x) = x .
Atât pe absciså, cât ¿i pe ordonatå se utilizeazå un format aritmetic sau
cartezian (la intervale egale corespund segmente egale, indiferent de pozi¡ia
acestora pe axå), rezultând curba cu linie plinå din figura 5.6, a.
¥n continuare, fiecårei valori x' = y de pe absciså i se asociazå o valoare:
~
x = f −1( y ) = y , (5.28)
( y)
2
~
y = f (~
x) = ~
x2 = = y = x' (5.29)
96
( y ) = f ( x') = a + b( x')
2
~
y = f ( x~ ) = f = a + bx' ; (5.30)
Dupå cum se observå ¿i din figura 5.6,b, pe formatul ob¡inut anterior, aceastå
curbå se reprezintå sub forma unei drepte.
Procedeul folosit se poate rezuma astfel: se stabile¿te o scarå aritmeticå de
divizare a axei Ox ¿i se trec deasupra axei absciselor valorile yi = f(xi);
corespunzåtor, în dreptul fiecårui punct yi astfel ob¡inut se trece valoarea
~ -1
x = f (y ) , aceste valori constituind noul sistem de divizare a abscisei.
i i
Utilizând aceste grada¡ii pentru absciså ¿i vechiul sistem de divizare pentru
ordonate, curba y = f(x), ca ¿i orice curbå din aceea¿i familie, se reprezintå în
noul sistem de coordonate sub forma unei drepte (M. Shahin, ¿.a., 1993).
Acela¿i procedeu se va folosi ¿i în cazul reparti¡iei normale normate. Fie
graficul reparti¡iei pe care s-au trecut valorile func¡iei (10%, 20%, 30%, etc.),
precum ¿i abscisele corespunzåtoare atât în reprezentare matematicå uzualå
(fig.5.7), cât ¿i în cea utilizatå în hidrologie (fig.5.8).
Fig. 5.7. Func¡ia de reparti¡ie normalå normatå ¿i câteva din valorile ei.
97
Fig. 5.8. Func¡ia de reparti¡ie normalå normatå în reprezentarea hidrologicå.
¥n continuare se utilizeazå un format aritmetic pentru reprezentarea valorilor
yp% (care vor fi trecute deasupra axei); în dreptul acestora, sub absciså se vor
marca probabilitå¡ile (fig. 5.9):
-1
p% = f (yp%)
98
Fig. 5.10. Reprezentarea func¡iei de reparti¡ie normale normate ¿i a curbei
probabilitå¡ilor de depå¿ire pe formatul de probabilitate.
99
Proprietatea reparti¡iei normale de a se reprezenta ca o dreaptå pe formatul
de probabilitate poate fi utilizatå pentru testarea ipotezei de normalitate: dacå
curba empiricå a probabilitå¡ilor de depå¿ire se situeazå aproximativ dupå o
dreaptå, poate fi luatå în considerare ipoteza unei reparti¡ii normale.
Dimpotrivå, dacå se manifestå o tendin¡å de curbare a reparti¡iei empirice,
distribu¡ia este asimetricå ¿i deci pentru modelarea statisticå a fenomenului
analizat trebuie utilizatå altå reparti¡ie teoreticå (lognormalå, Pearson III etc.).
1 ⎡ 1 ⎛ ln x − µ ⎞ 2 ⎤
ϕ (ln x ) = exp ⎢ − ⎜ n
⎟ ⎥ , (5.31)
σn 2π ⎢⎣ 2 ⎝ σ n ⎠ ⎥⎦
100
Se poate pune ¿i problema inverså de a trece de la distribu¡ia simetricå ϕ(lnx)
la distribu¡ia f(x); cu alte cuvinte, se cautå expresia matematicå a densitå¡ii de
reparti¡ie asimetricå f(x).
Probabilitatea elementarå ca variabila så ia valori în cadrul unui interval dat
trebuie så fie aceea¿i în ambele reprezentåri. Se poate scrie deci (V. Yevjevich,
1972):
1 1
f ( x ) ⋅ dx = ϕ (ln x ) ⋅ d(ln x ) = ϕ (ln x ) ⋅ dx = ϕ (ln x ) ⋅ ⋅ dx . (5.32)
x x
Rezultå:
1
f (x) = ϕ (ln x ) . (5.32')
x
1 ⎡ 1 ⎛ ln x − µ ⎞ 2 ⎤
f (x) = exp ⎢− ⎜ n
⎟ ⎥ (5.33)
x ⋅ σ n ⋅ 2π ⎢⎣ 2 ⎝ σ ⎠ ⎥
n
⎦
µ = e µn + σ n2 2
( )
12
σ = µ eσn − 1
2
(5.34)
( )
12
σ n2
Cv = e −1
Cs = 3Cv + Cv3
Distribu¡ia f(x) este asimetricå, a¿a cum se vede ¿i din figura 5.13 în care
s-au reprezentat pentru compara¡ie mai multe reparti¡ii log-normale
(V. Yevjevich, 1972).
101
Fig. 5.13. Reprezentarea comparativå a unor reparti¡ii log-normale.
2
µn = 0 ¿i σn = 0,1; 0,5 ¿i 2,0 (linia plinå),
2
σn = 0,5 ¿i µn = 0; 0,5 ¿i 1,0 (linia punctatå).
x p% = x + ∆x p% . (5.35)
102
Mårimea ∆xp% depinde de abaterea medie påtraticå a variabilei ¿i de un
factor de frecven¡å Kp%:
Deci:
Se ob¡ine:
x p% = x + σK p% . (5.37)
( )
x p% = x 1 + Cv K p% . (5.38)
Valorile factorului de frecven¡å Kp% sunt date în tabelul 5.3 (V. T. Chow,
1964) ¿i sunt exprimate în func¡ie de valorile lui Cs (ales drept parametru), care
la rândul lui se calculeazå în func¡ie de Cv, conform rela¡iei (5.34).
¥n tabel mai sunt trecute ¿i valorile probabilitå¡ii corespunzåtoare valorii
medii a variabilei.
Factorul de frecven¡å este pozitiv pentru probabilitå¡ile de 0,01; 0,1; 5; 20%
etc. ¿i negativ pentru probabilitå¡i mai mari de 50% (fig. 5.14).
103
104
5.4. REPARTIºIILE GAMA
Func¡ia gama
x Γ(x) x Γ(x) x Γ(x)
1,00 1,0000 1,34 0,8922 1,68 0,9050
1,02 0,9888 1,36 0,8902 1,70 0,9086
1,04 0,9784 1,38 0,8885 1,72 0,9126
1,06 0,9687 1,40 0,8873 1,74 0,9168
1,08 0,9597 1,42 0,8864 1,76 0,9214
1,10 0,9513 1,44 0,8858 1,78 0,9262
1,12 0,9436 1,46 0,8856 1,80 0,9314
1,14 0,9364 1,48 0,8857 1,82 0,9368
1,16 0,9298 1,50 0,8862 1,84 0,9426
1,18 0,9237 1,52 0,8870 1,86 0,9487
1,20 0,9182 1,54 0,8882 1,88 0,9551
1,22 0,9131 1,56 0,8896 1,90 0,9618
1,24 0,9085 1,58 0,8914 1,92 0,9688
1,26 0,9040 1,60 0,8935 1,94 0,9761
1,28 0,9007 1,62 0,8959 1,96 0,9837
1,30 0,8975 1,64 0,8986 1,98 0,9917
1,32 0,8946 1,66 0,9017 2,00 1,0000
De exemplu: Γ(3,7) = 2,7 ⋅ Γ(2,7) = 2,7 ⋅ 1,7 Γ(1,7) = 2,7 ⋅ 1,7 ⋅ 0,9086.
105
Dacå 0 < α < 1, din rela¡ia (5.40) se ob¡ine:
5.4.1. REPARTIºIA Γ1
1
f ( x;α ) = x α − 1e − x , (5.44)
Γ (α )
unde α este un parametru al formei curbei. Din figura 5.15 (V. Yevjevich,
1972), se constatå cå:
− pentru 0 ≤ α < 1, curba este asimptoticå la amândouå axele;
-x
− pentru α = 1, se ob¡ine o func¡ie exponen¡ialå f(x) = e ;
− pentru α > 1, curba are formå de clopot cu atât mai turtit cu cât α ia
valori mai mari; pentru α > 30, distribu¡ia Gama cu un parametru tinde cåtre
reparti¡ia normalå.
106
Parametrii distribu¡iei sunt urmåtorii:
m=α;
2 σ 1
σ =α; σ= α ; Cυ = = ;
m α
2
Cs = = 2Cυ . (5.45)
α
2
1 ⎛ x − m⎞
yi = ⎜ i ⎟ , (5.46)
2⎝ σ ⎠
n
α = ∑αi . (5.47)
i =1
n n 1 n
α = ∑αi = ∑ = . (5.48)
i=1 i=1 2 2
107
Acest rezultat este util pentru a genera numere aleatoare distribuite Γ1,
plecând de la numere aleatoare cu reparti¡ie normalå.
5.4.2. REPARTIºIA Γ2
1
f ( x; α , β ) = α
x α −1e − x /β . (5.49)
β Γ (α )
1 2
m = αβ ; σ 2 = αβ 2 ; σ = β α ; Cv = ; Cs = = 2C v . (5.50)
α α
108
Fig. 5.17. Transla¡ia func¡iei Γ2 cu valoarea xmin .
∑ ( x i + x min )
n n
∑ ui
i =1 i =1
u= = = x + x min . (5.51)
n n
∑ ( ui − u ) ∑ ( xi − x )
n 2 n 2
σ~ = i =1
= i=1
=σ . (5.52)
n−1 n−1
~
Noul coeficient de varia¡ie C v , se modificå astfel:
~ 1 σ σ x x
Cv = σ~ = = ⋅ = Cv . (5.53)
u x + x min x x + x min x + x min
109
Coeficientul de asimetrie, dupå cum s-a aråtat este invariant la transla¡ie:
~ 1 n
Cs = ∑ (ui − u ) ⋅ ~ 3 = ∑ ( x i − x ) ⋅ 3 = Cs .
3 1 1 n 3 1
(5.54)
n i=1 σ n i=1 σ
x + x min
Se noteazå cu ρ raportul , care pentru xmin > 0 este evident
x
supraunitar:
ρ>1. (5.55)
Ca urmare:
~
Cs Cs C
~ = 1 =ρ s . (5.56)
Cv Cv Cv
ρ
~ ~
Deoarece Cs /Cv = 2, iar ρ > 1, rezultå C s / C v > 2 pentru xmin > 0.
O formå echivalentå a reparti¡iei Γ2 a fost ob¡inutå de K. Pearson studiind
limitele unor reparti¡ii binomiale asimetrice; în expresia densitå¡ii de reparti¡ie
intervin 3 parametri, dar numai doi dintre ace¿tia sunt independen¡i.
Densitatea de reparti¡ie în forma datå de Pearson (fig. 5.18) este:
a/ d
− x /d ⎛ x⎞
f ( x; f 0 , a , d ) = f 0 e ⎜1+ ⎟ . (5.57)
⎝ a⎠
110
Fig. 5.18. Semnifica¡ia nota¡iilor din forma Pearson III a distribu¡iei Γ2.
+∞ a/ d
− x /d ⎛ x⎞
∫ f0 e ⎜1+ ⎟ dx = 1 . (5.58)
−∞ ⎝ a⎠
1
f ( x; α , β ) = α
x α −1e − x /β (5.59)
β Γ (α )
¿i:
a/ d
⎛ x⎞
f ( x; f 0 , a , d ) = f 0 e − x / d ⎜ 1 + ⎟ (5.59')
⎝ a⎠
a
= α −1 . (5.60)
d
111
d=β (5.61)
De aici rezultå:
a =β (α - 1) (5.62)
¿i:
d=β (5.63)
β=d (5.64)
a a+d
α = 1+ = .
d d
Dupå cum s-a aråtat, curbele de tip Pearson III sunt deosebit de adecvate
pentru studiul reparti¡iei debitelor maxime de pe râurile din România; în general
d ≠ 0, iar asimetria este pozitivå.
Rela¡ia de calcul a debitelor Qp% cu probabilitatea de depå¿ire p% prin
metoda momentelor este similarå cu cea utilizatå la reparti¡ia log-normalå:
(
Qp% = Q 1 + Cv φ p% .) (5.65)
112
113
114
Prin calcule se determinå valoarea medie Q ¿i coeficientul de varia¡ie Cv;
coeficientul de asimetrie se alege în func¡ie de Cν. Valorile φp% sunt date în
tabelul 5.5, în func¡ie de coeficientul de asimetrie Cs ¿i de probabilitatea de
depå¿ire p%. Se reaminte¿te cå reparti¡ia Pearson III este valabilå pentru
Cs > 2Cν (deoarece xmin > 0).
Pentru Cs = 0, curba ob¡inutå este simetricå, reprezentând de fapt ordonatele
probabilitå¡ii de depå¿ire a reparti¡iei normale. Utilizând pentru reprezentare
formatul de probabilitate, reparti¡ia normalå se va desena ca o dreaptå. Pe
acela¿i format, curbele Pearson III având Cs > 0 au o curburå cu atât mai
pronun¡atå, cu cât coeficientul de asimetrie este mai mare.
¥n figura 5.20 se poate urmåri influen¡a parametrilor Cν ¿i Cs asupra curbei
probabilitå¡ilor de depå¿ire: cu linie punctatå s-au figurat situa¡ii în care Cs = 0
(variind Cν), iar cu linie plinå s-au desenat curbe ale probabilitå¡ilor de depå¿ire
pentru valori crescåtoare ale lui Cs, men¡inând Cν constant (Cν = 1).
Metoda momentelor reprezintå un mod de calcul, deosebit de expeditiv, dar
cu o flexibilitate reduså, utilizând valori prestabilite ale raportului Cs /Cv .
O metodå cu performan¡e superioare este metoda celor mai mici påtrate care
conduce direct la evaluarea parametrilor α ¿i β ai densitå¡ii de reparti¡ie. ¥n
continuare, dispunând de valorile lui α ¿i β se poate ob¡ine prin încercåri
debitul Qp% care corespunde unei probabilitå¡i p% date; acest debit reprezintå
limita inferioarå de integrare a densitå¡ii de reparti¡ie f(x; α, β ):
+∞
∫ f ( x; α , β ) dx = p% . (5.66)
Qp %
5.4.3. REPARTIºIA Γ3
α − 1 − ( x −γ ) / β
f ( x; α , β , γ )= (x − γ )
1
α
e , (5.67)
β Γ (α )
unde:
115
α este parametrul de formå;
β - parametrul de scarå;
γ - limita inferioarå a valorilor distribu¡iei: 0 ≤ γ ≤ x <∞ (γ ≠ 0).
Schimbarea de variabilå y=x-γ reduce distribu¡ia Γ3 la Γ2, iar rela¡ia
z = (x -γ)/β transformå repati¡ia Γ3 în Γ1. Transformårile inverse sunt utilizate în
procedeele de generare a numerelor aleatoare, pentru a ob¡ine din variabile
aleatoare independente distribuite Γ1 variabile cu reparti¡ia Γ2 sau Γ3.
O reparti¡ie Γ triparametricå a fost ob¡inutå de S. N. Kri¡ki ¿i M. F. Menkel
b
din distribu¡ia Pearson III printr-o transformare de tipul u = ax .
Curbele binomiale-exponen¡iale Kri¡ki-Menkel sunt valabile pentru orice
raport Cs /Cν (se reaminte¿te cå în cazul reparti¡iei Pearson III Cs > 2Cν);
densitatea de reparti¡ie este (Manoliu, Roman, 1983):
γ-1 -u
f(u) = u e / Γ(γ) , (5.68)
unde:
⎛ Γ (γ + b ) x ⎞
1
b
u = ⎜⎜ ⋅ ⎟⎟ . (5.69)
⎝ Γ (γ ) m ⎠
Q p% = Q k p% , (5.70)
116
117
118
119
120
121
122
123
Fåcând compara¡ia cu rela¡ia:
( )
Q p% = Q 1 + Cv φ p% ,
utilizatå la reparti¡ia Pearson III, rezultå cå mårimea kp% joacå acela¿i rol ca
factorul 1 + Cν φp%.
Cu alte cuvinte, coeficien¡ii modul reprezintå înså¿i ordonatele curbei pro-
babilitå¡ilor de depå¿ire pentru o reparti¡ie Kri¡ki-Menkel având valoarea medie
unitarå (fig. 5.21).
124
5.4.4. CORECºIA DE SIGURANºÅ ∆QP%
a E p%
∆Qp% = Qp% . (5.71)
n
125
¥n aceastå rela¡ie:
Qp% este debitul cu probabilitatea de depå¿ire p%;
a - un factor care ¡ine cont de calitatea observa¡iilor ¿i are urmåtoarele
valori:
a = 0,70 pentru râurile care se gåsesc în regiuni bine studiate
din punct de vedere hidrologic;
a = 0,50 pentru fluviul Dunårea;
a = 1,00 pentru râurile din zone slab studiate din punct de
vedere hidrologic.
Ep% - un factor de corec¡ie care depinde atât de valoarea coeficientului de
varia¡ie Cv, cât ¿i de probabilitatea de calcul p%.
Valorile corec¡iei Ep% se ob¡in din figura 5.22 (C. Mociorni¡a ¿.a., 1979).
Mai trebuie men¡ionat cå valoarea corec¡iei ∆Qp% nu trebuie så depå¿eascå
20% din valoarea debitului la care se aplicå.
⎧⎪ ⎡ − ( a + x ) ⎤ ⎫⎪
F( x; a, c) = Pr ob ( X < x ) = exp ⎨exp ⎢ ⎥⎬ (5.72)
⎪⎩ ⎢⎣ c ⎥⎦ ⎪⎭
a=γc-m;
6
c= σ . (5.73)
π
126
Prin transformarea y = (a + x)/c, se ob¡ine:
−y
F( x ) = e −e . (5.74)
F( x ) ≅ 1 − e − y , (5.75)
1
c
( x + a) = − ln[− ln F( x )] . (5.77)
χ 2 = X 12 + X 22 +...+ X n2 . (5.78)
127
2
Densitatea de reparti¡ie a distribu¡iei χ cu n grade de libertate este definitå
numai pentru valori nenegative ale lui x:
n x
−1 −
f ( x; n) =
1
x e 2
2 . (5.79)
Γ ⎛⎜ ⎞⎟
n/ 2 n
2
⎝ 2⎠
2
Fig. 5.23. Densitatea de reparti¡ie ¿i func¡ia de reparti¡ie a distribu¡iei χ .
( ) (
F c χ 2 = Pr ob χ 2 ≥ χα2 = α . ) (5.80)
c 2
¥n rela¡ia de defini¡ie a lui F (χ ), valoarea a reprezintå o probabilitate care
se nume¿te prag de semnifica¡ie; valorile uzuale ale lui α sunt: α = 0,01; 0,05 ¿i
0,10 (Iliescu, Vodå, 1977). Mårimea χ α2 (notatå ¿i prin χ 02 sau χ cr2 ) se mai
2
nume¿te punct critic ¿i reprezintå acea valoare a variabilei χ a cårei
probabilitate de depå¿ire este α (fig. 5.24).
128
129
2
Fig. 5.24. Semnifica¡ia punctului critic în distribu¡ia χ .
( )
Fig. 5.25. Interval de încredere χ min , χ max .
2 2
2
Reparti¡ia χ intervine în definirea altor douå distribu¡ii auxiliare; reparti¡ia t
(sau Student) a lui Gosset ¿i reparti¡iile Z ¿i F ale lui Fischer.
• Reparti¡ia t (Student). Dacå X ¿i Y sunt douå variabile aleatoare
independente, X urmând o reparti¡ie normalå de medie 0 ¿i abatere medie
2
påtraticå σ, iar Y o reparti¡ie χ , cu n grade de libertate, atunci variabila
aleatoare:
x
t= (5.81)
y/n
130
urmeazå o reparti¡ie Student cu n grade de libertate. Variabila t este continuå
¿i apar¡ine intervalului (-∞, +∞), iar densitatea ei de reparti¡ie este:
⎛ n + 1⎞
Γ⎜ ⎟ −
n+ 1
⎝ 2 ⎠⎛ t2 ⎞ 2
f (t; n) =
1
⋅ ⎜1 + ⎟ . (5.82)
nπ ⎛ n⎞
Γ⎜ ⎟ ⎝
n⎠
⎝ 2⎠
Aceastå func¡ie este simetricå: f(-t)= f(t) ¿i F(-t)= 1 - F(t); când numårul
gradelor de libertate cre¿te foarte mult, reparti¡ia t tinde cåtre reparti¡ia normalå.
Valorile t, corespunzåtoare unei probabilitå¡i de depå¿ire α sunt de asemenea
tabelate (Panaite, Munteanu, 1982; Moineagu ¿.a., 1976).
• Reparti¡ia F a lui Fisher-Snedecor. Dacå Y1 ¿i Y2 sunt douå variabile
2
aleatoare independente, urmând amândouå o reparti¡ie χ cu n1, respectiv n2
grade de libertate, atunci raportul:
y1 / n1
x= , x>0. (5.83)
y 2 / n2
⎛ n + n2 ⎞
n1n1 / 2 ⋅ n2n2 / 2 ⋅ Γ ⎜ 1 ⎟ n
⎝ 2 ⎠ 21 − 1 n +n
f ( x; n1 , n2 ) = ( n2 + n1 x ) 2 .
− 1 2
x (5.84)
⎛n ⎞ ⎛n ⎞
Γ⎜ 1⎟ ⋅Γ⎜ 2⎟
⎝ 2⎠ ⎝ 2⎠
131
6. INTERVALE DE ¥NCREDERE
⎛ s ⎞
⎜ x − z (α ) ; x + z (α )
s
⎟ , (6.2)
⎝ n n⎠
132
unde z(a) se determinå, dupå cum se va aråta în continuare, din tabelele
reparti¡iei normale sau Student, func¡ie de volumul n al selec¡iei.
Se va nota prin U, valoarea normatå a mediei de selec¡ie:
x − M( x ) x−m
U= = , (6.3)
D2 ( x) σ n
2
unde pentru M( x ), ¿i D ( x ) s-au utilizat expresiile (6.1), respectiv (6.2).
Se considerå intervalul (-z, z) simetric în raport cu originea, care con¡ine
variabila normatå U cu o probabilitate egalå cu 1-α:
Deci:
2Φ(z) - 1 = 1 - α (6.6)
sau:
α
Φ( z ) = 1 − . (6.6')
2
133
b) Pentru un volum redus al selec¡iei (n < 30), dacå reparti¡ia variabilei este
2 2
normalå, iar dispersia σ este aproximatå prin s , variabila U are o reparti¡ie
Student cu (n - 1) grade de libertate.
Reparti¡ia Student este tabelatå cu ajutorul func¡iei complementare
c
F (z)=1-F(z). Prin urmare, marginile intervalului (-z, +z) corespunzåtoare
coeficien¡ilor de încredere (1 - α) se determinå prin rezolvarea ecua¡iei:
Tabelul 6.1
n-1 11 12 13 14 15 16 17 18 19 20
1-α
1-α=95% 2,201 2,179 2,160 2,144 2,131 2,120 2,110 2,100 2,093 2,086
1-α=99% 3,106 3,054 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845
n-1 21 22 23 24 25 26 27 28 29 30
1-α
1-α=95% 2,080 2,074 2,069 2,064 2,059 2,055 2,052 2,048 2,045 2,042
1-α=99% 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750
x−m
− z (α ) < < z (α ) (6.8)
σ n
sau, aproximând dispersia teoreticå prin dispersia de selec¡ie, rezultå a¿a cum
s-a aråtat deja:
s s
x − z (α ) < m < x + z (α ) . (6.9)
n n
134
∑ ( xi − x ) .
1 n 2
s2 = (6.10)
n − 1 i=1
− ( ) ⎛
media M s 2 = σ 2 ⎜ 1 −
⎝
1⎞
⎟ ≈σ ;
n⎠
2
(6.11)
m4 − σ 4
− ( )
dispersia D 2 s 2 ≈
n
. (6.12)
( )
D2 s 2 ≈
2 4
n
σ . (6.13)
α
(
Pr ob χ 2 > χ min
2
)
= 1−
2
. (6.16)
135
De exemplu, pentru α = 5% ¿i un numår de grade de libertate cuprins între 9
¿i 20, marginile χ min
2
¿i χ max
2
au urmåtoarele valori (tab. 6.2):
Tabelul 6.2
n-1 9 10 11 12 13 14 15 16 17 18 19 20
2
χ
χ min
2 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,81 7,56 8,23 8,91 9,59
χ 2
max
19,00 20,50 21,90 23,30 24,70 26,10 27,50 28,80 30,20 31,30 32,90 34,20
2
Dupå ob¡inerea lui χ min
2
¿i χ max
2
¿i evaluarea dispersiei de selec¡ie s ,
2
intervalul care con¡ine cu probabilitatea (1 - α) valoarea adevåratå σ a
dispersiei se calculeazå cu rela¡ia (6.14).
• Interval de încredere pentru abaterea standard. Abaterea standard, la fel
ca ¿i dispersia din care derivå, este de asemenea o variabilå aleatoare.
Valoarea medie a acestei variabile este (V. Yevjevich, 1972):
M(s) = σ , (6.17)
iar dispersia:
m4 − σ 4
D2 ( s) = . (6.18)
4 nσ 2
M(s) = σ (6.17')
σ2
D2(s) = . (6.18')
2n
136
Fig. 6.1. Elipsa de încredere pentru parametrii m ¿i σ.
¥n acest caz vor fi definite regiuni de încredere: pentru doi parametri rezultå
o elipså, iar pentru trei parametri un elipsoid de încredere (V. Yevjevich, 1972).
Cu alte cuvinte zona de încredere nu este un dreptunghi sau un paralelipiped
construit prin limitele intervalelor de încredere al fiecårui parametru ci are o
extindere mai restrânså. O exemplificare pentru cazul a doi parametri (m ¿i σ) se
poate urmåri în figura 6.1.
137
7. VERIFICAREA IPOTEZELOR STATISTICE
138
Evident, este verificatå rela¡ia:
n1 + n2 + ... +nk = n , (7.3)
sau:
Pentru orice reparti¡ie teoreticå, f(x) sau F(x) sunt cunoscute ¿i deci evaluarea
lui pi nu ridicå probleme. Cunoscându-l pe pi se pot calcula imediat frecven¡ele
absolute teoretice ale fiecårui interval, acestea fiind reprezentate de produsul npi
Abaterile ni - npi dintre frecven¡ele absolute teoretice ¿i cele empirice
reprezintå o variabilå aleatoare; se poate demonstra cå variabila auxiliarå:
k ( ni − np i ) 2
χ calculat
2
= χ c2 = ∑ =
i=1 npi
(7.6)
( n1 − np 1 ) 2 (n2 − np 2 ) 2 ( n − np k ) 2
= + +...+ k
np1 np2 npk
2
urmeazå la limitå o reparti¡ie χ . Numårul de grade de libertate al acestei
variabile nu este, înså, k - 1, ci k - λ - 1, unde λ reprezintå numårul parametrilor
reparti¡iei teoretice, care au fost estima¡i cu ajutorul datelor din måsuråtori.
139
2
Variabila χ c2 urmeazå deci o reparti¡ie χ cu ν = k - λ - 1 grade de libertate.
2
Pentru un numår ν dat de grade de libertate din tabelele reparti¡iei χ se poate
determina valoarea χ ν2,α (sau χ c2 ) corespunzåtoare pragului de semnifica¡ie α
2
ales; χ ν2,α reprezintå valoarea χ cu ν grade de libertate ¿i a cårei probabilitate
de depå¿ire este α (fig. 5.23).
Ipoteza statisticå propuså este acceptatå dacå χ calculat
2
< χ ν2,α (concordan¡a
între reparti¡ia teoreticå propuså ¿i cea empiricå este bunå) ¿i este respinså dacå:
χ calculat
2
> χ ν2,α .
Fie de exemplu cazul unor niveluri hidrologice la care domeniul de varia¡ie a
fost împår¡it în 11 clase; se testeazå ipoteza distribu¡iei normale (λ=2, deoarece
doi parametri: m ¿i σ sunt estima¡i pe baza datelor din måsuråtori). Numårul de
2
grade de libertate este : ν = 11 - 2 - 1 = 8; variabila χ cu 8 grade de libertate ¿i
un prag de semnifica¡ie de 1% are valoarea χ 2
8; 1% = 20,1.
Presupunând cå χ calculat
2
= 18, ipoteza normalitå¡ii poate fi acceptatå,
deoarece χ calculat
2
< χ 2
8; 1% .
d = max F * ( x ) − F( x ) , (7.7)
*
unde F (x) este calculat cu formula i/(n+1).
Conform teoremei lui Kolmogorov:
⎛ λ ⎞
Pr ob ⎜ d ≤ ⎟ = 1 − α = K( λ ) . (7.8)
⎝ n⎠
140
unde:
+∞
λ
K ( λ ) = ∑ ( −1) k e − 2 k
2 2
, (7.9)
−∞
iar λ este un numår real care depinde de valoarea aleaså pentru pragul de
semnifica¡ie α: λ=λ(α).
Func¡ia K(λ) se calculeazå conform rela¡iei (7.9) ¿i este tabelatå; ca urmare
pentru un prag de semnifica¡ie α ales rezultå imediat λ.
[ F ( x ) − F ( x )]
+∞ 2
C= ∫ *
df ( x ) . (7.10)
−∞
2
1 n ⎡ 2i − 1⎤
Ccalculat = +∑ ⎢⎣ F ( x i − 2n ⎥⎦ . (7.11)
12n i = 1
α = 1% C0,99 = 0,743
α = 5% C0,95 = 0,461
α = 10% C0,90 = 0,347
141
Ipoteza H0 este acceptatå dacå Ccalculat ≤ C1−α ¿i este respinså în caz contrar.
2
Cele trei teste prezentate (χ , Kolmogorov - Smirnov ¿i Cramer von Mises)
au fost utilizate comparativ pentru verificarea ipotezelor statistice privind
debitele maxime anuale la circa 108 sta¡ii hidro (Cicioni ¿.a., 1984) ¿i perioade
cuprinse între 27 ¿i 46 de ani. Pragul de semnifica¡ie α a fost considerat de 5%
2
¿i 10%. Cea mai mare satisfac¡ie a oferit testul χ , iar dintre reparti¡iile
2
examinate distribu¡ia lognormalå cu 2 parametri. Testele χ , Kolmogorov -
Smirnov ¿i Cramer von Mises pot fi aplicate indiferent de ipoteza privind tipul
reparti¡iei statistice teoretice.
Existå o serie de alte teste (Lilliefors, Massey, Shapiro Wilk, D'Agostino
etc.), utilizabile numai pentru verificarea ipotezei de normalitate ¿i care pot fi
aplicate chiar în cazul unui numår mai mic de valori. Evident, pentru aplicarea
acestor teste valorile variabilelor trebuie simetrizate prin logaritmare.
• Teste pentru analiza omogenitå¡ii hidrologice. Deducerea unor rela¡ii de
sintezå este posibilå numai pe zone omogene din punct de vedere hidrologic.
Pentru testarea ipotezei de omogenitate se poate folosi testul F (care utilizeazå
reparti¡ia F a lui Fisher - Snedecor).
Omogenitatea se referå la o anumitå caracteristicå hidrologicå
(Vladimirescu, 1978): debit mediu anual, precipita¡ie medie anualå etc. Dacå
dispersiile teoretice ale acestor variabile pentru douå sta¡ii sunt egale
omogenitatea poate fi admiså.
Din punct de vedere matematic problema poate fi formulatå astfel: fiind date
douå popula¡ii normale (sau eventual normalizate prin logaritmare) având
dispersiile teoretice σ 12 ¿i σ 22 se cere så se verifice ipoteza statisticå:
H0 : σ 12 = σ 22 cu alternativa H1 : σ 12 ≠ σ 22
s22
Fcalculat = (unde s12 > s22 ) (7.12)
s12
142
Dacå Fcalculat > Fn2 −1; n1 − 1; 1−α ipoteza H0 este respinså (α este pragul de
semnifica¡ie al testului, iar Fn2 −1; n1 − 1; 1−α se ob¡ine din tabelele reparti¡iei
Fisher - Snedecor).
¥n cazul în care intereseazå omogenitatea unui teritoriu mai larg (care
cuprinde mai multe sta¡ii), se calculeazå coeficientul de neomogenitate Fcalculat
cu rela¡ia (7.12); dacå aceasta depå¿e¿te limita criticå F, omogenitatea este
excluså (V. T. Chow, 1964; Vladimirescu, 1978).
Dacå se pune problema excluderii unei singure sta¡ii (dispersia ata¿atå
variabilei examinate este diferitå de a celorlalte sta¡ii) se poate utiliza testul
Cochran (Iliescu, Vodå, 1977).
143
8. VARIABILE ALEATOARE N - DIMENSIONALE
F(x)= F(x1, x2, ..., xn) = Prob [(X1 < x1), (X2 < x2), ..., (Xn < xn)]
(8.1)
x1 x2 xn
∫ ∫ ... ∫ f ( u1 , u2 ,..., un )du1du2 ... dun = F( x 1 , x 2 ,..., x n ) (8.3)
−∞ −∞ −∞
144
x1 x2 +∞
∫ ∫ ... ∫ f (u1 , u2 ,..., un )du1du2 ... dun = 1 (8.5)
−∞ −∞ −∞
∂ n F( x 1 , x 2 ,..., x n )
f(x) = f(x1,, x2, ..., xn)= . (8.6)
∂x 1∂x 2 ... ∂x n
F1, 2, ..., k(x1, x2, ..., xk) = F(x1, x2, ...,xk, ∞ ,∞ ,...,∞) (8.9)
¿i densitatea de reparti¡ie:
+∞ +∞
f1, 2,...,k ( x 1 , x 2 ,..., x k ) = ∫ ... ∫ f ( x 1 , x 2 ,..., x n )dx k + 1 ... dx n . (8.10)
−∞ −∞
145
Densitatea de reparti¡ie condi¡ionatå se calculeazå cu rela¡ia:
f ( x 1 , x 2 ,..., x n )
f ( x 1 , x 2 ,..., x n x k +1 , x k + 2 ,..., x n ) = . (8.11)
f k +1, ..., n ( x k +1 ,..., x n )
⎡ K 11 K 12 ... K 1n ⎤
⎢K K 22 ... K 2 n ⎥⎥
⎢ 21
K = ⎢⎢ ⎥ .
.
⎥ (8.13)
. ...
⎢ ⎥
⎢ . ⎥
⎢⎣ K n1 K n2 ... K nn ⎥⎦
146
Douå variabile Xi ¿i Xj din sistem se numesc corelate (sau dependente), dacå
momentul Kij ≠ 0 (aceasta înseamnå cå varia¡ia variabilei Xi antreneazå ¿i
varia¡ia variabilei Xj ). Când variabilele sunt necorelate (adicå sunt indepen-
dente) Kij = 0.
Se atrage înså aten¡ia cå propozi¡ia reciprocå nu este adevåratå, deci dacå
covarian¡a este nulå, nu rezultå neapårat cå variabilele respective sunt
independente (Mihåilå, 1965).
Având în vedere dependen¡a dintre variabilele unui sistem, rezultå cå
proprietå¡ile acestuia nu pot fi complet ¿i corect descrise numai prin
proprietå¡ile variabilelor componente, fiind necesarå ¿i examinarea rela¡iilor
reciproce dintre aceste variabile.
Momentele de corela¡ie intrå în definirea coeficien¡ilor de corela¡ie, care
reprezintå de fapt momente de corela¡ie normate:
rij =
K ij
=
(
cov X i , X j ) . (8.14)
σ iσ j D2 ( X i ) ⋅ D2 ( X j )
147
Foarte multe fenomene hidrologice sunt de tip bi-dimensional, ca de
exemplu perechile de valori: debitul maxim - volumul undei de viiturå; debitul
râului - debitul solid transportat, etc..
Chiar dacå anumite fenomene hidrologice ar fi mai complexe (de tip tri sau
n-dimensional) lipsa datelor din måsuråtori face necesarå simplificarea
dependen¡elor constatate sau estimate ¿i conduce la utilizarea unui aparat
matematic mai simplu (reparti¡ii unidimensionale, cel mult bi-dimensionale).
Prin particularizarea no¡iunilor de la sistemele de variabile n-dimensionale,
în cazul bi-dimensional se ob¡in urmåtoarele rela¡ii de defini¡ie:
− func¡ia de reparti¡ie F(x,y) = Prob [(X < x);(Y < y)]; (8.16)
∂ 2 F( x , y )
− densitatea de reparti¡ie f(x,y) = ; (8.16')
∂x ∂y
x y
¿i în plus: ∫ ∫ f ( x, y )dxdy = F( x, y ) (8.17)
−∞ −∞
sau:
+∞ +∞
f 1( x ) = ∫ f ( x , y )dy ; f 2 ( x ) = ∫ f ( x , y )dx ; (8.19)
−∞ −∞
− reparti¡iile condi¡ionate:
f ( x, y )
f ( x y) = ; (8.20)
f2 ( y)
f ( x, y )
f ( x y) = ; (8.21)
f1 ( x )
− matricea de corela¡ie a sistemului de variabile aleatoare:
148
⎡ K xx K xy ⎤
K=⎢
K yy ⎥⎦
, (8.22)
⎣ K yx
unde:
2
Kxx = M[(X - mx)(X - mx)] = σx , (8.23)
2
Kyy = M[(Y - my)(Y - my)] = σy , (8.25)
cov ( X, Y )
r ( X, Y ) = = r(Y , X ) (8.27)
D 2 ( X ) ⋅ D 2 (Y )
r = r(X,Y) ; σ x = D 2 ( X ) ¿i σ y = D 2 ( Y ) (8.28)
se poate scrie:
⎡ σ x2 r ⋅σ x ⋅σ y ⎤
K= ⎢ ⎥ (8.30)
⎢⎣ r ⋅ σ x ⋅ σ y σ y2 ⎥⎦
8.2.1. REPARTIºIA NORMALÅ BI-DIMENSIONALÅ
149
Este cea mai utilizatå reparti¡ie bi-dimensioanlå.
Din punct de vedere teoretic se pot formula, la fel ca ¿i la variabilele
unidimensionale, o multitudine de reparti¡ii (simetrice sau asimetrice). Practic
înså se admite apriori cå reparti¡ia normalå bi-dimensionalå aproximeazå
satisfåcåtor aproape toate tipurile de valori experimentale.
Densitatea de reparti¡ie a variabilei bi-dimensionale, normal distribuitå, este
datå de formula:
1 ⎛ 1 E2 ⎞
f ( x, y ) = exp⎜ − ⎟ , (8.31)
2πσ x σ y 1 − r 2 ⎝ 2 1− r2 ⎠
(x − m x ) (y − m ) ( x − m x )( y − m y )
2 2
y
E 2
= + − 2r . (8.32)
σ x2 σ y2 σ xσ y
respectiv:
⎛ y−m ( ) ⎞
2
exp⎜ − ⎟ .
1 y
f ( y) = (8.34)
σy 2π ⎜ 2σ y
2 ⎟
⎝ ⎠
150
y Reparti¡ia
. . . . . . marginalå
y1 y2 yi yn
x a lui X
. . . . . .
x1 f11 f12 f1j f1n f1•
. . . . . .
x2 f21 f22 f2j f2n f2•
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . .
xi fi1 fi2 fij fin fi•
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . .
xm fm1 fm2 fmj fmn fm•
Reparti¡ia
marginalå . . . . . . f••
f•1 f•2 f•j f•n
a lui Y
n
∑ f ij = f i • (i = 1, ..., m) , (8.34)
j =1
respectiv pe coloane:
m
∑ fij = f• j (j = 1, ..., n) , (8.35)
i =1
⎛x x2 xi xm ⎞
X: ⎜ 1 ⎟ , (8.36)
⎝ f 1• f 2 • f i• f •m ⎠
iar reparti¡ia marginalå a lui Y:
151
⎛ y1 y2 yj yn⎞
Y: ⎜ ⎟ . (8.36′)
⎝ f •1 f •2 f• j f•n ⎠
⎛ y1 y2 yi y n⎞
Y:⎜ ⎟ . (8.37)
⎝ f i1 f i2 f ij f in ⎠
152
reprezintå punctele de coordonate (xi , yi). Imaginea graficå ob¡inutå permite
formularea unor ipoteze privind dependen¡a sau independen¡a componentelor
X ¿i Y ale variabilei aleatoare bi-dimensionale analizate.
Stabilirea acestui lucru este foarte importantå: dacå variabilele sunt
independente, ele pot fi analizate separat, ca reparti¡ii uni-dimensionale; în cazul
în care variabilele sunt dependente este important så se determine cel pu¡in care
este influen¡a modificårii unei variabile asupra valorilor celeilalte variabile. Se
ajunge astfel la prelucråri statistice mai simple de o deosebitå importan¡å
practicå, cunoscute sub numele de analize de corela¡ie ¿i regresie.
Fie de exemplu precipita¡iile X cåzute pe un bazin hidrografic, respectiv
debitele Y ale râului în profilul de închidere al bazinului. Reprezentând
diversele situa¡ii înregistrate se ob¡ine în principiu dependen¡a din figura 8.1.
153
(sau mai corect unei vecinåtå¡i a acesteia) îi corespund o multitudine de valori
ale lui Y.
Acest lucru se explicå prin influen¡a pe care o are gradul de umiditate ini¡ialå
a solului asupra descompunerii precipita¡iilor în scurgere de suprafa¡å ¿i
infiltra¡ie. Pentru o precipita¡ie datå, dacå solul este uscat o mare parte se
infiltreazå, deci scurgerea de suprafa¡å (¿i implicit debitul râului) au valori mai
mici; dimpotrivå, dacå umiditatea ini¡ialå a solului este ridicatå, scurgerea
superficialå respectiv debitul râului vor fi mai mari.
Considerând cå punctul xi de pe absciså reprezintå centrul unui interval:
⎡ ∆x ∆x ⎤
⎢⎣ x i − 2 , x i + 2 ⎥⎦ ,
154
Fig. 8.2. Tipuri de dependen¡å între variabilele Y ¿i X: a - legåturå deterministå
între Y ¿i X (variabile total dependente); b - legåturå statisticå (dependen¡a dintre
cele douå variabile mai slabå decât în primul caz); c - lipsa oricårei legåturi între
Y ¿i X (variabile independente).
Y = f(X), (8.38)
Y = f(X) + ε (8.39)
155
¥n mod similar se pot stabili (I.M.H., 1971) corela¡ii între:
− timpul de cre¿tere tcr al unei unde de viiturå ¿i L sau L/ I r (fig. 8.3),
unde L este lungimea, iar Ir panta râului;
− durata totalå Tt a undei de viiturå ¿i L, L / I b sau F / I b I r , unde L
este lungimea râului, Ib - panta bazinului, Ir - panta râului, iar F suprafa¡a
bazinului hidrografic;
− stratul scurs h1% ¿i H/ F (fig. 8.4), unde H este altitudinea medie a
bazinului hidrografic;
− coeficientul scurgerii medii η ¿i altitudine;
− coeficientul evapora¡iei multianuale ¿i altitudine, etc.
¥n toate aceste exemple, cunoscând caracteristicile fizico-geografice ale
re¡elei hidrografice sau bazinului (H, F, Ib, Ir, L etc.) din graficele dependen¡elor
rezultate se pot determina o serie de mårimi hidrologice (caracteristici ale
undelor de viiturå, scurgere medie, evapora¡ie etc.).
Din reprezentårile grafice se observå cå valorile variabilei explicate (Y)
prezintå abateri mai mult sau mai pu¡in importante fa¡å de curba valorilor medii;
cu cât punctele (xi , yi) sunt mai apropiate de curba de regresie, cu atât
dependen¡a (sau corela¡ia) dintre cele douå variabile este mai strânså.
Y = F(X) (8.40)
156
practica nu este nici necesar si nici posibil så se evalueze influen¡ele tuturor
acestor factori. Ca urmare, se recurge la alegerea unui numår de factori care
intervin în mod esen¡ial în definirea variabilei explicate Y, restul factorilor
neglijându-se; ei intervin sub forma factorului aleator ε, deci a unor perturba¡ii
ale valorilor lui Y în raport cu valoarea sa medie, deduså pe baza variabilelor X1,
X2, ..., re¡inute.
Influen¡ele factorilor re¡inu¡i se evalueazå fie individual (permi¡ând corela¡ii
multiple), fie global, sub formå de produs al acestor factori în general (rezultând
corela¡ii simple între Y ¿i ansamblul factorilor considera¡i).
− corela¡ii par¡iale; în anumite cazuri intereseazå doar influen¡a unui
factor sau a unui grup de factori asupra valorilor lui Y. De exemplu, se ¿tie cå
Y=f(X1,X2) ¿i intereseazå doar corela¡ia par¡ialå Y = f(X1) sau Y = f(X2), pentru a
determina variabila care intervine în mod esen¡ial în varia¡ia lui Y. Variabila
re¡inutå poate fi supuså apoi unor procedee mai atente de måsurare sau control,
în vederea întåririi sau diminuårii influen¡ei ei, dupå cum implica¡iile
dependen¡ei rezultate sunt favorabile sau defavorabile.
b) ¥n func¡ie de tipul legåturii dintre variabile se deosebesc:
− corela¡ii liniare:
simple:
Y = A + BX (8.42)
multiple
− corela¡ii neliniare:
157
Fig. 8.5. Corela¡ie directå (a) ¿i inverså (b) între variabilele X ¿i Y.
cov( X ,Y )
r= (8.44)
D 2 ( X ) ⋅ D 2 (Y )
[ (
cov( X , Y ) = K XY = M ( X − m x ) Y − m y = )]
. (8.45)
+∞ +∞
= ∫ ∫ ( x − m x )( y − m y ) f ( x, y )dxdy
−∞ −∞
158
Valoarea medie a variabilei bi-dimensionale s-a ob¡inut dupå acelea¿i reguli
ca valoarea medie a variabilei aleatoare uni-dimensionale. Se reaminte¿te cå, în
cazul variabilei unidimensionale X cu densitatea de reparti¡ie f(x), valoarea sa
medie M(X) este:
+∞
M( X ) = ∫ x f ( x ) dx . (8.46)
−∞
+∞ +∞
r=
cov( X, Y )
∫ ∫ ( x − m x )( y − m y ) f ( x, y)dxdy (8.47)
D 2 ( X ) ⋅ D 2 (Y ) −∞ −∞
1
( x i − x )( yi − y ) pij
m n
r= ∑ ∑ . (8.49)
D 2 ( X ) D 2 (Y ) i=1 j =1
n
M( X ) = ∑ x i pi . (8.50)
i =1
f ij
p ij ≈ , (8.51)
f ••
159
unde fij reprezintå frecven¡e absolute, adicå numårul de cazuri în care
variabila X ia valorile xi (i = 1, ..., m), iar Y ia valorile yj (j = 1, ..., n); f•• este
volumul selec¡iei:
m n
f•• = ∑ ∑ fij . (8.52)
i=1 j =1
¥n hidrologie, dupå cum s-a mai aråtat, numårul de valori de care se dispune
din måsuråtori este redus.
Admi¡ând cå fiecare pereche de valori (Xi, Yj) s-a înregistrat o singurå datå,
rezultå fij = 1 ¿i deci:
1
p ij = . (8.53)
n
( xi − x )( yi − y ) ∑ ∆x i ⋅ ∆yi
1 n
r= ∑ = i =1
. (8.54)
s ( X )s 2 (Y )
2 i =1 n ns x s y
∑ ( xi − x ) = ∑ ( ∆x i )
1 n 2 1 n 2
sx = (8.55)
n i =1 n i=1
∑ ( ∆yi ) .
1 n 2
sy = (8.55')
n i =1
160
n
∑ ∆x i ∆yi
r= i=1
. (8.56)
∑ ( ∆x i ) ∑ ( ∆yi )
n 2 n 2
i=1 i =1
Tabelul 8.2
2 2
σ = M2 - M1 (8.57)
2 2
1 n 2 1⎛n ⎞
n ∑ x i2 − ⎛⎜ ∑ x i ⎞⎟
1 n n
sx = ∑ xi − 2 ⎜ ∑ xi ⎟ = (8.58)
n i=1 ⎝
n i=1 ⎠ n i=1 ⎝ i=1 ⎠
2
n ∑ yi2 − ⎛⎜ ∑ yi ⎞⎟
1 n n
sy = . (8.58')
n i=1 ⎝ i=1 ⎠
161
¥n cazul unei selec¡ii de volum n, prin particularizare covarian¡a se
calculeazå cu expresia:
1 n 1 n 1 n
cov( X, Y ) = ∑ x i yi − ∑ x i ⋅ ∑ y i . (8.60)
n i=1 n i =1 n i =1
n n n
n ∑ x i yi − ∑ x i ∑ yi
i=1 i=1 i=1
r= . (8.61)
⎡ n
⎛ n
⎞
2
⎤ ⎡ n 2 ⎛ n ⎞ 2⎤
⎢n ∑ x i − ⎜⎝ ∑ x i ⎟⎠ ⎢n ∑ yi − ⎜⎝ ∑ yi ⎟⎠ ⎥
2
⎥
⎢⎣ i = 1 i=1 ⎥⎦ ⎢⎣ i = 1 i=1 ⎥⎦
Tabelul 8.3
2 2
i xi yi xi . yi x i
y i
1
.
.
.
n
Σ Σ Σ
162
se evalueazå dependen¡a probabilisticå (stohasticå) a lui Y fa¡å de X sau a lui X
fa¡å de Y.
− Coeficientul de corela¡ie nu se poate utiliza decât în cazul a douå
variabile X ¿i Y cu reparti¡ii normale, pentru alte situa¡ii conceptul respectiv
nefiind fundamentat teoretic ¿i putând caracteriza cel mult un grad de asociere
al variabilelor respective (Panaite, Munteanu, 1982).
¥n practica hidrologicå se stabilesc de exemplu corela¡ii liniare între debitele
maxime anuale (având distribu¡ie asimetricå) ¿i volumele undelor de viiturå
respective. Este evident cå în acest exemplu premiza normalitå¡ii variabilelor nu
mai este verificatå.
− Coeficientul de corela¡ie are valori cuprinse între -1 ¿i +1. Se poate
demonstra matematic (Mihoc ¿.a., 1986) cå între douå variabile aleatoare existå
2
o rela¡ie liniarå, dacå ¿i numai dacå r = 1.
Coeficientul de corela¡ie constituie o måsurå a gradului de dependen¡å dintre
variabile. Cu cât r este mai apropiat de 1, cu atât legåtura probabilisticå dintre
variabile este mai puternicå (atingând maximul în cazul dependen¡ei
deterministe de tip liniar).
Dacå cele douå variabile aleatoare sunt independente, atunci r = 0. Reciproca
acestei propozi¡ii nu este adevåratå, deci dacå r = 0 nu rezultå cå variabilele sunt
independente (Mihoc ¿.a., 1986), dependen¡a între variabile putând fi neliniarå
(Moineagu ¿.a., 1976).
Valorile coeficientului de corela¡ie sunt pozitive în cazul în care cre¿terea
variabilei explicative antreneazå cre¿terea variabilei explicate (corela¡ie
pozitivå) ¿i negative în caz contrar (corela¡ie negativå).
¥n figura 8.6 sunt reperezentate câteva situa¡ii caracteristice de drepte de
regresie ¿i valorile corespunzåtoare ale coeficientului de corela¡ie (Panaite,
Munteanu, 1982).
163
¥n aceste reprezentåri s-a notat prin A dreapta de regresie a lui Y în func¡ie de
X, iar prin B dreapta de regresie a lui X în func¡ie de Y.
Este de remarcat faptul cå, în cazul dependen¡ei de tip determinist, dreptele
A ¿i B coincid, în timp ce, în cazul variabilelor independente, dreptele A ¿i B
sunt perpendiculare ¿i paralele cu cele douå axe (Dinescu ¿.a., 1986). Din
examinarea celorlalte cazuri se constatå cå, cu cât A ¿i B fac un unghi mai mic
între ele, cu atât coeficientul de corela¡ie r este mai mare în valoare absolutå,
deci corela¡ia este mai bunå.
y = a + bx . (8.62)
164
Estimarea parametrilor dreptei de regresie se face de regulå prin metoda
celor mai mici påtrate a lui Gauss: se impune condi¡ia ca suma påtratelor
abaterilor dintre valorile empirice (din måsuråtori) ¿i cele teoretice (situate pe
dreaptå ¿i deci verificând ecua¡ia) så fie minimå:
(y )
n 2
G= ∑ t
i − yie → minim . (8.63)
i =1
t
yi = a + bxi (8.64)
( )
n 2
G = ∑ a + bx i − yie . (8.65)
i =1
∂G
( )
n
= 2 ∑ a + bx i − y ei ⋅1 = 0 (8.66)
∂a i =1
∂G
( )
n
= 2 ∑ a + bx i − y ei ⋅x i = 0 . (8.67)
∂b i =1
Se ob¡ine sistemul:
n n n
∑ a + ∑ bx i = ∑ y i
e
(8.68)
i =1 i =1 i =1
n n n
∑ ax i + ∑ bx i = ∑ x i y i
2 e
(8.69)
i =1 i =1 i =1
sau:
n n
na + b ∑ x i = ∑ y ei (8.70)
i =1 i =1
165
n n n
a ∑ x i + b ∑ x i2 = ∑ x i y ei . (8.71)
i =1 i =1 i =1
n n n n
∑ yi ∑ x i − ∑ x i ∑ x i yi
e 2 e
n n n
n ∑ x i yie − ∑ x i ∑ yie
b = i =1 i=1 i=1
2
(8.73)
− ⎛⎜ ∑ x i ⎞⎟
n n
∑ xi
2
n
i=1 ⎝ i=1 ⎠
1 n 1 n 1 n e
∑ x i yi − ∑ x i ⋅ ∑ yi
e
b = n i = 1n n i = 1 n i =1 (8.74)
1 1 n 1 n
∑ xi − ∑ xi ⋅ ∑ xi
2
n i=1 n i=1 n i=1
1 n
∑ x i yi = M( XY )
e e
(8.75)
n i=1
1 n 1 n e
∑ x i ⋅ ∑ yi = M ( X ) ⋅ M ( Y )
e
(8.76)
n i=1 n i=1
e
Conform rela¡iei (8.59), numåråtorul lui b reprezintå covarian¡a cov (X, Y ).
166
Deoarece:
1 n
∑ xi = x , (8.77)
n i =1
1 n 2
∑ xi − x
2
n i =1
Dar, conform rela¡iilor (4.25), respectiv (4.28) aceasta este tocmai dispersia
de selec¡ie a variabilei X:
∑ ( xi − x ) = ∑ xi − x
1 n 2 1 n 2
s x2 = 2
(8.78)
n i =1 n i =1
b=
(
cov X ,Y e ). (8.79)
s x2
cov ( X ,Y )
r= , (8.80)
s x2 ⋅ s y2
adicå:
Rezultå:
r ⋅ sx ⋅ sy sy
b= =r . (8.82)
s x2 sx
167
∂G n n
= 0 → na + b ∑ x i = ∑ y ei (8.83)
∂a i =1 i =1
sau:
1 n e 1 n
a= ∑ yi − b ⋅ ∑ x i = y − bx . (8.84)
n i=1 n i =1
Rezultå:
a = M( y ) − b M( x ) = y − bx . (8.86)
sy
a = y − bx = y − r x (8.87)
sx
y = a + bx = y − bx + bx = y + b( x − x ) . (8.88)
sau:
sy
y −y =r
sx
(x − x ) . (8.89)
168
x −x =r
sx
sy
(y − y ) . (8.89')
Din aceste rela¡ii rezultå cå în sens geometric r este panta dreptei de regresie
în unitå¡i ale abaterii standard (Moineagu ¿.a., 1976).
Constantele:
sy sx
r ¿i r
sx sy
A = a ± t . σa (8.90)
B = b ± t . σb . (8.91)
σ y2
σ = 2
a (8.92)
1 x2
+ n
( i )
n ∑ x −x 2
i =1
169
σ y2
σ b2 = (8.93)
∑ ( xi − x )
n 2
i=1
1 n
( )
2
s y2 = ∑ yi − a − bx i
e
. (8.94)
n − 2 i=1
+ x 2 / ∑ ( xi − x )
1 n 2
A=a ± t α ⋅ sy (8.95)
n− 2; n i=1
2
∑ ( xi − x ) ,
n 2
B=b ± t α ⋅ sy (8.96)
n− 2; i=1
2
*
Intervalul de încredere bilateral care con¡ine valoarea medie y cu un prag de
semnifica¡ie α este (Panaite, Munteanu, 1982):
170
(x )
2
*
−x
Y * = y* ± t α ⋅ sy 1+ (8.98)
∑ ( xi − x )
n− 1; n 2
2
i=1
n
σ b2 = σ y2 / ∑ x i2 (8.99)
i =1
n
B=b ± t α ⋅ sy ∑ xi ,
2
(8.100)
n− 1; i=1
2
unde:
1 n e
( )
2
sy = ∑ yi − bx i , (8.101)
n − 1 i=1
171
Ultimul procedeu este aplicat curent în hidrologie. Fie de exemplu legåtura
între debitele maxime specifice cu probabilitatea de depå¿ire de 1% (q1%) ¿i
suprafe¡ele F ale bazinelor de recep¡ie. Evident, dependen¡a dintre cele douå
rânduri de valori este neliniarå (fig. 8.8, a); prin logaritmare rezultå înså o
rela¡ie liniarå (fig. 8.8, b).
¥n continuare, se ob¡ine:
a A
log q1% = a − log F = log A − B log F = log B . (8.103)
b F
A
q1% = , (8.104)
FB
172
Fig. 8.9. Liniarizarea prin schimbarea sistemului de coordonate:
a - sistemul ini¡ial; b - noul sistem de coordonate.
Y = ln y; X=x
A = ln a; B=b. (8.105)
Xi = xi
Yi = ln yi . (8.106)
173
b=B. (8.107)
Tabelul 8.4
σ ye2 Y X
R yx = 1 − , (8.108)
σ 02
unde:
σ ye2 Y X - reprezintå dispersia valorilor empirice yie fa¡å de valorile
teoretice (estimate prin ecua¡ia de regresie neliniarå Y X );
2
σ0 - dispersia valorilor empirice yie de la media acestora:
1 n e
y0 = ∑ yi . (8.109)
n i =1
1 n
( )
2
σ y2e YX = ∑ YXi − yi
e
(8.110)
n i=1
174
1 n
σ 02 = ∑ ( yi − y 0 ) .
e 2
(8.111)
n i =1
( )
n 2
∑ YXi − yi
e
Ryx = 1− i=1
. (8.112)
∑ (y −y )
n 2
e
i 0
i=1
n n
∑ ( yi − y0 ) = ∑ ( yi − YXi + YXi − y0 ) =
e 2 e 2
i=1 i=1
(8.113)
n n
=∑ ( yie − YXi ) + ∑ (YXi − y0 ) ,
2 2
i=1 i=1
n
deoarece ∑ ( yie − YXi )(YXi − y0 ) = 0 .
i=1
Rezultå:
n n n
∑ ( yi − YXi ) = ∑ ( yi − y0 ) − ∑ (YXi − y0 ) .
e 2 e 2 2
(8.114)
i=1 i =1 i=1
( )
n 2
∑ YXi − y0
Ryx = i =1
(8.115)
( )
n 2
∑ yie − y0
i=1
175
¥n aceastå rela¡ie Y X i reprezintå valorile teoretice ale variabilei Y (ob¡inute
2 2
0 ≤ r x,y
≤ R x,y ≤ 1
¿i (8.116)
2 2
0 ≤ r y,x
≤ R y,x ≤ 1 .
( )
n 2
∑ Yxi − y 0
r= i=1
. (8.115')
( )
n 2
∑ yie − y0
i =1
176
Se atrage înså aten¡ia cå valorile teoretice Y x i sunt ob¡inute cu o rela¡ie de
tipul:
Y x i = a + bx i (8.117)
(cu alte cuvinte trebuie întâi estima¡i parametrii a ¿i b ai dreptei de regresie).
Dacå variabilele X ¿i Y sunt independente, atunci:
Principiile care stau la baza calculelor unei corela¡ii liniare simple se aplicå
¿i în cazul corela¡iei liniare multiple.
Fie de exemplu o regresie de tipul:
Calculul parametrilor se face tot prin metoda celor mai mici påtrate,
urmårindu-se gåsirea hiperplanului care trece cel mai bine printre punctele
e
empirice yi .
( )
n 2
G = ∑ Yx1 , x2 ..., xm − yie → minim (8.120)
i
i =1
∂G ∂G ∂G
=0 ; =0 ; ... ; =0 . (8.121)
∂a ∂b1 ∂bm
177
n n n n
na + b1 ∑ x 1i + b2 ∑ x 2i +...+ bm ∑ x mi = ∑ yie
i=1 i=1 i=1 i=1
n n n n n
a ∑ x 1i + b1 ∑ x 12i + b2 ∑ x 1i x 2i +...+ bm ∑ x 1i x mi = ∑ yie x 1i
i=1 i=1 i=1 i=1 i=1
(8.122)
n n n n n
a ∑ x 2i + b1 ∑ x 1i x 2i + b2 ∑ x 2i2 +...+ bm ∑ x 2i x mi = ∑ yie x 2i
i=1 i=1 i=1 i=1 i=1
...........................................................................
n n n n n
a ∑ x mi + b1 ∑ x 1i x mi + b2 ∑ x 2i x mi +...+ bm ∑ x mi
2
= ∑ yie x mi
i=1 i=1 i=1 i=1 i=1
AX = B , (8.123)
t
unde X = (a, b1, b2, ....., bm) este vectorul necunoscutelor, A matricea
coeficien¡ilor, iar B termenul liber.
De aici rezultå:
-1
X=A ⋅B (8.124)
(ecua¡ia este o regresie liniarå multiplå în raport cu parametrii a, b1, b2, ... etc).
¥n sfâr¿it, dacå regresia este de tipul:
178
8.4.1. COEFICIENTUL CORELAºIEI LINIARE MULTIPLE
( )
n 2
∑ Yx1 x 2 ...x m i − yi
e
Cu cât valorile empirice yie se abat mai pu¡in fa¡å de curba de regresie
multiplå, cu atât coeficientul de corela¡ie are o valoare mai mare ¿i corela¡ia este
mai intenså.
La limitå, dacå toate punctele verificå ecua¡ia de regresie atunci:
y ei = Y x 1 x 2 ... x m ( x i ) (8.128)
¿i deci:
179
ry x1 − ry x2 ⋅ rx1 x2
ry x1⋅x2 = (8.131)
1 − ry2x2 1 − rx21 x2
ry x2 − ry x1 ⋅ rx1 x2
ry x2⋅x1 = . (8.132)
1 − ry2x1 1 − rx21 x2
(
Ceilal¡i coeficien¡i ry x2⋅x1x3 ) ¿i ( r y x 3 ⋅ x1x 2 ) se ob¡in din rela¡ia anterioarå prin
permutåri circulare ale indicilor.
180
Dacå o asemenea corela¡ie poste fi identificatå, regularizarea debitelor
necesitå volume mai mari ale lacurilor de acumulare decât în lipsa corela¡iei
respective.
Dependen¡a dintre o mårime luând valorile xi ¿i ea înså¿i dar decalatå (având
1 n− k 1 ⎛ n − k x ⎞ ⎛ n− k x ⎞
∑ xi xi+ k − ⎜
2 ⎝ ∑ i⎟ ⎜ ∑ i+ k ⎟
rk =
n − k i =1 (n − k ) i =1 ⎠ ⎝ i=1 ⎠
2 2
1 n− k 2 1 ⎛ n− k x ⎞ 1 n− k 2 1 ⎛ n− k x ⎞
∑ xi − ⎜
2 ⎝ ∑ i⎟ ∑ xi+ k − ⎜
2 ⎝ ∑ i+k ⎟
n − k i=1 (n − k ) i=1 ⎠ n − k i =1 (n − k ) i=1 ⎠
(8.135)
181
8.5. GENERAREA DEBITELOR
182
( )
Qi = Q + r1 Qi−1 − Q + σ t i 1 − r12 , (8.136)
unde:
Qi este debitul mediu generat al anului i;
Qi-1 are aceia¿i semnifica¡ie, dar pentru anul i-1;
( )
Q i = Q + r1 Q i −1 − Q + σγ i 1 − r12 , (8.137)
unde:
3
2 ⎡ C srt i C sr ⎤ 2
γi = ⎢1 + 6 − 36 ⎥ − C , (8.138)
C sr ⎣ ⎦ sr
iar:
1 − r13
C sr = C s . (8.139)
( )
3/ 2
1 − r12
183
multianuale ca ¿i abaterea medie påtraticå, coeficientul de autocorela¡ie ¿i
coeficientul de asimetrie diferå de la lunå la lunå).
ªi mai dificilå este generarea debitelor medii lunare în mai multe sec¡iuni ale
unui bazin hidrografic, caracterizat de existen¡a unor legåturi spa¡iale ¿i
temporale ale variabilelor aleatoare (Simon, Vi¿an, 1974; Giurma, Hogea,
1985 etc).
184
BIBLIOGRAFIE
3. Cicioni, G., Giuliano, G., Spaziani, F., Best fitting of probability functions
to a set of data for flood studies, Institute for Water Research, National
Research Council, Italy, 1982.
9. Drobot, R., Estimarea raportului Cs/ Cv, utilizând tehnici ale cercetårii
opera¡ionale, Revista Hidrotehnica, Bucure¿ti, vol. 34, nr. 10, 1989.
11. Hâncu, S., Stånescu, P., Platagea, Gh., Hidrologie agricolå, Editura
Ceres, Bucure¿ti, 1975.
185
12. Iliescu, D. V., Vodå, V., Gh., Statisticå ¿i toleran¡e, Editura Tehnicå,
Bucure¿ti, 1977.
e
13. Llamas, J., Hydrologie générale. 2 édition. Gaëtan Morin - éditeur,
Québec, 1993.
14. van der Made, J.W., Casebook of methods for computing hydrological
parameters of water projects, UNESCO, 1987.
18. Mihoc, Gh., Muja, A., Diatcu, E., Bazele matematice ale teoriei
fiabilitå¡ii, Editura Dacia, Cluj-Napoca, 1976.
19. Mociorni¡å, C., Dincå, A., Blindåråu, Al., Instruc¡iuni pentru calculul
viiturilor teoretice pe râuri mari, I.M.H., 1979.
25. Shahin, M., van Oorschot, H.J.L., de Lange, S.J., Statistical Analysis
in Water Resources Engineering. A.A. Balkema, Rotterdam, 1993.
186
26. Simon, Al., Vi¿an, V., Generarea debitelor medii lunare în mai multe
sec¡iuni ale bazinului hidrografic. Studii de Economia apelor. ICPGA-CNA,
Bucure¿ti, 1974.
187