Documente Academic
Documente Profesional
Documente Cultură
I. Rappels de statistique
. Loi de Gumbel
I
. Synthse
Par :
Harouna Karambiri et Dial NIANG
Institut International d'Ingnierie de l'Eau et de l'Environnement (2iE) (Groupe EIER-ETSHER)
UTER Gestion et Valorisation de l'Eau et l'Assainissement
E-mail: harouna.karambiri@2ie-edu.org ; dial.niang@2ie-edu.org 1
. Rappels de statistique
2
2
. Rappels de statistique
Quelques dfinitions
3
. Rappels de statistique
Concepts de probabilit et de frquence
En statistique, lensemble des observations des dbits dun
cours deau durant une anne constitue une preuve; de
chaque preuve on tire divers rsultats dont le module
annuel. Lensemble de toutes les ralisations des rsultats m
(module) de toutes les preuves possibles forme une
population M: suite indfinie hypothtique dont nest jamais
connue quune infinie partie lchantillon E observ des
modules sur une priode dtermine de N annes.
La ralisation r dans la population M se produit n fois en N
annes; on appelle:
4
. Rappels de statistique
-frquence exprimentale de r dans lchantillon E:
n
f =
N
- probabilit de r dans la population M:
F(x) = Prob { X x }
la drive de F(X) est la densit de probabilit f(x) de la variable alatoire, et lon
peut crire:
+
Pr ob{b x a} = F (a ) F (b) = f ( x)dx 5
. Rappels de statistique
Corrig :
n
Classe ni fi f =
500- 600 1 0.013 N
600-700 1 0.013
700-800 5 0.063
800-900 8 0.101 N= 79, ni= effectif par classe,
900-1000 16 0.202 fi = frquence relative
1000-1100 13 0.165
1100-1200 16 0.202
1200-1300 11 0.139
1300-1400 6 0.076
1400-1500 1 0.013
6
1500-1600 1 0.013
.
Rappels de statistique
F ( x ) = prob X x
r 0. 5
Formule de Hazen
Hazen:: F ( x) =
n
n: taille de lchantillon; r : rang
r
Formule de Weibull
Weibull:: F ( x) =
n +1
8
. Rappels de statistique
Exemple: calculer la frquence exprimentale au non
dpassement des pluies mensuelles de la station de
Payerne avec la formule de Hazen
Anne Pluie (mm) Rang Frquence
exprimentale
1970 43 1 0.045
1971 46 2 0.136
1972 49 3 0.227
1973 50 4 0.318
1974 50 5 0.409
1975 53 6 0.500
1976 53 7 0.591
1977 53 8 0.682
1978 54 9 0.773
1979 55 10 0.864
1980 60 11 0.955 9
. Rappels de statistique
Temps de retour
retour::
Il est dfini comme tant linverse de la probabilit de
dpassement
1 1
T= =
P 1 F
10
. Rappels de statistique
Exemple :
Pluie dcennale humide : la hauteur de pluie qui, chaque
anne, a seulement 10% de chance dtre dpasse, soit une
probabilit ou frquence annuelle de dpassement P = 0,1
11
11
. Rappels de statistique
Notion de risque
risque::
n
1
risque = 1 1
T
T=priode de retour
retour;; n=dure
12
. Rappels de statistique
Solution 1:
T = 100 ans
1
probabilit atteinte ou dpasse = = 0.01
100
n 50
1 1
risque = 1 1 = 1 1 = 1 (0.99 ) = 0.39
50
T 100
On a donc 39%
39% de risque pour que le dbit de projet Q100 soit
dpass durant 50 ans
ans..
13
99))100 = 63
Si dure n = 100 ans, risque = 1- (0.99 63%
%
. Rappels de statistique
Solution 2:
1 1
risque = 1 1 1 = 1 risque n
T T
1 1
= 1 1 risque T =
n
T 1 1 risquen
1
T= = 190 ans
1 1 0.1
20
14
. Rappels de statistique
Caractristiques de lchantillon
Description de lchantillon : Lorsque lon dispose dune srie importante
( > 30 valeurs) il peut tre intressant de prsenter cet chantillon de
manire synthtique : numriquement ou graphiquement
Synthse numrique :
1
- moyenne arithmtique : x = xi
n
- paramtres de dispersion :
valeurs extrmes : Max( x ), Min( x )
i i
1
variance : s = ( x x )
n i
cart-type : S
1
s = ( x x )
variance non-biaise : n 1 i
s
coefficient de variation : CV = 15
x 15
. Rappels de statistique
1er dcile : valeur non dpasse dans 10% des cas (F=0.1)
dernier dcile : valeur non atteinte dans 90% des cas (F=0.9)
16
16
Synthse graphique :
- histogramme des frquences empiriques :
on fixe des classes [xi ; xi-1] et on compte combien de valeurs de
lchantillon se trouvent dans chaque classe (effectifs).
17
17
Synthse graphique :
- histogramme des
frquences empiriques :
18
18
.
Ajustement dune srie statistique une loi de distribution
19
.
Loi de Gauss
La variable alatoire X suit une loi normale si sa fonction de rpartition
ou probabilit de non dpassement est de la forme:
1
F ( x) = Pr ob{X x} =
1 u
2u 2
e du
2
xx
avec u= variable rduite
s
Cette loi prsente 2 paramtres qui sont:
- la moyenne x et lcart type s
21
21
.
Loi de Gauss
La reprsentation graphique de la loi normale se fait sur un papier probabilit
normale appele aussi papier gaussien.
22
.
Loi de Gauss
xp = x + up s
F 0,01 0,025 0,05 0,10 0,15 0,20 0,50 0,80 0,85 0,90 0,95 0,975 0,99
u -2,33 -1,96 -1,64 -1,28 -1,04 -0,84 0,0 0,80 1,04 1,28 1,64 1,96 2,33
23
.
Loi de Gauss
Exercice dapplication
dapplication:: Calculer le module dcennal humide
(F(x)= 0,90),
90), le module centenaire humide (F(x)= 0,99), 99), le module
dcennal sec (F(x)= 0,10)
10) et le module centenaire sec (F(x)= 0,01)
01) pour
une srie de donnes dont
x= 292 mm et s = 90
Solution::
Solution
Les quantiles sont estims partir de la formule: xp = x + up s
avec Pr ob[ ]= Pr ob[ ]= 1
2 2
1
2
2
2
2
r = N-1 : r est le nombre de degr de libert
2Quantiles
Quantiles::
s
IC % pour x = x u
p p 1 u 2 + 2 valable si N 30
p
2 2N
26
V. Loi de Gumbel
Fonction de rpartition : F ( x ) = e e a ( x x0 )
27
27
V. Loi de Gumbel
u
avec u = a ( x x0 ) x = + x0
a
e u
F ( x) = e
28
V. Loi de Gumbel
Ajustement mathmatique
Mthode des moments
1
= 0 , 780
a
0 , 577
x0 = x
a
up
xp = + x0
a 29
V. Loi de Gumbel
Calcul des intervalles de confiance des quantiles
Intervalle de confiance x p = x p u1 1 + 1.4 K + 1.1K 2
2 n 1
K = 0.780(u p 0.577 )
u1
= variable rduite de Gauss
2
u p = ln[ ln (F ( x ))] = variable rduite de Gumbel
Moyenne x = 51 mm
Ecart type = 4.59 mm
31
V. Loi de Gumbel
Calcul des paramtres de la loi
1
= 0.780 4.59 = 3.58 a = 0.2793
a
x0 = 51 0.577 3.58 = 48.93
Estimation des quantiles
up
xp = + x0
a
avec u p = ln[ ln(F ( x ))]
Calcul des intervalles de confiance des quantiles
Intervalle de confiance x p = x p u1 1 + 1.4 K + 1.1K 2
2 n 1
K = 0.780(u p 0.577 )
32
V. Loi de Gumbel
33
Test de 2:
On juge gnralement ladquation dune loi un chantillon par le
test du 2, variable alatoire dont la distribution a t tudie par
Pearson.
En pratique, on procde comme suit:
=
2
k (n n )
i pi
2
2) calcul de
1 n pi
avec ni effectif observ de la classe i;
N effectif total
npi effectif thorique de cette mme classe n pi = =
nc nombre de classes
34
Test de 2:
3) Calcul du nombre de degrs de libert
= k p 1
avec k le nombre de classes et p le nombre de paramtres de
la loi.
=
2
k (n n )
i pi
2 ni effectif observ de la classe i;
npi effectif thorique de cette mme classe
N effectif total
1 n pi n pi = =
nc nombre de classes
Classe Limites des classes ni npi ni-npi (ni-npi)2 (n n )
i pi
2
n pi
1 188.5 7 7.6250 -0.6250 0.3906 0.0512
2 188.5 231.3 11 7.6250 3.3750 11.3906 1.4938
3 231.1 263.3 9 7.6250 1.3750 1.8906 0.2479
4 263.3 292.0 6 7.6250 -1.6250 2.6406 0.3463
5 292.0 320.7 6 7.6250 -1.6250 2.6406 0.3463
6 320.7 352.7 5 7.6250 -2.6250 6.8906 0.9037
7 352.7 395.6 8 7.6250 0.3750 0.1406 0.0184
8 395.6 9 7.6250 1.3750 1.8906 0.2479
3.66
cal
2
= 3 . 66 = k p 1 = 8 2 1 = 5
02. 05 = 11 . 07
2
Comme cal < 2
0 . 05 on accepte lhypothse
37
V. Synthse
38
V. Synthse
Contrle et analyse des donnes
Pour laborer un modle statistique partir des donnes
d'un chantillon, il faut que celles-ci soient dabord
homognes, stationnaires et indpendantes.
40
V. Synthse
Ajustement dune loi statistique en hydrologie
Choix de la variable tudier : pluie annuelle, pluie mensuelle, pluie
journalire maximale annuelle, dbit maximum annuel, dbit moyen annuel.
Vrifier que lon a une VA, sans tendance ni cycle :
--> mthode de la moyenne mobile
Vrifier lhomognit de la srie :
--> mthodes des doubles cumuls, cumuls des rsidus...
Description de lchantillon.
i 0.5
F *( x ) = (HAZEN, pour ajustement une loi de GAUSS)
i n
i
F *( x ) = (WEIBULL, pour ajustement une loi de GUMBELL)
i n+1
42
V. Synthse
6. Tracer la courbe exprimentale F(xi) et dterminer la mdiane.
7. Comparer les valeurs centrales (moyenne, mode, mdiane). Si elles sont trs peu
diffrentes, on pourra supposer que la distribution est normale ou gaussienne.
8. Reporter les points (xi, F(xi)) sur un papier GAUSS. Si les frquences
exprimentales de non-dpassement suivent rigoureusement une loi normale, tous
les points seront aligns (droite).
9. Ajustement graphique d'une droite sur l'ensemble des points. Veuillez avoir une
bonne rpartition des points de part et d'autre de la droite. On peut ainsi dterminer
n'importe quel quantile par lecture directe sur la droite.
10. Ajustement par le calcul d'une droite sur les points. Pour cela, il faut utiliser la
moyenne et l'cart-type, puis calculer les coordonnes de deux points assez
loigns (gnralement F = 0.05 et F = 0.95).
11. Choisir une loi parmi les 2 lois ajustes en allant dans le sens de la scurit.
12. Dterminer l'intervalle de confiance et valider la loi utilise :
On dmontre que, sur l'infinit des chantillons d'observations possibles, la valeur xi
est distribue selon une loi normale de paramtres :
43
V. Synthse
Tracer l'intervalle de confiance % partir de quelques points xi en reliant
respectivement les bornes infrieures Ai entre elles et les bornes suprieures Bi
entre elles.
La loi sera accepte si au moins % des valeurs de l'chantillon se
trouve l'intrieur de l'intervalle de confiance trac.
Ce test graphique sera toujours prfr aux tests numriques qui sont
peu puissants (exemple test de )
13. On peut estimer n'importe quel quantile et lui associ un intervalle de confiance
tel que :
44