Sunteți pe pagina 1din 56

Patrick GARCIA

Master de Mathmatiques 2me anne,


Statistique et Applications.
Anne scolaire 2011/2012.
RAPPORT DE STAGE :
Analyse statistique des pannes du rseau HTA.
Responsables :
M. Daniel WAGNER, Groupe lectricit de Strasbourg.
M. Nicolas POULIN, Universit de Strasbourg.
Du 1
er
Fvrier 2012 au 31 Juillet 2012.
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Remerciements.
Je remercie tout dabord le Groupe lectricit de Strasbourg pour mavoir accueilli au sein
de lentreprise lors de mon stage de n dtudes.
Je remercie particulirement mon matre de stage, Daniel WAGNER, pour son accueil,
pour le projet quil ma fourni, pour le temps quil ma consacr et pour la conance quil ma
accorde ds mon arrive au sein de lentreprise.
Je tiens remercier galement mon tuteur universitaire, M. Nicolas POULIN, pour mavoir
accueilli et conseill lors du mi-parcours.
Merci galement Mme Myriam MAUMY-BERTRAND pour ses conseils sur les processus
de Poisson et lcriture du rapport.
Un grand merci mes collgues de bureau, ric RUHLMANN, Taha AFERHANE, Sbastien
MULLER et Frdric Krger, pour mavoir si bien intgr dans lquipe, pour leur sympathie
et leur coopration professionnelle tout au long de ce stage.
Merci Bernard CROUX pour ses informations concernant la topologie du rseau de lS
et merci davoir rpondu toutes mes questions.
Enn je remercie lensemble du personnel du groupe lectricit de Strasbourg et les sta-
giaires et cadres dOSI et ESSIDIS que jai rencontrs pour leur accueil, ainsi que toutes les
personnes qui mont permis de passer un stage agrable et intressant.
1
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Table des matires
Remerciements. 1
Introduction. 5
1 Lentreprise lectricit de Strasbourg. 5
1.1 Historique de lentreprise. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Organisation gnrale de lentreprise. . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Les rseaux lectriques de llectricit de Strasbourg. . . . . . . . . . . . . . . . 6
1.4 Les groupes dexploitation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Prsentation du stage. 8
3 Diagramme de Gantt. 9
Analyse des incidents. 10
1 Les incidents du rseau lectrique. 10
1.1 Trois types dincidents. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Lapplication Incidents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 Le critre B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 Statistiques descriptives sur les incidents HTA et HTB. 12
2.1 Les variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Reprsentations graphiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 Modlisation des incidents HTA et HTB sur les quatre dernires annes. 18
3.1 Les processus alatoires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2 Les processus de Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.1 Processus de Poisson homogne. . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.2 Processus de Poisson non homogne. . . . . . . . . . . . . . . . . . . . . 20
3.2.3 Processus de Poisson compos. . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3 Les tests dadquation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.4 Modlisation par processus de Poisson. . . . . . . . . . . . . . . . . . . . . . . . 22
4 Simulation de pannes souterraines pour chaque dpart HTA. 32
4.1 Esprance de panne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1.1 Calcul des longueurs des cbles. . . . . . . . . . . . . . . . . . . . . . . . 32
4.1.2 Taux dincident au kilomtre. . . . . . . . . . . . . . . . . . . . . . . . . 33
4.1.3 Calcul des esprances de panne E
panne
pour chaque cellule. . . . . . . . . 34
4.2 Critre B attendu par an. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2.1 Dures des incidents. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2.2 Nombre de clients par dpart. . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.3 Calcul des contributions au critre B attendu. . . . . . . . . . . . . . . . 37
4.3 Simulation de pannes souterraines. . . . . . . . . . . . . . . . . . . . . . . . . . 37
2
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
4.4 Quelques reprsentations graphiques. . . . . . . . . . . . . . . . . . . . . . . . . 39
Conclusion et perspectives. 44
Annexes. 45
1 Interface de lapplication Incidents. 45
2 Fiche dincident rseau HTA. 46
3 Statistiques descriptives Rsultats de la console R. 48
4 Seuil critique c
n
=

n d
n
du test de Kolmogorov-Smirnov. 49
5 Programme R utilis pour obtenir la gure 17, page 25. 49
6 Programme R utilis pour obtenir les simulations des pannes souterraines. 50
7 Analyse Factorielle de Donnes Mixtes. 50
Rfrences. 55
3
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Table des gures
1 Organisation gnrale de lS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Les dirents rseaux lectriques . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3 Groupes dexploitation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4 Diagramme de Gantt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
5 Diagramme circulaire : groupes dexploitation . . . . . . . . . . . . . . . . . . . 12
6 Diagramme circulaire : dfauts lorigine des incidents . . . . . . . . . . . . . . 13
7 Diagramme circulaire : causes des incidents . . . . . . . . . . . . . . . . . . . . . 13
8 Diagramme simpli des causes des incidents . . . . . . . . . . . . . . . . . . . . 14
9 Botes moustaches du nombre de postes coups . . . . . . . . . . . . . . . . . 14
10 Figure 9 recentre sur lintrieur des botes moustaches . . . . . . . . . . . . . 14
11 Botes moustaches du nombre de clients coups . . . . . . . . . . . . . . . . . 15
12 Botes moustaches pour le critre B de lincident . . . . . . . . . . . . . . . . . 16
13 Matrice de nuages de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
14 Cumul des incidents de 2008 2011 . . . . . . . . . . . . . . . . . . . . . . . . . 22
15 Q-QPlot des temps inter-arrives . . . . . . . . . . . . . . . . . . . . . . . . . . 23
16 Ajustement une loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . 24
17 Seuils critiques c
n
par la mthode du bootstrap paramtrique . . . . . . . . . . . 25
18 Histogramme de la distribution simule de D . . . . . . . . . . . . . . . . . . . . 29
19 Histogramme de la distribution simule de W
2
. . . . . . . . . . . . . . . . . . . 30
20 Simulations des incidents 2008 2011 . . . . . . . . . . . . . . . . . . . . . . . . 31
21 Exemple du dpart n
o
15 du poste de Reichstett . . . . . . . . . . . . . . . . . . 33
22 Schma illustrant la formule de d
1
. . . . . . . . . . . . . . . . . . . . . . . . . . 36
23 Botes moustaches du critre B sur 100 ans . . . . . . . . . . . . . . . . . . . . 40
24 Botes moustaches du nombre dincidents sur 100 ans . . . . . . . . . . . . . . 40
25 Distribution du critre B sur 100 ans . . . . . . . . . . . . . . . . . . . . . . . . 40
26 Distribution du nombre dincidents sur 100 ans . . . . . . . . . . . . . . . . . . 40
4
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Introduction.
1 Lentreprise lectricit de Strasbourg
1
.
lectricit de Strasbourg SA est une socit anonyme au capital de 71 543 860 e, cote la
Bourse sur Euronext Paris qui a dgage un chire daaires de 562,1 Me et un rsultat net
consolid de 60,1 Me. Le groupe lectricit de Strasbourg est compos de plus de 1 000 salaris
rpartis dans les direntes socits et liales.
Lactionnaire majoritaire dlectricit de Strasbourg est EDF Dveloppement et Environ-
nement (EDEV) qui dtient 88,82% du capital. Le groupe S est compos dlectricit de
Strasbourg (maison mre), dS Rseaux (Gestionnaire de rseaux) et de plusieurs liales (S
nergies Strasbourg, cotral. . .).
1.1 Historique de lentreprise.
lectricit de Strasbourg (S) a t cre le 14 dcembre 1899 sous le nom de Elektrizitts-
werk Strassburg , linitiative de la ville de Strasbourg et grce aux capitaux de lentreprise
allemande AEG et du Crdit Suisse, travers sa liale Elektrobank. AEG fabriquait alors des
quipements lectrotechniques, tandis que Elektrobank nanait la construction et lexploita-
tion dentreprises dlectricit.
En 1908, la ville de Strasbourg devient actionnaire majoritaire. En ce dbut de sicle, lec-
tricit de Strasbourg sengage dans les grands programmes dlectrication des campagnes et
des villes.
Aprs une courte priode de transition lpoque de la premire guerre mondiale, lentreprise
reprend son expansion. Elle cre une socit immobilire qui, en 1925, deviendra Sodal, sa plus
ancienne liale.
En 1954, la ville de Strasbourg cde ses actions lectricit de France (EDF) qui devient
ainsi lactionnaire majoritaire de lentreprise.
Dans les annes 70, annes de crises ptrolires, lheure est aux conomies dnergie en
France. lectricit de Strasbourg cre une liale qui deviendra cotral charge de promou-
voir des installations de chauage lectrique conomiques, avec garantie de rsultat.
1
er
juillet 2004 : cette date marque une tape dcisive dans le processus douverture du
march de lnergie avec lligibilit de tous les clients, mnages excepts. partir du 1
er
octobre 2005, S largit son activit et devient galement fournisseur de gaz. En 2007, cest
louverture totale du march de llectricit et du gaz en France.
En 2009, lectricit de Strasbourg, en lien avec les obligations juridiques qui encadrent lou-
verture des marchs europens de lnergie, a procd la lialisation de son commercialisateur
S nergies Strasbourg . Elle cre galement la marque du groupe Groupe S et la
marque du distributeur ESR pour S Rseaux.
En avril 2012, nerest, fournisseur historique de gaz de Strasbourg et ex-liale de Rseau
GDS, devient une liale du groupe S.
1. Source : http://www.es-groupe.fr/
5
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
1.2 Organisation gnrale de lentreprise.
Le groupe S est organis autour de trois activits principales :
la gestion du rseau de distribution lectrique assure par S Rseaux.
la fourniture dnergies et de services lis assure par S nergies Strasbourg.
le conseil, lassistance et le service pour tout projet de construction ou de rnovation assurs
par cotral.
Figure 1 Organisation gnrale de lS
1.3 Les rseaux lectriques de llectricit de Strasbourg.
Le rseau de llectricit de Strasbourg est divis en quatre parties :
le rseau EDF-RTE : cest le rseau lectrique appartenant EDF. Cest un rseau maill
qui transporte du courant de 400 000 volts et 225 000 volts. Actuellement, le rseau HTB
(voir plus bas) de lS est aliment en cinq points par le rseau RTE 225 000 volts.
le rseau HTB : cest galement un rseau maill dont les tensions lectriques valent plus
de 50 000 volts (en gnral, 63 000 volts). Le rseau est compos de postes HTB (ou postes
source) qui sont diviss en plusieurs cellules (ou dparts HTA). Chaque cellule alimente
une partie du rseau haute tension . Le rseau lectrique de lS est compos de 40
postes HTB.
le rseau HTA : cest la haute tension de la distribution publique appele haute tension de
type A (HTA) ou moyenne tension (MT). Cette tension vaut gnralement 20 000 volts.
Il sagit ici dun rseau arborescent qui se dlimite par des postes de transformation
HTA/BT ou des postes de transformation HTA/BT client. Le rseau de lS est compos
de 7 000 postes HTA/BT.
6
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
le rseau BT : cest le rseau basse tension (230 et 400 volts) qui est aussi un rseau
arborescent. La racine de larbre tant, comme il a t dit prcdemment, soit un poste
de transformation HTA/BT, soit un poste de transformation HTA/BT client. Dans le
premier cas, le poste alimente des particuliers (galement appels clients basse tension).
Les particuliers sont relis au rseau BT par des corets. En moyenne, un poste HTA/BT
alimente 100 clients basse tension. Dans le second cas, le poste nest reli qu un seul
client qui est appel un client HTA. Les clients HTA sont gnralement des entreprises.
Figure 2 Les dirents rseaux lectriques
En HTB, les rseaux sont dits boucls, cest--dire que sil y a un incident sur une partie de
la ligne, le reste du rseau nest pas perturb. En revanche, en BT, les rseaux sont en antennes,
cest--dire quun problme sur une ligne entrane des perturbations pour tous les clients qui
sont en aval. En HTA, les rseaux sont en antennes dites bouclables.
1.4 Les groupes dexploitation.
lectricit de Strasbourg Rseaux alimente la majeure partie du Bas-Rhin, et son rseau est
divis en trois groupes dexploitation : le GEC, Groupe dExploitation Centre ; le GEN, Groupe
dExploitation Nord; et le GES, Groupe dExploitation Sud. La rpartition est la suivante :
Figure 3 Groupes dexploitation
7
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
2 Prsentation du stage.
Mon stage sest droul au sein du dpartement Expertise et Soutien au Systme dInfor-
mation du Distributeur (ESSIDIS), entit de lESR, qui se situe au Centre Oprationnel de
Mundolsheim (COM).
Dans un premier temps, nous avons analys les interventions eectues par lS depuis
2008. Une intervention peut tre une intervention technique (relev spcial, vrication, im-
pay/coupure. . .) ou une intervention contrat (cessation, souscription, modication de contrat. . .).
Cette partie, que nous ne prsentons pas, a dur un mois et ma permis damliorer mes com-
ptences sur le logiciel de statistique R, notamment en utilisant de gros jeux de donnes ainsi
quen ralisant des statistiques descriptives et des reprsentations graphiques.
Dans un second temps, nous avons analys les incidents du rseau de lS. Lobjectif prin-
cipal de ce stage a consist analyser les incidents HTA et HTB.
Nous prsentons en premier lieu certaines statistiques descriptives sur les incidents de 2008
2011. 609 incidents HTA ou HTB sont survenus ces quatre dernires annes, il nest donc
pas ais de dceler si des choses particulires se dgagent des donnes. Cest en ce sens que les
statistiques descriptives sont pertinentes.
Ensuite, nous nous sommes intresss aux occurrences des pannes sur le rseau lectrique
qui sont considres comme des vnements alatoires car nous ne pouvons pas les prvoir.
Nous avons ralis des tests statistiques an de savoir sil est possible de modliser les incidents
des quatre dernires annes en utilisant des processus alatoires et plus particulirement des
processus de Poisson car ces processus sont souvent bien adapts pour expliquer des processus
darrives .
Puis, nous nous sommes plus particulirement intresss aux incidents sur les cbles souter-
rains. partir de la topologie du rseau, nous avons calcul les longueurs des cbles souterrains
et nous avons pu estimer une esprance des pannes pour chaque dpart HTA
2
.
Ensuite, nous avons chercher les distances que doivent parcourir les exploitants pour isoler
le tronon en panne lorsquun incident a lieu sur telle ou telle cellule dun poste source, et de
ce fait nous avons valu les dures des incidents pour chacune de ces cellules.
Et ainsi nous avons pu calculer une esprance du critre B qui correspond au temps moyen
de coupure dun client par an.
Puis, aprs avoir calcul le critre B attendu par an, nous avons cherch simuler des pannes
pour chaque dpart HTA pendant 100 ans. De cette faon nous avons pu calculer le critre B
pour 100 ans dale, observer la dispersion, puis comparer la moyenne au critre B attendu
que nous avions calcul.
Enn nous avons ralis une Analyse Factorielle des Donnes Mixtes (AFDM) qui permet
lanalyse factorielle simultane de variables quantitatives et qualitatives sur les incidents. Cette
analyse est prsente en annexe 7, page 50.
Tout au long de mon stage, jai utilis le tableur Excel et le logiciel de statistique R.
2. Un dpart HTA (ou cellule) alimente le rseau HTA partir dun poste source HTB (cf. section 1.3).
8
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
3 Diagramme de Gantt.
Le diagramme de Gantt est un outil qui permet de visualiser dans le temps les direntes
tches qui composent un projet. Cest un outil trs utilis en gestion de projet car il permet de
reprsenter graphiquement lavancement dun projet.
Voici le diagramme de Gantt qui correspond au droulement de mon stage :
Figure 4 Diagramme de Gantt
9
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Analyse des incidents.
1 Les incidents du rseau lectrique.
Rappelons brivement que le rseau lectrique se compose de lensemble des cbles lec-
triques connects entre eux. Il existe dirents types de rseaux :
le rseau Haute Tension (ou rseau HT) qui est utilis pour le transport et la rpartition
de llectricit. Il se dcompose en deux sous-rseaux :
le rseau Haute Tension B (ou rseau HTB) : tensions suprieures 50 kV (Kilovolts).
Il sert lalimentation gnrale, du niveau national au niveau rgional.
le rseau Haute Tension A (ou rseau HTA) : tensions variant de 1 000 V 50 kV. Cest
le rseau de distribution local, dans un rayon de 10 20 kilomtres autour du poste
source.
le rseau Basse Tension (ou rseau BT) : tensions infrieures 1 000 V. Il est utilis pour
desservir les quartiers et les communes.
1.1 Trois types dincidents.
Il existe trois types dincidents dirents qui peuvent survenir sur le rseau lectrique :
un incident BT ou incident basse tension est un incident dans une petite zone go-
graphique. Il touche gnralement quelques rues, ce qui reprsente quelques dizaines jus-
qu une centaine de clients. Un incident BT peut tre caus par la coupure dun poste
HTA/BT ou tre li un problme dans larborescence du rseau BT (arrachage de la
ligne lectrique par la chute dune branche par exemple).
un incident HTA est un incident de grande ampleur. Il sagit en gnral de la coupure
dun dpart HTA (une cellule). Ce dpart tant la racine dun rseau HTA, cette coupure
entrane la coupure de plusieurs postes HTA/BT et donc une coupure chez les clients BT
raccords chacun des postes. Un tel incident aecte quelques milliers de clients.
un incident HTB est le pire des incidents pour lS. En eet, un tel incident entrane la
coupure de plusieurs cellules, ce qui entrane la coupure de plusieurs dizaines de postes
HTA/BT. Il sagit donc dun incident de trs grande ampleur. Le rseau HTA tant
protg par des disjoncteurs dans le poste source (les cellules), en cas de dfaut, cest tout
le dpart qui est coup soit plusieurs dizaines de milliers de clients.
Dans la suite, le travail portera sur les incidents HTA et HTB.
10
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
1.2 Lapplication Incidents
3
.
Lapplication Incidents a t dveloppe par le dpartement Exploitation du groupe S et
permet la gestion des incidents lectriques. Le but principal est davoir un historique sur les
incidents qui se sont produits sur le rseau de lS.
Il est possible galement dobtenir des statistiques et des dtails sur chaque incident. Tous
les utilisateurs de lapplication ont ainsi accs toutes les informations possibles sur un incident.
Lhistorique des incidents est construit soit grce au journal de bord du systme de tl-conduite
utilis par lS pour contrler distance le rseau Haute Tension, soit grce des ches saisies
par les agents de lS. Une che dincident HTA est prsente en annexe 2, page 46.
Extraction
Lapplication Incidents permet directement lextraction des donnes sur les incidents dans
un chier CSV.
1.3 Le critre B
Le critre B est un marqueur trs important pour lESR. Il reprsente la dure moyenne
annuelle de coupure par client desservi.
Grce lapplication Incidents, le calcul du critre B sera plus prcis du fait de la prcision
des donnes. Cest une mtrique universelle de la qualit des rseaux lectriques. lESR, le
critre B varie autour de 10 minutes par anne alors quen Europe, selon les rseaux, le critre
B peut tre de plusieurs heures.
Il se calcule de la faon suivante :
Critre B =

Incidents i de lanne
_
_
Dure de lincident i * Nb de clients coups dans lincident i
Nombre total de client S
_
_
3. Une interface de lapplication Incidents est donne en annexe 1, page 45.
11
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
2 Statistiques descriptives sur les incidents HTA et HTB.
2.1 Les variables.
Les variables concernant les incidents sont nombreuses, nous avons dcid den retenir 10 :
6 variables qualitatives : type de lincident, secteur o a eu lieu la coupure, nombre de
clients de la commune coupe, nom du poste source, dfaut de lincident et cause de
lincident.
4 variables quantitatives : nombre de postes coups, nombre de clients coups, critre B
de lincident et puissance coupe de lincident.
2.2 Reprsentations graphiques.
Il y a 609 incidents HTA ou HTB qui sont survenus de 2008 2011. Les statistiques des-
criptives vont permettre de nous renseigner sur chacune des variables tudies. Les rsultats de
la console R sont donns en annexe 3, page 48. Nous prsentons maintenant les reprsentations
graphiques pour quelques variables.
Les variables qualitatives.
Les reprsentations graphiques lies aux variables qualitatives sont la reprsentation en
diagramme circulaire et la reprsentation en btons. Dans ce manuscrit, nous reprsentons les
variables qualitatives sous forme de diagrammes circulaires car ils sont bien adapts pour des
vues densemble.
Secteur o a eu lieu la coupure.
Figure 5 Diagramme circulaire : groupes dexploitation
Plus de la moiti des incidents ont eu lieu dans le GEC. Cest dans ce secteur que se trouve
la ville de Strasbourg, qui regroupe prs de 20% des postes de lESR mais aussi 50% des clients.
12
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Dfaut de lincident.
Figure 6 Diagramme circulaire : dfauts lorigine des incidents
Quasiment la moiti des dfauts sont souterrains. Environ 1/5
e
sont des dfauts ariens. Les
dfauts sur cbles sont bien plus frquents que les dfauts sur postes.
Cause de lincident.
Figure 7 Diagramme circulaire : causes des incidents
La principale cause des incidents est la vtust des cbles. Nous pouvons remarquer gale-
ment que les causes naturelles (animaux, coup de foudre, tempte. . .) sont responsables dun
grand nombre dincidents. Ces causes sont des causes invitables pour lESR.
13
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Reprsentation simplie.
Figure 8 Diagramme simpli des causes des incidents
La reprsentation simplie, o la variable cause de lincident cinq modalits, nous montre
que le distributeur a une part de responsabilit dans plus de 40% des incidents. Nous remarquons
galement que prs de 20% des incidents sont dus des causes naturelles et environ 15% sont
de causes inconnues.
Les variables quantitatives.
Une des reprsentations adquates pour les variables quantitatives est lhistogramme. Une
autre reprsentation intressante est la bote moustaches. Cest cette reprsentation que nous
avons retenue car elle permet de comparer facilement une mme variable en fonction dun
paramtre. Par exemple, nous pouvons comparer les variables en fonction des direntes classes
de communes. Nous avons donc en abscisse la taille des communes concernes par lincident.
Nombre de postes coups.
Figure 9 Botes moustaches du nombre
de postes coups
Figure 10 Figure 9 recentre sur lintrieur
des botes moustaches
14
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Nous distinguons un certain nombre de valeurs extrmes pour chaque classe sur la gure 9,
page 14. Ainsi, dans les quatre groupes de communes, il sest produit des incidents qui ont
entrain la coupure de nombreux postes HTA/BT. Ceci est d aux incidents de type HTB.
Lchelle de la gure 9 nest pas trs agrable car les botes moustaches sont concentres
vers le bas. Nous allons donc recentrer le graphique sur lintrieur des botes moustaches
pour obtenir un graphique que nous pourrions mieux tudier. Nous obtenons ainsi la gure 10,
page 14.
Sur cette gure 10, nous constatons que les mdianes sont plus faibles pour les grandes
communes que pour les petites communes. Ceci peut sexpliquer par le fait que les petites
communes sont alimentes par des dparts trs longs avec beaucoup de postes alors qu linverse
les grandes communes ont moins de postes par dpart car lhabitat est plus dense et donc il
y a plus de clients par poste. La moyenne de chaque groupe est assez loigne de la mdiane,
ceci sexplique par le fait que les valeurs extrmes tirent vers le haut la moyenne qui est moins
robuste que la mdiane.
Nombre de clients coups.
Comme prcdemment, les botes moustaches sont concentres vers le bas avec des valeurs
extrmes pour chaque groupe. Il y a donc eu dans chaque classe de communes des incidents
qui ont entrain la coupure de nombreux clients. Cela est d aux incidents de type HTB. Nous
prsentons directement le graphique recentr sur les botes moustaches la gure 11.
Figure 11 Botes moustaches du nombre de clients coups
Nous remarquons que le nombre de clients coups est plus lev dans les grandes communes.
Il semble donc quil y a moins de postes coups mais plus de clients coups dans les grandes
communes. Comme nous lavons dit plus haut, il y a moins de clients sur les dparts des petites
communes, donc un incident va aecter moins de clients dans les petites communes que dans
les grandes communes.
15
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Critre B de lincident.
Le critre B dun incident est la contribution en secondes quapporte un incident sur le
critre B lanne. Nous prsentons, l encore, directement le graphique centr sur les botes
moustaches la gure 12.
Figure 12 Botes moustaches pour le critre B de lincident
Nous remarquons que le critre B moyen dun incident est le mme pour chaque groupe de
communes et il est environ gal trois secondes. Nous observons galement que la dispersion
autour de la moyenne pour chacun des groupes est assez identique.
Il ny a donc pas de dirence au niveau de ce critre entre les classes de communes contraire-
ment aux deux variables tudies prcdemment (nombre de postes coups et nombre de clients
coups) o nous avions observ des dirences entre les petites et les grandes communes.
Liens entre les variables quantitatives.
Nous pouvons tablir graphiquement des liens entre les variables quantitatives en utilisant
une matrice de nuages de points. La fonction scatterplotMatrix du logiciel R permet de raliser
ces nuages de points. De plus, nous pouvons y ajouter les droites des moindres carrs (en vert),
les courbes de lissage (en rouge) et galement les histogrammes sur la diagonale.
Nous observons, gure 13, page 17, une relation entre le nombre de postes coups et le
nombre de clients coups, selon deux groupes. De manire gnrale, un nombre important de
clients coups correspond un grand nombre de postes coups. Une explication serait que les
deux groupes que nous observons dirent suivant la taille des communes. Comme nous lavons
vu dans ltude des botes moustaches, dans les grandes communes il y a plus de clients par
postes. Pour un mme nombre de postes coups, le nombre de clients coups est plus important
dans les grandes communes que dans les petites communes.
Il semble galement quil y ait une liaison entre la puissance coupe et le nombre de postes
coups et aussi une liaison entre la puissance coupe et le nombre de clients coups. Cest
logique, plus il y a de postes coups ou de clients coups, plus la puissance coupe de lincident
est leve.
16
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Figure 13 Matrice de nuages de points
Nous pouvons acher galement la matrice des corrlations qui donne les coecients de
corrlation de Bravais-Pearson entre les variables quantitatives grce la fonction cor de R :
_
_
_
_
_
clients coups critre B postes coups puissance coupe
clients coups 1.0000000 0.1627597 0.8715437 0.9416155
critre B 0.1627597 1.0000000 0.0448003 0.0892804
postes coups 0.8715437 0.0448003 1.0000000 0.9449067
puissance coupe 0.9416155 0.0892804 0.9449067 1.0000000
_
_
_
_
_
Nous obtenons les mmes conclusions quavec la matrice de nuages de points : il existe
une liaison linaire entre le nombre de postes coups et le nombre de clients coups, entre le
nombre postes coups et la puissance coupe et galement entre le nombre de clients coups et
la puissance coupe.
Nanmoins, ltude graphique nous a permis en plus de distinguer deux groupes dans la relation
linaire entre le nombre de postes coups et le nombre de clients coups.
17
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
3 Modlisation
4
des incidents HTA et HTB sur les quatre
dernires annes.
Les occurrences des pannes sur le rseau lectrique sont considres comme des vnements
alatoires car nous ne pouvons pas les prvoir. Nous supposons alors que nous pouvons modliser
les incidents HTA/HTB par un processus alatoire. Dans la suite, nous raliserons des tests
dadquation, notamment les tests de Kolmogorov-Smirnov et de Cramer-Von Mises, an de
savoir sil est possible de modliser les incidents du rseau de lS par des processus de Poisson
qui sont souvent utiliss pour expliquer des processus darrives .
3.1 Les processus alatoires.
Les processus alatoires (ou stochastiques) sont des processus qui dcrivent lvolution dune
variable alatoire en fonction du temps. Introduisons des processus qui vont nous servir dans
la suite de ltude :
Soit (T
n
)
n1
le processus des temps doccurrences qui reprsente les instants doccurrences
des incidents. Par convention, T
0
= 0. partir de ce processus (T
n
)
n1
, il est possible de dnir
le processus de comptage, not N(t), qui reprsente le nombre dincidents qui se sont produits
entre 0 et t :
N(t) =
n

i=1
1(T
i
t), t 0
Soit (X
n
)
n1
le processus des temps inter-incidents qui correspond au temps dattente entre
deux incidents :
X
n
= T
n
T
n1
, n 1
Introduisons quelques dnitions :
Dnition 1 Un processus est dit accroissements indpendants si 0 < t
1
< t
2
< < t
n
:
N(t
1
), N(t
2
) N(t
1
), . . . , N(t
n
) N(t
n1
) sont indpendants.
Dnition 2 Un processus est dit accroissements stationnaires si 0 s < t :
N(t) N(s) et N(t s) sont identiquement distribus.
Dnition 3 Lintensit (t) dun processus N(t) se dnit de la faon suivante :
(t) = lim
h0
P[N(t +h) N(t) 1]
h
Lintensit dun processus peut sinterprter comme le taux doccurrence dun incident.
Dnition 4 Lintensit cumule (t) dun processus N(t) est le nombre moyen dincidents
survenus entre 0 et t :
(t) =
_
t
0
(v) dv = E[N(t)]
4. Pour cette analyse, nous nous sommes appuys sur [1] et [2] rfrencs page 55.
18
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
3.2 Les processus de Poisson.
Les processus de Poisson sont bien adapts pour expliquer des processus darrives . Des
exemples de ces processus sont larges : appels tlphoniques un standard, arrive dun client
un guichet, sinistres subis par une compagnie dassurance, panne sur une machine. . .
Les processus de Poisson que jai tudis sont des processus temporels , mais il est bon
de savoir quil existe des processus de Poisson dans dautres espaces. Les processus de Poisson
temporels se divisent en trois types : les processus de Poisson homognes, les processus de
Poisson non homognes et les processus composs.
3.2.1 Processus de Poisson homogne.
Dnition 5 Un processus de comptage N(t) est un processus de Poisson homogne dintensit
> 0 si :
1. N(0) = 0 ;
2. Le processus est accroissements indpendants ;
3. Le processus est accroissements stationnaires ;
4. 0 s < t, N(t) N(s) suit une loi de Poisson de paramtre (t s) :
k N, P[N(t) N(s) = k] = e
(ts)
((t s))
k
k!
Une dnition quivalente et qui est plus rpandue est la suivante :
Dnition 6 Un processus de comptage N(t) est un processus de Poisson homogne dintensit
> 0 si :
1. N(0) = 0 ;
2. Le processus est accroissements indpendants ;
3. Le processus est accroissements stationnaires ;
4.
P[N(t +h) N(t) = k] = P[N(h) = k] =
_

_
1 h +o(h) si k = 0
h +o(h) si k = 1
o(h) si k 2
Cette dnition nous montre que plusieurs occurrences ne peuvent avoir lieu en mme temps, ce
qui peut poser problme dans certains cas. Dans la suite, nous pourrons lever cette hypothse
grce aux processus composs.
La proposition suivante est trs utile pour modliser un processus de Poisson homogne :
Proposition 1 Un processus de comptage est un processus de Poisson homogne si et seule-
ment si les X
n
= T
n
T
n1
sont indpendants et identiquement distribus selon une loi expo-
nentiel le de paramtre > 0, cest--dire si les X
n
ont pour densit de probabilit :
f(x) =
_
_
_
0 x < 0
e
x
x 0
19
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
3.2.2 Processus de Poisson non homogne.
Un processus de Poisson non homogne dire dun processus de Poisson homogne par le
fait que ses accroissements ne sont plus stationnaires. Lintensit dun tel processus nest donc
plus constante mais dpend du temps.
Dnition 7 Un processus de comptage N(t) est un processus de Poisson non homogne din-
tensit (t) sil satisfait les conditions suivantes :
1. N(0) = 0 ;
2. Le processus est accroissements indpendants ;
3. N(t) suit une loi de Poisson de paramtre (t) :
k N, P[N(t) = k] = e
(t)
((t))
k
k!
o (t) est une fonction dterministe.
Dans ce cas, les temps inter-incidents X
n
ne sont plus identiquement distribus.
3.2.3 Processus de Poisson compos.
Les processus de Poisson composs permettent de lever lhypothse selon laquelle plusieurs
vnements ne peuvent se produire en mme temps.
Dnition 8 Un processus de comptage Z(t) est un processus de Poisson compos si :
t 0, Z(t) =

N(t)
n=0
Y
n
o N(t) est un processus de Poisson sous-jacent, (Y
n
)
n1
une
famil le de variables alatoires indpendantes et identiquement distribues et Y
0
= 0. De plus,
N(t) et (Y
n
)
n1
sont supposs indpendants.
3.3 Les tests dadquation
5
.
Les tests dadquation sont des tests dhypothse statistique qui permettent de dterminer
sil y a adquation ou non entre un chantillon de donnes et une distribution connue.
Le test du Chi-2 est certainement un des tests dadquation les plus connus. Par nature,
ce test sapplique plus gnralement des variables discrtes. Mais les variables continues
peuvent tre catgorises et donc le test peut galement sappliquer aux distributions continues.
Nanmoins, la statistique de test va dpendre de la rpartition choisie.
Il y a galement les tests dadquation bass sur la fonction de rpartition empirique. La
fonction de rpartition empirique est base sur lchantillon X
1
, . . . , X
n
et est dnie par :
F
n
(x) =
1
n
n

i=1
1(X
i
x), x R
5. Source : http://www.aiaccess.net/French/Glossaires/GlosMod/f_gm_adequation.htm
20
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Ces tests vrient que la fonction de rpartition empirique F
n
(x) est une bonne approxima-
tion de la fonction de rpartition thorique F(x). Ils testent alors :
H
0
: F
n
= F contre H
1
: F
n
= F
o F
n
est la fonction de rpartition empirique de lchantillon et F est la fonction de rpartition
de la distribution de rfrence.
Parmi ces tests, nous pouvons citer le test de Kolmogorov-Smirnov et celui de Cramr-Von
Mises dont nous prsentons les statistiques de test.
Test de Kolmogorov-Smirnov.
Le test de Kolmogorov-Smirnov sapplique aux distributions continues et dont la loi tho-
rique est entirement spcie, cest--dire sans paramtres inconnus. Si les paramtres sont
estims partir des donnes, la rgion critique de la statistique de test nest pas valable et doit
tre dtermine par simulation.
La statistique de test D
n
mesure lcart entre les valeurs observes (chantillon) et les valeurs
thoriques (distribution de rfrence) en prenant la plus grande valeur absolue de la dirence
entre la fonction de rpartition empirique et la fonction de rpartition thorique :
D
n
= sup
xR
| F
n
(x) F(x) |
La distribution de D
n
sous H
0
nest pas connue mais elle ne dpend pas de F(x). Elle a t
abondamment simule et tabule.
Test de Cramer-Von Mises.
Si le test de Kolmogorov-Smirnov est raisonnablement puissant, il peut paratre surprenant
quil soit conu uniquement sur lcart entre une observation de lchantillon et une valeur de
la fonction de rpartition thorique.
Le test de Cramr-Von Mises va plutt mesurer la dirence entre les deux fonctions de
rpartition en les comparant sur lensemble de leur domaine. La statistique de test est la sui-
vante :
W
2
=
1
12n
+
n

i=1
_
2i 1
2n
F(x
(i)
)
_
2
o x
(i)
est la statistique dordre de rang i de lchantillon.
La distribution de W
2
est inconnue mais elle est identique pour toutes les fonctions de rpar-
tition F(x). Elle a t abondamment simule et tabule.
21
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
3.4 Modlisation par processus de Poisson.
Nous avons notre disposition les dates darrives des incidents HTA/HTB depuis le 1
er
janvier 2008 jusquau 31 dcembre 2011. Nous pouvons donc dnir la fonction de comptage
du processus du cumul des incidents par :
N(t) =
n

i=1
1(T
i
t), t 0
o les T
i
correspondent aux instants doccurrences des incidents.
La gure 14 reprsente la trajectoire observe du cumul des incidents entre 2008 et 2011 :
Figure 14 Cumul des incidents de 2008 2011
Nous pouvons observer quil y a eu 609 incidents HTA/HTB lors des quatre dernires annes
et nous constatons une lgre acclration du cumul lors de chaque t.
Nous remarquons galement que plusieurs incidents ont eu lieu le mme jour puisque cer-
taines marches de la trajectoire observe sont plus hautes. Nous nous retrouvons alors avec
plusieurs temps doccurrences gaux et cela nest pas possible dans le cadre dun processus de
Poisson car il ne peut y avoir plusieurs instants doccurrences en mme temps.
Nous allons donc travailler avec un processus de Poisson compos

N(t)
n=0
Y
n
, o N(t) est
obtenu en ne considrant quune seule fois chaque temps doccurrences, ce qui correspond au
processus sous-jacent, et Y
n
correspond au nombre dincidents ayant eu lieu la date T
n
. Par
convention, T
0
= 0 et Y
0
= 0. Si nous avions cod les instants darrives la seconde, nous
naurions pas eu doccurrences simultanes, mais il est plus commode de travailler avec les
dates.
Ds lors que nous considrons le processus sous-jacent, nous navons plus que 438 instants
doccurrences et nous dnissons le processus des temps inter-arrives X
n
= T
n
T
n1
, n 1,
qui correspond au temps dattente entre deux occurrences. Les X
n
ne peuvent tre nulles puisque
nous travaillons avec le processus N(t) sous-jacent.
22
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Le processus sous-jacent est-il un processus de Poisson homogne ?
Nous pouvons dsormais tester si le processus sous-jacent N(t) correspond un processus
de Poisson homogne. Pour cela, nous allons utiliser la proposition 1, page 19, selon laquelle
un processus de comptage est un processus de Poisson homogne si et seulement si les X
n
=
T
n
T
n1
sont indpendants et identiquement distribus selon une loi exponentielle de paramtre
> 0.
Le Q-QPlot des temps inter-arrives permet dobtenir de linformation sur le caractre ex-
ponentiel ou non des X
n
. Il suit lide des tests dadquation bass sur la fonction de rpartition
empirique :
F
n
(x) F(x), x R

i
n
1 e
x
(i)
x
(i)

1

ln
_
1
i
n
_

_
x
(i)
, ln
_
1
i
1
2
n
__
forme un nuage de points qui sajuste une droite de pente .
Si les points sont bien aligns, nous pouvons supposer que le processus est un processus de
Poisson homogne dintensit que nous pouvons estimer grce la pente de la droite.
Voici le Q-QPlot des temps inter-arrives qui correspond nos donnes :
Figure 15 Q-QPlot des temps inter-arrives
23
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
La gure 15, page 23 montre plusieurs ensembles de points qui sont caractriss par une
mme valeur du temps inter-arrives alors quen thorie il ny a pas plusieurs valeurs gales
pour une mme variable continue. En fait, il ne se passe pas exactement un nombre entier de
jours entre deux incidents mais les donnes sont arrondies lentier le plus proche. La mthode
graphique nous montre quun ajustement linaire nest pas recommand car les points ne sont
pas aligns et donc il ne serait pas adquat de modliser le processus sous-jacent N(t) par un
processus de Poisson homogne.
Nous allons tout de mme tester si lajustement exponentiel des temps inter-arrives X
n
est acceptable ou non selon le test de Kolmogorov-Smirnov. Pour cela, nous pouvons utiliser
la fonction ks.test de R qui teste
6
ladquation dun chantillon de donnes une distribution
connue.
Voici une reprsentation graphique qui montre lcart entre la fonction de rpartition em-
pirique des X
n
et la fonction de rpartition de la loi exponentielle de paramtre estim :
Figure 16 Ajustement une loi exponentielle
La statistique de test de Kolmogorov-Smirnov que nous obtenons est :D
438
= 0, 2596. Nous
avons vu prcdemment que pour le test de Kolmogorov-Smirnov, la distribution thorique doit
tre entirement spcie. Ainsi, nous ne devons pas tenir compte de la p-valeur donne par le
logiciel R car le paramtre est inconnu et a t estim sur lchantillon tester.
Cependant, J. DURBIN sest intress au test de Kolmogorov-Smirnov en cas de paramtres
inconnus dans larticle [3], publi dans la revue sur les statistiques Biometrika.
6. ks.test peut galement tester si deux chantillons suivent la mme loi.
24
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Cet article prsente une technique qui permet dobtenir la distribution exacte de la sta-
tistique de test lorsque les paramtres sont estims. Puis cette technique est applique au cas
dune distribution exponentielle. Une table des seuils critiques c
n
tels que P[

nD
n
> c
n
] =
est donne dans larticle pour plusieurs valeurs de (1%, 5%, 10%. . .).
Nous donnons la table pour = 5% en annexe 4, page 49. Une interpolation linaire peut
tre ralise pour les valeurs ne gurant pas dans la table. Pour les valeurs de n > 100, la
mthode du bootstrap paramtrique
7
a permis dobtenir une estimation de la valeur du seuil
critique. La gure 17 montre que c
n
peut tre estim c
n
=

nd
n
1, 08 pour n > 100 :
Figure 17 Seuils critiques c
n
par la mthode du bootstrap paramtrique
Nous pouvons ainsi obtenir les valeurs critiques d
n
tel que d
n
=
cn

n
. Nous obtenons d
n
pour
n = 438 qui vaut : d
438
=
1,08

438
= 0, 0516044. Nous dcidons donc, avec un risque de premire
espce = 5%, de rejeter lhypothse nulle selon laquelle les temps inter-arrives sont distribus
exponentiellement car D
438
= 0, 2596 > d
438
= 0, 0516044.
Un autre moyen pour tester si les X
n
sont distribus exponentiellement est dutiliser le
package de R tdistrplus et ses fonctions tdist et gofstat.
La fonction tdist ajuste
8
une distribution thorique aux donnes et la fonction gofstat
calcule les statistiques des tests dadquation suivants :
Test du Chi-2 pour les distributions discrtes
Tests de Kolmogorov-Smirnov, de Cramer-Von Mises et dAnderson-Darling pour les dis-
tributions continues.
N.B. Le test dAnderson-Darling est de la mme famille que le test de Kolmogorov-Smirnov
et de Cramer-Von Mises, il est bas sur la fonction de rpartition empirique. La dirence est
que le test dAnderson-Darling donne plus de poids aux queues de distribution.
7. Le code R pour raliser la gure 17 a t repris du rapport [2] et est donn en annexe 5, page 49.
8. Par dfaut, cest la mthode du maximum de vraisemblance qui est utilise.
25
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
tant donn que nous testons ladquation des temps inter-arrives une distribution ex-
ponentielle, nous obtenons les statistiques suivantes :
Statistique de Kolmogorov-Smirnov : D
438
= 0, 2596
Statistique de Cramer-Von Mises : W
2
= 3, 1603
Statistique dAnderson-Darling : A
2
= 20, 7110
Les trois tests rejettent lhypothse nulle. Mais pour la statistique de Kolmogorov-Smirnov,
comme prcdemment, nous ne devons pas tenir compte de la dcision ache puisque la
distribution teste nest pas entirement spcie, et nous devons comparer D
438
avec la valeur
critique d
438
obtenue par simulation. Le rsultat est le mme puisque nous obtenons D
438
=
0, 2596 > d
438
= 0, 0516044. Nous concluons au rejet de lhypothse nulle avec un risque de
premire espce = 5%.
Le processus sous-jacent est-il un processus de Poisson non homogne
9
?
Le processus sous-jacent N(t) ne correspond pas un processus de Poisson homogne, nous
allons alors tester sil correspond mieux un processus de Poisson non homogne.
Comme nous lavons vu prcdemment, les accroissements dun processus de Poisson non
homogne ne sont plus stationnaires et donc les temps inter-arrives ne sont plus identiquement
distribus. Lintensit dun tel processus dpend alors du temps. Cela est peut tre plus raliste
dans notre cas puisque nous avions remarqu quil y avait une petite acclration du cumul des
incidents chaque t.
Les processus de Poisson non homognes sont souvent utiliss en abilit et notamment
pour les modles sur les dfaillances de systmes rparables. Un des modles les plus connus est
sans doute le Power Law Model . Le processus Power Law a une fonction dintensit donne
par :
(t) = abt
b1
; a, b > 0, t > 0
Nous allons donc ajuster nos donnes un processus de Poisson non homogne dintensit
(t) = abt
b1
. Dans un premier temps, nous devons estimer les paramtres de lintensit (t),
puis ensuite nous testerons si cet ajustement est acceptable ou non.
Estimation paramtrique de lintensit.
Pour estimer les paramtres a et b de (t), nous utilisons la mthode destimation par
maximum de vraisemblance. La log-vraisemblance du processus N(t) dintensit (t) scrit :
L(T) =
N(t)

i=1
log (T
i
)
_
t
0
(v) dv
Ainsi, dans le cas dune intensit dun processus Power Law, nous obtenons :
L(a, b) = N(t)(log a + log b) + (b 1)
N(t)

i=1
log T
i
at
b
En annulant les drives partielles, nous pouvons calculer les estimateurs a et

b :
9. Cette partie sappuie sur larticle [4].
26
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Estimateur a de a :
dL(a, b)
da
= 0
N(t)
a
t
b
= 0

N(t)
a
= t
b
a =
N(t)
t
b
Nous obtenons lestimateur suivant :
a =
N(t)
t

b
o

b est lestimateur par maximum de vraisemblance de b.
Rappelons que :
du
x
dx
= u
x
ln u
Estimateur

b de b :
dL(a, b)
db
= 0
N(t)
b
+
N(t)

i=1
log T
i
at
b
log t = 0

N(t)
b
+
N(t)

i=1
log T
i

N(t)
t
b
t
b
log t = 0

N(t)
b
= N(t) log t
N(t)

i=1
log T
i
b =
N(t)
N(t) log t

N(t)
i=1
log T
i
Nous obtenons lestimateur suivant :

b =
N(t)
N(t) log t

N(t)
i=1
log T
i
La priode dtude est de 4 ans, du 1
er
janvier 2008 au 31 dcembre 2011, donc t = 1461 jours.
N(t) = 438 puisque nous travaillons avec le processus sous-jacent. Nous pouvons ainsi calculer
les estimateurs a et

b avec le logiciel R :

b 0, 9618 et a 0, 3958
N.B. Une approche numrique est possible lorsquune solution analytique nexiste pas ou
nest pas facilement ralisable pour trouver les estimateurs par maximum de vraisemblance. La
fonction nlm de R permet de minimiser une fonction plusieurs variables. Il nous sut alors
de minimiser loppose de la log-vraisemblance.
27
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Tests dajustement un processus de Poisson non homogne.
Nous allons maintenant mettre en place deux tests dadquation un processus de Poisson
non homogne dans le cas dune paramtrisation Power Law pour tester si nos donnes sajustent
bien un tel processus : les tests modis de Kolmogorov-Smirnov et de Cramer-von Mises qui
sont dcrits dans larticle [4].
Ces tests statistiques considrent une hypothse nulle de la forme :
H
0
: T processus de Poisson non homogne
contre
H
1
: T processus de Poisson non homogne
Statistique de test modie de Kolmogorov-Smirnov.
D = max (D
+
, D

)
avec
D
+
= max
1in
(
i
n

V
i
), D

= max
1in
(

V
i

i 1
n
)
o

V
i
=
_
T
i
t
_
b
et n = N(t) = 438.
Le calcul de la statistique de test observe donne D
obs
0, 0370.
Puis comme cela est mentionn dans larticle, nous pouvons simuler la distribution de D.
Nous ralisons 100 000 chantillons de (

V
i
) o :

V
i
= U
n/

n
i=1
log U
i
(i)
i = 1, . . . , n et U
i
U[0, 1].
Nous pouvons ainsi calculer la valeur critique du test, pour = 5%, en prenant le quantile
95% de la distribution simule D
sim
.
La fonction quantile de R nous permet dobtenir D
crit
0, 0518.
Ainsi, nous avons :
D
obs
0, 0370 D
crit
0, 0518
La p-valeur vaut :
P[D
sim
D
obs
] 0, 3493
Ainsi, nous dcidons de ne pas rejeter lhypothse nulle et donc le processus sous-jacent
N(t) sajuste bien un processus de Poisson non homogne avec une fonction dintensit (t) =
abt
b1
.
28
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Voici lhistogramme qui reprsente la distribution simule D
sim
avec la valeur de la statis-
tique de test observe D
obs
et la valeur critique D
crit
:
Figure 18 Histogramme de la distribution simule de D
Statistique de test modie de Cramer-Von Mises.
W
2
=

i=1
n
_

V
i

2i 1
2n
_
2
+
1
12n
o

V
i
=
_
T
i
t
_
b
et n = N(t) = 438.
Le calcul de la statistique de test observe donne W
2
obs
0, 1591.
Puis comme pour le test de Kolmogorov-Smirnov, nous pouvons simuler la distribution de
W
2
. Nous ralisons 100 000 chantillons de (

V
i
) o :

V
i
= U
n/

n
i=1
log U
i
(i)
i = 1, . . . , n et U
i
U[0, 1].
Nous pouvons ainsi calculer la valeur critique du test, pour = 5%, en prenant le quantile
95% de la distribution simule W
2
sim
.
La fonction quantile de R nous permet dobtenir W
2
crit
0, 2232.
Ainsi, nous avons :
W
2
obs
0, 1591 W
2
crit
0, 2232
29
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
La p-valeur vaut :
P[W
2
sim
W
2
obs
] 0, 1280
Ainsi, nous dcidons de ne pas rejeter lhypothse nulle et donc le processus sous-jacent
N(t) sajuste bien un processus de Poisson non homogne avec une fonction dintensit (t) =
abt
b1
.
Voici lhistogramme qui reprsente la distribution simule W
2
sim
avec la valeur de la statis-
tique de test observe W
2
obs
et la valeur critique W
2
crit
:
Figure 19 Histogramme de la distribution simule de W
2
N.B. Un algorithme pour simuler un processus de Poisson non homogne avec une fonction
dintensit Power Law est galement donn dans larticle [4].
Pour pouvoir conclure et nous assurer que les incidents HTA/HTB peuvent tre modliss
par un processus compos, il reste tester lindpendance entre Y
n
, qui est le nombre dincidents
ayant lieu chaque date T
n
, et le processus sous-jacent N(t). Pour cela, nous pouvons utiliser
le test dindpendance du Chi-2 via la commande chisq.test de R.
Le test dindpendance du Chi-2, entre un chantillon alatoire issu de la distribution des
Y
n
et un chantillon alatoire issu de la distribution de Poisson de paramtre (t) = at
b
pour
t quelconque, ne rejette pas lhypothse nulle dindpendance.
30
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Conclusion :
Les incidents HTA/HTB du rseau de lS entre 2008 et 2011 peuvent tre modliss par
un processus de Poisson compos

N(t)
n=0
Y
n
, o N(t) est un processus de Poisson non homogne
dintensit (t) = abt
b1
, et Y
n
correspond au nombre dincidents ayant eu lieu la date T
n
.
Par convention, T
0
= 0 et Y
0
= 0.
Voici 1000 simulations du processus darrives des incidents de lS de 2008 2011 :
Figure 20 Simulations des incidents 2008 2011
Tout ce chapitre 3 a galement t fait en tenant compte uniquement des incidents souter-
rains dune part, et ariens dautre part. Ces deux analyses, que nous ne prsentons pas ici, ont
fourni les mmes conclusions aux tests que pour lanalyse ci-dessus.
31
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
4 Simulation de pannes souterraines pour chaque dpart
HTA.
Nous nous intressons maintenant aux incidents souterrains. Il y a deux sous-type dincidents
souterrains :
les incidents souterrains sur cbles papiers (cbles isolation par du papier imprgn
dhuile dilectrique).
les incidents souterrains sur cbles synthtiques (cbles isolation en polythylne).
Les incidents sur cble papier sont plus frquents que ceux sur cble synthtique, alors que
la longueur totale de cbles papiers est largement plus faible que la longueur totale de cbles
synthtiques (cf. section 4.1.2, page 33). Pour preuve, sur les quatre dernires annes, nous
avons comptabilis 221 incidents sur cble papier et 73 sur cble synthtique.
Les longueurs des cbles vont galement jouer un rle car il y a plus de chance de voir
apparatre une panne sur un dpart long que sur un dpart court.
4.1 Esprance de panne.
Le premier objectif ici est dobtenir une esprance de panne pour chaque dpart HTA
par an. Comme nous lavons expliqu en introduction, le rseau HTA est compos de plusieurs
dparts HTA (ou cellules) partir des postes sources dits postes HTB. Le rseau comporte 40
postes HTB et chacun alimente 10 dparts HTA en moyenne.
Nous allons donc dans un premier temps calculer les longueurs des cbles papiers et synth-
tiques pour chaque dpart HTA. Puis, en se basant sur les donnes observes de 2008 2011,
nous pourrons calculer un taux dincident au kilomtre pour les cbles papiers et synthtiques
pour chacun des dparts HTA. Enn, partir de ces deux taux et des longueurs de cbles de
chacune des cellules, nous pourrons calculer une esprance de panne pour chaque dpart HTA
par an.
4.1.1 Calcul des longueurs des cbles.
Les longueurs des cbles papiers et synthtiques sont disponibles dans une base de donnes
dans laquelle gure la topologie du rseau.
La gure 21, page 33, montre un exemple de la topologie du rseau concernant le dpart
n
o
15 du poste source de Reichstett. Nous distinguons clairement la structure arborescente du
dpart HTA.
Un dpart est compos de plusieurs circuits, ici le dpart n
o
15 en compte neuf. Les extrac-
tions ralises et qui ont t mises notre disposition ont t faites pour chaque circuit de
chaque dpart HTA pour chaque poste source.
Ainsi pour calculer la longueur totale de cbles papiers et synthtiques de chaque dpart, il a
fallu tre vigilant sur les doublons, cest--dire ne pas comptabiliser plusieurs fois une longueur
de cble donne qui a dj t prise en compte.
32
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Figure 21 Exemple du dpart n
o
15 du poste de Reichstett
4.1.2 Taux dincident au kilomtre.
partir des rsultats prcdents, nous pouvons calculer la longueur totale de cbles papiers
et de cbles synthtiques :
longueur totale de cbles papiers 493 kilomtres.
longueur totale de cbles synthtiques 2920 kilomtres.
Puisque de 2008 2011 il y a eu 221 incidents sur cble papier et 73 sur cble synthtique,
nous obtenons les deux taux dincident suivants sur 4 ans :
taux dincident papier 0, 448139 au kilomtre.
taux dincident synthtique 0.024995 au kilomtre.
Ce qui donne sur 1 an :
taux dincident papier : tx
papier
0, 112035 au kilomtre.
taux dincident synthtique : tx
synth
0.006249 au kilomtre.
33
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
4.1.3 Calcul des esprances de panne E
panne
pour chaque cellule.
Nous allons maintenant pouvoir calculer le nombre attendu dincidents par an pour chacun
des deux types de cbles.
Pour cela, nous multiplions les taux tx
papier
et tx
synth
par les longueurs de cbles l
papier
et
l
synth
respectives de chaque dpart et nous obtenons un nombre attendu dincidents par an
pour les deux types de cbles. Et ainsi en faisant la somme des deux, nous obtenons le rsultat
souhait :
E
panne
= tx
papier
l
papier
+tx
synth
l
synth
N.B. En faisant la somme de toutes les esprances de panne E
panne
obtenues pour chacun
des dparts HTA, nous retrouvons le nombre dincidents survenus en 1 an, cest--dire 73,5
incidents, qui nest rien dautre que la moyenne du nombre dincidents souterrains qui se sont
produits de 2008 2011.
4.2 Critre B attendu par an.
Pour calculer le critre B attendu par an, nous avons besoin de la dure des incidents pour
chaque dpart, du nombre de clients par dpart et des esprances de panne E
panne
calcules
prcdemment :
Critre B attendu =

Dpart k
_
_
Dure incident Nb de clients E
panne
Nombre total de client S
_
_
4.2.1 Dures des incidents.
Dans cette partie, nous tentons de modliser du mieux possible la dure dun incident qui
correspond la dure ncessaire la localisation du dfaut, de lisolement du tronon en dfaut
et la ralimentation des tronons sains.
Nous prsentons
10
ici plus en dtail la squence de ralimention des clients touchs par un
incident HTA compte tenu de la topologie et de la connaissance de la position des organes
de manuvres tlcommands ou non. Les clients sont tous coups en une fois lors du court-
circuit mais sont raliments en plusieurs tapes, car il faut ralimenter le rseau en gardant
hors tension le segment en dfaut en rorganisant la topologie du rseau.
Dans les cas les plus simples, la recherche et llimination dun dfaut ncessitent au mini-
mum 3 tapes. Dans le cas que nous allons prsenter, nous diviserons llimination du dfaut
en 5 tapes pour bien comprendre le principe :
0 : Le rseau fonctionne normalement avant lapparition du dfaut. Ici, nous utilisons la
couleur vert pour un poste HTA/BT aliment et rouge pour un poste HTA/BT coup.
10. La prsentation de la squence de ralimentation des clients a t entirement reprise de [5].
34
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
1 : A lapparition dun dfaut, le disjoncteur de la ligne o a lieu le dfaut, souvre. La
ligne ntant plus alimente, tous les postes relis cette ligne sont alors coups, soit 100% des
clients aliments par la ligne.
2 : Cest alors que commence le travail de localisation du dfaut. Le Bureau Central de
Conduite (BCC) a sa disposition des sectionneurs tl-conduits placs des endroits strat-
giques sur certaines lignes pour lui permettre douvrir ces lignes un endroit prcis.
3 : Le sectionneur tl-conduit ouvert, le courant pourra nouveau alimenter les postes
HTA/BT situs entre ce sectionneur et le poste HTB. A noter quil sagit dun cas prcis
et simpli pour ne pas troubler le lecteur. Nayant plus de sectionneur tl-conduit entre
le dfaut et le dernier sectionneur utilis, il faut aller sur le terrain pour ouvrir dirents
sectionneurs manuellement. A ce stade, environ 50% des clients ont dj t raliments grce
aux sectionneurs tl-conduits. La ralimentation par la tl-conduite prend quelques minutes.
4 : Le rseau HTA est reli de part et dautre un poste HTB. Aprs une ouverture
manuelle correcte dun sectionneur, les parties de lignes entre le poste HTB et le sectionneur
ouvert manuellement peuvent nouveau tre alimentes.
35
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
5 : Les exploitants (personnes ralisant les travaux sur les sites touchs) procdent ainsi
par dichotomie pour localiser le dfaut et lisoler jusqu obtenir un nombre de clients coups
minimum. Les contrles pour la dichotomie sont raliss grce aux DLD (Dispositifs Lumineux
de Dfaut) qui indiquent si le dfaut se trouve en amont ou en aval du poste examin (visible
uniquement sur place).
Les clients sont donc raliments en 3 tapes (tape 3, 4 et 5). Il sagit ici dun cas dcole
o la ralimentation des clients se droule sans problme.
Notre but est de calculer au plus proche de la ralit, la dure dun incident pour chaque
dpart HTA. Pour cela, nous procdons de la faon suivante :
Nous avons notre disposition la liste des postes HTA/BT de chacun des dparts HTA,
et galement les coordonnes en Lambert (X,Y) de ces postes.
Nous dcidons de prendre la distance entre (X
min
,Y
min
) et (X
max
,Y
max
) de manire
prendre la distance d
1
la plus large possible dans la zone dans laquelle se trouvent les
postes HTA/BT dun dpart donn :
Figure 22 Schma illustrant la formule de d
1
d
1
=
_
(X
min
X
max
)
2
+ (Y
min
Y
max
)
2
Puis, nous multiplions d
1
par

2 pour modliser le fait que les routes ne sont pas tou-
jours en ligne droite, et nous divisons le tout par 1000 an dobtenir une distance d
2
en
kilomtres :
d
2
=
d
1

2
1000
36
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Enn, pour obtenir une dure, nous supposons que les exploitants se dplacent une vi-
tesse de 30 km/h. Pour tre plus raliste, nous ajoutons 1 minute par poste parcouru pour
un dpart donn et nous supposons que les exploitants mettent environ 10 minutes pour
se rendre au premier poste HTA/BT du dpart concern par lincident. Nous obtenons
ainsi le temps t
inc
(en minutes) de dure dun incident :
t
inc
=
60 d
2
30
+nb
postes
+ 10
= 2 d
2
+nb
postes
+ 10
4.2.2 Nombre de clients par dpart.
Nous avons notre disposition le nombre de clients rattachs chaque poste HTA/BT.
Nous avons galement la liste des postes HTA/BT de chaque dpart HTA.
Ainsi, laide dun tableau crois dynamique, il nous est possible dobtenir directement le
nombre de clients pour chaque dpart HTA, not nb
clients coups
.
La somme des clients dpart par dpart donne un nombre total de clients S gal 432 038.
4.2.3 Calcul des contributions au critre B attendu.
Nous avons dsormais toutes les donnes pour calculer les contributions au critre B de
chaque dpart HTA. Pour un dpart donn, la contribution se calcule de la faon suivante :
Contribution =
_
_
t
inc
nb
clients coups
E
panne
Nombre total de client S
_
_
=
_
_
t
inc
nb
clients coups
E
panne
432 038
_
_
En additionnant les contributions de chaque dpart HTA, nous obtenons le critre B attendu
lanne qui vaut 10,17 minutes.
4.3 Simulation de pannes souterraines.
Lide maintenant est de simuler des pannes souterraines pour chaque dpart HTA et ainsi
nous pourrons calculer le critre B pour plusieurs annes dale et les comparer au critre B
que nous venons de calculer ci-dessus.
Pour cela, il faut savoir quelle loi serait convenable pour raliser ces simulations. Pour
trouver cette loi, nous nous basons sur nos donnes de 2008 2011.
Nous avions trouv prcdemment que les incidents de lS pouvaient tre modliss par
un processus compos avec un processus sous-jacent modlis par un processus de Poisson non
homogne de fonction dintensit Power Law. Mais cette modlisation correspond aux incidents
toutes causes confondues (rseau arien, poste HTA/BT, cble souterrain).
37
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Ici, nous souhaitons modliser les incidents uniquement souterrains et pris cellule par cellule.
Les temps inter-incidents sont donc plus espacs et il est trs rare quil y ait deux ou plusieurs
incidents la mme journe pour un mme dpart HTA. Cela laisse supposer que nous pouvons
tenter de modliser ces incidents par un processus de Poisson homogne cette fois-ci.
Nous allons donc tester sur nos donnes de 2008 2011, sil est possible de modliser les
incidents souterrains pris cellule par cellule par un processus de Poisson homogne. Il nous faut
alors tester si les temps inter-incidents suivent une loi exponentielle de paramtre > 0.
Comme les donnes que nous avons ne portent que sur quatre annes, il nest pas vident
davoir un chantillon assez large pour un dpart donn. Nous allons donc raliser nos tests sur
le dpart qui a subi le plus dincidents souterrains durant ces quatre dernires annes. Il sagit
du dpart n
o
14 du poste source Port du Rhin. Il sest produit 13 incidents souterrains de 2008
2011 sur ce dpart avec les temps darrives T
n
et les temps inter-arrives X
n
suivants :
T
1
T
2
T
3
T
4
T
5
T
6
T
7
T
8
T
9
T
10
T
11
T
12
T
13
164 356 578 603 626 647 741 866 874 956 1049 1057 1173
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
X
13
164 192 222 25 23 21 94 125 8 82 93 8 116
Nous testons si les X
n
sont distribues suivant une loi exponentielle avec la fonction ks.test
de R. Nous obtenons la statistique de test de Kolmogorov-Smirnov : D
13
= 0, 2124.
Nous comparons D
13
la valeur critique d
13
=
c
13

13
=
1,0354

13
= 0, 2871683. D
13
d
13
et donc
nous dcidons de ne pas rejeter lhypothse nulle.
Utilisons galement la librairie tdistrplus et ses fonctions tdist et gofstat. Nous obte-
nons :
Statistique de Kolmogorov-Smirnov : D
13
= 0, 2124
Statistique de Cramer-Von Mises : W
2
= 0, 0866
Statistique dAnderson-Darling : A
2
= 0, 4697
La dcision du test de Kolmogorov-Smirnov nest pas calcule. Dans laide de la fonction gofstat,
il est dit que le rsultat du test de Kolmogorov-Smirnov nest donn seulement si le jeu de
donnes est suprieur 30 observations, or ce nest pas le cas de notre chantillon. Ce test
nest donc pas recommand pour notre chantillon mme si nous pouvons comparer D
13
d
13
comme nous lavons fait prcdemment.
Les deux autres tests donnent leur dcision pour des jeux de donnes suprieurs cinq
observations. Notre jeu de donnes est compos de 13 observations donc les dcisions des tests
sont donnes et ils ne rejettent pas lhypothse nulle.
Nous pouvons ainsi conclure que les temps inter-incidents souterrains pour le dpart n
o
14
du poste source du Port du Rhin peuvent tre modliser par un processus de Poisson homogne
dintensit > 0.
38
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Il nest pas possible de tester sur tous les autres dpart HTA des autres postes sources car
nous naurions chaque fois que des chantillons avec un nombre dobservations trs faible,
mais dans la suite nous supposerons que nous pouvons modliser les incidents souterrains pour
chaque cellule par un processus de Poisson homogne.
Simulations des pannes.
Si pour un dpart donn, les pannes peuvent se modliser par un processus de Poisson
homogne > 0, nous pouvons simuler les temps inter-incidents par la loi exponentielle de
paramtre daprs la proposition 1, page 19.
Nous allons donc simuler des temps inter-incidents grce la loi exponentielle pour chacun
des dparts HTA. Le paramtre de la loi exponentielle sera pour chaque dpart lesprance
E
panne
que nous avons calcul plus haut. Puis, nous cumulons les temps inter-incidents simuls
pour chaque dpart HTA pour obtenir les dates darrives des incidents souterrains de chaque
dpart. Le programme R de ces simulations est donne en annexe 6, page 50.
Ensuite, nous dcidons dobserver ce quil se passe sur 100 annes. Nous comptabilisons ainsi
le nombre dincidents qui se trouvent dans lintervalle [0 ;365], ]365 ;730], . . ., ]36 135 ;36 500]
pour chaque cellule de chaque poste source.
Nous obtenons donc un grand tableau avec beaucoup de 0, de 1 et de 2, qui correspondent
au nombre dincidents qui ont eu lieu telle ou telle anne pour un dpart donn. Il y a galement
quelques 3 et 4 qui se trouvent dans le tableau. Cela arrive trs rarement et sexplique par le
fait que certains dparts HTA sont trs long et donc nous ne pouvons pas exclure que sur un
mme dpart, il arrive parfois trois ou quatre incidents dans la mme anne.
Une fois ce travail eectu, nous avons toutes les donnes disposition pour calculer le
critre B pour 100 ans dale par la formule que nous rappelons :
Critre B =

Incidents i de lanne
_
_
Dure de lincident i * Nb de clients coups dans lincident i
Nombre total de client S
_
_
Nous pouvons alors maintenant comparer le moyenne des critres B obtenus avec le critre B
que nous avons calcul avec les esprance de panne :
Critre B attendu par an = 10,17 minutes.
Moyenne des critres B sur 100 annes de simulations de pannes = 9,56 minutes.
Les deux rsultats sont trs proches.
4.4 Quelques reprsentations graphiques.
La gure 23, page 40, est trs intressante car elle nous permet de remarquer que les quatre
dernires annes ont t atypiques au niveau du critre B, et cela est plus particulirement
vrai pour lanne 2010 et 2011 avec un critre B de 3 minutes. Nous observons galement la
dispersion quil peut y avoir dune anne lautre, le critre B pouvant tre de 6 14 minutes
suivant les annes.
39
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
La gure 24 nous montre aussi une grande dispersion au niveau du nombre dincidents.
Dune anne lautre nous pouvons avoir de 50 100 incidents. 2008 et 2009 ont t des annes
avec un nombre dincidents plutt lev au contraire de 2010 et 2011 qui sont en dessous de la
moyenne sur les 100 annes de simulations.
Figure 23 Botes moustaches du critre
B sur 100 ans
Figure 24 Botes moustaches du nombre
dincidents sur 100 ans
Nous pouvons galement observer les distributions associes au critre B et au nombre
dincidents :
Figure 25 Distribution du critre B sur 100
ans
Figure 26 Distribution du nombre dinci-
dents sur 100 ans
Nous observons la gure 25 quun quart des critres B se situent entre 9 et 10 minutes, et
quasiment la moiti entre 8 et 10 minutes.
Concernant le nombre dincidents, la gure 26 montre que plus dun quart des nombres
dincidents sont entre 70 et 75 incidents, et prs de 60% des nombres dincidents sont entre 60
et 75 incidents.
40
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Nombre de clients en fonction de la dure de coupure.
Nous pouvons acher une fonction de lissage loess base sur une rgression non para-
mtrique grce la fonction scatterplot de R.
Nous avons reprsent ici la 5
e
anne des simulations, mais nous pourrions le faire pour les
100 annes. Lallure de la courbe est souvent la mme pour toute les annes mais il pourrait
tre intressant de voir la dispersion du nombre de clients pour les direntes classes de dures
sur les 100 ans. Cest ce que nous achons la page suivante.
41
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
42
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Nous pouvons acher galement le nombre de clients en fonction du nombre de coupures :
Lallure des graphes est toujours le mme suivant les annes : environ 350 000 clients qui
nont aucune coupure lanne, entre 50 000 et 100 000 clients qui ont une coupure lanne
et entre 5 000 et 15 000 clients qui ont deux coupures la mme anne.
Comme nous lavons dj dit prcdemment, il est rare que des clients subissent trois
quatre pannes dans la mme anne, mais cela peut arriver parfois. Cela arrive sur des dparts
HTA avec une grande longueur de cbles et concerne gnralement moins de 10 000 clients.
43
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Conclusion Perspectives.
Ce stage en entreprise au sein du Groupe lectricit de Strasbourg a t trs intressant.
Ce stage ma permis de dcouvrir le monde de lentreprise et le mode de fonctionnement dun
grand groupe comme celui dlectricit de Strasbourg.
Ce stage ma permis galement dapprofondir mes comptences au niveau du logiciel R
et du tableur Excel. Il ma permis de faire de nombreuses recherches sur dirents points
mathmatiques et statistiques et ainsi approfondir mes connaissances, notamment au sujet des
processus de Poisson.
Je me suis galement rendu compte des dicults auxquelles un statisticien peut tre
confrontes, et notamment le recueil des donnes et la mise en quation dun problme rel.
Ce stage a t un grand enrichissement personnel que ce soit au niveau humain ou au niveau
des comptences dveloppes et je remercie encore une fois toutes les personnes qui par leurs
accueils, leurs aides et leurs conseils ont particip au bon droulement de mon stage.
Au niveau des perspectives, les rsultats du chapitre 4 sont trs intressants car ils per-
mettent de situer le critre B dune anne dans la distribution obtenue par les simulations et
ainsi de vrier si une drive technique lie un vieillissement acclr des cbles papiers
devait survenir.
Ces rsultats portent sur les incidents souterrains, il serait peut tre intressant galement
de porter cette analyse au cas des incidents ariens.
44
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Annexes.
1 Interface de lapplication Incidents.
45
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
2 Fiche dincident rseau HTA.
46
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
47
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
3 Statistiques descriptives Rsultats de la console R.
> summary(statdescript)
Type Secteur Classe.commune Poste.source Postes.coups
HTA:548 GEC:309 1. < 1000 :144 PORT DU RHIN: 48 Min. : 0.00
HTB: 61 GEN:175 2. [1000;3000[ :138 MEINAU : 32 1st Qu.: 9.00
GES:125 3. [3000;21000[:147 BRUMATH : 28 Median : 18.00
4. > 21000 :180 GRAFFENST : 28 Mean : 27.97
OBERNAI : 26 3rd Qu.: 29.00
HOLZMATT : 25 Max. :319.00
(Other) :422
Clients.coups Critre.B
Min. : 0 Min. : 0.000
1st Qu.: 691 1st Qu.: 0.390
Median : 1365 Median : 2.070
Mean : 1952 Mean : 2.837
3rd Qu.: 2145 3rd Qu.: 3.980
Max. :22164 Max. :28.710
Dfaut Cause
Souterrain :296 Vtust :164
Arien :117 Cause inconnue : 99
Poste : 87 Dfaillance matriel: 68
Sans dgats : 46 Terrassement : 61
Rseau HTA : 22 Non renseigne : 52
Rseau AMONT dfinitif (reprise manuelle): 20 Coup de foudre : 43
(Other) : 21 (Other) :122
Cause.2 Puissance.coupe
Cause inconnue : 99 Min. : 0
Distributeur :259 1st Qu.: 3360
Elments Naturels:115 Median : 7100
Non renseigne : 52 Mean : 10155
Tiers : 84 3rd Qu.: 11100
Max. :107525
48
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
4 Seuil critique c
n
=

n d
n
du test de Kolmogorov-
Smirnov pour une distribution exponentielle de moyenne
inconnue.
n c
n
n c
n
2 0,8673 22 1,0511
3 0,9540 24 1,0531
4 0,9687 26 1,0549
5 0,9884 28 1,0565
6 1,0007 30 1,0580
7 1,0084 35 1,0609
8 1,0153 40 1,0633
9 1,0212 45 1,0652
10 1,0258 50 1,0668
12 1,0327 60 1,0694
14 1,0381 70 1,0714
16 1,0424 80 1,0729
18 1,0458 90 1,0742
20 1,0486 100 1,0753
5 Programme R utilis pour obtenir la gure 17, page 25.
> bootstrap <- function(i, I) {
+ taille <- 1:i
+ quant <- 1:i
+ par <- runif(1, 0.1, 10)
+ M_sim <- NULL
+ for (n in 1:i) {
+ N_res <- NULL
+ x_sim <- 1:I
+ x_sim <- rexp(I, par)
+ M_sim <- rbind(M_sim, x_sim)
+ for (j in 1:I) {
+ stat <- sqrt(n) * ks.test(M_sim[, j], "pexp", 1/mean(M_sim[,
+ j]))$statistic
+ N_res <- c(N_res, stat)
+ }
+ quant[n] <- quantile(N_res, 0.95)
+ }
+ plot(taille, quant, xlab = "n", ylab = "n^(1/2)*d_n", type = "l")
+ }
> bootstrap(200, 10000)
49
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
6 Programme R utilis pour obtenir les simulations des
pannes souterraines.
> lambda <- read.csv("lambda.csv", sep = ";", dec = ",", header = TRUE)
> delta_t <- matrix(rep(NA, 25000), ncol = 40)
> delta_j <- matrix(rep(NA, 25000), ncol = 40)
> d_j <- matrix(rep(NA, 25000), ncol = 40)
> for (i in 1:625) {
+ delta_t[i, ] <- rexp(40, lambda[i, ])
+ delta_j[i, ] <- delta_t[i, ] * 365
+ d_j[i, ] <- cumsum(delta_j[i, ])
+ }
7 Analyse Factorielle de Donnes Mixtes.
Lorsque nous souhaitons raliser une analyse factorielle sur des donnes qualitatives, nous
utilisons lAnalyse des Correspondances Multiples (ACM). Pour une analyse factorielle sur des
donnes quantitatives, nous avons notre disposition lAnalyse en Composantes Principales
(ACP). Mais ici nous avons la fois des variables qualitatives et quantitatives. Nous devons
donc utiliser une mthodologie factorielle qui permet dinclure les deux types de variables en
tant qulments actifs : lAnalyse Factorielle de Donnes Mixtes (AFDM).
LAFDM est un problme frquent. partir danciens travaux dEscoer (1979) et Saporta
(1990), proposant dinclure des donnes mixtes dans le cadre de lACM (pour Escoer) et
dans le cadre de lACP (pour Saporta), Jrme PAGS a propos une mthode qui prend en
compte les variables quantitatives comme une ACP norme et les variables qualitatives comme
une ACM. Elle fournit une reprsentation simultane des deux types de variables en plus des
reprsentations usuelles de lACP et de lACM. Pour plus de dtails, nous nous reporterons
larticle [6].
LAFDM est implmente dans le package Factominer du logiciel R et cest ce que nous
utilisons dans la suite.
Les variables sur lesquelles nous ralisons lAFDM sont les mmes que celles de la section 2.1,
page 12. Nous prsentons ici lAFDM ralise avec comme seules variables actives : le nombre
de postes coups, le nombre de clients coups, le critre B, la puissance coupe (4 variables
quantitatives) et le nombre de clients de la commune coupe (variable qualitative nomme
Classe.commune ).
LAFDM avec les 10 variables regroupes nest pas intressante car elle nexplique que 12%
de linertie totale et nest pas visuellement interprtable car il y a beaucoup de modalits pour
chaque variable.
50
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Valeurs propres.
Les valeurs propres, pourcentages de variance explique et cumul des pourcentages de va-
riance explique sont donns ci-dessous :
Nous constatons que le plan factoriel (1,2) explique quasiment 60% de linertie totale.
Nous pouvons reprsenter par un histogramme la dcroissance de linertie explique et ga-
lement le cumul de linertie explique.
Nous pouvons slectionner un nombre daxes garder suivant le critre de Kaiser ou le
critre du coude :
Critre de Kaiser : retenir les axes dont linertie est suprieure linertie moyenne.
Valeur propre moyenne=
7
8
= 0, 875. Nous retenons donc 5 axes daprs les valeurs propres
de la page prcdente.
Critre du coude : dceler un changement de pente sur le diagramme en btons de la
dcroissance de linertie des axes. Nous slectionnons les axes avant le coude : 5 axes.
Nanmoins, nous ne donnerons les reprsentations graphiques uniquement pour les axes 1 et 2
pour ne pas surcharger lanalyse.
Rsum.
Nous donnons dans lordre suivant, Lg, RV, coordonnes, contributions, qualits de repr-
sentation et corrlations de lanalyse.
51
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Lg : Les coecients Lg de liaison permettent de mesurer quel point les variables sont
lies deux deux.
RV : Les coecients RV de liaison correspondent une normalisation des coecients
Lg. La valeur des RV est donc comprise entre 0 et 1, ce qui en facilite linterprtation.
Nous pouvons observer ici que les variables les plus lies sont les postes coups, les clients
coups et la puissance coupe.
Coordonnes : Les coordonnes des variables sur un axe sont des mesures de liaison entre
laxe et les variables. Ces coordonnes sont utilises pour crer le graphe des variables.
Contributions : Dcrit limportance que prend une variable dans la construction dun axe.
Qualits de reprsentation : La qualit de reprsentation est mesur par le cos
2
. Cest
une mesure de proximit entre un point et le plan (mesure de langle form avec le plan).
52
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Corrlations : Pour les variables quantitatives, cela correspond aux corrlations avec un
axe. Concernant les variables qualitatives, il sagit du rapport de corrlation qui est une
mesure de liaison entre un axe et une variable. Si le rapport de corrlation est lev, cela
veut dire que les modalits de la variable forment autant de sous-population homognes
et bien spares le long de laxe. Cest le cas, ici, nous nous attendons ce que la variable
Classe.commune ait des modalits bien spares le long de laxe 2.
Reprsentations graphiques.
Nous pouvons voir sur le graphe des variables que le premier axe factoriel est fortement li
aux variables Postes.coups , Clients.coups et Puissance.coupe . Quant au second
axe factoriel, il est trs li la variable Classe.commune .
53
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Le graphe des variables quantitatives nous conrme que les trois variables Postes.coups ,
Clients.coups et Puissance.coupe sont lies entre elles et nous informe sur le fait que
la variable Critre.B nest pas bien reprsente car elle nest pas proximit du bord du
cercle des corrlations.
Sur le graphe des individus, les incidents survenus dans les communes de plus de 3 000
clients sont dans la partie ngative du second axe, alors que les incidents dans les plus petites
communes sont dans la partie positive du second axe.
De plus, nous observons que la variable Classe.commune a des modalits qui forment bien des
sous-populations homognes puisquelles sont bien spares le long du deuxime axe factoriel.
54
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2
Patrick GARCIA M2-SA, 2011/2012
Rfrences.
[1] Analyses statistiques des vnements de coupures sur les rseaux lectriques , Adrien
BARRET.
Rapport de stage, ENSAI Rennes, 2011.
[2] Processus de Poisson , Christel RUWET.
Mmoire, Universit de Lige, 2007.
[3] Kolmogorov-Smirnov tests when parameters are estimated with applications to tests of
exponentiality and tests on spacing , J. DURBIN.
Biometrika, Vol 62, No. 1 (Apr., 1975), pp. 5-22.
[4] Monte Carlo Exact Goodness-of-t Tests for Nonhomogeneous Poisson Processes , BO
H. LINDQVIST et BJARTE RANNESTAD.
Norwegian University of Science and Technology, Department of Mathematical Sciences.
[5] Mthode de dtermination du nombre de clients dlectricit de Strasbourg mal aliments
en tension. , Mlanie CHOULET.
Rapport de Stage, Universit de Strasbourg, 2009.
[6] Analyse Factorielle de Donnes Mixtes. , J. PAGS.
Revue de statistique applique, tome 52, n
o
4 (2004), p. 93-111.
55
d
u
m
a
s
-
0
0
7
2
8
9
5
6
,

v
e
r
s
i
o
n

1

-

7

S
e
p

2
0
1
2

S-ar putea să vă placă și