Sunteți pe pagina 1din 146

N DU : 1958 / N EDSPIC : 450

UNIVERSITE BLAISE PASCAL CLERMONT II



ECOLE DOCTORALE
SCIENCES POUR LINGENIEUR DE CLERMONT-FERRAND

THESE

Prsente par

Wiem MOUELHI-CHIBANI


pour obtenir le grade de

DOCTEUR DUNIVERSITE
Spcialit : INFORMATIQUE



Apprentissage autonome de rseaux de neurones pour le pilotage en
temps rel des systmes de production bas sur loptimisation via
simulation


Soutenue publiquement le 12 octobre 2009 devant le jury :

M. Alain QUILLOT Prsident
M. Pierre CASTAGNA Rapporteur
M. Georges HABCHI Rapporteur
Mme. Anne-Lise HUYET Examinateur
M. Henri PIERREVAL Directeur de thse
- 2 -
Remerciements


Une thse nest pas une fin en soi, mais cest un moment particulier dans la vie dun chercheur :
il y aura eu un avant qui ne sera plus, et il y aura un aprs construire. Aussi, au moment de
franchir cette limite, je ne peux pas ne pas penser tous ceux qui, de prs ou de loin, auront
contribu ce grand effort car, si lpreuve est individuelle, ses implications sont sociales,
acadmiques, familiales, et humaines tout simplement.

Je tiens tout d'abord remercier M. Henri PIERREVAL, qui m'a accept dans son quipe, a
consacr beaucoup de son temps mon travail, et a fait de nombreuses remarques, toujours
intressantes, sur cette thse, je le remercie pour sa patience, son soutien et ses conseils qui ont
contribu rendre ce travail trs enrichissant sur le plan des connaissances et sur le plan
personnel. Je lui exprime ici toute ma gratitude et toute ma sympathie. M. Henri PIERREVAL a
toujours su diriger mes recherches dans la bonne direction; je dois beaucoup lui pour ses
nombreuses contributions la russite de cette thse.

Je remercie M. Alain QUILLOT, directeur du LIMOS de mavoir accueillie dans son laboratoire
et davoir accept de prsider le jury de thse.

Je suis extrmement reconnaissante Monsieur Pierre CASTAGNA, Professeur luniversit de
Nantes et Monsieur Georges HABCHI, professeur lUniversit de Savoie davoir accept la
charge dvaluer ce travail en qualit de rapporteurs, et davoir relev les insuffisances et erreurs
du manuscrit.

Mes remerciements tout le personnel de lInstitut Franais de Mcanique Avance (IFMA) et le
personnel du Laboratoire dInformatique de Modlisation et Optimisation des systmes (LIMOS)
pour leur aide et soutien.

Je tiens aussi remercier en particulier Madame Anne-Lise Hyuet qui ma beaucoup aider et ma
beaucoup soutenu et qui a accept dtre lexaminateur de ma thse.

Jai gard une petite place part pour tout que je considre mes amis et qui ont t toujours l
pour me soutenir : Feiza, Saber, Sabeur, Mahmoud et Batrice Bourdieu des formidables
personnes qui mont paules pendant les quatre annes prcdentes.
- 3 -

Bien videmment jadresse un grand merci toute ma famille qui a toujours t prsente lorsque
jen ai eu besoin, en particulier ma mre, mon pre, mon frre et ma grand-mre. Merci tout
simplement davoir t l et de me donner jour aprs jour autant damour.

Enfin, mais non des moindres, tous mes remerciements mon mari bien aim, sans lequel cette
thse n'aurait jamais vu le jour. Je tiens le remercier pour tout ce quil mapporte au quotidien
dattention, de soutien et damour.

Je noublierai sans doute pas mon cousin Driss qui ma donn le tout premier coup de pousse
pour commencer mon grand parcours de chercheur ; lme de son ain ador Blir.












- 4 -
SOMMAIRE
INTRODUCTION GENERALE 12
Chapitre I CONTEXTE PROBLEMATIQUE .15
1. Introduction ..15
2. Le pilotage des systmes de production .....16
2.1. Pilotage centralis..17
2.2. Pilotage hirarchis18
2.3. Pilotage coordonn.18
2.4. Pilotage distribu...19
2.5. Pilotage distribu supervis .19
2.6. Pilotage holonique..................................................................19
2.7. Pilotage par le produit...20
3. Prise de dcision au niveau oprationnel (physique)21
3.1. Prise de dcision en temps rel.21
3.2. Les types de dcisions prises en temps rel .22
3.2.1. Les dcisions daffectation..22
3.2.2. Les dcisions dattribution.23
3.2.3. Les dcisions de remise en cause25
- 5 -
3.2.4. Les dcisions danticipation...26
3.2.5. Les dcisions de dclenchement des activits de maintenance ou
dentretien27
3.2.6. Dcisions de rgulation et dajustement28
3.2.7. Combinaison de diffrents types de dcisions..28
3.3. Les critres de prise de dcision...29
4. Conclusion.31

Chapitre II : LAPPRENTISSAGE AUTOMATIQUE PAR SIMULATION
DANS LES SYSTEMES DE PRODUCTION33
1. Introduction..33
2. Lapprentissage automatique..34
2.1. Mthode dinduction .35
2.2. Les machines vecteurs supports (SVM).38
2.3. Les rseaux de neurones40
2.3.1. Les rseaux de neurones non boucls41
2.3.2. Les rseaux de neurones boucls...42
2.3.3. Lapprentissage des rseaux de neurones.43
2.4. Mthodes statistiques : Naive Bayes.44
- 6 -
2.5. Mthodes Hybrides d'Apprentissage Automatique45
2.5.1. Systmes Symbolique-Flous...46
2.5.2. Systmes Symbolique-Gntiques 46
2.5.3. Systmes Neuro-Flous 46
3. Lapprentissage bas sur la simulation pour le pilotage des systmes de
production ....47
3.1. Le rle de la simulation dans lapprentissage pour le pilotage des systmes de
production .48
3.2. Les travaux relatifs lapprentissage automatique partir de la simulation des
systmes de production .49
4. Conclusion .59

Chapitre III : APPRENTISSAGE AUTONOME DES RESEAUX DE
NEURONES BASE SUR OPTIMISATION VIA SIMULATION...60
1. Introduction .60
2. Notre formulation du problme : description et objectifs61
3. Lapproche propose66
3.1. Une approche base sur les rseaux de neurones ...66
3.1.1. Les rseaux de neurones : approximateurs universels parcimonieux ...66
- 7 -
3.1.2. La prise de dcision par le rseau de neurones ...69
3.2. Auto-apprentissage des rseaux de neurones par optimisation via
simulation...71
3.2.1. Loptimisation via simulation ...72
3.2.1.1.Le recuit simul..73
3.2.1.2.Les algorithmes volutionnistes ....74
3.2.1.3.La recherche tabou ...76
3.2.1.4.Algorithme dchantillonnage ..76
3.2.1.5.Mthode de surface de gradient.77
3.2.2. Le principe dauto apprentissage des rseaux de neurones ...77
4. Implmentation 79
4.1. Module de simulation ...81
4.1.1. Notions de base ...81
4.1.2. Lien entre les modles ARENA et les fichiers DLL 85
4.2. Module du rseau de neurones.87
4.2.1. Architecture du rseau de neurones .87
4.2.2. Fonction dactivation .89
4.2.3. Adaptation des entres/sorties du rseau de neurones aux donnes de la
simulation ...91
- 8 -
4.3. Module de loptimisation ..92
5. Conclusion .95

Chapitre IV : APPLICATIONS .96
1. Introduction .96
2. Exemple 1 : Application de lapproche dapprentissage autonome des
rseaux de neurones pour le pilotage dun atelier Flowshop ..96
2.1. Description de lexemple ...96
2.2. Exprimentations .99
2.2.1. Le module du rseau de neurones ..100
2.2.1.1.Les entres du rseau de neurones : un rseau de neurones pour les deux
files dattente..101
2.2.1.2.Les entres du rseau de neurones : un rseau de neurones pour chaque file
dattente...102
2.2.1.3.Sorties du rseau de neurones 105
2.2.1.4.Architecture du rseau de neurones ...105

2.2.2. Le module doptimisation 105
2.3. Rsultats des exprimentations ..107
2.3.1. Les meilleures combinaisons de rgles de priorit trouves par Barrett et
Barman (1986) ..108
- 9 -
2.3.2. Les rsultats obtenus par le rseau de neurones ...108
3. Exemple 2 : Application de lapproche dapprentissage autonome des
rseaux de neurones pour le pilotage dun atelier Jobshop ...115
3.1. Description de lexemple .....115
3.2. Exprimentations 118
3.2.1. Le module de simulation...118
3.2.2. Le module du rseau de neurones ...118
3.2.3. Le module doptimisation .....120
3.3. Les rsultats des exprimentations .....121
4. Conclusion ...125
CONCLUSION GENERALE ET PERSEPECTIVES .....126
Bibliographie .....129
Annexe A ...141






- 10 -
TABLE DES ILLUSTRATIONS
Figure 1. Dcomposition systmique : (a) systme entreprise, (b) systme de production. (Le
Moigne, 1990)................................................................................................................................ 16
Figure 2. Le produit actif comme le lien entre les diverses approches de pilotage (Morel et al.,
2007) .............................................................................................................................................. 20
Figure 3. Dcision daffectation mono-ressource........................................................................ 23
Figure 4. Dcision daffectation multi-ressources ....................................................................... 23
Figure 5. Dcision dattribution simple ........................................................................................ 24
Figure 6. Dcision dattribution multiple...................................................................................... 24
Figure 7. Ractions aux perturbations........................................................................................... 25
Figure 8. Remise en cause suite des drives .............................................................................. 26
Figure 9. Dclenchement dactions de maintenance ou entretien................................................. 27
Figure 10. Combinaison affectation/ attribution........................................................................... 28
Figure 11. Exemple d'Arbre de Dcision Simple [F. Santos Osrio, 1998] ................................. 37
Figure 12. La transformation non linaire des donnes peut permettre une sparation linaire des
exemples dans un nouvel espace. Adapt de [A. Cornujols et al. 2002]. .................................... 39
Figure 13. Lhyperplan sparateur optimal est celui qui maximise la marge dans lespace de
redescription................................................................................................................................... 39
Figure 14. Un neurone formel....................................................................................................... 40
Figure 15. Un modle de rseau de neurones ............................................................................... 41
Figure 16. Forme canonique d'un rseau de neurones boucl ...................................................... 43
Figure 17. Principe dun modle de simulation............................................................................ 49
Figure 18. Dveloppement dun mtamodle partir dun rseau de neurones........................... 51
Figure 19. Intgration du rseau de neurones dans le modle de simulation pour laide la
dcision. ......................................................................................................................................... 53
Figure 20. Choix des rgles de priorit statiquement.................................................................... 54
Figure 21. Choix des rgles de priorit priodiquement............................................................... 55
Figure 22. Choix des rgles de priorit dynamiquement .............................................................. 55
Figure 23. La prise de dcision par le rseau de neurones dans un systme de production ......... 69
Figure 24. Optimisation de la logique de prise de dcision via simulation .................................. 77
Figure 25. La mthode globale de lapprentissage autonome des rseaux de neurones par
optimisation via simulation............................................................................................................ 78
Figure 26. Interaction entre les trois modules (la premire phase de lapproche propose)......... 79
Figure 27. Interaction entre les deux modules (la deuxime phase de lapproche propose)....... 79
Figure 28. Architecture du rseau de neurone utilis dans notre approche. ................................. 87
Figure 29. Le Principe du calcul du rseau de neurones............................................................... 88
Figure 30. Courbe de la tangentielle : y = tanh(x) ........................................................................ 90
Figure 31. Flux de donnes entre les fichiers externes et les modules : Optimisation, Rseau de
neurones et Simulation................................................................................................................... 94
Figure 32. Latelier flowshop. (Barett et Barman, 1986).............................................................. 96
Figure 33. Un paysage d'nergie bas sur le recuit simul. ........................................................ 111
Figure 34. Reprsentation de latelier cheminements multiples tudi et des diffrents flux . 116
Figure 35. Le rseau de neurones utilis pour le choix des rgles de priorit ............................ 119
Figure 36. Evolution du retard moyen ........................................................................................ 121

- 11 -
LISTE DES TABLEAUX
Tableau 1. Ensemble d'Apprentissage : Conditions Mtorologiques ......................................... 37
Tableau 2. Variables dtat dun systme de production (Shiue et Guh, 2006) ..... Erreur ! Signet
non dfini.
Tableau 3. Tableau rcapitulatif des diffrents types de fonctions dactivation les plus utilises89
Tableau 4. Variables dentre du rseau de neurones communiques par la simulation
(proposition dun rseau de neurones pour les deux files dattente) ........................................... 100
Tableau 5. Variables dentres du premier rseau de neurones de la premire file dattente
communiques par la simulation. ................................................................................................ 102
Tableau 6. Variables dentres du deuxime rseau de neurones de la deuxime file dattente
communiques par la simulation. ................................................................................................ 103
Tableau 7. Les rgles de priorits ............................................................................................... 104
Tableau 8. Les paramtres du recuit simul initialiser par lutilisateur ................................... 106
Tableau 9. Retards moyens obtenus partir des meilleures combinaisons de rgles de priorit
proposes par Barrett et Barmann................................................................................................ 107
Tableau 10. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 3. ............................................... 108
Tableau 11. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 5. ............................................... 109
Tableau 12. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 7. ............................................... 110
Tableau 13. Le rsultat de lexprimentation de lapprentissage du rseau de neurones avec
nombre de neurones dans la couche cache est 12. ..................................................................... 110
Tableau 14. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 3. ............................................... 114
Tableau 15. Squences des pices en fonction de leur type ....................................................... 115
Tableau 16. Paramtres des lois des dures opratoires ............................................................. 115
Tableau 17. Les rsultats des six rgles de priorit sur les quatre machines de latelier jobshop
...................................................................................................................................................... 120
Tableau 18. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones ....................................................................................................................................... 123
Tableau 19. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones ....................................................................................................................................... 124





- 12 -
INTRODUCTION GENERALE


Pour rester comptitives sur des marchs de plus en plus incertains, les entreprises ont besoin
dtre ractives. Elles doivent souvent faire face des vnements imprvus, comme par exemple
la prise en compte dune commande urgente, une annulation ou une modification de commande,
les interruptions alatoires du systme de production, etc. Ceci ncessite un pilotage efficace de
la production en temps rel, afin de pouvoir ragir face aux vnements critiques. En effet, le
pilotage des systmes de production est devenu un sujet qui a de plus en plus dimportance dans
la mesure o ils ncessitent une prise de dcisions plus complexes dune part, et une poursuite de
plus en plus fine dobjectifs associs des niveaux de performance levs dautre part.
De ce fait, les systmes de production ont de plus en plus besoin dtre pilots en temps rel afin
dtre plus ractifs: ils ragissent continment aux stimulis de leur environnement. Ils doivent, en
plus, ragir dans un dlai donn, en remplissant les contraintes imposes par lenvironnement
externe et les contraintes internes (ressources limites, dlais courts, commandes urgentes,)
quelle que soit la charge de latelier.
Cependant, la difficult rside dans la prise de dcisions adquates en temps rel dans le but
doptimiser globalement tout un systme, c'est--dire, optimiser une performance donne en
tenant compte de toutes les dcisions prises au temps rel de telles sortes que ces dernires soient
cohrentes avec les dcisions passes et les dcisions futures. Par exemple, le problme de savoir
quand ajouter, retirer des ressources en temps rel se pose souvent dans la pratique. De mme
laffectation des ressources doit se faire en temps rel (chariot auto-moteur, navette,).
Cependant, les dcisions ncessaires qui doivent tre prises chaque fois celles-ci sont requises
pendant le processus du pilotage du systme en temps rel, dpendent de plusieurs critres.
Dabord, il est ncessaire de prendre en compte les caractristiques de latelier, tels que le
nombre de machines, le nombre doprateurs sur chaque machine, les temps de livraison des
pices, le taux de chargement de latelier, etc. Dautre part, il est essentiel de caractriser ltat
courant de latelier qui change et volue constamment dans le temps, il est donc primordial de
dterminer les variables qui refltent au mieux ltat de latelier et sa dynamique.
- 13 -
Plusieurs travaux sont prsents dans la littrature pour aider au pilotage en temps rel; il existe
les mthodes qui sont bases sur les heuristiques, les mthodes bases sur les modles
dynamiques, les mthodes bases sur lintelligence artificielle
Parmi toutes ses mthodes utilises dans la littrature pour le pilotage en temps rel et laide la
dcision, nous nous intressons en particulier aux mthodes bases sur lintelligence artificielle
couples aves la simulation. Notre objectif est de montrer lintrt dutiliser la simulation pour
crer de la connaissance indispensable lapprentissage automatique des mthodes bases sur
lintelligence artificielle.
Lintelligence est gnralement issue de connaissances et elle est ventuellement capable de
prendre en compte de limprcision, telles que les approches floues ou les approches possibilistes.
La difficult connue de ces approches rside dans llicitation des connaissances dont doivent
tre dote ces systmes. En effet, la recherche de connaissances pertinentes pour piloter
efficacement constitue un cueil majeur pour la mise en uvre du pilotage intelligent dateliers.
Mais Comment obtenir les connaissances ncessaires au pilotage ?
Ces connaissances doivent notamment tre capables de dterminer comment affecter au mieux
les moyens de production (machines, transport, oprateurs, outils, etc.) de sorte satisfaire aux
objectifs de production (e. g. minimiser les en-cours). Dans la mesure o le pilotage seffectue
sur la base dun tat du systme changeant dynamiquement au cours du temps, il est trs difficile
de disposer dexemples des meilleures pratiques pour le pilotage.
Dans cette thse nous allons prsenter une tude complte qui rsout le problme du pilotage en
temps rel en se basant sur des mthodes dintelligence artificielle.
Le manuscrit de la thse est organis comme suit : dabord et dans le premier chapitre nous
prsentons les systmes de production et expliquons limportance de leur pilotage en temps rel.
Ensuite dans le deuxime chapitre nous prsentons un tat de lart des mthodes dapprentissage
automatique, et limportance des exemples dapprentissage pour lapprentissage de ces mthodes,
la fin du chapitre nous montrons lintrt que reprsente la simulation pour llicitation de la
connaissance ncessaire lapprentissage de ces mthodes pour le pilotage des systmes de
production.
- 14 -
Dans le troisime chapitre nous formulons le problme que nous visons rsoudre et prsentons
la mthode dapprentissage automatique des rseaux de neurones base sur loptimisation via
simulation pour le pilotage des systmes de production.
Enfin dans le quatrime chapitre nous montrons la capacit dapprentissage de notre approche en
lappliquant sur deux exemples datelier le premier un atelier flowshop et le second un atelier
jobshop.

























- 15 -
Chapitre I
CONTEXTE PROBLEMATIQUE

1. Introduction
Pour rester comptitives, les entreprises manufacturires sont contraintes damliorer leur
pilotage, tant au niveau stratgique, pour sadapter aux progrs de la technologie ou suivre les
volutions du march, quau niveau oprationnel, pour ragir face aux alas.
Les systmes de production peuvent tre des systmes trs complexes et difficiles grer au vue
de toutes leurs composantes fonctionnelles (fabrication, maintenance, gestion, pilotage, ).
Plusieurs approches ont t envisages dans le but de mieux comprendre leur fonctionnement et
de mieux les apprhender.
Dans ce chapitre, nous exposons les principales approches de pilotage des systmes de
production. Une tude des proprits de chaque approche nous a permis de mettre laccent sur
son utilit et son intrt, pour aboutir finalement la justification de la technique adopte dans ce
travail, et le contexte dans lequel nous nous positionnons par rapport ces approches de pilotage.
Nous mettons en vidence limportance de la prise de dcision en temps rel pour le pilotage
pour pouvoir obtenir un fonctionnement efficace et efficient du systme de production et
satisfaire les objectifs assigns. Par la suite, aprs avoir prsent le cadre de travail de cette tude,
nous abordons les diffrents types de dcisions pouvant tres prises en temps rel.
Le lecteur remarquera que ce chapitre fait rfrence de nombreuses notions de base et des
dfinitions de concepts bien connus dans la littrature. Nous attirons son attention sur le fait que
notre objectif nest pas de dtailler ces concepts dj largement dvelopps dans la littrature,
mais uniquement de donner un rapide descriptif de la bibliographie associe aux approches
par rapport auxquelles nous nous positionnons dans cette thse.


- 16 -
2. Le pilotage des systmes de production
Un systme de production est gnralement vu comme lassociation dun ensemble de ressources
en interaction entre elles pour raliser une activit de production. En effet, la production
seffectue par une succession doprations dites de transformation, de transfert, dassemblage et
de dsassemblage en exploitant les ressources disponibles (machines, moyens de transfert, )
afin de transformer les matires premires (composants entrants dans le systme) en des produits
finis sortants de ce systme.
Le modle conceptuel du systme de gestion de production exprime la dcomposition des
systmes de production en trois composantes : le sous-systme physique de production, le sous-
systme de dcision et le sous-systme dinformation (Le Moigne, 1990).

Figure 1. Dcomposition systmique : (a) systme entreprise, (b) systme de production. (Le
Moigne, 1990)
La figure 1 illustre les liaisons entre ces trois systmes et les trois types de flux associs. Pour un
fonctionnement coordonn de lentreprise, les flux physiques, dinformation et de dcision
doivent tre synchroniss en fonction du temps.
Le systme physique, il est galement appel systme oprationnel ou systme technologique ou
systme de fabrication, et a comme fonction la transformation dinputs en outputs. Ce systme
comprend des ressources (humaines et matrielles) et un ensemble doprations de
transformations requises pour raliser, partir des inputs et des ressources, le produit fini. Le
systme physique peut tre organis de diffrentes faons : en lignes flexibles, en sections
- 17 -
homognes, en chanes de transfert, en lots de production, ... . Afin que ce systme puisse
fonctionner et tre pilot de faon efficace, il est ncessaire quil soit accompagn dun systme
de dcision et dun systme dinformation.
Le systme dinformation, il assure essentiellement les fonctions de la collecte, du traitement, et
de la mmorisation des informations venues de lenvironnement du systme de production, mais
galement du systme lui-mme. Il assure aussi lchange de ces informations entre le systme de
dcision et le systme physique.
Le systme de dcision, il est galement appel systme de conduite ou systme de pilotage. Il a
pour but, partir des commandes prvisionnelles, de dfinir les paramtres de production et de
piloter, par ses dcisions, lvolution du systme physique. Il dcide en fonction du
comportement du systme physique, de ltat de lenvironnement et des objectifs qui lui ont t
assigns. Les dcisions peuvent tre humaines, assistes par ordinateur (systmes daide la
dcision, systmes experts) ou automatises. La structuration (organisation) du systme de
dcision est troitement lie aux caractristiques physiques de latelier, tels que la frquence des
commandes et le type de production raliser.
Certes, il est difficile dtablir une classification exhaustive de toutes les approches de pilotage
des systmes de production publis dans la littrature. Cependant, nous essayons de proposer
dans ce qui suit les approches de pilotage les plus connues.

2.1. Pilotage centralis
Il sagit de lapproche la plus classique et la plus ancienne. Elle se caractrise par un pilotage
localis au sein dune ressource unique qui supervise la production et gre en temps rel, les
vnements qui surviennent tout au long de la production, sur le systme compos de plusieurs
ressources.
Le pilotage est trs spcifique lenvironnement de production. Cependant, la capacit de
rgulation est rduite par la rigidit structurelle. Ainsi, la structure centralise est par essence peu
robuste et ne peut efficacement intgrer la rsistance aux perturbations (Trentesaux, 1996).
- 18 -
2.2. Pilotage hirarchis
Dans ce type dapproche, la notion de niveau dabstraction permet de modliser une usine
complte. Chaque niveau coordonne les units de pilotage du niveau infrieur, et ce jusquau
niveau le plus bas. Donc, chaque niveau a des relations de dpendance vis vis du niveau
suprieur et de dominance vis vis du niveau infrieur. Chaque dcision est labore au niveau
o un problme est dtect. Les niveaux infrieurs traitent cette dcision comme une contrainte et
transmettent en retour une information de suivi au niveau suprieur. La gestion temps rel
concerne les niveaux atelier, cellule, poste de travail et automate. Diffrentes prsentations
dtailles des nombreuses tudes ralises, sont fournies dans (Archimde 1991, Trentesaux
1996, Dindeleux 1992, Youssef 1998).
Ainsi, cette alternative base sur une dcomposition du problme global en sous-problmes, et
sur le concept dagrgation, est souvent utilise. Le principe de dcomposition permet de ramener
la rsolution du problme global la rsolution successive de sous-problmes de dimension et de
complexit acceptables. Au niveau suprieur de la structure hirarchise, linformation est
synthtise. Le problme rsoudre concerne des variables agrges reprsentant un ensemble de
variables lmentaires. La solution agrge fournie par ce niveau devient une contrainte pour le
niveau infrieur, qui porte sur des variables plus dtailles.

2.3. Pilotage coordonn
Lapproche coordonne correspond un ensemble de structures hirarchises. La diffrence est
lexistence dune coopration un mme niveau. Ces structures accroissent thoriquement la
capacit de dcision au sein de chacun de ces niveaux. Ainsi, cette coopration doit amliorer la
ractivit en proposant une dcomposition dynamique du problme au niveau o il apparat,
plutt quune dcomposition hirarchique des ordres vers les niveaux infrieurs (un exemple de
structure coordonne : le modle CODECO, Conduite DEcentralise COordonne datelier
(Kallel 1985). Cet aspect dynamique et cette coopration enrichissent la qualit de la dcision. Le
rsultat est une meilleure intgration en temps rel des perturbations.

- 19 -
2.4. Pilotage distribu
Il est fond sur une distribution complte de la dcision sur lensemble des ressources pilotant un
centre de production. Le contrle dune telle structure est beaucoup plus complexe en raison de
sa modularit, par rapport une structure hirarchique qui est plus rigide mais plus facilement
matrisable (Trentesaux, 1996).

2.5. Pilotage distribu supervis
Un pilotage distribu supervis se caractrise par un ensemble dentits cooprantes sous le
contrle dune entit superviseur dont le rle est dimposer, de conseiller ou de modifier une
dcision afin de respecter un objectif plus global. Un superviseur, qui possde une vision plus
globale du processus de production est rajout la mthode distribue.
Cette approche est un compromis entre les structures distribue et centralise. Elle permet une
gestion globale et efficace par la centralisation de contrle dune part, et une meilleure raction
aux perturbations par la distribution des capacits de dcision dautre part.
Le modle de Kouiss par exemple (Kouiss et al. 1995), est ddi au pilotage datelier et se base
sur une architecture distribue supervise dans un cadre sans ordonnancement prvisionnel. Le
modle utilise des agents (chacun des agents tant compos de trois sous-systmes : le sous-
systme de connaissances, le sous-systme dexpertise et le sous-systme de communication) et
le niveau de supervision est ddi aux rgles dallocations utilises par chaque agent.

2.6. Pilotage holonique
Lapproche holonique a t introduite par Koestler en 1989 daprs Roy (Roy 1998) pour des
organisations sociales et des systmes sauto-organisant. Cest une approche originale qui
considre un systme comme un agglomrat dunits distribues et autonomes : les holons .
Un systme holonique est une socit dholons qui cooprent pour atteindre un objectif et qui
agissent en tant quensembles dentits cooprantes. On lappelle une holarchie.
- 20 -
Cette approche marque une rupture avec les modles hirarchiques antrieurs, o les
comportements sont du type matre esclave selon une topologie arborescente et invariante des
centres de dcision, le tout renforc par le respect des ordres par le centre de dcision esclave. En
effet, le holon a une intelligence dcisionnelle (Cardin et al. 2009, Blanc et al. 2008) qui lui
permet dagir sur son propre comportement, mais qui lui permet galement dintervenir sur le
comportement du systme auquel il appartient (Pujo et Ounnar 2007).

2.7. Pilotage par le produit
Le contrle par le produit (Morel et al. 2007) est une dclinaison de cette approche distribue,
visant articuler les diverses activits de l'entreprise autour de produits actifs (McFarlane et al.
2003), capables d'informer les acteurs qui gravitent autour de lui (Figure 2). Du point de vue du
pilotage de la production, le produit pourra en particulier servir faire coexister des approches
ractives et locales de la prise de dcision (par exemple des initiatives prises par des quipes
d'oprateurs responsabiliss), avec des approches plus prdictives et globales (supportes par
exemple par des progiciels de gestion intgrs ou des systmes de planification avancs). Les
apports esprs du pilotage par le produit sont la simplification du systme d'information, centr
sur un objet unique, ainsi que la possibilit d'hybrider les approches centralises et distribues de
la prise de dcision, pour arriver des systmes la fois performants et flexibles (Thomas 2004).

Figure 2. Le produit actif comme le lien entre les diverses approches de pilotage (Morel et al.
2007)
- 21 -
Depuis quelques temps merge en France une communaut scientifique qui sintresse aux
systmes contrls par le produit (Bajic et al. 2007), plus particulirement, la matrise de
linteraction entre le procd de fabrication et le produit, en intgrant dans la boucle cyberntique
de nouvelles technologies telles que les communications sans fil (Wireless Sensors Network) et
le RFID (Radio Frequency Identification). Ces technologies doivent permettre de doter le produit
de capacits de mmorisation, de calcul et de communication : il devient alors actif au sein du
systme de production qui le traite. Il devient donc capable de capter les variations de son
environnement, de prendre des dcisions et donc dinteragir avec son environnement (ressources
constituant le procd, autres produits, oprateurs humains).
De nombreux chercheurs voient dans ces nouvelles capacits lopportunit damliorer
amplement les performances du pilotage oprationnel des systmes de production (McFarlane et
al. 2002) (Gouyon 2004) (Ptin et al. 2007). Cette voie est galement prconise par le Comit
dExperts en Productique du CNRS, dans sa dernire analyse prospective (Bourrires et al. 2007).

3. Prise de dcision au niveau oprationnel (physique)
3.1. Prise de dcision en temps rel
Dans le cadre de cette tude nous nous intressons la prise de dcision au niveau oprationnel.
En effet, au niveau de latelier, la prise de dcision signifie la dtermination des actions
appliquer court terme, voir mme en temps rel, pour pouvoir obtenir un fonctionnement
efficace et efficient du systme de production et satisfaire les objectifs assigns. Pour ce faire, le
dcideur (loprateur du pilotage) prendra un ensemble de dcisions pour conqurir au mieux
ces objectifs. En effet, il est classique de distinguer, parmi les dcisions qui doivent intervenir
lors de la vie dun atelier, celles qui peuvent tre prises hors ligne , la veille, la semaine ou le
mois prcdent, de celles qui doivent tre prises en ligne , en temps rel. Dans le premier cas il
est courant de faire appel des logiciels, de type gestion de production par exemple, ou des
mthodes doptimisation dont lobjectif est de dterminer la meilleure dcision pour optimiser un
ou plusieurs cots, en prenant en compte des contraintes. Dans le second cas, la complexit et
limprvisibilit de lvolution dynamique du systme de production ncessite souvent de prendre
des dcisions de pilotage en ligne , en temps rel qui ncessite la connaissance de ltat du
- 22 -
systme et qui permet dvaluer les consquences des dcisions que lon envisage de prendre
immdiatement (Pujo et al. 2002a, Pujo et al. 2002b), alors, nous pouvons considrer que les
mots cls en pilotage en temps rel sont : acquisition de donnes, analyse rapide et raction quasi
instantane (Habchi 2001).
Ainsi, nous ne essayons pas de construire un systme de pilotage global capable de prendre toute
dcision ncessaire au bon fonctionnement de latelier (stratgies de production,
planification,), mais, nous proposons une approche de prise de dcisions au niveau
oprationnel en temps rel qui prend en compte la dynamique de latelier.

3.2. Les types de dcisions prises en temps rel
Il existe plusieurs dcisions que nous pouvons prendre lorsquon se positionne dans le cas de
prise de dcisions en temps rel.
Daprs Berchet (Berchet 2000) il existe plusieurs types de prise de dcisions en temps rel. Elle
sest inspire des travaux de Pierreval (Pierreval 1999), qui prsente une typologie pour faciliter
lidentification de ces dcisions lors de lanalyse de latelier et faciliter leur reprsentation dans
un modle :
3.2.1. Les dcisions daffectation
Ces dcisions rsultent de la souplesse introduite au niveau du choix des ressources. Elles sont
introduites par la flexibilit physique du systme. Elles ont pour consquence de rduire
lensemble des ressources pouvant tre concernes par lexcution finale dune tche (Figure 3).
Par exemple, lorsquune pice a le choix entre plusieurs ressources diffrentes, la pice doit un
certain moment tre affecte une de ces ressources. Lorsque plusieurs chariots filo-guids sont
disponibles pour effectuer une opration de transport dune pice qui vient dtre dtermine, il
faut choisir celui appeler. Ces dcisions peuvent tre prises priori, nimporte quel moment.
Cependant, au regard de la simulation, il est important de noter que leffet de la dcision
ninterviendra que lors dvnements prdtermins, comme larrive dun nouvel ordre de
fabrication dans latelier ou la fin de lexcution dune opration.
- 23 -

Figure 3. Dcision daffectation mono-ressource
Lorsquun seul type de ressource est requis laffectation est mono-ressource (Figure 3), tandis
quelle sera multi-ressource (Figure 4) si plusieurs types sont impliqus (machines, outils,
palettes, oprateurs, etc.). Par exemple, en sous traitance mcanique, il peut tre ncessaire de
dcider quelle machine va tre utilise mais galement quel oprateur effectuera le travail.

Figure 4. Dcision daffectation multi-ressources
3.2.2. Les dcisions dattribution
Ce type de dcision survient lorsqu un instant donn, une ou plusieurs ressources ont le choix
entre diffrents travaux excuter. Il est alors ncessaire de dcider quel travail excuter dabord.
- 24 -
Cest le cas par exemple dun oprateur qui, aprs avoir achev une tche doit choisir dans son
stock amont la nouvelle pice usiner. Ces dcisions rsultent de la souplesse introduite par les
en-cours au niveau du choix de lordre de succession des travaux lis une ou plusieurs
ressources. Ces dcisions sont introduites par la flexibilit temporelle du systme. Elles
entranent la rservation de ressources par une entit partir dun moment donn. De nombreuses
rgles de priorit ont t proposes et testes dans la littrature, pour les dcisions dattribution
simples (Figure 5).

Figure 5. Dcision dattribution simple
Dans certaines situations, plusieurs travaux doivent tre slectionns simultanment (Figure 6).
Cest le cas par exemple dune ressource de manutention qui doit transporter plusieurs palettes
afin de rentabiliser son dplacement, ou dun four de traitement thermique qui doit tre rempli
au mieux avant dtre dmarr.

Figure 6. Dcision dattribution multiple
Ces dcisions peuvent tre prises diffrents instants mais elles deviendront effectives que lors
de la souvenance de lvnement de libration dune ressource.
- 25 -
3.2.3. Les dcisions de remise en cause
Un certain nombre de dcisions prises sur le fonctionnement de latelier peuvent ncessiter une
remise en cause, afin notamment dviter que les consquences sur la production de perturbations
survenues de faon imprvisibles soient trop importantes. Larrive de la perturbation
(vnement) va donc dclencher un choix entre plusieurs actions (activits) possibles (figure 7).
La dcision peut consister ne rien modifier ou au contraire reconsidrer des activits
initialement prvues (transformation de A
i
en A
k
), par exemple : faire effectuer un travail par
une autre machine ou faire passer un travail en priorit, etc.

Figure 7. Ractions aux perturbations
Larrive dune commande urgente relve galement du mme type de dcision. Certaines
remises en cause peuvent galement provenir de drives successives de latelier (Figure 8) vers
un tat non souhaitable (encombrement de machines, goulots, retards, etc.), quil convient
dessayer de corriger en reconsidrant le droulement de certaines activits. Par exemple la
formation dun goulot peut entrainer des raffectations de ressources afin de dcharger la
ressource critique. Aussi, la panne dune ressource critique peut engendrer la rvision globale de
lordonnancement prvu, voire le recours des heures supplmentaires ou de la sous-traitance et
donc modifier des dcisions prises initialement avant la fabrication.
- 26 -

Figure 8. Remise en cause suite des drives
3.2.4. Les dcisions danticipation
Elles proviennent de linitiative deffectuer certaines activits, un moment o les couts qui
rsultent (temps, matire, nergie, etc.), sont plus faibles que si elles avaient t effectues plus
tard. Par exemple, des montages ou dmontages doutils en temps masqu sont des dcisions
danticipation. Souvent, elles font rfrences un vnement spcifique tel que le dmarrage
dune opration de fabrication (pour laquelle les outils devront tre monts et rgler par
exemple). Compte tenu des alas nombreux qui rgissent la vie dun atelier, ces dcisions ne
peuvent souvent pas tre prises lavance de faon statique. Il est donc ncessaire de dcider en
temps rel le bon instant pour mettre un outil en chauffe, par exemple dans une forge, afin quil
arrive la bonne temprature lorsque lon voudra lutiliser, sachant que si on arrive trop tard une
attente sera gnre et sil arrive trop tt il refroidira. Certains ordres de rapprovisionnement (en
composants par exemple) entrent dans cette catgorie.
Ces dcisions ne sont en gnral pas dclenches par un vnement. Il sagit donc de dterminer,
lors du droulement de la simulation et des changements dtat, linstant propice.
- 27 -
3.2.5. Les dcisions de dclenchement des activits de maintenance ou dentretien
Dans un certain nombre de cas, ces dcisions ne peuvent tre planifies convenablement
lavance et sont prises en temps rel afin de conserver loutil de production dans son tat de
performance nominale (en productivit et qualit). Ces dcisions sont importantes dans la mesure
o elles sont de nature immobiliser un certain nombre de ressources. Il sagit donc de choisir
linstant o elles doivent tre effectues. Trop tt, elles peuvent perturber inutilement la
production, tandis que trop tard, elles risquent dentrainer une dgradation des installations, ou de
la qualit de la production. Le dclenchement dactions de maintenance doit aussi prendre en
compte le caractre urgent de certaines commandes. Un compromis doit en gnral tre tabli,
sur le moment o elles doivent tre mises en uvre. Par exemple, les fours lectroniques dune
fonderie doivent tre nettoys (dcrasss) priodiquement, sous peine dentrainer de forte
diminution de qualit. Ces oprations sont effectues chaque fois que cest possible lorsque des
arrts de production surviennent (ex. pannes). Nanmoins, il est souvent ncessaire dinterrompre
lactivit dun four pendant la production.
Ces dcisions peuvent entrer dans la catgorie des dcisions danticipation si elles se refltent
un vnement spcifique. Dans le cas le plus gnral, linstant de dclenchement est dtermin
par rapport ltat du systme (disponibilit de machines de substitution, ordre en retards, stocks
disponibles, etc.) (Figure 9).

Figure 9. Dclenchement dactions de maintenance ou entretien
- 28 -
3.2.6. Dcisions de rgulation et dajustement
Ces dcisions visent exercer un certain contrle sur des flux en vue de les ralentir ou les
acclrer. Elles dcoulent de la possibilit technologique de certaines machines dajuster leur
dbit, ou de la capacit de certains systmes de se rguler, ce qui autorise plus de flexibilit dans
le pilotage du flux. Par exemple, le rglage du dbit dun cubilot de fonderie doit tre ajust
rgulirement. Un dbit important permet de satisfaire sans interruption la demande en fonte
liquide, mais en contrepartie, peut conduire vider un four et entrainer une rupture
dapprovisionnement, mais induit des attentes de livraison plus longues.
Lajout ou le retrait de cartes kanban pour sadapter de nouvelles circonstances ou
laugmentation et la diminution de tailles de lots de transferts sont aussi des dcisions de
rgulation.
3.2.7. Combinaison de diffrents types de dcisions
Le pilotage dune unit de production complexe engendre des situations o des diffrents types
de dcision voqus prcdemment peuvent se combiner. Ainsi, les dcisions dattribution et
daffectation peuvent senchaner. La figure 10 montre une situation o plusieurs ressources tant
disponibles et plusieurs oprations effectuer, des dcisions daffectation et dattribution doivent
tre prises.

Figure 10. Combinaison affectation/ attribution
- 29 -
3.3. Les critres de prise de dcision
Les dcisions prises en temps rel dans un atelier ont un impact souvent trs important sur les
flux des produits. Une des caractristiques les plus importantes prendre en compte lors du
pilotage en temps rel est la dynamique du systme de dcision. Pour prendre les dcisions
ncessaires, on doit alors disposer dun maximum dinformations permettant de reflter la
situation lors de la prise de dcision dans latelier.
L'objectif est de permettre au gestionnaires de piloter un systme manufacturier discret complexe,
tant donn un ensemble d'objectifs et de contraintes, de la mme manire qu'il est possible de
piloter un systme dynamique continu, comme une centrale nuclaire ou une automobile, c'est--
dire en surveillant l'volution d'un nombre "restreint" de paramtres cls. La difficult consiste
dcouvrir ces paramtres cls et valuer leur incidence sur le systme de production de manire
pouvoir choisir les actions dterminantes, suivant les circonstances, afin que le systme volue
dans la direction dsire.
Cependant, les dcisions en temps rel dans les systmes de production dpendent de plusieurs
critres. Il est ncessaire de prendre en compte les caractristiques de latelier, tels que le nombre
de machines, le nombre doprateurs sur chaque machine, les temps de livraison des pices, le
taux de chargement de latelier, etc. Aussi, il est essentiel de caractriser ltat courant de latelier
qui change et volue constamment dans le temps, il est donc primordial de dterminer les
variables qui refltent au mieux ltat de latelier et sa dynamique.
Pierreval en 1999 (Pierreval 1999) a propos un formalisme de prise de dcisions en temps rel ;
il a propos un vecteur de 7-uplets (ID, A, C, H, R, AL, DU) pour caractriser la prise de dcision
en temps rel :
ID : Les donnes initiales utilises dans le processus de prise de dcisions : les variables dtat du
systme et les objectifs de production, etc.
A : Lensemble des alternatives possibles dans lequel un choix doit tre fait la fin de la prise de
dcision.
C : Un point ou une condition de prise de dcision. Gnralement, trois situations peuvent se
prsenter : un point de dcision auquel nous dclenchons la prise de dcision (une machine se
- 30 -
libre), un point dcision qui dpend dune priode de temps rgulire (activit de maintenance),
et enfin, un point dcision qui dpend dun ensemble de conditions remplir, pour cela le
systme doit tre scann pour pouvoir dtecter quand les conditions exiges sont satisfaites.
H : Lhorizon de la dcision : pour chaque dcision nous considrons une priode de temps de sa
validit (une machine est slectionne pour effectuer un job pour une dure de douze heures et
une autre dcision doit tre prise pour slectionner la machine la fin de cette priode de temps).
La dcision dure jusqu'au dclenchement dun vnement donn.
R : Les ressources acquises pour chaque type de dcision.
AL : La logique associe la prise de dcision, cette logique peut tre aussi simple que celle
utilise dans des rgles de priorit dans les files dattente ou bien trs complexe comme celle qui
est base sur lexpertise humaine.
DU : La dure de la prise de dcision.
Lobjectif de cette typologie est de faciliter la prise des dcisions en temps rel et de contribuer
lidentification des caractristiques du systme de production ncessaires au bon fonctionnement
du processus de pilotage.
Par ailleurs, il existe plusieurs approches dans la littrature destines aider les prises de
dcisions en temps rel de sorte ce quelles concourent de la meilleure faon aux objectifs de
lentreprise, on peut en distinguer plusieurs. Parmi les plus connues on rencontre : les approches
bases sur des heuristiques, les approches bases sur des modles dynamiques, utiliss en ligne et
les approches bases sur lintelligence artificielle. Les approches bases sur lintelligence
artificielle sont destines fournir une aide intelligente afin daider la prise de dcision ou de
prendre les dcisions de faon automatique. Cette intelligence peut tre destine rsoudre un
problme localis (systmes experts, systmes base de connaissance) (e. g., Pierreval 1992,
Monostori 2003) ou des problmes distribus (systmes multi agents) (e. g., Roy et al. 2001).
Le problme abord ici consiste donc dterminer comment nous pouvons aider prendre les
dcisions pour le pilotage des systmes de production partir de lapprentissage ?
- 31 -
Lintelligence est gnralement issue de connaissances expertes et est ventuellement capable
de prendre en compte de limprcision (approches floues, possibilistes). La difficult connue des
approches bases sur lapprentissage rside dans llicitation des connaissances dont doivent tre
dote ces systmes. En effet, la recherche de connaissances pertinentes sur lesquelles est bas
lapprentissage (Huyet 2004, Zhao et al. 2001, Metan et al. 2005, Shiue et al. 2006) pour piloter
efficacement constitue un cueil majeur pour la mise en uvre du pilotage intelligent dateliers.

4. Conclusion
Dans ce chapitre nous avons prsent une vue globale du pilotage des systmes de production et
quelques approches de pilotage prsentes dans la littrature (pilotage centralis, pilotage
hirarchis, pilotage coordonn, pilotage distribu, pilotage distribu supervis, pilotage
holonique, pilotage par le produit). Nous avons dtermin le cadre dans lequel nous nous situons :
prise de dcision au niveau oprationnel et en temps rel. Dans ce chapitre nous avons montr
aussi que le pilotage en temps rel des systmes de production ncessite une tude approfondie
des diffrents critres de prise de dcision tels que le nombre de machines, le nombre
doprateurs sur chaque machine, les temps de livraison des pices, le taux de chargement de
latelier, etc.
Plusieurs approches dans la littrature sont proposes pour aider au pilotage en temps rel des
systmes, parmi les approches les plus connues : les approches bases sur lintelligence
artificielle. Ces approches ncessitent des connaissances expertes. Ces connaissances doivent
notamment permettre de dterminer comment affecter au mieux les moyens de production
(machines, transport, oprateurs, outils, etc.) de sorte satisfaire aux objectifs de production (e. g.
minimiser les en-cours). Dans la mesure o le pilotage seffectue sur la base dun tat du systme
changeant dynamiquement au cours du temps, il est trs difficile de disposer dexemples des
meilleures pratiques pour le pilotage.
Nous proposons donc une approche dapprentissage autonome capable de gnrer sans expertise
pralable les connaissances ncessaires pour doter un systme informatique de la capacit
dcider en temps rel.
- 32 -
Pour cela, nous prsentons dans le chapitre suivant un tat de lart des travaux mens en
apprentissage par simulation et leurs limites.















- 33 -
Chapitre II

LAPPRENTISSAGE AUTOMATIQUE PAR SIMULATION DANS LES
SYSTEMES DE PRODUCTION


1. Introduction
Il existe un passage naturel des sciences de la dcision lintelligence artificielle ; la bonne
dcision ne se dcouvre pas, la bonne dcision est un construit qui s'labore en relation avec des
finalits, avec un contexte, avec des capacits d'appropriation par le milieu. De ce fait, le
dveloppement de l'aide la dcision qui prend appui sur des modes de raisonnement, des
modles, des algorithmes plus ou moins spcifiques doit laisser place une assez grande
flexibilit, une assez grande ouverture. L'aide scientifique la dcision ne permet pas de
postuler, comme on le fait couramment dans les sciences dures, qu'il existe quelque part une
vrit. C'est pourquoi la dmarche suivre n'est pas une dmarche de dcouverte mais une
dmarche de construction. De ce fait, dans ces conditions, ce qui a t fait en intelligence
artificielle et notamment dans toute la voie de lapprentissage automatique est trs positif.
Lintelligence est gnralement issue de connaissances expertes et est ventuellement capable
de prendre en compte de limprcision tel que dans les approches floues ou les approches
possibilistes. La difficult connue de ces approches rside dans llicitation des connaissances
dont doivent tre dote ces systmes. En effet, la recherche de connaissances pertinentes (Huyet
2004, Zhao et al. 2001, Metan et al. 2005, Shiue et al. 2006) pour piloter efficacement constitue
un cueil majeur pour la mise en uvre du pilotage intelligent dateliers.
Ces connaissances doivent notamment tre capables de dterminer comment affecter au mieux
les moyens de production (machines, transport, oprateurs, outils, etc.) de sorte satisfaire aux
objectifs de production (e. g. minimiser les en-cours). Dans la mesure o le pilotage seffectue
- 34 -
sur la base dun tat du systme changeant dynamiquement au cours du temps, il est trs difficile
de disposer dexemples des meilleures pratiques pour le pilotage.
Dabord, nous prsentons quelques approches dapprentissage automatique et nous montrons
limportance de llicitation des exemples dapprentissage pour lapprentissage de ses mthodes.
Ensuite, nous prsentons lintrt de la simulation pour lapprentissage pour le pilotage des
systmes de production.
Enfin nous prsentons les diffrents travaux dans le domaine de lapprentissage par simulation
des systmes de production.

2. Lapprentissage automatique
Les travaux de recherche en apprentissage, relays ensuite par ceux en fouille de donnes, ont
trouv leur essor avec lmergence des principes dintelligence artificielle dans les annes 1980
(Aler et al. 2002). Lobjectif de ces travaux est globalement dexhiber des connaissances partir
de donnes, notamment des bases dexemples ou des corpus (Sebag et al. 2002, Cornujols et al.
2002). Ces connaissances peuvent prendre des formes varies (rgles de production, rgles
floues, arbres de dcision, etc.).
Lapprentissage automatique (ou machine-learning) fait rfrence au dveloppement, lanalyse
et limplmentation de mthodes qui permettent une machine (au sens large) dvoluer grce
un processus dapprentissage, et ainsi de remplir des tches quil est difficile ou impossible de
remplir par des moyens algorithmiques plus classiques. Et daprs Cornujols et Miclet
(Cornujols et al. 2003) : La notion de lapprentissage automatique englobe toute mthode
permettant de construire un modle de la ralit partir de donnes, soit en amliorant un
modle partiel ou moins gnral, soit en crant compltement le modle. Il existe deux tendances
principales en apprentissage, celle issue de lintelligence artificielle et qualifie de symbolique
(arbre de dcision,), et celle issue des statistiques et qualifie de numrique (rseau de
neurones,).
- 35 -
Il existe plusieurs mthodes dapprentissage automatique tel que lanalyse discriminante linaire,
les machines vecteurs support (SVM), les rseaux de neurones, les mthodes dinduction, etc.
2.1. Mthode dinduction
L'apprentissage par induction reste toujours une des principales mthodes tudies dans le
domaine de l'apprentissage automatique (Santos Osrio, 1998). Dans cette approche, on cherche
acqurir des rgles gnrales qui reprsentent les connaissances obtenues partir d'exemples. Les
rgles ainsi obtenues peuvent tre reprsentes d'une faon explicite (facilement interprtables)
ou d'une faon implicite avec un codage qui n'est pas toujours facile interprter. L'algorithme
d'apprentissage par induction reoit un ensemble d'exemples d'apprentissage et doit produire des
rgles de classification, permettant de classer les nouveaux exemples. Le processus
d'apprentissage cherche crer une reprsentation plus gnrale des exemples, selon une mthode
de gnralisation de connaissances. Ce type de mthodes est aussi appel apprentissage de
concepts ou bien acquisition de concepts. Parmi les approches d'apprentissage empirique par
induction les plus connues, on trouve les rseaux de neurones artificiels et les arbres de dcision.
L'algorithme d'apprentissage par induction peut fonctionner de faon supervise ou
nonsupervise:
Apprentissage supervis (supervised learning) : les exemples d'apprentissage sont tiquets afin
d'identifier la classe laquelle ils appartiennent. Le but de l'algorithme de classification est de
rpartir correctement les nouveaux exemples dans les classes dfinies dans la phase
d'apprentissage.
Apprentissage non-supervis (unsupervised learning, clustering, discovery) : l'algorithme
d'apprentissage cherche trouver des rgularits dans une collection d'exemples, puisque dans ce
type d'apprentissage on ne connat pas la classe laquelle les exemples d'apprentissage
appartiennent. Une technique employe consiste implmenter des algorithmes pour rapprocher
les exemples les plus similaires et loigner ceux qui ont le moins de caractristiques communes.
Ces groupes d'exemples similaires sont parfois appels des prototypes.
Le premier programme dapprentissage par graphe dinduction a t ralis par Sonquist et
Morgan (Sonquist et al. 1963). Lobjectif des mthodes base de graphe dinduction est de
construire une fonction de classement reprsentable par un graphe : le graphe est construit en
partant de la racine et en allant vers les feuilles. On parle de mthode dinduction descendante et
on trouve, dans la littrature anglaise, le terme de TDIDT (Top Down Induction of Decision
Trees) afin de qualifier les mthodes base de graphe dinduction. Le principe gnral des
- 36 -
graphes dinduction sexprime ainsi: Chercher discriminer les exemples selon leur classe en
fonction dattributs considrs comme les meilleurs parmi tous les autres au sens dun critre
donn. Sur lchantillon dapprentissage, est recherch lattribut qui discrimine le mieux les
exemples. Puis sont constitus autant de sous - chantillons que lattribut possde de valeurs
(chaque sous- chantillon contient les exemples ayant la valeur associe de lattribut) et sur
chaque sous- chantillon est recherch, de nouveau, le meilleur attribut. Ce processus rcursif
est ritr jusqu ce que les exemples dun mme sous - chantillon possdent tous la mme
classe.
Dans un graphe dinduction, chaque chemin correspond une rgle exprime sous la forme si
condition alors conclusion dans laquelle condition dsigne une ou plusieurs propositions
logiques de type attribut, valeur (Zighed et Rakotomalala 2000). Lensemble des rgles
constitue ainsi le modle de prdiction.
Parmi les formalismes des graphes dinduction nous citons les arbres de dcision. Ils sont
composs d'une structure hirarchique en forme d'arbre. Cette structure est construite grce des
mthodes d'apprentissage par induction partir d'exemples. L'arbre ainsi obtenu reprsente une
fonction qui fait la classification d'exemples, en s'appuyant sur les connaissances induites partir
d'une base d'apprentissage. En raison de cela, ils sont aussi appels arbres d'induction (Induction
Decision Trees).
Traditionnellement, un arbre de dcision se construit partir d'un ensemble d'apprentissage par
raffinements de sa structure. Un ensemble de questions sur les attributs est construit afin de
partitionner l'ensemble d'apprentissage en sous-ensembles qui deviennent de plus en plus petits
jusqu' ne contenir la fin que des observations relatives une seule classe. Les rsultats des
tests forment les branches de l'arbre et chaque sous-ensemble en forme les feuilles. Le classement
d'un nouvel exemple se fait en parcourant un chemin qui part de la racine pour aboutir une
feuille : l'exemple appartient la classe qui correspond aux exemples de la feuille.
- 37 -

Figure 11. Exemple d'Arbre de Dcision Simple (Santos Osrio 1998)
La Figure 11 donne un exemple d'arbre de dcision pour le classement d'un ensemble de cas,
avec un test d'appartenance une classe (Santos Osrio 1998). Dans ce cas particulier, les cas dits
positifs sont ceux qui appartiennent la classe et les cas dits ngatifs sont ceux qui n'y
appartiennent pas.
Tableau 1. Ensemble d'Apprentissage : Conditions Mtorologiques

- 38 -
Le principe de construction des arbres est le suivant : on choisit un attribut parmi les attributs non
slectionns, et on cre un nud portant un test sur cet attribut. Pour chaque classe d'quivalence
ainsi induite, on opre le traitement suivant : si tous les exemples de cette classe d'quivalence
appartiennent la mme classe (les classes mtorologiques dcrites dans le tableau ci-dessus),
alors on cre une feuille correspondante cette classe, relie au test prcdent par un arc tiquet
par la valeur de l'attribut correspondant ; si tous les exemples de la classe d'quivalence
considre ne sont pas dans la mme classe, alors on ritre ce processus en enlevant l'attribut
prcdemment considr des attributs slectionner.

2.2. Les machines vecteurs support (SVM)
Les machines vecteurs de support ou sparateurs vaste marge (en anglais Support Vector
Machine, SVM), dveloppes originellement par Vapnik dans les annes 1980 et 1990, sont un
ensemble de techniques d'apprentissage supervis destines rsoudre des problmes de
discrimination et de rgression. Les SVM sont une gnralisation des classificateurs linaires.
Le classifieur SVM a t conu pour une sparation de deux ensembles de donnes. Il est
considr donc comme un classificateur binaire. Le but des SVM est de trouver un hyperplan qui
va sparer et maximiser la marge de sparation entre deux classes.
A lorigine conues pour les tches de classification ou reconnaissance de formes, les SVM
permettent galement de traiter les problmes de rgression non linaire.
Le principe thorique des SVM comporte deux points fondamentaux :
- La transformation non linaire () des exemples de lespace dentre vers un espace dit
de re-description de grande dimension muni dun produit scalaire (espace de Hilbert),
- 39 -

Figure 12. La transformation non linaire des donnes peut permettre une sparation linaire des
exemples dans un nouvel espace. Adapt de Cornujols et al. 2002.
- La dtermination dun hyperplan permettant une sparation linaire optimale dans cet
espace de grande dimension.

Figure 13. Lhyperplan sparateur optimal est celui qui maximise la marge dans lespace de
redescription.
Le problme de recherche de l'hyperplan sparateur possde une formulation duale. Ceci est
particulirement intressant car, sous cette formulation duale, le problme peut tre rsolu au
moyen de mthode d'optimisation quadratique.


- 40 -
2.3. Les rseaux de neurones
Les rseaux de neurones sont des assemblages fortement connects d'units de calcul, les
neurones formels. Ils ont pour origine un modle du neurone biologique et ont vocation imiter
certains mcanismes du cerveau humain. Un neurone formel est une fonction algbrique non
linaire et borne, dont la valeur dpend de paramtres appels coefficients ou poids. Les
variables de cette fonction sont habituellement appeles "entres" du neurone, et la valeur de la
fonction est appele sa "sortie".
Un neurone est donc avant tout un oprateur mathmatique, dont on peut calculer la valeur
numrique. Il est courant de reprsenter graphiquement un neurone comme indiqu sur la
Figure14.

Figure 14. Un neurone formel
Un neurone ralise une fonction non linaire borne y = f (x1, x2, ...xn ; c1, c2, ... c
p
) o les {x
i
}
sont les variables et les {c
j
} sont des paramtres (Dreyfus et al. 2004). Pour des raisons que nous
expliquerons plus loin, les neurones les plus frquemment utiliss sont ceux pour lesquels la
fonction f est une fonction non linaire (gnralement une tangente hyperbolique) d'une
combinaison linaire des entres :
y = tanh
(

=
n
i
i i
x c
1
(1)
Les {xi} sont les variables (ou entres) du neurone, les {ci} sont des paramtres ajustables. Un
neurone formel ne ralise donc rien d'autre qu'une somme pondre suivie d'une non-linarit.
- 41 -
C'est l'association de tels lments simples sous la forme de rseaux qui permet de raliser des
fonctions utiles pour des applications industrielles.
On distingue deux grands types d'architectures de rseaux de neurones : les rseaux de neurones
non boucls et les rseaux de neurones boucls.
2.3.1. Les rseaux de neurones non boucls :
Un rseau de neurones non boucl est reprsent graphiquement par un ensemble de neurones
"connects" entre eux, linformation circulant des entres vers les sorties sans "retour en arrire" ;
si lon reprsente le rseau comme un graphe dont les nuds sont les neurones et les artes les
"connexions" entre ceux-ci, le graphe dun rseau non boucl est acyclique.
La Figure 15 reprsente un rseau de neurones non boucl qui a une structure particulire, trs
frquemment utilise : il comprend des entres, une ou plusieurs couches de neurones "cachs" et
des neurones de sortie. Les neurones de la mme couche cache ne sont pas connects entre eux.
Cette structure est appele Perceptron multicouche.

Figure 15. Un modle de rseau de neurones

Les rseaux de neurones non boucls sont des systmes statiques, utiliss principalement pour
effectuer des tches de classification, ou de modlisation statique de processus ; loprateur
ralis par un rseau de neurones non boucl (relation entres-sorties) est une fonction
algbrique.

- 42 -
2.3.2. Les rseaux de neurones boucls :
Contrairement aux rseaux de neurones non boucls dont le graphe de connexions est acyclique
les rseaux boucls, dont le graphe des connexions contient des cycles (Figure 16) ; ce sont des
systmes dynamiques, utiliss comme filtres non linaires, ainsi que pour la modlisation et la
commande de processus ; loprateur ralis par un rseau boucl est un ensemble dquations
aux diffrences couples.
Un rseau de neurones boucl temps discret est rgi par une (ou plusieurs) quations aux
diffrences non linaires, rsultant de la composition des fonctions ralises par chacun des
neurones.
La forme la plus gnrale des quations rgissant un rseau de neurones boucl est appele forme
canonique ;
x (k+1) = [x(k), u(k)] (2)
Y(k) = [x(k), u(k)] (3)
O et sont des fonctions non linaires ralises par un rseau de neurones non boucl (par
exemple, mais pas obligatoirement, un Perceptron multicouche), et o k dsigne le temps
(discret).
La forme canonique est reprsente sur la Figure 16. Tout rseau de neurones, aussi compliqu
soit-il, peut tre mis sous cette forme canonique, de manire compltement automatique.
- 43 -

Figure 16. Forme canonique d'un rseau de neurones boucl
Les rseaux de neurones boucls sont utiliss pour effectuer des tches de modlisation de
systmes dynamiques, de commande de processus, ou de filtrage.
Afin que le rseau de neurones soit capable de prdire les valeurs de sorties en fonction des
valeurs dentres, il doit passer par une phase dapprentissage.

2.3.3. Lapprentissage des rseaux de neurones
L'apprentissage est en gnral un processus graduel, itratif, o les pondrations des connexions
entre les neurones du rseau de neurones : poids, sont modifis plusieurs fois selon une rgle
d'apprentissage avant d'atteindre leurs valeurs finales. Les approches d'apprentissage
connexionniste peuvent tre reparties en trois grandes classes, selon le degr de contrle donn
l'utilisateur :

i) Apprentissage Supervis :
L'utilisateur dispose d'un comportement de rfrence prcis qu'il dsire faire apprendre au rseau.
Le rseau est donc capable de mesurer la diffrence entre son comportement actuel et le
- 44 -
comportement de rfrence, et de corriger ses poids de faon rduire cette erreur.
L'apprentissage supervis utilise des connaissances empiriques, habituellement reprsentes par
des ensembles d'exemples tiquets par la classe laquelle ils appartiennent.

ii) Apprentissage Semi-Supervis :
L'utilisateur ne possde que des indications imprcises (par exemple, chec/succs du rseau) sur
le comportement final dsir. Les techniques d'apprentissage semi-supervis sont aussi appeles
apprentissage par renforcement (reinforcement learning). En effet, on dispose souvent tout au
plus d'une valuation qualitative du comportement du systme.

iii) Apprentissage non-supervis :
Les poids du rseau sont modifis en fonction de critres internes comme la coactivation des
neurones. Les comportements rsultants de ces apprentissages sont en gnral comparables des
techniques d'analyse de donnes. On les appelle aussi auto-organisation.
L'apprentissage des rseaux de neurones ncessite en gnral une grande quantit de donnes,
que l'on regroupe dans un ensemble d'exemples d'apprentissage. Selon la technique
d'apprentissage utilise, d'autres ensembles de donnes sont aussi employs, notamment pour
mesurer la validit de la solution trouve par le rseau. On appelle ces donnes supplmentaires
densembles d'exemples de test ou de gnralisation. On appelle gnralisation la capacit du
rseau ragir correctement lorsqu'on lui prsente des entres qui n'ont pas t vues lors de
l'apprentissage. Dans la pratique, ce sont les capacits de gnralisation d'un rseau
connexionniste qui vont tablir les possibilits de son application diffrents problmes.



- 45 -
2.4. Mthodes statistiques : Naive Bayes
L'apprentissage statistique dsigne un vaste ensemble de mthodes et d'algorithmes permettant
dans un sens gnral d'apprendre des logiques (comportements) partir d'exemples. Cet
apprentissage se base sur lvaluation mathmatique des exemples. Des stratgies de rduction
d'erreurs sont ensuite calcules partir de cette valuation.
L'algorithme le plus connu de cette catgorie est "Naive Bayes". Il permet de faire de
l'apprentissage supervis en se basant sur le thorme de Bayes:

P(A, B) = P(A) * P(B|A) (4)
De l P(B|A) = P(B) * P(A|B) / P(A) (5)

Lorsqu'on tente de prdire une "classe" B en fonction d'attributs connus A (qu'on suppose
indpendants) on numre les cas correspondants figurant parmi les exemples connus.
Les rseaux probabilistes bayesiens, galement appropris l'apprentissage dans les systmes
multi-agents (Maes et al. 2004), cependant leur apprentissage est trs coteux en termes de temps
de calcul.

2.5. Mthodes Hybrides d'Apprentissage Automatique
Le concept de systme hybride ou de mthode hybride est trs large. Ce groupe d'applications
inclut toute mthode qui intgre deux approches diffrentes pour la solution d'un problme. Nous
allons nous concentrer sur les approches hybrides d'apprentissage automatique, c.--d. les
diffrents systmes et mthodes rsultants de la combinaison des mthodes de base prsentes
dans ce document. Notre ide n'est pas de dresser une liste complte de toutes les possibilits de
combinaison d'approches diffrentes, mais seulement de donner un aperu de ce qui est fait
actuellement en termes de systmes et mthodes hybrides. Voici quelques exemples d'approches
hybrides appliqus l'apprentissage automatique ou la conception de systmes intelligents :
- 46 -
2.5.1. Systmes Symbolique-Flous :
Les systmes symbolique-flous intgrent la logique floue (fuzzy-logic) et les systmes base de
connaissances (KBS). Ce type de systme est en ralit une extension des systmes base de
connaissances, dans lesquels on ajoute la possibilit de reprsenter des rgles floues et de les
manipuler travers des mcanismes d'infrence floue (Santos Osrio 1998).

2.5.2. Systmes Symbolique-Gntiques :
Ces systmes sont normalement composs d'un module gntique responsable de l'acquisition de
connaissances partir des donnes (apprentissage), et d'un module symbolique responsable du
moteur d'infrence symbolique (raisonnement).

2.5.3. Systmes Neuro-Flous :
Les systmes hybrides neuro-flous sont une des catgories de systmes hybrides les plus
dveloppes car la logique floue et les rseaux connexionnistes ont beaucoup de points en
commun. Les systmes neuro-flous sont principalement de trois types : systmes qui intgrent
des rgles floues dans des rseaux (le modle RBF tant un des plus utiliss) ; les systmes qui
font l'extraction de rgles floues partir des rseaux ; et les systmes qui implmentent des
neurones flous .
Et beaucoup dautres approches hybrides dont nous ne pouvons pas donner une liste exhaustive
telles que les systmes qui intgrent un rseau connexionniste et un systme de raisonnent fond
sur des cas (Systmes Neuro-CBR), les systmes qui intgrent des rseaux connexionnistes et des
systmes base de connaissances (KBS) (Systmes Neuro-KBS ou SHNS), etc (Santos Osrio
1998).


- 47 -
3. Lapprentissage bas sur la simulation pour le pilotage des systmes de
production
3.1. Le rle de la simulation dans lapprentissage pour le pilotage des systmes de
productions
Dans le cadre de nos recherches, nous nous attacherons essentiellement aux mthodes issues de
lapprentissage permettant dextraire des rgles de fonctionnement sur le comportement des
systmes de production. Cependant la difficult connue de ces approches dapprentissage
automatique rside dans llicitation des connaissances dont doivent tre dote ces systmes. Et
la recherche des bons exemples qui refltent au mieux le comportement tudi du systme pour
piloter efficacement, constitue un cueil majeur pour la mise en uvre du pilotage intelligent
dateliers. Il est trs difficile dacqurir des exemples dapprentissage qui sont adapts au
problme tudi dans le systme de production.
Nanmoins, les travaux existants dans la littrature se basent globalement sur des exemples
dapprentissage pour gnrer ces connaissances.
Plusieurs approches ont t proposes pour constituer des ensembles dapprentissage partir
desquels on peut apprendre :
(1) mthode dchantillonnage (Pierreval et al. 1990, Li et al. 2007).
(2) connexion avec un algorithme doptimisation (Huyet et al. 2004).
(3) Exemples provenant des pratiques des oprateurs des systmes rels (Zhao et al., 2001).
De mme, lusage de la simulation permet dtre la source de gnration de connaissances
nouvelles. Plusieurs auteurs ont montr que la simulation tait capable de fournir des exemples
dapprentissage, mettant en relation des stratgies de dcision avec des performances.
En effet, nous avons besoin de gnrer des exemples qui refltent le fonctionnement rel des
systmes de production pendant une priode dfinie de production, sans pour autant dpenser le
temps rel de son fonctionnement.
- 48 -
La simulation permet ltude des systmes complexes (interactions complexes entre entits,
vnements alatoires, etc) o le rgime transitoire et son effet sur les performances sont pris en
compte. Dune manire gnrale, la simulation consiste tudier et analyser lvolution de
ltat dun systme travers la variable temps. Le temps peut tre vu comme continu ou discret,
selon que les tats du systme sont spcifis de manire dnombrable ou non. Dans ce cas, on
parle de simulation discrte ou continue (Law and Kelton 2000). Un survol des travaux de
recherche existants montre que la simulation vnements discrets est dun usage plus large que
la simulation continue (Pierreval, 2006, Pierreval et al. 2007). En effet, choisir de construire un
modle discret ou continu dpend avant tout des objectifs spcifiques de ltude.
De plus les potentiels de la simulation sont vastes. La simulation peut couvrir tous les flux de
lentreprise, puisquelle est capable de reprsenter : les flux physiques pour lesquels, dailleurs,
elle est le plus souvent utilise, mais galement les flux informationnels et les flux dcisionnels
associs ces flux physiques. Cet outil informatique est ainsi capable de reproduire sur
ordinateur, le comportement dynamique et stochastique dune machine, dun atelier, dune ligne
de production, dune usine, ... et donc, lvolution de ltat du systme en fonction des
informations suivies et des dcisions prises.
La simulation permet de rassembler les donnes utiles la production autant pour un atelier
existant que pour un atelier en projet. Ces donnes seront ainsi formalises en vue de leur
exploitation dans un modle. Par exemple, la dmarche de faire une simulation peut aider
formaliser les caractristiques globales dun atelier, en dfinissant par exemple : le nombre
doprateurs, le nombre de machines, le dimensionnement des stocks, les frquences des pannes
et autres temps darrt, la liste des rgles de gestion, ...
Plus formellement, un modle de simulation est une reprsentation informatique dun systme
rel permettant dobtenir, partir de variables dentre x
i
: les variables de dcision du systme,
une estimation des variables de sortie y
i
: les indicateurs de performance considrs pour le
systme tudi et des variables de rsultats (par exemple, le dtail dune solution de
dimensionnement). (Figure 17).

- 49 -

Figure 17. Principe dun modle de simulation
Ainsi le modle de simulation nous permet dvaluer la performance du systme de production
tudi selon les valeurs des paramtres dentre.
Cependant, la simulation reste un outil dvaluation de la performance dun systme de
production en fonction de ses paramtres dentre (Tamani et al. 2006, Habchi et al. 1994). Elle
ne permet pas danalyser et de comprendre directement les relations entre les paramtres et la
performance ni didentifier quelles interactions de ces paramtres influencent la performance
globale du systme.
Dans la section suivante nous allons citer quelques travaux qui relvent de lapprentissage
automatique dans les systmes de production partir de la simulation.

3.2. Les travaux relatifs lapprentissage automatique partir de la simulation des
systmes de production
Il existe plusieurs travaux sur lapprentissage automatique dans les systmes de production
partir de la simulation (Mouelhi et al. 2007a). A partir de rsultats de simulation obtenus
alatoirement, lobjectif est dextraire des connaissances partir de donnes simules sur le
comportement des systmes de production. (Pierreval, 1992) et (Pierreval et Ralambondrainy,
- 50 -
1992) mettent en vidence lintrt de disposer de connaissances, prsentes notamment sous la
forme de rgles de production, directement exploitables par un systme expert ou par un
dcideur.
Nombreux sont les travaux qui se basent sur lapprentissage des rseaux de neurones pour
construire des mtamodles qui reprsentent les systmes de production. Les mtamodles sont
capables de prdire les sorties dun modle de simulation dun systme de production partir de
ses entres.
En premier temps, nous rappelons la dfinition des mtamodles (Kleijnen, 1979). Soit X
j
le
vecteur des variables qui influencent la sortie du systme rel (j=1, 2, , s), et soit Y la rponse
du systme, la relation entre la sortie Y et les variables dentre X
j
peut tre reprsente comme
suit :
Y=f
1
(X
1
, X
2
,, X
s
) (6)
Un modle de simulation est une abstraction du systme rel, nous ny considrons que
lensemble des variables dentre choisies {Xj/j=1, 2, ..., r} o r est significativement infrieure
s qui est inconnu. La rponse Y de la simulation est alors dfinie comme une fonction f
2

reprsente comme suit :
Y= f
2
(X
1
, X
2
,, X
r
, v) (7)
O v reprsente un vecteur construit alatoirement qui reprsente linfluence des donnes
dentre que nous avons exclu.
Un mtamodle est maintenant une nouvelle abstraction, dans laquelle nous choisissons un sous-
ensemble de variables dentre de la simulation {X
j
/j=1, 2, ..., m; mr} et dcrivent le systme
comme suit :
Y= f
3
(X
1
, X
2
, , X
m
)+ (8)
O reprsente une erreur d'adaptation, qui tend vers zro. La figure 18 rcapitule la
mthodologie de construction des mtamodles partir des rseaux de neurones.
- 51 -

Figure 18. Dveloppement dun mtamodle partir dun rseau de neurones
Parmi les travaux qui mettent en application les mtamodles bass sur les rseaux de neurones
dans le domaine des systmes de production nous citons ; (Pierreval et Huntsinger 1992) qui
utilisent le potentiel des rseaux de neurones comme des mtamodles dans deux exemples de
modles : un exemple de modle discret (un atelier Jobshop) et un exemple de modle continu.
De mme, Wang et Yih (1997) utilisent un mtamodle bas sur un rseau de neurones pour
mesurer les performances des stratgies de contrle des automated storage and retrieval systems
(AS/RS). Puis, ils choisissent la performance la plus efficace. Plus tard, Kilmer, et al. (1999) ont
utilis un ensemble dentres/sorties gnres partir dun modle de simulation des stocks dun
atelier pour construire deux rseaux de neurones, un pour valuer le cot total moyen des stocks
et lautre pour estimer la variance du cot total. Ils ont utilis ces deux estimations calcules par
les rseaux de neurones pour calculer des intervalles de confiance du cot de stockage.
- 52 -
Plus tard, Fonseca et Navaresse (2002) ont propos un metamodle bas sur un rseau de
neurones pour remplacer un modle de simulation dun atelier jobshop. Leur metamodle tait
capable d'valuer les dlais (lead times) des commandes traites simultanment dans un atelier
jobshop compos de quatre machines.
Les mtamodles bass sur les rseaux de neurones sont aussi utiliss dans des domaines trs
spcifiques ; par exemple, Kwak et al. (2005) ont propos une mthode qui utilise un
metamodle bas sur un rseau de neurones pour rsoudre le problme dun processus de moules
dinjection plusieurs variables. Les techniques d'injection haute prcision sont exiges pour la
fabrication des lentilles optiques. Dans cette tude, le rseau de neurones prdit la rduction
d'paisseur et le taux d'altration volumtrique des conditions d'injection.
Il existe plusieurs travaux qui utilisent les mtamodles bass sur les rseaux de neurones coupls
avec dautres approches. Nous citons par exemple Chan et Spedding (2001) qui ont dvelopp un
mtamodle bas sur un rseau de neurones d'un systme d'assemblage de produits optroniques et
ils ont utilis ce metamodle coupl avec une approche de surface de rponse pour prdire la
performance du systme. Aussi, Wang et al. (2005) qui ont dvelopp un modle hybride de
dcouverte de connaissance, en combinant un arbre de dcision et un mtamodle bas sur les
rseaux de neurones pour dterminer la bonne rgle de production en utilisant des donnes de
production bruites et prdire sa performance.
Les mtamodles bass sur les rseaux de neurones sont aussi utiliss dans les processus
d'optimisation pour valuer (plus rapidement qu'un modle de simulation) des solutions
proposes par les mthodes d'optimisation. Hurrion (1997) a utilis un mtamodle bas sur un
rseau de neurones dans un programme de recherche combinatoire, avec une tude comparative
pour trouver le nombre optimum de kanbans dans un systme de production. Wang (2005) a
dvelopp une stratgie hybride qui combine lalgorithme gntique et les rseaux de neurones
pour rsoudre un problme doptimisation via simulation. La performance des rseaux de
neurones tant des bons approximateurs et l'efficacit potentielle des algorithmes gntiques sont
combines pour trouver des conceptions optimales des systmes.
Cependant, peu dauteurs ont utilis les rseaux de neurones pour le pilotage datelier en le
considrant comme dcideur dans un systme daide la dcision (Figure 19) et non pas
comme un mtamodle, c'est--dire, ils ont considr le rseau de neurones comme tant un
- 53 -
module dans le modle de simulation pour laide la dcision soit en proposant les dcisions
possibles aux dcideurs pour aider au mieux au pilotage du systme, soit en choisissant
directement la dcision qui optimise la performance vise dans le systme de production.

Figure 19. Intgration du rseau de neurones dans le modle de simulation pour laide la
dcision.
Parmi les travaux qui intgrent les rseaux de neurones dans les modles de simulation nous
citons par exemple (Pierreval 1992) qui a dvelopp un modle de simulation pour valuer les
performances des rgles de priorit partir des diffrents tats de latelier. Ensuite, il a cre
partir de ces donnes simules un ensemble dapprentissage inverse qui dtermine pour chaque
tat du systme la combinaison de rgles de priorit adquate. Enfin, et en se basant sur cet
ensemble dapprentissage, il entraine le rseau de neurones pour prdire la meilleure combinaison
de rgles qui sera prise en compte dans le modle de simulation du systme de production. En
2006, (Yildirim et al. 2006), ont aussi dvelopp deux rseaux de neurones en se basant sur le
mme principe, lun prdit le nombre de machines utiliser dans chaque centre de travail de leur
atelier et lautre prdit la date de livraison de chaque commande, et cela partir de la
performance donne par les managers. Enfin, et pour sassurer de la performance des choix des
deux rseaux de neurones ils relancent la simulation et vrifient la performance trouve avec la
performance attendue.
Dautres auteurs se sont intresss au problme de choix des rgles de priorit dans les systmes
de production en se basant sur des mthodes dapprentissage. Il y a ceux qui choisissent les rgles
de priorit statiquement, c'est--dire, ils testent toutes les rgles de priorit sur toute la priode de
simulation ensuite ils choisissent la rgle la plus performante par rapport la performance choisie
- 54 -
(figure 20). Puis, il y a ceux qui choisissent les rgles de priorit priodiquement ; en valuant
les rgles de priorit appliquer dans latelier chaque priode de temps t bien dtermine
(figure 21). Et il y a ceux qui choisissent les rgles de priorit dans latelier dynamiquement
chaque instant de prise de dcision soit en fixant un seuil de contrle qui une fois atteint une
nouvelle rgle de priorit est choisie, soit un vnement dclencheur se passe tel que la libration
dune machine ou lentre dune nouvelle commande, etc (figure 22).

Figure 20. Choix des rgles de priorit statiquement.
Parmi les travaux qui choisissent statiquement les rgles de priorit nous citons, Li et al., (2007)
qui ont utilis une approche base sur les rseaux de neurones pour rsoudre des problmes de
choix de rgles de priorit dans des ateliers flexibles (FMS) partir dun nombre de donnes
relles rduit, en effet, il proposent une technique qui lont appel Mega-Trend-Diffusion
pour valuer un petit jeu de donnes et produire des chantillons artificiels pour former le rseau
de neurones en se basant sur la simulation.
Par ailleurs, depuis les annes 90 plusieurs travaux sont venus sinscrire dans le cadre de
lapplication de lapprentissage automatique par les mthodes statistiques dans les prises de
dcisions au sein des systmes de production. Nous pouvons citer par exemple les travaux de
Pierreval (Pierreval 1988) qui utilisent lanalyse de correspondances multiples pour fournir des
rgles de production partir de rsultats de simulation, ces rgles seront ventuellement insres
- 55 -
dans une base de connaissances (1988), et pour tudier les diffrentes stratgies
dordonnancements dynamiques partir de rsultats de simulation (Pierreval 1994).

Figure 21. Choix des rgles de priorit priodiquement
Parmi les travaux qui choisissent les rgles de priorit priodiquement nous citons : (Sun et al.
2004) qui ont prsent une mthode dordonnancement base sur un apprentissage automatique
itratif, dans leur systme ; les auteurs slectionnent des rgles de priorit dans les files dattente,
ces rgles sont incorpores dans le modle avec des paramtres rglables et, selon la performance
globale obtenue de la dernire priode de simulation, ces paramtres sont mis jour afin
d'optimiser la valeur de la fonction d'objectif pendant la priode suivante.
Shiue et al. (Shiue et al. 2006) ont utilis une mthode hybride qui lie un algorithme gntique
un rseau de neurones appele l'approche dordonnancement adaptative multi-priodes, qui est
capable de dcouvrir ltat courant du systme et selon cet tat elle choisie la rgle de priorit
adquate pour la priode dordonnancement qui suit.

Figure 22. Choix des rgles de priorit dynamiquement
- 56 -
Parmi les travaux qui choisissent dynamiquement les rgles de priorit nous citons (Metan et al.
2009) qui, pour considrer plus efficacement les changements d'tat du systme pendant une
priode donne, ont ajout une carte de contrle pour mieux surveiller ces changements. Ils
proposent un systme dordonnancement bas sur lapprentissage automatique pour choisir les
rgles de priorit dans les files dattente de leur systme chaque fois la carte de contrle dtecte
le seuil fix, l'objectif est d'apprendre partir des caractristiques de latelier et construire un
arbre de dcision et ensuite slectionner les rgles de priorit en ligne partir de larbre construit
pendant une priode dordonnancement. Le systme utilise une carte de contrle pour contrler la
performance de l'arbre de dcision, qui est automatiquement mis jour chaque fois que ceci est
ncessaire. La performance de cette mthode dpend du paramtrage du systme de contrle et
comment l'arbre de dcision est construit.
El-Bouri et Shah (El-Bouri et al. 2006) ont utilis deux rseaux de neurones pour choisir une
combinaison de rgles de priorit dans un atelier Jobshop ; lun pour minimiser le makespan et
lautre pour minimiser le flowtime moyen. Les rgles sont changes dynamiquement chaque
fois que le seuil de congestion fix par les auteurs est atteint. Les deux rseaux de neurones sont
entrains partir densembles dapprentissage obtenus du modle de simulation de latelier.
Rcemment, Lee (Lee 2008) a propos une approche base sur les rgles floues pour rsoudre un
problme dordonnancement adaptatif ; il choisit et applique dynamiquement la rgle de priorit
la plus adquate selon l'tat de l'environnement dordonnancement. Ces rgles floues sont
construites partir densembles dapprentissage issus de la simulation.
Dautres travaux ont t mens en appliquant des mthodes bases sur lapprentissage
automatique dans le domaine des systmes de production tel quHritier (Hritier 1991) qui
utilise de lanalyse de donnes par simulation pour effectuer de laide la conception de systmes
de production. Et nous pouvons citer aussi dautres approches qui sont bases sur les principes de
classification comme lapproche prsente par Bonneau et Proth (Bonneau et al. 1985) pour
choisir les rgles de gestion dun systme de production.
Dautres travaux sont bass sur diffrentes mthodes dapprentissage automatique tel que :
(Lereno et al. 2001) qui ont construit des arbres de dcision partir des rsultats de simulation
choisis alatoirement afin daider la dcision dans un logiciel dordonnancement. Creighton et
Nahavandi (Creighton et al. 2002) ont optimis les performances dune ligne de production en
- 57 -
srie par apprentissage par renforcement. Cette stratgie leur permet doptimiser le systme plus
rapidement et plus efficacement.
De mme dans ses travaux Huyet (Huyet 2006) a propos une mthodologie base sur la synergie
d'une approche d'optimisation volutionniste et une approche dapprentissage par les graphes
d'induction. Avec cette mthodologie, il est possible d'extraire et dutiliser des connaissances
partir des meilleures solutions proposes par le systme de production tudi et analyser son
comportement pour en extraire les bonnes rgles du graphe dinduction. Lauteur a appliqu cette
mthodologie sur un atelier jobshop cinq machines.
Rcemment, (Aissani et al. 2008) ont propos un systme de commande industriel o les
dcisions prises par le systme sont le rsultat d'un travail de groupe d'agents, ces agents assurent
une amlioration continue de la performance globale du systme, grce lapprentissage par
renforcement. Cette technique d'apprentissage permet aux agents d'apprendre le meilleur
comportement dans leurs divers rles (l'auto-organisation, le planning des tches, etc) sans altrer
la qualit des dcisions prises en temps rel.
Bilan
Nous avons prsent dans ce qui prcde, plusieurs travaux qui se basent sur la simulation pour
gnrer des connaissances. Plusieurs auteurs ont montr que la simulation tait capable de
fournir des exemples, mettant en relation des stratgies de dcision avec des performances, de
telle sorte que des outils dapprentissage automatique puissent en extraire des connaissances
utiles et construire les ensembles dapprentissage.
Malheureusement, lusage densembles dapprentissage ncessite que lon soit capable de gnrer
par simulation des exemples distinguant les bonnes dcisions de mauvaises dcisions, au regard
dun objectif de performance, puisque les mthodes dapprentissage automatique sont trs
sensibles la qualit de lensemble de donnes dapprentissage, comme les rseaux de neurones,
les rgles floues, les arbres de dcision, etc. (Osei-Bryson 2004). Ainsi, les rsultats
dapprentissage obtenus restent trs dpendants des donnes sur lesquelles les connaissances
sont extraites.
- 58 -
Ce problme saccentue encore plus lorsquil sagit de prendre des dcisions en temps rel ; en
effet, lorsque lon considre des dcisions de pilotage en temps rel, limpact sur la performance
des dcisions prises est difficile mesurer et apprcier immdiatement. Cest pour cette raison
que la plupart des travaux existants considrent les performances obtenues sur une priode
dtude suffisamment longue ou sur plusieurs priodes relativement courtes dans loptique
damliorer la prise en compte des changements dtats dans latelier au cours du temps. Or,
mme en considrant de telles priodes il est difficile de capter tous les changements dans
latelier au cours de chaque priode considre et qui peuvent ainsi amener la prise de nouvelles
dcisions (ex. ajouter une nouvelle machine, raffecter des oprateurs, changer les rgles de
priorit dans les files dattente, etc.).
Cependant notre objectif est de gnrer des connaissances relatives au fonctionnement de latelier
en temps rel et en considrant chaque changement dtat dans latelier chaque instant de prise
de dcision et non sur des priodes donnes.
Autrement dit, nous cherchons gnrer des connaissances par simulation sans utiliser des
ensembles dapprentissage pralablement dtermins. Nous parlons alors dacquisition autonome
de connaissance (Mouelhi et al. 2007b). Des travaux possdant quelques liens avec lapproche
que nous proposons sont prsents dans (Geiger et al. 2006) pour gnrer une nouvelle rgle de
priorit de passage de pice. Les principes exposs ici diffrent fortement de lapproche par
programmation gntique propose par ces auteurs. Par ailleurs, nos propositions ont vocation
sappliquer des problmes beaucoup plus large de pilotage datelier.
4. Conclusion
Dans la synthse de la littrature que nous avons prsent dans cet tat de lart nous avons mis
laccent sur lutilisation de la simulation pour lapprentissage des mthodes dapprentissage
automatique (ex. les graphes dinduction, les rseaux de neurones, les mthodes statistiques, etc.)
dans les systmes de production. La plupart des travaux utilisent des ensembles dapprentissage
issus des modles de simulation des systmes de production tudis, mais ceci prsente des
inconvnients si on considre les changements de ltat du systme au cours du temps, la prise en
compte de ces changements est indispensable pour les changements des stratgies de production
au cours du temps. En effet, la prise en compte de tels changements en temps rel dans les
systmes de production est ncessaire dans des systmes qui sont confronts des imprvus qui
- 59 -
peuvent survenir au cours du processus de production (commandes urgentes, manque de matire
premire, pannes de machine, absentisme, etc) et qui peuvent nuire aux objectifs de la
production.
Dans ce sens, plusieurs travaux ont essay de prendre en compte ce type des changements. Les
chercheurs ont propos des solutions de dcomposition des temps de production pour les simuler
sur des priodes courtes, dautres ont propos des seuils de contrle partir duquel ils rvisent
ltat du systme et prennent en compte les changements qui ont amen atteindre ces seuils.
Malheureusement, la solution de dcomposition ne rsout pas totalement laspect temps rel
puisque au cours mme de la courte priode simule ltat du systme peut changer et ce dernier
ne peut tre pris en compte que dans la priode qui suit. De mme pour les seuils de contrle,
puisqu il est trs difficile de dterminer le bon seuil partir duquel la prise dune nouvelle
dcision de production est ncessaire.
A notre connaissance il nexiste pas dapproche qui assure un apprentissage prenant en compte
les changements dtat dans les systmes de production en temps rel.
Dans la suite de ce manuscrit nous allons donner notre formulation du problme et nous allons
prsenter notre approche








- 60 -
Chapitre III

APPRENTISSAGE AUTONOME DES RESEAUX DE NEURONES BASE
SUR OPTIMISATION VIA SIMULATION

1. Introduction
Comme nous lavons expliqu dans les chapitres prcdents, le pilotage des systmes de
production est un problme qui ncessite une prise de dcision trs complexe dune part, et une
poursuite de plus en plus fine dobjectifs associs des niveaux de performance levs dautre
part. En effet, trs dpendant de lexpertise du dcideur, le pilotage en temps rel est devenu
lenjeu de plusieurs travaux de recherche qui essayent dacqurir cette expertise pour en dduire
les bonnes dcisions des mauvaises et satisfaire ainsi la performance vise.
Malheureusement, lacquisition de lexpertise du dcideur ncessite lusage densembles
dapprentissage comme nous lavons prsent dans le chapitre II. Et nous avons montr quil est
ncessaire que lon soit capable de gnrer par simulation les exemples distinguant les bonnes
dcisions des mauvaises dcisions, au regard dun objectif de performance. Cependant, dcider si
la dcision prise est-elle bonne ou mauvaise au cours dun pilotage en temps rel est trs difficile
si cela nest pas impossible. En effet, est-il possible pour un dcideur dans un systme de
production en temps rel de dire si le fait daffecter loprateur X une machine Y linstant t
amliore la production future ? Ou bien quelle commande urgente doit tre passe cet instant t
(temps rel) parmi un ensemble de commandes urgentes dans une file dattente dune machine
qui minimisera le retard moyen dans latelier la fin de la production ?



- 61 -
2. Formulation du problme : description et objectifs
Le problme abord dans notre tude consiste dterminer comment obtenir les connaissances
ncessaires pour le pilotage en temps rel. Ces connaissances doivent notamment tre capables de
dterminer les bonnes actions de pilotage pour aboutir aux objectifs de la production (e. g.
minimiser les en-cours, minimiser le retard moyen, etc.) partir de ltat courant du systme de
production (e. g. le nombre de machines libres, le nombre de pices dans chaque file dattentes,
etc). Nous proposons dans ce qui suit une formulation de ce problme.
Considrons dune part, un ensemble dactions de pilotage en temps rel A, tels que choisir une
rgle de priorit, choisir un oprateur, ou des outils, etc. O
A = {A
1
, A
2
, A
3
, , A
k
} (9)
Soit (t) la fonction permettant de dterminer une action A
i
selon ltat courant du systme
chaque instant t de prise de dcision.
(t) : t A
i
, o i { 1, 2, , k} (10)
Dautre part, soit le vecteur X qui dcrit le systme lun instant t de prise de dcision dont les
composantes sont par exemple le nombre de machines libres, les oprateurs disponibles pour une
machine donne, etc.
Nous considrons aussi la fonction objectif du systme de production f que nous cherchons
optimiser (minimiser ou maximiser). Soit la squence des actions prises lors des dcisions
pendant toute la priode dtude. La fonction f value la squence des actions des actions de
pilotage prises tout au long du processus de production du systme par la fonction (t) en se
basant chaque fois sur ltat courant du systme X. On souhaite trouver la meilleure squence
tel que
Min ou Max [ f () ]

(11)
Nous abordons ce problme en recherchant une fonction non linaire G approximant qui nous
permettra chaque instant t donn de prise de dcision de dterminer laction de pilotage
- 62 -
choisir parmi lensemble de pilotage A, partir du vecteur X caractrisant ltat du systme dans
le but doptimiser la fonction objectif f. Toutes les tapes pour dterminer cette fonction sont
donnes au chapitre suivant.
Les variables prendre en compte dans la prise de dcision
Le vecteur X inclus des paramtres et des variables du systme qui refltent son tat courant. En
effet, dans un tel contexte, chaque dcideur a besoin de ces informations (transmises par le
vecteur X) pour prendre les bonnes dcisions qui optimisent les performances de latelier. Alors
nous estimons quil est ncessaire de bien tudier le choix de ces variables. Elles sont un facteur
clef dans llaboration de lapproche que nous proposons par la suite, puisqu elles influencent le
pilotage du systme.
En effet, il existe plusieurs variables qui peuvent tre transmises au dcideur chaque instant t de
prise de dcision pour pouvoir choisir une des actions de pilotage. Ces informations peuvent tre
utiles comme inutiles pour la prise de dcision. La question qui se pose alors est la suivante :
que doit-on inclure, et que doit-on exclure? . En fait, si des lments importants sont exclus, il y
a de forte chance pour que le dcideur nait pas assez dinformations pour prendre les bonnes
dcisions. Inversement, trop de dtails pris en compte dans le modle crent un bruitage inutile
qui biaise la dcision du dcideur. Le niveau de dtail transmettre ce dernier dpend des
objectifs fixs, du dtail des donnes acquises,...
Nous dfinissons deux vecteurs S(t) et D qui composent le vecteur X reprsentant ltat du
systme linstant t.
X = (S(t), D ) (13)
Le vecteur S(t) reprsente les variables de dcisions qui changent dynamiquement tout au long de
la priode de ltude de latelier, nous les appelons les variables dtat, o t est linstant auquel le
dcideur prend sa dcision. Ces variables caractrisent ltat courant de latelier au temps rel,
parmi ces variables nous citons par exemples le nombre de pices dans chaque file d'attente, le
nombre de machines libres linstant t, les oprateurs disponibles pour une machine donne
linstant t, etc.
- 63 -
Et le vecteur D = (D
1
, D
2
, , D
l
) reprsente les paramtres de latelier qui doivent tre pris en
considration pour prendre les dcisions, mais qui ne changent pas pendant la priode de ltude
de latelier. Par exemple : le nombre de machines disponibles dans un workcenter donn, le taux
de charge de latelier, le nombre doprateurs oprants sur chaque machine, etc.


S(t) = (S(t1), S(t2), , S (tk)), t = t1, t2, , tk

(14)
Avec, X = (S(t), D )
D = (D
1
, D
2
, , D
l
), (15)

Ces deux vecteurs S(t) et D sont construits en recensant les paramtres et les variables qui
refltent au mieux ltat du systme pour rsoudre un problme bien prcis.
Les paramtres de latelier qui sont reprsents par le vecteur D sont comme nous lavons dj
expliqu invariables et ne changent pas au cours du temps, alors leur dtermination ne ncessite
pas une longue tude des caractristiques de latelier ou des problmes que nous voulons
rsoudre dans un atelier donn. Cependant, les variables dtat S(t) qui changent au cours du
temps et qui refltent ltat courant du systme sont difficiles dterminer et leur choix est
troitement li aux types de problmes de pilotage que nous considrons dans latelier tudier.
Il existe des travaux dans la littrature qui ont t mens pour dsigner quelques variables pour
dcrire latelier un instant donn de prise de dcision et qui refltent au mieux son tat pour un
problme donn ou bien pour optimiser une performance considre dans un atelier.
Nous citons les travaux de Shiue et Guh, (Shiue et al. 2006) qui prsentent un ensemble
dattributs et de variables quils prennent en compte pour dcrire ltat de latelier un instant
donn. Le tableau 2 reprsente toutes les variables dtat que Shiue et Guh ont dtermin pour
dcrire leur systme.
- 64 -
Tableau 2. Variables dtat dun systme de production (Shiue et Guh, 2006)

- 65 -
Notre objectif est donc dapproximer la fonction non linaire G qui reprsente la relation entre le
vecteur X de ltat courant du systme de production aux instants de prise de dcision t aux
actions de pilotage qui leurs correspondent pour optimiser la fonction objectif f.
Dans ce qui suit, nous prsentons dans un premier temps les proprits qui nous ont amen
choisir le rseau de neurones pour approximer la fonction G. Dans un second temps, nous
expliquons le principe de prise de dcisions en temps rel par le rseau de neurones. Et enfin,
nous prsentons une mthode dapprentissage du rseau de neurones base sur loptimisation via
simulation.
3. Lapproche propose
Dans la mesure o le pilotage en temps rel seffectue sur la base dun tat du systme changeant
dynamiquement au cours du temps, il est donc trs difficile de dterminer la fonction G qui lie les
tats courants du systme de production aux bonnes actions de pilotage qui leurs correspondent,
aux instants de prise de dcision pour optimiser la fonction objectif.
Nous proposons dans cette tude une approche qui permettra dapproximer la fonction non
linaire G qui reprsente la logique du pilotage que nous cherchons dterminer. Notre approche
est compose de deux phases principales, une phase de construction de la logique du pilotage et
dapproximation de la fonction G, et une phase de lintgration de cette logique dans le systme
pilot.
Pour approximer la fonction G et construire la logique du pilotage nous avons utilis un rseau de
neurones. En fait, les rseaux de neurones possdent des proprits, que nous dtaillerons par la
suite, qui leur permettent dapproximer nimporte quelle fonction non linaire. Ce rseau de
neurones apprendra prendre les bonnes dcisions du pilotage en temps rel en se basant sur un
apprentissage qui vise extraire de faon autonome des connaissances dun modle de
simulation, sans utiliser ni ensembles dapprentissage ni expertise pralable. Dans la dmarche
prsente, lapprentissage seffectue par optimisation via simulation (Wetter et al. 2003) des
caractristiques dun rseau de neurones par rapport la fonction objectif f. Aprs optimisation,
le rseau possde la capacit de dcider quelle action de pilotage entreprendre, en fonction du
vecteur X

de ltat de latelier, pour satisfaire lobjectif f vis pour le pilotage. Une fois que le
- 66 -
rseau de neurones a appris, il peut tre alors intgr dans le systme de pilotage global du
systme de production considr.
Dans ce qui suit, nous prsentons dans un premier temps les proprits qui nous ont amen
choisir le rseau de neurones pour approximer la fonction G.
Ensuite, nous expliquons comment nous nous somme bas sur loptimisation via simulation pour
procder lapprentissage autonome du rseau de neurones.
3.1. Une approche base sur les rseaux de neurones
3.1.1. Les rseaux de neurones : approximateurs universels parcimonieux
Les rseaux de neurones, tels que nous les avons dfinis dans le chapitre prcdent, possdent
une proprit remarquable qui est l'origine de leur intrt pratique dans des domaines trs
divers: ce sont des approximateurs universels parcimonieux (Dreyfus et al. 2004).
Sans entrer dans les dtails mathmatiques, la proprit d'approximation peut tre nonce de la
manire suivante : toute fonction borne suffisamment rgulire peut tre approche avec une
prcision arbitraire, dans un domaine fini de lespace de ses variables, par un rseau de
neurones comportant une couche de neurones cachs en nombre fini, possdant tous la mme
fonction dactivation, et un neurone de sortie linaire (Hornik et al. 1989). Cette proprit n'est
pas spcifique aux rseaux de neurones : il existe bien d'autres familles de fonctions paramtres
possdant cette proprit ; c'est le cas notamment des ondelettes, des fonctions radiales, des
fonctions splines, par exemple. La spcificit des rseaux de neurones rside dans le caractre
parcimonieux de l'approximation : prcision gale, les rseaux de neurones ncessitent moins
de paramtres ajustables (les poids des connexions) que les approximateurs universels
couramment utiliss ; plus prcisment, le nombre de poids varie linairement avec le nombre de
variables de la fonction approcher, alors qu'il varie exponentiellement pour la plupart des autres
approximateurs.
Nous verrons dans ce qui suit que c'est cette remarquable parcimonie qui justifie l'intrt
industriel des rseaux de neurones. En pratique, ds qu'un problme fait intervenir plus de deux
variables, les rseaux de neurones sont, en gnral, prfrables aux autres mthodes.
- 67 -
Qualitativement, la proprit de parcimonie peut se comprendre de la manire suivante : lorsque
l'approximation est une combinaison linaire de fonctions lmentaires fixes (des monmes par
exemple, o des gaussiennes centres et carts-types fixes), on ne peut ajuster que les
coefficients de la combinaison, en revanche, lorsque l'approximation est une combinaison linaire
de fonctions non linaires paramtres ajustables (un Perceptron multicouche par exemple), on
ajuste la fois les coefficients de la combinaison et la forme des fonctions que l'on combine.
Ainsi, dans un Perceptron multicouche, les poids de la premire couche dterminent la forme de
chacune des sigmodes ralises par les neurones cachs, et les poids de la seconde couche
dterminent une combinaison linaire de ces fonctions. On conoit facilement que cette souplesse
supplmentaire, confre par le fait que l'on ajuste la forme des fonctions que l'on superpose,
permet d'utiliser un plus petit nombre de fonctions lmentaires, donc un plus petit nombre de
paramtres ajustables. Nous allons voir dans ce qui suit pourquoi cette proprit de parcimonie
est prcieuse dans les applications industrielles.
Dans la pratique, on n'utilise pas les rseaux de neurones pour raliser des approximations de
fonctions connues. Le plus souvent, le problme qui se pose lingnieur est le suivant : il
dispose dun ensemble de mesures de variables d'un processus de nature quelconque (physique,
chimique, conomique, financier, ...), et du rsultat de ce processus ; il suppose qu'il existe une
relation dterministe entre ces variables et ce rsultat, et il cherche une forme mathmatique de
cette relation, valable dans le domaine o les mesures ont t effectues, sachant que (1) les
mesures sont en nombre fini, (2) elles sont certainement entaches de bruit, et (3) toutes les
variables qui dterminent le rsultat du processus ne sont pas forcment mesures. En dautres
termes, lingnieur cherche un modle du processus quil tudie, partir des mesures dont il
dispose, et delles seules : on dit quil effectue une modlisation "bote noire". Dans le jargon des
rseaux de neurones, les donnes partir desquelles on cherche construire le modle sappellent
des exemples.
En quoi la proprit d'approximation parcimonieuse peut-elle tre utile pour rsoudre ce genre de
problmes ? Ce que l'ingnieur cherche obtenir l'aide de son modle, c'est la "vraie" fonction
qui relie la grandeur y
p
que l'on veut modliser aux variables {x} qui la dterminent, c'est - dire
la fonction que l'on obtiendrait en faisant une infinit de mesures de y
p
pour chaque valeur
possible de {x} : en termes de statistiques, l'ingnieur cherche la fonction de rgression de la
grandeur modliser. Cette fonction est inconnue, mais on peut en chercher une approximation
partir des mesures disponibles : les rseaux de neurones sont donc de bons candidats pour cela, si
- 68 -
la fonction de rgression cherche est non linaire. Cette approximation est obtenue en estimant
les paramtres d'un rseau de neurones au cours de la phase d'apprentissage.
C'est ici que la proprit d'approximation parcimonieuse des rseaux de neurones est prcieuse :
en effet, le nombre de mesures ncessaires pour estimer les paramtres de manire significative
est d'autant plus grand que le nombre de paramtres est grand. Ainsi, pour modliser une
grandeur avec une prcision donne l'aide d'un rseau de neurones, il faut moins de donnes que
pour la modliser, avec une prcision comparable, l'aide d'une rgression linaire multiple ; de
manire quivalente, un rseau de neurones permet, avec les mmes donnes disponibles, de
raliser une approximation plus prcise qu'une rgression linaire multiple (Dreyfus, 2004).
De manire gnrale, un rseau de neurones permet donc de faire un meilleur usage des mesures
disponibles que les mthodes de rgression non linaires conventionnelles. Ce gain peut tre
considrable lorsque le processus modliser dpend de plusieurs variables : en effet le nombre
de paramtres (donc de mesures) varie exponentiellement pour les mthodes conventionnelles de
rgression non linaire, alors qu'elle varie linairement pour les rseaux de neurones.
Ainsi, la lumire de cette proprit fondamentale, la technique des rseaux de neurones apparat
comme une puissante mthode de rgression non linaire : ce n'est donc rien d'autre qu'une
extension des mthodes de rgression linaire ou multilinaires (Dreyfus, 2004).
3.1.2. La prise de dcision par le rseau de neurones
Dans lapproche que nous proposons dans cette thse, le rseau de neurones est utilis en tant que
dcideur (figure 3.1) dans le systme de production, ses dcisions se basent sur des
caractristiques importantes de latelier (par exemple : nombre de machines disponibles, taux de
charge, etc.) ainsi que son tat linstant t o une dcision doit tre prise (par exemple le nombre
des pices dun certain type en attente pour une ressource donne, disponibilit doprateurs,
disponibilit des machines, etc.). Le rseau de neurones dcide alors dune action (ou plusieurs
actions) effectuer parmi les actions possibles de lensemble dactions de pilotage A par
exemple : affectation dun oprateur donn une machine donne, permutation de machines, etc.
Les dcisions prises par le rseau de neurones doivent concourir la satisfaction des objectifs de
production de latelier, par exemple la minimisation des retards ou des en-cours.
- 69 -
Ces dcisions sont bases sur une logique qui est le raisonnement du rseau de neurones, et ce
raisonnement dpend des caractristiques du rseau de neurones : sa topologie (nombre de
couches caches, nombre de neurones dans chaque couche, ), ses poids et ses paramtres (le
type des fonctions dactivation quils utilisent, les paramtres de ces fonctions,), que lon
caractrise par un vecteur numrique not W. Nous considrons alors la fonction qui reprsente la
logique du rseau de neurones comme suit :
W = G ( E (f () )

(16)
Cependant, comment pouvons-nous construire cette logique qui lie ltat courant du systme de
production aux instants de prise de dcision aux bonnes actions de pilotage qui leurs
correspondent et que le rseau de neurones prendra pour optimiser la fonction objectif f ? En
dautres termes, comment pouvons-nous dterminer la fonction G qui permettra au rseau de
neurones de prendre les bonnes dcisions au regard de la performance vise ?
Notre objectif est doptimiser cette fonction G tout au long de la phase dapprentissage du rseau
de neurones, c'est--dire optimiser ses caractristiques pendant cette premire phase de
lapproche.

Figure 23. La prise de dcision par le rseau de neurones dans un systme de production
- 70 -

3.2. Auto-apprentissage des rseaux de neurones par optimisation via simulation
Lapprentissage classique des rseaux de neurones multicouches de type Perceptron est bas
gnralement sur des ensembles dapprentissage pour en extraire les connaissances. Cependant,
dans le contexte de notre tude nous ne pouvons pas obtenir ces ensembles dapprentissage,
comme nous lavons expliqu dans les chapitres prcdents. Alors, nous nous sommes intresss
lapplication de la simulation pour lextraction des connaissances partir de loptimisation via
simulation.
Dans notre contexte, loptimisation via simulation consiste amliorer progressivement la
logique dcisionnelle du rseau de neurones, et ainsi, dterminer le vecteur W qui permettra au
rseau de neurones de prendre les bonnes dcisions au regard de la performance vise.
Dans la section qui suit nous rappelons brivement les principes de loptimisation via simulation
et son intrt pour notre dmarche dauto apprentissage du rseau de neurones.

3.2.1. Loptimisation via simulation
Loptimisation des systmes de production consiste souvent dterminer la meilleure
combinaison des paramtres qui les caractrisent. Certains de ces paramtres sont numriques
comme les capacits de stockage, le nombre de boucles kanban, la taille des lots de transport ou
non numriques comme les rgles de priorit.
Il y a souvent plusieurs interactions entre ces paramtres (par exemple, certaines tailles de lots
peuvent engendrer de bons rsultats avec une rgle de priorit donne et de mauvais rsultats
avec une autre).
Le but et nest pas seulement dvaluer ces paramtres mais aussi de les optimiser, il est difficile
dutiliser des approches analytiques sans faire dhypothses restrictives. La solution la plus
adapte pour permettre leur valuation est souvent la simulation car elle permet de prendre en
- 71 -
compte au mieux les diverses caractristiques des systmes de production (Law and Kelton,
2000).
Toutefois, la simulation nest quun outil dvaluation de la performance dun systme en
fonction de ses paramtres. Il faut donc utiliser la simulation conjointement dautres mthodes
afin de rechercher les solutions optimales ; do loptimisation via simulation.
Le principe de loptimisation via simulation ( Azadivar 1992, Fu 1994, Andradottir 1998, Fu
2002) consiste en une interaction entre les deux modules : le module de simulation et le module
doptimisation ; o le module doptimisation propose successivement des solutions que lon
espre de plus en plus performantes au module de simulation ; celui-ci les value en calculant le
comportement du systme ainsi paramtr, ceci jusqu la satisfaction dun critre darrt
(nombre de gnrations, valeur de loptimum atteint,). Le problme considr est donc la
maximisation ou la minimisation de la valeur de la fonction objectif.
Ce problme peut tre exprim de la faon suivante :
( ) ( ) X H
X
max min (17)
O H(X)= L(X, ) est la mesure de performance du systme,
X est un vecteur de p facteurs contrlables,
est lensemble des contraintes de X,
reprsente les effets stochastiques du systme,
De nombreux travaux ont t mens en optimisation via simulation, ils diffrent souvent par la
mthode doptimisation employe qui est troitement lie au contexte et aux objectifs de ltude.
Nous citons par exemple les tudes menes qui cherchent configurer au mieux selon divers
critres de performance tels que le temps de fabrication, le nombre den-cours ou le nombre de
demandes mises en attente (Krajewski et al. 1987, Paris et al.2001).
- 72 -
Plusieurs mthodes doptimisation peuvent tre utilises conjointement la simulation. Les
mthodes doptimisation peuvent tre classes de diffrentes manires : nous les classerons en
mthodes dterministes et mthodes non-dterministes. Les mthodes dterministes sont
gnralement efficaces quand lvaluation de la fonction est trs rapide, ou quand la forme de la
fonction est connue priori. Les cas plus complexes (temps de calcul important, nombreux
optima locaux, fonctions non-drivables, ) seront souvent traits plus efficacement par des
mthodes non-dterministes. Les mthodes non-dterministes font appel des tirages de nombres
alatoires. Elles permettent dexplorer lespace de recherche plus efficacement.
Dans le cas de loptimisation via simulation, la fonction nest pas calcule mais cest le rsultat
dune simulation. Alors, le temps de calcul peut tre trs important.
Dans ce qui suit nous rappelons quelques mthodes doptimisation non-dterministes.
3.2.1.1.Le recuit simul
La mthode du recuit simul a t introduite par (Kirkpatrick et al.1983). Le recuit simul est une
mtaheuristique inspire dun processus utilis en mtallurgie. Il est bas sur lutilisation de
cycles de chauffage et de refroidissement dun mtal qui tendent amliorer sa qualit en jouant
sur lorganisation des molcules afin dobtenir une structure rgulire. On parle alors
darrangement cristallin. Il est aujourdhui utilis en optimisation pour rechercher les optimas
locaux dune fonction.
Cette mthode doptimisation sappuie sur les travaux de (Metropolis 1953) qui permettent de
dcrire lvolution de lquilibre thermodynamique dun systme, la fonction objectif
minimiser tant lnergie E du matriau. Partant dune solution initiale, on gnre une solution
proche de manire alatoire afin dobtenir un voisin de ltat de dpart. Soit celui-ci amliore le
critre que lon cherche optimiser, soit il le dgrade.
Si la solution amliore la fonction objectif , cette dernire est automatiquement accepte. En
ritrant le processus, on tend ainsi chercher loptimum dans le voisinage de la solution de
dpart. Si le voisin ne rentre pas dans la fonction objectif , il peut quand mme tre accept
suivant une probabilit p. Lacceptation dune mauvaise solution permet alors dexplorer une
plus grande partie de lespace de solution et tend viter de senfermer trop vite dans la
- 73 -
recherche dun optimum local. On introduit galement un paramtre fictif, la temprature T.
Cette dernire est plutt leve au dbut de lalgorithme et permet de se dgager des optimas
locaux. Au fur et mesure que les itrations de lalgorithme se font, la temprature diminue selon
une stratgie propre au problme que lon souhaite rsoudre afin dintensifier la recherche du
point optimal mais cette fois-ci localement.
Collins et al. (Collins et al. 1988) et Hajek (Hajek 1988) ont propos plusieurs tempratures. Des
informations complmentaires peuvent tre trouves, par exemple, dans Van Laarhoven et Aarts
(Van Laarhoven et al. 1987) ou Eglese (Eglese 1990). Le recuit simul est largement utilis en
optimisation via simulation. Manz et al. (Manz et al. 1989) optimisent un systme de production
automatis par recuit simul. Haddock et Mittenthal (Haddock et al. 1992) utilisent le recuit
simul pour maximiser le profit dans un systme de production automatis comprenant 4
machines desservies par un carrousel. Dans les travaux de Jayaraman et Ross (Jayaraman et al.
2003), le recuit simul est utilis pour optimiser la conception dun systme de distribution ainsi
que ses futures stratgies dutilisation.
3.2.1.2. Les algorithmes volutionnistes
Les algorithmes volutionnistes (AE) sont des mthodes heuristiques de recherche qui mettent en
application les ides bases sur le processus d'volution naturelle (Spear et al. 1993, Reeves
1993). Les algorithmes volutionnistes recouvrent diverses mthodes telles que les algorithmes
gntiques (Holland 1975, Goldberg 1989), la programmation gntique, les stratgies
volutionnistes ou la programmation volutionniste. Il nexiste cependant aucune liste prcise
dcrivant lensemble des AE dans la mesure o il nexiste aucune dfinition standard (Bck
1996). Contrairement aux solutions simples utilises dans des mthodes traditionnelles, les AE
travaillent sur une population des solutions de faon ce que les solutions faibles disparaissent,
tandis que les bonnes solutions voluent pour atteindre loptimum. Chaque solution, appele
aussi individu , est code via un vecteur X
n
(appel chromosome et constitu de n gnes)
auquel sera associe une performance, appele fitness . Dans le cas dune approche
doptimisation via simulation, ce vecteur est constitu des paramtres dentre du modle de
simulation et sa performance est un rsum du comportement du systme ainsi paramtr (Pflug
1984, Pierreval et Tautou 1997). Classiquement, ces algorithmes commencent leur recherche
dune solution optimale partir dun ensemble de solutions potentielles, appel population .
Les AE vont faire voluer cette population vers une population suppose contenir la meilleure
- 74 -
solution. Pour cela, ils utilisent le cycle valuation-reproduction suivant : chaque itration,
appele gnration , certaines solutions sont slectionnes en fonction de leur performance
partir de la population courante. Ces solutions vont tre soumises des oprateurs de mutation et
de recombinaison, processus appel reproduction. La recombinaison va permettre un mlange
des informations portes par les parents qui seront transmises aux descendants ; la mutation va
introduire des lments nouveaux dans la population. Dune gnration lautre, la population est
constitue de solutions globalement plus performantes. Il y a un intrt important pour les AE
dans le cadre de loptimisation via simulation notamment parce quils n'exigent pas dhypothses
restrictives ou de connaissances priori sur la forme de la surface de rponse (Bck et Schwefel
1993). Parmi les diffrentes tudes dans lesquelles les algorithmes volutionnistes obtiennent de
bons rsultats, on peut citer Tautou et Pierreval (1995) ou Dolgui et al. (2000). Dans Azadivar et
Tompkins (1999), on voit que lalgorithme gntique utilis permet loptimisation non seulement
de variables numriques classiques comme le nombre de machines mais aussi de variables
qualitatives ou mme de la structure mme du systme. Paris et al. (2001) utilisent la
paralllisation dalgorithmes volutionnistes pour optimiser la configuration dun systme kanban
multi-produit. Bertel et Billaut (2003) comparent une approximation par borne infrieure, un
algorithme liste et un algorithme gntique pour la rsolution dun problme dordonnancement
dun flow-shop hybride deux machines avec re-circulation. Ces travaux soulignent lefficacit
de lalgorithme gntique. Alam et al. (2003) optimisent la planification du process dune
entreprise de fabrication de moules injecter avec un algorithme gntique. Pierreval et al.
(2003) font une tude des diverses approches volutionnistes utilises dans la conception et
lorganisation de systmes de production. De plus, il existe des adaptations dalgorithmes
gntiques pour loptimisation multiobjectif comme dans Alberto et al. (2002). Cependant, les
AE sont aussi reconnus pour tre assez lents et pour fonctionner comme des botes noires dans
le sens o ils napportent rien dautre quune solution que lon espre optimale ou presque
(Huyet, 2004).
3.2.1.3. La recherche tabou
La recherche tabou est une procdure de recherche contrainte, o chaque tape consiste
rsoudre un deuxime problme d'optimisation. En effet, chaque tape, la procdure de
recherche exclut un sous-ensemble de l'espace de solutions. Ce sous-ensemble change durant
lexcution de l'algorithme et est habituellement constitu par les solutions prcdemment
considres. Des informations complmentaires peuvent tre trouves dans Glover (1989) ou
- 75 -
dans Glover et Laguna (1997). 'Un certain nombre de travaux utilisent des procdures de
recherche tabou pour l'optimisation via simulation. Hu (1992) tudie la fiabilit et l'efficacit d'un
algorithme de recherche tabou sur quelques fonctions de test standard et signale qu'il surpasse la
recherche alatoire et l'algorithme gntique utilis sur ces tests. Garcia et Bolivar (1999)
dveloppent un systme de simulation qu'ils appellent simulateur de systme dinventaire
stochastique et optimisent cinq modles stochastiques dinventaire avec diffrentes distributions
de probabilit de demandes et de dlais d'excution par recherche tabou. Lutz et al. (1998) traitent
le problme du lieu et la taille de stockage dans une ligne de fabrication et loptimisent par
recherche tabou. Martin et al. (1998) implmentent quatre variantes de la recherche tabou pour
dterminer le nombre de kanbans et les tailles de lots dans un systme kanban gnrique. Dengiz
et Alabas (2000) appliquent galement un algorithme de recherche tabou un modle de
simulation d'un systme JIT pour trouver le nombre optimal de kanbans (Huyet, 2004).
3.2.1.4. Algorithme dchantillonnage
Cet algorithme a t dvelopp par Kushner (1963). La stratgie de recherche est la suivante :
chaque itration, la prochaine solution est choisie pour tre le point qui maximise la probabilit
de ne pas dpasser la valeur prcdente dune certaine constante positive Yn. Pour un problme
de minimisation, cette mthode choisit des solutions dans les zones o la valeur de la fonction
dvaluation est basse. Au dbut, Y
n
est petite mais augmente mesure que la recherche devient
plus locale afin dacclrer la convergence et dviter dtre pige. Stuckman et Easom (1992)
donnent un aperu des mthodes existantes bases sur ce principe dchantillonnage (i.e., la
mthode de Stuckman, la mthode de Mockus, la mthode de Perttunen) et les comparent
d'autres mthodes telles que lanalyse de sensibilit sur des fonctions de variables continues.
Dans leurs rsultats, il s'avre que ces mthodes surpassent lanalyse de sensibilit (Huyet, 2004).
3.2.1.5. Mthode de surface de gradient
Ho et al. (1992) ont propos la mthode de surface de gradient pour l'optimisation des systmes
dynamiques vnements discrets. Cette mthode diffre d'autres techniques globales de
recherche notamment parce qu'elle emploie des mthodes traditionnelles de recherche pour
explorer globalement une surface de rponse. Elle combine les avantages de la mthodologie de
surface de rponse et des techniques d'estimation de la drive efficaces telles que lanalyse de
perturbation et les estimateurs du maximum de vraisemblance en conjonction avec des
- 76 -
algorithmes d'approximation stochastique. Dans la mthode de surface de gradient, l'estimation
du gradient est obtenue par analyse de perturbation ou par estimateurs du maximum de
vraisemblance, et la surface de gradient est dduite de ces estimations par des mthodes des
moindres carrs comme dans la mthodologie de surface de rponse. Les points zro de la surface
de gradient sont alors pris comme solution optimale. La mthode de surface de gradient est une
mthode de recherche globale parce qu' chaque itration, elle emploie l'information de tous les
points plutt que juste le gradient local. Lavantage de cette mthode est quelle obtient les
estimations du gradient en une seule excution, et elle permet daccder rapidement la
proximit de la solution optimale en raison de son orientation globale. Ho et al. utilisent cette
mthode sur six exemples de rseaux de files dattente, mais ne fournissent pas de rsultats
comparatifs par rapport dautres mthodes (Huyet, 2004).
3.2.2. Le principe dauto apprentissage des rseaux de neurones
Dans notre approche, nous navons pas seulement des seuils numriques optimiser, mais plus
globalement lensemble de la logique de dcision que nous avons reprsente par le vecteur
numrique W, ce vecteur peut tre optimis par une mthode classique doptimisation dans R
n

parmi celles que nous avons cit dans la section prcdente tel que le recuit simul, la recherche
tabou, les algorithmes gntiques, etc.
Cependant, pour valuer la logique exprime par le rseau de neurones nous ne pouvons pas nous
baser sur une fonction explicite ; la complexit et la difficult de reprsenter de telles dcisions
de pilotage dans les systmes de production, ne nous permet pas de dterminer une fonction
mathmatique fixe et efficace pour mesurer la performance des dcisions du rseau de neurones.
Pour cela, la performance de la logique du rseau de neurones prendre les dcisions de pilotage
dun atelier donn sera toujours value via simulation.
Ainsi, pour optimiser la logique exprime par le rseau de neurones, nous nous basons sur:
loptimisation via simulation. Dans notre approche, nous recherchons la meilleure logique dfinie
par W de prise de dcision du rseau de neurones (Figure 24) au regard de notre fonction objectif
f.
- 77 -

Figure 24. Optimisation de la logique de prise de dcision via simulation
Lapproche consiste donc extraire , partir du comportement dynamique dun modle de
simulation de latelier, des connaissances de pilotage. Le modle de simulation permettant
dvaluer si les actions de pilotage sont bonnes, les corrections ncessaires peuvent seffectuer au
niveau des caractristiques W (logique) du rseau de neurones. Lapprentissage consiste donc
adapter les caractristiques du rseau de neurones en fonction des performances des dcisions
prises, values par simulation, que lon va chercher optimiser. Ainsi, lapprentissage peut se
voir comme un problme doptimisation via simulation, dans la mesure o il vise minimiser ou
maximiser une ou plusieurs fonction(s) objectifs qui caractrise(nt) la performance de latelier,
calcules par simulation, en utilisant les caractristiques du rseau de neurones comme variables
de dcision du problme (Wetter et al., 2003). Une fois que le rseau de neurones a appris, il peut
tre alors intgr dans le systme de pilotage global du systme de production considr. La
dmarche globale est rsume dans la figure 25.

- 78 -

Figure 25. La mthode globale de lapprentissage des rseaux de neurones par optimisation via
simulation.

4. Implmentation
Nous distinguons trois modules : le module du rseau de neurones, le module de la simulation et
le module de loptimisation. Dans la premire phase de notre approche de construction de la
logique dcisionnelle du rseau de neurones, les trois modules interagissent (figure 26).
Cependant, dans la deuxime phase dintgration de la logique dcisionnelle dans le systme de
production pour le pilotage, seulement le module de simulation du systme de production tudi
et le module du rseau de neurones communiquent (figure 27).
A chaque fois quune dcision de pilotage doit tre prise un instant t, la simulation communique
au rseau de neurones les caractristiques du systme et son tat W. Ce dernier lui renvoie sa
dcision A
i
. Alors, la simulation applique cette dcision. A la fin de la simulation, la valeur de la
fonction objectif est calcule et communique au module doptimisation qui modifie ainsi les
caractristiques du rseau de neurones, pour optimiser la fonction objectif (figure 25).
- 79 -

Figure 26. Interaction entre les trois modules (la premire phase de lapproche propose)


Figure 27. Interaction entre les deux modules (la deuxime phase de lapproche propose)





- 80 -
4.1. Module de simulation
Pour raliser et construire le module de simulation nous avons utilis le logiciel de simulation
ARENA dans sa version 10.
La description du modle du systme simul se fait l'aide d'un assemblage constitu de mise en
srie, en parallle ou en feedback de diffrents blocs fonctionnels, issus de bibliothques
(templates) dARENA. Une telle approche de modlisation permet d'obtenir une structure du
modle proche de celle du systme (rel) simuler.
Dans ce qui suit nous prsentons quelques notions de base dutilisation du logiciel ARENA pour
la construction dun modle de simulation dun systme de production donn.

4.1.1. Notions de base
Entit
Une entit est un objet qui volue dans les diffrents blocs fonctionnels constituant le modle du
systme. Elle correspond en gnral un objet concret, par exemple, une personne ou une pice
dans un atelier. Le dplacement des entits au sein des diffrents blocs - par exemple le
dplacement de pices dans un atelier - provoque un changement d'tat du modle de simulation.
Attribut
Un attribut est une variable associe individuellement aux entits (la variable est locale) pour
reprsenter leurs tats ou des paramtres qui leur sont propres. Par exemple, chaque entit,
reprsentant une pice circulant dans un atelier, peut avoir les attributs suivants :
- Type_de_piece afin de dsigner le type d'une pice (par exemple, Type_de_piece =A ou
B) ;
- Indice_de_priorite afin de dsigner l'indice de priorit d'une pice (par exemple,
Indice_de_priorite = faible ou importante) ;
- 81 -
- Date_arrivee_ds_le_modele (par exemple, Date_arrivee_ds_le_modele = TNOW).

Variable globale
Une variable globale concerne l'ensemble du modle. Par exemple, la variable TNOW (variable
prdfinie dans SIMAN) dsigne la date laquelle se trouve la simulation, c'est le temps courant
- mis jour chaque avance dans l'chancier des vnements scoulant durant une
simulation du modle.
Le principe de fonctionnement du logiciel ARENA est de suivre chacune des entits voluant
d'un bloc fonctionnel vers un autre dans le modle, de sa cration sa destruction.
Lordonnancement dans le temps des diffrents vnements rattachs l'volution des entits
dans les blocs constituant le modle se fait au travers dun chancier.
Quand une entit est introduite dans un bloc fonctionnel, elle dclenche le service qui lui est
associ, ce qui provoque une modification de l'tat du modle. Un service peut agir :
- Sur l'entit au travers de la valeur de ses attributs. Par exemple, travers un bloc Assign,
on peut affecter l'attribut indice_de_priorite d'une entit reprsentant une pice, prsente
dans le bloc, la valeur importante ;
- Sur les variables globales du modle. Par exemple, le passage dune entit dans un bloc
Delay provoque un retard pur, ce qui aura une consquence sur la variable TNOW.
Un modle labor avec ARENA est sauvegard dans un fichier ayant pour extension .doe et est
constitu :
- D'une partie modle, qui reprsente l'algorithme dcrivant les caractristiques statiques et
dynamiques des diffrents blocs fonctionnels composant le modle ;
- Du cadre exprimental, qui regroupe les donnes prcisant les paramtres spcifiques
une simulation donne (conditions initiales, dure de la simulation, ).
- 82 -
En fait, les entits traversent uniquement les blocs fonctionnels de la partie modle. Considrons
un simple tapis roulant, ayant un temps de transport de 3 units de temps, reprsent par le
modle dcrit comme suit :


Le bloc Create, issu du template Basic Process, est tel qu'une entit est cre partir de linstant
0, ceci toutes les 2 units de temps.
Le bloc Delay, issu du template Advanced Process, force une entit sjourner 3 units de temps
dans le bloc.
Le bloc Dispose, issu du template Basic Process, dtruit toute entit entrant dans le bloc. A
travers le menu Run/Setup/Replication Parameters, on peut notamment fixer :
- Le nombre de rplications (champ Number of Replications),
- Le temps o se termine une rplication (champ Replication Length).


- 83 -

A travers le menu Run/Setup/Project Parameters, on peut notamment donner :
- Un titre au projet (champ Project Title),
- Le nom du programmeur (champ Analyst Name),
- Un commentaire (champ Project Description).

Les 2 fichiers gnrs par SIMAN-ARENA (au format txt) sont accessibles via le menu
Run/SIMAN/View (voir ci-dessous un listage partiel de ces fichiers).
- Fichier Exemple.mod : (partie modle).
- Fichier Exemple.exp : (cadre exprimental).
ARENA permet de construire un modle en proposant des primitives de reprsentation (appeles
par la suite, blocs ou modules) plus ou moins dtailles. Il permet galement de crer des
animations graphiques pour visualiser le comportement du modle durant la simulation. Les blocs
sont regroups dans diffrentes bibliothques (templates).
- 84 -
Afin de bnficier dune animation, nous allons utiliser les templates Basic Process et Advanced
Process. Sont dcrits en Annexe A les templates Blocks et Elements lesquels contiennent des
blocs plus lmentaires ( chacun de ces blocs correspond une ligne dans les fichiers gnrs par
SIMAN-ARENA). Nous prsentons plus de dtails sur lutilisation du logiciel ARENA dans
lAnnexe A.

4.1.2. Lien entre les modles ARENA et les fichiers DLL
Une des particularits du logiciel ARENA que nous utilisons dans notre approche est sa capacit
de communiquer avec des programmes et des logiciels externes.
A partir de lenvironnement dARENA nous manipulons des fichiers DLL crits partir dun
environnement Visual Studios C++. En effet, le logiciel permet lappel des fichiers DLL pour
lexcution dun certain nombre de calculs externes qui sont effectus pendant la simulation et
qui peuvent utiliser plusieurs donnes telles que les variables globales, les attributs des pices
traites dans le modles, des variables systme comme TNOW, etc.
Pour tablir la connexion entre le modle ARENA et les fichiers DLL le logiciel offre la
fonctionnalit Load user-coded .DLL , cette option nous permet dincorporer des modules
cods par lutilisateur dans lenvironnement dARENA pour lutiliser dans des modles
particuliers (ex : calculs externes, importation de donnes calcules paralllement lors de la
simulation). Une fois cette option slectionne nous devons spcifier le nom de notre fichier DLL
dans la case qui correspond.

- 85 -




Pour mettre en uvre cette option, ARENA offre des fonctions prdfinies qui permettent la
communication entre le fichier DLL et le modle de simulation. Nous numrons ci-dessous
quelques fonctions et leurs utilits :
- cevent : Elle a comme argument le numro du bloc Event du modle ARENA et
lindex de lentit traite, son excution est valable lors du passage dune entit par ce
bloc Event .
- cprime : Cette fonction est appele par le modle ARENA au dbut de chaque
rplication de la simulation pour tablir les conditions initiales.
Alors, pour crer notre fichier DLL, nous nous sommes bas sur la proprit dARENA,
dinteragir avec lenvironnement C++.



- 86 -
4.2. Module du rseau de neurones
Un des problmes majeurs des rseaux de neurones a trait la difficult de dcider de leur
architecture : nombre de neurones cachs, nombre de couches caches, leur poids, leurs fonctions
dactivation, et leurs poids. Devant une tche rsoudre par un rseau de neurones il faut dcider
quelles seront ses caractristiques. Ceci se fait souvent de faon ad hoc ; on essaye plusieurs
combinaisons de caractristiques pour un problme donn et on choisit la meilleure combinaison.
En effet, aucune mthode nest connue pour dterminer larchitecture optimale pour un problme
donn (Cornujols et Miclet, 2003).
Dans cette section nous dcrivons le rseau de neurones que nous avons utilis ainsi que les
caractristiques que nous avons choisies. Nous dtaillons son architecture, la ou les fonction(s)
dactivation que nous avons utilises et nous dcrivons ses entres et ses sorties pour le problme
que nous traitons.

4.2.1. Architecture du rseau de neurones
Pour construire un rseau de neurones, il faut tout dabord dfinir, le nombre de couches qui le
composent, les liaisons existantes entre les diffrents neurones et le nombre de neurones prsents
dans chaque couche.
Notre rseau de neurones est constitu de trois couches (voir figure 28):
- Une couche dentre compose des neurones qui reprsentent le vecteur X des paramtres
D et de ltat courant de latelier S(t) lors de la prise de dcision et qui sont communiqus
par de module de la simulation,
- Une couche cache : Le nombre de neurones cachs joue un rle crucial dans le contrle
de la capacit du rseau de neurones. Si le nombre de neurones cachs est trop petit, alors
le rseau possde trop peu de poids et ne peut capter toutes les dpendances qui servent
modliser et prdire les valeurs du processus observ. linverse, si lon augmente le
nombre de neurones cachs, alors le nombre de poids du modle augmente et il devient
possible, pendant la phase doptimisation, de modliser certaines relations qui ne sont que
- 87 -
le fruit de fluctuations statistiques propres lensemble dentranement utilis plutt que
des relations fondamentales de dpendance entre les variables.
- Une couche de sortie compose des neurones qui reprsentent respectivement les actions
A
i
transmettre au module de la simulation.

Figure 28. Architecture du rseau de neurone utilis dans notre approche.

Les liaisons entre les neurones dune couche la couche suivante ont t choisies comme
compltes : chaque neurone de la couche N est reli tous les neurones de la couche N+1. Les
couches sont relies entre elles par des poids qui constituent notre vecteur W quon cherche
optimiser. En effet, pour chaque couche, les donnes dentres X sont multiplies avec le poids
synaptique de chaque arc w
ij
(voir figure 29), liant le neurone i de la couche N au neurone j de la
couche N+1. Aprs cette multiplication, nous additionnons les produits lis au mme neurone de
la couche N+1, pour obtenir la valeur des neurones de la couche N+1. Ensuite, la valeur est
transforme travers une fonction dactivation qui limite les valeurs dans un intervalle born,
ses bornes dpendent de la fonction dactivation utilise (voir figure 29).

- 88 -


Figure 29. Le Principe du calcul du rseau de neurones

4.2.2. Fonction dactivation
Les types de fonctions dactivation (ou fonctions de transfert) sont trs nombreux et dpendent du
type des donnes et de larchitecture du rseau. Voici un rcapitulatif des fonctions dactivation
les plus utilises :

















- 89 -
Tableau 3. Tableau rcapitulatif des diffrents types de fonctions dactivation les plus utilises

Nous utiliserons une fonction tangentielle comme fonction dactivation :

( ) 1
1
2
,
+
=
kx
e
k x f
(18)

- 90 -
Tanh(x)
-1,5
-1
-0,5
0
0,5
1
1,5
-
3
,
6
-
3
,
2
-
2
,
8
-
2
,
4
-
2
-
1
,
6
-
1
,
2
-
0
,
8
-
0
,
4 0
0
,
4
0
,
8
1
,
2
1
,
6 2
2
,
4
2
,
8

Figure 30. Courbe de la tangentielle : y = tanh(x)

Le module du rseau de neurones est dvelopp avec Microsoft Visual C++ et connect
directement au modle de simulation de latelier.

4.2.3. Adaptation des entres/sorties du rseau de neurones aux donnes de la
simulation
Les entres et les sorties du rseau de neurones sont troitement lies au type de problme trait
et dans notre cas ils sont troitement lies aux modles de simulation puisque le rseau de
neurones reoit les donnes partir du modle de simulation et communique ses dcisions aussi
au modle de simulation sous la forme qui convient. Nous dcrivons dans ce qui suit les entres
du rseau de neurones ainsi que ses sorties.
Les entres
Il est important dvaluer distinctement les variables dentre du rseau de neurones issues du
modle de simulation. En effet, les donnes peuvent avoir besoin dtre converties sous une autre
forme pour tre significatives pour un rseau de neurones.
La bonne comprhension du problme pour connatre quel type dinformation est approprie, est
la clef pour dterminer les variables dentre adquates. Comment nos donnes sont reprsentes
- 91 -
et traduites joue galement un rle important dans la capacit du rseau de prendre les dcisions
convenables.
Les sorties
La troisime couche : la couche de sortie donne le rsultat obtenu aprs compilation par le rseau
de neurones des donnes dentre dans la premire couche. Sa taille est directement dtermine
par le nombre de variables qu'on veut en sortie. De mme pour un problme de dtection de client
risque ou pas dans un systme bancaire, la couche de sortie peut tre compose dun seul
neurone valeurs binaires 0 pour dire que le client ne prsente pas de risque pour le systme
et 1 sinon.

4.3. Module de loptimisation
Dans le contexte doptimisation dans lequel nous nous situons dans cette tude, plusieurs
mthodes doptimisation peuvent tre utilises, telles que le recuit simul, les algorithmes
volutionnistes ou la recherche tabou. De plus, ces mthodes sont dj largement exploites dans
le domaine avec succs. Une faon de choisir une mthode plutt quune autre pourrait tre de
prendre en considration si elles ont ou non des paramtres extrieurs rgler.
Dans notre approche nous avons choisi la mthode du recuit simul. Comme nous lavons dj
dfinie dans la section 3 de ce chapitre cette mthode est base sur une analogie avec un principe
thermodynamique. A partir dune solution initiale, une solution voisine est choisie et value. Si
la fonction dvaluation est amliore, cette solution devient la solution courante. Sinon, elle
devient quand mme la solution courante mais avec une probabilit qui dcrot suivant une
certaine loi et en fonction du nombre de solutions dj tudies. Ainsi, si la fonction dvaluation
est dtriore, la rgle dacceptation dune solution Y voisine de Y est base sur une temprature
T qui dpend du nombre de solutions m tudies et sexprime de la manire suivante :
Si un nombre choisi entre 0 et 1 est infrieur
( ) ( )
|
|

\
|
) (
'
exp
m T
Y F Y F
alors on accepte la solution
Y. La solution Y est remplace par Y qui devient la nouvelle solution courante.
- 92 -
Pour optimiser les caractristiques W du rseau de neurones nous citons ci-dessous les diffrentes
tapes de lalgorithme du recuit simul que nous avons utilis.
La solution initiale W
0
est dtermine alatoirement. La perturbation des solutions est base sur
un principe de voisinage dynamique. Soit W
l
le vecteur courant des caractristiques du rseau de
neurones, et l est litration courante du recuit simul.
La solution voisine W
l
est dfinie en deux tapes tel que :
Etape 1 : slectionner alatoirement g(l) lments de W
l
Etape 2 : pour chaque lment slectionn, nous ajoutant un nombre alatoire partir dune loi
normale N(0, s(T
l
)).
Dans lalgorithme que nous utilisons :
( ) ( ) [ ]
10 * /
0
2
* 1 1 ) (
T l
e a E l g

+ = (19)
( ) ( ) [ ] ( )
max 0 0 min max
* / ) ( + = T T T T s
l l
(20)
Avec:
s est une fonction qui prend ses valeurs dans lintervalle [min , max],
E[z] est la partie entire du nombre rel z,
a est le nombre total des caractristiques du rseau de neurones que nous voulons optimiser,
T
0
est la temprature initiale du recuit simul,
T
l
est la temprature courante,
est la condition darrt de lalgorithme qui est initialement choisie.
- 93 -
Les fonctions g(l) et s(T
l
) diminuent progressivement, tout au long des itrations du recuit simul,
avec la diminution de la temprature. Ainsi, les changements effectus au dbut de loptimisation
sont beaucoup plus importants que les changements effectus la fin.
Cette mthode assure la connectivit de lespace de recherche. Le taux de refroidissement et la
temprature initiale ont t empiriquement choisis aprs plusieurs expriences. Le recuit simul
s'arrte quand la temprature est infrieure .
Pour appliquer lalgorithme du recuit simul notre approche, il est vident de ladapter pour
quil interagisse avec le reste des modules.
Dabord, puisque la fonction objectif f nest pas calcule par le recuit simul mais communique
par le module de simulation, il est donc ncessaire de grer cet change sur le plan informatique ;
nous proposons alors un change par un fichier externe fichier performance dans le quel la
simulation crit la performance calcule de f chaque fois la simulation est termine. Ce fichier
sera alors lu par le recuit simul en tant que valeur de la fonction optimiser.
Ensuite, nous proposons aussi un change par un fichier externe pour grer lchange entre le
recuit simul et le module du rseau de neurones ; en effet, le module du rseau de neurones
utilise pour chaque calcul dun choix daction demand par la simulation son fichier (externe) de
caractristiques fichier caractristiques du rseau de neurones . Ce dernier, est modifi
chaque itration du recuit simul, voir (figure 31).
- 94 -

Figure 31. Flux de donnes entre les fichiers externes et les modules : Optimisation, Rseau de
neurones et Simulation.
5. Conclusion
Nous avons donc propos une approche qui assure un pilotage en temps rel des systmes de
production en se basant sur les rseaux de neurones, cette approche sappuie sur un apprentissage
automatique qui ne ncessite ni exemple dapprentissage ni une expertise pralable concernant le
pilotage de latelier que nous voulons optimiser la performance. Comme nous lavons dj
prcis, le rseau de neurones est considr comme le dcideur (il gre le passage des pices sur
les machines, il affecte les bons oprateurs sur les machines libres,) et il prend ses dcisions en
se basant sur ltat rel du systme chaque instant t de prise de dcision. Notre approche, assure
son apprentissage en se basant sur loptimisation via simulation.
Cette approche est illustre dans le chapitre suivant.

- 95 -
Chapitre IV
APPLICATIONS
1. Introduction
Lobjectif de ce chapitre est de valider la faisabilit de lapproche de pilotage en temps rel base
sur les rseaux de neurones dveloppe dans les prcdents chapitres. Les performances du
pilotage sont values par simulation sous ARENA 10.0.
Dans la premire partie de ce chapitre, nous appliquons notre approche pour le pilotage en temps
rel un atelier Flowshop. Nous avons choisi un atelier qui est dj utilis dans la littrature
depuis 1986 par Barett et Barmann (Barett et Barman 1986). Dans ce contexte, il sagit de choisir
les stratgies de passage des pices sur les machines de latelier pour optimiser la fonction
objectif.
Dans la deuxime partie, nous dclinons et validons notre approche sur un autre exemple inspir
des travaux de Fonseca et Navaresse (Fonseca et al. 2002). Cest un atelier Jobshop sur lequel
nous testons les capacits du rseau de neurones du pilotage en temps rel.
2. Exemple 1 : Application de lapproche dapprentissage autonome des
rseaux de neurones pour le pilotage dun atelier Flowshop
2.1. Description de lexemple
Le modle tudi dans ce premier exemple dapplication de notre approche est une reprise dun
modle prcdemment ralis en 1986 par Barrett et Barmann. Lobjectif de ces auteurs tait
alors dtudier linfluence des rgles de priorit sur les files dattente dun atelier flowshop. Nous
avons repris ce mme modle pour permettre une comparaison des rsultats (Mouelhi et al.
2007c).
Latelier que nous avons considr est un atelier flowshop constitu de deux centres dusinage
workcenter 1 (WC1) et workcenter 2 (WC2) ralisant lun aprs lautre lusinage des pices
(Figure 32). Chaque centre de travail est compos de deux machines identiques. Les machines de
- 96 -
chaque centre sont capables de raliser les mmes oprations ; cependant, les oprations du
workcenter 1 sont diffrentes de celles de workcenter 2.
son arrive dans latelier, chaque pice, est traite squentiellement, dabord dans workcenter 1
ensuite dans workcenter 2. Si les deux machines dun centre de travail sont occupes alors la
pice attend dans la file dattente en amont du centre de travail jusqu ce quune machine soit
disponible.
Au niveau du workcenter 2, 10% des pices usines doivent subir une retouche sur lune des deux
machines du centre de travail. Ces pices retoucher sont prioritaires par rapport aux pices en
attente dusinage.
Chaque machine aprs avoir usin cinquante pices, reste hors service pendant une dure de 0.5
units de temps, puis sera remise en service.


Figure 32. Latelier flowshop. (Barett et Barman, 1986)

- 97 -


Dans ce systme lobjectif est de minimiser le retard moyen (meantardiness) qui est la moyenne
des retards obtenus pour les pices usines dans cet atelier, en choisissant des rgles de priorit
optimales pour les files dattente.
Les actions de pilotage consistent ici dterminer en temps rel quelles pices doivent passer sur
les centres dusinage. Pour cela on dcide de changer dynamiquement les rgles de priorit
dterminant lordre des pices (Pierreval, 1992b).
Les rgles de priorit utilises dans cet exemple sont: {FIFO, EDD, SPT, LPT, LIFO} qui sont
utilises dans le premier centre de travail de latelier workcenter 1. Et {EDD, SPT, LPT, FAS}
qui sont utilises dans le deuxime centre de travail de latelier workcenter 2 avec :
FIFO : First In First Out
La pice entre en premier dans la file dattente est traite en premier. Cest la rgle du premier
arriv, premier servi .

LIFO : Last In First Out
Cette rgle est similaire la prcdente mais cest la dernire pice arrive qui est traite en
premier.

SPT : Shortest Processing Time
Donne la priorit aux pices ayant le plus faible temps de process : la pice ayant le plus faible
temps de process sera traite en premier.

LPT : Longest Processing Time
La pice ayant le plus long temps de process sera traite en premier.

EDT : Earliest Due Date La pice devant donc tre livre la premire sera traite en premier.

FAS : First Arrived at Shop
- 98 -
Cette rgle permet de traiter en priorit les pices entres en premier dans latelier. Cette rgle
nest donc pas judicieusement applicable la premire file dattente car identique alors la rgle
FIFO.
2.2. Exprimentations
Chaque simulation dure 15000 units de temps, avec une priode transitoire de 7000 units de
temps, ce qui correspond une simulation de 4 annes de travail de production dans latelier.
Les attributs des pices sont dfinis grce des lois stochastiques. Les paramtres de
latelier sont prsents ci-dessous.
Pour chaque simulation, il est possible de choisir la charge de latelier. Lutilisateur peut choisir
entre une charge lourde (91%), moyenne (86%) et faible (81%). Il sagit du Shopload.
Le temps de process des pices peut galement varier en changeant la dispersion des commandes.
Deux options se prsentent : une dispersion forte ou faible ce qui correspond donc une
Dviation Standard de 0,3 ou 0,6.
Les lois dfinissant les caractristiques des pices sont les suivantes :
- Loi darrive des pices dans latelier : exp(1)
- Temps de process = Exp(2. Shopload) + N (0, )
Avec Shopload correspond la charge de latelier et N(0, ) valeur slectionne par la
distribution de loi normale de moyenne 0 et de dviation standard gal au choix de dispersion.
- Date de livraison

+ =
ij i i
p a D
Avec a
i
correspond au temps darrive dans latelier de la pice
correspond au facteur de retard (ici nous prendrons 3)
p
ij
correspond au temps de process dune entit i sur une machine j.
- 99 -
Le modle de latelier flowshop
La modlisation de latelier avec le logiciel ARENA 10.0 est dcrite ci-dessous.
La pice aprs avoir t cre, est dfinie par des attributs (temps de process) puis passe par le
poste workcenter 1, puis par le poste workcenter 2. Enfin, ses caractristiques sont analyses et le
meantardiness du systme est actualis, avant dvacuer la pice de latelier.
Ds que les pices arrivent dans le workcenter 1, elles sont places dans une file dattente avant
dtre choisies par la rgle de priorit. Une foi choisie, la pice va tre usine (bloc Delay) puis
avant dtre vacuer de la machine (par le bloc Release), elle va tre duplique pour lancer une
analyse de la premire file dattente. Aprs analyse, les nouvelles donnes sont mises jours, et
le bloc Event fait appel au rseau de neurones pour choisir la bonne rgle de priorit
correspondant ces donnes dentre. La recherche de la prochaine pice usiner est alors
effectue et celle-ci est dplace en premire position dans la premire file dattente. Enfin, La
pice traite est relche.
Le principe de fonctionnement de la modlisation de workcenter 2 reste la mme que pour
workcenter 1. La seule exception, est lajout dun test en fin dusinage pour savoir si des
retouches sont applicables, si oui elles sont ralises de suite.
Avant dtre vacue de latelier, la pice est analyse. Nous observons si elle est en retard ou
non. Si tel est le cas le meantardiness est mis jour. La pice est par la suite supprime de
latelier.
2.2.1. Le module du rseau de neurones
Nous avons propos deux manires diffrentes de prendre les dcisions dans les deux files
dattente:
a) nous avons considr un seul rseau de neurones qui prend les dcisions pour les deux
files dattente. Dans cette premire proposition nous indiquons chaque fois dans le
vecteur X des entres du rseau de neurones le numro de la file dattente traite (1
pour la premire file dattente ou 2 pour la deuxime file dattente).
- 100 -
b) Nous avons considr un rseau de neurones pour chaque file dattente : c'est--dire
nous considrons deux dcideurs chacun choisit une rgle de priorit pour la file
dattente qui le concerne.
2.2.1.1. Les entres du rseau de neurones : un rseau de neurones pour les deux
files dattente
Tableau 4. Variables dentre du rseau de neurones communiques par la simulation
(proposition dun rseau de neurones pour les deux files dattente)
# Variables du vecteur dentre du rseau de neurones
1 Nombre de pices en attente dans la premire file dattente Q1.
2 Nombre de pices en attente dans la deuxime file dattente Q2.
3 Numro de la file dattente traite.
4 Temps opratoire moyen sur le worckcenter 1 des pices en attente dans la
premire file dattente.
5 Temps opratoire minimum sur le worckcenter 1 des pices en attente dans la
premire file dattente.
6 Temps opratoire maximum sur le worckcenter 1 des pices en attente dans
la premire file dattente.
7 Temps opratoire moyen sur le worckcenter 2 des pices en attente dans la
premire file dattente.
8 Temps opratoire minimum sur le worckcenter 2 des pices en attente dans la
premire file dattente.
9 Temps opratoire maximum sur le worckcenter 2 des pices en attente dans
la premire file dattente.
10 Temps opratoire moyen sur le worckcenter 2 des pices en attente dans la
deuxime file dattente.
11 Temps opratoire minimum sur le worckcenter 2 des pices en attente dans
la deuxime file dattente.
12 Le temps opratoire maximum sur le worckcenter 2 des pices en attente
dans la deuxime file dattente.
13 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 1 < 1.5 units de temps.
14 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 1 entre 1.5 et 3 units de temps.
15 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 1 entre 3 et 4.5 units de temps.
- 101 -
16 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 1 > 4.5 units de temps.
17 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 2 < 1.5 units de temps.
18 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 2 entre 1.5 et 3 units de temps.
19 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 2 entre 3 et 4.5 units de temps.
20 Pourcentage des pices dans la premire file dattente ayant un temps
opratoire sur le worckcenter 2 > 4.5 units de temps.
21 Pourcentage des pices dans la deuxime file dattente ayant un temps
opratoire sur le worckcenter 2 < 1.5 units de temps.
22 Pourcentage des pices dans la deuxime file dattente ayant un temps
opratoire sur le worckcenter 2 entre 1.5 et 3 units de temps.
23 Pourcentage des pices dans la deuxime file dattente ayant un temps
opratoire sur le worckcenter 2 entre 3 et 4.5 units de temps.
24 Pourcentage des pices dans la deuxime file dattente ayant un temps
opratoire sur le worckcenter 2 > 4.5 units de temps.
25 Pourcentage des pices dans la premire file dattente ayant un slacktime
positif.
26 Pourcentage des pices dans la premire file dattente ayant un slacktime
ngatif.
27 Pourcentage des pices dans la deuxime file dattente ayant un slacktime
positif.
28 Pourcentage des pices dans la deuxime file dattente ayant un slacktime
ngatif.
2.2.1.2. Les entres du rseau de neurones : un rseau de neurones pour chaque file
dattente
Nous utilisons dans cette proposition deux rseaux de neurones, les tableaux :tab 1 et tab 2 ,
prsentent respectivement les entres du rseau de neurones de la premire file dattente et le
rseau de neurones de la deuxime file dattente.


- 102 -
Tableau 5. Variables dentres du premier rseau de neurones de la premire file dattente
communiques par la simulation.
# Variables du vecteur dentre du rseau de neurones
1 Nombre de pices en attente dans la premire file dattente Q1.
2 Nombre de pices en attente dans la deuxime file dattente Q2.
3 Temps opratoire moyen sur le worckcenter 1 des pices en attente dans la premire
file dattente.
4 Temps opratoire minimum sur le worckcenter 1 des pices en attente dans la
premire file dattente.
5 Temps opratoire maximum sur le worckcenter 1 des pices en attente dans la
premire file dattente.
6 Temps opratoire moyen sur le worckcenter 2 des pices en attente dans la premire
file dattente.
7 Temps opratoire minimum sur le worckcenter 2 des pices en attente dans la
premire file dattente.
8 Temps opratoire maximum sur le worckcenter 2 des pices en attente dans la
premire file dattente.
9 Temps opratoire moyen sur le worckcenter 2 des pices en attente dans la deuxime
file dattente.
10 Temps opratoire minimum sur le worckcenter 2 des pices en attente dans la
deuxime file dattente.
11 Le temps opratoire maximum sur le worckcenter 2 des pices en attente dans la
deuxime file dattente.
12 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 1 < 1.5 units de temps.
13 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 1 entre 1.5 et 3 units de temps.
14 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 1 entre 3 et 4.5 units de temps.
15 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 1 > 4.5 units de temps.
16 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 2 < 1.5 units de temps.
17 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 2 entre 1.5 et 3 units de temps.
18 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 2 entre 3 et 4.5 units de temps.
- 103 -
19 Pourcentage des pices dans la premire file dattente ayant un temps opratoire sur le
worckcenter 2 > 4.5 units de temps.
20 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 < 1.5 units de temps.
21 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 entre 1.5 et 3 units de temps.
22 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 entre 1.5 et 3 units de temps.
23 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 entre 3 et 4.5 units de temps.
24 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 > 4.5 units de temps.
25 Pourcentage des pices dans la premire file dattente ayant un slacktime positif.
26 Pourcentage des pices dans la premire file dattente ayant un slacktime ngatif.
27 Pourcentage des pices dans la deuxime file dattente ayant un slacktime positif.
28 Pourcentage des pices dans la deuxime file dattente ayant un slacktime ngatif.

Tableau 6. Variables dentres du deuxime rseau de neurones de la deuxime file dattente
communiques par la simulation.
# Variables du vecteur dentre du rseau de neurones
1 Nombre de pices en attente dans la deuxime file dattente Q2.
2 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 < 1.5 units de temps.
3 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 entre 1.5 et 3 units de temps.
4 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 entre 3 et 4.5 units de temps.
5 Pourcentage des pices dans la deuxime file dattente ayant un temps opratoire sur
le worckcenter 2 > 4.5 units de temps.
9 Pourcentage des pices dans la deuxime file dattente ayant un slacktime positif.
10 Pourcentage des pices dans la deuxime file dattente ayant un slacktime ngatif.
11 Pourcentage des pices qui ont un slacktime < -10
12 Pourcentage des pices qui ont un slacktime entre -10 et -5
13 Slacktime minimum
14 Slacktime maximum
15 Temps opratoire moyen sur le worckcenter 2 des pices en attente dans la deuxime
file dattente.
- 104 -
16 Temps opratoire minimum sur le worckcenter 2 des pices en attente dans la
deuxime file dattente.
17 Le temps opratoire maximum sur le worckcenter 2 des pices en attente dans la
deuxime file dattente.

2.2.1.3.Sorties du rseau de neurones
Les rgles de priorits sont reprsentes par les numros de 1 5 (ou 6 pour la file 2) pour chaque
WC (Tableau 7), cela nous permet de faire la correspondance entre la valeur de sortie calcule et
un numro de rgle de priorit.
Tableau 7. Les rgles de priorits
Rgle de priorit
Numro
File 1 File 2
1 FIFO FIFO
2 LIFO LIFO
3 SPT SPT
4 LPT LPT
5 EDT EDT
6 FAS



2.2.1.4. Architecture du rseau de neurones

Nous avons utilis une architecture de trois couches pour toutes nos exprimentations. Et nous
avons considr diffrentes configurations pour la couche cache ; nous avons vari le nombre de
neurones dans cette couche, et ceci est pour les deux propositions que nous avons considr (un
rseau de neurones pour les deux files dattente et un rseau de neurones pour chaque file
dattente).

Le nombre de poids que nous allons optimiser dpend du nombre de neurones que nous
choisissons mettre dans la couche cache.

- 105 -
2.2.2. Le module doptimisation
Comme nous lavons expliqu dans le chapitre prcdent, nous utilisons pour notre approche la
mthode du recuit simul pour optimiser le vecteur de poids W du rseau de neurones.
Nous rappelons ci-dessous le voisinage variable que nous utilisons :
La solution voisine W
l
est dfinie en deux tapes tel que :
Etape 1 : slectionner alatoirement g(l) lments de W
l
Etape 2 : pour chaque lment slectionn, nous ajoutant un nombre alatoire partir dune loi
normale N(0, s(T
l
)).
Dans lalgorithme que nous utilisons :
( ) ( ) [ ]
10 * /
0
2
* 1 1 ) (
T l
e a E l g

+ = (21)
( ) ( ) [ ] ( )
max 0 0 min max
* / ) ( + = T T T T s
l l
(22)
Avec:
s est une fonction qui prend ses valeurs dans lintervalle [min , max],
E[z] est la partie entire du nombre rel z,
a est le nombre total des caractristiques du rseau de neurones que nous voulons optimiser,
T
0
est la temprature initiale du recuit simul,
T
l
est la temprature courante,
est la condition darrt de lalgorithme qui est initialement choisie.
- 106 -
Les fonctions g(l) et s(T
l
) diminuent progressivement, tout au long des itrations du recuit simul,
avec la diminution de la temprature. Ainsi, les changements effectus au dbut de loptimisation
sont beaucoup plus importants que les changements effectus la fin.
Plusieurs paramtres dans lalgorithme du recuit simul que nous utilisons sont dfinis par
lutilisateur tel que la temprature initiale T
0
, la condition darrt , etc. Le tableau ci-dessous
(Tableau 8) reprend toutes les variables que nous devons initialiser pour chacune de nos
exprimentations. Dans la section qui suit (Rsultats des exprimentations) nous prsenterons
chaque exprimentation les valeurs de ces variables.
Tableau 8. Les paramtres du recuit simul initialiser par lutilisateur








2.3. Rsultats des exprimentations
D'abord, beaucoup d'exprimentations ont t menes afin de dterminer une bonne topologie
pour le rseau de neurones (nombre de neurones dans la couche cache) et les bons paramtres
pour l'algorithme de recuit simul. L'optimisation commence partir d'un vecteur initial de poids
obtenus alatoirement. Pendant l'optimisation de ces poids avec diffrents nombres de neurones
Paramtres du recuit simul initialiser par lutilisateur Value
Temprature initiale T
0

Taux de refroidissement r
La borne suprieure de lintervalle [
min
,
max
] o la fonction s
prend ses valeurs.

max

Nombre ditrations sans baisse de la temprature pour chaque
palier de temprature trait.
k
La borne infrieure de lintervalle [
min
,
max
] o la fonction s
prend ses valeurs.

min

La condition darrt
- 107 -
dans la couche cache, nous avons considr seulement 10 rplications pour chaque run de
simulation, pour conomiser le temps de calcul.
la fin du processus d'optimisation, une fois les poids sont optimiss, nous avons utilis 50
rplications pour comparer les dcisions des rseaux de neurones expriments avec les
meilleures combinaisons de rgles de priorit trouves par Barrett et le Barman (1986).
2.3.1. Les meilleures combinaisons de rgles de priorit trouves par Barrett et le
Barman (1986)
Nombre de rpliques : 50
Le choix arbitraire du coefficient K :2
Shopload :91%

Tableau 9. Retards moyens obtenus partir des meilleures combinaisons de rgles de priorit
proposes par Barrett et Barmann
Combinaison des rgles Le retard moyen du modle
FIFO-FIFO 17.76443
EDD-EDD 11.99342
EDD-SPT 7.27360
SPT-EDD 6.67160
SPT-FIFO 9.33060
SPT-SPT 3.69815
EDD-FIFO 14.00025

En se basant sur les rsultats trouvs par Barrett et Barman nous constatons que les deux
meilleures combinaisons des rgles de priorit pour minimiser le retard moyen sont SPT-EDD
et SPT-SPT qui ont pu rduire le retard moyen de latelier respectivement 6.67160 units de
temps et 3.69815 units de temps.
Dans la section suivante nous comparons les rsultats trouvs par les rseaux de neurones
avec les meilleurs rsultats trouvs par Barrett et Barman
- 108 -
2.3.2. Les rsultats obtenus par le rseau de neurones
Dans un premier temps, nous avons considr un seul rseau de neurones pour les deux files
dattente, et chaque fois que notre modle de simulation fait appel la dcision du rseau de
neurones, le numro de la file concerne est communiqu au rseau.
Dans ce qui suit, nous prsentons les diffrents rsultats que nous avons obtenus en variant le
nombre de neurones de la couche cache et les diffrents paramtres du Recuit Simul.
Compte tenu des objectifs de ces essais rappels au dbut de ce chapitre, la performance du
rseau de neurones est value en regard de la minimisation du retard moyen dans notre atelier
flowshop.
La contribution de lapproche que nous proposons se mesure essentiellement au regard de la
capacit du rseau de neurones apprendre prendre les bonnes dcisions. Par exemple, dans le
tableau 10 nous prsentons les rsultats obtenus des dcisions prises par un rseau de neurones
avec trois neurones cachs. En effet, en analysant les rsultats, on saperoit que le rseau de
neurones a obtenu de trs mauvais rsultats pendant les premires itrations du recuit simul, tels
quils sont attendus puisque le rseau de neurones na pas encore appri.
Dans le tableau 10 nous prsentons les rsultats obtenus par un rseau de neurones avec trois
neurones cachs (le nombre de neurones dans la couche cache = 3).
Tableau 10. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 3.
Les paramtres du Recuit Simul Retard moyen obtenu par
le rseau de neurones
T
0
r
max

min
K Nombre
ditrations
Temps
CPU
(minutes)
Avant
apprentissage
Aprs
apprentissage
2500 0.80 5 1 0.002 3 125 5875 17.879820 6.185470
3000 0.75 10 2 0.001 3 155 7285 27.564432 4.335690
4500 0.85 15 3 0.001 2 188 8836 23.944312 5.677310
Ensuite, tout au long de loptimisation de ses poids par le recuit simul, le rseau de neurones
permet de diminuer le retard moyen dans latelier. Nous nous apercevons quaprs optimisation
le rseau de neurones arrive combiner les six rgles de priorit dans le but de minimiser le
- 109 -
retard moyen dans latelier. Alors, il est devenu capable de choisir les combinaisons des rgles
sans se baser ni sur une expertise pralable, ni sur un ensemble dapprentissage.
Les rsultats obtenus montrent une nette amlioration des retards calculs la base des dcisions
du rseau de neurones au dbut de son apprentissage par rapport aux retards calculs la base des
dcisions du rseau de neurones aprs son apprentissage. Cette constatation est vrifie pour
toutes les configurations des rseaux de neurones que nous avons utiliss (3 neurones cachs
tableau 10, 5 neurones cachs tableau 11, 7 neurones cachs tableau 12 et 12 neurones cachs
tableau 13). Ceci sexplique par le fait que pour chaque rseau de neurones nous partons dune
matrice de poids alatoires.
Dans les tableaux de rsultats que nous prsentons pour ce premier exemple (tableau 10, tableau
11, tableau 12 et tableau 13) chaque ligne reprsente un cycle (ou run) dapprentissage du rseau
de neurones, au dbut de chaque cycle dapprentissage le rseau de neurones ne ralise pas de
bonne performance puisque comme nous lavons expliqu prcdemment il na pas encore
appris. Cependant une fois quil a apprit, nous obtenons des performances trs intressantes.
Dans le tableau ci-dessous (Tableau 11) nous prsentons les rsultats obtenus par un rseau de
neurones avec cinq neurones cachs (le nombre de neurones dans la couche cache = 5).
Tableau 11. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 5.
Les paramtres du Recuit Simul Retard moyen obtenu par
le rseau de neurones
T
0
r
max

min
k Nombre
ditrations
Temps
CPU
(minutes)
Avant
apprentissage
Aprs
apprentissage
2500 0.80 5 1 0.002 2 125 5875 19.532210 5.177560
4500 0.90 25 5 0.0005 3 455 21385 21.437230 3.61277
7000 0.90 20 5 0.0001 3 514 24158 25.430000 3.44712
3000 0.85 20 5 0.001 3 275 12925 32.565500 4.855220

- 110 -
Dans le tableau ci-dessous (Tableau 12) nous prsentons les rsultats obtenus par un rseau de
neurones avec sept neurones cachs (le nombre de neurones dans la couche cache=7).
Tableau 12. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 7.
Les paramtres du Recuit Simul Retard moyen obtenu par
le rseau de neurones
T
0
r
max

min
k Nombre
ditrations
Temps
CPU
(minutes)
Avant
apprentissage
Aprs
apprentissage
4000 0.90 20 5 0.0002 2 319 14993 26.667120 5.244570
2000 0.90 15 3 0.008 2 235 11045 31.366120 4.484630
4000 0.85 18 1 0.001 2 187 8695 29.787250 4.328930
Dans le tableau ci-dessous (Tableau 13) nous prsentons le rsultat obtenu par un rseau de
neurones avec douze neurones cachs (le nombre de neurones dans la couche cache = 12).
Tableau 13. Le rsultat de lexprimentation de lapprentissage du rseau de neurones avec
nombre de neurones dans la couche cache est 12.
Les paramtres du Recuit Simul Retard moyen obtenu par
le rseau de neurones
T
0
r
max

min
k Nombre
ditrations
Temps
CPU
(minutes)
Avant
apprentissage
Aprs
apprentissage
5000 0.90 30 5 0.0005 3 453 21291 34.655270 7.003410

Par ailleurs, nous constatons que le choix des paramtres du recuit simul a un impact
considrable sur la qualit dapprentissage des rseaux de neurones. Nous pouvons dduire
daprs les configurations que nous avons ralises et qui sont prsentes dans les quatre tableaux
de rsultats que le nombre ditrations dans chaque cycle (run) est troitement li lamlioration
- 111 -
des dcisions prises par les rseaux de neurones (minimisent le retard moyen), en effet, plus le
nombre ditrations est lev, plus lapprentissage des rseaux de neurones est amlior, mais
ceci tant que le recuit simul na pas tait bloqu dans un minimum local.
En ce qui concerne limpact de la temprature initiale T
0
sur les performances des rseaux de
neurones nous pouvons constater travers nos exprimentations empiriques que nous pouvons
raliser un bon apprentissage avec des tempratures leves, comme nous pouvons avoir aussi un
bon apprentissage avec des tempratures qui ne sont pas trop leves, par exemple (tableau 10 ) :
le rseau de neurones 3 neurones cachs a pu atteindre dans le deuxime cycle dapprentissage
que nous prsentons (la deuxime ligne du tableau) un retard moyen de 4.335690 partir dune
temprature initiale T
0
= 3000, comme il a atteint dans le troisime cycle dapprentissage que
nous prsentons (la troisime ligne du tableau) un retard moyen de 5.677310 partir dune
temprature initiale plus leve T
0
= 4500. En effet, en se basant sur le principe du recuit simul,
nous rappelons que temprature nulle, le systme volue partir d'une configuration vers la, ou
les, configurations d'nergie les plus basses par une mthode de type gradient. Par consquent,
dans le cas d'un systme frustr, la configuration atteinte est le plus souvent un tat mtastable,
dont l'nergie est suprieure celle du minimum absolu. Le systme est en quelque sorte pig
dans ce minimum local (Figure. 33), suivant la configuration initiale, indique par les flches, la
dynamique aboutit temprature nulle dans l'un quelconque des minima relatifs, spars par les
barrires indiques en pointills. A temprature leve, les processus probabilistes permettent au
systme de sauter les barrires sparant les valles.


Figure 33. Un paysage d'nergie bas sur le recuit simul.
En revanche, temprature non nulle, le caractre probabiliste des changements de configuration
peut permettre au systme de remonter la pente et de ressortir du bassin d'attraction d'un
minimum relatif pour accder un autre bassin plus profond. Idalement, pour se rapprocher du
- 112 -
minimum, il faudrait que la temprature soit assez grande pour permettre au systme de sauter
les barrires et qu'elle soit assez faible pour qu'il soit malgr tout attir vers le fond des valles.
Le plus intressant est alors denvisager une double dynamique: celle de la recherche des minima
temprature fixe, plus une dynamique de diminution de la temprature. Si l'on part d'une
temprature leve, toutes les configurations sont accessibles et le systme n'a qu'une faible
prfrence pour les tats de faible nergie. En diminuant progressivement la temprature par un
ratio r de la baisse de temprature pas trop lev, on permet au systme de rechercher des bassins
d'attraction relativement larges au dbut, tout en lui vitant d'tre pig par les attracteurs
mtastables. Ce qui explique lobtention dun retard moyen plus performant (la deuxime ligne
du tableau : un retard moyen de 4.335690 partir dune temprature initiale T
0
= 3000) en
partant dune temprature moins leve que celui dun retard moyen dun apprentissage partant
dune temprature plus leve, puisque le premier est bas sur un ratio de baisse de temprature
(r =0.75) moins lev que le second (r =0.85).
De plus nous avons obtenu de meilleurs rsultats que ceux obtenus par Barrett et Barman (Barrett
et Barman, 1986). En effet, en partant dune matrice alatoire de poids dun rseau de neurones
cinq neurones cachs, le retard moyen dans latelier a diminu de 21.437230 units de temps
3.61277 units de temps en 455 itrations du recuit simul. De plus pour la mme configuration
du rseau de neurones (5 neurones cachs) le retard moyen dans latelier a diminu de 25.43
units de temps 3.44712 units de temps en 514 itrations du recuit simul.
Par ailleurs, si nous considrons les temps de nos calculs (CPU) nous constatons que
typiquement, un cycle dapprentissage de 155 itrations (run doptimisation via simulation) qui
utilise le modle de simulation de notre atelier flowshop de 10 rplications et une priode de
simulation de 4 ans, exige 7285 minutes sur un PC avec Intel Pentium 4, CPU 3,80 GHz et 2
Go de mmoire RAM. C'est--dire, 47 minutes pour chaque itration du recuit simul. Certes,
cest temps important, mais cest le temps dapprentissage dun rseau de neurones. En effet, la
phase dapprentissage ncessite suffisamment de temps pour que le rseau de neurones puisse
finir son cycle dapprentissage et atteint la performance qui lui permettra de prendre les bonnes
dcisions. Llment essentiel des rseaux de neurones est quils peuvent capter les dpendances
non-linaires de haut niveau entre les variables dentre, ce qui est possible grce la prsence
dune transformation, elle-mme non-linaire, dans le calcul de la valeur prdite. Cependant, ils
ne peuvent acqurir cette dpendance non-linaire que sils ont suffisamment appris, ce qui
explique en partie le temps dapprentissage lev quils ncessitent.
- 113 -
Dautre part, le but de notre choix dun atelier dj existant dans la littrature pour pouvoir
comparer et valuer les performances des rseaux de neurones, nous a oblig de simuler sur une
longue dure de quatre annes (conformment aux caractristiques de latelier flowshop de Barett
et Barmann), ce qui explique en partie le temps dapprentissage des rseaux de neurones, puisque
chaque itration de recuit simul dans le cycle dapprentissage on value le retard moyen
gnr par les nouvelles dcisions prises par les rseaux de neurones aprs optimisation de leurs
poids.
Nanmoins, une fois appris, le rseau de neurones prend les bonnes dcisions qui optimisent la
fonction objectif dans latelier en fraction de seconde. En effet, le calcul lui-mme de la dcision
du rseau de neurones ne ncessite pas un temps de calcul (CPU) important mais cest le temps
dapprentissage qui inclut chaque fois lvaluation via le modle de simulation qui ncessite un
temps trs important. Ds que nous intgrant le rseau de neurones (sans le module
dapprentissage par optimisation via simulation) dans latelier rel pour quil prenne ses dcisions
en temps rel, nous ne parlons plus alors dun temps de calcul pour la prise de dcisions puisquil
est ngligeable.
Dans le tableau qui suit nous prsentons les performances de deux rseaux de neurones diffrents
dans notre modle le premier servira dterminer le choix de rgles de priorit dans la premire
file dattente. Alors que le deuxime rseau de neurones servira dterminer le choix de rgles de
priorit dans la deuxime file dattente.
Nombre de neurones dans la couche cache du premier rseau de neurones = 4
Nombre de neurones dans la couche cache du deuxime rseau de neurones = 3





- 114 -
Tableau 14. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones avec nombre de neurones dans la couche cache est 3.
Les paramtres du Recuit Simul Retard moyen obtenu par
le rseau de neurones
T
0
r
max

min
K Nombre
ditrations
Temps
CPU
(minutes)
Avant
apprentissage
Aprs
apprentissage
5000 0.90 20 3 0.002 3 419 19693 23.789060 3.788980
3000 0.80 30 5 0.006 2 117 5499 46.694599 4.006790
Les rsultats que nous avons obtenu en considrant un rseau de neurones pour chaque file
dattente sont assez performants ; certes ils ne dpassent les rsultats que nous avons dj
prsents (un rseau de neurones pour les deux files dattentes) mais ils sont trop prs, pour les
deux exprimentations que nous avons retenus et prsents dans le tableau ci-dessus, les rseaux
de neurones ont minimis le retard moyen 3.788980 et 4.006790. En effet, nous avons appris
chaque rseau de neurones le comportement de la file dattente pour laquelle il prend ses
dcisions et choisit les rgles de priorit adquates, alors nous avons limit le champ de
connaissance de chaque rseau de neurones dans le but quil garde sa concentration
dapprentissage sur un seul comportement (dune seule file dattente), cest pour cela que nous
avons considr pour chaque rseau de neurones les variables qui sont lies la file dattente qui
lui correspond ( voir les tableaux des variables de dcisions dans la section prcdente).

3. Exemple 2 : Application de lapproche dapprentissage autonome des
rseaux de neurones pour le pilotage dun atelier Jobshop
3.1. description de lexemple
Nous considrons un atelier job shop inspir du travail de Fonseca et Navaresse (Fonseca et al.
2002) (Mouelhi et al. 2008), fonctionnant de manire stochastique. Cet atelier est constitu de
- 115 -
quatre machines diffrentes {M1, M2, M3, M4}, et nous avons quatre types de pices diffrents
{P1, P2, P3, P4}.
Les pices suivent les cheminements suivants en fonction de leur type :
Tableau 15. Squences des pices en fonction de leur type
Type de pices Squences
P1 M1 M3 M2
P2 M2- M3 - M1 M4
P3 M2- M3 - M4
P4 M4- M2- M1
La loi darrive des pices est du type exponentiel de moyenne 5,5 minutes. Les taux de
production des pices et les lois rgissant les temps opratoires par type de pices et par machine
en minutes suivant une loi normale [moyenne, cart type] sont prsents dans le tableau suivant :
Tableau 16. Paramtres des lois des dures opratoires







Type de pices Proportion darrive par type (%) M1 M2 M3 M4
P1 40 [9, 1.3] [7, 1] [8, 1.2] -
P2 15 [7, 1] [8, 1.2] [9, 1.3] [7, 1]
P3 20 - [9, 1.3] [7, 1] [9, 1.5]
P4 25 [9, 1.5] [4, 1] - [8, 1]
- 116 -
Chaque machine dans latelier possde sa propre file dattente. Le problme que nous
considrons dans cet atelier est de minimiser le retard moyen. Nous recherchons pour cela des
heuristiques capables de dterminer la squence de passage des pices sur chaque machine, en
considrant ltat rel du systme chaque instant t de prise de dcision.
Le Passage des pices dans les files dattente est assur par six rgles de priorit. Elles ne
prsentent pas toutes le mme intrt mais elles permettent de raliser des heuristiques de gestion
de production varie.
Les rgles que nous avons utilises pour notre atelier sont :
FIFO (First In First Out), LIFO (Last In Last Out),
SPT (Shortest Processing Time), LPT (Longest Process Time),
EDD (Earliest Due Date),
PPM : Plus Petite Marge ; la marge correspond la diffrence entre la date de livraison et
la somme des temps opratoires effectuer.
Notre modle de reprsentation de latelier est prsent ci-dessous :

Figure 34. Reprsentation de latelier cheminements multiples tudi et des diffrents flux
- 117 -

3.2. Exprimentations
3.2.1. Le module de simulation
Pour modliser latelier nous avons utilis le logiciel de simulation ARENA 10.0, lunit de
temps de la simulation est la minute et notre atelier fonctionne 24 heures sur 24 et 7 jours sur 7,
sans pause mme pendant les changements dquipe. La dure de la simulation est de 40320
minutes soit 1 mois comprenant une priode de transition de 1 semaine durant laquelle les
statistiques de latelier ne sont pas comptabilises.
Dans notre Job shop, les pannes et les arrts de maintenance ne sont pas pris en compte et les
temps de transfert entre les diffrentes parties de latelier sont considrs comme nuls. On
considre quil ny a jamais de rupture dapprovisionnement.
Pour rsoudre ce problme, nous proposons la construction dheuristiques bases sur des rgles
de priorit partir dune logique dtermine par un rseau de neurones. Cette logique sera au
dpart alatoire, puis amliore par optimisation via simulation, afin de devenir progressivement
performante.

3.2.2. Le module du rseau de neurones
Les dcisions tant bases sur ltat courant de latelier, nous dfinissons le vecteur dentre X
qui reprsente les variables dtat de celui-ci. Nous avons tudi les paramtres et les variables de
latelier qui refltent au mieux son tat courant et qui influent sur les diffrentes rgles de priorit
qui composeront nos heuristiques. Les diffrentes variables de dcision que nous avons retenues
sont :



- 118 -
1 Pourcentage des pices de type P1 dans la file concerne.
2 Pourcentage des pices de type P2 dans la file concerne.
3 Pourcentage des pices de type P3 dans la file concerne.
4 Pourcentage des pices de type P4 dans la file concerne.
5 Nombre de pices dans toutes les autres files.
6 Temps opratoire moyen.
7 Temps opratoire maximum.
8 Temps opratoire minimum.
9 Numro de la file traite.
10 Date de livraison minimum.
11 Date de livraison maximum.
12 Date de livraison moyenne.
13 Pourcentage de pices dans la file qui ont une marge infrieure 10.

- 119 -

Figure 35. Le rseau de neurones utilis pour le choix des rgles de priorit

Dans les exprimentations que nous avons ralises, le rseau de neurones est constitu de trois
couches : une couche dentre de 13 neurones qui reprsentent le vecteur dentre X de ltat de
latelier lors de la prise de dcision et qui sont communiqus par la simulation, une couche cach
de 4 neurones et une couche de sortie dun seul neurone qui reprsente la rgle de priorit choisie
(figure 35).
Ces couches sont relies entre elles par 56 connexions qui constituent notre matrice W de 56
poids que nous cherchons optimiser. Nous utiliserons une fonction tangentielle comme fonction
dactivation. Le module rseau de neurone et le module d'optimisation ont t dvelopps avec
Microsoft Visual C++ et connects directement avec le modle de simulation du job shop.

3.2.3. Le module doptimisation
Dans ces exprimentations, nous avons utilis un recuit simul comme mthode doptimisation
de la matrice W, exactement comme dans lexemple prcdent de lateleier flowshop.
- 120 -
Une solution initiale W
0
est tire alatoirement. La perturbation des solutions est base sur des
principes de voisinage variables. Les principes du voisinage du recuit simul est le mme que
celui du voisinage du recuit simul utilis pour loptimisation via simulation de lexemple
prcdent (voir lexemple du flowshop).
Lapproche choisie assure la connexit de lespace de recherche. La fonction objectif, le retard
moyen, est valu par la simulation. Aprs plusieurs exprimentations, le paramtre de la
diminution de temprature r et la temprature initiale ont t empiriquement dtermins. Le
recuit simul sarrte quand la temprature est infrieure , avec initialement choisie.
3.3. Les rsultats des exprimentations
Nous prsentons dans cette section les rsultats que nous avons obtenus aprs les
exprimentations menes pour lapprentissage des rseaux de neurones prendre les bonnes
dcisions dans latelier jobshop.
Dabord et pour pouvoir comparer les dcisions du rseau de neurones aux performances des
meilleures rgles considres dans latelier (FIFO, LIFO, SPT, LPT, EDD et PPM), nous avons
considr limpact de chacune de ces rgles sur le retard moyen. Le tableau 3 prsente le retard
moyen des six rgles de priorit associes chacune des files dattente des quatre machines de
latelier.
Tableau 17. Les rsultats des six rgles de priorit sur les quatre machines de latelier jobshop
Rgle de priorit Le retard moyen
SPT 298.305
PPM 156.496
EDD 157.813
FIFO 182.128
LPT 581.188
FIFO 412.569
- 121 -
En se basant sur les rsultats ci-dessus (tableau 17), nous constatons que les rgles PPM et EDD
sont les rgles les plus performantes pour minimiser le retard moyen dans notre atelier jobshop.
Ensuite, en analysant les rsultats que nous avons obtenus nous constatons quils sont similaires
ceux obtenus dans le premier exemple (latelier flowshop). En effet, au cours des premires
itrations les retards moyens obtenus par les diffrents rseaux de neurones sont trs levs, tels
quils sont attendus puisque les rseaux de neurones nont pas encore appris. Puis, tout au long de
loptimisation de ses poids par le recuit simul, chaque rseau de neurones que nous avons
considr a permis la diminution du retard moyen dans latelier. Nous nous apercevons quaprs
optimisation le rseau de neurones arrive combiner les six rgles de priorit et proposer une
heuristique dans le but de minimiser le retard moyen dans latelier. Alors, il est devenu capable
de choisir les rgles de priorit sans se baser ni sur une expertise pralable, ni sur un ensemble
dapprentissage.

Figure 36. Evolution du retard moyen

La Figure 36 prsente la diminution du retard moyen durant les diffrentes itrations du recuit
simul pour un exemple de cycle dapprentissage 507 itrations et une temprature initiale T
0
=
50000 (voir la ligne 3 du tableau 18) ; dabord, nous avons calcul le retard moyen avec une
matrice initiale de poids tirs alatoirement : le retard moyen initial est gal 182.669850. Les
rsultats obtenus (dans les premires itrations) sont trs mauvais. Ensuite, tout au long de
loptimisation de ses poids par le recuit simul, le rseau de neurones permet de diminue le retard
moyen dans latelier : il a atteint un retard moyen de 152.664552. De plus, nous constatons que
- 122 -
cette dernire exprimentation (voir la ligne 3 du tableau 18) a permis lapprentissage dun rseau
de neurones qui a t capable de dpasser les performances trouves dans le tableau 17 des rgles
statiques que nous avons prsent au dbut de cette section. Ainsi, le rseau de neurones a
minimis le retard moyen de 182.669850 152.664552 units de temps, et a dpass les
meilleures rgles testes PPM et EDD qui nont minimis le retard moyen respectivement qu
156.496 et 157.813. Lapprentissage du rseau de neurones lui a permis dacqurir la
connaissance ncessaire coupler les bonnes rgles de priorit aux bons moments du cycle de
pilotage, au regard de minimiser le retard moyen.
Dailleurs, les performances des rseaux de neurones se sont amliores lorsque nous avons
considr un rseau de neurones pour chaque file dattente. En effet, nous avons considr un
rseau de neurones diffrent pour chaque file dattente, de telle sorte que nous apprenons
chaque rseau de neurones le comportement de chaque file dattente part, c'est--dire nous
avons limit la connaissance quil doit acqurir une seule file dattente, ceci a permis un
apprentissage plus efficace qi nous comparons les retards moyens ainsi obtenus (tableau 19):
159.208801, 148.669495 et 148.424927.
Par ailleurs, si nous considrons les temps de nos calculs (CPU) nous constatons que
typiquement, un cycle dapprentissage de 507 itrations (run doptimisation via simulation) qui
utilise le modle de simulation de notre atelier jobshop de 30 rplications et une priode de
simulation de 1 mois, exige 4562 secondes pour sur un PC avec Intel Pentium 4, CPU 3,80
GHz et 2 Go de mmoire RAM. C'est--dire, environ 9 secondes pour chaque itration du recuit
simul. Ces temps CPU sont largement infrieurs ceux constats pour latelier flowshop. En
effet, comme nous lavons expliqu dans le premier exemple (flowshop) le temps de calculs CPU
dpend troitement du temps que la simulation consacre pour valuer dans chaque itration les
performances du rseau de neurones ou des rseaux de neurones (en cas dun rseau de neurones
pour chaque file dattente). Dans latelier jobshop que nous avons choisi, la priode simule
correspond un mois ce qui explique une diffrence trs importante entre le temps de calcul dans
latelier flowshop et le temps de calcul dans latelier jobshop.



- 123 -
Rsultats de la proposition dun rseau de neurones pour les quatre files dattente
Tableau 18. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones
Les paramtres du Recuit Simul Retard moyen obtenu par le
rseau de neurones
T
0
r
max

min
k Nombre
ditrations
Temps
CPU
(seconde)
Avant
apprentissage
Aprs
apprentissage
700000 0.93 25 5 0.00001 3 1032 9288 201.093552 175.021851
500000 0.9 30 3 0.00006 4 867 7803 213.677813 159.651978
50000 0.9 20 5 0.001 3 507 4562 182.669850 152.664552
800000 0.92 40 10 0.00001 4 1208 10872 223.445790 156.273193


Rsultats de la proposition dun rseau de neurones pour chaque file dattente
Dans le tableau qui suit nous prsentons les performances de quatre rseaux de neurones
diffrents dans notre modle chacun servira dterminer le choix de rgles de priorit dans la file
dattente concerne.




- 124 -
Tableau 19. Les rsultats des diffrentes exprimentations de lapprentissage du rseau de
neurones
Les paramtres du Recuit Simul Retard moyen obtenu par
le rseau de neurones
T
0
r
max

min
k Nombre
ditrations
Temps
CPU
(seconde)
Avant
apprentissage
Aprs
apprentissage
10000 0.9 10 1 0.001 3 459 4131 250.920029 159.208801
900000 0.95 15 5 0.00001 3 1466 13194 265.545570 148.669495
500000 0.91 20 3 0.00006 3 726 6534 234.800934 148.424927

4. Conclusion
A travers ce chapitre, nous avons illustr lapproche de lapprentissage autonome des rseaux de
neurones pour le pilotage en temps rel base sur loptimisation via simulation.

Ainsi, nous avons dtaill dans un premier temps, les exprimentations que nous avons menes
sur le premier exemple : latelier flowshop que nous avons choisi partir des travaux de Barett et
Barman (Barett et Barman, 1986). Dans un second temps, nous avons men une srie
dexprimentations sur un deuxime exemple : un atelier Jobshop lui aussi inspir de la littrature
(Fonseca et Navaresse, 2002). Dans les deux exemples, les rseaux de neurones expriments ont
acquis par lapprentissage bas sur loptimisation via simulation la connaissance ncessaire pour
prendre les bonnes dcisions de pilotage pour les deux ateliers flowshop et jobshop.



- 125 -
CONCLUSION GENERALE ET PERSEPECTIVES


Le pilotage dateliers ncessite de prendre des dcisions complexes et souvent en temps rel qui
sont prises trs empiriquement. Toutefois, lapprentissage offre des possibilits trs intressantes
pour ce type de pilotage, et dans la mesure o le pilotage seffectue sur la base dun tat du
systme changeant dynamiquement au cours du temps, il est trs difficile de disposer dexemples
des meilleures pratiques .
Plusieurs auteurs ont montr que la simulation tait capable de fournir des exemples, mettant en
relation des stratgies de dcision avec des performances, de telle sorte que des outils
dapprentissage automatique puissent en extraire des connaissances utiles et construire les
ensembles dapprentissage. Pour cela, la plupart des travaux dans la littrature utilisent des
ensembles dapprentissage issus des modles de simulation des systmes de production tudis,
mais ceci prsente des inconvnients lis la prise en compte des changements qui est
indispensable pour les changements des stratgies de production au cours du temps. En effet, la
prise en compte de tels changements en temps rel dans les systmes de production est ncessaire
dans des systmes qui sont confronts des imprvus qui peuvent survenir au cours du processus
de production (commandes urgentes, manque de matire premire, pannes de machine,
absentisme, etc) et qui peuvent nuire aux objectifs de la production. Dans ce sens, plusieurs
travaux ont essay de prendre en compte ce type des changements. Les chercheurs ont propos
des solutions de dcomposition des temps de production et les simuler sur des priodes courtes,
dautres ont propos des seuils de contrle partir desquels ils rvisent ltat du systme et
prennent en compte les changements qui ont amen atteindre ce seuil. Malheureusement la
solution de dcomposition ne rsout pas totalement laspect temps rel puisque au cours mme de
la courte priode simule ltat du systme peut changer et ce dernier ne peut tre pris en compte
que dans la priode qui suit. De mme pour les seuils de contrle, puisque il est trs difficile de
dterminer le bon seuil partir duquel la prise dune nouvelle dcision de production est
ncessaire. A notre connaissance il nexiste pas dapproche qui assure un apprentissage des
mthodes dapprentissage automatique et qui prend en compte ces changements dtat dans les
systmes de production en temps rel.
Alors, nous avons prsent dans ces travaux de thse une approche qui surmonte la difficult
dlicitation des connaissances partir des modles de simulation pour lapprentissage des
- 126 -
mthodes dapprentissage automatiques, de plus cette approche prend en compte les changements
dtat des systmes en temps rel.
En effet, nous avons prsent le concept dapprentissage autonome de rseaux de neurones pour
prendre les dcisions de pilotage dans un systme de production. Ce type dapprentissage vise
extraire de faon autonome des connaissances dun modle de simulation, sans utiliser
densembles dapprentissage, difficiles constituer dans le cas du pilotage dateliers.
Dans la dmarche prsente, lapprentissage seffectue par optimisation via simulation des
paramtres dun rseau de neurones par rapport un objectif. Aprs optimisation via simulation,
le rseau de neurones possde la capacit de dcider quelle action de pilotage entreprendre, en
fonction de ltat de latelier, pour satisfaire lobjectif vis pour le pilotage.
Ainsi, nous avons montr comment un systme pouvait acqurir des connaissances de faon
autonome, grce lutilisation combine dapproches de simulation et doptimisation, et dun
rseau de neurones.
Les connaissances sont acquises sans intervention doprateur, sans expertise pralable et sans
ensemble dapprentissage. La proprit des rseaux de neurones en tant quapproximateurs
universels de fonctions complexes et non linaires, rendent leur usage trs attractif dans ce
contexte.
Nous avons gnr des connaissances relatives au fonctionnement de latelier en temps rel et en
considrant chaque changement dtat dans latelier chaque instant de prise de dcision.
Autrement dit, nous cherchons gnrer des connaissances par simulation sans utiliser des
ensembles dapprentissage pralablement dtermins. Comme nous lavons prsent dans les
chapitres prcdents, des travaux possdant quelques liens avec lapproche que nous proposons
sont prsents dans (Geiger et al., 2006) pour gnrer une nouvelle rgle de priorit de passage
de pice. Les principes exposs ici diffrent fortement de lapproche par programmation
gntique propose par ces auteurs. Par ailleurs, nos propositions ont vocation sappliquer des
problmes beaucoup plus larges de pilotage datelier.
Afin dillustrer lefficacit et le potentiel de notre mthode, nous lavons applique un atelier
flowshop simplifi, dj tudi dans la littrature (Barett et Barman, 1986) et un atelier Jobshop
aussi inspir de la littrature (Fonseca et Navaresse, 2002) ; Dans les deux cas, le rseau de
neurones a t capable dauto-apprendre piloter le systme et choisir en temps rel les rgles
- 127 -
les plus pertinentes en fonction de ltat courant de latelier. Les rsultats obtenus montrent que le
rseau de neurones a t capable dauto-apprendre contrler latelier en temps rel, et que les
connaissances gnres sont extrmement pertinentes.
Cette approche peut tre applique un large spectre de problmes de pilotage. Une fois entran
hors ligne, le rseau de neurones peut tre install sur latelier rel. Une des conditions
essentielles pour lapplicabilit de cette approche est, pour linstant, que les caractristiques de
latelier restent suffisamment stables au cours du temps. Si des changements majeurs devaient
intervenir (e. g. ajout de machines supplmentaires), alors il pourrait devenir ncessaire de r
entraner le rseau de neurones avec un modle de simulation mis jour. Lajustement du rseau
en fonction des changements de caractristiques est une des perspectives de recherche lie ce
travail.
La principale limite de ce type dapproche rside principalement dans les temps de calcul
ncessaires. La mthode doptimisation choisie doit permettre une convergence rapide vers de
bonnes solutions. Nanmoins cette approche parait extrmement prometteuse. Nos recherches
futures intgrent de nombreuses directions. Parmi celles-ci on relve lamlioration de
loptimisation (Siarry et al. 1997), une meilleure gestion des problmes de temps de calcul, une
meilleure prise en compte des aspects stochastiques dans la comparaison des solutions lors de
loptimisation via simulation et lapplication dautres types de problmes (chanes logistiques,
etc.).
















- 128 -
Bibliographie
Aissani N. et Beldjilali B., 2008, Use of machine learning for continuous improvement of the real
time heterarchical manufacturing control system performances. International Journal of
Industrial and Systems Engineering, Vol. 3, No. 4, pp 474-497.
Alam, M.R., Lee K.S., Rahman, M. et Zhang, Y.F., 2003 Process planning optimization for the
manufacture of injection moulds using a genetic algorithm. International Journal of computer
Integrated Manufacturing, 16(3), pp. 181-191.
Alberto, I., Azcrate, C., Mallor, F, et Mateo, P.M., 2002, Optimization with simulation and
multi-objective analysis in industrial decision-making: A case study. European Journal of
Operational Research, 140(2), pp. 373-383.
Aler, R., Borrajo, D., Isasi, P., 2002, Using genetic programming to learn and improve control
knowledge. Artificial Intelligence, vol. 141, p.29-56.
Andradottir, S., 1998, Simulation optimization. Handbook of Simulation, Chapter 9, Wiley and
Sons, New York, p. 307-333.
Archimde B., 1991, Conception dune architecture ractive distribue et hirarchise pour le
pilotage des systmes de production, Thse de doctorat, Universit de Bordeaux I, France, 1991.
Azadivar, F., 1992, A tutorial on simulation optimization. Proceedings of the 1992 Winter
Simulation Conference, p. 198-204.
Azadivar, F. Et Tompkins, G., 1999, Simulation optimization with qualitative variables and
structuralmodel changes : A genetic Algorithm approach. European Jouranl of Operational
Research, 113, pp.169-182.
Bck T., 1996, Evolutionary Algorithms in Theory and Practice, Oxford University Press.
Bajic E. Y. Sallez, 2007, Proposition de projet transversal exploratoire du GDR MACS :
Systme Contrl par le Produit , Journes prospectives STP, Lyon, 11 & 12 juin.
Bck T. et Schwefel H.P., 1993, An overview of Evolutionary Algorithms for Parameter
Optimization. Evolutionary Computaion, 1(1), pp. 1-23.
- 129 -
Barrett, R.T. et Barman, S., 1986, A SLAM II Simulation study of a simplified flow shop.
Simulation , Vol 13, n5, p. 181-189.
Blanc P., Demongodin I. et Castagna P., 2008. A holonic approach for manufacturing execution
system design: An industrial application. Engineering Application of Artificial Intelligence, Vol
N 21, Issue 3, pp. 315-330.
Bourrires J.P., Baptiste P., Bernard A., Lopez P., Morel G., Pierreval H., Portmann M.C., 2007.
Comit dExperts Productique : prospective de recherche, 15 janvier 2007.
Bertel S. et Billaut J.C., 2003, A genetic algorithm for an industrial multiprocessor flow shop
scheduling problem with recirculation. European Journal of Operational Research
Cardin O. et Castagna P., 2009, Using online simulation in Holonic manufacturing systems.
Engineering Application of Artificial Intelligence, Article In Press.
Chan K.K. et Spedding T.A., 2001, On-line optimization of quality in a manufacturing system.
International Journal of Production Research, 39:1127-1145, 2001.
Collins N.E., Eglese R.W., et Golden B.L., 1988, Simulated annealing : An annotated
bibliography. American Journal of Mathematical and Management Sciences, 8 :209.307.
Cornujols A., Miclet L., Kodratoff Y., Apprentissage artificiel, Eyrolles, 2002. Chapitres 2 et 9.
Cornujols A., Miclet L., Apprentissage artificiel Concepts et algorithmes, Eyrolles, 2003.
Creighton D.C. et Nahavandi S., 2002, Optimizing discrete event simulation models using a
reinforcement learning agent. Proceedings of the 2002 Winter Simulation Conference, pp. 1945-
1950.
Dengiz, B et Alabas, C., 2000, Simulation optimization using tabu serach. Proceedings of the
2000 Winter Simulation Conference, pp. 805-810.
Dindeleux E., 1992, Proposition dun modle et dun systme interactif daide la dcision pour
la conduite datelier, Thse de doctorat, Universit de Valenciennes, 1992.
Dolgui, A., Ereemev, A., Kolokolov, A., Sigaev, V., 2000, A Genetic Algorithm for Buffer
Allocation in Production Line with Unreliable Machine. Proc. of the international workshop on
discrete Optimization methods in scheduling and computer-Aided Design, pp. 26-32.
- 130 -
Dreyfus G., Martinez J.-M., Samuelides M., Gordon M. B., Badran, F., Thiria S., Hrault L.,
2004, Rseaux de neurones: mthodologies et applications. dition EYROLLES Avril 2004.
Eglese R.W., 1990, Simulated annealing: a tool for operational research. European Journal of
Operational Research, 46: 271281.
El-Bouri, A. et Shah P., 2006, A neural network for dispatching rule selection in a job shop.
International Journal of Advanced Manufacturing Technology, 31(3-4), 342-349.
Fonseca D. J. et Navaresse D., 2002, Artificial neural networks for job shop simulation.
Advanced Engineering Informatics, 16:241-246.
Fu, M. C., 1994, Optimization via simulation: a review. Annals of Operation research, 53 p. 199-
247.
Fu, M.C., 2002, Optimization for simulation: Theory vs Practice. INFORMS Journal on
Computing, Vol. 14, N3, pp. 192-215.
Garcia L.L. et Bolivar A.P., 1999, A simulator that uses Tabu search to approach the optimal
solution to stochastic inventory models. Computers & Industrial Engineering, 37(1-2), pp. 215-
218.
Geiger, C.D., Uzsoy, R., Aytug, H., 2006, Rapid modeling and discovery of priority dispatching
rules: an autonomous learning approach. Journal of Scheduling, vol. 9, p. 7-37.
Glover, F., 1989, Tabu Search Part I. ORSA Journal on Computing, pp. 190-206.
Glover, F. et Laguna, M., 1997, Tabu Search. Kluwer Academic Publishers, Norwell,
Masachsetts.
Goldberg, D.E., 1989, Genetic Algorithm in Search, Optimization, and Machine Learning.
Addition-Wesley, Reading, MA.
Gouyon D., Ptin J.F., Morel G., Control Synthesis For Product-Driven Automation. IFAC
WODES'04, 7th Workshop on Discrete Event Systems, Reims, 22-24 septembre 2004.
Habchi G., 2001, Conceptualisation et Modlisation pour la Simulation des Systmes de
Production, Habilitation diriger des recherches, Universit de Savoie, 2001.
- 131 -
Berchet C., 2000, Modlisation pour la simulation d'un systme d'aide au pilotage industriel,
Thse de doctorat, INPG, Grenoble, France, 2000.
Habchi G. et Labrune Ch., 1994, Study of lot sizes on job shop systems performance using
simulation.Vol. N2, Issue 6, pp. 277-289.
Haddock, J. And Mittenthal J., 1992, Simulation optimization using simulated annealing.
Computers and Industrial Engineering, 22:387-395.
Hajek. B., 1988, Cooling schedules for optimal annealing. Mathematics of Operations Research,
13 :311.329.
Hritier C., 1991, Une aide la conception des systmes de production base sur la simulation et
lanalyse de donnes. Thse de Doctorat, Ecole Nationale des Mines, saint-Etionne.
HO, Y.C., Shi, L., Dai, L. et gong, W.B., 1992, Optimizing discrete event dynamic systems via
the gradient surface method. Discrete Event Dynamic systems, 2, pp. 99-120.
Holland, J.H., 1975, Adaptation in Natural and artificial Systems. Ann ardour, MI: University of
Michigan Press.
Hornik K., Stinchcombe M., White H.,1989, Multilayer Feedforward Networks are Universal
Approximators. Neural Networks, Vol. 2, pp. 359-366.
Hu N.F., 1992, Tabu search method with random moves for globally optimal-design.
International Journal for Numerica Methods in Engineering, 35, pp. 1055-1070.
Hurrion R. D., 1997, An example of simulation optimisation using a neural network metamodel:
finding the optimum number of kanbans in a manufacturing system. Journal of Operational
Research Society, 48: 1105-1112.
Huyet A.-L. (2004). Extraction de connaissances pertinentes sur le comportement des systmes
de production : une approche conjointe par optimisation volutionniste via simulation et
apprentissage. Thse de doctorat, Universit Blaise-Pascal Clermont 2, Ndordre 1528, EDSPIC
: 305.
- 132 -
Huyet, A-L., Paris, J-L., 2004, Synergy between evolutionary optimization and induction graphs
learning for simulated manufacturing systems. International Journal of Production Research,
vol. 42, n 20, p.4295 4313.
Huyet A.L., 2006, Optimization and analysis aid via data-mining for simulated production
systems. European Journal of Operational Research, 173, pp 827838.
Jayaraman V. et Ross, A., 2003, A simulated annealing methodology to distribution network
design and management. European Journal of Operational Research, 144, pp. 629-645.
Kallel G., 1985, Proposition dune conduite dcentralise coordonne (CODECO) pour un atelier
de fabrication , Thse de Doctorat en Automatique, Institut National Polytechnique de Grenoble,
soutenue le 28 juin 1985.
Key K. Lee, 2008, Fuzzy rule generation for adaptive scheduling in a dynamic manufacturing
environment. Applied Soft Computing, 8, 12951304.
Kilmer R.A., Smith A.E., Shuman L.J., 1999, Computing confidence intervals for stochastic
simulation using neural network metamodels. Computers & Industrial Engineering, 36: 391-407.
Kirkpatrick S., Gelatt C. D. et Vecchi M.P., 1983, Optimization by Simulated Annealing.
Science, Number 4598, 13May 1983, volume 220, 4598, p.671-680.
Krajewski L.J. King B.E., Ritzman L.P., Wong D.S., 1987, Kanban, MRP and shaping the
manufacturing environment. Management Science, 33(1), pp. 39-57.
Kouiss K., Pierreval H. et Merbaki N., 1995, Toward the use of a multi-agent approach to the
dynamic scheduling of flexible manufacturing systems. International Conference on Industrial
Engineering and Production Management (IEPM95), Marrakech, Maroc, pp. 118-125.
Kushner, H.J., 1963, A new method for locating the maximum of an arbitrary multipeak curve in
the presence of noise. Proc. of the Joint Automatic Control Conference.
Kwak T. S., Suzuki T., Bae W. B., Uehara Y. et Ohmori H., 2005, Application of neural network
and computer simulation to improve surface profile of injection molding optic lens. Journal of
materials processing technology, 170:24-31.
- 133 -
Law, A.M. et Kelton W.D., 2000, Simulation Modelling and Analysis, 3rd esition. New York :
McGraw-Hill.
Le Moigne J.L., 1990, La thorie du systme gnral : thorie de la modlisation. 2me dition,
Paris, 1990.
Lereno, E., Morello, B. et Baptiste, P., 2001, Systmes d'aide au paramtrage d'un logiciel en
ordonnancement. Proceedings of MOSIM'01, pp. 363-369.
Li, D-C., Wu C-S., Tsai T-I. et Lina Y-S., 2007, Using mega-trend-diffusion and artificial
samples in small data set learning for early flexible manufacturing system scheduling knowledge.
Computer and Operations Research, 34, 966-982.
Li, D-C., Wu C-S., Tsai T-I. et Lina Y-S., 2007, Using mega-trend-diffusion and artificial
samples in small data set learning for early flexible manufacturing system scheduling knowledge.
Computer and Operations Research, 34, 966-982.
Lutz, C.M., Davis, K.R et Sun, M.H., 1998, Determining buffer location and size in production
lines using tabu search. European Journal of operational Research, 106, pp. 301-316.
Maes, S. and Meganck, S. and Manderick, B., 2004, Multi-Agent Identifcation of Causal Effects.
The Second European Workshop on Multi-Agent Systems, Barcelona, Spain.
Manz E.M., Haddock, J. et Mittenthal, 1989, Optimization of an automated manufacturing
system simulation model using simulated annealing. Proceedings of the 1989 Winter simulation
Conference, pp. 390-395.
Martin, A.D., Chang, T.M., Yih, Y. et Kincaid, R.K., 1998, Using tabu search to determine the
number of kanbans and lot sizes in a genetic kanban system. Annals of Operations research,78,
pp. 201-217.
McFarlane D., Sarma S., Chirn J.L., Ashton K., 2002, The intelligent product in manufacturing
control and management, 15th Triennal IFAC World Congress, Barcelone, Espagne.
Mcfarlane, D., Sarma, S., Chirn, J.L., Wong, C.Y., Ashton, K. 2003: Auto id systems and
intelligent manufacturing control. Engineering Applications of Artificial Intelligence 16/4: 365
376.
- 134 -
Metan, G. et Sabuncuoglu I., 2005, A simulation based learning mechanism for scheduling
systems with continuous control and update structure. M.E. Kuhl, N.M. Steiger, F.B. Armstrong,
and J.A. Joines, Proceedings of the 2005 Winter Simulation Conference, 2148-2156.
Metropolis N., Rosenbluth A.W., Rosenbluth M.N., Teller A.H., et Teller E., 1953, Equations of
state calculations by fast computing machines. Journal of Chemical Physics, 21 :10871091.
Metan, Sabuncuoglu et Pierreval (2009) In Press
Monostori L., 2003, AI and machine learning techniques for managing complexity, changes and
uncertainties in manufacturing, Engineering Applications of Artificial Intelligence, 16 (4) (2003)
277291.
Morel, G., Valckenaers, P., Faure, J.M., Pereira, C., Diedrich, C., 2007, Survey paper on
manufacturing plant control challenges and issues. Control Engineering Practice.
Mouelhi, W., Pierreval H. et Gningue M. B., 2007, Dynamic Selection of Dispatching Rules: a
Neural Network Approach. International Conference on Industrial Engineering and Systems
management, 324 CD-ROM.
Mouelhi W., Huyet A.-L. et Pierreval H., 2007, Combining simulation and artificial neural
networks : an overview. 6th EUROSIM Congress on Modeling and Simulation, (CD-ROM).
Mouelhi W. et Pierreval H., 2008, Construction dheuristiques bases sur des rgles de priorit
pour job shop par optimisation via simulation. 7
me
Confrence Internationale de Modlisation et
Simulation (MOSIM), CD-ROM, 5 pages.
Mouelhi W. et Pierreval H., 2007, Le concept dapprentissage autonome et son application au
pilotage des systmes de production. 7
me
Congrs international de gnie industriel (CIGI), CD-
ROM, 9 pages.
Mouelhi-Chibani W. et Pierreval H., 2009, Training a neural network to select dispatching rules
in real time. Computers & Industrial Engineering, In Press, Corrected Proof, Available online 29
March 2009.
Osei-Bryson K.M., 2004, Evaluation of decision trees : a multi-criteria approach. Computers
&Operations Research, 31, pp. 1933-1945.
- 135 -
Paris J.-L., Pierreval H., 2001, A Distributed Evolutionary Simulation Optimisation Approach for
the Configuration of Multiproduct Kanban Systems. International Journal of Computer
Integrated Manufacturing, Vol. 14, N 5, pp. 421-430.
Ptin J.-F., Gouyon D. et Morel G., 2007, Supervi-sory synthesis for product-driven automation
and its application to a flexible assembly cell. Control En-gineering Practice, 15(5), 595-614.
Pflug, G.C., 1984, Optimizing simulated systems, Simuletter, 15(4), pp. 6-9.
Pierreval, H., Caux, C., Paris, J.L. et Viguier, F., 2003, Evolutionary approaches to design and
organization of manufacturing systems. Computers & industrial Engineering, 44, pp. 339-364.
Pierreval H. et Tautou, L., 1997, Using evolutionary algorithms and simulation for the
optimization of manufacturing systems. IIE Transactions, 29 (3), pp. 181-190.
Pierreval H., 1999, Proposition de typologie des dcisions en temps rel agissant sur les flux des
systmes de production, 2me Congrs MOSIM99, Annecy, p.331, octobre 1999.
Pierreval H. Training a neural network by simulation for dispatching problems. Proceedings of
the Third Rensselaer International Conference on Computer Integrated Engineering, New York,
332-336, 1992.
Pierreval, H., Ralambondrainy, H., 1990, A simulation and learning technique for generating
knowledge about manufacturing systems behavior, Journal of Operational Research Society, vol.
46, n 6, p. 461-474.
Pierreval H., 2006, Simulation combine discret/continu : tude du cas dune fonderie, 6
me

Confrence Francophone de MOdlisation et SIMulation MOSIM06, Rabat, Maroc, 2006.
Pierreval H., Bruniaux R. et Caux C., 2007, A continuous simulation approach for supply chains
in the automotive industry. Simulation Modelling Practice and Theory, Vol. 15, N 2, pp. 185
198, 2007.
Pierreval H., 1992, Training a neural network by simulation for dispatching problems.
Proceedings of the Third Rensselaer International Conference on Computer Integrated
Engineering, New York, 332-336, 1992.
- 136 -
Pierreval H. et Huntsinger R., An investigation on neural network capabilities as simulation
metamodels. Proceedings of the 1992 Summer Computer Simulation Conference, California, CA,
413-417, 1992.
Pierreval. H., 1992, Training a neural network by simulation for dispatching problems.
Proceedings of the Third Rensselaer International Conference on Computer Integrated
Engineering, New York, 332-336, 1992.
Pierreval H., 1988, Data-analysis oriented techniques for learning about manufacturing control
with simulation. Proceedings of the 2
nd
European Simulation Multi-Conference : Factory of the
Future, pp. 61-66.
Pierreval H., 1994, Using Multiple Correspondence Analysis in the Analysis of Simulation
Experiments : a Study of Dynamic Scheduling Strategies. Int. Trans. Opt. Res., 1(2), pp. 147-157.
Pujo P., Ounnar F., 2007, Vers une approche holonique des systmes mcatroniques complexes
Proposition dun systme de pilotage auto-organis et isoarchique, JESA, 41 (6), p. 673-706.
Pujo P. et Kieffer J.P., 2002, Concepts fondamentaux du pilotage des systmes de production.
Fondements du pilotage des systmes de production, Trait IC2 Productique (Pujo P. and J.P.
Kieffer. Ed), p. 25-50, Herms, Paris.
Pujo P. et Brun-Picard D., 2002, Pilotage sans plan prvisionnel, ni ordonnancement pralable.
Mthodes du pilotage des systmes de production, Trait IC2 Productique (Pujo P. and J.P.
Kieffer. Ed), p. 129-162, Herms, Paris.
Reeves, C.R., 1993, Genetic algorithms, Modern heuristic Techniques for Combinational
Problems, edited by C.R. Reves (orient Longman). Chapter 4, pp. 151-188.
Santos Osrio F., 1998, Un systme hybride neuro-symbolique pour lapprentissage automatique
constructif. Thse de doctorat, LInstitut National Polytechnique de Grenoble, 1998.
Roy D., 1998, Une architecture hirarchise multi- agents pour le pilotage ractif dateliers de
production, Thse de Doctorat en Automatique - Productique, Universit de Metz, soutenue le 15
janvier 1998.
Roy, D., Anciaux, D., Vernadat F., 2001, SYROCO : A novel multi-agent shop-floor control
system, Journal of Intelligent Manufacturing, Vol. 12, n3, p. 295-307.
- 137 -
Shiue, Y-R. et Guh R-S., 2006, Learning based multi-pass adaptive scheduling for a dynamic
manufacturing cell environment. Robotics and Computer-Integrated Manufacturing, 22, 203-216.
Sebag M., Gallinari P., 2002, Apprentissage artificiel : acquis, limites et enjeux. Apprentissage
artificiel, Actes des deuximes Assises nationales du GDR I3, Cpadus Editions, p 303-333.
Siarry, P., Berthiau G., Durbin F., Haussy J., 1997, Enhanced simulated annealing for globally
minimizing functions of many-continuous variables. ACM Transactions on Mathematical
Software, 23(2), p. 209-228
Sonquist J.A. et Morgan J.J., 1963, Problems in the analysis of survey data and proposal, J.A.S.A.
58, pp. 415-435.
Spear W.M., Bck K.A., Fogel T., Degaris D.H., 1993, An overview of evolutionary comptation,
Proceedings of the European Conference on Machine Learning, (Spring: New-York), pp. 442-
459.
Stuckman, B.E. et Easmon, E.E., 1992, a comparison of bayesian/sampling global optimization
techniques.IEEE Transactions on systems, Man and cybernetics, 22, pp. 1024-1031.
Sun R-L., Ding H., Xiong X. et Du R., 2004, Iterative learning scheduling: a combination of
optimization and dispatching rules. Journal of Manufacturing Technology management, 15 (3),
298-305.
Tamani K., Boukezzoula R. et Habchi G., 2006, High level Petri nets based approach for
analyzing conceptual objects for production systems simulation. Proceedings Volume from the
12
th
IFAC Conference, Saint-Etienne, France, pp. 339-344.
Tautou, L. et Pierreval, H., 1995, Using evolutionary algorithm and simulation to optimize
manufacturing systems. Proc. of ETFA95, 3, pp.509-516.
Thomas A., 2004, De la planification au pilotage pour les chaines logistiques. Habilitation
Diriger des Recherches, Universit Henri Poincar Nancy 1.
Trentesaux D., 1996, Conception dun systme de pilotage distribu, supervis et multicritre
pour les systmes automatiss de production , Thse de Doctorat en automatique- Productique,
Institut National Polytechnique de Grenoble, soutenue le 24 janvier 1996.
- 138 -
Van Laarhoven P.J.M. et Aarts E.H.L., Simulated Annealing : Theory and Applications. Kluwer
Academic Publishers, Boston, 1987.
Wang K.-J., Chen J. C. et Lin Y.-S., 2005, A hybrid knowledge discovery model using decision
tree and neural network for selecting dispatching rules of a semiconductor final testing factory.
Production Planning and Control, 16: 665-680, 2005.
Wang K. -J., Chen J. C. et Lin Y.-S., 2005, A hybrid knowledge discovery model using decision
tree and neural network for selecting dispatching rules of a semiconductor final testing factory.
Production Planning and Control, 16: 665-680, 2005.
Wang J-Y. et Yih Y., Using neural networks to select a control strategy for automated storage
and retrieval systems (AS/RS). International Journal of Computer Integrated Manufacturing,
10:487-495, 1997.
Wetter, M., Polak, E., 2003, A convergent optimization method using pattern search algorithms
with adaptive precsion simulation. Eigth International IBPSA Conference, Eindhoven,
Netherlands, p. 1393-1400.
Yildirim, M.B., Cakar T., Doguc U. et Meza J.C., 2006, Machine number, priority rule, and due
date determination in flexible manufacturing systems using artificial neural networks. Computers
and Industrial Engineering, 50, 185-194.
Youssef A., 1998, Architecture distribue multi- experts avec contrle hirarchique pour le
pilotage des systmes de production, Thse de Doctorat en Productique Automatise, Universit
de Metz, soutenue en juin 1998.
Zhao Z. et De Souza R., 2001, Fuzzy rule learning during simulation of manufacturing resources.
Fuzzy Sets and Systems, 122, pp. 469-485.
Zighed, D.A. et Rakotomalala, R., 2000, Graphes dinduction, Herms.






- 139 -
Annexe A

DESCRIPTION DE QUELQUES BLOCS PERMETTANT LA CONSTRUCTION DUN
MODLE
a) Create (issu du template Basic Process) : Un bloc Create permet de crer des entits. Celui
reprsent dans la figure suivante est intitul Create 1 (champ Name = Create 1). Sont indiqus :
- La priode de cration des lots dentits (cadre Time Between Arrivals, par exemple :
champ Type = Constant, champ Value = 2),
- La taille des lots (champ Entities per Arrival = 1),
- Le nombre total de lots crer (champ Max Arrivals = Infinite),
- La date de cration du premier lot (champ First Creation = 0).
Les valeurs considres sont telles qu'une entit est cre toute les deux units de temps partir
de linstant 0, ceci une infinit de fois.

b) Dispose (issu du template Basic Process) : Un bloc Dispose permet de dtruire des entits. Celui
reprsent dans la figure suivante est intitul Dispose 1 (champ Name = Dispose 1), une entit entrant
dans ce bloc est immdiatement dtruite.
- 140 -

c) Delay (issu du template Advanced Process) : Un bloc Delay permet de retarder le passage
d'entits. Celui reprsent dans la figure suivante est intitul Delay 1 (champ Name = Delay 1),
quand une entit entre dans ce bloc, elle y reste inconditionnellement pendant la dure (alatoire
ou non) indique dans le champ Delay Time.

d) Seize (issus du template Advanced Process) : Une entit prsente dans un bloc Seize ne peut
sortir de ce bloc que sil existe un nombre suffisant de ressources disponibles (le nombre et le
type de ressources tant spcifis dans le bloc) ; en attendant lentit est stocke ( patiente )
dans une file dattente interne au bloc Seize. Le fait qu'une entit sorte du bloc indique que les
ressources, disponibles en nombre suffisant, sont saisies (et donc plus disponibles).
Le bloc reprsent dans la figure suivante est intitul Seize 1 (champ Name = Seize 1). Pour
simplifier la comprhension, considrons que seulement un type de ressource est concern (dans
lexemple, Resource 1), alors :
- le nom de la ressource est spcifi dans le champ Resource Name, soit Resource Name =
Resource 1 (lajout dun autre type de ressource donnerait lieu une ligne supplmentaire
dans la liste Resources),
- le nombre (minimum) de ressources (de type Resource 1) disponibles est spcifi dans le champ
Quantity, par exemple Quantity = 1.
- 141 -
Sachant qu'une ressource peut ne pas tre disponible, les entits, en attente d'un nombre suffisant
de ressources disponibles, sont stockes dans une file d'attente, intgre (en amont) au bloc Seize,
et dont le nom est indiqu dans le champ Queue Name (soit Queue Name = Seize 1.Queue).

Une file dattente est caractrise (configure) par le bloc Queue (issu du template Basic Process,
appartenant au cadre exprimental et donc non travers par une entit), voir la figure suivante :
- le champ Name permet de dclarer une file dattente, par exemple Seize 1.Queue,
- le champ Type permet dindiquer le mode de gestion de la file dattente. Par dfaut, le mode de
gestion est de type First In, First Out (FIFO).
Le bloc Queue permet de dfinir plusieurs files d'attente dans un mme modle.

Les types de ressource, ainsi que le nombre pour chaque type de ressources, sont indiqus dans le
bloc Resource (issu du template Basic Process, appartenant au cadre exprimental et donc non
travers par une entit), voir la figure suivante :
- le champ Name permet de dclarer une ressource, par exemple Resource 1,
Reprsentation graphique de la file dattente
associe au bloc Seize 1
- 142 -
- le champ Capacity permet de dfinir le nombre dunit de la ressource, par exemple 1.
Le bloc Resource permet de dfinir plusieurs types de ressources dans un mme modle.

e) Release (issu du template Advanced Process) : Un bloc Release permet de relcher des
ressources. Celui reprsent dans la figure suivante est intitul Release 1 (champ Name =
Release1). Quand une entit entre dans ce bloc, elle libre (relche) la, ou les ressources dont le
nom est spcifi dans le champ Resource Name, par exemple Resource 1, le nombre de
ressources libres est spcifi dans le champ Quantity, par exemple 1. On peut noter que
lexcution de cette tche est instantane, autrement dit le temps de passage dune entit dans un
bloc Release est nul. Pour simplifier, seul un type de ressource est concern (dans lexemple,
Resource 1), lajout dun autre type de ressource donnerait lieu une ligne supplmentaire dans
la liste Resources.

f) Assign (issu du template Basic Process) : Un bloc Assign permet dassigner une valeur,
notamment, un attribut, une variable (ventuellement propre SIMAN, par exemple relative
ltat dune ressource), durant lexcution dune simulation. Quand une entit entre dans un bloc
Assign, lexpression - logique ou mathmatique - spcifie dans le champ New Value est value
et assigne, selon le contenu du champ Type (Attribute, Variable, ), un attribut (rattach
- 143 -
lentit activant le bloc) ou une variable. Dans la figure suivante, le bloc intitul Assign 1
(champ Name = Assign 1) permet de dclarer :
- une variable Variable 1 1 ;
- un attribut Attribute 1 TNOW ;
- une variable Variable 2 STATE(resource 1). La variable STATE(resource 1) restitue ltat
courant de la ressource resource 1 (les valeurs possibles sont : -1=Idle ; -2=Busy ;
-3=Inactive ; -4=Failed) ;
- une Variable 3 Attribute 1.

Le bloc Variable (issu du template Basic Process, appartenant au cadre exprimental et donc non
travers par une entit) permet de dclarer des variables.
- 144 -

j) Process (issu du template Basic Process) : Un bloc Process permet de simuler le
comportement dune machine, sachant que diffrents modes de fonctionnement sont autoriss
selon le contenu du champ Action (situ dans le cadre Logic lorsque le champ Type = Standard).
Un bloc Process, intitul Process 1 (champ Name = Process 1), est dcrit dans la figure suivante.

Lorsque le champ Action contient la valeur :
i) Delay, la machine se ramne un simple bloc Delay, ce qui permet de simuler un temps de
traitement (voir le cadre Delay Type pour assigner un temps de traitement) et le fait quil ny a
pas de contrainte vis--vis de la ressource de la machine.
2i) Seize Delay, la machine ncessite une, voire plusieurs ressources (voir le cadre Resources
pour assigner le type, ainsi que le nombre, de ressources concernes) durant un temps (relatif au
temps de traitement) minimum indiqu dans le cadre Delay (le relchement de la ressource est
suppos ralis en aval).
- 145 -
3i) Seize Delay Release, idem. au cas 2i) avec une gestion au niveau du relchement de la
ressource saisie .
4i) Delay Release, idem. au cas 3i) sans la gestion de lallocation de la, voire des ressources
ncessaires au traitement dune pice (cette gestion est suppose ralise en amont du
bloc).
DESCRIPTION DE QUELQUES BLOCS PERMETTANT LANALYSE DUN MODLE
Les blocs dcrits au VIII.2 permettent de modliser un systme physique, sans pour autant fournir
dinformations (exceptes celles donnes par dfaut dans le rapport final). La collecte
dinformations spcifiques se fait en utilisant des blocs supplmentaires tels que le bloc Record et
le bloc Static. Dans ce qui suit nous dcrivant le bloc Static titre dexemple.
2) Le bloc Statistic (issu du template Advanced Process, appartenant au cadre exprimental et
donc non travers par une entit) permet, selon le contenu du champ Type, de :
- collecter durant la simulation des statistiques issues de variables SIMAN, telles que le nombre
dentits contenues dans une file d'attente (variable NQ, cf. 2.a), le taux doccupation dune
ressource (variable NR, cf. 2.b) (Type = Frequency) ;
- spcifier les fichiers dans lesquels seront sauvegardes les donnes dobservations individuelles,
par exemple :
- celles issues dun bloc Record (relatif un compteur ou un tally) (Type = Count ou Tally) (cf.
2.c)) ;
- celles issues dune variable SIMAN (le nombre dentits contenues chaque instant dans une
file d'attente, le taux doccupation chaque instant dune ressource (Type = Frequency) (cf. 2.c)).
2.a) Lorsque le champ Type = Frequency et le champ Frequency Type = Value, le bloc Statistic
permet, travers la variable NQ (abrviation de Number in Queue) - mise jour
automatiquement par SIMAN, de disposer du nombre dentits contenues dans une file d'attente.
- 146 -
Par exemple, en supposant dfini une file d'attente intitule Process 1.Queue, la variable Statistic
3 (champ Name = Statistic 3) permet de connatre le nombre dentits prsentes chaque instant
dans la file dattente Process 1.Queue lorsque le champ Expression = NQ(Process 1.Queue) (voir
figure ci-dessous).
2.b) Lorsque le champ Type = Frequency et le champ Frequency Type = Value, le bloc Statistic
permet, travers la variable NR (abrviation de Number of busy Resource units) - mise jour
automatiquement par SIMAN, de disposer du taux doccupation dune ressource.
Par exemple, une machine constitue de n ressources permet le traitement en parallle de n
pices. Une ressource peut tre occupe (busy), soit disponible (idle). Par exemple, considrons
une machine, reprsente par un bloc Process 1, utilisant une ressource Resource 1 de capacit
gale 3 (donne dclare dans un bloc Resource), la variable Statistic 4 (champ Name =
Statistic 4) permet de connatre le nombre de ressources Resource 1 occupes au cours du temps
(ce nombre pouvant tre gal 0, 1, 2 ou 3) lorsque le champ Expression =NR(Resource 1) (voir
figure ci-dessous).
2.c) Le nom du fichier - ainsi que son rpertoire si celui-ci est diffrent du rpertoire contenant
lapplication - dans lequel sont enregistres les donnes issues dun bloc Record ou dune
variable SIMAN (NQ ou NR) est indiqu dans le champ Counter Output File ou Tally Output File
(selon que le bloc Record est relatif un compteur ou un tally) ou Output File (pour une variable
SIMAN NQ ou NR). Le contenu du champ Type est respectivement gal Counter, Tally ou
Frequency selon que les donnes sont issues dun compteur, dun tally ou dune variable SIMAN
(NQ ou NR). Afin de disposer des donnes au format csv (abrviation de comma-separated-value,
comma signifiant virgule), il suffit de mettre lextension .csv au fichier de sauvegarde. Ce
format est reconnu notamment par MatLab (via la commande CSVREAD) et Excel. Au pralable,
il faut indiquer que le fichier de sauvegarde est au format texte ; pour cela cocher la case Write
Statistics Output Files as Text accessible via le menu Run/Setup/Run Control/Advanced.

S-ar putea să vă placă și