Documente Academic
Documente Profesional
Documente Cultură
Intoduction
0.1 Problmatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
0.2 Prsentation de lexprimentation . . . . . . . . . . . . . . . . . . . . .
0.3 Organisation du travail . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
2
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
5
6
9
9
10
11
13
13
15
15
16
17
19
20
21
22
23
23
25
25
25
26
26
30
ii
31
34
40
40
40
41
41
43
45
46
46
49
50
53
58
77
77
78
78
80
iii
. . . . 80
. . . . 83
. . . . 85
. . . . 88
. . . . 90
robot
. . . . 93
. . . . 93
. . . . 95
. . . . 97
. . . . 100
101
Bibliographie
104
Annexes
112
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
113
113
115
115
115
116
116
118
119
119
120
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
131
131
131
132
133
133
iv
THESE
prsente
Hadia CHERRID
pour obtenir le diplme de
DOCTORAT DE LUNIVERSITE
VERSAILLES SAINT QUENTIN
Spcialit : Automatique et Robotique
JURY
M. J.P. Richard
M. J.P. Barbot
M. W. Perruquetti
Mme. C. Chevallereau
M. N.K. MSirdi
Mme. N. N-Gauthier
Prsident
Rapporteur
Rapporteur
Examinateur
Directeur de thse
Codirecteur de thse
mes parents
Remerciements
Le travail prsent dans ce mmoire a t ralis au Laboratoire de Robotique de
Paris. A ce titre, je tiens exprimer ma profonde reconnaissance Monsieur le Directeur du Laboratoire de Robotique de Paris (L.R.P), pour mavoir accueilli et mavoir
permis ainsi de raliser lobjectif que je mtais x.
Je remercie vivement, Monsieur Jean Pierre BARBOT et Monsieur Wilfrid PERRUQUETTI davoir accept dtre rapporteurs de ce travail. Je suis trs reconnaissante
pour le temps quils ont consacr ltude du rapport de thse, pour lintrt quils ont
manifest lgard de mon travail et pour laccueil quils mont fait an den discuter.
Je tiens remercier Monsieur Jean Pierre RICHARD davoir accept de prsider
le jury de cette thse.
Je remercie galement Madame Christine CHEVALLEREAU davoir accept de
participer au jury de thse en qualit dexaminateur.
Mes vifs remerciements Monsieur Nacer K. MSirdi, Professeur lUniversit de
Versailles Saint-Quentin et responsable du groupe commande au LRP, davoir veill
ce que je puisse travailler dans les meilleures conditions. Je le remercie galement pour
ses conseils et sa sympathie.
Mes remerciements les plus sincres sadressent Madame Nelly NADJAR GAUTHIER, matre de confrences lUniversit de Versailles Saint-Quentin, pour avoir
suivi le droulement de mon travail et mavoir aide aner et prciser ma dmarche.
Je tiens aussi remercier tous les membres du LRP qui ont contribu, par lamiti
et le soutien, la ralisation de ce travail.
Je ne terminerais pas sans adresser une pense toute particulire mes frres et
ma soeur dont le soutien me fut indispensable.
vii
Introduction gnrale
0.1
Problmatique
Les systmes rels sont la plupart du temps non linaires, mal dnis, ont des
paramtres variables et sont soumis des perturbations externes. La modlisation de
ces systmes relve trs souvent dune approximation des phnomnes physiques mis
en jeu. Or, cest partir de cette reprsentation approximative des systmes que lon
souhaite construire une commande robuste dans le sens o elle devra assurer une faible
sensibilit aux incertitudes sur les paramtres, leurs variations et aux perturbations
externes. Lobjectif que nous nous sommes x pour ce travail de recherche peut donc
se rsumer dterminer des commandes robustes et performantes, relativement simples
mettre oeuvre et adaptes aux systmes robotiques rapides.
Lorsque la partie commande du processus est faiblement perturbe, les commandes classiques, par exemple action Proportionnelle Intgrale Drive, peuvent
savrer susantes si les exigences en prcision et performance du systme ne sont pas
trop svres. Dans le cas contraire, il faut concevoir des algorithmes de commande
assurant une robustesse du comportement du processus vis--vis des incertitudes sur
les paramtres et leurs variations. On peut citer dans ce contexte, la commande H
[73], la commande LQG [59], la commande CRONE [89, 90], la commande adaptative
[14, 25, 65, 108, 120], la commande par modes glissants [24, 42, 43, 112, 104] etc... Nous
avons choisi dadopter pour rpondre un critre de robustesse, la technique des modes
glissants que nous combinerons dans un second temps avec les techniques dadaptation.
La caractristique principale dune commande par modes glissants est sa structure
variable avec commutation sous certaines conditions prdnies lors de la synthse de
part et dautre dune surface choisie a priori, appele surface de glissement. Le systme
command est dit alors en rgime glissant et sa dynamique devient insensible aux
variations paramtriques, aux erreurs de modlisation, et certaines perturbations
externes. La mise en oeuvre dune telle commande est relativement simple. En eet,
elle ne ncessite pas une reprsentation exacte du processus, ce qui est un avantage
considrable. Cependant, lutilisation de cette approche a longtemps t limite par
les vibrations rsiduelles en hautes frquences qui se manifestent sur les grandeurs
asservies et les variables de commande. Ce phnomne est appel rticence. Diverses
fonctions de lissage ont t proposes dans la littrature permettant de palier cet
inconvnient mais au dtriment des performances. Cependant, de nouvelles lois de
commande bases sur les modes glissants dordre suprieur sont apparues rcemment
1
Introduction
[11, 12, 45, 48, 53, 74, 78]. Elles sont susamment lisses et liminent le phnomne de
rticence.
Nanmoins, la mise en oeuvre de toutes ces lois de commande ncessite la mesure de signaux souvent non disponibles ou trs bruits. Ce problme peut tre rsolu
de deux faons direntes. La premire consiste utiliser des capteurs plus performants (sils existent) mais donc plus onreux. La deuxime solution consiste limiter
le nombre de capteurs et concevoir un capteur logiciel intgr directement dans la
boucle de commande, savoir un observateur dtat.
Nous verrons que, contrairement aux cas des systmes linaires, il nest pas trivial
dintgrer un observateur dans une loi de commande. En eet, pour un systme non
linaire, lassociation dun observateur convergent et dune loi de commande stabilisante
ne conduit pas forcment un systme convergent. Concevoir un observateur nest donc
pas susant ; il est aussi ncessaire de concevoir une loi de commande qui stabilise
lensemble constitu de lobservateur et du processus. Les deux concepts doivent tre
traits de pair.
0.2
Prsentation de lexprimentation
Le robot ayant servi de support exprimental (gure (0.1)) est un bras manipulateur trois degrs de libert actionneurs lectriques, qui a t conu au sein du
Laboratoire de Robotique de Paris (LRP). Lune des caractristiques du systme est
sa lgret car il a t construit avec des matriaux composites lgers ; le mcanisme a
un poids total de 1.03 Kg.
Nous disposons de trois codeurs incrmentaux pour la mesure des positions articulaires des trois axes constituant le bras manipulateur.
Le premier et le deuxime axe sont directement actionns par des motorducteurs
relatifs aux actionneurs un et deux. Le troisime axe est mis en mouvement par une
courroie lie larbre de sortie du motorducteur relatif son actionneur.
27cm
Axe1
Bti
Rducteur
Codeur
M oteur
A xe2
22.5cm
Courroie
Axe3
36.5cm
P re ssio n
d a lim e n ta tio n
C y lin d re
P n e u m a tiq u e
P isto n
C a p te u r d e
2m e S egm ent
d e la p a tte
C b le
P o u lie
0.3
Organisation du travail
Introduction
Chapitre 1
Elments de thorie concernant le
mode de glissement
1.1
Introduction
Un modle mathmatique constitue souvent une description approche de la ralit physique. Or nous ne disposons que de ce type de modle pour construire une
loi de commande. Ainsi la commande choisie devra tre robuste dans le sens o elle
devra garantir une faible sensibilit aux erreurs et incertitudes sur les paramtres,
leurs variations et aux perturbations. Notre choix sest port sur la commande
par modes de glissement qui nest autre quun cas particulier de la thorie des systmes structure variable et multifonctions, base essentiellement sur la rsolution
des quations direntielles second membre discontinu, initie par Filippov en 1960
[49]. Lutilisation de cette thorie date de la parution des livres dEmelyanov [44],
dItkis [67] et dUtkin [113]. La communaut automaticienne sest rapidement rendu
compte de lintrt de cette technique qui allie simplicit de synthse et robustesse
[3, 13, 17, 23, 27, 41, 60, 62, 96, 99, 100, 105, 106, 110, 119].
Ce chapitre est destin introduire les lments thoriques ncessaires la comprhension du fonctionnement des commandes par modes de glissement, et des observateurs bass sur la mme technique.
1.2
Dnitions
Considrons le systme non linaire suivant :
x = f (x, t, u)
(1.1)
et lhypersurface
s (x) = 0
o x est ltat du systme de dimension n, f un champ de vecteur susamment
5
si
s (x) < 0
u
u (x, t) [1, 1]
si
s (x) = 0
(1.2)
si
x s+
x = f + (x, t)
(1.3)
x = f (x, t)
si
x s
Ayant rejoint la surface, ltat va y rester puisque chacun des deux champs f + ou f
ly ramne. Il glissera donc le long de cette surface. Cest ce mouvement le long de la
surface de discontinuit s (x) = 0 quon nomme rgime ou mode de glissement.
Nous appellerons fN+ et fN les projections respectives de f + et de f sur la
normale la surface s (x) = 0.
1.3
fi
(i, j = 1, . . . , n)
xj K
K tant une constante. Cette condition tant vrie pour tout x dans le domaine
X = s s+ . Soit une fonction s deux fois direntiable, telle que chacune des fonctions
fN+ et fN est continue par rapport x et t, pour x solution de s (x) = 0, et le vecteur
h = fN+ fN est continment direntiable. Si en chaque point de la surface s (x) = 0,
les ingalits fN+ < 0 et fN > 0 sont vries, il existe alors dans le domaine X,
une solution unique x (t) du systme (1.1) qui dpend des conditions initiales de faon
continue.
On peut remarquer que les ingalits fN+ < 0 et fN > 0 signient que s est
attractive au moins dans un voisinage.
Un deuxime thorme, bas sur lutilisation des fonctions de Lyapunov, fournit
les conditions dexistence du mode de glissement selon Utkin :
Thorme 2 [112, 114] : Pour que le domaine Dg de dimension (n 1) soit un domaine de glissement pour le systme (1.1) et (1.2), il sut que pour tout x de ce
domaine, il existe une fonction de Lyapunov V (s, x, t) continment direntiable par
rapport tous ses arguments, dnie sur un ensemble contenant lorigine et satisfaisant les conditions suivantes :
a- V (s, x, t) est dnie positive par rapport s :
V (s, x, t) > 0
s 6= 0
si
et
V (0, x, t) = 0
ksk=R
sup V = HR ,
ksk=R
R 6= 0,
lim HR = 0,
R0
mR > 0,
sup mR > 0
R[a,b]
(1.4)
x 1 = x2
x 2 = ksign(s)
Avec s (x) = cx1 + x2 (c > 0) et x = (x1 , x2 ) voluant dans <2 . En prenant comme
fonction de Lyapunov V = 12 s2 , il sut que la drive par rapport au temps de V soit
ngative pour que la surface s (x) = 0 soit attractive soit :
ss < 0
(1.5)
k
c
k
s < 0 et s > 0 x2 >
c
k
+
x/ s > 0 et x2 < +
Da =
c
Da =
x/ s < 0 et x2 >
c
et donc le domaine de glissement (gure (1.1)) est donn par :
+ D
Dg = x/ x D
a
a
s=0
Domaine de glissement
+ k /c
D a+
x1
D a
k /c
(1.6)
Dans ce cas on peut assurer que la surface s(x) = 0 va tre rejointe en un temps ni
tf in tel que tf in < s(t=0)
.
Remarque 3 Daprs Filippov [49] et Utkin [112] lestimation du domaine de glissement Dg, dpend des conditions initiales (x0 , t0 ). Il est donc intressant, pour la mise
en oeuvre dune commande par modes glissants, dvaluer le domaine des conditions
initiales, cest--dire, le domaine contenant tous les tats x0 linstant t0 qui permettent dassurer un rgime glissant. Pour plus de dtails sur lestimation du domaine
des conditions initiales, voir [61, 91].
1.4
1.4.1
Mthode de Filippov
10
s
x*
s+
f *+
f0
f *
(0 1)
(1.7)
grad s.f
grad s. (f f + )
(1.8)
1.4.2
grad s.f
grad s.f +
+
f
f
grad s. (f f + )
grad s. (f f + )
(1.9)
Cette mthode propose par Utkin consiste admettre quen mode de glissement
tout se passe comme si le systme tait pilot par une commande dite commande
quivalente que nous noterons par la suite ueq [112, 113, 115].
La commande quivalente est dnie comme tant la commande obtenue par
rsolution de lquation :
s = 0
(1.10)
11
Cest donc la commande qui permet de maintenir ltat du systme sur la surface de
discontinuit s = 0. Ceci nous donne directement lquation du mode de glissement
pour les systmes du type :
(1.11)
x = f (x, t, ueq )
Lquation (1.11) conduit lcriture :
s
s
f (x, t, ueq ) +
=0
x
t
(1.12)
Dans le cas gnral, il nest pas facile de rsoudre analytiquement lquation (1.12).
Pour le cas des systmes non linaires anes en u dnis comme suit :
(1.13)
x = f (x, t) + g (x, t) u
Lquation (1.12) possde la solution explicite suivante :
s
ueq (x, t) =
g
x
s
s
f+
x
t
(1.14)
s
dans le cas o le terme x
g est non nul. Le remplacement de (1.14) dans (1.13) donne
lexpression de lquation du mode de glissement :
s
s
s
g
f+
= f (x, t) g (x, t)
x
x
t
(1.15)
Dans la littrature qui traite des problmes de commande par modes de glissement
on utilise beaucoup cette mthode car elle concerne les systmes contrls et donne des
solutions explicites pour les systmes non linaires anes. De plus, pour ces derniers,
Utkin [113, 114] montre que par rapport la commande initialement commutante
u (x, t), la commande quivalente nest rien dautre que la composante basse frquence
de la commande commutante rellement applique au systme physique. Ceci veut dire
quen moyenne le systme ragit comme sil tait pilot par ueq .
1.5
Le problme dunicit de lquation du mode de glissement se pose. Les dynamiques glissantes aux sens de Filippov [49] et dUtkin [114] sont quivalentes dans le
cas des systmes linaires en entre. Dans le cas contraire, elles sont en gnral direntes. Lexemple suivant montre que la dynamique de glissement peut dpendre de
la mthode utilise. Nous prsentons un cas o lon obtient une solution stable selon
Filippov, et instable selon Utkin.
12
x 1 = 0.3x2 + ux1
x 2 = 0.7x1 + 4u3 x1
u = sign(s(x)x1 ) =
1
1
si
si
(1.16)
s(x)x1 < 0
s(x)x1 > 0
(1.17)
avec :
s(x) = x1 + x2
x2
s s& > 0
s s& < 0
s s& < 0
x1
s s& < 0
s s& < 0
x 2 = x1
s s& > 0
x 2 = 19 x 1
x 2 = 14 . 33 x 1
s = 1 + ueq + 4u3eq x1
13
En utilisant la procdure de Filippov, lquation (1.9) aboutit la dynamique de glissement stable donne par :
x 1 = 0, 1x1
La comparaison des deux quations de mode de glissement, trouves respectivement
par la mthode de la commande quivalente et la mthode de Filippov, montre la non
unicit des solutions en mode de glissement, jusqu lobtention de solutions stables ou
instables.
1.6
(1.18)
(1.19)
1.7
Phnomne de rticence
14
s+
f
Mode de glissement
s=0
Fig 1.4 : Mode de glissement idal
Malgr les dirents avantages de la commande par modes de glissement, son utilisation a t entrave par un inconvnient majeur quon appelle rticence, broutement
ou encore chattering (gure (1.5)). La rticence est une consquence naturelle du
comportement dynamique rel de lensemble actionneur-systme commander.
Elle est lorigine des commutations persistantes de la commande qui peuvent
provoquer une dtrioration anticipe de lorgane de commande ou exciter des dynamiques hautes frquences non considres dans la modlisation du systme. Ainsi,
nous allons chercher par direntes mthodes limiter ce phnomne. Une premire
approche consiste remplacer la fonction signe par une fonction plus lisse.
s+
s = 0
s
s
sat
=
sign (s)
si
si
s
1
s
> 1
15
sat (s )
2
s
s
s
arctan , |s|+ , tanh ...etc.
1.8
1.8.1
16
t1 > 0 tel que t t1 , les galits suivantes soient vries s(t, x(t)) = s(t,
x(t)) =
. . . s(r1) (t, x(t)) = 0
La notion de modes glissants idaux na pour but que dexprimer une solution
thorique, mathmatiquement possible mais irralisable pratiquement ( cause des imperfections et limitations physiques des organes de commutation). Elle permet datteindre de faon plus lisse la surface de contrainte. Ceci est gnralement li un
phnomne dintgration des discontinuits de la commande.
Denition 2 Une commande par modes glissants rels sur s = 0 est dite dordre
r > 0 par rapport une fonction valeur relle (), tels que 0 () 0, si
pour nimporte quel ensemble compact appartenant au domaine de dnition, il existe
t1 > 0 et une constante C > 0 telle que t > t1 lingalit suivante soit vrie :
|s (t, x (t, ))| C |()|r .
La notion de modes glissants rels permet dexprimer la dpendance de lalgorithme modes glissants par rapport aux imperfections physiques du systme rel (retard dun actionneur, chantillonnage de la mesure, gain non inni de la fonction signe
en zro, etc...). Cet aspect est trs important pour les systmes structure variable
quand il sagit de passer une application relle.
1.8.2
(1.20)
s = s(t, x)
(1.21)
et la surface de commutation
pour lesquelles,
x <n est ltat du systme
u < la commande.
s < et f sont deux fonctions continues (en x et t).
Lobjectif de la commande est de contraindre la trajectoire du systme atteindre
la surface de glissement s.
Par drivation successive de la fonction s, on peut dnir le degr relatif r [66]
du systme (1.20) par rapport la variable s, soit :
s
1- le degr relatif de 1 si u
6= 0.
(i)
(r)
s = 0 (i = 1, 2, ...r 1) et u
s 6= 0.
2- le degr relatif suprieur 2 si u
Pour le premier cas, avec lapproche par modes glissants classique, on peut atteindre lobjectif de commande. Toutefois, la commande par modes glissants dordre
deux peut tre applique an dliminer le phnomne de rticence [9, 53, 74]. Alors
que pour le deuxime cas, lapproche par modes glissants dordre r est la technique la
plus conforme.
17
Si on a une surface de degr relatif un, en drivant deux fois cette dernire, on
aboutit aux relations suivantes :
s (t, x) +
s (t, x) f (t, x, u)
t
x
s (t, x, u) f (t, x, u) +
s (t, x, u) u
s = s (t, x, u) +
t
x
u
s =
(1.22)
(1.23)
Pour une tude rigoureuse de la commande par modes glissants dordre deux, les hypothses suivantes sont ncessaires [53] :
1. La commande est telle que : |u| Umax , avec Umax une constante relle
positive, et, les solutions du systme (1.20) sont supposes dnies pour tout t.
2. Il existe u1 [0, Umax ] telle que pour toute fonction continue u (t) avec |u (t)| > u1 ,
il existe t1 (initial), tel que, s (t) u (t) > 0 pour tout t > t1 . Ainsi, la commande
u = Umax sign [s (t0 )], o t0 est linstant initial, permet datteindre la surface de
glissement s = 0 en temps ni.
3. Il existe des constantes s0 , G1 , G2 telles que pour tout x, t <n < avec
|s (t, x)| < s0 , le systme vrie par rapport la surface de glissement s = 0 la
relation suivante :
0 < G1
s
G2
u
(1.24)
4. Il existe une constante H telle que lintrieur du domaine |s (t, x)| < s0 , on ait
lingalit suivante :
s (t, x, u) +
<H
s
(t,
x,
u)
f
(t,
x,
u)
(1.25)
t
Dans la littrature, il existe plusieurs algorithmes de commande par modes glissants dordre deux : Lalgorithme du twisting, lalgorithme du twisting chantillonn,
lalgorithme du sub-optimal [6, 10], lalgorithme du super-twisting [74, 76], lalgorithme
du drift [46, 47], etc...
Nous allons dcrire en dtail lalgorithme du twisting et lalgorithme du twisting
chantillonn que nous utiliserons dans notre travail pour la synthse de commandes
et dobservateurs.
1.8.2.1
Algorithme du twisting
Cet algorithme de commande a t propos dans [45, 48, 74, 78]. Pour un systme
de degr relatif un, la variable u est considre comme une variable dtat, alors que
18
(1.26)
(1.27)
s (t, x, u) +
s (t, x, u) f (t, x, u)
t
x
s (t, x, u) s = 0
et
g(x) =
u
Dans ce cas, lalgorithme du twisting est dni de la manire suivante :
h(x, u) =
si
|u| > Umax
u
kM sign(s)
si
ss > 0 et |u| Umax
u =
(1.28)
km sign(s)
si
ss 0 et |u| Umax
kM > km > 0
4G2
km >
s0
H
km >
G1
G2 km 2H
kM >
+
G1
G1
(1.29)
(1.30)
(1.31)
(1.32)
19
avec :
G1 kM + G2 km
2
(G1 kM H) G2 km + H
r
G2 km + H
=
G1 kM H
et s1 la valeur de la variable s lors de son premier passage travers laxe des abscisses
dans le plan ss (gure (1.8)). tM1 reprsente le temps correspondant.
=
s&
s1 ( t M 1 )
s = h(x, u) + g(x)u
lalgorithme du twisting devient [53, 74] :
kM sign(s)
u=
km sign(s)
si
si
ss > 0
ss 0
(1.35)
20
si
|u| > Umax
u
kM sign(s)
si
s4s > 0; |u| Umax
u =
(1.36)
km sign(s)
si
s4s 0; |u| Umax
si
s4s > 0
kM sign(s)
(10)
u=
si
s4s 0
km sign(s)
Comme lalgorithme du twisting chantillonn ne ncessite pas la connaissance de la
drive de la surface de glissement s,
qui est en partie un des objectifs dun observateur,
il sera utilis pour la synthse dobservateurs par modes glissants dordre suprieur.
1.9
y(t)
u(t)
Systme
Observateur
x(t)
21
[15, 16], ltre de Kalman tendu [58, 109] ..) mais elle sappuie en gnral sur une
bonne connaissance du modle du systme.
Une des classes les plus connues des observateurs robustes est celle des observateurs par modes glissants [26, 29, 38, 63, 64, 72, 101, 107, 116]. Ce type dobservateur
est bas sur la thorie des systmes structure variable. Notre choix porte sur ces observateurs, pour leurs bonnes proprits de robustesse vis--vis des erreurs paramtriques
et des perturbations bornes.
Nous allons prsenter la structure de lobservateur par modes glissants classique
puis une structure adapte au cas o le systme peut se mettre sous forme triangulaire
[5, 19]. Ce dernier observateur est intressant car sous certaines conditions, il converge
en temps ni.
1.9.1
x = f (x, u)
y = h (x)
une structure dobservateur par modes glissants scrit :
( .
x
b= f (
x, u) + sign (y y)
y = h (
x)
cest une copie du modle, laquelle on ajoute un terme correcteur, qui assure la
convergence de x vers x. La surface de glissement dans ce cas est donne par :
s(x) = y y
Le terme de correction utilis est proportionnel la fonction discontinue signe applique
lerreur de sortie o sign (x) est dnie par :
sign (x) =
1
1
si
si
x>0
x<0
Ltude de stabilit et de convergence pour de tels observateurs, est base sur lutilisation des fonctions de Lyapunov [26, 106].
22
1.9.2
Une autre structure dobservateurs base sur les modes glissants, t introduite
dans [5, 19, 84]. Cet observateur a t dvelopp pour des systmes qui peuvent se
mettre sous la forme suivante, appele forme triangulaire dobservation :
x 1
x2 + g1 (x1 , u)
x 2
x3 + g2 (x1 , x2 , u)
..
..
=
(1.37)
.
x n1
xn + gn1 (x1 , ..., xn1 , u)
fn (x) + gn (x, u)
x n
y = x1
o les gi et fn pour i = 1, ..., n sont des fonctions analytiques, x = (x1 , x2 , ..., xn )T <n
ltat du systme, u <m est le vecteur dentre et y < la sortie que nous considrons
pour des raisons de simplicit dcriture unidimensionnelle.
La structure de lobservateur propose est la suivante :
x1
.
x2
..
.
xn1
.
xn
=
x + g (x , x ..., x , u) + sign (
n1 )
n
n1 1
2
n1
n1
n1 xn1 x
(1.38)
1.10. Conclusion
1.9.3
23
Ces observateurs sont bass sur la technique des modes glissants dordre suprieur
[7, 20] permettant dliminer le phnomne de rticence sur les tats observs, tout
en gardant les bonnes proprits de robustesse des observateurs par modes glissants
prsent ci-dessus.
Pour des raisons de clart nous prsentons lobservateur dordre deux. Ce dernier
est inspir de lalgorithme du twisting chantillonn pour la commande et est donn
par [20, 21] :
( .
x1i = x2i + 1i
.
(1.39)
x2i = fi (x1 , x2 , ) + K2i sign(
x2 x2 )
avec :
1i =
o :
pour
sign(
x1i )
Mi
x1i )
mi sign(
pour
pour
1i (k) = x1i (k) x1i ((k 1)) et est la priode dchantillonnage des mesures.
x1i = x1i x1i reprsente lerreur dobservation.
x2i =
x2i
x2i + 1i
pour
pour
x1i (k) 6= O( 2 )
x1i (k) = O( 2 ) et 1i (k) = O( 2 )
pour i = 1, ...3.
Lobservateur dordre deux prsente une convergence en temps ni en O( 2 ) pour les
positions et en O() pour les vitesses.
1.10
Conclusion
Dans ce chapitre, nous avons eectu une courte synthse des principaux rsultats
sur la commande et lobservation par modes glissants dordre un et dordre deux.
Lintrt majeur de ces approches se situe dans la simplicit de mise en oeuvre de
la loi de commande. On peut prendre en compte, aussi bien en terme de stabilit que
de robustesse, les non-linarits et limprcision des paramtres identis du processus
command. Nanmoins, ces lois de commandes ncessitent souvent lemploi dobservateurs. An destimer avec la plus grande robustesse possible ltat, notre choix sest
port sur les observateurs par modes glissants.
Nous allons nous intresser en premier lieu ltude de stabilit en boucle ferme, de lobservateur classique par modes glissants coupl une commande par modes
24
glissants pour un robot trois degrs de libert. Des rsultats de simulation et exprimentaux sur la plate-forme du bras manipulateur illustreront les performances de
lobservateur et la commande propose. Une extension de ce travail est faite pour un
systme mcanique dordre 3 actionneurs pneumatiques, suivi de rsultats de simulation.
Linconvnient majeur des modes glissants est lapparition du phnomne de rticence qui se manifeste dans les grandeurs asservies. Les fonctions dadoucissement
permettent sa rduction. Cependant, elles font apparatre un compromis entre la robustesse de la commande et les performances du systme.
Ainsi lobjectif de ce mmoire est de construire des schmas de commande et dobservation assurant la fois, robustesse et performance, adapts aux systmes robotiss
pour des mouvements rapides.
Chapitre 2
Commande et observateur par
modes glissants
2.1
Introduction
2.2
26
La modlisation lagrangienne puis sous forme dtat du robot, est prsente. Ensuite nous abordons la synthse dun observateur et dune commande par modes glissants dont nous montrons la stabilit en boucle ferme.
2.2.1
Modlisation mcanique
En appliquant le formalisme de Lagrange (voir annexe A), nous obtenons lquation suivante, reprsentant le modle dynamique du bras manipulateur :
M (q) q + C (q, q)
q + G (q) =
(2.1)
o q, q et q (vecteurs de dimension 3) reprsentent respectivement le vecteur des coordonnes gnralises en position, vitesse et acclration, M (q) la matrice dinertie,
C (q, q)
q vecteur de dimension 3 des forces de Coriolis, G (q) le vecteur de gravit
(3 1) et les couples appliqus sur chacune des articulations du bras manipulateur.
Le dtail de M , C et G est donn en annexe A.
Pour notre tude nous mettons le modle (2.1) sous forme dquation dtat, en
prenant comme vecteur dtat : x1 = q, et x2 = q,
ce qui conduit la reprsentation
suivante :
.
x. 1 = x2
x2 = M 1 (x1 ) [C(x1 , x2 )x2 G(x1 ) + ]
(2.2)
y = x1
2.2.2
Ainsi, seule une partie de ltat est mesure (position articulaire). Do la ncessit
dutiliser un observateur dtat pour reconstituer ltat complet du systme. De plus les
paramtres intervenant dans les matrices M, C et G sont assez mal connus et peuvent
varier. Aussi la robustesse est un critre indispensable la synthse de lobservateur et
a conditionn le choix des modes glissants.
Direntes structures dobservateurs sont possibles pour ltude de notre systme
(2.1). Nous prsentons dans ce paragraphe un observateur par modes glissants qui est
une extension de celui prsent par Canudas de Wit pour un robot manipulateur
deux degrs de libert o la structure et les paramtres du systme taient supposs
connus [29] [64].
27
(2.3)
x
b= (b
x1 , x
b2 )T = (b
x11 , x
b21 , x
b31 , x
b12 , x
b22 , x
b32 )T
Dans le but dobtenir des dynamiques stables pour lerreur dobservation, nous
procdons par tapes. Dans un premier temps, nous dterminons une surface attractive
et le domaine de convergence correspondant. Dans un deuxime temps, nous tudions la
dynamique sur cette surface glissante pour le systme (2.2). Ensuite nous vrions que
cette dernire est une surface glissante pour le systme et quil y converge en temps ni.
En eet, si nous choisissons i > supt>0 |
xi2 (t)| avec i {1, 2, 3}, alors nous obtenons,
aprs un temps ni t0 , la convergence vers la surface x1 = 0. En dautres termes, x1
atteint x1 au bout dun temps t0 .
Cependant, lors du rgime transitoire avant datteindre la surface de glissement
(priode o x 6= x), il faut que le systme ne diverge pas. Ceci est vri car le systme
est entres bornes, tats borns (EBEB) pour un temps ni (voir annexe D).
Comme la surface x1 = 0 est une surface de discontinuit pour le systme (2.3)
il faut vrier quune partie au moins de cette surface est une surface glissante pour le
systme. Pour cela, nous considrons la fonction de Lyapunov suivante :
1 T
V1 = x
e x
e1
2 1
28
V 1 = x
eT1 x
e1
T
= x
e1 (
x2 1 x
e1 1 sign(e
x1 ))
xT1 1 x
e1 e
xT1 (1 sign(e
x1 )
x2 )
V 1 = e
V 1 = e
xT1 1 x
e1 +e
x11 (
x12 11 sign(e
x11 )) +e
x21 (
x22 21 sign(e
x21 )) +e
x31 (
x32 31 sign(e
x31 ))
xi2 | pour i
qui sera strictement ngative si x
e1 6= 0 et si nous choisissons i1 > |
{1, 2, 3}. Do :
V 1
= min (i ) > 0
i
n
X
T
x
ei1 i ke
x1 k
i=1
.
V 1 w V1 avec w = 2
= , (0) = V 1 (0)
V1 (t) |(t)| , (t)
La solution de cette quation direntielle est donne par :
(t) = (V1 (0) t/2)2
or, comme V1 (t) |(t)|, on a :
0 < V1 (t) < (V1 (0) t/2)2
et comme (t) = 0 en t0 = 2 V1(0) on a : V1 (t) = 0 donc x
e1 = 0 pour t > t0 = 2 V1(0) .
Ainsi, on a V 1 < 0 sous les conditions suivantes :
|
xi2 | < i1
(2.5)
29
o signeq issu de la littrature sur les modes glissants [19, 49, 113] est le vecteur
quivalent la fonction sign sur la surface de glissement. Nous pouvons rcrire sur ce
segment, lquation de la dynamique de lerreur dobservation :
( .
x
e1 =e
x2 1 signeq (e
x1 )
.
x
e2 =f(
x, ) f (x, ) 2 signeq (e
x1 ) + v
de manire obtenir la dynamique quivalente en moyenne sur la varit rduite :
(
signeq (e
x1 ) = 1
e2
1 x
.
x
e2 = f (
x, ) f (x, ) 2 signeq (e
x1 ) + v
o
h
i
1 (x1 ) C(x
1 , x2 )
1) +
f(
x, ) f (x, ) = M
x2 G(x
1 M 1
M 1 = M
1 C M 1 C
o :
M 1 C = M
1
1 G
M 1 G
M G=M
reprsentent les erreurs de modlisation.
Ce qui conduit au systme rduit suivant :
x1 ) = 1
e2
sign
eq (e
1 x
.
1
x
e = M C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2 M 1 G
2
e2 +v
+M 1 2 1
1 x
(2.6)
30
2.2.3
Lobjectif de ce paragraphe
raliser un suivi de trajectoires articulaires en
d d est de
d
position et en vitesse x1 , x2 (o x2 = x d1 ) en disposant uniquement des positions
comme retour dinformation mesure. La loi de commande propose est calcule en
considrant ltat observ et en satisfaisant la condition de glissement
ss < 0
En considrant des erreurs paramtriques et les vitesses reconstitues par lobservateur
propos ci-dessus nous obtenons la loi de commande suivante [94] :
+M
x d x2 xd Fv s ksign (s)
= C (x1 , x2 ) x2 + G
2
en posant :
.r
x2 = x d2 x2 xd2
nous obtenons :
.r
+M
x +M
[Fv s ksign (s)]
= C (x1 , x2 ) x2 + G
2
(2.7)
s = x2 xd2 + x1 xd1
(2.8)
(2.9)
x2 d
G ( x1 )
Fv
s
- K
M 1 ( x1)
+
+
x1
C ( x1 , x 2 ) x 2
Robot
x1
x 2
- -
1
1
~
x1
G ( x1 )
v
+
M 1 ( x1)
C ( x1 , x 2 ) x 2
2.2.4
31
Lobjectif de ce paragraphe est ltude de stabilit de lobservateur et la commande en boucle ferme, en utilisant lquation lie la dynamique de lerreur de suivi
(2.9) et le systme rduit (2.6) reprsentant la dynamique de lerreur dobservation,
tout en considrant les paramtres du systme inconnus.
Considrons le vecteur dtat augment Z (t) tel que :
s
Z (t) =
x2
)
(
s
.
est dnie par :
La drive Z (t) =
x
e2
1
e2 x2 +v
s. = Fv s ksign (s) 2 1 x
x
e = M 1 C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2 M 1 G + M 1
2
1
2 1 x
e2 +v
(2.10)
Pour montrer la convergence du systme (2.10), nous utilisons deux fonctions de Lyapunov :
1
V1 (s) = sT s
2
Sa drive par rapport au temps est donne par :
V 1 (s) = sT s
En utilisant les quations du systme (2.10) on aboutit au rsultat suivant :
V 1 (s) = sT Fv s sT ksign (s) sT 2 1
e2 sT x2 +sT v
1 x
ou encore :
32
(2.11)
nous avons :
.
V1 ksk
Nous obtenons donc une convergence en temps ni vers la surface de glissement s (voir
dmonstration paragraphe 2.2.2).
Pour montrer la convergence de lerreur dobservation, la deuxime fonction de
Lyapunov candidate suivante est utilise :
1
V2 (
x2 ) = xT2 x2
2
Sa drive par rapport au temps est donne par :
.
V 2 (
x2 ) = xT2 x
e2
T
1 C(x , x
x
x2 ) =
xT2 2 1
+
x
x2 M 1 C(x1 , x2 )
x2
V 2 (
2
1
2 M
1 2 )
i
M 1 C(x1 , x2 )
x2 + M 1 C(x1 , x2 )
x2 M 1 G M 1 + xT2 v
ou encore :
x2 ) =
xT2 Q
x2 + xT2 + xT2 v
V 2 (
avec :
= M 1 C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2
+M 1 C(x1 , x2 )
x2 M 1 G M 1
Q = 2 1
1
Ltude de stabilit du systme est faite en boucle ferme sous les hypothses suivantes
(voir annexes A et D) :
1) ltat du systme est born (kx (t)k < , t 0)
2) la matrice dinertie M (x1 ), matrice carre de dimension 3 3, ne dpend que
de la position et est symtrique dnie positive pour tout x1 de <n .
a) M (x1 ) = M (x1 )T > 0
M est donc inversible :
b) M (x1 )1 existe
33
c
1
1
d) kM (x1 )k n1 et M (x1 ) n01;
Le vecteur G(x1 ) de dimension 3, reprsente les termes de gravit. Chacun de ses
lments, fonction des positions,
est born.
0
e) kG(x1 )k g1 et G(x
1 ) g 1 ;
Le vecteur C (x1 , x2 ) x2 , de dimension 3, est form dlments quadratiques en x2 ,
vitesse articulaire estime. On peut majorer la norme de C (x1 , x2 ) x2 par une fonction
du carr de la vitesse articulaire x2 .
2
x2 k et C (x1 , x2 ) x2 c01 k
x2 k2 ;
f) kC (x1 , x2 ) x2 k c1 k
g) kC (x1 , x2 ) x2 k c1 k
x 2 k2 ;
Ces hypothses sont compatibles avec notre systme. Elles proviennent des proprits mcaniques du systme, et du fait que les signaux rels (position, vitesse et
acclration) sont borns (les actionneurs sont puissance nie limite).
On dnit les constantes q0 et 0 qui vont tre utilises pour la dmonstration
par :
q0 = min {Q}
0 = sup k ( )k
0 t
sup [ 1 k
x2 k2 + ( 2 + 3 ) kb
x2 k k
x2 k + 2 k
x2 k2 + 4 + 5 k k ]
0 t
0
1 signeq (e
6= 0
sign
(e
x
)
si
x
)
1
1
1
eq
k
sign
(e
x
)k
eq 1
1
(2.12)
v=
1 signeq (e
x1 ) = 0
0
si
Nous remplacerons cette forme (2.12) par la forme (2.13) utile pour lanalyse.
si
ke
x2 k =
6 0
0 kexxe22 k
v=
(2.13)
0
si
ke
x2 k = 0
x2 ) peut tre borne en crivant :
La drive de la fonction de Lyapunov V2 (e
.
min {Q} ke
x2 k2 + ke
x2 k 0 + x
eT2 v
x
eT x
e2
x2 k2 + ke
x2 k 0 2 0
min {Q} ke
ke
x2 k
q0 ke
x 2 k2
34
x
plus nous avons montr que la surface de glissement s = x2 xd2 + x1 xd1 converge
2.2.5
Rsultats de simulation
-0 .5
-5
0
0 .5
q2 et q2d
0 .5
q2p et q2pd
0 .5
q3p et q3pd
0 .5
te m p s (s )
5
rd/s
0 .5
rd
q1p et q1pd
5
rd/s
rd
0 .5
-0 .5
-5
0
0 .5
0 .5
q3 et q3d
1
5
rd
rd/s
-0 .5
-1
-5
0
0 .5
te m p s (s )
Fig 2.2 : Etats rels et dsirs sur les trois axes du bras manipulateur
Sur la gure (2.2) ( gauche) nous montrons les positions dsires (q1d , q2d et q3d )
et les positions relles (q1 , q2 et q3 ) des trois axes du bras manipulateur. Sur la mme
35
gure (2.2) ( droite) nous montrons les vitesses correspondantes (q1 , q2 et q3 ). Nous
remarquons une convergence des trajectoires relles vers les trajectoires dsires au
bout de 0.4s. En ce qui concerne les vitesses, leur convergence est obtenue au bout de
0.6s.
q1 et q1o
0 .5
q1p et q1po
rd
rd/s
- 0 .5
-1
-5
0
- 0 .5
0 .5
q2p et q2po
0 .5
q3p et q3po
0 .5
te m p s (s)
-5
0
0 .5
q3 et q3o
1
5
rd/s
rd
0
5
rd/s
rd
0 .5
0 .5
q2 et q2o
-1
-5
0
0 .5
te m p s (s)
Fig 2.3 : Etats rels (-) et observs (- -) sur les trois axes du bras manipulateur
La gure (2.3) reprsente ( gauche) les positions relles et observes (q1o , q2o
et q3o ) sur chacun des trois axes du bras manipulateur ; nous montrons ( droite)
les vitesses relles et observes correspondantes (q1o , q2o et q3o ). Nous remarquons une
convergence plus rapide des positions observes vers les positions relles 0.1s que celles
des vitesses observes vers les vitesses relles 0.2s; ce qui est conforme la thorie.
e rre u r d o b s e rv a tio n 1 (p o s)
- 0 .5
-2
0
0 .5
e rre u r d o b s e rv a tio n 2 (p o s)
0 .5
e r r e u r d o b s e r v a tio n 2 ( v it)
0 .5
e r r e u r d o b s e r v a tio n 3 ( v it)
0 .5
te m p s (s)
4
rd/s
0 .5
rd
e r r e u r d o b s e r v a tio n 1 ( v it)
2
rd/s
rd
0 .5
2
0
- 0 .5
-2
0
1
4
rd/s
rd
0 .5
0 .5
e rre u r d o b s e rv a tio n 3 (p o s)
2
0
- 0 .5
-2
0
0 .5
te m p s (s)
Fig 2.4 : Erreurs dobservation en position et vitesse sur les trois axes du bras
manipulateur
36
- 0 .2
-5
0
0 .5
e rre u r d e s u iv i 2 (p o s )
0 .5
e r r e u r d e s u iv i 2 ( v it)
0 .5
e r r e u r d e s u iv i 3 ( v it)
0 .5
te m p s (s)
5
0
rd/s
0 .2
rd
e r r e u r d e s u iv i 1 ( v it)
5
rd/s
rd
0 .2
-5
- 0 .2
-1 0
0
0 .5
e rre u r d e s u iv i 3 (p o s )
5
rd/s
rd
0 .2
- 0 .2
-5
0
0 .5
te m p s (s)
Fig 2.5 : Erreurs de suivi en position et vitesse sur les trois axes du bras manipulateur
La gure (2.5) montre que le systme complet commande et observateur, est
stable et montre un bon suivi des trajectoires dsires avec une erreur de suivi allant
de 1% 2%.
c o u p le 1
Nm
-2
0
0 .1
0 .2
0 .3
0 .4
0 .5
c o u p le 2
0 .6
0 .7
0 .8
0 .9
0 .1
0 .2
0 .3
0 .4
0 .5
c o u p le 3
0 .6
0 .7
0 .8
0 .9
0 .1
0 .2
0 .3
0 .4
0 .5
te m p s(s)
0 .6
0 .7
0 .8
0 .9
Nm
2
1
0
-1
Nm
1
0 .5
0
- 0 .5
37
q1p et q1po
0 .5
rd
rd/s
- 0 .5
-1
-5
0
0 .5
0 .5
q2 et q2o
0 .5
q2p et q2po
0 .5
q3p et q3po
0 .5
te m p s(s)
rd
rd/s
- 0 .5
-1
-5
0
1
5
rd/s
rd
0 .5
q3 et q3o
-1
-5
0
0 .5
te m p s (s )
e rre u r d e s u iv i 1 (v it)
5
rd/s
rd
0 .2
0
-5
- 0 .2
-1 0
0
0 .5
e rre u r d e s u iv i 2 (v it)
0 .5
e rre u r d e s u iv i 3 (v it)
0 .5
te m p s (s )
5
rd/s
rd
0 .1
0 .5
e rre u r d e su iv i 2 (p o s)
0
-5
- 0 .1
-1 0
0
1
5
rd/s
rd
0 .2
0 .5
e rre u r d e su iv i 3 (p o s)
0
-5
- 0 .2
-1 0
0
0 .5
te m p s(s )
38
- 0 .5
0 .5
q2 et q2d
0 .5
q2p et q2pd
0 .5
q3p et q3pd
0 .5
te m p s(s)
5
rd/s
0 .5
rd
-5
0
- 0 .5
-5
0
0 .5
q3 et q3d
1
10
rd/s
rd
q1p et q1pd
5
rd/s
rd
0 .5
5
0
-1
-5
0
0 .5
te m p s ( s )
e rre u r d e s u iv i 1 (p o s )
e rre u r d e s u iv i 1 (v it)
10
rd/s
rd
0 .2
0
-1 0
- 0 .2
-2 0
0
0 .5
e rre u r d e s u iv i 2 (v it)
0 .5
e rre u r d e s u iv i 3 (v it)
0 .5
te m p s (s)
10
rd/s
rd
0 .2
0 .5
e rre u r d e s u iv i 2 (p o s )
0
-1 0
- 0 .2
-2 0
0
1
10
rd/s
rd
0 .2
0 .5
e rre u r d e s u iv i 3 (p o s )
0
-1 0
- 0 .2
-2 0
0
0 .5
te m p s (s)
2
Nm
39
1
0
-1
0
0 .1
0 .2
0 .3
0 .4
0 .5
c o u p le 2
0 .6
0 .7
0 .8
0 .9
0 .1
0 .2
0 .3
0 .4
0 .5
c o u p le 3
0 .6
0 .7
0 .8
0 .9
0 .1
0 .2
0 .3
0 .4
0 .5
te m p s ( s )
0 .6
0 .7
0 .8
0 .9
Nm
2
1
0
-1
Nm
1
0 .5
0
- 0 .5
Fig 2.11 : Couple de commande des trois axes en utilisant la fonction sat
La gure (2.11) montre des couples de commande moins sollicits que prcdemment. En eet, en utilisant la fonction saturation, nous constatons (gure (2.11)) que
la commande devient plus lisse, mais au dtriment des performances du systme (gure
(2.10)).
40
2.2.6
Rsultats exprimentaux
Le dispositif de commande est dni au travers de la gure (2.12). Celui-ci comporte essentiellement un micro-ordinateur et une carte DSP. Les logiciels MATLAB +
SIMULINK + C code Generator (Real Time Interface) + TRACE, implants sur ce
PC, sont exploits respectivement pour :
La synthse des lois de commandes.
La dnition et la reprsentation graphique de la conguration de commande
(gnrateur de consigne, paramtres de commande...).
La traduction automatique de la conguration de commande en un code excutable par le contrleur de la carte DSP.
La rcupration et la visualisation des signaux traits par la carte DSP.
MATLAB
SIMULINK
C Code Generator
TRACE
Base du robot
.
Articulation 1
Tensions de commande
Articulation 3
..
Articulation 2
Trois motorducteurs sont ncessaires pour actionner le bras. Les moteurs utiliss
sont des moteurs Maxon courant continu aliments en 24 V sur lesquels se trouvent
des rducteurs plantaires de rapport de rduction 1/50. Ces actionneurs peuvent dlivrer un couple maximal de 1.03 N m, et tourner une vitesse en charge de 167 tr/ min.
2.2.6.2
Sur chaque axe moteur est x un codeur qui permet de rcuprer la position
de laxe. Ces codeurs optiques sont de type HEDS5540, ils renvoient 500 impulsions
par tour moteur et ont une bande passante de 100 Khz. Les informations codeurs sont
renvoyes une carte dacquisition (DSP) par deux signaux dphass de 90 degrs.
41
Par consquent la carte reoit 2000 points codeurs par tour de moteur, ce qui permet
davoir une plus grande prcision sur la position des axes.
Cependant, nous ne disposons pas sur notre systme de capteurs de vitesses,
dont nous avons besoin dans la synthse de lois de commande ; pour ces derniers, nous
utilisons donc des observateurs.
2.2.6.3
A titre comparatif il est intressant de voir comment ragit notre robot face
une commande classique trs utilise dans le domaine industriel qui est la commande
proportionnelle intgrale drive (PID). Pour cette raison nous commenons dans un
premier lieu par limplmentation de cette commande dont les rsultats sont donns par les gures ci-dessous que nous comparons aux rsultats exprimentaux de la
commande et de lobservateur par modes glissants en boucle ferme appliqus au robot manipulateur. An de tester nos commandes pour des systme robotiss rapides,
nous considrons des trajectoires dsires sinusodales de frquence 1Hz. Nous prenons
comme priode dchantillonnage 1ms. Les gains utiliss sont : Kp = diag(98, 25, 20),
kv = diag(7, 3, 4) et ka = diag(15, 18, 10), ces derniers ont t rgls exprimentalement.
p o s it io n r e lle e t d s ir e ( a r t ic u la t io n 1 )
0 .5
rd
q1d
q1
-0 .5
0
0 .5
1 .5
0 .5
1 .5
0 .5
1 .5
rd
0 .1
2
2 .5
3
3 .5
e r r e u r e n p o s it io n ( a r t i c u la t io n 1 )
4 .5
3 .5
4 .5
3 .5
4 .5
-0 .1
Nm
1 .5
2
2 .5
3
c o u p le ( a r t ic u la t io n 1 )
- 1 .5
2
2 .5
te m p s ( s )
Fig 2.13 : Position relle, position dsire, erreur de suivi et commande sur laxe un
du bras manipulateur
42
La gure (2.13), montre (en haut) la position articulaire relle et dsire de laxe
1 du robot manipulateur, les deux autres courbes prsentent respectivement lerreur
de suivi en position ainsi que le couple appliqu au moteur du premier axe du bras
manipulateur. Lerreur de suivi en position est infrieure 0.06 rd, soit 12% derreur
relative.
p o s itio n r e lle e t d s ir e ( a r tic u la t io n 2 )
0 .5
rd
q2d
q2
- 0 .5
0
0 .5
1 .5
0 .5
1 .5
0 .5
1 .5
rd
0 .5
2
2 .5
3
3 .5
e r r e u r e n p o s itio n ( a r tic u la t io n 2 )
4 .5
3 .5
4 .5
3 .5
4 .5
- 0 .5
Nm
2
2 .5
3
c o u p le ( a r tic u la tio n 2 )
-1
2
2 .5
te m p s ( s )
Fig 2.14 : Position relle, position dsire, erreur de suivi et commande sur laxe deux
du bras manipulateur
La gure (2.14), montre (en haut) la trajectoire articulaire dsire et relle de
laxe 2 du robot manipulateur, ainsi que lerreur de poursuite et le couple de commande
applique la deuxime articulation. Il sest avr durant les essais exprimentaux que
laxe deux du robot tait trs dicile rgler ceci tant d aux jeux et frottements
importants prsents au niveau de la deuxime articulation ainsi quau couplage. Avec la
commande applique dans ce premier essai, cest--dire la commande PID, nous avons
eu du mal avoir de meilleures performances que celles prsentes dans la gure (2.14).
Lerreur relative maximale est de lordre de 80%.
p o s itio n r e lle e t d s ir e (a rtic u la tio n 3 )
1
rd
q3d
q3
-1
0
0 .5
1 .5
0 .5
1 .5
0 .5
1 .5
rd
0 .1
2
2 .5
3
3 .5
e rr e u r e n p o s itio n ( a r tic u la t io n 3 )
4 .5
3 .5
4 .5
3 .5
4 .5
-0 .1
Nm
2
2 .5
3
c o u p le ( a rt ic u la tio n 3 )
-1
2
2 .5
t e m p s (s )
Fig 2.15 : Position relle, position dsire, erreur de suivi et commande sur laxe trois
du bras manipulateur
43
Dans le but davoir de meilleures performances que celles obtenues avec la commande PID et aussi de tester le schma de commande dvelopp dans ce chapitre,
nous appliquons la commande par modes glissants couple lobservateur par modes
glissants. Le systme en boucle ferme commande et observateur prsente les rsultats
suivants, une fois le rgime permanent tabli.
q 1 e t q 1 d
rd
-1
0
rd
4
q 2 e t q 2 d
0 .5
-0 .5
0
rd
0 .5
q 3 e t q 3 d
-0 .5
te m p s (s )
Fig 2.16 : Positions relles et dsires sur les trois axes du bras manipulateur
La gure (2.16), montre les positions articulaires dsires et relles des trois axes
du robot manipulateur. Compars aux rsultats obtenus en utilisant la commande PID,
nous remarquons de meilleures performances, notamment sur laxe deux.
q1 et q1o
-1
1
2
3
q2 et q2o
2
3
q2p et q2po
2
3
q3p et q3po
rd/s
rd
-5
0
0 .5
-0 .5
-5
0
2
3
q3 et q3o
5
10
rd/s
0 .5
rd
q1p et q1po
rd/s
rd
5
0
-0 .5
-5
0
2
3
te m p s (s )
2
3
te m p s (s )
Fig 2.17 : Etats rels et observs sur les trois axes du bras manipulateur
La gure (2.17), prsente ( gauche) les positions relles et observes sur les trois
axes du bras manipulateur ; sur la mme gure ( droite) nous prsentons les vitesses
44
relles et observes correspondantes. Nous remarquons une bonne observation. Pour les
vitesses observes nous constatons quelles sont moins bruites que celles obtenues par
drivation.
x
1 0
- 3
e r r e u r
0
x
1 0
- 3 1
e r r e u r
rd
o b s e r v a t io n
( p o s )
- 5
rd
2
3
o b s e r v a t io n
4
( p o s )
- 5
0
1
e r r e u r
rd
0 . 0 1
2
3
o b s e r v a t io n
4
( p o s )
- 0 . 0 1
0
2
t e m
3
p s ( s )
Fig 2.18 : Erreurs dobservation en position sur les trois axes du bras manipulateur
La gure (2.18), prsente les erreurs dobservations, en position sur les trois axes
du bras manipulateur montrant les bonnes performances de lobservateur. Les erreurs
dobservation en position restent infrieures 5 103 radian, soient 1% derreurs
relatives.
x
1 0 - 3
1 0
e r r e u r
d e
s u iv i
e r r e u r
2
d e
s u iv i
e r r e u r
2
d e
s u iv i
( p o s )
( p o s )
( p o s )
rd
5
0
- 5
0
rd
0 . 1
- 0 . 1
0
rd
0 . 1
- 0 . 1
2
te m
3
p s ( s )
Fig 2.19 : Erreurs de suivi en position sur les trois axes du bras manipulateur
La gure (2.19) montre les erreurs de suivi en position articulaires sur les trois
axes du bras manipulateur. Les erreurs de suivi en position sont de lordre de 5 103
radian 3 102 radian, soient 1% 6% en erreurs relatives ( comparer 12%
80% pour le PID).
Nm
45
-2
0
0 .5
1 .5
2 .5
c o u p le 2
3 .5
4 .5
0 .5
1 .5
2 .5
c o u p le 3
3 .5
4 .5
0 .5
1 .5
2 .5
3 .5
4 .5
Nm
1
0
-1
Nm
-1
te m p s (s )
2.3
46
2.3.1
(2.14)
o q, q,
q et reprsentent respectivement les vecteurs de dimension (2 1) des positions, vitesses, acclrations et couples articulaires.
M(q) est la matrice dinertie de dimention (2 2), G(q) est le vecteur des forces
de gravit de dimension (2 1) et C(q, q)
q est le vecteur des forces centrifuges et de
Coriolis.
La dynamique des actionneurs pneumatiques [83] peut tre reprsente par un
modle nominal dcrit par lquation suivante :
= Ji B E q
(2.15)
i
h .
.
...
q = M 1 M +C + BM q + C +BC + E q + BG+ G Ji
Les dtails de lobtention du modle de lactionneur pneumatique et des direntes
matrices M , C, G, J, B et E sont donns en annexe B.
2.3.2
.
x2 = x3
.
(2.16)
x3 = f (x, i)
y = x1
y = q = x1
1
47
et le vecteur dtat :
x = (x1 , x2 , x3 )T
et
f (x, i) = M 1
i
h .
.
.
+C
+
BM
x
+BC
+
E
x
Ji
+
+
BG+
M
C
G
3
2
Dans le but destimer ltat complet du systme (positions, vitesses et acclrations articulaires) on propose un observateur non linaire bas sur les modes glissants,
qui nest autre quune combinaison de lobservateur par modes glissants classique et
lobservateur triangulaire [5, 86] prsent dans le chapitre 1. Lutilisation de cet observateur me permet, aprs la convergence en temps ni de lerreur dobservation en
position et en vitesse de rduire mon systme une seule composante. La structure de
lobservateur propos est la suivante :
.
b1 = x
b2 1 sign1 (e
x1 )
x
.
(2.17)
x
b2 = x
b3 2 sign2 (
x2 x2 )
.
x, i) 3 sign2 (
x
b3 = f(b
x2 x2 ) + v
o ltat estim est donn par :
T T T T
b2 , x
b3
x
b= x
b1 , x
et
c1
f(b
x, i) = M
x
bT1 = (b
q1 , qb2 )
.
.
b
b
c
b
b
c
b
b
b
b
b
b
M +C + B M x
b3 + C +B C + E x2 + B G+ G Ji
x2 = x
b2 1 signeq1 (e
x1 )
o x
e=x
b x reprsente lerreur dobservation. La fonction sign2 (.) est mise zro
tant que x
e1 6= 0, sinon sign2 (.) est gale la fonction sign (.) classique. Le terme v
pouvant tre fonction de variables connues ou mesurables, est introduit pour augmenter
la robustesse de lobservateur ; il sera dni explicitement par la suite. Les matrices
1 , 2 sont choisies diagonales positives : 1 = diag(11 , 21 ), 2 = diag(12 , 22 ), et
la matrice non linaire 3 (.) sera dtermine plus tard.
En soustrayant les quations du systme (2.16) et les quations de lobservateur
(2.17), nous obtenons les erreurs destimation :
.
e1 = x
e2 1 sign1 (e
x1 )
x
.
(2.18)
x
e2 = x
e3 2 sign2 (
x2 x2 )
.
x
e3 = f(b
x, i) f (x, i) 3 sign2 (
x2 x2 ) + v
48
e1 = x
e2 1 sign1 (e
x1 )
x
.
x
e2 = x
e3
.
x
e3 = f(b
x, i) f (x, i) + v
Par hypothse le systme est suppos EBEB pour une dure [0, T ] nie (donc le
systme nexplose pas en temps ni). Prenons lquation x
e1 = 0 et vrions quune
partie au moins de cette surface est une surface glissante pour le systme. Pour ceci
nous choisissons comme fonction de Lyapunov candidate :
1 T
V1 = x
e x
e1
2 1
(2.19)
Il est facile de montrer [29] que V 1 est ngative sous les conditions suivantes :
i
x
i {1, 2}
(2.20)
e2 < i1
x
e1 = x
e2 1 signeq1 (e
x1 ) = x2 x2 = 0
e2 .
Une fois x2 obtenu nous passons la dynamique de x
Etape 2 : le but de cette tape est datteindre x
e1 = x
e2 = 0, sur la surface x
e1 = 0 ;
la dynamique de lerreur dobservation devient :
.
e1 = 0
x
.
x
e2 = x
e3 2 sign2 (e
x2 )
x
e3 = f (b
x, i) f(x, i) 3 sign2 (e
x2 ) + v
Soit la nouvelle fonction de Lyapunov :
1 T
V2 = x
e x
e2
2 2
49
do en moyenne :
signeq2 (e
x2 ) = 1
e3
2 x
1 , x2 , x3 , i) f (x, i) 3 1 x
x
e3 = f(x
2 e3 + v
avec :
(2.21)
x
f(x1 , x2 , x3 , i) f (x, i) = M 1 M + M 1 C + B
e3
b3 M 1 M + C + BM x
.
M 1 Ji M 1 C + M 1 BC + M 1 E x2
.
M 1 BG + M 1 G
AB
AB = AB
C ABC
ABC = AB
2.3.3
+ J1 M
x d 1 x3 xd 2 x2 xd Fv s Ksign (s)
i = J1 H
3
3
2
en posant :
.r
x3 = x d3 1 x3 xd3 2 x2 xd2
50
nous obtenons :
.r
+ J1 M
x J1 M
[Fv s + Ksign (s)]
i = J1 H
3
avec :
b=
H
(2.22)
.
.
.
c
b
b
c
b
b
b
b
b
bG
b
M + C + BM x
b3 + C +B C + E x2 + G +B
(2.23)
2.3.4
s = Fv s Ksign (s) 3 1
e3 1 x3 + v
2 x
(2.24)
s
Z (t) =
x
e3
)
(
s
.
est dnie par :
La drive Z (t) =
x
e3
s = Fv s Ksign (s) 3 1
e3 1 x3 + v
2 x
.
1
1
1
M + C + BM x
e3 3 1
x
e3 = M M + M C + B x
b3 M
e3 + v
2 x
.
.
M 1 C + M 1 BC + M 1 E x2 M 1 BG + M 1 G M 1 Ji
(2.25)
Pour montrer la convergence du systme (2.25), nous utilisons deux fonctions de Lyapunov :
1
V1 (s) = sT s
2
La drive de V1 est donne par :
.
V1 = sT F s sT Ksign (s) sT 3 1
e3 sT 1 x3 + sT v
2 x
x3 sT 1 x3 + sT v
= sT F s sT Ksign (s) sT Qe
51
avec Q = 2 1
1
La drive de la fonction de Lyapunov V1 (s) peut tre borne par :
.
k1
1 kQk k2 k kk kvk ksk
(2.26)
nous avons :
.
V ksk
Nous obtenons donc une convergence en temps ni de la surface de glissement s.
Pour montrer la convergence de lerreur dobservation, une deuxime fonction de
Lyapunov est utilise :
1
x3 ) = xT3 x3
V2 (
2
Sa drive par rapport au temps est donne par :
.
V 2 (
x3 ) = xT3 x
e3
1
1
1
M + C + BM x3 M 1 Ji
= M M +M C +B x
b3 M
.
.
M 1 C + M 1 BC + M 1 E x2 M 1 BG + M 1 G
Ltude de stabilit en boucle ferme est faite sous les hypothses physiques suivantes
(voir annexes A et D) :
1) Ltat du systme est born (kx (t)k < , t 0), (les actionneurs ont des
limites physiques) ;
0
M
(x
)
2) kM (x1 )k 1 ;
1 1 ;
c
1
3) kM 1 (x1 )k 1 ;
M (x1 ) 1 ;
.
c (x1 ) 01 wm;
M
4) M (x1 ) 1 wm ;
52
1
5) M (x1 ) 1 wm ;
M
c (x1 )1 1 wm ;
6) kC
x2 )k 2 kx2 k ;
(x1 ,
b
7) C (x1 ) 02 kx2 k ;
.
8) C (x1 , x2 ) 2 wm kx2 k ;
b (x1, x2 ) 0 wm kx2 k ;
C
9)
2
0
10) kG(x1 )k g0 ;
G(x
)
1 g0 ;
.
0
b
11) G (x1 ) g0 wm ;
G (x1 ) g0 wm ;
b
0
;
12) kJk Jm ;
J Jm
b1
13) kJ 1 k Jm ;
J Jm ;
14) kBk bm ;
kEk em .
kEk e0m .
15) kBk b0m ;
Ces hypothses sont compatibles avec notre systme, et proviennent des proprits
mcaniques de ce dernier et du fait que les signaux rels sont borns.
Nous dnissons les constantes q0 et 0 que nous utilisons pour la dmonstration
par :
q0 = min {Q}
0 = sup k ( )k
0 t
sup [1 kb
x3 k + 2 ke
x3 k + 3 kx2 k kb
x3 k + 4 kx2 k ke
x3 k + 5 kx2 k2
0 t
+ 6 kx2 k + 7 kik + 8 ]
0
signeq2 (e
x2 )
k2 signeq2 (e
x2 )k 2
2 signeq2 (e
x2 ) 6= 0
2 signeq2 (e
x 2 ) = 0
si
si
(2.27)
0 kexxe33 k
0
si
si
ke
x3 k 6= 0
ke
x3 k = 0
(2.28)
53
V2 min {Q} ke
x3 k2 + ke
x3 k 0 + x
eT3 v
e3
x
eT x
min {Q} ke
x3 k2 + ke
x3 k 0 3 0
ke
x3 k
2
q0 ke
x3 k
Ainsi nous obtenons une convergence en temps ni des erreurs dobservation en position
e2 , ainsi quune convergence exponentielle de lerreur dobservation
e3 .
x
e1 et en vitesse x
x
d
d
Deplus nous
avons montr que la surface de glissement s = x3 x3 + 1 x2 x2 +
2 x1 xd1 converge
e3 tend vers zro s tend vers
vers
zro en
temps ni. Aussi, si x
d
d
d
x3 x3 + 1 x2 x2 + 2 x1 x1 soit e+ 1 e+
2 e. On peut donc conclure que lerreur
de suivi en position e1 , en vitesse e2 et en acclration e3 .converge asymptotiquement
vers zro.
2.3.5
Rsultats de simulation
Dans nos simulations, nous avons considr le schma de commande et dobservation bas sur la technique des modes glissants, que nous avons dvelopp dans ce
chapitre. Des erreurs sur la structure du systme sont prises en compte. Nous avons
b (x1 , x2 ) = 0 et une matrice dinertie M
c (x1 ) constante diaconsidr une matrice C
gonale, et nous avons considr des erreurs de +20% sur les dirents paramtres
(M, J, B, E). Les rsultats donnent une stabilit et une robustesse vis--vis des erreurs
paramtriques du systme complet, commande et observateur. Pour la simulation les
gains suivants sont utiliss : 1 = diag(40, 90), 2 = diag(400, 900), avec une priode
dchantillonnage de 1ms.
q1 et q1d
q2 et q2d
2
rd
rd
-2
-2
0
1
q1p et q1pd
1
q2p et q2pd
1
q2pp et q2ppd
1
te m p s (s)
10
rd/s
rd/s
10
-1 0
-1 0
0
1
q1pp et q1ppd
2
100
rd/s
100
rd/s
-1 0 0
-1 0 0
0
1
te m p s (s )
Fig 2.21 : Etats rels (-) et tats dsirs (- -) considrant 20% derreur sur les
paramtres
Sur la gure (2.21), les deux premires courbes (en haut) montrent les positions dsires (q1d et q2d ) et les positions relles (q1 et q2 ) sur les deux axes du systme
mcanique actionneurs pneumatiques (SAP). Les deux courbes centrales montrent
54
-2
1
q1p et q1po
1
q2p et q2po
1
q2pp et q2ppo
1
te m p s (s )
10
rd/s
rd/s
-2
0
10
-1 0
-1 0
0
1
q1pp et q1ppo
2
200
rd/s
100
rd/s
q2 et q2o
rd
rd
-1 0 0
-2 0 0
0
1
te m p s (s)
Fig 2.22 : Etats rels (-) et observs (- -) sur les deux axes du robot SAP
La gure (2.22) prsente les tats rels et observs sur les deux axes. Les deux
courbes (en haut) reprsentent les positions relles et observes (q et qo ) sur les deux
axes. Les deux courbes centrales montrent les vitesses relles et observes sur les deux
axes et les deux dernires courbes montrent les acclrations relles et observes des
deux axes. Nous obtenons une convergence nale de tout ltat au bout de 0.35s avec
une erreur dobservation en acclration de 8%. La prsence du phnomne de rticence
que nous constatons sur les direntes articulations et notamment en acclration est
due lutilisation de la fonction signe.
x 1 0 - e4 r r e u r d o b s e r v a t i o n 1 ( p o s )
rd
rd
-5
1
e rre u r d o b s e rv a tio n 1 (v it)
0
0 .2
rd/s
rd/s
-2
0
0 .5
- 0 .5
1
e rre u r d o b s e rv a tio n 2 (v it)
-0 .2
0
1
e rre u r d " o b se rv a tio n 1 (a c c )
1
e rre u r d " o b s e rv a tio n 2 (a c c )
1
te m p s (s )
50
rd/s
50
rd/s
x 1 0 - 4e r r e u r d o b s e r v a t i o n 2 ( p o s )
-5 0
-5 0
0
1
te m p s (s )
Fig 2.23 : Erreurs dobservation sur les tats du systme sur les deux axes du robot
SAP
55
e rre u r d e s u iv i 1 (p o s)
- 0 .5
1
e rre u r d e s u iv i 1 (v it)
1
e rr e u r d e s u iv i 2 (v it)
1
e rre u r d e s u iv i 2 (a c c )
1
te m p s (s)
10
rd/s
10
rd/s
- 0 .5
0
-1 0
-1 0
0
1
e rre u r d e su iv i 1 (a c c )
2
200
rd/s
200
rd/s
e rre u r d e s u iv i 2 (p o s )
0 .5
rd
rd
0 .5
-2 0 0
-2 0 0
0
1
te m p s(s )
Fig 2.24 : Erreurs de suivi en position, vitesse et accleration sur les deux axes du
robot SAP
Sur la gure (2.24) nous obtenons une erreur de suivi de 0.1% en positions articulaires, de 1% en vitesses articulaires et une erreur de 8% en acclrations articulaires.
c o u ra n t1
c o u ra n t2
2
mA
mA
10
-2
-1
-4
-2
0
1
te m p s (s )
1
te m p s (s )
56
-2
1
q1p et q1pd
1
q2p et q2pd
1
q2pp et q2ppd
1
te m p s (s )
10
rd/s
10
rd/s
-2
0
-1 0
-1 0
0
1
q1pp et q1ppd
2
100
rd/s
100
rd/s
q2 et q2d
rd
rd
-1 0 0
-1 0 0
0
1
te m p s(s)
Fig 2.26 : Etats rels (-) et tats dsirs (- -) utilisant la fonction sat
Dans le but de rduire le phnomne de rticence apparu sur les direntes grandeurs asservies, et an dobtenir une commande lisse, nous avons remplac la fonction
signe par la fonction saturation. La gure (2.26) montre une diminution du phnomne
de rticence.
q1 et q1o
-2
1
q1p et q1po
1
q2p et q2po
1
q2pp et q2ppo
1
te m p s (s)
10
rd/s
10
rd/s
-2
0
-1 0
-1 0
0
1
q1pp et q1ppo
2
200
rd/s
100
rd/s
q2 et q2o
rd
rd
-1 0 0
-2 0 0
0
1
te m p s(s)
Fig 2.27 : Etats rels (-) et observs (- -) sur les deux axes du robot SAP, utilisant la
fonction sat
La gure (2.27) montre les tats rels et observs sur les deux axes du robot SAP,
avec une rduction du phnomne de rticence sur les dirents tats.
e rre u r d e su iv i 1 (p o s)
- 0 .5
- 0 .5
0
1
e rre u r d e s u iv i 1 (v it)
1
e rre u r d e s u iv i 2 (v it)
1
e rre u r d e s u iv i 2 (a c c )
1
te m p s (s )
10
rd/s
rd/s
10
-1 0
-1 0
0
1
e rre u r d e su iv i 1 (a c c )
2
200
rd/s
100
rd/s
e rre u r d e su iv i 2 (p o s )
0 .5
rd
rd
0 .5
57
-1 0 0
-2 0 0
0
1
te m p s (s )
Fig 2.28 : Erreurs de suivi en position, vitesse et accleration sur les deux axes du
robot SAP, utilisant la fonction sat
La gure (2.28) prsente lerreur de suivi en positions, vitesses et acclrations
articulaires sur les deux axes du robot SAP. Nous constatons une chute de performances
de lutilisation de la fonction de saturation. Les erreurs en position son alors de 5%,
les erreurs en vitesse sont de 10% et les erreurs en acclration de 20%.
c o u r a n t2
5
mA
mA
c o u ra n t1
10
-2
-1
0
1
te m p s (s )
1
te m p s (s)
Fig 2.29 : Courants de commande des deux axes du robot SAP, utilisant la fonction
sat
La gure (2.29), montre les deux courants de commande des axes un et deux du
robot SAP. Nous constatons que la commande obtenue est lisse.
58
2.4
Conclusion
Chapitre 3
Commande et observateur
adaptatifs par modes glissants
3.1
Introduction
Dans ce chapitre, nous proposons une combinaison des techniques des modes
glissants [50, 92, 102, 121] et dadaptation [1, 58, 88, 111] pour la synthse de commande
et dobservateur robustes vis--vis des erreurs structurelles et paramtriques. Nous
considrons le cas de la commande de robot lorsque la structure et les paramtres du
modle sont mal connus et lorsque ltat doit tre obtenu par observation.
Notre travail apporte une extension de la mthode propose par Canudas [29].
Celle-ci prsente une commande adaptative par retour dtat estim o la conception
de lobservateur et de la loi de commande sont bass sur la connaissance explicite de
la structure du modle ; les valeurs des paramtres dynamiques du modle tant, par
hypothse, inconnues, une loi dadaptation est utilise pour les estimer. Dans notre
approche [30], nous supposons connue la structure gnrale du modle mais pas les
paramtres intervenant dans cette structure. La seule hypothse utilise est que ces
matrices sont bornes et que ces bornes varient lentement. Ainsi nous allons utiliser une
loi dadaptation pour estimer ces bornes ce qui est beaucoup plus simple que la mthode
propose dans [29]. Par rapport cette dernire, notre algorithme dadaptation est plus
rapide car il ne ncessite pas ladaptation de tous les paramtres mais uniquement celle
des bornes des direntes matrices constituant le modle du systme.
Nous ralisons pour le bras manipulateur, la synthse de la commande adaptative dcrite prcdemment et dun observateur par modes glissants. Nous montrons la
stabilit en boucle ferme du systme puis nous illustrons lapproche propose par des
rsultats de simulations ( pour des problmes de logiciel nous navons pu obtenir de
rsultats exprimentaux). Une extension thorique de cette approche est faite pour le
systme mcanique actionneurs pneumatiques, dordre 3.
59
60
3.2
3.2.1
Avant de prsenter lobservateur bas sur les techniques des modes glissants et
dadaptation que nous proposons, nous rappelons la reprsentation dtat du robot
manipulateur :
.
x. 1 = x2
x = M 1 (x1 ) [C(x1 , x2 )x2 G(x1 ) + ]
(3.1)
2
y = x1
Nous ne mesurons que les positions articulaires. Dans le but destimer ltat complet
du systme utilis dans la loi de commande, un observateur est propos :
( .
x
b1 =b
x2 1 sign(e
x1 )
.
(3.2)
x
b2 = 2 sign(e
x1 )
3.2. Commande et observateur adaptatifs par modes glissants pour un bras manipulateur61
surface glissante puis dans un deuxime temps, on tudie la dynamique du systme sur
cette surface de glissement. En eet, si nous choisissons i1 > |
xi2 | i = 1, 2, 3, alors
aprs un temps ni t0 , on obtient la convergence vers la surface x1 = 0. Rappelons que
par hypothse le systme est entres bornes, tats borns (EBEB) dans une dure
nie. On conclut que la surface dnie par x1 = 0 et |
xi2 | < i1 est attractive et que
sur cette surface, nous avons :
signeq (e
x1 ) = 1
e2
1 x
(3.4)
x
e2 = M 1 [C(x1 , x2 )x2 +G ] + 2 1
e2
1 x
(3.5)
Cette erreur dobservation va nous servir dans le paragraphe suivant pour dnir lerreur de suivi.
3.2.2
La commande utilise dans ce paragraphe est base sur une commande simple
de type retour dtat laquelle nous ajoutons un terme adaptatif qui lui permet de
saranchir de la connaissance des matrices constituant le modle du systme.
(3.6)
(3.7)
. 1 =b
x
b2 = v h2 1
e2
(3.8)
1 x
i
.
1
1
x
e2 = M
C(x1 , x2 )x2 +G + v +v 2 1 x
e2
Daprs les proprits du modle dynamique nous avons :
x2 C(x1 , x2 )
x2 C(x1 , x2 )
x2
C(x1 , x2 )x2 = C(x1 , x2 )
On peut donc crire en utilisant (3.4) :
h
i
.
1
C(x1 , x2 )
x
e2 = M
x2 C(x1 , x2 )
x2 +G + (M + I)v 2 1
e2 M 1 C(x1 , x2 )
x2
1 x
62
En posant :
= C(x1 , x2 )
x2 C(x1 , x2 )
x2 +G + (M + I)v
Nous obtenons :
kk kC(x1 , x2 )
x2 k + kC(x1 , x2 )
x2 k + kGk + k(M + I)k kvk
En utilisant les direntes proprits du systme cites au chapitre 2, nous pouvons
crire les ingalits suivantes :
x2 k2
1) kC (x1 , x2 ) x2 k cm k
2) kC (x1 , x2 ) x2 k cm k
x2 k k
x2 k
Or comme lintrieur de la surface de glissement nous avons daprs (3.4) :
k
x2 k < 1 alors :
kC (x1 , x2 ) x2 k cm 1 k
x2 k
3) kG(x1 )k gm
4)kM (x1 ) + Ik kvk (m + 1) kvk
Par consquent, nous obtenons :
x2 k2 +cm 1 k
x2 k +g m +(m + 1) kvk
kk cm k
(3.9)
Notons :
b(
x2 , v) = cm k
x2 k2 +cm 1 k
x2 k +g m +(m + 1) kvk
et
1
x , v)sign(e
x1 )
= b(
n 2
o n est le nombre de degrs de libert du robot manipulateur (n = 3, dans notre cas).
En considrant pour vecteur dtat lintrieur de la surface de glissement le
vecteur derreur augment de dimension 3n constitu des erreurs de poursuite et des
erreurs dobservation sur la vitesse :
eT = (eT1 , eT2 , xT2 )T
nous obtenons partir de (3.3) et (3.8) les quations de la dynamique de lerreur de
suivi et dobservation suivantes :
e2
e 1 = e2 x
e 2 = Kp e1 Kv e2 h2 1
ei2
1 x
.
1
1
x
e2 = 2 1 x
e2 + M
M 1 C(x1 , x2 )
x2
Ce vecteur derreur nous conduit ltude de stabilit de lobservateur en boucle ferme.
3.2. Commande et observateur adaptatifs par modes glissants pour un bras manipulateur63
3.2.3
Pour des raisons de clart, nous considrons dans un premier temps, la connaissance exacte des dirents paramtres du systme (notamment les bornes de toutes les
matrices constituant le modle du systme cest--dire cm , gm et m) ; on utilisera par
la suite une loi dadaptation nous permettant de nous aranchir de la connaissance de
ces paramtres.
3.2.3.1
Lobjectif de ce paragraphe est de prouver la stabilit en boucle ferme de lobservateur, en supposant connus les bornes cm , gm et m.
Dmontrons dabord la convergence de lerreur dobservation.
Soit la fonction de Lyapunov suivante :
1 T
e Mx
e2 + x
V = x
eT2 M x
e2
2 2
1 T
V = x
e Mx
e2
2 2
1 T
T
e
e Mx
xT2 C(x1 , x2 )
= e
xT2 M 2 1
x
e
+e
x
x2 + x
e2
2
1
2
2 2
1
x
eT2 ( M C(x1 , x2 ))
x2 = 0
2
Et en posant M 2 1
1 = Q , o Q est une matrice choisie symtrique dnie positive,
nous obtenons :
V min {Q} k
x2 k2 +e
xT2 ( )
sign(e
x1 )
2
T
min {Q} k
x2 k +e
x2 b(
x2 , v)
n
!
1
x
e
2
1
x2 k2 +e
xT2 b(
x2 , v)
min {Q} k
1 x
1 e2
T
ke
x 2 k2
min {Q} k
x2 , v)
x2 k + x
e2 kk b(
ke
x2 k
2
min {Q} k
x2 k + ke
x2 k (b(
x2 , v)b(
x2 , v))
2
x2 k2
min {Q} k
V < 0.
Ainsi, lerreur dobservation tend vers zro.
Considrant maintenant le vecteur derreur de suivi :
T
eT = eT1 , eT2
64
avec :
e 1 = e2 x
e2
e 2 = Kp e1 Kv e2 2 1
e2
1 x
(3.10)
e = F e + Ge
x2
avec :
F =
0
I
Kp Kv
,G=
avec = 2 1
1 .
Pour montrer la stabilit de notre systme en utilisant lapproche entres/sorties
nous avons besoin du lemme suivant [34] :
Lemme [34] : soit un systme reprsent par la relation entre son entre r et sa
sortie e :
e = H (p) r
o H (p) est une matrice de transfert (n m) strictement propre et exponentiellement
n
n
n
stable alors : r Lm
2 e L2 L , e L2 , e est continu et e 0 quand t . Si
en plus r 0 quand t alors e 0.
Pour appliquer ce lemme, calculons la fonction de transfert du systme suivant :
e = F e + Ge
x2
(3.11)
y = Ce
C=
I 0
e2 (p)
Y (p) = C (pI F )1 GX
v1 +1
p2p+k
0
0
+pkv1 +kp1
v2 +2
0
p2p+k
0
H (p) =
+pkv2 +kp2
p+kv3 +3
0
0
p2 +pkv3 +kp3
3.2. Commande et observateur adaptatifs par modes glissants pour un bras manipulateur65
3.2.3.2
Kp
x2d
- -
x1
Kv
+
Robot
Loi d adaptation
x1
x2
- -
1
2
~
x1 +
Observateur
et
T (
x2 , v) = k
x2 k2 + 1 k
x2 k , 1, kvk
T = (cm , gm , m + 1)
on prend :
1
= T (
x2 , v) sign(e
x1 )
n
(3.12)
66
avec :
.
b
x2 , v) k1 k
= nL (
1
1 T
e2 M x2 + ( )T L1 ( )
V = x
2
2
.
.
1 T
e2 M x2 + ( )T L1
= x
eT2 M x2 + x
2
.
T 1
1 T
T
T
x
e
+e
x
C(x
,
x
)
x
+
+
(
)
L
M
x
e
= e
xT2 M 2 1
x
e
e
x
2
2
2 2
1
2
2
1
2 2
.
+ ( )T L1 b
x2 k2 +e
xT2 ( )
V min {Q} k
1
x2 k2 + k
x2 k kk x
eT2 T (
x2 , v) sign(e
x1 )
min {Q} k
n
.
T
+ ( ) L1 b
sign(e
x1 )
x2 k2 + k
x2 k T (
x2 , v)
xT2 T (
x2 , v)
min {Q} k
n
T
+ (
x2 , v) k1 k
T
2
T
x2 k + k
x2 k (
x2 , v) +( ) (
x2 , v) k
x2 k
min {Q} k
x2 k2
min {Q} k
3.2.4
Rsultats de simulation
Pour la simulation dun bras de robot rigide 3 degrs de libert, nous avons
considr la loi de commande et dobservation adaptative par modes glissants propose
dans ce chapitre. Les rsultats obtenus montrent que le systme en boucle ferme,
commande et observateur, est stable. Les trajectoires dsires pour chaque axe sont des
sinusodes damplitude 0.5rd et de frquence 1Hz, les courbes ci-dessous montrent les
rsultats obtenus en utilisant comme gains Kp = diag (64, 64, 64) , Kv = diag (8, 8, 8),
1 = diag(3, 3, 3) 2 = diag(5, 5, 5) et L = diag(5, 5, 5).
3.2. Commande et observateur adaptatifs par modes glissants pour un bras manipulateur67
q1 et q1d
-1
0 .5
1
q2 et q2d
1 .5
0 .5
1
1 .5
qp2 et qp2d
0 .5
1
1 .5
qp3 et qp3d
0 .5
5
rd/s
rd
-5
0
-1
-5
0
0 .5
1
q3 et q3d
1 .5
2
10
rd/s
rd
qp1 et qp1d
5
rd/s
rd
5
0
-1
-5
0
0 .5
1
te m p s (s )
1 .5
1
te m p s (s )
1 .5
Fig 3.2 : Trajectoires relles et dsires sur les trois axes du bras manipulateur
La gure (3.2) ( gauche) montre les positions dsires et relles au niveau des
trois axes du bras manipulateur, ainsi que les vitesses correspondantes ( droite). Nous
constatons des oscillations en rgime transitoire au niveau des vitesses qui diminuent
jusqu sannuler au bout de 0.1 s.
q1 et q1o
-1
0 .5
1
q2 et q2o
1 .5
0 .5
1
1 .5
q2p et q2po
0 .5
1
1 .5
q3p et q3po
0 .5
5
rd/s
rd
-5
0
-1
-5
0
0 .5
1
q3 et q3o
1 .5
2
10
rd/s
rd
q1p et q1po
5
rd/s
rd
5
0
-1
-5
0
0 .5
1
te m p s (s )
1 .5
1
te m p s (s )
1 .5
Fig 3.3 : Trajectoires relles et observes sur les trois axes du bras manipulateur
La gure (3.3) reprsente les trajectoires relles et observes sur les trois articulations du bras manipulateur. En considrant une erreur dobservation initiale de 0.25rd
sur les trois positions articulaires, nous constatons une bonne convergence de ltat
68
-0 .5
-1
0
0 .5
1
1 .5
e rre u r d o b s e rv a tio n 2 (p o s )
0
4
rd/s
0 .5
rd
1
rd/s
rd
0 .5
0 .5
1
1 .5
e rre u r d o b s e rv a tio n 2 (v it)
2
0
-0 .5
-2
0
0
10
rd/s
rd
0 .5
0 .5
1
1 .5
e rre u r d o b s e rv a tio n 3 (p o s )
0 .5
1
1 .5
e rre u r d o b s e rv a tio n 3 (v it)
5
0
-0 .5
-5
0
0 .5
1
te m p s (s )
1 .5
0 .5
1
te m p s (s )
1 .5
Fig 3.4 : Erreur dobservation en position et vitesse sur les trois axes du robot
La gure (3.4) reprsente les erreurs dobservation en position et en vitesse pour
chaque axe du bras manipulateur. Nous constatons que la vitesse observe converge
trs rapidement vers la vitesse relle (au bout 0.3 s). Lerreur que nous commettons
est de lordre de 0.18% en positions et de 2.3% en vitesses articulaires.
e rre u r d e s u iv i 1 (p o s )
e rre u r d e s u iv i 1 (v it)
2
rd/s
rd
0 .5
0
-2
-0 .5
-4
0
0 .5
1
1 .5
e rre u r d e s u iv i 2 (v it)
0 .5
1
1 .5
e rre u r d e s u iv i 3 (v it)
2
rd/s
rd
0 .5
0 .5
1
1 .5
e rre u r d e s u iv i 2 (p o s )
0
-2
-0 .5
-4
0
2
2
rd/s
rd
0 .2
0 .5
1
1 .5
e rre u r d e s u iv i 3 (p o s )
0
-2
-0 .2
-4
0
0 .5
1
te m p s (s )
1 .5
0 .5
1
te m p s (s )
1 .5
Fig 3.5 : Erreur de suivi en position et vitesse sur les trois articulations du bras
manipulateur
En ce qui concerne le suivi de trajectoire, nous remarquons sur la gure (3.5) que
3.3. Commande et observateur adaptatifs par modes glissants pour le robot SAP 69
lon arrive atteindre les trajectoires dsires au bout de 0.8 s. Nous mesurons une
erreur de 2% 2.25% sur les dirents tats du systme.
c o u p le 1
Nm
-2
0
0 .2
0 .4
0 .6
0 .8
1
c o u p le 2
1 .2
1 .4
1 .6
1 .8
0 .2
0 .4
0 .6
0 .8
1
c o u p le 3
1 .2
1 .4
1 .6
1 .8
0 .2
0 .4
0 .6
0 .8
1
te m p s (s )
1 .2
1 .4
1 .6
1 .8
Nm
-2
Nm
-2
Fig 3.6 : Couples de commandes appliqus aux trois axes du bras manipulateur
Pour la commande (gure (3.6)) nous constatons quelle est moins sollicite que
celle utilise dans le chapitre prcdent (commande par modes glissants), tout en ayant
de trs bonnes performances, avec une trs grande robustesse vis--vis des erreurs
paramtriques et structurelles. Il faut cependant souligner le fait que le rglage des
dirents paramtres aux eets trs coupls nest pas trs simple.
3.3
3.3.1
x.
2 = x3
.
(3.13)
x
3 = f (x, i)
y = x1
70
f (x, i) = M
i
.
.
M + C + BM x3 + C +BC + E x2 + BG+ G Ji
Nous ne mesurons que les positions articulaires. Dans le but destimer ltat
complet du systme utilis dans la loi de commande, un observateur non linaire bas
sur les modes glissants est propos :
.
b1 =b
x2 1 sign1 (e
x1 )
x
.
(3.14)
x
b2 =b
x3 2 sign2 (
x2 x2 )
.
i sign (
x
b3 =
2 )
3
2 x2 x
i est lentre applique au systme et est un terme qui sera choisi pour rendre lobservateur encore plus robuste vis--vis des erreurs paramtriques et sera dni ultrieurement. x
e est lerreur dobservation donne par :
x
e=x
bx
e1 =e
x2 1 sign1 (e
x1 )
x
.
(3.15)
x
e2 =e
x3 2 sign2 (
x2 x2 )
.
x
e3 = i 3 sign2 (
x2 x2 )f (x, i)
Dans le but dobtenir les dynamiques du systme lintrieur dune rgion attractive,
nous devons, dans un premier temps, dterminer une surface attractive et dnir le
domaine de convergence correspondant. Dans un deuxime temps, nous devons tudier
la dynamique sur cette surface glissante.
En procdant tape par tape, nous obtenons tout dabord la convergence vers
zro en temps ni de x
e1 et x
e2 . Sur la surface x
e1 = x
e2 = 0 :
x2 ) = 1
e3
signeq2 (e
2 x
(3.16)
x
e3 = i 3 1
e3 f (x, i)
2 x
(3.17)
3.3. Commande et observateur adaptatifs par modes glissants pour le robot SAP 71
3.3.2
La commande utilise dans ce paragraphe est base sur une commande simple de
type retour dtat avec un terme adaptatif qui lui permet de saranchir de la connaissance du modle du systme et par consquent augmenter encore plus la robustesse du
systme vis--vis des erreurs paramtriques.
(3.18)
x 1 =x2
x 2 =
x3 x3
.
x
b3 = v 3 1
e3
2 x
.
1
x
e3 = v 3 2 x
e3 +f (x, i)
= J
.
.
M + C + BM x3 M + BM x3 + C +BC + E x2 + BG+ G
+ (M + J) v]
kk J 1 M + C + BM k
x3 k + C +BC + E kx2 k
x3 k + M + BM k
i
.
+ BG+ G + kM + Jk kvk
En utilisant les direntes proprits du systme nous pouvons crire les ingalits
suivantes :
1) kM
(x1 )k 1
2) M (x1 ) 1 wm
3) kC
. (x1 , x2 )k 2 kx2 k
4) C (x1 , x2 ) 2 wm kx2 k
72
kG(x
. 1 )k g0
G (x1 ) g0 wm
7) kJ 1 k Jm
8) kBk bm
9) kEk em
avec 1 , 2 , wm , g0 , Jm , bm , em les bornes des direntes matrices du modle
du systme.
Par consquent, nous obtenons :
kk Jm 1 wm k
x3 k + Jm 2 kx2 k k
x3 k + Jm bm 1 k
x3 k + Jm 1 wm 2
2
+Jm bm 1 2 + Jm 2 wm kx2 k + Jm bm 2 kx2 k2 + Jm em kx2 k
+Jm g0 wm + Jm bm g0 + (Jm 1 + 1) kvk
(3.19)
Notons :
x3 , v) = (Jm 1 wm + Jm bm 1 ) k
x3 k + Jm 2 kx2 k k
x3 k + Jm em kx2 k
b(x2 ,
2
+ (Jm 2 wm + Jm bm 2 ) kx2 k + Jm g0 wm + Jm bm g0
+ (Jm 1 wm + Jm bm 1 ) 2 + (Jm 1 + 1) kvk
et
1
= b(x2 , x3 , v)sign2 (e
x2 )
n
o n est le nombre de degrs de libert du systme mcanique actionneurs pneumatiques (ici n = 2).
Considrons pour vecteur dtat lintrieur de la surface de glissement le vecteur
derreur augment :
eT = (eT1 , eT2 , eT3 , xT3 )T
avec :
e1 = e2
e2 = e3 x
e3
e3 = Kp e1 Kv e2 Kahe3 i3 1
e3
2 x
1
1
x
e3 = 3 x
e3 + M J M 1 C x3
2
3.3.3
3.3.3.1
Lobjectif de ce paragraphe est de prouver la stabilit en boucle ferme de lobservateur, en supposant connus les paramtres 1 , 2 , wm , g0 , Jm , bm et em (on montrera
par la suite comment saranchir de la connaissance de ces paramtres).
3.3. Commande et observateur adaptatifs par modes glissants pour le robot SAP 73
Dmontrons dabord la convergence de lerreur dobservation
Soit la fonction de Lyapunov suivante :
1 T 1
V = x
e J Mx
e3
2 3
1 T 1
V = x
eT3 J 1 M x
e3
e3 + x
e J Mx
2 3
1 T 1
T
e3
e J Mx
= e
xT3 J 1 M3 1
x
e
+e
x
e
xT3 J 1 C x3 + x
3
2
3
2 3
1
x3 = 0
x
eT3 ( M C(x1 , x2 ))
2
Et en posant J 1 M 3 1
2 = Q, o Q est une matrice choisie symtrique dnie positive.
Nous obtenons :
V min {Q} k
x3 k2 + x
eT3 ( )
sign2 (e
x2 )
2
T
min {Q} k
x3 k + x
e3 b(x2 , x3 , v)
n
2
min {Q} k
x3 k + ke
x3 k (b(x2 , x3 , v)b(x2 , x3 , v))
x3 k2
min {Q} k
T
eT = eT1 , eT2 , eT3
avec :
e 1 = e2
e 2 = e3 x
e3
e 3 = Kp e1 Kv e2 Ka e3 3 1
e3
2 x
e = F e + Ge
x3
avec :
avec = 3 1
2 .
0
I
0
0
0
I , G = I
F = 0
Kp Kv Ka
74
e = F e + Ge
x3
(3.20)
y = Ce
o
C=
I 0
e3 (p)
Y (p) = C (pI F )1 GX
On suppose maintenant que les bornes 1 , 2 , wm , g0 , Jm , bm , em , sont in on procde une estimation adaptative des bornes
connues. Dans ce cas pour avoir
inconnues. A partir de (3.19) nous avons :
kk Jm 1 wm k
x3 k + Jm 2 kx2 k k
x3 k + Jm bm 1 k
x3 k + Jm 1 wm 2
2
+Jm bm 1 2 + Jm 2 wm kx2 k + Jm bm 2 kx2 k2 + Jm em kx2 k
+Jm g0 wm + Jm bm g0 + (Jm 1 + 1) kvk
Choisissons la loi dadaptation suivante :
x3 k + Jm 2 kx2 k k
x3 k + Jm bm 1 k
x3 k + Jm 1 wm 2
T (x2 , x3 , v) = Jm 1 wm k
2
+Jm bm 1 2 + Jm 2 wm kx2 k + Jm bm 2 kx2 k2 + Jm em kx2 k
+Jm g0 wm + Jm bm g0 + (Jm 1 + 1) kvk
3.3. Commande et observateur adaptatifs par modes glissants pour le robot SAP 75
avec :
x3 k , kx2 k k
x3 k , kx2 k2 , kx2 k , 2 , 1, kvk
T (x2 , x3 , v) = k
et
b
=
nLT (x2 , x3 , v) k2 k
do
1 T 1
V = x
eT3 J 1 M 3 1
e3 J M x3 + ( )T L1
3 + x
2 x
2
.
+ ( )T L1 b
V min {Q} k
x3 k2 + x
eT3 ( )
x3 k2 + k
x3 k T (x2 , x3 , v) + ( )T T (x2 , x3 , v) k2 k
min {Q} k
sign(e
x1 )
xT3 T (x2 , x3 , v)
n
2
T
min {Q} k
x3 k + k
x3 k (x2 , x3 , v) + ( )T T (x2 , x3 , v) k
x3 k
x3 k2
min {Q} k
76
3.4
Conclusion
Dans ce chapitre, une commande et un observateur bass sur les techniques des
modes glissants et dadaptation, ont t dvelopps et appliqus un bras manipulateur
trois degrs de libert. Une extension de cette mthode a t faite en intgrant les
actionneurs pneumatiques dans le modle du robot SAP. Dans ce cas, une observation
des vitesses et des acclrations a t propose.
Le schma ainsi dvelopp possde de bonnes proprits de robustesse. Nous avons
montr que nous pouvions faire de la poursuite de trajectoires en estimant simultanment les tats et les bornes des direntes matrices constituant le modle du systme,
sans pour autant avoir besoin dutiliser les paramtres du systme ou connatre avec
exactitude sa structure. La convergence obtenue sur les erreurs de poursuite et dobservation dtat est asymptotique. Lavantage du schma de commande et dobservation
propos dans ce chapitre par rapport la commande et lobservateur par modes glissants propos dans le deuxime chapitre est lobtention dune commande plus lisse,
sollicitant ainsi moins les actionneurs du robot, tout en conservant les mmes performances, et ce avec une trs grande robustesse vis--vis des erreurs paramtriques
puisque la seule connaissance sur le modle que nous utilisons rside dans le fait quil
scrit laide de matrices bornes (sans pour autant connatre les valeurs des bornes).
Contrairement ce que nous pourrions attendre, nous avons montr que la combinaison
de deux techniques, notamment la technique des modes glissants et celle dadaptation
conduit un systme relativement simple. Par contre linconvnient de ce schma de
commande et dobservation rside dans le rglage des gains dicile obtenir.
Dans le chapitre suivant, nous prsentons un autre schma de commande avec observation dtat, bas cette fois-ci sur la technique des modes glissants dordre suprieur
qui prsente lavantage en plus de la robustesse vis--vis des erreurs paramtriques, de
rduire ou dliminer le phnomne de rticence.
Chapitre 4
Commande et observateur par
modes glissants dordre suprieur
4.1
Introduction
78
4.2
(4.1)
y = x1
o le vecteur de sortie mesur (par les codeurs incrmentaux) est dni par :
y = q = x1
4.2.1
Nous ne mesurons que les positions articulaires (une partie de ltat). Or nous
avons besoin dans la commande de ltat complet du systme. Lobjectif de lobservateur sera donc destimer ltat complet avec la plus grande robustesse possible an
de pouvoir linjecter dans une loi de commande et darriver un suivi de trajectoire
stable.
Limplantation de lobservateur par modes glissants dordre un prsent dans les
chapitres prcdents ncessite sa discrtisation. Comme il est bas sur lcrasement
des termes incertains, cela conduit des discontinuits assez raides. Nous faisons alors
appel aux modes glissants dordre 2. Lobservateur utilis est inspir de lalgorithme
du twisting chantillonn pour la commande et est donn par [20] [21] :
( .
x1i = x2i + 1i
.
(4.3)
i (x1 , x2 , ) + K2i sign(
x2i = h
x2 x2 )
o
h
i
h (x1 , x2 , ) = M
1 (x1 ) C (x1 , x2 ) x2 G
(x1 ) +
avec :
1i =
x1i )
Mi sign(
mi sign(
x1i )
pour
pour
pour
4.2. Observateur et commande par modes glissants dordre 2 pour un bras manipulateur79
o :
1i (k) = x1i (k) x1i ((k 1)) et est la priode dchantillonnage des mesures.
x1i = x1i x1i reprsente lerreur dobservation.
x2i =
x2i
x2i + 1i
pour
pour
x1i (k) 6= O( 2 )
x1i (k) = O( 2 ) et 1i (k) = O( 2 )
pour i = 1, ...3.
Remarque 4 Dans la synthse des observateurs, nous pouvons appliquer des valeurs
de 1i aussi grandes que lon veut. En eet, contrairement la commande qui a toujours
des actionneurs borns ici est simplement une grandeur interne lalgorithme. Ainsi,
ltape 1 de lalgorithme du twisting nest plus ncessaire (i.e. u = u pour |u| >
comme pour la commande (4.15)).
Proposition 6 Lobservateur (4.3) chantillonn avec une priode , prsente une
x1 ), et en
convergence en temps ni en O( 2 ) pour lerreur dobservation en position (
O() pour lerreur dobservation en vitesse (
x2 ) si les conditions suivantes sur les gains
sont vries :
M i > mi
.
mi > c1i
= max x2i
et K2i > c2i lincertitude maximale sur la dernire composante.
x1i = x2i 1i
Comme le systme est EBEB (Entre Borne, Etat Born) en temps ni, lerreur dobservation sur x2 ne diverge pas (les paramtres de lobservateur sont gels et la divergence nest de quau systme) et daprs le Thorme 3 du chapitre 1, nous savons que
la dynamique x1 tend vers x1 = O( 2 ) en temps ni ainsi il existe t1 tel que t > t1 :
1i = x2i + O()
si nous posons x2i = 1i + x2i nous avons x2i = x2i + O() que nous remplaons dans
la dynamique de la seconde composante de lobservateur do :
x1i = O( 2 )
et
x2i = 4h 2i
x1i = O()
80
avec :
(x1 , x2 , )
4h = h (x1 , x2 , ) h
x2 x2 )
2i = K2i sign (
et x2i converge vers O() en temps ni.
4.2.2
La commande utilise dans ce paragraphe est une commande par modes glissants
dordre deux. Lobjectif de cette dernire est le suivi de trajectoires, en ne disposant
que des positions comme retour dinformation mesure. La loi de commande propose
utilise dans sa conception les mesures de positions et les vitesses reconstitues par
lobservateur bas sur les techniques des modes glissants dordre suprieur que nous
avons dcrit prcdemment. Pour cela, nous pouvons crire le systme (4.2) sous la
forme suivante :
x 2 = f (x1 , x2 ) + v
(4.4)
avec :
f (x1 , x2 ) = M 1 (x1 ) [C (x1 , x2 ) x2 G (x1 )]
v = M 1 (x1 )
T
(4.5)
(4.6)
x d2
= f (x1 , x2 ) x d2 + v
(4.7)
4.2. Observateur et commande par modes glissants dordre 2 pour un bras manipulateur81
o e = x1 xd1 , e = x2 xd2 , e = x 2 x d2 , reprsentent respectivement lerreur en
position, en vitesse et en acclration.
Calculons maintenant la commande quivalente veq que nous obtenons en rsolvant lquation s = 0 :
veq = x d2 f (x1 , x2 )
(4.8)
(4.9)
veq = x d2 f (x1 , x2 )
(4.10)
et :
v1 =
kM sign(s)
km sign(s)
si
si
ss > 0
ss 0
M 1(x1)
+ +
x&2d
x1d
veq
+
+
KM
Km
d
dt
s&
..
.
v1
+
+
x1
Robot
Fig 4.2 : Schma de la commande par modes glissants dordre deux (s=e)
82
= f + v1
avec :
f = f (x1 , x2 ) f (x1 , x2 )
Soit si les composantes du vecteur s dont la drive seconde peut scrire comme suit :
si = fi + v1i
i {1, ...3}
En prenant comme hypothse que ltat et que toutes les matrices constituant le modle
du systme sont borns, nous avons :
|fi | Fi
De la mme faon que prcdemment, nous obtenons une convergence en temps ni.
Il est bien connu que pour les systmes non linaires, le principe de sparation
valable dans le cas linaire, est gnralement faux. On ne peut plus faire sparment la
synthse de la commande et de lobservateur. Pour avoir un systme stable en boucle
ferme, il ne sut pas de remplacer ltat rel du systme par ltat estim que donne
lobservateur dans la commande stabilisante, mme si les tats estims convergent vers
les tats rels comme nous lavons vu dans le chapitre 2.
Cependant, le fait que notre observateur modes glissants dordre 2 (4.3) donne
une erreur dobservation convergente vers zro en un temps ni tf in garanti, cela indpendemment de la commande, simplie le problme de la synthse de la commande. En
celles du systme x= x , une commande u(x) base sur lobservateur sera identique
la commande u(x) base sur une connaissance ctive de tout ltat. En dautres termes,
le systme est stabilisable par la mme chane de retour lorsque ltat x est utilis la
place de x.
Cependant, il reste un problme pos par le rgime transitoire qui existe avant
datteindre la surface de glissement cest--dire avant tf in . Durant la priode o x 6= x
et donc u(x) 6= u(
x), il faut que le systme ne diverge pas. Ceci est rsolu car, le
systme considr est EBEB (Entre borne, Etat born) en temps ni ; par ailleurs
nous pouvons minimiser le temps tf in avec de grands gains. Ainsi nous pouvons noncer
les propositions suivantes :
Proposition 7 Si le systme (4.4) est EBEB en un temps ni et est globalement
(respectivement localement) stabilisable par bouclage u(x) alors il est globalement (respectivement localement) stabilisable lorsque lon utilise lobservateur synthtis avec la
commande u(
x) sur la surface de glissement.
En pratique, le systme (4.4) est entres bornes et tats borns, et stabilisable
par le retour dtat u(x). Le systme est donc aussi stabilisable par u(b
x), qui est le mme
retour dtat utilisant x
b la place de x.
4.2. Observateur et commande par modes glissants dordre 2 pour un bras manipulateur83
4.2.2.2
Rsultats de simulation
0 .5
q1p et q1pd
rd
rd/s
-0 .5
-1
-5
0
0 .5
1 .5
-1
0 .5
1
q2p et q2pd
1 .5
0 .5
1
q3p et q3pd
1 .5
0 .5
1
te m p s (s )
1 .5
-5
0
0 .5
1
q3 et q3d
1 .5
2
5
rd/s
rd
0
5
rd/s
rd
1
q2 et q2d
-1
-5
0
0 .5
1
te m p s (s )
1 .5
-1
0 .5
1
q2 et q2o
1 .5
0 .5
1
q 2p et q2po
1 .5
0 .5
1
q 3p et q3po
1 .5
0 .5
1
te m p s (s )
1 .5
rd/s
rd
-5
0
-1
-5
0
0 .5
1
q3 et q3o
1 .5
2
5
rd/s
rd
q 1p et q1po
rd/s
rd
-1
-5
0
0 .5
1
te m p s (s )
1 .5
84
0 .0 2
e rr e u r d o b s e r v a tio n 1 (v it)
0 .5
rd
rd/s
- 0 .0 2
- 0 .0 4
- 0 .5
0
0 .0 2
0 .5
1
e rr e u r d o b s e r v a tio n 2 (p o s )
1 .5
0 .5
1
e rr e u r d o b s e r v a tio n 2 (v it)
1 .5
0 .5
1
e rr e u r d o b s e r v a tio n 3 (v it)
1 .5
0 .5
rd
rd/s
0
0
- 0 .0 2
- 0 .0 4
- 0 .5
0
0 .0 2
0 .5
1
e rr e u r d o b s e r v a tio n 3 (p o s )
1 .5
0 .5
rd
rd/s
0
0
- 0 .0 2
- 0 .0 4
- 0 .5
0
0 .5
1 .5
0 .5
te m p s (s )
1 .5
te m p s (s )
e rr e u r d e s u iv i 1 ( v it)
rd/s
rd
0 .2
0
-2
-0 .2
-4
0
0 .5
1
1 .5
e rr e u r d e s u iv i 2 ( v it)
0 .5
1
1 .5
e rr e u r d e s u iv i 3 ( v it)
0 .5
rd/s
rd
0 .2
0 .5
1
1 .5
e rre u r d e s u iv i 2 (p o s )
-0 .2
-5
0
0 .2
0 .5
1
1 .5
e rre u r d e s u iv i 3 (p o s )
2
4
rd/s
rd
2
0
0
-2
-0 .2
-4
0
0 .5
1
te m p s (s )
1 .5
1
te m p s (s )
1 .5
4.2. Observateur et commande par modes glissants dordre 2 pour un bras manipulateur85
c o u p le 1
Nm
-2
0
0 .5
1 .5
1 .5
1 .5
c o u p le 2
Nm
1
0
-1
0
0 .5
0 .5
c o u p le 3
Nm
-1
te m p s (s )
Fig 4.7 : Couples de commande appliqus aux moteurs des trois axes du bras
manipulateur
La gure (4.7) prsente les couples de commandes appliqus aux moteurs des
trois axes du bras manipulateur. Nous constatons quils sont moins sollicits que ceux
obtenus dans le chapitre 2.
4.2.2.3
Rsultats exprimentaux
rd
3
d
3
d
3
s ( s )
- 1
0
rd
2
q
- 1
0
rd
- 1
2
t e
Fig 4.8 : Positions relles et positions dsires sur les trois articulations du bras
manipulateur
La gure (4.8) prsente les positions relles et dsires sur les trois articulations
du bras manipulateur. Nous constatons un trs bon suivi sur les trois axes.
86
q1 et q1o
-1
1
2
3
q2 et q2o
2
3
q2p et q2po
2
3
q3p et q3po
2
3
te m p s ( s )
rd/s
rd
-5
0
-1
-5
0
2
3
q3 et q3o
5
5
rd/s
rd
q1p et q1po
rd/s
rd
-1
-5
0
2
3
te m p s (s )
La gure (4.9) montre les positions relles et observes ( gauche) sur les trois
axes du bras manipulateur, nous prsentons droite les vitesses relles (obtenues par
drivation) et observes . Nous constatons une trs bonne observation.
- 4
0
x
- 3
e
1
r r e
0
x
- 3
e
1
r r e
rd
r r e
s e
r v a
t i o
( p
s )
- 2
rd
2
b
s e
r v a
3
t i o
( p
4
o
s )
s e
r v a
3
t i o
( p
4
o
s )
- 5
rd
- 5
0
2
t e
3
s ( s )
La gure (4.10) montre les erreurs dobservation en positions sur les trois axes du
bras manipulateur conrmant les bonnes performances de lobservateur utilis (dordre
deux en position et dordre un en vitesse).
4.2. Observateur et commande par modes glissants dordre 2 pour un bras manipulateur87
0 . 0 2
e r r e u r
d e
s u iv i
e r r e u r
2
d e
s u iv i
e r r e u r
2
d e
s u iv i
( p o s )
( p o s )
( p o s )
rd
0 . 0 1
0
- 0 . 0 1
0
rd
0 . 0 2
- 0 . 0 2
0
rd
0 . 0 2
- 0 . 0 2
2
t e m
3
p s ( s )
Fig 4.11 : Erreurs de suivi en position sur les trois axes du bras manipulateur
Un trs bon suivi est obtenu avec la commande propose, comme le montre la
gure (4.11), o lon prsente les erreurs de poursuite en positons articulaires sur les
trois axes du bras manipulateur. Lerreur relative maximale est de lordre de 4%.
c o u p le 1
Nm
-2
0
0 .5
1 .5
2 .5
c o u p le 2
3 .5
4 .5
0 .5
1 .5
2 .5
c o u p le 3
3 .5
4 .5
0 .5
1 .5
2 .5
te m p s (s )
3 .5
4 .5
Nm
-2
Nm
-1
Fig 4.12 : Couples de commande appliqus aux moteurs des trois axes du bras
manipulateur
La gure (4.12) montre les couples de commande appliqus aux moteurs des trois
axes du bras manipulateur. Nous remarquons que les amplitudes de commutation sont
moins importantes que celles obtenues avec la commande par modes glissants dordre un
prsente dans le chapitre 2, entrainant ainsi une rduction du phnomne de rticence
sur les grandeurs asservies.
88
4.2.2.4
dans le but davoir une commande continue avec une convergence en temps ni de la
surface de glissement s, et une convergence exponentielle de lerreur de poursuite e
lintrieur de la surface de glissement :
s = x2 x d2 + x1 xd1
= x2 xd2 e
(4.11)
= x2 xr2
Aprs convergence de lobservateur en temps ni sur la surface x1 = x2 = 0, en drivant
deux fois la surface de glissement nous obtenons :
s = e + e
= x 2 x d2 + x2 xd2
= x 2 x r2
= f (x1 , x2 ) x r2 + v
...
s = e +
e
= x2 xd2 + x 2 x d2
= x2 xr2
= f (x1 , x2 ) xr + v
2
(4.12)
(4.13)
o :
e = x1 xd1 , e = x2 xd2 , e = x 2 x d2 reprsentent respectivement lerreur de
poursuite en position, en vitesse et en acclration.
Dautre part, on dnit :
xr2 = xd2 e,
x r2 = x d2 e,
et xr2 = xd2
e
(4.14)
v = veq + v1
veq = x r2 f (x1 , x2 )
o f reprsente lestime de f et [51] :
v1
kM sign(s)
v 1 =
km sign(s)
si
si
si
4.2. Observateur et commande par modes glissants dordre 2 pour un bras manipulateur89
avec kM et km des matrices diagonales ayant comme composantes respectives kMi et
kmi (i {1, 2, 3}) vriant les ingalits suivantes :
kmi > Fi
kM i > kmi
kM i Fi > kmi + Fi
Cet algorithme reprsente lalgorithme du twisting que nous reprsentons par le schma
suivant :
G (x1)
+ + M (x1)
C (x1, x2 )x2
x&2d
+
+
x1d
v eq
x2
-1
-KM
-Km
+
d
dt
.. .
.
v 1 > v eq
v&1
v1
v1
x1
v eq
Robot
s&
f = f (x1 , x2 ) f (x1 , x2 )
Soit si la ie`me composante du vecteur s dont la drive seconde peut scrire comme
suit :
i {1, ...3}
si = fi + v 1i
avec :
fi Fi
90
4.2.2.5
Rsultats de simulation
q1p et q1pd
rd
rd/s
0 .5
0
-0 .5
-5
0
0 .5
1 .5
q2 et q2d
0 .5
1
q2p et q2pd
1 .5
0 .5
1
q3p et q3pd
1 .5
0 .5
1 .5
rd
rd/s
0 .5
0
0
-0 .5
-5
0
0 .5
0 .5
q3 et q3d
1 .5
5
rd
rd/s
0
0
-0 .5
-1
-5
0
0 .5
1 .5
te m p s (s )
1
te m p s ( s )
q1p et q1po
rd/s
rd
-1
-5
0
0 .5
1 .5
q2 et q2o
0 .5
1
q2p et q2po
1 .5
0 .5
1
q3p et q3po
1 .5
0 .5
1 .5
rd
rd/s
0 .5
0
0
-0 .5
-5
0
0 .5
0 .5
q3 et q3o
1 .5
5
rd
rd/s
0
0
-0 .5
-1
-5
0
0 .5
1 .5
te m p s (s )
1
te m p s ( s )
4.2. Observateur et commande par modes glissants dordre 2 pour un bras manipulateur91
La gure (4.15) quand elle, reprsente les tats rels et observs pour chaque
axe du bras manipulateur.
e rr e u r d o b s e rv a tio n 1 ( p o s )
0 .0 2
e rr e u r d o b s e rv a tio n 1 ( v it)
0 .2
0
rd
rd/s
0
-0 .0 2
- 0 .2
-0 .0 4
- 0 .4
0
0 .0 2
0 .5
1
e rr e u r d o b s e rv a tio n 2 ( p o s )
1 .5
0 .5
1
e rr e u r d o b s e rv a tio n 2 ( v it)
1 .5
0 .5
1
e rr e u r d o b s e rv a tio n 3 ( v it)
1 .5
0 .2
0
rd
rd/s
0
-0 .0 2
- 0 .2
-0 .0 4
- 0 .4
0
0 .0 2
0 .5
1
e rr e u r d o b s e rv a tio n 3 ( p o s )
1 .5
0 .2
0
rd
rd/s
0
-0 .0 2
- 0 .2
-0 .0 4
- 0 .4
0
0 .5
1 .5
0 .5
te m p s (s )
1 .5
te m p s ( s )
e rre u r d e s u iv i 1 (v it)
rd/s
rd
0 .2
0
-2
-0 .2
-4
0
0 .2
0 .5
1
e rr e u r d e s u iv i 2 ( p o s )
1 .5
0 .5
1
e rre u r d e s u iv i 2 (v it)
1 .5
0 .5
1
e rre u r d e s u iv i 3 (v it)
1 .5
rd/s
rd
0
0
-2
-0 .2
-4
0
0 .5
1
e rr e u r d e s u iv i 3 ( p o s )
1 .5
2
rd/s
rd
0
-0 .0 5
-2
-0 .1
-4
0
0 .5
1
te m p s (s )
1 .5
0 .5
1 .5
te m p s ( s )
92
c o u p le 1
Nm
2
1
0
-1
0
0 .5
1 .5
1 .5
1 .5
c o u p le 2
Nm
1
0
-1
0
0 .5
0 .5
c o u p le 3
Nm
0 .5
0
-0 .5
tem p s(s )
Fig 4.18 : Couples de commande appliqus aux moteurs des trois axes du bras
manipulateur
Lapport fondamental de ce choix de surface de glissement est li lobtention
dune commande trs lisse rprsente en gure (4.18), et cela, sans dtrioration des
performances de la commande.
4.3. Observateur et commande par modes glissants dordre 2 pour le robot SAP 93
4.3
i
h .
.
...
q = M 1 M +C + BM q + C +BC + E q + BG+ G Ji
(4.16)
.
o q, q,
q, M , C, G, M , C , G, B, E, J et i ont t dnis dans les chapitres prcdents.
Pour notre tude nous mettons le modle (4.16) sous forme dquation dtat,
en prenant comme vecteur dtat : x1 = q, x2 = q,
x3 = q, ce qui conduit la
reprsentation suivante :
.
x1 = x2
x.
2 = x3
.
(4.17)
x3 = h (x1 , x2 , x3 , i)
y = x1
avec :
h (x1 , x2 , x3 , i) = M
4.3.1
h .
i
.
M +C + BM q + C +B + CE q + BG+ G Ji
b1 = x
b2 + 1
x
.
(4.18)
x
b2 = x
b3 + 2
x
b3 = h(x1, x2 , x3 , i) + K3 sign (
x3 x3 )
avec :
1, x2 , x3 , i) = M
h(x
.
+C + B
M
.
C + E x2 + B
Ji
G+
G
x3 + C +B
, M
c1 , M
c, C,
b C,
b G,
b G,
b B,
b E,
b Jb sont les matrices estimes de M, M 1 , M , C, C,
M
.
G, G, B, E, J, et :
.
1 = 1,1 si x1 ou x1 = 0, sinon
94
1,1 =
pour
M sign(
x1 )
m sign(
x1 )
pour
pour
x1 ((k 1)) 0 ou
x1 (k)
1 (k)1 ((k 1)) 0
x1 (k)1 (k) > 0
x1 (k)1 (k) 0
0
pour
x2 (k)
x2 ((k 1)) 0 ou
M
m sign(
x2 ) pour
x2 (k)2 (k) 0
avec :
x1 = x2 1
Comme le systme est EBEB (Entre Borne, Etat Born), lerreur dobservation sur
x2 et x3 ne diverge pas en temps ni, et daprs le Thorme 2 nous savons que la
dynamique x1 tend vers x1 = O(3 ) en temps ni. Ainsi il existe t1 tel que t > t1 :
1 = x2 + O( 2 )
et
x1 = O(2 )
x2 = x3 2 + O()
4.3. Observateur et commande par modes glissants dordre 2 pour le robot SAP 95
Comme prcdement, il existe un temps ni t2 > t1 tel que :
x2 = x2 x2 = O( 2 )
Comme x2 = x2 + O( 2 ), nous pouvons dduire que x2 = x2 + O( 2 ). Aprs tout instant
t > t2 nous avons x3 = x3 + O(), x2 = x2 + O( 2 ) et x1 = x1 + O( 3 ) ce qui conduit
:
.
x1 = O( 3 )
et
x1 = O(2 )
x2 = O( 2 )
et
x2 = O()
x3 = 4h 3
avec :
(x1 , x2 , x3 , i)
4h = h (x1 , x2 , x3 , i) h
3 = K3 sign (
x3 x3 )
et x3 converge en O() en temps ni.
4.3.2
La commande utilise dans ce paragraphe est une commande par modes glissants dordre deux reposant sur le choix dune surface de glissement de degr relatif
1 par rapport s, permettant davoir une commande continue et une convergence exponentielle de lerreur de poursuite sur la surface de glissement. La loi de commande
propose utilise dans sa conception les mesures de positions ainsi que les vitesses et les
acclrations reconstitues par lobservateur bas sur les techniques des modes glissants
dordre suprieur que nous avons dtaill dans le paragraphe prcdent. Pour cela, nous
pouvons crire le systme (4.17) sous la forme suivante :
x 3 = f (x1 , x2 , x3 ) + v
(4.19)
avec :
f (x1 , x2 , x3 ) = M 1
v = M 1 Ji
.
. i
M +C + BM x3 + C +BC + E x2 + BG+ G
T
Ltat du systme est alors reprsent par le vecteur x = xT1 , xT2 , xT3 . Nous choisissons
comme surface de glissement s :
(4.20)
s = x3 xd3 + 1 x2 xd2 + 2 x1 xd1
96
= x3 xd3 + 1 e + 2 e
= x3 xr3
En drivant deux fois s sur la surface x1 = x2 = x3 = 0 nous obtenons :
...
s = e + 1 e + 2 e
= x 3 x d3 + 1 x3 xd3 e + 2 x2 xd2
= x 3 x r3
= f (x1 , x2 , x3 ) x r3 + v
....
...
s = e + 1 e + 2 e
= x3 xd3 + 1 x 3 x d3 + 2 x3 xd3
= x3 xr3
= f (x1 , x2 , x3 ) xr + v
3
(4.21)
(4.22)
(4.23)
o :
e = x1 xd1 reprsente lerreur en position,
e = x2 xd2 reprsente lerreur en vitesse,
e = x xd3 reprsente lerreur en acclration,
... 3
e = x 3 x d3 lerreur en jerk.
Dautre part :
xr3 = xd3 1 e 2 e,
x r3 = x d3 1 e 2 e,
...
et xr3 = xd3 1 e 2 e
(4.24)
(4.25)
veq = x r3 f (x1 , x2 , x3 )
(4.26)
o :
f reprsente lestime de f , et :
v1
kM sign(s)
v 1 =
km sign(s)
si
si
si
4.3. Observateur et commande par modes glissants dordre 2 pour le robot SAP 97
avec kM et km des matrices diagonales ayant comme composantes respectives kMi et
kmi (i {1, 2}) vriant les ingalits suivantes :
kmi > Fi
kM i > kmi
kM i Fi > kmi + Fi
alors nous obtenons lalgorithme du twisting chantillonn.
En remplaant (4.25) dans (4.23) nous obtenons sur la surface x1 = x2 = x3 = 0 :
s = f (x1 , x2 ) xr3 + v eq + v 1
4fi Fi
De la mme faon que prcdemment nous obtenons une convergence en temps ni.
En pratique, le systme (4.19) est eectivement entres bornes et tats borns, et stabilisable par le retour dtat u(x).
4.3.3
Rsultats de simulation
98
q1 et q1d
0 .5
rd
rd
0
-0 .5
- 0 .5
-1
-1
0
0 .5
q1p et q1pd
0 .5
q2p et q2pd
0 .5
q2pp et q2ppd
0 .5
te m p s (s )
rd/s
rd/s
-5
-5
0
0 .5
q1pp et q1ppd
1
50
rd/s
50
rd/s
q2 et q2d
0 .5
-5 0
-5 0
0
0 .5
te m p s (s )
Fig 4.19 : Etats rels et tats dsirs sur les deux axes du robot SAP
La gure (4.19) montre les tats rels et dsirs sur les deux axes du robot SAP,
nous constatons un temps de convergence relativement grand.
q1 et q1o
0 .5
q2 et q2o
0 .5
rd
rd
0
-0 .5
- 0 .5
-1
-1
0
-5
0 .5
q2p et q2po
0 .5
q2pp et q2ppo
0 .5
te m p s (s )
-5
0
0 .5
q1pp et q1ppo
1
50
rd/s
50
rd/s
0
5
rd/s
rd/s
0 .5
q1p et q1po
-5 0
-5 0
0
0 .5
te m p s (s )
Fig 4.20 : Etats rels et tats observs sur les deux axes du robot SAP
La gure (4.20) prsente les tats rels et observs sur les deux axes du robot SAP,
nous observons une convergence des tats observs vers les tats relles. Cependant,
4.3. Observateur et commande par modes glissants dordre 2 pour le robot SAP 99
e r re u r d o b s e r v a tio n 1 ( p o s )
e rr e u r d o b s e rv a tio n 2 ( p o s )
0 .5
rd
rd
0 .5
-0 .5
- 0 .5
0
0 .5
e rr e u r d o b s e rv a tio n 1 (v it)
0 .5
e r re u r d o b s e r v a tio n 2 (v it)
0 .5
e r re u r d o b s e r v a tio n 2 ( a c c )
0 .5
te m p s (s )
1
0 .5
rd/s
rd/s
0 .5
0
-0 .5
- 0 .5
0
1
10
rd/s
rd/s
0 .5
e rr e u r d o b s e rv a tio n 1 (a c c )
5
0
-5
-5
0
0 .5
te m p s (s )
e r re u r d e s u iv i 2 ( p o s )
0 .5
rd
rd
0 .5
-0 .5
- 0 .5
0
0 .5
e r re u r d e s u iv i 1 (v it)
0 .5
e r re u r d e s u iv i 2 ( v it)
0 .5
e rre u r d e s u iv i 2 (a c c )
0 .5
te m p s (s )
rd/s
rd/s
0
0
-2
-5
-4
0
1
40
20
rd/s
rd/s
40
0 .5
e rre u r d e s u iv i 1 (a c c )
20
0
-2 0
-2 0
0
0 .5
te m p s (s )
Fig 4.22 : Erreur derreur en position, vitesse et acclration sur les deux axes du
robot SAP
An de pouvoir montrer au moins les performances de la commande dordre
deux sur le robot SAP, nous prsentons dans la gure (4.22) les erreurs de poursuite
100
en position, en vitesse et en acclration sur les deux axes du robot en boucle ouverte,
cest--dire sans lobservateur.
c o u r a n t1
mA
0 .5
-0 .5
0
0 .1
0 .2
0 .3
0 .4
0 .5
0 .6
0 .7
0 .8
0 .9
0 .6
0 .7
0 .8
0 .9
c o u ra n t2
0 .2
mA
0 .1
0
-0 .1
-0 .2
-0 .3
0
0 .1
0 .2
0 .3
0 .4
0 .5
te m p s (s )
Fig 4.23 : Courants de commande appliqus aux actionneurs des deux axes du robot
SAP
La gure (4.23) montre les courants de commande appliqus aux actionneurs
pneumatiques des deux axes du robot SAP. Nous obtenons une commande lisse justiant notre choix de ce type de schma de commande.
4.4
Conclusion
Dans ce chapitre, nous avons prsent une nouvelle vision de la commande par
modes glissants. En eet, en rgime glissant dordre deux, la discontinuit nintervient
plus sur lentre mais sur sa drive. On vite ainsi les phnomnes de rticence lis des
commutations trop rapides de lentre intervenant lors de lutilisation de la commande
par modes glissants classiques.
Nous avons eectu dans ce chapitre, une extension des rsultats obtenus dans la
littrature pour les systmes monovariables au cas des systmes multivariables. Lide
de base tait de considrer, par une technique de dcouplage, que le rgime glissant
global est un ensemble de m rgimes glissants an de pouvoir exploiter les rsultats
existants. Il a t montr que le schma de commande et dobservateur par modes
glissants dordre deux prsente le meilleur suivi de trajectoire, la meilleure observation avec une rduction du phnomne de rticence. Cependant, pour lobservateur
dordre 3 nous navons pas pu atteindre les performances prvues en thorie, ceci tant
li la grande complxit de rglage des gains que nous avons rencontr durant nos
simulations.
Ce type de commande nous semble par ailleurs tout fait adapt aux systmes
rapides, et nous parat une voie trs prometteuse pour de nombreuses applications.
102
introduisant ainsi une nouvelle vision des rgimes glissants. Avec ce schma de commande nous obtenons selon le choix de la surface de glissement, une commande discontinue mais avec rduction du phnomne de rticence ou alors une commande lisse.
La gnralisation au cas multivariable des rsultats obtenus dans la littrature dans
le cas monovariable a t ralise. Lobservateur que nous proposons dans ce schma
est bas lui aussi sur la technique des modes glissants dordre deux, permettant ainsi
dliminer le phnomne de rticence au niveau de lobservateur et de la commande.
Divers rsultats de simulation ont permis dillustrer cette approche, permettant ainsi
de montrer que cette dernire ralise le meilleur suivi de trajectoire, avec rduction et
voir mme limination du phnomne de rticence. La convergence
2 que nous obtenons
est une convergence en temps ni, et elle est de lordre de O ( tant la priode
dchantillonnage de la mesure) alors quelle ne serait que de lordre de O () pour la
commande par modes glissants dordre un. Des rsultats exprimentaux ont t prsents qui nous semblent tre essentiels pour valider cette approche encore nouvelle. Il
y a dailleurs pour le moment encore trs peu de travaux exprimentaux publis.
Ce panorama, non exhaustif, montre la diversit des techniques de commande
et dobservation. Cependant aucune dentre elles nest idale. Malgr tout, il se dgage certaines tendances. La commande qui rpond le mieux au problme de suivi, est
la commande par modes glissants dordre deux. Nanmoins, lutilisation dtats non
disponibles dans la commande, ncessite lutilisation dun observateur. A notre avis
lobservateur dordre suprieur est le mieux adapt, assurant une trs grande prcision
dobservation. Il ore une convergence en temps ni de tout ltat, permettant ainsi
dviter ltude de stabilit en boucle ferme de la commande et de lobservateur. Cependant, il prsente une grande complexit de rglage des gains, notamment pour un
ordre suprieur deux. Dans tous les cas, la technique des modes glissants dordre
suprieur est un outil performant qui mrite dvoluer pour sadapter un maximum
dapplications possibles. Pourtant, rien ne permet de ngliger lapport des autres schmas de commande et dobservation proposs dans ce rapport. Le but reste llaboration
dune commande et dun observateur performant et facile implmenter. Nous allons
dans ce paragraphe laborer sous forme de tableau (gure (C.1)), les avantages et les
inconvnients de chacune des commandes et des observateurs proposs. Les temps de
rponse et les performances sont donns pour les rsultats de simulation.
103
104
Pour faciliter le travail dutilisateurs potentiels, nous prsentons un tableau simpli (gure (C.2)) qui permettra de faire un choix entre les direntes commandes et
observateurs proposs.
Complexit
thorique
Rapidit de
convergence
Performances
glissants dordre un
0.6 s (vitesse)
2% (vitesse)
Discontinue
***
Observateur par m odes
glissants dordre un
0.2 s (vitesse)
Observateur adaptatif
Com mande
1s
(vitesse)
Continue
0.3 s (vitesse)
Rgime transitoire
1.03
Rglage
nergie
consom me (J) des gains
28.152
**
15.189
***
0.2% (vitesse)
2.25% (vitesse)
Com mande
maxim ale (Nm )
Rgime transitoire
1.03
Rgime perm anent
0.625
2.3% (vitesse)
0.8 s (vitesse)
1.91% (vitesse)
0.1 s (position)
0.04% (position)
0.2 s (vitesse)
0.25% (vitesse)
Discontinue
1.25%
(vitesse)
*
18.859
Rgime transitoire
1.03
**
13.46
Continue
Rgime perm anent
0.61
Bibliographie
[1] K. J. Astrom and B. Wittenmark. Adaptive control. Addison-Wesley, 1989.
[2] A. Aubin. Modlisation, identication et commande du bras manipulateur. TAM,
INPG, November 1988. Grenoble.
[3] K. S. Bag, S. K. Frankowska, and C. Edwards. Dynamique output feedback
sliding mode design for linear uncertain systems. In Proc. of the 35th Conf. on
Dec. and Cont., 1996. Kobe, Japan.
[4] S. P. Banks. A note on nonlinear observers. Int. Jour. of Cont., 34 :185190,
1981.
[5] J. P. Barbot, T. Boukhobza, and M. Djemai. Triangular input observer form and
nonlinear sliding mode observer. In IEEE-CDC Conf., 1996. Kobe, Japan.
[6] G. Bartolini, M. Coccoli, and A. Ferrara. Vibration damping and second order
sliding modes in the control of a single nger of the amadeus gripper. Int. Jour.
of Syst. Science., 29(5) :497512, 1998.
[7] G. Bartolini and A. Ferrara. Real-time output derivatives estimation by means
of higher order sliding modes. 1998. Tunisia.
[8] G. Bartolini, A. Ferrara, A. Levant, and E. Usai. On second order sliding mode
controllers. Proc. of 5th Int. Workshop on VSS, Longboat Key, Florida, 1998.
[9] G. Bartolini, A. Ferrara, and E. Usai. Chattering avoidance by second-order
sliding mode control. IEEE Trans. on Auto. Cont., 43(2) :241246, 1998.
[10] G. Bartolini, T. Ferrara, and E. Usai. Application of a sub-optimal discontinuous
control algorithm for uncertain second order systems. Int. Jour. of Robust and
Nonlinear Cont., 7(4) :299310, 1997.
[11] G. Bartolini, A. Pisano, and E. Usai. A digital 2-sliding control algorithm for a
class of uncertain nonlinear plants. Proc. of the ECC, 1999. Karlshruhe, Germany.
[12] G. Bartolini and P. Pydynowski. An improved, chattering free, v.s.c. scheme for
uncertain dynamical systems. IEEE Trans. on Auto. Cont., 41 :12201226, 1996.
[13] S. Behtash. Robust output tracking for nonlinear systems. Int. Jour. of Cont.,
51(6) :13811407, 1990.
[14] H. Berghuis, R. Ortega, and H. Nijmeijer. A robust adaptive robot controller.
IEEE Robot. and Auto., 9 :825830, 1993.
[15] D. Bestle and M. Zeitz. Canonical form observer design for nonlinear time varying
systems. Int. Jour. of Cont., 38 :419431, 1983.
105
106
BIBLIOGRAPHIE
[16] J. Birk and M. Zeitz. Extended luenberger observers for nonlinear multivariable
systems. Int. Jour. of Cont., 47 :18231836, 1988.
[17] A. Bloch and S Drakunov. Stabilization and tracking in the nonholonomic integrator via sliding mode. Syst. & Cont. Lett., 29 :9199, 1996.
[18] G. Bornard and H. Hammouri. A high gain observer for a class of uniformly
observable systems. In IEEE. of the 30th Conf. on Dec. and Cont., pages 1494
1496, 1991.
[19] T. Boukhobza. Observateurs modes glissants et formes dobservabilit et analyse
et synthse des commandes par ordres suprieurs. PhD thesis, Universit de ParisSud Orsay, Laboratoire des Signaux et Systmes, 1997.
[20] T. Boukhobza and J. P. Barbot. High order sliding modes observer. IEEECDC98, Tampa, USA, pages 19121917, 1998.
[21] T. Boukhobza, N.K. Msirdi, H. Cherrid, and N.N. Gauthier. Observateur
modes glissants dordre suprieur chantillonns pour un robot manipulateur.
CIFA, pages 267272, 2000.
[22] M. Bouri. Contribution la commande non linaire par mode de glissement :
Application aux actionneurs lectropneumatiques. PhD thesis, INSA de Lyon,
France, 1997.
[23] M. Bouri, D. Thomasset, and R.F. Ngwompo. Nonlinear sliding mode control
synthesis with electropneumatic application. IEEE-SMC IMACS, 1 :5358, July
1996.
[24] H. Buhler. Rglage par mode de glissement. Presse Polytechnique Romandes,
1986.
[25] C. Canudas de Wit. Adaptive control for partially known systems : Theory and
applications. Elsevier Publishers, Studies in Auto. and cont., 7, 1988.
[26] C. Canudas De Wit, K. J. Astrom, and N. Fixot. Computed torque control via
a nonlinear observer. Int. Jour. of Adap. Cont. and Sig. Proc., pages 443452,
1990.
[27] C. Canudas de Wit, K.J. Astrm, and N. Fixot. Trajectory tracking in robot
manipulators via nonlinear estimated state feedback. Trans. on Robot. and Auto.,
1(8) :138144, 1992.
[28] C. Canudas de Wit and N. Fixot. Adaptive control of robot manipulator via
velocity estimated feedback. IEEE Trans. on Auto. Cont., 37(8), 1992.
[29] C. Canudas de Wit and J. J. E. Slotine. Sliding observers in robot manipulators.
Automatica, 27(5) :859864, 1991.
[30] H. Cherrid, F. Errahimi, N. N-Gauthier, and N.K. MSirdi. Observateurs robuste
et commande adaptatifs par modes glissants pour les robots manipulateurs. JDA,
Nantes, 1999.
[31] H. Cherrid, F. Errahimi, N. N-Gauthier, and N.K. MSirdi. The second order
sliding mode control for a bipedal walking robot. Third Int. Conf. on Climbing
and walking robots, CLAWAR, Madrid, Spain, 2000.
BIBLIOGRAPHIE
107
[32] H. Cherrid, N. N-Gauthier, N. Manamani, and N.K. MSirdi. Sliding mode observer based controller for a robot with pneumatic actuators. ECPD, Int. Conf.
on advanced robotics, intelligent automation and active systems, Moscou, 1998.
[33] P. Coiet. Les robots. Edition Hermes, 1986.
[34] C. Desoer and M. Vidyasagar. Feedbak systems : Input-output properties. Academic Press, New York, 1975.
[35] M. Djemai, J.P. Barbot, and T. Boukhobza. Some comments on higher order
sliding modes. Proc. of the Euro. Cont. Conf., 1999. Karlshruhe, Germany.
[36] E. Dombre and W. Khalil. Modlisation et commande des robots. Ed.Herms,
1988.
[37] S. Drakunov and V. Utkin. Sliding mode observer. tutorial. IEEE Conf. on Dec.
and Cont., pages 33763379, 1995.
[38] S.V. Drakunov. Sliding mode observer based on equivalent control method. In :
IEEE Conf. on Dec. and Cont., pages 23682369, 1992.
[39] S.V. Drakunov and V.I. Utkin. Sliding mode control in dynamic systems. Int.
Jour. of Cont., 55(4) :10291037, 1992.
[40] B. Draznovic. The invariance conditions in sliding mode systems. Automatica,
5 :287295, 1969.
[41] C. Edwards and S. Spurgeon. Robust output tracking using a sliding mode
controler/observer scheme. Int. Jour. of Cont., 64(5) :967983, 1996.
[42] C. Edwards and S. Spurgeon. Sliding mode control : theory and applications.
Taylor and Francis Eds, 1998.
[43] H. Elmali and N. Olgac. Robust output tracking control of nonlinear mimo
systems via sliding mode technique. Automatica, 28(1) :145151, 1992.
[44] S.V. Emelyanov. Variable structure control systems. Moscow Nauka, 1967.
[45] S.V. Emelyanov, S.K. Korovin, and A. Levant. Higher-order sliding modes in
control systems. Dierential Equations, 29(11) :16271647, 1993.
[46] S.V. Emelyanov, S.K. Korovin, and L.V. Levantovsky. Drift algorithm in control
of uncertain processes. Problems of Control and Information Theory, 15(6) :425
438, 1986.
[47] S.V. Emelyanov, S.K. Korovin, and L.V. Levantovsky. Higher order sliding modes
in the binary control system. Soviet Physics, 31(4) :291293, 1986.
[48] S.V. Emelyanov, S.K. Korovin, and L.V. Levantovsky. Second order sliding modes
in controlling uncertain systems. Soviet Jour. of Computer and System Science,
24(4) :6368, 1986.
[49] A. F. Filippov. Application of the theory of dierential equations with discontinuous right-hand side to non-linear problems in automatic control. Amer. Math.
Soc. Trans., 62 :199231, 1960.
[50] M. Fliess and F. Messager. Sur la commande en rgime glissants. Compte Rendu
Academique des sciences de Paris, 1992.
108
BIBLIOGRAPHIE
BIBLIOGRAPHIE
109
[67] U. Itkis. Control systems of variable structure. J. Wiley : New York, 1976.
[68] R. E. Kalman. A new approach to linear ltering and prediction problems. Trans.
ASME, Jour. Basic Engineering, 82 :3445, 1960.
[69] R. E. Kalman and R. Bucy. New results in linear ltering and prediction theory.
Trans. ASME, Jour. Basic Engineering, 83 :95108, 1961.
[70] A. Kellal. Contribution ltude des asservissements lectropneumatiques. Application la ralisation dun asservissement numrique dun axe de robot. PhD
thesis, INSA de Lyon, 1987.
[71] A. Krener and A. Isidori. Linearization by output injection and nonlinear observers. Syst. & Cont. Lett., 3 :4752, 1983.
[72] V. Krishmaswami, C. Siviero, F. Cabognani, and V Utkin. Application of sliding
mode observers to automobile power-train. In : Proc. of the IEEE int. Conf. on
Cont. Appli., pages 355360, 1996.
[73] L. Laval. Modlisation et commande en force dun actionneur hydrolique
confront un environnement incertain : Approche Hinnie et commande adaptative. PhD thesis, Universit de Paris VI, Laboratoire de Robotique de Paris
France, 1997.
[74] A. Levant. Sliding order and sliding accuracy in sliding mode control. Int. Jour.
of Cont., 58(6) :12471263, 1993.
[75] A. Levant. Higher order sliding : collection of design tools. Euro. Cont. Conf.,
Bruxelles, Belgique, 1997.
[76] A. Levant. Robust exact dierentiation via sliding mode technique. Automatica,
34(3) :379384, 1998.
[77] A. Levant. Controlling output variable via higher order sliding modes. Proc. of
the Euro. Cont. Conf., Karlshruhe, Germany, 1999.
[78] L.V. Levantovsky. Second order sliding algorithms : Their realization. in dynamique of heterogeneous systems. Institute for System Studies, Moscow, pages
3243, 1985.
[79] S.J. Lin and A. Akers. Dynamic analysis of a apper nozzle valve. Jour. of Dyn.
Sys. Meas. and Cont., (113) :163166, March 1991.
[80] S. Liu and J.E. Bobrow. An analysis of a pneumatic servo system and its application to a computer controlled robot. Jour. of Dyn. Sys. Meas. and Cont.,
(110) :228235, 1988.
[81] D. G. Luenberger. Observerving the state of a linear system. IEEE Trans. Mil.
Electron, 6 :7480, 1964.
[82] D. G. Luenberger. An introduction to observers. IEEE Trans. on Auto. Cont.,
16(6), 1971.
[83] N. Manamani. Commandes et Observateurs pour systmes pneumatiquesMthodologie pour la locomotion pattes. PhD thesis, Universit de Paris VI,
Laboratoire de Robotique de Paris France, 1998.
110
BIBLIOGRAPHIE
BIBLIOGRAPHIE
111
[102] H. Sira-Ramirez and S.K. Spurgeon. Robust sliding mode control using measured
outputs. J. Mathematical syst., Estimation, and cont., 6 :359362, 1996.
[103] J-J. Slotine and W. Li. Applied Nonlinear Control. Prentice Hall, 1991.
[104] J.J. Slotine and S.S. Sastry. Tracking control of nonlinear system using sliding
surface, with application to robotic manipulators. Int. Jour. of Cont., 38 :465
492, 1983.
[105] J.J.E. Slotine. Sliding controller design for nonlinear systems. Int. Jour. of Cont.,
40(2) :421434, 1984.
[106] J.J.E. Slotine, J.K. Hedrick, and E.A. Misawa. Nonlinear state estimation using
sliding observers. In Proc. of 25th IEEE Conf. on Dec. and Cont., pages 332339,
1986. Greece.
[107] J.J.E. Slotine, J.K. Hedrick, and E.A. Misawa. On sliding observer of nonlinear
systems. Jour. of Mathematical Syst., Estimation and Cont., 109 :245252, 1987.
[108] J.J.E. Slotine and W. Li. On the adaptive control of robot manipulators. Int.
Jour. of Robot. Research, 6(3) :4959, 1987.
[109] Y. Song and J. W. Grizzle. The extended kalman lter as local asymptotic
observer for nonlinear discrete-time systems. In : Proc. of the American Cont.
Conf., pages 33653369, 1992.
[110] C.Y. Su and Y. Stepanenko. On the robuste control of robot manipulators including actuator dynamics. Jour. of Robot. Syst., 13(1) :110, 1996.
[111] M. Tarokh and G. McDermott. A robust adaptive tracking controller for robot
manipulators. Proc. of the third IASTED Inter. Conf., Cancun, Mexico, pages
152155, June 1995.
[112] V. I. Utkin. Variable structure systems with sliding mode. IEEE Trans. on Auto.
Cont., 26, No 2 :212222, 1977.
[113] V. I. Utkin. Sliding mode and their application in variable structure systems.
Mir, Moscou, 1978.
[114] V. I. Utkin. Sliding modes in control optimization. Springer-Verlag, 1992.
[115] V. I. Utkin. Sliding mode control design principles. IEEE Trans. on Industr.
Electron., 40 :2336, 1993.
[116] V. I. Utkin and S. Drakunov. Sliding mode observer. tutorial. IEEE Conf. on
Dec. and Cont., pages 33763378, 1995.
[117] X. Xia and W. Gao. Nonlinear observer design by observer canonical forms. Int.
Jour. of Cont., 47 :10811100, 1988.
[118] X. Xia and W. Gao. Nonlinear observer design by observer error linearization.
SIAM Jour. Cont. and Opt., 27 :199213, 1989.
[119] J.M. Yang and J.H. Kim. Sliding mode control for trajectory tracking of nonholomic wheeled mobile robots. IEEE Trans. on Robot. and Auto., 15(3) :578587,
1999.
112
BIBLIOGRAPHIE
[120] S.Y. Yi and M.J. Chung. Robust control with an adaptation law for robot manipulators. Proc. of the third IASTED Inter. Conf., Cancun, Mexico, pages
148151, June 1995.
[121] K.D. Young, V.I. Utkin, and U. Osguner. A control engineers guide to sliding
mode control. IEEE Trans. on Cont. Syst. Technology, 7(3) :328342, 1999.
[122] T. Zolezzi. Dierential inclusions and Sliding mode control. in Sliding mode
control in Engineering, Editeurs : W. Perruquetti and J.P. Barbot. Marcel Dekker
( paratre en janvier 2002).
Annexe A
Modlisation du bras manipulateur
A.1
Nous montrons dans cet annexe le cheminement qui permet dobtenir le modle
dynamique du bras manipulateur partir des quations de Lagrange. Nous faisons
lhypothse quils sont rigides et sans frottements. En eet, le cas des robots ayant des
frottements non ngligeables pourrait tre tudi de faon peu prs similaire. Nous
choisissons de ne pas les considrer pour ne pas trop compliquer lexpos des rsultats.
A.1.1
=
dt q
q
Dans le cas des robots manipulateurs rigides et sans frottement, lnergie potentielle
Ep (q) ne dpend que de la position, elle nest pas fonction des vitesses gnralises q,
1
1
Ec = qT M (q) q =
2
2
mij (q) qi qj
i,j{1,...n}
M (q) est la matrice dinertie de dimention n n, elle est symtrique, dnie positive
pour tout q de <n .
113
114
1
2
i,j{1,...n}
on a dune part :
X
L
=
mkj (q) qj
qk
j
et donc :
X
X d
d L
mkj (q) qj
=
mkj (q) qj +
dt qk
dt
j
j
X
X mkj
=
mkj (q) qj +
(q) qi qj
i
j
i,j
et dautre part :
1 X mij
P
L
=
qi qj
qk
2 i,j qi
qk
Les quations de Lagrange pour un tel systme se traduisent donc par :
X
X mkj
1 mij
P
qi qj +
mkj (q) qj +
= k
k {1, . . . n}
qi
2 qk
qk
j
i,j
En interchangeant lordre de la somme dans le deuxime terme et en utilisant la symtrie de la matrice dinertie, on peut montrer que :
X mkj
1 X mkj mki
qi qj =
+
qi qj
q
2
q
q
i
i
j
i,j
i,j
et ainsi, en dnissant les coecients cijk , connus sous le nom de symboles de Christoel, par :
2
qi
qj
qk
et en posant :
Gk =
P
qk
i,j
k {1, . . . n}
115
(A.1)
C (q, q)
q est form dlments quadratiques en q dont les coecients peuvent dpendre
de q. Ils sont classs en deux catgories : les termes en qi2 reprsentent les forces de
centrifuges et les termes en qi qj , i 6= j, reprsentent les forces de Coriolis. Plusieurs
reprsentations de la matrice C (q, q)
peuvent tre choisies, on prendra de prfrence
celle dont les lments sont dnis par :
Ckj (q, q)
=
n
X
Cijk (q) qi
i=1
car elle a des proprits intressantes. G (q) reprsente les termes de gravit du systme
et les couples appliqus sur chacun des lments du bras manipulateur.
A.1.2
A.1.3
Comme nous lavons dja soulign prcdemment, la matrice dinertie M (x1 ), qui
est une matrice carre de dimention n n et qui ne dpend que de la position, est
symtrique dnie positive pour tout x1 de <n .
P.1. M (x1 ) = M (x1 )T > 0
Il en rsulte directement quelle est inversible
P.2. M (x1 )1 existe
116
k {1, n}
2
qi
qj
qk
On peut majorer la norme de C (x1 , x2 ) x2 par une fonction du carr de la vitesse
articulaire x2
P.7. kC (x1 , x2 ) x2 k c1 kx2 k2 ;
Le vecteur C (x1 , x2 ) x2 tant donn, il existe plusieurs paramtrisations possibles
pour la matrice C (x1 , x2 ) x2 . Nous avons cit prcdemment celle dnie par les symboles de Christoel :
X
Cijk (x1 ) x2i
{C (x1 , x2 )}kj =
i
X mkj
1 mij
{C (x1 , x2 )}kj =
x2i
x1i
2 x1k
i
On peut montrer [88] que, quelle que soit la dnition de la matrice C (x1 , x2 ), la
relation suivante est
vraie :
P.8. xT2 dtd (M (x1 )) 2C (x1 , x2 ) x2 = 0
Cest une proprit de conservation dnergie.
117
Preuve 3 [88]
Pour dmontrer cette proprit, on dnit lhamiltonien du systme
H = pT x2 L (x1 , x2 )
L
o L est le Lagrangien du systme et p est le vecteur des moments gnraliss : p = x
2
Il en rsulte que H est gale la somma de lnergie cintique et de lnergie
potentielle du systme.
1
H = xT2 M (x1 ) x2 + Ep (x1 )
2
(A.2)
x2i =
pi
i {1, n}
1 dM (x1 )
p
= xT2 M (x1 ) x 2 + xT2
x2 +
x2
2
dt
x1
1 T dM (x1 )
T
2C (x1 , x2 ) x2
= x2 + x2
2
dt
p
car M (x1 ) x 2 = C (x1 , x2 ) x2 x
daprs lquation du modle obtenue par les
1
quations de Lagrange.
On a donc montrer que quelle que soit la paramtrisation de C (x1 , x2 ) choisie,
elle vrie la proprit (g).
n
X
dM (x1 )
mkj
=
x2i
dt
x1i
kj
i=1
118
n
1 X mkj mki mij
Ckj =
x2i
+
2 i=1 x1i
x1j
x1k
donc les lments de la matrice M (x1 ) 2C (x1 , x2 ) sont :
n
X
mij
mki
x2i = Sjk
Skj =
x1k
x1j
i=1
car la matrice dinertie est symtrique.
A.2
r1
q2
l1
Articulation 3
r2
l2
Articulation 2
q3
r3
l3
A xe 2
A xe 3
0 .7 8
0 .7 8
0 .7 8
L o n g u eu rs (m m )
270
225
365
D ia m t r e s ( m m )
30
30
110
P o id s (K g )
P o i d s to ta l ( K g )
1 .0 3
L o n g u eu r m ax (m )
0 .6 2
A.2.1
119
1
mVG2 + (I.)
2
A.2.2
120
A.2.3
M11 0
0
M = 0 M22 M23
0 M32 M33
M11 = m3 l22 cos2 (q2 ) + m3 r32 cos2 (q2 + q3 ) + 2m3 l2 r3 cos (q2 ) cos (q2 + q3 )
+m2 r22 cos2 (q2 ) + A2 sin2 (q2 ) + A3 sin2 (q2 + q3 )
+B1 + B2 cos2 (q2 ) + B3 cos2 (q2 + q3 )
M22 = m2 r22 + m3 l22 + m3 r32 + 2m3 l2 r3 cos (q3 ) + B2 + B3
M23 = m3 r32 + m3 l2 r3 cos (q3 ) + B3
M32 = m3 r32 + m3 l2 r3 cos (q3 ) + B3
M33 = m3 r32 + B3
Termes de la matrice C :
C11 = [m3 r32 cos (q2 + q3 ) sin (q2 + q3 ) m3 l2 r3 sin (q2 + q3 ) cos (q2 )
m3 l2 r3 cos (q2 + q3 ) sin (q2 ) m3 l22 cos (q2 ) sin (q2 ) B2 cos (q2 ) sin (q2 )
m2 r22 cos (q2 ) sin (q2 ) + A3 cos (q2 + q3 ) sin (q2 + q3 )
+A2 cos (q2 ) sin (q2 ) B3 cos (q2 + q3 ) sin (q2 + q3 )] q2
[m3 r32 cos (q2 + q3 ) sin (q2 + q3 ) m3 l2 r3 sin (q2 + q3 ) cos (q2 )
+ (A3 B3 ) cos (q2 + q3 ) sin (q2 + q3)] q3
C12 = [m3 r32 cos (q2 + q3 ) sin (q2 + q3 ) m3 l2 r3 sin (q2 + q3 ) cos (q2 )
m3 l2 r3 cos (q2 + q3 ) sin (q2 ) m3 l22 cos (q2 ) sin (q2 ) B2 cos (q2 ) sin (q2 )
m2 r22 cos (q2 ) sin (q2 ) + A3 cos (q2 + q3 ) sin (q2 + q3 )
+A2 cos (q2 ) sin (q2 ) B3 cos (q2 + q3 ) sin (q2 + q3 )] q1
C13 = [m3 r32 cos (q2 + q3 ) sin (q2 + q3 ) m3 l2 r3 sin (q2 + q3 ) cos (q2 )
+ (A3 B3 ) cos (q2 + q3 ) sin (q2 + q3)] q1
C21 = [m3 r32 cos (q2 + q3 ) sin (q2 + q3 ) + m3 l2 r3 sin (q2 + q3 ) cos (q2 )
+m3 l2 r3 cos (q2 + q3 ) sin (q2 ) + m3 l22 cos (q2 ) sin (q2 ) + B2 cos (q2 ) sin (q2 )
+m2 r22 cos (q2 ) sin (q2 ) A3 cos (q2 + q3 ) sin (q2 + q3 )
A2 cos (q2 ) sin (q2 ) + B3 cos (q2 + q3 ) sin (q2 + q3 )] q1
0
G = G1
G2
G2 = (m2 r2 cos (q2 ) + m3 l2 cos (q2 ) + m3 r3 cos (q2 + q3 )) g
G3 = m3 r3 cos (q2 + q3 ) g
121
Annexe B
Modlisation dun systme
mcanique actionneurs
pneumatiques (robot S.A.P)
B.1
Plate-form e
C odeur optique 1
C able
2 nd segm ent
du systm e
Poulie
123
V dP
dV
+P
g dt
dt
(B.1)
V1 dP1
dV1
+ P1
dt
dt
V 2 dP2
dV2
+ P2
dt
dt
m1 rT1 =
m2 rT2 =
124 Annexe B. Modlisation dun systme mcanique actionneurs pneumatiques (robot S.A.P)
Pam
.
m2 = Cq Cm2 x 2
Tam2
Nous obtenons donc laide des quations ci-dessus,
dV1
V1 dP1
.
=m1 rT1 P1
dt
dt
V 2 dP2
dV2
.
=m2 rT2 P2
dt
dt
ce qui donne :
rT1 .
rT1 .
dV1
P1 dV1
=
P1 =
m1 P1
m1
V1
V1
dt
V1
rT1 dt
.
rT2 .
rT2 .
dV2
P2 dV2
=
P2 =
m2 P2
m2
V2
V2
dt
V2
rT2 dt
.
Le dbit dair dans les chambres P et N peut tre exprim en fonction de ceux
dans les direntes orices Aij comme tant :
m
p = (m
ap m
pr ) et m
n = (m
an m
nr )
Ceci mne aux quations suivantes pour la servovalve :
Pp dVp rT
dPp
dt = V dt + V mp
(B.2)
dPn = Pn dVn + rT m
n
dt
Vn dt
Vn
(B.3)
.
mp = fp (x, P ) = Cx x Cp Pp
mn = fn (x, P ) = Cx x Cn Pn
.
.
map
map
(B.5)
|x0
|x0
Cx =
x
x
.
.
man
mnr
|P0
|P0
Cx =
P
P
125
(B.6)
Dans les quations suivantes, lindice i indique les conditions initiales. Les relations entre les volumes, le ux dcoulement et la vitesse du piston sont :
dVn
dVp
=
= S y
dt
dt
rT
Pp
(Cx x Cp Pp ) i Slq
Pp =
Vpi
Vpi
avec :
rT
Pn
(Cx x Cn Pn ) i Slq
Pn =
Vni
Vni
Pp = Pp Ppi ; Pn = Pn Pni
Vp = Vp Vpi ; Vn = Vn Vni
(B.7)
(B.8)
(B.9)
(B.10)
Lallure dynamique du piston et des charges externes peuvent tre dcrites comme
suit :
m
dy
= S(Pp Pn ) V (y, y)
Fr
dt
(B.11)
o :
- V (y, y)
reprsente les frottements secs et visqueux, et certaines fonctions non
linaires qui auraient pu tre ngliges lors de lidentication du modle.
- Fr reprsente la force rsistive produite par la charge (proportionnelle la
dirence des pressions dans les deux chambres).
- m est la masse du cble et du piston qui est ngligeable compare linertie du
segment.
La relation entre louverture x de la valve et le courant peut tre simplie en
posant i = x + i0 , mais il est noter quen pratique il existe une zone morte et une
saturation. Ce modle simpli sera alors utilis pour lidentication et la commande.
Notons galement que les paramtres des actionneurs sont variant dans le temps et
dpendent des conditions initiales (la temprature ambiante, les pressions, ...).
Le modle de lactionneur est alors dni par les quations (B.3) (B.11). Les
quations de lactionneur lctropneumatique sont non linaires et paramtres variant
dans le temps donnes par :
= Ji B E q
o = K (Pp Pn )
126 Annexe B. Modlisation dun systme mcanique actionneurs pneumatiques (robot S.A.P)
Le couple permet de relier les quations dynamiques de la patte celles des
actionneurs, J, B et E sont des matrices diagonales de dimension (2 2) appeles
paramtres thermodynamiques donnes par :
rT Ci
1
1
J
=
+
Sl
Vpi
Vni
rT Cp
B = Vp
i
E = Ppi + Pni
Vpi
B.2
Vni
M (q)
q + C(q, q)
q + G(q) =
Nous prsentons dans ce paragraphe les termes de chaque matrice, ainsi que de
leurs drivs utilises dans la loi de commande.
En sachant que :
m1 , m2 : les masses du premier et du second segment de la patte,
l1 , l2 : les longueurs respectives du premier et du second segment de la patte,
I1 , I2 : les inerties respectives du premier et du second segment de la patte,
g : le terme de gravit,
ci = cos(qi ), si = sin(qi ), sij = sin(qi + qj ), cij = cos(qi + qj ),
nous avons pour :
La matrice dinertie,
M (q) =
4m2 l1 l2 s2
2m2 l1 l2 q 2 s2
.
2m2 l1 l2 q 2 s2
0
.
.
.
2m2 l1 l2 q 2 s2 2m2 l1 l2 (q 1 + q 2 )s2
.
C(q) =
2m2 l1 l2 q 1 s2
0
.
C (q) =
..
.2
2m2 l1 l2 q2 s2 2m2 l1 l2 q 2
..
. .
2m2 l1 l2 q1 s2 2m2 l1 l2 q 2 q 1
c2
c2
..
..
2m2 l1 l2 (q 1 + q2 )s2
.
.
.
2m2 l1 l2 q 2 (q1 + q 2 )c2
0
G (q) =
127
.
Annexe C
Complment du chapitre 4
C.1
Pour une commande u telle que |u| > Umax , la commande tend vers zro quelque
soit les valeurs de s et s.
Nous pouvons donc considrer quaprs un temps t1 ni,
lentre u est de module infrieur Umax . Conformment la littrature russe nous
appellerons la rgion |u| < Umax , le domaine linaire. On peut alors montrer que les
trajectoires, dans le plan de phase de la surface de glissement ss (gure (4.1)), dcrivent
une courbe senroulant sur elle-mme tout en convergeant en temps ni vers lorigine
s = s = 0.
Rappelons la drive seconde de la surface de contrainte (1.27) :
s = h(x, u) + g(x)u
avec par hypothse pour |u| < Umax :
|f (x, u)| < H
et
0 < G1 g(x) G2
(C.1)
Avec s > 0 et s > 0, la drive seconde de s donne par lquation (1.27) peut tre
borne par :
H G2 kM < s < H G1 kM
(C.2)
et
Ht G2 kM t + s 0 < s < Ht G1 kM t + s 0
t2
t2
(H + G2 kM ) + s 0 t < s < (H G1 kM ) + s 0 t
2
2
128
(C.3)
(C.4)
129
Lquation (C.3) reste inchange tant que la surface s = 0 nest pas atteinte.
Soit t11 le temps pour lequel la borne suprieure de s dnie dans la relation (C.3)
sannule
t11 =
s 0
G1 kM H
(C.5)
s (t11 ) = (H G1 kM )
(C.6)
De mme, soit t12 le temps pour lequel la borne infrieure de s dnie dans la relation
(C.3) sannule
t12 =
s 0
H + G2 kM
(C.7)
s (t12 ) = (H G2 kM )
=
t212
+ s 0 t12
2
s 0 2
1
2 G2 kM + H
(C.8)
(C.9)
(C.10)
(C.11)
130
2s(t11 )
G1 km H
s 0 2
(G1 km H)(G1 kM H)
(C.12)
et
t222 =
2s(t12 )
H + G1 km
s 0 2
=
(H + G1 km )(H + G2 kM )
(C.13)
H + G2 km
< s (t1 + t2 ) < s 0
H + G2 kM
G1 km H
G1 kM H
(C.14)
Ceci engendre une suite dcroissante, qui commute de plus en plus vite, mais atteint
la surface s = s = 0 en un temps ni (tf in ) dont on peut obtenir la borne suprieure
par rcurrence [8],
tf in tM1 +
1 p
|s1 |
1
(C.15)
avec, s1 la valeur de la variable s lors de son premier passage travers laxe des abscisses
dans le plan ss (gure (1.8)), tM1 dnote le temps correspondant.
G1 kM + G2 km
2
(G1 kM H) G2 km + H
r
G2 km + H
=
G1 kM H
Annexe D
Hypothses utilises
D.1
D.1.1
(x1 )1 n01;
kM 1 (x1 )k n1 et M
0
kG(x1 )k g1 et G(x
)
1 g1 ;
b
2
x2 k et C (x1 , x2 ) x2 c01 k
x 2 k2 ;
kC (x1 , x2 ) x2 k c1 k
3
x2 k k
x2 k et kC (x1 , x2 ) x2 k c1 k
x 2 k2 ;
kC (x1 , x2 ) x2 k c1 k
Nous avons obtenu dans 2.2.4 :
= M 1 C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2 M 1 C(x1 , x2 )
x2
+M 1 C(x1 , x2 )
x2 M 1 G M 1
0 =
=
sup k ( )k
0 t
sup [ 1 k
x2 k2 + ( 2 + 3 ) kb
x2 k k
x2 k + 2 k
x2 k2 + 4 + 5 k k ]
0 t
x2 + M 1 C(x1 , x2 )
x2 + M 1 C(x1 , x2 )
x2
0 M 1 C(x1 , x2 )
1
1 1
x2 + M G + M
+ M C(x1 , x2 )
131
132
sachant que :
1
1
1) M 1 C(x1 , x2 )
x2 =
x2 M
x2
M C(x1 , x2 )
C(x1 , x2 )
1
1
1
x2 M C(x1 , x2 )
x2 + kM C(x1 , x2 )
x2 k
M C(x1 , x2 )
x2 k2 + n1 c1 k
x2 k2
n01 c01 k
1 k
x 2 k2
2) kM 1 C(x1 , x2 )
x2 k n1 c1 k
x2 k k
x2 k
x2 k k
x2 k
2 k
3) kM 1 C(x1 , x2 )
x2 k n1 c1 k
x2 k k
x2 k
3 k
x2 k k
x2 k
4) kM 1 C(x1 , x2 )
x2 k n1 c1 k
x2 k2
2 k
x 2 k2
1
1
5) M 1 G =
M G M
G
1 1
M G M G + kM 1 Gk
n01 g10 + n1 g1
4
1
1 M 1
6) M = M
1
1
M M + kM 1 k k k
(n01 + n1 ) k k
5 k k
D.1.2
Nous proposons pour montrer lhypothse entre borne tat born (EBEB), la
fonction de Lyyapunov suivante :
1
1
V = xT1 x1 + xT2 M x2
2
2
en drivant V nous obtenons :
1
V = xT1 x 1 + xT2 M x 2 + xT2 M x2
2
1
T
T
1
= x1 x2 + x2 M (M (Cx2 G + )) + xT2 M x2
2
or
xT (M 2C)x2 = 0
2
do
1
V = xT1 x2 + xT2 M (G + ) + xT2 M x2
2
de plus
V
V
1
1 T
x1 x1 = V > kx1 k2
2
2
1 T
1
x2 Mx2 = V > min {M } kx2 k2
>
2
2
>
133
2V
2V m1
V < p
+p
(g1 + 1 )
(min {M })
(min {M })
< V + V
Si V < 1 (x1 , x
2 ) borns.
Si V 1 V V
Donc V < aV soit :
V (t) < beat
V est donc (x1 , x2 ) sont borns en temps ni.
D.2
D.2.1
n
par la pulsation wm , alors toutes ses drives sont bornes et telles que d dtx(t)
n wm X
En rappelons que pour lerobot SAP
nous avons utilis les hypothses suivantes :
c
kM (x1 )k 1 ;
M (x1 ) 01 ;
(x1 )1 1 ;
kM 1 (x1 )k 1 et M
.
M
c (x1 ) 01 wm ;
M (x1 ) 1 wm ;
1
1
c
M (x1 ) 1 wm ;
M (x1 ) 1 wm ;
kC
2 kx2 k ;
(x1 , x2 )k
b
C (x1, x2 ) 02 kx2 k ;
,
x
)
(x
C 1 2 2 wm kx2 k ;
.
C
b (x1, x2 ) 02 wm kx2 k ;
0
G(x
)
kG(x1 )k g0 ;
1 g0 ;
.
g 0 wm ;
b
)
G
(x
G (x1 ) g0 wm ;
1
0
b
0
kJk Jm ;
;
J Jm
134
b1
kJ 1 k Jm ;
J Jm ;
kEk em .
kBk bm ;
0
kEk e0m .
kBk bm ;
Nous obtenons dans 2.3.4 :
1
1
1
b3 M
M + C + BM x3 M 1 Ji
= M M +M C +B x
.
.
M 1 C + M 1 BC + M 1 E x2 M 1 BG + M 1 G
0 =
=
sup k ( )k
0 t
x3 k + 2 ke
x3 k + 3 kx2 k kb
x3 k + 4 kx2 k ke
x3 k + 5 kx2 k2
sup [1 kb
0 t
+ 6 kx2 k + 7 kik + 8 ]
kb
x3 k
kk M 1 M + M 1 C + B
x3 k + M 1 M + kCk + kBM k ke
+ M 1 J kik + M 1 C + M 1 BC + M 1 E kx2 k
+ M 1 BG + M 1 G
sachant que :
1 M
c M 1 M
1) M 1 M = M
.
1
1
1 c
M M M M + M M
1 01 wm + 1 1 wm
1
1 C M 1 C
2) M 1 C =
M
1 1
M C M C + kM 1 Ck
1 02 kx2 k + 1 2 kx2 k
2 kx2 k
=B
B
3) B
B + kBk
b0m + bm
3
4) kBM k kBk + kM k
bm + 1
4
1 J = M
1 J M 1 J
5)
M
1 1
M J M J + kM 1 Jk
135
0
1 Jm
+ 1 Jm
5
.
.
.
b M 1 C
1 C
6) M 1 C = M
1 .
1 .
1 b
M
C
+
M
M
C
C
1 02 wm kx2 k + 1 2 wm kx2 k
6 kx2 k
1
1 M 1 BC
7) M BC
= M B C
1
1
B
C
M
BC
M
+ kM 1 BCk
= M E
1 1
M E M E + kM 1 Ek
1 e0m + 1 em
8
1 BG = M
G
M 1 BG
1 B
9)
M
1
1
M BG M B G + kM 1 BGk
00 + 1 bm g0
1 Bg
9
.
.
.
b M 1 G
1 G
10) M 1 G =M
1 .
1 .
1 b
M G M G + M G
1 g00 wm + 1 g0 wm
10
1 , 2 , 3 , 4 , 5 , 6 , 7 et 8 sont en fonction de i avec i {1, . . . 10}
D.2.2
Nous proposons pour montrer lhypothse entre borne tat born (EBEB) de
regarder le systme en deux tages :
= M x3 + Cx2 + G
Ji = + B + Ex2
utilisant la fonction de Lyyapunov suivante :
1
1
V = T + xT2 M x2
2
2
en drivant V nous obtenons :
V
1
= T + xT2 M x2 + xT2 M x3
2
1
= T (Ji B Ex2 ) + xT2 M x2 + xT2 M (M 1 (Cx2 G + ))
2
136
or
xT2 (M 2C)x2 = 0
do
V = T (Ji B Ex2 ) + xT2 (G + )
de plus
V
V
1
1 T
= V > k k2
2
2
1 T
1
>
x2 Mx2 = V > min {M } kx2 k2
2
2
>
< V + V