07DMartin Control PDF

Control
Optimo
en
grupos de Lie
David Martn de Diego
8-11 de mayo de 2007, UPC (Version del 23-05-2007)
Indice general
1. El grupo de rotaciones de R
3
, SO(3) 1
1.1. Denicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. La aplicacion exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. El Logaritmo Matricial en SO(3) . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. La metrica de Killing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Identicacion con R
3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.6. Teorema de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.7. Apendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2. El cuerpo rgido 12
2.1. Coordenadas espaciales, materiales y en el cuerpo . . . . . . . . . . . . . . . 12
2.2. El Lagrangiano del cuerpo rgido . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3. Ecuaciones de Euler-Poincare . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3. Sistemas Hamiltonianos en grupos de Lie 20
3.1. Campos invariantes a la izquierda . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2. Trivializacion del brado cotangente a un grupo de Lie . . . . . . . . . . . . 21
3.3. Ecuaciones de Euler-Arnold . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4. Ecuaciones de Euler-Arnold para el cuerpo rgido . . . . . . . . . . . . . . . 25
4. Control en grupos de Lie 26
2
4.1. Motivacion: aparcamiento de un vehculo . . . . . . . . . . . . . . . . . . . . 26
4.2. Sistemas de control invariantes a izquierda . . . . . . . . . . . . . . . . . . . 26
4.3. Accesibilidad y Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.4. Propiedades del conjunto accesible . . . . . . . . . . . . . . . . . . . . . . . 27
4.5. Control optimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.6. Principio del maximo de Pontryaguin . . . . . . . . . . . . . . . . . . . . . . 30
5. Ejemplos de problemas de control optimo en grupos de Lie 32
5.1. Control optimo de la posicion de un cuerpo rgido . . . . . . . . . . . . . . 32
5.1.1. Ecuaciones de control del cuerpo rgido . . . . . . . . . . . . . . . . 33
5.1.2. Estudio de las soluciones singulares o abnormales . . . . . . . . . . . 34
5.1.3. Estudio de las soluciones regulares . . . . . . . . . . . . . . . . . . . 34
5.2. Problema subriemanniano en SO(3) . . . . . . . . . . . . . . . . . . . . . . 36
5.2.1. Estudio de las soluciones singulares o abnormales . . . . . . . . . . . 37
5.2.2. Estudio de las soluciones regulares . . . . . . . . . . . . . . . . . . . 38
5.3. Problema de control optimo de una bola rodando en un plano . . . . . . . . 39
5.3.1. Analisis de la controlabilidad . . . . . . . . . . . . . . . . . . . . . . 41
Leccion 1
El grupo de rotaciones de R
3
, SO(3)
En esta leccion introductoria expondremos algunos resultados tecnicos sobre el grupo
de rotaciones SO(3).
1.1. Denicion
Consideremos el espacio eucldeo R
3
con su producto escalar usual ( , ):
((x
1
, x
2
, x
3
), (y
1
, y
2
, y
3
)) = x
1
y
1
+x
2
y
2
+x
3
y
3
.
Tambien denotaremos el producto escalar como (x, y) = x y donde x = (x
1
, x
2
, x
3
) e
y = (y
1
, y
2
, y
3
).
El grupo ortogonal O(3) esta formado por el conjunto de las transformaciones lineales de
R
3
que preservan el producto escalar usual. Es decir, si denotamos por M(3) L(R
3
, R
3
)
al conjunto de las matrices reales:
M(3) = R = (R
ij
) [ R
ij
R, i, j = 1, 2, 3
entonces R O(3) si se verica que
(Rx, Ry) = (x, y).
Por tanto,
O(3) = R M(3) [ RR
T
= I,
donde R
T
denota la matriz transpuesta de R e I es la matriz identidad. Como det(RR
T
) =
(det R)
2
= 1 entonces det R = 1, lo que divide al grupo ortogonal O(3) en dos compo-
nentes conexas.
El grupo de rotaciones SO(3) es la componente conexa de O(3) que contiene la identidad
I; es decir,
SO(3) = R M(3) [ RR
T
= I , det R = 1.
1
2
SO(3) es un grupo de Lie compacto y conexo.
El algebra de Lie so(3) de SO(3) es
so(3) = T
I
SO(3) =
R(0) [ R(t) SO(3), R(0) = I = A M(3) [ A es antisimetrica.

(Idea de la demostracion: Tenemos que R(t)R(t)
T
= I y, entonces,
0 =

R(0)R(0)
T
+R(0)

R(0)
T
=

A(0) +

A(0)
T
Si denotamos por A =

R(0) obtenemos que A+A
T
= 0.)
Por tanto, un matriz A so(3) si y solo si es una matriz real 3 3 antisimetrica, o, lo
que es lo mismo,
(Ax, y) + (x, Ay) = 0
El algebra de Lie so(3) tiene un corchete de Lie [ , ] determinado por las relaciones:
[E
1
, E
2
] = E
1
E
2
E
2
E
1
= E
3
, [E
2
, E
3
] = E
1
, [E
3
, E
1
] = E
2
donde E
1
, E
2
, E
3
es la base estandar de so(3):
E
1
=
_
_
_
_
0 0 0
0 0 1
0 1 0
_
_
_
_
, E
2
=
_
_
_
_
0 0 1
0 0 0
1 0 0
_
_
_
_
, E
3
=
_
_
_
_
0 1 0
1 0 0
0 0 0
_
_
_
_
.
De una forma mas breve escribiremos
[E
i
, E
j
] =
3
k=1
ijk
E
k
donde
ijk
= 0 si alguno de los subndices coincide;
ijk
= 1 si (ijk) es una permutacion par
de (123); y
ijk
= 1 si (ijk) es una permutacion impar.
1.2. La aplicacion exponencial
Para cada A so(3) denimos:
exp A = e
A
= I +A+
A
2
2!
+. . . +
A
n
n!
+. . .
Veamos en primer lugar que exp A SO(3)
Prueba: Como A es antisimetrica:
(exp A)
T
=
n=0
1
n!
(A
T
)
n
=
n=0
1
n!
(A)
n
= exp(A) = (exp A)
1
.
3
Por tanto exp A O(3). Como exp 0 = I y exp es continua deducimos que exp A SO(3)
2.
Formula de Rodrigues. Para cualquier matriz de so(3),
A =
_
_
_
_
0 a
3
a
2
a
3
0 a
1
a
2
a
1
0
_
_
_
_
no nula, es decir (a
1
, a
2
, a
3
) ,= (0, 0, 0), si denotamos por r =
_
a
2
1
+a
2
2
+a
2
3
se tiene que el
polinomio caracterstico:
p() =
a
3
a
2
a
3
a
1
a
2
a
1

=
3
r
2
= 0
Entonces A
3
= r
2
A (Teorema de Cayley-Hamilton). Deducimos que:
A
2n+1
= (1)
n
r
2n
A
A
2n+2
= (1)
n
r
2n
A
2
, n 0
De la expresion de la exponencial de la matriz A se llega a que
exp A =
n=0
1
n!
A
n
= I +
n=0
1
(2n + 1)!
A
2n+1
+
n=0
1
(2n + 2)!
A
2n+2
I +
n=0
(1)
n
(2n + 1)!
r
2n
A+
n=0
(1)
n
(2n + 2)!
r
2n
A
2
= I +
senr
r
A+
1 cos r
r
A
2
recordando que
senx =
n=0
(1)
n
(2n + 1)!
x
2n+1
cos x =
n=0
(1)
n
(2n)!
x
2n
2
4
La siguiente propiedad de la exponencial sera util en lo sucesivo:
d
dt
exp (tA) =
d
dt
_
I +tA+
t
2
A
2
2!
+. . . +
t
n
A
n
n!
+. . .
_
= A+tA
2
+
t
2
A
3
2!
+. . . +
t
n
A
n+1
n!
+. . .
= exp (tA)A.
En particular,
d
dt
t=0
exp (tA) = A.
1.3. El Logaritmo Matricial en SO(3)
Sea A so(3) una matriz antisimetrica y denotemos por R su exponencial, es decir:
R = exp(A) =
n=0
1
n!
A
n
.
Por la formula de Rodrigues, tenemos:
R = I +
sinr
r
A+
1 cos r
r
2
A
2
,
donde r = ||i(A)|| = ||a||, con a = A. Descomponiendo R I en parte simetrica y
antisimetrica, obtenemos:
R = I +
1
2
(RR
T
) +
1
2
(R+R
T
2I).
Luego, por la unicidad de la descomposicion,
A =
r
2 sinr
(RR
T
) y
r2
2(1 cos r)
(R+R
T
2I).
Aplicando la traza a la segunda igualdad, deducimos que
2r
2
= traza (A
2
) =
r
2
2(1 cos r)
(2traza (R) 6),
y por tanto,
r = acos (
1
2
Tr(R)
1
2
),
siempre y cuando 0 < r < .
Theorem: La exponencial matricial es un difeomormismo analtico de A so(3) :
0 ||i(A)|| < en R SO(3) : traza (R) ,= 1. Su inversa log : SO(3) so(3)
viene dada por:
log(R) =
_
_
_
0 R = I
(R)
2 sin (R)
(RR
T
) R ,= I
5
donde (R) = acos (
1
2
traza (R)
1
2
).
Prueba: La demostracion de que log es efectivamente la inversa de la exponencial
matricial exp se deduce de la discusion anterior. Para la analiticidad, basta observar que
las aplicaciones que entran en juego en la decion del logartmo matricial son analticas.
Comentario: El resultado anterior, deja entrever que la exponencial matricial no es in-
yectiva, al igual que ocurre con la exponencial compleja. Baste observar que exp

(2k, 0, 0) =
I para todo k Z (formula de Rodrigues).
1.4. La metrica de Killing
En so(3) hay un producto escalar
k : so(3) so(3) R
llamado la metrica de Killing y denida por
k(A, B) =
1
2
traza AB =
1
2
traza AB
T
Comentario:
Se nalaremos a continuacion algunas de las propiedades de la traza que pueden resultar
de interes en el futuro. As, para A, B, C M(n) (matrices cuadradas de orden n) y R,
se verica que
(1) traza(A+B) = trazaA+ trazaB,
(2) traza(A) = traza(A),
(3) trazaA
T
= trazaA,
(4) traza(ABC) = traza(CAB) = traza(BCA),
(5) traza A = traza(B
1
AB), si B es invertible.2
La metrica de Killing verica las siguientes propiedades:
k es denida positiva
Prueba: Sea A =
3
i=1
x
i
E
i
, then
|A|
2
k
= k(A, A) =
1
2
traza
_
_
_
_
0 a
3
a
2
a
3
0 a
1
a
2
a
1
0
_
_
_
_
2
= a
2
1
+a
2
2
+a
2
3
0
y es 0 unicamente cuando A = 0. 2
6
Si R SO(3), sea Ad
R
A = RAR
1
so(3), entonces k es Ad
R
invariante, es decir,
para todo A, B so(3) se tiene que
k(Ad
R
A, Ad
R
B) = k(A, B)
Prueba:
k(Ad
R
A, Ad
R
B) =
1
2
traza(RABR
1
) =
1
2
traza(AB) = k(A, B) 2
Para cada R SO(3) se tiene que
Ad
R
1
= k
Ad
R
k
Prueba: La aplicacion k
: so(3) so(3)
esta denida por k
(A)(B) = k(A, B) y
k
= (k
)
1
.
Para todo A, B so(3), como k es Ad-invariante, tenemos que
k(Ad
R
A, B) = k(A, Ad
R
1B)
De otro modo
k
(Ad
R
A)(B) = k
(A)(Ad
R
1B) = (Ad
R
1
k
(A)(B)
para todo B so(3). Deducimos que
k
Ad
R
(A) = Ad
R
1
k
(A), A so(3)
de lo que se deduce la propiedad buscada. 2
Para todo A, B, C so(3) se verica que k([C, A], B) +k(A, [C, B]) = 0. (Recuerdese
que [A, B] = AB BA).
Prueba: Es una consecuencia directa de la cuarta propiedad de la traza. 2
Dados B, C so(3) y la curva R(t) = exp (tC) (recuerdese que R(0) = I y

R(0) = C)
calculemos en primer lugar
d
dt
t=0
_
Ad
exp (tC)
B
_
=
d
dt
t=0
_
exp (tC)B(exp (tC))
1
_
=
d
dt
t=0
_
R(t)BR(t)
1
_
=
d
dt
t=0
_
R(t)BR(t)
1
_
=

R(0)BR(0)
1
+R(0)B
d
dt
t=0
(R(t)
1
)
7
Pero diferenciando R(t)R(t)
1
= I deducimos que
d
dt
t=0
(R(t)
1
) = R(t)
1

R(t)R(t)
1
Por tanto,
d
dt
t=0
(R(t)
1
) = C.
As
ad
C
B =
d
dt
t=0
_
Ad
exp (tC)
B
_
= CB BC = [C, B]
Sera util la siguiente formula e
t ad
A
B = e
tA
Be
tA
Prueba:
Considera la aplicacion (t) : so(3) so(3) denida por (t)(B) = e
tA
Be
tA
con
A, B so(3) y A jado.
Entonces
(0) : so(3) so(3) es igual a
(0)(B) = [A, B] = ad
A
(B). As, e
tad
A
B =
e
tA
Be
tA
. 2.
1.5. Identicacion con R
3
Considera la aplicacion lineal i : so(3) R
3
denida por
i
_
_
_
_
0 a
3
a
2
a
3
0 a
1
a
2
a
1
0
_
_
_
_
= (a
1
, a
2
, a
3
) = a
Observese que i(E
1
) = (1, 0, 0), i(E
2
) = (0, 1, 0) e i(E
3
) = (0, 0, 1).
Veamos algunas propiedades de la aplicacion i:
i es una isometra de (so(3), k) en (R
3
, ( , )).
Prueba: Para A =
3
i=1
a
i
E
i
y B =
3
i=1
b
i
E
i
tenemos que
k(A, B) = a
1
b
1
+a
2
b
2
+a
3
b
3
= ((a
1
, a
2
, a
3
), (b
1
, b
2
, b
3
)) = a b . 2
i es un isomorsmo del algebra de Lie (so(3), [ , ]) con el algebra de Lie (R
3
, ), donde
denota el producto vectorial en R
3
.
i([A, B]) = i(
3
i,j,k=1
ijk
a
i
b
j
E
k
) =
3
i,j,k=1
ijk
a
i
b
j
= a b = i(A) i(B) = Ab
Frecuentemente denotaremos i
1
(a) = a.
8
Veamos la propiedad anterior usando esta notacion. Como a b = ab entonces para
todos a, b, c R
3
se verica que
[ a,

b]c = ( a
b)c (
b a)c
= a(b c)
b(a c)
= a (b c) b (a c)
= (a b) c =

a bc
i intercambia la accion adjunta de SO(3) en so(3) con la accion usual de SO(3) en
R
3
.
Prueba: Sea R SO(3) y dene la aplicacion
R
: R
3
R
3
por x i(Ad
R
i
1
(x)) =
i(Ad
R
x). Se verica para todo y R
3
que
R
(x) y = (R xR
1
)y = R x(R
1
y)
= R(x R
1
y)
= (Rx) y
aplicando que el producto vectorial es invariante por rotaciones (vease apendice al
nal del captulo).
1.6. Teorema de Euler
Lema. Cada R SO(3) tiene un autovalor igual a 1.
Prueba: Los autovalores de R viene dados por las races de la ecuacion de tercer grado
det(RI) = 0; luego al menos un autovalor es real. Sea

el autovalor real y v un vector
propio no nulo
Rv =

v.
Tenemos que, al estar R SO(3),
| Rv |
2
=| v |
2
,
Como
| v |
2
=| Rv |
2
=

2
| v |
2
.
As, si los tres autovalores son reales deben ser 1, 1, 1 o 1, 1, 1 pues det R = 1. En el caso
de que haya races complejas 1, , . 2.
Teorema de Euler. Cada elemento de SO(3) es una rotacion de angulo sobre el eje
v.
Prueba: Por el lema anterior existe un autovector v tal que Rv = v. El subespacio
generado por v tambien es R-invariante.
9
Considerese el plano perpendicular P a v, es decir,
P = y [(v, y) = 0
Como R SO(3), se verica para todo y P
0 = (y, v) = (Ry, Rv) = (Ry, v)
luego se deduce que RP = P. Sea e
1
, e
2
una base ortogonal en P. Relativa a v, e
1
, e
2
,
la matriz R se escribira
R =
_
_
_
_
1 0 0
0 a
1
a
2
0 a
3
a
4
_
_
_
_
.
Como la matriz
R =
_
_
a
1
a
2
a
3
a
4
_
_
esta en SO(2), se deduce
R =
_
_
_
_
1 0 0
0 cos sen
0 sen cos
_
_
_
_
.
1.7. Apendice
Teorema
Sea R SO(3). Entonces para cualesquiera vectores u, v en R
3
,
R(u v) = (Ru) (Rv).
Prueba. Fijemos una base ortonormal orientada a derecha en R
3
. Sean u
1
, u
2
, u
3
y
v
1
, v
2
, v
3
las componentes de u y v en dicha base. En esa misma base denota las compo-
nentes de R por R
ij
. Como R es una rotacion, entonces R
ij
R
kj
=
ik
donde
ik
es la delta
de Kronecker. La i-esima coordenada de u v sera igual a(u v)
i
=
3
i,j=1
ijk
u
j
v
k
. Para
la k-esima coordenada de (R u) (R v) se tiene que
((R u) (R v))
k
=
imk
R
ij
R
mn
u
j
v
n
=
iml
kl
R
ij
R
mn
u
j
v
n
=
iml
R
kr
R
lr
R
ij
R
mn
u
j
v
n
=
jnr
det RR
kr
u
j
v
n
.
10
entendiendo suma cuando aparecen ndices repetidos. En la ultima lnea hemos usado que
ijk
R
im
R
jn
R
kr
=
mnr
ijk
R
i1
R
j2
R
k3
=
mnr
det R. Como det R = 1, se sigue que
((R u) (R v))
k
= R
kr
jnr
u
j
v
n
= R
kr
(u v)
r
= (R u v)
k
.
2
11
Leccion 2
El cuerpo rgido
En esta leccion analizaremos en detalle un ejemplo de sistema mecanico cuyo espacio de
fases es el algebra de Lie so(3) del grupo de Lie SO(3). Este sistema describe el movimiento
de un cuerpo rgido sobre un punto jo sin la accion de ninguna fuerza externa; entendien-
do por cuerpo rgido un sistema de partculas donde las distancias entre ellas permanece
invariable. Al nal de la leccion estudiaremos la dinamica, deduciendo las ecuaciones del
movimiento aplicando un principio variacional adecuado.
2.1. Coordenadas espaciales, materiales y en el cuerpo
Considerese un cuerpo rgido moviendose libremente en el espacio eucldeo R
3
.
Una conguracion de referencia B consiste en jar un compacto, clausura de un abierto
de R
3
con frontera diferenciable.
Fijada una referencia ortonormal (E
1
, E
2
, E
3
), entonces un punto X B (punto mate-
rial ) tendra coordenadas X = (X
1
, X
2
, X
3
) llamadas coordenadas materiales.
Una conguracion en B es una aplicacion : B R
3
que es C
1
, preservando orientacion
e invertible en su imagen.
Fijada una referencia ortonormal (e
1
, e
2
, e
3
) en R
3
, entonces un punto x = (X) (punto
espacial ) tendra coordenadas x = (x
1
, x
2
, x
3
) llamadas coordenadas espaciales.
Un movimiento de B es una familia dependiente del tiempo de conguraciones. Usaremos
indistintamente las siguientes notaciones
x = (t, X) =
t
(X) = x(t, X) = x
t
(X)
Identicamos x(0, X) X.
Un cuerpo rgido es una coleccion de partculas de modo que la distancia entre cuales-
quiera dos partculas permanece ja independientemente del movimiento del cuerpo o las
fuerzas ejercidas en el cuerpo. Supongamos que el cuerpo rgido tiene el centro de masas
12
13
jo en el origen. Toda isometra de R
3
que deja jo el origen es un elemento del grupo
ortogonal. Por tanto,
x
t
(X) = R(t)X
En coordenadas, x
i
(t) = R
ij
(t)X
j
donde (R
ij
) es la matriz de R relativa a las bases
(E
1
, E
2
, E
3
) y (e
1
, e
2
, e
3
).
La dinamica se supone que es continua y R(0) es la identidad, entoces det R(t) = 1 y,
por lo tanto, R(t) SO(3).
De lo que conclumos que:
El espacio de conguracion del cuerpo rgido es SO(3), su espacio de fases de
velocidades es TSO(3) y el espacio de fases de momentos es T
SO(3).
Hay un tercer tipo de coordenadas que seran de interes, las coordenadas en el cuerpo o
coordenadas convectivas. Son coordenadas asociadas a una referencia que se mueve con el
cuerpo. Consideremos la base dependiente del tiempo:
i
= R(t)E
i
, i = 1, 2, 3
Las coordenadas en el cuerpo de un elemento de R
3
son sus coordenadas respecto a la base
1
,
2
,
3
.
2.2. El Lagrangiano del cuerpo rgido
La trayectoria de un punto material X B es x(t) = R(t)X con R(t) SO(3).
Denicion: Velocidad lagrangiana o velocidad material :
V (X, t) =
x
t
(X, t) =

R(t)X
Denicion: Velocidad euleriana o velocidad espacial :
v(x, t) = V (X, t) =

R(t)R(t)
1
x
Denicion: Velocidad convectiva o velocidad en el cuerpo:
1(X, t) =
X
t
(x, t) = R(t)
1

R(t)R(t)
1
x
= R(t)
1

R(t)X
= R(t)
1
V (X, t)
= R(t)
1
v(x, t)
Supongamos que la distribucion de masa en el cuerpo esta descrita por una densidad
0
d
3
X en la conguracion de referencia.
14
El Lagrangiano cinetico vendra dado por la siguiente expresion:
L =
1
2
_
B
0
(X)|V (X, t)|
2
d
3
X
=
1
2
_
B
0
(X)|
R(t)X|
2
d
3
X
Como R(t) SO(3), entonces diferenciando con respecto a t, R(t)
T
R(t) = I y R(t)R(t)
T
=
I, llegamos a que R(t)
1

R(t) y

R(t)R(t)
1
esta en so(3). Denen, en particular, la velocidad
angular espacial (t) R
3
:
(t) =

R(t)R(t)
1
y la velocidad angular convectiva (t) R
3
:
(t) = R(t)
1

R(t)
Observese que v(x, t) =

(t)x = (t) x y 1(X, t) =

(t)X = (t) X.
Como
= R
R
1
= Ad
R
entonces = R.
Veamos que el lagrangiano L : TSO(3) R es invariante a izquierda por SO(3). As,
si B SO(3) comprobemos que L(R,

R) = L(BR, B

R):
L(BR, B

R) =
1
2
_
B
0
(X)|B

R(t)X)|
2
d
3
X
=
1
2
_
B
0
(X)|
R(t)X)|
2
d
3
X
= L(R,

R)
pues B es ortogonal.
De este modo L(R,

R) = L(R
1
R, R
1

R) = L(I,

) = l()
Estudiemos distintas expresiones mas manejables del lagrangiano del cuerpo rgido (li-
bre):
L =
1
2
_
B
0
(X)|V (X, t)|
2
d
3
X
=
1
2
_
B
0
(X)|
RX|
2
d
3
X
=
1
2
_
B
0
(X)|R
1

RX|
2
d
3
X
=
1
2
_
B
0
(X)|
X|
2
d
3
X
=
1
2
_
B
0
(X)| X|
2
d
3
X
15
Introduce el producto escalar en R
3
:
a, b =
_
B
0
(X)(a X, b X)d
3
X
As,
l() =
1
2
,
Construye el isomorsmo lineal II : R
3
R
3
denido por
(IIa, b) =a, b , para todo a, b R
3
.
Por denicion, (IIa, b) = (a, IIb). Entonces II es simetrica y, ademas, denida positiva (bajo
adecuadas hipotesis iniciales). Como II es simetrica, puede ser diagonalizada. Si escogemos
un base ortonormal (E
1
, E
2
, E
3
) para la que II es diagonal entonces
l() =
1
2
, =
1
2
(II, ) =
1
2
(I
1
2
1
+I
2
2
2
+I
3
2
3
).
Si denotamos por = II entonces tendremos la funcion:
H() =
1
2
_
2
1
I
1
+

2
2
I
2
+

2
3
I
3
_
2.3. Ecuaciones de Euler-Poincare
En la siguiente seccion vamos a probar la relacion siguiente:
Teorema: La curva R(t) SO(3) verica las ecuaciones de Euler-Lagrange para
L(R,

R) si y solo si (t) = i(R(t)
1

R(t)) verica las ecuaciones de Euler:
II

= II .
Demostracion:
Sabemos por calculo de variaciones que L satisface las ecuaciones de Euler-Lagrange si y
solo si
_
L dt = 0
Consideremos l : so(3) R denido por l() =
1
2
(II, ).
Tomando una variacion R
(t) de la curva R(t) tendremos una variacion de la curva
(t) en el algebra de Lie so(3). Si llamamos

R(t) =
d
d
=0
R
(t)
(t) =
d
d
=0
(t)
16
Derivando con respecto a la relacion R
1

R =

obtenemos:
R
1
(R)R
1

R+R
1
(

R) =

.
Dene la matriz antisimetrica

:
= R
1
R
y el vector = i(
) de R
3
.
Observese que:
= R
1

RR
1
R+R
1
(

R)
Luego
R
1

R =

+R
1

R
por lo tanto,
es decir,
+ [
]
o, lo que es lo mismo,
=

+
En denitiva hemos probado que que las ecuaciones variacionales
_
t
1
t
0
L dt = 0 en TSO(3)
son equivalentes al principio variacional reducido
_
t
1
t
0
l dt = 0
en R
3
donde las variaciones son de la forma =

+ con (t
0
) = 0 y (t
1
) = 0.
En nuestro caso como l() =
1
2
(II, ) entonces
_
t
1
t
0
l dt =
_
t
1
t
0
(II, ) dt
=
_
t
1
t
0
(II,

+ ) dt
=
_
t
1
t
0
_
(II

, ) + (II, )
_
dt
=
_
t
1
t
0
_
(II

+II ),
_
dt
donde hemos integrando por partes y usado las condiciones (t
0
) = 0 y (t
1
) = 0. Al ser
arbitrario llegamos a que:
II

+II = 0
17
que son las ecuaciones de Euler para el cuerpo rgido:
I
1

1
= (I
2
I
3
)
2
3
I
2

2
= (I
3
I
1
)
1
3
I
3

3
= (I
1
I
2
)
1
2
El resultado anterior se puede generalizar para un grupo de matrices arbitrario distinto
de SO(3).
Teorema
Sea G un grupo de Lie de matrices y L : TG R un Lagrangiano G-invariante a
izquierda. Sea l : g R su restriccion a la identidad. Para una curva R(t) G, sea
(t) = T
R(t)
L
R(t)
1

R(t). Entonces son equivalentes:
(i) R(t) satisface las ecuaciones de Euler-Lagrange para L;
(ii) R(t) extremiza el funcional
R()
_
L(R(t),

R(t)) dt
para variaciones con puntos inicial y nal jados.
(iii) Se verican las ecuaciones de Euler-Poincare:
d
dt
l
= ad
.
(iv) (t) extremiza
()
_
l((t)) dt
para variaciones de la forma
= + [, ]
Prueba:
Suponemos conocida por el alumno la equivalencia de (i) e (ii).
Veamos que (ii) e (iv) son equivalentes. Para ello vamos a calcular las variaciones inni-
tesimales donde = R
1

R. Si llamamos R = dR
/d en = 0 para variaciones R
de
R. Procediendo del mismo modo que en el teorema anterior llegamos a que si = R
1
R
entonces
= [, ]
con lo que se deduce facilmente la equivalencia.
18
Para nalizar comprobemos la equivalencia entre (iii) y (iv):
_
l() dt =
_
l
dt
=
_
l
( +ad
) dt
=
_ _
d
dt
_
l
_
+ad
_
dt
2
Si escogemos un base E
1
, . . . E
n
de g tal que
[E
i
, E
j
] = C
k
ij
E
k
entonces todo elemento =
i
E
i
. En estas coordenadas, las ecuaciones de Euler-Poincare se
escriben del siguiente modo:
d
dt
_
l
i
_
= C
k
ji
j
l
k
En la siguiente leccion veremos la formulacion hamiltoniana de las ecuaciones de Euler-
Poincare. Observese que si llamamos
=
l
,
y suponemos que = () utilizando la expresion anterior. As, se dene
h() = , ) l() .
Entonces
h
= +,

)
l
) =
Luego podemos escribir las ecuaciones del movimiento como:
= ad
h/
que se conocen como ecuaciones de Lie-Poisson.

19
Leccion 3
Sistemas Hamiltonianos en grupos
de Lie
La siguiente leccion practicamente consistira en un ejercicio de geometra simplectica.
Las ecuaciones obtenidas constituyen uno de los pilares de la mecanica: las ecuaciones
de Euler-Arnold y de Lie-Poisson. Ademas los resultados obtenidos seran cruciales para
analizar las soluciones de los problemas de control optimo en grupos de Lie.
3.1. Campos invariantes a la izquierda
Sea G un grupo de Lie y g su algebra de Lie.
Recordemos que dado A g la ecuacion diferencial
R = RA, R(0) = R
0
, R G
tiene una unica solucion R(t) = R
0
exp (tA) (ver propiedades de la exponencial).
Analicemos a continuacion cual es el espacio tangente a G en R.
Proposicion:
Dado R G se verica que:
T
R
G = RA[ A g = Rg = T
I
l
R
(g).
Prueba: El espacio tangente a en R a G es:
T
R
G =
R(0) [ R(t) G, R(0) = R

20
21
Podemos pasar de esta curva comenzando en R a una curva comenzando en la identidad I:
Y (t) = R
1
(0)R(t)
Entonces
Y (0) = R
1
(0)

R(0) g.
Si denotamos A =

Y (0) entonces
R(0) = RA
As, deducimos que T
R
G Rg. Como ambos tienen la misma dimension entonces T
R
G =
Rg. 2.
3.2. Trivializaci on del brado cotangente a un grupo de Lie
Denicion:
Sea E un espacio vectorial con dimE = dimQ. Una trivializacion del brado cotangente
T
Q de una variedad diferenciable M es un difeomorsmo

: QE T
Q
tal que
1. (q, e) T
q
Q, con (q, e) QE,
2. (q, .) : E T
q
Q es un isomorsmo de espacios vectoriales para cada q Q.
Para todo punto (q, e) tenemos las siguientes identicaciones:
T
(e,q)
(E Q)

= T
e
E T
q
Q
= E T
q
Q
T
(e,q)
(E Q)

= T
e
E T
q
Q
= E
q
Q
Supongamos ahora que T
Q es el brado cotangente T
G de un grupo de Lie G y sea

g
el dual de su algebra de Lie g. Denotaremos : T
G G,
R
R a la proyeccion
canonica. Es claro que T
G admite una trivializacion (usando, por ejemplo, la translacion

a izquierda):
L : Gg
G, (R, )
R
= T
R
L
R
1
es decir,
R
, RA) = , A)
con A g. Asimismo, podemos identicar Gg con TG con la correspondencia (R, A)
RA.
Veamos como se reescribe la 1-forma de Liouville
1
T
G como una 1-forma

=
L

1
(Gg
). De un modo similar tenemos la 2-forma = d
= L
, donde es la
forma simplectica canonica de T
G.
22
Para calcular estas formas, veamos quien es primero la aplicacion tangente de L.
Dados A g y g
consideremos la aplicacion
(A,)
t
: Gg
Gg
(R, ) (R exp tA, +t)
(A,)
t
es el ujo del campo de vectores X
(A,)
en Gg
denido por
X
(A,)
(R, ) = (RA, )
Por tanto, la aplicacion tangente de L es:
T
(R,)
( L)(RA, ) =
d
dt
t=0
L
_
(A,)
t
(R, )
_
=
d
dt
t=0
R exp tA = RA
De este modo, ya podemos calcular

:
(R,)
, (RA, )) =
L(R,)
, T
(R,)
L(RA, ))
=
R
, T
(R,)
( L)(RA, ))
=
R
, RA) = , A) = (A).
Para calcular la 2-forma utilizaremos la formula
d
(X
(A,)
, X
(B,)
) =
X
(A,)
d
_
X
(B,)
_
+X
(B,)
d
_
X
(A,)
_
+ [X
(A,)
, X
(B,)
]
Calculemos cada uno de los terminos por separado. En primer lugar,

X
(A,)
d
_
X
(B,)
_
(R, ) = L
X
(A,)
_
X
(B,)
_
(R, )
=
d
dt
t=0
(
(A,)
t
)
_
X
(B,)
_
(R, )
=
d
dt
t=0
(R exp tA, +t), X

(B,)
(R exp tA, +t))
=
d
dt
t=0
(R exp tA, +t), (R exp (tA)B, ))

=
d
dt
t=0
( +t)(B) = (B)
El segundo termino se calcula de un modo similar.
Para calcular el tercer termino observese que
[X
(A,)
, X
(B,)
](R, ) =
d
dt
t=0
_
(B,)
t

(A,)
t

(B,)
t

(A,)
t
_
(R, )
=
d
dt
t=0
(R exp
tA exp
tB exp
tA exp
tB, )
= (R[A, B], 0)
23
As,
([X
(A,)
, X
(B,)
])(R, ) =

(R, )(R[A, B], 0) = ([A, B])
En denitiva,
(R, )((RA, ), (RB, )) = (B) +(A) +([A, B])
3.3. Ecuaciones de Euler-Arnold
En esta seccion vamos a encontrar las ecuaciones de Hamilton en el brado cotangente
de un grupo de Lie, que ha sido trivializado usando translaciones a izquierda.
Supongamos que H : T
G R es una funcion diferenciable. El campo de vectores

hamiltoniano X
H
en la variedad simplectica (T
G, ) esta denido por las ecuaciones

i
X
H
= dH
Consideremos el hamiltoniano H : G g
R denido por H(R, ) = H(L(R, )) =

H(
R
). De este modo podemos encontrar el campo de vectores
i
X
H
= dH
Vamos a encontrar las ecuaciones de Hamilton; es decir, las ecuaciones de las curvas inte-
grales de del campo de vectores X
H
en Gg
. En este contexto, a estas ecuaciones se las

conoce como ecuaciones de Euler-Arnold.
Para cada funcion f : G g
R denotaremos por
f
R
y
f
las derivadas parciales

de f; es decir
f
R
es la diferencial de la restriccion de f a valores = constante,
f
es la diferencial de la restriccion de f a valores R = constante.

Entonces
f
R
(R, ) T
R
G y
f
(R, ) (g
= g.
As, deducimos que
dH(R, )(RB, ) =
H
R
(R, )RB +
H
(R, )
=
H
R
(R, )T
I
L
R
B +(
H
(R, ))
Como X
H
(R, ) T
R
G g
entonces, existiran X(R, ) g y (R, ) g
de modo
que
X
H
(R, ) = (RX(R, ), (R, )) = (T
I
L
R
(X(R, )), (R, ))
24
Pero por denicion de X
H
:
dH(R, )(RB, ) = (R, )
_
(RX(R, ), (R, )), (RB, )
_
para todo B g y g
. De otro modo,
dH(R, )(RB, ) = (R, )(B) +(X(R, )) +([X(R, ), B])
Si hacemos B = 0 llegamos a que
(
H
(R, )) = (X(R, ))
para todo g
. Por tanto,
X(R, ) =
H
(R, )
Si hacemos = 0, entonces,
H
R
(R, )RB = (R, )B +([X(R, ), B])
o lo que es lo mismo,
H
R
(R, )T
I
L
R
B = (R, )B + (ad
X
)(B)
para todo B g. Por tanto,
(R, ) = (T
I
L
R
)
H
R
(R, ) +ad
H/
Luego las ecuaciones de Euler-Arnold son:
R = T
I
L
R
H
(R, ) = R
H
= (T
I
L
R
)
H
R
(R, ) +ad
H/
En el caso en que el hamiltoniano H es invariante a izquierda entonces

H
R
= 0 y las
ecuaciones de Euler-Arnold se escriben:
R = T
I
L
R
H
()
= ad
H/
25
3.4. Ecuaciones de Euler-Arnold para el cuerpo rgido
Podemos identicar so(3)
con R
3
por medio del producto escalar usual de R
3
, as, si
so(3)
, lo identicamos con el elemento R

3
de modo que
( a) = ( , a), para todo a R
3
Consideremos como hamiltoniano H : SO(3) so(3)
R denido por
H(R, ) =
1
2
_
((E
1
))
2
I
1
+
((E
2
))
2
I
2
+
((E
3
))
2
I
3
_
que expresado como un hamiltoniano H : SO(3) R
3
R si = (
1
,
2
,
3
) entonces
H(R, ) =
1
2
_
2
1
I
1
+

2
2
I
2
+

2
3
I
3
_
el clasico Hamiltoniano del cuerpo rgido.
Como
H
so(3) entonces para todo A so(3) se tiene que

ad
, A) = , adH
A)
= , [
H
, A])
= (

i(
H
) i(A))
= ( , i(
H
) i(A))
= ( i(
H
), i(A))
Luego como i(
H
) = (
1
I
1
,

2
I
2
,

3
I
3
) las ecuaciones de Euler-Arnold (en este caso, la ultima
se llama de Lie-Poisson) son:
R = R
_
_
_
_
0
3
I
3
2
I
2
3
I
3
0

1
I
1
2
I
2
1
I
1
0
_
_
_
_
(

1
,

2
,

3
) = (
1
,
2
,
3
) (
1
I
1
,

2
I
2
,

3
I
3
).
La ultima ecuacion se puede escribir de forma expandida como:
1
=
I
2
I
3
I
2
I
3
2
=
I
3
I
1
I
1
I
3
3
=
I
1
I
2
I
1
I
2
2
.
Leccion 4
Control en grupos de Lie
Los resultados que vamos a exponer a continuacion son validos para cualquier subgrupo
de Lie de GL(n, R) (grupo de los isomorsmos de R
n
).
4.1. Motivaci on: aparcamiento de un vehculo
4.2. Sistemas de control invariantes a izquierda
Sea G un grupo de Lie y g su algebra de Lie.
Denicion: Un sistema de control invariante a izquierda en un grupo de Lie G es un
subconjunto del algebra de Lie g:
g.
Los ejemplos mas tpicos seran los casos de sistemas de control anes
= A+
m
i=1
u
i
B
i
[ u = (u
1
, . . . , u
m
) U R
m
,
donde A, B
1
, . . . , B
m
son elementos de g. Clasicamente, el sistema de control se escribira:
R = RA+
m
i=1
u
i
RB
i
, con R G
26
27
4.3. Accesibilidad y Controlabilidad
Denicion: Una trayectoria de un sistema de control invariante a izquierda en G
es una curva continua R(t) en G denida en un intervalo [t
0
, T] R tal que existe una
particion
t
0
< t
1
< . . . < t
N
= T
y elementos,
A
1
, . . . , A
N

tal que la restriccion de R(t) a cada intervalo abierto (t
i1
, t
i
) es diferenciable y
R(t) = R(t)A
i
, i = 1, . . . , N.
Denicion: Para cada T 0 y cada R G, el conjunto accesible a tiempo T desde R
del sistema de control invariante a izquierda g es el conjunto
/
(R, T) = R(T) [ R(t) trayectoria de , R(0) = R,

(conjuntos de elementos de G accesibles desde R a tiempo T).
Denicion: El conjunto accesible a tiempo menor o igual que T se dene como
/
(R, T) =
_
0tT
/
(R, t).
Denicion: El conjunto accesible se dene como
/
(R) =
_
T0
/
(R, T).
Denicion: El sistema g es controlable si para cada par de puntos R
0
y R
1
en G:
R
1
/
(R
0
)
4.4. Propiedades del conjunto accesible
En primer lugar, observemos que para todo A g y R
0
G el problema de Cauchy
R = RA, R(t
0
) = R
0
tiene como solucion R(t) = R
0
exp ((t t
0
)A).
Lema: Sea R(t), t [t
0
, T] una trayectoria de un sistema de control invariante a iz-
quierda g con R(0) = R
0
. Entonces existe N N y
1
, . . . ,
N
> 0, A
1
, . . . , A
N
g
28
tal que
R(T) = R
0
exp (
1
A
1
) exp (
N
A
N
)
y T t
0
=
1
+. . . +
N
.
Prueba: Por la denicion de trayectoria existe una particion
t
0
< t
1
< . . . < t
N
= T
y elementos,
A
1
, . . . , A
N
,
tal que la restriccion de R(t) a cada intervalo abierto (t
i1
, t
i
) es diferenciable y
R(t) = R(t)A
i
, i = 1, . . . , N.
En el primer intervalo tenemos que:
t (t
0
, t
1
) ,

R = RA
1
, R(t
0
) = R
0
.
Por tanto,
R(t) = R
0
exp ((t t
0
)A
1
), R(t
1
) = R
0
exp ((t
1
t
0
)A
1
),
En el siguiente intervalo (t
1
, t
2
):
R = RA
2
, R(t
1
) = R
0
exp ((t
1
t
0
)A
1
)
luego para
R(t) = R
0
exp ((t
1
t
0
)A
1
)exp ((t t
1
)A
2
),
y
R(t
2
) = R
0
exp ((t
1
t
0
)A
1
) exp ((t
2
t
1
)A
2
),
Llamando
1
= t
1
t
0
y
2
= t
2
t
0
se tiene que
R(t
2
) = R
0
exp (
1
A
1
) exp (
2
A
2
),
Procediendo de este modo
R(t
N
) = R(T) = R
0
exp (
1
A
1
) exp (
N
A
N
)
con
1
= t
i
t
i1
, i = 1, . . . , N y
N
+. . . +
1
= T. 2
De este lema deducimos facilmente que
/
(R) = R exp (t
1
A
1
) exp (t
N
A
N
) [ A
i
, t
i
> 0, N 0
/
(R) = R/
(I)
/
(R) es arco-conexo.
29
As, el sistema de control es controlable si y solo si /
(I) = G.
Denicion: La orbita de en un punto R G es el conjunto:
O
(R) = Rexp (t
1
A
1
) exp (t
N
A
N
) [ A
i
, t
i
R, N 0
Obviamente,
O
(R) = RO
(I).
Denotemos por Lie el algebra de Lie generada por .
Teorema de Hermann-Nagano: Se verica que O
(I) G es una subvariedad dife-

renciable de G con espacio tangente T
I
O
(I) = Lie .
(Vease demostracion en Jurdjevic). 2
Por tanto, es facil deducir que O
(I) es un subgrupo de Lie de G con algebra de Lie

asociada Lie .
Teorema: Un sistema de control g es controlable si y solamente si
1. G es conexo;
2. Lie = g;
3. /
(I) es un subgrupo de G
Prueba:
La necesidad es trivial. Probaremos la suciencia.
Si /
(I) es un subgrupo de G, entonces para todo R /
(I) tenemos que R

1
/
(I)
Como (exp (t
i
A
i
))
1
= exp (t
i
A
i
) se deduce que /
(I) = O
(I). Por tanto, O
(I) es
un subgrupo de Lie conexo con algebra de Lie g. Por tanto /
(I) = G. 2.
Veanse mas caracterizaciones en:
Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste,
Italy, January-February 2006.
http://digitallibrary.sissa.it/retrieve/1131/15-2006M.pdf
4.5. Control optimo
Todos los vehculos tripulados o no requieren un control si queremos que sigan un com-
portamiento adecuado o una planicacion prejada. En el caso de un vehculo con ruedas
los controles nos permiten frenarlo, acelerarlo, llevarlo por la direccion requerida... Estos
controles se activan manualmente, por radio control o automaticamente, o los dise na nues-
tro sistema (va feedback). Pueden actuar llevando nuestro sistema de un punto a otro o
evitando desviaciones de la trayectoria que queremos seguir. En muchos casos el sistema es
inestable y necesitamos introducir controles para evitar grandes perturbaciones del sistema.
30
La aplicacion no se reduce a problemas de mecanica si no que tienen un ambito mayor
de aplicacion: teoras del crecimiento economico, ecologa, planicacion comercial, medicina,
robotica...
En este captulo nos centraremos mas en detalle en utilizar aquel control que sea mas
benecioso para nosotros: nos permita llegar en mnimo tiempo, nos resulte mas barato,
consuma menos combustible, mas saludable... En este caso elegiremos entre los controles
admisibles (si estos existen) aquel que minimice o maximice un cierto funcional. En denitiva
debemos utilizar el control que consideramos optimo.
Leibniz utilizo la palabra optimo basandode en la palabra latina optimusque signi-
ca lo mejor. La palabra latina deriva del nombre de la diosa romana Ops, diosa de la
abundancia agrcola (de su nombre se deriva la palabra opulencia, operaciones, operador...).
En tiempos imperiales, el templo de esta diosa contena el tesoro romano y, ademas, a los
ricos aristocratas de Roma se les conoca como optimates. El 25 de agosto se celebraba la
Opiconsivia, cuando el grano era recogido y almacenado y el 17 de diciembre el festival de
Opalia, cuando los graneros se abran.
La teora del control optimo surgo ante la dicultad que se encontro para aplicar el
calculo de variaciones tradicional cuando los controles estan restringidos a tomar valores en
un cierto conjunto (incluso cerrado) y se les permite ser funciones continuas a trozos. La
culminacion de la nueva teora la lograron Pontryaguin y sus colaboradores a nales de los
a nos cincuenta del siglo XX.
4.6. Principio del maximo de Pontryaguin
Consideremos el problema de control
x(t) = f(x(t), u(t)), x M, u U R
m
x(t
0
) = x
0
, x(t
1
) = x
1
minimizar
_
t
1
t
0
L(x(t), u(t)) dt
en una variedad diferenciable M, f y L funciones diferenciables y u(t) funcones medibles
acotadas en un conjunto arbitrario U R
m
.
Se dene el Hamiltoniano de Pontryaguin, H : T
M U R denido por
H((x, p); u) = L(x, u) +p, f(x, u))
donde x M, p T
x
M, u U y donde es cero o un n umero real no nulo menor que cero
(por ejemplo, = 1).
El principio del maximo de Pontryaguin asegura que si u
: [t
0
, t
1
] U es un control
optimo, entonces la correspondiente trayectoria x
: [t
0
, t
1
] M puede ser levantada a
una curva
: [t
0
, t
1
] T
M,
(t) = (x(t), p(t)) tal que (, p(t)) ,= (0, 0) y vericando las

siguientes condiciones:
31
(A)

(t) = X
H
(
(t), u
(t));
(B) H(
(t), u
(t)) H(
(t), u), para todo u U y casi todo t [t

0
, t
1
];
(C) La funcion t H(
(t), u
(t)) es constante (siendo cero si el tiempo t

1
es libre).
Las funciones t x
(t) que satisfacen el principio de Pontryaguin con ,= 0 se llaman

soluciones regulares y soluciones singulares o abnormales si = 0.
Este curso sera enfocado en utilizar el principio del maximo de Pontryaguin en sistema
de control invariantes a izquierda, dejando de lado su demostracion. Para ello vease las
notas:
Andrew Lewis, Course on Pontryagins Maximum Principle, course oered to
graduate students at Universitat Polit`ecnica de Catalunya
http://penelope.mast.queensu.ca/MP-course/
Leccion 5
Ejemplos de problemas de control
optimo en grupos de Lie
5.1. Control optimo de la posicion de un cuerpo rgido
En este captulo desarrollaremos un ejemplo de control optimo en SO(3) basandonos en
el artculo:
Spindler, K. Optimal attitude control of a rigid body. Appl. Math. Optim. 34
(1996), no. 1, 7990
Motivados por el control de satelites, vamos a estudiar el problema de la maniobra de
un cuerpo rgido de una posicion inicial a una posicion nal deseada en un tiempo jado y
minimizando una funcion de coste.
Trabajando directamente en SO(3) evitaremos los problemas de trabajar con angulos
de Euler (singularidades y ambig uedades en la descripcion).
32
33
5.1.1. Ecuaciones de control del cuerpo rgido
Recordemos las ecuaciones del cuerpo rgido:
R(t) = R(t)
(t)
= R(t)
_
_
_
_
0
3
(t)
2
(t)
3
(t) 0
1
(t)
2
(t)
1
(t) 0
_
_
_
_
= R(t)(
1
(t)E
1
+
2
(t)E
2
+
3
(t)E
3
),
donde las velocidades angulares (
1
(t),
2
(t),
3
(t)) verica las ecuaciones de Euler:
I
1

1
(t) = (I
2
I
3
)
2
(t)
3
(t) +T
1
(t)
I
2

2
(t) = (I
3
I
1
)
3
(t)
1
(t) +T
2
(t) (5.1.1)
I
3

3
(t) = (I
1
I
2
)
1
(t)
2
(t) +T
3
(t)
Recordemos que I
1
, I
2
, I
3
son momentos de inercia y T
1
, T
2
y T
3
pares que ejercemos en el
cuerpo y que nos permiten controlarlo.
Suponemos que debemos pasar de la matriz R(t
0
) para un tiempo t
0
a una matriz R(t
1
)
a un tiempo t
1
eligiendo una sucesion de pares adecuada. La funcion a minimizar es:
_
t
1
t
0
(c
1
1
(t)
p
1
+c
2
2
(t)
p
2
+c
3
3
(t)
p
3
) dt
con c
1
, c
2
, c
3
> 0 and p
1
, p
2
, p
3
N.
En el problema que vamos a plantear, vamos a elegir las velocidades angulares (
1
,
2
,
3
)
como controles, en vez de los pares (T
1
, T
2
, T
3
). Utilizando las ecuaciones (5.1.1) deduciremos
los pares que debemos emplear a partir de las velocidades angulares.
As pues, el problema de control optimo que tenemos es:
minimizar
_
t
1
t
0
(c
1
1
(t)
p
1
+c
2
2
(t)
p
2
+c
3
3
(t)
p
3
) dt
con ecuaciones de control:
R(t) = R(t)(
1
(t)E
1
+
2
(t)E
2
+
3
(t)E
3
), (
1
(t),
2
(t),
3
(t)) R
3
y condiciones R(t
0
) = R
0
y R(t
1
) = R
1
jadas.
El Hamiltoniano de Pontryagin sera una funcion:
H : T
SO(3) R
3
R
34
denida por:
H(R,
R
, ) =
R
, R
) +

2
(c
1
1
(t)
p
1
+c
2
2
(t)
p
2
+c
3
3
(t)
p
3
)
= ,

) +

2
(c
1
1
(t)
p
1
+c
2
2
(t)
p
2
+c
3
3
(t)
p
3
)
=
o
1
H
1
+
2
H
2
+
3
H
3
2
((c
1
p
1
1
+c
2
p
2
2
+c
3
p
3
3
)
donde H
i
: T
SO(3) R denida por H

i
(R, ) = (E
i
), i = 1, 2, 3.
Supongamos que el control optimo este dado por funciones t (
1
(t),
2
(t),
3
(t))
entonces la trayectoria t
(t) T
SO(3) vericara aplicando el principio del maximo

de Pontryagin que
(t) =
1
(t)X
H
1
(
(t)) +
2
(t)X
H
2
(
(t)) +
3
(t)X
H
3
(
(t)) (5.1.2)
5.1.2. Estudio de las soluciones singulares o abnormales
Supongamos que el parametro = 0 y que existe una solucion del problema de control
optimo. Entonces como
H(
(t),
(t)) H(
(t), ), para todo R

3
es decir,
1
(t)H
1
(
(t)) +
2
(t)H
2
(
(t)) +
3
(t)H
3
(
(t))

1
H
1
(
(t)) +
2
H
2
(
(t)) +
3
H
3
(
(t))
para todo = (
1
,
2
,
3
) R
3
.
De aqu facilmente se deduce que H
i
(
(t)) = 0. Si denotamos por (R
(t),
(t))
SO(3) so(3)
la trayectoria tal que L(R
(t),
(t)) =
(t) entonces
0 = H
i
(
(t)) =
(t)(E
i
), i = 1, 2, 3
con lo cual
(t) = 0 y llegamos contradiccion.

Por tanto, no hay soluciones singulares.
5.1.3. Estudio de las soluciones regulares
Tomamos el valor = 1.
Partimos de las ecuaciones
H
i
(
(t)) = 0, i = 1, 2, 3, es decir
H
i
(
(t)) = c
i
p
i
i
(t)
q
i
35
donde q
i
= p
i
1. Entonces eliminando los controles de la ecuacion (5.1.2) obtenemos:
(t) =
_
H
1
(
(t))
c
1
p
1
_
1/q
1
X
H
1
(
(t))+
_
H
2
(
(t))
c
2
p
2
_
1/q
2
X
H
2
(
(t))+
_
H
3
(
(t))
c
3
p
3
_
1/q
3
X
H
3
(
(t))
que son las ecuaciones de Hamilton para el hamiltoniano
H
0
=
3
j=1
q
j
p
j
(c
j
p
j
)
1/q
j
H
p
j
/q
j
j
Obviamente este lagrangiano es invariante a izquierda.
Trivializando llegamos a que el hamiltoniano en SO(3) R
3
se escribe como:
H
0
(R, ) =
3
j=1
q
j
p
j
(c
j
p
j
)
1/q
j
p
j
/q
j
j
Como
H
j
=
1
(c
j
p
j
)
1/q
j
1/q
j
j
Las ecuaciones de Lie-Poisson son (vease Leccion 3):
(

1
,

2
,

3
) = (
1
,
2
,
3
)
_
1
(c
1
p
1
)
1/q
1
1/q
1
1
,
1
(c
2
p
2
)
1/q
2
1/q
2
2
,
1
(c
3
p
3
)
1/q
3
1/q
3
3
_
Operando y reescribiendo las ecuaciones en terminos de los controles llegamos a que:
c
1
p
1
q
1
q
1
1
1
1
= c
2
p
2
q
2
2
c
3
p
3
q
3
3
c
2
p
2
q
2
q
2
1
2
2
= c
3
p
3
q
3
3
c
1
p
1
q
1
1
c
3
p
3
q
3
q
3
1
3
3
= c
1
p
1
q
1
1
c
2
p
2
q
2
2
Observese que si p
1
= p
2
= p
3
= 2 entonces el funcional a minimizar es:
minimizar
_
t
1
t
0
(c
1
1
(t)
2
+c
2
2
(t)
2
+c
3
3
(t)
2
) dt
en este caso las ecuaciones que describen los controles son precisamente las ecuaciones del
cuerpo rgido:
c
1

1
= c
2
2
c
3
3
c
2

2
= c
3
3
c
1
1
c
3

3
= c
1
1
c
2
2
En el caso c
1
= c
2
= c
3
, se tiene que las unicas soluciones son
i
(t) =
i
= constante.
As, debemos encontrar una curva R(t) vericando:
R(t) = R(t)(
1
E
1
+
2
E
2
+
3
E
3
), R(t
0
), R(t
1
) jados
36
o, lo que es lo mismo:
R(t) = R(t
0
)e
(tt
0
)
con
R(t
1
) = R(t
0
)e
(t
1
t
0
)
As,
R(t
0
)
1
R(t
1
) = e
(t
1
t
0
)
Llamando r =
_
2
1
+
2
2
+
2
3
R(t
1
)R(t
0
)
1
= I +
sen(t
1
t
0
)r
(t
1
t
0
)r
+
1 cos(t
1
t
0
)r
(t
1
t
0
)
2
r
2
2
=
_
_
_
_
1 0 0
0 1 0
0 0 1
_
_
_
_
+
sen(t
1
t
0
)r
(t
1
t
0
)r
_
_
_
_
0
3

2
3
0
1
2

1
0
_
_
_
_
1 cos(t
1
t
0
)r
(t
1
t
0
)
2
r
2
_
_
_
_
2
2
+
2
3

1
2

1
2

2
1
+
2
3

2
3

2
3

2
1
+
2
2
_
_
_
_
que puede ser resuelta numericamente.
5.2. Problema subriemanniano en SO(3)
Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste,
Italy, January-February 2006.
Vamos a calcular el camino mas corto entre dos puntos jos R
0
y R
1
en SO(3), pero
suponiendo que las velocidades

R(t) no son libres pues suponemos que

R debe ser ser
tangente a una distribucion invariante por la izquierda (de codimension 1):
R
T
R
SO(3),
para todo R SO(3).
Como es invariante a izquierda, elige un elemento B so(3) con |B|
k
= 1 tal que
I
= | = B
= U so(3) [ k(U, B) = 0
Entonces
R
= R
I
o de otro modo:
R = RU, U
I
.
37
Planteamos el siguiente problema de control optimo:
R = RU, R SO(3) U |,
R(0) = R
0
, R(1) = R
1
jos
minimizar
_
1
0
|U(t)|
2
k
dt
El sistema de control | = B
= LA
1
, A
2
, donde A
1
y A
2
son elementos de so(3)
generando U. Claramente,
[A
1
, A
2
] / generadoA
1
, A
2
Por tanto el sistema es controlable.

El hamiltoniano de Pontryagin es:
H : T
SO(3) | R
(
R
, U)
R
, Ru) +

2
|U|
2
k
o, trivializando,
H : SO(3) so(3)
| R
(R, , U) , U) +

2
|U|
2
k
o, si se preere, identicando so(3)
por medio del producto escalar (vease Seccion 3.4))

H : SO(3) R
3

| R
(R, , u) ( , u) +

2
(u, u)
donde u R
3
con i(U) = u. Asmismo, si b = i(B) entonces
| = .
5.2.1. Estudio de las soluciones singulares o abnormales
Supongamos que = 0.
Tenemos que buscar maximo
ub
( , u).
Descomponiendo =
con
|b y
b con la metrica eucldea estandar.

El probelma es equivalente a buscar maximo
u
k(
, u) lo que equivale a que
= 0.
Se deduce que (t) = (t)b con (t) ,= 0.
De las ecuaciones de Lie-Poisson para el cuerpo rgido (vease Leccion 3) se llega a que:
=
H

= u
38
Por tanto, sustituyendo el valor de , se llega a que
(t)b = (t)b u
con lo que se tiene que (b u)|b. Pero al ser u b se deduce que tambien (b u, b) = 0,
es decir que b u = 0. As se llega a que b|u, pero de las hipotesis iniciales tenamos que
b u. As, u = 0 o expresado de otro modo u = 0.
Sustituyendo en las ecuaciones de control deducimos que

R = R u = 0; es decir, R(t) =
constante, que son las unicas soluciones abnormales o singulares.
5.2.2. Estudio de las soluciones regulares
Tomamos = 1
De la condicion:
( , u) +

2
(u, u) maximo
ub
se llega a que el control optimo debe vericar:
u =
Como por hipotesis |b| = 1 podemos reescribir la condicion anterior como:

u = (b, )b,
Observese tambien que
= (b, )b.
Por tanto de las ecuaciones de Lie-Poisson seran:
= ( (b, )b)
= (b, )b
Observese que
d
dt
(b, ) = (b,

) = (b, )(b, b ) = 0.
luego
(b, (t)) = (b, (0)).
Reescribiendo de nuevo las ecuaciones de Lie-Poisson como:
= (b, (0))b
o llamando C = i
1
((b, (0))b):
= C
39
con solucion
(t) = e
tC
(0)
Luego los controles buscados son:
u = e
tC
(0) (b, e
tC
(0))b
Dados estos controles ya solamente restara resolver la ecuacion:
R = R u,
con R(0) y R(1) jos.
5.3. Problema de control optimo de una bola rodando en un
plano
Imaginemos una bola rodando sin deslizar en un plano horizontal en R
3
. El producto
eucldeo nos permite expresar la cinematica de la rotacion de la esfera en terminos de un
sistema de referencia ortonormal situado en la esfera.
Sea (E
1
, E
2
, E
3
) un sistema ortonormal jo en R
3
de modo que el plano en el que rueda
la esfera esta generado por E
1
, E
2
.
Sea (
1
,
2
,
3
) un sistema ortonormal situado en la esfera
= RE
i
, i = 1, 2, 3.
Si denotamos por Q las coordenadas de un punto en el sistema de referencia (E
1
, E
2
, E
3
) y
q sus coordenadas en la base (
1
,
2
,
3
) entonces
Q = qR
El movimiento de la esfera esta descrito por el movimiento de sus centro y el del sistema
de referencia (rotacion). Por tanto, el espacio de conguracion es M = R
2
SO(3).
Sea O un origen jo y O
origen del sistema en movimiento y P un punto arbitrario de

la esfera. Entonces
OP =

OO
P
P(t) = X(t) +Q(t)
por tanto,
P(t) =

X(t) +

Q(t)
=

X(t) +qR(t)
40
Sabemos que

R(t) = R(t)A(t) con A(t) so(3) o
R(t) = R(t) (
1
(t)E
1
+
2
(t)E
2
+
3
(t)E
3
)
y, por tanto,
dQ
dt
= qR(t) (
1
(t)E
1
+
2
(t)E
2
+
3
(t)E
3
)
= Q(t) (
1
(t)E
1
+
2
(t)E
2
+
3
(t)E
3
)
La condicion de que la esfera rueda sin deslizamiento signica que la velocidad del punto
de contacto con el plano es cero con respecto a la referencia ja, es decir

P = 0. Como ese
punto es Q = (0, 0, 1). Por tanto,
0 = ( x, y, 0) + (0, 0, 1) (
1
,
2
,
3
)
Luego
x =
2
y =
1
Lamando u
1
=
2
y u
2
=
1
entonces llegamos al siguiente sistema de control:
x = u
1
y = u
2
R = R
_
_
_
_
0 u
3
u
1
u
3
0 u
2
u
1
u
2
0
_
_
_
_
En algunos ejemplos interesantes se supone que la bola rueda de tal modo que su velo-
cidad angular es siempre paralela al plano horizontal, es decir u
3
= 0, con lo que el sistema
de control queda:
x = u
1
y = u
2
R = R
_
_
_
_
0 0 u
1
0 0 u
2
u
1
u
2
0
_
_
_
_
41
5.3.1. Analisis de la controlabilidad
Para expresarlo de un modo en que nos resulte mas sencillo aplicar las condiciones de
la Leccion 4 escribamos las siguientes matrices
X =
_
R 0
0
1 0 x
0 1 y
0 0 1
_
Es facil comprobar que el conjunto G de estas matrices es un grupo de Lie. Su algebra de
Lie g estara formada por las matrices:
A =
_
A 0
0
0 0 b
0 0 c
0 0 0
_
Un base del algebra de Lie vendra dada por las matrices:
E
1
=
_
_
E
1
0
0 0
_
_
,

E
2
=
_
_
E
2
0
0 0
_
_
,

E
3
=
_
_
E
3
0
0 0
_
_
E
4
=
_
_
_
_
_
_
_
0 0
0
_
_
_
_
0 0 1
0 0 0
0 0 0
_
_
_
_
_
_
_
_
_
_
_
,

E
5
=
_
_
_
_
_
_
_
0 0
0
_
_
_
_
0 0 0
0 0 1
0 0 0
_
_
_
_
_
_
_
_
_
_
_
Es facil comprobar que:
[

E
1
,

E
2
] =

E
3
, [

E
2
,

E
3
] =

E
1
, [

E
3
,

E
1
] =

E
2
, [

E
4
,

E
i
] = 0, [

E
5
,

E
i
] = 0,
con i = 1, . . . , 5.
Nuestro sistema de control se escribira
R = R
_
_
_

0 0 u
1
0 0 u
2
u
1
u
2
0
0
0
0 0 u
1
0 0 u
2
0 0 0
_
_
_
= R
_
u
1
(

E
4

E
2
) +u
2
(

E
5
+

E
1
)
_
Tenemos un sistema de control invariante a izquierda donde es:
=
E
4

E
2
,

E
5
+

E
1
Es facil comprobar que Lie() = g y, por tanto, el sistema es controlable.

En breve, en estas notas, el interesante estudio del control optimo de este ejemplo.
Bibliografa
A.M. Bloch: Nonholonomic Mechanics and Control, Interdisciplinary Applied Mathe-
matics, 24. Systems and Control. Springer-Verlag, New York, 2003.
Richard H. Cushman, Larry Bates: Global Aspects of Classical Integrable Systems, ,
Birkhauser, 1997.
V. Jurdjevic: Geometric Control Theory, Cambridge Studies in Advances Mathematics
51, Cambridge University Press, 1997.
Andrew Lewis, Course on Pontryagins Maximum Principle, course oered to graduate
students at Universitat Polit`ecnica de Catalunya
http://penelope.mast.queensu.ca/MP-course/
J. Marsden, T. Ratiu: Introduction to Mechanics and Symmetry, Springer-Verlag 1994
Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste, Italy,
January-February 2006.
Spindler, K. Optimal attitude control of a rigid body. Appl. Math. Optim. 34 (1996),
no. 1, 7990
42

07DMartin Control PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

07DMartin Control PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Control

R(0) [ R(t) SO(3), R(0) = I = A M(3) [ A es antisimetrica.

esta denida por k

(0) : so(3) so(3) es igual a

(t) de la curva R(t) tendremos una variacion de la curva

(t) en el algebra de Lie so(3). Si llamamos

que se conocen como ecuaciones de Lie-Poisson.

R(0) [ R(t) G, R(0) = R

Q de una variedad diferenciable M es un difeomorsmo

G de un grupo de Lie G y sea

el dual de su algebra de Lie g. Denotaremos : T

G admite una trivializacion (usando, por ejemplo, la translacion

G como una 1-forma

). De un modo similar tenemos la 2-forma = d

(R, ) (R exp tA, +t)

Calculemos cada uno de los terminos por separado. En primer lugar,

(R exp tA, +t), X

(R exp tA, +t), (R exp (tA)B, ))

G R es una funcion diferenciable. El campo de vectores

G, ) esta denido por las ecuaciones

R denido por H(R, ) = H(L(R, )) =

. En este contexto, a estas ecuaciones se las

las derivadas parciales

es la diferencial de la restriccion de f a valores R = constante.

entonces, existiran X(R, ) g y (R, ) g

Luego las ecuaciones de Euler-Arnold son:

En el caso en que el hamiltoniano H es invariante a izquierda entonces

, lo identicamos con el elemento R

so(3) entonces para todo A so(3) se tiene que

(R, T) = R(T) [ R(t) trayectoria de , R(0) = R,

(I) G es una subvariedad dife-

(I) es un subgrupo de Lie de G con algebra de Lie

(I) es un subgrupo de G, entonces para todo R /

(I) tenemos que R

(I). Por tanto, O

(t) = (x(t), p(t)) tal que (, p(t)) ,= (0, 0) y vericando las

(t), u), para todo u U y casi todo t [t

(t)) es constante (siendo cero si el tiempo t

(t) que satisfacen el principio de Pontryaguin con ,= 0 se llaman

SO(3) R denida por H

SO(3) vericara aplicando el principio del maximo

(t), ), para todo R

(t)) = 0. Si denotamos por (R

la trayectoria tal que L(R

(t) = 0 y llegamos contradiccion.

Por tanto el sistema es controlable.

por medio del producto escalar (vease Seccion 3.4))

b con la metrica eucldea estandar.

, u) lo que equivale a que

Como por hipotesis |b| = 1 podemos reescribir la condicion anterior como:

origen del sistema en movimiento y P un punto arbitrario de

Es facil comprobar que Lie() = g y, por tanto, el sistema es controlable.

S-ar putea să vă placă și