Documente Academic
Documente Profesional
Documente Cultură
Dr. Luis Alejandro Marquez Martínez Dr. David Hilario Covarrubias Rosales
7 de diciembre de 2007
CENTRO DE INVESTIGACIÓN CIENTÍFICA Y DE EDUCACIÓN SUPERIOR
DE ENSENADA
TESIS
que para ubrir par ialmente los requisitos ne esarios para obtener el grado de
DOCTOR EN CIENCIAS
Presenta:
__________________________
Dr. Joaquín Álvarez Gallegos
Director de tesis
A los Doctores Iouri Orlov Kuchina, Luis Alejandro Márquez Martínez, Jaime Álvarez
Gallegos y Luis Tupak Aguilar Bustos.
Página
I. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
I.1 Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
I.3 Contenido de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Página
VII. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
VII.1 Trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .60
Literatura citada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Lista de Figuras
Figura Página
Aunque la mecánica es un tema clásico cuyo estudio data desde la antigüedad, mu-
chos problemas, viejos y nuevos, siguen atrayendo la atención. En años recientes, muchas
tos en respuesta a fuerzas y pares de torsión externos diferentes. Así, un sistema mecánico
se puede ver como un sistema de control con las fuerzas externas como las entradas, las
variables que describen los movimientos de los elementos del sistema como los estados, y
las dinámicas que son determinadas por la interacción de fuerzas actúan como puentes entre
variables y entradas. Las salidas de un sistema mecánico son funciones de sus estados.
grados de libertad del sistema mecánico, se define el llamado sistema mecánico subactuado
El problema del control de sistemas subactuados está motivado por numerosas apli-
diseño; por ejemplo, un avión es un sistema subactuado. Otras aplicaciones surgen por la
propia disposición física del sistema; por ejemplo, en el diseño de vehículos submarinos,
subactuado también es más compleja que para un sistema con control pleno.
Las dinámicas bajo restricción constituyen una propiedad interesante de los sistemas
mecánicos subactuados. Las restricciones pueden ser expresadas como ecuaciones diferen-
ciales con las coordenadas generalizadas y sus derivadas con respecto al tiempo (veloci-
tras que las dinámicas son debidas al equilibrio dinámico en el grado de libertad pasivo
tica, que son sistemas mecánicos subactuados clásicos, son sistemas holonómicos (Seto y
Baillieul, 1994).
Un simple disco sobre una superficie (Török, 2000), robots móviles (Kolmanovsky y
McClamroch, 1995) y vehículos articulados (Jiang y Nijmeijer, 1999) son sistemas mecáni-
Nakamura, 1991), vehículos marinos subactuados (Do et al., 2002) y el Acrobot (Spong,
1995).
bología, la fricción seca (fricción discontinua) es definida como una fuerza que se opone
al movimiento relativo entre dos superficies de diferentes cuerpos en contacto. Los cuer-
pos se “atascan” (“stick”) cuando la velocidad relativa entre las superficies en contacto es
cero. Si los cuerpos se deslizan con velocidad relativa no cero, decimos que se “resbalan”
(“slip”). Un modelo de fricción seca debe describir la fase de stick y slip (Leine, 2000).
La acción de la fricción discontinua puede ser descrito por medio de inclusiones diferen-
ciales o ecuaciones diferenciales ordinarias con lado derecho discontinuo (Utkin, 1992),
(Filippov, 1988).
ciclos límite, bifurcaciones y caos (Armstrong y Amin, 1996). Por lo tanto, surge la necesi-
dad de analizar la variedad de estados estacionarios que pueden presentar y diseñar estrate-
I.1 Antecedentes
Algunos artículos representativos que analizan algunos problemas acerca de sistemas sub-
equilibrio por medio de técnicas de pasividad (Ortega et al., 2002) y moldeo de energía
“backstepping” (Seto y Baillieul, 1994), el uso de restricciones virtuales para producir os-
2001), y control de sistemas mecánicos con una variable no actuada cíclica (Grizzle et
dos ignoran el efecto de la fricción. Los términos de fricción no son modelados y los
algoritmos se reducen a resolver el problema de control para un modelo en lazo abierto sin
fricción, esperando que la disipación física ayude, de alguna manera, a alcanzar el punto
de equilibrio deseado. Sin embargo, en años recientes algunos trabajos se han dirigido al
problema de la fricción. En Gómez-Estern y van der Shaft (2004), Woolsey et al. (2001),
Woolsey et al. (2004) se considera fricción lineal (fricción viscosa) en las articulaciones de
sistemas subactuados.
Gómez-Estern y van der Shaft (2004) fue extendida la técnica (IDA-PBC) para sistema
Coulomb.
Para sistemas mecánicos subactuados con fricción discontinua sólo en las articula-
sando control discontinuo (Riachy et al., 2006). Sin embargo, el problema importante de
En este trabajo de tesis se proponen varias técnicas para controlar sistemas mecánicos
de esta clase.
I.2 Objetivos
actuadas.
articulación no actuada.
6
Consideramos que éstos son dos casos típicos encontrados en prototipos mecánicos
(los cuales exhiben un comportamiento dinámico desplegado por mecanismos más compli-
Puesto que en esta tesis se considerarán sistemas mecánicos subactuados con fricción dis-
actuado de 2 g.d.l. con fricción viscosa y de Coulomb en las dos articulaciones. Este
Capítulo VI, para diseñar un controlador para otra clase de sistemas mecánicos subactuados
f : R × Rn → Rn es un campo vectorial.
La existencia y unicidad de las soluciones de (1) son esenciales para que esta ecuación
sea un modelo matemático útil de un sistema físico. A continuación se presentan las condi-
Teorema 1 (Existencia y unicidad de solución local) (Khalil, 2002) Sea f (t, x) una fun-
∀x, y ∈ B = {x ∈ Rn |kx − yk < r }, ∀t ∈ [t0 , t1 ]. Entonces existe alguna δ > 0 tal que
la ecuación ẋ = f (t, x) con x(t0 ) = x0 tiene solución única sobre [t0 , t0 + δ].
Teorema 2 (Existencia y unicidad de solución global) (Khalil, 2002) Sea f (t, x) una
función continua por tramos en t que satisface (2) ∀x, y ∈ Rn , ∀t ∈ [t0 , t1 ]. Entonces la
Los sistemas bajo estudio en esta tesis se pueden describir por medio de la ecuación
Considérese que para cada punto (t, x) ∈ G, el conjunto F (t, x) es el conjunto cerra-
do convexo más simple conteniendo todos los valores límite de la función f (t, x∗ ) para
(t, x∗ ) ∈
/ M, x∗ → x, t =const.
diferencial
I para el cual ẋ(t) ∈ F (t, x(t)) casi donde sea en I. Puesto que M es un conjunto de
medida cero, entonces para casi todo t ∈ I la medida de la sección transversal del conjunto
M por el plano t =const es igual a cero. Para tal t el conjunto F (t, x) es definido para
todo (t, x) ∈ G.
Todos los puntos fi (t, x) (i = 1, ..., k) están contenidos en F (t, x), pero no es nece-
desde los dominios G− y G+ , definimos los valores límite de la función f (t, x∗ ) como
Entonces el conjunto F (t, x) es un segmento lineal que une los puntos finales de los
Si para t1 < t < t2 este segmento se encuentra en un lado del plano P tangente a la
superficie S en el espacio x (figura 1(b)). Esto significa que la función x(t) que satisface la
ecuación
ẋ = f 0 (t, x) (6)
es llamada un movimiento deslizante. Una función continua x(t), que en una parte del
10
do la ecuación (6) es, desde luego, también una solución de la ecuación (1) en el sentido de
la definición (3).
puede ser única o no, dependiendo de si el conjunto F (t, x) tiene uno o más puntos co-
definidos con respecto a los puntos de equilibrio establecidos por esta definición de solu-
ción.
11
• Estable al tiempo t0 si, para cada ε > 0, existe una constante δ > 0 que puede
• Inestable si no es estable.
alguna δ > 0 y cada ε > 0, existe un intervalo de tiempo finito T (t0 , δ, ε) tal que
Es uniformemente atractivo en [t0 , ∞) si para todo ε, que satisface 0 < ε < δ, el intervalo
atractivo.
para alguna δ > 0 existen constantes α(δ) > 0 y β > 0 tal que
Es exponencialmente estable si, para alguna δ > 0 existen dos números estrictamente
p → ∞.
si existe una función de clase k, γ 1 : R+ → R+ , tal que para alguna vecindad del origen
Ω ⊂ Rn se cumple que
• Para concluir estabilidad asintótica o estabilidad exponencial, V (t, x(t)) debe ser
• Para concluir estabilidad global, V (t, x(t)) debe ser globalmente definida positiva
y radialmente no acotada.
global, V (t, x(t)) debe ser globalmente definida positiva, globalmente decreciente y
radialmente no acotada.
Teorema 10 Considere la ecuación (1) tal que, para cualquier conjunto acotado D ⊂Rn
temporal de V (t, x(t)) a lo largo de la solución de (1) tiene la propiedad que, para toda
14
donde γ 3 (·) es continua y no negativa, con γ 3 (0) = 0. Entonces el equilibrio xe del sistema
positiva.
constantes positivas λi .
donde ψ es una función continua a tramos cuyos componentes ψ i , ..., ψ n son acotados local
y uniformemente dentro de una bola Bδ , con centro en el origen con radio δ; es decir,
un concepto de solución para esta ecuación diferencial con incertidumbres (Orlov, 2005).
una solución de la ecuación diferencial con incertidumbres (7)-(8) si y sólo si es una solu-
Se debe señalar que el sistema con incertidumbres (7)-(8) puede ser representado
ẋ ∈ F (t, x) + Ψ, (9)
satisface la desigualdad
° ¡ ¢°
°xψ t, t0 , x0 ° < ε para todo t ∈ [t0 , ∞) .
16
° ¡ ¢°
lim °xψ t, t0 , x0 ° = 0 (10)
t→∞
estable.
¡ ¢
xψ t, t0 , x0 = 0 (11)
ajuste de tiempo
© ¡ ¢ ª
T (t0 , x0 ) = sup inf T ≥ 0 : xψ t, t0 , x0 = 0 para todo t ≥ t0 + T (12)
xψ (·,t0 ,x0 )
es tal que
enfoques con un alto grado de paralelismo: los sistemas lagrangianos y los sistemas hamil-
tonianos. Pese existir una equivalencia entre ambos enfoques y poder expresar el modelo
lagrangiano en forma hamiltoniana, las formulaciones han sido generalizadas hasta el punto
en que no es evidente su equivalencia, y por lo tanto tampoco son intercambiables las téc-
mente se dice que son subactuados los sistemas de n grados de libertad y r < n actuadores
con
donde qi , i = 1, ..., n, son las coordenadas generalizadas del sistema, ff i , i = 1, ..., n son
de 2 g.d.l., con movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb
no actuada es llevada a la posición deseada mientras que la actuada terminará en una posi-
sólo en el plano horizontal, con fricción viscosa y de Coulomb en las dos articulaciones.
donde
· ¸ · ¸
q1 u1
q= , u= ,
q2 0
· ¸
θ1 + θ2 + 2θ3 cos(q2 ) θ2 + θ3 cos(q2 )
M(q) = ,
θ2 + θ3 cos(q·2 ) θ2 ¸
−q̇2 −q̇2 − q̇1
C(q, q̇) = θ3 sen(q2 ) ,
q̇1 0
19
· ¸ · ¸
ff 1 (q̇1 ) fv1 q̇1 + fc1 sgn(q̇1 )
ff (q̇) = = ,
ff 2 (q̇2 ) fv2 q̇2 + fc2 sgn(q̇2 )
1 , para z > 0,
sgn(z) = [−1, 1], para z = 0, (16)
−1 , para z < 0;
con
2
θ1 = m1 lc1 + m2 l12 + I1 2
θ2 = m2 lc2 + I2 θ3 = m2 l1 lc2
θ4 = m1 lc1 + m2 l1 θ5 = m2 lc2
y fvi > 0, fci > 0, para i = 1, 2, son los coeficientes de la fricción viscosa y.de Coulomb
El control u1 será diseñado usando la técnica de control por modos deslizantes clásica.
como
ẋ1 = x2 ,
1
ẋ2 = 2
[m2 l1 lc2 k1 cos (q2 ) sen (x1 ) x2
m2 lc2 + I2
−m2 l1 lc2 k1 sen (q2 ) cos (x1 ) q̇1 − fv2 x2
+fv2 k1 cos (x1 ) − fc2 sgn (x2 − k1 cos (x1 ))] . (18)
Note que si sen(x1 ) tiende a 1 y x2 a cero cuando t tiende a infinito, entonces q̇1 y q̇2 tienden
a cero.
que el punto de equilibrio (sen (x1 ) , x2 ) = (1, 0) de (18) sea asintóticamente estable.
ẋ1 = x2 ,
1
ẋ2 = 2
[−m2 l1 lc2 k1 sen (q2 ) cos (x1 ) q̇1
m2 lc2 + I2
+fv2 k1 cos (x1 ) − fc2 sgn (x2 − k1 cos (x1 )) − f1 x2 ] , (19)
21
Teorema 15 Suponga que k1 , para una constante 0 < γ < 2/π2 , satisface
2
£ ¡ 2
¢
fv2 > k1 2m2 l1 lc2 fv2 + m2 lc2 + I2 fv2 − m22 l12 lc2
2
k1
¡ ¢ ¤
2
− m2 lc2 + I2 m2 l1 lc2 k1 + (fv2 + 2m2 l1 lc2 k1 )2 /4 . (22)
en forma local.
1¡ ¢
V1 (x1 , x2 ) = 2
m2 lc2 + I2 x22 − fv2 k1 sen (x1 ) + fv2 k1 + k2 sen (x1 − π/2) x2 (23)
2
Entonces,
· ¸T · ¸
1 |x1 − π/2 − 2πi| |x1 − π/2 − 2πi|
V1 (x1 , x2 ) ≥ D1 (26)
2 |x2 | |x2 |
22
donde
· ¸
2γfv2 k1 −k2
D1 = 2 .
−k2 m2 lc2 + I2
Por lo tanto, si (21) se satisface, entonces la función (23) es definida positiva y radialmente
donde
Por lo tanto, si (20) y (22) se satisfacen, entonces concluimos que el punto de equilibrio
III.2 Aplicación
La ley de control u1 se obtiene usando la técnica de modos deslizantes clásica. Por lo tanto,
si proponemos la función
1
V2 (s) = s2 , (28)
2
23
1 £
u1 = −θ2 θ3 sen (q2 ) (q̇1 + q̇2 )2 − θ23 cos (q2 ) sen (q2 ) q̇12
θ2
+θ2 fv1 q̇1 − (θ2 + θ3 cos (q2 )) fv2 q̇2
¡ ¢ ¤
− θ1 θ2 − θ23 cos2 (q2 ) (k sgn (s) + k1 sen (q1 + q2 ) (q̇1 + q̇2 )) (30)
donde
¡ ¢
k > (θ2 fc1 + (θ2 + θ3 ) fc2 ) / θ1 θ2 − θ23 .
fv1 = fv2 = 0.2 kg · m2 /s, fc1 = fc2 = 0.005 N · m, γ = 0.20, k = 0.21 y, para que se
Proponemos una ley de control discontinua para un manipulador planar subactuado con
movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb en las articu-
laciones. Para el diseño del controlador usamos la técnica de modos deslizantes clásica y
concluimos estabilidad asintótica local del punto de equilibrio deseado. Esta ley de con-
3 0.3
q1 q2
2
(rad ) ( rad ) 0.2
1 0.1
0 0
-1 -0.1
-2 -0.2
0 2 4 6 8 10 0 2 4 6 8 10
a) t (s ) b) t (s)
3 1.5
q1+q 2 u1
(rad ) 2 (N m) 1
1 0.5
0 0
-1 -0.5
-2 -1
0 2 4 6 8 10 0 2 4 6 8 10
c) t (s ) d) t (s)
pares gravitacionales en el modelo del sistema causa una condición adicional para fv2 .
El análisis y diseño de este primer controlador nos motiva a proponer leyes de con-
trol para sistemas subactuados de 2 g.d.l., que si bien no logren la regulación en ambas
es accionada solamente por la posición y velocidad de la actuada, las cuales son conside-
radas continuas, la primera articulación puede ser considerada como un sistema mecánico
con fricción discontinua pero con una entrada de control artificial continua dada por un
física en la articulación actuada que lleve el control virtual a su valor ideal en tiempo finito.
control. C2 (q̇2 ) es el módulo de los términos de fricción, que en general depende de los
estados del sistema y de acciones externas, supuesto, junto con sus derivadas temporales,
µ 2¶
q̇
C2 (q̇2 ) = C2c + (C2s − C2c ) exp − 22 , (32)
v2s
donde C2c y C2s son los niveles de fricción de Coulomb y el nivel de fricción estática que
pueden estar divididos por una masa constante, con 0 ≤ C2c ≤ C2s , y v2s es la veloci-
dad de Stribeck. Note que C2c ≤ C2 (q̇2 ) ≤ C2s . También suponemos que la función
f2 (q2 , q̇2 , q̈2 ) = df1 (q2 , q̇2 ) /dt es continua en sus argumentos, y que g1 y g2 son cons-
σ = g1 q1 + g2 q̇1 , (33)
ẏ1 = y2 ,
Note que (34) puede ser descrito como un sistema mecánico con fricción discontinua,
que es continuo por naturaleza (excepto posiblemente cuando señales impulsivas son per-
reducir el error y = (y1 , y2 )T a cero, entonces una ley dinámica para σ puede ser adecuada.
para el sistema (34) que asegure la convergencia del estado y al origen, luego propon-
dremos un control discontinuo u1 para el sistema (31) que haga el control virtual σ con-
verja en tiempo finito a σ ∗ . Denotamos este tiempo finito como t1 . Note que si el estado
y(t) y la aceleración ẏ2 (t) son acotados, entonces σ ∗ también será acotada (esto puede ser
permanecen acotadas.
Considere una ley de control virtual σ ∗ con una dinámica dada por
σ̇ ∗ = ϕ (y, σ ∗ ) . (35)
Esto es equivalente a definir un controlador dinámico σ ∗ = ψ(w, y), ẇ = χ(w, y), con
ψ(·) = w y χ(w, y) = ϕ(y, w). Note que σ ∗ debe ser continua, pero no necesariamente ϕ.
el cual, debido a la presencia del término discontinuo, puede tener un conjunto no contable
y compacto como equilibrio (ver (Alvarez et al., 2000)), según la definición de punto de
única raíz de ϕ(σ̄∗ ,0) = 0, entonces todos los puntos de equilibrios del sistema (34)-(35) se
lo cual implica que ȳ1 = 0. Note que, de (32), tenemos C2 (0) = C2s , por lo tanto
y siempre existe un valor real σ̄ ∗ tal que, para cualquier q2d ∈ R, satisface σ̄ ∗ +f1 (q2d , 0) ∈
[−C2s , C2s ].
Note que el resultado previo significa que, en caso de que el sistema (34)-(35) exhiba
el sistema abandonará esta superficie. Este tiempo puede ser de cualquier tamaño, incluso
Entonces el sistema (34), con el control artificial (35), es descrito para x2 6= 0, por
x2
x3
ẋ = ³ 2´ = g(t, x), (37)
2(C2s −C2c ) x2
f2 (x1 + q2d , x2 , x3 ) + |x2 | exp − v2 x3 + σ˙∗
v2
2s 2s
donde x = (x1 , x2 , x3 )T . Note que el punto de equilibrio (0, 0, σ̄ ∗ ) del sistema (34)-(35)
Denotamos como tak el k-ésimo tiempo de llegada de la solución del sistema (34)-
(35) a la superficie S, y por tbk ≥ tak , k ∈ K = {1, 2, ...}, el tiempo de salida de esta
solución de esta superficie justo después de la k-ésima llegada. Entonces tenemos una
¡ ¢ ¡ −¢ ¡ +¢
Cuando t1 < tak y tbk < ∞, defínase ∆xk = x t+
bk − x t ak , donde x tbk =
¡ ¢
limh→0 x (tbk + h) y x t−
ak = limh→0 x (tak − h), h > 0. Entonces el sistema (34)-(35)
ẋ = g(t, x),
¡ ¢ ¡ ¢
x t+
bk = x t−
ak + ∆xk , k ∈ K. (38)
control es el de conducir a cero el estado x(t) del sistema (38) con un “control” continuo
σ∗.
En esta sección diseñamos un control ideal continuo σ ∗ para el sistema (34), para posterior-
mente diseñar el control real del sistema (31) tal que σ (ver (33)) converga a σ ∗ en tiempo
Suposición 17 Existe una función continua f3 (t, x1 , x2 ) tal que, si el control artificial es
dado por
σ ∗ = f3 (t, x1 , x2 ) , (39)
Note que x̄ = 0 del sistema (40) es un punto de equilibrio. Por lo tanto, si es posible
entonces el objetivo de control será alcanzado. Así pues, en el siguiente teorema establece-
mos algunas condiciones sobre estos coeficientes para conseguir que limt→∞ kx(t)k = 0.
Para esto mostraremos que cualquier trayectoria del sistema (38)-(40) que llega al conjunto
p11 p12
p13 = 0, = = k1 , (43)
p23 p33
(38)-(40).
junto S en tiempo tak , entonces sale de este conjunto en tiempo tbk ≥ tak desde un punto
∆x1k = x1 (t+ −
bk ) − x1 (tak ) = 0,
∆x2k = x2 (t+ −
bk ) − x2 (tak ) = 0.
¯ ¯ ¯ ¯
Por lo tanto, para probar esta parte basta mostrar que ¯x3 (t+
bk )¯ < ¯x3 (t− )¯. Note tam-
ak
bién que (40) describe la dinámica del sistema (38) fuera de la superficie de discon-
(44)
y
Z tak
−
φ (tak ) = − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ − lim [C2 (x∗2 )] sgn (x∗2 ) + c1
t1 x∗2 ∈G− ,
x∗2 →0
Z tak
= − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + C2s + c1 . (46)
t1
tak y las trayectorias del sistema cruzan la superficie. Para esto, los campos vectoriales en
tiempo t+
bk y tak debe tener una componente en la misma dirección en el eje x2 ; así
−
¯ Z ¯
¯ tak ¯
¯− [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + c1 ¯¯ > C2s (47)
¯
t1
tener
" Z #
t−
ak £ ¡ ¢¤
sgn − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + c1 = − sgn x2 t−
ak . (50)
t1
y
¯ Z + ¯
¯ ¡ + ¢¯ ¯¯ tbk ¯
¯
¯x3 t ¯ = ¯− [k x
1 1 (τ ) + k x
2 2 (τ ) + k x
3 3 (τ )] dτ + c1 ¯ − C2s . (52)
bk
¯ t1 ¯
33
En el segundo caso, es decir, cuando existe un modo deslizante, la condición ẋ2 (t) =
¯ ¯
|x3 (tbk )| = |ẋ2 (tbk )| = ¯φ± (tbk )¯
¯ Z tbk ¯
¯ ¯
¯
= ¯− [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ ∓ C2s + c1 ¯¯ = 0. (53)
t1
¯ ¡ − ¢¯ ¯ ¡ − ¢¯
¯x3 t ¯ = ¯ẋ2 t ¯ > 0. (54)
ak ak
¯ ¡ + ¢¯ ¯ ¡ − ¢¯
¯x3 t ¯ < ¯x3 t ¯ . (55)
bk ak
V (x) = p11 x21 + 2p12 x1 x2 + p22 x22 + 2p23 x2 x3 + p33 x23 . (56)
¡ ¢
Note que x1 t−
ak = x1 (tbk ) y x2 (tak ) = x2 (tbk ) = 0. Entonces tenemos, de (55), que
+ − +
¡ ¡ ¢¢ ¡ −¢ ¡ −¢ ¡ +¢ ¡ +¢ ¡ ¡ + ¢¢
V x t−
ak = p11 x2
1 tak + p33 x2
3 tak > p11 x2
1 tbk + p33 x2
3 tbk = V x tbk , (57)
y existirá una reducción de V (x) cuando las trayectorias del sistema (38)-(40) crucen la
estabilidad asintótica global del origen, porque si el origen no ha sido alcanzado entonces
Una vez obtenida una expresión para σ ∗ y los coeficientes ki , pij satisfaciendo las
previas condiciones, podemos diseñar una ley de control discontinua para u1 que haga que
el control artificial σ (ver (33)) converja al control ideal σ ∗ en tiempo finito. Podemos
usar, por ejemplo, una técnica de modo deslizante para lograr este objetivo. En la siguiente
IV.3 Aplicaciones
ka kb fb 1
q̈1 + q1 + (q1 − q2 ) + (q̇1 − q̇2 ) = u1 ,
m1 m1 m1 m1
kb fb
q̈2 − (q1 − q2 ) − (q̇1 − q̇2 ) + C2 (q̇2 ) sgn (q̇2 ) = 0, (59)
m2 m2
donde qi son las posiciones de las masas, q̇i las velocidades, mi las masas, para i = 1, 2;
C2 (q̇2 ) es dada por (32), C2c y C2s son los niveles de fricción de Coulomb y de fricción
kb fb
f1 (x1 + q2d , x2 ) = − (x1 + q2d ) − x2 ,
m2 m2
kb fb
σ (q1 , q̇1 ) = q1 + q̇1 ,
m2 m2
Z t µ ¶ µ ¶
kb fb kb
∗
σ = −k1 x1 (τ ) dτ − k2 − x1 − k3 − x2 + q2d , (60)
t0 m2 m2 m2
donde t0 es el tiempo inicial, entonces llegamos a la forma deseada del Teorema 18.
El control u1 puede ser diseñado usando la técnica clásica de modos deslizantes. Por
Z t
fb kb kb
s= q̇1 + q1 + k1 (q2 (τ ) − q2d ) dτ + k2 (q2 − q2d ) + kc3 q̇2 − q2 , (61)
m2 m2 t0 m2
µ ¶
ka kb fb
u1 = m1 q1 + (q1 − q2 ) + (q̇1 − q̇2 ) + τ 1 , (62)
m1 m1 m1
36
donde
· µ ¶ ¸
m2 kb kb fb kc3 kb kc3
τ1 = − q̇1 + k2 − q̇2 − (q̇2 − q̇1 ) − (q2 − q1 ) + τ 2 (63)
fb m2 m2 m2 m2
Finalmente, si encontramos constantes p11 , p12 , p22 , p23 , p33 , k1 , k2 y k3 , que satisfa-
|v2s | = 0.143 m/s, k1 = 0.5, k2 = 1.5, y kc3 = 2, con q1 (t0 ) = −1 m, q̇1 (t0 ) = 0 m/s,
3 . 3
q1 q1
( m) 2
(m/s) 2
1 1
0 0
-1 -1
-2 -2
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
q2 3 . 3
q2
2 2
( m) (m/s)
1 1
0 0
-1 -1
-2 -2
0 10 20 30 0 10 20 30
c) t (s) d) t (s)
4 100
u1 V
2 80
( N)
0 60
-2 40
-4 20
-6 0
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
¡ ¢
J + mq22 q̈1 + 2mq2 q̇1 q̇2 − mgq2 cos (q1 ) = u1 ,
q̈2 − q2 q̇12 − g sen (q1 ) + fv2 q̇2 + C2 (q̇2 ) sgn (q̇2 ) = 0, (64)
donde q1 es la posición angular de la viga, q2 la posición lineal de la masa, q̇1 y q̇2 las
respectivas velocidades, m la masa; C2 (q̇2 ) es dada por (32), C2c , C2s , y fv2 son los niveles
Se desea obtener una ley de control u1 para que la masa m sea regulada alrededor del
que el ángulo y velocidad de la viga son pequeños. Bajo esta condición, el sistema (64)
puede simplificarse a
¡ ¢
J + mq22 q̈1 + 2mq2 q̇1 q̇2 − mgq2 cos (q1 ) = u1 ,
¡ ¢
u1 = 2mq2 q̇1 q̇2 − mgq2 cos (q1 ) + J + mq22 τ 1 , (65)
donde x1 = q2 − q2d , x2 = q̇2 , con c una constante real, y una superficie deslizante para
produce el control
1
τ 1 = − [k1 q̇2 + k2 (gq1 − fv2 q̇2 ) + k sgn (s)] , (67)
g
con k > k2 C2s . Finalmente, si encontramos constantes p11 , p12 , p22 , p23 , p33 , k1 , k2 , y
k3 = fv2 que satisfagan el Teorema 18, entonces el objetivo de control será alcanzado.
m/s2 , J = 0.3 kg·m2 , C2s = 0.1 N/kg, C2c = 0.075 N/kg, |v2s | = 0.0143 m/s, k1 = 0.5,
39
. 0.6
q1 0.6 q1
(rad ) 0.4 (rad/s)0.4
0.2 0.2
0 0
-0.2 -0.2
-0.4 -0.4
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
q2 2 . 2
q2
1.5 1.5
( m) (m/s)
1 1
0.5 0.5
0 0
-0.5 -0.5
0 10 20 30 0 10 20 30
c) t (s) d) t (s)
k2 = 1.5, y fv2 = 3 N/(kg · m/s), con q1 (t0 ) = 0.3 rad, q̇1 (t0 ) = 0 rad/s, q2 (t0 ) = 0.3
En este capítulo proponemos un controlador discontinuo para una clase de sistemas mecáni-
usando la técnica clásica de modos deslizantes, garantiza la convergencia del error de posi-
5 20
u1 V
0 16
(N m)
-5 12
-10 8
-15 4
-20 0
0 10 20 30 0 10 20 30
a) t (s ) b) t (s)
Como se observa en las gráficas las respuestas de los sistemas en lazo cerrado pueden
exhibir fases de “atascamiento”, debido a esto el desempeño del sistema puede ser afectado
resultados para proponer, primero, un control continuo para un sistema con fricción discon-
tinua y control pleno, y luego su aplicación al control de sistemas subactuados con fricción
discontinua.
Capítulo V
Control continuo de sistemas discontinuos
Desde el punto de vista de control de sistemas mecánicos con control pleno, la téc-
pertubación acotada de signo impredecible y por lo tanto contrarrestada con una amplitud
adecuada del control. Sin embargo, esta clase de algoritmos de control requieren a menudo
un alto esfuerzo de control para contrarrestar este fenómeno físico, y requieren señales de
control que conmuten, teóricamente, con frecuencia infinita, por lo tanto, en general es
Se han propuesto varias técnicas para eliminar el efecto del “chaterring” (conmutación
de alta frecuencia), por ejemplo los algoritmos de control de modos deslizantes de orden
superior. Sin embargo, los procedimientos “anti-chattering”, que intentan obtener leyes de
de fricción discontinua.
2000a), (Bartolini y Punta, 2000b). En estos trabajos se prueba que, con una ligera mo-
la velocidad convergan a una posición deseada, iniciando desde cualquier punto de “atas-
y Alvarez, 2007)). Además, utilizando este control, diseñamos un controlador para un sis-
ẏ1 = y2 ,
control. C2 (·) es el módulo de los términos de la fricción definido por (32). Suponga que
la función f2 (y1 , y2 , ẏ2 ) = df1 (y1 + q2d , y2 ) /dt es continua en sus argumentos.
continuo u(t).
Note que (68) tiene la misma forma que (34). Por lo tanto, consideramos una ley de
u̇ = ϕ (y, u) . (69)
Lema 19 Defínase ϕ(u,0) (y1 ) = ϕ (y, u), con y = (y1 , 0)T , como la restricción de ϕ para
y2 = 0. Suponga que y1 6= 0 implica que ϕ(u,0) (y1 ) 6= 0. Por lo tanto, si (68)-(69) exhibe
Bajo esta condición, u̇ = ϕ (ȳ, u), con ȳ = (y1 , 0), y1 6= 0, es diferente de cero. De (32),
u + f1 (y1 + q2d , 0) ∈
/ [−C2s , C2s ] , f1 (y1 + q2d , 0) − C2 (0) sgn(0) + u 6= 0. (70)
en un tiempo finito.
ẋ = g(t, x),
¡ ¢ ¡ ¢
x t+
bk = x t−
ak + ∆xk , k ∈ K, (71)
donde x = (x1 , x2 , x3 )T ,
x2
x3
g(t, x) = ³ 2´ , (72)
x
f2 (x1 , x2 , x3 ) + 2(C2sv2−C2c ) |x2 | exp − v22 x3 + u̇
2s 2s
¡ +¢ ¡ −¢
tak , tbk , ∆xk , x tbk y x tak son definidas en el capítulo anterior.
44
discontinuo u̇.
u = f3 (t, x1 , x2 ) , (73)
donde f3 (t, x1 , x2 ) es una función continua tal que (72) con (73) puede ser transformado a
x2 ,
x3 ,
g(t, x) = ³ 2´ , (74)
x
−k1 x1 − k2 x2 − k3 x3 + τ 1 + 2(C2sv2−C2c ) |x2 | exp − v22 x3 ,
2s 2s
con
1, para z > 0,
β(z) = 0, para z = 0, , (76)
−1, para z < 0;
una constante arbitraria k4 , sgn(k4 )=sgn(k1 ), y u̇ = ϕ (y, u) satisfaciendo el Lema 19.
es dado por
Z t
x2 = 0, − C2 (0) sgn(0) + [−k4 sgn(0) + k4 |β(0)| sgn(0)] dτ + c = 0,
t0
Así, puesto que u es una función continua, las condiciones para los coeficientes ki
que limt→∞ kx(t)k = 0, son obtenidas del Teorema 18 del capítulo anterior (ver prueba de
este teorema).
V.2 Aplicaciones
C2s son los niveles de la fricción de Coulomb y de la estática divididos por m; k es una
El objetivo es diseñar una ley de control continua u1 para llevar la posición de la masa
Z t µ ¶
k
u=− [k1 x1 (τ ) − τ 1 (τ )] dτ − k2 − x1 − k3 x2 , (79)
t0 m
N/m, m = 1 kg, C2s = 1 N/kg, C2c = 0.75 N/kg, |v2s | = 0.143 m/s, k1 = 0.5, k2 = 1.5,
q 3 . 1.5
q
2 1
( m) (m/s)
1 0.5
0 0
-1 -0.5
-2 -1
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
u, tenemos
µ ¶
ka kb fb
u1 = m1 q1 + (q1 − q2 ) + (q̇1 − q̇2 ) + τ 2 , (80)
m1 m1 m1
47
3 40
u1 V
2
( N) 30
1
20
0
10
-1
-2 0
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
donde
· ¸
m2 kb kb kc3 fb kc3
τ2 = − q̇1 + kc2 q̇2 + (q1 − q2 ) + (q̇1 − q̇2 ) + τ 3 (81)
fb m2 m2 m2
kc2 = k2 −kb /m2 , kc3 = k3 −fb /m2 y τ 1 (t) = −k4 sgn(q2 (t)−q2d )+k4 |β(q̇2 (t))| sgn(q2 (t)−
q2d ).
N/m, fb = 1 N/(m/s), m1 = m2 = 1 kg, C2s = 1 N/kg, C2c = 0.75 N/kg, |v2s | = 0.143
3 . 3
q1 q1
( m) 2
(m/s) 2
1 1
0 0
-1 -1
-2 -2
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
q2 3 . 3
q2
2 2
( m) (m/s)
1 1
0 0
-1 -1
-2 -2
0 10 20 30 0 10 20 30
c) t (s) d) t (s)
actuada permanecen acotadas. Este controlador puede verse como una extensión de los
presentados en el capítulo anterior, ya que disminuye el tiempo del transitorio del sistema
en lazo cerrado, sin embargo su uso se restringe por las funciones discontinuas en u̇.
Capítulo VI
Control de sistemas subactuados con fricción discon-
tinua II
no actuada. El péndulo con disco inercial y el péndulo invertido pueden ser incluidos en
El diseño del control es dividido en dos partes; primero, la articulación no actuada es lle-
vada a la posición deseada en tiempo finito, luego la articulación actuada es también lle-
vada a una posición deseada. Para esto, hacemos uso de un resultado central presentado
en (Orlov, 2005), acerca de las condiciones para tener estabilidad en tiempo finito de una
convergencia del error de posición a cero, y es robusto con respecto a algunas incertidum-
tado por
∂V1 (q1 )
I1 q̈1 + I2 q̈2 + + C2 (q̇1 ) sgn (q̇1 ) = 0
∂q1
I3 q̈1 + I4 q̈2 = u (83)
50
1 (q1 )
donde q1 ∈ R, q2 ∈ R, I1 , I2 , I3 y I4 son constantes positivas y I1 > I2I4I3 ; ∂V∂q 1
es un par
¯
1 (q1 ) ¯
gravitacional, y es una función suave tal que ∂V∂q 1
¯ = 0, y V1 (0) = 0, u es la entrada
q1 =0
Si definimos x1 = q1 , x2 = ẋ1 , x3 = q1 + I4
q,
I3 2
x4 = ẋ3 y
· µ 2¶ ¸
q̇1
$ = (C2s − C2c ) exp − 2 − (C2s − C2c ) sgn (q̇1 ) , (84)
v2s
ẋ1 = x2 ,
µ ¶
−1 ∂V1 (x1 ) I2
ẋ2 = + C2s sgn (x2 ) + $ + u , (85)
I1 − I2 I3 /I4 ∂x1 I4
ẋ3 = x4 ,
1
ẋ4 = u. (86)
I3
Note que |$| ≤ C2s − C2c < C2s . Entonces, el objetivo de control es conducir a cero el
Primero se diseñará un control discontinuo u1 para el subsistema (85) que asegure la con-
ẏ1 = y2 ,
1988).
h ≥ 0, p≥0 (90)
I4
u1 (x1 , x2 ) = k1 β(x1 ), (91)
I2
cero.
Teorema 23 El subsistema (85) con u = u1 , donde u1 es dado por (91), es estable global,
para todo x1 .
subsistema (85) con (91) y (92) en el sentido de Filippov (Filippov, 1988); es decir, si
Ahora analizaremos el caso donde las trayectorias del subsistema no están en las
superficies de discontinuidad
n o n o
T 2 T 2
S1 = (x1 , x2 ) ∈ R : x1 = 0 S2 = (x1 , x2 ) ∈ R : x2 = 0 .
Considere la función
µ ¶
1 I2 I3
V2 (x1 , x2 ) = V1 (x1 ) + k1 |x1 | + I1 − x22 , (93)
2 I4
53
donde k1 es dado por (92), la cual es continua Lipschitz, radialmente desacotada, y definida
positiva. La derivada temporal de V2 a lo largo de las trayectorias de (85) con (91) y (92)
n o
D² = (x1 , x2 )T ∈ R2 : V2 (x1 , x2 ) ≤ ² , (95)
donde ² > 0; de x1 = x2 = 0, el subsistema (85) con (91) y (92) no puede dejar esta
¯ ¯
¯ 1 (x1 ) ¯
vecindad. Además, debido a (92), k1 > ¯ ∂V∂x 1
¯ + C2s + |$| + II24 C1 y en tiempo finito t1 ,
¯ ¯
¯ 1 (x1 ) ¯
C2s ≥ C2c > ¯ ∂V∂x 1
¯ + |$| + II24 C1 . Por lo tanto, si y1 = x1 , y2 = x2 , a = I1 −Ik21I3 /I4 ,
³ ´
∂V1 (x1 )
b = I1 −IC22sI3 /I4 , h = p = 0, y ω = I1 −I−1 2 I3 /I4 ∂x1
+ $ + I2
I4
u2 para t ≥ t1 , de acuerdo
al Teorema 22, el subsistema (85) con (91) y (92) es estable global equiuniformemente en
satisfacen
k2 + k3 ≤ C1 (97)
54
t ≥ t2 )
Por lo tanto, el sistema (85), (86), (87) con (91), (96), (92), (97) y (98) conduce a
cero al estado x en tiempo finito, satisfaciendo el objetivo de control. Note que el contro-
lador propuesto, de acuerdo a las estas desigualdades, es robusto con respecto a algunas
VI.3 Aplicación
Considere el sistema mostrado en la Figura 15, cuyo movimiento esta restringido a un plano
donde q1 es el ángulo del péndulo, q2 es la posición del eslabón 2, m1 y m2 son las masas,
¡ ¢
Jo = J1 + J2 + m2 lo2 + q22 + m1 lc2 (100)
El objetivo es diseñar una ley de control discontinuo u que lleve q1 , q̇1 , q2 y q̇2 a cero.
55
Para aplicar el resultado previo simplificamos este modelo, suponiendo que q1 , q̇1 , q2
y q̇2 son pequeños. Bajo esta condición, el sistema (99) puede ser reducido a
con
I2 I3
I1 = Joe , I2 = I3 = m2 lo , I4 = m2 , y I1 > ,
I4
1 1
x1 = q1 , x2 = q̇1 , x3 = q1 + q2 , x4 = q̇1 + q̇2 , (103)
lo lo
0.06
q1
0.03
(rad) 0
-0.03
-0.06
0 2 4 6 8 10
q 2 0.12
0.06
(m)
0
-0.06
-0.12
0 2 4 6 8 10
-3
x 10
6
u
3
(N)
0
-3
-6
0 2 4 6 8 10
t (sec)
Cc > lo (k2 + k3 ) ,
(modelo 505), donde tenemos que lo = 0.330 m, m1 = 0.785 kg, m2 = 0.213 kg, Joe =
con q1 (t0 ) = −0.045 rad, q̇1 (t0 ) = 0 rad/s, q2 (t0 ) = 0 m, y q̇2 (t0 ) = 0 m/s. La ley de
fue por medio de una tarjeta DSpace. Las derivadas aproximadas de las posiciones de las
0.4
q1
(rad) 0.2
-0.2
0 5 10 15 20 25 30
q 2 0.04
(m) 0.02
0
-0.02
0 5 10 15 20 25 30
-3
x 10
4
u
(N) 2
-2
0 5 10 15 20 25 30
t (sec)
El control propuesto fue diseñado suponiendo que q1 , q̇1 , q2 y q̇2 son pequeños. Sin
experimentales del mismo sistema, donde ahora tenemos que q1 (t0 ) = 0 rad, q̇1 (t0 ) = 0
rad/s, q2 (t0 ) = 0 m, q̇2 (t0 ) = 0 m/s, y la salida de un filtro de segundo orden a un paso
t = 1.5 segundos.
58
En este capítulo proponemos un controlador discontinuo para una clase de sistema mecáni-
fricción.
horizontal.
En este sistema, para aplicar los resultados de este capítulo simplificamos el modelo
del sistema, suponiendo que q1 , q̇1 , q2 y q̇2 son pequeños; sin embargo, puesto que existe
Esta tesis aborda el problema de control de sistemas mecánicos subactuados con fric-
ción discontinua en las articulaciones no actuadas. Este problema, sin ignorar o aproximar
Los algoritmos de control propuestos en esta tesis consideran y hacen frente a los
leyes de control utilizan su efecto en el sistema para alcanzar el objetivo de control, siendo
tinua.
para dos clases de sistemas mecánicos subactuados de 2 grados de libertad con fricción
En los dos primero usamos la técnica de modos deslizantes para obtener las leyes de
control, mientras que en el tercero utilizamos resultados recientes acerca de las condiciones
Hasta el momento, por lo que sabemos, estos resultados representan los primeros tra-
Los controladores propuestos en esta tesis son para una clase de sistemas mecánicos sub-
actuados con fricción discontinua, por lo que una primera aplicación puede ser en la etapa
de control donde sea posible considerar posiciones y velocidad pequeñas para sistemas
mecánicos subactuados en general. Sin embargo, un trabajo futuro, que puede dar resulta-
tinua de la técnica IDA-PBC y/o lagrangianos controlados utilizando los resultados de los
capítulos 4 y 5.
61
Literatura citada
Alvarez, J., Orlov, I., y Acho L. 2000. An invariance principle for discontinuous dynamic
systems with applications to a Coulomb friction oscillator. ASME Journal of Dynamical
Systems, Measurement, and Control. 122: 687-690 p.
Armstrong, B. y Amin, B. 1996. PID Control in the Presence of Static Friction: A Com-
parison of Algebraic and Describing Function Analysis. Automatica. 32(5): 679-692
p.
Bartolini, G. y Punta, E. 2000. Chattering elimination with second order sliding modes
robust to Coulomb friction. ASME Journal of Dynamic Systems, Measurement and
Control. 122: 679-686 p.
Bartolini, G. y Punta, E. 2000. Second order sliding mode control of systems with nonlin-
ear friction. En: Proceedings of the 39th IEEE Conference on Decision and Control.
Sydney. 12-15 de diciembre.
Bloch, A. M., Leonard, N. E., y Marsden, J. E. 2000. Controlled lagrangians and the sta-
bilization of mechanical systems I: The first matching theorem. IEEE Transactions on
Automatic Control. 45: 2253-2270 p.
Block, D. J. 1996. Mechanical design and control of the pendubot. Tesis de maestría. Uni-
versity of Illinois. Urbana-Champaign. 65 p.
Canudas de Wit, C., Olsson, H., Astrom, K. J. y Lischinsky, P. 1995. A new model for
control of systems with friction. IEEE Transactions on Automatic Control. 40(3): 419-
425 p.
Do, K. D., Jiang, Z. P., y Pan, J. 2002. Universal controllers for stabilization and tracking
of underactuated ships. Systems & Control Letters. 47: 299-317 p.
Gómez-Estern, F., y van der Schaft, A. J. 2004. Physical damping in IDA-PBC controlled
underactuated mechanical systems. European Journal of Control. 10(5): 451-468 p.
Khalil, H. K. 2002. Nonlinear systems. Prentice Hall. Tercera Edición. New Jersey. 750 p.
Martinez, R., y Alvarez, J. 2007. A Controller for 2-DOF Underactuated Mechanical Sys-
tems with Discontinuous Friction. Nonlinear Dynamics. DOI 10.1007/s11071-007-9307-
1.
63
Orlov, Y. 2005. Finite time stability and robust control synthesis of uncertain switched
systems. SIAM J. Control Optim. 43: 1253-1271 p.
Qu, Z. 1998. Robust control of nonlinear uncertain systems. John Wiley and Sons, Inc.
New York. 527 p.
Reyhanoglu, M., van der Schaft, A., McClamroch, M. H., y Kolmanovsky, I. 1999. Dy-
namics and control of a class of underactuated mechanical systems. IEEE Transactions
on Automatic Control. 44: 1663-1671 p.
Riachy, S., Floquet, T., Orlov, I., y Richard, J. P. 2006. Stabilization of the cart-pendulum
system via quasi-homogeneous switched control. En: Proceedings of the 2006 Interna-
tional Workshop on Variable Structure Systems. Alghero. 5-7 de junio.
Shiriaev, A., Perram, J. W., y Canudas de Wit, C. 2005. Constructive tool for orbital stabi-
lization of underactuated nonlinear systems: Virtual constraints approach. IEEE Trans-
actions on Automatic Contol. 50: 1164-1176 p.
Spong, M.W. 1995. The Swing Up Control Problem For The Acrobot. IEEE Control Sys-
tems. 15(1): 49-55 p.
Utkin, V. I. 1992. Sliding modes in control optimization. Springer Verlag. Berlin. 286 p.
Woolsey, C. A., Bloch, A. M., Leonard, N. E., y Marsden, J. E. 2001. Physical dissipation
and the method of controlled Lagrangians. En: Proceedings of the European Control
Conference. Porto. 4-7 de septiembre.
64
Woolsey, C., Bloch, A. M., Leonard, N. E., Reddy, C. K., Chang, D. E., y Marsden, J. E.
2004. Controlled Lagrangian systems with gyroscopic forcing and dissipation. Euro-
pean Journal of Control. 10(5): 478-496 p.