Sunteți pe pagina 1din 73

TESIS DEFENDIDA POR

Roque Martínez Ortiz


Y APROBADA POR EL SIGUIENTE COMITÉ

Dr. Joaquín Álvarez Gallegos


Director del Comité

Dr. Iouri Orlov Kuchina Dr. Luis Alejandro Marquez Martínez


Miembro del Comité Miembro del Comité

Dr. Jaime Álvarez Gallegos Dr. Luis Tupak Aguilar Bustos


Miembro del Comité Miembro del Comité

Dr. Luis Alejandro Marquez Martínez Dr. David Hilario Covarrubias Rosales

Coordinador del programa de posgrado Encargado del Despacho de la


en Electrónica y Telecomunicaciones Dirección de Estudios de Posgrado

7 de diciembre de 2007
CENTRO DE INVESTIGACIÓN CIENTÍFICA Y DE EDUCACIÓN SUPERIOR
DE ENSENADA

PROGRAMA DE POSGRADO EN CIENCIAS


EN ELECTRÓNICA Y TELECOMUNICACIONES

CONTROL DE SISTEMAS MECÁNICOS SUBACTUADOS CON FRICCIÓN


DISCONTINUA

TESIS

que para ubrir par ialmente los requisitos ne esarios para obtener el grado de

DOCTOR EN CIENCIAS

Presenta:

ROQUE MARTÍNEZ ORTIZ

Ensenada, Baja California, Méxi o, di iembre de 2007.


RESUMEN de la tesis de Roque Martínez Ortiz, presentada como requisito parcial para
la obtención del grado de DOCTOR EN CIENCIAS en ELECTRÓNICA Y
TELECOMUNICACIONES, con orientación en INSTRUMENTACIÓN Y CONTROL.
Ensenada, Baja California, México. Diciembre de 2007.

CONTROL DE SISTEMAS MECÁNICOS SUBACTUADOS CON FRICCIÓN


DISCONTINUA

Resumen aprobado por:

__________________________
Dr. Joaquín Álvarez Gallegos
Director de tesis

Es frecuente que en el diseño de controladores para sistemas mecánicos


subactuados se considere despreciable un fenómeno físico no lineal y no suave o duro: la
fricción. La presencia de este fenómeno puede producir comportamientos dinámicos no
tradicionales como intervalos de equilibrios, variedades deslizantes, ciclos límite,
bifurcaciones y caos.
En años recientes, algunos trabajos en el campo del control de sistemas subactuados
se han dirigido al problema de la fricción en las articulaciones. Sin embargo, estos
esfuerzos se han concentrado en el problema de fricción viscosa.
En esta tesis proponemos controladores para sistemas mecánicos subactuados de 2
g.d.l. con fricción discontinua. Los controladores llevan la articulación no actuada a la
posición deseada sin cancelar directamente este fenómeno físico, y son robustos con
respecto a algunas incertidumbres en los coeficientes de los términos discontinuos. Los
controladores son diseñados utilizando la técnica de control por modos deslizantes, algunos
resultados que extienden la teoría de estabilidad de Lyapunov y las condiciones para tener
estabilidad en tiempo finito de una clase de sistemas discontinuos con incertidumbres
presentadas recientemente. Las leyes de control obtenidas son discontinuas o híbridas.
Otra aportación es un control continuo para sistemas mecánicos con fricción
discontinua y control pleno obtenido utilizando los resultados anteriores.
Ilustramos estos procedimientos con ejemplos numéricos y físicos.

Palabras clave: fricción discontinua, sistemas mecánicos subactuados, estabilidad


asintótica.
ABSTRACT of the thesis presented by Roque Martínez Ortiz as a partial requirement to
obtain the DOCTOR OF SCIENCE degree in ELECTRONICS AND
TELECOMMUNICATIONS with orientation in INSTRUMENTATION AND
CONTROL. Ensenada, Baja California, México. December 2007.

CONTROL OF UNDERACTUATED MECHANICAL SYSTEMS WITH


DISCONTINUOUS FRICTION

Works in the field of underactuated mechanical control have commonly neglected a


nonlinear and nonsmooth, physical phenomenon: friction. This phenomenon may produce
nontraditional dynamics as equilibrium intervals, sliding modes, limit cycles, bifurcations,
and chaos.
In recent years, several works have addressed the problem of friction in the
underactuated mechanical systems. However, these efforts have been concentrated to cope
only with viscous friction.
In this thesis, we propose controllers for 2-DOF underactuated mechanical systems
with discontinuous friction. The control objetive is that of steering the unactuated joint to a
desired position. The proposed controllers do not cancel this physical phenomenon directly,
and they are robust with respect to some uncertainty in the discontinuous friction
coefficients. The controllers are designed using the classic technique of sliding modes,
some results that extend the Lyapunov stability, and the conditions to have finite time
stability of a class of uncertain switched systems presented recently. The control laws are
discontinuous or hybrid.
Another contribution is the design of a continuous control for a class of mechanical
systems with discontinuous friction and full control using the results mentioned before.
We illustrate these procedures with numerical and physical examples.

Keywords: asymptotic stability, discontinuous friction, underactuated mechanical systems.


A Doris, Daniela y Leonardo.
Agradecimientos

A mi familia, como siempre.

Al Dr. Joaquín Álvarez Gallegos por todo.

A los Doctores Iouri Orlov Kuchina, Luis Alejandro Márquez Martínez, Jaime Álvarez
Gallegos y Luis Tupak Aguilar Bustos.

Al Centro de Investigación Científica y de Educación Superior de Ensenada.

Al Consejo Nacional de Ciencia y Tecnología.


Contenido

Página

I. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
I.1 Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
I.3 Contenido de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

II. Preliminares matemáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7


II.1 Definición del convexo más simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8
II.2 Estabilidad en el sentido de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11
II.3 Estabilidad equiuniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14
II.4 Sistemas mecánicos subactuados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

III. Control de un manipulador planar subactuado con fricción . . . . . . . . . . . . . . . 18


III.1 Diseño de la ley de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18
III.2 Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
III.3 Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23

IV. Control de sistemas subactuados con fricción discontinua I . . . . . . . . . . . . . . . .25


IV.1 Planteamiento de problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
IV.2 Resultado principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29
IV.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34
IV.4 Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39

V. Control continuo de sistemas discontinuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41


V.1 Diseño de la ley de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42
V.2 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .45
V.3 Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47
Contenido (continuación)

Página

VI. Control de sistemas subactuados con fricción discontinua II . . . . . . . . . . . . . . .49


VI.1 Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49
VI.2 Resultado principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51
VI.3 Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
VI.4 Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .58

VII. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
VII.1 Trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .60

Literatura citada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Lista de Figuras

Figura Página

1. Interpretación geométrica de la definición de solución del convexo más simple. . . . 10


2. Intersección de superficies de discontinuidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3. Manipulador planar subactuado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4. Posiciones y ley de control del manipulador.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5. Sistema masa-resorte-amortiguador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
6. Posiciones y velocidades del sistema masa-resorte-amortiguador. . . . . . . . . . . . . . . . . . 36
7. Ley de control y función V para el sistema masa-resorte-amortiguador. . . . . . . . . . . . 37
8. Sistema masa y viga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
9. Posiciones y velocidades del sistema masa y viga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
10. Ley de control y función V del sistema masa y viga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
11. Oscilador mecánico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
12. La posición y velocidad del oscilador mecánico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
13. Entrada de control y función V para el oscilador mecánico. . . . . . . . . . . . . . . . . . . . . . . 47
14. Posiciones y velocidades del sistema masa-resorte-amortiguador. . . . . . . . . . . . . . . . . . 48
15. Péndulo horizontal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
16. Posiciones y control del péndulo horizontal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
17. Posiciones y control del péndulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Capítulo I
Introducción

Aunque la mecánica es un tema clásico cuyo estudio data desde la antigüedad, mu-

chos problemas, viejos y nuevos, siguen atrayendo la atención. En años recientes, muchas

aplicaciones en el control de sistemas mecánicos acentúan cuestiones que fueron ignoradas

en planteamientos clásicos, como son: dinámica elástica, fuerzas de fricción, etc.

De manera simple, un sistema mecánico es una colección de elementos materiales

formalmente organizados interactuando a través de fuerzas que producen varios movimien-

tos en respuesta a fuerzas y pares de torsión externos diferentes. Así, un sistema mecánico

se puede ver como un sistema de control con las fuerzas externas como las entradas, las

variables que describen los movimientos de los elementos del sistema como los estados, y

las dinámicas que son determinadas por la interacción de fuerzas actúan como puentes entre

variables y entradas. Las salidas de un sistema mecánico son funciones de sus estados.

En Seto y Baillieul (1994), dependiendo del número de entradas y el número de los

grados de libertad del sistema mecánico, se define el llamado sistema mecánico subactuado

o superarticulado como un sistema mecánico controlado en el cual la dimensión del espacio

de configuración excede la dimensión del espacio de la entrada de control.

El problema del control de sistemas subactuados está motivado por numerosas apli-

caciones prácticas. En primer lugar se esgrime el sólido argumento de la economía de

diseño; por ejemplo, un avión es un sistema subactuado. Otras aplicaciones surgen por la

propia disposición física del sistema; por ejemplo, en el diseño de vehículos submarinos,

misiles, satélites de comunicaciones y robots bípedos (Gómez-Estern, 2002).


2

En general, un sistema mecánico subactuado presenta desafíos que no se encuentran

en un sistema con control pleno en el cual la dimensión del espacio de configuración es

igual a la dimensión del espacio de la entrada de control. La controlabilidad, por ejemplo,

que es normalmente implícita en un sistema con control pleno, al menos localmente, no es

determinada fácilmente en un sistema subactuado. La síntesis del control para un sistema

subactuado también es más compleja que para un sistema con control pleno.

Las dinámicas bajo restricción constituyen una propiedad interesante de los sistemas

mecánicos subactuados. Las restricciones pueden ser expresadas como ecuaciones diferen-

ciales con las coordenadas generalizadas y sus derivadas con respecto al tiempo (veloci-

dades y/o aceleraciones). Si la restricción es no integrable es llamada no holonómica.

Las restricciones no holonómicas son clasificadas como cinemáticas y dinámicas.

Las cinemáticas restringen geométricamente la dirección de movilidad del sistema, mien-

tras que las dinámicas son debidas al equilibrio dinámico en el grado de libertad pasivo

donde no es aplicada una fuerza o par de torsión (Arai et al., 1998).

El péndulo invertido, el sistema bola y viga y el manipulador con articulación elás-

tica, que son sistemas mecánicos subactuados clásicos, son sistemas holonómicos (Seto y

Baillieul, 1994).

Un simple disco sobre una superficie (Török, 2000), robots móviles (Kolmanovsky y

McClamroch, 1995) y vehículos articulados (Jiang y Nijmeijer, 1999) son sistemas mecáni-

cos que tienen restricciones no holonómicas cinemáticas. Ejemplos de sistemas subactua-

dos con restricciones no holonómicas dinámicas o relaciones de aceleraciones no inte-


3

grables (Reyhanoglu et al., 1999) incluyen robots manipuladores subactuados (Oriolo y

Nakamura, 1991), vehículos marinos subactuados (Do et al., 2002) y el Acrobot (Spong,

1995).

Es frecuente que en el diseño de controladores para sistemas mecánicos se con-

sidere despreciable un fenómeno físico no lineal y no suave o duro: la fricción. En tri-

bología, la fricción seca (fricción discontinua) es definida como una fuerza que se opone

al movimiento relativo entre dos superficies de diferentes cuerpos en contacto. Los cuer-

pos se “atascan” (“stick”) cuando la velocidad relativa entre las superficies en contacto es

cero. Si los cuerpos se deslizan con velocidad relativa no cero, decimos que se “resbalan”

(“slip”). Un modelo de fricción seca debe describir la fase de stick y slip (Leine, 2000).

La acción de la fricción discontinua puede ser descrito por medio de inclusiones diferen-

ciales o ecuaciones diferenciales ordinarias con lado derecho discontinuo (Utkin, 1992),

(Filippov, 1988).

La presencia de discontinuidades en sistemas mecánicos pueden producir compor-

tamientos dinámicos no tradicionales como intervalos de equilibrios, variedades deslizantes,

ciclos límite, bifurcaciones y caos (Armstrong y Amin, 1996). Por lo tanto, surge la necesi-

dad de analizar la variedad de estados estacionarios que pueden presentar y diseñar estrate-

gias de control que corrijan el comportamiento no deseado.

I.1 Antecedentes

Algunos artículos representativos que analizan algunos problemas acerca de sistemas sub-

actuados incluye el estudio de accesibilidad (Reyhanoglu et al., 1999), estabilización del


4

equilibrio por medio de técnicas de pasividad (Ortega et al., 2002) y moldeo de energía

(Bloch et al., 2000), estabilización y seguimiento de trayectorias por medio de control

“backstepping” (Seto y Baillieul, 1994), el uso de restricciones virtuales para producir os-

cilaciones estables (Shiriaev et al., 2005), planificación de trayectorias (Bullo y Lynch,

2001), y control de sistemas mecánicos con una variable no actuada cíclica (Grizzle et

al., 2005), entre otros.

Comúnmente los trabajos en el campo del control de sistemas mecánicos subactua-

dos ignoran el efecto de la fricción. Los términos de fricción no son modelados y los

algoritmos se reducen a resolver el problema de control para un modelo en lazo abierto sin

fricción, esperando que la disipación física ayude, de alguna manera, a alcanzar el punto

de equilibrio deseado. Sin embargo, en años recientes algunos trabajos se han dirigido al

problema de la fricción. En Gómez-Estern y van der Shaft (2004), Woolsey et al. (2001),

Woolsey et al. (2004) se considera fricción lineal (fricción viscosa) en las articulaciones de

sistemas subactuados.

En Woolsey et al. (2001) se describe el efecto de la disipación física en la estabi-

lidad de un equilibrio, estable en ausencia de la fricción, con el método de lagrangianos

controlados. En ese trabajo se sugiere el uso de retroalimentación de amortiguamiento para

estabilizar exponencial y localmente una clase de sistemas lagrangianos controlados. En

Gómez-Estern y van der Shaft (2004) fue extendida la técnica (IDA-PBC) para sistema

mecánicos subactuados para incorporar amortiguamiento en lazo abierto. Además, en este

documento se presentan las condiciones para recuperar la estabilidad a través de inyección


5

de amortiguamiento en presencia de aproximaciones suaves de los efectos de la fricción de

Coulomb.

Para sistemas mecánicos subactuados con fricción discontinua sólo en las articula-

ciones actuadas, el problema de compensación, en algunos casos, puede ser resuelto u-

sando control discontinuo (Riachy et al., 2006). Sin embargo, el problema importante de

control de sistemas mecánicos subactuados con fricción discontinua en las articulaciones

no actuadas aún sigue abierto.

En este trabajo de tesis se proponen varias técnicas para controlar sistemas mecánicos

de esta clase.

I.2 Objetivos

El objetivo general de este trabajo es contribuir a resolver el problema de control de sis-

temas mecánicos subactuados que presentan fricción discontinua en las articulaciones no

actuadas.

Los objetivos particulares de este trabajo son:

• Diseñar leyes de control para regular la articulación no actuada de un manipulador

planar subactuado de 2 grados de libertad (g.d.l.), cuando éste presenta fricción

viscosa y de Coulomb en las dos articulaciones.

• Diseñar leyes de control para regular la articulación no actuada, para algunas

clases de sistemas mecánicos subactuados de 2 g.d.l. con fricción discontinua en la

articulación no actuada.
6

Consideramos que éstos son dos casos típicos encontrados en prototipos mecánicos

(los cuales exhiben un comportamiento dinámico desplegado por mecanismos más compli-

cados). En esta tesis, los sistemas considerados son prototipos mecánicos.

I.3 Contenido de la tesis

Puesto que en esta tesis se considerarán sistemas mecánicos subactuados con fricción dis-

continua, en el Capítulo II se da la definición de solución para ecuaciones diferenciales

ordinarias con términos discontinuos en el lado derecho y de algunos conceptos de estabi-

lidad utilizados a lo largo de la tesis. Además, se presenta la definición formal de sistema

mecánico subactuado considerada en esta tesis.

En el Capítulo III proponemos un primer controlador para un sistema mecánico sub-

actuado de 2 g.d.l. con fricción viscosa y de Coulomb en las dos articulaciones. Este

sistema es un manipulador planar. El controlador es diseñado utilizando la técnica de con-

trol por modos deslizantes.

Un procedimiento de diseño de controladores para una clase de sistemas mecáni-

cos subactuados con fricción discontinua en la articulación no actuada se presentan en los

capítulos IV y V. Además, en el Capítulo V se propone un control continuo para sistemas

mecánicos con fricción discontinua y control pleno.

Resultados recientes en sistemas discontinuos con incertidumbres son utilizados en el

Capítulo VI, para diseñar un controlador para otra clase de sistemas mecánicos subactuados

con fricción discontinua.

Finalmente, las conclusiones son incluidas en el Capítulo VII.


Capítulo II
Preliminares matemáticos

Muchos sistemas físicos pueden ser descritos por la ecuación de estado

ẋ = f (t, x), (1)

donde x ∈ Rn es el vector de estado con la condición inicial x(t0 ) = x0 , ẋ = dx/dt y

f : R × Rn → Rn es un campo vectorial.

La existencia y unicidad de las soluciones de (1) son esenciales para que esta ecuación

sea un modelo matemático útil de un sistema físico. A continuación se presentan las condi-

ciones para garantizar la existencia y unicidad de soluciones de (1) en el sentido usual.

Teorema 1 (Existencia y unicidad de solución local) (Khalil, 2002) Sea f (t, x) una fun-

ción continua a tramos en t y que satisface la condición de Lipschitz

kf (t, x) − f (t, y)k ≤ L kx − yk (2)

∀x, y ∈ B = {x ∈ Rn |kx − yk < r }, ∀t ∈ [t0 , t1 ]. Entonces existe alguna δ > 0 tal que

la ecuación ẋ = f (t, x) con x(t0 ) = x0 tiene solución única sobre [t0 , t0 + δ].

Teorema 2 (Existencia y unicidad de solución global) (Khalil, 2002) Sea f (t, x) una

función continua por tramos en t que satisface (2) ∀x, y ∈ Rn , ∀t ∈ [t0 , t1 ]. Entonces la

ecuación ẋ = f (t, x) con x(t0 ) = x0 tiene solución única sobre [t0 , t1 ].

Los sistemas bajo estudio en esta tesis se pueden describir por medio de la ecuación

(1) donde ahora f es una función continua a tramos en un dominio G; x ∈ Rn y M es un

conjunto (de medida cero) de puntos de discontinuidad de la función f .


8

Para analizar esta ecuación es necesario investigar la existencia y unicidad de sus

soluciones. A continuación se presenta una definición de solución más general, presentada

en (Filippov, 1988), y que será utilizada a lo largo de esta tesis.

II.1 Definición del convexo más simple

Considérese que para cada punto (t, x) ∈ G, el conjunto F (t, x) es el conjunto cerra-

do convexo más simple conteniendo todos los valores límite de la función f (t, x∗ ) para

(t, x∗ ) ∈
/ M, x∗ → x, t =const.

Entonces, una solución de la ecuación (1) es llamada una solución de la inclusión

diferencial

ẋ ∈ F (t, x), (3)

es decir, una función absolutamente continua x(t) definida en un intervalo o en un segmento

I para el cual ẋ(t) ∈ F (t, x(t)) casi donde sea en I. Puesto que M es un conjunto de

medida cero, entonces para casi todo t ∈ I la medida de la sección transversal del conjunto

M por el plano t =const es igual a cero. Para tal t el conjunto F (t, x) es definido para

todo (t, x) ∈ G.

En puntos de continuidad de la función f el conjunto F consiste de un punto f (t, x), y

la solución satisface la ecuación (1) en el sentido usual. Si el punto (t, x) ∈ M se encuentra

en la frontera de la sección transversal de dos o varios dominios G1 , ..., Gk intersectada por

el plano t =const, el conjunto F (t, x) es un segmento, un polígono convexo, o un poliédro


9

con vértices fi (t, x), i ≤ k, donde

fi (t, x) = lim f (t, x∗ ). (4)


(t,x∗ )∈Gi ,x∗ →x

Todos los puntos fi (t, x) (i = 1, ..., k) están contenidos en F (t, x), pero no es nece-

sario que todos ellos sean vértices.

Considérese el caso donde la función f (t, x) es discontinua en una superficie suave

S definida por la ecuación ϕ(x) = 0. La superficie S divide su vecindad en el espacio x en

los dominios G− y G+ . Para t =const y para el punto x∗ aproximándose al punto x ∈ S

desde los dominios G− y G+ , definimos los valores límite de la función f (t, x∗ ) como

f − (t, x) = lim f (t, x∗ ), f + (t, x) = lim f (t, x∗ ). (5)


x∗ ∈G− ,x∗ →x x∗ ∈G+ ,x∗ →x

Entonces el conjunto F (t, x) es un segmento lineal que une los puntos finales de los

vectores f − (t, x) y f + (t, x) que inician en el punto x.

Si para t1 < t < t2 este segmento se encuentra en un lado del plano P tangente a la

superficie en el punto x, las soluciones para estos t pasan de un lado de la superficie S al

otro (Figura 1(a)).

Si este segmento intersecta el plano P , el punto de intersección es el punto final del

vector f 0 (t, x) que determina la velocidad de movimiento ẋ = f 0 (t, x) a lo largo de la

superficie S en el espacio x (figura 1(b)). Esto significa que la función x(t) que satisface la

ecuación

ẋ = f 0 (t, x) (6)

es una solución de la ecuación (1) por la definición (3). Si f 0 6= f − , f 0 6= f + , tal solución

es llamada un movimiento deslizante. Una función continua x(t), que en una parte del
10

Figura 1. Interpretación geométrica de la definición de solución del convexo más


simple.

intervalo de tiempo bajo consideración se encuentra en el dominio G− (o en G+ ) satisfa-

ciendo la ecuación (1), y en el resto del intervalo se encuentra en la superficie S satisfacien-

do la ecuación (6) es, desde luego, también una solución de la ecuación (1) en el sentido de

la definición (3).

Si todo el segmento con los puntos finales de f − y f + se encuentra en el plano P, la

velocidad f 0 , del movimiento a lo largo de la superficie S, no es única.

Con base en la definición (3), podemos encontrar también la velocidad de movimiento

a lo largo de la intersección de superficies de discontinuidad (Figura 2). Esta velocidad

puede ser única o no, dependiendo de si el conjunto F (t, x) tiene uno o más puntos co-

munes con la tangente a esta intersección.

A continuación presentamos los conceptos de estabilidad manejados en esta tesis,

definidos con respecto a los puntos de equilibrio establecidos por esta definición de solu-

ción.
11

Figura 2. Intersección de superficies de discontinuidad.

II.2 Estabilidad en el sentido de Lyapunov

El método directo de Lyapunov, que prueba si un punto de equilibrio es estable en el sentido

de Lyapunov, se presenta de la siguiente manera (Qu, 1998), (Khalil, 2002).

Considere que el sistema (1) tiene como equilibrio al origen xe = 0 ∈ Rn .

Definición 3 El punto de equilibrio xe = 0 de (1) es:

• Estable al tiempo t0 si, para cada ε > 0, existe una constante δ > 0 que puede

depender de t0 y ε tal que

kx(t0 )k < δ(t0 , ε) =⇒ kx(t)k ≤ ε, ∀t ≥ t0 .

Es uniformemente estable en [t0 , ∞) si, para cada ε > 0, el valor de δ es

independiente del tiempo inicial t0 .

• Inestable si no es estable.

Definición 4 El punto de equilibrio xe = 0 se dice ser atractivo al tiempo t0 si, para

alguna δ > 0 y cada ε > 0, existe un intervalo de tiempo finito T (t0 , δ, ε) tal que

kx(t0 )k < δ =⇒ kx(t)k ≤ ε, ∀t ≥ t0 + T (t0 , δ, ε).


12

Es uniformemente atractivo en [t0 , ∞) si para todo ε, que satisface 0 < ε < δ, el intervalo

de tiempo finito es independiente del tiempo inicial t0 .

Definición 5 Un punto de equilibrio xe = 0 es asintóticamente estable al tiempo t0 si es

estable al tiempo t0 y si es atractivo, o equivalentemente si existe alguna δ > 0 tal que

kx(t0 )k < δ implica que x(t) → 0 cuando t → ∞. Es uniformemente asintóticamente

estable en [t0 , ∞) si éste es uniformemente estable en [t0 , ∞) y si x = 0 es uniformemente

atractivo.

Definición 6 El punto de equilibrio xe = 0 al tiempo t0 es exponencialmente atractivo si,

para alguna δ > 0 existen constantes α(δ) > 0 y β > 0 tal que

kx(t0 )k < δ =⇒ kx(t)k ≤ α(δ)e−β(t−t0 ) .

Es exponencialmente estable si, para alguna δ > 0 existen dos números estrictamente

positivos α y β tales que

kx(t0 )k < δ =⇒ kx(t)k ≤ α(δ) kx(t0 )k e−β(t−t0 ) .

Definición 7 Una función continua γ 0 : R+ → R+ es una función de clase k si γ 0 (0) = 0

y si es estrictamente monótona creciente. Se dice que es de clase k∞ si γ 0 (p) → ∞ cuando

p → ∞.

Definición 8 Una función V (t, x) : R × Rn → R se llama localmente definida positiva

si existe una función de clase k, γ 1 : R+ → R+ , tal que para alguna vecindad del origen

Ω ⊂ Rn se cumple que

γ 1 (kx(t)k) ≤ V (t, x), ∀(t, x) ∈ Ω × R+ .


13

La función V (t, x) se dice localmente decreciente si existe una función de clase k, γ 2 :

R+ → R+ tal que, para alguna vecindad alrededor del origen Ω ⊂ Rn se satisface

V (t, x) ≤ γ 2 (kx(t)k) , ∀(t, x) ∈ Ω × R+ .

La palabra “localmente” es reemplazada por “globalmente” si Ω = Rn . La función

V (t, x) es radialmente no acotada si γ 1 es una función de clase k∞ .

Definición 9 Una función V (t, x(t)) : R × Rn → R es una función candidata de Lya-

punov si es continuamente diferenciable y si

• Para concluir estabilidad, V (t, x(t)) debe ser definida positiva.

• Para concluir estabilidad asintótica o estabilidad exponencial, V (t, x(t)) debe ser

definida positiva y decreciente.

• Para concluir estabilidad global, V (t, x(t)) debe ser globalmente definida positiva

y radialmente no acotada.

• Para concluir estabilidad asintótica uniforme y global o estabilidad exponencial

global, V (t, x(t)) debe ser globalmente definida positiva, globalmente decreciente y

radialmente no acotada.

Teorema 10 Considere la ecuación (1) tal que, para cualquier conjunto acotado D ⊂Rn

la función f (·) mapea D×R+ a conjuntos acotados en Rn . Suponga que la derivada

temporal de V (t, x(t)) a lo largo de la solución de (1) tiene la propiedad que, para toda
14

(t, x(t)) ∈ R+ × Ω se tiene que

V̇ (t, x(t)) ≤ −γ 3 (kx(t)k),

donde γ 3 (·) es continua y no negativa, con γ 3 (0) = 0. Entonces el equilibrio xe del sistema

tiene las siguientes propiedades de estabilidad:

• Es global o localmente uniformemente estable si γ 3 es semidefinida positiva.

• Es uniforme y asintóticamente estable en forma global o local si γ 3 es definida

positiva.

• Es exponencialmente estable en forma local o global si γ 3 (kx(t)k) ≥ λV (t, x) para

alguna constante λ > 0 o si γ i (kx(t)k) = λi kx(t)k2 para i = 1, 2, 3 y algunas

constantes positivas λi .

• Es exponencialmente estable en forma global o local con convergencia en tiempo

finito si γ 3 (kx(t)k) ≥ λV (t, x)P para constantes λ > 0 y 0 < p < 1.

II.3 Estabilidad equiuniforme

En esta tesis, además de la ecuación (1) consideraremos su versión perturbada

ẋ = f (t, x) + ψ(t, x), (7)

donde ψ es una función continua a tramos cuyos componentes ψ i , ..., ψ n son acotados local

y uniformemente dentro de una bola Bδ , con centro en el origen con radio δ; es decir,

|ψ i (t, x)| ≤ Mi , i = 1, ..., n, (8)


15

para casi todo (t, x) ∈ Bδ × R y algunas constantes Mi ≥ 0. A continuación se presenta

un concepto de solución para esta ecuación diferencial con incertidumbres (Orlov, 2005).

Definición 11 Una función absolutamente continua x(·), definida en un intervalo I, es

una solución de la ecuación diferencial con incertidumbres (7)-(8) si y sólo si es una solu-

ción de (7) en el intervalo I en el sentido de Filippov para alguna función continua a

tramos ψ sujeta a (8).

Se debe señalar que el sistema con incertidumbres (7)-(8) puede ser representado

como una inclusión diferencial de la forma

ẋ ∈ F (t, x) + Ψ, (9)

donde F (t, x) es la construida de acuerdo a la definición de solución de Filippov, Ψ es el

producto Cartesiano de los intervalos Ψi = [−Mi , Mi ] , i = 1, ..., n, y el conjunto

F (t, x) + Ψ = {f + ψ : f ∈ F (t, x), ψ ∈ Ψ} .

Ahora se presenta el concepto de estabilidad equiuniforme (Orlov, 2005).

Definición 12 El punto de equilibrio x = 0 del sistema con incertidumbres (7)-(8) es

equiuniformemente estable si y sólo si para cada t0 ∈ R, ε > 0, existe δ = δ(ε) > 0,

dependiendo de ε e independiente de t0 y ψ, tal que cada solución xψ (·, t0 , x0 ) de (7)-(8)

con el dato inicial x0 = x(t0 ) ∈ Bδ existe en el intervalo de tiempo semi-infinito [t0 , ∞) y

satisface la desigualdad

° ¡ ¢°
°xψ t, t0 , x0 ° < ε para todo t ∈ [t0 , ∞) .
16

Definición 13 El punto de equilibrio x = 0 del sistema con incertidumbres (7)-(8) es

equiuniforme y asintóticamente estable si es equiuniformemente estable y la convergencia

° ¡ ¢°
lim °xψ t, t0 , x0 ° = 0 (10)
t→∞

se cumple para toda soluciones de (7)-(8) iniciando dentro de alguna Bδ , uniformemente en

el dato inicial t0 y x0 , y todas las soluciones xψ (·, t0 , x0 ). Si esta convergencia permanece

en vigor para cada δ > 0, el punto de equilibrio es global, equiuniforme y asintóticamente

estable.

Definición 14 El punto de equilibrio x = 0 del sistema con incertidumbres (7)-(8) es

global, equiuniformemente estable en tiempo finito si, además de la estabilidad global,

equiuniforme y asintótica, la relación límite

¡ ¢
xψ t, t0 , x0 = 0 (11)

se cumple para cada solución xψ (·, t0 , x0 ) y toda t ≥ t0 + T (t0 , x0 ), donde la función de

ajuste de tiempo

© ¡ ¢ ª
T (t0 , x0 ) = sup inf T ≥ 0 : xψ t, t0 , x0 = 0 para todo t ≥ t0 + T (12)
xψ (·,t0 ,x0 )

es tal que

T (Bδ ) = sup T (t0 , x0 ) < ∞ para δ > 0.


t0 ∈R,x0 ∈Bδ

En la siguiente sección se presenta la definición formal de sistema mecánico subac-

tuado considerada en esta tesis.


17

II.4 Sistemas mecánicos subactuados

La comunidad de control de sistemas mecánicos ha dividido sus líneas de trabajo en dos

enfoques con un alto grado de paralelismo: los sistemas lagrangianos y los sistemas hamil-

tonianos. Pese existir una equivalencia entre ambos enfoques y poder expresar el modelo

lagrangiano en forma hamiltoniana, las formulaciones han sido generalizadas hasta el punto

en que no es evidente su equivalencia, y por lo tanto tampoco son intercambiables las téc-

nicas de control desarrolladas en uno u otro enfoque.

En esta tesis se propondrán controladores para sistemas mecánicos subactuados la-

grangianos de 2 grados de libertad con fricción discontinua en las articulaciones. Formal-

mente se dice que son subactuados los sistemas de n grados de libertad y r < n actuadores

cuyas ecuaciones de Lagrange toman la forma


µ ¶
d ∂L ∂L
− + ff i = ui , i = 1, ..., r (13)
dt ∂ q̇i ∂qi
µ ¶
d ∂L ∂L
− + ff i = 0, i = r + 1, ..., n (14)
dt ∂ q̇i ∂qi

con

L = T (q1 , ..., qn , q̇1 , ..., q̇n ) − V (q1 , ..., qn )

donde qi , i = 1, ..., n, son las coordenadas generalizadas del sistema, ff i , i = 1, ..., n son

términos discontinuos debidos a las fricciones discontinuas, L es la función de Lagrange,

T (q, q̇) y V (q) es la energía cinética y potencial respectivamente.

En el siguiente capítulo, se presenta un controlador para un manipulador planar sub-

actuado con dos articulaciones.


Capítulo III
Control de un manipulador planar subactuado con
fricción

En este capítulo proponemos un controlador para un manipulador planar subactuado

de 2 g.d.l., con movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb

en las dos articulaciones. El controlador no cancela directamente este fenómeno físico ni

requiere los valores exactos de los coeficientes de fricción de Coulomb. La articulación

no actuada es llevada a la posición deseada mientras que la actuada terminará en una posi-

ción desconocida. El controlador es diseñado utilizando la técnica de control por modos

deslizantes y se concluye estabilidad asintótica local del punto de equilibrio deseado.

III.1 Diseño de la ley de control

Considere el manipulador planar subactuado de 2 eslabones (Figura 3) con movimiento

sólo en el plano horizontal, con fricción viscosa y de Coulomb en las dos articulaciones.

Las ecuaciones dinámicas que modelan el sistema pueden presentarse como:

M(q)q̈ + C(q, q̇)q̇ + ff (q̇) = u (15)

donde
· ¸ · ¸
q1 u1
q= , u= ,
q2 0
· ¸
θ1 + θ2 + 2θ3 cos(q2 ) θ2 + θ3 cos(q2 )
M(q) = ,
θ2 + θ3 cos(q·2 ) θ2 ¸
−q̇2 −q̇2 − q̇1
C(q, q̇) = θ3 sen(q2 ) ,
q̇1 0
19

Figura 3. Manipulador planar subactuado.

· ¸ · ¸
ff 1 (q̇1 ) fv1 q̇1 + fc1 sgn(q̇1 )
ff (q̇) = = ,
ff 2 (q̇2 ) fv2 q̇2 + fc2 sgn(q̇2 )

 1 , para z > 0,
sgn(z) = [−1, 1], para z = 0, (16)
 −1 , para z < 0;
con

2
θ1 = m1 lc1 + m2 l12 + I1 2
θ2 = m2 lc2 + I2 θ3 = m2 l1 lc2

θ4 = m1 lc1 + m2 l1 θ5 = m2 lc2

y fvi > 0, fci > 0, para i = 1, 2, son los coeficientes de la fricción viscosa y.de Coulomb

presente en la articulación 1 y 2, respectivamente.

El objetivo de control es regular la posición del eslabón 2 para que sen(q1 + q2 ) = 1

con las velocidades de los dos eslabones iguales a cero.


20

El control u1 será diseñado usando la técnica de control por modos deslizantes clásica.

Note que si sen(q1 + q2 ) = 1 y q̇1 = q̇2 = 0, entonces cos (q1 + q2 ) = q̇1 = 0 y,

puesto que − sen(q1 + q2 )(q̇1 + q̇2 ) = 0, q̇2 = 0.

Si la superficie deslizante tiene la forma

s = q̇1 − k1 cos (q1 + q2 ) , (17)

donde k1 es una constante positiva, entonces la ecuación de la articulación no actuada del

sistema, en el estado x = (x1 , x2 )T , donde x1 = q1 + q2 y x2 = q̇1 + q̇2 , se puede escribir

como

ẋ1 = x2 ,
1
ẋ2 = 2
[m2 l1 lc2 k1 cos (q2 ) sen (x1 ) x2
m2 lc2 + I2
−m2 l1 lc2 k1 sen (q2 ) cos (x1 ) q̇1 − fv2 x2

+fv2 k1 cos (x1 ) − fc2 sgn (x2 − k1 cos (x1 ))] . (18)

Note que si sen(x1 ) tiende a 1 y x2 a cero cuando t tiende a infinito, entonces q̇1 y q̇2 tienden

a cero.

Por lo tanto, el objetivo de control se cumple si encontramos una constante k1 , tal

que el punto de equilibrio (sen (x1 ) , x2 ) = (1, 0) de (18) sea asintóticamente estable.

Considere el sistema (18) descrito como

ẋ1 = x2 ,
1
ẋ2 = 2
[−m2 l1 lc2 k1 sen (q2 ) cos (x1 ) q̇1
m2 lc2 + I2
+fv2 k1 cos (x1 ) − fc2 sgn (x2 − k1 cos (x1 )) − f1 x2 ] , (19)
21

donde f1 = fv2 − m2 l1 lc2 k1 cos (q2 ) sen (x1 ).

Teorema 15 Suponga que k1 , para una constante 0 < γ < 2/π2 , satisface

fv2 > m2 l1 lc2 k1 , (20)


¡ ¢
2
fv2 > k1 m2 lc2 + I2 / (2γ) , (21)

2
£ ¡ 2
¢
fv2 > k1 2m2 l1 lc2 fv2 + m2 lc2 + I2 fv2 − m22 l12 lc2
2
k1
¡ ¢ ¤
2
− m2 lc2 + I2 m2 l1 lc2 k1 + (fv2 + 2m2 l1 lc2 k1 )2 /4 . (22)

Entonces (sen(x1 ), x2 ) = (1, 0) es un punto de equilibrio asintóticamente estable de (19)

en forma local.

Demostración Para el análisis de estabilidad, considérese la siguiente función

1¡ ¢
V1 (x1 , x2 ) = 2
m2 lc2 + I2 x22 − fv2 k1 sen (x1 ) + fv2 k1 + k2 sen (x1 − π/2) x2 (23)
2

donde k2 = k1 (m2 lc2


2
+ I2 ).

Para mostrar que esta función es definida positiva y radialmente desacotada en

−π/2 + 2πi ≤ x1 ≤ 3π/2 + 2πi para i ∈ Z, obsérvese que

1 − sen (x1 ) ≥ γ (x1 − π/2 − 2πi)2 (24)

sen (x1 − π/2) x2 ≥ − |x1 − π/2 − 2πi| |x2 | . (25)

Entonces,
· ¸T · ¸
1 |x1 − π/2 − 2πi| |x1 − π/2 − 2πi|
V1 (x1 , x2 ) ≥ D1 (26)
2 |x2 | |x2 |
22

donde
· ¸
2γfv2 k1 −k2
D1 = 2 .
−k2 m2 lc2 + I2
Por lo tanto, si (21) se satisface, entonces la función (23) es definida positiva y radialmente

desacotada en −π/2 + 2πi ≤ x1 ≤ 3π/2 + 2πi para i ∈ Z.

La derivada temporal de la función (23) a lo largo de las trayectorias del sistema

(19) se puede escribir como


· ¸T · ¸· ¸
q̇1 d211 d212 q̇1
V̇1 (x1 , x2 ) = − − fc2 |x2 − q̇1 | (27)
x2 d212 d222 x2

donde

d211 = fv2 − m2 l1 lc2 k1 sen (q2 ) cos (x1 ) ,

d212 = (m2 l1 lc2 k1 sen (q2 ) cos (x1 ) − f1 ) /2,

d222 = f1 − k2 cos (x1 − π/2) .

Por lo tanto, si (20) y (22) se satisfacen, entonces concluimos que el punto de equilibrio

(sen (x1 ) , x2 ) = (1, 0) es asintóticamente estable en forma local.

En la siguiente sección presentamos la ley de control propuesta y un ejemplo numérico

para mostrar el desempeño del sistema en lazo cerrado.

III.2 Aplicación

La ley de control u1 se obtiene usando la técnica de modos deslizantes clásica. Por lo tanto,

si proponemos la función
1
V2 (s) = s2 , (28)
2
23

la ley de control u1 que nos conduce a

V̇2 (s) ≤ ² |s| , (29)

donde ² > 0 es una constante, es

1 £
u1 = −θ2 θ3 sen (q2 ) (q̇1 + q̇2 )2 − θ23 cos (q2 ) sen (q2 ) q̇12
θ2
+θ2 fv1 q̇1 − (θ2 + θ3 cos (q2 )) fv2 q̇2
¡ ¢ ¤
− θ1 θ2 − θ23 cos2 (q2 ) (k sgn (s) + k1 sen (q1 + q2 ) (q̇1 + q̇2 )) (30)

donde
¡ ¢
k > (θ2 fc1 + (θ2 + θ3 ) fc2 ) / θ1 θ2 − θ23 .

La Figura 4 muestra los resultados numéricos para los parámetros de un Pendubot

presentado en (Block, 1996), es decir, θ1 = 0.08925 kg · m2 , θ2 = 0.02763 kg · m2 ,

θ3 = 0.0235 kg · m2 , θ4 = 0.0112 kg · m, θ5 = 0.00294 kg · m. Además, tenemos que

fv1 = fv2 = 0.2 kg · m2 /s, fc1 = fc2 = 0.005 N · m, γ = 0.20, k = 0.21 y, para que se

cumplan las condiciones del Teorema 15, k1 = 1.

III.3 Conclusiones del capítulo

Proponemos una ley de control discontinua para un manipulador planar subactuado con

movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb en las articu-

laciones. Para el diseño del controlador usamos la técnica de modos deslizantes clásica y

concluimos estabilidad asintótica local del punto de equilibrio deseado. Esta ley de con-

trol no cancela directamente la fricción de Coulomb. Además, puesto que el coeficiente de

fricción viscosa fv2 es mayor que cero, garantizamos la existencia de k1 .


24

3 0.3
q1 q2
2
(rad ) ( rad ) 0.2
1 0.1

0 0

-1 -0.1

-2 -0.2
0 2 4 6 8 10 0 2 4 6 8 10
a) t (s ) b) t (s)
3 1.5
q1+q 2 u1
(rad ) 2 (N m) 1

1 0.5

0 0

-1 -0.5

-2 -1
0 2 4 6 8 10 0 2 4 6 8 10
c) t (s ) d) t (s)

Figura 4. Posiciones y ley de control del manipulador.

Si el movimiento del sistema es en un plano vertical (Pendubot) la presencia de los

pares gravitacionales en el modelo del sistema causa una condición adicional para fv2 .

El análisis y diseño de este primer controlador nos motiva a proponer leyes de con-

trol para sistemas subactuados de 2 g.d.l., que si bien no logren la regulación en ambas

articulaciones, logren la regulación en la articulación no actuada.

En el siguiente capítulo presentamos un algoritmo de control para una clase de sis-

temas subactuados con fricción discontinua en la articulación no actuada.


Capítulo IV
Control de sistemas subactuados con fricción discon-
tinua I

En este capítulo proponemos un controlador para una clase de sistemas mecánicos

subactuados de 2 grados de libertad con fricción discontinua en la articulación no actuada.

El objetivo de control es la regulación de la articulación no actuada mientras que la posición

y la velocidad de la actuada permanecen acotadas. Puesto que la articulación no actuada

es accionada solamente por la posición y velocidad de la actuada, las cuales son conside-

radas continuas, la primera articulación puede ser considerada como un sistema mecánico

con fricción discontinua pero con una entrada de control artificial continua dada por un

término dependiendo de la posición y velocidad de la actuada. Este “control” no puede ser

estático si pretendemos eliminar el error en estado estacionario. Por lo tanto, proponemos

un procedimiento para el diseño de un control ideal virtual y dinámico que garantice un

error en estado estacionario igual a cero, posteriormente se calculará la entrada de control

física en la articulación actuada que lleve el control virtual a su valor ideal en tiempo finito.

Finalmente ilustraremos este procedimiento con dos ejemplos numéricos.

IV.1 Planteamiento de problema

Considere un sistema mecánico subactuado representado por

q̈1 = f0 (q1 , q̇1 , q2 , q̇2 ) + g0 (q1 , q̇1 , q2 , q̇2 ) u1 ,

q̈2 = f1 (q2 , q̇2 ) − C2 (q̇2 ) sgn (q̇2 ) + g1 q1 + g2 q̇1 , (31)


26

donde q1 ∈ R, q2 ∈ R, f0 , g0 , f1 son funciones suaves, g0 6= 0, y u1 es una entrada de

control. C2 (q̇2 ) es el módulo de los términos de fricción, que en general depende de los

estados del sistema y de acciones externas, supuesto, junto con sus derivadas temporales,

acotado. Aquí, de acuerdo a modelos propuestos en algunos trabajos (Bartolini y Punta,

2000b), C2 (q̇2 ) puede ser expresado como

µ 2¶

C2 (q̇2 ) = C2c + (C2s − C2c ) exp − 22 , (32)
v2s

donde C2c y C2s son los niveles de fricción de Coulomb y el nivel de fricción estática que

pueden estar divididos por una masa constante, con 0 ≤ C2c ≤ C2s , y v2s es la veloci-

dad de Stribeck. Note que C2c ≤ C2 (q̇2 ) ≤ C2s . También suponemos que la función

f2 (q2 , q̇2 , q̈2 ) = df1 (q2 , q̇2 ) /dt es continua en sus argumentos, y que g1 y g2 son cons-

tantes. Además, suponemos que g1 6= 0 y, si g2 6= 0, entonces sgn (g1 ) = sgn (g2 ).

El objetivo de control es la regulación de la variable no actuada mientras que la

posición y velocidad de la articulación actuada permanecen acotadas.

Si definimos y1 = q2 − q2d , donde q2d es la posición constante deseada, y2 = q̇2 , y

σ = g1 q1 + g2 q̇1 , (33)

entonces la articulación no actuada es descrita por la ecuación

ẏ1 = y2 ,

ẏ2 = f1 (y1 + q2d , y2 ) − C2 (y2 ) sgn (y2 ) + σ. (34)


27

Note que (34) puede ser descrito como un sistema mecánico con fricción discontinua,

una superficie de discontinuidad S caracterizada por y2 = 0, y un control virtual σ (q1 , q̇1 )

que es continuo por naturaleza (excepto posiblemente cuando señales impulsivas son per-

mitidas en el control u1 , un caso no considerado en la tesis). Por lo tanto, si deseamos

reducir el error y = (y1 , y2 )T a cero, entonces una ley dinámica para σ puede ser adecuada.

Por lo tanto, primero diseñaremos un control “ideal”, continuo dinámico σ ∗ (y, t)

para el sistema (34) que asegure la convergencia del estado y al origen, luego propon-

dremos un control discontinuo u1 para el sistema (31) que haga el control virtual σ con-

verja en tiempo finito a σ ∗ . Denotamos este tiempo finito como t1 . Note que si el estado

y(t) y la aceleración ẏ2 (t) son acotados, entonces σ ∗ también será acotada (esto puede ser

concluido porque f1 es suave) y, de (33), la posición y velocidad de la articulación actuada

permanecen acotadas.

Considere una ley de control virtual σ ∗ con una dinámica dada por

σ̇ ∗ = ϕ (y, σ ∗ ) . (35)

Esto es equivalente a definir un controlador dinámico σ ∗ = ψ(w, y), ẇ = χ(w, y), con

ψ(·) = w y χ(w, y) = ϕ(y, w). Note que σ ∗ debe ser continua, pero no necesariamente ϕ.

El sistema (34)-(35), con σ = σ ∗ , es un sistema de tercer orden con estado (y1 , y2 , σ ∗ ) ∈ R3

el cual, debido a la presencia del término discontinuo, puede tener un conjunto no contable

y compacto como equilibrio (ver (Alvarez et al., 2000)), según la definición de punto de

equilibrio de un sistema discontinuo en el sentido de Filippov (Filippov, 1988). Bajo estas

circunstancias tenemos el siguiente resultado sencillo pero importante.


28

Lema 16 Para cualquier σ ∗ = σ̄ ∗ ∈ R, defínase ϕ(σ̄∗ ,0) (y1 ) = ϕ (y, σ̄ ∗ ), con y =

(y1 , 0)T , como la restricción de ϕ para σ ∗ = σ̄ ∗ , y2 = 0. Por lo tanto, si y1 = 0 es la

única raíz de ϕ(σ̄∗ ,0) = 0, entonces todos los puntos de equilibrios del sistema (34)-(35) se

proyectan en el punto único y = 0 en el plano (y1 , y2 ).

Demostración Un punto de equilibrio del sistema (34)-(35) es dado por

ȳ2 = 0, f1 (ȳ1 + q2d , 0) − C2 (0) sgn(0) + σ̄ ∗ = 0, ϕ (ȳ, σ̄ ∗ ) = 0,

lo cual implica que ȳ1 = 0. Note que, de (32), tenemos C2 (0) = C2s , por lo tanto

f1 (q2d , 0) − C2 (0) sgn(0) + σ̄ ∗ = 0, (36)

y siempre existe un valor real σ̄ ∗ tal que, para cualquier q2d ∈ R, satisface σ̄ ∗ +f1 (q2d , 0) ∈

[−C2s , C2s ].

Note que el resultado previo significa que, en caso de que el sistema (34)-(35) exhiba

un modo deslizante en la superficie S fuera del origen y = 0, entonces en un tiempo finito

el sistema abandonará esta superficie. Este tiempo puede ser de cualquier tamaño, incluso

cero o muy largo, pero finito.

Defínase ahora x1 = y1 , x2 = y2 , y x3 = f1 (y1 + q2d , y2 ) − C2 (y2 ) sgn (y2 ) + σ ∗ .

Entonces el sistema (34), con el control artificial (35), es descrito para x2 6= 0, por
 
x2
 x3 
ẋ =  ³ 2´  = g(t, x), (37)
2(C2s −C2c ) x2
f2 (x1 + q2d , x2 , x3 ) + |x2 | exp − v2 x3 + σ˙∗
v2
2s 2s

donde x = (x1 , x2 , x3 )T . Note que el punto de equilibrio (0, 0, σ̄ ∗ ) del sistema (34)-(35)

corresponde a x̄ = 0 del sistema (37) (ver (36)).


29

Denotamos como tak el k-ésimo tiempo de llegada de la solución del sistema (34)-

(35) a la superficie S, y por tbk ≥ tak , k ∈ K = {1, 2, ...}, el tiempo de salida de esta

solución de esta superficie justo después de la k-ésima llegada. Entonces tenemos una

secuencia ordenada de tiempos

t1 ≤ ta1 ≤ tb1 ≤ · · · ≤ tak ≤ tbk ≤ · · · .

¡ ¢ ¡ −¢ ¡ +¢
Cuando t1 < tak y tbk < ∞, defínase ∆xk = x t+
bk − x t ak , donde x tbk =
¡ ¢
limh→0 x (tbk + h) y x t−
ak = limh→0 x (tak − h), h > 0. Entonces el sistema (34)-(35)

puede ser representado por

ẋ = g(t, x),
¡ ¢ ¡ ¢
x t+
bk = x t−
ak + ∆xk , k ∈ K. (38)

Puesto que el objetivo de control es la regulación de la variable no actuada mientras la posi-

ción y velocidad de la variable actuada de (31) permanece acotadas, entonces el objetivo de

control es el de conducir a cero el estado x(t) del sistema (38) con un “control” continuo

σ∗.

IV.2 Resultado principal

En esta sección diseñamos un control ideal continuo σ ∗ para el sistema (34), para posterior-

mente diseñar el control real del sistema (31) tal que σ (ver (33)) converga a σ ∗ en tiempo

finito, desde cualquier condición inicial.


30

Suposición 17 Existe una función continua f3 (t, x1 , x2 ) tal que, si el control artificial es

dado por

σ ∗ = f3 (t, x1 , x2 ) , (39)

entonces (37) con (39) puede ser transformado a


 
x2 ,
 x3 , 
ẋ =  ³ 2´  = g(t, x), (40)
2(C2s −C2c ) x2
−k1 x1 − k2 x2 − k3 x3 + v2
|x2 | exp − v2 x3 ,
2s 2s

donde k1 , k2 y k3 son coeficientes reales, y σ̇ ∗ = ϕ(y, σ ∗ ) satisface el Lema 16.

Note que x̄ = 0 del sistema (40) es un punto de equilibrio. Por lo tanto, si es posible

encontrar una función f3 y valores k1 , k2 y k3 , que lleven el estado de (38)-(40) a x̄ = 0,

entonces el objetivo de control será alcanzado. Así pues, en el siguiente teorema establece-

mos algunas condiciones sobre estos coeficientes para conseguir que limt→∞ kx(t)k = 0.

Para esto mostraremos que cualquier trayectoria del sistema (38)-(40) que llega al conjunto

S = {x ∈ R3 : x1 6= 0, x2 = 0}, saldrá de este en un punto más cercano al origen. Note

que, de (40), no se puede llegar a S con la coordenada x3 igual a cero.

Considere las matrices P y Q(x) dadas por


 
p11 p12 p13 · ¸
k k
P =  p12 p22 p23  , Q(x2 ) = q22 q23
, (41)
kq23 kq33
p13 p23 p33
donde

kq22 = −2p12 + 2p23 k2 ,


· ³ ´2 ¸
2(C2s − C2c ) x
− v2
kq23 = −p22 + p23 k3 − 2
|x2 | e 2s + p33 k2 , (42)
v2s
· ³ ´2 ¸
2(C2s − C2c ) − v2
x
kq33 = −2p23 + 2p33 k3 − 2
|x2 | e 2s .
v2s
31

Teorema 18 Si la Suposición 17 se satisface, la matriz Q es definida positiva para toda

x2 ∈ R, la matriz P es también definida positiva y satisface

p11 p12
p13 = 0, = = k1 , (43)
p23 p33

entonces x = 0 es un punto de equilibrio estable asintótica y globalmente del sistema

(38)-(40).

Demostración Primero mostraremos que, cuando el sistema (38)-(40) llega al con-

junto S en tiempo tak , entonces sale de este conjunto en tiempo tbk ≥ tak desde un punto

más cercano al origen. Note que

∆x1k = x1 (t+ −
bk ) − x1 (tak ) = 0,

∆x2k = x2 (t+ −
bk ) − x2 (tak ) = 0.

¯ ¯ ¯ ¯
Por lo tanto, para probar esta parte basta mostrar que ¯x3 (t+
bk )¯ < ¯x3 (t− )¯. Note tam-
ak

bién que (40) describe la dinámica del sistema (38) fuera de la superficie de discon-

tinuidad S = {x ∈ R3 : x2 = 0}, la cual divide el espacio de estado en dos dominios,

G± = {x ∈ R3 : x2 ≷ 0}. Lo que es más, la tercera coordenada x3 está dada por


Z t
x3 (t) = ẋ2 (t) = − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ −C2 (x2 ) sgn (x2 )+c1 , φ (t) ,
t1

(44)

donde c1 es una constante finita. Entonces tenemos


Z tak
+
φ (tak ) = − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ − lim [C2 (x∗2 ) sgn (x∗2 )] + c1
t1 x∗2 ∈G+ ,
x∗2 →0
Z tak
= − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ − C2s + c1 , (45)
t1
32

y
Z tak

φ (tak ) = − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ − lim [C2 (x∗2 )] sgn (x∗2 ) + c1
t1 x∗2 ∈G− ,
x∗2 →0
Z tak
= − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + C2s + c1 . (46)
t1

Suponga primero que un modo deslizante no ocurre en la superficie S, entonces tbk =

tak y las trayectorias del sistema cruzan la superficie. Para esto, los campos vectoriales en

tiempo t+
bk y tak debe tener una componente en la misma dirección en el eje x2 ; así

¯ Z ¯
¯ tak ¯
¯− [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + c1 ¯¯ > C2s (47)
¯
t1

se debe satisfacer. Esto implica que


¯ Z − ¯
¯ tak ¯
¯ ¯
¯− [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + c1 ¯ > C2s , (48)
¯ t1 ¯
¯ Z + ¯
¯ tbk ¯
¯ ¯
¯− [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + c1 ¯ > C2s , (49)
¯ t1 ¯

y porque la trayectoria llega a la superficie de discontinuidad en el tiempo t−


ak debemos

tener
" Z #
t−
ak £ ¡ ¢¤
sgn − [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + c1 = − sgn x2 t−
ak . (50)
t1

Por lo tanto, de (44), (48), (49) y (50),


¯ Z − ¯
¯ ¡ − ¢¯ ¯¯ tak ¯
¯
¯x3 t ¯ = ¯− [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ + c1 ¯ + C2s (51)
ak
¯ t1 ¯

y
¯ Z + ¯
¯ ¡ + ¢¯ ¯¯ tbk ¯
¯
¯x3 t ¯ = ¯− [k x
1 1 (τ ) + k x
2 2 (τ ) + k x
3 3 (τ )] dτ + c1 ¯ − C2s . (52)
bk
¯ t1 ¯
33

En el segundo caso, es decir, cuando existe un modo deslizante, la condición ẋ2 (t) =

0 debe de cumplirse para t ∈ [tak , tbk ]. Entonces, de (44),

¯ ¯
|x3 (tbk )| = |ẋ2 (tbk )| = ¯φ± (tbk )¯
¯ Z tbk ¯
¯ ¯
¯
= ¯− [k1 x1 (τ ) + k2 x2 (τ ) + k3 x3 (τ )] dτ ∓ C2s + c1 ¯¯ = 0. (53)
t1

Lo que es más, porque la trayectoria llegan a la superficie de discontinuidad en tiempo tak ,

la siguiente condición se debe cumplir,

¯ ¡ − ¢¯ ¯ ¡ − ¢¯
¯x3 t ¯ = ¯ẋ2 t ¯ > 0. (54)
ak ak

Por lo tanto, podemos concluir, de (51) a (54), que

¯ ¡ + ¢¯ ¯ ¡ − ¢¯
¯x3 t ¯ < ¯x3 t ¯ . (55)
bk ak

Ahora analicemos el caso donde el sistema no está en la superficie de discontinuidad

S. Considere la función candidata de Lyapunov V (x) = xT P x, donde P es dada por (41).

Entonces V (x) puede ser escrita como

V (x) = p11 x21 + 2p12 x1 x2 + p22 x22 + 2p23 x2 x3 + p33 x23 . (56)

¡ ¢
Note que x1 t−
ak = x1 (tbk ) y x2 (tak ) = x2 (tbk ) = 0. Entonces tenemos, de (55), que
+ − +

¡ ¡ ¢¢ ¡ −¢ ¡ −¢ ¡ +¢ ¡ +¢ ¡ ¡ + ¢¢
V x t−
ak = p11 x2
1 tak + p33 x2
3 tak > p11 x2
1 tbk + p33 x2
3 tbk = V x tbk , (57)

y existirá una reducción de V (x) cuando las trayectorias del sistema (38)-(40) crucen la

superficie S. Lo que es más, la derivada temporal de V a lo largo de las trayectorias de

(40) es dada por

V̇ (x) = − (x2 , x3 ) Q (x2 ) (x2 , x3 )T < 0. (58)


34

Por lo tanto, el sistema converge al conjunto {x ∈ R3 : (x2 , x3 ) = (0, 0)} y concluimos

estabilidad asintótica global del origen, porque si el origen no ha sido alcanzado entonces

las trayectorias de (34)-(39) saldrán de la superficie de discontinuidad S en un tiempo

finito, y la función V decrece fuera de esta superficie.

Una vez obtenida una expresión para σ ∗ y los coeficientes ki , pij satisfaciendo las

previas condiciones, podemos diseñar una ley de control discontinua para u1 que haga que

el control artificial σ (ver (33)) converja al control ideal σ ∗ en tiempo finito. Podemos

usar, por ejemplo, una técnica de modo deslizante para lograr este objetivo. En la siguiente

sección se describe la aplicación de este procedimiento a dos sistemas.

IV.3 Aplicaciones

Ejemplo 1. Considere el sistema mostrado en la Figura 5, descrito por

ka kb fb 1
q̈1 + q1 + (q1 − q2 ) + (q̇1 − q̇2 ) = u1 ,
m1 m1 m1 m1
kb fb
q̈2 − (q1 − q2 ) − (q̇1 − q̇2 ) + C2 (q̇2 ) sgn (q̇2 ) = 0, (59)
m2 m2

donde qi son las posiciones de las masas, q̇i las velocidades, mi las masas, para i = 1, 2;

C2 (q̇2 ) es dada por (32), C2c y C2s son los niveles de fricción de Coulomb y de fricción

estática dividida por m2 ; ka , kb , y fb son constantes positivas, y u1 es la entrada de control.


35

Figura 5. Sistema masa-resorte-amortiguador.

El objetivo es diseñar un ley de control u1 para que la posición de la masa m2 converja

a un valor constante q2d dado, con la posición y velocidad de la masa m1 acotadas.

Para este sistema, tenemos

kb fb
f1 (x1 + q2d , x2 ) = − (x1 + q2d ) − x2 ,
m2 m2
kb fb
σ (q1 , q̇1 ) = q1 + q̇1 ,
m2 m2

donde x1 = q2 − q2d , x2 = q̇2 . Si

Z t µ ¶ µ ¶
kb fb kb

σ = −k1 x1 (τ ) dτ − k2 − x1 − k3 − x2 + q2d , (60)
t0 m2 m2 m2

donde t0 es el tiempo inicial, entonces llegamos a la forma deseada del Teorema 18.

El control u1 puede ser diseñado usando la técnica clásica de modos deslizantes. Por

ejemplo, si la superficie deslizante tiene la forma s = σ − σ ∗ , entonces s es dada por

Z t
fb kb kb
s= q̇1 + q1 + k1 (q2 (τ ) − q2d ) dτ + k2 (q2 − q2d ) + kc3 q̇2 − q2 , (61)
m2 m2 t0 m2

donde kc3 = k3 − fb /m2 . Podemos proponer u1 como

µ ¶
ka kb fb
u1 = m1 q1 + (q1 − q2 ) + (q̇1 − q̇2 ) + τ 1 , (62)
m1 m1 m1
36

donde

· µ ¶ ¸
m2 kb kb fb kc3 kb kc3
τ1 = − q̇1 + k2 − q̇2 − (q̇2 − q̇1 ) − (q2 − q1 ) + τ 2 (63)
fb m2 m2 m2 m2

con τ 2 = k sgn (s) + k1 (q2 − q2d ) y k > |kc3 | C2s .

Finalmente, si encontramos constantes p11 , p12 , p22 , p23 , p33 , k1 , k2 y k3 , que satisfa-

gan el Teorema 18, entonces el objetivo de control será alcanzado.

Las figuras 6 y 7 muestran algunos resultados numéricos, donde tenemos que ka =

kb = 1 N/m, fb = 1 N/(m/s), m1 = m2 = 1 kg, C2s = 1 N/kg, C2c = 0.75 N/kg,

|v2s | = 0.143 m/s, k1 = 0.5, k2 = 1.5, y kc3 = 2, con q1 (t0 ) = −1 m, q̇1 (t0 ) = 0 m/s,

q2 (t0 ) = 2 m, q̇2 (t0 ) = 2 m/s, y q2d = 0 m.

3 . 3
q1 q1
( m) 2
(m/s) 2

1 1

0 0

-1 -1

-2 -2
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
q2 3 . 3
q2
2 2
( m) (m/s)
1 1

0 0

-1 -1

-2 -2
0 10 20 30 0 10 20 30
c) t (s) d) t (s)

Figura 6. Posiciones y velocidades del sistema masa-resorte-amortiguador.


37

4 100
u1 V
2 80
( N)
0 60

-2 40

-4 20

-6 0
0 10 20 30 0 10 20 30
a) t (s) b) t (s)

Figura 7. Ley de control y función V para el sistema masa-resorte-amortiguador.

Ejemplo 2. Consideremos ahora el sistema masa y viga mostrada en la Figura 8.

Este sistema es modelado por las ecuaciones

¡ ¢
J + mq22 q̈1 + 2mq2 q̇1 q̇2 − mgq2 cos (q1 ) = u1 ,

q̈2 − q2 q̇12 − g sen (q1 ) + fv2 q̇2 + C2 (q̇2 ) sgn (q̇2 ) = 0, (64)

donde q1 es la posición angular de la viga, q2 la posición lineal de la masa, q̇1 y q̇2 las

respectivas velocidades, m la masa; C2 (q̇2 ) es dada por (32), C2c , C2s , y fv2 son los niveles

de la fricción de Coulomb, estática, y viscosa divididas por m, J es el momento de inercia

de la viga, g la aceleración gravitacional, y u1 la entrada de control.

Figura 8. Sistema masa y viga.


38

Se desea obtener una ley de control u1 para que la masa m sea regulada alrededor del

valor q2d , con la posición y velocidad de la viga acotadas.

Para poder aplicar el resultado previo debemos simplificar el modelo, suponiendo

que el ángulo y velocidad de la viga son pequeños. Bajo esta condición, el sistema (64)

puede simplificarse a

¡ ¢
J + mq22 q̈1 + 2mq2 q̇1 q̇2 − mgq2 cos (q1 ) = u1 ,

q̈2 − gq1 + fv2 q̇2 + C2 (q̇2 ) sgn (q̇2 ) = 0.

En este caso tenemos σ = gq1 y el control u1 es

¡ ¢
u1 = 2mq2 q̇1 q̇2 − mgq2 cos (q1 ) + J + mq22 τ 1 , (65)

donde τ 1 es un nuevo control. Si proponemos un control artificial


Z t

σ =− [k1 x1 (τ ) + k2 x2 (τ )] dτ + c, (66)
t1

donde x1 = q2 − q2d , x2 = q̇2 , con c una constante real, y una superficie deslizante para

diseñar el control u1 como s = gq̇1 + k1 x1 + k2 x2 , una técnica clásica de modo deslizantes

produce el control

1
τ 1 = − [k1 q̇2 + k2 (gq1 − fv2 q̇2 ) + k sgn (s)] , (67)
g

con k > k2 C2s . Finalmente, si encontramos constantes p11 , p12 , p22 , p23 , p33 , k1 , k2 , y

k3 = fv2 que satisfagan el Teorema 18, entonces el objetivo de control será alcanzado.

Las figuras 9 y 10 muestran algunos resultados numéricos, para m = 1 kg, g = 9.81

m/s2 , J = 0.3 kg·m2 , C2s = 0.1 N/kg, C2c = 0.075 N/kg, |v2s | = 0.0143 m/s, k1 = 0.5,
39

. 0.6
q1 0.6 q1
(rad ) 0.4 (rad/s)0.4
0.2 0.2

0 0

-0.2 -0.2

-0.4 -0.4
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
q2 2 . 2
q2
1.5 1.5
( m) (m/s)
1 1

0.5 0.5

0 0

-0.5 -0.5
0 10 20 30 0 10 20 30
c) t (s) d) t (s)

Figura 9. Posiciones y velocidades del sistema masa y viga.

k2 = 1.5, y fv2 = 3 N/(kg · m/s), con q1 (t0 ) = 0.3 rad, q̇1 (t0 ) = 0 rad/s, q2 (t0 ) = 0.3

m, q̇2 (t0 ) = 0 m/s, y q2d = 0 m.

IV.4 Conclusiones del capítulo

En este capítulo proponemos un controlador discontinuo para una clase de sistemas mecáni-

cos subactuados de 2 grados de libertad con fricción discontinua en la articulación no ac-

tuada. El objetivo de control es regular la variable no actuada mientras la posición y veloci-

dad de la articulación actuada permanecen acotadas. El controlador propuesto es obtenido

usando la técnica clásica de modos deslizantes, garantiza la convergencia del error de posi-

ción de la variable no actuada a cero, y es robusto con respecto a algunas incertidumbres

en los coeficiente de la fricción discontinua.


40

5 20
u1 V
0 16
(N m)
-5 12

-10 8

-15 4

-20 0
0 10 20 30 0 10 20 30
a) t (s ) b) t (s)

Figura 10. Ley de control y función V del sistema masa y viga.

Como se observa en las gráficas las respuestas de los sistemas en lazo cerrado pueden

exhibir fases de “atascamiento”, debido a esto el desempeño del sistema puede ser afectado

negativamente. Sin embargo, en el siguiente capítulo se presenta una extensión de nuestros

resultados para proponer, primero, un control continuo para un sistema con fricción discon-

tinua y control pleno, y luego su aplicación al control de sistemas subactuados con fricción

discontinua.
Capítulo V
Control continuo de sistemas discontinuos

Desde el punto de vista de control de sistemas mecánicos con control pleno, la téc-

nica más sencilla para contrarrestar el fenómeno de la fricción discontinua es el control

de modos deslizantes de primer orden; la fricción discontinua es considerada como una

pertubación acotada de signo impredecible y por lo tanto contrarrestada con una amplitud

adecuada del control. Sin embargo, esta clase de algoritmos de control requieren a menudo

un alto esfuerzo de control para contrarrestar este fenómeno físico, y requieren señales de

control que conmuten, teóricamente, con frecuencia infinita, por lo tanto, en general es

imposible su implementación (Boiko et al., 2004).

Se han propuesto varias técnicas para eliminar el efecto del “chaterring” (conmutación

de alta frecuencia), por ejemplo los algoritmos de control de modos deslizantes de orden

superior. Sin embargo, los procedimientos “anti-chattering”, que intentan obtener leyes de

control continuas, están en conflicto con el problema de garantizar exactitud en presencia

de fricción discontinua.

Un resultado hacia la solución de este problema fue presentado en (Bartolini y Punta,

2000a), (Bartolini y Punta, 2000b). En estos trabajos se prueba que, con una ligera mo-

dificación, un algoritmo de segundo orden en un sistema mecánico, hace que la posición y

la velocidad convergan a una posición deseada, iniciando desde cualquier punto de “atas-

camiento”. En estos artículos se considera un sistema mecánico con fricción estática y de

Coulomb (Armstrong et al., 1994), (Canudas et al., 1995).


42

En este capítulo proponemos un controlador continuo para la regulación de un sis-

tema mecánico de 1 grado de libertad con fricción discontinua. El control es dinámico y

es diseñado usando el Teorema 18 del capítulo anterior (presentado también en (Martinez

y Alvarez, 2007)). Además, utilizando este control, diseñamos un controlador para un sis-

tema subactuado con fricción discontinua en la articulación no actuada. Este controlador

puede verse como una extensión de los presentados en el capítulo anterior.

V.1 Diseño de la ley control

Considere un sistema mecánico representado por

ẏ1 = y2 ,

ẏ2 = f1 (y1 + q2d , y2 ) − C2 (y2 ) sgn (y2 ) + u, (68)

donde y1 ∈ R, y2 ∈ R, f1 es una función suave, q2d es una constante y u es una entrada de

control. C2 (·) es el módulo de los términos de la fricción definido por (32). Suponga que

la función f2 (y1 , y2 , ẏ2 ) = df1 (y1 + q2d , y2 ) /dt es continua en sus argumentos.

El objetivo de control es el de conducir y1 (t) y y2 (t) a cero por medio de un control

continuo u(t).

Note que (68) tiene la misma forma que (34). Por lo tanto, consideramos una ley de

control u con una dinámica dada por

u̇ = ϕ (y, u) . (69)

donde u debe ser continua, pero no necesariamente ϕ.


43

Se propone encontrar ϕ discontinua. Para esto, presentamos el siguiente lema.

Lema 19 Defínase ϕ(u,0) (y1 ) = ϕ (y, u), con y = (y1 , 0)T , como la restricción de ϕ para

y2 = 0. Suponga que y1 6= 0 implica que ϕ(u,0) (y1 ) 6= 0. Por lo tanto, si (68)-(69) exhibe

un modo deslizante en la superficie S caracterizada por y2 = 0 fuera del origen y = 0,

entonces el sistema saldrá de esta superficie en un tiempo finito.

Demostración Cuando el sistema (68) está en modo deslizante en la superficie S

fuera del origen y = 0, es descrito por

y2 = 0, f1 (y1 + q2d , 0) − C2 (0) sgn(0) + u = 0.

Bajo esta condición, u̇ = ϕ (ȳ, u), con ȳ = (y1 , 0), y1 6= 0, es diferente de cero. De (32),

C2 (0) = C2s , por lo tanto

u + f1 (y1 + q2d , 0) ∈
/ [−C2s , C2s ] , f1 (y1 + q2d , 0) − C2 (0) sgn(0) + u 6= 0. (70)

en un tiempo finito.

Si definimos x1 = y1 , x2 = y2 y x3 = f1 (y1 + q2d , y2 ) − C2 (y2 ) sgn (y2 ) + u,

entonces el sistema (68)-(69) puede ser representado por

ẋ = g(t, x),
¡ ¢ ¡ ¢
x t+
bk = x t−
ak + ∆xk , k ∈ K, (71)

donde x = (x1 , x2 , x3 )T ,
 
x2
 x3 
g(t, x) =  ³ 2´ , (72)
x
f2 (x1 , x2 , x3 ) + 2(C2sv2−C2c ) |x2 | exp − v22 x3 + u̇
2s 2s
¡ +¢ ¡ −¢
tak , tbk , ∆xk , x tbk y x tak son definidas en el capítulo anterior.
44

Por lo tanto, el objetivo de control es conducir el estado x a cero con un control

discontinuo u̇.

Suposición 20 Existe un control

u = f3 (t, x1 , x2 ) , (73)

donde f3 (t, x1 , x2 ) es una función continua tal que (72) con (73) puede ser transformado a
 
x2 ,
 x3 , 
g(t, x) =  ³ 2´ , (74)
x
−k1 x1 − k2 x2 − k3 x3 + τ 1 + 2(C2sv2−C2c ) |x2 | exp − v22 x3 ,
2s 2s

donde ki , i = 1, 2, 3 son coeficientes reales,

τ 1 = −k4 sgn(x1 ) + k4 |β(x2 )| sgn(x1 ), (75)

con 
 1, para z > 0,
β(z) = 0, para z = 0, , (76)
 −1, para z < 0;
una constante arbitraria k4 , sgn(k4 )=sgn(k1 ), y u̇ = ϕ (y, u) satisfaciendo el Lema 19.

El siguiente lema nos muestra que el punto de equilibrio x = 0 existe.

Lema 21 En caso de que el sistema (68)-(73) exhiba un modo deslizante en la superficie

S y x1 = 0, entonces el sistema no sale de esta superficie.

Demostración El sistema (68)-(73) en modo deslizante en la superficie S con x1 = 0,

es dado por
Z t
x2 = 0, − C2 (0) sgn(0) + [−k4 sgn(0) + k4 |β(0)| sgn(0)] dτ + c = 0,
t0

donde t0 es el tiempo inicial y c es una constante finita. Por lo tanto


Z t
[−k4 sgn(0) + k4 |β(0)| sgn(0)] dτ + c ∈ [−C2s , C2s ] (77)
t0
45

para todo tiempo.

Así, puesto que u es una función continua, las condiciones para los coeficientes ki

que limt→∞ kx(t)k = 0, son obtenidas del Teorema 18 del capítulo anterior (ver prueba de

este teorema).

En la siguiente sección mostramos la aplicación de este resultado a dos sistemas.

V.2 Aplicaciones

Ejemplo 1. Considere el sistema mostrado en la Figura 11, descrito por

mq̈ + kq + mC2 (q̇) sgn (q̇) = u1 , (78)

donde q es la posición de la masa, q̇ la velocidad, m la masa; C2 es dado por (32), C2c y

C2s son los niveles de la fricción de Coulomb y de la estática divididos por m; k es una

constante positiva, y u1 es la entrada de control.

Figura 11. Oscilador mecánico.

El objetivo es diseñar una ley de control continua u1 para llevar la posición de la masa

m a un valor constante qd dado.


46

Para este sistema tenemos f1 (x1 + q2d , x2 ) = − m


k
(x1 + qd ) y u = 1
u,
m 1
donde

x1 = q − qd , x2 = q̇. Por lo tanto, proponemos

Z t µ ¶
k
u=− [k1 x1 (τ ) − τ 1 (τ )] dτ − k2 − x1 − k3 x2 , (79)
t0 m

donde τ 1 (t) = −k4 sgn(x1 (t)) + k4 |β(x2 (t))| sgn(x1 (t)).

Las figuras 12 y 13 muestran algunos resultados numéricos, donde tenemos k = 1

N/m, m = 1 kg, C2s = 1 N/kg, C2c = 0.75 N/kg, |v2s | = 0.143 m/s, k1 = 0.5, k2 = 1.5,

k3 = 3 y k4 = 20, con q (t0 ) = 2 m, q̇ (t0 ) = 0 m/s y qd = 0 m.

q 3 . 1.5
q
2 1
( m) (m/s)
1 0.5

0 0

-1 -0.5

-2 -1
0 10 20 30 0 10 20 30
a) t (s) b) t (s)

Figura 12. La posición y velocidad del oscilador mecánico.

Ejemplo 2. Considere el sistema del ejemplo 1 del capítulo anterior.

El objetivo es diseñar una ley de control u1 para llevar la posición de la masa m2 a

un valor constante deseado q2d , con la posición y velocidad de la masa m1 acotadas.

Procediendo de la misma manera que en el Ejemplo 1 del capítulo anterior con σ ∗ =

u, tenemos
µ ¶
ka kb fb
u1 = m1 q1 + (q1 − q2 ) + (q̇1 − q̇2 ) + τ 2 , (80)
m1 m1 m1
47

3 40
u1 V
2
( N) 30
1
20
0
10
-1

-2 0
0 10 20 30 0 10 20 30
a) t (s) b) t (s)

Figura 13. Entrada de control y función V para el oscilador mecánico.

donde
· ¸
m2 kb kb kc3 fb kc3
τ2 = − q̇1 + kc2 q̇2 + (q1 − q2 ) + (q̇1 − q̇2 ) + τ 3 (81)
fb m2 m2 m2

con τ 3 = k5 sgn (s) + k1 (q2 − q2d ), k5 > |kc3 | C2s + k4


Z t
kb fb
s= q1 + q̇1 + [k1 (q2 (τ ) − q2d ) − τ 1 (τ )] dτ + kc2 (q2 − q2d ) + kc3 q̇2 , (82)
m2 m2 t0

kc2 = k2 −kb /m2 , kc3 = k3 −fb /m2 y τ 1 (t) = −k4 sgn(q2 (t)−q2d )+k4 |β(q̇2 (t))| sgn(q2 (t)−

q2d ).

La Figura 14 muestra algunos resultados numéricos, donde tenemos que ka = kb = 1

N/m, fb = 1 N/(m/s), m1 = m2 = 1 kg, C2s = 1 N/kg, C2c = 0.75 N/kg, |v2s | = 0.143

m/s, k1 = 0.5, k2 = 1.5, k3 = 3 y k4 = 20, con q1 (t0 ) = −1 m, q̇1 (t0 ) = 0 m/s,

q2 (t0 ) = 2 m, q̇2 (t0 ) = 2 m/s, y q2d = 0 m.

V.3 Conclusiones del capítulo

En este capítulo proponemos un controlador continuo para un sistema mecánico de un

grado de libertad con fricción discontinua. El objetivo de control es conducir a cero la


48

3 . 3
q1 q1
( m) 2
(m/s) 2

1 1

0 0

-1 -1

-2 -2
0 10 20 30 0 10 20 30
a) t (s) b) t (s)
q2 3 . 3
q2
2 2
( m) (m/s)
1 1

0 0

-1 -1

-2 -2
0 10 20 30 0 10 20 30
c) t (s) d) t (s)

Figura 14. Posiciones y velocidades del sistema masa-resorte-amortiguador.

posición y la velocidad. El control es diseñado usando el Teorema 18 del capítulo anterior y

es robusto con respecto a algunas incertidumbres en los coeficientes de fricción discontinua.

Además, usando este control, proponemos un controlador para un sistema mecánico

subactuado con fricción discontinua en la articulación no actuada. El objetivo de control

es la regulación de la articulación no actuada mientras que la posición y velocidad de la

actuada permanecen acotadas. Este controlador puede verse como una extensión de los

presentados en el capítulo anterior, ya que disminuye el tiempo del transitorio del sistema

en lazo cerrado, sin embargo su uso se restringe por las funciones discontinuas en u̇.
Capítulo VI
Control de sistemas subactuados con fricción discon-
tinua II

En este capítulo proponemos un controlador discontinuo para un clase de sistemas

mecánicos subactuados de 2 grados de libertad con fricción discontinua en la articulación

no actuada. El péndulo con disco inercial y el péndulo invertido pueden ser incluidos en

esta clase de sistemas. El objetivo de control es la regulación de las dos articulaciones.

El diseño del control es dividido en dos partes; primero, la articulación no actuada es lle-

vada a la posición deseada en tiempo finito, luego la articulación actuada es también lle-

vada a una posición deseada. Para esto, hacemos uso de un resultado central presentado

en (Orlov, 2005), acerca de las condiciones para tener estabilidad en tiempo finito de una

clase de sistemas discontinuos con incertidumbres. El controlador propuesto garantiza la

convergencia del error de posición a cero, y es robusto con respecto a algunas incertidum-

bres en los coeficientes de la fricción discontinua. Ilustramos este procedimiento con su

aplicación a un sistema físico.

VI.1 Planteamiento del problema

Considere un sistema mecánico subactuado de 2 g. d. l. con fricción discontinua represen-

tado por

∂V1 (q1 )
I1 q̈1 + I2 q̈2 + + C2 (q̇1 ) sgn (q̇1 ) = 0
∂q1
I3 q̈1 + I4 q̈2 = u (83)
50

1 (q1 )
donde q1 ∈ R, q2 ∈ R, I1 , I2 , I3 y I4 son constantes positivas y I1 > I2I4I3 ; ∂V∂q 1
es un par
¯
1 (q1 ) ¯
gravitacional, y es una función suave tal que ∂V∂q 1
¯ = 0, y V1 (0) = 0, u es la entrada
q1 =0

de control y C2 (·) es definido en (32).

El objetivo de control es conducir q1 , q̇1 , q2 y q̇2 a cero con un control discontinuo u.

Si definimos x1 = q1 , x2 = ẋ1 , x3 = q1 + I4
q,
I3 2
x4 = ẋ3 y

· µ 2¶ ¸
q̇1
$ = (C2s − C2c ) exp − 2 − (C2s − C2c ) sgn (q̇1 ) , (84)
v2s

entonces el sistema (83) es descrito por

ẋ1 = x2 ,
µ ¶
−1 ∂V1 (x1 ) I2
ẋ2 = + C2s sgn (x2 ) + $ + u , (85)
I1 − I2 I3 /I4 ∂x1 I4

ẋ3 = x4 ,
1
ẋ4 = u. (86)
I3

Note que |$| ≤ C2s − C2c < C2s . Entonces, el objetivo de control es conducir a cero el

estado x = (x1 , x2 , x3 , x4 )T con una ley de control discontinua u = u(x1 , x2 , x3 , x4 ).

Considere una ley de control u dada por

u = u1 (x1 , x2 ) + u2 (x3 , x4 ). (87)

Primero se diseñará un control discontinuo u1 para el subsistema (85) que asegure la con-

vergencia de x1 y x2 a cero en tiempo finito, manteniendo u2 acotada, |u2 | ≤ C1 , donde C1


51

es una constate positiva. Entonces proponemos un control discontinuo u2 para el subsis-

tema (86) que lleve x3 y x4 a cero.

VI.2 Resultado principal

Primero mostramos un resultado presentado en (Orlov, 2005). Considere el sistema dis-

continuo con incertidumbres de segundo orden

ẏ1 = y2 ,

ẏ2 = −a sgn(y1 ) − b sgn(y2 ) − hy1 − py2 + ω(y1 , y2 , t), (88)

donde a y b son constantes, h y p son parámetros, ω(y1 , y2 , t) es una perturbación no lineal

continua a tramos, uniformemente acotada

|ω(y1 , y2 , t)| ≤ M (89)

para todos los puntos de continuidad (y1 , y2 , t) y alguna M > 0.

Las soluciones de este sistema son definidas en el sentido de Filippov (Filippov,

1988).

Teorema 22 (Orlov, 2005) Supongamos que las condiciones

0 < M < b < a − M,

h ≥ 0, p≥0 (90)

se satisfacen. El sistema (88) con (89) es estable global, equiuniformemente en tiempo

finito alrededor del origen.


52

Este resultado se usará para resolver el problema descrito en la sección anterior.

Primero proponemos el control discontinuo u1 para el subsistema (85)

I4
u1 (x1 , x2 ) = k1 β(x1 ), (91)
I2

donde k1 es una constante y β(·) es definida en (76).

En el siguiente teorema se establecen los valores k1 y C1 que conducen a x1 y x2 a

cero.

Teorema 23 El subsistema (85) con u = u1 , donde u1 es dado por (91), es estable global,

equiuniformemente en tiempo finito alrededor de x1 = x2 = 0 si


¯ ¯
I2 ¯ ∂V1 (x1 ) ¯ I2
k1 > 2C2s + C1 − C2c + ¯¯ ¯, C2c > C1 , (92)
I4 ∂x1 ¯ I4

para todo x1 .

Demostración Primero note que x1 = x2 = 0 es el único punto de equilibrio del

subsistema (85) con (91) y (92) en el sentido de Filippov (Filippov, 1988); es decir, si

x2 = 0 en una trayectoria de este subsistema, entonces debido a (92), la segunda ecuación

de (85) con (91) no se satisface para x1 6= 0.

Ahora analizaremos el caso donde las trayectorias del subsistema no están en las

superficies de discontinuidad
n o n o
T 2 T 2
S1 = (x1 , x2 ) ∈ R : x1 = 0 S2 = (x1 , x2 ) ∈ R : x2 = 0 .

Considere la función
µ ¶
1 I2 I3
V2 (x1 , x2 ) = V1 (x1 ) + k1 |x1 | + I1 − x22 , (93)
2 I4
53

donde k1 es dado por (92), la cual es continua Lipschitz, radialmente desacotada, y definida

positiva. La derivada temporal de V2 a lo largo de las trayectorias de (85) con (91) y (92)

fuera de las superficies de discontinuidad S1 y S2 satisface


µ ¶
I2
V̇2 (x1 , x2 ) ≤ − C2c − C1 |x2 | < 0. (94)
I4

Por lo tanto, el subsistema converge a (x1 , x2 ) = (0, 0).

Así, iniciando en una vecindad arbitrariamente pequeña

n o
D² = (x1 , x2 )T ∈ R2 : V2 (x1 , x2 ) ≤ ² , (95)

donde ² > 0; de x1 = x2 = 0, el subsistema (85) con (91) y (92) no puede dejar esta
¯ ¯
¯ 1 (x1 ) ¯
vecindad. Además, debido a (92), k1 > ¯ ∂V∂x 1
¯ + C2s + |$| + II24 C1 y en tiempo finito t1 ,
¯ ¯
¯ 1 (x1 ) ¯
C2s ≥ C2c > ¯ ∂V∂x 1
¯ + |$| + II24 C1 . Por lo tanto, si y1 = x1 , y2 = x2 , a = I1 −Ik21I3 /I4 ,
³ ´
∂V1 (x1 )
b = I1 −IC22sI3 /I4 , h = p = 0, y ω = I1 −I−1 2 I3 /I4 ∂x1
+ $ + I2
I4
u2 para t ≥ t1 , de acuerdo

al Teorema 22, el subsistema (85) con (91) y (92) es estable global equiuniformemente en

tiempo finito alrededor de x1 = x2 = 0.

Ahora proponemos el control discontinuo u2 para el subsistema (86)

u2 (x3 , x4 ) = −k2 sgn(x3 ) − k3 sgn(x4 ), (96)

donde k2 y k3 son constantes positivas.

Los valores de k2 y k3 conducen x3 y x4 a cero, de acuerdo al resultado previo,

satisfacen

k2 + k3 ≤ C1 (97)
54

y, puesto que u1 = 0 cuando x1 = x2 = ẋ2 = 0 (lo cual ocurre en tiempo finito t2 ) y de

acuerdo al Teorema 22 (si y1 = x3 , y2 = x4 , a = k2


I3
, b= k3
I3
, h = p = 0, y ω = 0 para

t ≥ t2 )

0 < k3 < k2 . (98)

Por lo tanto, el sistema (85), (86), (87) con (91), (96), (92), (97) y (98) conduce a

cero al estado x en tiempo finito, satisfaciendo el objetivo de control. Note que el contro-

lador propuesto, de acuerdo a las estas desigualdades, es robusto con respecto a algunas

incertidumbre en los coeficientes de la fricción discontinua.

En la siguiente sección se describe la aplicación de este resultado a un sistema físico.

VI.3 Aplicación

Considere el sistema mostrado en la Figura 15, cuyo movimiento esta restringido a un plano

horizontal. La primera articulación gira alrededor de un punto O, y un actuador desplaza a

la segunda. Este sistema es modelado por las ecuaciones

Jo q̈1 + m2 lo q̈2 + 2m2 q2 q̇2 q̇1 + C2 (q̇1 ) sgn (q̇1 ) = 0,

m2 lo q̈1 + m2 q̈2 − m2 q2 q̇12 = u, (99)

donde q1 es el ángulo del péndulo, q2 es la posición del eslabón 2, m1 y m2 son las masas,

¡ ¢
Jo = J1 + J2 + m2 lo2 + q22 + m1 lc2 (100)

es el momento de inercia del sistema alrededor de O; J1 y J2 son momentos de inercia, lc

y lo son constantes positivas y u es la entrada de control.

El objetivo es diseñar una ley de control discontinuo u que lleve q1 , q̇1 , q2 y q̇2 a cero.
55

Figura 15. Péndulo horizontal.

Para aplicar el resultado previo simplificamos este modelo, suponiendo que q1 , q̇1 , q2

y q̇2 son pequeños. Bajo esta condición, el sistema (99) puede ser reducido a

Joe q̈1 + m2 lo q̈2 + C2 (q̇1 ) sgn (q̇1 ) = 0,

m2 lo q̈1 + m2 q̈2 = u, (101)

con

Joe = J1 + J2 + m2 lo2 + m1 lc2 . (102)

Para este sistema tenemos que

I2 I3
I1 = Joe , I2 = I3 = m2 lo , I4 = m2 , y I1 > ,
I4
1 1
x1 = q1 , x2 = q̇1 , x3 = q1 + q2 , x4 = q̇1 + q̇2 , (103)
lo lo

y, de acuerdo a (87) con (91), (96), proponemos


µ ¶ µ ¶
1 1 1
u = k1 β (q1 ) − k2 sgn q1 + q2 − k3 sgn q̇1 + q̇2 , (104)
lo lo lo
56

0.06
q1
0.03
(rad) 0
-0.03

-0.06
0 2 4 6 8 10

q 2 0.12
0.06
(m)
0

-0.06

-0.12
0 2 4 6 8 10
-3
x 10
6
u
3
(N)
0

-3

-6
0 2 4 6 8 10
t (sec)

Figura 16. Posiciones y control del péndulo horizontal.

donde, de acuerdo a (92), (97) y (98),

k1 > 2Cs + lo (k2 + k3 ) − Cc ,

Cc > lo (k2 + k3 ) ,

k2 > k3 > 0. (105)

La Figura 16 muestra resultados experimentales de un sistema fabricado por ECP

(modelo 505), donde tenemos que lo = 0.330 m, m1 = 0.785 kg, m2 = 0.213 kg, Joe =

0.0477957 kg · m2 , Cs ≈ Cc ≈ 0.0004 N · m, k1 = 0.0008, k2 = 0.0005, y k3 = 0.0004,

con q1 (t0 ) = −0.045 rad, q̇1 (t0 ) = 0 rad/s, q2 (t0 ) = 0 m, y q̇2 (t0 ) = 0 m/s. La ley de

control se aplica en t = 2.5 segundos. La implementación de la ley de control en el sistema

fue por medio de una tarjeta DSpace. Las derivadas aproximadas de las posiciones de las

articulaciones fueron consideradas como las velocidades de las articulaciones.


57

0.4
q1
(rad) 0.2

-0.2
0 5 10 15 20 25 30

q 2 0.04
(m) 0.02
0

-0.02
0 5 10 15 20 25 30
-3
x 10
4
u
(N) 2

-2
0 5 10 15 20 25 30
t (sec)

Figura 17. Posiciones y control del péndulo.

El control propuesto fue diseñado suponiendo que q1 , q̇1 , q2 y q̇2 son pequeños. Sin

embargo, si deseamos conducir la articulación no actuada a una posición arbitraria podemos

tomar ventaja de la convergencia en tiempo finito. En la Figura 17 se muestran resultados

experimentales del mismo sistema, donde ahora tenemos que q1 (t0 ) = 0 rad, q̇1 (t0 ) = 0

rad/s, q2 (t0 ) = 0 m, q̇2 (t0 ) = 0 m/s, y la salida de un filtro de segundo orden a un paso

con magnitud de 0.31416 rad es tomada como referencia de q1 . El paso es aplicado en

t = 1.5 segundos.
58

VI.4 Conclusiones del capítulo

En este capítulo proponemos un controlador discontinuo para una clase de sistema mecáni-

cos subactuados de dos grados de libertad con fricción discontinua en la articulación no

actuada. El objetivo de control es la regulación de las dos articulaciones.

El controlador propuesto garantiza la convergencia del error de posición a cero en

tiempo finito, y es robusto con respecto a algunas incertidumbre en los coeficientes de

fricción.

Ilustramos la técnica con su aplicación a un sistema subactuado físico: un péndulo

horizontal.

En este sistema, para aplicar los resultados de este capítulo simplificamos el modelo

del sistema, suponiendo que q1 , q̇1 , q2 y q̇2 son pequeños; sin embargo, puesto que existe

una convergencia en tiempo finito, validamos experimentalmente que es posible conducir

la articulación no actuada a una posición arbitraria.


Capítulo VII
Conclusiones

Esta tesis aborda el problema de control de sistemas mecánicos subactuados con fric-

ción discontinua en las articulaciones no actuadas. Este problema, sin ignorar o aproximar

los términos discontinuos, por lo que sabemos, permanece abierto.

Los algoritmos de control propuestos en esta tesis consideran y hacen frente a los

efectos de los términos discontinuos de la fricción.

Debido a la imposibilidad de cancelar directamente este fenómeno físico, nuestras

leyes de control utilizan su efecto en el sistema para alcanzar el objetivo de control, siendo

robustas con respecto a algunas incertidumbres en los coeficientes de la fricción discon-

tinua.

En esta tesis proponemos tres controladores para sistemas mecánicos subactuados de

2 grados de libertad con fricción discontinua en sus articulaciones. El objetivo de control

es la regulación. El primer control es para un manipulador planar subactuado con fricción

viscosa y de Coulomb en ambas articulaciones. El segundo y el tercero son controles

para dos clases de sistemas mecánicos subactuados de 2 grados de libertad con fricción

discontinua en la articulación no actuada.

En los dos primero usamos la técnica de modos deslizantes para obtener las leyes de

control, mientras que en el tercero utilizamos resultados recientes acerca de las condiciones

para estabilidad en tiempo finito.

Ilustramos estos procedimientos con sus aplicaciones a algunos sistemas.


60

Hasta el momento, por lo que sabemos, estos resultados representan los primeros tra-

bajos de control para regulación de sistemas mecánicos subactuados considerando fricción

discontinua en sus articulaciones.

VII.1 Trabajo futuro

Los controladores propuestos en esta tesis son para una clase de sistemas mecánicos sub-

actuados con fricción discontinua, por lo que una primera aplicación puede ser en la etapa

de control donde sea posible considerar posiciones y velocidad pequeñas para sistemas

mecánicos subactuados en general. Sin embargo, un trabajo futuro, que puede dar resulta-

dos importantes, es la extensión hacia sistemas subactuados considerando fricción discon-

tinua de la técnica IDA-PBC y/o lagrangianos controlados utilizando los resultados de los

capítulos 4 y 5.
61

Literatura citada

Alvarez, J., Orlov, I., y Acho L. 2000. An invariance principle for discontinuous dynamic
systems with applications to a Coulomb friction oscillator. ASME Journal of Dynamical
Systems, Measurement, and Control. 122: 687-690 p.

Arai, H., Tanie, K. y Shiroma, N. 1998. Nonholonomic Control of a Three-DOF Planar


Underactuated Manipulator. IEEE Transactions on Robotics and Automation. 14(5):
681-695 p.

Armstrong, B., Dupont, P. y Canudas de Wit, C. 1994. A survey of models, analysis


tools and compensation methods for the control of machines with friction. Automat-
ica. 30(7): 1083-1138 p.

Armstrong, B. y Amin, B. 1996. PID Control in the Presence of Static Friction: A Com-
parison of Algebraic and Describing Function Analysis. Automatica. 32(5): 679-692
p.

Bartolini, G. y Punta, E. 2000. Chattering elimination with second order sliding modes
robust to Coulomb friction. ASME Journal of Dynamic Systems, Measurement and
Control. 122: 679-686 p.

Bartolini, G. y Punta, E. 2000. Second order sliding mode control of systems with nonlin-
ear friction. En: Proceedings of the 39th IEEE Conference on Decision and Control.
Sydney. 12-15 de diciembre.

Bloch, A. M., Leonard, N. E., y Marsden, J. E. 2000. Controlled lagrangians and the sta-
bilization of mechanical systems I: The first matching theorem. IEEE Transactions on
Automatic Control. 45: 2253-2270 p.

Block, D. J. 1996. Mechanical design and control of the pendubot. Tesis de maestría. Uni-
versity of Illinois. Urbana-Champaign. 65 p.

Boiko, I., Fridman, L. y Castellanos, M. I. 2004. Analysis of Second-Order Sliding-Mode


Algorithms in the Frequency Domain. IEEE Transactions on Automatic Control. 49(6):
946-950 p.
62

Bullo, F. y Lynch, K. M. 2001. Kinematic controllability for decoupled trajectory planning


in underactuated mechanical systems. IEEE Transactions on Robotics and Automation.
17: 402-412 p.

Canudas de Wit, C., Olsson, H., Astrom, K. J. y Lischinsky, P. 1995. A new model for
control of systems with friction. IEEE Transactions on Automatic Control. 40(3): 419-
425 p.

Do, K. D., Jiang, Z. P., y Pan, J. 2002. Universal controllers for stabilization and tracking
of underactuated ships. Systems & Control Letters. 47: 299-317 p.

Filippov, A. F. 1988. Differential Equations with Discontinuous Right-Hand Side. Kluwer


Academic Publishers. Dordrecht. 304 p.

Gómez-Estern, F. 2002. Control de sistemas no lineales basados en la estructura hamilto-


niana. Tesis de doctorado. Escuela Superior de Ingenieros de la Universidad de Sevilla.
Sevilla. 199 p.

Gómez-Estern, F., y van der Schaft, A. J. 2004. Physical damping in IDA-PBC controlled
underactuated mechanical systems. European Journal of Control. 10(5): 451-468 p.

Grizzle, J. W., Moog, C. H., y Chevallereau, C. 2005. Nonlinear control of mechanical


systems with an unactuated cyclic variable. IEEE Transactions on Automatic Control.
50: 559-576 p.

Jiang, Z. y Nijmeijer, H. 1999. A Recursive Technique for Tracking Control of Nonholo-


nomic Systems in Chained Form. IEEE Transactions on Automatic Control. 44(2): 265-
279 p.

Khalil, H. K. 2002. Nonlinear systems. Prentice Hall. Tercera Edición. New Jersey. 750 p.

Kolmanovsky, I. y McClamroch, N. H. 1995. Developments in Nonholonomic Control


Problems. IEEE Control Systems. 15(6): 20-36 p.

Leine, R. I. 2000. Bifurcations in discontinuous mechanical systems of Filippov-type. Tesis


de doctorado. Technische Universiteit Eindhoven. Eindhoven. 143 p.

Martinez, R., y Alvarez, J. 2007. A Controller for 2-DOF Underactuated Mechanical Sys-
tems with Discontinuous Friction. Nonlinear Dynamics. DOI 10.1007/s11071-007-9307-
1.
63

Oriolo, G. y Nakamura, Y. 1991. Control of Mechanical Systems with Second-Order Non-


holonomic Constraints: Underactuated Manipulators. En: Proceedings of the 30th
IEEE Conference on Decision and Control. Brighton. 11-13 de diciembre.

Orlov, Y. 2005. Finite time stability and robust control synthesis of uncertain switched
systems. SIAM J. Control Optim. 43: 1253-1271 p.

Ortega, R., Spong, M. W., Gomez-Estern, F., y Blankenstein, G. 2002. Stabilization of a


class of underactuated mechanical systems via interconnection and damping assign-
ment. IEEE Transactions on Automatic Control. 47: 1218-1233 p.

Qu, Z. 1998. Robust control of nonlinear uncertain systems. John Wiley and Sons, Inc.
New York. 527 p.

Reyhanoglu, M., van der Schaft, A., McClamroch, M. H., y Kolmanovsky, I. 1999. Dy-
namics and control of a class of underactuated mechanical systems. IEEE Transactions
on Automatic Control. 44: 1663-1671 p.

Riachy, S., Floquet, T., Orlov, I., y Richard, J. P. 2006. Stabilization of the cart-pendulum
system via quasi-homogeneous switched control. En: Proceedings of the 2006 Interna-
tional Workshop on Variable Structure Systems. Alghero. 5-7 de junio.

Seto, D., y Baillieul, J. 1994. Control problems in super-articulated mechanical systems.


IEEE Transactions on Automatic Control. 39: 2442-2453 p.

Shiriaev, A., Perram, J. W., y Canudas de Wit, C. 2005. Constructive tool for orbital stabi-
lization of underactuated nonlinear systems: Virtual constraints approach. IEEE Trans-
actions on Automatic Contol. 50: 1164-1176 p.

Spong, M.W. 1995. The Swing Up Control Problem For The Acrobot. IEEE Control Sys-
tems. 15(1): 49-55 p.

Török, J. 2000. Analytical mechanics, with an Introduction to dynamical systems. Wiley-


Interscience. New York. 359 p.

Utkin, V. I. 1992. Sliding modes in control optimization. Springer Verlag. Berlin. 286 p.

Woolsey, C. A., Bloch, A. M., Leonard, N. E., y Marsden, J. E. 2001. Physical dissipation
and the method of controlled Lagrangians. En: Proceedings of the European Control
Conference. Porto. 4-7 de septiembre.
64

Woolsey, C., Bloch, A. M., Leonard, N. E., Reddy, C. K., Chang, D. E., y Marsden, J. E.
2004. Controlled Lagrangian systems with gyroscopic forcing and dissipation. Euro-
pean Journal of Control. 10(5): 478-496 p.

S-ar putea să vă placă și