Sunteți pe pagina 1din 6

Control Difuso-Adaptable Aplicado a un Carro Pendulo como Sistema de

Cuarto Orden

Francisco Ruvalcaba, Miguel Angel


Llama, Vctor Santiban ez
Resumen En este artculo se estudia el control difuso
adaptable de un pendulo invertido, modelado como un sistema
de cuarto orden. Se incluyen los fundamentos te o ricos de
sistemas basados en logica difusa, as como el modelo dinamico
del sistema al cual se le aplica el control. Para realizar el
control del pendulo, se consideran los cuatro estados del
sistema, que son posicion y velocidad del pendulo, posicio n y
velocidad del carro. A partir de estos estados, se establecen
nuevas variables de estado que esten en funcio n de la salida
actuada y la salida no actuada. Con los nuevos estados, se
utiliza un controlador difuso adaptable, el cual mediante
sistemas difusos se estiman funciones del sistema que se
suponen desconocidas. Se realizaron simulaciones para los
casos de estabilizacion y seguimiento.
Palabras clave: control difusoadaptable,
por realimentacion, carro pendulo

I.

linealizacion

I NTRODUCCI ON

El problema del pendulo invertido es un tema de


control que se ha estudiado ampliamente. Esto es debido
a que el sistema ofrece multiples retos para el diseno de
controladores, ya que el sistema es no lineal, inestable, de
fase no mnima y subactuado. Ademas, presenta efectos
parasitos como la friccion, el juego entre engranes, la
tension de las bandas, y saturacion de la entrada. Todo esto
hace que el control del sistema pendulo invertido sea una
herramienta clasica en los laboratorios de control [1].
Entre los trabajos previos desarrollados en el carropendulo del ITL figura el control LQR [2] y un control
Difuso Adaptable [3]. En el caso del control LQR se
observo que la respuesta era algo oscilatoria y que no se
poda hacer seguimiento del carro.
En el caso del Control Difuso Adaptable propuesto
originalmente en [4], se trata de un control de linealizacion
por realimentacion, en el cual se utilizan sistemas difusos
para estimar las funciones supuestas como desconocidas de
la planta. Para mejorar la respuesta de los sistemas difusos,
se agrega una ley de adaptacion la cual mejora la respuesta
con el paso del tiempo. El problema de este controlador,
es que en [4] solo se considera el control para los estados
del pendulo, lo cual deja al carro sin regulacion alguna.
En [3] se suma a la ley de control total un controlador PD
realimentando los estados del carro, logrando una respuesta

Francisco Ruvalcaba, Miguel Angel


Llama y Vctor Santiban ez,
pertenecen a la Division de Estudios de Posgrado e Investigacion,
Instituto Tecnologico de la Laguna, Torreon, Coah., C.P. 27000,
Mexico. pacoruvalcabag@hotmail.com, mllama@itlalaguna.edu.mx, vsantiba@itlalaguna.edu.mx.

adecuada para los casos de estabilizacion y seguimiento.


Otra manera de lograr el control del sistema es propuesta en
[5], en donde se consideraron los cuatro estados del sistema
carro-pendulo dentro de una misma ley de control.
En este artculo se estudia un control considerando
los cuatro estados del sistema carro-pendulo, como en [5],
pero agregando estimadores de las funciones con sistemas
difuso-adaptables, como se propone en [4]. Este trabajo
esta desarrollado actualmente en simulacion, por lo que es
el primer paso para aplicarlo a la planta fsica.
II.

C ONTROLADOR DIFUSO ADAPTABLE

II-A. Control por linealizaci o n entrada-salida


El controlador difuso adaptable indirecto usado en este
trabajo consiste de un control por linealizacion entradasalida, que se basa en encontrar una relacion directa entre
la salida del sistema y y la entrada de control u, para
lo cual existe una metodologa definida en [6], [7] y [8]
entre otros, para un sistema expresado en la forma normal
(x = x1 , x = x2 , . . . x(n1) = xn , x(n) = x n ) con
x(n) = f (x) + g(x)u
y=x

(1)

donde x(n) significa la nesima derivada temporal de x. Ya


que consideramos a nuestro sistema como de cuarto orden,
la ecuacion anterior queda de la siguiente manera
x(n) = F (x) + G(x)u
y=x

(2)

donde F (x) = f1 (x)L + f2 (x) y G(x) = g1 (x)L + g2 (x),


f1 (x), f2 (x), g1 (x) y g2 (x) son funciones del sistema (1), y
L es una ganancia proporcional. La ley de control esta dada
por
u=


1 
(n)
,
F (x) + kT e + ym
G(x)

(3)

donde se define el error como e = y m y = ym y1 ,


siendo ym la salida deseada, y1 el nuevo estado, e =
T

e e . . . e(n1) y k = [kn . . . k1 ]T . Al aplicar (3) en (2),
la ecuacion en lazo cerrado del sistema idealmente se reduce
a

e(n) + k1 e(n1) + . . . + kn e = 0

u=

e(n) + kT e = 0
Como las funciones del modelo de la planta f 1 (x), f2 (x),
g1 (x) y g2 (x) se suponen desconocidas, el controlador difuso adaptable las aproximara mediante las funciones f1 (x),
f2 (x), g1 (x) y g2 (x), de manera que la ley de control por
linealizacion entrada-salida (3) se convierte en
u=

G(x)



(n)
F (x) + kT e + ym

(8)

Los parametros libres f1 , f2 , g1 y g2 se obtienen


con una ley de adaptacion calculada a partir del metodo
conocido como Aproximacion Sintetica de Lyapunov [4].

Sean

Para mejorar la aproximacion de las funciones f1 (x), f2 (x),


g1 (x) y g2 (x) se dejan algunos parametros libres de cambiar
durante la operacion en lnea y as la precision de aproximacion mejora con el paso del tiempo; estos parametros
libres sustituyen a las funciones de pertenencia de salida del
sistema difuso, que nominalmente son fijas. Considerando la
ecuacion (5), se sustituye yfl11ln por los parametros libres
n
f1 R i=1 pi 1 en f1 (x) (donde p i es el numero de
funciones de pertenencia de la entrada i), y as para las
funciones f2 (x), g1 (x) y g2 (x), entonces nuestras funciones
estimadas quedan como
g1 (x| g1 ) = Tg1 1 (x)

g2 (x| g2 ) = Tg2 2 (x)


n
con
n el vector 1 (x) de dimensionesni=1 pi 1, 2 (x) de
qi 1, 1 (x) de dimensiones i=1 ri 1 y 2 (x) de
i=1
n
i=1 si 1, cuyos elementos tienen la siguiente estructura
n
i=1 Alii (xi )

1,l1 ln (x) = 
pn n
p1
l1 =1
ln =1
i=1 Alii (xi )
n
i=1 Cili (xi )


1,l1 ln (x) = 

r1
rn
n

li (xi )
l1 =1
ln =1
i=1 C
2

G(x|
G)



(n)
F (x|F ) + kT e + ym

II-C. Diseno de la ley de adaptaci o n

(4)

II-B. Disen o del controlador difuso


Los sistemas difusos se pueden usar como aproximadores
universales y aproximar uniformemente funciones no lineales
con precision arbitraria. Para estimar las funciones desconocidas de nuestra ley de control (4) se utilizan sistemas difusos
que poseen fusificador impulsivo, inferencia max-prod y
defusificador centro promedio, los cuales tienen la siguiente
estructura


p1
pn
l1 ln n

li (xi )
l1 =1
ln =1 f1
i=1 Ai

f1 (x) =
(5)
pn n
p1
l1 =1
ln =1
i=1 Ali (xi )

f1 (x| f1 ) = Tf1 1 (x)


f2 (x| f ) = T 2 (x)

b=

0
0

0
kn
0

1
0

0
kn1
0 1

0
1

T

0
0

1
k1

Definimos el error de aproximacion mnimo como


 



G(x)
u,
= F (x|F ) F (x) + G(x|
G

(9)

siendo f1 (x| f1 ), f2 (x|f2 ), g1 (x|g1 ) y g2 (x|g2 ) los


mejores aproximadores de f 1 (x), f2 (x), g1 (x) y g2 (x) respectivamente, con f1 , f2 , g1 y g2 como los parametros
de adaptacion o ptimos, de manera que el sistema en lazo
cerrado puede escribirse como



 
e = e + b 1 f1 f1 + 2 f2 f2
 




+ 1 g1 g1 + 2 g2 g2 u +

(10)

La tarea de la ley de adaptacion es determinar un


mecanismo de adaptacion tal que f1 f1 , f2 f2 ,
g1 g1 y g2 g2 de forma que el error en lazo
cerrado e sea mnimo; esta ley de adaptacion se obtiene a
partir del analisis de estabilidad de Lyapunov.

f2

Obtenemos as las funciones estimadas


F (x|F ) = f1 (x| f1 ) L + f2 (x| f2 )
(x| G ) = g1 (x|g1 ) L + g2 (x| g2 )
G

Para este fin se propone la siguiente funcion candidata de


Lyapunov
V (e, f , g ) =
+
+
+
+

(6)
(7)

De esta manera, la ley de control difuso adaptable esta dada finalmente por

1 T
e Pe
2
1 
f1
21
1 
f2
22
1 
g1
23
1 
g2
24

f1

T 

f1 f1

f2

T 

f2 f2

g1

T 

g1 g1

g2

T 

g2 g2

(11)

la cual es una funcion definida positiva, con 1 , 2 , 3 y


4 siendo constantes positivas, y P es una matriz simetrica
definida positiva que satisface la ecuacion de Lyapunov
T P + P = Q, siendo Q una matriz arbitraria n n

simetrica definida positiva. La derivada temporal de V a lo


largo de la trayectoria del sistema en lazo cerrado de interes
es
1
V (e, f , g ) = eT Qe + eP b
2
T 
1 
f1
f1 f1
+
1
T 
1 
f2
f2 f2
+
2
T 
1 
g1
g1 g1
+
3
T 
1 
g2
g2 g2
+
4


+ 1 eT P b 1 (x)

+ 2 eT P b 2 (x)
+ 3 eT P b 1 (x)u
+ 4 eT P b 2 (x)u




Para minimizar el error de seguimiento e, y los errores en


los parametros de adaptacion ( f1 f1 ), ( f2 f2 ), ( g1
g1 ) y ( g2 g2 ), y a la vez minimizar V , se seleccionan
las siguientes leyes de adaptacion
f1 = 1 eT P b1 (x)
f2 = 2 eT P b2 (x)

g1
g
2

= 3 eT P b1 (x)u

TABLA I

DEL S ISTEMA
PAR AMETROS
Descripcion
Masa del Carro
Masa del pendulo
Longitud al centro de masa del pendulo
Momento de inercia

Notacion
M
m
l
I

Valor
2.024 kg
0.338 kg
0.33 m
0.015 kg / m2

= 4 eT P b2 (x)u (13)

As, la derivada temporal de V se reduce a


V (e, f1 , f2 , g1 , g2 ) = 21 eT Qe + eT P b. Si los
sistemas difusos se disenan de manera tal que el error de
aproximacion mnimo sea tan pequeno para que se cumpla
|eT P b| < 12 eT Qe, entonces V (e, f1 , f2 , g1 , g2 ) < 0
y el sistema es estable en el origen.
III.

Fig. 1. Diagrama de cuerpo libre del carro-pendulo

(12)

DIN AMICA
DEL CARRO-P ENDULO

El sistema carro-pendulo del ITL consta de un riel sobre


el cual esta montado un carro con movimiento lineal.
El carro tiene en uno de sus extremos un mecanismo
subactuado, ya que posee mas grados de libertad que
actuadores. El objetivo de control es llevar el pendulo a una
posicion vertical hacia arriba, que es el punto de equilibrio
inestable.
Para el modelado del sistema carro-pendulo se considera el
diagrama de cuerpo libre de la Fig. 1, en donde
x = posicion del carro [m]


m
x = velocidad del carro
seg
= posicion angular del pendulo [rad]


rad
= velocidad angular del pendulo
seg
u = par de entrada [N ],
mientras que los parametros I, l, m, y M estan dados en la
Tabla I y g es la fuerza de atraccion gravitacional.
El modelo dinamico del sistema carro-pendulo se puede
obtener de las ecuaciones de movimiento de Lagrange, como

se sugiere en [9] para el modelado de robots manipuladores.


Por lo tanto, el modelo no lineal en terminos de la ecuacion
de estados se puede escribir como:

x2
x 1


x 2 2 x22 sin x1 cos x1 sin x1
=

x 3
x4


x 4
x22 sin x1 + sin x1 cos x1

0
cos x1
u
+

(14)

Para simplificar se han definido los parametros auxiliares


=
, = ml 2 + I, = ml, = mgl, y =
 m+M
2
1/ cos2 x1 . Los estados del sistema son x1 = ,
x3 = x, x4 = x.
Para reducir mas el modelo del
x2 = ,
sistema, lo reescribimos como sigue:
x1 = x2

x2 = f1 (x) + g1 (x)u

x3 = x4

x4 = f2 (x) + g2 (x)u

(15)

donde


f1 (x) = 2 x22 sin x1 cos x1 sin x1


f2 (x) = x22 sin x1 + sin x1 cos x1
g1 (x) = cos x1
g2 (x) =
IV.

E STRATEGIA DE CONTROL

En esta seccion se muestra el desarrollo del controlador


difuso adaptable considerando el sistema como de cuarto

orden. Primeramente se desarrolla un controlador basado


en la linealizacion por realimentacion utilizando los cuatro
estados del sistema carro-pendulo. Para lograr esto se definen
nuevos estados del sistema que incluyan simultaneamente
los terminos del pendulo y del carro. A partir de estos
estados se define la ley de control. Para minimizar los
efectos oscilatorios de esta ley, se agrega un termino de
amortiguamiento. Como segundo punto, la ley de control de
linealizacion por realimentacion es modificada, al cambiar
que son las funciones
los terminos F y G por F y G,
estimadas mediante sistemas difuso-adaptables.
En el simulador del carro-pendulo que se uso, el pendulo
comienza de la posicion vertical hacia abajo = 180 .
Por lo tanto, se requiere un control adicional para acercar
el pendulo a la posicion vertical invertida, conocido como
control de vaiven, el cual con pequenos movimientos del
carro hacia los lados, va llevando el pendulo hasta que e ste
llegue a una posicion cercana a los 0 . Al estar alrededor de
esta posicion, el conmutador desactiva el control de vaiven
y cambia al control de estabilizacion.

Por lo tanto, el modelo queda como sigue


y 1 = y2
y 2 = F + Gu

A continuacion se propone la siguiente ley de control


de linealizacion por realimentacion que estabiliza el sistema
(21):

uf bl

1
=
G





e1
T
+ yr
F + kc
e2

y = x + L

kc =

(16)

Considerando lo anterior, escogemos nuevos estados como


y1 = y
= x + L
= x3 + Lx1

(17)

y2 = y

(22)



donde e1 = yr y, e2 = y r y y kcT = k1 k2 . Al
aplicar la ley de control (22), el sistema en lazo cerrado
se reduce a una ecuacion lineal, en la cual la ganancia k c
determina la colocacion de sus polos, por lo que k c se escoge
de tal manera que las races de la ecuacion lineal s 2 + k2 s +
k1 = 0 se encuentren en el semiplano izquierdo para que el
sistema sea estable. Para ello se selecciono

IV-A. Control de Linealizaci o n por Realimentaci o n


Una de las maneras para controlar sistemas subactuados
es mediante la seleccion de una salida que sea funcion de
la salida actuada y de la salida no actuada. Considerando
nuestro sistema de cuarto orden (14), inspirados en [5]
elegimos una salida y como

(21)

k1
k2


=

1500
850


(23)

Para mostrar que el controlador (22) estabiliza el sistema


de cuarto orden (15), se debe conocer el valor para el cual
G = 0 alrededor de = 0. Por lo que se sustituye g 1 y g2
en (20), y obtenemos G = , donde = L cos ,
por lo que G = 0 cuando = 0, lo cual ocurre cuando
= b = cos1 (/L). Este valor de se considera
como el lmite entre dos regiones, la primera alrededor de
= 0 y la otra alrededor de = 180 . Si se aplica la
ecuacion (22) directamente al sistema de cuarto orden (15),
la dinamica de ceros del sistema es crticamente estable con
respuesta oscilatoria, como se comprobo en [5]. Esto quiere
decir que x y estaran oscilando indefinidamente, mientras
que y se mantendra en 0. Por lo tanto, se agrega un termino
de amortiguamiento al controlador (22) para contrarrestar
las oscilaciones, el cual es un termino de realimentacion de
estados, dado como

= x + L
= x4 + Lx2

ud = kdT [x1 x2 ex1 ex2 ]T

(18)

Con lo anterior, definimos ahora un nuevo modelo dinamico:


y 1 = y

(24)

donde
ex1 = yr x

= y2
y 2 = x 4 + Lx 2

ex2 = y r x

= [Lf1 + f2 ] + [Lg1 + g2 ]u

Ahora tenemos una ley de control total dada por

Definimos
F = Lf1 + f2

(19)

G = Lg1 + g2

(20)

u = uf bl + ud

(25)

Aplicando el controlador (25) a la planta (15), y despues

linealizando el sistema, obtenemos


0
1
x 1
Lk2
1
x 2 +Lk
+L
+L

x 3 =
0
0
Lk2
L+Lk1
x 4
L
L

ud
+

0


k1
+L

k2
+L

k1
L

k2
L

(26)
Fig. 2. Funciones de pertenencia de entrada gaussianas

x1 x2 x3 x4 . La ganancia de amordonde x =
tiguamiento kd se obtuvo mediante la tecnica de diseno
Regulador Cuadratico Lineal (LQR). Para usar esta tecnica,
se necesita el modelo linealizado que se obtuvo en (26) y
sustituyendo los parametros de la Tabla I, el valor de la
ganancia kc (23), y la ganancia L = 0.67, obtenemos:

0
1
0
0
4937 2771 7298 4135

A=

0
0
0
1
2303
1287
3390
1921

T
B = 0 1.01 0 0.47

(27)

(28)

los universos de discurso p , p , px y px fueron seleccionadas


como
(23, 15, 0, 15, 23),
(115, 75, 0, 75, 115),
(191, 5, 0, 5, 191)
y
(38, 28, 0, 28, 38)
repectivamente. Las desviaciones estandar , , x
y x se seleccionaron como (1.14, 7.44, 7.44, 7.44, 1.14),
(5.72, 37.34, 37.34, 37.34, 5.72),
(1.91, 4.01, 4.01, 4.01, 1.91)
y
(11.46, 54.43, 54.43, 54.43, 11.46)
respectivamente.
El valor de las constantes de adaptacion es 1 = 2 = 50 y
3 = 4 = 0.0000001. La aplicacion del controlador difuso
adaptable al carro-pendulo se observa en la Fig. 3.

Seleccionando la diagonal principal de Q


=
[100 100 200 200], R = 1 y usando la funcion lqr de
Matlab, el valor de k d obtenido es
kd =

65.64 30.22 107.02 65.84

T

(29)

Para mejorar la respuesta de la ley de control (22) se


utilizaron sistemas difusos para estimar las funciones F (x)
y G(x), por lo que la ley de control queda como
uaf lc =

G(x)



(n)
F (x) + kT e + ym

Fig. 3. Controlador difuso adaptable

(30)

donde F (x) y G(x)


estan dadas por (6) y (7). Partiendo
de una condicion inicial diferente de cero, es necesario

verificar que G(x)


= 0; de ser el caso, tomamos el valor
anterior.

V.

RESULTADOS DE SIMULACI ON

(31)

En la Fig. 4 se muestran los resultados para el caso de


estabilizacion. En la Fig. 4.a) se muestra la posicion del
pendulo, la cual despues de un poco de oscilacion, logra
estabilizarse en cero grados. En la Fig. 4.b) se muestra la
posicion del carro, la cual se puede observar que llega al
origen, aunque la respuesta se muestra bastante oscilatoria
antes de estabilizarse.

Para los sistemas difusos que estiman f1 (x|f1 ),

f2 (x|f2 ), g1 (x|g1 ) y g2 (x|g2 ) se utilizaron sistemas difusos con las funciones de pertenencia de entrada mostradas
en la Fig. 2
Cada uno de los cuatro sistemas difusos fue particionado
en cinco conjuntos difusos: A 2
= N B (Negativo Grande),
i
=
N
S
(Negativo
Peque
n
o), A 0i = ZE (Cero),
A1
i
1
2
Ai = P S (Positivo Pequeno), A i = P B (Positivo Grande),
con i = 1, 2 como el numero de entrada. Las particiones de

En la Fig. 5 se muestra el resultado para el caso de


seguimiento, en donde se uso como senal de referencia
yr = 0.2 sin(t). En la Fig. 5.a) se aprecia que el pendulo
al llegar a la posicion invertida tiene un comportamiento
oscilatorio debido a que el carro trata de alcanzar la senal
sinusoidal de referencia. Este efecto se mantiene hasta los
16 segundos, en donde finalmente el pendulo se mantiene
estable mientras que el carro sigue con un pequeno error la
senal de referencia, tal como se observa en la Fig. 5.b).

Por lo que ahora la ley de control total queda de la


siguiente manera
u = uaf lc + ud

asegure su estabilidad. En este trabajo se estudia una ley


de control que considera los cuatro estados del sistema
carro-pendulo. Se presentan simulaciones para el caso de
estabilizacion tanto del carro como del pendulo, y para el
caso de estabilizacion del pendulo y seguimiento del carro.
En ambos casos se alcanza el objetivo planteado.
Las leyes de adaptacion (13) utilizadas en este trabajo
no garantizan el acotamiento de los parametros f1 , f2 , g1
y g2 . Este problema se puede resolver agregando un control
supervisorio a la ley de control (4), como es propuesto
en [4]. El control supervisorio se activara solamente
cuando los estados tiendan a dejar el rango estable, y se
desactivara cuando los estados regresen al rango estable.
Este control supervisorio se estudio en [10], en donde
se aplico a un sistema de Multiples Entradas, Multiples
Salidas. En este trabajo mencionado se pudo observar que
el control supervisorio rara vez se activaba. Se planea a
futuro incorporar esta estrategia de control a nuestro control
difuso adaptable.
VII.
Fig. 4. Respuesta para el caso de estabilizacion

AGRADECIMIENTOS

Este trabajo fue realizado con apoyo de la DGEST y


CONACYT.
R EFERENCIAS
[1] Astrom, K. J.; Furuta, K. (Febrero 2000). Swinging up a pendulum by
energy control. Automatica, Vol. 26, No. 2, pp. 287-295.
[2] Garca, J. (2006). Implementacion y control de un sistema pendulo
invertido. Tesis de maestra, Instituto Tecnologico de la Laguna,
Mexico.
[3] Centeno, H; Llama, M. A.; Santiban ez, V. (2008). Control difuso
adaptable: Aplicacion experimental a un carropendulo CONGRESO

MEXICANO DE ROBOTICA,
Mexico.
[4] Wang, L. X. (1991). A course in fuzzy systems and control. Prentice
Hall, USA.
[5] El-Hawwary, M. I.; Elshafei, A. L.; Emara, H. M.; Abdel Fattah , H.
A.; (November 2006). Adaptive Fuzzy Control of the Inverted Pendulum Problem. IEEE Transactions on Control Systems Technology.
Vol. 14, No. 6, pp. 11351144.
[6] Slotine J. J., Li W., Applied nonlinear control, Prentice Hall, USA,
1991.
[7] Khalil H., Nonlinear control systems, Prentice Hall, USA, 3a. edicion,
2002.
[8] Isidori. A., Nonlinear control systems, Springer, USA, 1995.
[9] I. Fantoni, R. Lozano, Non-linear Control for underactuated Mechanical systems, Spriger-Verlang, 2002.
[10] Tellaeche, J. L. (2006). Diseno de un controlador difuso adaptable
para un robot manipulador de dos grados de libertad de transmision
directa. Tesis de maestra, Instituto Tecnologico de la Laguna, Mexico.

Fig. 5. Respuesta para el caso de seguimiento

VI.

CONCLUSIONES

En este artculo se ha estudiado un metodo diferente


para disenar el control del carro-pendulo. En la literatura
de control automatico generalmente se aborda este sistema
como de segundo orden, ignorando la dinamica del carro,
por lo que se agrega un lazo de control externo que

S-ar putea să vă placă și