Documente Academic
Documente Profesional
Documente Cultură
Contenido
........................................................................................................................................ 2
DEDICATORIA ................................................................................................................................. 3
........................................... 4
polos dada?
Los autovalores del observador deberían escogerse más rápidos que los del sistema de
lazo cerrado. ¿Hay algún otro criterio disponible para ayudar a decidirse por una
Los métodos que introduciremos ahora dan respuesta a esas preguntas. Veremos cómo
forma óptima.
3
DEDICATORIA
Dedico este proyecto de tesis a Dios y a mis padres. A Dios
porque ha estado conmigo a cada paso que doy, cuidándome y
dándome fortaleza para continuar, a mis padres, quienes a lo
largo de mi vida han velado por mi bienestar y educación
siendo mi apoyo en todo momento. Depositando su entera
confianza en cada reto que se me presentaba sin dudar ni un
solo momento en mi inteligencia y capacidad. Es por ellos que
soy lo que soy ahora. Los amo con mi vida.
4
1 𝑡𝑓 1
J(x) = 2 𝑥 𝑡 (tf) Fx (tf) + ∫𝑡0 [𝑥 𝑡 (t)Q(t)x(t) + 𝑢𝑡 (t)R(t)u(t)] dt (25)
2
1
H(x(t),u(t),𝐽𝑥∗ , t) = 2[ 𝑥 𝑡 (t)Q(t)x(t) + 𝑢𝑡 (t)R(t)u(t)] + 𝐽𝑥∗ (x(t),t)[A(t)x(t) + B(t)u(t)
𝜕𝐻
Una condición necesaria para u(t) que minimiza H es que 𝜕𝑢 = 0; entonces:
𝜕𝐻
(x(t),u(t), 𝐽𝑥∗ ,t) = R(t)u(t) + 𝐵 𝑡 (t) 𝐽𝑥∗ (x(t),t) =0. ……. (27)
𝜕𝑢
𝜕2 𝐻
La condición suficiente está dada por 𝜕𝑢2 > 0, luego se tiene que
𝜕2 𝐻
(x(t),u(t), 𝐽𝑥∗ ,t) = R(t)
𝜕𝑢2
1 1
H(x(t), 𝑢∗ (t), ) 𝐽𝑥∗ ,t) = 𝑥 𝑡 Qt + 2 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵 𝑡 𝐽𝑥∗ + 𝐽𝑥∗ 𝑡 Ax - 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵 𝑡 𝐽𝑥∗
2
1 1
= 𝑥 𝑡 Qt - 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵𝑡 𝐽𝑥∗ + 𝐽𝑥∗ 𝑡 Ax ………(30)
2 2
1 1
0 = 𝐽𝑡∗ + 2 𝑥 𝑡 Qt - 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵 𝑡 𝐽𝑥∗ + 𝐽𝑥∗ 𝑡 Ax ……… (31)
2
6
Del análisis de estabilidad realizado en secciones anteriores para sistemas lineales, debe
existir una función Lyapunov V(t) = 𝑥 𝑇 (t)P(t)x(t) que garantice la estabilidad asintótica en
lazo cerrado; esto es, existe alguna matriz definida positiva P(t) y la derivada en función del
tiempo dV/dt evaluada en las trayectorias del sistema en lazo cerrado es definida negativa.
Luego, asumiendo la solución 𝐽∗ (x(t),t) de la siguiente forma:
1
𝐽∗ (x(t),t) = 2 𝑥 𝑇 (t)P(t)x(t) …..(33)
Donde P(t) es una matriz real simétrica definida positiva que debe ser determinada.
Sustituyendo la solución asumida en la ecuación 31 resulta:
1 1 1
0 = 2 𝑥 𝑇 Px + 2 𝑥 𝑇 Qx - 2 𝑥 𝑇 PB𝑅 −1 𝐵𝑇 Px + 𝑥 𝑇 PAx
La matriz PA que aparece en el último término puede ser escrita como la suma de una parte
simétrica y otra parte anti-simétrica.
1 1
PA = 2[PA + (PA)𝑇 ] + 2[PA - (PA)𝑇 ]
Esta ecuación debe cumplirse para todo x(t), luego la ecuación de Riccati es:
0 = P(t) + Q(t) – P(t)B(t) 𝑅 −1(t) 𝐵 𝑇 (t)P(t) + P(t)A(t) + 𝐴𝑇 (t)P(t) ……(37)
Y la ecuación de frontera de (32) y (33)
P(tf) = F ……(38)
A continuación consideremos las implicancias del resultado obtenido: primero, la ecuación
diferencial parcial de H-J-B se reduce a un conjunto de ecuaciones diferenciales no lineales
ordinarias. Segundo, la matriz P8t) puede ser determinada por integración numérica de
(37). Retrocediendo en el tiempo- a partir de t = tf hacia t = t0 – usando la condición de
frontera P(tf) = F. En realidad dado que la matriz P(t) es simétrica, necesitamos integrar
solo n(n + 1)/2 ecuaciones diferenciales.
Una vez que P(t) ha sido determinado, la ley de control óptima está dado por:
𝑢∗ = -𝑅 −1(t) 𝐵 𝑇 (t)P(t)x(t) ……(39)
7
Donde al haber asumido (33), la ley de control óptima es lineal, variante en el tiempo y por
realimentación de estados. Por similitud con el control por realimentación de estados
podemos escribir:
𝑢∗ = -K(t)x(t) …………..(40)
+ + x
r u 𝑥̇ y
B ∫
C
+
-
K(t)
El valor del índice de desempeño puede ser evaluado en base a la solución de la ecuación
de Riccati. Primero, notar que:
𝑑
(𝑥 𝑇 Px) = ̇ 𝑥̇ 𝑇 Px + 𝑥 𝑇 𝑃𝑥 + 𝑥 𝑇 𝑃𝑥̇
𝑑𝑡
Usando la ecuación (38) los dos primeros términos desaparecen y el valor óptimo
(mínimo) del índice de desempeño es:
𝟏
Jmin = 𝟐 𝒙𝒕 (t0) P(t0)x(t0) …….(42)
0 1 𝑝(𝑡)
𝑥̇ (𝑡) = Ax(t) + Bu(t) = [ ][ ] + [0 ] u(t)
0 0 𝑣(𝑡) 1
El vector de estados está formado por la posición p(t) y la velocidad v(t) y la entrada de
control es la aceleración u(t). El índice de desempeño a ser minimizado es :
1 1 𝑡𝑓
J = 2 𝑥 𝑡 (tf) Fx (tf) + 2 ∫𝑡0 [𝑥 𝑡 (t)Qx(t) + p𝑢2(t)] dt
Para que F y Q sean semidefinidas positivas, los parámetros rp, rv y los auto valores
de F deben ser no negativos. Introduciendo las matrices de ponderación en la
ecuación de Riccati diferencial resulta:
9
𝑟𝑝 1 0 0 0 0
-P(t) = [ ] – P(t) [ 01] 1/p [0 1 ] p(t) + P(t) [ ][ ] P(t)
0 𝑡𝑣 1 0 1 0
Como P(t) es simétrico tenemos que resolver tres ecuaciones para los elementos de:
𝑝11 𝑝12
P(t) = [ ]
𝑝12 𝑝22
1
-p11 = rp - 𝑝2 12
𝑝
1
-p12 = p11 - 𝑝p12p22
1
-p22 = tv + 2p12 - 𝑝 𝑝2 12
5
P11
4
3
P(t0) P22
2
P12
1
0 4 8 10
1.4 Ejercicios
Ejercicio 1:
Considere un integrador doble escrito por la ecuación espacio de estado:
0 1 0
𝑥̇ (𝑡) = [ ] x(t) + [ 1] u(t)
0 0
El controlador tiene que minimizar el siguiente índice de desempeño:
∞
J = ∫0 [𝑥 𝑡 (t)Qx(t) + p𝑢2(t)] dt
1
-p12 = p11 - 𝑝p12p22
1
-p22 = tv + 2p12 - 𝑝 𝑝2 12
Solución:
𝑝11 𝑝12
Aquí p = [ ], es la solución de la ARE. Resolviendo estas ecuaciones algebraicas
𝑝12 𝑝22
se obtiene la solución definida positiva única:
P12 = √𝑟𝑝𝑃
𝑟𝑝 𝑟𝑝 𝑟𝑝
= - [√ 𝑃 √2√ 𝑃 − ] x(t)
𝑃
Se observa que la ganancia del control de incrementa a medida que los pesos de los estados
se incrementan, la ecuación característica del sistema en lazo cerrado puede ser encontrada
como:
𝑟𝑝 𝑟𝑣 𝑟𝑝
𝑆 2 + √2√ 𝑃 + s+ =0
𝑃 𝑃
4 𝑟𝑝
W = √𝑃
1 𝑟𝑣
C= √1 + 2√𝑃
√2 √𝑟𝑝
1/√2 ≈ 0.71
Ejercicio 2:
Considere el siguiente modelo de un sistema dinámico
𝑥̇ = 2x + u
Así como el índice de desempeño asociado
∞
J = ∫0 [𝑥 2 + 𝑟𝑢2)dt
Encuentre el valor de r tal que el sistema en lazo cerrado óptimo tenga un polo -3
Solución:
Formamos la matriz Hamiltoniana asociada
𝐴 −𝐵𝑅 −1 𝐵𝑇 2 −1/𝑟
H=[ ]=[ ]
−𝑄 −𝐴𝑇 −1 −2
Det(sI2 – H) = 𝑠 2 – 4 – 1/r = 0
Luego:
Resulta en el sistema en lazo cerrado óptimo teniendo su polo localizado en -3
13
Ejercicio 3:
Considere la dinámica original de una aeronave de impulsión escrita en la forma espacio de
estados como:
0
𝑧4
0
𝑧5
0
𝑑𝑧
𝑧6 1 1
= −𝑔𝑠𝑖𝑛𝜃 −
𝑐
𝑧4 + 𝑚 𝑐𝑜𝑠𝜃𝐹1 − 𝑚 𝑠𝑖𝑛𝜃𝐹2
𝑑𝑡 𝑚
𝑐 1 1
−𝑔𝑐𝑜𝑠𝜃 − 𝑧5 𝑠𝑖𝑛𝜃𝐹1 + 𝑚 𝑐𝑜𝑠𝜃𝐹2
𝑚 𝑚
𝑟
[ 0 ] 𝐹1
[ 𝑗 ]
Los parámetros del sistemas son m = 4kg. J = 0.0475kgm cuadrados, r = 0.25, g =9.8m/𝑠 2 ,
c = 0.05NS/m, que corresponde a un modelo escalado de sistema. El punto de equilibrio
para el sistema está dado por F! = 0, F2 = mg y Ze = (Xe, Ye, 0, 0, 0, 0). Para derivar el
sistema linealizado cerca del punto de equilibrio, calculamos el sistema linealizado.
00 0 1 0 0 0 0
A= 00 0 0 1 0 0 0
00 0 0 0 1 B= 0 0
0 0 –g −𝑐
𝑚
0 0 1/m 0
−𝑐
00 0 0 𝑚
0 0 1/m
00 0 0 0 0 r/j 0
1 00 00 0 0 0
C=| | D=| |
0 10 00 0 0 0
14
𝑑𝑧
= Az + Bv
𝑑𝑡
Y = Cz
∞
J = ∫0 [𝑍 𝑇 Qz + 𝑣 𝑇 𝑅𝑣)dt
Dónde:
z= z-ze y v = u –ue representan las coordenadas locales en torno al punto de equilibrio (Ze,
Ue)
Comenzamos con matrices diagonales para los costos del estado y la entrada:
1 00 00 0
0 10 00 0
0 01 00 0 1 0
𝑄= R=[ ]
0 00 10 0 0 1
0 00 01 0
0 00 00 1
Luego la ley de control de la forma v = -kz será usada para derivar la ley de control en
términos de las variables originales:
15
U = v + vc = -k(z - ze) + ve
Posición x, y [m]
0.5
x
0 2 4 6 8 10 Figura a
Posición x [m]
0.5 p
0 2 4 6 8 10 Figura b
Respuesta al escalón de una aeronave de impulsión. La figura (a) muestra las posiciones
“x” e “y” de la aeronave cuando se le comanda moverse 1m en cada dirección. La figura (b)
se muestra el movimiento x variando los pesos de control p = 1, 102 , 104 . Un peso más
grande en el término de control de la función costo causa una respuesta más lenta.