Criterios de Funcionamiento de Control Óptimo

0
Año De La Consolidación Del Mar De Grau
Tema : Regulador de Estado

Escuela : Ingeniería Electrónica
Sección : IXEE
Curso : Control Automático III
Docente : Ing. Fidel Andía Guzmán
Grupo :
 Alvares Quito Pedro
 Bustillos Gastello Jorge
 Crisóstomo García Andrés
 Raymundo Flores Ronald
 Tataje López Brian
1
Contenido
........................................................................................................................................ 2
DEDICATORIA ................................................................................................................................. 3
........................................... 4
Regulador del estado ....................................................................................................................... 4

1.1 Ecuación de Riccati Diferencial ...................................................................................... 5
1.2 Valor de Índice de Desempeño ....................................................................................... 8
1.3 Ejemplo de Integrador Doble con LQR .......................................................................... 8
1.4 Ejercicios ....................................................................................................................... 10
2
El método de diseño por realimentación de estados y observador, no obstante ser una
herramienta fundamental en el control de sistemas en E.E., no siempre es el método de diseño
más útil por:
 El traslado de las especificaciones de diseño (máximo sobre impulso, etc.), no siempre es
directo, particularmente para sistemas complejos; ¿cuál es la mejor configuración de polos
para las especificaciones dadas?
 En sistemas MIMO las ganancias de realimentación de estados que logran una
configuración de polos dada, no es única. ¿Cuál es la mejor K para una configuración de
polos dada?
 Los autovalores del observador deberían escogerse más rápidos que los del sistema de
lazo cerrado. ¿Hay algún otro criterio disponible para ayudar a decidirse por una
configuración o por otra?
Los métodos que introduciremos ahora dan respuesta a esas preguntas. Veremos cómo
las ganancias de la realimentación de estados y del observador se pueden calcular en una
forma óptima.
3
DEDICATORIA
Dedico este proyecto de tesis a Dios y a mis padres. A Dios
porque ha estado conmigo a cada paso que doy, cuidándome y
dándome fortaleza para continuar, a mis padres, quienes a lo
largo de mi vida han velado por mi bienestar y educación
siendo mi apoyo en todo momento. Depositando su entera
confianza en cada reto que se me presentaba sin dudar ni un
solo momento en mi inteligencia y capacidad. Es por ellos que
soy lo que soy ahora. Los amo con mi vida.
4
Regulador del estado
Vamos a empezar el tema de “Regulador Cuadrático Lineal” considerando un sistema que

va a ser controlado y esta descrito por las ecuaciones espacio de estado:
𝑥̇ (t) = A(t)x(t) + B(t)u(t), (24)

Y(t) = Cx(t)
x(t0) = x0
Y el índice de desempeño asociado a ser minimizado es:
1 𝑡𝑓 1
J(x) = 2 𝑥 𝑡 (tf) Fx (tf) + ∫𝑡0 [𝑥 𝑡 (t)Q(t)x(t) + 𝑢𝑡 (t)R(t)u(t)] dt (25)
2
Donde Q = 𝑄𝑡 >= 0 y F = 𝐹 𝑡 son matrices reales simétricas semidefinidas positivas y R = 𝑅 𝑡 > 0 es

una matriz real simétrica y definida positiva, es estado inicial “t0” y el estado final ”tf” son
especificados, y u(t) y x(t) no están restringidos.
5
1.1 Ecuación de Riccati Diferencial
Para usar la ecuación Hamilton-Jacobi-Bellman, primero escribimos el Hamiltoniano H:
1
H(x(t),u(t),𝐽𝑥∗ , t) = 2[ 𝑥 𝑡 (t)Q(t)x(t) + 𝑢𝑡 (t)R(t)u(t)] + 𝐽𝑥∗ (x(t),t)[A(t)x(t) + B(t)u(t)
𝜕𝐻
Una condición necesaria para u(t) que minimiza H es que 𝜕𝑢 = 0; entonces:
𝜕𝐻
(x(t),u(t), 𝐽𝑥∗ ,t) = R(t)u(t) + 𝐵 𝑡 (t) 𝐽𝑥∗ (x(t),t) =0. ……. (27)
𝜕𝑢
𝜕2 𝐻
La condición suficiente está dada por 𝜕𝑢2 > 0, luego se tiene que
𝜕2 𝐻
(x(t),u(t), 𝐽𝑥∗ ,t) = R(t)
𝜕𝑢2
Que es definida positiva y H posee forma cuadrática en u. El control que satisface la

ecuación (27) minimiza H (globalmente). Resolviendo la ecuación 27 para 𝑢∗ (t)
resulta:
𝑢∗ (t) = - 𝑅 −1(t) 𝐵 𝑡 (t) 𝐽𝑥∗ (x(t),t)
Reemplazando 𝑢∗ (t) en (26) se obtiene:
1 1
H(x(t), 𝑢∗ (t), ) 𝐽𝑥∗ ,t) = 𝑥 𝑡 Qt + 2 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵 𝑡 𝐽𝑥∗ + 𝐽𝑥∗ 𝑡 Ax - 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵 𝑡 𝐽𝑥∗
2
1 1
= 𝑥 𝑡 Qt - 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵𝑡 𝐽𝑥∗ + 𝐽𝑥∗ 𝑡 Ax ………(30)
2 2
La ecuación de Hamilton-Jacobi-Bellman se reduce a:
1 1
0 = 𝐽𝑡∗ + 2 𝑥 𝑡 Qt - 𝐽𝑥∗ 𝑡 B𝑅 −1 𝐵 𝑡 𝐽𝑥∗ + 𝐽𝑥∗ 𝑡 Ax ……… (31)
2
6
De la ecuación 25 la condición de frontera es:

1
𝐽∗ (x(tf),tf) = 2 𝑥 𝑡 (tf)Fx(t) ……..(32)
Del análisis de estabilidad realizado en secciones anteriores para sistemas lineales, debe
existir una función Lyapunov V(t) = 𝑥 𝑇 (t)P(t)x(t) que garantice la estabilidad asintótica en
lazo cerrado; esto es, existe alguna matriz definida positiva P(t) y la derivada en función del
tiempo dV/dt evaluada en las trayectorias del sistema en lazo cerrado es definida negativa.
Luego, asumiendo la solución 𝐽∗ (x(t),t) de la siguiente forma:
1
𝐽∗ (x(t),t) = 2 𝑥 𝑇 (t)P(t)x(t) …..(33)
Donde P(t) es una matriz real simétrica definida positiva que debe ser determinada.
Sustituyendo la solución asumida en la ecuación 31 resulta:
1 1 1
0 = 2 𝑥 𝑇 Px + 2 𝑥 𝑇 Qx - 2 𝑥 𝑇 PB𝑅 −1 𝐵𝑇 Px + 𝑥 𝑇 PAx
La matriz PA que aparece en el último término puede ser escrita como la suma de una parte
simétrica y otra parte anti-simétrica.
1 1
PA = 2[PA + (PA)𝑇 ] + 2[PA - (PA)𝑇 ]
Usando la propiedad de matrices (PA)𝑇 = 𝐴𝑇 𝑃𝑇 y sabiendo que la transpuesta de un escalar

es igual a si misma se puede demostrar que sólo la parte simétrica de PA contribuye en
(49). Luego (49) puede ser escrita como:
1 1 1 1 1
0 = 2 𝑥 𝑇 Px + 2 𝑥 𝑇 Qx - 2 𝑥 𝑇 PB𝑅 −1 𝐵𝑇 Px + 2 𝑥 𝑇 PAx 2 𝑥 𝑇 𝐴𝑇 Px
Esta ecuación debe cumplirse para todo x(t), luego la ecuación de Riccati es:
0 = P(t) + Q(t) – P(t)B(t) 𝑅 −1(t) 𝐵 𝑇 (t)P(t) + P(t)A(t) + 𝐴𝑇 (t)P(t) ……(37)
Y la ecuación de frontera de (32) y (33)
P(tf) = F ……(38)
A continuación consideremos las implicancias del resultado obtenido: primero, la ecuación
diferencial parcial de H-J-B se reduce a un conjunto de ecuaciones diferenciales no lineales
ordinarias. Segundo, la matriz P8t) puede ser determinada por integración numérica de
(37). Retrocediendo en el tiempo- a partir de t = tf hacia t = t0 – usando la condición de
frontera P(tf) = F. En realidad dado que la matriz P(t) es simétrica, necesitamos integrar
solo n(n + 1)/2 ecuaciones diferenciales.
Una vez que P(t) ha sido determinado, la ley de control óptima está dado por:
𝑢∗ = -𝑅 −1(t) 𝐵 𝑇 (t)P(t)x(t) ……(39)
7
Donde al haber asumido (33), la ley de control óptima es lineal, variante en el tiempo y por
realimentación de estados. Por similitud con el control por realimentación de estados
podemos escribir:
𝑢∗ = -K(t)x(t) …………..(40)
La figura muestra el diagrama de bloques de la realimentación de estados para el regulador

cuadrático lineal. Se observa que en general la ganancia LQR será dependiente del tiempo
aun cuando el sistema sea LTI y la función de costo tenga matrices de ponderación Qy R
constantes. Nótese que la ganancia del controlador LQR es un controlador lineal por
realimentación de estados y que la ganancia LQR sólo depende de parámetros que se
conocen con anticipación y luego podría ser calculado fácilmente offline.
Una vez obtenida la ley de control óptima, el sistema en lazo cerrado está dado por:
𝑥̇ (t) = Ac(t)x(t) = [A8T9 – B(t)K(t)]x(t) ….(41)
+ + x
r u 𝑥̇ y
B ∫
C
+
-
K(t)
K (f) = 𝑅 −1(t) 𝐵 𝑇 (t) P(t)

-P(t) = P(t) = P(f)A(t) + 𝐴𝑇 (t)P(t) – P(t)B(t) 𝑅 −1(t) 𝐵 𝑇 (t)P(t) + Q(t)
8
1.2 Valor de Índice de Desempeño
El valor del índice de desempeño puede ser evaluado en base a la solución de la ecuación
de Riccati. Primero, notar que:
𝑑
(𝑥 𝑇 Px) = ̇ 𝑥̇ 𝑇 Px + 𝑥 𝑇 𝑃𝑥 + 𝑥 𝑇 𝑃𝑥̇
𝑑𝑡
Luego en el Índice de desempeño (25) se obtiene

1 1 1
J(𝑢∗ ) = 𝑥 𝑡 (tf) Fx (tf) - 2 𝑥 𝑡 (tf)P(tf)X(tf) + 𝑥 𝑡 (t0) P(t0)x(t0) dt
2 2
Usando la ecuación (38) los dos primeros términos desaparecen y el valor óptimo
(mínimo) del índice de desempeño es:
𝟏
Jmin = 𝟐 𝒙𝒕 (t0) P(t0)x(t0) …….(42)
1.3 Ejemplo de Integrador Doble con LQR
Considere un integrador doble descrito por la ecuación espacio de estado
0 1 𝑝(𝑡)
𝑥̇ (𝑡) = Ax(t) + Bu(t) = [ ][ ] + [0 ] u(t)
0 0 𝑣(𝑡) 1
El vector de estados está formado por la posición p(t) y la velocidad v(t) y la entrada de
control es la aceleración u(t). El índice de desempeño a ser minimizado es :
1 1 𝑡𝑓
J = 2 𝑥 𝑡 (tf) Fx (tf) + 2 ∫𝑡0 [𝑥 𝑡 (t)Qx(t) + p𝑢2(t)] dt
Aquí las matrices han sido relacionadas como:

𝑓11 𝑓12 𝑟𝑝 1
F= [ ] Q=[ ] p>0
𝑓12 𝑓22 0 𝑡𝑣
Para que F y Q sean semidefinidas positivas, los parámetros rp, rv y los auto valores
de F deben ser no negativos. Introduciendo las matrices de ponderación en la
ecuación de Riccati diferencial resulta:
9
𝑟𝑝 1 0 0 0 0
-P(t) = [ ] – P(t) [ 01] 1/p [0 1 ] p(t) + P(t) [ ][ ] P(t)
0 𝑡𝑣 1 0 1 0
Como P(t) es simétrico tenemos que resolver tres ecuaciones para los elementos de:
𝑝11 𝑝12
P(t) = [ ]
𝑝12 𝑝22
1
-p11 = rp - 𝑝2 12
𝑝
1
-p12 = p11 - 𝑝p12p22
1
-p22 = tv + 2p12 - 𝑝 𝑝2 12
5
P11
4
3
P(t0) P22
2
P12
1
0 4 8 10
Solución de la ecuación de Ricatti para el integrado doble

10
1.4 Ejercicios
Ejercicio 1:
Considere un integrador doble escrito por la ecuación espacio de estado:
0 1 0
𝑥̇ (𝑡) = [ ] x(t) + [ 1] u(t)
0 0
El controlador tiene que minimizar el siguiente índice de desempeño:
∞
J = ∫0 [𝑥 𝑡 (t)Qx(t) + p𝑢2(t)] dt
Aquí las matrices han sido seleccionadas como :

𝑟𝑝 1
Q=[ ]
0 𝑡𝑣
P>0
Donde rp y rv son los pesos de posición y velocidad respectivamente. Con los valores
dados la ecuación de Riccati algebraica resulta en las siguientes ecuaciones acopladas:
1
-p11 = rp - 𝑝2 12
𝑝
1
-p12 = p11 - 𝑝p12p22
1
-p22 = tv + 2p12 - 𝑝 𝑝2 12
Solución:
𝑝11 𝑝12
Aquí p = [ ], es la solución de la ARE. Resolviendo estas ecuaciones algebraicas
𝑝12 𝑝22
se obtiene la solución definida positiva única:
P11 = √𝑟𝑝√2𝑝√𝑟𝑝𝑃 + 𝑟𝑣𝑝
P12 = √𝑟𝑝𝑃
P22 = √2𝑝√𝑟𝑝𝑃 + 𝑟𝑣𝑝

11
El controlador resulta en el control por realimentación de estados con la señal de control:

U(t) = -K∞x(t) = -(𝑅 −1 𝐵 𝑡 P∞)x(t)
𝑟𝑝 𝑟𝑝 𝑟𝑝
= - [√ 𝑃 √2√ 𝑃 − ] x(t)
𝑃
Se observa que la ganancia del control de incrementa a medida que los pesos de los estados
se incrementan, la ecuación característica del sistema en lazo cerrado puede ser encontrada
como:
𝑟𝑝 𝑟𝑣 𝑟𝑝
𝑆 2 + √2√ 𝑃 + s+ =0
𝑃 𝑃
La frecuencia natural correspondiente al sistema en lazo cerrado w y el factor de

amortiguamiento “c” son calculados como:
4 𝑟𝑝
W = √𝑃
1 𝑟𝑣
C= √1 + 2√𝑃
√2 √𝑟𝑝
Para p = 1, si rv = 0 los polos en lazo cerrado tienen un factor de amortiguamiento de
1/√2 ≈ 0.71
Para elementos de la matriz de ponderación positivos el factor de amortiguamiento de los

polos en lazo cerrado siempre serán mayores que 0.71
12
Ejercicio 2:
Considere el siguiente modelo de un sistema dinámico
𝑥̇ = 2x + u
Así como el índice de desempeño asociado
∞
J = ∫0 [𝑥 2 + 𝑟𝑢2)dt
Encuentre el valor de r tal que el sistema en lazo cerrado óptimo tenga un polo -3
Solución:
Formamos la matriz Hamiltoniana asociada
𝐴 −𝐵𝑅 −1 𝐵𝑇 2 −1/𝑟
H=[ ]=[ ]
−𝑄 −𝐴𝑇 −1 −2
La ecuación característica de H es:
Det(sI2 – H) = 𝑠 2 – 4 – 1/r = 0
Luego:
Resulta en el sistema en lazo cerrado óptimo teniendo su polo localizado en -3
13
Ejercicio 3:
Considere la dinámica original de una aeronave de impulsión escrita en la forma espacio de
estados como:
0
𝑧4
0
𝑧5
0
𝑑𝑧
𝑧6 1 1
= −𝑔𝑠𝑖𝑛𝜃 −
𝑐
𝑧4 + 𝑚 𝑐𝑜𝑠𝜃𝐹1 − 𝑚 𝑠𝑖𝑛𝜃𝐹2
𝑑𝑡 𝑚
𝑐 1 1
−𝑔𝑐𝑜𝑠𝜃 − 𝑧5 𝑠𝑖𝑛𝜃𝐹1 + 𝑚 𝑐𝑜𝑠𝜃𝐹2
𝑚 𝑚
𝑟
[ 0 ] 𝐹1
[ 𝑗 ]
Los parámetros del sistemas son m = 4kg. J = 0.0475kgm cuadrados, r = 0.25, g =9.8m/𝑠 2 ,
c = 0.05NS/m, que corresponde a un modelo escalado de sistema. El punto de equilibrio
para el sistema está dado por F! = 0, F2 = mg y Ze = (Xe, Ye, 0, 0, 0, 0). Para derivar el
sistema linealizado cerca del punto de equilibrio, calculamos el sistema linealizado.
00 0 1 0 0 0 0
A= 00 0 0 1 0 0 0
00 0 0 0 1 B= 0 0
0 0 –g −𝑐
𝑚
0 0 1/m 0
−𝑐
00 0 0 𝑚
0 0 1/m
00 0 0 0 0 r/j 0
1 00 00 0 0 0
C=| | D=| |
0 10 00 0 0 0
14
Haciendo z= z-ze y v = u –ue, el sistema linealizado está dado por:
𝑑𝑧
= Az + Bv
𝑑𝑡
Y = Cz
Se puede verificar que el sistema es alcanzable

Para calcular el regulado lineal para el sistema, escribimos la función costo como:
∞
J = ∫0 [𝑍 𝑇 Qz + 𝑣 𝑇 𝑅𝑣)dt
Dónde:
z= z-ze y v = u –ue representan las coordenadas locales en torno al punto de equilibrio (Ze,
Ue)
Comenzamos con matrices diagonales para los costos del estado y la entrada:
1 00 00 0
0 10 00 0
0 01 00 0 1 0
𝑄= R=[ ]
0 00 10 0 0 1
0 00 01 0
0 00 00 1
Luego la ley de control de la forma v = -kz será usada para derivar la ley de control en
términos de las variables originales:
15
U = v + vc = -k(z - ze) + ve
Los puntos de equilibrio corresponden a uc = (0.mg) y ze = (xe, ye, 0, 0, 0, 0). La respuesta

del controlador a un cambio de la función escalón es mostrada en la figura (a), la respuesta
puede ser afinada cambiando los pesos en la función de costo la figura (b) muestra la
respuesta en la dirección x para diferentes selecciones del peso p, siendo que R = pI2
Posición x, y [m]
0.5
x
0 2 4 6 8 10 Figura a
Posición x [m]
0.5 p
0 2 4 6 8 10 Figura b
Respuesta al escalón de una aeronave de impulsión. La figura (a) muestra las posiciones
“x” e “y” de la aeronave cuando se le comanda moverse 1m en cada dirección. La figura (b)
se muestra el movimiento x variando los pesos de control p = 1, 102 , 104 . Un peso más
grande en el término de control de la función costo causa una respuesta más lenta.

Criterios de Funcionamiento de Control Óptimo

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Criterios de Funcionamiento de Control Óptimo

Încărcat de

Drepturi de autor:

Formate disponibile

0

Año De La Consolidación Del Mar De Grau

Tema : Regulador de Estado

Regulador del estado ....................................................................................................................... 4

El método de diseño por realimentación de estados y observador, no obstante ser una

herramienta fundamental en el control de sistemas en E.E., no siempre es el método de diseño

más útil por:

 El traslado de las especificaciones de diseño (máximo sobre impulso, etc.), no siempre es

directo, particularmente para sistemas complejos; ¿cuál es la mejor configuración de polos

para las especificaciones dadas?

 En sistemas MIMO las ganancias de realimentación de estados que logran una

configuración de polos dada, no es única. ¿Cuál es la mejor K para una configuración de

configuración o por otra?

las ganancias de la realimentación de estados y del observador se pueden calcular en una

Regulador del estado

Vamos a empezar el tema de “Regulador Cuadrático Lineal” considerando un sistema que

𝑥̇ (t) = A(t)x(t) + B(t)u(t), (24)

Y el índice de desempeño asociado a ser minimizado es:

Donde Q = 𝑄𝑡 >= 0 y F = 𝐹 𝑡 son matrices reales simétricas semidefinidas positivas y R = 𝑅 𝑡 > 0 es

1.1 Ecuación de Riccati Diferencial

Para usar la ecuación Hamilton-Jacobi-Bellman, primero escribimos el Hamiltoniano H:

Que es definida positiva y H posee forma cuadrática en u. El control que satisface la

Reemplazando 𝑢∗ (t) en (26) se obtiene:

La ecuación de Hamilton-Jacobi-Bellman se reduce a:

De la ecuación 25 la condición de frontera es:

Usando la propiedad de matrices (PA)𝑇 = 𝐴𝑇 𝑃𝑇 y sabiendo que la transpuesta de un escalar

La figura muestra el diagrama de bloques de la realimentación de estados para el regulador

K (f) = 𝑅 −1(t) 𝐵 𝑇 (t) P(t)

1.2 Valor de Índice de Desempeño

Luego en el Índice de desempeño (25) se obtiene

1.3 Ejemplo de Integrador Doble con LQR

Considere un integrador doble descrito por la ecuación espacio de estado

Aquí las matrices han sido relacionadas como:

Solución de la ecuación de Ricatti para el integrado doble

Aquí las matrices han sido seleccionadas como :

P11 = √𝑟𝑝√2𝑝√𝑟𝑝𝑃 + 𝑟𝑣𝑝

P22 = √2𝑝√𝑟𝑝𝑃 + 𝑟𝑣𝑝

El controlador resulta en el control por realimentación de estados con la señal de control:

La frecuencia natural correspondiente al sistema en lazo cerrado w y el factor de

Para p = 1, si rv = 0 los polos en lazo cerrado tienen un factor de amortiguamiento de

Para elementos de la matriz de ponderación positivos el factor de amortiguamiento de los

La ecuación característica de H es:

Haciendo z= z-ze y v = u –ue, el sistema linealizado está dado por:

Se puede verificar que el sistema es alcanzable

Los puntos de equilibrio corresponden a uc = (0.mg) y ze = (xe, ye, 0, 0, 0, 0). La respuesta

S-ar putea să vă placă și