Documente Academic
Documente Profesional
Documente Cultură
Segundo edicion
Katsuhiko Ogata
University of Minnesota
TRADUCCION:
. r ,
6104968779
EDIaO~ D; ESPA..x ot
?RESIDE~ TI DE LA DNISION L -\IT\""O A..'.fERICANA DE SIMON & SCHUSTER . DIRECTOR GENERAL: DIRECTOR DE EDICIONES: GERE:-"lE DNISION UNIVERSITARIA: GERENTE EDITORIAL: EDITOR: GERENTE DE EDICIONES: SUPERVISOR DE TRADUCCION: SUPERVISOR DE PRODUCCION:
RAYMUNDO CRUZADO GONZALEZ MOISES PEREZ ZAVALA ALBERTO SIERRA OCHOA ENRIQUE IVAN GARCIA HERNANDEZ JOSE TOMAS PEREZ BONILLA LUIS GERARDO CEDENO PLASCENCIA JULIAN ESCAMILLA LIQUIDANO TOAQUIN RAMOS SANTALLA ENRIQUE GARCIA CARMONA Lynda Griffiths/TKM Productions Salzbach David Dickey/Bill Scazzero
EDICION EN INGLES
OCT
PROGRAMAS EDUCATIVOS. SA CAll. CHABACANO No.65LOCAL A COL. ASTURIAS, DELEG. CUAUHTEMOC, D.F. C.P.0685O
2000
1996
Cont enido
Prologo Capitulo 1
ix
INTRODUCCION, 1 SISTEMAS DE CONTROL DIGITAL, 5 CUANTIFICACION Y ERRORES DE CUANTIFICACION, 8 SISTEMAS DE ADQUISICION, CONVERSION Y DISTRIBUCION DE DATOS, 11 COMENTARIOS FINA~ES, 20
Capitulo 2 La transformada z
2..1 2-2 2-3 2-4 2-5 2-6 2-7
23
INTRODUCCION, 23 LA TRANSFORMADA z, 24 TRANSFORMADA z DE FUNCIONES ELEMENTALES, 25 PROPIEDADES Y TEOREMAS IMPORTANTES DE LA TRANSFORMADA z, 31 LA TRANSFORMADA z INVERSA, 37 METODO DE LA TRANSFORMADA z PARA LA SOLUCION DE ECUACIONES EN DIFERENClAS,52 COMENTARIOS FINALES, 54 PROBLEMAS DE EJEMPLO Y SOLUCIONES, 55 PROBLEMAS, 70
v
Contenido
INTRODUCCION, 74 MUESTREO MEDIANTE IMPULSOS Y RETENCION DE DATOS, 75 CALCULO DE LA TRANSFORMADA z MEDIANTE EL METODO DE LA INTEGRAL DE CONVOLUCION, 83 RECONSTRUCCION DE SENALES ORIGINALES A PARTIR DE SENALES MUESTREADAS, 90 LA FUNCION DE TRANSFERENCIA PULSO, 98 REALIZACION DE CONTROLADORES DIGITALES Y FILTROS DIGITALES, 122 PROBLEMAS DE EJEMPLOS Y SOLUCIONES, 138 PROBLEMAS, 166
Capitulo 4 Diseiio de sistemas de control en tiempo discreto mediante metodos convencionales 173
INTRODUCCION, 173 CORRESPONDENCIA ENTRE EL PLANO-5 Y EL PLANO-z, 174 ANALISIS DE ESTABILIDAD DE SISTEMAS EN LAZO CERRADO EN EL PLANO-z, 182 ANALISIS DE LAS RESPUESTAS TRANSITORIA YEN ESTADO PERMANENTE, 193 DISENO BASADO EN EL METODO DEL LUGAR GEOMETRICO EN LAS RAlCES, 204 DISENO BASADO EN EL METODO DE Y RESPUESTA EN FRECUENClA, 225 METODO DE DISENO ANALITICO, 242 PROBLEMAS DE EJEMPLO Y SOLUCIONES, 257 PROBLEMAS, 288
INTRODUCCION, 293 REPRESENTACIONES EN EL ESPACIO DE ESTADO DE SISTEMAS EN TIEMPO DISCRETO, 297 SOLUCION DE LAS ECUACIONES DE ESTADO EN TIEMPO DISCRETO, 302 MATRIZ DE TRANSFERENCIA PULSO, 310 DISCRETIZACION DE LAS ECUACIONES EN EL ESPACIO DE ESTADO EN TIEMPO CONTINUO, 312 ~NALISIS DE ESTABILIDAD DE L1APUNOV, 321 PROBLEMAS DE EJEMPLO Y SOLUCIONES, 336 PROBLEMAS, 370
Contenido
vii
INTRODUCCION, 377 CONTROLABILIDAD, 379 OBSERVABILIDAD, 388 TRANSFORMACIONES UTILES EN EL ANALISIS Y DISENO EN EL ESPACIO DE ESTADOS, 396 DISENO viA UBICACION DE POLOS, 402 OBSERVADORES DE ESTADO, 421 SISTEMAS DE SEGUIMIENTO, 460 PROBLEMAS DE EJEMPLO Y SOLUCIONES, 474 PROBLEMAS, 510
Capitulo 7
..
517
INTRODUCCION,517 LA ECUACION DIOFANTINA, 518 EJEMPLO ILUSTRATIVO, 522 ENFOQUE DE ECUACIONES POLINOMIALES PARA EL DISENO DE SISTEMAS DE CONTROL, 525 DISENO DE SISTEMAS DE CONTROL MEDIANTE EL ACOPLAMIENTO A UN MODELO, 532 PROBLEMAS DE EJEMPLO Y SOLUCIONES, 540 PROBLEMAS, 562
INTRODUCClON, 566 CONTROL OPTIMO CUADRATICO, 569 CONTROL OPTIMO CUADRATICO EN ESTADO ESTACIONARIO, 587 CONTROL OPTIMO CUADRATICO DE UN SISTEMA DE SEGUIMIENTO, 596 PROBLEMAS DE EJEMPLO Y SOLUCIONES, 609 PROBLEMAS, 629
viii A-4 A-5 A-6 A-7 A-8 REGlAS DE OPERACIONES CON MATRICES, 637 VECTORES Y ANALISIS VECTORIAL, 643 VAlORES PROPIOS, VECTORES PROPIOS Y TRANSFORMACIONES DE SIMILITUD, 649 FORMAS CUADRATICAS, 659 PSEUDOINVERSAS, 663 PROBLEMAS DE EJEMPlO Y SOlUCIONES, 666
Contenido
681
INTRODUCCION, 681 TEOREMAS UTllES DE lA TRANSFORMADA z, 681 TRANSFORMACION INVERSA z Y El METODO DE lA INTEGRAL DE INVERSION, 686 METODO DE lA TRANSFORMADA z MODIFICADA, 691 PROBLEMAS DE EJEMPlO Y SOlUCIONES, 697
704
Bibliografia
730
indice
735
Prefacio
En este libro se presenta un tratamiento entendible sobre el anal isis y disefio de sistemas de control en tiempo discreto. Ellibro se escribio para utilizarse como texto para los cursos sobre sistemas de control en tiempo discreto 0 de control digital que se imparten ya sea en el ultimo afio de licenciatura o en el primer ano de posgrado para estudiantes de ingenieria. En esta segunda edicion, parte del material de la primera edicion se ha omitido y se anadio material nuevo a 10 largo dellibro. La caracteristica mas significativa de esta edicion es el tratamiento amplio acerca del disefio mediante ubicacion de polos con observadores de orden reducido a traves del enfoque en el espacio de estados (vease el capitulo 6) y el enfoque de ecuaciones polinomiales (vease el capitulo 7). En este libro todo el material se presenta de manera que ellector pueda seguir facilmente todas las discusiones. Se incluye la informacion necesaria para entender los temas que se presentan (tal como la prueba de teoremas y los pasos que se siguen para la obtenci6n de las ecuaciones importantes relacionadas con el disefio de observadores y la ubicacion de pol os) con el fin de facilitar la comprension de estes. Los antecedentes teoricos para el disefto de sistemas de control se discuten en forma detallada. Una vez que se han entendido los aspectos te6ricos, ellector puede utilizar ventajosamente MATLAB para obtener las soluciones numericas que involucran varios tipos de operaciones con matrices y vectores. Se supone que el lector esta familiarizado con el material que se presenta en el libro del mismo autor Solving Control Engineering Problems with MATLAB (editado por Prentice-Hall) 0 su equivalente. Los requisitos para el lector son un curso introductorio de sistemas de control, un curso sobre ecuaciones diferenciales ordinarias y estar familiarizado con MATLAB (si ellector no esta familiarizado con MATLAB, este se puede estudiar paralelamente).
IX
Prefacia
Debido a que este libro esta escrito desde el punto de vista de ingenieria, la presentaci6n del material hace enfasis en los conceptos basicos y evita de una manera cuidadosa los desarrollos maternaticos complejos. Todo el texto se ha organizado con el fin de presentar la teoria de control en tiempo discreto en una forma gradual. EI libro esta organizado en ocho capitulos y tres apendices. Esta formado como sigue: en el capitulo 1 se da una introducci6n a los sistemas de control en tiempo discreto. El capitulo 2 presenta la teoria de la transformada z necesaria para el estudio de los sistemas de control en tiempo discreto. En el capitulo 3 se discute el analisis en el plano z de los sistemas en tiempo discreto, en el que se incluye el muestreo mediante impulsos, la retenci6n de datos, el teorema de muestreo, la funci6n de transferencia pulso y los filtros digitales. El capitulo 4 trata el disefio de sistemas de control en tiempo discreto mediante metodos convencionales. Este capitulo incluye el anal isis de estabilidad de sistemas en lazo cerrado en el plano z, el analisis de las respuestas transitoria yen estado estacionario y el disefio basado en el metodo dellugar geornetrico de las raices, el metodo de respuesta en frecuencia y el metoda analitico. EI capitulo 5 presenta el analisis en el espacio de estados, incluyendo la representaci6n de sistemas en tiempo discreto en dicho espacio, la matriz de transferencia pulso, un metodo de discretizaci6n y el analisis de estabilidad de Liapunov. En el capitulo 6 se discute el disefio por ubicaci6n de polos y el disefio de observadores. Este capitulo contiene discusiones sobre controlabilidad, observabilidad, ubicaci6n de polos, observadores de estados y sistemas de seguimiento. EI capitulo 7 trata el enfoque de ecuaciones polinomiales en el disefio de sistemas de control. En este capitulo primero se estudia la ecuaci6n Diofantina y entonces se presenta el enfoque de ecuaciones polinomiales para el disefio de sistemas de control. Por ultimo, se disefian sistemas de control mediante el acoplamiento a un modelo utilizando el enfoque de ecuaciones polinomiales. El capitulo 8 presenta el control 6ptimo cuadratico. Se estudian los problemas de control 6ptimo cuadratico tanto de dimensi6n finita como infinita. Este capitulo concluye con un problema de disefio basado en el control 6ptimo cuadratico resuelto con MATLAB. El apendice A presenta un resumen del analisis con matrices y vectores. En el apendice B se dan los teoremas utiles de la teoria de la transformada z que no se presentaron en el capitulo 2, el metodo de la integral de inversi6n y el metodo de la transformada z mod ificada. En el apendice C se discute el problema de disefio por ubicaci6n de polos cuando la senal de control es una cantidad vectorial. Los ejemplos se presentan en puntos estrategicos a 10 largo dellibro para que ellector tenga un mejor entendimiento de los temas que se discuten. Adernas se proporciona un buen numero de problemas resueltos (problemas A) al final de cada capitulo, excepto en el capitulo I. Estos problemas representan una parte integral del texto. Se sugiere que ellector los estudie cuidadosamente para obtener un entendimiento profundo de los temas discutidos. Ademas, se presentan muchos problemas propuestos (problemas B) para que se utilicen como tare a 0 problemas de examen. La mayoria del material que se presenta en este libro se ha probado en c1ases en el ultimo curso sobre sistemas de control a nivel licenciatura y el primero a nivel posgrado en la Universidad de Minnesota. Todo el material de este libro se puede cubrir en dos trimestres. En un curso de un semestre, el instructor tendra cierta tlexibilidad para seleccionar los temas a tratar. En un curso trimestral, es
Prefacia
xi
posible cubrir una buena parte de los primeros seis capitulos. Este libro tambien puede servir para ingenieros que deseen estudiar la teoria de control en tiempo discreto. Se debe dar reconocimiento a mis exalurnnos, quienes resolvieron todos los problemas resueltos (problemas A) y los problemas propuestos (problemas B) e hicieron un buen numero de comentarios constructivos acerca del material contenido en este libro.
Katsuhiko Ogata
r
Introduccion G los sistetnGs de control en tietnpo discreto
J- J INTRODUCCION
En anos recientes se ha incrementado el uso de controladores digitales en sistemas de control. Los controladores digitales se utilizan para alcanzar el desernpefio 6ptimo -por ejemplo, en la forma de productividad maxima, beneficio maximo, costa minimo 0 la utilizaci6n minima de energia. Recientemente, la aplicaci6n de control por computadora ha hecho posible el movimiento "inteligente" en robots industriales, la optimizaci6n de economia de combustible en autom6viles y el refinamiento en la operaci6n de enseres y maquinas de uso domestico, tales como homos de microondas y maquinas de coser, entre otros. La capacidad en la tom a de decisiones y la flexibilidad en los programas de control son las mayores ventajas de los sistemas de control digital. La tendencia actual de controlar los sistemas dinamicos en forma digital en lugar de analogica, se debe principalmente a la disponibilidad de computadoras digitales de bajo costa y a las ventajas de trabajar con sefiales digitales en lugar de sefiales en tiempo continuo.
Tipos de seiiales. Una sefial en tiempo continuo es aquella que se define sobre un intervalo continuo de tiempo. La amplitud puede tener un intervalo continuo de valores 0 solamente un numero finito de valores distintos. El proceso de representar una variable por medio de un conjunto de valores distintos se denomina cuantificacion y los valores distintos resultantes se denominan va/ores cuantijicados. La variable cuantificada s610 cambia en un conjunto finito de valores distintos. Una seftal anal6gica es una sefial definida en un intervalo continuo de tiempo cuya amplitud puede adoptar un intervalo continuo de valores. La figura I-I a) muestra una serial anal6gica en tiempo continuo y la figura 1- J b) una serial cuantificada en tiempo continuo (cuantificada s610 en amplitud).
2
x(t)
Capitulo 1
a)
x(t)
b)
x(t)
c)
x(t)
d)
Figura I-I a) Serial analogica en tiempo continuo; b) senal cuantificada en tiempo continuo; c) seflal de datos muestreados; d) seflal digital.
Observe que la sefial analogica es un caso especial de la sefial en tiempo continuo. En la practica, sin embargo, se emplea con frecuencia la terminologia "tiempo continuo" en lugar de "analogica", De esta forma, en la literatura, inc1uyendo este libra, los terminos "sefial en tiempo continuo" y "sefial analogica" se intercambian de manera frecuente, aunque estrictamente hablando no son del todo sinonimos. Una sefial en tiempo discreto es una sefial definida solo en valores discretos de tiempo (esto es, aquellos en los que la variable independiente testa cuantificada). En una sefial en tiempo discreto, si la amplitud puede adoptar valores en un intervalo continuo, entonces la serial se denomina seiial de datos muestreados. Una sefial de datos muestreados se puede generar muestreando una sefial analogica en valores discretos de tiempo. Esta es una sefial de pulsos modulada en amplitud. La figura I-I c) muestra una serial de datos muestreados. Una sefial digital es una sefial en tiempo discreto con amplitud cuantificada. Dicha sefial se puede representar mediante una secuencia de numeros, por ejemplo, en la forma de numeros binarios.
Seccion 1-1
lntroduccion
(En la practica, muchas sefiales digitales se obtienen mediante el muestreo de sefiales anal6gicas que despues se cuantifican; la cuantificaci6n es 10 que permite que estas senales anal6gicas sean leidas como palabras binarias finitas.) La figura I-I d) muestra una serial digital. Es claro que esta cuantificada tanto en amplitud como en tiempo. EI uso de un controlador digital requiere de la cuantificaci6n de las sefiales tanto en amplitud como en tiempo. EI terrnino "serial en tiempo discrete" es mas general que el termino "sefial digital" 0 que el terrnino "serial de datos muestreados", De hecho, una serial en tiempo discreto se puede referir ya sea a una sefial digital 0 a una serial de datos muestreados. En la practica, los terrninos "tiempo discrete" y "digital" a menudo se intercambian. Sin embargo, el terrnino "tiernpo discreto" se emplea en el estudio teorico, mientras que el termino "digital" se utiliza en conexi6n con las realizaciones de hardware 0 software. En ingenieria de control, el objeto control ado es una planta 0 proceso. Este podrfa ser una planta 0 proceso Fisico 0 un proceso no fisico como un proceso econ6mico. La mayoria de las plantas o procesos fisicos involucran sefiales en tiempo continuo; por 10 tanto, si los sistemas de control incluyen controladores digitales, se hace necesaria la conversi6n de sefiales (de anal6gico a digital y de digital a anaI6gico). Existen tecnicas estandar para realizar dichas conversiones de sefiales; las que se estudiaran en la secci6n 1-4. Hablando con cierta holgura, los terminos como sistemas de control en tiempo discreto, sistemas de control de datos muestreados y control digital implican el mismo tipo 0 tipos muy similares de sistemas de control. Hablando en forma precisa, por supuesto que hay diferencias en estos sistemas. Por ejernplo, en un sistema de control de datos muestreados existen tanto sefiales en tiempo continuo como en tiempo discreto; las sefiales en tiempo discreto estan moduladas en amplitud por una sefial de pulsos. Los sistemas de control digital pueden incluir tanto sefiales en tiempo continuo como en tiempo discreto; donde las sefiales en tiempo discreto estan codificadas en forma nurnerica. Los sistemas de control de datos muestreados y los digitales son sistemas de control en tiempo discreto. Muchos sistemas de control industrial incluyen sefiales en tiempo continuo, sefiales de datos muestreados y sefiales digitales. Por 10 tanto, en este libro se utiliza el termino "sistemas de control en tiempo discrete" para describir los sistemas de control que incluyen alguna de las formas de senates de datos muestreados (sefiales de pulsos moduladas en amplitud) y/o sefiales digitales (sefiales codificadas en forma nurnerica).
Sistemas que se tratan en este /ibro. Los sistemas de control en tiempo discreto que se consideran en este libro son en su mayoria lineales e invariables en el tiernpo, aunque ocasionalmente se incluyen en las discusiones sistemas no lineales y/o variantes en el tiernpo. Un sistema lineal es aquel en el que se satisface el principio de superposici6n. De esta manera, si Yt es la respuesta del sistema ala entrada x., y Y2 es la respuesta ala entrada x., entonces el sistema es lineal si y s610 si, para cualesquiera escalares ex y {3, la respuesta a la entrada ax t + {3x 2 es exYt + {3Y2' Un sistema lineal se puede describir mediante ecuaciones diferenciales 0 en diferencias lineales. Un sistema lineal e invariable en el tiempo es aquel en el que los coeficientes en la ecuaci6n diferencial 0 en diferencias no varian con el tiernpo, esto es, es aquel sistema cuyas propiedades no cambian con el tiempo. Sistemas de control en tiempo continuo yen tiempo discreto, Los sistemas de control en tiempo discreto son aquellos sistemas en los cuales una 0 mas de las variables pueden carnbiar solo en valores discretos de tiempo. Estos instantes, los que se denotaran mediante kT 0 t, (k = O. I. 2...
i
Capitulo 1
pueden especificar los tiempos en los que se !leva a cabo alguna medicion de tipo fisico 0 los tiempos en los que se extraen los datos de la memoria de una computadora digital. El intervalo de tiempo entre estos dos instantes discretos se supone que es 10 suficientemente corto de modo que el dato para el tiempo entre estos se pueda aproximar mediante una interpolacion senci!la. Los sistemas de control en tiempo discreto difieren de los sistemas de control en tiempo continuo en que las sefiales para los primeros estan en la forma de datos muestreados 0 en la forma digital. Si en el sistema de control esta involucrada una computadora digital como un controlador, los datos muestreados se deben convertir a datos digitales. Los sistemas en tiempo continuo, cuyas sefiales son continuas en el tiernpo, se pueden describir mediante ecuaciones diferenciales. Los sistemas en tiempo discreto, los cuales involucran sefiales de datos muestreados 0 sefiales digitales y posiblemente sefiales en tiempo continuo, tambien se pueden describir mediante ecuaciones en diferencias despues de la apropiada discretizacion de las sefiales en tiempo continuo.
Proceso de muestreo. El muestreo de sefiales en tiempo continuo reemplaza la sefial en tiempo continuo par una secuencia de valores en puntos discretos de tiempo. El proceso de muestreo se emplea siempre que un sistema de control involucra un controlador digital, puesto que son necesarias una operacion de muestreo y una de cuantificacion para ingresar datos a ese controlador. Tambien, se da un proceso de muestreo cuando las mediciones necesarias para control se obtienen en forma intermitente. Por ejemplo, en el sistema de seguimiento par radar, a medida que la antena del radar gira, la informacion ace rca del azimut y de la elevacion se obtiene una vez por cada vue Ita que da la antena. De este modo, la operacion de rastreo del radar produce un dato muestreado. En otro ejemplo, el proceso de muestreo se necesita cuando un controlador 0 computadora de gran tamafio se comparte en tiempo entre varias plantas con el fin de reducir los costos. En este caso se envia periodicamente una sefial de control para cada una de las plantas y de esta manera la senal se convierte en una de datos muestreados. El proceso de muestreo es seguido por un proceso de cuantificacion. En el proceso de cuantificacion, la amplitud analogica muestreada se reemplaza por una amplitud digital (representada mediante un nurnero binario). Entonces la sefial digital se procesa por medio de la computadora. La salida de la computadora es una sefial muestreada que se alimenta a un circuito de retencion. La salida del circuito de retencion es una serial en tiempo continuo que se alimenta al actuador. En la seccion 14 se presentaran los deta!les para dichos metodos de procesamiento de sefiales en el controlador digital. EI termino "discretizacion" en lugar de "muestreo" se utiliza con frecuencia en el anal isis de sistemas con entradas y salidas multiples, aunque ambos significan basicamente 10 mismo. Es importante observar que de manera ocasionalla operacion de muestreo 0 discretizacion es enteramente ficticia y se ha introducido solo para simplificar el anal isis de los sistemas de control que en realidad solo conti enen sefiales en tiempo continuo. De hecho, a menudo se utiliza un modelo en tiempo discreto apropiado para un sistema en tiempo continuo. Un ejemplo es la sirnulacion en una computadora digital de un sistema en tiempo continuo. Dicho sistema simulado en una computadora digital se puede analizar para obtener los parametres que optimizan un fndice de desernpefio dado. La mayor parte del material que se presenta en este libro trata con sistemas de control que se pueden modelar como sistemas en tiempo discreto, lineales e invariables en el tiempo. Es importante mencionar que muchos sistemas de control digital estan basados en tecnicas de disefio en tiempo continuo. Debido a que se ha acumulado una gran riqueza en 10 que a experiencia se refiere en el
Seccion 1-2
disefio de controladores en tiempo continuo, el conocimiento pleno de estas tecnicas es muy valioso en el disefio de sistemas de control en tiempo discreto.
En la figura 1-2 se muestra un diagrama de bloques de un sistema de control digital que presenta la configuraci6n del esquema de control basico, En el sistema se incluye el control realimentado y el prealimentado. En el disefio de dicho sistema de control, se debera observar que la "bondad" del sistema de control depende de circunstancias individuales. Se requiere elegir un indice de desernpefio apropiado para un caso dado y disefiar un controlador de modo que optimice el indice de desernpefio elegido.
Formas de las setiales en un sistema de control digital. La figura 1-3 muestra un diagrama de bloques de un sistema de control digital. Los elementos basicos del sistema se muestran mediante los bloques. La operaci6n del controlador se maneja por el reloj. En dicho sistema de control digital, en algunos puntos del sistema pasan sefiales de amplitud variable ya sea en tiempo continuo 0 en tiempo discreto, mientras que en otros pasan sefiales codificadas en forma numerica, como se muestra en la figura. La salida de la planta es una sefial en tiempo continuo. La sefial de error se convierte a forma digital mediante el circuito de muestreo y retenci6n y el convertidor anal6gico-digital. La conversi6n se hace en el tiempo de muestreo. La computadora digital procesa las secuencias de numeros
Perturbaci6n o ruioo
i-----------------l
Entrada Salida
I I
L_~
Controladofdigilal
Filtro
RUido
Figura 1-2
Introducci6n
Capitulo 1
r----,ooo
&11
-00-0
00-00-0
L.l-L
Computaoora
LL.L
Cor-varuoor
-----Il::J-----Figura 1-3 Diagrama de bloques de un sistema de control digital que muestra las scnales en forma binaria
0
grafica.
por medio de un algoritmo y produce nuevas secuencias de numeros. En cada instante de muestreo se debe convertir un numero codificado (en general un numero binario que consiste en ocho 0 mas digitos binarios) en una sefial fisica de control, la cual normalmente es una sefial en tiempo continuo o anal6gica. EI convertidor digital-anal6gico y el circuito de retenci6n convierten la secuencia de numeros en c6digo numerico a una sefial continua por secciones. EI reloj en tiempo real de la computadora sincroniza los eventos. La salida del circuito de retencion, una sefial en tiempo continuo, se alimenta a la planta, ya sea de manera directa 0 a traves de un actuador, para controlar su dinamica, La operaci6n que transforma las sefiales en tiempo continuo en datos en tiempo discreto se denomina muestreo 0 discretizacion. La operaci6n inversa, que transforma datos en tiempo discreto en una sefial en tiempo continuo, se conoce como retencion de datos; esta realiza la reconstrucci6n de la sefial en tiempo continuo a partir de la secuencia de datos en tiempo discreto. Esto por 10 regular se logra al utilizar alguna de las muchas tecnicas de extrapolaci6n. En la mayoria de los casos esto se realiza manteniendo constante la serial entre los instantes de muestreo sucesivos. (Dichas tecnicas de extrapolaci6n se estudiaran en la secci6n 1-4.) EI circuito de muestreo y retenci6n (S/H, del ingles Sample-and-Hold) y el convertidor anal6gico-digital (AID) convierten la sefial en tiempo continuo en una secuencia de palabras binarias codificadas nurnericarnente. Dicho proceso de conversi6n AID se conoce como codificacion. La combinaci6n del circuito S/H y el convertidor anal6gico-digital se puede visualizar como un interruptor que cierra instantaneamente en cada intervalo de tiempo Ty genera una secuencia de numeros en c6digo numerico. La computadora digital procesa dichos numeros en c6digo numerico y genera una secuencia deseada de numeros en c6digo numerico. EI proceso de conversion digitalanalonico (01 A) se denomina decodificacion.
Definicion de terminos. Antes de estudiar los sistemas de control digital en detalle, se necesitan definir algunos de los terminos que aparecen en el diagrama de bloques de la figura 1-3.
Muestreador y retenedor (.S/H). "Muestreador y retenedor" es un termino general que se utiliza para un amplificador de muestreo y retenci6n. Este termino describe un circuito que recibe como entrada una sefial anal6gica y mantiene dicha sefial en un valor con stante durante un tiempo especifico. Normalmente la sefial es electrica, pero son posibles otras formas de esta, tales como 6ptica 0 mecanica,
Seccion 1-2
Convertidor anal6gico-digital (A/D). Un convertidor analogico-digital, tambien conocido como codificador, es un dispositivo que convierte una sefial analogica en una sefial digital, usualmente una sefial codificada numericamente, Dicho convertidor se necesita como una interfaz entre un componente analogico y uno digital. Con frecuencia un circuito de muestreo y retencion es una parte integral de un convertidor AID disponible comercialmente. La conversion de una sefial analogica en la sefial digital correspondiente (numero binario) es una aproxirnacion, ya que la sefial analogica puede adoptar un numero infinito de valores, mientras que la variedad de numeros diferentes que se pueden formar mediante un conjunto finito de digitos esta limitada. Este proceso de aproxirnacion se denomina cuantificaci6n. (En la seccion 1-3 se presenta mas informacion acerca de la cuantificacion.) Convertidor digital-anal6gico (D/A). Un convertidor digital-analogico, tambien denominado decodificador, es un dispositivo que convierte una sefial digital (datos codificados numericamente) en una sefial analogica. Dicho convertidor es necesario como una interfaz entre un componente digital y uno analogico. Planta 0 proceso. Una planta es cualquier objeto fisico a ser controlado. Como ejemplos se tienen un homo, un reactor quimico y un conjunto de partes de maquinaria que funcionan de manera conjunta para Ilevar a cabo una operacion particular, tal como un sistema de seguimiento 0 una nave espacial. En general, un proceso se define como una operacion progresiva 0 un desarrollo marcado mediante una serie de cambios graduales que suceden uno a otro de una manera relativamente fija y conducen hacia un resultado 0 fin determinado. En este libro se denomina proceso a cualquier operacion a ser control ada. Como ejemplos se pueden citar procesos quimicos, econornicos y biologicos, La parte mas dificil en el disefio de sistemas de control puede situarse en el modelado preciso de una planta 0 proceso fisico. Existen much os enfoques para obtener el modelo de una planta 0 proceso pero, aun asi, pueden existir dificultades, debido principalmente a la falta de precision en la dinamica del proceso y a la pobre definicion de parametres aleatorios en muchas plantas 0 procesos fisicos. Por tanto, en el disefio de un controlador digital, es necesario reconocer el hecho de que el modelo maternatico de una planta 0 proceso en muchos casos es solo una aproxirnacion del proceso fisico. Existen algunas excepciones en el modelado de sistemas electromecanicos y sistemas hidraulicomecanicos (hidromecanicos), puesto que estos se pueden modelar de manera precisa. Por ejemplo, el modelado de un sistema de un brazo manipulador (robot) se puede Ilevar a cabo con una gran precision. Transductor. Un transductor es un dispositivo que convierte una senal de entrada en una serial de salida de naturaleza diferente a la de entrada, tal como los dispositivos que convierten una sefial de presion en una salida de voltaje. En general, la sefial de salida depende de la historia de la entrada. Los transductores se pueden clasificar como transductores analogicos, transductores de datos muestreados 0 transductores digitales. Un transductor analogico es aquel en que las senales de entrada y salida son fu~ciones continuas del tiempo. Las magnitudes de estas sefiales pueden to mar cualquier valor dentro de las limitaciones fisicas del sistema. Un transductor de datos muestreados es aquel en el que las sefiales de entrada y salida se presentan en valores discretos de tiempo (normalmente periodicos), pero las magnitudes de las sefiales, como en el caso de los transductores analogicos, no estan cuantificadas. Un transductor digital es aquel en el que las sefiales de entrada y salida se presentan solo en valores discretos de tiempo y las magnitudes de las sefiales estan cuantificadas (esto es, solamente pueden adoptar ciertos valores discretos).
Capitulo 1
Tipos de operaciones de muestreo, Como se estableci6 antes, una sefial cuya variable independiente t es discreta se den om ina sefial en tiempo discreto. Una operaci6n de muestreo es basicamente la transformaci6n de una sefial en tiempo continuo en una en tiempo discreto. Existen diferentes tip os de operaciones de muestreo de importancia practica: 1. Muestreo periodico. En este caso, los instantes de muestreo estan espaciados de manera uniforme, 0 tk = kT (k = 0, I, 2, ...). EI muestreo peri6dico es el tipo mas convencional de las operaciones de muestreo. Muestreo de orden multiple. El patr6n de los tk se repite peri6dicamente; esto es, tk + r - tk es constante para todo k. Muestreo de tasa multiple. En un sistema de control que tiene lazos multiples, la mayor constante de tiempo involucrada en un lazo puede diferir en gran medida de las de los otros lazos. Por 10 tanto, puede ser aconsejable muestrear lentamente en un lazo que involucre una constante de tiempo grande, mientras que en un lazo que involucre constantes de tiempo pequefias la tasa de muestreo debe ser mas rapida. De esta manera, un sistema de control digital puede tener diferentes perfodos de muestreo en diferentes trayectorias de realimentaci6n 0 bien tasas de muestreo multiples. Muestreo aleatorio. En este caso, los instantes de muestreo son aleatorios, 0 tk es una variable aleatoria.
2. 3.
4.
Las principales funciones involucradas en la conversi6n anal6gico-digital son el muestreo, fa cuantificaci6n de la amplitud y la codificaci6n. Cuando el valor de cualquier muestra cae entre dos estados de salida adyacentes "permitidos", se debe leer como el estado de salida permitido mas cercano al valor real de la serial, EI proceso de representaci6n de una sefial continua 0 anal6gica mediante un numero fin ito de estados discretos se denomina cuantificacion de la amplitud. Esto es, "cuantificacion" significa la transformaci6n de una serial continua 0 anal6gica en un conjunto de estados discretos. (Observe que la cuantificaci6n se presenta cuando una cantidad fisica se representa en forma numerica.) El estado de salida de cualquier muestra cuantificada se describe entonces mediante un c6digo numerico, EI proceso de representar el valor de una muestra mediante un c6digo numerico (tal como el c6digo binario) se denomina codificacion. De este modo, la codificaci6n es el proceso de asignaci6n de una palabra 0 c6digo digital a cada uno de los estados discretos. EI perfodo de muestreo y los niveles de cuantificaci6n afectan el desempefio de los sistemas de control digital. De manera que estes se deben determinar cuidadosamente.
Cuantificacion. El sistema numerico estandar utilizado para el procesamiento de sefiales digitales es el sistema binario. En dte sistema nurnerico el grupo de c6digos consisten en n pulsos cada uno de los cuales indica ya sea "encendido" (1) 0 "apagado" (0). En el caso de la cuantificaci6n, los n pulsos "encendido-apagado" pueden representar 2" niveles de amplitud 0 estados de salida. El nivel de cuantificaci6n Q se define como el intervalo entre dos puntos adyacentes de decisi6n y esta dado mediante
Seccion 1-3
Q = FSR 2"
donde FSR es el intervalo a escala completa. Observe que el bit que esta mas a la izquierda del c6digo binario natural tiene el mayor peso (un medio de la escala completa) y se Ie conoce como el bit mas significativo (MSB). El bit que esta mas ala derecha tiene el menor peso (112" veces la escala completa) y se Ie conoce como el bit menos significativo (LSB). De esta manera,
Error de cuantificacion, Puesto que el numero de bits en la palabra digital es fin ito, la conversi6n AID da como resultado una resoluci6n fin ita. Esto es, la salida digital puede solamente adoptar un numero finito de niveles, y por 10 tanto un numero anal6gico se debe redondear al nivel digital mas cercano. Por consiguiente, toda conversi6n AID involucra un error de cuantificaci6n. Dicho error de cuantificaci6n varia entre 0 y tQ. Este error depende de la fineza del nivel de cuantificaci6n y se puede hacer tan pequeno como se desee haciendo mas pequeno el nivel de cuantificaci6n (esto es, al incrementar el numero n de bits). En la practica, existe un maximo para el numero n de bits, y de este modo siempre existe algun error debido a la cuantificaci6n. La incertidumbre presente en el proceso de cuantificaci6n se conoce como ruido de cuantificacion. Para determinar el tamafio deseado del nivel de cuantificaci6n (0 numero de estados de salida) en un sistema de control digital dado, el ingeniero debe tener un buen entendimiento entre el tamafio del nivel de cuantificaci6n y el error resultante. La varianza del ruido de cuantificaci6n es una medida del error de cuantificacion, puesto que esta es proporcional a la potencia promedio asociada con el ruido. En la figura 1-4a) se muestra un diagrama de bloques de un cuantificador junto con sus caracteristicas entrada-salida. Para una entrada anal6gica x(t), la salida yet) toma s610 un numero finito de niveles, los cuales son multiples enteros del nivel de cuantificaci6n Q. En el anal isis nurnerico, el error resultante de despreciar los digitos remanentes se den om ina error de redondeo. Debido a que el proceso de cuantificaci6n es un proceso de aproximaci6n en el que la cantidad anal6gica se aproxima mediante un numero digital finito, el error de cuantificacion es un error de redondeo. Es claro que, mientras mas fino sea el nivel de cuantificacion, mas pequefio sera el error de redondeo. En la figura lAb) se muestra una entrada anaI6gicax(t) y la salida discretay(t), la cual esta en la forma de una funci6n escalonada. El error de cuantificaci6n e(t) es la diferencia entre la sefial de entrada y la salida cuantificada, 0
e(t)
Observe
x(t) - y(t)
error cuantificado es
o~
le(t)1 ~!Q
Para un nivel de cuantificaci6n pequefio Q, la naturaleza del error de cuantificaci6n es similar a la del ruido aleatorio. Y, en efecto, el proceso de cuantificaci6n actua como una fuente de ruido aleatorio. A continuaci6n se obtendra la varianza del ruido de cuantificaci6n. Dicha varianza se puede obtener en terrninos del nivel de cuantificaci6n Q.
10
Capitulo 1
xUI
Cuantificador
y(tl
a)
xltl
y(tl
a
b)
P1"I~
Q
a
c)
Figura 1-4 a) Diagrama de bloques de un euantifieador y sus caractcristicas entrada-salida; b) entrada anaI6gieax(t) y salida diseretay(t); c) distribuei6n de probabilidad Pte) del error de euantifieaei6n e(~
Suponga que el nivel de cuantificaci6n Q es pequefio y que tam bien el error de cuantificaci6n eel) se distribuye uniformemente entre -tQ y tQ y que este error actua como un ruido blanco. [Esto es de manera obvia una suposici6n un tanto aspera, Sin embargo, debido a que la sefial de error de cuantificaci6n eel) es de una amplitud pequefia, esta suposici6n pod ria ser aceptable como una aproximaci6n de primer orden.] La distribuci6n de probabilidad pee) de la sefial eel) puede graficarse
Seccion ]-4
11
0
como se rnuestra en la figura 1-4c). El valor prornedio de e(t) es cero, del ruido de cuantificacion es
u2
E[e(t) - e(t)j2
= -
ed{ = Q -Q!2 12
!2
Q2
De esta rnanera, si el nivel de cuantificacion Q es pequefio cornparado con la amplitud prornedio de la senal de entrada, entonces la varianza del ruido de cuantificacion es un doceavo del cuadrado del nivel de cuantificacion.
Con el crecirniento rapido en el uso de computadoras digitales para ejecutar las acciones de un control digital, tanto los sistemas de adquisicion de datos como los de distribucion se han convertido en una parte importante de todo sistema de control. La conversion de sefiales que tiene lugar en el sistema de control digital involucra las siguientes operaciones:
I. 2. 3. 4.
Multiplexacion y demultiplexacion Muestreo y retencion Conversion analogico-digital (cuantificacion y codificacion) Conversion digital-analogico (decodificacion)
En la figura I-Sa) se muestra el diagrama de bloques de un sistema de adquisicion de datos y en la figura 1-5b) se muestra un diagrarna de bloques de un sistema de distribucion de datos. En el sistema de adquisicion de datos, la entrada al sistema es una variable fisica tal como posicion, velocidad, aceleracion, temperatura 0 presion. Dichas variables fisicas primero se convierten en una sefial electrica (una sefial de voltaje 0 corriente) mediante un transductor apropiado. Una
t---~
Arcconcrao
cJglal
.1
bl
Figura 1-5 0) Diagrama de bloques de un sistema de adquisicion de datos: b) diagrama dc bloqucs de distribucion dc datos.
Ull
sistema de
12
Capitulo 1
vez que la variable ffsica se convierte en una sefial de voltaje 0 corriente, el resto del proceso de adquisici6n de datos se hace por medios electr6nicos. En la figura I-Sa) el amplificador que sigue del transductor (frecuentemente un amplificador operacional) ejecuta una 0 mas de las siguientes funciones: amplificar el voltaje de salida del transductor: convertir la sefial de corriente en una de voltaje; 0 aislar la sefial. EI filtro paso-bajas que sigue al amplificador atenua las componentes de alta frecuencia de la senal, tales como sefiales de ruido. (Observe que los ruidos de tipo electr6nico son de naturaleza aleatoria y se pueden reducir mediante filtros paso-bajas. Sin embargo, dichos ruidos de tipo electronico, como la interferencia de la linea de alimentacion, general mente son peri6dicos y se pueden reducir por medio de filtros de muesca.) La salida del filtro paso-bajas es una sefial anal6gica. Esta sefial se alimenta a un multiplexor anal6gico. La salida del multiplexor se alimenta al circuito de muestreo y retencion, cuya salida, a su vez, se alimenta al convertidor anal6gico-digital. La salida del convertidor es la sefial en forma digital; esta se alimenta al controlador digital. EI proceso inverso al de adquisici6n de datos es el de distribuci6n de datos. Como se muestra en la figura I-Sb), un sistema de distribuci6n de datos consiste en registros, un demultiplexor, convertidores digital-anal6gico y circuitos de retenci6n. Este sistema convierte la sefial en forma digital (numeros binarios) en otra en forma anal6gica. La salida del convertidor 01A se alimenta al circuito de retenci6n. La salida del circuito de retenci6n se alimenta al actuador analogico, el cual, a su vez, control a directamente la planta que se esta considerando. A continuacion, se estudiara cada componente individual involucrado en el sistema de procesamiento de la sefial.
Multiplexor analogico, Un convertidor anal6gico-digital es el componente mas costoso en un sistema de adquisici6n de datos. EI multiplexor anal6gico es un dispositivo que lIeva a cabo la funci6n de com partir en tiempo un convertidor AID entre muchos canales anal6gicos. EI procesamiento de varios canales con un controlador digital es posible debido a que el ancho de cada uno de los pulsos que representa a la serial de entrada es muy angosto, de manera que el espacio vacio durante cada perfodo de muestreo se puede utilizar para otras seftales. Si se van a procesar muchas sefiales por un solo controlador digital, entonces estas sefiales de entrada se deben alimentar al controlador a traves de un multiplexor. En la figura 1-6 se muestra un diagrama de un multiplexor anal6gico. EI multiplexor anal6gico
hf------l~
AI muestreador
Seccion 1-4
13
es un interruptor multiple (nonnalmente un interruptor electr6nico) que conmuta secuencialmente entre muchos canales de entrada anal6gicos en alguna fonna preestablecida. EI numero de canales, en muchas instancias, es 4, 8 0 16. En un instante dado, s610 un interruptor esta en la posici6n de "encendido". Cuando el interruptor esta encendido en un canal de entrada dado, la sefial de entrada se conecta a la salida del multiplexor durante un tiempo especifico. Durante el tiempo de conexion, el circuito de muestreo y retenci6n muestrea a la sefial de voltaje (sefial anal6gica) y retiene su valor, mientras que el convertidor anal6gico-digital convierte el valor anal6gico en datos digitales (numeros binarios). Cada uno de los canales se lee en orden secuencial y los valores correspondientes se convierten en datos digitales en la misma secuencia.
Demultiplexor. El demultiplexor, el cual esta sincronizado con la sefial de muestreo de entrada, separa los datos digitales de la salida compuesta, del controlador digital en los canales originales. Cada uno de los canales esta conectado a un convertidor DI A para producir la sefial de salida anal6gica para ese canal. Circuitos de muestreo y retencion. Un muestreador en un sistema digital convierte una sefial anal6gica en un tren de pulsos de amplitud modulada. El circuito de retenci6n mantiene el valor del pulso de la sefial muestreada durante un tiempo especffico. EI muestreador y el retenedor son necesarios en el convertidor AID para producir un numero que represente de manera precisa la serial de entrada en el instante de muestreo. Existen de manera comercial circuitos de muestreo y retenci6n en una sola unidad, conocidos como muestreador y retenedor (S/H). Sin embargo, matematicamente, las operaciones de muestreo y la de retenci6n se modelan por separado (vease la secci6n 3-2). Es una practica comun utilizar un solo convertidor anal6gico-digital y multiplexar muchas entradas anal6gicas muestreadas en este. En la practica, la duraci6n del muestreo es muy corta comparada con el periodo de muestreo T. Cuando la duraci6n del muestreo es despreciable, el muestreador se puede considerar como un "muestreador ideal". Un muestreador ideal 10 habilita a uno para obtener un modelo matematico relativamente simple de un muestreador y retenedor. (Dicho modelo matematico se discutira con detalle en la secci6n 3-2.) En la figura 1-7 se muestra un diagrama simplificado para el muestreador y retenedor. El circuito S/H es un circuito anal6gico (simplemente un dispositivo de memoria de voltaje) en el que se adquiere una entrada de voltaje y entonces se almacena en un capacitor de alta calidad con caracteristicas de fuga y absorci6n dielectrica bajas. En la figura 1-7 el interruptor electr6nico se conecta al capacitor de retenci6n. EI amplificador operacional I es un amplificador de aislamiento de entrada con una impedancia de entrada alta. EI amplificador operacional 2 es el amplificador de salida; este aisla el voltaje en el capacitor de retenci6n. Existen dos modos de operaci6n para el circuito de muestreo y retencion: el modo de seguimiento y el de retenci6n. Cuando el interruptor esta cerrado (esto es, cuando la sefial de entrada esta conectada), el modo de operaci6n es el de seguimiento. La carga en el capacitor en el circuito sigue al voltaje de entrada. Cuando el interruptor esta abierto (Ia sefial de entrada esta desconectada), el modo de operaci6n es el de retencion y el voltaje del capacitor se mantiene con stante por un tiempo especifico. La figura 1-8 muestra los modos de seguimiento y de retenci6n. Observe que, de manera practica, la conmutaci6n del modo de seguimiento al de retenci6n no es instantaneo. Si se da el comando de retenci6n mientras el circuito esta en el modo de seguimiento. cntonces el circuito permanecera en el modo de seguimiento por un momenta antes de reaccionar ante
14
Capitulo 1
Amplificador 1 Entrada
Am plificador 2
anal6gica
0_-
--1-___
l_
C
Salida
analoqica
Muestreador
Figura 1-7
el comando de retenci6n. El intervalo de tiempo durante el cualla conmutaci6n tiene lugar (esto es, el intervalo de tiempo cuando la amplitud medida es incierta) se denomina tiempo de apertura. EI voltaje de salida durante el modo de retenci6n puede decrecer ligeramente. La calda del modo de retenci6n se puede reducir mediante el uso de un amplificador de aislamiento de salida con una impedancia de entrada alta. Dicho amplificador de aislamiento de salida debe tener una corriente de polarizaci6n muy baja. La operaci6n de muestreo y retenci6n esta controlada por un reloj.
Tipos de convertidores analogico-digltal (AID). Como se estableci6 en un principio, el proceso mediante el cual una serial anal6gica muestreada se cuantifica y se convierte en un numero binario es conocido como conversion analogico-digital. De esta manera, un convertidor AID trans-
Senalde entrada
Muestra a nivel
de retencJ6n
I I
i
I
I
j Tiempode
abertura Senalde salida
I
I
se~~::to
-1
t
1 - - - ..
r~tc::,~i: ----~7
Figura 1-8
retencion,
El comandode retenci6n
se da aqui
Seccion 1-4
15
forma una sefial analogica (par 10 general en la forma de voltaje 0 corriente) en una sefial digital 0 una palabra codificada numericamente. En la practica, la logica esta basada en digitos binarios compuestos por Os y Is, y la representacion tiene un numero fin ito de digitos. EI convertidor AID ejecuta las operaciones de muestreo y retencion, cuantificacion y codificacion. Observe que en el sistema digital un reloj genera un pulso cada periodo de muestreo T. El convertidor AID envia una serial digital (numero binario) al controlador digital cada vez que el pulse llega. Entre los circuitos AID disponibles, los siguientes tipos son los mas frecuentemente utilizados: I. 2. 3. 4. Del Del Del Del tipo tipo tipo tipo de aproximaciones sucesivas de integracion contador paralelo
Cada uno de estos cuatro tipos tiene sus propias ventajas y desventajas. En cualquier aplicacion particular, la velocidad de conversion, precision, longitud de palabra y el costa son los principales facto res a considerar en la eleccion del tipo de convertidor AID. (Si se requiere de una mayor precision, por ejernplo, se debe incrementar el numero de bits en la sefial de salida.) Como se vera, el convertidor analogico-digital utiliza como parte de sus lazos de realimentacion convertidores digital-analogico. EI tipo mas sencillo de convertidor AID es el del tipo contador. Su principio basico es que se aplican los pulsos de reloj al contador digital de manera que el voltaje de salida del convertidor DIA (esto es, parte dellazo de realirnentacion del convertidor AID) aumente un bit menos significativo (LSB) cada vez, y el voltaje de salida se compara con el voltaje analogico de entrada una vez por cada pulso. Cuando el voltaje de salida ha alcanzado la magnitud del voltaje de entrada, los pulsos de reloj se detienen. EI voltaje de salida del contador es entonces la salida digital. EI convertidor AID del tipo de aproximaciones sucesivas es mucho mas rapido que el del tipo contador y es el utilizado con mayor frecuencia. En la figura 1-9 se muestra un diagrarna del convertidor AID del tipo de aproximaciones sucesivas.
Convertidor D/A
f1--
Reterencia analoqica
...
Salida digital
Entrada
anal6gica
+
Comparador
---1
Reloj
Figura 1-9
16
Capitulo 1
EI principio de operaci6n de este tipo de convertidor AID es el que sigue. EI registro de aproximaciones sucesivas (SAR) primero enciende el bit mas significativo (Ia mitad del maximo) y 10 compara con la entrada anal6gica. EI comparador decide ya sea dejar encendido este bit 0 apagarlo. Si el voltaje de entrada anal6gico es mayor, el bit mas significativo permanece encendido. EI siguiente paso es encender el bit 2 y entonces compararlo con los tres cuartos del maximo del voltaje anal6gico de entrada. Despues de que se completan las n comparaciones, la salida digital del registro de aproximaciones sucesivas indica todos aquellos bits que se mantienen encendidos y produce e I c6digo digital deseado. Asi, este tipo de convertidor AID fija un bit por cada cicIo de reloj, y de este modo s610 requiere de n ciclos de reloj para generar n bits, donde n es la resoluci6n del convertidor en bits. (El numero n de bits empleados determina la exactitud de conversi6n.) El tiempo requerido para la conversi6n es aproximadamente 2,useg 0 menos para una conversi6n de 12 bits. Errores en convertidores AID. Los convertidores anal6gico-digitales reales difieren de los convertidores ideales en que los primeros siempre tienen algunos errores, tales como errores de nivel, de linealidad y de ganancia; las caracteristicas de estos se muestran en la figura 1-10. Tambien, es importante observar que las caracteristicas entrada-salida cambian con el tiempo y con la temperatura. Por ultimo, se debe observar que los convertidores comerciales se especifican para tres rangos de temperatura: comercial (0 C a 70C), industrial (-25C a 85C) y militar (-55C a 125C). Convertidores digital-analoglco (D/A). A la salida del controJador digitalla sefial digital se debe convertir en una serial anal6gica mediante el proceso conocido como conversi6n digital-anaI6gica. Un convertidor D/A es un dispositivo que transforma una entrada digital (numeros binarios) en una salida anal6gica. La salida, en la mayoria de los casos, es una serial de voltaje. Para el rango completo de la entrada digital, existen 2" valores anal6gicos correspondientes diferentes, incluyendo el O. Para la conversi6n digital-anal6gica existe una correspondencia uno a uno entre la entrada digital y la salida anal6gica. En general se emplean dos metodos para la conversi6n digital-anaI6gica: el metodo que utiliza resistores ponderados y el otro que utiliza la red en escalera R-2R. EI primero es sencillo en la configuraci6n del circuito, pero su exactitud puede no ser muy buena. EI segundo es un poco mas complicado en configuracion, pero es mas exacto. En la figura 1-11 se muestra el diagrama de un convertidor DI A que emplea resistores ponderados. Los resistores de entrada del amplificador operacional tienen valores ponderados en forma binaria. Cuando el circuito 16gico recibe un 1 binario, el interruptor (en realidad una compuerta electr6nica) conecta el resistor al voltaje de referencia. Cuando el circuito 16gico recibe un 0 binario, el interruptor conecta el resistor a tierra. Los convertidores digital-anal6gicos empleados en la practica comun son gel tipo paralelo: todos los bits que intervienen se aplican simultaneamente de la entrada digital (numeros binarios). Asi el convertidor D/A genera el voltaje de salida anal6gico correspondiente al voltaje digital dado. Para el convertidor D/A que se muestra en la figura 1-11, si el nurnero binario es b)b 2b]b o, donde cada una de las b puede ser ya sea un 0 0 un 1, entonces la salida es
Se ccion 1-4
17
111
a)
100
o0 0
k:--L-_ _-,-l.
--J
~ FS
FS
111
/ / /
/'
/
/
b)
100
/
Error de uneahdao
/
/
/ / /
000
/'
L....
PS
:-'-
---J
FS
111
c)
100
000
.1._
__J
~ FS
FS
Figura 1-10 Errores en convcrtidores ND: a) error de nivel; b) error de lincalidad: c) error de gananeia.
Notese que a medida que el numero de bits se incrementa el intervalo de valores de los resistores se hace mas grande y la exactitud se empobrece. . En la figura 1-12 se muestra un diagrama esquernatico de un convertidor 0/A de n-bits que utili~ un circuito en escalera R-2R. Observe que con excepcion del resistor de realirnentacion (el cual es 3R) todos los resistores involucrados son ya sea R 0 2R. Esto significa que se puede alcanzar un alto nivel de exactitud. EI voltaje de salida en este caso puede estar dado mediante
Reconstruccion de fa seiiul de entrada mediante circuitos de retencion. La operaci6n de muestreo produce una sefial de pulsos modulados en amplitud. La funci6n de la operacion de reten-
18
Capitulo 1
8R
Figura I-II
cion es reconstruir la serial analogica que ha sido transmitida como un tren de pulsos muestreados. Esto es, el prop6sito de la operaci6n de retenci6n es rellenar los espacios entre los periodos de muestreo y as! reconstruir en forma aproximada la serial anal6gica de entrada original. El circuito de retencion se disefia para extrapolar la sefial de salida entre puntos sucesivos de acuerdo con alguna manera preestablecida. La forma de onda de escalera de la salida que se muestra en la figura 1-13 es la forma mas sencilla para reconstruir la sefial de entrada original. El circuito de retenci6n que produce dicha forma de onda de escalera se conoce como retenedar de orden cera. Debido a su simplicidad, el retenedor de orden cero se emplea por 10 regular en sistemas de control digital.
3R
2R
2R
2R
2R
2R
2R
2R
b;
- V"'
0---....1--+---'-->,- _ - _ - _ - _
Figura 1-12
Seccion 1-4
19
_ I""'" I--Llsalida
/ f-<,
-,
r-/
I
"-
"-
r--,
/
'--
"~
'-~
/
~
- I"="::::
Figura 1-13
Se dispone de circuitos de retenci6n mas sofisticados que el de orden cero. Estos se conocen como circuitos de retenci6n de orden superior e incluyen los retenedores de primero y segundo orden. En general los circuitos de retenci6n de orden superior reconstruiran una sefial de manera mas exacta que los retenedores de orden cero. pero con algunas desventajas, como se explicara posteriormente. El retenedor de primer orden mantiene el valor de la muestra anterior, asi como el de la presente, y mediante extrapolaci6n predice el valor de la muestra siguiente. Esto se logra mediante la generaci6n de la pendiente de salida igual a la pendiente de un segmento de linea que conecta la muestra actual con la anterior y proyectando esta desde el valor de la muestra actual, como se puede apreciar en la figura 1-14. Como se puede ver facilmente en la figura, si la pendiente de la sefial original no cambia mucho, la predicci6n es buena. Sin embargo, si la sefial original invierte su pendiente, entonces la predicci6n es mala y la salida sigue la direcci6n equivocada, causando as! un gran error para el periodo de muestreo considerado. Un retenedor de primer orden con interpolacion, tambien conocido como retenedor poligonal, reconstruye la sefial original de una manera mucho mas exacta. Este circuito de retenci6n tambien genera una linea recta a la salida cuya pendiente es igual a aquella que une el valor de la muestra anterior con el valor de muestra actual, pero esta vez la proyecci6n se hace desde el punto de la
Salida
Figura 1-14
20
Capitulo 1
Salida
Figura 1-15 Salida de un retenedor de primer orden con interpolacion (retenedor poligonal).
muestra actual con la amplitud de la muestra anterior. Por 10 tanto, la exactitud al reconstruir la seftal original es mejor que para otros circuitos de retencion, pero existe un periodo de muestreo de retardo, como se muestra en la figura 1-15. En efecto, la mejoria en la exactitud se logra a expensas de un retardo de un periodo de muestreo. Desde el punta de vista de la estabilidad de los sistemas en lazo cerrado, dicho retardo no es deseable, y de este modo el retenedor de primer orden con interpolacion (retencion poligonal) no se emplea en aplicaciones de sistemas de control.
r-5
COMENTARIOS FINALES
En la conclusion de este capitulo se compararan los control adores digitales y los analogicos utilizados en sistemas de control industrial y se revisaran algunos conceptos sobre el control digital de procesos. Entonces se presentara la organizacion del libro.
numeros, La toma de decisiones es una de sus funciones importantes. Estos a menudo se utilizan
para resolver los problemas relacionados con la operacion global optima de plantas industriales. Los control adores digitales son muy versatiles. Estes pueden manejar ecuaciones de control no lineales que involucran calculos complicados u operaciones logicas, Se puede utilizar con controladores digitales una variedad mucho mas amplia de leyes de control que las que se pueden usar con controladores analogicos. Tambien en el controlador digital, mediante la edicion de un nuevo programa, las operaciones que se estan ejecutando se pueden cambiar por completo. Esta caracteristica es en particular importante si el sistema de control va a recibir informacion 0 instrucciones de operacien desde algun centro de calculo donde se hacen analisis economicos y estudios de optimizacion. Los controladores digitales son capaces de ejecutar calculos complejos con exactitud constante a alta velocidad y pueden tener casi cualquier grado deseado de exactitud de calculo con un incremento relativamente pequeno en el costo. En un principio los control adores digitales se usaron solo como componentes en sistemas de control a gran escala. Actualmente, sin embargo, gracias a la disponibilidad de microcomputadoras baratas, los controladores digitales se utilizan en muchos sistemas de control de gran y pequena
Secci6n 1-5
Comentarios finales
21
escala. De hecho, los controladores digitales estan reemplazando a los controladores analogicos que han sido utilizados en muchos sistemas de control a pequefia escala. Los controladores digitales son a menudo superiores en desempefio y con un costa menor que sus contrapartes analogicas. Los controladores analogicos representan las variables en una ecuacion mediante cantidades fisicas continuas. Estos se pueden disenar facilmente para servir de manera satisfactoria como controladores que no tienen que tomar decisiones. Pero el costa de las computadoras 0 controladores analogicos se incrementa rapidamente a medida que la complejidad del calculo se incrementa, si se tiene que mantener una exactitud constante. Existen ventajas adicionales de los controladores digitales sobre los analogicos, Los componentes digitales, tales como circuitos de muestreo y retencion, convertidores AID y DIA Y los transductores digitales, son de construcci6n robusta, alta confiabilidad y a menu do compactos y ligeros. Adernas, los componentes digitales tienen alta sensibilidad y con frecuencia son mas baratos que sus contrapartes analogicas y son menos sensibles a sefiales de ruido. Y, como se menciono en un principio, los controladores digitales son flexibles al permitir cambios en la programaci6n.
Control digital de procesos. En general, en sistemas de control de procesos industriales, no es practice operar por periodos de tiempo muy prolongados en estado estacionario, debido a que se pueden presentar ciertos cambios en los requerimientos de produccion, materias primas, factores economicos y equipos y tecnicas de procesamiento. Asi, el comportamiento transitorio de los procesos industriales debe siempre tomarse en consideraci6n. Debido a que existen interacciones entre las variables de proceso, al utilizar una sola variable de proceso para cada uno de los agentes de control no es apropiado para un control completo real. Mediante el uso de un controlador digital, es posible tomar en cuenta todas las variables del proceso, conjuntamente con los factores economicos, los requerimientos de produccion, el desempefio del equipo y todas las demas necesidades, y de este modo alcanzar el control optimo de los procesos industriales. Observe que un sistema capaz de controlar un proceso tan completamente como pueda, debera resolver ecuaciones complicadas. En el control mas completo, 10 mas importante es que se conozcan y empleen las relaciones correctas entre las variables de operaci6n. El sistema debe ser capaz de aceptar instrucciones desde muy variadas fuentes como computadoras y operadores humanos y debe tambien ser capaz de cambiar por completo su subsistema de control en un tiempo corto. Los control adores digitales son los mas apropiados en dichas situaciones. De hecho, una de sus ventajas es su flexibilidad, esto es, la facilidad de cambiar los esquemas de control mediante reprogramacion, En el control digital de un proceso complicado, el disefiador debe tener un buen conocimiento del proceso a ser control ado y debe ser capaz de obtener su modelo maternatico. (Elmodelo maternatico se puede obtener en terminos de ecuaciones diferenciales 0 en diferencias, 0 de alguna otra forma.) EI disefiador debe estar familiarizado con la tecnologia de medici6n asociada con la salida y otras variables relacionadas en el proceso. EI 0 ella debe tener un buen conocimiento del trabajo con cOlllPtl(adoras digitales, asi como de la teoria de controlmoderno. Si el proceso es complicado, el disefiador debe investigar varios enfoques diferentes para el disefio del sistema de control. A este respecto, serla util un buen conocimiento de tecnicas de simulaci6n.
Organizacion del /ibro. EI objetivo de este libro es presentar una visi6n detallada de la teoria de control que es relevante al anal isis y disefio de sistemas de control en tiempo discreto. Se enfatizan los conceptos basicos involucrados. En este libro, con frecuencia los control adores digitales se disefian en la forma de funciones de transferencia pulso 0 ecuaciones en diferencias equivalenres. las cuales se pueden implantar facilmente en la forma de programas de computadora.
22
Capitulo 1
La organizaci6n dellibro es como sigue. El capitulo I ha presentado material introductorio. El capitulo 2 presenta la teoria de la transformada z. Este capitulo incluye la transformadaz de funciones elementales, propiedades y teoremas importantes de la transformada z, la transformada z inversa y la soluci6n de ecuaciones en diferencias mediante el metoda de la transformadaz. EI capitulo 3 presenta material de antecedentes para el anal isis de sistemas de control en el plano z. Este capitulo incluye discusiones del muestreo mediante impulsos y la reconstrucci6n de sefiales originales a partir de sefiales muestreadas, funciones de transferencia pulso y la realizaci6n de control adores y filtros digitales. EI capitulo 4 presenta en principio la relaci6n entre los pianos s y z y entonces se discute el analisis de estabilidad de los sistemas en lazo cerrado en el plano z, seguido del anal isis de las respuestas transitoria yen estado estacionario, disefiado mediante los metodos dellugar geornetrico de las raices y de la respuesta en frecuencia y el metodo analitico de disefio. El capitulo 5 presenta la representaci6n en el espacio de estados de sistemas en tiempo discreto, la soluci6n de las ecuaciones de estado en tiempo discreto y la matriz de funciones de transferencia pulso. Despues, se trata la discretizaci6n de las ecuaciones en el espacio de estados en tiempo continuo y el anal isis de estabilidad de Liapunov. El capitulo 6 presenta el disefio de sistemas de control en el espacio de estados. El capitulo inicia con una presentacion detail ada de controlabilidad y observabilidad. Entonces se presentan las teenicas de disefio basadas en la ubicaci6n de polos, seguido por una discusi6n de observadores de estado de orden completo y de orden minimo. Este capitulo se concluye con el disefio de sistemas de seguimiento. EI capitulo 7 trata el enfoque de ecuaciones polinomiales al disefio de sistemas de control. El capitulo comienza con el estudio de las ecuaciones Diofantinas. Entonces se presenta el disefio de sistemas de regulaci6n y sistemas de control empleando la soluci6n de las ecuaciones Diofantinas. Este enfoque es una alternativa al de ubicaci6n de polos combinado con los observadores de orden minimo. En este capitulo se incluye el disefio de sistemas de control mediante el acoplamiento a un modelo. Por ultimo, el capitulo 8 trata en detalle los problemas de control6ptimo cuadratico. El anal isis en el espacio de estados y el disefio de sistemas de control en tiempo discrete, que se presenta en los capitulos 5, 6 Y8, hace un uso extensivo de vectores y matrices. En el estudio de estos capitulos el lector puede, si la necesidad surge, referirse al apendice A, el cual resume el material basico del analisis de vectores y matrices. EI apendice B presenta material referente a la teo ria de la transformada z que no se incluy6 en el capitulo 2. El apendice C trata los problemas de disefio mediante la ubicaci6n de polos euando el control es una cantidad vectorial. En cada uno de los capitulos, excepto el capitulo I, el texto principal esta seguido por problemas resueltos y par problemas propuestos. Ellector debera estudiar y resolver los problemas cuidadosamente. Los problemas resueltos son una parte integral del texto. Los apendices A, Bye estan seguidos por problemas resueltos. EI lector que estudie estos problemas tendra un mejor entendimiento del material presentado.
2
La transforrnada z
2-' INTRODUCCION
Una herramienta matematica muy utilizada en el anal isis y la sintesis de sistemas de control en tiempo discreto es la transformada z. EI papel de la transformada z en sistemas en tiempo discreto es similar al de la transformada de Laplace en sistemas en tiempo continuo. En un sistema de control en tiempo discreto, una ecuacion en diferencias lineal caracteriza la dinarnica del sistema. Para determinar la respuesta del sistema a una entrada dada, se debe resolver dicha ecuacion en diferencias. Con el metodo de la transformadaz, las soluciones a las ecuaciones en diferencias se convierten en un problema de naturaleza algebraica. (De la misma forma en que la transformada de Laplace transforma las ecuaciones diferenciales lineales invariantes en el tiempo en ecuaciones algebraicas en s, la transformada z transforma las ecuaciones en diferencias lineales e invariantes en el tiempo en ecuaciones algebraicas en z.) EI principal objetivo de este capitulo es presentar las definiciones de la transformada z, los teoremas basicos asociados con ella y los metodos para encontrar la transformada z inversa. Tambien se estudia la solucion de ecuaciones en diferencias mediante el metodo de la transformada z,
Senates en tiempo discreto, Las seflales en tiempo discreto surgen si el sistema involucra la operacion de muestreo de senales en tiempo continuo. La seflal muestreada es x(O), x(T), x(2 T), ... , donde T es el periodo de muestreo. Dicha secuencia de valores que surge de la operacion de muestreo normal mente se escribe como x(kT). Si el sistema incluye un proceso iterativo realizado por una computadora digital, la sefial involucrada es una secuencia de numeros x(O), x( I), x(2). . . . La sect;encia de nurneros normal mente se escribe como x(k), donde el argumento k indica el orden en el que se presentan los nurneros en la secuencia, por ejemplo, x(O), x( I), x(2) . . . . Aunque x(k) es una secuencia de numeros, esta se puede considerar como una sei'ial muestreada de x(t) cuando el pertodo de muestreo T es I segundo.
23
24
La transformada z
Capitulo 2
La transformada z se aplica a la serial en tiempo continuo xU), a la sefial muestreadax(k7) y a la secuencia de numeros x(k). Si no se presenta confusi6n en el estudio al tratar con la transformada z, de manera ocasional se emplean x(k7) y x(k) intercambiadas. [Esto es, para simplificar la presentacion, en ocasiones se omite la aparici6n explicita de Ty se escribe x(k7) como x(k).]
Organizacion del capitulo. En la secci6n 2-1 se presentaron comentarios introductorios. En la secci6n 2-2 se expone la definici6n de la transformada z y los temas asociados con esta. En la secci6n 2-3 se dan las transformadas z de funciones elementales. Las propiedades y teoremas importantes de la transformada z se presentan en la secci6n 2-4. En la secci6n 2-5 se estudian los metodos analfticos y computacionales para encontrar la transformada z inversa. En la secci6n 2-6 se presenta la solucion de ecuaciones en diferencias mediante el metodo de la transformada z, Por ultimo, en la secci6n 2-7 se dan los comentarios finales.
2-2 LA TRANSFORMADA %
EI metodo de la transformada z es un metodo operacional muy poderoso cuando se trabaja con sistemas en tiempo discreto. A continuaci6n se definira la transformada z de una funci6n del tiempo 0 de una secuencia de numeros, Al considerar la transformada z de una funci6n del tiempo x(t), s610 se toman en cuenta los valores muestreados de x(t), esto es, x(O), x(7), x(27), ... , don de T es el periodo de muestreo. La transformada z de una funci6n del tiempo xU), donde t es positivo, 0 de la secuencia de valores x(k7), donde k adopta valores de cero 0 de enteros positivos y Tes el periodo de muestreo, se define mediante la siguiente ecuaci6n:
L x(kT)z-k
k=O
(2-1)
X(z)
Z[x(k)]
L X(k)Z-k
k=O
(2-2)
La transformada z definida mediante las ecuaciones (2-1) 0 (2-2) se conoce como transformada z
unilateral. x(t)
= para t < 0 0 x(k) = 0 para k < O. Observe que z es una variable compleja.
Observe que, cuando se trata con una secuencia de tiempo x(k7) que se obtuvo mediante el muestreo de una sefial x(t), la transformada z X(z) involucra de manera explfcita a T. Sin embargo, para una secuencia de tiempo x(k), la transformada zX(z) no 10incluye a Texplfcitamente. La transformada z de xU), donde -x < t < x, 0 de x(k), don de k adopta valores enteros (k = 0, I, 2, .. '), se define mediante
L
k=-~
X(kT)z-k
(2-3)
X(z)
= Z[x(k)] =
X(k)Z-k
(2-4)
Seccion 2-3
25
La transfonnada z definida mediante las ecuaciones (2-3) 0 (2-4) se denomina transformada z bilateral. En la transformada z bilateral, se supone que la funcion x(t) es distinta de cero para t < 0 y se considera que la secuencia x(k) tiene valores distintos de cero para k < O. Ambas transfonnadas z, la
unilateral y la bilateral, son series de potencias de Z-I . (La transfonnada bilateral incluye tanto potencias positivas como negativas de z -I.) En este libro, solo se considera de manera detaIlada la transformada zuni lateral. Para la mayoria de las aplicaciones en ingenieria, la transfonnada z unilateral tendra una solucion apropiada en forma cerrada en su region de convergencia. Observe que cuando X(z), una serie infinita en z -I, converge fuera del circulo Izi = R, donde R se conoce como radio de convergencia absoluta. AI utilizar el metodo de la transfonnada z para resolver problemas en tiempo discreto no es necesario especificar los valores de z para los cuales X(z) converge. Observe que la expansion del segundo miembro de la ecuacion (2-1) da como resultado
X(z)
(2-5)
La ecuacion (2-5) implica que la transfonnada z de cualquier funcion en tiempo continuo x(t) se puede escribir, mediante inspeccion, en la forma de una serie. La z -k en esta serie indica la posicion en el tiempo en la que se presenta la amplitudx(k1). De maneracontraria, siX(z) esta dada en la forma de una serie como la que se indico, la transfonnada z inversa se puede obtener por inspeccion como una secuencia de la funcion x(k1) que corresponde a los valores de x(t) en los valores de tiempo respectivos. Si la transfonnada z esta dada como el cociente de dos polinomios en z, entonces la transformada z inversa se puede obtener mediante varios metodos diferentes, tales como el metoda de la division directa, el metodo computacional, el metodo de expansion en fracciones parciales y el metodo de la integral de inversion (para mayores detalles vease la seccion 2-5).
A continuacion se presentara la transfonnada z de varias funciones elementales. Observe que en Ja teoria de la transfonnada z unilateral, al muestrear una serial discontinua x(t), se supone que la funcion es continua por la derecha; esto es, si la discontinuidad se presenta en t = 0, entonces se supone que x(O) es igual a x(O+) en lugar del promedio en la discontinuidad, [x(O-) + x(O+)]/2.
x(t)
{l(t), 0,
O:5t t<O
Como se puede observar, en el muestreo de la funcion escalon unitario se supone que esta funcion es continua por la derecha; esto es, 1(0) = 1. Entonces, refiriendose a la ecuacion (2-1), se tiene
X(z)
26
La transformada z
Capitulo 2
1 1- z
=--
z - 1
Observe que la serie converge si Izi > 1. Al encontrar la transformada z, la variable z actua como un operador mudo. No es necesario especificar la regi6n de z en la que X(z) converge. Es suficiente saber que dicha regi6n existe. La transformada z X(z) de una funci6n del tiempo x(t) que se obtiene de esta manera es valida en todo el plano z excepto en los polos de X(z). Se debe observar que I(k) definida mediante
l(k)
{I, 0,
k = 0,1,2, ...
k<O
x(t) = It, 0,
Observe que
O:5t t<O
k
=
x(kT) = kT,
0,1,2, ...
La figura 2-1 representa la sefial rampa unitaria muestreada. Las magnitudes de los valores muestreados son proporcionales al periodo de muestreo T. La transformada z de la funci6n rampa unitaria se puede escribir como
cc
X(z)
k=O
T (1 _
Z-I)2
Tz
x(t)
x(4T) x(3n
x(2T) x(T)
I
o
T
2T
3T
4T
Figura 2-1
Se ccion 2-3
27
x(k)
= { 0, '
ak
k=0,1,2, ...
k<O
don de a es una constante. Con referencia a la definicion de la transformada z dada por Ia ecuacion (2-2), se obtiene
X(z) =Z[akJ = 2:X(k)Z-k = 2:a kz- k k=O k=O = 1 + az- 1 + a2Z-2 + a3Z-3 + ...
1 1 - az
=--
z z - a
a "
Funcion exponencial.
Encuentre la transformada z de
x(t)
Puesto que
= {e0,
OSt t<O
x(kT)
se tiene que
= e- akT,
= 0,1,2, ...
X(z)
= Z[e-a'J = =
z z - e aT
Funcion senoidal.
Considere la funcion senoidal
x(t)
Si observamos que
= {sen wt,
0,
OSt t<O
sen wt
28
Como la transformada z de la funci6n exponencial es
La transform ada z
Capitulo 2
Z[e- al ]
se tiene
1 -1-_-e---;..- ----,. aT 1
z
e\WT z I)
Ejemplo 2-1
Obtenga la transformada z de la funcion coseno
0:5 t
t<O
Si se procede de manera similar a la forma en la que se trato a la transformada z de la funcion seno, se tiene
X(z) =Z[coswt] =
=
~Z[eiWl
+ e- j w , ]
~C
-)"'TZ
1)
2 1 - (ej"'T + e j"'T)Z
+ Z-2
1 Xes) = -s(-s-+-I-)
Cuando se da una funcion en s, una manera de encontrar la transformada z correspondiente es convertir Xes) en x(t) y entonces encontrar la transformada z de x(t). Otro enfoque es expandir Xes) en fracciones parciales y utilizar la tabla de transformadas z para encontrar la transformada z de los terminos expandidos. No obstante, se estudiaran otros enfoques en la seccion 3-3.
5eCClon 2-3
29
x(t)
Por consiguiente,
1 - e:',
0s t
_ X(z) =Z[1- e I]
1 1 -1---z---1 - 1 _ e T
(1 - e-T)z
(z - l)(z - e T)
Comentarios. De la misma forma como se trabaja con la transformada de Laplace, una tabla de las transformadas z de las funciones comunrnente encontradas es muy util en la resoluci6n de problemas en el campo de los sistemas en tiempo discreto. La tabla 2-1 es de este tipo.
TABLA 2-1
TABLA DE TRANSFORMADAS
z
0
X(s)
x(t)
x(kT)
x(k)
X(z)
I.
I, 0,
k=O k*O
2.
Z-k
3.
s
1 -+S a
1(t)
1 ~
1 - e aT Z I
4.
at
-:
5.
kT
6.
,2
S'
t'
(kT)'
7.
54
a s(s + a) b-a (s + a)(s + b)
1 (s + a)2
t-'
1 -e -at
(kT)-'
8.
1 - e :""
9.
e-a/ _ e- ht
(e- aT _ e-OT)z-1
(I - e aT Z 1)(1 - e sr Z ')
10.
te~al
11.
s
(s + a)'
(I - al)e-a,
30
TABLA 2-1
La transformada z
Capitulo 2
(continuaci6n)
X(s)
12. 2
x(t)
(2
x(kT)
x(k)
X(z) T 2e-aT(l + :" Z-I)Z-I (1 - e aT Z-I)3 [(aT - 1 + e- aT) + (1 - e- aT - aTe-aT)z-I)z-1 (1 - z 1)'(1 - e aT Z I) z-'senwT 1-2z Icos wT+z 2
1 - Z-I coswT 1-2z 'cos wT+z 2
e:"
13.
at - 1 + e:"
14.
sen wt
senwkT
15.
cos wt
16.
17.
18.
19.
20.
ka" - I
21.
k' ak - I
k3ak - I
z-I(1
22.
23.
24.
+ az- I
Z-2
25.
(1 - z 1)3
z-m+l
26.
k(k - 1) ... (k - m + 2)
(m - I)!
(1 - Z I)m
H
27.
k(k - 1)
2!
Z-2
(1 - az 1)3
z-m+l
23.
k(k - 1) .. (k - m + 2) a k - m + 1
(m - 1)!
(1 - az-I)m
Secci6n 2-4
31
EI uso del metodo de la transformada z en el anal isis de sistemas de control en tiempo discreto se puede facilitar si se hace referencia a los teoremas de la transfonnada z, En esta seccion se presentan las propiedades importantes y los teorernas utiles de la transfonnada z, Se supone que la funcion del tiernpo x(t) tiene transformada z y que x(t) es cero para t < O.
Z[ax(t)]
= a Z[x(t)] = aX(z)
donde a es una constante. Para probar esto, observe que, por definicion
Z[ax(t)] =
k=O
Llnealidad de la transformada Z. La transformada z posee una propiedad importante: la linealidad. Esto significa que, sif(k) y g(k) tienen transformada z yay (3 son escalares, entonces x(k) formada por una combinacion lineal
x(k)
tiene la transformada z
af(k) + (3g(k)
X(z)
k=O
= = =
L [af(k)
k~O
+ {3g(k)]Z~k
L f(k)z~k + (3 L g(k)Z-k
k=O
Z[a kx(k)]
Esto se puede probar como sigue:
X(a- 1 z)
(2-6)
zt k
Z[a kx(k)]
= =
k-O X(a- 1 z)
L akX(k)Z-k
k-O
L x(k)(a-
Teorema de corrimiento, EI teorema de corrimiente que se presenta aqui se conoce tambien como teorema de translacion real. Si x(t) = 0 para t < 0 y x(t) tiene la transformada r X(.::), entonces
32
La transformada z
Capitulo 2
Z[x(t - nT)]
y
z" X(Z)
(2-7)
Z[x(t + nT)]
z{X(Z) -
X(kT)Z-k]
(2-8)
donde n es cero 0 un entero positivo. Para probar la ecuaci6n (2-7), observe que
Z[x(t - nT)]
2: x(kT k~O
z"
2: x(kT k~O
Z[x(t - nT)]
2:
m=-n
xtm'Tyz:"
Puesto que x(m7) = 0 para m < 0, se podrfa cambiar ellimite inferior de la sumatoria de m = - n por m = O. Por tanto,
Z[x(t - nT)]
z"
2: xtm'Tiz :" =
m~O
-II
z:" X(z)
(2-10)
De este modo, la multiplicaci6n de una transformadaz por z tiene el efecto de retrasar la funci6n del tiempo x(t) un tiempo nT. (Esto es, mover la funci6n a la derecha un tiempo nT) Para probar la ecuaci6n (2-8), se observa que
Z[x(t + nT)]
2: x(kT + nT)z-k
k~O
z" 2: x(kT
k~O
+ nT)z-(k+n)
z{
X(z) -
~~ X(kT)Z-k]
=
Para la secuencia de numeros x(k), la ecuaci6n (2-8) se puede escribir como sigue:
Z[x(k + n)]
z{
X(z) -
~~ X(k)Z-k]
(2-11)
= =
(2-12)
Seccion 2-4
33
+ n)]
= z" X(z) -
(2-13)
donde n es un entero positivo. Recuerde que la multiplicacion deX(z) por z tiene el efecto de avanzar la sefial x(kT) un paso (un periodo de muestreo) y que la multiplicacion de la transformada z X(z) por z -I tiene el efecto de retrasar la sefial x(kT) un paso (un periodo de muestreo).
Ejemplo 2-3 Encuentre las transformadas z de una funcion escalon unitario que esta retrasada un periodo de muestreo y cuatro periodos de muestreo, respectivamente, como se muestra en las figuras 2-2a) y b). Mediante el teorema de corrimiento dado por la ecuacion (2-7), se tiene
Z[l(t - T)) =
Tarnbien.
z-
'
Z [l (t)] =
z-I1 -1
1 -z
1
=1
-z
Z-1
-I
Z[l(t - 4T)] =
z-
Z [1(t)] =
z-4--
1 -z
-_1 = -1--1
Z-4
-z
(Observe que z -1 representa el retardo de un periodo de muestreo T, sin tomar en cuenta el valor de T.)
f(a) =
~,
k-I
k=1,2,3, ...
ksO
<'lJ
0
1(t-T)
/
I
I
2T
3T
4T
5T
6T
7T
8T
a)
<"l
0
l(t - 4T)
/'
~
2T
3T
4T
5T
6T
7T
8T
b)
Figura 2-2 a) Funcion escalon unitario retardada I periodo de muestrco: h) funcion escalon unitario retardada 4 pcriodos de muestreo.
34
Si tomamos la ecuaci6n (2-7) como referencia, se tiene
Z[x(k - 1)] = Z~l X(z)
La transformada z
Capitulo 2
La transform ada z de a k es
Z[a 'l = 1 - az
y de este modo
1 = Z~l _ _....,.
1 - az
1 - az
Ejemplo 2-5 Considere la funci6n y(k), la cual es la suma de funciones x(h), donde h = 0, 1,2, ... , k, tal que
k
y(k) =
L x(h),
h-O
k = 0,1,2, ...
donde y(k) = 0 para k < O. Obtenga la transformada z de y(k). Primero observe que
y(k) = x(O) y(k - 1)
- 1) - 1)
+ x(k)
De aqui,
y(k) - y(k - 1)
= 0,1,2, ...
Por 10 tanto,
Z[y(k) - y(k - 1)]
= Z[x(k)] = X(z)
o
Y(z) Z-1
Y(z)
10 cual da
Y(z) = 1 _ z-IX(z)
don de X(z)
Z[x (k)].
Teorema de traslacion compleja. Si x(t) tiene la transforrnada z X(z), entonces la transformada z de e-<II x(t) esta dada por X(ze a1). Esto se conoce como teorema de traslacion compleja. Para probar este teorema, observe que
Z[e-atx(t)] =
= X(zea~
(2-14)
De esta manera, se ve que al reemplazar z en X(z) por zeal da la transformada z de e-<II x(t).
Ejemplo 2-6 Dadas las transformadas z de wi y cos WI, obtcnga la transformada z de e:" sen wi y e:" cos vamcntc, mediante el uso del teorema de traslacion compleja.
WI,
rcspecti-
3S
Si observamos que
Z-I
Z[senwt]
1 _ 2z
senwT coswT + z
sustituimos r por ze" para obtener la transforrnada ; de e-<lI sen cot, como sigue:
Z[e-atsenwI] = 1
.c [cos wt] = 1
..,.
1-
Z-l
I
coswT cosw T + z
at
Z[e
Ejemplo 2-7
Z [t]
De este modo.
= (1
Tz- 1 _ z If = X(z)
To -aT
Z[ te -at] = X( ze aT) .
-I
xeD)
Para pro bar este teorerna, observe que
lirnX(z)
(2-15)
X(z)
2: X(k)Z-k = xeD)
k~O
+ x(l)z-1 + x(2)z-Z +
AI hacer que z ~ x en esta ultima ecuacion, se obtiene la ecuaci6n (2-15). De esta forma. el comportamiento de la serial en la vecindad de t = 0 0 k = 0 se puede determinar mediante el comportamiento de XC::) cuando z = x. EI teorema del valor inicial es conveniente para verificar la incidencia de posibles errores en el calculo de la transformada z. Debido a que x(O) normal mente se conoce, una verificaci6n del valor inicial mediante ~~~ XC::) puede facilitar descubrir errores en XC::), si estos existen.
Ejemplo 2-8
Determine el valor inicial x(O) si la transformada ; de x(t) esta dada por
X(z)
= (1
(1 - e-T)z-I _ z 1)(1 - e T z 1)
36
La transfarmada z
Capitulo 2
x(t)
1 - e- t
Teorema del valor final. Suponga que x(k), donde x(k) = 0 para k < 0, tiene la transformada z X(z) y que todos los polos de X(z) estan dentro del circulo unitario, con la posible excepci6n de un solo polo en z = 1. [Esta es la condici6n para la estabilidad deX(z), 0 la condici6n para quex(k) (k = 0, 1,2, ...) permanezca finita.] Entonces el valor final de x(k), esto es, el valor de x(k) a medida que k tiende a infinito, puede darse mediante
(2-16)
z-e l
= X(z) =
k=O
L X(k)Z-k
k=O - 1)Z-k
k=O
L X(k)Z-k - L x(k
k=O
- 1)Z-k = X(z) -
Z-I
X(z)
1)Z-k] =
~~ [(1 -
Z-I)X(Z)]
Debido a la condici6n de estabilidad que se supuso y a la condicion de que x(k) = 0 para k < 0, el primer miembro de esta ultima ecuaci6n se convierte en
k=O
- x(k - 1)]
Por tanto,
limx(k)
k--+Xl
que es la ecuaci6n (2-16). El teorema del valor final es muy util para determinar el comportamiento de x(k) a medida que k ~ 'X a partir de su transformada z X(z).
Ejemplo 2-9 Determine el valor final xrx ) de
X(z) = 1 _
1
Z-1 -
1_ e
1
aT Z
I'
a>0
La transformada z inversa
37
Z~I)X(Z)]
lim
z-r-eI
. [( 1 - -1)(-1----1 1
Z
-
1aT
lim ( 1 - 1
z-1
1
-
--~T
e
-1)
1
e~al
af )
=1
Resumen. En esta secci6n se han presentado las propiedades y teoremas importantes de la transformada z que probaran ser de utilidad al resolver muchos problemas de la transformada z. Con el prop6sito de tener una referencia adecuada, estas propiedades y teoremas importantes se resumen en la tabla 2-2. (Muchos de los teoremas que se presentan en esta tabla se estudiaron en esta secci6n. Aquellos que no fueron estudiados aqui pero que se incluyen en la tabla se obtienen 0 prueban en el apendice 8.)
La transformada z en sistemas de control en tiempo discreto juega el mismo papel que la transformada de Laplace en sistemas de control en tiempo continuo. Para que la transformada z sea util, debemos estar familiarizados con los metodos para encontrar la transformada z inversa. La notaci6n para la transformada z inversa es Z-I. La transformada z inversa de X(z) da como resultado la correspondiente secuencia de tiempo x(k). Se debe observar que a partir de la transformada z inversa s610 se obtiene la secuencia de tiempo en los instantes de muestreo. De esta manera, la transformada z inversa de X(z) da como resultado una unica x(k), pero no da una unica x(t). Esto significa que la transformada z inversa da como resultado una secuencia de tiempo que especifica los valores de x(t) solamente en los valores discretos de tiempo, t = 0, T, 2 T, ... , y no dice nada acerca de los valores de x(t) en todos los otros tiempos. Esto es, muchas funciones del tiempo x(t) diferentes pueden tener la misma x(kT). Vease Ia figura 2-3. Cuando X(z), la transformada z de x(k1) 0 x(k), esta dada, la operaci6n que determina la x(k1) o x(k) correspondiente se denomina transformacion z inversa. Un metoda obvio para encontrar la transformada z inversa es referirse a una tabla de transformadas z . Sin embargo, a menos que uno se refiera a una tabla de transformadas z muy extensa, no serfa uno capaz de encontrar la transformada z inversa de una funci6n de z complicada. (Si se utiliza una tabla de transformadas z no muy extensa, es necesario expresar una transformada z complicada como una suma de transformadas z mas sencilias. Refierase al metodo de expansi6n en fracciones parciales que se presenta en esta seccion.) Existen otros cuatro metodos para obtener la transformada z inversa que no implican el uso de tablas:
38
TABLA 2-2
La transformada z
Capitulo 2
x(t)
I. 2. 3. 4. 5. 6. 7. 8. 9.
x(k)
Z[x(t)]
Z[x(k)]
aX(z) aXt(z) + bXz(z) zX(z) - zx(O) ZZ X(z) - Zzx(O) - zx(T) ZzX(z) - ZZx(O) - zx(l) z" X(z) - z" x(O) - zk-t x(T) - ... - zx(kT - T) Z-k X(z) z" X(z) - z" x(O) - Zk-l x(l) - ... - zx(k - 1) Z-k X(z) d -Tz-X(z) dz -z-X(z) dz X(ze aT) X(zea)
d
x(k + 1)
x(t + 2T) x(k + 2) x(t + kT) x(t - kT) x(n + k) x(n - k) tx(t) kx(k) e- atx(t) e- ak x(k) akx(k) kakx(k) x(O) x (00) Vx(k) ..::1x(k)
z~t
10.
II. 12.
13.
X(~)
-z~X(~) dz a
lim X(z)
z~~
SI
ellimite existe
(1 - z-t)X(z)
(z - l)X(z) - zx(O)
1 -l--- X(z) -z t
2: x(k)
k~O
a aax(t,a) k m x(k)
23. 24.
k-O
2: x(kT)y(nT oc
k-O
2: x(k)
3e::lon 2-5
La transformoda z inversa
39
2T
3T
4T
Figura 2-3 Dos funciones en tiempo continuo diferentes xl(t) Y x,(t), que tienen los mismos valores en t = 0, T, 2T, .
1. 2. 3. 4.
Para obtener la transformada z inversa, se supone, por 10 regular, que la secuencia de tiempo
x(kT) 0 x(k) es cero para k < O.
Antes de presentar los cuatro metodos, son convenientes algunos comentarios acerca de los polos y ceros de la funcion de transferencia pulso.
Polos y ceros en el plano z. puede tener la forma
X( z )
o
(m -s n)
(2-17)
donde los Pi(i = 1,2, ... ,n) son los palos deX(z) y los zjU = 1,2, ... ,m) son los ceros deX(z). La ubicacion de los polos y los ceros de X(z) determina las caracteristicas de x(k), la secuencia de valores 0 numeros. Como en el caso del analisis de sistemas de control lineales en tiempo continuo en el plano s, tambien se utiliza una representacion grafica de las localizaciones de los polos y ceros de XC;) en el planoz. Observe que en ingenieria de control y en procesamiento de senales, X(z) a menudo se expresa como un cociente de polinomios en Z-I, como sigue: boz-(n-m) + b1z-(n-m+l) + ... + bmz- n X(z) = (2 - 18) 1 + alz- I + a2z-2 + ... + anz- n
40
La transformada z
Capitulo 2
donde Z-I se interpreta como el operador retraso unitario. En este capitulo, donde se presentaran las prapiedades y teoremas basicos del metodo de la transformada z, X(z) se puede expresar en terrninos de las potencias de z, como se hace en la ecuacion (2-17), 0 en terminos de las potencias de Z-I, como en la ecuacion (2-18), dependiendo de las circunstancias. AI encontrar los polos y ceros de X(z), es conveniente expresar X(z) como un cociente de polinomios en z. Por ejemplo,
X(z)
ZZ + 0.5z ZZ + 3z + 2
Es claro que X(z) tiene polos en z = -1 Yz = -2 y ceros en z = 0 y z = - 0.5. Si X(z) se escribe como un cociente de polinomios en Z-I, laX(z) precedente se puede escribir como
X(z)
1 + 0.5z- 1 1 + 3z 1 + 2z
1 + 0.5z- 1
Z
Aunque los polos en z = -1 y z = -2 y un cero en z = - 0.5 se yen claramente a partir de la expresion, el cera en z = 0 no se muestra de manera explicita, y de esta forma el principiante puede fallar al ver la existencia del cera en z = O. Por 10 tanto, al tratar con los polos y ceros deX(z), es preferible expresar X(z) como un cociente de polinomios en z, en lugar de polinomios en Z-I. Ademas, en la obtencion de la transformada z inversa que emplea el metodo de la integral de inversion, es deseable expresar X(z) como un cociente de polinomios en z; en lugar de Z-I, para evitar cualquier posible error al determinar el numero de polos en el origen de la funcion X(z)z k-I.
Metoda de La division directa. En el metodo de la division directa, la transformada z inversa se obtiene mediante la expansion de X(z) en una serie infinita de potencias de Z-I. Este metodo es util cuando es dificil obtener una expresion en forma cerrada para la transformada z inversa 0 se desea encontrar solo algunos de los primeras terminos de x(k). EI metoda de la division directa proviene del hecho de que si X(z) esta expandida en una serie de potencias de Z-I, esto es, si
X(z)
L x(kT)z-k
k~O
= x(O)
X(z)
= =
L X(k)Z-k
k~O
3ecclon 2-5
La transformada z inversa
41
crecientes de Z-I. Si la serie resultante es convergente, los coeficientes de los terminos z" son los valores x(k7) de la secuencia del tiempo 0 los valores x(k) de la secuencia de numeros. Aunque este metodo da como resultado los valores de x(O), x(7), x(27), ... 0 los valores x(O), x( I), x(2), ... de una manera secuencial, por 10 regular es dificil obtener una expresi6n para el termino general a partir de un conjunto de valores de x(k7) 0 x(k).
Ejemplo 2-10 Encuentre x(k) para k = 0, 1,2,3,4, cuando X(z) esta dada por
X(z)
1Oz- 1 + 112- 2 + 18.4z- 3 + 18.68z- 4 + 1 - 1.2z- 1 + 0.2z- 2 )1Oz 1 + 5z 2 1Oz- 1 - 12z- 2 + 2z- 3 112 2 - 2 z 3 112- 2 - 20.4z- 3 + 3.4z- 4 18.4z 3 - 3.4z 4 18.4z- 3 - 22.08z- 4 + 3.68z- 5 18.68z- 4 - 3.68- 5 18.68z- 4 - 22.416z- 5 + 3.736z- 6
De este modo,
X(z)
= 1Oz- 1 +
Al comparar esta expansion de X(z) en una serie infinita con X(z) x(O) = 0
x(l) = 10
x(2) = 17
1
X(z)
Al dividir el numerador entre el denominador, obtenemos
Z-1
= Z + 1 = 1 + Z-1
X(z)
42
AI comparar esta expansi6n de )((=) en una serie infinita con X(=)
=
La transformada z
Capitulo 2
x(O)
x(l)
=0
=
1
-1
x(2)
=
=
x(3) = 1 x(4)
-1
Esta es una senal alternante entre 1 y -I. que empieza en k = I. En la figura 2-4 se muestra una grafica de esta senal.
X(z)
La transformada X(=) ya esta en la forma de una serie de potencias de =-i. Puesto que X(z) tiene un nurnero fin ito de terrninos, corresponde a una sefial de longitud finita. Por inspeccion se encuentra que
x(O)
x(l)
=1
=
x(2) = 3 x(3) = 4
Todos los otros valores de x(k) son cero.
Metoda computacional.
la transfonnada z inversa.
1. 2.
El enfoque de MATLAB El enfoque de la ecuaci6n en diferencias Considere un sistema G(z) definido mediante
G( )
Z
(2-19)
Para encontrar la transfonnada z inversa, se utiliza la funci6n delta de Kronecker Do(kT), donde
-1
Figura 2-4 en k = I.
5eCClon 2-5
La transformada z inversa
43
8o( k T) = 1,
= 0,
para k = para k
0
0
"* 0
a
0,
X(z) = 1
Mediante la entrada delta de Kronecker, la ecuaci6n (2-19) se puede rescribir como
Y(z) 0.4673z- 1 - 0.3393z- 2 G(z) = X(z) = 1 - 1.5327z- 1 + 0.6607z- 2 0.4673z - 0.3393 Z2 - 1.5327z + 0.6607
(2-20)
Enfoque de MATLAB. Se puede utilizar MATLAB para encontrar la transformada z inversa. A partir de la ecuaci6n (2-20), la entradaX(z) es la transformada z de la entrada delta de Kronecker. En MATLAB la entrada delta de Kronecker esta dada por
x = [1 zeros(l,N)J
donde N corresponde al final de la duracion del tiempo discreto del proceso considerado. Puesto que la transformada z de la entrada delta de Kronecker X(.::) es igual a la unidad, la respuesta del sistema a esta entrada es
Por 10 tanto, la transfonnada z inversa de G(z) esta dada pory(O),y( I ),y(2), .... Se obtendrajxx) hasta k=40. Para obtener la transformada z inversa de G(z) con MATLAB, se procede como sigue: Introduzca el numerador y el denominador de la siguiente forma:
num = [0 den = [1
0.4673 -1.5327
-0.3393] 0.6607J
44
La transformada z
Capitulo
En resumen, el programa para MATLAB que permite obtener la transformada z inversa 0 la respuesta a la entrada delta de Kronecker es como se muestra en el programa para MATLAB 2-1.
% - - - Para encontrar la transformada z inversa - - % ***** Encontrar la transformada z inversa de G(z) es 10 mismo que % encontrar la respuesta del sistema Y(z)jX(z) = G(z) a la % entrada delta de Kronecker ***** % ***** Introducir el numerador Y denominador de G(z) *****
num = [0 0.4673 -0.3393]; den=[l -1.5327 0.6607];
% ***** Introducir la entrada delta de Kronecker x y el comando de filtro % y = filter (num, den, x) *****
x= [1 zeros(1,40)]; y = filter(num,den,x)
Si este programa se ejecuta, la pantalla mostrara la salida y(k) desde k = 0 hasta 40 como sigue:
y= Columns 1 through 7 0.0032 0.1632 0.0725 0.2690 0.3769 0.4673 0 Columns 8 through 14 -0.0429 -0.0679 -0.0758 -0.0712 -0.0591 -0.0436 -0.0277 Columns 15 through 21 0.0092 0.0108 0.0111 0.0094 0.0050 -0.0137 -0.0027 Columns 22 through 28 0.0007 -0.0005 -0.0013 -0.0016 0.0046 0.0025 0.0070 Columns 29 through 35 0.0000 -0.0016 -0.0014 -0.0011 -0.0008 -0.0004 -0.0002 Columns 36 through 41 0.0001 0.0002 0.0002 0.0002 0.0002 0.0002
(Observe que los calculos en MATLAB comienzan a partir de la columna 1 y terminan en la columna 41, en lugar de comenzar en la columna 0 y terminar en la 40.) Estos valores dan la transformada z inversa de G(z). Esto es,
yeO) = 0
y(1) y(2)
= = =
y(3)
Seccion 2-5
La transformada z inversa
45
y(40) = 0.0001
Para graficar los valores de la transforrnada z inversa de G(z), se sigue el procedimiento siguiente.
Graflcacion de fa respuesta a fa entrada delta de Kronecker. Considere el sistema dado por la ecuaci6n (2-20). Un posible programa para MATLAB que perrnite obtener la respuesta de este sistema a la entrada delta de Kronecker se muestra en el programa para MATLAB 2-2. La grafica correspondiente se muestra en la figura 2-5.
Programa para MATLAB 2-2
% - - - Respuesta a la entrada delta de Kronecker - - num = [0 0.4673 -0.3393J; den=[l -1.5327 0.6607J; x = [1 zeros(1,40)1; v=[O 40 -1 1J; axis(v); k = 0:40; y = filter(num,den,x); plot(k,y'o') grid title ('Respuesta a la entrada delta de Kronecker') xlabel('k') ylabel('y(k)') Respuesta a la entrada delta de Kronecker
>.
000000000000000000000000000 0 0 0 00 0
-1 0
10
15
20
25
30
35
40
k Figura 2-5 Respuesta del sistema definido por la ecuacion (2-20) a la entrada delta de Kronecker.
46
La transformada z
Capitulo 2
Si se desea conectar los puntos consecutivos (abrir circulos, 0) mediante Ifneas rectas, se necesita modificar el comando de graficacion de (k, y, 0) en el de (k, y, '0', k, y, '-').
(0.4673z - 0.3393)X(z)
= 0.4673x(k + 1) -
0.3393x(k)
(2-21)
donde x(O) = I y x(k) = 0 para k =1= 0, Yy(k) = 0 para k < O. [x(k) es la entrada delta de Kronecker.] Los datos iniciales yeO) y y(l) se pueden determinar como sigue: mediante la sustitucion de k = -2 en la ecuaci6n (2-21), se encuentra que
=0
y(l) - 1.5327y(0)
a partir de la cual se tiene
Encontrar la transformada z inversa de Y(z) se convierte ahora en el problema de resolver la siguiente ecuaci6n en diferencias paray(k):
= 0.4673x(k + 1) -
0.3393x(k)
(2-22)
con los datos iniciales yeO) = 0, y(l) = 0.4673, x(O) = I, Yx(k) = 0 para k =1= O. La ecuacion (2-22) se puede resolver facilrnente a mano, 0 mediante el uso de BASIC, FORTRAN 0 algun otro lenguaje de programaci6n.
Metodo de expansion en fracciones parciales. EI metodo de expansion en fracciones parciales que se presenta aqui y que es identico al metodo de expansion en fracciones parciales que se utiliza en la transformada de Laplace, es muy empleado en problemas rutinarios que involucran transformadas z. EI metoda requiere que todos los terminos de la expansion en fracciones parciales se puedan reconocer facilmente en la tabla de pares de transformadas z. Para encontrar la transformada z inversa, si X(z) tiene uno 0 mas ceros en el origen (z = 0), entonces X(z)/z 0 X(z) se expande en la suma de terminos sencillos de primero 0 segundo orden mediante la expansion en fracciones parciales y se emplea una tabla de transformadas z para encontrar la funcion del tiempo correspondiente para cada uno de los terminos expandidos. Se debe observar que la unica raz6n de que se expanda X(z)/z en fracciones parciales es que cada uno de los terminos expandidos tenga una forma que se pueda encontrar facilmente a partir de las tab las de transformadas z de que se dispone comunmente,
.:-=:: :~
2-5
La transformada z inversa
47
Ej ernplo 2-13 Antes de estudiar el metodo de expansion en fracciones parciales se revisara eI teorema de corrimiento. Considere la siguiente X(z):
Z-1
X(z) = 1
Escribiendo zX(z) como Y(z), se obtiene
- az
zX(z)
= Y(z) = 1 - az
= y(k) = ak
Con referencia a la tabla 2-1, la transformada z inversa de Y(z) se puede obtener como sigue:
Z-l[y(Z)]
Por 10 tanto, la transformada z inversa de X(z)
= Z-I Y(z)
k=I,2,3, ...
ksO
z - PI
Z - P2
Z - Pn
EI coeficiente a, se puede determinar multiplicando ambos miembros de esta ultima ecuacion por z- P, Y haciendo que z = p.. Esto dara como resultado que todos los terminos del segundo miembro sean cera excepto el termino a.; en el cual el factor que esta multiplicando z - P, ha sido cancelado por el denominador. Por 10 tanto, se tiene
48
La transformada z
Capitulo 2
Observe que dicha forma para determinar Q, es valida s610 para polos simples. Si X(z)/z involucra un polo multiple, por ejemplo, un polo doble en z = PI Yno tiene mas pol os, entonces X(z)/z tendra la forma
X(Z) Z
Los coeficientes
CI
CI
+ _c_z_
z - PI
(z - PI)Z
Y C z se determinan a partir de
CI
= [(Z - PI)ZX(Z)]
Z
Z~PI
Cz =
{~[(Z dz
- PI)ZX(Z)]}
Z
Z=PI
Se debe observar que si X(z)/z involucra un polo triple en z = PI' entonces las fracciones parciales deben incluir un termino (z + PI)/(Z - PI)3. (Vease el problema A-2-8.)
. Ejemplo 2-14 Dada la transfonnada z
X(z) - ...,...-"'-----:----'---;::- (z - 1)(z - e a~
(1 - e-aT)z
donde a es una constante y T es el periodo de muestreo, determine la transformada z inversa x(kT) utilizando el metodo de expansion en fracciones parciales. La expansion en fracciones parciales de X(z)/z se tiene que es
X(z) =_1__
z
De este modo,
z - 1
z - e aT
X(z) = - 1 -1
-z
1 1 -e -aTz 1
z-t _ e~aT
Por 10 tanto, la transfonnada z inversa de X(z) es Ejemplo 2-15 Obtenga la transfonnada z inversa de
Z-{1 _\-1]
= 1
akT
Z-1] = e-
x(kT) = 1 - e- akT,
k = 0,1,2, ...
Zz
+z+2
Z
(z) = (z - 1)(z2 -
+ 1)
mediante el rnetodo de expansion en fracciones parciales. Se puede expandir X(z) en fracciones parciales como sigue:
-3z + 2
1+
Z2 Z
(z) =
Z -
5,,::
C~
2-5
La transformada z inversa
49
Si obscrvamos que los dos polos involucrados en el termino cuadratico de esta ultima ecuaci6n son complejos conjugados, X(z) se rescribe como sigue:
X(z) = -1--~-1 - 3 1 -z
4Z~'
-I
= 4z ---Z-I 1
Puesto que
Z[e- ak T senwkT] =
al identificar e?" = I Ycos wT=
+en este caso, se tiene wT= TTI3 y sen wT= J3 12. Por 10 que se obtiene
Z-I[ 1 - 0.5z~' ] 1-Z-I+Z-2
=
1-
2e- a T Z~I
+ e""
1k
cos 3
kTT
Z - I[
De este modo, se tiene
1 - z- 1 + z " 2
0.5Z-'
l)
3(1k -
l)
x(k) = 4 - 3 cos ( 0,
= 1,2,3, ...
k~O
x(O) = 0
x(1) = 1
x(2) = 3
x(3) = 6
x(4) = 7
x(5)
=
Observe que la transformada z inversa de X(z) tambien se puede obtener como sigue:
C_Z~~I+
2) +
2Z-I_1-_-z-~....,.~_I+-Z--"""2
1,2,3, ...
k~O
50
La transfarmada z
Capitulo 2
y Z
se tiene
x(k) =
,-I[ Z-I+ ]_
1_
Z
1
Aunque esta solucion se podria ver diferente a la que se obtuvo en un principio, ambas solucioncs son correctas y dan los mismos valores para x(k).
2 k k tt v'3(1 ) sen 3
k = 1,2,3" ..
0,
k:sO
Metodo de la integral de inversion. Esta es una tecnica util para la obtencion de la transformada z inversa. La integral de inversion de la transformada z X(z) est). dada por
Z-I[X(Z)]
(2-23)
don de C es un cireulo eon eentro en el origen del plano z tal que todos los polos de X(Z)z*-1 estan dentro de el. [Para obtener la ecuacion (2-23), vease el apendice B.] La ecuacion que da la transformadaz inversa en terminos de los residuos se puede obtener si se utiliza la teoria de la variable eompleja. Esta se puede obtener eomo sigue:
x(kT)
= x(k) =
m
K1
+ K 2 + ... + K;
(2-24)
donde K j , K2 , . Km denotan los residuos de X(z).I- 1 en los polos z., Z2' . . , Zm' respeetivamente. (Para obtener esta ecuacion, vease el apendice B.) Al evaluar los residuos, observe que si el denominador de X(z).I- 1 eontiene un polo simple en z = z, entonees el residuo K eorrespondiente esta dado por
(2-25)
Zj
)qX() Z k-I] Z
(2-26)
Observe que los valores de k en las eeuaeiones (2-24), (2-25) Y (2-26) son enteros positivos. Si X(z) tiene un eero de orden r en el origen, entonces Afzjz"" en la ecuacion (2-24) involucrara un eero de orden r + k - 1 en el origen. Si r ~ 1, entonees r + k - 1 ~ 0 para k ~ 0, y no hay polo en z = 0 en X(z).I I Sin embargo, si r:::; 0, entonees habra un polo en z = 0 para uno 0 mas valores positivos (no negativos) de k. En tal caso, es neeesaria la inversion por separado de la ecuacion (2-24) para eada valor de k. (Vease el problema A-2-9.) Debe observarse que el metodo de la integral de inversion, cuando se evalua por residuos, es una tecnica muy seneilla para obtener la transformada z inversa, siempre que X(z).I- I , no tenga polos en el origen, z = O. Sin embargo, si X(z).I- 1 tiene un polo simple 0 uno multiple en z = 0, el calculo se puede tornar tedioso y el metodo de expansion en fraeeiones pareiales podria ser mas seneillo de
:~:::"
2-5
La transformada z inversa
51
::.:~ar. Por otro lado, en ciertos problemas el enfoque de expansion en fracciones parciales puede ser - _:- laborioso. En esos casos es mas conveniente el metoda de la integral de inversion.
Ejernplo 2-16 Obtcngax(kT) cmpleando el rnetodo de la integral de inversion cuando X(z) esta dada por
X(Z)Zk-l
Para k = 0, 1,2, ... , X(Z)~-I tiene dos polos simples en z = la ecuacion (2-24), se tiene
1 Y Z = Z2
x(k) =
=
~l residua de (z
2 [
(1 _
D(: _:
K1 + K2
donde
. [ _ hm (z - eaT)
_e- akT
Por 10 tanto,
k
Ejemplo 2-17 Obtenga 1a transformada Z inversa de
= 0,1,2, ...
Para k = 0, 1,2, ... , X(Z).t'-1 tiene un polo simple en z = z 1= a partir de la ecuacion (2-24). se obtiene
1. Por 10 tanto.
x(k)
= =
,~l
[residuo de
)-::-(_+_l__a--';T"'-) en el polo Z = (z - 1 (z - e
K, + K 2
52
La transformada z
Capitulo 2
donde
K1 == [residuo en el polo simple z == e-ar] k+l] e-a(k+ljT aT) == z~~aT [ (z - e(z _ l)~(Z _ eaT) == (1 - e aTf
K2
== == ==
== lim z-e-I
1 - e aT
Por 10 tanto.
k == 0,1,2, ...
LA SOLUCION
Las ecuaciones en diferencias se pueden solucionar facilrnente mediante el uso de una computadora digital, siempre que se proporcionen los valores numericos de todos los coeficientes y los parametres. Sin embargo, las expresiones en forma cerrada parax(k) no se pueden obtener a partir de la solucion por computadora, excepto para casos muy especiales. La utilidad del metodo de la transformada z es que permite obtener la expresi6n en forma cerrada parax(k). Considere un sistema en tiempo discreto, lineal e invariante en el tiempo caracterizado por la siguiente ecuacion en diferencias:
(2-27)
donde u(k) y x(k) son la entrada y salida del sistema, respectivamente, en la k-esima iteraci6n. Al describir dicha ecuaci6n en diferencias en el plano z, se toma la transformada z de cada uno de los terminos en la ecuaci6n. Definase
Z[x(k)]
X(z)
Entonces x(k + I), x(k + 2), x(k + 3), ... y x(k - 1), x(k - 2), x(k - 3), ... se pueden expresar en terminos de X(z) y de las condiciones iniciales. Sus transformadas z exactas se obtuvieron en la secci6n 2-4 y se resumieron en la tabla 2-3 por conveniencia. A continuaci6n se presentan dos problemas como ejemplo de la soluci6n de ecuaciones en diferencias mediante el metoda de la transformada z.
Metodo de
en ecuociones
53
TABLA 2-3
Transformadaz
Z4
+ 4) + 3) + 2) + 1)
X(z) Z3
Z4 x(O)
Z3 x(l)
Z2 x(2)
- zx(3)
X(z) Z2
Z3 x(O)
Z2 x(l)
- zx(2)
X(z) -
Z2 X (0)
- zx(l)
X(z)
Z-2 X(z)
z- 3X(z)
Z-4 X(z)
+ 2) + 3x(k + 1) + 2x(k)
Z[x(k Z[x(k
= 0,
x(O) = 0,
x(l) = 1
Observe primero que las transformadas z dex(k + 2), x(k + I) Yx(k) estan dadas, respectivamente,
+ 2)] + 1)]
zX(z) - zx(O)
Z[x(k)]
Z2
= X(z)
+ 3zX(z) - 3zx(0) + 2X(z) = 0
z =_z z + 1 z_ z
AI tomar las transformadas z de ambos miembros de la ecuaci6n en diferencias dada, se obtiene X(z) Z2 X (0)
- zx(l)
+ 3z + 2 - (z + 1)(z + 2)
1
+2
= 1
Z-l -
1 1 + 2z- 1
Si se observa que
Z-I[_I_] (-I)k
1+
Z-l
Ejemplo 2-19 Obtenga la soluci6n de la siguiente ecuaci6n en diferencias en terminos de x(O) y x( I):
x(k
+ 2) + (a + b)x(k + 1) + abx(k)
= 0
S4
La transformada z de esta ecuaci6n en diferencias esta dada por
La transformada z
Capitulo 2
o
[Z2 + (a + b)z + ab]X(z) = [Z2 + (a + b)z]x(O) + zx(l)
Al resolver esta ultima ecuaci6n paraX(z) se obtiene
--=
X(z)
x(
k)
a~b
z +a
(z + a)2
--'---;- + 1 + az 1
La transformada z inversa de X(z) da como resultado
x(O)
"----,---'---~.;;--
a= b
z tiene el mismo prop6sito para sistemas en tiempo discreto, lineales e invariantes en el tiempo que
la transformada de Laplace para sistemas en tiempo continuo, lineales e invariantes en el tiempo. EI metodo por computadora para el anal isis de datos en tiempo discreto da como resultado ecuaciones en diferencias. Con el metodo de la transformada z, las ecuaciones en diferencias lineales e invariantes en el tiempo se pueden transformar en ecuaciones algebraicas. Esto facilita el anal isis de la respuesta transitoria de los sistema de control digital. Tarnbien, el metodo de la transformada z
ss
el uso de las tecnicas convencionales de analisis y diseflo disponibles para sistemas de :: -:~ol analogicos (en tiempo continuo), tales como la tecnica dellugar geometrico de las raices. El -=--~Jisis y diseflo mediante la respuesta en frecuencia se puede lIevar a cabo si se convierte el plano z ~- -e I plano w. Asimismo, la ecuacion caracteristica transformada en el dominio de z permite aplicar una :~..:-eba sencilla de estabilidad, tal como el criterio de estabilidad de Jury. Estos temas se estudiaran :::l detalle en los capitulos 3 y 4.
n.
Z[GkJ =
2: Gk Z-k
k~O
(I - GZ-1)-1
- G)-I z
= (zl
k
Observe que G se puede obtener tomando la transformada z inversa de (1- Gz-1 Esto es,
r'
(zl - Gt l z,
Ejemplo A-2-2 Obtenga la transformada z de Ii? Solucion Por definicion, la transformada z de Ii? es
Z[e]
= z-I(1
(1 - Z-I)3 Aqui se ha empleado la expresion en forma cerrada (I - z-lt J para la serie infinita involucrada en el problema. (Vease el apendice B.)
Ejemplo A-2-3 Obtenga la transformada z de ka H mediante dos metod os. Solucion Metoda I. Por definicion, la transfonnada z de kak- I esta dada por
Z[kak-1J
2: ka k- I Z-k
k~O
Z-I
56
La transformada z
Capitulo 2
Metoda 2. La expresi6n mediante la sumatoria para la transformadaz de ka::' tambien se puede escribir como sigue:
Z[ka k- I]
ka" Z-k
Z-I
k~O
=! i: k(~)-k
a k-O a
Iy
(1 - az 1)2
Z[ X(h)] = 1 _1 _IX(Z)
h~O
Z[I,IX(h)] h-O
~-I_IX(Z) Z
(2-28)
L x(k)
k=O
= limX(z)
z-l
Z [ 't:/(h)
donde I
~
= 1_
1
Z-I
(2-29)
k - J.
Solucion
Defina
k
y(k) =
de modo que
L x(h),
h~O
= 0,1,2, ...
Z-I
y(z) = X(z)
1 y(z) = 1 _ Z-IX(Z)
o
Capitula 2
57
ZLtX(h)] =Z[y(k)]
y
= Y(z) = 1 _\_IX(Z)
limy(k)
k----+x
= k_x lim
[
k
X(h)]
h=O
= lim z_1
L x(h)
h=O
L x(k)
k=O
= limX(z)
z-1
se obtiene
;-1
Puesto que
k = i, i + 1, i + 2, ...
Z [ Lx(h)
h=,
Ejemplo A-2-5 Obtenga la transformada z de la curva x(t) que se muestra en la figura 2-6. Suponga que el periodo de muestreo T es 1 seg.
Solucien
x(O) x(l)
=0
=
0.25
x(2) = 0.50
x(3) = 0.75
x(k)=I, k=4,5,6, ...
58
x(t)
La transformada z
Capitulo 2
1.0
0.5
X(z)
= 2: X(k)Z-k
k-O
Z-4
Z-5
Z-6
+ ...
Z-I
Z-2
Z-3
Z-4
4(1 - z I)
=
4 4
Ht -
4)1(t - 4)
donde 1(I - 4) es la funci6n escal6n unitario que se presenta en 1= 4. Puesto que el periodo de muestreo es T = 1 seg, la transformada z de x(t) tarnbien se puede obtener como sigue:
4 (1 -
z 1)2
4 (1 - Z If
X(z) = (z - 2)\z - 1)
Obtenga la transformada z inversa de X(z). Solucion Se expandira X(z)/z en fracciones parciales como sigue:
--=
X(z)
z
2z 2 + 1 9 3 = - -1 + - (z - 2)2(Z - 1) (z - 2f z - 2 z - 1
Capitulo 2
59
Entonces
__ 1---,. + __ 3_ 1 - 2z I 1 - Z-I
Las transformadas z inversas de los terminos individuales dan
y por tanto
k
Ejemplo A-2-7 Obtenga la transformada z inversa de
= 0,1,2'00'
X(z)
Solucion
= (z
z+2 - 2)Z2
X(z)
=Z
1
_
2-
Z2 -
lIz-I ~ = 1 _ 2z
I -
Z-2 - Z-I
[Observe que en este ejemplo, X(z) involucra un polo doble en z = O. Por 10 que la expansion en fracciones parciales debe incluir los terrninos I/(z2) y liz.] Refiriendose a la tabla 2-1, se encuentra la transforrnada r inversa de cada uno de los terminos de esta ultima ecuacion, Esto es,
'-I[
Z-I
]
1
1 - 2z-
{20,
0, 0,
k l - ,
Z-I[Z-2] =
Z-I[Z-I]
{I, = {I,
0x(k)
= 1-
AI rescribir, sc tiene
22k - 1
a- a = 0, a- 1 = 0, 1 - a= 1 a- a ~ 2
-
k- l ,
x(k)
= 1,
a,
2k - 1 ,
k = 0,1 k = 2
k=3,4,5, ...
Para verificar este resultado, se pod ria aplicar el metoda de la division directa a estc problema. Notando quc
60
z+2 - 2)Z2
La transform ada z
Capitulo 2
X(z)
= (z
=
= Z-2
Z-2 + (23- I)Z-3 + (24- I)Z-4 + (25- I)Z-5 + (26- 1)Z-6 + '"
se encuentra que
x(k) =
1
X(z)
0, 1, 2k -
k = 0,1
1,
= (1
_ Z-I)3
Solucion La transforrnada z inversa de z-2/(1 - Z-I)3 no esta disponible en la mayoria de la tablas de transforrnadas z. Sin embargo, es posible escribir laX(z) dada como una suma de transforrnadas z que, por 10 regular, se encuentran en las tablas de transformadas z. Puesto que el denominador de X(z) es (1 - Z-I)3 Yla transforrnada z de k? es Z-I(1 + Z-I)/( 1 - Z-I)3, rescribase X(z) como
X(z)
= (1 _
Z-2 Z-I)3
Z-I (1 - z 1)3
o
Z-2 _ z-l(l + Z-I) (1 - z 1)3 - (1 - z 1)3
a partir de 10 cual se obtiene la siguiente expansi6n en fracciones parciales:
Z-2
(l - Z 1)3
= 2 (1 - z
Las transforrnadas z de los dos terminos del segundo miembro de esta ultima ecuaci6n se pueden encontrar en la tabla 2-1. Asi,
x k -
- k - 2 k k - 1),
1 (
= 0,1,2, ...
Se debe observar que si laX(z) dada se expande en otras fracciones parciales, entonces la transformada z inversa no se podra obtener. Como un enfoque alternative, la transforrnada z inversa de X(z) podra obtenerse mediante el metodo de la integral de inversi6n. Primero, observe que
k-I Zk
X(z)z
= (z _ 1)3
Por 10 tanto, para k = 0, 1,2, ... , X(z)z k-I, tiene un polo triple en z = 1. Con referencia a la ecuaci6n (2-24), se tiene
x(k)
= [ residuo de (z
Zk
- 1)
en el polo triple z v z.
:c -_ : :2
61
= "2k(k - 1),
k = 0,1,2, ...
10 X(z) = (z - 1)(z - 2)
Solucion Observe que
lOz k X(Z)Zk-1
1
= (z
10
- 1)(z - 2)
X ( z) z
k=O
Por 10 tanto, para k = 0, X(z)z k-I tiene tres polos simples, z = Zl = I, Z =::2 = 2 Y:: =::3 = O. Para k = 1.2. 3, ... : sin embargo, X(Z)~-I tiene solo dos polos simples, :: =::1 = 1 y:: =::2 = 2. Por 10 tanto. se debe considerar x(O) y x(k) (donde k = I, 2. 3.... ) por separado. Para k = O. Para este caso, con referencia a la ecuacion (2-24), se tiene
x(O)
=
=
=1 ]
+ K, + K 3
donde
= lim [z (z Z~O
=5
62
Por 10 tanto,
La transformada z
Capitulo 2
x(O) = K 1 + K 2 + K 3 = -10 + 5 + 5 = 0
Para k = 1, 2, 3, . . .. Para este caso, la ecuaci6n (2-24) se convierte en
= K 1 + K2
donde
= I]
l )
x(k) = K 1 + K 2 = -10 + 1O(2k- 1 ) = 1O(2k- 1 - 1), k = 1,2,3'00' Por 10 tanto, la transformada z inversa de la X(z) dada se puede escribir como x(k) = {
~O(2k-1 ~
1),
k=O
k = 1,2,3, ....
0 es
k = 0,1,2, ...
Bo(k) =
Ejemplo A-2-10 Obtenga la transformada z inversa de
{I,
0,
X( ) = z(z + 2) z (z _ 1)2
empleando los cuatro metodos que se presentaron en la secci6n 2-5. Solucion Metoda 1: metoda de la division directa.
Z-I:
(2-30)
x(O) = 1
Problemas de ejernplos
y soluciones
63
xCI) = 4
x(2) = 7
x(3) = 10
Jr( ) z =
Z2 Z2 -
+ 2z 2z + 1
Por 10 tanto. la transforrnada r inversa de X(.:) se puede obtener con MATLAB como sigue: Defina
num = [1 den = [1
2 0]
-2
1]
Si se desean los valores de x(k) para k = O. 1.2..... 30, entonces introduzca la entrada delta de Kronecker corno siguc:
u = [1
Luego introduzca el comando
zeros(l,30)]
x = filter(num,den,u)
Vease el programa para MATLAB 2-3. [La pantalla mostrara la salidax(k) desde k = 0 hasta k = 30.] (Los calculos de MATLAB comienzan desde la columna 1 y terminan hasta la columna 31. en lugar de ernpe-
x=
columns 1 through 12
4
Columns 13 through 24
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
Columns 25 through 31
76
7')
a2
a5
aa
'J]
64
La transformada z
Capitulo 2
zar en la columna y terrninar en la 30.) Los valores dex(k) dan la transforrnadaz inversa deX(z). Esto es,
x(O) = 1
x(1) = 4
x(2) = 7
x(30) = 91
Metoda 3: metoda de la expansion en fracciones parciales. parciales: Se expande X(z) en las siguientes fracciones
1
Z -
k=O
k = 1,2,3, ...
k = 0,1,2, ...
k
obtenemos
1,2,3, ...
ksO
x(O)
=
1
k = 1,2,3, ...
x(k) = 3k + 1,
x(k)
= 3k +
1,
0,1,2, ...
x(O) = 1
x(k) = 4 + 3(k - 1) = 3k + 1,
o
k = 1,2,3, ...
x(k) = 3k + 1,
= 0,1,2, ...
que es eJ mismo resultado que se obtuvo mediante la expansi6n de X(z) en otras fracciones parciales. [Recuerde que X(z) se puede expandir en diferentes fracciones parciales, pero el resultado final para la transforrnada z inversa es el mismo.] Metoda 4: metoda de la integral de inversion. Primero, observe que
k-I
X( Z ) Z
= (z + 2)Zk (z _ 1)2
Para k = 0, 1,2, ..., X(Z)~-I tiene un polo doble en z = I. Por 10 tanto, con referencia a la ecuaci6n (2-24),
- -_ : --::I:
65
x(k)
....... ::' ..
= L. reslduo de
= 1]
= lim
z-l
d [(z + 2)Zk] dZ
k = 0,1,2, ...
= 3k + 1,
2x(k) - 2x(k - 1)
'::0nde x(k) = 0 para k < 0 y
+ x(k - 2)
= u(k)
U(k)={I, 0,
Soluci6n
k = 0,1,2, ...
k<O
1
X(z) = 1 Z-l
1
2 - 2z
1
Z3
+Z
(z - 1)(2z2
2z
+ 1)
Z-l
z
(z)
-Z2
-
+z
2z + 1
-1 +
=z
_ 1 + 2z2
=1-
Z-l
+ 2 - 2z
+Z 2
N6tese que los dos polos involucrados en el termino cuadratico en esta ultima ecuacion son complejos conjugados. Por 10tanto, X(z) se rescribe como sigue:
1
X(z) = 1 _
Z-l -
2: 1 -
Refiriendose a la formula de las transformadas z de las funciones coseno y seno amortiguados. se identifica
e?" = 0.5 Ycos wT = 11J2 para este problema. Por 10 tanto, se obtiene que wT = 7T/4. sen wT = 1I..j2,
Y " = II J2. Entonces la transformada z inversa de X(z) se puede escribir como .
x(k)
= 1-
k - 0 1 2 - , , , ...
66
La transformada z
Capitulo 2
= = =
0.3679u(k + 1) + 0.2642u(k)
u(k)
0,
k < 0
u(O) = 1 u(l)
=
0.2142
k=3,4,5, ...
X(z) -
Z2 X (0)
= 0.3679u(0) = 0.3679
x(l) = 0.3679, u(O) = 1
x(O)
en la ecuacion (2-31), se tiene que
Z2
0,
X(z)
Z2 -
67
Por tanto,
X (Z )
_
-
ZZ _
0.3679z- 1
+ 0.3430z- z - 0.02221z- 3
1 - 1.3679z
1
0.05659z- 4
z
+ 0.3679z +
Z-4
= 0.3679z- 1 + 0.8463z- z +
Z-3
+ z-s + " .
= = =
0.3679 0.8463
k=3,4,5, ...
x(k) = 1,
Ejemplo A-2-13 Considere la ecuaci6n en diferencias
.J5
1.6180.
Solucion AI tomar Ia transformada z de esta ecuacion en diferencias, se obtiene
ZZ
X(z) -
ZZ x(O)
+ X(z)
X(z)
= ZZ x(O)
=
~ zx(l) - zx(O)
z - z - 1
Al sustitur los datos iniciales x(O) = 0 y x( I) 1 en esta ultima ecuaci6n, se tiene
x(k)
= 0,1,2, ...
Observe que aunque esta ultima ecuaci6n involucra a .J5, las raices cuadradas del segundo miembro de esta ultima ecuaci6n se cancelan, y los valores de x(k) para k = 0, 1,2, ... resultan ser enteros positivos.
68
La transformada z
Capitulo 2
EI valor limite de x(k + I )/x(k) a medida que k tiende a infinito se obtiene como sigue:
1 + VS)k+l _ (1 _ VS)k+l
e\vsr -e vsr
0
1
!( 1 - J5 )/2[ <
I, lim
k~oo
(1 - VS)k--.
2
Por 10 tanto,
1+ . x(k + 1) _ . ( 2
k~oo
vsr+
VS)k
hm
x (k)
- k~oo ( 1 + hm
_ 1+
--2
VS _ 2 - 1.6180
Ejemplo A-2-14 Con referencia al problema A-2-13, escriba un programa para MATLAB a fin de generar la serie de Fibonacci. Desarrolle la serie de Fibonacci hasta k = 30.
Solucion La transformada z de la ecuacion en diferencias
X(z) -
Z2 X (O )
+ X(z)
se tiene que
= 0 y x( 1) = I,
z
X(z)
= z2
- z - 1
La transformada z inversa de X(z) dara la serie de Fibonacci. Para obtener la transformadaz inversa deX(z), obtenga la respuesta de este sistema a la entrada delta de Kronecker. EI programa para MATLAB 2-4 dara como resultado la serie de Fibonacci.
% - - - Serie de Fibonacci - - -
% ***** La serie de Fibonacci se puede generar como la % respuesta de X(z) a la entrada delta de Kronecker, donde % X(z) = z/(z"2 - z - 1) *****
num = [0 1 0]; den = [1 -1 -1]; u = [1 zeros(1,30)]; x = filter(num,den,u)
69
x=
Columns 1 through 6
o
Columns 7 through 12
13
21
34
55
89
75025
121393
196418
317811
514229
=0
y la columna 31 corresponde a k
= 30. La serie de
x(O) = 0
x(l) = 1
x(2) = 1 x(3)
=2
x(4) = 3 x(5) = 5
x(k
+ 2) + axik + 1) + (3x(k) = 0
(2-32)
70
La transformada z
Capitulo 2
~ =
-2
'"
Figura 2-7 Region del plano a{3 en la que la serie solucion de la ecuacion (2-32), sujeta a las condiciones iniciales, es lin ita.
'" + ~ =-1
-1
Encuentre las condiciones sobre ex y (3 para las cuales la serie solucion de x(k) para k = 0, 1,2, ... , sujeta a las condiciones iniciales, es finita.
Solucion
Definasc
a = a + b,
(3 = ab
Entonces, con referencia al ejemplo 2-19, la solucion x(k) para k = 0, 1,2, ... puede darse mediante
x(k)
a of. b
La serie solucion x(k) para k = 0, I, 2, ... , sujeta a las condiciones iniciales x(O) y x( I), cs finita si los valores absolutos de a y b son menores que la unidad. Asi, sobre el plano ex{3, se pueden localizar tres puntos criticos:
ex = 2,
{3=1
a = -2, a
f3 = 1 f3 = -1
= 0,
EI interior de la region limitada por las lineas que conectan a estos puntos satisface la condicion lal < I, Ibl < I. Las lineas de la frontera pueden darse por {3 = I, ex - {3 = I Y ex + {3 = -I. Vease la figura 2-7. Si el punto (ex, (3) cae dentro de la region triangular sombreada, entonces la serie solucion x(k) para k = 0, I, 2, ... , sujeta a las condiciones iniciales x(O) y x( I), es fin ita.
PROBLEMAS
Problema 8-2-1 Obtenga la transform ada z de
x(t) =
dondc a es una constante,
! (1 a
e- at )
===')02
Problemas
71
re-
x(k)
Suponga que x(k)
=
9k(2k -
2k + 3,
0,1,2, ...
0 para k < O.
x(k)
donde a es una constante. Problema 8-2-6 Muestre que
2: a"
h-O
Z [k(k - 1)ak-2] =
Z [k(k - 1) .. (k - h + l)ak-h]
Problema 8-2-7 Obtenga la transformada z de la curva x(t) que se muestra en la figura 2-8.
x(t}
1.0
0.5
o
Figura 2-8 Curva x(t).
X(z)
1 + 2z + 3Z;4+ 4z + 5z
72
Problema 8-2-9 Encuentre la transformada z inversa de
La transformada z
Capitulo 2
Use 1) el rnetodo de expansion en fracciones parciales y 2) el metodo de MATLAB. Escriba un programa para MATLAB para encontrar x(k), la transformada z inversa de X(z).
X(z) = 1
\Z-1 -z
-lZ-2
:::::p;tulo 2
Problemas
73
+ 2) - 1.3x(k + 1) + OAx(k)
= u(k)
0 y x(k)
0 para k < O. Para la funci6n de entrada u(k), considere los siguientes dos
u(k) = { y
~:
u(O) = 1
u(k) = 0,
kf.O
Resuelva este problema tanto de manera analitica como por computadora con MATLAB.
+ 2) - x(k + 1) + 0.25x(k)
= u(k
+ 2)
u(k)
= 1,
= 0,1,2, ...
Resuelva este problema tanto de manera analitica como por computadora con MATLAB.
+ 2) - 1.3679x(k + 1) + 0.3679x(k)
u(k) = 0, k
= 0.3679u(k
+ 1) + 0.2642u(k)
<0
u(O) = 1.5820
u(l) = -0.5820
u(k)
= 0,
= 2,3,4, ...
Determine la salida x(k). Resuelva este problema tanto de manera analitica como por computadora con MATLAB.
3
Anal;s;s en el plano z de s;stemas de control en t;empo d;screto
3-1 INTRODUCCION
El metodo de la transformada z es particularmente util para analizar y disefiar sistemas de control en tiempo discreto, lineales e invariantes en el tiempo, de una entrada y una salida. En este capitulo se presenta el material introductorio necesario para el analisis y disefio de sistemas de control en tiempo discreto en el plano z. La principal ventaja del metodo de la transformada z es que esta habilita al ingeniero para aplicar los metodos de diseno convencionales de sistemas en tiempo continuo a sistemas en tiempo discreto que pueden ser en parte en tiempo discreto y en parte en tiempo continuo. A 10 largo de este libro se supone que la operaci6n de muestreo es uniforrne; esto es, s610existe una tasa de muestreo en el sistema y el periodo de muestreo es constante. Si un sistema de control en tiempo discreto incluye dos 0 mas muestreadores en el sistema, se supone que los muestreadores estan sincronizados y tienen la misma tasa de muestreo 0 frecuencia de muestreo.
Orgunizacion del capitulo. La organizaci6n de este capitulo es la siguiente. En la secci6n 3-1 se dan los comentarios introductorios. La seccion 3-2 presenta un metodo para tratar la operaci6n de muestreo como una representaci6n matematica de la operaci6n de tomar muestras x(k7) a partir de una sefial en tiempo continuo x(t) mediante modulaci6n con impulsos. Esta secci6n incluye el calculo de las funciones de transferencia del retenedor de orden cero y del retenedor de primer orden. En la secci6n 3-3 se trata el metodo de la integral de convoluci6n para obtener la transformada z. EI tema principal de la secci6n 3-4 es la reconstrucci6n de la sefial original en tiempo continuo a partir de la sefial muestreada. Basandose en el hecho de que la transformada de Laplace de la serial muestreada es peri6dica, se presenta el teorema de muestreo. En la secci6n 3-5 se estudia la funcion de transferencia pulso. Tambien se analiza el modelado matematico de los controladores digitales en terrninos de las funciones de transferencia pulso. La secci6n 3-6 trata la realizaci6n de control adores y filtros digitales.
74
75
stuestreo mediante impulsos. Se considerara un muestreador ficticio comunmente lIamado :-"" ::':or mediante impulsos. La salida de este muestreador se considera como un tren de impulsos : :r-;;:-:za en t = 0, con el periodo de muestreo igual a Ty la magnitud de cada impulso igual al valor ,,~-;; ::do de la sefial en tiempo continuo en el instante de muestreo correspondiente. En la _ . .,1"":: : -: se muestra un diagrama de un muestreador mediante impulsos. [Se supone que x(t) = 0 para : :J _esto que, en forma matematica, un impulso esta definido como una funcion que tiene una , :_J .nfinita con duraci6n cero, esto se representa graficamente mediante una flecha con una am_1IIIUJ'.l-- ':_",= representa la magnitud del impulso.) _..: salida muestreada mediante impulsos es una secuencia de impulsos, con la magnitud de cada _ ",::=ual al valor de x(t) en el instante de tiempo correspondiente. [Esto es, en el tiempo t = kT, el -: ;;s XI k7)8(t- k7). Observe que 8(t- k7) = 0 a menos que t> kT] Se ernpleara la notacion x'(r) -;;:~",=s"'ntar la salida muestreada mediante impulsos. La serial rnuestreada x'(r), un tren de impulse : _",de representar mediante una sumatoria infinita
x* (t) =
L x(kT)5(t k=O
kT)
(3-1)
L 5(t k=O
kT)
J:: j",1 muestreador es igual al producto de la sefial en tiempo continuo de entrada x(t) por el :i1pulsos unitarios 8At). En consecuencia, el muestreador se puede considerar como un _ _"- .':':2~ con la entrada x(t) como la sefial moduladora y el tren de impulsos 8/ (t) como la portadora, -.n!": se :-:1Uestra en la figura 3-2.
XO"'hlliL
I
..
x(t)
_____-J/
)(151
_ ..
X"ls)
Figura 3-1
76
Capitulo 3
x(r) Serial
moduladora
X*(s)
= .;t[x*(t)] = x(O).;t[o(t)] + x(T).;t[o(t + x(2T).;t[o(t - 2T)] + ... S S = x(O) + x(T)e- T + x(2T)e- 2T + ...
s = L x(kT)e- kT k=O
- T)]
(3-2)
s = -lnz
entonces la ecuaci6n (3-2) se convierte en
1 T
X*(s)1
s=(lIT) Inz
= k=O x(kT)z-k
(3-3)
El segundo miembro de la ecuaci6n (3-3) es exactamente el mismo que el segundo miembro de la ecuaci6n(2-1): es la transfonnadaz de la secuenciax(0),x(1),x(21), ... , generada a partir dex(t) en t = kT, donde k = 0, 1,2, .... Por tanto se puede escribir
= X(z)
(3-41
Observe que la variable z es una variable compleja y T es el periodo de muestreo. [Se debe enfatizar que lanotaci6nX(z) no significaX(s) reemplazando s por z, sino que X'(s = T-1lnz).]
5e::i6n 3-2
y retenci6n de datos
77
Resumen. Se resumirajustamente 10 que se acaba de establecer. Si la sefial en tiempo continuo () se muestrea mediante impulsos en forma periodica, la seftal muestreada se puede representar de manera matematica mediante
~-,
x*(t)
= 2: x(t)(j(t
k=O
- kT)
En el muestreador mediante impulsos se puede pensar que el interruptor se cierra instantaneamente cada periodo de muestreo Ty genera impulsos x(kT)o(t - kT). Dicho proceso de muestreo se conoce como muestreo mediante impulsos. EI muestreador mediante impulsos se presenta por conveniencia matematica; este es un muestreador ficticio que no existe en el mundo real. La transformada de Laplace de la senal muestreada mediante impulsos x*(t) ha mostrado ser la misma que la transformada z de la sefial x(t) si e'' se define como z, 0 e" = z.
Circuitos para la retenclon de datos. En un muestreador convencional, un interruptor se cierra cada periodo de muestreo Tpara admitir una sefial de entrada. En la practica, la duracion del muestreo es muy corta en comparacion con la constante de tiempo mas significativa de la planta. Un muestreador convierte una sefial en tiempo continuo en un tren de pulsos que se presenta en los instantes de muestreo t> 0, T, 2T, ... , donde Tes el periodo de muestreo. (Observe que entre dos instantes de muestreo consecutivos el muestreador no transfiere informacion. Dos sefiales cuyos respectivos valores en los instantes de muestreo son iguales daran como resultado la misma senal muestreada.) La retencion de datos es un proceso de generacion de una sefial en tiempo continuo h(t) a partir de una secuencia en tiempo discreto x(k7). Un circuito de retencion convierte la sefial muestreada en una sefial en tiempo continuo, que reproduce aproximadamente la sefial aplicada al muestreador. La serial h(t) durante el intervalo de tiempo kT:5:t < (k + 1) T se puede aproximar mediante un polinomio en T como sigue: h(kT + T)
= an r"
an-I Tn-I
+ ... + al T +
0
ao
(3-5)
donde 0:5: T < T. Observe que la sefial h(kT) debe ser igual ax(kT),
h(kT)
x(kT)
h(kT +
T)
= an r" +
an-I Tn-I
+ ... + al T + x(kT)
(3-6)
Si el circuito de retencion de datos es un extrapolador polinomial de n-esimo orden, se conoce como retenedor de n-esimo orden. De este modo, si n = 1, se denomina retenedor de primer orden. [EI retenedor de n-esimo orden emplea los n + I datos discretos anteriores x((k - n)7), x((k - n + I )T), ... , x( k7) para generar una sefial h(kT + T).] Debido a que un retenedor de alto orden utiliza las muestras anteriores para extrapolar una serial en tiempo continuo entre el instante de muestreo presente y el siguiente, la exactitud en la aproximacion de la sefial en tiempo continuo se mejora a medida que el numero de muestras anteriores utilizadas se incrementa. Sin embargo, esta mejoria en la exactitud se obtiene a costa de un tiempo de retraso mayor. En sistemas de control en lazo cerrado, cualquier tiempo de retardo adicional en el lazo decrementara la estabil idad del sistema y en algunos casos podria aun causar la inestabilidad del mismo. EI retenedor de datos mas sencillo se obtiene cuando n = 0 en la ecuacion (3-6), esto es, cuando
78
Capitulo 3
","~
k T ,...--------,
-------'/_---~
x(t)
Muestreador
x(kT)
Retenedorde ordencera
hIt)
Figura 3-3
(3-7)
donde 0 ::; 'T < Ty k = 0, 1,2, .... La ecuacion (3-7) implica que el circuito retiene la amplitud de la muestra de un instante de muestreo al siguiente. Dicho retenedor de datos se conoce como retenedor de orden cera, 0 sujetador, 0 generador de la sefial de escalera. La salida del retenedor de orden cera es una funcion escalonada. En este libra, a menos de que se indique otra cosa, se supone que el circuito de retencion es de orden cera. Se vera posteriormente que la funcion de transferencia G, del retenedor de orden cero esta dada mediante
Retenedor de orden cero. En la figura 3-3 se muestra un muestreador y retenedor de orden cera. La sefial de entradax(t) se muestrea en instantes discretos y la serial muestreada se pasa a traves del retenedor de orden cera. EI circuito del retenedor de orden cero suaviza la sefial muestreada para producir la sefial h(t), la cual es constante desde el ultimo valor muestreado hasta que se puede disponer de la siguiente muestra. Esto es,
h(kT + t)
x(kT),
(3-8)
Se obtendra un modelo matematico de la cornbinacion de un muestreador real y de un circuito de retencion de orden cera, como el que se muestra en la figura 3-4a). A partir del hecho de que la integral de una funcion impulso es una constante, se puede suponer que el retenedor de orden cero es un integrador, y la entrada al circuito de retencion de orden cero es un tren de impulsos. Entonces un modelo matematico para el muestreador real y el retenedor de orden cero se puede construir como se muestra en la figura 3-4b), donde GhO(s) es la funcion de transferencia del retenedor de orden cera y x' (t) es la sefial muestreada mediante impulsos de x(t).
~
T
a)
h,(t)
~X'(t)
liT X'(s)
b)
Figura 3-4
::ecci6n 3-2
79
~a
Considere el muestreador y el retenedor de orden cero que se muestra en la figura 3-4a). Suponque la sefial x(t) es cera para t < O. Entonces la salida hj(t) esta relacionada con x(t) como sigue:
+ x(T)[l(t
- T) - l(t - 2T)]
L x(kT)[1(t
k~O
- kT) - l(t - (k
+ l)T)]
(3-9)
- kT)]
=-
e- kTs
S
~[hl(t)]
= Hj(s) = L
1
=
k~O
e
S
-Ts
L x(kT)e- kTs
k=O
cc
(3-10)
Despues, considere el modelo maternatico que se muestra en la figura 3-4b). La salida de este modelo debe ser la misma que la del retenedor de orden cera real, 0
~[h2(t)] =
H2(s) = Hj(s)
De este modo,
(3-11)
A partir de la figura 3-4b), se tiene
(3-12)
Debido a que
X*(s) =
la ecuaci6n (3-1 I) se puede escribir como
L x(kT)e- kTs
k=O
H 2(s) =
1-
e"
X*(s)
(3-13)
Al comparar las ecuaciones (3-12) y (3-13), se ve que la funci6n de transferencia del retenedor de orden cera esta dada por
Observe que, de forma matematica, el sistema que se muestra en la figura 3-4a) es equivalente al que se muestra en la figura 3-4b) desde el punto de vista de la relaci6n entrada-salida. Esto es, un rnuestreador real y retenedor de orden cera se puede reemplazar por un sistema en tiernpo continuo
80
Capitulo 3
matematicamente equivalente, que consiste de un muestreador mediante impulsos y una funci6n de transferencia (1 - e-lI)1s. Los dos procesos de muestreo se distinguiran (como se aprecia en la figura 3-4) por la manera en la que se dibujan los interruptores para el muestreo.
Funcion de transferencia de un retenedor de primer orden. Aunque los retenedores de primer orden no se utilizan en sistemas de control, vale la pena ver cual podria ser su funci6n de transferencia. Se mostrara que la funci6n de transferencia del retenedor de primer orden esta dada por
Gh,(s) =
-se-TJ Ts ; 1
(3-14)
Ahora se obtendra la ecuaci6n (3-14). Se ha establecido que la ecuaci6n (3-6) describe la salida de un circuito de retenci6n de n-esimo orden. Para el retenedor de primer orden, n = 1. Sustituyase n = 1 en la ecuaci6n (3-6). Entonces se tiene
h(kT
+ T) = a, T + x(kT)
= x((k - l)T)
- l)T)
(3-15)
la constante
G,
a, =
+ T) = x(kT) + x(kT)
X~(k
- l)T) T
(3-16)
donde 0 ~ T < T. EI proceso de extrapolaci6n del retenedor de primer orden esta basado en la ecuaci6n (3-16). La sefial de salida en tiempo continuo h(t) que se obtiene al utilizar el retenedor de primer orden es una senal lineal por secciones, como se muestra en la figura 3-5.
o
x(t)
2T
3T
-T
2T 3T
h(t)
---......;/----.-1
Figura 3-5
x(kT)
C~:: :;n
3-2
8.
-------
Para obtener la funci6n de transferencia del circuito de retenci6n de primer orden, es convenien.e suponer una funci6n sencilla para X(/). Por ejemplo, una funci6n escal6n unitario, una funci6n ~;:,ulso unitario 0 una funci6n rampa unitaria sedan buenas elecciones para xu). Suponga que se elige una funci6n escal6n unitario como X(/). Entonces, para el muestreador real :- retenedor de primer orden que se muestra en la figura 3-6a), la salida h(/) del retenedor de primer : rden consiste en lineas rectas que son extrapolaciones de los dos valores muestreados precedentes. :"'a salida h(!) se muestra en el diagrama. La curva de salida h(/) se puede escribir como sigue: h(t)
= 1+T
( I)
=
l(t) -
1- T --r l(t Ts 2
Ts
T) - l(t - T)
H(s)
(l + _1_) __l_
s Ts2
e - rs _le-TS
S
1 - es
+ 1 - e- rs Ts 2
(3-17)
1= XlknluL
o _________ t/
x(tl
h(t)
2T
x(kT)
3T
t
Retenedorde primer orden
-T
2T 3T
h(tl
a)
hIt)
uu. ____---"t/
o o
T 2T 3T
t
1=
x(t)
-T
2T 3T
-.t
hit)
l)r
x1t)
b)
Figura 3-6 a) Muestreador real en cascada con un retenedor de primero orden: b) modelo matematico que consiste en un muestreador mediante impulsos y G",(s).
,, "
....
82
En la figura 3-6b) se muestra un modelo matematico del muestreador real en cascada con el retenedor de primer orden que se observa en la figura 3-6a). EI modelo maternatico consiste en un muestreador mediante impulsos y Gh1 la funci6n de transferencia del retenedor de primer orden. La sefial de (S), salida de este modelo es la misma que la salida del sistema real. Por tanto, la salida H(s) esta dada tambien por la ecuaci6n (3-17). La transformada de Laplace de la entradax'(r) al retenedor de primer orden Gh1(S) es
X*(s) =
k=O
L 1(kT)e-
k Ts
1 1- e
Ts
Por tanto, la funci6n de transferencia Gh1(S) del retenedor de primer orden esta dada por
='e _/-T'Y
TS
; 1
Observe que un muestreador real en combinaci6n con un retenedor de primer orden es equivalente a un muestreador mediante impulsos con una funcion de transferencia (1 - e-E?(Ts + 1)/(7.1'2). De manera similar, se pueden obtener las funciones de transferencia de retenedores de alto orden mediante el procedimiento presentado. Sin embargo, puesto que los circuitos de retenci6n de alto orden (n 2': 2) no son practicos desde el punta de vista del retraso (el cual puede causar la inestabilidad del sistema) y los efectos de ruido, no se obtendran sus funciones de transferencia. (EI retenedor de orden cero es el mas sencillo y el que se utiliza con mayor frecuencia en la practica.)
Resumen.
impulsos.
1.
Un muestreador real toma peri6dicamente muestras de la sefial de entrada y produce una secuencia de pulsos como salida. Mientras que la duraci6n del muestreo (ancho del pulso) del muestreador real es muy pequefia (pero nunca llegara a ser cero), la suposici6n de que el ancho es cero, 10 cual implica que la secuencia de pulsos se convierta en una secuencia de impulsos cuyas magnitudes son iguales a la seftal en tiempo continuo en los instantes de muestreo, simplifica el analisis de los sistemas en tiempo discreto. Dicha suposici6n es valida si la duraci6n del muestreo es muy pequefia comparada con la constante de tiempo mas significativa del sistema y si un circuito de retenci6n se conecta a la salida del muestreador. Cuando e" se transforma en z, el concepto de muestreo mediante impulsos (el cual es un proceso puramente matematico) nos posibilita realizar el analisis de sistemas de control en tiempo discreto que involucran muestreadores y circuitos de retenci6n mediante el metodo de la transformada z. Esto significa que mediante el empleo de la variable compleja z se puede aplicar de manera directa las tecnicas desarrolladas para los metodos de la transformada de Laplace para el analisis de sistemas en tiempo discreto que incluyen la operaci6n de muestreo. Como se puntualiz6 al principio, una vez que el muestreador real y el retenedor de orden cero se han reemplazado de manera matematica por un muestreador mediante impulsos y la funci6n de transferencia (l - e-1')/s, el sistema se convierte en un sistema en tiempo continuo. Esto simplifica el analisis de los sistemas de control en tiempo discreto, puesto que se puede aplicar las tecnicas disponibles para sistemas de control en tiempo continuo.
2.
3.
:~:::n
3-3
83
~.
Se reitera que el muestreador mediante impulsos es un muestreador ficticio que se introduce s610 para prop6sitos de analisis maternatico, No es posible implantar fisicamente tal muestreador que genere impulsos.
En esta secci6n se obtendra la transformada z de x(t) mediante el metodo de la integral de convoluci6n. Considere el muestreador mediante impulsos que se presenta en la figura 3-7. La salida del ' .nuestreador mediante impulsos es
x*(t)
Si se observan que
2: x(t)i>(t 1-0
kT)
x(t)
2: i>(t 1=0
kT)
(3-18)
~[i>(t
- kT)] = e- kTs
se tiene
kT)]
1- e
Ts
X*(s)
kT)]
se ve que Xes) es la transformada de Laplace del producto de dos funciones, x(t) y 8 (t - k7). Observe que esto no es igual al producto de las dos transformadas de Laplace correspondientes. La transformada de Laplace del producto de dos funcionesf(t) y g (t) se puede dar mediante
:L:=o
~[f(t)g(t)] =
r
o
f(t)g(t)e- Sl dt
1 = 2-rrj
C jOO
c-joo
F(p )G(s - p) dp
(3-19)
[Para obtener la ecuaci6n (3-19), vease e~roblema A-3-4.] Sustituyamosf(t) y g(t) por x(t) y L:=o 8 (t - k7), respectivamente. Entonces la transformada de Laplace deX(s), donde
X*(s)
~[X(t) ~o 5(t -
kT)]
--------'/_-----
x(t)
x'(t)
Figura 3-7
84
puede darse mediante
Capitulo 3
X*(s) =
= 27Tj
C jX + c-jx
1 X(p) 1 - e T(s-p) dp
(3-20)
donde la integracion se hace a 10 largo de la linea que corre desde c - jx hasta c + jx paralela al eje imaginario en el plano p y separa los polos deX(p) de los polos de 1/[1 - e-I\'-I'l]. La ecuacion (3-20) es la integral de convolucion. Es un hecho bien conocido que dicha integral se puede evaluar en terminos de los residuos forrnando un contomo cerrado que consiste en una linea desde c - jx hasta c + jx y un semicfrculo de radio infinito en el semiplano izquierdo 0 derecho, ya que la integral a 10 largo del semicfrculo que se anadio es una constante (ya sea cero 0 sJiferente de cera). Esto es, la ecuacion (3-20) se rescribe como sigue: ....i->
1 X* (s) = 27Tj
C jX + c-jx
1 X(p) 1 _ e-T(s-p) dp
(3-21)
donde res un semicfrculo de radio infinito en el semiplano izquierdo 0 derecho del plano p. Existen dos forrnas de evaluar esta integral (una es emplear un semicfrculo infinito en el semiplano izquierdo y la otra es emplear un semicfrculo infinito en el semiplano derecho); se describiran los resultados que se obtienen para los dos casos por separado. En el analisis que se presenta, se supone que los polos de Xes) estan en el semiplano izquierdo y que Xes) se puede expresar como el cociente de polinomios en s, 0
Evaluaclon de la integral de convolucion en el semiplano izquierdo. Se evalua la integral de convolucion dada por la ecuacion (3-21) utilizando un contomo cerrado en el semiplano izquierdo del plano p como se muestra en la figura 3-8. Empleando este contorno cerrado, la ecuacion (3-21) se puede evaluar como sigue: Si observamos que el denominador de Xes) es de mayor grado en s que el numerador, la integral a 10 largo de C se desvanece. Por lo tanto,
X*(s) =
2: [reSidue of 1 _X;~/cs
p) at pole of X(P)]
(3-22)
=-=-:: :-
3-3
85
planop
x
x
x
x x
Re
x x
x x
x x
'---v-'
1
<''':
:::-~
:~S= 31
problema A-3-6 para obtener la ecuacion (3-22).] AI sustituir e" por zen la ecuacion .e tiene X(z)=2,lresiduo de~en un polo de X(p)J J
L.-e
X(~z
.l
~::'-':'3.r
(3-23)
S.:ponga que Xes) tiene los polos Sj, sz, ... , Sm' Si un polo en S = Sj es un polo simple, entonces correspondiente K, es
. K, = hm [ (s S-+Sj
SJ---Ts
Z -
X(S)Z] e
(3-24)
...
:',:':0
(3-25)
[.tmplo 3-1
=>"J3
Xes) _ _-=.1_
5 2(5
+ 1)
86
Capitulo 3
Observe que Xes) tiene un polo doble en s = 0 y un polo simple en s =-1. Par tanto, la ecuaci6n (3-23) se convierte en
X(z) =
I II residua de
z]
z]
=hm
=
1 z (-1)2 z - e T -z(z - 1 - T) z z2(T - 1 + e- T) + z(l - e" - Te- T) +-----:;0 (z - 1)2 Z- e T (z - 1)2(z - e T) (T - 1 + e-T)z-l + (1 - e- T - Te- T)z-2
+----~
(1 - z 1)2(1 - e T z I) Evaluacion de la integral de convolucion en el semiplanoderecho, Ahora se va a evaluar la integral de convolucion dada por la ecuacion (3-21) en el semiplano derecho del plano p. Se elige el contomo cerrado que se muestra en la figura 3-9, el cual consiste en una linea desde c - jx hasta c + jX Y r R, la porcion de un semicfrculo de radio infinito en el semiplano derecho del plano p que esta situado a la derecha de esta linea. El contomo cerrado encierra a todos los polos de 1I[ I - e-/(,-p), pero no encierra a ningun polo de X(P). Ahorax'(s) se puede escribir como
1m
Re
c
x
'--y---'
Palosde X(p)
~
Palos de
1 - e- Tl '
-pi
Figura 3-9
:-=:: :-
3-3
87
.f.
(3-26)
En la evaluaci6n de las integrales del segundo miembra de la ecuaci6n (3-26), se necesita .r siderar dos casos por separado: un caso donde el denominador deX(s) es dos 0 mas grados mayor 0- , que el numerador, y otra caso donde el denominador de Xes) es s610 un grado en s mayor que el - _:Tlerador. Caso J: Xes) tiene un denominador dos 0 mas grados mayor en s que el numerador. Para este ~::so. puesto que Xes) posee por 10 menos dos pQlo_s_~!S que ceros, se tiene
~
limsX(s) = x(O+) = 0
s-+X
1 -2'
7TJ
f.
TR
X(p) T(s
e
p)
dp
X*(s)
TL
k=-:IO
cc
Xes + jwsk)
(3-27)
X(z)
1 T k~X Xes
+ jwsk) s=(IIT) ln z
(3-28)
Observe que esta expresi6n de la transformada z es util para prabar el teorema de muestreo (vease la seccion 3-4). Sin embargo, es muy tedioso obtener expresiones de la transformada z de funciones de uso comun mediante este metodo. Caso 2: Xes) tiene un denominador un grado mayor en s que el numerador. Para este caso, lim sX(s) = x(O+) =1= 0 < oc y la integral a 10largo de Til no es cera. [EI valor distinto de cero esta asociado~con el valor inicial x(O+) de x(t).] Se puede mostrar que la contribuci6n de la integral a 10 largo de Til en la ecuaci6n (3-26) es -+x(O+). Esto es,
1 -2'
7TJ
f.
TR
x(p)
-
e
x
1 -T(s-p)dp=--2 x (O+ )
X*(s)
= Tk~X Xes
1 + jwsk) + zX(O+)
(3-29)
Ejemplo 3-2 Muestre que X(s) es periodica y su periodo es 27T/W" Refiriendose a la ecuacion (3-29),
X*(s) =
+ zX(O+)
88
Por tanto,
Capitulo 3
X'es + jwsk)
+ jwsh) +
~x(o+)
= X'es)
X'es + jwsk)
Por tanto, se tiene
=~
=
m=-x
xes + jwsm) +
~x(o+)
X'es)
x'es jWsk),
k = 0,1,2, ...
De esta manera, x'es) es periodica, con periodo 27T!W,. Esto significa que, si la funci6n Xes) tiene un polo en s = Sl en el plano s, entonces x'es) tiene polos en s = Sl jw,.k (k = 0, 1,2, ... ).
Cdlculo de La transformada z defunciones que invoLucran eL termino (1- e-T')/s. Se considerani aqui que en la funci6nX(s) se incluye (I - e-Ts)!s. Suponga que la funci6n de transferencia G(s) sigue de un retenedor de orden cero. Entonces el producto de la funcion de transferencia del retenedor de orden cera y G(s) se convierte en
Xes)
1 - e- Ts G(s) s
En los siguientes pasos se obtendra la transforrnada z de dicha funcion Xes). Observe que Xes) se puede escribir como sigue:
(3-30)
donde
Considere la funci6n
(3-31)
Puesto que XI(s) es el producto de la transforrnada de Laplace de dos funciones, la transforrnada inversa de Laplace de la ecuacion (3-31) puede estar dada mediante la siguiente integral de convoluci6n:
x,(t)
donde
r
a
ga(t - T)g,(T) dr
8(t - T)
:;e-l[G,(S)]
x,(t) =
r
a
8(t - T - T)g,(T) dr
= g,(t - T)
:~::
:- 3-3
89
Z[G1(s) - e-TsG1(s)
Z[gl(t)] - Z[Xl(t)]
G1(Z}::---Z.::"1 G1(z)
= (1 - Z-I)G1(Z)
X(z) = Z[X(s)) = (1 - Z-I)Z[ Gy)]
(3-32)
:)e este modo se ha mostrado que si X(s) incluye un factor (I - e- lI ) , entonces, al obtener la transfor~ada::; de Xes), el termino 1 - e- I , = I - Z-I se puede factorizar de modo queX(z) sea igual al producto ce ( I - ::;-1) Yla transformada z del terrnino remanente. De manera similar, si la funcion de transferencia G(s) sigue de un retenedor de primer orden .J_(s), donde
Gh1(S) =
entonces la transformada z de la funcion
-se-T}TS; 1
X(s) =
-se-TsyTs; 1 G (s )
mediante el mismo enfoque que se utilizo para obtener la ecuacion (3-32), se tiene
(3-33)
La ecuacion (3-33) se puede emplear para obtener la transformada z de Ia funcion que incluye el circuito retenedor de primer orden.
Ejemplo 3-3 Obtenga la transformada z de
Xes) = 1 - es
Ts
_I_
s+1
90
Capitulo 3
1 - e1 -s s +1
Ts
J
_1_J s + 1
1 -
(1 - Z-I)Z[S(S
~ 1)J
1
-
(1 (
Z-I)Z[~ s
Z
-I
1-
(1 1
-
e- T - I Z
1)
(1 -
e-T)z-I
z 1 - e- T - I
3-4 RECONSTRUCCION DE SENALES ORIGINALES A PARTIR
DE SENALES MUESTREADAS
Teorema delmuestreo. Si la frecuencia de muestreo es suficientemente alta, comparada con la componente de mas alta frecuencia que se incluye en la serial en tiempo continuo, las caracteristicas de amplitud de la serial en tiempo continuo se pueden preservar en la envoIvente de la serial muestreada Para reconstruir la sefial original a partir de una serial muestreada, existe una frecuencia minima que la operaci6n de muestreo debe satisfacer. Dicha frecuencia minima se especifica en el teorema de muestreo. Se supondra que la senal en tiempo continuo x(t) tiene un espectro en frecuencia como el que se muestra en la figura 3-10. Esta seftal x(t) no contiene ninguna componente de frecuencia arriba de WI radianes por segundo.
Teorema del muestreo. mayor que 2w j , 0 Si w" definida como 27TlT, don de T es el periodo de muestreo, es
donde W j es la componente de mas alta frecuencia presente en la sefial en tiempo continuo x(t). entonces la sefial x(t) se puede reconstruir completamente a partir de la sefial muestreada x*(t). EI teorema implica que si W.1 > 2w) entonces, a partir del conocimiento de la sefial muestreada, es te6ricamente po sible reconstruir con exactitud la serial en tiempo continuo original. A continuacion, se hara uso de un enfoque grafico intuitivo para explicar el teorema del muestreo. Para un enfoque anaIitico, vease el problema A-3-1 O. Para mostrar la validez del teorema del muestreo, se necesita encontrar el espectro en frecuencia
I Xljw) I
-w,
w,
Figura 3-10
Un espectro en frecuencia.
:~::
:- 3-4
91
:0:= .:: serial muestreada x*(t). La transformada de Laplace de x*(t) se obtuvo en la secci6n 3-3 y esta ~.:.:: cor las ecuaciones (3-27) 0 (3-29), dependiendo de que x(O+) = 0 0 no. Para obtener el espectro -:""' -"-::cuencia, se sustituyejwpor sen la ecuaci6n (3-27). [En el estudio del espectro en frecuencia, no ;..;0 -:::ccsitaestar interesado en el valor de x(O+).] De este modo, X*(jw) =
= ...
.:: ecuacion (3-34) da el espectro en frecuencia de la sefial muestreadax*(t). Se observa que el espectro ;;- frecuencia de una sefial muestreada mediante impulsos se reproduce un numero infinito de veces ': se atenua en un factor de liT. De esta manera, el p~ de modulaci6n mediante impulsos de una sdal en tiempo continuo produce una serie de bandas laterales. Puesto quex'es) es peri6dica con un :';;~iodo 21Tlw." como se muestra en el ejemplo 3-2, 0
X*(s)
= X*(s
jwsk),
= 0,1,2, ...
s: una funci6nX(s) tiene un polo en s = Sj, entoncesx'(s) tiene un polo en s = Sj jW,k (k = 0, 1,2, ...). En las figuras 3-lla) y b) se muestran las graficas del espectro en frecuenciax'(jw) contra wpara
I X'!iw) I
w, >2w,
-2w,
-w,
w, 2
o
a)
w,
2
w,
32
w,
2w,
I X'!iw) I
w, <2w,
,/
1\
<,
I I
I I
1\ I \
,/
,/
-, /
-, \
\
\
I \
\
1\
I \
\ \
\
I
0
b)
-2w,
-w,
w,
2w,
Figura 3-11 Graficas de espectros en frecuencia de IX\ jw)1 contra w para dos valores de frecuencia de muestreo W,: a) w, > 2w,i b) t, < 2w,.
92
Copitulo 3
dos valores de la frecuencia de muestreo w,. La figura 3-11 a) corresponde a w, > 2w), mientras que la figura 3-11 b) corresponde a w, < 2w!. Cada una de las graficas de IX(jw)1 contra co consiste en lX(jw)l/ Trepetido cada w, = 27T/Trad/s. En el espectro en frecuencia de IX(jw)lla componente lX(jw)I/Tse denomina componente primaria, y las otras componentes IXU( w ::!: w,k))I/T se denominan componentes complementarias. Si w, < 2w!, las componentes de IX(jw)1 no se traslaparan, y el espectro en frecuencia muestreado se repetira cada ca, rad/s. Si w, < 2w l , la forma original de IXUw)I no aparece mas en la grafica de IXUw)1 contra w debido a la superposici6n de los espectros. Por 10 tanto, se ve que la sefial en tiempo continuo x(t) se puede reconstruir a partir de la seflal muestreada mediante impulsos x '(t) a traves de filtrado si y s610 si w., > 2w!. Se debe observar que aunque el requisito de la frecuencia de muestreo minima se especifica en el teorema del muestreo como to;> 2w!, donde w! es la componente de mas alta frecuencia presente en la senal, algunas consideraciones practicas sobre la estabilidad del sistema en lazo cerrado y otras consideraciones de disefio pueden hacer necesario muestrear a ;rna frecuencia mucho mas alta que este valor minima te6rico. (Con frecuencia, w, se elige como lOw) 020w).)
Filtro paso-bajas ideal. La amplitud del espectro en frecuencia de un filtro paso-bajas ideal G1 Uw) se muestra en la figura 3-12. La magnitud del filtro ideal es unitaria sobre el intervalo de frecuencias -+w,::; w::; +ws y es cero fuera de este intervalo de frecuencias. EI proceso de muestreo introduce un numero infinito de componentes complementarias (componentes de bandas laterales) ademas de la componente primaria. EI filtro ideal atenuara todas las componentes complementarias hasta cero y permitira s610el paso de la componente primaria, siempre que la w, sea dos veces mayor que la componente de mas alta frecuencia de la sefial en tiempo continuo. Dicho filtro ideal reconstruye la sefial en tiempo continuo representada por las muestras. En la figura 3-13 se muestran los espectros en frecuencia de las sefiales antes y despues del filtrado ideal. EI espectro en frecuencia a la salida del filtro ideal es l/Tveces el espectro en frecuencia de la sefial en tiempo continuo original x(t). Debido a que el filtro ideal tiene caracteristicas de magnitud constante para la regi6n de frecuencias -+w, ::; w::; +w" no hay distorsi6n en ninguna frecuencia dentro de este intervalo. Esto es, no hay corrimiento de fase en el espectro de frecuencia de un filtro ideal. (EI corrimiento de fase del filtro ideal es cero.) Se debe observar que si la frecuencia de muestreo es menor que el doble de la componente de mayor frecuencia de la serial en tiempo continuo original, entonces, debido a que los espectros en
1
w,
2
1
w,
2
:-::: :- 3-4
93
---------/_-------~ X"ls) 6,
XI~
-w , 0 w,
Fillro ideal
~
-w, 0 w,
Yls)
GII/w)
F2ura 3-13
-'--;;cuencia de la componente primaria y complementarias se traslapan, aun el filtro ideal no puede -;;construir la serial original en tiempo continuo. (En la practica, el espectro en frecuencia de la sefial en :;;mpo continuo en un sistema de control se puedeextender mas alia de +w" incluso euando las .:~plitudes a altas frecuencias son pequefias.)
El filtro paso-bajas ideal no es flsicamente realizable. Se encontrara la respuesta impulso eel filtro ideal. Se mostrara que para el filtro ideal se requiere una salida antes de que se aplique la entrada al filtro. Asi, este no es fisicamente realizable. Debido a que el espectro en frecuencia del filtro ideal esta dado por
-~ws:5
..1 transformada
w:5
~ws
= -1
=
, /2
27T
e/wldw
e-(ll2 l
-w,/2
_1_. (e(ll2l/w, 1 _
/w ,t)
27T Jt
1
= 7Tt senT
Ws t
o
gJ (t ) - T
(3-35)
La ecuacion (3-35) da la respuesta impulso unitario del filtro ideal. En la figura 3-14 se muestra una grafica de glt) contra t. Notese que la respuesta se extiende desde t = _C:JJ hasta t = DC. Esto implica que existe respuesta para t < 0 a un impulso unitario que se aplica en t = O. (Es decir, la respuesta en el tiempo empieza antes de que se aplique la entrada.) Esto no puede ser cierto en el mundo fisico. Por 10 tanto, dicho filtro no es fisicamente realizable. [Sin embargo en muchos sistemas de comunicaciones, es posible aproximar glt) mediante la adicion de un atraso de fase, 10 cual significa agregar un retraso al filtro. En sistemas de control realimentado, incrementar el atraso de fase no es deseable desde el
94
Capitulo 3
Figura 3-14
puna de vista de la estabilidad. Por 10 tanto, se evita agregar atrasosde fase para aproximar al filtro idealJ . Puesto que el filtro ideal es irrealizable y debido a que las sefiales en sistemas de control practices, en general tienen componentes de alta frecuencia que no estan limitados en banda de manera ideal, esto no es posible, en la practica, para reconstruir con exactitud la serial en tiempo continuo a partir de la sefial muestreada, no importa que frecuencia de muestreo se elija. (En otras palabras, desde el punto de vista practice, no es posible reconstruir con precisi6n la sefial en tiempo continuo en un sistema de control practice una vez que este se ha muestreado.)
Caracteristicas de respuesta en frecuencia de un retenedor de orden cero. transferencia de un retenedor de orden cero es
GhO(s) =
La funci6n de
1 - e:"
(3-36)
Para comparar al retenedor de orden cera con el filtro ideal, se obtendran las caracteristicas de respuesta en frecuencia de la funci6n de transferencia del retenedor de orden cera. Mediante la sustituci6n de jw por sen la ecuaci6n (3-36), se obtiene
IG hO (. )1 jW
T sen(wT/2) wT/2
(3-37)
La magnitud se hace cero en la frecuencia igual ala frecuencia de muestreo y en multiples enteras de la frecuencia de muestreo. En la figura 3-l5a) se muestran las caracteristicas de respuesta en frecuencia del retenedor de orden cero. Como se puede observar a partir de la figura 3-15, existe un pica de ganancia no deseado
:..,.:: : -
~4
95
:- .:.< rrecuencias de 3wJ2, 5wJ2, etcetera. N6tese que la magnitud es mas de 3 dB abajo de (0.637 =
B) en la frecuencia co; Debido a que la magnitud decrece en forma gradual a medida que la se incrementa, las componentes complementarias se atenuan gradualmente hasta cera. : .;;:':'.} que las caracteristicas de magnitud del retenedor de orden cera no son constantes, si el .; ':;;-;a esta conectado a un muestreador y rete nedor de orden cero, se presenta distorsi6n en el :-,:-;;~:ro en frecuencia del sistema. Las caracteristicas de corrimiento de fase del retenedor de orden cera se pueden obtener como ; ,:_" Observe que sen (wTI2) adopta valores positivos y negativos a medida que co se incrementa de .:. __' . de w, a 2w" de 2w, a 3w" y asi sucesivamente. De este modo, la curva de fase [parte inferior de .:. .. ;ura 3-15a)] es discontinua en w = kio, = 27rkIT, donde k = 1,2,3, .... Dicha discontinuidad 0 . .:..-::-io de un valor positivo a uno negativo, 0 viceversa, se puede considerar como un corrimiento de '':'''<;; de::: 180. En la figura 3-15a), se supone que el corrimiento de fase es de -180. (Se puede suponer :..:.--:,ien que es de + 180. ) De esta manera,
-'-=~_;;ncia
.: .; ~ j
5!!I L:.I + I
/ cp n
e-(1/2)/wT
/ wT L:.I - 2
c p n5!!I
dB
~
20
\
\
(\
I Gh O !
-40
w,
w,
3w,
-60
2"
w,
-' 30'
~-----r----r-------,--'---~
0 -lBO -360
LEM
- -20'
---w
I...........
-540 -720 0
"I
'0
-.
20
(rad/s)
aJ
b}
Figura 3-15 a) Curvas de respuesta en frecuencia para el retenedor de orden cera; b) diagrama de Bode cquivalente cuando T = I s.
96
Capitulo 3
donde
/
e~(1/2)jwT
wT
2
/sen w T
= GO
180 0
En la figura 3-15b) se presenta una modificaci6n de c6mo presentar las caracteristicas de respuesta en frecuencia del diagrama de la figura 3-15a). EI diagrama que se muestra en la figura 3-15b) es el diagrama de Bode del retenedor de orden cera. Se supone que el periodo T de muestreo es de Iso T = I. N6tese que la curva de magnitud tiende a -XJ decibeles en puntos de frecuencia que son multiplos enteros de la frecuencia de muestreo w, = 21T/T = 6.28 rad/s. Las discontinuidades de la curva de fase [parte inferior de la figura 3-15b)] se presentan en estos puntos de frecuencia. Para resumir 10 que se ha establecido, el espectro en frecuencia de la salida del retenedor de orden cera incluye las componentes complementarias, debido a quelas caracteristicas de magnitud muestran que la magnitud de GhO(jw) es distinta de cero para Iwl > w" excepto en los puntos donde w = w" w = 2w" w = 3 w" .... En la curva de fase existen discontinuidades de 180 0 en los puntos de frecuencia multiplos de w,. Excepto por estas discontinuidades en la fase, esta es lineal en w. En la figura 3-16 se muestra la comparaci6n del filtro ideal y el retenedor de orden cera. Con prop6sitos de comparaci6n, las magnitudes IG(jw)1 estan normalizadas. Se observa que el retenedor de orden cera es un filtro paso-bajas, aunque su funci6n no es muy buena. A menudo, el filtrado adicional de la sefial en bajas frecuencias antes del muestreo es necesario para remover de manera efectiva las componentes de frecuencia mayores que w,. La exactitud del retenedor de orden cero como un extrapolador depende de la frecuencia de muestreo w,. Esto es, la salida del retenedor se puede hacer tan cercana a la sefial en tiempo continuo original como sea posible haciendo que el periodo de muestreo T sea tan pequefio como la situaci6n practica 10 perm ita.
Doblamiento. EI fen6meno de traslape en el espectra en frecuencia se conoce como doblamiento. En la figura 3-17 se muestran las regiones donde se presenta error de doblamiento. La frecuencia w, se denominafrecuencia de doblamiento 0 frecuencia de Nyquist wN Esto es,
I G(/w) I
-2w,
-W s
W$
Ws
Ws
Figura 3-16
:-=:: :- 3-4
97
I X*(jwl I
Error de doblamiento
I I
,....-',
,.......-" I
\ \
\ \
w
Figura 3-17 Diagrama que muestra las regiones donde se presentan los errores de doblamiento.
WN
= ZWs
7T
T-
=:1 la practica, las sefiales en los sistemas de control tienen componentes de alta frecuencia, y casi
< .ernpre existe algun efecto de doblamiento. Por ejemplo, en un sistema electromecanico alguna sefial cuede estar contaminada por ruido. EI espectro en frecuencia de la sefial, por tanto, puede incluir ~ ornponentes de baja frecuencia, asi como componentes de ruido de alta frecuencia (esto es, ruidos en -:',) a 400 Hz). Debido a que las frecuencias de muestreo mayores de 400 Hz no son practicas, la alta .recuencia se doblara y aparecera como una baja frecuencia. Recuerde que todas las sefiales con frecuencias mayores a W s aparecen como senales de frecuencias entre 0 y W,. De hecho, en ciertos ':350S, una sefial de frecuencia cero puede aparecer en la salida.
------.
Traslape. En el espectro en frecuencia de una serial muestreada mediante impulsos x*(t), Jande co, < 2w\, como el mostrado en la figura 3-18, considere un punto de frecuencia arbitrario W 2 que cae en la region del traslape del espectro en frecuencia. El espectro en frecuencia en W = W2 incluye dos componentes !x(jw2)1 !x(j(ws - w2))1. La ultima componente viene del espectro en frecuencia y centrado en w = W s De este modo, el espectro en frecuencia de fa serial muestreada en w = W2 incluye
I X*(jwll
- ...
I
""
...-,
"
\ \
\
\
Figura 3-18
98
Capitulo 3
componentes no solo en la frecuencia W z sino tambien en la frecuencia w, - Wz (en general, en ruo, W z, donde n es un entero). Cuando el espectro compuesto se filtra mediante un filtro paso-bajas, tal como un retenedor de orden cero, algunas armonicas de alta frecuencia estaran aun presentes en la salida. La componente de frecuencia en w = nco, W z (donde n es un entero) aparecera en la salida como si esta fuera una componente de frecuencia en to = ~. No es posible distinguir el espectro en frecuencia en w = W z de aquel en to = ru, W z. Como se muestra en la figura 3-18, el fenorneno de que la componente de frecuencia w, - W z(en general, ruo, Wz, donde n es un entero) se presente sobre la frecuencia W z cuando la serial x(t) se muestrea se denomina traslape. Esta frecuencia to, - W z (en general, nco, wz) se conoce como un alias de W z. Es importante recordar que las sefiales muestreadas son identicas si las dos frecuencias difieren por un multiplo entero de la frecuencia de muestreo w,. Si una sefial se muestrea a una frecuencia baja de modo que el teorema de muestreo no se satisfaga, entonces las altas frecuencias se "doblan hacia adentro" y aparecen como bajas frecuencias.-~ Para evitar el traslape, se debe ya sea elegir la frecuencia de muestreo 10 suficientemente alta (w, > 2w l , donde WI es la componente de mas alta frecuencia presente en la seftal) 0 utilizar un prefiltro antes del muestreador para darle forma al espectro en frecuencia de la sefial (de modo que el espectro en frecuencia para w> w, sea despreciable) antes de que la sefial sea muestreada.
Oscilaciones escondidas. Se debe observar que, si la sefial en tiempo continuo x(t) incluye una componente de frecuencia igual a n veces la frecuencia de muestreo w, (donde n es un entero), entonces la componente puede no aparecer en la sefial muestreada. Por ejemplo, si la sefial x(t) = Xl(t)
+ xz(t) = sen t +
sen3t
donde xl(t) = sen t y xit) = sen 3t, se muestrea en t = 0, 27f/3, 47f/3, ... (la frecuencia de muestreo w, es 3 rad/s), entonces la sefial muestreada no mostrara la componente de frecuencia con W = 3 rad/s, la frecuencia es igual a w,. (Vease la figura 3-19.) Aun cuando la sefial x(t) incluya una oscilacion con co = 3 rad/s [esto es, la componente x 2(t) = sen 3t], la senal muestreada no muestra esta oscilacion. Dicha oscilacion existente en x(t) entre los periodos de muestreo se denomina oscilacion escondida.
La funcion de transferencia para un sistema continuo relaciona las transformadas de Laplace de la salida en tiempo continuo con la correspondiente de la entrada en tiempo continuo, mientras que la funcion de transferencia pulso relaciona las transformadas z de la salida en los instantes de muestreo con la correspondiente entrada muestreada. Antes de estudiar la funcion de transferencia pulso, es conveniente estudiar la sumatoria de convolucion.
Sumatoria de convotucion. Considere la respuesta de un sistema en tiempo continuo excitado por una seftal muestreada mediante impulsos (un tren de impulsos) como se muestra en la figura 3-20. Suponga que x(t) = 0 para t < O. La sefial muestreada mediante impulsos x*(t) es la entrada al sistema en tiempo continuo cuya funcion de transferencia es O(s). Se supone que la salida del sistema es una sefial en tiempo continuo yet). Si en la salida hay otro muestreador, sincronizado en fase con el
:.;-:: : - 3-5
99
sen t
OI'C-----~:__-----:lIC-----~:__---__,,;t:_....
sen3t
OI'----'\--+--+--+--4--+---\,..----jf-----'\--+--~-+___I-
x(tl
sen t+ sen 3t
xlk)
Ol-----'-----.------_----'-----y----.___
3
6
k
Figura 3-19 Graficas de x,(t) = sen I, x,(t) = sen 31, y x(t) = sen 1 + sen 31. Senal muestreada x(k), donde la frecuencia de muestreo to, = 3 rad/s, no muestra oscilaci6n con la frecuencia w = 3 rad/s.
nuestreador de la entrada, y ambos ope ran con el mismo periodo de muestreo, entonces la salida es un ren de impulsos. Se supone que yet) = 0 para t < O. La transformada z de y(t) es
Z[y(t)]
Y(z)
k=O
2: y(kT)z-k
y(t)
(3-38)
xlt)
/
T
x*(t)
.1
G(5)
L/
T
y*(t) :
Figura 3-20 Sistema de tiempo continuo G(s) excitado con una serial muestreada mediante impulsos.
100
Capitulo 3
En ausencia del muestreador a la salida, si se considera un muestreador ficticio en la salida (sincronizado en fase con el muestreador de entrada y opera al mismo perfodo de muestreo) y se observa la secuencia de valores que toma yet) solo en los instantes t = kT, entonces la transformada z de la salida y*(t) puede tambien estar dada por la ecuacion (3-38). Para el sistema en tiempo continuo, es bien conocido el hecho de que la salida del sistemay(t) esta relacionada con la entradax(t) por medio de la integral de convolucion, 0
yet)
f'g(t - T)X(T)dT
o
{X(t - T)g(T)dT
0
donde get) es la funcion de ponderacion del sistema 0 la funcion de respuesta impulso del sistema Para sistemas en tiempo discreto se tiene una sumatoria de-eenvolucicn, similar a la integral de convolucion. Debido a que
cc
x*(t)
L x(t)8(t k~O
kT)
L x(kT)8(t k~O
kT)
es un tren de impulsos, la respuesta yet) del sistema deb ida a la entrada x*(t) es la suma de las respuestas impulso individuales. Por tanto,
yet)
Si observamos que para un sistema ffsico una respuesta no puede preceder a la entrada, tenemos que
I
k
get) = 0 para t < 0 0 get- k7) = 0 para t < kT. En consecuencia, las ecuaciones anteriores se pueden
combinar en una sola ecuacion:
yet)
= =
L get h~O
hT)x(hT)
0::::: i s: kT
Los valores de la saliday(t) en los instantes de muestreo t = kT (k = 0, 1,2, ...) estan dados por
y(kT) =
=
L g(kT h~O
hT)x(hT) hT)g(hT)
(3-39) (3-40)
L x(kT h~O
donde g(k7) es la secuencia de ponderacion del sistema. [La transformada z inversa de G(z) se denomina secuencia de ponderacion.s La sumatoria en las ecuaciones (3-39) 0 (3-40) se conoce como sumatoria de convolucion. Observe que la notacion simplificada
:-o:::n 3-5
101
~-~Q) Y (3-40) se pueden tomar desde 0 hasta x mas que desde 0 hasta k sin alterar el valor de la '_-'Horia. Por tanto, las ecuaciones (3-39) y (3-40) se pueden rescribir como sigue:
y(kT) =
hT)x(hT)
(3-41) (3-42)
= L x(kT
- hT)g(hT)
Se debe observar que si G(s) es un cociente de polinomios en s)' si el grado del polinomio :,,] denominador excede s610 en I el grado del polinomio del dlii:8.minador, la salida yet) es : ;.coTiTinua:como se muestra en la figura 3-21 a). Cuandt)-y{t~es discontinua, las ecuaciones ~ --+ I) Y (3-42) daran los val ores inmediatamente posteriores a los instantes de muestreo, esto es ':'-). y(T+), ... ,y(kT+). Dichos valores no describen la curva real de la respuesta. Sin embargo, si el grado del polinomio del denominador excede al del numerador en 2 0 .....,.ls. la salida yet) es continua, como se muestra en la figura 3-21 b). Cuando yet) es continua, las ecuaciones (3-41) y (3-42) daran los valores en los instantes de muestreo. Los valores de y(k) en .:: .cho caso describen los valores de la curva real de la respuesta.
2T
3T
4T
5T
a)
,tl
2T
3T
4T
5T
b)
Figura 3-21 a) Grafica de la salida y(l) (respuesta al impulso) contra 1 cuando el grado del polinomio del denominador de G(s) es de grado mayor en I que el polinomio del nurnerador: b) grafica de la salida y(l) contra 1 cuando el grado del polinomio del denominador de G(s) es de grado mayor en 2 0 mas que cl polinomio del numerador.
102
Capitulo 3
Al analizar los sistemas de control en tiempo discreto es importante recordar que la respuesta del sistema a una sefial muestreada mediante impulsos puede no describir el correcto cornportamiento de la respuesta en el tiempo para el sistema real, a menos que la funci6n de transferencia G(s) de la parte del sistema en tiempo continuo tenga por 10 menos dos polos mas que ceros, de modo que lim sG(s) = O.
.\'--)00
I
h~O
g(kT - hT)x(hT),
k=O,1,2, ...
Y(z) =
=
I
k~O
I I
k~O h~O
I I
m~Oh~O
= =
I
m~U
g(mT)z-m
I
h~U
X(hT)z-h
(3-43)
G(z)X(z)
donde m
k- hy
G(z) =
I
m~U
g(mT)z-m = transformadazdeg(t)
La ecuaci6n (3-43) relaciona la salida pulso Y(z) del sistema y la entrada pulsoX(z). Esto proporciona un medio para determinar la transformada z de la secuencia de salida para cualquier secuencia de entrada. Al dividir ambos miembros de la ecuaci6n (3-43) entreX(z) obtenemos
G( )
Y(z) X(z)
(3-44)
La G(z) dada por la ecuaci6n (3-44), el cociente entre la salida Y(z) y la entrada X(z), se denomina funcion de transferencia pulso del sistema en tiempo discreto. Esta es la transformada z de la secuencia de ponderaci6n. En la figura 3-22 se muestra un diagrama de bloques para una funci6n de transferencia pulso G(z), junto con la entrada X(z) y la salida Y(z). Como se ve de la ecuaci6n (3-43), la transformada z de la sefial de salida se puede obtener como el producto de la funci6n de transferencia pulso del sistema y la transfonnada z de la sefial de entrada. Observe que G(z) es tambien la transformada z de la respuesta del sistema a la entrada delta de Kronecker:
Xlz)
Y(z)
: ~:: :)n
3,5
103
x(kT)
= 5o(kT) =
{I, 0,
X(z)
L X(kT)z-k = 1
k=O
Y(z)
G(z)
:)" este modo, la respuesta del sistema a la entrada delta de Kronecker es G(z), la transfonnada z de la secuencia de ponderacion. Este hecho es paralelo al de que G(s}erta transformada de Laplace de :: tuncion de ponderacion del sistema, que es la respuesta del sistema ala funcion impulso unitario. Transformada de Laplace asterisco de la setiat que involucra tanto transformadas de Laplace ordinurlas como asterisco. Al analizar los sistemas de control en tiempo discreto, a menudo se ,,'":cuentra que algunas sefiales en el sistema son sefiales asterisco (10 que significa que las setiales es.an muestreadas mediante impulsos) y otras no 10 son. Para obtener las funciones de transferencia :- j Iso y analizar el sistema de control en tiempo discreto, por 10 tanto, se debe ser capaz de obtener las .r.msformadas de las sefiales de salida de los sistemas que contienen operaciones de muestreo en . aries lugares en los lazos. Suponga que el muestreador mediante impulsos es seguido por un elemento lineal en tiempo ~c,ntinuo, cuya funcion de transferencia es G(s), como se muestra en la figura 3-23. En el siguiente analisis se supone que todas las condiciones iniciales en el sistema son cero. Entonces, la salida Y(s) es
Y(s) = G(s)X*(s)
(3-45)
'\otese que Y(s) es el producto deX(s), que es periodica con un periodo de 27T/W" y G(s), no periodica. :: I hecho de que las sefiales muestreadas mediante impulsos son periodicas se puede ver del hecho de
X*(s)
= X*(s
jwsk),
0,1,2, ...
(3-46)
.Vease el ejemplo 3-2.) En 10 que se presenta a continuacion se mostrara que al tomar la transformada de Laplace asterisco de la ecuacion (3-45) se puede factorizar X(s) de manera que
Y*(s)
[G(s)X*(s)]*
(3-47)
Este hecho es muy importante en la obtencion de la funcion de transferencia pu\so y tarnbien en \a sirnplificacion del diagrama de bloques del sistema de control en tiempo discreto. Para obtener la ecuacion (3-47), observe que la transformada inversa de Laplace de Y(s) dada por :: ecuacion (3-45) se puede escribir como sigue:
x(t)
y(t)
Y(s)
XIs)
..
104
Capitulo 3
y(t) =
=
~-l[G(S)X*(s)]
f'g(t - T)X*(T)dT
o
o
f' g(t - T)
k~O
x( T)8(T -
kT) dr
k~O
f'g(t 0
T)X(T)8(T - k'Ti d
2: g(t
k~O
- kT)x(kT)
Y(z) = Z[y(t)] =
=
kT)X(kT)]z-n---
2: 2: g(mT)x(kT)z-(k+m l
Y(z) =
=
2: g(mT)z-m 2: xtk'Tyz:"
m~O k~O
G(z)X(z)
(3-48)
Debido a que la transformada z puede entenderse como la transformada de Laplace asterisco con ell reemplazada por z, la transformada z se puede considerar una notaci6n corta para la transformada de Laplace asterisco. De esta manera, la ecuaci6n (3-48) se puede expresar como Y*(s)
= G*(s)X*(s)
que es la ecuaci6n (3-47). Asi se ha mostrado que al tomar la transformada de Laplace asterisco en ambos miembros de la ecuaci6n (3-45) se obtiene la ecuaci6n (3-47). Para resumir 10 que se ha obtenido, observe que las ecuaciones (3-45) y (3-47) establecen que al tomar la transformada de Laplace asterisco de un producto de transformadas, donde algunas son transformadas de Laplace ordinarias y otras son transformadas de Laplace asterisco, las funciones que ya estan en transformadas asterisco se pueden factorizar de la operaci6n de la transformada de Laplace asterisco. Se debe observar que los sistemas se hacen peri6dicos bajo la operaci6n de la transformada de Laplace asterisco. Dichos sistemas peri6dicos son en general mas complicados de analizar que los sistemas origin ales que no son periodicos, pero el anterior se puede analizar sin dificultad si se \leva al plano z (esto es, mediante el enfoque de la funci6n de transferencia pulso). Procedimientos generales para obtener funciones de transferencia pulso. Aqui se presentaran procedimientos generales para obtener la funci6n de transferencia pulso de un sistema que tiene un muestreador mediante impulsos en una de lasentradas del sistema, como se muestra en la figura 3-24a). La funci6n de transferencia pulso O(z) del sistema que se muestra en la figura 3-24a) es Y(z) X(z)
G(z)
= Z[G(s)]
105
y(t)
x(t)
yO(t)
y(z)
Muestreador ficticio
a)
x(t)
X(s)
y(t)
~
Y(s)
b]
Figura 3-24 a) Sistema en tiempo continuo con un muestreador mediante impulsos en la entrada; b) sistema en tiempo continuo.
=:><:spues, considere el sistema que se muestra en la figura 3-24b). La funcion de transferencia G(s) esta :"da por
Y(s) = G( ) X(s) s
=='S
importante recordar que la fun cion de transferencia pulso para este sistema no es Z[G(s)], debido
La presencia 0 ausencia del muestreador mediante impulsos es crucial en la determinacion de la '-Jncion de transferencia pulso del sistema, puesto que, por ejemplo, para el sistema que se muestra en a figura 3-24a), la transformada de Laplace de la saliday(t) es
Y(s) = G(s)X*(s)
?or 10 tanto, al tomar la transformada de Laplace asterisco de yes), se tiene
Y*(s)
,,). en terminos de la transformadaz,
= G*(s)X*(s) = G(z)X(z)
Y(z)
es
mientras que, para el sistema que se muestra en la figura 3-24b), la transformada de Laplace de la salida
.-.1 t)
Y(s)
]0
= G(s)X(s)
106
Capitulo 3
0, en terminos de la transformada z,
G(z)
Z[G(s)]
Los ejemplos 3-4 y 3-5 demuestran los metodos para obtener la funci6n de transferencia pulso.
Ejemplo 3-4 Obtenga la funci6n de transferencia pulso G(z) del sistema que se muestra en la figura 3-24a), don de G(s) esta dada por
G(s) = - s +a Observe que existe un muestreador a la entrada de G(s) y por tanto la funci6n de transferencia pulso es
G(z)
=
Z[G(s)].
Metoda 1.
z[s + 1
Por 10 tanto,
a-I - e
] _
aT Z
G(z)
Metoda 2.
1 - e -aT-l z
get)
Por 10 tanto,
= .;e-l[G(S)] = e- a ,
k = 0,1,2, ...
Por 10 que,
G(z)
2: g(kT)z-k
k=O
2: :" Z-k = 2:
k=O k=O
(eaT Z)-k
107
Ejemplo 3-5
Obtcnga la funci6n de transferencia pulso del sistema que se muestra en la figura 3-24a), donde G(s) esta dada por
G (s) -
1-e- Ts
.vletodo I. G(s) incluye el terrnino (I - e- r.): por tanto, refiriendose a la ecuacion (3-32), se obtiene la funci6n de transferencia pulso como sigue:
G(z)
1 (1 - z - I )Z [1 - - + -1 ] S2 S S + 1
A partir de la tabla 2-1, se puede encontrar la transformada:: de cada uno de los terminos de la expansion en fracciones parciales. De este modo,
G(z)
" Z-I
1]
(3-49)
1 1) G(s) = (1 - e- rs ) (1 - - + - S2 S S + 1
Por tanto, al tomar la transformada inversa de Laplace, se tiene la siguiente funcion de respuesta impulso:
g(kT)
= =
G(z)
2: g(kT)z-k
k~O
2: [e- kT + T k~O
e-(kT-n]z-k + e" - 1 - T
= (1 - e T) 2:
k-O
:" Z-k + T
2: Z-k + e T k-O
1- T
(1 - e T )
108
Capitulo 3
Funcion de transferencia pulso de elementos en cascada. Considere el sistema que se muestra en las figuras 3-25a) y b). Aqui se supone que los muestreadores estan sincronizados y que tienen el mismo periodo de muestreo. Se mostrara que la funcion de transferencia pulso del sistema que se muestra en la figura 3-25a) es G(z)H(z), mientras que la del sistema que se muestra en la figura 3-25b) es Z[G(s)H(s)] = Z[GH(s)] = GH(z), que es diferente de G(z)H(z). Considere el sistema que se muestra en la figura 3-25a). A partir del diagrama se obtiene
U(s) Yes)
= G(s)X*(s)
=
H(s)U*(s)
Por tanto, al tomar la transformada de Laplace asterisco de cada una de estas dos ecuaciones, se obtiene como resultado
U*(s) Y*(s)
En consecucncia,
= =
G*(s)X*(s) H*(s)U*(s)
Y*(s)
o
H*(s)U*(s)
=
H*(s)G*(s)X*(s)
Y*(s)
G*(s)H*(s)X*(s)
Y(z)
G(z)H(z)X(z)
La funcion de transferencia pulso entre la salida y*(t) y la entrada x*(t) esta por tanto dada mediante
Y(z) X(z)
G(z)H(z)
x(t) / ------'
x"(t)
s,
Gis)
ult)
f-.
-_~
/s;
a)
u"(t)
H(s)
v(t) ----'
/' s,
--------j~
v" (t)
x(t)
G(s)
I-~I
b)
H(s)
v(t)
/'
6r
-----v"(t)
Figura 3-25 a) Sistema muestreado con un muestreador entre los elementos en cascada G(s) y H(s); b) sistema muestreado sin muestreador entre los elementos en cascada G(s) y H(s).
:,,:>:in 3-5
109
Despues, considere el sistema que se muestra en la figura 3-25b). A partir del diagrama se ::::-:cuentra que
GH(s)
G(s)H(s)
Y*(s)
[GH(s)]*X*(s)
Y(z) = GH(z)X(z)
la funcion de transferencia pulso entre la salida y*(t) y la entrada x*(t) es
~~:~
Observe que
GH(z)
Z[GH(s)]
G(z)H(z)
'* GH(z)
Z[GH(s)]
Por tanto, las funciones de transferencia pulso de los sistemas que se muestran en las figuras 3-250)
:' b) son diferentes. Ahora se verificara esta asercion en el ejemplo 3-6.
Ejemplo 3-6 Considere los sistemas que se muestran en las figuras 3-26a) y b). Obtenga la funci6n de transferencia pulso Y(z)/X(z) para cada uno de estos dos sistemas.
x(d
/
or
x'(t)
.1
1
s
+a
G(s)
P<
a)
u'(t)
1
S
y(t)
+b
H(s)
x(t)
/
or
x'(t)
1
s
+a
G(s)
I ~I
1
s
y(t)
H(s)
b)
Figura 3-26 0) Sistema muestreado con un rnuestreador entre los elementos G(s) = I/(s + 0) y H(s) = I/(s + h); h) sistema muestreado sin muestreador entre los elementos
G(s) y fI(s).
110
Capitulo 3
Para el sistema de la figura 3-26a), las dos funciones de transferencia G(s) y H(s) estan separadas por un muestreador. Se supone que los dos muestreadores que se presentan estan sincronizados y tienen el mismo periodo de muestreo. La funcion de transferencia pulso para este sistema es
1_]
=Z[b ~ aC ~ a- s ~ b)]
Por 10 tanto,
]
I)
Claramente, se ve que las funciones de transferencia pulso de los dos sistemas son diferentes; esto es,
Funcion de transferencia pulso de sistemas en lazo cerrado. En un sistema en lazo cerrado, la existencia 0 no de un muestreador de salida en ellazo hace que el comportamiento del sistema sea diferente. (Si existe un muestreador fuera dellazo, no habra ninguna diferencia en la operaci6n dellazo cerrado.) Considere el sistema de control en lazo cerrado que se muestra en la figura 3-27. En este sistema, el error actuante esta muestreado. A partir del diagrama de bloques, E(s) = R(s) - H(s)C(s)
C(s) = G(s)E*(s)
R(s)
(s)
*(s)
G(s)
CIs)
H(s)
:-=::6n 3-5
111
:;cr tanto.
C*(s) = G*(s)E*(s)
',c
obtiene
C(z)
G(z)R(z) 1 + GH(z)
La transformada z inversa de esta ultima ecuaci6n da los valores de la salida en los instantes de
rnuestreo. [Observe que la salida real e(t) del sistema es una sefial en tiempo continuo. La transformada ; inversa de q::) no dara la sefial de salida en tiempo continuo e(l).] La funcion de transferencia pulso para este sistema en lazo cerrado es
C(z)
R(z)
G(z) 1 + GH(z)
(3-50)
En la tabla 3-1 se muestran cinco configuraciones tipicas para sistemas de control en tiempo discrete en lazo cerrado. Aqui, los muestreadores estan sincronizados y tienen el mismo periodo de muestreo. Para cada configuracion. se muestra la salida correspondiente C(::). Notese que algunos sistemas de control en tiempo discreto en lazo cerrado no se pueden representar mediante C(:)/R(::) .esto es, no tienen funcion de transferencia pulso) debido a que fa serial de entrada R(s) no se puede separar de la dinamica del sistema. Aunque la funcion de transferencia pulso no pueda existir para ciertas configuraciones de sistemas, se pueden aplicar las mismas tecnicas que se estudian en este capitulo para analizarlas.
Funcion de transferencia pulso de UII controlador digital. La funci6n de transferencia pulso de un controlador digital se puede obtener a partir de las caracteristicas entrada-salida requeridas del controlador digital. Suponga que la entrada al controlador digital es e(k) y la salida es m(k). En general, la salida m(k) puede estar dada mediante el siguiente tipo de ecuacion en diferencias:
m(k) + a.rnik. - 1) + a-mt]: - 2) + ... + a.rnt]: - 11)
=
(3-51)
112
Capitulo 3
TABLA 3-1 CINCO CONFIGURACIONES TiplCAS DE SISTEMAS DE CONTROL EN TIEMPO DISCRETO EN LAZO CERRADO
R(s)
c_
GI,I L:~cr(s).s:
C(z)
G(zIR(zl
1 + GH(z)
--H(s)"
R(sl
H~l
L -
~ ~ C ( S ) /
C(z)
C(z) =
Bf-oo..f----J-J
C(z)
~
G(z)R(z) + G(z)H(z)
C (z) =
H(s) ~-------'
G, (z)G (z)R(z)
R(s)
-+
--L------i
H(s) f - + - - - - - - '
C(z)
C (z)
R(s)
Cis)
--
C(z)
:;;::on3-5
113
(b o + bcz:' + .. , + bnz-n)E(z)
est~;cmda mediante
(3-52)
+ bnz- n +anz-n
E] uso de la funcion de transferencia pulso Gliz) en la forma de la ecuacion (3-52) habilita allector para -':"lal izar los sistemas de control digital en el plano z,
Funcion de transferencia pulso en tazo cerrado de un sistema de control digital. En la ::gura 3-28a) se muestra un diagrama de bloques de un sistema de control digital. Aquf, el muestreador, .:1 convcrtidor AID, el controlador digital, el retenedor de orden cera y el convertidor D/A producen .ma serial de control u(t) en tiempo continuo (con stante por pedazos) para ser alimentada fa planta. En a figura 3-28b) se muestran las funciones de transferencia de los bloques involucrados en el sistema. La funcion de transferencia del controlador digital se muestra como G;) (5). En el sistema realla
rlt)
e(f)
a)
Risl
C(s)
G(s)
b)
Figura 3-28 a) Diagrama de bloques de un sistema de control digital; h) diagrama de bloques cquivalcntc que mucstra las funcioncs de transferencia de los bloques.
114
Capitulo 3
computadora (controlador digital) resuelve una ecuaci6n en diferencias cuya relaci6n entrada-salida esta dada mediante la funci6n de transferencia pulso GoCz). En el presente sistema la sefial de salida e(t) se alimenta de regreso para ser comparada con la sefial de entrada ret). La sefial de error e(t) = r(t) - e(t) se muestrea, Yla sefial anal6gica se convierte en digital a traves de un dispositivo A/D. La serial digital e(k7) se alimenta al controlador digital, el cual opera sobre la secuencia muestreada e(k7) de una manera adecuada para producir la sefial m(k7). Esta relaci6n conveniente entre las secuencias m(k7) Ye(k7) se especifica mediante Ja funci6n de transferencia pulso GIJ(z) del controlador digital. [Mediante la selecci6n adecuada de los polos y ceros de Gf)(z), se puede generar un buen nurnero de caracteristicas entrada-salida.] Refiriendose a la figura 3-28b), se define
1 - e- Ts --Gp(s) = G(s) s
A partir de la figura 3-28b), n6tese que
C(s)
o
C* (s)
G(s)GbCs)E*(s)
= G* (s)GbCs)E* (s)
=
C(z)
Puesto que
G(z)GD(z)E(z)
C(z)
y, por 10tanto,
GD(z)G(z)[R(z) - C(z)]
(3-53)
La ecuacion (3-53) da la funci6n de transferencia pulso en lazo cerrado del sistema de control digital que se muestra en la figura 3-28b). EI desempefio de dicho sistema en lazo cerrado se puede mejorar mediante la apropiada eleccion de Gf)(z), la funcion de transferencia pulso del controlador digital. Posteriormente se estudiara una variedad de formas para Gf)(z) a ser utilizadas en la obtenci6n del desempefio optimo para varios indices de desempefio dados. A continuaci6n, se considerara s610 un caso sencillo, donde la funcion de transferencia pulso Gf)(z) es del tipo PID (proporcional mas integral mas derivativo).
Funcion de transferencia pulso de un controlador PID digital. EI esquema de control PID analogico ha sido usado de manera exitosa en muchos sistemas de control industrial por mas de medio siglo. EI principio basico del esquema de control PID es que actua sobre la variable a ser manipulada a traves de una apropiada combinacion de las tres acciones de control: acci6n de control proporcionaJ (donde la accion de control es proporcional ala sefial de error actuante, la cual es la diferencia entre la entrada y la sefial de realimentaci6n); la accion de control integral (donde la accion de control es
:-=::6n 3-5
l1S
::--.:>porcional a la integral de la sefial de error actuante) y la acci6n de control derivativa (donde la .:,:;;i6n de control es proporcional a la derivada de la sefial de error actuante). En situaciones donde muchas plantas se controlan directamente mediante una sola computadora ::gital (como un esquema de control en el que se controlan desde unos cuantos lazos hasta cientos de ;,;,:05 mediante un solo controlador digital), la mayoria de los lazos de control se pueden manipular ~~diante esquemas de control PID. La acci6n de control PID en controladores anal6gicos esta dada por
met)
K[e(t) + tfe(t)dt + t:
d~~t)]
(3-54)
.ionde e(t) es la entrada al controlador (sefial de error actuante), m(t) es la salida del controlador (la senal manipulada), K es laganancia proporcional, T, es el tiempo integral (0 tiempo de reajuste) y Td es ~ 1tiempo derivativo (0 tiempo de adelanto). Para obtener la funci6n de transferencia pulso del controlador PID digital, se puede discretizar la ecuaci6n (3-54). AI aproximar el termino integral mediante la sumatoria trapezoidal y el termino derivativo mediante la diferencia de dos puntos, se obtiene
m(kT)
+
o
m(kT) =
K{ e(kT) + f~1 eh -
1)~)
+ e(hT)
+ t; [e(kT) - ek - 1)T)] } T
Se define
(3-55)
eh - 1)~) + e(hT)
[(hT),
[(0)
eh - I)T) + e(hT) 2
h~l
[(hT)
z[
h~1
eh - I)T) + e(hT)] = 2
z[
h~l
[(hT)] =
_1
1
-1
[F(z) - [(0)]
1 1 - z-lF(z)
(Para obtener esta ultima ecuaci6n, refierase al problema A-2-4.) N6tese que
F(z) = Z[[(hT)] =
+ Z-I
2
E(z)
116
Capitulo 3
elt)
___-+---_+_
f(OI
e(T!
+ e(2T!
2
= f(2T!
o
Figura 3-29
2T
3T
Por 10 tanto,
z[
h=1
M(z) = K [ 1
t; T 1 + Z-I + 21; 1 _ z 1 + T (1 -
Z-I) (z)
Tl M(z) = K [ 1 - - . + T _ -1 2, t: 1 z
=
t: + - (1 T
Z-I) (z)
[K
+ 1
KT
~~
K (1 D
Z-I)](Z)
don de
K; = K - 2 T, = K K, =
K,
= ganancia proporcional
KT
I
= ganancia integral
+ 1 _ Z-1 + K D(1 - z )
K[
-I
La funcion de transferencia pulso del controlador PID digital dada por la ecuacion (3-56) se co cornunmente como forma posicional del esquema de control PID.
~~::::1
3-5
117
La otra forma por 10 regular utilizada en el esquema de control PID digital es el esquema conoci_. como forma de velocidad. Para obtener la ecuaci6n del control PID en la forma de velocidad, se ~. -sidera la diferencia hacia atras en m(kT), esto es, la diferencia entre m(kT) y meek - I)T). Con ::. ;Jnas suposiciones y manipulaciones, se obtiene
(3-57)
vease el problema A-3-I7.] La ecuaci6n (3-57) da el esquema de PID en la forma de velocidad. En la figura 3-30 se muestra un diagramade-bloques de la -~~I izaci6n de un esquema de control PID digital en la forma de velocidad. Note que en la ecuaci6n ~-5(7) 5610 el termino del control integral incluye la entrada R(z). Por 10tanto, el termino integral no se :- ..:~de excluir del controlador digital si este se utiliza en la forma de velocidad. Una ventaja del esquema de control PID en la forma de velocidad es que no es necesaria la <cializaci6n cuando se conmuta de operaci6n manual a automatica. De este modo, si existen cambios s, oitos grandes en el punto de ajuste 0 en el inicio de la puesta en operaci6n del proceso, el esquema .:~ control PID en la forma de velocidad presenta mejores caracteristicas de respuesta que aquel en la .'.''111a posicional. Otra ventaja del esquema de control PID en la forma de velocidad es que es util en ::. supresion de correcciones excesivas en sistemas de control de procesos. Las leyes de control lineales en la forma de acciones de control PID, tanto en la forma posicional orno en la de velocidad, son basicas en controles digitales debido a que con frecuencia dan solucio~~5 satisfactorias a muchos problemas practicos de control, en particular a problemas en control de :'~ocesos. Observe que, en los controladores digitales, las leyes de control se pueden implantar ~ediante software, y por 10 tanto las restricciones de hardware de los controladores PID se pueden gnorar por completo. (Para una comparaci6n de las caracteristicas de respuesta en frecuencia entre os controladores PID anal6gicos y digitales, vease el problema A-3-l6.)
~ ~ ntrol
Ejemplo 3-7 Considere el sistema de control con el controlador PID digital que se muestra en la figura 3-31a). (El controlador PID esta en la forma posicional.) Se supone que la funcion de transferencia de la planta es
Rlzi
Clz)
Figura 3-30
118
Capitulo 3
m(kT)
eft)
(a)
C(z)
(b)
Figura 3-31
Puesto que
Z[l - eS
] _ G(z) _
s(s + 1) -
se puede redibujar el diagrama de bloques de la figura 3-31 a) como se muestra en la figura 3-31 b). Obtengase la respuesta escalon de este sistema cuando el controlador digital es un controlador con K; = I, K 1 = 0.2, Y Kf) = 0.2. La funcion de transferencia pulso del controlador digital esta dada
G ( )
DZ
C(z) R(z)
GD(z)G(z) 1 + GD(z)G(z) O.5151z- 1 - O.1452z- z - O.2963z- 3 + O.0528z- 4 - 1 - 1.8528z ' + 1.5906z z - O.6642z 3 + O.0528z
4
:-=::on3-5
119
COil
MATLAB.
e scalon unitario hasta k = 40. Entonces la entrada r(t) se puede escribir como
r = ones(l,41)
- programa para MATLAB que pennite obtener 1a respuesta escalon unitario para este sistema se -- .iestra en el programa para MATLAB 3-1. La salida resultante c(k) contra k se grafica en lafigura 3-
Respuestaatescalonunitaro
20
k
25
30
35
40
Figura 3-32
120
Capitulo 3
La respuesta de este sistema para una entrada rampa unitaria se puede obtener mediante el programa para MATLAB 3-2. La grafica resultante se muestra en la figura 3-33. Observe que este sistema no presenta error en estado estacionario en la respuesta a la rampa.
Programa para MATLAB 3-2
% - - Respuestaa la rampa unitaria-num = [0 05151 -0.1452 -0.2963 0.0528]; den = [1 -1.85281.5906 -0.6642 0.0528]; axis(v); k = 0:40;
r =
[k];
16 14 12 10
:;<
6 4 2 0 0 4 6 10 12 14 16
k Figura 3-33
Respuesta a la rampa unitaria.
121
Comentarios. Los controladores PID para los sistemas de control de procesos como sistemas :.:- ~: -:rol de temperatura, sistemas de control de presion y sistemas de control de nivel de liquidos se s.r ': - .Z.3.n normalmente en forma experimental. De hecho, en el control PID de cualquier planta indus::-.::. conde su dinamica no es bien conocida 0 no esta bien definida, las variables del controlador (K p . .,' ) se deben determinar de forma experimental. Dicha manera de determinar los parametres 0 s.r : ::-:zarlos se puede llevar a cabo mediante cambios de tipo escalon en la seii.al de referencia 0 de =.o-:-_:bacion. Se dispone de unos cuantos procedimientos establecidos para dicho propos ito. Basica-::-:::. la sintonizacion (el determinar las constantes K p , K[ Y K D ) se logra mediante la variacion ,,~:::-,atica de los valores hasta que se obtienen buenas caracteristicas de respuesta. Para los controladores PID digitales utilizados para sistemas de control de procesos, el periodo ;j:: "":":-:estreo se debe elegir de manera apropiada. Muchos sistemas de control de procesos tienen _:-':.lntes de tiempo ligeramente grandes. Una receta de cocina en la eleccion del periodo de muestreo :",-odo de muestreo T= 27T/W" donde W, es la frecuencia de muestreo) en sistemas de control de zr .c esos. es que para sistemas de control de temperatura el periodo de muestreo debe ser de lOa 30 ;:,::~-:ndos. para sistemas de control de presion de I a 5 segundos y para sistemas de control de nivel .quidos de I a 10 segundos. Obtencion de la respuesta entre instantes de muestreo consecutivos.
~.::.s0S ~.~
EI analisis de la trans-
i: :-:'lada:: no dara informacion sobre la respuesta entre dos instantes de muestreo consecutivos. En
ordinarios esto no es serio, debido a que si el teorema de muestreo se satisface, entonces la .da no variara mucho entre cualquiera de estos dos instantes de muestreo consecutivos. En ciertos . zsos, sin embargo, se puede necesitar la respuesta entre instantes de muestreo consecutivos. Se dispone de tres metodos de uso comun que permiten conocer la respuesta entre dos instan:::~ de muestreo consecutivos:
\.
..,
3.
~.qui se estudiara brevemente el metodo de la transformada de Laplace. EI metodo de la transformada :: modificada se presenta en el apendice 8. (Aquellos lectores interesados en la transformada z modi::.:ada deberan leer la seccion 8-4.) EI metoda en el espacio de estados se estudiara en la seccion 5-5.
El metoda de la transformada de Laplace. Considere, por ejernplo, el sistema que se muestra en la figura 3-27. La salida C(s) se puede dar mediante
c(t) -: [C(s)] -:
_ -1
(3 -59 )
La ecuacion (3-59) dara la respuesta en tiempo continuo e(t). Por tanto, la respuesta en cualquier tiempo entre dos instantes de muestreo consecutivos se puede calcular con la ecuacion (3-59). [Vease el problema A-3-18 para una muestra del calculo del segundo miembro de la ecuacion (3-59).]
122
Capitulo 3
G(z)
Y(z) X(z)
+ bmz- m + anz n ,
n"2m
(3-60)
donde las a, y las b, son para muchos controladores digitales coeficientes reales (algunos de estos pueden ser cero). La funci6n de transferencia pulso es de esta forma. Por ejemplo, la funci6n de transferencia pulso para el controlador PID dado por la ecuaci6n (3-56) se puede expresar en la fonna de la ecuaci6n (3-60), como sigue:
x(k)
x(k -
1)
X(z)
..
Figura 3-34 Funci6n de transferencia pulso mostrando un retardo de una unidad de tiempo.
:~::
:- 3-6
123
a, b,
b o = K; + K 1 + K D
=
-(Kp + 2K D )
b2 = K D Ahora se estudiaran las formas de programaci6n directa y estandar de los filtros digitales. En :::<as formas de programaci6n, los coeficientes a, Y hi (que son cantidades reales) aparecen como -~ltiplicadores en el diagrama de bloques de la realizaci6n. Aquellos esquemas de diagramas de :-,''iuesdonde los coeficientes a, Yhi aparecen de manera directa como multiplicadores se denominan c_' .ructuras directas.
Programacion directa. Considere el filtro digital dado por la ecuaci6n (3-60). N6tese que la de transferencia pulso tiene n polos Y m ceros. En la figura 3-35 se muestra un diagrama de -0'iues de la realizaci6n del filtro. El hecho de que este diagrama de bloques representa la ecuaci6n ~-60) se puede ver facilmente, puesto que a partir del diagrama de bloques se tiene
Y(z) = -ajz-1y(z) - a2z-2y(Z) - ... - anz-ny(z)
~~nci6n
+ boX(z) + bmz-mX(z)
+ bjz- 1X(z) +
.;,] reordenar esta ultima ecuaci6n se obtiene la ecuaci6n (3-60).
y(z)
(:
Figura 3-35
124
Capitulo 3
Este tipo de realizacion se denomina programacion directa. Programacion directa significa que se obtiene la realizacion del numeradory el denominador de la funcion de transferencia pulso mediante conjuntos de elementos de retraso por separado. El numerador utiliza un conjunto de m elementos de retraso y el denominador utiliza un conjunto diferente de n elementos de retraso. De esta manera, el nurnero total de elementos de retraso utilizados en la programacion directa es m + n. El numero de elementos de retraso empleados en la programacion directa se puede reducir. De hecho, el numero de elementos de retraso se puede reducir de n + man (donde n ~ m). El metodo de programacion que utiliza el numero minima posible de elementos de retraso se denomina programa-
cion estandar.
En la practica, se trata de utilizar el numero minima de elementos de retraso en la realizacion de una funcion de transferencia pulso dada. Por tanto, la programacion directa que requiere un numero de elementos de retraso mayor que el valor minimo es mas 0 menos de valor acadernico mas que de valor practice.
Programacion estdndar. Como se establecio previamente, el numero de elementos de retraso requeridos en la programacion directa se puede reducir. De hecho, el numero de elementos de retraso utilizados en la realizacion de la funcion de transferencia pulso dada par la ecuacion (3-60) se puede reducir de n + man (donde n ~ m) mediante el reacomodo del diagrama de bloques, como se estudiara aqui. Primero, se rescribe la funcion de transferencia pulso Y(z)/X(z) dada por la ecuacion (3-60) como sigue:
donde
Y(z) H(z)
y
(3-61)
H(z) X(z)
(3-62)
Entonces, se dibuja el diagrama de bloques para los sistemas dados por las ecuaciones (3-61) y (3-62). respectivamente. Para dibujar el diagrama de bloques, se puede rescribir la ecuacion (3-61) como
Y(z)
y la ecuacion (3-62) como
(3-63)
H(z)
(3-64)
Entonces, a partir de la ecuacion (3-63), se obtiene la figura 3-36a). De modo similar, se obtiene la figura 3-36b) a partir de la ecuacion (3-64). La combinacion de estos dos diagramas de bloques da el diagrama de bloques para el filtro digital G(z), como se muestraen la figura 3-36c). EI diagrama de bloques de Ia realizacion como se presento aqui esta basado en la programacion estandar, Note que solo se utilizan
n elementos de retraso. Los coeficientes aI' a-, ... .a; aparecen como elementos de realimentacion.y
los coeficientes bo, b., ... .b; aparecen como elementos de prealimentacion.
bo
1---------------------,
H(z)
Ylz)
a)
Xlz)
' - - - - - - - - - - - - - - ; 8m
'---------------------; 80
b)
X(zl
Y{z)
L-------------i
8m
L---------------------l
el
80
Figura 3-36 a) Diagrama de bloques de la realizaci6n de la ecuacion (3-63); b) diagrama de bloques de la realizacion de la ecuacion (3-64); c) diagrama de bloques de la realizacion del filtro digital dado por la ecuacion (3-60) mediante prograrnacion estandar.
125
126
Capitulo 3
Los diagram as de bloques en las figuras 3-35 y 3-36c) son equivalentes, pero el ultimo utiliza n elementos de retraso, mientras que el formal utiliza n + m elementos de retraso. Obviamente, se prefiere el ultimo diagrama, el cual utiliza un numero mas pequeno de elementos de retraso.
Comentarios. Observe primero que utilizar un numero minimo de elementos de retraso ahorra espacio en memoria en los controladores digitales. Tambien utilizar un numero minima de puntos suma es conveniente. En la realizaci6n de controladores 0 filtros digitales, es importante tener un buen nivel de exactitud. En esencia, son tres las fuentes de error que afectan la exactitud:
1.
El error debido a la cuantificaci6n de la seftal de entrada en un numero finito de niveles discretos. (En el capitulo 1 se discuti6 este tipo de error, el cual se puede considerar como una fuente aditiva de ruido, denominado ruido de cuantificacion. Este se puede considerar como ruido blanco; la varianza del ruido es cl = Q 2/ 12.) El error debido a la acumulaci6n de los errores de redondeo en las operaciones aritrneticas en el sistema digital. El error debido a la cuantificaci6n de los coeficientes a, y hi de la funci6n de transferencia pulso. Este error puede hacerse mas grande a medida que el orden de la funci6n de transferencia pulso se incrementa. Esto es, en filtros digitales de orden superior en la estructura directa, los errores pequefios en los coeficientes a, Y hi causan grandes errores en las localizaciones de los polos y los ceros del filtro digital.
2. 3.
Estos tres errores surgen debido a las limitaciones practicas del numero de bits que representa a las muestras de la sefial y a los coeficientes. Observe que el tercer tipo de error se puede reducir mediante la descomposici6n matematica de las funciones de transferencia pulso de orden superior en una combinaci6n de funciones de transferencia pulso de orden pequefio, De esta forma, el sistema se puede hacer menos sensible a la inexactitud de los coeficientes. Para la descomposici6n de funciones de transferencia pulso a fin de evitar el problema de sensibilidad de los coeficientes, se utilizan por 10 regular los tres enfoques siguientes. 1. 2. 3. Programaci6n en serie Programaci6n en paralelo Programaci6n en escalera
Programacion en serie. El primer enfoque empleado para evitar el problema de sensibilidad consiste en implantar la funci6n de transferencia pulso G(z) como una conexi6n en serie de funciones de transferencia pulso de primero y segundo orden. Si G(z) se puede escribir como un producto de funciones de transferencia pulso G\(z), GzCz), ... , G/z), 0
G(z)
G j ( z ) G2(z)'" Gp(z)
entonces el filtro digital para G(z) puede estar dado como una conexi6n en serie de las componentes de filtros digitales GJ(z), GzCz), ... , G/z), como se muestra en la figura 3-37. En la mayorta de los casos, las Gj(z) (i = 1, 2, ... , p) se eligen como funciones de primero 0 segundo orden. Si los polos y ceros de G(z) son conocidos, G,(z), GzCz), ... , G/z) se pueden obtener agrupando un par de polos complejos conjugados y un par de ceros conjugados para producir una
:~::i6n
3-6
127
Ylz)
Figura 3-37 Fittro digital G(=l descompuesto en una conexi6n en serie de G,(=), G,(=), ... , G/=).
runcion de segundo orden, 0 agrupando polos y ceros reales para producir funciones ya sea de prirnero 0 segundo orden. Por supuesto, es posible agrupar dos ceros reales con un par de polos cornplejos conjugados, 0 viceversa. La agrupaci6n es, en un sentido, arbitraria. Es preferible hacer la agrupacion de formas diferentes para ver cual es la mejor con respecto al numero de operaciones aritrneticas requeridas, los rangos de los coeficientes, etcetera. Para resumir, G(z) se puede descomponer como sigue:
TIl
TI
Y(Z) X(z)
y para
+ bjz- I 1 + a.z:'
(3-65)
Y(z) X(z)
(3-66)
se muestran en las figuras 3-38a) y b), respectivamente. El diagrama de bloques para el filtro digital G(z) es una conexi6n en serie de p componentes de filtros digitales como los que se muestran en las figuras 3-38a) y b).
Programacion ell para/e/o. El segundo enfoque para evitar el problema de sensibilidad de los coeficientes es expandir la funci6n de transferencia pulso G(z) en fracciones parciales. Si G(z) se expande como una suma de A, G](z), Glz), ... , G,/z), 0 de modo que
G(z) = A + G1(z) + G 2(z) + ... + Gq(z)
don de A es simplemente una constante, entonces el diagrama de bloques para el filtro digital G(z) se puede obtenercomo una conexion en paralelo de q + I filtros digitales, como se muestra en la figura 3-39. Debido a la presencia del termino constante A, las funciones de primero y segundo orden se pueden elegir en formas sencillas. Esto es, G(z) se puede expresar como
+
+
I
i=1
Gj(z)
I
i=j+l
= A
b
1 + a,z-I
Y(z) X(z)
j
-I
j=]
(3-67)
128
Capitulo 3
x(k)
y(k)
X(z)
y(z)
~ = 1
X(z)
+ b;Z-1
1 + a;z-1
a)
X(z)
Y(z)
_ 1
X(z)
(3-65); b)
Figura 3-38 a) Representaci6n mediante diagrama de bloques de la ecuacion representaci6n mediante diagrama de bloques de la ecuaci6n (3-66).
y el correspondiente para
>::::n3-6
129
, kI
y(kl
Y(z)
'" zl
Figura 3-39 Filtro digital G(=) descompuesto en una conexion en paralelo de A, G,(=), G,(=), ... , G/z).
=- _150 G(z)
1 G(z) = A o + - - - - - - - - - - - - 1 BIz + - - - - - - - - - - - 1 Al + - - - - - - - - - 1 B 2z + - - - - - - 1
(3-69)
An-I
+ ----,1 Bnz + A
n
G;
G;
(A)(
Z) ) _
1 Biz + GIA)(z)' 1
1,2, ... .n - 1
130
Ccpltuk
x(k) X(z)
y(k) Y(z)
a)
x(k) X(z)
y(k) y(z)
ej + f j z - 1
1+
c;Z-' + a,Z-2
b)
Figura 3-40 a) Representaci6n mediante diagrama de bloques de la ecuaci6n (3-67); b) representaci6n mediante diagrama de bloques de la ecuaci6n (3-68).
Se explicara este metoda de programaci6n mediante un ejemplo sencillo donde n = 2. Esto eli
G(z)=A o +
BIz
1 1 1
B 2z
+
A +
I
+A
131
vlediante el usa de las funciones Gj(A) (z), G[Rl (z) Y Gi R ) (z), la funcion de transferencia G(z) se puede escribir como sigue:
G(z) = A o +
A o + GIB)(z)
(3-70)
X(z) - GiA)(z)Y;(z)
R
B;zY;(z)
E I diagrama de bloques para la Gi ) (z) dada par la ecuacion (3-70) se muestra en la figura 3-41 a). De .nanera similar, el diagrama de bloques para la Gi A l (z), que puede estar dado par
y;(k)
a)
y;(k)
A;
b)
Figura 3-41 a) Diagrama de bloques para G,(8)(Z) dado por la ecuacion (3-70); b) diagrama de bloques para G,II) (z) dado por la ecuacion (3-71).
132
Capitulo 3
(3-71)
o
X;(z) - Gi~l(z)Y;(z)
Ai Y;(z)
Mediante la combinacion de las dos componentes de los filtros digitales, como se muestra en la figura 3-42a), es posible dibujar el diagrama de bloques del filtro digital G(z) como puede apreciarse en la figura 3-42b). [Observe que las figuras 3-42a) y b) corresponden al caso donde n = 2.]
Comentarios. Los filtros digitales basados en la programacion en escalera tienen ventajas respecto a la sensibilidad y exactitud de los coeficientes. La realizacion de la estructura en escalera se logra mediante la expansion de la G(z) en fracciones continuadas alrededor del origen. Se observa que la expansion en fracciones continuadas dada por la ecuacion (3-69) no es la unica forma posible. Existen algunas maneras diferentes para construir la estructura de escalera. Por
xlk)
x(z)
CD +
A,
al
b)
Figura 3-42 a) Diagramas de bloques componentes para la programaci6n en escalera de G(z) dada par la ccuaci6n (3-69) cuando n = 2; b) combinacion de los diagramas de bloques componentes que muestra la programaci6n en escalera de G(z).
Secci6n 3-6
133
ejemplo, un filtro digital G(z) se puede estructurar como una expansion en la forma de fracciones continuadas alrededor del origen en terminos de z -I, como sigue:
G(z)
1 = Ao + - - - - - - - - - - - - -
B1z- 1 + - - - - - - - - - - - - - 1 Al + - - - - - - - - - - 1 B z -I + ---: _
2
A n- I +
Bnz- I + -,An
Tambien, en lugar de G(z), su inversa l/G(z) se puede expandir en la forma de fracciones continuadas en terminos de z 0 de z -I con la finalidad de Ilevar a cabo la programacion en escalera.
Ejemplo 3-8 Obtenga los diagramas de bJoques para la funcion de transferencia pulso del sistema (un filtro digital) mediante I) programaci6n directa, 2) programacion estandar y 3) programacion en escalera:
Y(z) X(z)
G() z
= 1 + O.5z
2 - O.6z-
I. Programaci6n directa. Puesto que la funcion de transferencia puJso dada se puede escribir como
Y(z) X(z)
donde
= H(z)
= (1 -
-I 2 O.3z ) 1 + O.5z- 1
x(k)
X(z)
y(k)
y(z)
= (2 -
0.6;:")/(1 +
134
Capitulo 3
Los diagramas de bloques de las realizaciones de estas dos ultimas ecuaciones se muestran en la figura 3-44a) y b), respectivamente. Si se combinan estos dos diagrarnas, se obtiene el diagrarna de bloques para el filtro digital Y(z)/X(z), como se muestra en la figura 3-44c). N6tese que el numero de elementos de retraso requeridos se ha reducido a I mediante la programacion estandar,
3. Programacion en escalera. Primero se rescribira Y(z)/X(z) en la forma de escalera como sigue:
Y(z) X(z)
= G(z) = 2z
- 0.6 z+0.5
1 = 2 + ~ = 2 + _ _---=-__
z+0.5
1 -0.625z + -3.2
De este modo, A o = 2 Y
1 1 -0.625z + -3.2
1
-1.6 z y(k)
0.3125
h(k)
H(z)
VIz)
a)
xlk)
X(z)
hlk - 1)
b)
x(k)
X(z)
y(k)
Ylz)
c)
Figura 3-44
+ 0.5z- I ) ; c)
:~::i6n
3-6
135
X1z!
Y(z)
Figura 3-45 Diagrama de bloques de la realizacion de Y(z)/X(z) = (2 - O.6z- ' )/(l + O.5z- ') (programacion en escalera).
+ GlB)(z)X(z)
Refiriendose a la figura 3-4Ia) para el diagrarnade bloques de Gill!) (z), se obtiene el diagramade bloques del filtro digital Y(z)/X(z) como se muestra en la figura 3-45. Notese que solo se necesita un elemento de retraso.
Fittro de respuesta al impulso injinita y jiltro de respuesta al impulso jinita. Los filtros digitales se pueden clasificar de acuerdo con la duracion de la respuesta al impulso. Considere un filtro digital definido mediante la siguiente funcion de transferencia pulso:
bo + 1 + al z
biZ-I
1
(3-72)
Ahora, considere un filtro digital donde los coeficientes a, son todos cero,
donde
Y(z) -- = X(z)
b0 + b IZ -I + b2Z -2 +
...
+ b
m
Z -m
(3-73)
y(k)
La respuesta al impulso del filtro digital definido mediante la ecuacion (3-73) esta limitado a un numero finito de muestras definidas sobre un rango finito de intervalos de tiempo; esto es, la respuesta
136
Capitulo 3
impulso es una secuencia finita. Este tipo de filtro se denominafiltro de respuesta al impulsofinita. Tambien se denominafiltro no recursivo, ofiltro de promedio movil. En una realizacion no recurs iva, el valor presente de la salida depende solo de los valores presente y pasados de la entrada. EI filtro de respuesta al impulso finita se puede reconocer por la ausencia de las a, en el diagrama de bloques de la realizacion.
Realizacion de un flltro de respuesta af impufso fin ita. Ahora se considerara la realizacion de un filtro de respuesta al impulso finita. La secuencia de la respuesta al impulso finita (secuencia de ponderacion) del filtro digital se define como g(kT). Si la entrada x(k7) se aplica a este filtro, entonces la salida y(k7) puede estar dada mediante
k
y(kT)
= L g(hT)x(kT
h~O
- hT)
(3-74)
La saliday(k7) es una sumatoria de convolucion de la seftal de entrada y la secuencia de la respuesta al impulso. EI segundo miembro de la ecuacion (3-74) consta de k+ I terminos. De este modo, la salida y(k7) esta dada en terminos de las k entradas anteriores x(O), x(I), ... ,xk - 1)7) Yla entrada actual x(k7). Note que a medida que k se incrementa no es fisicamente posible procesar todos los valores anteriores de la entrada para producir la salida actual. Se necesita limitar el numero de valores anteriores de la entrada a procesar. Suponga que se decide emplear los N inrnediatos valores anteriores de la entrada xk - 1)7), xk - 2)7), ... ,xk- N)7) y la entrada actualx(kT). Esto es equivalente a aproximar el segundo miembro de la ecuacion (3-74) mediante los N + I valores anteriores de la entrada mas reciente incJuyendo el valor actual, 0
y(kT) = g(O)x(kT)
(3-75)
Debido a que la ecuacion (3-75) es una ecuacion en diferencias, el correspondiente filtro digital en el plano z se puede obtener como sigue. AI tomar la transformada z de la ecuacion (3-75) se tiene
Y(z)
(3-76)
x(k)
X(Z)
g(O)
L-
------
---
-=_:"::_===::=;;a,,/
y(k)
Y(Z)
Figura 3-46
:ecci6n 3-6
137
En la figura 3-46 se muestra un diagrama de bloques de la realizaci6n de este filtro. Las caracterlsticas del filtro de respuesta al impulso finita se pueden resumir como sigue:
I.
2.
3. 4.
EI filtro de respuesta al impulso finita es no recursivo. De esta manera, debido a la falta de realimentaci6n, la acumulaci6n de errores de las salidas anteriores se puede evitar en el procesamiento de la serial. La implantaci6n del filtro de respuesta al impulso finita no requiere de realimentaci6n, de modo que la programaci6n directa y la programaci6n estandar son identicas. Tambien, la implantaci6n se puede lograr mediante convoluci6n de alta velocidad mediante la transformada rapida de Fourier. Los polos de la funci6n de transferencia pulso del filtro de respuesta al impulso finita estan en el origen, y por 10 tanto este es siempre estable. Si la seflal de entrada incluye componentes de alta frecuencia, entonces el nurnero de elementos de retraso necesarios en el filtro de respuesta al impulso finita se incrementa y la cantidad de tiempo de retraso se alarga. (Esto es una desventaja del filtro de respuesta al impulso finita comparado con el filtro de respuesta al impulso infinita.)
Ejemplo 3-9 EI filtro digital que se estudio en el ejemplo 3-8 es un filtro recursivo. Modifique este filtro y haga su realizacion como un filtro no recursivo. Luego obtenga la respuesta de este filtro no recursivo a una entrada delta de Kronecker. AI dividir el numerador del filtro recursivo G(z) entre el denominador, se obtiene
G(z)
=2
1 + 0.5z
- 0.6z-
1 1 -
= 2 - 1.6z + 0.8z 2
0.4z 3 + 0.2z 4
0.lz 5 + 0.05z 6
0.025z 7 + ...
Al truncar de manera arbitraria esta serie en z -7, se obtiene el filtro no recursivo adecuado, como sigue
~~:~ = 2 -
1.6z 1 + 0.8z 2
0.4z 3 + 0.2z 4
0.lz 5
+ 0.05z 6
0.025z 7
(3-77)
En la figura 3-47 se muestra el diagrama de bloques para este filtro digital no recursivo. Note que se requiere de un nurnero grande de elementos de retraso para obtener un buen nivel de exactitud. Observe que el filtro digital es la transforrnada z de la secuencia de la respuesta al irnpulso, la transforrnada z inversa del filtro digital da la secuencia de la respuesta al impulso. Al tomar la transforrnada z inversa del filtro no recursivo dado por la ecuacion (3-77), se obtiene
y(kT)
yeO) yeT)
= =
2
-1.6
138
Capitulo:
y(k) Y(z)
Figura 3-47 Diagrama de bloques para el filtro digital dado por la ecuacion (3-77) (forma no recurs iva).
-0.1
0.05
= -0.025
La secuencia de la respuesta al impulso para este filtro digital se muestra en la figura 3-48.
y(k)
0
-1
-2
Figura 3-48 Secuencia de la respuesta al impulso para eI filtro digital dado por la ecuacion (3-77).
::::pitulo 3
Problemas de ejemplo
y soluciones
139
:
;'
2T
3T
4T
5T
6T
7T
Obtenga la expresi6n para y(t). Luego encuentre yes) y obtenga la funci6n de transferencia del retenedor de orden cero. Solucion A partir de la figura 3-49 se obtiene
yet) = x(D)[l(t) - l(t - T)] + x(T)[l(t - T) - l(t - 2T)] + x(2T)[1(t - 2T) - l(t - 3T)]
La transformada de Laplace de Yet) es
+ ...
yes)
= x(O)( ; - ~ + x(T) ~
+x(2T) (~
=
~TS)
(-TS
-ZTS)
-ZS T
-~ + ...
-3Ts)
=1donde
Ts
X*(s)
X*(s) =
k-O
kT)]
hO
yes) X*(s)
1 - e- Ts s
Problema A-3-2 Considere un retenedor de primer orden precedido por un muestreador. La entrada al muestreador es x(t) y la salida del retenedor de primer orden esy(t). En el retenedor de primer orden la saliday(t) para kT5, t < (k + I )Tes la linea recta que es la extrapolacion de los dos valores muestreados precedentes, x((k- I)T) Yx(kT). como se muestra en la figura 3-50. La ecuacion para la saliday(t) es
kT:s; t < (k
+ l)T
(3-78)
Obtenga la funci6n de transferencia del retenedor de primer orden. suponiendo una funcion sencilla tal como un impulso en t = 0 como la entradax(t).
140
x(t)
v(t) v(t)
Capitulo 3
I
I I I
-T
2T
3T
4T
5T
6T
Solucion Para una entrada impulso de magnitud x(O) tal que x*(t) = x(O)o(t), la saliday(t) dada por la eeuaei6n (3-78) se eonvierte en la forma de onda que se muestra en la figura 3-51. La expresion numerica paray(t) es
yet) = X(O)(1 +
~ )l(t) -
[ 2x(O) + 2x(O) t
2T)
~ T }(t - T)
yes)
= x(O) ( ; +
Ts z - 2x(O)
1)
(-TS
~ + eTs Z + x(O)
-TS)
(-ZTS
+ eTs Z
-ZTS)
= x(O)(l - ze? +
= x(O)
e-2Ts)(~ + ~z)
e-Ts)Z
TST~
1 (1 _
v(t)
Slope
= x(O)
x!O)
/
/
-,
-,
-,
-,
-,
-,
2T
-T
T
Figura 3-51 Curva de salida del retenedor de primer orden cuando la entrada es una funcion impulso.
Slope
= _ x(O)
Capitula 3
141
Por tanto
X* (s)
.P[x* (t)]
.P[x(0)8(t)]
x(O) Ts
G () hI s
Problema A-3-3 Considere la funci6n
= yes) = Ts + 1(1 - e- ) 2
X*(s) T s
Xes) = 1 - es
Ts
yes)
tiene un polo simple en s
=
= 1 -S:-Ts
O.
Solucion Si la funci6n de transferencia incluye un termino trascendente reemplazar mediante una serie valida en la vecindad del polo en cuesti6n. Para la funci6n
",
Xes)
= 1 - es
Ts
(3-79)
se obtendra la expansi6n en series de Laurent alrededor del polo en el origen. Puesto que, en la vecindad del origen, e- n- se puede reemplazar por
(3-80)
- ... ]
T 2S T 3S2 2! 3! que es la expansi6n en series de Laurent de Xes). A partir de esta ultima ecuaci6n se ve que s = 0 no es un polo de Xes).
T--+---'"
yes)
= -; - 2T + 3! - ...
0
T2
T 3s
es un polo simple.
Problema A-3-4 Muestre que la transformada de Laplace del producto de dos funciones jet) y get), de las cuales se garantiza que la transformada de Laplace existe, puede estar dada por
142
Capitulo 3
.'[f(t)g(t)]
Soluci6n
1 2TTj
C JX
+
X
C-J
F(p)G(s - p)dp
(3-81)
.'[f(t)g(t)]
Observe que la integral de inversion es
r
+
f(t)g(t)e- st dt
(3-82)
f(t)
1 -2.
TTl
JX
. F(s)eslds,
t > 0
C-JX
1 .'[f(t)g(t)] = -2' LX
TTl
0
C JX
. F(p)eptdpg(t)e-stdt
C-J X
Debido a la convergencia uniforme de las integrales consideradas, se puede invertir el orden de integracion:
.'[f(t)g(t)]
Si observamos que
1 -2.
TTl
C JX
. F(p)dp LX g(t)e-(s-p)tdt
0
C-JX
r
x* (r) =
g(t)e-(s-P)tdt = G(s - p)
obtenemos
.'[f(t)g(t)]
1 + = 2TTj C-JX
C jX
F(p)G(s - p)dp
(3-83)
2: x(t)o(t k~O
kT) = x(t)
2: o(t
k~O
- kT)
(3-84)
x*(s)
.'[X(t)
= -2. TTl
Soluci6n
k~O o(t -
kT)]
C jX +
C-J X
. X(p) 1 _
1 -Tls-p)dp
(3-85)
donde
f(t)
y observando que
x(t)
get)
2: o(t
k~O
- kT)
:::apitulo 3
Problemas de ejernplo
y soluciones
143
se tienc
1 - e
Puesto que
Ts
1
e Ts
se ticne
G(s - p) = 1 _ e
1
T(s
p)
Observe que los polos de 1/[1 - e- /(' - I' l] se pueden obtener al resolver la ecuacion
1o
e-T(s-p)
-T(s - p) = j27Tk,
de modo que los polos son
k = 0,1,2, ...
=s
.27T
=s
. k JWs
k = 0,1,2, ...
donde w., = 2 ttt T. De est a manera, existe una infinidad de polos simples a 10 largo de una linea paralela al eje jw. La transformada de Laplace de x*(t) ahora se puede escribir como
X* (s) =
.;e[x(t) ~o 8(t 1
fC+j~
c-j~
kT)] 1 (3-86)
= -2-. nJ
X (p ) -l----:OT""'"(S---"p) dp
-
donde la integraci6n es a 10largo de una linea desde c - jX hasta c + jX paralela al eje imaginario en el plano p. separa los polos de X(P) de los polos de 1/[1 -e- /(' - I' l ] . La ecuaci6n (3-86) es la integral de convoluci6n. Es un hecho bien conocido que dicha integral se puede evaluar en terminos de los residuos mediante un contorno cerrado que consista de una linea desde c - jX hasta c + jX Y un semicirculo de radio infinito en eI semiplano Izquierdo 0 derecho, dado que la integral a 10 largo del circulo que se anadio es una constante (ya sea cero 0 distinta de cero). Existen dos formas de evaluar esta integral (una utilizando un semicirculo infinito en el semiplano izquierdo y otra con un semicirculo infinito en el semiplano derecho): se consideraran estos dos casos por separado en los problemas A-3-6 y A-3-7.
L [reSidUO de
1- e
(3-87)
144
Capitulo 3
k residua de
I l
z_
_ hi.
x(s)z]
L..
j=h+ 1 S-Sj
. x(s)z] hm [ (s -Sj)~ Z e
donde se supone queX(z) tiene h diferentes polos multiples y m - h polos simples (m e: h). Se supone que los polos de Xes) estan en el semiplano Izquierdo y que Xes) se puede expresar como el cociente de polinomios en s, 0
Xes)
= q(s)
pes)
donde q(s) y pes) son polinomios en s. Tarnbien se supone quep(s) es de mayor grado en s que q(s), 10 cual significa que
IimX(s) = 0
s-->OO
Solucion Se evaluara la integral de convoluci6n dada por la ecuaci6n (3-86) mediante un contomo cerrado en el semiplano Izquierdo del plano p, como se muestra en la figura 3-52. Utilizando este contorno cerrado, la ecuaci6n (3-86) se puede escribir como
X* (s)
2----:
1 TTJ
oo
+/
. X(p) 1 _
C-/OO
T(s-p) dp
2~11 - X(!)s_Pldp TT JJ e
1 - -2 1 X(!)s_p)dp TT J rc - e
.J
(3-88)
don de el contomo cerrado consiste en una linea desde c - joo hasta c + joo y que, a su vez, consiste en un semicirculo de radio infinito y las lineas horizontales en j y _joo, mismas que conectan la linea desde c _joo hasta c + joo con el semicirculo en el semiplano izquierdo del plano p. Se elige un valor de c tal que todos los polos de X(P) esten a la izquierda de la linea desde c - joo hasta c + joo y todos los polos de 1/[1 - e-7(s-P)] esten ala derecha de esta linea. EI contomo cerrado encierra a todos los polos deX(p), mientras que los polos de 1/[1 - e-T(s-p)] estan fuera del contomo cerrado. Debido a que se ha supuesto que el denominador deX(s) es de orden mayor en s que el numerador, la integral a 10 largo de T; (el semicirculo infinito en el semiplano Izquierdo mas las lineas horizontales en jooy_joo, las cuales conectan a la linea desdec- joo hastac +joo con el semicirculo) se desvanece. Por tanto,
rr,
(3-89)
:::apitulo 3
145
planop
x x
x
x
x
Re
x x
x
x
x
x
'----.,--J
1
Polosde 1 _ e-T1. -pi
Figura 3-52
X(z) =
LJ
~ [ . de residuo
--r.-p
X(z) =
LJ
~[. de residuo
.. , Sm'
(3-90)
Si un polo en s =
. K, = lim [ (s S-5j
Sj)---Ts Z - e
X(S)z]
(3-91)
Si un polo en s
(3-92)
Par tanto, si Xes) tiene un polo multiple Sl de orden n l , un polo multiple S2 de orden n-; ... , un polo multiple Sh de orden n.; Y palos simples Sh + I' Sh +2' . . , Sm' entonces XC::) dada par la ecuacion (3-90) se puede escribir como
X(z) =
L [ residua de
146
Capitulo 3
- 2: (n,. _ 1),hm .
i= 1
_ hI.
s----""s,
ni 1 [ ds n i - 1
(s - Si)'--=-r; z e
X(S)Z]
j=h+
X~S)~s] e
(3-93)
donde n, es el orden del polo multiple en s = s; Problema A-3-7 Refiriendose a la ecuacion (3-86), rescrita como
X (s) - -2.
_ 1
fC+j~
C-J~
TTJ
X(p) . 1 _ e -T(s-p)dp
muestre que al realizar esta integracion en el semiplano derecho del plano p, Xes) puede estar dada por
X*(s)
T 2:
k=-:x>
Xes + jwsk)
(3-94)
siempre y cuando el denominador de Xes) sea de grado dos 0 mayor en s que el grado del numerador. Muestre que si el denominador deX(s) es solo un grado mayor en s que el grado del numerador entonces
2x (O+ )
(3-95)
Soluci6n Evaluese la integral de convolucion dada por la ecuacion (3-86) en el semiplano derecho del plano p. Elijase el contomo cerrado que se muestra en la figura 3-53, el cual consiste en una linea desde c - jX hasta c + jX Y R, la porcion de un semicirculo de radio infinito en el semiplano derecho del plano p que esta a la derecha de esta linea. El contomo cerrado encierra a todos los polos de 1/[1 _e- 1"(s - p )] , pero no encierra a ninguno de los polos de X(P). Ahora Y{s) se puede escribir como
X*(s)
p)dp
=_11,
2TTjT 1 - e
p)
d P
(3-96)
Se investigara la integral a 10largo de R, la porcion del semicirculo infinito a la derecha de la linea desde c-jx hasta c +j'YO. Puesto que una infinidad de polos de 11[1 - e-n,-P)] estan sobre una linea paralela al ejejw, la evaluacion de la integral a 10largo de R no es tan sencilla como en el caso anterior, donde el contomo cerrado encierra un numero finito de polos deX(p) en el semiplano Izquierdo del plano p. En la mayoria de los sistemas de control reales, a medida que s tiende a ser mas grande, Xes) tiende a cero por 10menos tan rapido como lis. Por tanto, a continuacion se consideran dos casos, uno donde el denominador de X(s) es de dos grados 0 mas en s que el grado del numerador y otro donde el denominador de X(s) es de un grado mayor en s que el grado del numerador.
Caso 1: Xes) Posee por 10 menos dos polos mas que ceros. Con referencia a la teoria de la variable compleja, se puede mostrar que la integral a 10largo de rR es cero si el grado del denominador pes) de Xes) es mayor por 10menos en 2 que el grado del numerador q(s); esto es, si Xes) posee por 10menos dos polos
mas que ceros, 10cual implica que
limsX(s)
= x(O+) = 0
::opitulo 3
147
)(
o
x
Re
Polos de ---':::,---,
1-
e-T(,-p)
Figura 3-53
(3-97)
La integral a 10 largo del contorno cerrado dada por la ecuacion (3-97) se puede obtener mediante la evaluacion de los residuos en el numero infinito de polos en p = s jt, k. De este modo. X*(s) =
EI signa menos al principio del segundo miembro de esta ultima ecuacion viene del hecho de que en la integracion a 10largo de un contorno, la trayectoria r R se toma en la direccion de las manecillas del reloj. At emplear la regia de L'Hopital, se obtiene X*(s) =
148
Capitulo 3
N6tese que
se tiene
X*(s)
De este modo,
~ X(s + jwsk)
k~ - x
(3-98)
X(z)
1 Tk'!:x X(s
x
+ jwsk) s~(l!T)lnz
\
(3-99)
Observe que esta expresi6n de la transformada:: es util para probar el teorema de muestreo (vease la seccion 3-4). Sin embargo, es muy tedioso obtener las expresiones de la transformada:: de funciones comunmente encontradas mediante este rnetodo.
Caso 2: X(s) tiene un denominador de un grado mayor en s que el grado del numerador. Para cste caso. limH X sX(s) = x(O+) 0 < oc y la integral a 10 largo r/l no es cero. [EI valor distinto de cero esta asociado con el valor inicial x(O+) dex(t).] Se puede mostrar que la contribuci6n de la integral a 10 largo de r/l en la ecuaci6n (3-96) es -1x(O+). Esto es,
1 2rrj
J
I"R1 -
x(p)
e
T(s
p)dp
-2 x (O+)
(3-100)
x(t) = {
~~a1,
t t
2:
<0
1 X(s) = - s +a
Es claro que lim,-c> sX(s) = x(O+) = 1,0 que la funcion tiene un saIto discontinuo en t = O. Por tanto se debe utilizar la ecuacion (3-95). Con referencia a esta ccuacion, se tiene 1 1 x X*(s) = - ~ X(s + jw,k) + 2x(O+) T k~
7
7.
= -1 {
:= coitulo 3
149
=-
=
=
1[i:
l.-[ i:
27T
k-l
1] 1
2
+~] + !
s +a
(3-101)
- - +e W
00
k-l
2: -+- + x2 k2 X
s
2x
y observando que
27T-- = T(s
Ws
+a
+ a)
11+
2
+ 2"
e-T(s+a)
1-
e-T(s+a)
12
e T(s+a)
e-T(s+a)
2" 1 -
1
o
X(z) = 1
1 - e
aT
De este modo. se ha obtenido X(z) mediante la integral de convolucion en el semiplano derecho. [Este proceso para obtener la transformadaz es muy tedioso debido a que esta involucrada una serie infinita de Xes + jw, k). Este ejemplo se presenta solo con propositos de demostracion, Se deben utilizar otros rnetodos para obtener la transformada z.]
X(s)
= (s + 1)2(s + 2)
150
Capitulo 3
X(s)
se tiene
2 1 s + 1 - (s + 1)2
2
s
+2
X(z)
1)2 -
Z-I - Te- T
T
2C _)2T Z-I)
2T
Ir
Z-1
2
1- e
2. Metoda de los residuos. Refiriendose a la ecuaci6n (3-93) y observando que X(s) tiene un polo doble en s = -I Y un polo simple en s = -2, se tiene
X(z)
1 (2 _
1)!s~r~.\ds (s + 1) (s + 1)\s + 2) z _ e Ts
d[
z]
+ s~2 lim
2z 2
-
[(s + 2) (
T
2 - 2e- TZ - 1
(1 - e
2
1- e
2T
Problema A-3-10 Considere una senal en tiempo eontinuox(t) eon un espectro en frecuencia limitado cntrc-vco, Y WI' Esto es. X(jW) = 0,
para
W
<-
WI
Y WI <
Pruebe que si esta senal se muestrea con una frecuencia w, > 2w I entonces la transformada de Fourier dex(t) se determina en forma (mica por x(kT), k = ... ,-2, -I, 0, 1,2, ... ,y la serial en tiempo continuo original x(t) puede estar dada por la suma de una serie infinita de muestras de valores ponderadosx(kT) como sigue:
x(t)
k~ ~ x(kT)
oc
ws(t - kT)/2
(Este es el teorema de muestreo de Shannon.) Solucion La transformada de Fourier de x(t) esta dada por
X(jw)
r~ e -Jwl x(t) dt
Defina la versi6n muestreada de x (t) como x*(t). Entonces x*(t) puede estar dada por
x* (t)
= ...
I
k~
-'-
X*(jw) =
J:
eiw1x*(t)dt =
r~ eJW1~~ x(kT)o(t -
kT)]dt
=:Jpitulo 3
151
k=-'Y;.
Asi, .\Uw) esta dctcrrninada en forma (mica por x(k7). k = ... -2. -I. O. 1,2, .... Refiriendose a la ecuaci6n (3-27). la transformada de Fourier de X*(/) puede estar dada por
X*(jw)
Debido a que el espcctro en frecuencia de la senal en tiempo continuo original x(/) esta limitada entre -WI
Y WI' sc tiene
XUW) = O.
t,
.YUW) = O.
<
Por tanto.
X*(jw) =
J['"
T
= !..X(jw)
De este modo. sc obtiene
-~Ws
X(jw)
= {TX*(jW),
0,
:$
w S
!ws
= ~s k~X x(kT) ==
r::
elw(t - kT) dw
00
L..
k--oo
Por tanto. se ha mostrado que la sefial en tiempo continuo original x(t) se puede reconstruir a partir de los datos muestrcados x(k7). [Observe que a rnenos que )(Uw) = 0 para W < -WI Y WI < W la senal en tiempo continuo x(t) no se puede deterrninar a partir de los datos muestreados x(k7). k = .... -2. -I. O. I. 2.... J. Problema A-3-11 Dibuje las curvas de magnitud Y fase para el retenedor de primer orden. Luego compare las caracieristicas de magnitud Y fase del retenedor de primer orden con las del retenedor de orden cera. Solucion La runcion de transferencia del retenedor de primer orden es
152
Ghl(S)
Al sustituir s por jw en Gh1(S), se obtiene
TS;
Ie
Capitulo 3
-se-TSr
= Tjw
+ 1 e- fTW[2j sen.(Tw/2)]2
JW
e
w2
Tjw + 1 _iTw4sen2(Tw/2)
T
Por 10 tanto,
IGhl(jw)1
= T\h
+ T2 wJsen (TW/2)]2
Tw/2
= tan " Tw - Tw
= tan
_121TW
t,
-- --to,
21TW
IGhl(jO)1 IGhl(jf)1
IGhl(j2;)1
= 1.336T
=
Ghl(j~)
-279.0
En la figura 3-54 se muestran las graficas de las caracterfsticas de magnitud y fase del retenedor de primer orden y las correspondientes para el retenedor de orden cero. A partir de la figura 3-54 se observa que tanto el retenedor de primer orden como el retenedor de orden cero no son filtros paso-bajas muy satisfactorios. Estes permiten una transmisi6n significativa arriba de la frecuencia de Nyquist W N = 1T/T. Es importante, por tanto, que la serial sea filtrada con un filtro paso-bajas antes de la operaci6n de muestreo de modo que las componentes de frecuencia mayores a la frecuencia de Nyquist sean despreciables.
Problema A-3-12 Considere el retenedor de orden cero que se muestra en la figura 3-55. A partir del diagrama se tiene
yes) = G(s)X*(s) =
Muestre que
1 - e:"
s
X*(s)
(3-102)
Y*(s)
Soluci6n
Y*(s)
1 (
se
Capitulo 3
153
I G h 1 (jw) I I GhO(jw) I
:
::i
ro
0>
c:
.!.
T
271'
T
371'
T
41f
T
s.
0 -90 -180
T
271'
T
371'
T
471'
T
<,
.......................
/
<,
I GhO (jw)
I
I
,lJi
ill
<l> -0
,~
~ 0>
Figura 3-54 Caracteristicas de magnitud y fase del retenedor de primer orden y las correspondientes al retenedor de orden cero.
Y(z) = Z [
donde
-se
-TS] X(z)
Z [ 1 - se-
T S ] = (1 -
Z-I)Z [1] -s
(1 -
x"(t)
y(t)
G(s)
Figura 3-55
154
Capitulo 3
Por tanto
YCz) = XCz)
En terminos de la notacion de la transformada de Laplace asterisco, esta ultima ecuacion se pucde escribir como
Y*Cs)
X*Cs)
I, 2 Y 3, respectivamente. Para n
=
Solucion
1, se tiene
G1Cz)
+ az :'
1 - az- 1 + a 2 z - 2
a3z- 3 +
Por tanto, se encuentra que la secuencia de ponderaci6n g](k) es glCk) Para n = 2, se obtiene
=
(-a)k
1 - az- 1
=
1 - 2az-]
+ 3a2z- 2
4a3z- 3 +
Para n
3, se tiene
1 - 2az- 1
Problema A-3-14 Obtenga la salida en tiempo discreto C(z) del sistema de control en lazo ccrrado que se muestra en la figura 3-56. Tambien obtenga la salida en tiempo continuo C(s).
R(s)
CIs)
H(s)
Capitula 3
iSS
Soluci6n
Par tanto.
M(s)
M*(s)
o
C(z)
= G2(z)G,R(z)
1
o, G
2H(z)
Esta ultima ccuacion da la salida en tiempo discreto C(~). La salida en tiempo continuo C(s) se puede obtener a partir de la siguiente ecuacion
2H(s)]*
Note quc [G/?(s)r/{ I + [G,G 1H(s))'} es una serie de impulses. La salida en tiernpo continuo C(s) es la respucsta de G1(s) ala secuencia de dichos impulses. [Vease el problema A-3-18 para los detalles de como deterrninar la salida en tiernpo continuo c(t). la transforrnada inversa de Laplace de C(s).]
Problema A-3-15 Considere el sistema que se rnuestra en la figura 3-57. Obtenga la funcion de transferencia pulso en lazo cerrado C(z)/R(~). Tambien obtenga la expresion para C(s).
R(s)
E"(s)
Gt(s)
Cis)
C(z)
R(z)
H(s)
Figura 3-57
156 Soluci6n
Capitulo 3
Si tomamos la transformada de Laplace asterisco en ambos miembros de las ultirnas tres ecuaciones. obtenemos
= Gj(s)E*(s)
=
R*(s) - HGHs)M*(s)
C*(s)
De este modo,
= =
C*(s)[l + Gj(s)HGHs)]
o
= G;"(s)GHs)R*(s)
C*(s) R*(s)
Gj(s)G!(s)
1 + Gj(s)HGHs)
CCz) R(z)
CCs)
G 2(s)M*(s)
Problema A-3-t6 Considere el controlador PID anal6gico y el controlador PID digital. La ecuaci6n para el controlador PID anal6gico es
met) = K [ e(t) +
donde e(t) es la entrada al controlador y m(t) es la salida del controlador. La funci6n de transferencia del controlador PID analogico es
G(s)
S)
La funci6n de transferencia pulso del controlador PID digital en la forma posicional esta dada por la ecuaci6n (3-56):
:::apitulo 3
157
Compare las graficas polares (caracteristicas de respuesta en frecuencia) del controlador PID anal6gico can las correspondientes al controlador PID digital. Solucion Para el controladof PID analogico, las caracteristicas de respuesta en frecuencia se pueden obtener mediante la sustituci6n dejw en lugar de s en G(s). De este modo,
G(jw) == K( 1 +
==
I;~W + TdjW)
j I;l + TdjW)
w
K( 1 -
(3-103)
Para el controlador PID digital. las caracteristicas de respuesta en frecuencia se pueden obtener mediante la sustituci6n de r == e'" en Gn(::):
1 GD(e jw T ) == K + 1 - Ke-/ w T + K D (1 _ e-/ w T )
== K p + 1 == K; +
- cos w
:1. sen wT + KD (1 +i
cos wT
+ j sen wT)
(3-104)
KI( 2 1-
Se cornparara prirnero par separado la acci6n P, la acci6n ] y la acci6n D del controlador anal6gico can sus contrapartes en el controlador digital. Observe que en la acci6n proporcional (acci6n P) el controlador digital tiene una ganancia de K/ /2 menor que la ganancia correspondiente en el controlador analogico, K/. Vease la figura 3-58a). puesto que KI' == K Para la acci6n integral (acci6n 1) las partes reales de las graficas polares del controlador anal6gico y del controlador digital difieren por K/ /2, como se muestra en la figura 3-58b). Cuando las acciones proporcional e integral se combinan, entonces las partes reales de las graficas polares para la accion Pi anal6gica y la acci6n Pi digital se hacen iguales, como se muestra en la figura 3-58c). Las graficas polares de la acci6n derivativa (acci6n D) para el controlador anal6gico y para el controlador digital difieren rnucho, como se muestra en la figura 3-58d). Par tanto, existen diferencias considerables entre la acci6n D anal6gica y la acci6n D digital. La grafica polar cualitativa del contralador PID anal6gico se puede obtener a partir de la ecuaci6n (3- I03) variando w desde 0 hasta x, como se muestra en la figura3-59a). De modo similar, la grafica polar cualitativa del controlador PID digital se puede obtener a partir de la ecuaci6n (3-104) variando w desde 0 hasta 7T/T, como sc muestra en la figura 3-59b). Observe que, aunque las graficas pol ares del controlador PI anal6gico y del controlador PI digital son similares. existen diferencias significativas entre las graficas polares del controlador PID anal6gico y el controlador PID digital.
Problema A-3-17 En la secci6n 3-5 se obtuvo la funci6n de transferencia pu/so para el controlador PID en la forma posicional. Con referencia a la figura 3-28, la funci6n de transferencia pulso para el controlador PID digital se obtuvo como
Gn(z)
Utilizando Vm(kT) velocidad.
==
== - - ==
M(z) (z)
Kp +
----I
K/ l-z
+ K n( - I ) 1- z
158
Capitulo 3
1m
K
a)
1m
(Kp=K-~K[)
Kp
Re
Re
Accion P digital
1m
w=
11
Re
K[
tW = 0
Accion I dig/tal
1m
o
w=.!.
T
Re
tW = 0
Accion PI digital
1m
11
-----f"....----""- Re
W=o
Acclon Danal6gica
Accion Ddigital
Figura 3-58 Graficas polares de los control adores analogico y digital con a) accion proporcional; b) accion integral; c) accion proporcional mas integral, y d) accion derivativa.
::apitulo 3
Problemos de ejemplo
y soluciones
1m
159
1m
tw=oo
1r
w=T
o
K
Re
Re
al
Figura 3-59
b)
a) Grafica polar del controlador PID analogico: b) grafica polar del controlador PIO digital.
Solucion
Observe que
Vm(kT) = m(kT) - m((k - 1)T)
=
l)T)J
~ [e(kT) -
(3-105)
dondc se han ernpleado las relaciones K; = K - +K t , K, = KT/T" Y K" = KTjT. (Para estas rclaciones. rcfierase a la obtencion de la forma posicional de la ecuacion de control del Pll) digital.) La ecuacion (3-105) toma en considcracion la variacion de la forma posicional en un periodo de muestrco, Suponga que cl error actuante e(kT) es la difcrencia entre la entrada r(k7) y la salida ctkl>. 0
e(kT) = r(kT) - c(kT)
(3-106)
160
Capitulo 3
El esquema de control PID en la forma de velocidad dado por la ecuacion (3-106) se puede modificar de algun modo en una forma diferente para hacer frente a grandes cambios subitos en el punta de ajuste. Puesto que las acciones de control proporcional y derivativo producen gran des cambios en la salida del controlador cuando la senal que entra a este presenta un cambio sub ito grande, para suprimir dichos cambios en la salida del controlador, los terrninos proporcional y derivativo digitales se pueden modificar como se discute a continuacion. Si los cambios en el punta de ajuste [entradar(k7)) son una serie de cambios detipo escalon, entonces inmediatamente despues de que un cambio escalon tiene lugar, la entrada r(k7) permanece con stante por un tiempo hasta que el siguiente cambio escalon tiene lugar. Por tanto, en la ecuacion (3-106) se supone que
+ KI[r(kT) - c(kT)]
+ ck
- 2)T)]
(3-107)
(1 - z-I)M(z)
- C(z)]
+ z-Z)C(z)
Al simplificar, se obtiene
M(z)
(3-108)
La ecuacion (3-108) da el esquema de control PID en la forma de velocidad. El diagrama de bloques de la realizacion del esquema de control PID digital en la forma de velocidad se mostro en la figura 3-30.
Problema A-3-18 Considere el sistema que se muestra en la figura 3-60a). Obtenga la salida en tiempo continuo c(t) de modo que se pueda determinar la salida entre dos instantes cualesquiera de muestreo consecutivos. Encuentre la expresion para la salida en tiempo continuo c(t). EI periodo de muestreo T es de 1 segundo.
Solucion Para el sistema que se muestra en la figura 3-60a), se tiene
C(s)
G(s)E*(s)
E*(s)
o
E (s) - 1
De este modo,
C(s)
La salida en tiempo continuo c(t) se puede portanto obtener como la transformada inversa de Laplace de C(s):
:opftulo 3
161
R(s)
CIs)
1)
s (s +
G(s)
a)
0 -1
-2
b)
c (t)
Puntas de salida que 58 obtienen mediante el calculo de las muestras
1.5
1.0
0.5
4
c)
Figura 3-60 0) Sistema de control en ticmpo discrcto; h) graficas de las rcspucstas 'II impulse individualcs: c) grafica de 1'1 salida en ticmpo continuo c(t) contra I.
e(l) = 5 [C(s)] = 5
Para cstc sistcmu.
~I
-I[
G(s)=l-e-" 1 s s(s + 1)
162
Capitulo 3
Por tanto,
e(t) =
s::[ - s - s(s
X (s)
1-
R*(S)]
+ 1) 1 + G*(s)
Definase
_, R*(s) (1 - e ) 1 + G* (s)
X(z) = (1 - z
) 1 + G(z)
R(z)
+ 0.2642z 2
1 + (1 _ 0.3679z 1)(1 - z 1) 1 - 1.3679z- 1 + 0.3679z- 2 1 - Z 1 + 0.6321z 2 Por tanto, al observar que el periodo de muestreo T es I segundo 0 T = I, se tiene
X *( ) _ 1 - 1.367ge-' + 0.367ges 1 _ : + 0.6321e 2s
2s
Por 10 tanto,
e(t)
= ;;e-l[
2s ]
2s
0.3996e- 3'
1 1 1 1 = - - - + -s\s + 1) S2 S S + 1
1)]
t - 1 + e-
e-(r-
lj1(t - 1)
+ ...
(3-109)
:::Jpitulo 3
163
En la figura 3-60b) se muestran las graficas de las respuestas impulso individuales dadas por la ecuacion (3-109). [Observe que c(t) consiste en la suma de respuestas impulso que se presentan en I = O. I = I. 1= 2.... con facto res I. -0.3679. -0.6321. .... J A partir de la ecuacion (3-109) se ve que para los intervalos de tiempo O:S: I < I, 1 :s: I < 2, 2 :s: I < 3... " la salida c(t) es la suma de las respuestas impulso como sigue:
C(/)
I
- 1
I -
C(O)
=0
+ 1 =0
- 0.3679 x 0 - 0.3679 x
c(1.5)
c(2.0)
c(2.5)
c(3.0)
c(4.0)
+ 0 x 0.3679
0.8944
La salida en tiempo continuo C(/) obtenida de esta manera se grafica en la figura 3-60c).
+ 1) + 0.8)
Dibuje un diagrama de la realizacion en serie y un diagrama de la realizacion en paralelo. (Utilice una seccion de primer orden y una seccion de segundo orden.) Solucion Se considerara primero el esquema de la realizacion en serie. Para limitar los coeficientes a cantidades reales, se agrupan los terrninos de segundo orden del numerador (que tienen ceros complejos) y los terminos de segundo orden del denominador (que tienen polos complejos). Por 10 tanto. G(:-) se agrupa comosigue: z - 1 Z2 + 1.2z + 1 G(z) = 4 - - -2=------
164
Capitulo 3
X(z)
L------l 0.8
I-+----~
a)
.....------..j -50 f - - - - - - - - - - - - - - - - - - - - ,
X(z)
----J
b)
Figura 3-61 Diagrama de bloques de la rcalizacion del filtro digital que se considero en el problema A-3-19. a) Realizaci6n en scrie; b) rcalizacion en paralclo.
=:~'ulo3
165
La Iigura 3-61 a) rnucstra un diagrama de la realizacion en serie. Ahora. sc considerara el esquema de realizacion en paralelo. La expansion de G(~)/: en fracciones parcialcs da como resultado G(z) z 4(z - 1)(z2 + 1.2z + 1) z(z + O.1)(z" - 0.3z + 0.8)
Y7Y 50 = __ + __"_1_ + ., ill z + ~ 21 21 Z Z + 0.1 z' - 0.3z + 0.8
Entonces G(:-) se puede escribir como sigue: G(z) = -50 + 46.61905 7.38095 + 4.04762z1 + 0.lz- 1 + 1 - 0.3z- 1 + 0.8z-" La figura 3-61 h) muestra el diagrarna de la realizacion en paralelo. Problema A-3-20 Una scnal en tiempo continuo x(t) que cambia lentamente se muestrea cada Tsegundos. Suponga que los cambios en la senal x(t) son muy lentos comparados conla frecuencia de muestreo. Muestre que en el plano z, (I - ~-I )/Tcorresponde a la "difcrenciacionljustamente como s corresponde a la "diferenciacion" en el plano s. Solucien Para una sefial x(t) que cambia Ientamente. la derivada de x(t) se puede aproximar mediante v(t)
1
dx(t)
- Z-I X(z)]
= 1'(1
Z-I)X(Z)
a partir de 10 cual se obtiene el diagrama de bloques que se muestra en la figura 3-62a). Este diagrama corresponde a la diferenciacion en el plano s que se muestra enla figura 3-62h). Observe que cl diagrama de bloques que se muestra en la figura 3-62a) se puede rnodificar como el que se mucstra en 1'1 figura 3-63. (Para la aproxirnacion de 1'1 "integracion" en el plano z, veanse los problemas 8-3-25 '11 8-3-27.)
~'---------~(l-r')
T
V(z)
----[J--X(s)
V(s) b)
a)
Fi~III'a 3-62 a) Diagrama de bloqucs para la "difercnciacion" en el plano r: b) diagrama de bloques para la "difercnciacion" en el plano s.
X(z)
t - - -...-------~+
V(z)
166
Capitulo
PROBLEMAS
Problema 8-3-1 Muestre que el circuito que se muestra en la figura 3-64 actua como un retenedor de orden cera.
o------J.VM----'
e(t)
R,
/
T
----r---...,.-----O
mIt)
R,
-e:e,
Figura 3-64
Problema 8-3-2 Considere el circuito que se muestra en la figura 3-65. Obtenga una ecuacion en diferencias que describa la dinamica del sistema cuando el voltaic de entrada aplicado es una constante seccionalmente continua, 0
e(t)
e(kT),
R
kT s; t < (k + l)T
O----VM..----c-r----.. . O
e(t)
0-_1_
Figura 3-65 Circuito RC.
x(t)
(Obtenga primero una ecuacion diferencial y luego discreticela para obtener una ecuacion en diferencias.)
Problema 8-3-3 Considere el muestreador mediante impulsos y el retenedor de primer orden que se muestra en la figura 3-66. Obtenga la funcion de transferencia del rctenedor de primer ordcn, suponiendo una funcion rampa unitaria como la entradax(t) al muestreador. Problema 8-3-4
x(t)
x*(t)
----~
y(t)
Or
Capitulo 3
Problemas
167
X(s) _
s +3 (s + l)(s + 2)
Problema 8-3-5
Obtenga la transforrnada r de
Xes) - - - - - (s + a)(s + b)
Emplee eI rnetodo de los residuos y el metoda basado en la funcion de respuesta impulso.
Problema 8-3-6
Obtenga la transformada ; de
Xes) - - - - ...,..--=-~ s (s + af
Problema 8-3-7
Considere la ecuacion en diferencias de un sistema
1_e- Ts
y(k
+ 1) + O.5y(k) = x(k)
donde y(O) = O. Obtenga la respuestajtx) cuando la entradax(k) es una secuencia escalon unitario. Tarnbien obtenga la solucion mediante MATLAB.
Problema 8-3-8
Considere la ecuacion en diferencias de un sistema
y(k
+ 2) + y(k) = x(k)
donde y(k) = 0 para k < O. Obtenga la respuesta y(k) cuando la entrada x(k) es una secuencia escalon unitario. Tambien obtenga la solucion mediante MATLAB.
Problema 8-3-9
Obtenga la secuencia de ponderacion g(k) del sistema descrito mediante la ecuacion en diferencias
-1 < a < 1
Si dos sistemas descritos mediante esta ultima ecuacion se conectan en serie, (,cual es la secuencia de ponderaci6n del sistema resultante?
Problema 8-3-10
Considere el sistema descrito mediante
y(k) - y(k - 1)
+ O.24y(k
- 2) = x(k)
+ x(k
- 1)
donde x(k) es la entrada y y(k) es la salida del sistema. Determine la secuencia de ponderacion del sistema. Suponiendo que y(k) = 0 para k < O. determine la respuestay(k) cuando la entrada x(k) es una secuencia escalon unitario. Tarnbien obtenga la soluci6n mediante MATLAB.
Problema 8-3-11
Considere el sistema
168
Capituio 3
Problema 8-3-12
Obtenga la respuestay(kT) del siguiente sistema:
Y(s) X*(s)
(s
+ l)(s + 2)
donde x(t) es una funcion escalon unitario y x*(t) es su version muestreada mediante impulsos. Suponga que el periodo de muestreo T es 0.1 segundos.
Problema 8-3-13
Considere el sistema definido mediante
y(k) =
2: h(k
j=O
- j)u(j)
Problema 8-3-14
Suponga que la senal muestreadax'(s) se aplica a un sistema G(s). Suponga tambien que la salida de G(s) es Y(s) y y(O+) = O.
Y(s) = G(s)X*(s)
Empleando la relacion
muestre que
Y*(s) = G*(s)X*(s)
Problema 8-3-15
Obtenga la funcion de transferencia pulso en lazo cerrado del sistema que se muestra en la figura 3-67.
R(s)
----l~+
(5)
*(5)
CIs) Gis)
M'(s)
M(s)
H, (5)
Figura 3-67
:=:Jpitulo 3
Problemas
169
Problema B-3-16 Obtenga la tuncion de transferencia pulso en lazo cerrado del sistema que se muestra en la figura 3-68.
R(s)
Retenedorde
orcen cera
K s +a
Cis)
Figura 3-68
Problema B-3-17 Considcre cl sistema de control en tiernpo discreto que se muestra en la figura 3-69. Obtenga la salida en tiernpo discreto C(::) y la salida en tiernpo continuo C(s) en terminos de la entrada y las funciones de transfercncia dc los bloqucs.
R(s)
Cis)
Rlz)
Clz)
81s)
H(s)
Figura 3-69
Problema B-3-18 Considere el sistema de control en tiempo discreto que se muestra en la tigura 3-70. Obtenga la secuencia de salida c(k7) del sistema cuando este esta sujeto a una entrada escalon unitario. Suponga que el periodo de muestreo T es I segundo. Tarnbien obtenga la salida en tiernpo continuo c(t).
R(s)
C(s)
Figura 3-70
170
Capitulo 3
Problema 8-3-19
Obtenga en forma cerrada la secuencia de respuesta c(kl) del sistema que se muestra en la figura 3-71 cuando este esta sujeto a una entrada delta de Kronecker r(k). Suponga que el periodo de muestreo Tes I segundo.
R(s)
1 s (s
CIs)
+ 1)
G(s)
Figura 3-71
Problema 8-3-20
Considere el sistema que se muestra en la figura 3-72. Suponiendo que el periodo de muestreo T es 0.2 segundos y que la ganancia con stante K es unitaria, determine la respuesta c(kl) para k = 0, I, 2, 3 Y 4, cuando la entrada r(t) es una funci6n escal6n unitario. Tarnbien determine el valor final c(x).
R(s) E(s)
---~+
CIs)
s +1
G(s)
SIs)
Figura 3-72
Problema 8-3-21
Obtenga la funcion de transferencia pulso en lazo cerrado C(z)/R(z) del sistema de control digital que se muestra en la figura 3-30. Suponga que la funci6n de transferencia pulso de la planta es G(z). (Observe que el sistema que se muestra en la figura 3-30 es un control PID en la forma de velocidad de la planta.)
Problema 8-3-22
Suponga que un filtro digital esta dado mediante la siguiente ecuaci6n en diferencias:
Capitulo 3
Problemas
171
Realice este filtro digital en el esquema en serie, en el esquema en paralelo y en el esquema en escalera.
Problema 8-3-24
Refiriendose a la aproximacion del diferenciador que se muestra en la figura 3-63, dibuje una grafica de la salida v(k) contra k cuando la entradax(k) es una secuencia escalon unitario.
Problema 8-3-25
Considere el sistema que se muestra en la figura 3-73. Muestre que la funcion de transferencia pulso H.:-)! XC::) esta dada por Y(z) X(z)
X(z)
(. 1 ) T 1 - Z-I
Y(z)
Figura 3-73
De este modo, la salida y(kT) se aproxima al area formada por la entrada. Por tanto, el sistema actua como un integrador. Debido a que y( 0) = h(O), la salida aparece tan pronto x(O) entra al sistema. Este integrador comunmente se den om ina integradordigital sin retraso. Dibuje una grafica de la saliday(kT) cuando la entradax(kT) es una secuencia escalon unitario.
Problema 8-3-26
Considere el sistema que se muestra en la figura 3-74. Muestre que la funcion de transferencia pulso Y(::)/
X(.:-) esta dada por
Y(z) = X(z)
X(z)
y(z)
Figura 3-74
y(kT) = T[x(O)
+ x(T) + ' .. + xk
- 1)T)]
172
Capitulo 3
La saliday(k7) se aproxima al area formada por la entrada. Puesto que yeO) = 0 y y (n = Tx(O). la salida cornienza a aparecer en t = T. Este integrador se denomina como integrador digital con rctraso, Dibuje una grafica de la salida y(k7) cuando la entrada x(k7) es una secuencia escal6n unitario. Problema 8-3-27 Considere el sistema que se muestra en la figura 3-75. Muestre que la funcion de transferencia pulso Y(.::) X(.::) esta dada por
Y(z) X(z)
="2
T( 1 - 1
Z-I)
Z-I
+1-
Z-I
Este sistema cs una combinaci6n de integradores digitales sin retraso y con rctraso, como se presentaron en los problemas B-3-25 y B-3-26. respectivamente.
x(z)
y(z)
Figura 3-75
Suponiendo que y(k7) = 0 para k < O. obtenga y(k7) en terminos de x(O) .1(7), ... x(k7). Este integrador se denomina integrador digital bilineal. Dibuje una grafica de la saliday(k7) cuando la entrada x(k7) es una secuencia escal6n unitario.
mediante metodos
convenciona/es
- ~':" capitulo presentaremos en primer termino la correspondencia del plano s con el plano z y a _. -- -Jacion analizaremos la estabilidad de los sistemas de control en lazo cerrado en el plano z, __'~=:' verernos tres metod os de diseno distintos para los sistemas de control en tiempo discreto 0 : =:.:es de una entrada y una salida. El primer metodo esta basado en la tecnica dellugar geometrico :'; .:' raices, y utiliza configuraciones de polos y ceros en el plano z, EI segundo esta basado en el -;- _'::L' de respuesta en frecuencia en el plano w. EI tercer metodo es un metodo analitico en el cual --~-::lI1lOS obtener un comportarniento deseado del sistema en lazo cerrado manipulando la funcion :; .r.msferencia de pulso del controlador digital. Desde los anos cincuenta han quedado bien establecidas las tecnicas de disefto para los siste- .:' ce control en tiempo continuo basados en metodos de transformadas convencionales (los del _=.:~ geometrico de las raices y de respuesta en frecuencia). Los rnetodos de transformadas conven__ - a.es son especialmente utiles para el disefio de sistemas de control industrial. De hecho, en el ~ >.:'::0. muchos sistemas digitales de control industrial fueron disefiados con exito basandose en - ~::jos de transformadas convencionales, Tanto la farniliaridad con las tecnicas dellugar geornetrico :; zs raices y de respuesta, en frecuencia, como la experiencia obtenida en el diseno de controladores :..- ,:,'gicos son de gran valor en el disefio de sistemas de control en tiempo discreto.
Organlzaclon del capitulo. En la seccion 4-1 presentamos material introductorio. La sec__ ., -1-2 se ocupa de la correspondencia del plano s hacia el plano z, La seccion 4-3 analiza el criterio :-:- estabilidad de Jury para sistemas de control en lazo cerrado en el plano z, La seccion 4-4 resume > caractertsticas de respuesta transitoria y en estado permanente de sistemas de control en tiempo : -; reto. La tecnica de disefio basada en el metodo del lugar geometrico de las raices se presenta en :: .eccion 4-5. La seccion 4-6 prirnero analiza el rnetodo de respuesta en frecuencia y a continuacion ~ -::senta las tecnicas de respuesta en frecuencia mediante la transformada w para disefiar sistemas de _. -:rol en tiempo discreto. La seccion 4-7 se ocupa de un metodo de disefio analitico.
173
174
Capitulo 4
Y EL PLANO z
Tanto la estabilidad absoluta como la relativa del sistema de control en lazo cerrado en tiempo continuo lineal e invariante con el tiempo quedan determinadas por la localizaci6n de los polos en lazo cerrado en el plano s. Por ejemplo, los polos complejos en lazo cerrado en el semiplano izquierdo del plano s cercanos al eje jt mostraran un comportamiento oscilatorio, y los polos en lazo cerrado sobre el eje real negativo mostraran decaimiento exponencial. En vista de que las variables complejas z y s estan relacionadas mediante z = e", la localizaci6n de los polos y de los ceros en el plano z esta relacionada con la localizaci6n de los polos y los ceros del plano s. Por 10 tanto, la estabilidad del sistema en lazo cerrado en tiempo discreto lineal e invariante con el tiempo puede determinarse con base en las posiciones de los polos de la funci6n de transferencia en pulso en lazo cerrado. Debe observarse que el comportamiento dinamico del sistema de control en tiempo discreto depende del periodo de muestreo T. En funci6n de los polos y los ceros en el plano z, sus localizaciones dependen del periodo de muestreo T. En otras palabras, un cambio en el perioda de muestreo Tmodifica las localizaciones de los polos y de los ceros en el plano z y hace que el comportamiento de respuesta se modifique.
Correspondencia del semiplano izquierdo del plano s hacia el plano z, En el disefio de un sistema de control en tiempo continuo, la localizaci6n de los palos y de los ceros en el plano s es de gran importancia para predecir el comportamiento dinamico del sistema. De igual manera, en el disefio de sistemas de control en tiempo discreto, es muy importante la localizaci6n de los polos y de los ceros en el plano z, A continuaci6n investigaremos como se comparan las localizaciones de los polos y de los ceros en el plano s con las localizaciones de los polos y de los ceros en el plano z. Cuando en el proceso se incorpora un muestreo por impulsos, las variables complejas z y s quedan relacionadas mediante la ecuaci6n
Esto significa que un polo en el plano s puede quedar localizado en el plano z mediante la transformaci6n z = eli. Dado que la variable compleja s esta formada de una parte real (J" y una parte imaginaria w, tenemos
s=
y
(J"
+ jw
De esta ultima ecuaci6n vemos que los polos y los ceros en el plano s, donde las frecuencias difieran en multiples enteros de la frecuencia de muestreo 2'TT/T, corresponden a las mismas localizaciones en el plano z. Esto significa que por cada valor de z existira un numero infinito de valores de s. Dado que (J" es negativo en el semiplano Izquierdo del plano s, el semiplano Izquierdo del plano s corresponde a
y el plano z
175
Observe que, en vista de que L.1 = wT, el de z varia desde -x hasta x conforme w varia desde -x a x. Tomemos un punto representa"." en el eje jw del plano 5. Conforme este punto se mueve sobre el eje jt desde -if w, hastajf w" .; endo w, la frecuencia de muestreo, tenemos que [z] = I, Y L.Z varia desde -7T hasta 7T, en direcci6n _,:'ntraria a las manecillas del reloj en el plano z. Con forme el punto representativo se mueve desde - lU, hasta w, sobre el eje jto, el punto correspondiente en el plano z traza un cfrculo unitario en ..:.recci6n contraria a las manecillas del reloj. Por 10 tanto, conforme el punto en el plano 5 se mueve en el plano jw desde -x hasta x, dibujaremos el cfrculo unitario en el plano z un numero infinito de . eces, De este anal isis, resulta claro que cada franja de ancho w, en el semiplano izquierdo del plano ,e transformara al interior del circulo unitario del plano z, Esto implica que el semiplano izquierdo ::.:1 plano 5 puede dividirse en un nurnero infinito de franjas periodicas, tal y como se muestra en la '-:,ura 4-1. La franja primaria se extiende desdejw = -H w, hastajf w,. Las franjas complementarias ,~ extienden desdeH w, hasta}i w." }i w, hasta J+ w". . ., y desde -H w, hasta -}i w" -}+ w., hasta -~w\, ..... En la franja primaria, si trazamos la secuencia de los puntas 1-2-3-4-5-1 en el plano 5, tal y orno se muestra mediante los numeros encerrados en un cfrculo en la figura 4-2a), entonces esta :-.1:ectoria corresponde al cfrculo unitario con centro en el origen del plano z, como se muestra en la -c gura 4-2b). Los puntos correspondientes 1,2,3,4 Y 5 del plano z se muestran mediante nurneros encerrados en un cfrculo en la figura 4-2b). EI area encerrada por cualquiera de las franjas complementarias se transforma en el mismo ~ .rculo unitario en el plano z, Esto significa que la correspondencia entre el plano z y el plano 5 no es
~-:,ulo
j+
jw j
Franja
complementaria
~
5w, 2
Plano s
j
Franja
complementaria
3w, 2
1m
Plano z
j
Franja
prima ria
w,
2
a
Re
"
-j
Franja complementaria
w,
2
-j
Franja compJementaria
3w, 2
-j
5w,
2"
Figura 4-1 Franjas pcri6dicas cn el plano s y region corrcspondicntc (circulo umtario con centro en cI origcn) en el plano z.
176
Copltulo 4
jw
Plano s
1m
Plano z
--------~----
------
1-
. w,
Franja
-oc
prlrnaria
Ii' <:
___L
CD
Re
:c..:::
-::-::--:::-:--J
. w,
-I
"2
a)
b)
Figura 4-2 Diagramas que muestran la correspondencia entre la franja primaria en eI plano s y el circulo unitario en el plano z: a) una trayectoria en el plano s; b) la trayectoria correspondiente ell el plano z.
(mica. Un punto en el plano z corresponde a un nurnero infinito de puntos en el plano s, aunque un punta en el plano s corresponda a un solo punta del plano z. Dado que la totalidad del semiplano izquierdo del plano s corresponde al interior del cfrculo unitario en el plano z, la totalidad del semiplano derecho del plano s corresponde al exterior del cfrculo unitario en el plano z. Tal y como fue mencionado anteriormente, el eje jw del plano s se transforma en el cfrculo unitario del plano z. Note que, si la frecuencia de muestreo es por 10menos dos veces mayor que la componente de frecuencia mas alta involucrada en el sistema, entonces cada uno de los puntos del cfrculo unitario del plano z representaran frecuencias entre W. Y W. Ahora investigaremos la correspondencia de algunos de los contornos de uso cornun del plano s hacia el plano z. De manera especffica, haremos la correspondencia de los lugares geornetricos de atenuacion (factor de amortiguamiento real) con stante, de frecuencia constante y de factor de amortiguamiento relativo constante.
-+
I '
Lugar geometrico de atenuacion constante. Una linea de atenuacion constante (una linea trazada con a = constante) en el plano s corresponde a un cfrculo de radio z = e'" con centro en el origen del plano z, como se muestra en la figura 4-3. Tiempo de asentamiento t.: EI tiempo de asentamiento queda determinado por el valor de la atenuacion rr de los polos dominantes en lazo cerrado. Si se especifica el tiempo de asentarniento, es posible dibujar una linea tr = -U I en el plano s que corresponda a un tiempo de asentamiento dado. La region en el plano s a la izquierda de la linea u= -U I corresponde en el plano z a la parte interior de un cfrculo de radio e-"", tal y como se muestra en la figura 4-4. Lugar geometrico defrecuencia constante. Un lugar geornetrico de frecuencia constante W en el plano s corresponde en el plano z a una linea radial de angulo con stante TWI (en radianes), como se muestra en la figura 4-5. Note que las Ilneas de frecuencia con stante en W = WI en el
WI
Secci6n 4-2
y el plano z
Plano
177
z
jw
1m
Re
a)
b)
Figura 4-3
semiplano izquierdo del plano s corresponden al eje real negativo entre 0 y -I en el plano z, dado que T(+wJ = 1T. Las Ifneas de frecuencia con stante en w = (us en el semiplano derecho del plano s corresponden al eje real negativo del plano z entre -I y -x. EI eje real negativo del plano s corresponde al eje real positivo del plano z entre 0 y I. Y las Ifneas de frecuencia constante en w = X/1W, (/1 = 0, 1,2, ...) en el semiplano derecho del plano s corresponden at eje real positivo del plano z, entre 1 ex. La region limitada por las lineas de frecuencia con stante W = WI Y W = -(U e (donde tanto WI como We ocurren entre W s Y wJ y las Iineas de atenuacion constante (T = -0'1 Y (T = -O'e' como se muestra en la figura 4-6a), corresponden a una region limitada por dos Ifneas radiales y dos arcos circulares, como se muestra en la figura 4-6b).
-+
jw
Plano s
\
0
\
Re
a,
e -0 1 T
oj
bl
Figura 4-4 a) Region para un ticmpo de asentamicnro T.mcllor que 4/"1 en el plano s: b) region para un ucmpo de ascntarnienro T, mcnor que 4/"1 en el plano =.
178
Capitulo 4
iw
Plano 5
1m
Plano z
z = e Tlo + jW,)
. w, /-
--------t-i
o
W 2-
---------1f- iw, - - a
Re
--------t,-iw , -
a)
b)
Figura 4-5 a) Lugares geometricos de frecuencia constante en el plano s; b) lugares geomctricos correspondientes en el plano z.
Lugares geometricos de/actor de amortiguamiento relativo constante. Una linea de factor de amortiguamiento relativo constante (una linea radial) en el plano s corresponde a una espiral en el plano z. Esto se puede observar como sigue. En el plano s una linea de factor de amortiguamiento relativo constante puede ser determinada por
1m
Plano z
iw
w,
2
Plano 5
z = e Tio + jw,)
__
- r - ~
iw,
Re
a)
b)
W
Secci6n 4-2
179
donde w" = w
lI
J1- (
Por 10 tanto,
Izl=exp ( - ~
y
(4-1)
(4-2)
Entonces, la magnitud de z se reduce y el angulo de z aumenta linealmente con forme w" se incrementa y el lugar geometrico en el plano z se convierte en una espiral logaritmica, como se muestra en la figura 4-7 b). Observe que para una relaci6n w,,/w., dada, la magnitud Izi se convierte en una funcion s610 de (;, y el angulo de z se convierte en una constante. Por ejemplo, si el factor de amortiguamiento relativo esta especificado como 0.3, es decir (; = 0.3, entonces para w" = 0.25w., tenemos
Izl
= exp ( -
21T V x
0.610
a)
b)
Figura 4-7 a) Linea de factor de amortiguamiento relativo constante en el plano s; b) lugar geometrico correspondientc en el plano z:
180
Capitulo 4
Para wJ = 0.5w"
Izi
exp ( -
27T V
0.3 1 - 0.3 2
X 7T =
x 0.5 )
0
0.3725
/ : = 27T
x 0.5 =
180
Por 10 tanto, se puede graduar la espiral en funcion de una frecuencia normalizada wJ/w, [yea la figura 4-7 b)]. Una vez especificada la frecuencia de muestreo W." se puede determinar el valor nurnerico de W J en cualquiera de los puntos de la espiral. Por ejemplo, en el punta P de la figura 4-7 b), se puede determinar WJ como sigue. Si, por ejemplo, la frecuencia de muestreo esta especificada como w, = 107T rad/s, entonces el punto P
/: = 7T
= 27TWs
Wd
De ahi,
WJ
en el punta P es
Wd
rz
Ws
= ~ 7T
rad/sec
Observe que si una linea de factor de amortiguamiento relativo constante esta en el segundo 0 en el tercer cuadrante del plano s, entonces la espiral decrece dentro del circulo unitario en el plano z. Sin embargo, si una linea de factor de amortiguamiento relativo constante aparece en el primero 0 en el cuarto cuadrante del plano S (10 que corresponde a una amortiguacion negativa), entonces la espiral crece por fuera del circulo unitario. En la figura 4-8 se muestran los lugares geornetricos de un factor de amortiguamiento relativo constante para t = 0, t = 0.2, t = 004, t = 0.6, t = 0.8 y t = I. El lugar geometrico de t = 1 es una linea horizontal entre los puntos z = 0 y z = I. (Note que la figura 4-8 solo muestra los lugares geometric os correspondientes al semiplano superior del plano z, 10 que corresponde a 0 :5 w:5 t W,. Los lugares geometricos correspondientes a -t w, :5 w:5 0 son las imageries de espejo de los lugares geometricos del semiplano superior del plano z en relacion con el eje horizontal.) Adviertase que los lugares de t constante son normales a los lugares geornetricos de W constante en el plano s, como se ve en la figura 4-9a). En la correspondencia can el plano z, los lugares geometricos de W constante intersectan las espirales de las t constantes en angulos constantes, como se muestran en la figura 4-9b). Una correlacion a transformacion como esta, que conserva tanto la dimension como el sentido de los angulos, se conoce como mapeo 0 correspondencia conforme.
II
I1
1m
Plano z
-1.0
--0.5
05
1.0
Re
Figura 4-8
y el plano z
1m
18 .
:-:
constants
Plano s
Plano
-I
b}
Figura 4-9 a) Diagrama que muestra la ortogonalidad 0 perpendicularidad de los lugares geometricos de las (constantes \ de los lugares gcometricos de los w" constantes dentro del plano s; b) diagrama correspondiente en eI plano z.
Regiones del plano sy del plano z para ~> ~I' La figura4-10 muestra los lugares geornetricos de ~ constante (~ = ~I) tanto en el plano s como en el plano z. Note que las espirales logaritmicas mostradas corresponden a la franja primaria en el plano s. (Si se satisface el teorema de muestreo, solo necesitaremos considerar la franja primaria del plano s.) Si todos los polos del plano s se definen como con un factor de amortiguamiento relativo no menor que el valor especificado ll' entonces los polos deberan ocurrir a la izquierda de la linea de factor de amortiguamiento relativo constante en el plano s (la region sombreada). En el plano z, los polos deberan presentarse en la region limitada por las espirales logaritmicas correspondientes a ~ = ~I (la region sombreada).
Ejemplo 4-1
Especifique la region en el plano z que corresponda a una regi6n deseable (region sombreada) del plano s limitada por las lincas W WI' las lineas 'I Y una linea a -U lo tal y como se muestra en la figura
,=
4- Ila).
1m
Plano
a)
b)
Figura 4-10 a) Region correspondiente a (> (, en el plano s; b) region correspondiente a (> (, en el plano z.
182
Capitula 4
jw
Plano s
1m
Plano z
Re
a)
b)
Figura 4-11 a) Una regiondeseableen el plano s para la localizaci6n de los palos en lazo cerrado; b) regi6n correspondiente en el plano z. Can base en los analisis anteriores sobre la correspondencia del plano s con el plano z, la region deseable puede ser transformada (mapeada) al plano z como aparece en la figura 4-11 b). Note que si los polos dominantes del sistema de control en tiempo continuo en lazo cerrado deben estar en la region deseable especificada en el plano s, entonces los polos dominantes del sistema de control equivalente en tiempo discreto en lazo cerrado deberan tambien ocurrir dentro de la region del plano z que corresponda a la region deseable del plano s. Una vez disenado el sistema de control en tiempo discrcto, deberan verificarse las caracteristicas de respuesta del sistema mediante experimcntos 0 simulacion, Si las caracteristicas de respuesta no son satisfactorias, entonces deberan modificarsc las locaiizaciones de los polos y los ceros en lazo cerrado, hasta que se obtengan los resultados satisfactorios.
Comentarios. Para sistemas de control en tiempo discreto, es necesario tener especial cuidado con el periodo de muestreo T. Esto es en razon de que, si el periodo de muestreo es demasiado largo y el teorema de muestreo no es satisfecho, entonces ocurrira un doblamiento de frecuencia y se modificaran las localizaciones efectivas de los polos y los ceros. Suponga que un sistema de control en tiempo continuo tiene en el plano s polos en lazo cerrado en s = -(TI jco., Si en ese sistema se involucra la operacion de muestreo y si WI > t w" siendo w, la frecuencia de muestreo, entonces ocurrira un doblamiento de frecuencia y el sistema se comportara como si tuviera polos en S = -(Tj j(wl nwJ, donde n = 1,2,3, .... Esto significa que la operacion de muestreo dobla los polos exteriores de la franja primaria hacia el interior de la franja primaria, y los polos volveran a aparecer en S = -(TI j( WI - wJ; yea la figura 4-12a). En el plano z estos polos seran transformados en un par de polos complejos conjugados, tal y como se muestra en la figura 4-12b). Cuando ocurre un doblamiento de frecuencia, se observaran oscilaciones con frecuencias w, - WI en vez de la frecuencia WI'
Antilisls de estabilldad de un sistema en 11lZO cerrado. A continuacion analizaremos la estabilidad de los sistemas de control en tiempo discreto lineales e invariantes con el tiempo de una entrada/una salida. Considere eJ siguiente sistema con funcion de transferencia de pulso en lazo cerrado:
Seccion 4-3
183
jl2w, - w,)
1m
Plan z
..
Franja primana
a
-jlw,-w,) -jw,/2 -jw,
Re
:<
X
~a,
,',
-j(2w, - w,'
.',
a)
b)
Figura 4-12 a) Diagrama que muestra los palos en el plano s en -CT, jw, y los palos can doblamiento que aparecen en -CT, j(w, w,), -CT, j(w, 2w,), ... ; b) correspondencia en el plano z de los palos del plano sen -CT, jw" -CT, j(w, w,), -CT, j(w, 2w.,), . . ,
C(z)
R(z)
G(z) 1 + GH(z)
(4-3)
La estabilidad del sistema que define la ecuacion (4-3), asi como la de otros tipos de sistemas de control en tiempo discreto, puede determinarse por las localizaciones de los polos en lazo cerrado en el plano z, 0 por las rakes de la ecuacion caracterfstica
P(z)
como sigue: 1.
= 1 + GH(z) = 0
2.
3.
Para que el sistema sea estable, los polos en lazo cerrado 0 las raices de la ecuacion caracterfstica deben presentarse en el plano z dentro del circulo unitario, Cualquier polo en lazo cerrado exterior al circulo unitario hace inestable al sistema. Si un polo simple se presenta en z = I, entonces el sistema se convierte en criticamente estable, Tambien el sistema se convierte en criticamente estable si un solo par de polos complejos conjugados se presentan sobre el circulo unitario en el plano z. Cualquier polo multiple en lazo cerrado sobre el circulo unitario hace al sistema inestable. Los ceros en lazo cerrado no afectan la estabilidad absoluta y por 10 tanto pueden quedar localizados en cualquier parte del plano z
Entonces, un sistema de control en lazo cerrado en tiempo discreto lineal e invariante con el tiempo de una entrada/una salida se vuelve inestable si cualquiera de los polos en lazo cerrado se presenta por fuera del circulo unitario y/o cualquier polo multiple en lazo cerrado se presenta sobre el circulo unitario del plano z.
184
Capitulo 4
Ejemplo 4-2 Considere el sistema de control en lazo cerrado que aparece en la figura 4-13. Determine la estabilidad del sistema cuando K = 1. La funci6n de transferencia en lazo cerrado G(s) del sistema es
1 1 - e" G(s) = - - - - s s(s + 1) Refiriendose a la ecuaci6n (3-58), la transformada z de G(s) cs
G(z)
(4-4)
C(z) R(z)
la ecuaci6n caracteristica es
G(z)
1 + G(z)
1 + G(z)
que se convierte en
+ 0.6321
z,
En vista de que
0.5 + jO.6181,
Z2 =
0.5 - jO.6181
el sistema es estable.
Es importante observar que en ausencia del muestreador, un sistema de segundo orden es siempre estable. Sin embargo, en presencia del muestreador, un sistema de segundo orden como este puede hacerse inestable para valores de ganancia grandes. De hecho, puede demostrarse que si K> 2.3925 el sistema de segundo orden que aparece en la figura 4-13 se puede convertir en inestable. (Yea el ejemplo 4-7.)
Metodos para probar fa estabilidad absofuta. Se pueden aplicar tres pruebas de estabilidad directamente a la ecuaci6n caracteristica P(z) = 0, sin tener que resolver las raices. Dos de elias son la prueba de estabilidad de Schur-Cohn y la prueba de estabilidad de Jury. Estas dos pruebas revelan
R(s)
1
s (s
CIs)
1)
C(z)
R(zl
Figura 4-13
eccion
4-3
ana z
185
,.1 existencia de cualquier raiz inestable (raices qu. el plano z se presentan fuera del circulo .mitario). Sin embargo, estas pruebas no dan las localizaciones de las raices inestables, ni indican los efectos de cambios en los parametres sobre la estabilidad del sistema, excepto en el caso senciIIo de sistemas de bajo orden. (Vea el ejemplo 4-7.) EI tercer metodo esta basado en la transformaci6n ::'i1ineal conjuntamente con el criterio de estabilidad Routh, que sera descrito mas adelante en esta seccion. (En el capitulo 5 estudiaremos el anal isis de estabilidad de Liapunov, que es aplicable a sistemas de control definidos en el espacio de estados.) Tanto la prueba de estabilidad de Schur-Cohn como la prueba de estabilidad de Jury pueden aplicarse a ecuaciones polin6micas con coeficientes reales 0 complejos. Los calculos requeridos en la prueba de Jury, cuando la ecuaci6n polin6mica implica unicamente coeficientes reales, son mucho mas senciIIos que los requeridos en la prueba de Schur-Cohn. En vista de que los coeficientes de las ecuaciones caracteristicas correspondientes a sistemas fisicamente realizables son siempre reales, es preferible la prueba de Jury sobre la prueba de Schur-Cohn.
La prueba de estabilidad de Jury. AI aplicar la prueba de estabilidad de Jury a una ecuaci6n caracteristica dada P(z) = 0, construimos una tabla cuyos elementos se basan en los coeficientes de P(z). Suponga que la ecuaci6n caracteristica P(z) es un polinomio en z, como sigue:
P(z)
(4-5)
donde ao > O. Entonces la tabla de Jury se construye como se ve en la tabla 4- I. Observe que los elementos del primer rengl6n estan formados por los coeficientes en P(z) arreglados en orden de potencias ascendentes de z. Los elementos del segundo rengl6n estan formados por los coeficientes de P(z) arreglados en orden de potencias descendentes de z. Los elementos correspondientes a los renglones 3 hasta 2n -3 se obtienen mediante los siguientes determinantes:
TABLA 4-1
Rengl6n
z'
an -1
Z2
Z3
zn-2
zn-l
zn
an ao
b.;-,
an - 2
a2
an -3
a2
an -2
a,
an -1
ao an
2
3
a,
bn - 2
a3
b; - 3
b2
b; -4
b3
b,
bo bn -I
bo
en Co
2
i;
en C,
3
b; -2
Co
5
6
en- 4
C2
en
-5
C3
en
-2
2n - 5 2n - 4 2n - 3
P3 po q2
P2 p, q,
PI
po P3
P2 qo
186
Capitulo 4
b, = Ian ao
Ck
an-1- k l, a.; I
b n- 2 - k I bk + 1 '
Ib n- 1
bo
qk
= Ip3
po
PHI
PHI,
k=0,1,2
Note que el ultimo rengl6n de la tabla esta formado par tres elementos. (Para sistemas de segundo orden, 2n - 3 = I Yla tabla de Jury estara s610 form ada par un rengl6n, que contiene tres elementos.) Observe que los elementos en cualquier rengl6n par son simplemente los inversos del rengl6n impar inmediatamente anterior.
Criterio de estabilidad mediante fa prueba de Jury. Un sistema can la ecuaci6n caracterfstica P(z) = 0 dado par la ecuaci6n (4-5), y rescrito de la forma
1. 2.
la,,1 < ao
P(z)lz~]
>0
{>oparanpar < 0 para n impar
3. 4.
P(z)lz~-1
Ejemplo 4-3
Construya la tabla de estabilidad de Jury para la siguiente ecuacion caracteristica:
P(z) =
aoz
a1 Z3
a2z2
a3Z
a4
don de a o > O. Escriba las condiciones de estabilidad. A partir del caso general de la tabla de estabilidad de Jury dado en la tabla 4-1, puede construirse una tabla de estabilidad de Jury para el sistema de cuarto orden, tal y como se muestra en la tabla 4-2. La tabla ha sido modificada ligeramente en relacion con la forma estandar y resulta conveniente para los calculos de las b y de las c. EI determinante incluido en la parte intermedia de cada renglon da el valor de bode c escrito en el lado derecho del mismo renglon, Las condiciones de estabilidad son las siguientes:
1.
la41 < ao
n = 4 = par
Seccion 4-3
TABLA 4-2
187
Renglon
I I
I
a. ao
a. ao a.
ao
'1/ .>:
"1/
Co
..':
'1/
.> ::1
= b.-
=b.
=b 1
1::= :'.1 /
I
I
b. bo
3
=b o
/::1
=c.
b bo
3
=Cl
/b.
3
4
b bo
::1/
c,
=Co
C.
Debe hacerse notar que el valor de c, (0 bien, tratandose de un sistema de orden n, el valor de q,) no es utilizado en la prueba de estabilidad y, por 10 tanto, el calculo de c, (0 q,) puede omitirse.
= z" -
ao =
at = a2 =
-1.2 0.07
a, = 0.3 a.
=
-0.08
Es claro que la primera condicion la.1 < aose satisface. Examinemos la segunda condicion en relacion con la estabilidad:
P(l)
188
Capitulo 4
n = 4 = par
Por 10 tanto, se satisface la tercera condici6n. Ahora construiremos la tabla de estabilidad de Jury. A partir del ejemplo 4'-3, calculamos los valores de b: b-; b, Y b.; y de C 2 y de Co EI resultado aparece en la tabla 4-3. (Aunque en la tabla aparece el valor de C I, este no es necesario en la prueba de estabilidad y, por 10 tanto, no necesita ser calculado.) De esta tabla, obtenemos
Ib 3
0.994> 0.204
Ibol
leoI
Iezl = 0.946
> 0.315 =
Por 10 tanto, se satisfacen ambos elementos de la cuarta condici6n dados en el ejemplo 4-3. Una vez satisfechas todas las condiciones de estabilidad, la ecuacion caracterfstica dada es estable 0, 10 que es 10 mismo, todas las raices estan dentro del cfrculo unitario en el plano z. De hecho, la ecuaci6n caracteristica dada P(z) puede ser factorizada como sigue:
..
Z
= b 3 = -0.994
= b 2 = 1.176
= b , = -0.0756
1-~08
0.31 -1.2
= b o = -0.204
204
13 4 5
-0.
= C2 = 0.946
-0.994
1-
= c, = -1.184
-0.204
1-
= Co = 0.315
189
Ejemplo 4-5
Examine la estabilidad de la ecuaci6n caracterfstica dada par P(z)
Z3 -
1.1z 2
O.lz
+ 0.2 =
ao =
aj = -1.1
a, = -0.1 a3
=
0.2
Las condiciones de estabilidad en la prueba de Jury para el sistema de tercer arden son las siguientes:
1. la3i < a o 2. P(IO 3. P(-I) < 0, 4.. Ib 21 > Ibol
n = 3 = impar
La primera condicion, la,l < ao, claramente se satisface. Ahara examinemos la segunda condici6n de la prueba de estabilidad de Jury: P(l)
Esto indica que por 10 menos una raiz esta en z = I. Por 10 tanto, como maximo el sistema es criticamente estable. Las pruebas siguientes deterrninaran si eI sistema es criticamente estable 0 es inestable. (Si la ecuaci6n caracteristica dada representa un sistema de control, la estabilidad critica no es deseable. Llegado a este punto puede detenerse la prueba de estabilidad.) La tercera condici6n de la prueba de Jury nos da P(-l)
n = 3 = impar
La tercera condici6n se satisface. Ahora veamos la cuarta condici6n de la prueba de Jury. Calculos sencillos dan b, = -0.96 Y bo = -0.12. De ahi
Ib 2
>
Ibol
La cuarta condici6n de la prueba de Jury se satisface. Del analisis anterior concluimos que la ecuaci6n caracteristica dada tiene una raiz en el circulo unitario (z = I) Ylas otras dos ralces en el interior del circulo unitario en el plano z. Por 10 tanto, el sistema es criticamente estable. Ejemplo 4-6 Un sistema de control tiene la siguiente ecuaci6n caracteristica: P(z)
Z3 -
1.3z 2
0.08z
+ 0.24 =
ao = 1
al =
-1.3 -0.08
a2
as = 0.24
190
Capitulo 4
Es claro que se satisface la primera condicion de estabilidad, IG 3 1 < condicion segunda para estabilidad:
Go.
A continuacion, examinamos la
Ejemplo 4-7 Consideremos el sistema de control con realirnentacion unitaria en tiempo discreto (con periodo de muestreo T= I segundo) cuya funcion de transferencia pulso en lazo abierto esta dada por
C(z)
R(z)
Z2
P(z) =
Z2
Dado que se trata de un sistema de segundo orden, las condiciones de estabilidad de Jury pueden escribirse como sigue:
1. 'IG 2 1 < Go 2. P(I) > 0 3. P(-I) > 0,
n=2=par
G2
Go
Aplicaremos ahara la primera condicion de estabilidad. En vista de que = I, la primera condicion de estabilidad se convierte en 10.3679 + 0.2642KI < 1
= 0.3679 + 0.2642K Y
es decir
(4-6)
K>0
La tercera condicion de estabilidad da
26.382> K
(4-8)
Para estabilidad, la con stante de ganancia K debe satisfacer las desigualdades (4--6), (4-7) Y(4-8). Por 10 tanto, 2.3925> K > 0
Secci6n 4-3
191
EI rango de la constante de ganancia K para estabilidad esta entre ay 2.3925. Si la ganancia K se define igual a 2.3925, entonces el sistema se convierte en criticamente estable (10 que significa que en la salida existiran oscilaciones sostenidas). La frecuencia de las oscilaciones sostenidas puede determinarse, si se escribe 2.3925 en lugar de K en la ecuaci6n caracteristica y se investiga la ecuaci6n resultante. Con K = 2.3925, la ecuaci6n caracteristica se convierte en
Z2 -
0.4877z + 1 = 0
Las raices caracteristicas estan en z = 0.2439 jO.9698. Si observamos que el periodo de muestreo T= 1 segundo, de la ecuaci6n (4-2) tenemos
Wd
W,
/ ,
21T /7
Antilisis de estabilldad mediante fa transformacion bilineal y ef criterio de estabilldad de Routh. Otro metodo muy utilizado en el analisis de estabilidad de los sistemas de control en tiernpo discreto es el uso de la transformaci6n bilineal, junto con el criterio de estabilidad de Routh. EI metodo requiere de la transformaci6n del plano z a otro plano complejo, el plano w. Aquellos que esten familiarizados con el criterio de estabilidad de Routh-Hurwitz encontraran el rnetodo sencillo y sin rodeos. Sin embargo, la cantidad de calculo requerido es mucho mayor que en el criterio de estabilidad de Jury, La transforrnacion bilineal definida por
z
misma que, al ser resuelta en funcion de w, da
w+l w - 1
z +1 w=-z - 1
hace corresponder el interior del circulo unitario del plano z con el semiplano Izquierdo del plano w. Esto puede verse como sigue. Hagamos que la parte real de w sea a y la parte imaginaria w, de tal forma que
= u + jw
Izi
es decir
I w + 1 I = I u + ~w + 1 I <
w - 1
cr + JW - 1
obtenemos
(u + 1 + w 2 < (u - 1
10 que da
r+
u<o
192
Capitulo 4
Entonces, el interior del circulo unitario (izi < I) en el plano z corresponde al semiplano Izquierdo del plano w. EI circulo unitario en el plano z corresponde al eje imaginario en el plano w, y la parte extema del circulo unitario en el plano z corresponde al semiplano derecho del plano w. (Debe sefialarse que, aunque el plano w es similar al plano s en que este corresponde al interior del circulo unitario hacia el semiplano izquierdo, de ninguna manera es cuantitativamente equivalente al plano s. Por 10 tanto, la estimacion de la estabilidad relativa del sistema a partir de las localizaciones de los polos en el plano w es dificil.) En el anal isis de estabilidad, utilizando la transformacion bilineal junto con el criterio de estabilidad de Routh, primero pondremos (w + I)/(w - I) en lugar de z en la ecuacion caracterfstica
como sigue:
Q(w)
Una vez que transformemos P(z) = en Q(w) = 0, es posible aplicar el criterio de estabilidad de Routh de la misma forma que en los sistemas en tiempo continuo. Debe hacerse notar que la transformacion bilineal junto con el criterio de estabilidad de Routh indicara exactamente cuantas raices de la ecuacion caracterfstica estan en el semiplano derecho del plano w, y cuantas sobre el eje imaginario. Sin embargo, en el disefio de sistema de control, la informacion relacionada con el numero exacto de polos no estables por 10 general no es necesaria, porque no se desean sistemas de control inestables 0 criticamente estables. Tal y como fue mencionado antes, la cantidad de calculos que este metodo necesita es mucho mayor que la requerida en la prueba de estabilidad de Jury. Por 10 tanto, seguiremos mas adelante con este tema. Nos permitimos referir al lector al problema A-4-3, donde el metodo presente es utilizado para el analisis de estabilidad.
2.
3.
Si estamos interesados en el efecto de algun parametro de sistema sobre la estabilidad de un sistema de control en lazo cerrado, podria resultar util un diagrama dellugar geometrico de las raices. Puede usarse MATLAB para calcular y graficar un diagrama del lugar geornetrico de las raices. Debe notarse que, en la prueba de la estabilidad de una ecuacion caracterfstica, pudiera resultar mas simple, en algunos casos, determinar directamente las raices de la ecuacion caracteristica mediante el uso de MATLAB. Es importante observar que la estabilidad no tiene nada que ver con la habilidad de un sistema para seguir una entrada especifica. La sefial de error en un sistema de control en lazo cerrado puede aumentar sin limite, aun si el sistema es estable. (Yea la seccion 4-4 en relacion con un analisis de las constantes de los errores.)
Seccion 4-4
193
Especijicaciones de fa respuesta transitoria. En muchos casos practices, las caracterfsticas de desempefio deseadas de los sistemas de control, sean en tiempo continuo 0 en tiempo discreto, se especifican en terminos de cantidades en el dominio de tiempo. Esto ocurre debido a que los sistemas con almacenamiento de energia no pueden responder en forma instantanea y siempre que esten sujetos a entradas 0 perturbaciones mostraran algunas respuestas transitorias. Con frecuencia, las caracterfsticas de desempefio de un sistema de control estan especificadas en terminos de su respuesta transitoria a una entrada escal6n unitario, ya que la entrada escal6n unitario es facil de generar yes 10 suficientemente drastica para proporcionar informaci6n util tanto de las caracteristicas de la respuesta transitoria como de la respuesta en estado permanente del sistema. La respuesta transitoria de un sistema a una entrada escalon unitario depende de las condiciones iniciales. Por comodidad, al comparar respuestas transitorias de varios sistemas, es comun utilizar la condici6n inicial estandar: el sistema esta inicialmente en reposo y la salida y todas sus derivadas con respecto al tiempo son cero. Las caracteristicas de respuesta pueden entonces compararse sin dificultad. La respuesta transitoria de un sistema de control practico, donde la sefial de salida es en tiempo continuo, a menudo muestra oscilaciones amortiguadas antes de lIegar al estado permanente. (Esto es cierto para la mayoria de los sistemas de control en tiempo discreto 0 digitales, porque las plantas a controlarse en la mayor parte de los casos son en tiempo continuo y, por 10 tanto, las senates de salida son en tiempo continuo.) Considere, por ejemplo, el sistema de control digital que se muestra en la figura 4-14. La salida
r (t)
Controlador digital Planta
e (t)
T
e(kT)
10
Reten
Figura 4-14
194
c(t)
Capitulo 4
o
a)
c(kT)
Figura 4-15 a) Respuesta escalon unitario del sistema mostrado en la figura 4-14; b) salida en tiempo discreto correspondiente a la respuesta escalon unitario.
kT
b)
e(t) de un sistema como este a una entrada escalon unitario puede mostrar oscilaciones amortiguadas, tal y como se muestra en la figura 4-15a). En la figura 4-15b) aparece la salida en tiempo discrete e(kT). Igual que en el caso de los sistemas de control en tiempo continuo, la respuesta transitoria de un sistema de control digital puede caracterizarse no solo por el factor de amortiguamiento relativo y la frecuencia natural amortiguada, sino tambien por el tiempo de levantamiento, los sobrepasos maximos, el tiempo de asentamiento y asi sucesivamente, en respuesta a una entrada escalon. De hecho, en la especificacion de distintas caracteristicas de la respuesta transitoria, es comun especificar las cantidades siguientes:
ESPECIFICACIONES DE LA RESPUESTA TRANSITORIA
1. 2. 3. 4. 5.
Tiempo de retardo t d Tiempo de levantamiento t, Tiempo pica ' Sobrepaso maximo Mp Tiempo de asentamiento t,
Las especificaciones de la respuesta transitoria antes mencionadas en la respuesta escalon unitario son definidas a continuacion y aparecen en forma grafica en la figura 4-16.
I.
Tiempo de retardo td . EI tiempo de retardo es el tiempo requerido para que la respuesta lIegue a la mitad del valor final la primera vez.
y en estado permanente
195
c Itl
'-'-1
Mp
I
1
Tolerancia permisible
1.0 0.9
I
I
I I
05
I I
I I
01 I
1
ot-t---'----i----.,.-----------;.------------_
Figura 4-16 Curva de respuesta escalon unitario que muestra las especificaciones de rcspuesta transitorias I.;. t,.. '/" st, YI,.
:2.
3.
t
Tiempo de levantamiento t, EI tiernpo de levantamiento es el tiempo que requiere la respuesta para pasar de 10% hasta 90%. de 5% a 95% 0 de 0% a 100% de su valor final. segun la situaci6n. Para sistemas de segundo orden subarnortiguados, por 10 regular se utiliza el tiernpo de levantamiento de 0% a 100%. Para sistemas sobreamortiguados y sistemas con atraso de transporte, comunrnente se utiliza el tiempo de levantarniento de 10% a 90%. Tiempo pico tv EI tiempo pica es el tiempo requerido para que la respuesta llegue a la primera cresta del sobrepaso. Sobrepaso maximo ~,. EI sobrepaso maximo es el valor maximo de la curva de respuesta medido a partir de la unidad. Si el valor final en estado permanente de la respuesta difiere de la unidad, entonces es com un utilizar el sobrepaso porcentual maximo. Queda definido por la relaci6n
c(t )-c(oo)
I' ( )
coo
x 100%
5.
La cantidad de sobrepaso maximo (en porcentaje) indica en forma directa la estabilidad relativa del sistema. Tiempo de asentamiento I,. EI tiempo de asentamiento es el tiempo requerido para que una curva de respuesta llegue y se quede dentro de un rango alrededor del valor final de un tamano especificado, en funci6n de un porcentaje absoluto de valor final. par 10 general 2%. EI tiempo de asentamiento esta relacionado con la con stante de tiempo de mayor valor en el sistema de control.
Las especificaciones en el dominio del tiempo que acabamos de dar son muy importanres, ya que la mayor parte de los sistemas de control son sistemas en el dominio del tiempo: esto es. deben mostrar respuestas aceptables en el tiempo. (Lo que significa que el sistema de control bajo disei'io debera ser modificado hasta que la respuesta transitoria sea satisfactoria.) No todas las especificaciones que acabarnos de definir se aplican necesariamente a un caso
196
Capitulo 4
dado. Por ejemplo, en el caso de un sistema sobreamortiguado, no son aplicables los terminos correspondientes al tiempo pico y el sobrepaso maximo. Por otra parte, algunas especificaciones pudieran incluirse: para aquellos sistemas que generan errores en estado permanente en caso de entradas escal6n, el error deb era conservarse dentro de un nivel porcentual especificado. (Mas adelante en esta secci6n se hara un analisis detallado de los errores en estado permanente.) Supongamos que se satisface el teorema de muestreo y que no ocurre doblamiento de frecuencia. La naturaleza de la respuesta transitoria de un sistema de control en tiempo discreto a una entrada dada depende de las localizaciones reales de los polos y ceros en lazo cerrado en el plano z. Considere el sistema de control en tiempo discreto definido por
C(z)
R(z)
boz"
Z"
+ bjz"- t + + at Z" +
j
+ b ll + all
(4-9)
donde R(z) es la transformada z de la entrada y CCz) es la trasformada z de la salida. Con MATLAB. es facil obtener la respuesta transitoria de un sistema como este, a entradas delta Kronecker, a entradas escalon, a entradas rampa, y as! sucesivamente. Yea, por ejemplo, el ejemplo 4-8.
Ejcmplo 4-8 Considere el sistema de control en tiempo discreto definido por
CCz)
R(z)
Z2 -
(4-10)
Obtenga la respuesta escal6n unitario de este sistema. En el programa MATLAB 4-1 aparece un programa MATLAB para obtener la respuesta escal6n unitario. La grafica resultante de c(k) en funci6n de k se muestra en la figura 4-17.
MATLAR Programa 4-1
'Y<, ---------- Respuesta escalon unitario --------num = [0 0.4673 -0.3393); den=[l -1.5327 0.6607]; r = ones(1,41); v=[O 40 0 1.6]; axis(v); k = 0: 40; c = filter(num,den,r); plot(k,c'o') grid title('Unit-Step ResponseJE) xlabel('k') ylabel('c(k)')
Andlisis de error en estado permanente. Una caracteristica importante asociada con la respuesta transitoria es el error en estado permanente. EI desempefto en estado permanente de un sistema de control estable se juzga en general por el error en estado perrnanente debido a entradas esca16n, rampa y de aceleraci6n. A continuaci6n investigaremos un tipo de error en estado permanente que es causado por la incapacidad de un sistema para seguir tipos especiales de entradas. (Debera notarse que, adernas de este tipo de error en estado permanente, existen errores que pueden ser atribuidos a otras causas, como imperfecciones en los componentes del sistema, fricci6n estatica,
Secci6n 4-4
y en estado permanente
Respuesta escal6n unitario
197
1.4
00
1.2
o
o o
o
o
0 0 00 0
.
0
0 0
00 0
~
u
10
15
20
25
30
35
40
k
Figura 4-17 Respuesta escalon unitario del sistema definido por la ecuacion (4-10).
zonas muertas, 0 el deterioro 0 edad de los componentes. En esta secci6n, sin embargo, no analizaremos errores en estado permanente debidos a estas causas.) En forma inherente, cualquier sistema fisico de control sufre de error en estado permanente en respuesta a ciertos tipos de entrada. Esto es, un sistema pudiera no tener ningun error en estado permanente a entradas escalon, pero el mismo sistema puede mostrar error en estado permanente distinto de cero en respuesta a entradas rampa. Dependera del tipo de la funci6n de transferencia en lazo abierto del sistema si un sistema dado muestra 0 no error en estado perrnanente en respuesta a un tipo dado de entrada. Considere el sistema de control en tiempo continuo cuya funci6n de transferencia en lazo abierto G(s)H(s) esta dada por
G(s)H(s)
EI termino slY en el denominador representa un polo de multiplicidad N en el origen. Es costumbre clasificar el sistema de acuerdo con el numero de integradores en la funci6n de transferencia en lazo abierto. Se dice que un sistema es de tipo 0, tipo I, tipo 2, ... , si N = 0, N = I, N = 2, ... , respectivamente. Los sistemas de tipo mostraran errores finitos en estado perrnanente en respuesta a entradas escal6n y errores infinitos en respuesta a entradas rampa 0 de orden superior. Los sistemas de tipo I no mostraran ningun error en estado permanente en respuesta a entradas escal6n, errores finitos en estado perrnanente en respuesta a entradas rampa, y errores infinitos en estado permanente en respuesta a entradas de aceleraci6n y de orden mayor. Conforme se incrementa el nurnero de tipo, la precisi6n aumenta. Sin embargo, al incrementar el tipo, el problema de estabilidad se complica. Siempre sera necesario un termino medio entre la precisi6n en estado permanente y la estabilidad relativa (caracteristicas de la respuesta transitoria). Los conceptos de las constantes de error estatico pueden extenderse al sistema de control en tiempo discreto, como se analiza a continuaci6n.
198
Copitu!o 4
Los sistemas de control en tiernpo discreto pueden clasificarse segun el nurnero de polos en lazo abierto en z = I. (Un polo en lazo abierto en z = I corresponde a un integrador en el lazo.) Suponga que la funcion de transferencia pulso en lazo abierto esta dada por la ecuacion
Funcion de transferencia pulso en lazoabierto
=
donde B(z)/A(z) no contiene ni polos ni ceros en z = I. Entonces el sistema se puede c1asificar como sistema de tipo 0, sistema de tipo I 0 sistema de tipo 2, segun si N = 0, N = IoN = 2, respectivamenteo EI tipo de sistema define las caracterfsticas del sistema en estado permanente 0 la precision en estado permanente. EI significado fisico de las constantes de error estatico para sistemas de control en tiempo discreto es el mismo que en los sistemas de control en tiempo continuo, excepto que el primero solo transmite informacion en los instantes de muestreo. Considere el sistema de control en tiempo discreto que se muestra en la figura 4-18. Suponemos que el sistema es estable, de tal forma que el teorema de valor final puede aplicarse para la determinacion de los valores en estado permanente. Del diagrama tenernos el error de actuacion
e(t)
ret) - bet)
Consideraremos el error de actuacion en estado permanente en los instantes de muestreo. Note que a partir del teorema del valor final tenemos
lime(kT)
k-----+x
1im[(1- Z-I)(Z)]
z-----+l
(4-11)
Entonces tenemos
C(z) R(z)
y
C(z)
1 + CH(z)
crt)
C(z)
Rizi
bltl
Figur1l4-18 Sistema de control en ticmpo discrete.
His)
I.. .
f--------....J
Seccion 4-4
y en estado permanente
199
(z)
+ CH(z) R(z)
(4-12)
e;
(4-13)
Como en el caso del sistema de control en tiempo continuo, consideraremos tres tipos de entradas: escalon unitario, rampa unitaria y entradas de aceleraci6n unitaria.
R(z)
-z -I
Si escribimos esta ultima ecuaci6n en la ecuaci6n (4-13), el error de actuaci6n en estado permanente en respuesta a una entrada escal6n unitario se puede obtener como sigue:
= lim CH(z)
z~l
(4-14)
Entonces el error de actuaci6n en estado permanente en respuesta a una entrada escal6n unitario puede obtenerse a partir de la ecuaci6n
e;
1 1+ K
p
(4-15)
EI error de actuaci6n en estado permanente en respuesta a una entrada escal6n unitario se convierte en cero si K1, = x, 10 que requiere que CH(z) tenga por 10 menos un polo en z = I.
r ess = z~
[(1
-I)
= z~
(1 -
z-I)CH(z)
(4-16)
Entonces el error de actuaci6n en estado permanente en respuesta a una entrada rampa unitaria puede ser dado por
1 e; =-K
I'
(4.17)
Si K" =X, entonces el error de actuaci6n en estado permanente en respuesta a una entrada rampa unitaria es cero. Esto requiere que CH(z) posea un polo doble en z = I.
200
Capitulo 4
+ I(r), tenemos f
T 2(1 +
R(z)
2(1 _
2(1
Z 1)3
ess
~~ (1 -
-1
1
)
Z-1)Z-1]. Z-1)3
1 + CH(z)
2(1 -
~~ (1 -
T2
Z-1)2
CH(z)
Definimos la constante de error de aceleraci6n estatica K" como sigue: (4-18) Entonces el error de actuaci6n en estado permanente se convierte en
e;
1
a
(4-19)
EI error de actuaci6n en estado permanente en respuesta a una entrada de aceleraci6n unitaria se convierte en cero si K, = x. Esto requiere que GH(z) posea un polo triple en z = I. Las ecuaciones (4-15), (4-17) Y (4-19) dan las expresiones para los errores de actuacion en estado permanente del sistema de control en tiempo discreto que aparece en la figura 4-18, en los instantes de muestreo para entradas escal6n unitario, ramp a unitaria y de aceleraci6n unitaria, respectivamente.
Resumen. Es importante enfatizar que el error de actuaci6n es la diferencia entre la entrada de referencia y la sefial de realimentaci6n, y no la diferencia entre la entrada de referencia y la salida. Del analisis anterior vemos que un sistema de tipo 0 mostrara un error de actuaci6n en estado permanente con stante, en respuesta a una entrada escal6n y un error de actuaci6n infinito, en respuesta a entradas ramp a, de aceleraci6n 0 de orden superior. Un sistema de tipo I mostrara un error de actuacion en estado permanente cero de respuesta escalon, un error en estado permanente constante en respuesta a una entrada rampa y un error de actuaci6n en estado permanente infinito en respuesta a entradas de aceleraci6n 0 de orden superior.
TABLA 4-4 TI POS DE SISTEMAS Y LOS ERRORES CORRESPONDI ENTES AL ESTADO PERMANENTE EN RESPUESTA A ENTRADAS ESCALON, RAMPA Y ACELERACION PARA EL SISTEMA DE CONTROL EN TIEMPO DISCRETO QUE SE MUESTRA EN LA FIGURA 4-18
Errores en estado permanente en respuesta a Sistema Entrada escal6n r(t) = I 1 l+KI' 0 0 Entrada rampa r(t) = t
Xc
+r
-x:
1 K, 0
YO
K;
Secci6n 44
201
La tabla 4-4 lista los tipos de sistemas y los errores correspondientes al estado permanente, en respuesta a entradas escalon, rampa y de aceleraci6n para el sistema de control en tiempo discreto de la configuraci6n mostrada en la figura 4-18. EI analisis de error en estado permanente que acabamos de presentar es aplicable al sistema de control en tiempo discreto en lazo cerrado mostrado en la figura 4-18. Para una configuraci6n distinta en lazo cerrado, debe hacerse notar que si el sistema de control en tiempo discreto en lazo cerrado tiene una funci6n de transferencia pulso en lazo cerrado, entonces se pueden determinar las constantes de error estaticas mediante un anal isis similar al que acaba de presentarse. La tabla 4-5 muestra las constantes de errores basicos para configuraciones en lazo cerrado tfpicas de sistemas de control en tiempo discreto. Si el sistema de control en tiempo discreto en lazo cerrado no tiene una funci6n de transferencia pulso en lazo cerrado, sin embargo, las constantes de error estatico no pueden definirse, porque la sefial de entrada no puede separarse de la dinarnica del sistema. Es importante notar que los terminos "error de posicion", "error de velocidad" y "error de aceleracion" significan desviaciones en estado permanente de la posici6n de salida. Un error de velocidad finito implica que despues de que los transitorios hayan desaparecido, la entrada y la salida se mueven a la misma velocidad, pero tienen una diferencia finita de posici6n.
TABLA 4-5 CONSTANTES DE ERROR ESTATICO PARA CONFIGURACIONES EN LAZO CERRADO TiplCAS DE SISTEMAS DE CONTROL EN TIEMPO DISCRETO.
Configuraci6n en lazo cerrado Valores de K,,, K,. Y K" K p = lim GH(z)
z-I
K - li
t- -
}!!l
(1 - rl)GH(z)
T
K - (
r -
zl!!f
(I - z-I)G(z)H(z) T
K -(
a -
}~
( l - r ')2G,(z)HG z(z)
T2
K - (
v -
}!!l }!!l
K - li
a -
TZ
202
Copitulo 4
Respuesta a perturbaciones. AI examinar las earaeteristieas de respuesta transitoria y los errores en estado perrnanente, es importante observar que, adernas de los eorrespondientes a las entradas de referencia, deberan ser explorados los efeetos de perturbaeiones. Para el sistema mostrado en la figura 14-19a), supongamos que la entrada de refereneia es cero, es deeir R(:::) = 0, pero el sistema esta sujeto a la perturbaei6n N(z). Para este caso, el diagrama de bloques del sistema puede volverse a dibujar eomo se muestra en la figura 4-19b). Entonees la respuesta C(:::) a la perturbaei6n N(:::) puede eneontrarse a partir de la funei6n de transfereneia pulso en lazo eerrado
C(z)
N(z)
G(z)
1 + GD(z)G(z)
Si IG/)(:::)G(:::)1
I, entonees eneontramos
C(z)
N(z)
==
GD(z)
N(z)
R(z) cO
G(z)
C(z)
a)
N(z)
C(z!
b)
Figura 4-19 a) Sistema de control digital cn lazo ccrrado sujcto a una entrada de rcfcrcncra y a una entrada de pcrturbacion; h) diagrama de bloqucs modificado dondc la entrada de pcrturbacion sc considcra la entrada al sistema.
Seccion 4-4
y en estado permanente
203
N N(z) = 1 - Z
si Gn(::) impliea un polo en z
=
Gv(z) = Gv(z) =
donde G n(::) no impliea ningun eero en z dado por
:~I
=
GD(Z)Z~I
-lim
z~1
[0 - Z-I) 1 -Nz
_I
Si un sistema lineal esta sujeto tanto a una entrada de refereneia como a una entrada de perturbacion, entonees el error resultante es la suma de los errores debidos a la entrada de referencia y a la entrada de perturbacion. EI error total debera de conservarse dentro de Ifmites aceptables. Observe que el punto donde la perturbacion entra en el sistema es muy importante en el ajuste de la ganancia de Gn(::)G(::). Por ejernplo, eonsidere el sistema mostrado en la figura 4-20a). La funcion de transferencia pulso en lazo cerrado para la perturbacion es
C(z) N(z)
_ (z) N(z)
A fin de minimizar los efeetos de la perturbacion N(::) en el error del sistema E(::), la ganancia de Gn(::)G(::) debe haeerse 10 mas grande posible. Sin embargo, para el sistema rnostrado en la figura 4-20b), la funcion de transferencia pulso en lazo cerrado para la perturbacion es
C(z) N(z)
(z) N(z)
Gv(z)G(z)
1
+ Gv(z)G(z)
y para minimizar los efectos de la perturbacion N(::) en el error de sistema E(::), la ganancia de Gn(::)G(::) debe hacerse tan pequefia como sea posible. Por 10 tanto, resulta ventajoso obtener la expresion para E(::)/N(::) antes de concluir si la gananeia de Gn(::)G(::) debera ser grande 0 pequena para minirnizar el error debido a perturbaciones. Es importante recordar, sin embargo, que la magnitud de la ganancia no puede ser determinada solo a partir de consideraciones de perturbacion. Debe determinarse considerando las respuestas tanto de las entradas de referencia como de perturbacion. Si las regiones de frecuencia para la entrada de
204
Capitulo 4
R(z) =0
GD(z) G(z)
C(z)
a)
R(z) = 0
C(z)
+H---------'
Nlz)
b)
Figura 4-20 a) Sistema de control digital en lazo cerrado sujeto a la entrada de referencia y a la entrada de perturbaci6n; b) sistema de control digital en lazo cerrado donde la perturbaci6n entra al lazo de realimentaci6n.
referencia y para la entrada de perturbaci6n estan suficientemente separadas, puede insertarse un filtro adecuado en el sistema. Si las regiones de frecuencia se superponen, debera entonces modificarse la -configuracion del diagrama de bloques para obtener respuestas aceptables tanto a entradas de referenetatomo de perturbaci6n.
Tal como se discuti6 en la secci6n 4-4, la estabilidad relativa del sistema de control en tiempo discreto puede ser investigada en relaci6n con el circulo unitario en el plano z. Por ejemplo, si los polos en lazo cerrado son complejas conjugadas y ocurren dentro del circulo unitario, la respuesta escalon unitario sera oscilatoria.
Secci6n 4-5
205
Ademas de las caracteristicas de respuesta transitoria de un sistema dado, a menudo resulta necesario investigar los efectos de la ganancia del sistema 0 del periodo de muestreo del sistema sobre la estabilidad absoluta y relativa del sistema en lazo cerrado. Para estos fines, el metodo del lugar geornetrico de las raices es muy util. El metodo del lugar geornetrico de las raices desarrollado para sistemas en tiempo continuo puede ser extendido sin modificaciones a sistemas en tiempo discreto, excepto por que el limite de estabilidad queda modificado del ejejw en el plano s al circulo unitario en el plano z. La raz6n por la cual el rnetodo del lugar geornetrico de las raices puede extenderse a sistemas en tiempo discreto es porque la ecuaci6n caracteristica correspondiente al sistema en tiempo discreto tiene la misma forma que la del sistema en tiempo continuo en el plano s. Por ejemplo, para el sistema mostrado en la figura 4-21 la ecuaci6n caracteristica es 1 + G(z)H(z) =
que es exactamente de la misma forma que la ecuaci6n del analisis dellugar geometrico de las raices en el plano s. Sin embargo, la localizaci6n de los polos para los sistemas en lazo cerrado en el plano z debe ser interpretada en forma distinta a la correspondiente en el plano s. En esta secci6n demostraremos la aplicaci6n del metodo dellugar geometrico de las raices al disefio de sistemas de control en tiempo discreto 0 digitales. Los programas de computadora para el calculo y graficaci6n de los lugares geometricos de las raices estan disponibles para la mayor parte de los sistemas de computaci6n. En particular, MATLAB proporciona un medio conveniente para graficar ellugar geometrico de las raices tanto para sistemas en lazo cerrado en tiempo continuo como en tiempo discreto. La grafica exacta dellugar geometrico de las raices se puede lIevar a cabo en la computadora y, por 10 tanto, quizas no necesitaremos de procedimientos de tipo grafico. Sin embargo, es una ventaja tener cierta destreza en el graficado del lugar geometrico de las raices, porque ello permitira al ingeniero de control lIevar a cabo graficas rapidas para problemas especificos y asi acelerar etapas preliminares del disefio del sistema. De hecho, un ingeniero de control experimentado a menudo utiliza el metoda del lugar geometrico de las raices para un disefio preliminar, a fin de localizar los polos dominantes en lazo cerrado en las posiciones deseadas del plano z y a continuaci6n utilizar simulaci6n digital para mejorar el desempefio en lazo cerrado.
Condiciones de dngulo y magnitud. En muchos sistemas de control en tiempo discreto lineales e invariantes con el tiempo, la ecuaci6n caracteristica puede tener cualquiera de las dos siguientes formas:
1 + G(z)H(z)
y
1
R(z)
G(z)
+ GH(z)
C(z)
Figura 4-2\
206
Capitulo 4
Para combinar estas dos formas en una, definamos la ecuaci6n caracteristica como
1 + F(z)
donde
(4-20)
F(z)
G(z)H(z)
F(z)
GH(z)
Observe que F(z) es la funci6n de transferencia pulso en lazo abierto. La ecuaci6n caracteristica dada por la ecuaci6n (4-20) se puede escribir en la forma
F(z)=-1
Dado que F(z) es una cantidad compleja, esta ultima ecuaci6n se puede dividir en dos ecuaciones al igualar primero los angulos y a continuaci6n las magnitudes de ambos miembros para obtener
CONDICION DE ANGULO:
k
CONDfCION DE MAGNITUD:
0,1,2, ...
IF(z)1
Los val ores de z que satisfacen tanto las condiciones de angulo como de magnitud son las raices de la ecuaci6n caracteristica, es decir los polos en lazo cerrado. Una grafica de los puntos en el plano complejo que satisfacen solamente la condici6n de angulo es el lugar geometrico de las raices. Las raices de la ecuaci6n caracteristica (los polos en lazo cerrado) que corresponden a un valor dado de la ganancia pueden localizarse en el lugar geornetrico de las raices mediante la condici6n de magnitud. Los detalles de la aplicaci6n de las condiciones de angulo y de magnitud para obtener los polos en lazo cerrado se presentan a continuaci6n.
Procedimiento general para construir ellugar geometrico de las raices. Para un sistema complicado con muchos polos y ceros en lazo abierto, la construcci6n de una grafica del lugar geornetrico de las raices pudiera parecer complicado, pero de hecho no es diflcil si se aplican las reglas establecidas para la construcci6n de un lugar geornetrico de las raices. Mediante la localizaci6n de puntos y asintotas particulares y al calcular los angulos de partida de los polos complejos y los angulos de Ilegada a los ceros complejos, es posible construir el lugar geornetrico de las raices sin dificultad. Note que mientras ellugar geornetrico de las raices puede ser dibujado en forma conveniente mediante una computadora digital, si se intenta la elaboraci6n manual de la grafica dellugar geornetrico de las raices, esencialmente procederemos con base en prueba y error, pero el numero de pruebas requeridas puede reducirse en gran medida si se utilizan las reg las establecidas. Dado que Ios polos complejos conjugados en lazo abierto y los ceros complejos conjugados, de haber alguno, siempre estaran localizados simetricamente en relaci6n con el eje real, los lugares geometricos de las raices siempre seran simetricos respecto al eje real. Por 10tanto, s610 necesitamos construir la parte superior dellugar geometrico de las raices y dibujar la imagen en espejo de la parte superior en la parte inferior del plano z. Recuerde que los angulos de las cantidades complejas que se originan de los polos en lazo abierto y de los ceros en lazo abierto y dibujados al punto de prueba z se miden en direcci6n contraria a las manecillas del reloj. Presentaremos ahora las reglas generales y los procedimientos para la construcci6n del lugar geometrico de las raices.
Secci6n 4-5
207
1 + F(z) =
a
(z + zm) (Z + Pn)
y a continuaci6n reacomode esta ecuaci6n de tal forma que el parametro de interes como la ganancia
(z + PI)(Z + P2)
En el analisis presente, suponemos que el parametro de interes es la ganancia K, donde K> O. De la forma factorizada de la funci6n de transferencia pulso en lazo abierto, local ice los polos y ceros en lazo abierto en el plano r, [Note que si F(::) = G(::)H(::), entonces los ceros en lazo abierto son ceros de G(::)H(::) en tanto que los ceros en lazo cerrado estan formados de los ceros de G(::) y de los polos de H(::).] 2. Determine los puntos de inicio y los puntos de terminaci6n del lugar geornetrico de las rafces. Encuentre tambien el numero de ramas separadas del lugar geometrico de las raices. Los puntos en ellugar geometrico de las raices que corresponden a K = 0 son los polos en lazo abierto y aquellos que corresponden a K = x son los ceros en lazo abierto. Por 10 tanto, conforme K se incrementa desde 0 hasta x, un lugar geometrico de las rafces empieza a partir de un polo en lazo abierto y tennina en un cero finito en lazo abierto 0 un cero en lazo abierto en el infinito. Esto significa que un trazo del lugar geometrico de las rafces tendra exactamente tantas ramificaciones como existan rafces en la ecuaci6n caracterfstica. [Si se cuentan los ceros en el infinite, F(::) tiene elmismo numero de ceros que de polos.] Si el nurnero 11 de polos en lazo cerrado es el mismo numero que el numero de polos en lazo abierto, entonces el numero de ramificaciones individuales del lugar geornetrico de las rafces que terminan en ceros en lazo abierto finitos es igual al numero 111 de ceros en lazo abierto, Las rarnificaciones 11 - 111 restantes terminan en el infinito (en los ceros implfcitos 11- 111 en infinite) a 10 largo de las asintotas. 3. Determine el lugar geornetrico de las rafces sobre el eje real. EI lugar geometrico de las raices sobre el eje real se determina por los polos en lazo abierto y los ceros que quedan sobre el, Los pol os y ceros complejos conjugados de la funci6n de transferencia pulso en lazo abierto no tienen efecto en la localizaci6n del lugar geornetrico de las rafces sobre el eje real porque la contribucion angular de los polos y ceros de un par de polos complejos conjugados es de 360 0 sobre el eje real. Cada parte del lugar geometrico de las rafces sobre el eje real se extiende sobre un segmenro desde un polo 0 cero hasta otro polo 0 cero. AI construir el lugar geornetrico de las raices sobre el eje real, escoja sobre el un punto de prueba. Si el nurnero total de polos y ceros reales a la derecha de este punto de prueba es impar, entonces este punto cae sobre un lugar geometrico de las raices. EI lugar geometrico de las rafces y su complemento forman segmentos alternos a 10 largo del eje real. 4. Determine las asintotas del lugar geometrico de las raices. Si el punta de prueba :: esta localizado Iejos del origen, entonces los angulos de todas las cantidades cornplejas pueden considerarse iguales. Entonces un cero en lazo abierto y un polo en lazo abierto cada uno cancela los efectos del otro. Por 10 tanto, el lugar geometrico de las raices para valores muy grandes de ; debe ser asint6tico a lineas rectas cuyos angulos estan dados como sigue:
208
Capitulo 4
Aqui, N = 0 corresponde a la asintota que forma el angulo mas pequeno con respecto al eje real. Aunque N supone un numero infinito de valores, el angulo se repite a si mismo, conforme N aumenta, y el numero de asintotas diferentes es n - m. Todas las asintotas se cruzan en el eje real. EI punto en el cual 10 hacen se obtiene de la siguiente manera. Dado que
F (z)
=
+ zm)zm-I + + Pn)zn 1 +
+ .. , + zm)]zn m 1 + ...
para un valor grande de z esta ultima ecuaci6n se puede aproximar como siguc:
(Zl
Z2
n-m
(4-21)
Si la abscisa de la intersecci6n de las asintotas y del eje real se identifica como -era' entonces
Debido a que todos los polos y ceros complejos se presentan en pares conjugados, -era dado por la ecuaci6n (4-21) siempre es una cantidad real. Una vez encontrada la intersecci6n de las asintotas con el eje real, las asintotas se pueden dibujar de inmediato en el plano complejo z. 5. Encuentre los puntos de ruptura de salida y de ruptura de entrada. En vista de la simetria conjugada de los lugares geornetricos de las rafces, los puntos de ruptura de salida y de ruptura de entrada se presentan 0 sobre el eje real 0 en pares complejos conjugados. Si un lugar geometrico de las rafces se presenta entre dos polos adyacentes en lazo abierto sobre el eje real, entonces existira por 10 menos un punto de ruptura de salida entre ambos polos. En forma similar, si el lugar geornetrico de las rafces se presenta entre dos ceros adyacentes (un cero pudiera estar localizado en -x) sobre el eje real, entonces siempre existira por 10 menos un punto de <, ruptura de~ad<lentre los dos ceros. Si el lugar geometrico de las raices se presenta entre un polo y un cero (finito 0 infinito) sobre el eje real, entonces pudieran no existir puntos ni de ruptura de salida ni de entrada 0 pudieran existir tanto puntos de ruptura de salida como de entrada. Si la ecuaci6n caracteristica
1 + F(z)
se escribe en la forma
Seccion 4-5
209
donde KB(z)/A(z)
F(z), entonces
K = _ A(z) B(z)
(4-22)
y los puntos de ruptura de salida y de entrada (que corresponden a raices multiples) se pueden determinar a partir de las raices de
dK dz
(4-23)
donde el apostrofo indica diferenciacion respecto a z. (Yea el problema 4-5 para una prueba.) Si el valor de K correspondiente a una raiz z = =0 de dK/dz = 0 es positivo, el punto z = =0 es un punto real de ruptura de salida 0 de entrada. Dado que se supone que K no es negativo y si el valor de K asi obtenido es negativo, entonces el punta z = =0 no es ni punto de ruptura de salida ni de entrada. Observe que este metodo puede usarse cuando existen polos complejos 0 ceros complejos. 6. Determine el angulo de salida (0 el angulo de lIegada) dellugar geometrico de las raices a partir de los polos complejos (0 en los ceros complejos). Para dibujar el lugar geornetrico de las rakes con una precision razonable, debemos encontrar la direccion del lugar geornetrico de las ratces cerca de los polos y de los ceros complejos. EI angulo de salida (0 angulo de lIegada) dellugar geometrico de las rakes correspondiente a un polo complejo (0 a un cero complejo), puede determinarse al sustraer de 180 0 la suma de todos los angulos de Ifneas (cantidades complejas) correspondiente a todos los dernas polos y ceros del polo complejo (0 del cero complejo) en cuestion, si se incluyen los signos apropiados. El angulo de salida se muestra en la figura 4-22. 7. Encuentre los puntos donde los lugares geometricos de las raices cruzan el eje imaginario. Los puntos donde el lugar geometrico de las rakes cruza el eje imaginario pueden determinarse definiendo z = jv en la ecuacion caracteristica (10 que implica la ganancia K no determinada), e igualando tanto la parte real como la imaginaria con cero, y se resuelve en funcion de v y de K. Los valores de v y de K que asf se encuentren daran la localizacion en la cual el lugar geometrico de las rakes cruza el eje imaginario y el valor de la ganancia correspondiente K, respectivamente.
1m
Plano z
'"'===-.~+-_~~--_ 180
Re
x
Figura 4-22 Diagrama que muestra el angulo de salida.
210
Capitulo 4
8. Cualquier punto de los lugares geometricos de las raices es un polo en lazo cerrado posible. Un punto determinado sera un polo en lazo cerrado cuando el valor de la ganancia K satisfaga la condici6n de magnitud. Por otra parte, la condici6n de magnitud nos permite detenninar el valor de la ganancia K en un lugar especifico de las raices dentro del lugar geornetrico. La condici6n de magnitud es
IF(z)1 = 1
es decir
I (z
1
K
(4-24 )
Si la ganancia K de la funci6n de transferencia pulso en lazo abierto esta dada en el problema, entonces mediante la aplicaci6n de la condici6n de magnitud, ecuaci6n (4-24), es posible localizar los polos en lazo cerrado para una K dada en cada una de las ramificaciones del lugar geometrico de las raices mediante un metodo de prueba y error.
Cancelacion de los polos de G(z) COil los ceros de H(z). Es importante notar que si F(::) = G(::)H(z) y el denominador de G(::) y el numerador de H(::) involucran factores cornunes, entonces los polos y los ceros en lazo abierto correspondientes se cancelaran unos a los otros, si se reduce el grado de la ecuaci6n caracteristica en uno 0 mas. La grafica del lugar geometrico de las raices de G(::)H(z) no mostrara todas las raices de la ecuaci6n caracteristica, sino s610 las raices de la ecuaci6n reducida. A fin de obtener el conjunto completo de polos en lazo cerrado, deberemos anadir los polos cancel ados 0 polos de G(::)H(::) a aquellos polos en lazo cerrado obtenidos de la graficaci6n dellugar geornetrico de las raices de G(z)H(z). Es importante recordar que un polo cancelado de G(::)H(::) es un polo del sistema en lazo cerrado. Como ejernplo, veamos el caso donde G(z) y H(::) del sistema mostrado en la figura 4-21 estan dados por
G( ) z
y
z +c (z + a)(z + b)
H(z)
Entonces, c1aramente el polo z resulta en.
=
z +a z +d
~~
H (z)
C(z)
R(z)
G(z)
1 + G(z)H(z)
y vemos que z = -u, el polo cancelado de G(z)H(::), es un polo en lazo cerrado del sistema realimentado.
Seccion 4-5
211
Observe, sin embargo, que si la cancelaci6n de polos y ceros se presenta en la funci6n de transferencia pulso de la trayectoria directa, entonces la misma cancelaci6n de polos y ceros se presenta en la funcion de transferencia pulso en lazo cerrado. Considere otra vez el sistema mostrado en la figura 4-21 donde suponemos
H(z)
Suponga que ocurren cancelaciones de polos y ceros en Gj)(z)Gl::). Por ejernplo, suponga
GD(z)G](z)
z +d
(z + a)(z + c)
C(z) R(z)
En raz6n de la cancelaci6n de polos y ceros, el sistema de tercer orden se convierte en uno de segundo orden. Es importante concluir que el efecto de la cancelaci6n de polos y ceros en G(z) y H(z) es distinto al de la cancelaci6n de polos y ceros en la funcion de transferencia pulso de la trayectoria directa (como es la cancelaci6n de pol os y ceros en el controlador digital y en la planta). En el primero, el polo cancelado sigue siendo un polo del sistema en lazo cerrado, en tanto que en el ultimo, los polos cancelados no aparecen como polos en el sistema en lazo cerrado (en este ultimo el orden del sistema queda reducido por el numero de polos cancelados).
Diagramas del lugar geometrico de las raices de los sistemas de control digital. Ahora investigaremos los efectos de la ganancia K y del periodo de muestreo Tsobre la estabilidad relativa del sistema de control en lazo cerrado. Veamos el sistema mostrado en la figura 4-23. Suponga que el controlador digital es del tipo integral, es decir que
GD(z)
K ~] -z
K-z- 1
Dibujemos los diagramas del lugar geometrico de las raices para el sistema, para tres valores del periodo de muestreo T: 0.5 seg, I seg y 2 seg. Tarnbien determinemos el valor critico de K en cada uno de los casos. Y, finalmente, local icemos los polos en lazo cerrado correspondientes a K = 2 para cada uno de los tres casos.
Figura 4-23
212
Capitulo l.
Z[Gh(s)Gp(s)]
z[1
TS
-se- s
~ 1]
= =
(1 - Z-I)Z[S(S
s
~ 1)]
s 1
(1 - Z-I)Z[! _ _ 1_] +
1 - e- T z - e- T
_Z-l(_Z _ _ Z ) Z z - l z-e T
(4-25)
1 + G(z)
es decir
1+
1.
Kz(l - e- ) (z - 1)(z - e T)
(4-26)
Periodo de muestreo T
0.3935Kz
G(z)
(z - l)(z - 0.6065)
Observe que G(z) tiene polos en z = I yen z = 0.6065 y un cera en z = O. Para dibujar un diagrama dellugar geometrico de las raices, primera localizaremos los polos y el cera sobre el plano z y a continuaci6n encontraremos el punto de ruptura de salida y el de entrada. Note que esta funci6n de transferencia pulso en lazo abierto con dos polos y un cera da como resultado un lugar geornetrico de las raices circular con centra en el cera. El punto de ruptura de salida y el punto de ruptura de entrada se determinan escribiendo la ecuaci6n caracteristica en la forma de la ecuacion (4-22),
<.
K=
(z - l)(z - 0.6065)
0.3935z
(4-27)
dK dz
De ahi,
= _ Z2
- 0.6065 0.3935z 2
=0
Z2 =
0.6065
213
es decir,
z = 0.7788
z = -0.7788
Observe que la sustituci6n de z por 0.7788 en la ecuacion (4-27) da un valor de K = 0.1244, en tanto que si se supone que z = -0.7788 da un valor de K = 8.04 I. Dado que ambos valores de K son positivos, z = 0.7788 resulta el punta de ruptura de salida real y z = -0.7788 es eI punto de ruptura de entrada real. La figura 4-24a) muestra el diagrama dellugar geometrico de las raices cuando T= 0.5 seg. EI valor critico de ganancia K para este caso se obtiene mediante la condicion de magnitud, que se puede obtener a partir de la ecuaci6n (4-26) como sigue:
1m
Plano z
(T = 0.5 seg)
K = 8.165
Re
1m
Plano z
(T= 1 seg)
= 0.2449
Re
1m
Plano z
(T= 2 seg)
K = 0.4622
K
= 2.626
Re
Circulo unitario
Figura 4-24 a) Diagrama dellugar geornetrico de las raices para eI sistema mostrado en la figura 4-23 cuando T= 0.5 seg; b) diagrama dellugar geomctrico de las raices cuando T= I seg: c) diagrama del lugar geometrico de las raices cuando T= 2 seg.
214
Diseiio
Capitulo 4
z(l - e- T ) (z - l)(z - e- T )
0.3935z (z - l)(z - 0.6065)
1
K
1 K
=
(4-28)
K = 8.165
La ganancia critica K, es por 10 tanto 8.165. Los polos en lazo cerrado que corresponden a K
ZI
=
Z2
= 0.4098 +jO.6623
Estos polos en lazo cerrado que dan indicados por puntos en el diagrama dellugar geometrico de las raices. 2. Periodo de muestreo T = 1 seg: para este caso, la ecuaci6n (4-25) se convierte en:
0.05185 + jO.6043
Z2
0.05185 - jO.6043
y se muestran en el diagrama del lugar geornetrico de las raices mediante puntos. 3. Periodo de muestreo T = 2 seg: para este caso, la ecuaci6n (4-25) se convierte en
0.2971 + jO.2169
Z2
= -0.2971 - jO.2169
Estos polos en lazo cerrado se muestran en forma de puntos en el diagrama del lugar geometrico de las raices.
Seccion 4-5
215
Efectos del periodo de muestreo T sobre las caracteristicas de la respuesta transitoria. Las caracteristicas de la respuesta transitoria del sistema de control en tiempo discreto dependen del periodo de muestreo T. Un periodo de muestreo grande tiene efectos dafiinos 0 detrimentales sobre la estabilidad relativa del sistema. Una regIa practica es muestrear de ocho a diez veces durante un cicIo de las oscilaciones senoidales amortiguadas de la salida del sistema en lazo cerrado, si es que este esta subamortiguado. Para sistemas sobreamortiguados, pruebe de ocho a diez veces durante el tiempo de levantamiento de la respuesta escalon. Como se ha visto en los analisis precedentes, para un valor dado de ganancia K, aumentar el periodo de muestreo T hara que el sistema de control en tiempo discreto sea menos estable y que eventualmente se convierta en inestable. De manera altemativa, al reducir el periodo de muestreo T se permite que el valor critico de la ganancia K respecto a la estabilidad sea mayor. De hecho, reducir el periodo de muestreo mas y mas tiende a hacer que el sistema se comporte muy parecido a un sistema en tiempo continuo. (Para un sistema de control de segundo orden en tiempo continuo, la ganancia critica para la estabilidad es infinita, es decir, K =x.) Para el sistema mostrado en la figura 4-23, el factor de amortiguamiento relativo ? para los polos en lazo cerrado para K = 2 para cada uno de los tres casos anteriores puede determinarse a partir de la figura 4-25. Graficarnente, los factores de amortiguamiento relativo para los polos en lazo cerrado correspondientes a T= 0.5, T= I Y T= 2 se determinan en forma aproximada como? = 0.24, ? = 0.32 Y ? = 0.37, respectivamente. EI factor de amortiguamiento relativo ? de un polo en lazo cerrado se puede determinar en forma analitica a partir de la localizacion del polo en lazo cerrado en el plano z. Si el factor de amortiguamiento relativo de un polo en lazo cerrado es ?, entonces en el plano s la localizacion del polo en lazo cerrado (en la parte superior) puede darse mediante
S = -?wn + jWn~
Dado que z = eli, el punto correspondiente en el plano z es
exp[T(-?wn + jWn~)]
1m
z plane
85.10
58.25
1=0
-1
o
1 = 0.6
Re
Figura 4-25 Localizaciones de los polos en lazo cerrado en los pianos z mostrados con lugares geornetricos de ~ constante.
216
Capitulo 4
L!-
(4-30)
De las ecuaciones (4-29) y (4-30) se puede calcular el valor de z. Por ejemplo, en el caso en que el perfodo de muestreo T es de 0.5 segundos, tenemos el polo en lazo cerrado para K = 2 en z = 004098 + jO.6623. Por 10tanto, [z] = YOA098 2 Resolviendo [z] = para el exponente encontramos (4-31 ) Tambien,
e-T(wn
+ 0.6623 2 =
=
0.7788
0.7788
L!- =
Por 10 tanto,
'7
tan
_10.6623 0.4098
L!- =
TW n
VI=""? = VI=""? =
T?w n
1.0167 rad
(4-32)
TW n
es decir,
0.25 1.0167
, r;----;;:, =
v1 -
0.2459
10 que nos da
~ =
0.2388
(De la figura 4-25 obtuvimos en forma grafica 0.24 para ~, 10 cual es muy cercano al valor real ~ de 0.2388.) Es importante notar que en un sistema de segundo orden el factor de amortiguamiento relativo ~ es indicador de la estabilidad relativa (por ejemplo, en relaci6n con el sobrepaso maximo en respuesta a un escal6n unitario) s610si la frecuencia de muestreo es 10 suficientemente alta (de tal forma que existan de ocho a diez muestras en un cicIo de oscilaci6n). Si una frecuencia de muestreo no es 10 suficientemente alta, el sobrepaso maximo de la respuesta escalon unitario sera mucho mayor de 10 que podrfa predecirse por el factor de amortiguamiento relativo ~. Para comparar los efectos de los distintos perfodos de muestreo T sobre la respuesta trans itoria, compararemos las frecuencias de respuestas escal6n unitario correspondientes a los tres valores de Ttomados en cuenta en el analisis precedente.
Seccion 4-5
217
La funci6n de transferencia pulso en lazo cerrado para el sistema de la figura 4-23, cuya funcion de transferencia pulso de la trayectoria directa G(z) esta dada por la ecuaci6n (4-25), es
C(z)
R(z)
G(z) 1 + G(z)
Para T = 0.5 seg y K = 2, la respuesta escal6n unitario puede estar dada por 0.3935 x 2z
cos Ok = cos 0 ( k
360) + -0-
Por 10 tanto, para el caso en que 0 = 58.25, tenemos que 360% = 360/58.25 = 6.18 muestras por cicio de oscilaci6n amortiguada, como se ve en la figura 4-26a). Similarmente, en el caso en que T = I seg y K = 2, la respuesta escal6n unitario esta dada por
C(z)
La secuencia de respuesta escal6n unitario c(k7) en funci6n de kT aparece en la figura 4-26b). Dado que el angulo en la linea que conecta el origen y el polo en lazo cerrado en este caso es 85.10 0 , como se muestra en la figura 4-25, tenemos aproximadamente 360/85.10 = 4.23 muestras por cicio, 10 que es mucho menos de 10 que por 10 regular recomendariamos. (Recomendamos 8 0 mas muestras por cicIo de oscilaci6n de la senoidal amortiguada.) Por ultimo, en el caso de T = 2 seg y K = 2, la respuesta escalon unitario esta dada por
218
Capitulo 4
c(kT)
1.5
-e,
/
\
I
I
a)
I
e,
"
,e' e_.e-
,e--e-_.
e--e e--e--e
e
0.5
I I
I
o
c(kT)
kT (s.)
15
b)
....... ,
e
I I
I
I ' 10 I---~~~~~ ~
05
I
I I I
I
clkT)
I
,..-e ,
'
15
c)
II
\
" ,
1.0
I
I
I
,,
" ".--" .-
,..-
-e----
--~
0.5
I
I
,I
o
k T (s.)
Figura 4-26 a) Secuencia de la rcspuesta escalon unitario del sistema mostrado en la figura 4-23 cuando T= 0.5 scg y K = 2; b) sccuencia de la respuesta escalon unitario cuando T= I seg y K = 2~"(:c:l!encia de la rcspuesta escalon unitario cuando T= 2 seg y K = 2.
de las consideraciones reales del equipo. Note que la simple satisfacci6n del teorema de muestreo no es suficiente. Una regia practica aceptable es de ocho a diez muestras por cicio (seis muestras por cicio es marginal) si el sistema es subamortiguado y muestra oscilaciones en la respuesta. A continuaci6n, analicemos el efecto del periodo de muestreo T sobre la exactitud en estado permanente. Veremos la respuesta rampa unitaria para cada uno de los tres casos. Para el caso en que el periodo de muestreo T es 0.5 seg y la ganancia K es 2, la funci6n de transferencia pulso en lazo abierto es
Secci6n 4-5
219
G(z)
Kv
- ,.
-
(1 - Z-I)G(Z)
T
1m
z~l
\. rz0.5z1 (z 1m-z-e l
=4
Por 10 tanto, el error en estado permanente en respuesta a una entrada rampa unitaria es
1 1
el s = K" =
4=
0.25
De igual manera, para el caso en que T = I seg y K = 2, Ia funci6n de transferencia pulso en lazo abierto es 1. 2642z G(z) = (z - l)(z - 0.3679) la constante de error de velocidad estatica K" esta dado por
. (1 - Z-I)G(Z) K, = II m-'------"---"---'z~I T
-
u m- 1 rz - 1
z~I
=2
y el error en estado permanente en respuesta a una entrada rampa unitaria es
e = K, =
SI
:2 =
0.5
G(z)
y la constante de error de velocidad estatica K" y el error en estado permanente en respuesta a una
entrada rampa unitaria se obtienen, respectivamente, en la forma
K,
y
e., =
K, =
Las partes a), b) y c) de la figura 4-27 rnuestran, en forma respect iva, las graficas de la secuencia de la respuesta rampa unitaria c(kT) en funci6n de kT para los tres casos en consideraci6n.
220
Capitulo 4
6
Error en estado permanente
= 0.25
a)
kT
c(kT)
6
b)
kT
c(kT)
10
Error en estado permanente ~ 1.00 -----....
8
c)
kT (s.)
Figura 4-27 a) Secuencia de fa respuesta rampa unitaria del sistema mostrado en fa figura 4-23 cuando T= 0.5 seg y K = 2; b) secuencia de la respuesta rampa unitaria cuando T= 1 seg y K = 2; c) secuencia de fa respuesta rampa unitaria cuando T = 2 seg y K = 2.
Los tres casas que hemos vista demuestran que al aumentar el periodo de muestreo T se afecta en forma adversa la estabilidad relativa del sistema. (Incluso puede en algunos casos causar inestabilidad.) Es importante recordar que el factor de amortiguamiento relativo de los polos en lazo cerrado del sistema de control digital indica la estabilidad relativa s610 si la frecuencia de muestreo es 10 suficientemente alta (es decir, de ocho 0 mas muestras par cicIo de oscilaci6n de la senoidal amortiguada). Si la frecuencia de muestreo es baja (es decir, de menos de seis muestras por cicIo de
Seccion 4-5
221
oscilacion de la senoidal amortiguada), entonces predecir la estabilidad relativa a partir del valor del factor de amortiguamiento relativo resultant erroneo.
Ejemplo 4-9 Considere el sistema de control digital que se muestra en la figura 4-28. En el plano z, disefie un controlador digital de tal forma que los polos dominantes en lazo cerrado tengan un factor de amortiguamiento relative i; de 0.5 y un tiempo de asentamiento de 2 seg. El periodo de muestreo se sup one en 0.2 seg, es decir, T= 0.2. Obtenga la respuesta del sistema de control digital disefiado a una entrada escalon unitario. Tambien obtenga la con stante de error de velocidad estatica K,. del sistema. Para el sistema de segundo orden estandar con un par de polos dominantes en lazo cerrado, el tiempo de asentamiento de 2 seg significa que
tiempo de asentamiento
i;w
= O.5w" = 2
de los polos dominantes en lazo cerrado
10 que da el valor de la frecuencia natural no amortiguada como W" = 4 La frecuencia natural amortiguada w J se determina como
Wd
Wn
W"
277'
277'
[Note que existen aproximadamente nueve muestras par cada cicio de oscilacion amortiguada (31.42/ 3.464 = 9.07). Por 10 tanto. es satisfactorio el periodo de muestreo de 0.2 seg.] Primero localizaremos los polos dominantes en lazo cerrado deseados en el plano:. Refiriendonos a las ecuaciones (4-29) y (4-30), para un lugar geornetrico de los factores de amortiguamiento relativo constante. tenemos
De las especificaciones dadas (i; = 0.5 y WJ = 3.464), la magnitud y el angulo del polo dominante en lazo cerrado enla parte superior del plano z se determinan como sigue:
Iz I = exp ( - VI r (t!
Controlador digital
R(z!
+ 2!
Figura 4-28
222
y
Capitulo 4
L.!...
/ '7
Podemos ahora localizar el polo dominante en lazo cerrado deseado en la parte superior del plano z, que se muestra como punto P en la figura 4-29. Note que en el punto P
G(z) = Z [
1-
-0.2,
= -51.26
La funcion de transferencia pulso del controlador debe proporcionar +51.26. La funcion de transferencia pulso para el controlador se supone como
1m
Plano z
-0.8760
0.2543
0.6703
Re
Seccion 4-5
223
GD(z) = KZ + a z+f3
donde K es la constante de ganancia del control ador. Si decidimos cancelar el polo en z = 0.6703 mediante el cero del controlador en z = -a, entonces el polo del controlador podra determinarse (si se parte de la condici6n de que el controlador debe pro veer +5 I .26) como un punto en z= 0.2543 (f3=-0.2543). Por 10tanto, Ia transferencia pulso para el controlador puede ser determinada como
60 ) K -,--0._01_7---:-58---,'-(-,:-z---:-+,...,0_.8_7_.c.. (z - 0.2543)(z - 1)
K
1
10que da
K
El controlador digital diseiiado es
GD(z)
= 12.67 z
(4-33 )
GD(z)G(z)
= (z -
C(z) R(z)
1-
ZI
La figura 4-30 muestra la secuencia de respuesta escal6n unitario c(k7) en funci6n de kT. El trazo muestra que el sobrepaso maximo es aproximadamente 16% (10 que significa que el factor de amortiguamiento relativo es de alrededor de 0.5) y el tiempo de asentamiento es de aproximadamente 2 seg. EI controlador digital que acabamos de disenar satisface las especificaciones dadas y es satisfactorio.
224
Disefio 1.6
Capitulo 4
1.4
12
1.0
c(kT)
0.8
0.6
0.4
0.2
o
Figura 4-30 cjemplo 4-9.
0.4
0.8
1.2
1.6
2.0
kT(s.)
2.4
2.8
3.2
3.6
4.0
K;
~~ [ +GD(Z)G(Z)
-)
= hm - - ----'-----"'z-1
. [z - 1
2.801
Si se requiere tener un valor grande de K", entonces pudieramos incluir un compensador de atraso. Por ejemplo, anadir un cero en z = 0.94 y un polo en z = 0.98 elevaria tres veces el valor de K; ya que (I - 0.94 )/(1 - 0.98) = 3. (Es importante que el polo y el cero del compensador de atraso se presenten en un numero finito de puntos discretos asignables.) Un compensador de atraso, que ticne un polo y un cero muy cercanos el uno del otro, no cambia en forma significativa ellugar geometrico de las raices cerca de los polos dominantes en lazo cerrado. El efecto de un compensador de atraso sobre la respuesta transitoria es el de introducir una componente transitoria pequefia pero que se reduce lentamente. Sin embargo, ese transitorio pequefio pero lento, no es deseable desde el punto de vista de las perturbaciones 0 de la atenuaci6n de ruido, ya que la respuesta a las perturbaciones no se atenuaria rapidamente. Por ultimo, debe hacerse notar que aunque el sistema disenado es del tercer orden, funciona como un sistema de segundo orden, ya que un polo de la planta ha sido cancelado por el cera del controlador. En vista de 10 anterior, el presente sistema tiene solamente dos polos en lazo cerrado. Los polos dorninantes en lazo cerrado en este caso son los unicos polos en lazo cerrado. Si un polo y un cero no se cancelan el uno al otro, entonces el sistema sera del tercer orden.
Comentarios. Es importante sefialar que los polos de una funcion de transferencia pulso en lazo cerrado deterrninan los modos naturales del sistema. No obstante, los comportamientos de la respuesta transitoria y de la respuesta a la frecuencia quedan influidos en gran medida por los ceros de la funcion de transferencia pulso en lazo cerrado.
Secci6n 4-6
225
Resulta util familiarizarse con la relaci6n entre las localizaciones de los polos y de los ceros del plano z y las caracteristicas de respuesta en el tiempo para el disefio de los sistemas de control en tiempo discreto. Es importante notar que en el plano s la adici6n de un cera en el eje real negativo cerca del origen aumenta el sobrepaso maximo en respuesta a una entrada escal6n. Un cera como este en el plano s es transformado en un cera en el eje real positivo en el plano z entre 0 y I. Por 10 tanto, en el plano z; la adici6n de un cera en el eje real positivo entre 0 y I aumenta el sobrepaso ma-ximo. De hecho, mover un cero hacia el punto z = I aumentara en gran medida el sobrepaso maximo. De forma similar, en el plano s un polo en lazo cerrado sobre el eje real negativo cerca del origen aumenta el tiempo de asentamiento. En el plano z, ese polo en lazo cerrado se transforma en un polo en lazo cerrado sobre el eje real positivo entre 0 y I. Por 10 tanto, un polo en lazo cerrado en el plano z entre 0 y I (en particular, cerca de z = I) aumenta el tiempo de asentamiento. Sin embargo, la presencia de un polo en lazo cerrado 0 de un cero en el eje real negativo entre 0 y -I enel plano z, afectara s610 ligeramente la respuesta transitoria.
Respuesta de un sistema en tiempo discreto lineal e invariante con el tiempo a una entrada senoidal. Ya hemos indicado que la respuesta en frecuencia de G(z) puede obtenerse sustituyendo
z = (/wl en O(z). A continuaci6n demostraremos que esto es cierto. Considere el sistema estable en tiempo discreto lineal e invariante con el tiempo que se muestra en la figura 4-31. La entrada del sistema G(z) antes del muestreo es
u(t) = sen wt
226
Copitulo 4
ult)
sin wt
/----.-..1
ulkT)
T
xlkT)
G(z)
Figura 4-31
u(kT)
La transfonnada z de la entrada muestreada es
senkwT
X(z)
G(z)U(z)
az
z - e'"
T+
az
z - e JW
. _ T+ [terminodebldoalospolosdeG(z)]
(4-341
G(z)
.
El segundo termino del segundo miembro de esta ultima ecuaci6n se ace rca a cera con forme z se acerca a e'", Dado que el sistema considerado aqui es estable, el tercer termino del segundo miemJ bro tambien se acerca a cera conforme z se acerca a e'", Por 10 tanto, al dejar que z se acerque a eW. tenemos
a
=
G(e
iw T)
2' J
EI coeficiente
w G(e- J T)
2j
Definamos
Entonces
w G(e- J T)
La ecuaci6n (4-34) ahora puede escribirse como
Me:"
X(z)
M2~i8
J z-e
iwT -
M2e~i8
J
z-e
Seccion 4-6
227
o bien
X(z)
-2.
M(
eiBz
W J z - eJ
. T-
~(eikWT e" -
(4-35)
EI ultimo termino del segundo miembro de la ecuacion (4-35) representa la respuesta transitoria. Dado que el sistema G(z) se ha supuesto estable, todos los terminos de la respuesta transitoria desapareceran en estado permanente y obtendremos la siguiente respuesta en estado permanente x ssCk7):
xss(kT) =
~ [ei(kwT+B) - e- i(kwT+8)]
M sen(kwT
+ 8)
(4-36)
donde M, que es la ganancia del sistema en tiempo discreto al ser sujeto a una entrada senoidal, esta dada por
M
y
M(w)
IG(eiwT)j
Hemos demostrado que G(e'w7) realmente proporciona la magnitud de la fase de la respuesta en frecuencia de G(z). Por 10 tanto, para obtener la respuesta en frecuencia de G(z), solo necesitamos escribir e'wT en lugar de z en G(z). La funcion G(e'w7) se conoce cornunmente como funci6n de transferencia pulso senoidal. Si observamos que
O<a<l
donde u(k7) es la entrada y x(k7) la salida. Obtenga la salida en estado permanente x(k7) cuando la entrada u(k7) es la senoidal de muestra, es decir u(k7) = A sen kwT. La transfonnada z de la ecuaci6n del sistema es
X(z) = V(z) + az- J X(z)
Al definir G(z)
X(z)/V(z), tenemos
G(z)
= X(z) =
V(z)
1 - az
228
Capitulo 4
Sustituyamos z por e'" en G(z). De ahi se puede obtener la funci6n de transferencia pulso senoidal G(e/wl ) en la forma
1
1 - a cos wT La amplitud de G(el
wl )
+ ja sen wT
es
IG(e1wT)1 == M ==
y el angulo de fase de G(e/
wl )
VI + a
1
2 -
2a coswT
es
jG(e1wT) == 0 == -tan- 1
-
1 - a cos wT
a senwT
+ 0)
Transformaclon bilineal y el plano w. Antes de aplicar can ventaja los metodos bien desarrollados de Ia respuesta en frecuencia al analisis y disefio de sistemas de control en tiempo discreto, son necesarias ciertas modificaciones al metoda del plano z. Dado que en el plano z la frecuencia aparece en Ia forma z == e'", si tratamos la respuesta en frecuencia del plano z, la simplicidad de las trazas logaritmicos se perdera totaImente. Por 10 tanto, la aplicacion directa de los metodos de respuesta en frecuencia no merece tomarse en consideracion. De hecho, en vista de que la transformada z transforma las franjas primarias y complementarias en el semi plano izquierdo del plano s al circulo unitario del plano z; los metodos convencionales de la respuesta en frecuencia, que se ocupan de la totaIidad del semiplano izquierdo del plano, no se aplican aI plano z. La dificultad, sin embargo, puede resolverse transformando la funcion de transferencia pulso en eI plano z en la correspondiente en el plano w. La transformada Ilamada comunmente transformada w, es decir una transformada bilineal, queda definida por
==
_1_+_(-,--T_/2-,-)_w 1 - (T/2)w
(4-37)
donde T es el periodo de muestreo involucrado en eI sistema de control en tiempo discreto bajo consideracion. AI convertir una funcion de transferencia pulso dada en el plano z en una funcion racional de w, se pueden extender los metodos de respuesta en frecuencia a los sistemas de control en tiempo discreto. Si se resuelve la ecuacion (4-37) en funcion de w, obtenemos la relacion inversa
W == - - -
2 z - 1 T z +1
(4-38)
Mediante la transformada z y la transformada w, la franja primaria del semipIano izquierdo del plano s es primero transformada al interior del circulo unitario en el plano z y a continuacion transformada a la totalidad del semi plano izquierdo del plano w. Estos dos procesos de correspondencia se ilustran en la figura 4-32. (Note que en el plano s unicamente consideramos la franja primaria.) Observe que el origen del plano z corresponde al punto w == -2/T en el plano w. Tambien note que, con forme s varia desde cero hastajw/2 a 10 largo del eje jw en el plano s, z varia desde I hasta -I a
3ecci6n 4-6
229
jw
Plano 5
~
o
Plano w
Re
Z =:
e Ts
b)
w= - - -
2 z - 1 T z +1
c)
0)
Figura 4-32
Diagramas que muestran las correspondencias del plano scan el plano z y del plano z can el plano w.
a) Franja primaria en el semiplano izquierdo del plano s: b) correspondencia en el plano z de la franja primaria en el plano s; c) correspondencia en el plano w del circulo unitario en el plano z.
10 largo del circulo unitario en el plano z y w varia des de 0 hastacc en el eje imaginario del plano w. A pesar de que el semiplano Izquierdo del plano w corresponde al semiplano Izquierdo del plano s y que el eje imaginario del plano w corresponde al eje imaginario del plano s, existen diferencias entre ambos pIanos. La diferencia principal es que el comportamiento en el plano s sobre el intervalo de frecuencia --} w., ~ w:S: co, corresponde al intervalo -x < v < x, donde u es la frecuencia ficticia en el plano w. Esto significa que, a pesar de que las caracteristicas de la respuesta en frecuencia del filtro anal6gico seran reproducidas en el filtro discreto 0 digital, la escala de frecuencias en la cual se presenta la respuesta se comprimira de un intervalo infinito en el filtro anal6gico a un intervalo finito en el filtro digital. Una vez que la funci6n de transferencia pulso G(z) haya sido transformada en G(w) mediante la transformada w, podra ser tratada como una funci6n transferencia convencional en w. Se podran utilizar las tecnicas convencionales de respuesta en frecuencia en el plano w y, por 10 tanto, podran aplicarse las tecnicas bien establecidas de disefio mediante la respuesta en frecuencia al disefio de los sistemas de control en tiempo discreto. Como se observ6 antes, v representa la frecuencia ficticia. Al reemplazar w por jv se pueden usar tecnicas convencionales de respuesta en frecuencia para dibujar el diagrama Bode correspondiente a la funci6n de transferencia en w. (En la breve revisi6n de los Bode en esta secci6n, utilizaremos la frecuencia ficticia v como variable.) Aunque el plano w se parece geometricamente al plano s, el eje de frecuencias en el plano w esta distorsionado. La frecuencia ficticia v y la frecuencia real w estan relacionadas como sigue:
w.c jv
= jv = T z + 1 z~eJwT = T e
=
2 z -
11
2 e
jwT j wT
+ 1
wT
T J tan 2
2.
230
Capitulo 4
es decir,
2 wT
V = -
tan-
(4-39)
La ecuacion (4-39) da la relacion entre la frecuencia real t y la frecuencia ficticia v. Note que conforme la frecuencia real w pasa de -t W s hasta 0 la frecuencia ficticia w pasa desde -x hasta 0, y conforme co pasa de 0 hasta t w,,, v pasa desde 0 hasta XJ. Refiriendose a la ecuacion (4-39), la frecuencia real w se puede traducir a la frecuencia ficticia v. Por ejemplo,si el ancho de franja se especifica como w h , entonces el ancho de franja correspondiente al plano w es (21T) tan (wbTI2). De igual manera, GUv l ) corresponde a GUw l ) , donde WI = (21 T) tan:' (VI TI2). En la figura 4-33 se da la relacion entre la frecuencia ficticia V multiplicada por t T Y la frecuencia real w del rango de frecuencias entre 0 y t W s ' Observe que en la ecuacion (4-39), si wT es pequefio, entonces
V ~
Esto significa que para un wTpequefio las funciones de transferencia G(s) y G(w) se parecen una a la otra. Observe que este es el resultado directo de la inclusion del factor de escala 21T en la ecuacion (4-38). La presencia de este factor de escala en la transformacion nos permite mantener las mismas constantes de error antes y despues de la transformacion en w. (Esto significa que la funcion de transferencia en el plano w se acercara a la del plano s conforme T se acerque a O. Yea el ejemplo 411 a continuacion.)
Ejemplo 4-11 Considere la funci6n de transferencia del sistema que se muestra en la figura 4-34. El periodo de muestreo T se supone de 0.1 seg. Obtenga G(w). La transformada z de G(s) es
-v
2
3
2
w,
4
w,
2
Figura 4-33 Relaci6n entre la frecuencia ficticia II multiplicada par t Ty la frecuencia real w para el intervalo de frecuencias entre 0 y t w,.
Seccion 4-6
231
10
s + 10
Gis)
Figura 4-34
G(z) = Z[l - e-
s + 10
~]
= (1
- z
0.6321
z - 0.3679
Mediante la transfonnaci6n bilineal dada par la ecuaci6n (4-37), es decir,
z=
Observe que la localizaci6n del polo de la planta es s = -lOy que el polo en el plano w es w = 9.241. EI valor de ganancia en el plano s es lOy el correspondiente en el plano w es 9.241. (Asi, tanto las localizaciones de los palos como los valores de ganancia son similares en el plano s y en el plano w.) Sin embargo, G(w) tiene un cera en w = 21T= 20, a pesar de que la planta no tiene ningun cera. Confonne se hace mas pequeno el periodo de muestreo T, el cera del plano w en w = 21Tse acerca a oc en el semiplano derecho del plano w. Observe que tenemos lim G(w) = lim
w-O
5_05
10 + 10
Este hecho es muy uti! para verificar los calculos numericos para la transfonnaci6n de G(s) en G(w).
Para resumir, la transformada w, transformada bilineal, hace corresponder eI interior del circu10 unitario del plano z con el semiplano izquierdo del plano w. EI resultado general de las transformaciones del plano s en el plano z y en el plano w es que el plano w y el plano s son simi lares sobre las regiones de interes del plano s. Esto es debido a que algunas de las distorsiones causadas por la transformaci6n del plano s en el plano z estan parcialmente compensadas por la transformaci6n del plano z en el plano w. Observe que si
232
Capitula ~
+ (T/2)w
1 - (T/2)w
al w"
+ ... +
an
donde las a, y las f3j son constantes (algunas de elias pueden ser 0). Entonces, G(w) es un cociente de polinomios en w, donde los grados del numerador 0 del denominador pueden ser 0 no iguales. Dado que G(jv) es una funci6n racional de v, se puede aplicar el criterio de estabilidad de Nyquist a G(jv). En terminos del diagrama Bode, se aplican a G(jv) la aproximaci6n convencional de linea recta a la curva de magnitud, asi como el concepto del margen de fase y el margen de ganancia.
Diagramas Bode. En los sistemas de control en tiempo continuo de una entrada-una salida se ha utilizado mucho el disefio mediante diagramas Bode. En particular, si la funci6n de transferencia est! en forma factorizada, es bien conocida la simplicidad y rapidez con la cual se puede dibujar y refonnar un diagrama Bode asint6tico. Tal y como se indic6 antes, los metodos convencionales de respuesta en frecuencia se aplican a las funciones de transferencia en el plano w. Recuerde que el diagrama Bode consiste en dos trazas por separado, la magnitud logaritmica IG(jv)1 en funci6n dellogaritmo de v y el angulo de fase G(j~') en funci6n del logaritmo de v. La traza de la magnitud logaritmica se basa en la factorizaci6n de G(jv), de tal forma que funciona en el principio de sumar los terminos individuales factorizados, en vez de multiplicar los terminos individuales. Las tecnicas conocidas de trazas asint6ticas son aplicables y, por 10 tanto, se puede dibujar con rapidez la curva de magnitud si se utilizan asintotas con lineas rectas. Mediante el uso del diagrama Bode, se puede disefiar un compensador digital 0 un controlador digital a traves de tecnicas de disefio convencionales. Es importante notar que puede existir una diferencia en las magnitudes en alta frecuencia para G(jw) y G(jv). La asintota de alta frecuencia de la curva de magnitud logaritmica para G(jv) puede ser una linea con stante a ciertos decibeles (que es 10mismo que una linea horizontal). Por otra parte. si lim,-> x G(s) = 0, entonces la magnitud de G(jw) siempre se acercara a cero (-ocdB) conforme w se acerque a infinito. Por ejemplo, en relaci6n con el ejemplo 4-11, obtuvimos G(w) para G(s) como sigue:
G(w) = 9.241(1 - 0.05W)
w + 9.241
0.4621
lim I
10 I jw + 10
La diferencia en los diagramas Bode en el extremo de alta frecuencia puede explicarse como sigue: primero, recuerde que s610 estamos interesados en el rango de frecuencia 0 :s; w:s; co, 10que corresponde a 0 :s; v:S; oc. Entonces, al observar que v = o: en el plano w corresponde a co = w, en el plano s, se puede decir que lim v-> x IG(jv)1 corresponde a lim w --> wlzil O/(jw + 10)1, que es una constante. (Es
Secci6n 4-6
233
importante senalar que estos dos valores no suelen ser iguales entre si.) Desde el punta de vista de polos y ceros, se puede decir que cuando IG(jv)1 es una constante distinta de cero en v = x, esta implicito que G(w) contiene el mismo numero de polos y de ceros. En general, uno 0 mas ceros de G(w) se presentan en el semiplano derecho del plano w. La presencia de un cero en el semiplano derecho del plano w significa que G(w) es una funcion de transferencia de fase no minima. Por 10 tanto, debemos tener cuidado al dibujar la curva de angulo de fase en el diagrama Bode.
Ventajas del metoda del diagrama Bode para el disetio. El metodo del diagrama Bode es en particular util en 10 que se refiere al analisis y el disefio de los sistemas de control, por las siguientes razones:
1.
2.
3.
En el diagrama Bode, la asintota de baja frecuencia de la curva de magnitud indica una de las constantes de error estaticas 1\" K; 0 K". Se pueden traducir las especificaciones de la respuesta transitoria a las correspondientes de la respuesta en frecuencia en terminos del margen de fase, del margen de ganancia, del ancho de franja y asi sucesivamente. Estas especificaciones se pueden manejar facilmente en el diagrama Bode. En particular, los margenes de fase y de ganancia se pueden leer en forma directa del diagrama Bode. EI disefio de un compensador digital (0 un controlador digital) para satisfacer las especificaciones dadas (en funcion del margen de fase 0 del margen de ganancia) puede Ilevarse a cabo en el diagrama Bode de una forma sencilla y simple.
Compensacion de adelanto de fase, atraso de fase y atraso-adelanto de fase. Antes de que analicemos los procedimientos de disefio en el plano w, revisemos las tecnicas de compensacion mediante el adelanto de fase, el atraso de fase y el atraso-adelanto de fase. La compensacion mediante el adelanto de fase es cornunrnente utilizada para mejorar los margenes de estabilidad. Este tipo de compensacion aumenta el ancho de franja del sistema. Por 10 tanto, el sistema tiene mas velocidad para responder. Sin embargo, un sistema que utilice cornpensacion mediante adelanto de fase puede estar sujeto a problemas de ruido de alta frecuencia, en vista de su incremento en la ganancia en alta frecuencia. La compensaci6n mediante atraso de fase reduce la ganancia del sistema en frecuencias mas altas, sin reducir la ganancia del sistema en frecuencias mas bajas. EI ancho de franja del sistema queda reducido y, por 10 tanto, el sistema tiene una velocidad de respuesta mas baja. Debido a la reducida ganancia en alta frecuencia, se puede aumentar la ganancia total del sistema y, por 10 tanto, incrementarse la ganancia en baja frecuencia y mejorarse la precision en estado permanente. Tambien puede atenuarse cualquier ruido de alta frecuencia que se presente en el sistema. En algunas aplicaciones, un compensador de atraso de fase es colocado en cascada con un compensador de adelanto de fase. Un compensador en cascada como este se conoce como un compensador de atraso-adelanto de fase. AI utilizar un compensador de atraso-adelanto se puede incrementar la ganancia en baja frecuencia (10 que significa una mejeria en la precision en estado permanente), mientras que al mismo tiempo se puede aumentar el ancho de franja y los margenes de estabilidad. Observe que el controlador PID es un caso especial de controlador de atraso-adelanto de fase. La accion del control PD, que afecta la region de alta frecuencia, aumenta el angulo del adelanto de fase y mejora la estabilidad del sistema, asi como tambien incrementa el ancho de banda del sistema (10 que mejora la velocidad de respuesta). Esto es, el controlador PD se comporta de una manera
234
Capitulo A
similar al compensador de adelanto de fase. La acci6n de control PI afecta la parte de baja frecuencia y, de hecho, aumenta la ganancia en baja frecuencia al mejorar la precisi6n en estado permanente. Por 10 tanto, el controlador PI actua como un compensador de atraso de fase. La acci6n de control PID es una combinaci6n de las acciones de control PI y PD. Las tecnicas de disefio para los controladores PID basicamente siguen los correspondientes a los compensadores de atraso-adelanto de fase. (En los sistemas de control industrial, sin embargo, cada acci6n de control PID en el controlador PID puede ser ajustada en forma experimental.)
Algunas observaciones sobre el problema de cuantlzacion de los coeficientes. Desde el punto de vista de la implementaci6n en un microprocesador de los compensadores de adelanto de fase, atraso de fase y atraso-adelanto de fase, los compensadores de adelanto de fase no presentan problemas de cuantizaci6n de los coeficientes, porque las localizaciones de los polos y de los ceros estan bien separadas. Sin embargo, en el caso de los compensadores de atraso de fase y de los compensadores de atraso-adelanto de fase, la red de atraso de fase plantea un problema de cuantizaci6n de los coeficientes porque las localizaciones de polos y de ceros estan cercanas entre si. (Estan cerca del punto z = I.) Dado que los coeficientes de filtro deben realizarse mediante palabras binarias que utilizan un numero limitado de bits, si el numero de bits empleados no es suficiente, las localizaciones de los polos y los ceros del filtro pudieran no llevarse a cabo con tanta exactitud como se desea y el filtro resultante no se comportara como se espera. Debido a que pequenas desviaciones en las localizaciones de polos y de ceros en relaci6n con las localizaciones deseadas pueden tener efectos significativos en las caracteristicas de la respuesta en frecuencia del compensador, la versi6n digital del compensador pudiera no funcionar como se espera. Para minimizar el efecto del problema de cuantizaci6n de los coeficientes, es necesario estructurar el filtro de tal forma que resulte 10 menos sujeto posible a inexactitudes de coeficientes debidas a la cuantizaci6n. En raz6n de la sensibilidad de las raices de los polinomios a las variaciones de los parametres que se vuelven mas severos conforme aumenta el orden del polinomio, la realizaci6n directa de un orden superior no es deseable. Es preferible colocar elementos de orden inferior en cascada 0 en paralelo, tal y como se analiza en la secci6n 3-6. Si desde el inicio seleccionamos polos y ceros desde el compensador digital a partir de puntos discretos permisibles, se puede evitar el problema de cuantizaci6n de los coeficientes. En el compensador analogico, los polos y los ceros del compensador pueden colocarse con una precisi6n arbitraria. En la conversi6n de un compensador anal6gico a uno digital, la version digital del compensador de atraso puede tener imprecisiones considerables en las localizaciones de los polos y de los ceros. (Lo que es importante recordar es que los polos y los ceros en el filtro en el plano z deben presentarse en un numero finito de puntos discretos permisibles.) Procedimiento de diseiio en el plano w. Refiriendonos al sistema de control digital que se muestra en la figura 4-35, el procedimiento de disefio en el plano w puede enunciarse como sigue:
1.
Primero obtenga G(z), la transformada z de la planta precedida por un reten. A continuaci6n transforme G(z) en una funci6n de transferencia G(w) mediante la transformaci6n bilineal dada por la ecuaci6n (4-37):
1 + (T/2)w 1 - (T/2)w
Seccion 4-6
235
C(z)
R(z)
Go(z)
Planta
G(z)
Figura 4-35
Esto es,
G(w) = G(z)lz:ll+(TI2)wj/[1-(TI2)wj
2. 3.
4.
5.
Es importante que se seleccione adecuadamente el periodo de muestreo T. Una regIa practica es muestrea con una frecuencia de 10 veces el ancho de franja del sistema en lazo cerrado. (Aunque los controles digitales y el procesamiento de sefiales utilizan procedimientos simi lares en el muestreo en las sefiales en tiempo continuo, las frecuencias de muestreo involucradas son muy distintas. En el campo de procesamiento de sefiales, las frecuencias de muestreo por 10 general son muy altas, en tanto que en el campo de los sistemas de control digital, las frecuencias de muestreo usadas son por 10 regular bajas. Esta diferencia en las frecuencias de muestreo se debe en principio a las distintas dinamicas involucradas y a las ventajas y desventajas existentes en ambos campos.) Sustituya w = iv en G(w) y trace el diagrama Bode para G(jv). Lea del diagrama Bode las constantes de error estatico, el margen de fase y el margen de ganancia. Suponiendo que la ganancia en baja frecuencia de la funcion de transferencia del controlador en tiempo discreto (0 controlador digital) Gf)(w) es la unidad, determine la ganancia del sistema al satisfacer el requisito para una constante dada de error estatico, A continuacion, utilizando tecnicas de disefio convencionales para sistema de control en tiempo continuo, determine los pol os y los ceros de la funcion de transferencia del controlador digital. [GoCw) es un cociente de dos polinomios en w.] Entonces la funcion de transferencia en lazo abierto del sistema disefiado esta dado por GoCw)G(w). Transforme la funcion de transferencia del controlador Gf)(w) en Gf)(z) mediante la transformacion bilineal dada por la ecuacion (4-38)
w=---
Z - 1 Tz + 1
Entonces
Gf)(Z) = G D(w)lw:(2I7)(z-I)/(z+l)
6.
es la funcion de transferencia pulso del controlador digital. Lleve a cabo la funcion de transferencia pulso Gf)(z) mediante un algoritmo de calculo.
236
Capftulc~
1.
2.
La funcion de transferencia G(w) es una funcion de transferencia de fase no minima. Por 10 tanto, la curva del angulo de fase es distinta de la correspondiente a la funcion de transferencia de fase minima mas tipica. Es necesario asegurarse de que la curva del angulo de fase queoe bien dibujada tomando en consideracion el termino de fase no minimo. El eje de frecuencia en el plano w esta distorsionado. La relacion entre la frecuencia ficticia J' y la frecuencia real W es
V
= -
wT tan-
Wb
Vb
= -
Wb T tan--
Ejemplo 4-12 Considere el sistema de control digital que se muestra en la figura 4-36. Disene un controlador digital en el plano w de tal forma que el margen de fase sea 50, el margen de ganancia sea de por 10men os 10 dB. y la constante de error de velocidad estatica K; sea 2 seg', Suponga que el periodo de muestreo es 0.::: segundos, es decir, que T = 0.2. Primero obtenemos la funci6n de transferencia pulso G(z) de la planta que esta precedida por un retenedor de orden cero:
G(z) =
z[
;-02< s(s :
-1
1)]
+ 1)]
(1 - z
)Z
S2(S
= 0.01873 [
K(0.01873z + 0.01752) Z2 - 1.8187z + 0.8187 A continuaci6n, transformamos la funci6n de transferencia pulso G(z) en una funci6n de transferencia G(w) mediante la transformaci6n bilineal dada por la ecuaci6n (4-37):
z=
r (t)
R(z)
c (t)
J'
sis + 11
Clz)
Figura 4-36
Seccion 4-6
237
Entonces,
G(w) = (1 + 0.lW)2 _ 1.8187(1 + O.lW) + 0.8187 1-0.lw 1-0.lw K( -0.000333w 2 - 0.09633w w 2 + 0.9969w
+ 0.9966)
K(l + ~)(1 - ~)
w(w + 1)
Un compensador simple de adelanto de lase probablemente satisfara todos los requisitos. Por 10 tanto, probaremos compensaci6n mediante adelanto. (Si la compensaci6n mediante adelanto no satisface todos los requisitos, sera menester utilizar un tipo distinto de compensaci6n.) Ahora supongamos que la funci6n de transferencia del controlador digital GJ)(w) tiene una ganancia unitaria para el intervalo de baja frecuencia y tiene la forma siguiente:
GD(w) = 1 + TW , 1 + aTW
O<a<l
(Se trata de un compensador de atraso de fase.) Esta es una de las formas mas sencillas de la funci6n de transferencia del controlador digital. (Otras formas se pueden suponer tarnbien para este problema.) La funci6n de transferencia en law abierto es 2 GD(w)G(w) = 1 + TW K( -0.000333w - 0.09633w + 0.9966) 2 1 + aTW w + 0.9969w La constante de error de velocidad estatica K" queda especificada como 2 seg', Por 10 tanto, K; = lim wGD(w)G(w) ~ K = 2
w~o
La ganancia K se determina entonces como el valor 2. AI definir K = 2, trazamos el diagrama Bode de G(w):
G(w)
= 2(-0.000333w 2
~ 2(1 + ~)(1 - ~)
-v-
w(w + 1)
La figura 4-37 muestra el diagrama Bode para el sistema. Para las curvas de magnitud hemos utilizado asintotas con !ineas rectas. La magnitud y el angulo de fase de GUv) aparecen como curvas punteadas. (Note que el cero en v = 10que ocurre en el semiplano derecho del plano w da retraso de fase.) EI margen de fase se puede leer del diagrama Bode (curvas punteadas) como 300 y el margen de ganancia como 14.5 dB. Las especificaciones requieren, adernas de K; = 2, de un margen de fase de SOD y una ganancia de por 10 menos 10 dB. Disenemos un controlador digital que satisfaga estas especificaciones.
SOD, el angulo adicional del adelanto de fase necesario para satisfacer este requisito es de 20 0 Para obtener un margen de fase de SOD sin reducir el valor de K, el compensador de adelanto debe de contribuir
238
40
Capitulo ~
20
i"--....
--....... r--...
L..--GoljP)
r--..
""'~ ~i
I
'. ~,
1
14 dB
--i'.~
Go liv/Gliv)
14~B~1
-20
dB
~40
Go 1M
'",
~-
-r~r-:
30 ........
10-
........
-60
'--
-G(Jv:
.. ... ...... ~~
'
....
Goliv)GIjP)
,/
"- ~-
-90
-...(
t
0.1
0.4
... ~ t::::~
10
v [rad/sec]
40
:.L--- ...-
~180
1.0
100
-270 1000
Figura 4-37
Si observamos que la adicion de un compensador de adelanto modi fica la curva de magnitud en el diagrama Bode, la frecuencia de cruce de ganancia se desplazara hacia la derecha. Si se considera el corrimiento de la ganancia en la frecuencia de cruce, debemos suponer que cPm, que es el angulo maximo de adelanto de fase requerido, es aproximadamente de 28. (Esto significa que se han aftadido 8 para compensar el corrimiento de la ganancia en la frecuencia de cruce.) En vista de que
sencPm = -1-+a
28 corresponde a a = 0.361. Una vez que el factor a de atenuacion se ha determinado sobre la base del angulo de adelanto de fase requerido, el siguiente paso es determinar las frecuencias de esquina v = IIr y v = lI(ar) del compensador de adelanto. Para ello, primero notamos que el angulo de adelanto de fase maximo cPm se presenta en la media geornetrica de las dos frecuencias de esquina, es decir v = 1I(.j;:; ). La cantidad de modificacion en la curva de magnitud en v = 1I(.j;:;) debido ala inclusion del termino (l + '(jv)!(1 + a'(jv) es 1 + rjv I 1 1 + ccrjv V~lI(y,;T) = v;:;
1- a
cPm =
do es
A continuacion encontramos el punto de frecuencia donde la magnitud del sistema no compensa-20 log(l! J;;). Note que
1 -20 logYO.361
dB
Secci6n 4-6
239
Para encontrar el punto de frecuencia donde Ia magnitud es -4.425 dB, sustituimos w = jv en G(w) y encontramos la magnitud de Gijv):
Mediante prueba y error, encontramos que en II = 1.7 la magnitud se convierte en a1rededor de -4.4 dB. Seleccionamos esta frecuencia como la nueva frecuencia de cruce de ganancia lie AI observar que esta frecuencia corresponde a II( f;;.), 0
lie
= , r = 1.7
1 v or
obtenemos
T
= - , r = 0.9790
1.7va
ar = 0.3534
Por 10 tanto, el compensador de adelanto determinado esa
1+
GD(w) = 1 +
TW aTW
1 + 0.9790w = 1 + 0.3534w
(4-40)
Las curvas de magnitud y de angulo de fase para GJ)(jll) y las curvas de magnitud y de angulo de fase de la funcion de transferencia en lazo abierto cornpensada GJ)(jll)G(jll) se muestran mediante curvas solidas en la figura 4-37. Del diagrama Bode vemos que el margen de fase es 50 y el margen de ganancia es 14 dB. La funcion de transferencia del controIador dada por Ia ecuaci6n (4-40) se transformara ahora de regreso al plano z mediante la transformacion bilineal dada por Ia ecuaci6n (4-38):
w
Entonces,
=~z
- 1 T z + 1
=~ z
- 1 0.2 z + 1
10z - 1 z + 1
1 + 0.9790 ( 1O~
z -
1)
)
GD(z) =
1 + 0.3534 10; :
Z3
240
Capitulo 1.
La funcion de transferencia pulso en lazo cerrado del sistema que hemos disenado es
C(z) R(z)
Z3
'10--- Unit-step response of designed system - - num = [0 0.0891 0.Q108 -0.0679J; den = [1 -2.2885 1.8460 -0.5255J; r = ones(1,41); v = [0 40 0 1.6]; axis(v); k = OAO; c = filter(num,den,r); plot(k,c,'o') grid title('Unit-Step Response cf Designed System') xlebel('k (Sampling period T = 0.2 sec)') yleb('Output c(k)')
Comentarios. La ventaja del metodo de transfonnada de w es que el metodo de respuesta en frecuencia convencional mediante el uso de diagramas Bode puede ser utilizado para disenos de sistemas de control en tiempo discreto. En la aplicacion de este metodo, debemos seleccionar cuidadosamente una frecuencia de muestreo razonable. Antes de concluir esta seccion, resumiremos 105 puntos importantes reJativos aJ disefio en eJ plano w.
1.
La magnitud y el angulo de fase de G(jv) son la magnitud y el angulo de fase de G(z) confonne z se mueve en el circulo unitario desde z = 1 hasta z = -1. En vista de que z = eiwT, el valor w
Secci6n 4-6
241
1.6 r - - - , - - - - - , - - - - - , - - - - - , - - - - - , - - - - - , - - - - - , - - - - - ,
1.4
1.2
OOOOoOOOOOOOOOOOOOOOO?OOOO
"" o
:2
OJ
(f)
'"
5
k (Periodo de muestreo T = 0.2 seg)
Figura 4-38
2.
3.
4.
varia desde 0 hasta -+ co.. La frecuencia ficticia v varia desde 0 hasta x ya que v = (2/7) tan( wT/ 2). Por 10 tanto, la respuesta en frecuencia del sistema de control digital para 0 :5: w :5: -+ w.\ es similar ala respuesta en frecuencia del sistema de control analogico correspondiente en el caso de 0 :5: v:5: oc, Dado que GUv) es una funcion racional de v, basicamente es la misma que GUw). En la determinacion de ceros inestables posibles de la ecuacion caracteristica, se puede aplicar el criterio de estabilidad de Nyquist. Por 10 tanto, son aplicables a GUv) tanto la aproximacion convencional con lineas rectas a la curva de magnitud del diagrama Bode como el concepto de margen de fase y de margen de ganancia. Compare las funciones de transferencia G(w) y G(s). Como hemos mencionado antes, en razan de la presencia del factor de escala 2/T en la transformacion w, las constantes de error estatico correspondientes para G(w) y para G(s) se hacen identicas. (Sin el factor de escala 2/ T esto no seria cierto.) La transformacion w puede generar uno 0 mas ceros en el semiplano derecho en G(w). Si existen uno 0 mas ceros en el semiplano derecho, entonces G(w) es una funcion de transferencia de fase no minima. Debido a que los ceros en el semiplano derecho estan generados por la operacion de muestreo y retencion, las localizaciones de estos ceros dependen del periodo de muestreo T. Los efectos de estos ceros en el semiplano derecho en la respuesta se hacen rnenores conforme se reduce el periodo de muestreo T. Ahora consideremos los efectos de la respuesta del cero en el semiplano derecho en w = 2/T. EI cero en w = 2/T genera distorsion en la respuesta en frecuencia conforme v se acerca a 2/T. En vista de que
2 wT v = - tan-
242
Capitulo 4
bien
2
y, por 10 tanto,
= 2T
1T
5.
Como ya se indica, w = W s = 1TIT es la frecuencia mas alta que consideramos en la respuesta del sistema de control en tiempo discreto 0 digital. Por 10 tanto, W = w/4 = 1T12T, que es la mitad de la frecuencia mas alta considerada, esta dentro del intervalo de frecuencia de interes, Asi, el cero en w = 21T, que aparece en el semiplano derecho del plano w, afectara seriamente la respuesta. Debe hacerse notar que el metodo de diagrama Bode en el plano W se utiliza con frecuencia, y muchos sistemas de control digital de exito han sido disefiados mediante este procedimiento.
La razon principal por la cual el manejo de los control adores analogicos es limitado, se debe a que los componentes neumaticos, hidraulicos y electronicos tienen limitaciones fisicas. Dichas limitaciones pueden ignorarse por completo en el disefio de los controladores digitales. Por 10 tanto, muchos esquemas de control, que han sido imposibles con controles analogicos, resultan posibles con controles digitales. De hecho, esquemas de control optirno que son imposibles mediante control adores analogicos se han hecho posibles con esquemas de control digital. En esta seccion presentamos en particular un metodo de disefio analftico para controladores digitales que obligara la secuencia de error, cuando quede sujeta a un tipo especifico de entrada en el dominio del tiempo, para lIegar a cero despues de un numero finito de perlodos de muestreo y, de hecho, a convertirse en cero y mantenerse en cero despues del numero minimo posible de periodos de muestreo. Si la respuesta de un sistema de control en lazo cerrado a una entrada escalon muestra el tiempo de asentamiento minimo posible (es decir, cuando la salida alcanza su valor final en un tiempo minimo y se queda ahi), sin error en estado pennanente y ninguna componente oscilatoria entre instantes de muestreo, entonces este tipo de respuesta se conoce com unmente como respuesta con oscilaciones muertas. La respuesta con oscilaciones muertas sera analizada en esta seccion. (La volveremos a ver en el capitulo 6, donde analizaremos la tecnica de ubicacion de polo y el disefio de los observadores de estado.) Los estudios que siguen estan limitados a la determinacion de algoritmos de control 0 funciones de transferencia pulso de control adores digitales para sistemas de una entrada-una salida, dadas las caracteristicas deseadas de respuesta optima. Para el control optimo de sistemas de multiples entradas-multiples salidas, ver el capitulo 8, donde se utiliza el metodo en el espacio de estados.
Diseiio de controladores dlgitales para un tiempo de asentamiento minima con un error cero en estado permanente. Considere el sistema de control digital que se muestra en la figura 439a). La sefial de error e(t), que es la diferencia entre la entrada ret) y la salida c(t), se muestrea en
Secci6n 4-7
243
c (r)
r (t)
Controlador digital
a)
R(z)
C(z)
b)
Figura 4-39
cada intervalo de tiempo T. La entrada al controlador digital es la serial de error de e(k7). La salida del controlador digital es la sefial de control u(k7). La sefial de control u(k7) es alimentada al reten de orden cero, y la salida del reten, u(t), que es una sefial en tiempo continuo, es alimentada a la planta. (A pesar de que no se muestra el dispositivo de muestreo en la entrada del reten de orden cero, la sefial u(k7) es primero muestreada y alimentada al reten de orden cera. Tal y como se mencion6 antes, el reten de orden cero que se muestra en el diagrama es un muestreador y reten.) Se desea disefiar un controlador digital GJ)(z) tal que el sistema de control en lazo cerrado muestre el tiempo de asentamiento minimo posible, con un error en estado permanente cera, en respuesta a una entrada escal6n, rampa 0 de aceleraci6n. Se requiere que la salida no presente componentes oscilatorias entre muestras, despues de haber alcanzado el estado permanente. Si se requiere, el sistema debera satisfacer cualquier otra especificaci6n, como es Ia correspondiente a la constante de error de velocidad estatica, Definamos la transformada de z de la planta, precedida por el reten de orden cero, como G(z), es decir
Entonces, la funci6n de transferencia pulso en Iazo abierto se convierte en Gn(z)G(z), tal y como se muestra en la figura 4-39b). A continuaci6n definamos la funci6n de transferencia pulso en lazo
244
Copltulo z
C(z)
R(z)
(4-411
Dado que es necesario que el sistema tenga un tiempo de asentamiento finito con un error en estado permanente cero, el sistema debera mostrar una respuesta impulso finita. Por 10 tanto, la funcion de transferencia pulso en lazo cerrado deseado debe ser de la forma siguiente:
\' V-I F(z)=aoz +al z' v++ aN
z'
es decir
(4-42)
donde N :?: n, y n es el orden del sistema. (Note que F(z) no debe contener ningun termino con potencias positivas en z, ya que dichos terminos en la expansion en series de F(z) implicarian que la salida antecede a la entrada, 10 que no es posible para un sistema fisicamente realizable.) En nuestro metoda de disefio, resolvemos la funcion de transferencia pulse en lazo cerrado para la funcion de transferencia pulse del controlador digital GJ)(z). Esto es, buscamos que la funcion de transferencia pulso GJ)(z) satisfaga la ecuacion (4-4 J). Si se resuelve la ecuacion (4-41) en funcion de Gn(zl obtenemos
GD(z)
(4-43 )
EJ sistema disefiado debe ser fisicamente realizable. Las condiciones para que esto ocurra imponen ciertas limitantes a la funcion de transferencia pulse en lazo cerrado F(z) y enla funcion de transferencia pulso del controlador digital GoCz). Las condiciones para que sean fisicamente realizabies pueden enunciarse como sigue:
1.
2.
3.
EI grade del numerador de G/)(z) debe ser igual 0 menor que el grade del denominador. (De no ser asi, el controlador requiere que sean datos de entrada futuros los que produzcan la salida de corriente. ) Si la planta GJs) incluye un atraso de transporte e '", entonces el sistema en lazo cerrado disefiado debe involucrar por 10 menos la misma magnitud de atraso de transporte. (De no ser asi, el sistema en lazo cerrado tendria que responder antes de que se Ie diera una entrada, 10 que es imposible realizar en un sistema ffsico.) Si G(z) se expande a una serie en Z-l, el termino elevado a la potencia menor de la expansion serial de F(z) en Z-l debe ser por 10 menos igual de grande que el correspondiente a G(z). Por ejernplo, si la expansion de G(z) en una serie en z' empieza con el termino z ", entonces el primer termino de F(z) dado por la ecuacion (4-42) debera ser cero, 0 aodebe ser igual a 0, esto es, la expansion debera ser de la forma
F(z)
donde N:?: n, y n es el orden del sistema. Esto significa que la planta no puede responder en forma instantanea cuando es aplicada una sefial de control de magnitud finita: la respuesta se presenta con un atraso de por 10 menos un periodo de muestreo, si la expansion de la serie de G(z) empieza con un terrnino z".
Secci6n 4-7
245
Ademas de las condiciones de la posibilidad ffsica de realizacion, tenemos que poner atencion en aspectos de estabilidad del sistema. De manera especifica, debemos evitar la cancelacion de un polo inestable de la planta mediante un cero del controlador digital. Si se intenta este tipo de cancelacion, cualquier error en la cancelacion entre polos y ceros generara una divergencia conforme pasa el tiempo y el sistema se hara inestable. En forma similar, la funcion de transferencia pulso del controlador digital no debera incluir polos inestables para cancelar ceros de la planta que ocurran fuera del circulo unitario. Ahora investiguemos 10 que ocurrira con la funcion de transferencia pulso en lazo cerrado F(z) si G(z) incluye un polo inestable (0 crfticamente estable), esto es, un polo z = 0' exterior al circulo unitario (0 bien sobre el). [Note que la discusion siguiente se aplica de la misma manera, si G(z) incluye dos polos 0 mas inestables-o crfticamente estables.] Definamos
G(z) = G)(z)
z -
0' 0'.
don de G](z) no incluye un termino que se cancele con z pulso en lazo cerrado se convierte en
= F(z)
1 + GD(z) G1(z)
Z 0'
(4-44)
En vista de que requerimos que ningun cero de G[)(z) cancele el polo inestable de G(z) en z debemos tener
= 0',
1 - F(z) =
--------=-~
1 + GD(z) G)(z)
z -
0'
z - 0' + GD(z)Gj(z)
z -
0'
Esto es, I - F(z) debe tener como cera a z = 0'. Tambien, note de la ecuacion (4-44) si ceros de G(z) no cancelan polos de G/)(z), los ceros de G(z) se convierten en ceros de F(z). [F(z) puede incluir ceros adicionales.] Resumamos 10 que hem os dicho en relacion con la estabilidad.
I.
2.
Dado que el controlador digital GD(z) no debe cancelar los polos inestables (0 crfticamente estables) de G(z), todos los polos inestables (0 crfticamente estables) de G(z) deberan incluirse en 1 ~ F(z) como ceros. Los ceros de G(z) que se presenten dentro del circulo unitario pueden cancelarse con polos de G/)(z). Sin embargo, los ceros de G(z), que ocurran sobre 0 fuera del circulo unitario, no deben cancelarse con polos de G/)(z). Por 10 tanto, todos los ceros de G(z) que se presenten sobre 0 por fuera del cfrculo unitario deberan ser incluidos en F(z) como ceros.
Ahora seguiremos con el disefio. Dado que e(k7) = r(k7) - c(k7), reflriendonos a la ecuacion (4-41) tenemos
(4-45)
246
Capitulo.4
R(z)=l
Para una entrada rampa unitaria ret) = t I (t),
-z -I
R(z) = (1 _
Y para una entrada de aceleracion unitaria ret) =
Z-I)2
+ I (t), f
Z-I) Z-I)3
R(z) =
T 2 z-l(1 2(1 _
Por 10 tanto, en general, las transformadas z en estas entradas polinomiales en eI dominio de tiempo se pueden escribir como (4-46) don de P(z) es un polinomio en Z-I. Note que para una entrada escalon unitario, P(z) = I Y q = 0; para una entrada rampa unitaria, P(z) = Tz- 1 Y q = I; Y para una entrada de aceIeraci6n unitaria, P(z) = ]'2z-l(1 + Z-I) Y q = 2. AI sustituir la ecuacion (4-46) en la ecuacion (4-45) obtenemos
E( ) = P(z)[1 - F(z)]
(1 _
Z-lY+1
(4-47)
Para aseguramos de que el sistema lIega aI estado permanente en un nurnero finito de periodos de muestreo y mantiene un error cero en estado permanente, (z) debera ser un poIinomio en Z-I con un numero finito de terminos, Entonces, refiriendonos a la ecuacion (4-47), escogemos que la funcion I - F(z) tenga la forma (4-48) donde N(z) es un poIinomio en
Z-I
que es un polinomio en Z-1 con un numero finito de terminos, Esto significa que la sefial de error se convierte en cero en un nurnero finito de periodos de muestreo. Del analisis anterior, Ia funcion de transferencia pulso del controlador digital puede determinarse como sigue. Si se supone primero que F(z) satisface Ia posibilidad fisica de realizacion y las condiciones de estabilidad, y a continuacion se sustituye la ecuacion (4-48) en la ecuacion (4-43). obtenemos F(z) GD(z) = G(z)(l - z-Iy+l N(z) (4-50)
La ecuacion (4-50) da la funcion de transferencia pulso del controlador digital que producira un error cero en estado permanente, despues de un numero finito de period os de muestreo. Para una planta estable O/s), Ia condicion para que la salida no muestre componentes oscilatorios entre muestreos despues del tiempo de asentamiento, se puede escribir como sigue:
Seccion 4-7
247
para entradas escalon para entradas rampa para entradas de aceleracion
La condicion aplicable debera ser satisfecha cuando se disefte el sistema. Al disefiar el sistema, la condicion sobre e(t), e(t) 0 c(t) debera de interpretarse en terminos de u(t). Note que la planta esta en tiempo continuo y la entrada a la planta es u(t), que es una funcion en tiempo continuo; por 10 tanto, para no tener componentes oscilatorias en la salida e(t), la senal de control u(t) en estado permanente debe ser constante 0 de un incremento monotone (0 decrernentandose rnonotonamente) para los casos de entrada escalon, rampa y de aceleracion,
Comentarios
I. Dado que la funcion de transferencia pulso en lazo cerrado F(z) es un polinomio en Z-I, todos los polos en lazo cerrado estan en el origen 0 en z = O. EI polo multiple en lazo cerrado en el origen es muy sensible a las variaciones de parametros del sistema. Aunque un sistema de control digital disefiado para presentar un tiempo de asentamiento minimo con un error cero en estado permanente en respuesta a un tipo especifico de entrada tenga caracteristicas excelentes de respuesta transitoria para la entrada para la cual fue disefiado, puede mostrar caracteristicas de respuestas transitorias inferiores 0 algunas veces inaceptables para otros tipos de entrada. (Esto es siempre cierto tratandose de sistemas de control optirno. Un sistema de control optimo mostrara las mejores caracteristicas de respuesta para el tipo de entrada para el que fue disefiado, pero no exhibira caracteristicas de respuesta optima con otros tipos de entradas.) En el caso en el que un controlador analogico es discretizado, un incremento en el periodo de muestreo modifica la dinarnica del sistema, 10 que puede llevar a la inestabilidad del mismo. Por otra parte, el comportamiento del sistema de control digital que disefiamos en esta seccion no depende de la seleccion del periodo de muestreo. En vista de que las entradas ret) consideradas aqui son entradas en el dominio del tiempo (como entradas escalon, entradas rampa y entradas de aceleracion), el periodo de muestreo T puede ser escogido de manera arbitraria. Para un periodo de muestreo menor, el tiempo de respuesta (que es un multiple entero del periodo de muestreo 7) se hace menor. Sin embargo, para un periodo de muestreo T muy pequefio, la magnitud de la sefial de control se convertira en excesivamente grande, con el resultado de que en el sistema apareceran fenornenos de saturacion, y el metodo de diseno presentado en esta seccion ya no sera aplicable. Por 10 tanto, el periodo de muestreo T no debe ser demasiado pequefto. Por otra parte, si el periodo de muestreo T se escoge demasiado grande, el sistema puede comportarse de manera no satisfactoria, 0 incluso puede hacerse inestable cuando este sujeto a entradas variables en el tiempo (como son entradas en el dominio de la frecuencia). De ahi que un termino medio sea necesario. Una regIa practica seria escoger el periodo de muestreo T mas pequeno para que no ocurra ningun fenomeno de saturacion en la sefial de control.
2.
3.
Ejemplo 4-13 Considere el sistema de control digital mostrado en la figura 4-39a), donde la funcion de transferencia de la planta Gp(s) esta dada por
G p (s) = -s (,-s-+-1:-)
248
Copitc-c ..
Disene un controlador digital GD(z), tal que el sistema en lazo cerrado muestre respuesta con oscilacioi muertas a una entrada escal6n unitario. (En una respuesta con oscilaciones muertas el sistema no mos ra componentes oscilatorias entre muestras en la salida, una vez alcanzado el tiempo de asentamiento.1 EJ periodo de muestreo Tse supone de 1 seg. Entonces, utilizando el controlador digital Gj)(z) disefiado esta forma, investigue la respuesta de ese sistema a una entrada rampa unitaria. EI primer paso en el diseno es determinar la transform ada z de la planta que esta antecedida por la retenedor de orden cera:
G(z) = Z
I - es
-I
Ts
1 s(s + 1)
= (1 -- z
)Z [ s\s 1 1)] +
1]
(4-:q
I
Ahora vuelva a dibujar el diagrama del sistema de la misma manera en que se muestra en la figura 439b). Defina la funci6n de transferencia pulso en lazo cerrado como F(z), es decir
C(z)
R(z)
GD(z)G(z)
- F
z
()
1 + GD(z)G(z) -
Observe que si G(z) se expande a una serie en Z-I entonces el primer terrnino sera O.3679z- '. Por 10 tanto, F(z) deb era empezar con un terrnino en Z-I. AI referimos a la ecuaci6n (4-42) Yobservar que el sistema es del segundo orden (n = 2), suponemos que F(z) tiene la forma siguiente:
F(z) = alz- I
azz- 2
(4-52'
Dado que la entrada es una funci6n escalon, de la ecuaci6n (4-48) requerimos que
1 - F(z)
(1 - z-l)N(z)
(4-53 '
Dado que G(z) tiene un polo criticamente estable en z = I, el requisito de estabilidad define que I - F(=~ debe tener un cera en z = 1. Sin embargo, la funci6n I - F(z) ya tiene un termino 1 ~ [ I , 10 que satisface por 10 tanto el requisito. En vista de que el sistema no debera mostrar componentes oscilatorias entre mucstras y la entrada es una funci6n escalon, necesitamos que c(t ~ 2T) sea constante. Si observamos que u(t), la salida del retenedor de orden cera, es una funci6n en tiempo continuo, una constante c(t ~ 2T) requiere que U~lI tarnbien sea con stante para t ~ 2T. En terrninos de la transformada z, U(z) debe ser del tipo siguiente de: series de Z-I:
donde b es una con stante. Dado que la funci6n de transferencia de la planta G/s) involucra un integrador, b deb era ser cera. (De 10 contrario, la salida no podria conservarse constante.) En consecuencia tenernos
U(z) = b o
b,
Z-l
C(z)
U(z)
G(z)
Seccion 4-7
249
1 (1 - z-I)(l - 0.3679zl )
(4-54)
U(z)
(4-55)
La ecuacion (4-55) da U(::) en terminos de F; Una vez que se determine la constante Fj, U(::) se puede dar como una serie de ::-1 con solo dos terrninos. Ahora determinaremos N(::). F(::) y F; Si se sustituye la ecuacion (4-52) en la ecuacion (4-53) obtenemos
1 - alz
a2z-2
(1 - z-I)N(z)
EI primer miembro de esta ultima ecuacion debera ser divisible entre 1 - ::-1. Si dividimos el primer miembro entre 1 - [ I , el cociente es I + (I - GI)::-I y el residuo es (1 - GI - G 2)::-2. Por 10 tanto. N(::) se determina como
(4-56)
y el residuo debera ser cero. Esto requiere que
1 - al - a2
'larnbien, de las eeuaciones (4-52) y (4-54) tenemos
=0
(4-57)
F(z)
Por 10 tanto,
al Z-1 + a2z-2
(1 + 0.7181z- l)z-1 F;
(4-58)
Si se resuelven las ecuaciones (4-57) y (4-58) en funcion de a l ya2 da
al = 0.5820,
Entonces, F(z) se determina en la forma
a2
= 0.4180
(4-59)
N(z) = 1 + 0.4180z- 1
(4-60)
250
Diseiio
Capitulo .4
La funci6n de transferencia pulso del controlador digital GlJ(z) es determinada a continuaci6n a partir de la ecuaci6n (4-50) como sigue. Refiriendonos a las ecuaciones (4-51), (4-54) Y(4-60),
(1 + 0.7181z- l)z-I(0.5820) 0.3679(1 + 0.7181z I)Z 1 (1 _ z-I)(l + 0.4180z-l) (1 - z 1)(1 - 0.3679z ') 1.5820 - 0.5820z- 1 1 + 0.4180z- 1
Con el controlador digital asi disenado, la funci6n de transferencia pulso en lazo cerrado se convierte en:
~~;~
C(z) = F(z)R(z)
= (0.5820z- 1 + 0.4180z-\ 1 -z
Por 10tanto,
c(O) = 0
c(l)
= 0.5820
c(k) = 1, k = 2,3,4, ... Observe que la sustituci6n de 0.5820 en lugar de F 1 en la ecuacion (4-55) da como resultado
U(z)
= =
Por 10tanto, la seiial de control u(k) se convierte en cero para k <!: 2, tal y como se requiere. No existe componente oscilatoria entre muestras en la salida una vez alcanzado el tiempo de asentamiento. La figura 4-40a) muestra las graficas de c(k) en funci6n de k, de u(k) en funcion de k y de u(t) en funci6n de t en la respuesta escal6n unitario. A continuacion, investiguemos la respuesta de este sistema a una entrada rampa unitaria:
C(z)
F(z )R(z)
= (0.5820z- 1 + 0.4180z- 2 ) (1 _ z
= 0.5820z- 2
Z-I
1)2
Para la respuesta rampa unitaria, la senal de control U(z) se obtiene como sigue. Refiriendonos a las ecuaciones (4-51) Y(4-59)
1)2
251
r(t}
<.
2
3
4
e u = 1.4180
(5.)
a}
b)
Figura 4-40 Respuesta del sistema diseilado en el ejemplo 4-13. a) Grafica de c(k) en funcion de k, u(k) en funcion de k y u(t) en funcion de t en la respuesta escalon unitario; b) graficas de c(k) en funcion de k, u(k) en funcion de k y u(t) en funcion de ten la respuesta rampa unitaria.
-I
La seftal u(k) se hace constante (b = I) para k;::: 2. Por 10 tanto, la salida del sistema no mostrara cornponentes oscilatorias entre muestras. La figura 4-40b) muestra las graficas de c(k) en funci6n de k. u(k) en funci6n de k y u(t) en funci6n de t en la respuesta rampa unitaria. Observe que la constante de error de velocidad estatica K; para el presente sistema es
s,
= =
~~ [ +GD(Z)G(Z)
-1
252
Capitulo 4
1 en = K = 1.4180
v
En el presente problema de disefio, requerimos que en respuesta a una entrada escal6n el sistema tenga un tiempo de asentamiento minirno, sin error de estado permanente y sin componentes oscilatorias en la salida, una vez alcanzado el tiempo de asentamiento. Si en este problema existen una 0 mas limitantes adicionales (por ejemplo, si se especifica arbitrariamente el valor de la constante de error de velocidad estatica KJ, entonces debera incrementarse el numero de periodos de muestreo antes de alcanzar el estado permanente. Por ejemplo, el sistema de segundo orden pudiera necesitar tres 0 mas periodos de muestreo antes de alcanzar el estado permanente, dependiendo de las limitantes adicionales impuestas. Yea el ejemplo 4-14 a continuaci6n
Ejemplo 4-14 Considere un problema de diseno similar al del ejemplo 4-13 excepto que se especifica la con stante de error de velocidad estatica K v (En razon de esta limitante adicional, el tiempo de asentamiento sera 2 seg mas largo) El diagrama de bloque del sistema de control digital aparece en la figura 4-39a). La funcion de transferencia de la planta Gp(s) bajo consideracion es
Gp(S)
s(s
+ 1)
Las especificaciones de disei'io son 1) que el sistema en lazo cerrado muestre un tiempo de asentarniento finito con un error cero en estado permanente en la respuesta escalon unitario, 2) que la salida no presente componentes oscilatorias entre muestras, una vez alcanzado el tiempo de asentamiento, 3) que la constante de error de velocidad estatica K; sea de 4 seg' y 4) que el tiempo de asentamiento sea el minimo posible para satisfacer todas estas especificaciones. El perfodo de muestreo se supone de 1 seg. Disefie un controlador digital GIJ(z) que satisfaga las especificaciones dadas. Una vez disei'iado el controlador, investigue Ia respuesta del sistema a una entrada rampa unitaria. La transformada z de la planta precedida por un reten de orden cero sc obtiene en el ejemplo 4-13 en la forma:
G(z) - Z
1 - e- Ts
s
1 ] s(s + 1)
C(z)
R(z)
en[l:
GD(z)G(z)
1
+ GD(z)G(z)
F(z)
En vista de que el primer termino de la expansion de G(z) es 0.3679[1, F(z) debe empezar con un termino
donde N ~ n y n es el orden del sistema (en este caso n = 2). En razon de la limitante adicional, podrernos suponer que N > 2. Probaremos con N = 3. Por 10 tanto, suponemos (4-61
Secci6n 4-7
253
(Si no se obtiene un resultado satisfactorio, debemos suponer que N > 3.) Si se observa que la entrada es una funci6n escalon, de la ecuaci6n (4-48) requerimos que
1 - F(z)
(1 - z-I)N(z)
(4-62)
Observe que la presencia de un polo criticamente estable en z = I en la funci6n de transferencia pulso de la planta G(z) requiere que I - F(z) tenga un cero en z = I. Sin embargo, la funci6n I - F(z) ya tiene un terrnino 1 ~ Z~I, por 10 tanto satisface el requisito de estabilidad. EI requisito de que la constante de error de velocidad estatica sea de 4 seg' se puede escribir en la forma:
K,
= ~~ [ +GD(Z)G(Z)
-I
= N(I)
donde utilizamos la ecuacion (4-50) con q = O. Note que de la ecuaci6n (4-62) tenemos que F( I) = I. De ahi, K,. se puede escribir como sigue:
1 K; = N(1) = 4
Dado que la salida del sistema no debe mostrar componentes oscilatorias entre muestras una vez alcanzado el tiernpo de asentarnicnto, requerimos que U(z) sea de la siguiente forma:
(4-63)
U(z)
Debido a que la funci6n de transferencia de planta Gp(s) incluye un integrador, b debera ser cero. Por 10 tanto, tenernos
U(z) = b., +
b,Z-~1
+ b2 z - 2
CCz) CCz) R(z) R(z) U(z) = G(z) = R(z) G(z) = F(z) G(z)
1 - 0.3679z- 1
(4-64)
(4-65)
(4-66)
254
Diseiio
Copitulo d
1 - al - az - a3 = 0
Observe que de la ecuaci6n (4-63) requerimos que N(I) ecuaci6n (4-66) obtenemos
=
(4-67)
Z-I =
1 en la (4-68)
a3 - 0.7181(az - 0.7181al) = 0
Si se resuelven las ecuaciones (4-67), (4-68) Y(4-69) en funci6n de a" a2 Ya] obtenemos
(4-69)
al = 1.26184,
Por 10tanto, F(z) se determina como
az = 0.22633,
a3 = -0.48816
La ecuaci6n (4-66) da
0.3679(1 + 0.7181z(1 - z-I)(l - 0.26184z- 1 - 0.48817z- Z) (1 - z 1)(1 - 0.3679z I) I)(1 l) = 3429 (1 - 0.5387z- 0.3679z. 8 (1 _ 0.8418z 1)(1 + 0.5799z I) Con el controlador digital asi disenado, la salida del sistema en respuesta a una entrada escalon unitario r(t) = 1 se obtiene como sigue:
C(z) = F(z)R(z)
= (1.26184z- 1 +
Seccien 4-7
255
Por 10 tanto,
c(O)
c(l) = 1.2618
c(2)
c(k)
La secuencia de la respuesta escalon unitario tiene un sobrepaso maximo de aproximadamente 50%. EI tiempo de asentamiento es de 3 seg. Observe que de la ecuacion (4-65) tenemos
U(z)
elk)
0
u(k)
2
0
2
3
4
-2
u(t)
o r---1r--r--.L....-....-.l----J~
4 5
t (sec)
-2
Figura 4-41- Graficas de elk) en funcion de.e, u(k) en funcion de k y u(t) en funcion de ten la respuesta escalon unitario del sistema
disenado en el ejemplo 4-14.
256
Copitulo .!
C(z) = F(z)R(z)
= =
(1.26184z- 1 + O.22633z-
O.48816z- 3 ) (1 ~ z
-I
1)2
C(z) F(z) F(z) 1 Z-1 U(z) = G(z) = G(z)R(z) = G(z) 1 - Z-1 1 - Z-1
= =
-I
Z-4
+ z-s +
La seftal u(k) se hace constante (b = I) para k 23. Por 10tanto, la salida del sistema no exhibira cornponentes oscilatorias entre muestras. La figura 4-42 muestra las graficas de c(k) en funci6n de k, u(k) er; funci6n de k y u(t) en funcion de t para la respuesta rampa unitaria. Note que el error de estado permanente en la respuesta rampa unitaria es e" = IIKv = tal y como se indica en la figura 4-42.
Capitulo 4
257
Al comparar los sistemas de control digital disefiados en los ejemplos 4-13 y 4- I4, notamos que este ultimo mejora las caracteristicas de respuesta rarnpa, a expensas del tiempo de asentamiento. (Este ultimo sistema requiere de un perfodo de muestreo adicional, para Ilegar al estado permanente.) Observe tarnbien que eJ primero tiene una mejor caracterfstica de respuesta escalon, es decir, un tiempo de asentamiento mas corto, sin sobrepaso. Segun los objetivos del sistema, pudieramos escoger uno sobre el otro. Si se requieren buenas caracterfsticas de fa respuesta rampa, entonces el sistema debera disefiarse utilizando la entrada rampa como entrada de referencia, en lugar de la entrada escalon. (Vea el problema A-4-l4.)
es decir
z - 1 ~ Ts
Por 10 tanto, los patrones geornetricos de los polos cerca de z = I en el plano r son sirnilares a los patrones de los poles en el plano s cerca del origen. Problema A-4-2 Considere el sistema dcscrito por
Y(z) X(z)
1 1 - 0.6z
1 -
0.81z
Z4
+ 0.67z
3 -
0.12z
Z4 -
0.6z 3 0.6z 3
Defina
P(z) =
Z4 -
ao > 0
Entonces, tenemos
258
Diseiio
de sistemasde control
Capitulo 4
a = -0.81
a3 = 0.67
a4 = -0.12
1.
2.
la41 < ao. Esta condici6n cJaramente esta satisfecha. P(I) > O. Dado que
P(l) = 1 - 0.6 - 0.81
entonces Ja condicion esta satisfecha.
b,
0 .9856
b., =
Ja condicion esta satisfecha. 5.
I:: ::I
1-~12 _~::71
= -0.5980
=
=
la condicion esta satisfecha. Del analisis anterior, concluimos que la ecuaci6n caracteristica P(z) = 0 incluye una raiz en z = -I Y las otras tres raices estan en el interior del circuJo unitario con centro en el origen del plano z. El sistema es crfticamente estable.
Problema A-4-3
Considere la siguiente ecuacion caracteristica:
P(z)
= Z3 - 1.3z 2
0.08z + 0.24
=0
(4-70)
Determine si alguna de las raices de la ecuaci6n caracteristica se presenta 0 no por fuera del circulo unitario del plano z. UtiJice la transformaci6n biJineaJ y el criterio de estabiJidad Routh. Solucion Sustituyamos (w + J )/(w - I) en lugar de z en la ecuaci6n caracteristica dada, 10 que resulta en
( w
(w
Al simplificar las fracciones multiplicando ambos terminos de esta ultima ecuaci6n por (w - J )3, obtenemos
Capitulo 4
259
w3
7.571w 2
36.43w - 14.14
(4-71 )
EI arreglo de Routh para la ecuacion (4-71) se convierte en: one sig~w3 change --.....,. w
2
-36.43
-7.571
-14.14
-38.30
WO
-14.14
EI criterio de estabilidad de Routh establece que el numero de raices con partes reales positivas es igual al numero de cambios en signa de los coeficientes de la primera columna del arreglo. Dado que hay un cambio de signa en los coeficientes de la primera columna, existe una raiz en el semiplano derecho del plano w. Esto significa que la ecuacion caracteristica original dada por la ecuacion (4-70) tiene una raiz fuera del circulo unitario del plano z. El sistema es inestable. (Compare la cantidad de calculos necesarios en el presente metodo y la correspondiente en la prueba de estabilidad de Jury. Yea en particular el ejemplo 4-6.)
Y(z) U(z)
El periodo de muestreo T es 0.5 seg. Utilizando MATLAB, trace la respuesta rampa unitaria hasta k = 20.
Soluci6n
kT,
k=0,1,2, ...
O:N;
donde N es el fin del proceso en consideracion, En el programa 4-3 de MATLAB se da un programa MATLAB para trazar la respuesta rampa unitaria del sistema considerado. La grafica resultante aparece en la figura 4-43.
Problema A-4-5 Demuestre que si la ecuacion caracteristica para un sistema en lazo cerrado se escribe en la forma
KB(z) 0 1 + A(z) =
donde A(z) y B(z) no contienen k, entonces los puntos de ruptura de salida y de entrada pueden determinarse a partir de las raices de
260
Capitulo 4
% ---- Unit-ramp response - % ***** Enter the numerator and denominator of the system *****
num = [0 0.7870 den = [1 -0.8195 0]; 0.6065);
% ***** Enter k, unit-ramp input, filter command and plot command *****
k = 0:20; u = [0.5*k];
10
9
8
7
6
::;;
>.
5
4
10
12
14
16
18
20
k
Figura 4-43 Respucsta rampa unitaria del sistema considerado en cl problema A-4-4.
II
=::'Jlo4
261
Solucion
fez)
Suponga que fez)
=
= A(z) + KB(z) = 0
ZI)'CZ Z2)'"
(4-72)
0 tiene varias raices del orden r. Entonces fez) puede escribirse en la forma
fez)
= (z -
(z - zp)
Zj,
obtenemos
df(z) = 0 dz
es decir
df(z) dz
donde
= A '(z) + KB'(z) = 0
(4-73 )
A'(z) =
d~;Z),
B'(z) = dB(z) dz
A'(z) K = - B'(z)
Este valor particular de K daracorno resultado varias raices de la ecuacion caracteristica. Si sustituimos este valor de Ken la ecuacion (4-72), obtenemos
fez)
cs decir
A'(z)
B'(z)A(z) - A'(z)B(z)
=0
(4-74)
Si esta ultima ecuacion se resuelve en funci6n de z, podran obtenerse los puntos donde se presentan \ arias raices. Por otra parte, en la ecuacion (4-72) tenemos
K = _ A(z) B(z)
dK dz
Si dK/dz se define igual a cera, obtenemos la misma ecuaci6n que la (4-74). Por 10 tanto, los puntos de ruptura de salida y de entrada pueden simplcmente determinarse a partir de las raices de
de dK/dz = 0 corresponden a
262
Diseiio
de sistemas de control
Capitulo.4
puntos reales de ruptura de salida 0 de entrada. Un punto como este para el cual dK/dz = 0 es un punto real de ruptura de salida 0 de entrada si y solo si Ken este punta tiene un valor real y positivo.
Problema A-4-6
Discuta el procedimiento para disefiar compensadores de adelanto para sistemas de control digital mediante el metodo del lugar geornetrico de las raices. Solucion Consideraremos el sistema que se muestra en la figura 4-44 para analizar el procedimiento de disefio de los compensadores de adelanto. La cornpensacion mediante adelanto es util cuando el sistema es inestable para todos los valores de ganancia 0 estable, pero tiene caracteristicas de respuesta transitoria no deseables. Para disefiar compensadores de adelanto, podemos utilizar el procedimiento siguiente:
Go(z)
G(zl
Figura 4-44
1. De las especificaciones de desempeno, determine la posicion deseada para los polos dominantes en lazo cerrado. 2. Mediante el dibujo de la grafica del lugar geornetrico de las raices, asegurese si que con el solo ajuste de ganancia se puede 0 no proporcionar los polos deseados en lazo cerrado. Si no se puede. calcule la deficiencia angular ~. Este angulo adicional debera ser proporcionado por el compensador de adelanto, si el nuevo lugar geometrico de las raices ha de pasar a traves de las localizaciones deseadas para los polos dominantes en lazo cerrado. 3. Suponga que el compensador de adelanto GJ)(z) es G D ( z ) = KDa
1 + az ' 1 + an
0<0'<1
4. Si no se especifican constantes del error estatico, determine la localizacion del polo y del cera del compensador de adelanto de tal forma que el compensador de adelanto contribuya con el angulo necesario ~. Si no se imponen otros requisitos en el sistema, trate de hacer el valor de a tan grande como sea posible. Un valor mayor de a da general mente como resultado un valor mas grande de K", 10 que es deseable. (Si se especifica una constante de error estatico particular, por 10 regular es mas sencillo utilizar el metodo de la respuesta en frecuencia.) 5. Determine la ganancia en lazo abierto del sistema compensado a partir de la condicion de magnitud. Una vez disefiado el compensador, verifique si todas las especificaciones de desempefio han sido cumplidas 0 no. Si el sistema compensado no cumple con las especificaciones de desernpefio, entonces repita el procedimiento de diseno, ajustando el polo y el cero del compensador hasta que todas las especificaciones se hayan cumplido. Si se requiere de una constante de error estatico grande, ponga en cascada una red de atraso 0 altere el compensador de adelanto a un compensador de atraso-adelanto. '. Problema A-4-7 Dibuje los diagramas dellugar geornetrico de las ralces en el plano z para el sistema que se muestra en la figura 4-45 en el caso de los tres siguientes periodos de muestreo: T = 1 seg, T = 2 seg y T = 4 seg.
::::: 'vlo 4
263
r(r)
R(z)
e(t) C(z)
G(s)
Figura 4-45
Solucion
G(z) = Z [
K ] 1 - e- Ts s s(s + 1)
= (1 -
Z-I)Z[S2(S:
1)J
+ (1 - e- T - Te- T)z-2]
T
_ K[(T - 1 +
-
e-T)z~l
(4-75)
(1 - z 1)(1 - e
z 1)
A. continuacion construimos los diagramas del lugar geometrico de las raices para los tres casos en consideracion.
1. Periodo de muestreo T = I: para T = I, la ecuacion (4-75) se convierte en
K =
I 0.3679(z + 0.7181)
(z - l)(z - 0.3679)
Si seleccionamos un punto z en los lugares geometricos de las raices, el valor de K en dicho punta se puede calcular si se sustituye el valor de z en esta ultima ecuacion. (Esto significa que con este valor de K este punto en particular se convierte en un polo en lazo cerrado.) La ganancia critica se encuentra como K = 2.3925. 2. Periodo de muestreo T= 2: para el periodo de muestreo T= 2, tenemos de la ecuacion (4-75)
264
Capitulo !.
Plano z
T = 1s
\ K
a)
a
Re
-2.0841
T=2s
b)
Re
1m
Plano z
T = 4 s K = 0.9653
c)
Re
0.0183
Figura 4-46 Diagramas dellugar geometrico de las raices para el sistema mostrado en la figura 4-45 cuando a) T= I seg, b) T= 2 seg y c) T= 4 seg.
3.
Capitulo 4
265
lugar geometrico de las raices se muestra en la figura 4-46c). La ganancia critica para la estabilidad es K= 0.9653. De los tres casos considerados, note que mientras mas pequeno es el periodo de muestreo, mas grande sera la ganancia critica K para la estabilidad.
Problema A-4-8
Considere el sistema de control digital que se muestra en la figura 4-47, donde la planta es del primer orden y tiene un tiempo muerto de 2 seg. El periodo de muestreo se supone de I seg, es decir T = I. Disene un controlador digital PI tal que los polos dominantes en lazo cerrado tengan un factor de amortiguamiento relativo 'de 0.5 y el numero de muestras por cada cicio de la oscilaci6n senoidal amertiguada sea 10. Obtenga la respuesta del sistema a una entrada escal6n unitario. Tambien, obtenga la constantc de error de velocidad estatica K v y encuentre el error en estado permanente en respuesta a la entrada rampa unitaria.
r It)
1- e
T,
ctz)
Clz)
Rizi
Figura 4-47
Soluci6n
2[1 (1 - z
e-
Ts
e5
2s ]
+1
(1 - Z-I)Z-2 2[5(5 ~ 1J
_I -2
)z
(1 - e-1)z-1 (1 _ z ')(1 _ e- I z I)
0.6321z -3
1 - 0.3679z- 1
1 GD(z) = Kp + K-- - - 1 1 -z
(K;
+ K)
Kp z---kp + K
..
z - 1
0.6321
GD(z)G(z) =
z - 1
Z2(Z - 0.3679)
266
Capitulo ~
o
0.5881
Re
Figura 4-48 Localizaciones del polo y del cero en el plano z del sistema considerado en el problema A-4-8.
Localizamos los polos en lazo abierto en el plano z tal y como se muestra en la figura 4-48. En este ~ esta implicado un cero en lazo abierto, en este momenta su localizaci6n es desconocida. Dado que se requiere tener 10 muestras por cicIo de la oscilacion senoidal amortiguada, el dominante en lazo cerrado en la parte superior del plano z debe presentarse sobre una linea desde ell origen con un angulo de 360/10 = 36. De las ecuaciones (4-1) Y(4-2) vueltas a escribir en la forma
JX'"
27T( Wd)
la localizacion deseada del polo en lazo cerrado puede determinarse como sigue: al notar que tenemos
A = 36
es decir wjw,
Iz I -
VI - 0.5
10
EI polo en lazo cerrado esta localizado en el punto P en la figura 4-48, donde (en dicho punto P)
Capitulo 4
267
= 0.6958 /36
= 0.5629
+ j0.4090
(Note que este punto es la interseccion dellugar geometrico de (= 0.5 y la linea desde el origen que tiene un angulo de 36.) Si el punta P debe ser una Iocalizacion de polo en lazo cerrado en la parte superior del plano z, entonces la deficiencia angular en el punto P es
EI cero del controlador debe contribuir con +93.52. Esto significa que el cero del controlador digital debera colocarse en z = 0.5881. Por 10 tanto,
x, x, + K, =
0.5881
(4-76)
GD(Z) = KZ - 0.5881 z - 1
donde K
=
K
es decir
z - 0.5881
z - 1
I
z~O.5629+j04090
= 1
K
Por 10 tanto,
= 0.5070
= 0.5070
K;
+ K,
(4-77)
K, = 0.2982
K, = 0.2088
Y, por 10 tanto, el controlador PI que acabamos de disefiar puede estar dado por
G (z)G(z)
D
0.3205z- 3 - 0.1885z- 4
1
+ 0.3679z- z + 0.3205z- 3 -
0.1885z- 4
La respuesta c(k7) a la entrada escalon unitario se puede obtener facilmente mediante el uso de MATLAB. Un programa MATLAB para la graficacion de la respuesta escalon unitario aparece en el programa 4-4 de MATLAB. La grafica resultante se muestra en la figura 4-49.
268
Capitulo 4
% - - Respuesta escalon unitario - - num = [0 0 0 0.3205 -0.1885]; den = [1 -1.3679 0.3679 0.3205 r = ones(l ,51); v = [0 50 0 1.6]; axis(v); k = 0:50; c = filter(num,den,r); plot(k,c,'o') grid title('Respuesta escalon unitario') xlabel('k') ylabel('(c(k)')
-0.1885];
1.6 r----r----,---r--~--~----.----,--~-__r-___,
1.4
1.2
000000000000000000000000000000000000
0 0000 0 0
~
u
10
15
20
25
30
35
40
45
50
Figura 4-49 Grafica de c(kl) en funci6n de kTpara el sistema disei'iado en el problema A-4-8. (Periodo de muestreo T= I seg.)
Problema A-4-9
Considere el sistema que se muestra en la figura 4-50. Deseamos disefiar un controlador digital, de forma que los polos dominantes del sistema en lazo cerrado tengan un factor de amortiguamiento relativ ~ de 0.5. Tambien deseamos que el numero de muestras par cicIo de la oscilaci6n senoidal amortigu sea 8. Suponga que el periodo de muestreo T es 0.2 seg. Utilizando el metoda del lugar geornetrico de las raices en el plano z, determine la funci6n transferencia pulse del controlador digital. Obtenga la respuesta del sistema disefiado en funci6n de entrada escal6n unitario. Tambien obtenga la constante de error de velocidad estatica Kv-
Capitulo 4
269
r (t)
Rizi
C(z)
Glz)
Figura 4-50
Soluci6n Localizaremos en primer terrnino los polos en lazo cerrado deseados en el plano z. Refiriendonos a las ecuaciones (4-1) Y (4-2), para un lugar geomctrico del factor de amortiguamiento relativo con stante, tenemos (4-78)
y
Dado que requerimos de ocho muestras par cicio de Ia oscilacion senoidal amortiguada, el polo dominante en lazo cerrado en la parte superior del plano z debera estar localizado sobre una linea con un angulo de 45 y que pase a traves del origen tal y como se muestra en la figura 4-51. (Note que el numero de muestras por cicio es de 360/8. Por 10 tanto, ocho muestras por cicio requiere que 8 = 360/8 = 45.) Entonces,
/: = 45" = - = 27T4
ta,
7T
Wd
10 que nos da
Wd
so,
~ 8
(4-79)
Por 10 tanto,
Wd
1
gWS
107T
= 3.9270
Al establecer
~=
= e- 0 4 535 = 0.6354
Par 10 tanto, podemos localizar el polo en lazo cerrado deseado en la parte superior del plano z: de la misma manera como se muestra mediante el punta P de la figura 4-51. Observe que en el punto P
Izl!..!..
= 0.6354
! 45" =
0.4493
+ j0.4493
A continuacion, obtenemos la funcion de transfcrencia de pulso C(::) de la planta precedida por un rcten de orden ccro:
270
Diseiio
Capitulo A
Plano z
-0.9356
Re
Cfrculo unitario
Figura 4-51
zC
2(S 1+ 1)]
Podemos ahora localizar los polos en lazo abierto y un cera en el plano z, tal y como se muestra en figura 4-51. Dado que el punto P es la localizaci6n del polo en lazo cerrado deseado, la defici angular en el punto P puede calcularse facilmente, como sigue: -140.79 - 129.43 + 17.97 + 180 = -72.25 La funci6n de transferencia pulso del controlador debera contribuir con 72.25. Escojamos la funci6n de transferencia pulso del contralador como
G (z) = K Z
D
z + f3
+a
Copitulo 4
271
y el cero del controlador a fin de cancelar el polo en z = 0.8187. De ahi se puede deterrninar facilmente el polo del controlador de la condicion de angulo como z = 0.1595. Entonces, tenemos
GD(z)
=K1_
1 - 0.8187z- 1 0.1595z 1
La funcion de transferencia pulso en lazo abierto del sistema se obtiene, por 10 tanto, como sigue:
1 l)z-1 G () () _ 1 - 0.8187z- 0.01873(1 + 0.9356z1 (1 _ z-I)(1 - 0.8187z-l) D Z G z - K 1 _ 0.1595z-
=K
(I - 0.1595z 1)(1 - z I)
K
1
I
z=0.4493+jO.4493
- 1
es decir
K = 13.934
De ahi, hemos deterrninado que la funcion de transferencia pulso del controlador digital es
C(z) R(z)
GD(z)G(z) 1 + GD(z)G(z)
0.26IOz- 1 + 0.2442z- z
1 - 0.8985z
+ 0.4037z
Debido a la cancelacion de un polo en la planta y en el cero del controlador, el orden del sistema ha quedado reducido de tercero a segundo. EI sistema tiene solo un par de polos en lazo cerrado complejos conjugados. La figura 4-52 muestra la secuencia de la respuesta escalon unitario c(kT) en funcion de kT. EI trazo muestra que el sobrepaso maximo es de alrededor de 16.5%. Finalmente, se deterrnina la constante de error de velocidad estatica K; como sigue:
x. = ~~ [ +GD(Z)G(Z)
-I
= hm
. [I -
z~1
I)Z-I]
= 3.005
272
1.6
Capitulo 4
1.4
1.2
1.0
c (kT)
0.8
0.6
0.4
0.2
0.4
0.8
1.2
1.6
2.0
2.4
2.8
3.2
3.6
kT (sec)
Figura 4-52 Grafica de la secuencia de la respuesta escal6n unitario c(kT) en funci6n de kT para el sistema disefiado en el problema A-4-9 Problema A-4-10
Considere el sistema mostrado en la figura 4-53. Suponga que las especificaciones de desempefio estzn dadas en terminos de margen de fase, margen de ganancia, constantes de error de velocidad estatica ~ simi lares. Defina los procedimientos para el disefio de los compensadores de adelanto y de los compensadores de atraso mediante el metodo de respuesta en frecuencia. Solucion Los procedimientos para el disefio de compensadores de adelanto y de los cornpensadores oe atraso pueden definirse como sigue:
COMPENSADOR DE ADELANTO
1+ GD(w) = K D 1
TW aTW
'
O<a<l
La funci6n de transferencia en lazo abierto para el sistema compensado puede escribirse en ia forma
1+ GD(w)G(w) = K D 1
TW
+ arw
G(w)
= 1+
1
TW aTW
Gl(w)
JC
donde CI(W) = KuC(w). Determine la ganancia de K" que satisfaga.el requisito de la constante error de la velocidad estatica dada.
:::apitulo 4
273
G(w)
Figura 4-53
2. Utilizando la ganancia Kf) asi deterrninada, dibuje un diagrama Bode de G,(w), el sistema ajustado por ganancia, pero no compensado. Evalue el margen de fase. 3. Determine el angulo de adelanto de fase necesario 4> a anadirse al sistema. 4. Afiada de 5 ~ 12 a 4> para compensar el corrimiento de la frecuencia de cruce de ganancia. Defina este 4> anadido como 4>m. Determine el factor de atenuaci6n a a partir dela ecuaci6n siguiente:
sen4>m
1- a 1+ a
5. Determine e]Yunto de frecuencia donde la magnitud del sistema no compensado G,(jv) es igual a -20 loge I/ v' a ). Escoja esta frecuencia como la nueva frecuencia de cruce de ganancia. Esta frecuencia corresponde a V m = I/(.,J;;;), ya esta frecuencia se presenta el corrimiento maximo de fase 4>m. 6. Determine las frecuencias de esquina del compensador de adelanto como sigue:
I
v=T
v=aT
7. Verifique el margen de ganancia para asegurarse de que es satisfactorio. De 10contrario. rep ita el proceso de diseno modificando la localizaci6n de los polos y de los ceros del compensador hasta que se obtenga un resultado satisfactorio. La funci6n primordial del compensador de adelanto es proporcionar atenuacion en el rango de altas frecuencias para un margen de fase suficiente para el sistema. Las caracteristicas del atraso de fase no ticnen consecuencias en la compensaci6n mediante atraso.
COMPENSACION DE ATRASO
GD(w)
1 + TW KD 1 + f3 TW
(f3
> 1)
La funcion de transferencia en lazo abierto del sistema compensado puede escribirse como
GD(w)G(w)
1 + TW K n 1 f3 G(w)
TW
1 + TW G 1(w) 1 + f3TW
274
Diseiio
Capitulo 4
donde G1(w) = KnG(w). Determine la ganancia Kf) que satisfaga el requisito de la constante de error de velocidad estatica dada. 2. Si el sistema no compensado G1(w) no satisface las especificaciones referentes a los margenes de fase y de ganancia, entonces encuentre el punta de frecuencia donde el angulo de fase de la funcion de transferencia en lazo abierto sea igual a -180 mas el margen de fase requerido. EI margen de fase requerido es el margen de fase especificado mas 5 a 12. (La adici6n de 5 a 12 compensa el atraso de fase del compensador de atraso.) Escoja esta frecuencia como la nueva frecuencia de cruce de ganancia. 3. A fin de evitar efectos perjudiciales de atraso de fase en raz6n del compensador de atraso, el polo y el cero del compensador de atraso deberan estar localizados bastante mas abajo que la nueva frecuencia de cruce de ganancia. Por 10 tanto, escoja la frecuencia de esquina v = liT (correspondiente al cero del compensador de atraso de fase) una decena por debajo de la nueva frecuencia de cruce. 4. Determine la atenuaci6n necesaria para Ilevar la curva de magnitud hacia abajo hasta 0 dB en la nueva frecuencia de cruce de ganancia. Notando que esta atenuaci6n es -20 log f3, determine d valor de f3. Entonces la otra frecuencia de esquina (que corresponde al polo del compensador de atraso) queda determinada a partir de v = I I( bt).
Precaucion. Una vez disefiado el compensador de atraso en el plano w, Gn(w) debera transformarse el compensador de atraso en el plano z, Gf)(z). Note que el polo y el cero en el compensador de atraso el plano z estan muy cerca uno de otro. (Estan cerca del punta z = I.) Ya que los coeficientes del filtro deben realizar mediante palabras binarias que utilizan un numero limitado de bits, si el nurnero de empleado resulta insuficiente, las localizaciones de polos y ceros del filtro pueden no realizarse tal como se desea, y el compensador resultante podria no comportarse como se espera. Es importante que polo y el cero del compensador de atraso se presenten en un nurnero finito de puntos discretos asignab
Problema A-4-11 Disene un controlador digital para el sistema que se muestra en la figura 4-54. Uti lice el metoda diagrama Bode en el plano w. Las especificaciones de disefio consisten en que el margen de fase debe de 55, el margen de ganancia por 10 menos de 10 dB, y la con stante de error de velocidad estatica de seg:'. El periodo de muestreo se especifica como 0.1 seg, es decir T= 0.1. Una vez disenado el control trace un diagrama del lugar geometrico de las raices. Localice los polos en lazo cerrado del diagrama encuentre el numero de muestras por cicio de la oscilacion senoidal amortiguada. Solucion La transformada de z de la planta precedida por un reten de orden cero es
G(z) =Z [
1 - es
Ts
1
s(s
+ 2)
= (1 - Z-I)Z[S2(S 1+ 2)]
-I
1 + 0.9355z- 1
(1 _ z 1)(1 _ 0.8187z I)
0.004683z
z=
1 + (TwI2) 1 - (TwI2)
1 + 0.05w 1 - 0.05w
Capitulo 4
r (r)
R(z)
275
Figura 4-54
G(w) =
0.004683(1 + 0.05w + 0.9355) 1 - 0.05w 1 + 0.05w _ 1)(1 + 0.05w _ 0.8187) ( 1 - 0.05w 1 - 0.05w 0.5(1 + 0.OO1666w)(1 - 0.05w)
w(1
0.5016w)
EI diagrama Bode de G(jv) aparece en la figura 4-55. Escogeremos ahora la funci6n de transferencia del controlador en la forma
= KD1
1 + rw
1+.!:!::
+ arw
= KD-1
K D = 10
Utilizando una tecnica de disefio convencional, se determina la funcion de transferencia del controlador digital como
GD(w) = 10
~ ( l + ~)
+
1 12.5
GD(W)G(W) = 10
( 1 + ~)
1
w
+ 0.5016w)
+ 12.5
276
40
Capituk:.L
~
20 dB
~
a
""
~
_.... "
....
.)
. .... -~
Go Ilv)
,-- -- -
--
-20
--
r-... r-o."'2.4 dB
~,
'"'1- __
r-,
---
- "'~r--.... ....
r-.. ~ .............
<,
-90 0
0.1 0.4
~~ .--G(jvl
->-
-.;;-~
Gllv)
-J...
-180 0
-2700
'"
"' ...
~
55 0
f' ~
'" '~
10
4 5
---
j,.-
1000
v (rad/s )
Figura 4-55
Esta funci6n de transferencia en lazo abierto da el margen de fase de aproximadamente 55 e ~ margen de ganancia de alrededor de 12.4 dB. La con stante de error de velocidad estatica K; es 5 5e[II Por 10 tanto, se satisfacen todos los requisitos y la funci6n de transferencia del controlador disefi GIJ(w) es satisfactoria. A continuaci6n, transformamos GIJ(w) en GIJ(z). Se debera utilizar la siguiente transformac bilineal
G()=lO
D
1 - 0.2308z
GD(z)G(z)
La figura 4-56 muestra el diagrama del lugar geornetrico de las raices para el sistema. AI usar condici6n de magnitud, encontramos que los polos en lazo cerrado estan localizados en z = 0.5 It> )0.388. En el diagrama del lugar geornetrico de las raices, se superponen los lugares geornetricos de
Capitula 4
277
Re
constante para (= 0.5 Ypara (= 0.6. Se puede ver del diagrama que el factor de amortiguamiento relativo (de los polos en lazo cerradoes de aproximadamente 0.55. La Ifnea que conecta el polo en lazo cerrado en la parte superior del plano z con el origen tiene un angulo de 37. Por 10 tanto, el nurnero de muestras por cicIo de la oscilaci6n senoidal amortiguada es 360/37 = 9.73. Problema A-4-12 Considere el sistema de contral digital mostrado en la figura 4-57, donde la funcion de transferencia de la planta es Iii. Diseiie un contralador digital en el plano w, tal que el margen de fase sea de 50 y el margen de ganancia sea de por 10 menos 10 dB. EI periodo de muestreo es 0.1 seg, es decir T = 0.1. Despues de diseiiar el controlador, obtenga la constante de error de velocidad estatica K". Tarnbien, obtenga la respuesta del sistema diseiiado ante una entrada escal6n unitario. Soluci6n Primero obtendremos la transformada z precedida por un reten de orden cero:
G(z) =Z
(1 - Z-l)Z
[1] :?
T 2(1 +
Z-I)Z-l
= (1 -
z ) 2(1 _ z 1)3
Z-I)Z-I
0.005(1 +
O.005(z + 1)
(1 - z ')2
A continuacion, utilizando la transformaci6n bilineal dada por
(z - 1)2
z=
278
r(t)
Diseiio
Capitulo 4
Go(z)
R(z) C(z)
Figura 4-57
G(w) =
Por 10 tanto,
1 - 0.05w
w2
. ) G( JV
1 - 0.05jv (jV)2
La figura 4-58 muestra el diagrama Bode de G(jv) que se obtiene de esta manera. Observe que el margen de fase es -12. Sera necesario afiadir una red de adelanto para conseguir el margen de fase y el margen
40
r-,
20
dB
~r-,
......
r-,
......
r-, ~
r--.~'V'(jVIG(jv) I
-20
I GliV){
r-.r-,
'\~
~
t'--
........ ......
i
..... 13 dB
i"'-...I',
" ~ -,
r-......
r-..... ......
a'
-,
r--................
Go IjvlGljv)
1""-. . r-.............~
50.62'
r-......
..........
1""'-- .....
-180'
-" r--.
......
r-. ...............
<,
Gltl
-270' 01
0.4
r-- r-
--. ~
)
i'-.....
1""'-- .....
~
100 1000
10
v [rad/s
40
Figura 4-58
278
r(t)
Capitulc.
e(t)
Go(z)
R(z)
C(z)
Figura 4-57
1 + 0.05w _ 1 1 - 0.05w
)2
1 - 0.05w
w2
. ) G( tv
1 - 0.05jll (j1l)2
La figura 4-58 muestra el diagrama Bode de Gijv) que se obtiene de esta manera. Observe que el margea de fase es _12 Sera necesario anadir una red de adelanto para conseguir el margen de fase y el rnargea
40
<,
20
dB
~r-,
......
......
"
-20
rJ
r-.... .....
+
13 d8
<,
......
~r-. <,
.......... .......
-,
0"
r-,-,
.....
"'-
<,
-90'
GD (jvIG(jvl
-180"
-Gliv)
I""i'~~
50.62"
r-...... t'--.r--,
i"'--
""
-270" 01 0.4 4
10 v Irad/s )
--r--~e-, 40
...... .....i"......
..... ~ ...............
t'--.r--,
100
1000
Figura 4-58
Capitulo 4
279
de ganancia requeridos. Mediante la aplicaci6n de una tecnica convencional de diseno, puede verse que la red de adelanto siguiente satisface los requisitos:
GD(w) = 4 1
+ (w/16)
l+w
= 64 w
(W+1) + 16
La adici6n de esta red de adelanto modi fica el diagrama Bode. La frecuencia de cruce de ganancia se recorre a v = 4. Note que el adelanto de fase maximo cPm que puede producir esta red de adelanto es 61.93, ya que
cPm
l-
+16
It
Ala frecuencia de cruce de ganancia v = 4, el angulo de fase de GJjv)G(jv) se convierte en -191.31 0 + 61.93 = 129.38. Par 10tanto, el margen de fase es 50.62. El margen de ganancia se determina aproximadamente en 12 dB. Por 10 tanto, se satisfacen las especificaciones de disefio dadas. Ahora transformamos la funci6n de transferencia del controlador GD(w) en GD(z). Mediante la transformacion bilineal
2 1 2 1 1) w=rz+1=D.Iz+1=20 z+l
obtenemos
z-
z-
(z -
20(Z GD(z)
= 64
z+ 1 ( _)
~1 z+
1) + 1
= 37.333
+ 16
20
1 x. = ~~ [ +GD(Z)G(Z)
-I
= lim [1 z~1
Z-I 0.1867(1 - 0.9048z- ' )(1 + Z-I)Z-I] 0.1 (1 - O.1111z 1)(1 - z '?
= 00
Por 10 tanto, la constante de error de velocidad estatica K; es infinita. No existe error en el estado permanente en la respuesta rampa. La funcion de transferencia pulso en lazo cerrado del sistema es
0.1689z- 3 3 - 0.2800z-
La figura 4-59 muestra la respuesta escalon unitario. Note que el cero del controlador digital de z = 0.9048 esta cerca del polo doble en z = 1. Un par polo-cero cerca del punta z = 1 genera una cola larga de pequefia amplitud en la respuesta.
280
1.6
Diseiio
Capitulo L
1.4
1.2 1.0
e(kT) 0.8
4
o
Figura 4-59
0.2
0.4
0.6
0.8
1.0
1.2
kT (5
1.4
1.6
1.8
2.0
2.2
2.4
Problema A-4-13 Considere el sistema de control digital mostrado en la figura 4-60. La funci6n de transferencia de a planta incluye un atraso de transporte ". EI tiempo de atraso es 5 seg, es decir L = 5. La salida deseaaa e(t) en respuesta a una entrada escal6n unitario es como se muestra en la figura 4-61 a). La curva se eleva desde cero hasta su valor final en 10 seg (medido desde t = 5 hasta t = 15). Y no existe ni sobrepaso rn error en estado permanente. EI tiempo de asentamiento es de 15 seg (medido desde t = 0 hasta t = 15). Soc requiere que no existan componentes oscilatorias entre muestras en la salida despues de haber alcanzaoo el tiempo de asentamiento. Disefie un controlador digital G/)(z).
Solucion Seleccionemos el periodo de muestreo como de 5 seg, es decir T= 5. (Podernos, naturalmer-te, elegir el periodo de muestreo como de 2.5 seg, I seg u otro valor. En este ejernplo, sin embargo, para simplificar nuestra presentacion, hemos definido el periodo de muestreo en 5 seg.)
ret)
R(z)
u(kT)
eft) C(z)
Go(z) G(z)
Figura 4-60
:apitulo 4
281
h[1 - e- O.lI t
- 51]
1.5
~---r----------'-c------
---5
6
30
1(5
1.0
t------t------:~~--------
0.5
o o
5
2
10
3
15
(I)
"
20
k
)
25
U(I)
1.5820 ~----_
1.0
10
15
(b)
20
25
30
1(5
b)
Figura 4-61 a) Salida deseada cIt) en respuesta a una entrada escalon unitario; Grafica de u(t) en funcion de I.
G(z)
= (1 -
l Z-1)Z-
1 Z C (lO + l)J S
O.3935z- z 1 - O.6065z
Note que no existe ningun polo inestable 0 criticamente estable en G(z). Por 10 tanto, en este caso no hay problema de estabilidad. Definamos la funcion de transferencia pulso en lazo cerrado como F(z):
(4-80)
En el caso presente, la salida c(t) en la respuesta escalon unitario se define tal y como se muestra en la figura 4-61 a). En vista que h[1 - e--0 1( 15 -5)] = h(1 - e- I ) = 1 tenemos que h = 1.5820. A partir de la curva de respuesta con oscilaciones muertas que se muestra en la figura 4-6Ia) obtenemos
c(O) = 0
c(l)
282
Capitulo .4
c(2)
c(k)
= h(l - e- O S )
= 1,
= 3,4,5, ...
de 10 cual obtenemos
C(z)
Si se observa que
C( Z ) = F ()R (z ) z
obtenemos
2 1 -z
1 - F(z) = (1 - z-1)N(z)
es decir
GD (Z )
_
-
~'~:5Z
2
1
(1 - z-1)(1
+ Z-1 + 0.3775z- 2)
2 3 U(z) = C(z) = 0.6225z- + 0.3775z = 1.5820(1 - 0.367~Z-2) 2G(z) (1 _ Z-1) 0.3935z 1- z 1 - 0.6065z 1 = 1.5820 + 1.5820z- 1 + Z-2 + Z-3 + Z-4 + ...
Capitulo 4
283
AI tomar la transformada z inversa de U(z), encontramos que u(k) es constante para k ~ 2. Por 10 tanto, no existen componentes oscilatorias entre muestras en la salida una vez que se ha alcanzado el tiempo de asentamiento. La senal u(t) en funci6n de t aparece graficada en la figura 4-61b).
Problema A-4-14 Considere el sistema de control digital que se muestra en la figura 4-62. Disene un controlador digital GD(z) tal que el sistema en lazo cerrado exhiba el tiempo de asentamiento minima con un error en estado permanente cero en una respuesta rampa unitaria. EI sistema no podra tener componentes oscilatorias entre muestras en estado permanente. EI periodo de muestreo T se supone de 1 seg. Despues de disenar el controlador, investigue la respuesta del sistema a una entrada delta de Kronecker y a una entrada esca16n unitario. Soluci6n EI primer paso en el diseno sera determinar la transformada z de la planta que esta antecedida por un reten de orden cero:
G(z) =
z[ 1 =
rs
se-
~] = (1 - Z-I)Z[~]
C(z) R(z)
GD(z)G(z)
= F(z)
1 + GD(z)G(z)
Observe que si G(z) se expande a una serie en Z-I entonces el primer terrnino sera 0.5 de Z-I. Por 10 tanto,
F(z) debe de empezar con un termino en Z-I: F(z) = alz- I + a2z-2 + ... + aNz- N
donde N ~ n siendo n el orden del sistema. Dado que el sistema aqui es de segundo orden, n = 2. En vista de que la entrada es una rampa unitaria, de la ecuaci6n (4-48) requerimos que (4-81) Note que G(z) tiene un polo doble criticamente estable en z = 1. Por 10 tanto, desde el punto de vista del requisito de estabilidad, I - F(z) debera tener un cero doble en z = 1. Sin embargo, 1 - F(z) ya implica un termino (I - Z-I)2, satisfaciendo por 10 tanto el requisito de estabilidad. Dado que el sistema no debe mostrar componentes oscilatorias entre muestras en el estado permanente, requerimos que U(z) sea del tipo siguiente de la serie en Z-I:
r(t) R(z)
Controlador digrtal
u(kT)
VIz)
e(t) C(z)
G(z)
284
Capituc
Dado que la funci6n de transferencia de la planta Gp(s) incluye un doble integrador, b debe ser cero. I 10 contrario, la salida aumentara en forma parabolica, en vez de linealmente.) En consecuencia. teo mos
U(z) = b
b, Z-I
+ ... +
bN -
I Z-N+I
G~)
- F(z) -:-:---'--....,..,.-:; (1 - z I? (1 +
2 = F(z) 1 + Z-1
Z-I)2 --'------'~
2(1 -
Z-I)Z-1
Para que U(z) sea una serie en Z-I con un numero finito de terrninos, F(z) debe ser divisible entre 1 -
U(z) = 2F;(z)
donde Fl(z) es un polinomio en Z-l con un numero finito de terrninos. Al comparar las ecuaciones (4-81) y (4-82) y mediante un simple analisis, vemos que Fi: incluir un termino con por 10 menos z-J. Por 10 tanto, suponemos
F(z)
alz-1 + a2z-2 + a3 z- 3
Esta forma supuesta de F(z) involucra s610 el numero minimo de terrninos, la respuesta transiton asentara en tres periodos de muestreo. Determinaremos ahara las constantes ai' a2 Y a-. De la ecuaci6n (4-81) tenemos
1 - al Z-I
a2z-2 - a3z-3
(1 -
Z-I?
N(z)
Si dividimos el primer miembro de esta ultima ecuaci6n entre (1 - Z-I)2, el cociente es 1 + (2 - a cresiduo es [2(2 - a l) - (1 + a2)][2 - [(2 - a l) + a 3]z-J. De ahi, se determina N(z) en la forma
N(z) = 1 + (2 - al)z-I
y el residuo se iguala a cero:
al z- 1 + a2 z- 2 + a3z-3 = (1 + z-I)FI(z)
Si dividimos el primer miembro de esta ultima ecuaci6n entre 1 + Z-I, el cociente es a1z- + (a2 - a residuo es (al - a2 + a3)z-J. Por 10tanto,
1 c
:::apitula 4
285
Y G], obtenemos
= 1.25,
GZ
= 0.5,
G3
= -0.75
Por 10 tanto.
0.75z- z
+ z-l)(l - 0.6z- 1)
GD(z)
= G(z)(1
2(1 _
(1 - z
(1 + 0.75z
-I
C(z) = F(z)R(z)
= (1.25z1
+ 0.5z- z -
Z-I
0.75z-
(1 _
Z-I)Z
c(O) = 0
c(l) = 0
c(2)
=
1.25
k=3,4,5, ...
c(k)=k,
Observe que de la ecuaci6n (4-83) tenemos
U(z)
= =
2F1(z)
= 2.5z- 1
1.5z- z
Por 10 tanto. la serial de control U(k) se convierte en cero para k ~ 3. Consecuentemente, no habra componentes oscilatorias entre muestras en la respuesta en estado perrnanente. La figura 4-63 muestra las graficas de c(k) en funcion de k. lI(k) en funcion de k y 1I(t) en funcion de I en la respuesta rampa unitaria.
286
elk)
Copitoc
4
3 2
u(k)
4
2
0
-2
-4
u(t)
-2 -4
Figura 4-63 Graficas de c(k) en funcion de k, u(k) en fune k y u(t) en funcion de ten la respuesta rampa unitaria del si disenado en el problema A-4-14.
A continuacion, investiguemos la respuesta de este sistema a una entrada delta de Kronec una entrada escalon unitario. En el caso de una entrada delta de Kronecker
C(z)
0.75z- 3
R(z) 1.25z- I(1 + z-I)(1 - 0.6z- l ) U(z) = F(z) G(z) = (1 + z I)Z 1/[2(1 - z 1)2]
1.5z- 3
La sefial de control u(k) se convierte en cero para k ~ 4. Por 10tanto, no habra componentes osci entre muestras despues de t ~ 4T= 4.
Capitulo 4
287
F(z)R(z)
(1.25z- 1
+ O.5z- z
O.75z-3)~
1- z
2(1 - z
'?
La senal de control u(k) se convierte en cero para k ~ 3. En consecuencia, no habran componentes oscilatorias entre muestras despues de que se ha alcanzado el tiempo de asentamiento. En la figura 4-64a) se muestran las graficas de c(k) en funci6n de k, u(k) en funci6n de k y u(t) en funci6n de t en respuesta a la entrada delta de Kronecker. La figura 4-64b) muestran graficas similares para la respuesta escal6n unitario. Note que cuando el sistema se ha disenado para la entrada rampa la respuesta a una entrada escal6n ya no es oscilatoria.
elk) e(k)
2
3
4 5
k
u(t) u(t)
5
0
5
0
t (s
t (s )
-5
-5
a)
b)
Graficas de elk) en funci6n de k, u(k) en funcion de k y u(/) en funcion de I en la respuesta a una entrada delta de Kronecker del sistema disenado en el problema A-4-14; b) Graficas de elk) en funcion de k, u(k) en funci6n de k y u(t) en funcion de ten la respuesta escalon unitario para el mismo sistema.
Figura 4-64
a)
288
Capit
PROBLEMAS
Problema 8-4-1 Considere las regiones en el plano s que se muestran en las figuras 4-65a) y b). Dibuje las regie correspondientes en el plano z. El periodo de muestreo Tse supone de 0.3 seg. (La frecuencia de muesc es w, = 271"/T= 271"/0.3 = 20.9 rad/seg.)
Plano 5
tr (rad/seg)
(a)
o
-j7
I
I
I
I
I
I
I
0=-4.5
0=-1
jw
Plano 5
j7 (rad/seg)
(b)
o
/
/ 30
0=-4.5
I
Figura 4-65 a) Region en el plano s limitada lineas de w constantes ylineas de a constantes: r~ regionen el plano s limitadas por lineas de ~ constantes, lineas de w constantes y una linea de constante.
Determine si cualquiera de las raices de la ecuacion caracteristica estan centro en el rigen del plano z. Problema 8-4-3 Determine la estabilidad del siguiente sistema en tiempo discreto:
Y(z)
Z-3
X(z)
1 + 0.5z-
1.34z
+ 0.24z
Problema 8-4-4 Considere el sistema de control en tiempo discreto en lazo cerrado mostrado en la figura 4-13. Dete el intervalo de la ganancia K para estabilidad mediante el uso del criterio de estabilidad de Jury.
Capitulo 4
Problemas
289
Problema 8-4-5 Resuelva el problema 8-4-4 utilizando la transformaci6n bilineal junto con el criterio de estabilidad de Routh. Problema 8-4-6 Considere el sistema
fx(k)1
M 1 = constante,
siendo k = 0, 1, 2, ...
Demuestre que, si todos los polos de G(z) estan dentro del circulo unitario en el plano z, entonces la salida
y(k) tambien es acotada; esto es.
[v(k)/
M 2 = constante,
siendo k = 0, I, 2, ...
Problema 8-4-7 Enuncie las condiciones de estabilidad, inestabilidad y estabilidad critica en terminos de la secuencia de ponderaci6n g(kT) de un sistema de control en tiempo discreto lineal e invariante con el tiempo. Problema 8-4-8 Considere el sistema de control digital que se muestra en la figura 4-66. Trace los lugares geornetricos de las raices con forme se varia la ganancia K desde 0 hasta oc Determine el valor critico de la ganancia K para estabilidad. EI periodo de muestreo es de 0.1 seg, es decir T= 0.1. (,Que valor de la ganancia K dara un factor de amortiguamiento relativo ( de los polos en lazo cerrado igual a 0.5? Con la ganancia K definida para obtener (= 0.5, determine la frecuencia natural amortiguada w" y el nurnero de muestras por cicio de la oscilaci6n senoidal amortiguada.
R(z)
K(z
+ 1)
0.6065)
C(z)
(z - 11(z -
Problema 8-4-9 Refiriendonos al sistema de control digital mostrado en la figura 4-67. disene un controlador digital G/)(z) tal que el factor de amortiguamiento relativo (de los polos dominantes en lazo eerrado sea 0.5 yel numero de muestras por cicIo de la oscilaci6n senoidal amortiguada sea 8. Suponga que el periodo de rnuestreo es de 0.1 seg es decir T = 0.1. Determine la constante de error de velocidad estatica. Tambien, determine la respuesta del sistema disenado a una entrada escal6n unitario. Problema 8-4-10 Considere el sistema de control rnostrado en la figura 4-68. Disene un controlador digital adecuado que incluya una acci6n de control integral. Las especificaciones de diseno son que el factor de amortiguamiento relativo (de los polos dominantes en lazo cerrado sea 0.5 y que existan por 10 rnenos 8 rnuestras por ciclo
290
r(t)
Diseiio
Capitulo 4
Go(z)
R(z) C(z)
G(s)
Figura 4-67
r(t) R(z)
G(s)
Figura 4-68
de la oscilaci6n senoidal arnortiguada. El periodo de muestreo se supone de 0.2 seg es decir T= 0.2. Una vez disefiado el controlador digital, determine la constante de error de velocidad estatica K;
Problema 8-4-11 Considere el sistema de control digital mostrado en la figura 4-69, donde la planta es de primer orden y tiene un tiempo muerto de 5 seg. Seleccionando un periodo de muestreo razonable T, disefie un controlador digital PI tal que los polos dominantes en lazo cerrado tengan un factor de amortiguamiento relativo ~ de 0.5 y el numero de muestras por cicio de la oscilaci6n senoidal amortiguada sea 10. Despues de disenar el controlador, determine la respuesta del sistema a una entrada escal6n unitario.
r(t) R(z) cIt) C(z)
Controlador PI digital
G(s)
Figura 4-69
Problema 8-4-12 Disene un controlador proporcional y derivativo digital para la planta cuya funci6n de transferencia es 11 S2 tal y como se muestra en la figura 4-70. Se desea que el factor de amortiguamiento relativo ~ de los polos dominantes en lazo cerrado sea de 0.5 y la frecuencia natural no arnortiguada sea 4 rad/seg. EI periodo de muestreo es 0.1 seg, es decir T= 0.1. Despues de disenar el controlador, determine el numero de muestras por ciclo de la oscilaci6n senoidal amortiguada.
:::apitula 4
Problemas
291
r(t)
R(z)
Controlador PO digital
cIt)
C(zl
G(s)
Figura 4-70
Problema B-4-13 Al hacer referencia al sistema considerado en el problema A-4-9, rcdisene el controlador digital de tal forma que la constante de error de veloeidad estatica K" sea 12 seg', sin cambiar en forma apreciable las posiciones de los polos dominantes en lazo cerrado en el plano 2. EI periodo de muestreo se supone de 0.2 seg 0 T = 0.2. Una vez redisefiado el controlador, obtenga la respuesta escal6n unitario y la respuesta rampa unitaria del sistema de control digital. Problema B-4-14 Considere el sistema de control digital mostrado en la figura 4-71. Dibuje un diagrama Bode en el plano w. Defina la ganancia K de tal manera que el margen de fase sea igual a 50. Con la ganancia K definida de esta forma, determine cl margen de ganancia y la constante de error de velocidad estatica K,.. Se supone que el periodo de muestreo es de 0.1 seg, es decir T = 0.1.
r(t)
c Itl
sis + 101
G(s)
Figura 4-71
Problema B-4-15 Utilizando el metoda del diagrama Bode en el plano w, disene un controlador digital para el sistema mostrado en la figura 4-72. Las espccificaciones de diseno consisten en que el margen de fasc sea de 50. el margen de ganancia de por 10 menos 10 dB, y la constante de error de velocidad estatica K" sea de 20 seg'. EI periodo de muestreo se supone de 0.1 scg, es decir T = 0.1. Una vez disenado el controlador. caleule el numero de muestras por cicio de la oseilaci6n senoidal amortiguada.
r(t)
cltl
Glsi
Figura 4-72
292
Disefio
Copituc
Problema 8-4-16 Considere el sistema de control digital de la figura 4-73. Al usar el metodo del diagrama de Bode en d plano w, disene un controlador digital de tal forma que el margen de fase sea de 60 0 , el margen de ganancia de 12 dB 0 mas, y la constante de error de velocidad estatica de 5 seg'. EI perfodo de muestreo se supone de 0.1 seg, es decir T = O. I.
r It)
Go Izi
5
(s
c (t)
+ 1)ls + 2)
Gis)
Figura 4-73
Problema 8-4-17 Considere el sistema mostrado en la figura 4-74. Disefie un controlador digital utilizando un diagra Bode en el plano w de tal forma que el margen de fase sea de 500 y el margen de ganancia de por 10 me 10 dB. Se desea que la constante de error de velocidad estatica K" sea de 10 seg'. EI periodo de muesu esta especificado como 0.1 seg, es decir T = 0.1. Una vez disefiado el controlador, determine el nurne de muestras por cicio de la oscilacion senoidal amortiguada.
r (r)
sis KI2s + 11 + 1)(0.2s + 11
cit)
Gisl
Figura 4-74
Problema 8-4-18 Considere el sistema de control digital mostrado en la figura 4-75. Disefie un controlador digital GJ)(::1 que la salida del sistema tenga una respuesta con oscilaciones rnuertas a una entrada escalon unit (esto es, el tiernpo de asentamiento sera el minimo posible y el error en estado permanente sera c tambien, la salida del sistema no mostrara componentes oscilatorios entre muestras una vez alcanzado tiempo de asentamiento). EI perfodo de muestreo T se supone de 1 seg, es decir T = 1.
r It)
Controlador digital
u(kT)
cit)
Figura 4-75
5
Ana/isis en el espacio deestado
i-'
INTRODUCCION
En los capitulos 3 y 4 nos ocupamos de los metodos convencionales para el analisis y el disefio de los sistemas de control. Metodos convencionales como los dellugar geometrico de las raices y los de respuesta en frecuencia, son utiles para los casos de sistemas con una entrada y una salida. Los metodos convencionales son conceptualmente sencillos y nada mas requieren de un nurnero razonable de calculos, pero s610 son aplicables a sistemas lineales invariantes en el tiempo con una entrada y una salida. Se basan en la relacion entrada-salida del sistema, es decir, en la funcion de transferencia 0 la funcion de transferencia pulso. No se aplican a sistemas no lineales, excepto en casos simples. Asimismo, los metodos convencionales no son aplicables al disefio de sistemas de control optimo y adaptable, mismos que son, en su mayor parte, variantes en el tiempo y/o no lineales. Un sistema de control modemo puede tener muchas entradas y muchas salidas, y estas estan interrelacionadas de una manera complicada. Los metodos en el espacio de estado para el analisis y la sintesis de sistemas de control son mas adecuados para tratar con sistemas con varias entradas y varias salidas que se requiere que sean 6ptimos en algun sentido.
Concepto del metoda en el espacio de estado. Este metodo se basa en la descripcion del sistema en terminos de n ecuaciones en diferencias 0 diferenciales de primer orden, que pueden combinarse en una ecuacion matricial en diferencias 0 diferencial de primer orden. La utilizacion de la notacion matricial simplifica en gran medida la representaci6n rnatematica de los sistemas de ecuaciones. El disefio del sistema mediante el uso del concepto de espacio de estado permite al ingeniero disefiar sistemas de control con respecto a indices de desempefio dados. Ademas, el disefio en el espacio de estado se puede realizar para toda una clase de entradas, en lugar de una funcion de entrada especifica como la funcion impulso, la funcion escalon 0 la funcion senoidal. Asimismo, los
293
294
Capitulo 5
metodos en el espacio de estado penniten al ingeniero incluir condiciones iniciales dentro del diseno. Esta es una caracteristica muy importante, que no tienen los metodos de disefio convencional. A continuacion definiremos primero 10 que es estado, variable de estado, vector de estado y espacio de estado, y luego presentaremos las ecuaciones en el espacio de estado.
Estado. EI estado de un sistema dinamico es el conjunto mas pequefto de variables (Ilamadas variables de estado) tales que el conocimiento de dichas variables en t = to, junto con el conocimiento de la entrada para t ~ to, detenninan por completo el comportamiento del sistema para cualquier tiempo t ~ to. EI concepto de estado de ninguna manera esta limitado a sistemas fisicos; tambien se aplica en sistemas biologicos, sistemas econornicos, sistemas sociales y otros.
Variables de estado. Las variables de estado de un sistema dinarnico son las que conforman el conjunto mas pequefio de variables que detenninan el estado del sistema dinamico. Si para describir en su totalidad el comportamiento de un sistema dinamico se requiere de por 10 men os n variables XI' X 2, . . . ,XII (de tal forma que una vez dada la entrada para t ~ toYel estado inicial en t = to, el estado futuro del sistema queda completamente detenninado), entonces dichas n variables se consideran un conjunto de variables de estado. Observe que las variables de estado no necesitan ser cantidades fisicamente medibles u observables. Aquellas variables que no representan cantidades fisicas y aquellas que no se pueden medir ni observar, se pueden seleccionar como variables de estado. Esta libertad en la seleccion de variables de estado es una ventaja de los metodos en el espacio de estado. Sin embargo, en la practica, 10 conveniente es seleccionar cantidades facilmente medibles como variables de estado, si esto fuera posible, ya que las leyes de control optirno requeriran la retroalirnentacion de todas las variables de estado, con una adecuada ponderacion. Vector de estado. Si se necesitan n variables de estado para describir completamente el comportamiento de un sistema dado, entonces estas n variables de estado se pueden considerar como los n componentes de un vector x. Dicho vector se conoce como vector de estado. Un vector de estado es, por tanto, un vector que detennina en forma (mica el estado x(t) del sistema para cualquier tiempo t ~ to, una vez dado el estado en t = to Y especificada la entrada u(t) para t ~ to. Espacio de estado. EI espacio de n dimensiones cuyos ejes coordenados estan formados por el eje XI' eje X 2, , eje XII se conoce como espacio de estado. Cualquier estado puede representarse por un punto dentro del espacio de estado. Ecuaciones en el espacio de estado. En el anal isis en el espacio de estado se tratara con tres tipos de variables que estan involucradas en el modelado de sistemas dinamicos: las variables de entrada, las de salida y las de estado. Como se vera en la seccion 5-2, la representacion en el espacio de estado para un sistema dado no es (mica, con la excepcion de que el nurnero de variables de estado es el mismo para cualquiera de las distintas representaciones en el espacio de estado del misrno sistema. Para sistemas (lineales 0 no lineales) de tiempo discreto variantes en el tiempo, la ecuacion de estado se puede escribir como
x(k + 1)
y la ecuacion de salida como
f[x(k),u(k),k]
Secci6n 51
Introducci6n
295
y(k)
ecuacion de salida se pueden simplificar a
= g[x(k),u(k),k]
Para los sistemas lineales de tiempo discreto variantes en el tiempo, la ecuacion de estado y la
x(k) = vector n y(k) = vector m u(k) = vector r G(k) = matriz n H(k) = matriz n
C(k)
=
matriz m x n
x
D(k) = matriz m
La presencia de la variable k en los argumentos de las matrices G(k), H(k), C(k) y D(k) implica que estas matrices varian con el tiempo. Si la variable k no aparece en forma explicita en estas matrices, se supone que son invariables en el tiempo, es decir, constantes. Esto es, si el sistema es invariante en el tiempo, entonces las dos ultimas ecuaciones se pueden simplificar a
(5-1) (5-2)
= Cx(k) + Du(k)
AI igual que en el caso del tiempo discreto, los sistemas de tiempo continuo (lineal 0 no lineal) se pueden representar mediante la siguiente ecuacion de estado y la siguiente ecuacion de salida:
x(t)
yet)
= f[x(t), u(t), t]
=
g[x(t), u(t), t]
Para sistemas lineales de tiempo continuo variantes en el tiempo, las ecuaciones de estado y de salida estan dadas por
x(t) yet)
= C(t)x(t) + = Ax(t) +
=
x(t)
yet)
Bu(t)
(5-3) (5-4)
Cx(t) + Du(t)
En la figura 5-la) se muestra la representacion en diagrama de bloques del sistema de control en tiempo discreto definido por las ecuaciones' (5-1) y (5-2), y la figura 5-1 b) muestra el sistema de control en tiempo continuo definido por las ecuaciones (5-3) y (5-4). Observe que las configuraciones basicas de los sistemas en tiempo discreto y en tiempo continuo son las mismas.
296
Capitulo .5
u(k)
x(k)
y(k)
(a)
utr)
x(t)
y(r)
(b)
Figura 5-1 a) Diagrama de bloques de un sistema de control lineal en tiempo discreto invariante en el tiempo representado en el espacio de estado; b) diagrama de bloques de un sistema de control lineal en tiempo continuo invariame en el tiempo represent ado en el espacio de estado.
Observe que en este libro u(k) [0 bien u(t)] denota tanto el vector de entrada a un sistema co el vector de control (entrada de control a una planta). Por tanto, u(k) [0 u(t)] se interpreta ya como el vector de entrada 0 como el vector de control, de acuerdo con las circunstancias.
Reseiia del capitulo. La secci6n 5-1 present6 una introducci6n del metodo en el espacio estado y defini6 algunos terminos basicos. La secci6n 5-2 se ocupa de varias representaciones en espacio de estado de sistemas lineales de tiempo discreto invariantes en el tiempo. La secci6n 5primero obtiene la soluci6n de la ecuaci6n de estado lineal de tiempo discreto invariante en el tie mediante el procedimiento de recursi6n y el metoda de la transformada z. Posteriormente pre un metodo para calcular (zI - Gt\ y concluye con un analisis para la soluci6n de la ecuaci6n estado lineal de tiempo discreto invariante en el tiempo. La secci6n 5-4 se ocupa de la matriz de funci6n de transferencia pulso. La secci6n 5-5 en principio trata la discretizaci6n de las ecuacio en el espacio de estado lineal de tiempo continuo y luego analiza la respuesta en tiempo entre
:~::
::05-2
297
- ;:...ntes de muestreo consecutivos. La seccion final, seccion 5-6, presenta el analisis de estabilidad ::: ., .apunov, Empieza con la discusion de la funcion de Liapunov y las definiciones de estabilidad :: s.stemas dinamicos. Asimismo, presenta el teorema principal de estabilidad de Liapunov, seguido :': - 'us aplicaciones al analisis de estabilidad de sistemas lineales de tiempo continuo y de tiempo : -; ~"to.
Formas canonicas para ecuaciones en el espacio de estado en tiempo discreto. Existen ;- __ ~as tecnicas para obtener representaciones en el espacio de estado correspondientes a sistemas =-- : ernpo discreto. Considere el sistema en tiempo discreto descrito por
= bou(k) +
(5-5)
:.. -:" lI(k) es la entrada e y(k) es la salida del sistema en el instante de muestreo k. Observe que
.L,= _- os de los coeficientes a,(i = 1,2, ... , n) y h/} = 0, 1,2, ... ,n) pueden ser cero. La ecuacion - se puede escribir en la forma de la funcion de transferencia pulso como Y(z) bo + blz 1 + ... + bnz- n U(z) = 1 + alz 1+ '" + anz n (5-6)
Y(z) U(z)
~ xisten
IIILl ::II::;
+ bn + an
(5-7)
muchas formas de I1evar a cabo representaciones en el espacio de estado para el siste.iempo discreto descrito por las ecuaciones (5-5), (5-6) 0 (5-7). Aqui se presentan las siguien-
-: '
lIE :
-=~
que se refiere al significado de los terminos controlable y observable, yea las secciones 6-2 .,,:-:: La forma canonica controlable se puede obtener con el metodo de programacion directa. (Vea . :7:::- lema A-5-1.) La forma canonica observable se puede obtener a partir del metoda de progra. : -: anidada. (Vea el problema A-5-2.) La forma canonica diagonal y la forma can6nica de Jordan . ' d , " obtener utilizando el metodo de expansion en fracciones parciales. (Vea los problemas A~;. -\-5-4.)
~ ~;;to
Forma canonica controlable La representaci6n en el espacio de estado del sistema en tiemobtenida de las ecuaciones (5-5), (5-6) 0 (5-7) se puede expresar en la forma dada por las ::1es siguientes:
298
Capftulc
xI(k + xz(k+l)
1)] [0
0
o o
o
1
[ Xn-I(~ + 1) = xn(k + 1)
~
-an
(5-9~
Las ecuaciones (5-8) y (5-9) son las ecuaciones de estado y salida, respectivamente. La represen ci6n en el espacio de estado dada par las ecuaciones (5-8) y (5-9) se conoce cornunrnente co forma canonica contralable. [Para la deducci6n de las ecuaciones (5-8) y (5-9) vea el problema. 5-1.] Observe que si se invierte el orden de las variables de estado, es decir, si se define nuev variables de estado, de acuerdo con la forma
xz~k)
xn(k)
XI(k )]
=
[0 0
~ ~
0 1][XI(k)]
~ ~ xz~k)
1 0
0 0 xn(k)
[-a l 1 0
"
<a: 0 1
. . .
-an-I
.. "
0 0 ...
o o
1
o xz(k) -an][XI(k)]
~ X3~k)
[1] +
0 0
~ u(k)
(5-1
xn(k)
(5-]
Forma canonica observable. La representaci6n en el espacio de estado del sistema en ti po discreto dada por las ecuaciones (5-5), (5-6) 0 (5-7) se puede expresar en la forma siguiente:
o o o
0 1 0 0 0
o o
0 0
(5-
1 0 o 1
Se<cion 5-2
299
(5-13)
"
_-" o;:::,resentaci6n en el espacio de estado dada por las ecuaciones (5-12) y (5-13) se conoce como l o canonica observable. [Para la deducci6n de las ecuaciones (5-12) y (5-13), vea el problema ~ --: -=] Observe que la matriz de estado de n x n de la ecuaci6n de estado dada por la ecuaci6n (5.=. ;:, la transpuesta de la matriz correspondiente de la ecuaci6n de estado definida por la ecuaci6n
C'
[xn(k)
-.. ..
0 1 0
'"
l][Xl(k)] X2( k )
. .
xn(k)
..
1 0
0 0
+ 1) ] x2(k + 1)
xl(k
xn-l(i + 1)
xn(k + 1)
-a) -a2
1 0 0 1
(5- 14)
-an-) 0 0 -an 0 0
(5- I5)
=~ .aciones
Forma canonica diagonal. Si los polos de la funci6n de transferencia pulso dados por las (5-5), (5-6) 0 (5-7) son todos distintos, entonces la representaci6n en el espacio de estado x : .iede expresar en la forma can6nica diagonal como sigue:
(5-16)
300
Capitulo 5
(5-17)
[Para las correspondientes deducciones de las ecuaciones (5-16) y (5-17), yea el problema A-5-3.]
Forma canonica de Jordan. Si la funci6n de transferencia pulso dada por las ecuaciones (5-5), (5-6) 0 (5-7) incluye un polo multiple del orden m en z = PI Y todos los demas polos son distintos, entonces la ecuaci6n de estado y la ecuaci6n de salida se pueden expresar como sigue:
xI(k + 1) x2(k + 1) xm(k + 1)
------------
PI 1 0 o PI 1
0: 0 o" 0 I
PI: 0
: I I
I
0 0 0 0
Pn
0 0
0 0 0 0 0 0
0 0 0
I I I
xm+l(k + 1)
I -----------------,-------------
1 1 1
u(k)
(5-18)
o :Pm+l
0:I 0
x.I]: + 1)
y(k)
= [CI
C2
[X'(k) ]
(5-19)
[Las deducciones de las ecuaciones (5-18) y (5-19), aparecen en el problema A-5-4.] La matriz de estado de n x n esta en la forma can6nica de Jordan. (Para mayores detalles sabre las formas can6nicas de Jordan, yea el apendice A.)
Ejemplo 5-1 Considere el sistema siguiente:
Y(z)
U(z)
Zz
z+1
+ 1.3z + 0.4
Las representaciones en el espacio de estado en las formas canonica controlable, canonica observable :canonica diagonal, se convierten en:
FORMA CANONICA CONTROLABLE:
[X )] t(k xz(k)
-O.4][Xt(k)] + [1]U(k) -1.3 xz(k) 1
y(k) = [0
FORMA CANONICA DIAGONAL:
1 xz(k) 1[Xt(k)]
~ecci6n
5-2
301
--=---+--U(z)
Y(z)
5/3 z+0.5
-2)3 z+0.8
Y. par tanto.
X t(k [x2(k + 1) +
1)]
[-0.5 0
y(k) =
[~ -~][;:~Zn
No unicidad de las representaciones en el espacio de estado. Para un sistema con funcion :-0 transferencia pulso dada, la representacion en el espacio de estado no es (mica. Se ha demostrado ~.-o existen diferentes representaciones en el espacio de estado para un sistema con funcion de ::"".:.nsferencia pulso. Las ecuaciones de estado, sin embargo, estan relacionadas unas con otras me~1nte una transformacion de similitud. Considere el sistema definido por
x(k + 1) y(k)
~~ define
(5-20) (5-21 )
x(k)
:~
= PX(k)
(5-22)
-,je P es una matriz no singular. [Observe que, en vista de que tanto x(k) como x(k) son vectores dimension n, estan relacionados uno con el otro mediante una matriz no singular.] Entonces, al sustituir la ecuacion (5-22) en la ecuacion (5-20) se obtiene
PX(k + 1)
~-~::1Ultiplicando ambos
GPX(k) + Hu(k)
(5-23)
x(k + 1)
=",::niendo
= p-l GPX(k)
+ p-l Hu(k)
(5-24)
P-IGP =
_~
G,
= Gx(k) + Hu(k)
CPX(k) + Du(k)
(5-25)
x(k + 1)
:: -'~mna
y(k)
(5-26)
~~ uacion
t:
D=D
Du(k)
(5-27)
y(k)
~ -.3
= tx(k) +
demostrado as! que la representacion en el espacio de estado dada por las ecuaciones (5-20) y
I.
=-: :
302
Capitulo 5
+ bu(k)
Los vectores de estado x(k) (k) estan relacionados entre sf mediante la ecuacion (5-22). Dado que la matriz P puede ser cualquier matriz no singular de n x n, para un sistema dado existe una cantidad infinita de representaciones en el espacio de estado. En algunas aplicaciones se podria desear diagonalizar la matriz de estado G. Esto se puede Ilevar a cabo si se selecciona en forma adecuada una matriz P, de forma que P-1GP
=
yx
matriz diagonal
En el caso donde la diagonalizacion no sea posible, P-'GP puede transformarse a la forma canonica de Jordan: P-'GP = J = forma canonica de Jordan Refierase al apendice A para metodos de transformacion de la matriz G a una matriz diagonal 0 a matriz en la forma canonica de Jordan. [Observe que si se utiliza el metodo de programacion expansion en fracciones parciales, la matriz de estado se convierte en diagonal si todos los po involucrados son distintos, y se convierte en una forma canonica de Jordan si en Y(z)/U(z) involucrados polos multiples.]
En esta secci6n, primero se presenta la soluci6n de la ecuaci6n lineal de estado en tiempo disc invariante en el tiempo
x(k + 1)
= Gx(k) +
Hu(k)
mediante un procedimiento de recursi6n y, posteriormente, a traves del metodo de la transform Luego se analizan los metodos para calcular (zI - Gt'. Por ultimo, se resuelve la ecuaci6n de lineal en tiempo discreto y variante en el tiempo
x(k + 1)
G(k)x(k)
+ H(k)u(k)
Solucion de la ecuacion de estado lineal en tiempo disereto e lnvarlante en el tiempo. general, las ecuaciones de tiempo discreto son mas faciles de resolver que las ecuaciones dife les, porque las primeras pueden resolverse simplemente mediante un procedimiento de rec Este es bastante sencillo y conveniente para calculos digitales. Considere las siguientes ecuaci6n de estado y ecuacion de salida:
x(k + 1)
= Gx(k) +
Hu(k)
>C::6n 5-3
303
_ ~ solucion de la ecuaci6n (5-28) para cualquier entero positivo k se puede obtener directamente por
'" ~ ursion, como sigue:
x(l) = Gx(O) + Ou(O) x(2) = Gx(l) + Ou(l) = G 2 x(O) + GOu(O) + Ou(l) x(3)
x(k)
~
= Gkx(O) +
k-]
j=O
L Gk-j-l OuU),
k-]
k=1,2,3, ...
(5-30)
-,-"Jmente, x(k) esta formado de dos partes, una que representa la contribuci6n del estado inicial x(O) y e _.ra. la contribuci6n de la entrada u(j), donde j = 0, 1,2, ... , k - 1. La salida y(k) esta dada por
y(k) = CGkx(O) + C
Motri; de transicion de estado. : -:ejo homogenea
(5-31)
j~O
x(k + 1)
J
= Gx(k)
(5-32)
forma
x(k)
= 1I'(k)x(0)
G1I'(k),
(5-33)
1I'(k + 1)
- .Iaro que 'I'(k) puede estardada par
11'(0)
(5-34)
(5-35)
_ .J. ecuacion (5-33), se puede ver que la soluci6n (5-32) es simplemente una transformaci6n del :. :~jo inicial. Por 10 tanto, la matriz unica 'IJ1(k) se llama matri: de transicion de estado. Tambien se
- oce como matriz fundamental. La matriz de transici6n de estado contiene toda la informaci6n --;; los movimientos fibres del sistema definidos por la ecuaci6n (5-32). En terrninos de la matriz de transici6n de estado 'IJ1(k), la ecuaci6n (5-30) se puede escribir en _ . :>rma
k-]
x(k)
j=O j=O
L 1I'(k
- j - l)OuU)
j - 1)
(5-36) (5-37)
k-]
L 1I'(j)Ou(k -
-ustituir la ecuaci6n (5-36) 0 la (5-37) en la ecuaci6n (5-31), se puede obtener la siguiente ecuaci6n :: .alida:
304
k-I
k-I
Metoda de la transformada z a la solucion de las ecuaciones de estado en tiempo discreto. continuaci6n se presenta la soluci6n de una ecuaci6n de estado en tiempo discreto mediante el m do de la transformada z. Considere el sistema en tiempo discreto descrito por la ecuaci6n (5-281: x(k
+ 1)
Gx(k)
+ Hu(k)
(zI - G)X(z) = zx(O) + HU(z) Premultiplicando ambos lados de esta ultima ecuaci6n por (zl- Gt l , se obtiene X(z) = (zI - G)-I zx(O) + (zI - Gr l HU(z)
AI tomar la transformada inversa z en ambos lados de la ecuaci6n (5-41), da
x(k) =Z-I[(zl - Gr1z]x(O) +Z-I[(zl - GrIHU(z)]
y
k-I
j~O
L Gk-j-1Hu(j)
donde k = I, 2, 3, .... Observe que la soluci6n del metodo de la transformada z involucra el proceso de invertir la (zI - G), 10 que puede realizarse mediante metodos analiticos 0 utilizando una rutina de compu La soluci6n tambien requiere de las transformadas inversas z de (zI - Gt l z Y (zI - Gt l Hur:
Ejemplo 5-2 Obtenga la matriz de transici6n de estado del siguiente sistema en tiempo discreto:
G=[-~.16
-n,
H=[iJ, C=[10]
=
Posteriormente obtenga el estado x(k) y la salida y(k) cuando la entrada u(k) Suponga que el estado inicial esta dado por
I para k
0, I. ::..
x(O) =
[Xl(O)] = [
X2(0)
-1
1]
Secci6n 5-3
305
Gt l :
(zI - G)-1
[0.~6 z ~11
T
1
z + 1 = (z + 0.2)(z + 0.8)
(z
0.2~Z + 0.8)]
+
(z + 0.2)(z + 0.8)
_
-
+ 0.2
-1
3
2
3
_2]
3
+ 0.2
z + 0.8
+ 0.2
z + 0.8
= Z-1 [
~ Z +z0.2 - ~ z +z0.8
0.8 z 3 z + 0.2
0.8 z 3 z + 0.8
~ z +z0.2 - ~ z +z0.8 ]
1 z 3 z + 0.2 4 Z 3 z + 0.8
-----+---- -----+----
~ (-0.2)k - H-0.8t
[
0
i (-0.2)k
H-0.8t
(5-45)
38 (-0.2)k
La ecuaci6n (5-45) da la matriz de transici6n de estado. Ahara, se calcula x(k). La transformada z de x(k) esta dada par
Z[x(k)] = X(z) = (zI - G)-l zx(O) + (zI - G)-1 HU(z) = (zI - G)-I[ZX(O) + HU(z)]
Dado que
U(z)
se obtiene
= - - - 1 = -- l 1-z z
z ZX(O)+HU(Z)=[]+ -z
Par tanto
-- l z
[
Z z-l
z ]
[ zZ2 l ] 2 -z + 2z z-l
--
X(z)
306
Copitulo f
-12z + 6
=
Z
llz 9
z + 0.8 z + 0.8
+ 0.2 + 0.2
z - 1
2.z
_18_
~z
18
3.4 Z _17.6 Z [ _ 6_ _ + __ _ + 9
z - 1
til til
is
y(k)
Cx(k)
- (-0.2l
+
(-0.8)k +
+
=
Cdlculo de (zI - Gt 1
- (-0.2)k
(-0.8)k
ti
La soluci6n de la ecuacion de estado dada por la ecuaci6n (5-21 mediante el metodo de la transformadaz requiere del calculo de (zI - Gt l EI calculo de (zI - Gt por 10 general, una tare a que toma mucho tiempo, excepto en casos simples. Existen metodos t analfticos como de computo para el calculo de (zI - Gt l Aquf se presenta uno.
Metoda para ea/eu/ar (zl - Ct l Este metodo esta basado en la expansion de la adjunta (zI - G). La inversa de (zI - G) se puede escribir en terminos de la adjunta de (zI - G), como sig .
(zI _ Gt1
Observe que en el determinante IzI
~
adj (zI - G)
IzI - GI
GI se puede escribir como sigue:
(5
IzI - GI
Se puede demostrar (vea el problema A-5-13), que adj(zI adj (zI - G) = Izn-l donde HI = G Hz
=
GH I + azI
(5
Observe que ai' a-, ... , all son los coeficientes que aparecen en el determinante dado JX"f ecuacion (5-47). Las a, tambien se pueden obtener (vea el problema A-5-13) mediante el ernpleo la traza, como sigue:
Secci6n 5-3
307
aj = -trG
az =
a3 =
-! trGH - t trGH z
j
(5-50)
an
= --
trGH n -
(La traza de una matriz de n x n es la suma de sus elementos diagonales.) Para un determinante de orden superior (n > 3), la expansion del determinante IzI - GI en la forma dada por Ia ecuacion (5-47) puede ocupar mucho tiempo, en este caso, resulta util emplear la ecuacion (5-50) para calcular las a.; ya que aI' H" a z, Hz, ... , a" _ " H,,_ I se pueden calcular facilmente de manera secuencial. Al sustituir la ecuacion (5-49) en la ecuacion (5-48) y sustituyendo Ja ecuacion resultante en la ecuacion (5-46), se obtiene la inversa de (zI - G). Este metodo es conveniente para soluciones en computadora; ya existe un programa estandar,
Ejemplo 5-3 Determine fa inversa de la matriz (zI - G), donde
G=
Tambien obtenga G k De las ecuaciones (5-46), se tiene
(
- t _
-0.3
-~.2]
adj (zI - G)
zI - G)
IzI - GI
A pesar de que el determinante IzI - GI se puede expandir facilmente, utilizaremos aqui, para efectos de dernostracion, la ecuaci6n (5-50) para el calculo de a" a, Ya-. Primero observe que
0.1
at = -trG = -tr
Entonces, de la ecuaci6n (5-49), se obtiene
~.3
0.1 -0.1
0]
0] -0.2
0] g3
0.1 0.1 0.3 -0.1 -0.2 + -0.3 [0.3
L]
e ca. = -~ tr
{["'
~.3
0.1 -0.1
-002]
~.02
o -0.2 -0.3
][0'
-Hl
= -0.04
308
Capitulo
[o
0.03 0.09
y
a3 =
-t tr GH 2 = -t tr
[o
0.012 0
0 ] 0 = -0.012 0.012
Observe que
H 3 = GH 2 - 0.0121 = 0 La adjunta de (zl- G) se puede dar ahora mediante la ecuacion (5-48), es decir
adj (zl - G) = Iz 2 + HI 1 0
+ H2
[0.4 0 0.1 0.2 0 0] [0.03 -0.2 z + 0.09 0 0 0.03 -0.03 0 -0.02] 0.02 -0.04
= 0 1 0 Z2 + 0.3
[o 0 1
Z2 + O.4z + 0.03
0]
= 0.3z + 0.09
[o
Tarnbien,
zl - G )
0.3
(z
1
z + 0.3
Esta ultima ecuaci6n da la inversa de (zl- G). A continuaci6n, se obtendra G k De la ecuaci6n (5-43), se tiene
G k = Z-I[(zl - G)-I z]
0.25z 0.75z 0.25z 0.25z 0.5z O.lz --- + --- ---- + --- --- - --z + 0.2 z - 0.2 z + 0.2 z - 0.2 z + 0.2 z - 0.2 0.75z 0.75z =Z-I - - - - + - - z + 0.2 z - 0.2 0.75z 0.25z
-O.4zz
+ 0.3
1.6z
--- + --- ---- - --- + --z + 0.2 z - 0.2 z + 0.2 z - 0.2 z + 0.3
1.5z
O.lz
z z + 0.3
Se.:: :" 53
309
Il.:;:~espondiente
ecuacion de salida:
x(k
+ 1)
y(k)
= G(k)x(k)
=
(5-52) (5-53)
.ucion de la ecuacion (5-52) se puede encontrar facilmente mediante recursion, como sigue:
l)u(h
+ 1)
:...~
matriz de transicion de estado (matriz fundamental) para el sistema definido por la ecuacion se define como 'I'(k, h). Se trata de una matriz (mica, que satisface las condiciones
'f1(k + 1,h)
= G(k)'f1(k,h),
'f1(h,h)
=I
c = h. h + 1, h + 2, ... Se puede ver que la matriz de transicion de estado 'I'(k, h) esta dada por
'f1(k,h)
= G(k
- l)G(k - 2) G(h),
k-I
k>h
(5-54)
x(k) = 'f1(k,h)x(h)
L 'f1(k,j
+ l)H(j)u(j),
k>h
(5-55)
.;: que el primer termino segundo miembro de la ecuacion (5-55) es la contribucion del esta- '':': x(h) al estado actual x(k), y que el segundo termino es la contribucion de la entrada u(h), :,.... ,u(k-l). facil verificar la ecuacion (5-55). En referencia a la ecuacion (5-54), se tiene
=5
'f1(k
+ 1,h)
(5-56)
x(k
+ 1) = 'f1(k + 1,h)x(h) +
L 'f1(k
j=h
+ 1,j + l)H(j)u(j)
k-I
x(k
+ 1) = G(k)'f1(k,h)x(h) +
L 'f1(k
j=h
I ,
+ 1,j + l)H(j)u(j)
f
+ 'f1(k + 1, k + l)H(k)u(k)
: '...~ t
310
Capitulc
= =
G(k>['I1(k, h)x(h) +
G(k)x(k) + H(k)u(k)
Por tanto, se ha demostrado que la ecuacion (5-55) es la soluci6n de la ecuaci6n (5-52). Una vez obtenida la solucion de x(k), la ecuacion de salida, ecuaci6n (5-53), se convierte en:
k-I
y(k)
= C(k)'I1(k,h)x(h) +
2: C(k)'I1(k,j + l)H(j)u(j)
j~h
+ D(k)u(k),
k>h
Si G(k) es no singular para todos los valores de k considerados, de forma que la inversa de 'l'(k, h) exista, entonces la inversa de 'l'(k, h), denotada como 'l'(h, k), esta dada como sigue:
'I1- I(k, h)
= 'I1(h, k)
= =
G-I(h)G-1(h + 1) . G-1(k - 1)
1. 'l'(k, k) = I 2. 'l'(k, h) = G(k - I)G(k - 2) ... G(h), k> h 3. Si la inversa de 'l'(k, h) existe, entonces
para cualquier i, j, k
Un sistema en tiempo discreto de una entrada y una salida se puede representar 0 modelar mediante una funci6n de transferencia puIso. La extension del concepto de la funci6n de transferencia pulso a un sistema en tiempo discreto de varias entradas y varias salidas da la matriz de funci6n de transferencia pulso. En esta secci6n se estudiara la relacion entre la representacion en el espacio estado y la representacion mediante la matriz de funcion de transferencia pulso.
Matri; de funcion de transferencia pulso. La representacion en el espacio de estado de un sistema lineal en tiempo discreto e invariante en el tiempo de orden n, con r entradas y m salidas, se puede dar mediante
(5-58 ) (5-591
311
e: r
il -
ztriz de n x r, C es una matriz de m x n y D es una matriz de m x r. Al tomar las transformadas 2S ecuaciones (5-58) y (5-59), se obtiene
zX(z) - zx(O) = GX(z) Y(z) = CX(z)
+ HU(z) + DU(z)
~'X;-.
e que la definicion de funcion de transferencia pulso exige la suposicion de condiciones .: 2:- S cero, aqui tambien suponemos que el estado inicial x(O) es cero. Entonces se obtiene
X(z) Y(z)
= (zl
- G)-I HU(z)
= [C(zl
F(z)
- Gt l H
+ D]U(z) = F(z)U(z) +D
(5-60)
= C(zl
- G)-I H
,.:- conoce como matriz de funcion de transferencia pulso. Se trata de una matriz de m x r. La .: .ie funcion de transferencia pulso F(z) caracteriza la dinarnica de entrada/salida del sistema de rrr-. :iscreto dado. =::::: vista de que la inversa de la matriz (zI - G) se puede escribir en la forma
- 1 _ (
adj (zl - G)
zl - G )
Izl - GI
~z
F (z )
.: -.:..-: .:jue los polos de F(z) son los ceros de IzI - G[ = O. Esto significa que la ecuacion caracterissistema en tiempo discreto esta dada por
IZI -
GI = 0
:s coeficientes
G;
Transformacion de slmilitud.
= Cx(k) + Du(k)
GtlH + D
F(z)
a
-I.
= C(zl-
~~cion
2
5-2 se mostro que varias representaciones en el espacio de estado distintas para un :2do estan interrelacionadas por una transformacion de similitud. AI definir un nuevo vector \ ~) utilizando una matriz de transformacion de similitud P, es decir
312
Capitulo 5
x(k)
donde P es una matriz no singular de n
x
= PX(k)
(5-61) (5-62)
n, se tiene
x(k
donde G, H, C, D Y G,
+ 1) = Gx(k) + Hu(k)
y(k)
= Cx(k) + Du(k)
D=D
La matriz de funcion de transferencia pulso F(z) para el sistema definido por las ecuaciones (5-61.
y (5-62) es
Observe que las matrices de funcion de transferencia pulso F(z) y F(z) son iguales, en vista de que
D=
En el control digital de plantas en tiempo continuo es necesario convertir ecuaciones en el espacio estado en tiempo continuo, en ecuaciones en el espacio de estado en tiempo discreto. Se p realizar dicha conversion si se introducen en los sistemas en tiempo continuo muestreadores y ' positivos de retencion ficticios. EI error introducido por la discretizacion se puede hacer despr . utilizando un periodo de muestreo suficientemente pequeno en comparacion con la constante tiempo mas significativa del sistema.
Repaso de la solucion de las ecuaciones de estado en tiempo continuo. la matriz exponencial e", La matriz exponencial se define como 1 2 2 1 k k ., A k t k
k!
k=O
2.:-k!
~:: :~ 5-5
313
I,;=oA
- e"
d dt
= A[I + At + - - + ... +
= [ I + At + - - + ... +
2!
A2t2 2! A2 t 2
Ak - 1 tk-1 (k - I)!
+ . .. A = e" A
e e
=
:'~'1icular,
A (t +
k
k~O
k L Ak L
cc [
S)k
= eA(t+s)
k!
si s = -t, entonces
At.
e", e"
es no singular.
= BA
x = Ax + Bu
.Gce \
(5-63)
x(t) - Ax(t)
d
= Bu(t)
:-:~grar
(5-64)
314
Capitulo 5
La ecuacion (5-64) es la solucion de la ecuacion (5-63). Observe que la solucion de la ecuacion de estado que comienza en el estado inicial x(to) es
Ahora se presentara un procedimiento para la discretizacion de ecuaciones en el espacio de estado en tiempo continuo. Se supone que el vector de entrada u(t) cambia solo en instantes de muestreo uniformemente espaciados. Observe que la operacion de muestreo aqui es ficticia. Se deducira una ecuacion de estado en tiempo discreto y una ecuacion de salida que den como resultado los valores exactos en t = kT, donde k = 0, I, 2, ... Considere la ecuacion de estado en tiempo continuo y la ecuacion de salida
XC!)
eA(t-to) x(to) +
(5-65,
x=
Ax + Bu
(5-661 (5-67,
y=Cx+Du
En el siguiente analisis, con el objeto de simplificar la presentacion, se utilizara la notacion kTy (kI)T en vez de k y k + I. La representacion en tiempo discreto de la ecuacion (5-66) tomara la forma
x((k + l)T)
G(T)x(kT) + H(T)u(kT)
(5-68)
Observe que las matrices G y H dependen del periodo de muestreo T. Una vez fijo el periodo de muestreo T, G y H son matrices constantes. Para determinar G(7) y H(7), se utiliza la ecuacion (5-64), solucion de la ecuacion (5-66). Se supone que la entrada u(t) es muestreada y alimentada a un retenedor de orden cero, de forma que todos los componentes de u(t) sean constantes en el intervalo entre dos instantes de muestreo consecutivos cualesquiera, es decir
u(t) = u(k7),
(5-69)
En vista de que
!
0
(k+l)T e-ATBu(T)dT
(5-70)
(5-71 ) al multiplicar la ecuacion (5-71) por e" y sustraerla de la ecuacion (5-70) nos da
x((k + l)T)
Dado que la ecuacion (5-69) u(t) = u(k7) para kT $. t < kT + T, se puede sustituir u( T) = u(k7) = constante en esta ultima ecuacion. [Observe que u(t) puede tomar un valor en t = kT + T, es decir, u(kT + 7), que puede ser distinto de u(k7). Este valor en u( T) con T = kT + T, que es ellimite superior de la integracion, no afecta el valor de la integral en esta ultima ecuacion, ya que el integrando no incluye funciones impulso.] Por 10 tanto podemos escribir
:~:: en 5-5
315
xk + 1)T)
:J: - .:~
A = T - t. Si se definen
(5-73)
I
I
I
0=1'- -
(f eAA )B
ds:
(5-74)
IGl.C ~' la ecuaci6n (5-68). Entonces, las ecuaciones (5-73) y (5-74) dan las matrices deseadas G(7)
f\!, H -, Note que G(7) y H(7) dependen del perfodo de muestreo T. Con referencia ala ecuaci6n (5l ecuacion de salida se convierte en
(5-75)
1 r.:::
y(kT)
= Cx(kT) + Du(kT)
(5-76)
as matrices C y D son matrices constantes y no dependen del perfodo de muestreo T. Si la matriz A es no singular, entonces H(7) dada por la ecuaci6n (5-74) se puede simplificar
C omentarios
::::". el enfoque del espacio de estado, observe que al suponer el vector de entrada net) constante dos instantes de muestreo consecutivos cualesquiera, la representaci6n en tiempo discre-: se puede obtener simplemente integrando la ecuaci6n de estado en tiempo continuo sobre _~ periodo de muestreo. La ecuaci6n de estado en tiempo discreto dada por la ecuaci6n (5-68) se conoce como equivalente con retenedor de orden cero de la ecuaci6n de estado en tiempo ~ :ltinuo dada por la ecuaci6n (5-66). .. ::: - general, para convertir la ecuaci6n de un sistema en tiempo continuo en una ecuaci6n de un .stema en tiempo discreto, es necesario algun tipo de aproximaci6n. Es importante apuntar .: _~ la ecuaci6n (5-75) no incluye ninguna aproximaci6n, siempre que el vector de entrada net) ~:: constante entre dos instantes de muestreo consecutivos cualesquiera, tal y como se supuso ~~ .a deducci6n. ~ =:-Serve que para T I, G(7) 7 G(O) = e A O = I. Por tanto, con forme el perfodo de muestreo T ;.: ~ace muy pequeflo, G(7) se aproxima a la matriz de identidad.
~-.:re
":~
(s) = U(s) = s + a
yes)
316
Capitula 5
Obtenga la representacion en el espacio de estado en tiempo continuo de este sistema. Luego discretice Ia ecuacion de estado y la ecuacion de salida y obtenga la representacion en el espacio de estado en tiernps discreto del sistema. Tarnbien obtenga la funcion de transferencia pulso del sistema mediante el emplee de la ecuaci6n (5-60). La representacion en el espacio de estado en tiempo continuo del sistema es simplemente
i
y
= =
-ax + u
x
Ahora se discretiza Ia ecuacion de estado y la ecuacion de salida. Con referencia a las ecuaciones (5-73\ y (5-74), se tiene
G(T) H(T)
= e:" =
T e-aAdA
= -
-aT e
1 - e- aT u(k) a
Con referencia ala ecuacion (5-60), la funci6n de transferencia pulso para este sistema es
= (z
-aT
_II )
e- aT
= a (1
Este resultado concuerda con Ia transformada z de G(s) cuando esta precedida por un muestreador y un retenedor de orden cera [es decir, en donde la serial u(t) se muestrea y alimenta a un retenedor de orden cera antes de que sea aplicada a G(s)]:
G(z)
= Z [ 1 - eS
Ts
-1 ] S + a
= (1
e-aT)z-1
er? Z-I)
Obtenga las ecuaciones de estado y de salida en tiempo discrete y la funcion de transferencia pulso (cuando el periodo de muestreo T = I) del sistema en tiempo continuo siguiente:
G() s
= lJ(s) = s(s + 2)
yes)
y = [1
oJ[;:]
Seccion 55
317
donde las matrices G(1) y H(1) se obtienen a partir de las ecuaciones (5-73) y (5-74) como sigue:
G(T) H(T)
Por tanto
Z T)]
T)
1)] (kT) u
XI(k + = [ x2(k + 1)
y
1)] [1
[1 Ol[z - 1
= [1 Ol[Z
z - 0.1353
-0.4323
1 (z -
1~:3~30'1353)][0'2838]
1
z - 0.1353
(1 _ Z-I)Z[0.5 _ 0.25 +
sZ s
1
0.25] +2
= 1- z
318
Enfoque de MATLAB para fa discretizacion de ecuaciones de estado en tiempo contin MATLAB tiene un comando muy util para discretizar una ecuaci6n de estado en tiempo continuo
x=
y convertirla a
x(k
Ax + Bu
+ 1)
Gx(k) + Hu(k)
[G,Hj = c2d(A,B,T)
donde T es el perfodo de muestreo del sistema en tiempo discreto. T se debera especificar en segun Si se requiere de buena precision en la obtencion de G y de H utiliceformat long. Si solam se necesitan cuatro decimales, utilice format short. Si no se incluye enunciado de formato en programa, MATLAB producira G y H en format short. Considere el ejemplo siguiente: si el sistema en tiempo continuo esta dado por
[;:] =
[-2~ -~][~:] + [n u
1;-25 -4];
(5-
A
B
= [0
[0;1];
[G,Hl
= c2d(A,B,O.05)
G=
0.9709 -1.1212 0.0448 0.7915
H=
0.0012 0.0448
Observe que la matriz de estado G y la matriz de entrada H de la ecuacion en el espacio estado de tiempo discreto
x(k
+ 1) = Gx(k) + Hu(k)
dependen del perfodo de muestreo T. Por ejemplo, considere la discretizaci6n del sistema en tiem continuo dado por la ecuacion (5-77) con dos perfodos de muestreo distintos: T = 0.2 segundos y = I segundo. Como se ha visto en las salidas de MATLAB anteriores y en las que siguen, un conj to de matrices G y H difieren en funci6n de un perfodo de muestreo T diferente.
:e:: : c 55
319
A = [0
B
1;-25
-4];
A = [0 [G,H)
1;-25
-4];
[0;1];
B = [0;1];
[G,H] = c2d(A,B,0.2)
= c2d(A,B,1)
G=
0.6401 -2.9017 0.1161 0.1758
G=
-0.0761 0.7321 -0.0293 0.0410
H=
0.0144 0.1161
Como otro ejernplo, veamos el siguiente sistema:
H=
0.0430 -0.0293
x=
A = [
Ax + Bu
20.~01
-0.4905
1 o a a
a OJ a a a 1' a a
B=
-1
O~5
OJ
III ;.- :'-':'ner que eI periodo de muestreo T es de 0.5 segundos y sin III ' :0 _cnte ecuaci6n de estado en tiempo discreto: x(k + 1) = Gx(k) + Hu(k)
.r.
.:~ 15
0 0 1 0];
G=
1.0259 1.0389 -0.0006 -0.0247 0.0504 1.0259 -0.0000 -0.0006
o o
1.0000
o o
0.0500 1.0000
H=
-0.0013 -0.0504 0.0006 0.0250
320
Capftulo5
Respuesta en tiempo entre dos instantes de muestreo consecutivos. En un sistema en tiempo continuo muestreado, la salida es constante en el tiempo. Como se vio en los capitulos 3 y 4, la solucion mediante la transfonnada z de la ecuacion del sistema en tiempo discreto da la respuesta de la salida solo en los instantes de muestreo. En la practica, se puede desear detenninar la salida entre dos instantes de muestreo consecutivos. Existen algunos metodos para encontrar la respuesta (salida) entre dos instantes de muestreo consecutivos, como el metodo de la transfonnada de Laplace y el metoda de la transformada z modificada (vea el apendice B). Aqui se demostrara como se puede modificar facilmente el metodo en el espacio de estado para obtener la salida entre dos instantes de muestreo consecutivos cualesquiera. Considere el sistema en tiempo continuo invariante en el tiempo definido por
x=
Ax
+ Bu
y=Cx+Du
Se supone que la entrada u se muestrea y alimenta a un retenedor de orden cero. Entonces u( r) = u(kn para kT$. -r ; kT+ T. Con referencia a la ecuacion (5-65), la solucion de la ecuacion de estado que comienza con el estado inicial x(to) es x(t)
eA(t-Io)
x(to)
r
to
kT
eA(t-T)
Bu( r) dr
Para obtener la respuesta del sistema muestreado en t = kT + 6.T, donde 0 < 6.T < T, se hace que t = kT + 6.T, to = kTy u( r) = u(kn en la solucion x(t). Entonces,
x(kT
f +f
k T +J T eA(kTHT-T)
Bu(kT) dr
JT
e A A Bu(kT) dA
G(LiT)
= e AJ T
(5-78)
x(kT
(5-80)
y(kT + LiT)
(5-81)
Por tanto, los valores de x(kT + 6.n y y(kT + 6.n entre dos instantes de muestreo consecutivos cualesquiera se pueden obtener si se calcula G(6.n y H(6.1) para varios valores de 6.T, donde 0 < 6.T < T, y se introducen dichos valores calculados en las ecuaciones (5-80) y (5-81). (Estos calculos se pueden programar facilmente en una computadora digital.)
:-=:: en 5-6
Jemplo 5-6
321
Considere el sistema analizado en el ejemplo 5-5. Obtenga la ecuaci6n de estado en tiempo discreto as! como la ecuaci6n de salida en t = kT + 11T. Tambien obtenga las expresiones especificas correspondientes ala ecuacion de estado y la ecuacion de salida cuando T= I segundo y I1T= 0.5 segundos. En el ejemplo 5-5, se obtuvieron las matrices G(7) y H(7) como sigue:
Para obtener la ecuacion de estado y la ecuacion de salida en t = kT + I1T, donde 0 < I1T < T, primero se convierte G(7) en G(I17) y H(7) en H(I17), y luego se sustituye G(I17) y H(I17) en las ecuaciones (5-80) : (5-8 I), como sigue:
~(1
e-z,j~
y( k T + ..1T) = [1 0][1 o
+ [1 0]
1 ( 2 ~~1 [
1)]
u(kT) 0.3161
Para T= I Y I1T= 0.5 se obtiene la ecuacion de estado y la ecuaci6n de salida como sigue:
= [1 0.3161][Xl(k)] + [0.0920]U(k)
0.3679 xz(k) 0.3161J[
y(k + 0.5) = [1
;:~~j] + (0.0920)u(k)
analisis de estabilidad de Liapunov juega un papel importante en el analisis de la estabilidad de .:., sistemas de control descritos por ecuaciones en el espacio de estado. Existen dos rnetodos de lr~i5is de estabilidad de Liapunov, lIamados primer metoda y segundo metoda; ambos se aplican :-~-:. determinar la estabilidad de los sistemas dinamicos descritos por ecuaciones diferenciales 0 en : .:.erencias ordinarias. EI primer metoda esta formado por procedimientos en los que se utilizan las -;,:--nas explicitas de las soluciones de las ecuaciones diferenciales 0 de las ecuaciones en diferencias :-.?:: el anal isis. Por otra parte, el segundo rnetodo no requiere de las soluciones de las ecuaciones : --;:renciales 0 en diferencias, por 10 que resulta mas uti! en la practica, Aunque existen muchos criterios de estabilidad poderosos para los sistemas de control, como ,,:.- el criterio de estabilidad de Jury y el criterio de estabilidad de Routh-Hurwitz, estos estan -~7ingidos a sistemas lineales invariantes en el tiempo. Por otro lado, el segundo metodo de Liapunov
322
CopituloS
no esta limitado a sistemas lineales invariantes en el tiempo: es aplicable tanto a sistemas lineales como no lineales, variantes e invariantes en el tiempo. En particular, el segundo metoda de Liapunov es indispensable para el analisis de estabilidad de sistemas no lineales en los que las soluciones exactas no son posibles. (Es importante sefialar, sin embargo, que a pesar de que el segundo metodo de Liapunov es aplicable a cualquier sistema no lineal, los resultados no son una tarea facil. Se necesita experiencia e imaginacion para lIevar a cabo el analisis de estabilidad en la mayoria de los sistemas no lineales.) EI segundo metodo de Liapunov tambien se conoce como metoda directo de Liapunov.
Segundo metoda de Liapunov. De la teoria de la mecanica clasica, se sabe que un sistema vibratorio es estable si su energia total se reduce continuamente, hasta aIcanzar un estado de equilibrio. EI segundo metoda de Liapunov se basa en una generalizacion de 10 anterior: si el sistema tiene un estado de equilibrio asintoticarnente estable, entonces la energia almacenada en el desplazada dentro del dominio de atraccion se decrementa al aumentar el tiempo, hasta que por ultimo adopta su valor minimo en el estado de equilibrio. Sin embargo, para sistemas puramente matematicos, no existe una forma simple de definir una "funcion de energia". Para veneer esta dificultad, Liapunov intradujo la funcion de Liapunov, una funcion ficticia de energia. Esta idea es mas general y mas utilizada que la de la energia, De hecho, cualquier funcion escalar que satisfaga las hipotesis de los teoremas de estabilidad de Liapunov (vea los teoremas 5-1 hasta 5-6) puede servir como funcion de Liapunov. Antes de que se analice mas prafundamente la funcion de Liapunov, es necesario explicar la definicion positiva de las funciones escalares. Definicion positiva de funciones escalares. Se dice que una funcion escalar Vex) es definida positiva en una region D. (que incJuye el origen del espacio de estado) si Vex) > 0 para todos los estados x no cero de la region D. y si V(O) == o. Se dice que una funcion variante en el tiempo Vex, t) es definida positiva en una region D. (que incluye el origen del espacio de estado) sf esta limitada por debajo por una funcion definida positiva invariante en el tiempo, es decir, si existe una funcion definida positiva Vex) tal que
vex, t) > Vex),
para toda t ~ to para toda t ~ to Una funcion escalar Vex) es definida negativa
V(O, t) > 0,
Semidefinicion positiva de funciones escalares. Una funcion escalar Vex) es semidejinida positiva si es positiva en todos los estados en la region D. excepto en el origen y en determinados estados donde es cera. Semidefinlcion negativa de funciones escalares. negativa si -Vex) es positiva semidefinida.
Una funcion escalar Vex) es semidefinida
Indeflnlclon de funciones escalares. Una funcion escalar Vex) es indefinida si en la region D. adopta tanto valores positivos como negativos, independientemente de 10 pequeiia que sea la region D..
323
5-7 este ejemplo se dan varias funciones escalares y sus c1asificaciones de acuerdo con las definiciones -'.--:t<:riores. Aqui se supone que x es un vector de dos dimensiones.
=~
1. V(x)
x~
2. V(x) = x~
+ x~ , x, + --,
I+x,
3. V(x)
= (x,
+ X2)2
4. V(x)
5. V(X)=XIX2+ x~
Funciones de Liapunov. La funci6n de Liapunov, que es una funci6n escalar, es una funjdinida positiva y es continua junto con sus primeras derivadas parciales (en relaci6n con sus ..entos) en la regi6n n alrededor del origen y tiene una derivada can respecto al tiempo que, c..) se toma a 10 largo de la trayectoria, es definida negativa (0 semidefinida negativa). Las .'Xlesde Liapunov involucran ax l , X 2, ,XII y, posiblemente, at. Se expresan en la forma V(x l , :C". t), 0 s610mediante Vex, t). Si las funciones de Liapunov no incluyen a t en forma explicita, rxes se expresan mediante V(x l , X 2, ,XII)' 0 bien, Vex). I)bserve que Vex, t) es de hecho la derivada de Vex, t) con respecto a t a 10 largo de una c.on del sistema. Par tanto, V (x, t) < 0 implica que Vex, t) se va decrementando en funci6n de t. ~_nci6n de Liapunov no es (mica para un sistema dado. (Por esta raz6n, el segundo metado de 10\ es una herramienta mas poderosa que las consideraciones convencionales de energia. rve que para un sistema cuya energia E se reduce en promedio, pero no necesariamente es -;: en cada instante, E no es una funci6n de Liapunov.) Mas adelante en esta secci6n se demostrara que en el segundo metodo de Liapunov el comporC"'l0 del signa de Vex, t) yel de su derivada de tiempo Vex, t) = dV(x, t)/dt dan informaci6n -;: .a estabilidad de un estado en equilibrio sin tener la soluci6n. Dbserve que la funci6n definida positiva mas senciIIa es de forma cuadratica:
n n
Vex)
= L: L: qijX;Xj,
i=1 j=1
i,j
= 1,2, ... ,n
- :e cualquier funci6n
~~:1eral,
las funciones de Liapunov pueden no ser de forma cuadratica simple. No obstante, en el de Liapunov, los term inos de grado menor en V deben ser pares. Esto se . ver como sigue. Si se definen
X2 - =X2,
A
Xn
... ,
-- = Xn
Xn-I
Xn-I
-(""~es en la vecindad del origen, s610 los terminos de grado mas bajo se haran dominantes y Vex) =,_ede escribir como
se rnantienen las x/ fijas, V(x" x , ... , XII_I, I) sera una cantidad fija. Para el caso de p impar, XI;' 2 ;:<': adoptar tanto valores positivos como negativos cerca del origen, 10 que significa que Vex) no zerinida positiva. Por tanto, p debera ser par. A continuaci6n se dan las definiciones de sistema, estado de equilibrio, estabilidad, estabili- asintotica e inestabilidad.
324
Co .
Sistema.
x = f(x, t)
donde x es un vector de estado (un vector-a) y f(x, t) es un vector-a cuyos elementos son funci de XI' X 2, . . . , X", Yde t. (Observe que como modelo se utiliza un sistema de tiempo continuo presentar los conceptos basicos sobre el analisis de estabilidad mediante el segundo metode Liapunov. Posteriormente se extienden los resultados obtenidos al sistema en tiempo discreto.j supone que el sistema de la ecuacion (5-82) tiene una solucion (mica, que empieza en la condo inicial dada. La solucion de la ecuacion (5-82) se denota como q,(1; X o, 10), donde x = X o en 1= i{ es el tiempo observado. Por tanto,
= Xo
I
r(xe , I) = 0,
para toda
(5
se llama estado de equilibrio para el sistema. Si el sistema es lineal e invariante en el tiempo, esto si rex, t) = Ax, entonces solo existira un estado de equilibrio si A es no singular, y un numero inti de estados de equilibrio si A es singular. En el caso de los sistemas no lineales, pueden existir uno mas estados de equilibrio. Estos estados corresponden a las soluciones constantes del sistema (x = para toda I). La determinacion de los estados de equilibrio no involucra la solucion de la ecuaci diferencial del sistema, ecuacion (5-82), sino solo la solucion de la ecuacion (5-83). Cualquier estado de equilibrio aislado (es decir aislado de otros) puede ser desplazado al gen de las coordenadas, 0 f(O, I) = 0, mediante traslacion de coordenadas. En esta seccion, unicamente se tratara el analisis de estabilidad de este tipo de estados.
Estabilidad en el sentido de Liapunov. A continuacion, una region esferica de radio r, alrededor de un estado de equilibrio x, se denotara como
Ilx - xell
IIx - x.]
= [(Xl - Xl e)2
(X2 - X2e)2
+ ... + (x, -
x ne )2jl i2
Sea S(8) el conjunto formado por todos los puntos tales que
Se dice que un estado de equilibrio x, del sistema de la ecuacion (5-82) es estable en el sentido de Liapunov si, para cada S( E) existe un S(8) tal que las trayectorias que se inicien en S(8) no salgan de S( E) al aumentar I en forma indefinida. El numero real 8 depende de E y, en general, tarnbien depende de 10' Si 8 no depende de 1o, se dice que el estado de equilibrio es uniformemente estable. Lo que se ha enunciado aquf es que primero se escoge la region S( E) y, para cada S( E), debera existir una region S(8) tal que trayectorias que se inicien dentro de S(8) no salgan de S( E) con forme I se incrementa en forma indetinida.
:: :- 5-6
325
Estabilidad aslntotica. Se dice que un estado de equilibrio x, del sistema de la ecuacion ; es asintoticamente estable si es estable en el sentido de Liapunov y si cada solucion que se ml-: " desde el interior de S( 8) converge, sin salir de S( e) hacia x, conforme t se incrementa en forma - -c~::lida. En la practica, la estabilidad asintotica es mas importante que la simple estabilidad. Sin embar:.do que la estabilidad asintotica es un concepto local, el hecho de establecer la estabilidad '=-~2:ica no necesariamente significa que el sistema operara de manera correcta. Por 10 general, es .esario algun conocimiento del tamano de Ia region mas grande de la estabilidad asintotica, Esta :: ~:-: se conoce como dominio de atraccion. Es esa parte del espacio de estado en la cual se origias trayectorias asintoticamente estables. En otras palabras, cualquier trayectoria que se origine dorninio de atraccion es asintoticamente estable.
;;-~:
Estabilidad asintotica global. Si la estabilidad asintotica es valida para todos los estados -.-.:. :odos los puntos en el espacio de estado) a partir de donde se originan todas las trayectorias, se .1.:;;; :;Je el estado de equilibrio es estable asintoticamente global. Esto es, el estado de equilibrio x, s.srema dado por la ecuacion (5-82) se dice estable asintoticamente global si es estable y cada "_..:[on converge a x, conforme t se incrementa en forma indefinida. Es claro que una condicion ":';;;;..lfia para la estabilidad asintotica global es que exista solo un estado de equilibrio en la totali- "'::;;1 espacio de estado. En problemas de ingenieria de control, la estabilidad asintotica global es una caracteristica ~.:jle. Si el estado de equilibrio no es estable asintoticamente global, entonces el problema se .e;:r .me en determinar la region mas grande de estabilidad asintotica, Esto por 10 regular es muy .::'"..:: '\0 obstante, para efectos practices, es suficiente con determinar una region de estabilidad rs.:-::.:-tica 10 suficientemente grande para que ninguna perturbacion la exceda.
r
Inestabilidad. Se dice que un estado de equilibrio x, es inestable si para algun numero real cualquier numero real 8> 0, sin importar que tan pequefio, siempre existira un estado X o en IS; :.11 que la trayectoria que se inicie en ese estado salga de S(e).
E ::.
Representacion grdfica de estabilidad, estabilidad asintotica e inestabilidad. Una repregrafica de las definiciones anteriores aclarara sus significados. Consideremos el caso de dos dimensiones. Las figuras 5-2a), b) y c) muestran los estados de eo, . ibrio y las trayectorias tfpicas que corresponden a estabilidad, estabilidad asintotica e inestabi~:...:.:i6n
S(e) S(e)
S(6)
(a)
(b)
[c)
Figura 5-2 a) Estado de equilibrio estable y una trayectoria representativa; b) estado de equilibrio estable asintoticamente y una trayectoria representativa; c) estado de equilibrio inestable y una trayectoria representativa.
326
Capit:
lidad en forma respectiva. En la figura 5-2a), b) 0 c), la region S(8) limita el estado inicial x,:- ~. region S(e) corresponde a los limites de la trayectoria que se inicia de cualquier estado inicial ~ la region S(8). Observe que las definiciones anteriores no especifican la region exacta de las condici iniciales permisibles. Por tanto, las definiciones solo se aplican a la vecindad del estado de brio, a menos que S( e) corresponda a la totalidad del plano de estado. Observe que en la figura 5-2c) la trayectoria sale de S(e) y, por tanto, todo el estado de brio es inestable. No podemos, sin embargo, decir que la trayectoria se ira al infinito, ya que acercarse a un cicio limite fuera de la region S(e). (Si un sistema lineal de tiempo invariante inestable, las trayectorias que se inician incluso cerca del estado de equilibrio inestable van al i to. Pero tratandose de sistemas no lineales, esto no es necesariamente cierto.) Es importante sefialar que las definiciones aqui presentadas no son las (micas que definen conceptos de la estabilidad de un estado de equilibrio. De hecho, existen algunos libros con difi tes formas de definir la estabilidad. Por ejemplo, en la teoria de control convencional, solo aq sistemas que son estables asintoticamente se denominan sistemas estables, y aquellos sistemas bles en el sentido de Liapunov, pero que no son estables asintoticamente, se lIaman inestables. ejemplo es la estabilidad B180. Un sistema lineal de tiempo invariante se llama estable de en acotada y salida acotada (estable BIBO) si la salida que se inicia a partir de un estado inicial arb' rio queda acotada euando la entrada tambien esta acotada. Se debe notar, sin embargo, que en libro, cuando se utilice la palabra "estabilidad", por 10 general significara estabilidad asintotica ell sentido de Liapunov.
Teorema de Liapunov sobre fa estabilldad asintotica. Se puede demostrar que si una cion escalar V(x), donde x es un vector n, es definida positiva, entonces los estados x que satis
V(x) = C
donde C es una constante positiva, estan en una hipersuperficie cerrada en el espacio de estado de dimensiones, al menos en la vecindad del origen. Si V(x) ~ 00 conforme Ilxll ~ 00, entonces superficies cerradas se extienden sobre la totalidad del espacio de estado. La hipersuperficie V(x) C 1 esta enteramente en el interior de la hipersuperficie V(x) = Cz siempre que C 1 < Cz. Para un sistema dado, si es posible encontrar una funcion escalar definida positiva V(x). que su derivada de tiempo tomada a 10 largo de una trayectoria sea siempre negativa, ento conforme el tiempo aumenta, V(x) toma valores cada vez mas pequeflos de C. Conforme el tie aumenta, V(x) finalmente se reduce a cero y, por tanto, x tambien se reduce a cero. Esto imp estabilidad asintotica del origen del espacio de estado. EIteorema principal de estabilidad de Liap que es una generalizacion de 10 anterior, proporciona una condicion suficiente para la estabili asintotica. Este teorema puede enunciarse como sigue. Teorema 5-1. Suponga que un sistema esta descrito por
x = f(x, t)
donde
f(O, t) = 0,
para todo t
Si existe una funcion escalar V(x, t) con derivadas parciales de primer orden continuas y que sati gan las condiciones
327
-:-ccs el estado de equilibrio en el origen es uniforme y asint6ticamente estable. Si. ademas, Vex, t) ~ x conforme Ilxll ~ x, entonces el estado de equilibrio en el origen es :-:::TIc y asint6ticamente estable global. (Para pro bar este teorema, yea el problema A-5-18.) Las condiciones de este teorema se pueden modificar como sigue: I .
I"( x, t)
es definida positiva.
: . r (4)(t; x o, to), t) no desaparece para t ~ to para cualquier to y para cualquier Xo =I- 0, donde
dX t: xo, to) denota la soluci6n que se inicia a partir de X o en t = to'
ces el origen de sistema es uniforme y asint6ticamente estable global. ~a equivalencia de la condicion 2 del teorema y las condiciones modificadas 2' y 3' sepueden :~'TlO sigue. Si V(x, t) no es definida negativa sino s610 semidefinida negativa, entonces la !-=-::oriadel punta representativo se puede volver tangente a alguna superficie determinada Vex, t) .: ~Jdo que V(q,(t; XO, to), t) no desaparece para t ~ to para cualquier to y para cualquier Xo =I- 0, el .- representativo no puede permanecer en el punta tangente [el punto que corresponde a Vex, t) .}: : oor tanto debe moverse hacia el origen.
-r-
Teorema de Liapunov sobre fa establlldad. Para probar la estabilidad (pero no la estabilidad - ::ca) del origen del sistema definido por la ecuaci6n (5-82) se puede aplicar el siguiente teo-
Teorerna 5-2.
i=f(x,t)
r, O. t) = 0 para toda t. Si existe una funcion escalar _ orden continuas y que satisfaga las condiciones
L
Vex, t) que
x. l) es definida positiva.
l.
Inestabilidad. Si un estado de equilibrio x = 0 de un sistema es inestable, entonces existe una ',:- escalar W(x, t) que determina la inestabilidad del estado de equilibrio. A continuaci6n se :.:..-a un teorema sobre la inestabilidad.
328
CapitJO
Teorema 5-3.
x = rex, t)
donde
reo, t) =
0,
para todo t ~ to
Si existe una funci6n escalar W(x, t) que tenga primeras derivadas parciales continuas y que ga las condiciones 1. W(x, t) es definida positiva en alguna regi6n alrededor del origen. 2. W(x, t) es definida positiva en la misma regi6n. entonces el estado de equilibrio en el origen es inestable.
Observaciones. Cuando se aplica el analisis de estabilidad de Liapunov a sistemas no les es necesario hacer algunos comentarios.
1. En la aplicaci6n de los teoremas de estabilidad de Liapunov a un sistema no lineal, las ciones de estabilidad obtenidas a partir de una funci6n de Liapunov determinada son co nes suficientes pero no son condiciones necesarias. 2. Una funci6n de Liapunov para un sistema determinado no es (mica. Por tanto, es im sefialar que el no encontrar una funci6n de Liapunov adecuada para mostrar estabili estabilidad asint6tica 0 inestabilidad del estado de equilibrio bajo consideraci6n, puede informaci6n sobre la estabilidad. 3. Aunque una funci6n de Liapunov determinada puede probar que el estado en equilibrio consideraci6n es estable 0 estable asint6ticamente en la regi6n fl donde incluye este es equilibrio, esto no necesariamente significa que los movimientos son inestables fuera regi6nfl. 4. Para un estado de equilibrio estable 0 asint6ticamente estable, siempre existe una funce Liapunov con las propiedades requeridas.
Analisis de estabilidad de los sistemas lineales invariantes en el tiempo. Existen metodos para la investigaci6n de la estabilidad asint6tica de sistemas lineales invariantes en el po. Por ejemplo, para un sistema de tiempo continuo descrito por la ecuaci6n
x=
Ax
se puede decir que una condici6n necesaria y suficiente para la estabilidad asint6tica del orig sistema es que todos los valores propios de A tengan partes reales negativas, 0 que los c polinomio caracteristico
tengan partes reales negativas. De igual manera, para un sistema en tiempo discreto representado por la ecuaci6n
x(k
+ 1)
= Gx(k)
una condici6n necesaria y suficiente que se puede enunciar para la estabilidad asint6tica del es que todos los valores propios de G tengan magnitud menor que la unidad, 0 que los c polinomio caracteristico
329
-:",c~.;ren
~-. embargo, encontrar los valores propios puede ser dificil, en el caso de sistemas de orden .:r ~ cuando algunos de los coeficientes del polinomio caracteristico no son numericos. En
::=:"---:'s. puede aplicarse el criterio de estabilidad de Jury 0 los criterios de estabilidad de RouthEI metodo de Liapunov, que proporciona una altemativa al analisis de estabilidad de siste~~Ies invariantes en el tiempo, es algebraico y no requiere factorizacion del polinomio carac-~. como mas adelante se vera. Es importante notar que para los sistemas lineales invariantes . :.;;:-:-:po, el segundo metodo de Liapunov no da solo condiciones suficientes, sino tambien . .: =-.es necesarias y suficientes para la estabilidad 0 para la estabilidad asintotica. ::=- ;:1 siguiente analisis de estabilidad de sistemas lineales invariantes en el tiempo, se supone .: ..alor propio Ai de la matriz A es una cantidad compleja, entonces A debe contener a Ai' que '::'''.'.igado complejo de i..;, como su valor propio. Entonces, cualesquiera valores propios com.:t A apareceran como pares complejos conjugados. Asimismo, en las siguientes discusiones ~::J.bilidad, se unlizara la expresion de transpuesta conjugada, en lugar de la expresion de .e-sta de la matriz A, ya que los elementos de la matriz A pueden incluir conjugados comple~ :::-".;:Ilspuesta conjugada de A se describe como A *. Es una conjugada de la transpuesta:
'0':.
A*
= '~F
-ilfolisis de establlldad Liapunov de sistemas lineales en tiempo continuo e invariantes en e/ Considere el siguiente sistema lineal invariante en el tiempo:
x = Ax
1
(5-84)
;;s el vector de estado (un vector-n) y A es una matriz constante de n x n. Se supone que A Entonces el unico estado de equilibrio es el origen, x = O. La estabilidad del estado de "ero del sistema lineal invariante en el tiempo se puede investigar facilmente mediante el se, merodo de Liapunov. ?lra el sistema definido por la ecuacion (5-84), se escoge como posible funci6n de Liapunov
,=-.~ular.
V(x) = x*Px P ;:5 una matriz hermitica definida positiva. (Si x es un vector real, entonces P se puede '-::-ar como una matriz simetrica real definida positiva.) La derivada en el tiempo de Vex) a 10 .:.;: cualquier trayectoria es
Vex) se escogi6 para ser definida positiva, se requiere, para la estabilidad asint6tica, que sea definida negativa. Por tanto, se requiere que
V(x)
-x*Qx
330
Capitulo
donde
PII P
=
P12
~12
522
Pin P2n
donde Pi)' representa el complejo conjugado de Pi). La matriz P es definida positiva si todos menores principales sucesivos son positivos, esto es, si
P12 1 ~1I
P12
P12 P22
Pin P2n
En vez de especificar primero una matriz definida positiva P y examinar si Q es defini positiva, es conveniente especificar una matriz definida positiva Q primero y a continuacion ex nar si P calculada a partir de
A*P + PA = -Q
es definida positiva 0 no. Observe que el que P sea definida positiva es una condicion necesaria suficiente. Se resumira 10 anterior en forma de teorema. Teorema 5-4. Considere el sistema descrito por
x = Ax
donde x es un vector de estado (un vector n) y A es una matriz no singular constante de n x n. L condicion necesaria y suficiente para que el estado de equilibrio x = 0 sea asintoticamente es global es que, dada cualquier matriz Q hermitica definida positiva (0 cualquier matriz simetrica real finida positiva), existe una matriz P hermitica definida positiva (0 una matriz sirnetrica real definida sitiva) tal que
A*P + PA
-Q
La funcion escalar x'Px es una funcion de Liapunov para este sistema. [Observe que en el sist lineal considerado, si el estado de equilibrio (el origen) es asintoticamente estable, entonces asintoticamente estable global.]
Comentarios. AI aplicar eI teorema 5-4 al analisis de estabilidad de sistemas lineales tiempo continuo e invariantes en el tiempo, se pueden hacer algunos comentarios importantes.
:-=::6n 5-6
331
I. Si V(x) = -x'Qx no se desaparece a 10 largo de cualquier trayectoria, entonces Q se puede seleccionar para ser semidefinida positiva . ., Si Q se escoge como una matriz definida positiva arbitraria [0 una matriz semidefinida positiva arbitraria si V(x) no se desaparece a 10 largo de cualquier trayectoria] y la ecuacion matricial A*P
+ PA
= -Q
se resuelve para determinar P, entonces la definicion positiva de Pes una condicion necesaria
y suficiente para la estabilidad asintotica del estado de equilibrio x = O.
3. EI resultado final no depende de la matriz Q determinada escogida, siempre y cuando Q sea definida positiva (0 semidefinida positiva, segun el caso). 4. Para determinar los elementos de la matriz P, se igualan las matrices A'P + AP Y-Q, elemento por elemento. Esto resulta en n(n + 1)/2 ecuaciones lineales para determinar los elementos Pi; = Pp de P. Si se identifican los valores propios de A como AI, A , , Am cada uno es repetido 2 varias veces en relacion con su multiplicidad como una raiz de la ecuacion caracteristica, y si por cada suma de dos raices
entonces los elementos de P estan determinados en forma unica. (Observe que para una matriz estable Ala suma Aj + Ak es siempre diferente de cero.) 5. AI determinar si existe 0 no una matriz P simetrica real definida positiva 0 hermitica definida positiva, es conveniente escoger Q = I, donde I es la matriz identidad. Entonces los elementos de P quedan determinados a partir de A*P
+ PA
-I
5-8
El sistema s610tiene un estado de equilibrio en el origen. Seleccionando Q = I y sustituyendo I en la ecuaci6n (5-85), se tiene
A*P + PA = -I
Si observamos que A es una matriz real, P debera ser una matriz simetrica real. Esta ultima ecuaci6n se puede escribir como sigue:
-2]=_[10]
-4 0 1
(5-86)
donde se observa que P2I = P12 con 10 que se hace la sustituci6n apropiada. Si la matriz P resulta ser definida positiva, entonces x'Px es una funci6n de Liapunov y el origen es asint6ticamente estable.
332
Capitulo
P22
Por tanto,
p=
-~
11 60
60
-~] 60
!!
60
De acuerdo con el criterio de Sylvester, esta matriz es definida positiva. Por tanto, se concluye que origen del sistema es asintoticamente estable global. Debe hacerse notar que una funcion de Liapunov para este sistema es
V(x)
_ 7
][x M x~ ]
= 6\i(23x~ - 14xlx2
+ 1lx~)
V(x)
-x; - xi
Andllsls de estabilidad de Liapunov de sistemas en tiempo discreto. A continuacion extendera el analisis de estabilidad de Liapunov a los sistemas en tiempo discreto. Como en el de los sistemas en tiempo continuo, la estabilidad asintotica es el concepto mas importante ell estabilidad de los estados de equilibrio de los sistemas en tiempo discreto. Ahora se presentara un teorema de estabilidad para sistemas lineales 0 no lineales de tie discreto e invariantes en el tiempo, basados en el segundo metodo de Liapunov. Hay que senalar en los sistemas de tiempo discreto, en vez de V(x), se utilizara la diferencia directa V(x(k + I) V(x(kD), es decir
JV(x(kT))
Teorema 5-5.
=
xk
donde x = vector-n
+ l)T) = f(x(kT))
Suponga que existe una funcion escalar V(x) continua en x tal que
1. V(x) > 0 para x *- O. 2. LlV(x) < 0 para x*- 0, donde
JV(x(kT))
= V(x(k +
l)T) - V(x(kT))
= V(f(x(kT)))
- V(x(kT))
: : - 5-6 ;(0)
=
333
;1 x) ~ x cuando
:,-~~s
/lxll
oc
_: que significa que no es necesario que L\Vex) sea definida negativa si no se desaparece en cual; .;.er secuencia solucion de la ecuacion de diferencias.
Of
Andlisis de estabilidad de Liapunov de los sistemas lineales en tiempo discreto e invariantes el tiempo. Considere el sistema en tiempo discreto descrito por
x(k + 1)
\ =
Gx(k)
(5-89)
x n. EI origen 0 es el estado de equilibrio. Se investigara la estabilidad de este estado mediante el segundo -:odo de Liapunov. Se escoge como posible funcion de Liapunov
V(x(k)) = x*(k)Px(k)
:.:-:Je Pes un matriz hermitica definida positiva (0 una matriz simetrica real definida positiva). ::'.-:onces
.:1 V(x(k))
:'::c':o que V(x(k)) se selecciono para ser definida positiva, se requiere, para la estabilidad asintotica, a,e .1V(x(k)) sea definida negativa. Por tanto
.:1 V(x(k
:..:-de
= -x*(k )Qx(k)
ese modo, para la estabilidad asintotica del sistema en tiempo discreto de la ecuacion (5-89), es que Q sea definida positiva. Como en el caso de sistemas lineales de tiempo continuo, es conveniente especificar primero J:::C matriz Q hermitica definida positiva (0 simetrica real definida positiva) y a continuacion ver si a -:latriz P determinada por
G*PG - P
-Q
334
Capitulo 5
es definida positiva 0 no. Observe que una P definida positiva es una condicion necesaria y suficienteo Se resumira en un teorema 10 que se ha enunciado aqui. Teorema 5-6. Considere el sistema en tiempo discreto
x(k
+ 1) = Gx(k)
donde x es el vector estado (vector-s) y G es una matriz no singular constante de n x n. Una condicion necesaria y suficiente para que el estado de equilibrio x = 0 sea asintoticamente estable global es que, dada cualquier matriz Q hermitica definida positiva (0 sirnetrica real definida positiva) existe una matriz P hermitica definida positiva (0 simetrica real definida positiva) tal que
G*PG - P =-Q
(5-90)
La funcion escalar x'Px es una funcion de Liapunov para este sistema. Si Ll V(x(k)) = -x*(k)Qx(k) no se desaparece a 10 largo de ninguna serie de soluciones, entonces Q puede ser escogida como semidefinida positiva.
Estabilidad de un sistema en tiempo discreto obtenido al discretizar un sistema en tiempo continuo. Siel sistema se describe en terminos de ecuaciones en el espacio de estado, la estabilidad asintotica de un estado de equilibrio de un sistema en tiempo discreto obtenido al discretizar un sistema en tiempo continuo, equivale a la del sistema en tiempo continuo original. Considere un sistema en tiempo continuo
i = Ax
y el sistema correspondiente en tiempo discreto
x((k + l)T)
donde
Gx(kT)
Si el sistema en tiempo continuo es asintoticamente estable, es decir, si todos los valores propios de la matriz A tienen partes reales negativas, entonces
IIGnll~O,
cuando n
00
y el sistema discretizado tambien es asintoticamente estable. Esto se debe a que, si las Ai son los valores caracteristicos de A, entonces las eV son los valores propios de G. (Observe que lev I < I si A,T es negativa.) Se debe notar que si se discretiza un sistema en tiempo continuo con polos complejos, entonces en casos excepcionales puede ocurrir inestabilidad oculta, en funcion de la seleccion del periodo de muestreo T. Es decir, en algunos casos don de el sistema en tiempo continuo no es asintoticamente estable, el sistema discretizado equivalente pudiera parecer estable asintoticamente, si se observan unicamente los valores de salida en los instantes de muestreo. Este fenomeno ocurre solo para algunos valores del periodo de muestreo T. Si se varia el valor de T, entonces esta inestabilidad oculta aparece en forma de inestabilidad explicita. Yea el problema A-5-15.
Contraccion. Una norma de x denotada como Ilxll se puede pensar como una medida de la longitud del vector. Existen diferentes definiciones de norma. Cualquier norma, sin embargo, tiene las siguientes propiedades:
335
para x = 0 para
II x] = 0, IIxII > 0, Ilx + yll ~ IIxll + Ilyll, Ilkxll = Ikl [x], ':_-.cion rex) es una contracci6n si reO) = 0 y
.l.~:.m
x*-O
de Liapunov. (5-91 )
x(k
l..~..;na
1)
= f(x(k)),
f(O) = 0
\ es un vector-a y rex) es tambien un vector-no Suponga que rex) es una contracci6n para toda norma. Entonces el origen del sistema de la ecuacion (5-91) es asint6ticamente estable _:. una de sus funciones de Liapunov es
V(x)
se ouede ver como sigue. Dado que
= [x]
xermine la estabilidad del origen del sistema. Se escoje Q como I. A conrinuacion, con referencia a la ecuaci6n (5-90), la ecuacion de estabili~ de Liapunov se convierte en
-n-[~:: ~:~]
PlI - 2p12 =-1
-[~ ~]
(5-92)
... se encuentra que la matriz P es definida positiva, entonces el origen x = 0 es asint6ticamente estable ; :~al. De la ecuaci6n (5-92) se obtienen las siguientes tres ecuaciones:
se obtiene
PlI =.If,
P12 = ~,
336
En consecuencia,
CapitLlb
11 = [58
:5
24
:5
8]
Al aplicar el criterio de Sylvester para probar la definicion positiva de la matriz P, se encuentra que P definida positiva. Por tanto, el estado de equilibrio, el origen x = 0, es asintoticarnente estable global Observe que en vez de escoger Q como I se podria haber escogido Q como una matriz semidefi positiva, tal como
Q=[~ ~]
siempre y cuando ~V(x) = -x'(k)Qx(k) no se desaparezca a 10 largo de cualquier serie de soluciones. la matriz Q semidefinida positiva recien definida, se tiene
.1V(x) = -x~(k)
Para el sistema actual, x2(k) identicarnente cero implica que xl(k) es identicamente cero. Por tanto, ~ I no se desaparece a 10 largo de cualquier serie de soluciones, excepto en el arigen. Por tanto, se p escoger esta matriz Q semidefinida positiva para determinar la matriz P de la ecuacion de estabilidad Liapunov. La ecuacion de estabilidad de Liapunov, en este caso se convierte en
[~
-1
-1 -
0]
1
[~ ~]
:5
4
12
Al aplicar el criterio de Sylvester, se encuentra que P es definida positiva, par tanto se obtiene la conclusion que antes: el origen es asint6ticamente estable global.
Y(z) U(z)
Muestre que una representacion en el espacio de estado de este sistema puede estar dada por
xl(k + 1) ] x2(k + 1)
o o
-
o o
o
1
o o
1
Xn-l(~ + 1)
xn(k + 1)
:::::')05
337
Solucion
Y(z) bo + blz- I + bzz- z + ... + bnz- n U(z) = 1 + alz I + azz z + '" + anz n = b + (b l - albo)z-I + (b~l- azbo~~-z + '" + (~: - anbo)z-n o l+alz +azz +"'+anz
Esta ultima ecuacion se puede escribir como sigue:
(5-95) Se define
Y(z
)
= (b l
(5-96)
(5-97)
(b 1
Y(z) albo)z-I + (b z - azbo)z z + .,. + (bn - anbo)z-n U(z) l+alz I+ azz z+"'+anz n=Q(z)
Y(z) = (b i
Q(z)
338
Capitulo 5
(5-1011
zXn(z)
= -a1Xn(z) =
+ U(z)
(5-1021
xn(k + 1) Y(z)
= (bl
y(k)
AI usar esta ultima ecuacion, la ecuacion (5-97) puede ser escrita de la manera
= tb; -
anbO)xl(k) + (bn -
1 -
an-1bo)X2(k)
(5-1031
Si se combinan las ecuaciones (5-101) Y (5-102) obtenemos como resultado la ecuacion de estado dada por la ecuacion (5-93). La ecuaci6n de salida, ecuaci6n (5-103), se puede volver a escribir en la forma dada por la ecuacion (5-94). Problema A-5-2 (Metodo de programaci6n anidada)
Considere el sistema con funcion de transferencia pulso definido par n 1 G(z) = Y(z) = bo + b1z- + ... + bnzn 1++a l+alz U(z) nz
Muestre que la representacion en el espacio de estado de este sistema puede estar dado como sigue:
~ ~ -~:~l][ ~:~~~ ]
o
1 0 1
r
a:
-Ql
xn-l(k) xn(k)
(5-1
...
0 1]
+ bou(k)
(5-1
[ xn-l(k) xn(k)
339
Solucion
+ z-2[a2 Y(z)
o bien
Y(z)
(5-106)
+ Xn-I(z)]
(5-107)
X 2(z)
Y(z)
(5-108)
.~I sustituir la ecuacion (5-108) en la ecuacion (5-107) Ymultiplicar ambos lados de las ecuaciones por z, se obtiene
~I tamar las transformadas inversaz de las n ecuaciones anteriores y al escribir las ecuaciones resultantes en orden inverso, se obtiene
XI(k + 1) x2(k
+ 1) = xI(k)
+ (bn- t
- an-t bo)u(k)
xn-I(k + 1) = x n-2(k) - a2xn(k) + (b, - a2bo)u(k) xn(k + 1) = xn-l(k) - at xn(k) + tb, - at bo)u(k)
-:-lmbien, la transformada inversa z de la ecuacion (5-108) da
y(k)
-C'S
= xn(k)
+ bou(k)
,,: \ olver a escribir la ecuacion de estado y la ecuacion de salida en la forma estandar matricial, obtenelas ecuaciones (5-104) y (5-105), respectivamente.
"'Q"I~ma
A-5-3 vletodo de programacion de expansion en fracciones parciales) .r.msferencia pulso dado por
340
Y(z) U(z)
Copito :
Demuestre que la ecuaci6n de estado y la ecuaci6n de salida se puedcn dar en la forma can6nica diagonal siguiente, si todos los polos son distintos.
(5-1 .:,.;,
y(k) =
Solucion
[CI
C2
'"
cnl[;:~~~]
xn(k)
+ bou(k)
(5-1 !'j
Y(z) U(z)
= bo +-
En vista de que todos los polos de la funci6n de transferencia pulso Y(z)/U(z) son distintos, Y(;;)/..I:: puede expandir a la forma siguiente:
n - - = b o + - - + - - + , .. + - -
Y(z) U(z)
CI
C2
Z-PI .
Z-P2
z-pn
(5-1 ;
donde
c,
[Y(Z)
Y(z) = boU(z)
(5-1 ;
z - PI
Z - P2
Z - pn
X1(z)
= --
1 U(z) z - PI
X 2(z) = - - U(z) z - P2
(5- I:
1 Xn(z) = - - U(z) z - pn
La ecuaci6n (5-114) se puede volver a escribir como
zXI(z) = PIXI(Z)
+ U(z)
(5-1 J
Capitula 5
341
x,(k + 1)
= PIXl(k) + u(k)
(5-117)
Y(z) U(z)
Suponga que el sistema incluye varios polos del orden m en .: = p, y que todos los demas polos son distintos. Demuestre que este sistema puede representarse por la siguiente ecuaci6n de estado y por la siguiente ecuacion de salida:
PlIO a PI 1
xm(k + 1) xm+I(k + 1)
0: I 0:
I I I
0 0
0
a o
o a
+
xm+I(k)
1
a a
PI:
a
0 pn
---------------4------------
u(k)
(5-119)
o 0 0 a a a
0 : pm+I
I I
I
0: a
I
y(k) =
Solucion
[cI
C2
...
cn][;~~~~]
xn(k)
+ bou(k)
(5-120)
Dado que la funcion de transferencia pulso del sistema se puede eseribir en la forma
Y(z) U(z)
hoz n + h1z n- 1 + '" + bn-1z + bn (z - pl)m(Z - Pm+I)(Z - Pm+2)'" (z - Pn) (b l - a l ho)zn-l + (b2 - a2 bo)z n- 2 + ... + (bn - an bo) = b + (z - PI)m(Z - Pm+l)" . (z - Pn)
Cm+l
C m+2
(5-121)
342
se obtiene
Capitulo 5
Y(z)=boU(z)+(
Z - PI
CI
)mU(z)+(
C2)m IU(Z)+"'+~U(z) Z - PI Z - PI
(5-122~
Cm+1
Z -
pm+1
U(z) +
Las primeras m variables de estado XI(z), X2(z), ... , Xm(z) se definen mediante las ecuaciones
(5-1231
Xm(z)
= - - U(z)
z - PI
y las n - m variables de estado restantes Xm+ I(Z), x'n + iz), ... ,Xn(z) se dcfinen mediante las ecuaciones
Xm+l(z) Xmdz)
Z - pm+1
U(z)
1 U(z) z - pm+2 1
(5-1241
Xn(z)
= --U(z)
Z -
pn
Observe que las m variables de estado definidas por la ecuaci6n (5-123) estan relacionadas una con la otra, mediante las ecuaciones siguientes:
XI(Z)
X 2(z )
=-Z -
PI
(5-1251
X 2 (z ) Xiz)
z - PI
Xm-I(Z) Xm(z)
Z - PI
Al tomar las transformadas inversas z de toda la ecuaci6n (5-125), la ultima ecuaci6n de la ecuaci6n (5123) Ytoda la ecuaci6n (5-124), sc obtiene
XI(k + 1) x2(k + 1)
= =
xm-I(k + 1) xm(k + 1)
= =
=::'ulo 5
343
=
xm+l(k + 1)
pm+1Xm+l(k) + u(k)
Y(z)
(5-127)
.-\1 volver a escribir las ecuaciones (5-126) y (5-127) en la forma estandar matricial, se obtienen las ecuaciones (5-1 19) Y (5-120), respectivamente.
""")blema A-5-5 Utilizando el rnetodo de programaci6n anidada (refierase al problema A-5-2), obtenga la ecuaci6n de estado y Ia ecuaci6n de salida para el sistema definido por
Y(z) U(z)
.-\ continuaci6n dibuje un diagrama de bloque para el sistema, que muestre todas las variables de estado. Soluci6n La funci6n de transferencia pulso dada se puede escribir en la forma
= z-I[5U(z)
- 3Y(z)]
"""-olema A-5-6
Obtenga una representaci6n en el espacio de estado del sistema mostrado en la figura 5-4. EI periodo de muestreo T es de 1 segundo.
344
u(k)
Ccc
x,
(kl
y(kl
Figura 5-3
VIs)
1 - e r,
VIs)
G(z)
Figura 5-4
Soluci6n
G z - Z
( ) -
1 ] - 11 - : [ - s - s(s + 1) - (
Z-l
Z[
S2(S
+ 1)
Z-l
0.6321z- 1
I
1 - z-t - 1 - 0.3679z
La figura 5-5 muestra el diagrama de bloques para el sistema. Se escoje la salida del elemento de rcu unitario como una variable de estado, como se muestra en la figura 5-5. Entonces sc obtiene
345
x,
(k)
X,(z)
u(k)
y(k)
Y(z)
VIz)
Figura 5-5
zX1(z)
X1(z) - O.6321X2(z)
+ 1)
y(k)
= -xl(k)
+ x2(k) + u(k)
= xl(k)
- O.6321xlk)
es decir
X1 + (k [ x2(k + 1)
y(k)
"""blema A-5-7 Obtenga la representacion en el espacio de estado del siguiente sistema con funcion de transferencia
pulsu:
Y(z) U(z)
I~
5 (z + 1)2(z + 2)
se el metoda de programacion de expansion en fracciones parciales. Tambien obtenga los valores niciales de las variables de estado en terrninos dey(O).y( I) y y(2). A continuacion dibuje un diagrama de bloques para el sistema.
Solucion Ya que se necesitan los valores iniciales de las variables de estado en terrninos de y(O),y( I) Y '.,2). se modificara Iigcramentc el metodo de programacion de expansion en fracciones parciales presen.ado en la seccion 5-2. Se expanden Y(z)/U(z), zY(z)/U(z) y Z2}'(Z)/U(z) en fracciones parciales como 5lgue:
346
--=
Copitulc
Y(z) U(z)
5 5 5 ---+-(z + 1)2 Z + 1 z + 2
--=-
zY(z) U(z)
5 10 10 +----(z + 1)2 Z + 1 z + 2
--=
Z2 Y(z) U(z)
Entonces se tiene
-5
5
10 -10
-15
z+1
1
Z2 Y(z) U(z)
20
z +2
X\(z) U(z) X 2(z) U(z) X 3(z) U(z)
1 (z + 1)2
-1z +1
(5-1
-1z +2
Asi, las variables de estado XI (z), Xiz) y XJ(z) estan relacionadas con Y(z), z Y(z) Y:?Y(z) como sigue:
zY(z) Z2 Y(z)
Y(Z)] =
[5 -5
-5 5
10 -10 -15 20
5][X\(Z)] X
2(z)
(5-1-
X 3(z)
(z + 1)2X\(z) = U(z)
(z
+ I)X2(z)
= U(z)
(z + 2)X3(z) = U(z)
Si observamos que
(z + I)X\(z) = X 2(z)
se obtiene
U(z)
=::~Iulo 5
347
xl(k + 1) = -xl(k) + x2(k) x2(k + 1) = -x2(k) + u(k) x3(k + 1) = -2x3(k ) + u(k) y(k) = 5Xl(k) - 5X2(k) + 5X3(k)
es decir
+ [0] u(k)
1
1
Los datos iniciales se obtienen mediante el uso de la ecuacion (5-129), como sigue
[ ;~~~~]
X3(0)
1"T)blema A-5-8
[_~ ~~ _1~]-1[~~~~]
5 -15 20
y(2)
[ :1 ~ 1 O][Y(O)] ~ t y(l)
y(2)
Obtenga una representaci6n en el espacio de estado del siguiente sistema con funcion de transferencia pulso, tal que la matriz de estado sea diagonal:
2 Y(z) Z3 + 8z U(z) = (z + 1)(z
+ 17z + 8 + 2)(z + 3)
Y a continuaci6n obtenga el estado inicial x(O) en terrninos de y(O), y( I), y(2) Y u(O), u( I) 1/(2).
Soluci6n
Primero se dividen los numeradores de los lados derechos de }"(:VU(:), :T(=)IU(=) y =2Y(=)1
C(=) entre los denominadores respectivos y se expanden los terminos restantes en fracciones parciales.
como sigue:
5
Figura 5-6
348
Ccp.:
Y(z) = 1- _1_ + _2_ + _1_ U(z) z +1 z +2 z +3 zY(z) 1 4 3 --=z+2+-------U(z) z+l z+2 z+3
Z2 Y(z) 2 1 8 9 - - = z + 2z - 6 - - - + - - + - U(z) z +1 z +2 z +3
Rescribiendo, se tiene
Y(z) - U(z) U(z) zY(z) - zU(z) - 2U(z) U(z) 2U(z) Z2Y(Z) - z - 2zU(z) + 6U(z) U(z)
es decir
= __ 1_
z +1
1
=
+ _2_ + _1_ z +2 z +3
4 3
z +1- z +2- z +3 z +1 z +2 z +3
1
= __ + _8_ + _9_ 1_
-1
z +1
-4 -3
-1
-1-1z +3
z +2
Y(z) -
Z2
-z + 1
1
z +2
1
(5-1
z +3
(5-I::t
zX1(z)
-Xj(z) + U(z)
x-I]: + 1)
-xl(k) + u(k)
-3X3(k) + u(k)
==::Jitulo 5
Problemas de ejemplo
y soluciones
349
y(k)
[-1 21l[:~~~~]
x3(k)
9
+ u(k)
[ :~~~~]
x,(O)
u(k)
y(k)
Figura 5-7
350
Problema A-5-9 Sea A una matriz de n
Capitulo
que
=
Soluci6n
donde
Observe tambien que (AI - A) adj (AI - A) = [adj (AI - A)](AI - A) = IAI - All Por tanto, se obtiene IAI - All = un
= (B\A n-\ +
De esta ecuaci6n se ve que A y B,(i = 1,2, ... ,n) conmutan. Por tanto, el producto de (AI- A) por adj(AI - A) se convierte en cera si cualquiera de estos es cera. Si A se escribe en lugar de A en esta ultima ecuacion, entonces claramente AI - A se convierte en cera. Por tanto,
Problema A-5-10 En referencia al problema A-5-9, se ha demostrado que cada matriz A de n x n satisface su propia ecuaci6n caracteristica. No obstante, la ecuacion caracteristica no es la ecuaci6n escalar de grado minimo que A puede satisfacer. EI polinomio de grado minimo que tiene A como raiz se conoce como polinomio minimo. Es decir, el polinomio minimo de una matriz A de n x n se define como el polinomio c/>(A) de grado minimo:
m
tal que c/>(A) = 0, es decir
:s;
cf>(A)
EI polinomio minima juega un papel importante en el calculo de los polinomios de una matriz de n x n. Supongamos que d(A), un polinomio en A,es el maximo comun divisor de todos los elementos de adj(AI- A). Demuestre que si el coeficiente del termino de mayor grado en A de d(A) se escoge como I entonces el polinomio minima cf>(A) esta dado por
IAI - AI
cf>(A)
d(A)
351
Solucion
Por la suposicion, el maximo cornun de la matriz adj(AI- A) es d(A). Por tanto adj (AI - A) = d(A)B(A)
(5-133)
coeficiente del terrnino de mayor grado en Ade l{!(A) es la unidad. De las ecuaciones (5-132) 5-133) se tiene (AI - A)B(A) = l{!(A)I
~3
tanto.
l{!(A) = 0
'~,ene que IjJ(A) se puede escribir como sigue
l{!(A)
- _0:
= g(A)(A) + a(A)
~: nde a(A) es de menor grado que (A). Dado que IjJ(A) = 0 Y (A) = 0, se debe tener que a(A) = O. Dado
c!>(A) es el polinomio mlnimo, a(A) debe ser identicamenn, cero, es decir l{!(A) = g(A)(A) debido a que (A) = 0, se puede escribir (A)I = (AI - A)C(A)
~,ene que,
= g(A)(A)I = g(A)(AI
B(A) = g(A)C(A)
- A)C(A)
'b,cne que el maximo cornun divisor de los n 2 elementos de B(A) es la unidad. Por tanto g(A)
~,~
=1
aqui que.
l{!(A) = (A)
~ -:'onces, de esta ultima ecuacion y de la ecuacion (5-133), se obtiene
(A) =
IAI- AI d(A)
x
Hay que scnalar que el polinomio minimo (A) de una matriz A de n orocedimiento siguiente:
352
CapjrJ~
2. Determine d(A) como el maximo cornun divisor de todos los elementos de adj(AI- A). Selecci el coeficiente del terrnino de mayor grado en A de d(A) como I. Si no existe divisor con d(A) = 1. 3. EI polinomio minirno 4>(A) entonces esta dado como IAI - AI dividido entre d(A).
Problema A-5-11 Si una matriz A de n x n tiene n valores propios distintos, entonces el polinomio minima de A es idei al polinomio caracteristico. Asimismo, si los diversos valores propios de A estan enlazados en una na de Jordan, el polinomio minimo y el polinomio caracteristico son identicos, Si, sin embargo.. diversos valores propios de A no estan enlazados en una cadena de Jordan, el polinomio minimo es grado menor que el polinomio caracteristico. Utilizando como ejemplo las matrices A y B que siguen, verifique los enunciados anteriores relaci6n con el polinornio minimo, cuando se relacionan varios valores propios.
2 1
A = 0 2
[o 3
B=
2 0 0] [
0 2 0 031
Solucion
IAI - AI
-3
04 1 = (A - 2)2(A - 1) A-I
Asi, los valores propios de A son 2. 2 Y I. Se puede demostrar que la forma can6nica Jordan de A es
[H ~]
y los va!ores propios multiples estan enlazados en la cadena Jordan como se muestra. (Para obterxr forma can6nica Jordan de A, refierase al apendicc A.) Para determinar el polinomio rninimo, primero se obtiene adj(AI - A). Este esta dado por adj(AI - A)
=
(A - 2)(A - 1) 0 [
(A + 11) (A - 2)(A - 1)
4(A 0- 2)]
(A - 2?
=
3(A - 2)
Observe que no existe un divisor cornun de todos los elementos de adj(AI - A). Por tanto, di): I Entonces, el polinomio minimo 4>(A) es identico al polinomio caracteristico, es decir 4>(A)
A3
pero
5A 2 + SA - 41 = 0
A2
3A
21 of- 0
Por tanto, se ha demostrado que el polinomio minima y el polinomio caracteristico de esta matriz A los mismos.
. :J
353
IAI - BI
A- 2 0
0 A- 2 -3
0 0 A- 1
.n calculo simple revela que la matriz B tiene tres vectores propios, y que la forma canonica Jordan de B esta dada par
[H ~]
:\'r tanto, los val ores propios multiples no estan enlazados. Para obtener el polinomio minima, primero .~ calcula adj(AI - B):
(A - 2)(,\ - 1)
adj(AI - B)
~~
=
[
o
(A - 2)(A - 1) 3(A - 2)
d(A)=A-2
:0
or tanto.
q,(A) =
. ~'.1
mediante el uso del polinomio minima la inversa de una matriz no singular A se puede un polinomio A con coeticientes escalares, como sigue:
(5-134 )
_ -jc
(/1' (/, . . .
-io -~]
-3
<otuclon EI polinomio minimo q,(A) de una matriz no singular A. se puede escribir como sigue:
354
donde am
* O. Par tanto,
1=
_l-(A m+ a am am
(A m 1
Am -
+ ... +
am_2A2 + am-
1A)
A-
= - -1
+ al A m - 2 + ... +
am-2 A + am-I I)
que es la ecuacion (5-134). Para una matriz dada A, se puede dar adj(.\I - A) como sigue:
adj (AI - A)
2 2A + 6 A + 4A + 3 3.\ + 7 A2 + 2A - 3 [
A
-4] -2A + 2
A2
-
Claramente, no existe un divisor comun d(.\) de todos los elementos de adj(.\I - A). Por tanto d(.\) = I. consecuencia, el polinomio rninirno 4J(.\) esta dado por la ecuacion
4J(A)
IAI - AI d(A)
IAI - AI
Asi, el polinomio minimo 4J(.\) es el mismo que el polinomio caracteristico. Dado que la ecuaci6n caracteristica es
IAI - AI = A3 + 3A 2 - 7A - 17 = 0
se obtiene
4J(A)
= A3 + 3.\2 - 7A - 17
Al identificar los coeficientes a, del polinomio minimo (que en este caso es el mismo que el polinOlllliii caracteristico), se tiene
a2 =
-7,
l-[[_~ 2 ~ 17 -2
17 2.
17
-:]
9
Problema A-5-13 Demuestre que la inversa de zI - G puede estar dada par la ecuaci6n
-1
J...
17
(zI - G)
+ H l z n - 2 + H 2z n - 3 + .,. + H n IzI - GI
rsns
::::aprtulo 5
355
donde HI = G H2
+ all
= GH I + a 2 1
= GH n 2
Hn-
+ +
an-I I an 1= 0
H, = GH n -
y a" a b
... ,
a, = -trG
an = - - trGH n -
Para simplificar la deducci6n, suponga que n = 3. (Se puede facilmente extender la deducci6n al caso de cualquier entero positivo n.) Solucien Observe que
(zl - G)(lz 2 + HI Z + H 2 ) = z 31 - z 2G + z 2H I - zGH I + zH 2 - GH 2 = z 31 - z 2G + Z2(G + all) - zG(G + all) +z[G(G + all) + a 2 1] - G[G(G + all) + a 2 1] = z 3 1 + alz 21 + a2z1 + a 3 1 - G3
-a 1 G 2
a2 G - a 3 1
(5- I 36)
EI teorema Cayley-Hamilton (vea eI problema A-5-9) indica que una matriz G de n x n satisface su propia ecuaci6n caracterfstica. Dado que n = 3 en el caso presente, la ecuaci6n caracteristica es IzI - GI y G satisface la ecuaci6n siguiente: G3
= Z3 + al Z2 + a2Z + a3 = 0
= 0
+ al G2 + a2 G + a3 I
(zl - G)(Iz 2 + Hj z + H 2 )
En consecuencia,
356
A continuaci6n se demostrara que
Cap
al = -trG
a2 = -~ trGH I
a3 =
-t trGH 2
Se transformara G en una matriz diagonal si G involucra n vectores propios lineal mente independi (donde n = 3 en el caso presente) 0 en una matriz en la forma can6nica Jordan si G incluye menos vectores propios lineal mente independiente. Es decir,
p-I GP = D
o bien
= matriz en
forma diagonal
8- 1 G8
donde las matrices P y 8 son matrices de transformaci6n no singulares. Como el calculo que sigue se aplica independientemente de si la matriz G pueda ser transfo en una matriz diagonal 0 en una matriz en la forma can6nica Jordan, se utilizara Ja notaci6n
rlGT = I>
donde I> representa ya sea una matriz diagonal 0 una matriz en la forma can6nica Jordan, segun caso. En 10 siguiente primero se demostrara que
HI = I> + al I H 2 = I>HI
Entonces se mostrara que
+ a2I
al = -trl>
a2 = - ~ tr I>HI
t trl>H 2
tr AB = trBA
se tiene
trTI>T- I
Observe asimismo que
+ B)
= trA
+ trB
Y ahora se tiene
trG
= trTI>T- I = trl>
+ al I)
= trG
trGH I = trG(G
2 + tr s, G
:::pitulo 5
357
trTD3T- 1 + tralTDzT- 1 + trazTDT- 1 = trD3 + tralD z + trazD = tr(D 3 + alD z + azD) = trDH z
Se escribe
T- l GT = D =
* a pz [a a
PI
* P3
0]
l". Entonces
z
IzI
- D
=z
= Z3
+ al ZZ + az z + a3
donde
Observe que
tr D = PI + p: + P3 = -al
Z tr DHI = tr D(D + al I) = tr D + tr al D
= =
tr Dfl;
3PIPZP3 = -3a3
al = -trD = -trG
az =
a3 = Problema A-5-14
t trGH z
358
.,
Obtenga la representaci6n en el espacio de estado en tiempo continuo del sistema. A continuaci6n di~ el sistema y obtenga la representaci6n en el espacio de estado en tiempo discreto. Tambien obte~ funci6n de transferencia pulso del sistema discretizado. I Solucion Para la funci6n de transferencia dada tenemos
ji +
Se define
wZy
= wZu
X2
=-y
W
1.
[;:J
y
=
=
La representaci6n en el espacio de estado en tiempo discreto del sistema se obtiene como sigue, observar que
A
se tiene
[~w ~
=[ ]
_ ::-1 y
SZ
~
+
W
s +
SZ
W] + WZ
+
W Z
SZ
SZ
H=
=
(re )B = (r[
AA
dA
[1 ~e~:;T]
=
Por tanto, la representaci6n en el espacio de estado en tiempo discreto del sistema oscilatorio se conviene
Xl((k + l)T)] = [ cos wT senwT ][Xl(kT)] + [1 - cos WT]U(kT) [ xz((k + l)T) -sen wT cos wT xz(kT) sen wT y(kT)
(5-60):
[1
Ol[XI(kT)] xz(kT)
La funci6n de transferencia pulso del sistema discretizado se puede obtener a partir de la ecu
Capitulo 5
359
1 [1 2z cos wT + 1
_ (1 - coswT)(z + 1) Z2 - 2z cos wT + 1
Por tanto,
Y(z) _ U(z) -
Z[l - eS
Ts S2
2 ] _ -
+ w2
(1
-
-1)Z[l
S2
+ w2
)
2
s]
= (1 _ Z-I)(_l_ _
1-z-1
[a)
-s-:
U(s)
U(z)
~ll-se-rsH,--_~~
or
(bl
Y(z)
Figura 5-8 a) Sistemaen tiempocontinuodel problema A-5-15; b) version discretizada del sistema.
360
del sistema en tiempo continuo. EI sistema discretizado tambien es estable pero no es asintoticaz estable. Suponiendo una entrada escalon unitario, demuestre que el sistema discretizado puede rrx oscilaciones ocultas cuando el periodo de muestreo T adopta cierto valor.
Soluci6n
Y(s)
Por tanto,
S2
+4~
1
=
S2
+4
yet) = cos2t
0
-1
(a)
y(kTi
0
11 -1
211
311
411
kT
(b)
y(kTi
y (t) -,
\ \
I I
\
\
,.. /
\ I
\
\
~\
\ \
211
/-,
I \
11
\
-1
-,
I
I
311
,,/
"
\
,/
411
kT
(c)
Respuesta en escal6n unitanoy(t) del sistemaen tiempocontinuomostrado en la figura 5-8a); b) graficade y(k7) cn funci6n de kT del sistemadiscretizado que se presenta en la figura 5-8b) cuando T= 7r scgundos; c) grafica dey(k7) en funci6n de kTdcl sistemadiscretizado cuando T= 7r segundos. (En el diagrama se muestran las oscilaciones ocultas.)
a)
Figura 5-9
:opitulo 5
361
Y(z) U(z)
= Z[1
Ts
- e-
--L] =
s2+4
1
(1 _ Z-I)Z[_S_] s2+4
2
Y(z
1 - 2z
= 1-
cos2T + z
2
1 - Z-I
La respuesta y(k7) se hace oscilatoria si T= ntt segundos (n = I, 2, 3, ...). Por ejernplo, la respuesta del sistema discretizado cuando T= 7T segundos se convierte en:
Y(z)
Por tanto,
= -+1Z-2 = 1 -1
y(O)
Z-2
=1
1 1Z
I
1
= 1Z-I
1 - 2z
=
La respuestay(k7) para k = 0, 1,2, ... es constante e igual a uno. La grafica de y(k7) en funci6n de kT cuando T= 7T se muestra en la figura 5-9c). Observe que si T= 7T segundos (de hecho, si T= n7T segundos, donde n = 1,2,3, ...) la secuencia de respuesta al escal6n unitario se conserva en la unidad. Dicha respuesta puede damos la impresi6n de que y(t) es constante. La respuesta real no es constante ya que oscila entre I y -I. Por tanto, la salida del sistema discretizado cuando T= 7T segundos (0 cuando T= n7Tsegundos, donde n = 1,2,3, ... ,) muestra oscilaciones ocultas. Observe que dichas oscilaciones ocultas (inestabilidad oculta) s610 ocurren para ciertos valores del periodo de muestreo T. Si se varia el valor de T, estas oscilaciones ocultas (inestabilidad oculta) apareeeran en la salida como oscilaciones explicitas. Problema A-5-16 Aunque el sistema con doble integrador es dinarnicamente simple, representa una clase de sistema importante. Un ejemplo de sistema con doble integrador es el sistema de control de altitud de un sate lite, que se puede describir como
Jjj = u + v
362
Capitula 5
donde J es el momento de inercia, e es el angulo de altitud, u es el par de control, y IJ es el par de: perturbaci6n. Considere el sistema con doble integrador en ausencia de entrada de perturbaci6n. Se define J() = y. Entonces la ecuaci6n del sistema se convierte en
ji=u
Obtenga una representaci6n en el espacio de estado en tiempo continuo del sistema. A continuaci6n obtenga un equivalente en tiempo discreto. Tambien obtenga la funci6n de transferencia pulso para d sistema en tiempo discreto. Solucion Defina
XI
=Y
X2
= oj
A=[~ ~l B=[~]
se tiene
[1
T][Xl(kT)] + 0 1 x2(kT)
[~2 ]U(kT) T
[1 OJ[Xl(kT)]
x2(kT)
La funci6n de transferencia pulso del sistema en tiempo discreto se obtiene a partir de la ecuaci6n (5-60) como sigue:
Gfl H + D
::Jpitulo 5
363
V(x)
~ xTPx ~ (x,
1
x, xf~ -1
10 41 1 1-2 -1
= :][;:]
-21 > 0 -11
10 > 0,
10 >0 1 4 '
11
En vista de que todos los menores principales sucesivos de la matriz P son positivos, Vex) es definida positiva.
x=f(x,t)
Suponga que
f(0, t) = 0,
t) satisface las condiciones:
para todos t
Suponga que existe una funcion escalar Vex, t) que tiene primeras derivadas parciales continuas. Si Vex,
1. Vex, t) es definida positiva. Esto es, V(O, t) = 0 y Vex, t) ~ a(/lx/l) > 0 para toda x*-O y para toda t, donde a es una funcion escalar no decreciente continua tal que a(O) = O. . 2. La derivada total V(x, t) es negativa para toda x*-O y para toda t, es decir V(x, t) ::; -')'(/lxID < 0 para toda x*-O y toda t, donde 'Yes una funcion escalar no decreciente continua tal que ')'(0) = O. 3. Existe una funcion escalar no decreciente continua 13 tal que 13(0) = 0 y para toda t, Vex, t)::; 13(/lx/l). 4. a(/lx/l) se aproxima al infinito conforme [x] aumenta en forma indefinida, es decir
eel/xII --7
00 ,
cuando
Ilx/i --7
00.
Entonces el origen del sistema, x = 0, es uniforme y asintoticamente estable global. (Este es el teorema de estabilidad principal de Liapunov.) Pruebe este teorema.
364
Soluci6n
Co pi
1. EI origen es uniformemente estable. 2. Cualquier solucion esta acotada en forma uniforme. 3. Todas las soluciones convergen al origen cuando t ---7 00 uniformemente en to Y IIxoll ::;; 8, do fijo, pero arbitrariamente grande. Es decir, dados dos numeros reales 8 > 0 y p > 0, existe numero real T(p, 8) tal que
Ilxoll
10 que implica que
:$
para toda t ~ to + T(p, 8) donde cf>(t; x o, to) es la solucion de la ecuacion diferencial dada. En vista de que 13 es continuo y 13(0) = 0, se puede escoger una 8(e) > 0 tal que f3( 8) < 0:( e) para cual e> O. La figura 5-10 muestra las curvas o:(llxll) f3(llxlD y Vex, t). Al observar que -
I' v(
'0
t > to
0:
Por tanto, se ha demostrado que para cada numero real e> 0 existe un numero real 8> 0 tal que IlXol implica que lIcf>(t; x o, to)11 ::;; e para toda t ~ to. Asi, se ha probado la estabilidad uniforme. Ahora se probara que IIcf>(t; xo to)ll---7 0 cuando t ---7 00 en forma uniforme en to Y Ilxoll ::;; 8. Se ,
13(0)
OlE)
II XII
=zctulo 5
365
cualquier 0 < Il < Ilxoll Yse encuentra una v(1l) > 0 tal que (3(v) < a(Il). Se denota e'(Il, 0) > 0 el minima de la funci6n continua no decreciente Y(llxll) en el conjunto compacto v(1l) ::;; Ilxll::;; e(o). Se define
10
+ T. Entonces se tiene
o<
10 que resulta en una contradiccion: por tanto. para un valor de I en el intervalo 10 ::;; I::;; tl' como es un valor arbitrario 11 se tiene
Por tanto.
para toda t
~ 12 ,
Entonces.
Problema A-5-19
En el anal isis del plano r, una matriz G de n x n cuyos n valores propios tienen magnitudes menores que la unidad se conoce como una rnatriz estable. Considere una matriz P hermitica (0 sirnetrica real) de 11 x II que satisface la ecuaci6n matricial siguiente:
G*PG - P =
-Q
(5-137)
donde Q es una matriz de 11 x n definida positiva hermftica (0 sirnetrica real). Pruebe que si la matriz G es estable, entonces una matriz P que satfsface la ecuaci6n (5-137) es unica yes definida positiva. Pruebe que la matriz P puede estar dada por
P=
L (G*tQG
k~O
Pruebe tarnbien que a pesar de que ellado derecho de esta ultima ecuaci6n es una serie infinita la matriz es finita, Por ultimo. pruebe que si se satisface la ecuaci6n (5-137) mediante matrices definidas positivas P y Q. entonces la matriz G es una matriz estable. Suponga que todos los valores propios de G son distintos y todos los vectores propios de G son linealmente independientes. Solucion Suponga que existen dos matrices PI Y P2 que satisfacen la ecuacion (5-137). Entonces
(5-138)
G*PzG - P z
= -Q
0
(5-139)
P=
(5-140)
366
donde
Capitulc 5
P = PI
- P2
Xi
Xi
GXi
Por tanto, de la ecuaci6n (5-140), se obtiene
Ai Xi
G*PGXi -
Px i = G*PAixi
Px i =
(AiG* -
I)Px i = 0
(5-Im
La ecuaci6n (5-141) implica que ,17' es un valor propio de G*. Dado qU,e 1,1,1 < I, se tiene que 1,17 1 I > L Esto contradice la suposici6n de que G es una matriz estable. Por tanto, P debe ser una matriz cero. 0 cs necesario que
Por tanto, se ha probado la unicidad de la matriz P, que es la soluci6n a la ecuaci6n (5-137). Para probar que una matriz P, que satisface la ecuaci6n (5-137), puede estar dada por
P =
2: (G*lQG k
k~O
(5-1
k P = (G*)oQGo + kt (G*lQG = Q +
G*[k~O (G*)kQGk]G
= Q + G*PG
Por tanto, se satisface la ecuaci6n (5-137). Dado que la matriz Q es una matriz positiva definida, de ecuaci6n (5-142) la matriz P tambien es positiva definida. Ahora se probara que, aunque la matriz P dada por la ecuaci6n (5-142) es la sum a de una infinita, se trata de una matriz fin ita. En raz6n de las suposiciones hechas en el enunciado del probl los valores propios Ai son distintos y los vectores propios de G son lineal mente independientes. Pan valor propio Ai asociado con el vector propio Xi' se tiene
x;l L(G*)k QG k Jx
k=O
r~
GXi = Aixi
i.
xt(G*)2QG2 Xi
= (Xi* G*)(G*QG)(GXi) = Aixt G*QGAixi = IAd\xt G*)Q(GXi) = IA iI 2(A xnQ(A i Xi) i 21A 2xt = IA il il QXi
xt
[i:
k-O
+ ...
-::::'Jlo5
367
es una matriz finita. Finalmente, se probara que si la ecuaci6n (5- 137) es satisfecha por las matrices definidas positivas P y Q, entonces la matriz G es una matriz estable. Se define el vector propio asociado con un valor propio A, de G como x.. Entonces Gx,=A,x, Premultiplicando ambos lados de la ecuaci6n (5- 137) por x; y postmultiplicando ambos lados por x., se obtiene xt G*PGx, - xt Px, = -xt Qx, Por tanto, A,xtPA,x, - xtPx, = -xtQx,
a bien
En vista de que tanto x; Px, y x; Qx, son definidas positivas, se tiene
IA,I 2 a bien
1< 0
Las pruebas y deducciones presentadas aqui se pueden extender al caso en el que la matriz G incluye valores propios multiples y vectores propios multiples.
Problema A-5-20 Considere el sistema
+ 1)
= H(x(kx(k)
c; tales que
C b C2' . . . ,
paratodax
o bien
(2)
m;x{~~'hilX)I}<l,
para toda x
Demuestre que en cualquiera de estos casos H( x)x es una contracci6n para toda x y por tanto el estado de equilibrio del sistema es asint6ticamente estable global.
Solucien
Entonces
368
Capitulo S
= [x]
10que verifica que H(x)x es una contraccion. En el caso 2, la norma se define mediante
n
IIxll =
Entonces
;=1
2: c.lXil
IIH(x)xll =
::s
~ c, Ij~ hij(x)Xj I
i-I
-s m;x
= [x]
que muestra que H(x)x es una contraccion, Ahora considere una funcion escalar Vex) = [x]. Claramente, V(x)
.1V(x(k = V(x(k +
1 - V(x(k
- Ilx(k)1I < 0
= IIH(x(kx(k)11
y
.1V(O) = 0
Asi, IlV(x) es definida negativa. Por tanto, para el sistema considerado Vex) = [x] es una funci60 Liapunov y, en razon del teorema 5-5, el origen del sistema es asintoticarnente estable global.
x(k + 1) = Gx(k)
donde x es un vector n y G es una matriz constante de n x n, tiende a cero conforme k se acerca al infi entonces todas las soluciones del sistema
Ilu(k)" < c,
La solucion de la ecuacion (5-144) esta dada por
k = 0,1,2, ...
x(k)
= Gkx(O) + 2: Gk-jHu(j
j-I
- 1)
369
?or tanto,
k
j=1 k_oo
k
k ilIHII j-I
En vista de que el origen del sistema homogeneo dado por la ecuacion (5-143) es asint6ticamente estable, existen constantes positivas a y b (0 < b < I) tales que
lim
Y por tanto,
k- OOj=l
2.: IIGll
xl(k)
siguientes:
= Xl.,
X2(k)
= X20
Entonces este estado de equilibrio puede ser detenminado a partir de las dos ecuaciones sirnultaneas
Xl. = 0,
X20 = 10
EI estado de equilibrio es, por 10 tanto, (0, 10). Consideremos ahora un nuevo sistema de coordenadas con el origen en el estado de equilibrio. Se
definen
370
caPit1
Para determinar la estabilidad del origen del sistema en el nuevo sistema de coordenadas, se aplica ecuacion de estabilidad de Liapunov dada por la ecuacion (5-90):
= -[
~ ~.35]
don de se escoge Q como una matriz definida positiva con elementos que simplifiquen el ca involucrado. Al resolver esta ultima ecuacion en funci6n de la matriz P, se obtiene
[~:: ~::] = [ -; 1~ ]
Al aplicar el criterio de Sylvester para la definicion positiva, se encuentra que la matriz P no es depositiva. Por tanto, el origen (estado de equilibrio) no es estable. La inestabilidad del estado de equilibrio puede, naturalmente, determinarse mediante el met la transformada z. Primero se elimina 2 de la ecuacion de estado. Entonces, se tiene
2.8z + 1.6 = 0
es decir
(z - 2)(z - 0.8) = 0
Por tanto,
z = 2,
0.8
Dado que el polo z = 2 esta localizado fuera del circulo unitario en el plano z, el origen (estai equilibrio) es inestable.
PROBLEMAS
Problema B-5-1 Obtenga una representacion en el espacio de estado en la forma canonica controlable del siguiente rna con funcion de transferencia pulso.
2 Y(z) = Z-l + 2zU(z) 1 + 4z 1 + 3z
Problema B-5-2 Obtenga una representacion en el espacio de estado en la forma canonica observable del sistema fun cion de transferencia pulso siguiente.
3 Y(z) = Z-2 + 4z2 U(z) 1 + 6z 1 + l1z- + 6z
Problema B-5-3 Obtenga una representaci6n en el espacio de estado en la forma canonica diagonal del sistema cocion de transferencia pulso siguiente.
Y(z) U(z)
Capitulo 5
Problemas
371
Problema 8-5-4 Obtenga una representaci6n en el espacio de estado del sistema descrito por la ecuaci6n
u(k)
y(k)
Figura 5-11
Problema 8-5-6 Obtenga la ecuaci6n de estado y la ecuaci6n de salida del sistema mostrado en la figura 5-12. Problema 8-5-7 Obtenga una representaci6n en el espacio de estado del sistema mostrado en la figura 5-13. Problema 8-5-8 La figura 5-14 muestra un diagrama de bloques de un sistema en tiempo discreto de varias entradas y varias salidas. Obtenga las ecuaciones en el espacio de estado del sistema considerando xl(k), x 2(k) Y x3(k) tal y como se muestran en el diagrama como variables de estado. A continuaci6n defina las nuevas variables de estado tales que la matriz de estado se convierta en una matriz diagonal. Problema 8-5-9 Obtenga la ecuaci6n de estado y la ecuaci6n de salida para el sistema que se muestra en la figura 5-15. Problema 8-5-10 Obtenga una representaci6n en el espacio de estado del sistema de control en tiempo discreto que se muestra en la figura 5-16.
372
Copituc
u(k)
Figura 5-12
u(k)
h(O)
y(k)
Figura 5-13
Problema 8-5-11 Obtenga una representaci6n en el espacio de estado del sistema siguiente en la forma canonica diag x,
Y(z) U(z)
1 + 0.7z
+ 0.12z
Problema 8-5-12 Obtenga una representacion en el espacio de estado del sistema con funci6n de transferencia pulse guiente tal que la matriz de estado sea una matriz diagonal:
Y(z) U(z)
1 (z + l)(z + 2)(z + 3)
Asimismo obtenga las variables de estado iniciales XI(O), x,(O) y X3(0) en terrninos de j.(O), y( 1) ~ ..
=~pitulo 5
Problemas
373
u, (k)
v, (k)
Figura 5-14
Diagrama de bloques del sistema en tiempo discrete de varias entradas y varias salidas del problema 8-5-8.
u(k)
V(k)
Figura 5-15
374
VIs)
Y(s)
G(z)
Figura 5-16
Problema 8-5-13
;:~~.: g
y(k)
x n-l(k + 1) xn(k + 1)
=
0 0 -an(k) -a n-l(k)
xl(k) + bo(k - n)u(k)
Determine hiCk), h2(k), ... , hn(k) en terminos de a/k) y de bl(k), donde i = 1,2, , n y j = 0, I.. Tarnbien determine los valores iniciales de las variables de estado x](O), x 2(0), ,xn(O) en terrni la secuencia de entrada u(O), u( I), ... , u(n -I) y la secuencia de salida yeO), y( 1), ... ,y(n - I )
Problema 8-5-14
Si el polinomio minimo de una matriz G de n x n involucra solo rafces distintas, entonces la inversa - G puede estar dada por la siguiente expresion:
n que se dete
donde
dondej = I, 2, ... , m Yz, es cualquiera de las rafces del polinomio minimo de G. Utilizando la ecuacion (5-145), se obtiene (zl- Gr i para la siguientc matriz G de 2
2:
G [0 -21J o
=
::apitula 5
Problemas
375
Problema 8-5-15 Obtenga la funci6n de transferencia pulso del sistema definido por las ecuaciones
x(k + 1) = Gx(k) + Hu(k) y(k) = Cx(k) + Du(k) donde
TTl
C
=
H~m
-
[b l
a l bo : b 2
a 2 bo : b3
a3 bo],
D = bo
Problema 8-5-16 Encuentre la funcion de transferencia pulso del sistema definido por
x(k + 1) = Gx(k) + Hu(k)
y(k)
=
Cx(k) + Du(k)
donde G =
- al [ -a3
r:a:
01,
10]
0
~ [z:]
[1 0 0],
D = bo
Problema 8-5-17 Obtenga la representaci6n en el espacio de estado para el sistema definido en la siguiente matriz de transferencia pulso:
[i~~n =[ ~
1 + 0.6z
Problema 8-5-18 Considere la ecuacion de estado en tiempo discreto
=
1 + 0.6z
~ [~:~~n
1
1 + z" ]
+ Du(k)
donde la matriz G es una matriz estable. Obtenga los valores en regimen permanente de x(k) y y(k) cuando u(k) es un vector constante.
376
Capitulc 5
x(k + 1)
Gx(k)
donde G es una matriz estable. Demuestre que para una matriz Q definida positiva (0 sernidefinida positiva)
J
puede darse por
= 2:
k~O
x*(k )Qx(k)
= x*(O)Px(O)
donde P
Q + G'PG.
Problema 8-5-21 Determine una funci6n de Liapunov Vex) para el sistema siguiente:
Xt(k + [ x2(k + 1) -
1)] -[1
0.5
Problema 8-5-22 Determine la estabilidad del origen del sistema siguiente en tiempo discreto:
1)] [-31
1
= [
Problema 8-5-23 Determine la estabilidad del origen del sistema siguiente en tiempo discreto:
6
Ubicacion de po/os y diseiio de observadores
~ INTRODUCC/ON
J
En la primera parte de este capitulo se presentaran dos conceptos fundamentales de los sistemas de control: controlabilidad y observabilidad. La controlabilidad se ocupa del problema de poder dirigir un sistema de un estado inicial dado, a un estado arbitrario. Un sistema es controlable si puede, mediante un vector de control no acotado, transferir dicho sistema de cualquier estado inicial a cualquier otro estado, en un numero finito de periodos de muestreo. (Por 10 tanto, el concepto de controlabilidad trata de la existencia de un vector de control que puede causar que el estado del sistema Begue a algun estado arbitrario.) La observabilidad se ocupa del problema de determinar el estado de un sistema dinamico a partir de observaciones de los vectores de salida y de control en un numero finito de periodos de muestreo. Un sistema es observable si, con el sistema en el estado x(O), se puede determinar el estado a partir de la observacion de los vectores de salida y de control a 10 largo de un numero finito de periodos de muestreo. Los conceptos de controlabilidad y observabilidad fueron introducidos por R. E. Kalman. Tienen un papel importante en el control optimo de sistemas multivariables. De hecho, las condiciones de controlabilidad y observabilidad pueden hacer posible la existencia de una solucion completa a un problema de control optimo. En la segunda parte del capitulo analizaremos el metoda de disefio de ubicacion de polos y los observadores de estados. Observe que el concepto de controlabilidad es la base para solucionar el problema de ubicacion de polos y el concepto de observabilidad juega un papeI importante para eI disefio de los observadores de estados. EI metodo de diseflo basado en la ubicacion de polos junto con los observadores de estados, es uno de los metodos de disefio fundamentales para los ingenieros de control. Si el sistema es de estado completamente controlable, entonces es posible seleccionar los 377
378
Capitulo e
polos en lazo cerrado deseados en el plano z (0 las rakes de la ecuacion caracterfstica) y se podra disefiar el sistema que proporcione estos polos en lazo cerrado. EI metodo de disefio de ubicar los polos en lazo cerrado en localizaciones deseadas en el plano z, se conoce como tecnica de diseho ck ubicaci6n de palos; es decir, en dicha tecnica se realimentan todas las variables de estado, de tal forma que todos los polos del sistema en lazo cerrado quedan ubicados en las localizaciones deseadas. En los sistemas reales de control, sin embargo, quiza no se puedan medir todas las variables de estado, en cuyo caso, no todas las variables de estado estaran disponibles para su realimentacion, Para poner en practica un disefio basado en la realimentaci6n del estado, sera necesario estimar las variables de estado no medibles. Esta estimaci6n puede ser efectuada mediante el uso de observadores de estados, mismos que se analizaran en detalle en este capitulo. EI proceso de disefio de ubicacion de polos de sistemas de control puede dividirse en dos fases, En la primera, disefiaremos el sistema suponiendo que todas las variables de estado estan disponibles para realimentarse. En la segunda, se disenara el observador de estados, que estimara todas las variables de estado (0 s610 las no medibles directamente), requeridas para realimentar, a fin de cOOtpletar el disefio. Observe que en el metodo de diseno anterior, los parametros de disefio son las localizacio de los polos en lazo cerrado deseados y el periodo de muestreo T. (Este perfodo T determina efecovamente el tiempo de asentamiento para la respuesta.) En el anal isis de este capitulo supondremos que las perturbaciones son impulsos que se sentan en forma aleatoria. Su efecto es modificar el estado de sistema. Por 10 tanto, una perturbacic puede ser representada como un estado inicial. Se supone ademas que el espaciamiento entre pe baciones adyacentes es 10suficientemente amplio, para que cualquier respuesta a dicha perturbaci . se haya amortiguado antes de que la siguiente se presente, por 10 que el sistema siempre estara r para la siguiente instancia. Aunque la preocupacion de este capitulo se centrara principalmente en el problema de reg ci6n, tambien se analizaran problemas de control. El problema es reducir el vector de error h cero con suficiente velocidad. Tanto en el problema de regulaci6n como en el de control, la formulae" de la ubicaci6n de polos del disefio se reduce a la determinacion de la matriz de ganancia realimentaci6n del estado deseada. El procedimiento para la determinaci6n de dicha matriz del do es primero elegir localizaciones adecuadas para todos los pol os en lazo cerrado, y a continuaci determinar aquella matriz de ganancia de realimentacion del estado que de como resultado polos en lazo cerrado especificados, de forma que los errores causados por perturbaciones 0 ent de comando puedan ser reducidos a cero con suficiente velocidad. En el estado final del proceso disefio la realimentaci6n del estado se lleva a cabo mediante el uso de variables de estado estim mas que con variables de estado reales, mismas que probablemente no estan disponibles para medicion directa. Si algunas de las variables de estado son medibles, entonces se pueden utili esas variables de estado disponibles y utilizar variables de estado estimadas en vez de aque verdaderamente no medibles. En la ultima parte de este capitulo se tratara un problema de disefio de seguimiento, que uti el control integral junto con la tecnica de ubicaci6n de pol os y el observador de estados. Observe en el problema de regulaci6n, se desea transferir al origen el vector de error no cero (debide perturbaci6n). En el problema de seguimiento, se necesita que la salida siga a la entrada de com Note que el sistema de seguimiento debe seguir la entrada de comando y al mismo tiempo re cualquier problema de regulaci6n. Como consecuencia, en el disefio del sistema de seguimiento puede empezar con el disefio de un sistema de regulaci6n y, a continuacion, modificar dicho si y convertirlo en uno de seguimiento.
::::i6n 6-2
Controlabilidod
379
Resumen tiel capitulo. La seccion 6-1 presento una introduccion al material que se va a estudiar en este capitulo. La seccion 6-2 analiza la controlabilidad de los sistemas de control lineales ::- invariantes en el tiempo. La seccion 6-3 trata la observabilidad de dichos sistemas. La seccion 6-4 -::-visa transformaciones utiles en el ami/isis y diseno en el espacio de estados, que se usaran en las .ecciones restantes de este capitulo. E/ metodo basico de disefio en el espacio de estados se presenta ::-1 las secciones 6-5 y 6-6. La seccion 6-5 presenta el metoda de ubicacion de polos, que es la rrirnera fase del diseno. En este metodo se supone que todas las variables de estado pueden medirse :- estan disponibles para realimentarse. La seccion 6-6 analiza la segunda fase del diseno, el disefio :;: los observadores de estados, que estiman las variables de estado que realmente no son medibles. ~.1 estimacion se basa en las mediciones de las senales de salida y de control. Las variables de estado estimadas pueden ser utilizadas para la realimentacion del estado, basado en el disefio de ubicacion ce polos. Por ultimo, la seccion 6-7 se ocupa de los sistemas de seguimiento y analiza el disefio de estes sistemas; la seccion concluye con un ejemp/o de disefio.
CONTROLABILIDAD
S;: dice que un sistema de control es de estado completamente controlable, si es posible transferir el sistema de un estado inicial arbitrario a cua/quier estado deseado (tambien un estado arbitrario), en .in periodo finito. Es decir, un sistema de control es contro/able si todas las variables de estado r-ueden ser controladas en un perfodo finito, mediante alguna serial de control no restringida. Si cualquiera de las variables de estado es independiente de la sefial de control, entonces resulta imposible controlar esa variable de estado y, por 10 tanto, el sistema es no controlable. Puede no existir solucion a un problema de control optimo, si el sistema se considera no controlable, A pesar de que la mayor parte de los sistemas fisicos son controlab/es, los modelos matematicos correspondientes quizas no tengan la propiedad de controlabi/idad. Por 10 tanto, es necesario saber la condicion bajo la cual el sistema es controlable. Veremos mas adelante, en la seccion 6-5, que el concepto de controlabilidadjuega un papel importante en la ubicacion arbitraria de polos en los sistemas de control. Ahora se deducira esta condici6n.
Controlabilidad completa tiel estado para un sistema tie control ell tiempo tliscreto lineal e invariante ell el tiempo. Considere el sistema de control en tiempo discreto definido por
x((k + 1)T)
donde x(k7) u(k7) G
= =
= Gx(kT) + Hu(kT)
(6-1)
vector estado (de dimension n) en el k-esimo instante de muestreo senal de control en el k-esimo instante de muestreo
= matriz de n x n
=
H = matriz de n x I
periodo de muestreo
Suponemos que u(k7) es constante para kT:5.t < (k + 7)T. EI sistema de control en tiempo discreto dado por la ecuacion (6-1) se dice es de estado completamente controlable, 0 simplemente de estado controlable, si existe una seftal de control con stante
380
por intervalos u(kT) definida a 10 largo de un numero finito de periodos de muestreo de forma que, partir de cualquier estado inicial, el estado x(kT) pueda ser transferido al estado deseado x. ell periodos de muestreo como maximo. (AI analizar la controlabilidad, el estado deseado x, especificarse como el origen, 0 Xi = O. Yea el problema A-6-1. Aqui, sin embargo, suponemos que es un estado arbitrario en el espacio de n dimensiones, que incluye el origen.) Utilizando la definicion que se acaba de dar, a continuacion se deducira la condicion para controlabilidad completa del estado. En vista de que la solucion a la ecuacion (6-1) es
n-l
x(nT) = Gnx(O)
2: Gn-j-l Hu(jT)
j=O
~ 2)T)
u(O)
Dado que H es una matriz de n x 1, encontramos que cada una de las matrices H, GH, ... GO- H una matriz de n x 1 0 un vector columna. Si el rango de 1amatriz siguiente es n, es decir rango [H : GH : ... : Gn-l H] = n entonces los n vectores H, GH, ... , GO - I H pueden abarcar todo el espacio de n dimensiones, matriz
comunmente se conoce como matriz de controlabilidad. (Observe que todos los estados que p ser alcanzados desde el origen, estan abarcados por las columnas de la matriz de controlabili Por 10 tanto, si el rango de tal matriz es n, entonces, para un estado arbitrario x(nT) = Xi' existira secuencia de sefiales de control no acotadas u(O), u(t), ... , u[(n - 1)7'] que satisfaga la ec (6-2). Por 10tanto, la condie ion de que el rango de la matriz de controlabilidad sea n da una c cion suficiente para la controlabilidad completa del estado. Para probar que la ecuacion (6-3) es tambien una condicion necesaria para la controlabi . completa del estado, se supone que rango [H:GH: : Gn-1H] < n Entonces, utilizando el teorema de Cayley-Hamilton, puede demostrarse que, para una i arbi G' H puede expresarse como una combinacion lineal de H, GH, ... , GO - I H. En consecu tenemos para cualquier i rango[H. GH: ... : G i - 1 H] < n y par 10 tanto los vectores H, GH, ... , G'- I H no pueden abarcar completamente el espacio dimensiones; y por 10tanto, para algunas Xi' no es posible tener xCiT) = Xi para todas las i. Ent es necesaria la condicion dada por la ecuacion (6-3). De esta manera, se encuentra que la con . de rango dada por la ecuacion (6-3) es necesaria y suficiente para la controlabilidad compl estado.
Secci6n 6-2
Controlabilidad
381
Si el sistema definido por la ecuacion (6-1) es completamente controlable de estado, entonces es posible transferir cualquier estado inicial a cualquier estado arbitrario, en a 10 mas n perfodos de muestreo. Observe, sin embargo, que esto es cierto si y solo si la magnitud de u(kT) es no acotada. Si dicha magnitud es acotada, pudiera tomar mas de n periodos de muestreo. (Vea el problema
A.-6-2.)
Si el sistema esta
[H : GH : ... : Gn-l H]
sea de rango n, es decir rango [H : GH : ... : Gn-l H] = n
Si
es del rango n y u(kT) es un escalar, entonces es posible encontrar n ecuaciones escalares linealmente independientes, a partir de las cuales se puede determinar en forma (mica una secuencia de seriales de control no acotadas u(kT)(k = 0, 1,2, ... , n - I) tal que cualquier estado inicial x(O) se transfiera al estado deseado en n periodos de muestreo. Yea la ecuaci6n (6-2). Observe tambien que si la senal de control no es un escalar sino un vector, entonces la secuencia de u(kT) no es (mica. De esta manera existe mas de una secuencia para el vector de control znx") para lIevar el estado inicial x(O) a un estado deseado, en no mas de n perfodos de muestreo.
Forma alterna de la condicion para la controlabilidad completa del estado. sistema definido por
Considere el
(6-4)
x((k + l)T)
donde
Gx(kT) + Hu(kT)
G H
T
= =
=
perfodo de muestreo
Si los vectores caracteristicos de G son distintos, entonces se puede encontrar una matriz de transformaci6n P tal que
382
Copr _ =
Al A2
p~1
GP
A"
Note que si los valores caracteristicos de G son distintos, entonces los vectores caracteristicos oe tambien 10 son. Sin embargo, 10 opuesto no es cierto. (Por ejernplo, una matriz simetrica real de n con valores caracteristicos multiples tiene n vectores caracteristicos distintos.) Observe tar.. que la i-esima columna de la matriz P es un vector caracteristico de G asociado con el r-esimo \ caracteristico A, (i = 1,2, ... , n). Se define x(kT) = Px(kT)
Al sustituir la ecuaci6n (6-5) en la ecuaci6n (6-4), se obtiene
fir]
... 1:
Por 10 tanto, la ecuaci6n (6-6) puede escribirse como sigue:
= =
A\x\(kT) + fllUl(kT) + f12uz(kT) + '" + f\rur(kT) Azxz(kT) + fZ1U\(kT) + fzzuz(kT) + '" + fzrur(kT)
Si los elementos de cualquiera de los renglones en la matriz de F n x r son todos cero, entc variable de estado correspondiente no puede controlarse mediante cualquiera de los u,(kTI. tanto, la condici6n para la controlabilidad cornpleta del estado es que si los vectores caract . de G son distintos, entonces el sistema es de estado completamente controlable, si y s610 si u de los renglones de p- I H tienen elementos cero. Es importante setialar que para aplicar esu ci6n de la controlabilidad completa del estado, se debe poner la matriz p-I GP de la ecuac en la forma diagonal. Si la matriz G en la ecuaci6n (6-4) no tiene vectores caracteristicos distintos, en imposible su diagonalizaci6n. En tal caso, podernos transformar G a una forma can6nica doe S i, porej=m pJo, G tiene valores caracteristicos AI, AI, AI' A4 , A4, A6, , A" Y posee n -.3 caracteristicos distintos, entonces la forma can6nica de Jordan de G es
Seccion 6-2
Controlobilidad
383
AlIa a Al 1 Al a
I
----------~~-------I
a a
J=
: A4 , I 0
1 I A4: T : A6
I
I
I I
,
I I
I I
'OAn
Las submatrices de 3 x 3 y de 2 x 2 sobre la diagonal principal se conocen como bloques de Jordan. Suponga que es posible encontrar una matriz de transformacion S de modo que
x mediante
x(kT) = Sx(kT) (6-7)
x((k + 1)T)
Las condiciones para la contralabilidad cornpleta del estado del sistema de la ecuaci6n (6-8) pueden entonces enunciarse como sigue: el sistema es de estado completamente controlable, si y s610 si: I) dos bloques de Jordan en la rnatriz J de la ecuaci6n (6-8) no esten asociados con valores caracteristicos iguales; 2) los elementos de cualquier rengl6n de s' H, que correspond en al ultimo rengl6n de cada uno de los bloques de Jordan no sean todos cera. y 3) los elementos de cada rengl6n de s' H, que correspondan a valores caracteristicos distintos, no sean todos cera.
Comentarios. En las condiciones precedentes de la contralabilidad del estado, se ha dicho que en la ecuaci6n (6-8) no deberian estar asociados dos bloques de Jordan de la matriz J con valores caracteristicos iguales. Este punto se desarralla como sigue. Considere el sistema siguiente, donde los dos bloques de Jordan estan asociados con los misrnos valores caracteristicos AI:
Aunque todas las variables de estado estan afectadas pOI' lI(k). este sistema es no controlable. ya que el rango de la rnatriz de contralabilidad
Ai] Al Al 1 Ai + 2AI + Al Ai
es 2. POI' 10 tanto. al aplicar el criterio anterior correspondiente ala contralabilidad de estado. ninguno de los dos bloques de Jordan de J debera estar asociado con los rnismos valores caracrertsticos.
384
Ccpitulc ~
x2(k + 1)
1)] [-1
=
2.
: -5 : 0
I
1 -5
x4(k) xs(k)
0 2
x2(k + 1)
1)] [-1
= =
2.
Condiciones para la controlabilidad completa del estado en el plano z, La condici6n la controlabilidad completa del estado puede enunciarse en terminos de funciones de transfer pulso. Una condici6n necesaria y suficiente para la controlabilidad completa del estado es que 00 presente cancelaci6n en la funci6n de transferencia pulso. Si esto ocurre, el sistema no puede controlado en la direcci6n del modo cancelado. (Yea el problema A-6-4.)
Ejemplo 6-2 Considere la siguiente funci6n de transferencia pulso:
Y(z) V(z)
Es claro que ocurren cancelaciones en los factores (z + 0.2) tanto en el numerador como en el denc dor. Por 10tanto, se pierde un grado de libertad. En raz6n de esta cancelaci6n, este sistema no es de ~ completamente controlable. Por supuesto, se puede obtener la misma conclusi6n escribiendo esta funci6n de transf . pulso en la forma de ecuaciones de estado. Una posible representaci6n de espacio de estados pan sistema es
1)] _[0
=
-0.16
1]
[1 O][XI(k)] x2(k)
[H : GH] = [
-~.8
-0.8 ] 0.64
el rango de [H : GH] es I. Llegamos por 10 tanto a la misma conclusi6n: el sistema no es de completamente controlable.
:eccicSn 6-2
Controlabilidad
385
Controlabilidad completa de la salida. En el disefio practice de un sistema de control, se ouede preferir controlar la salida en vez del estado del sistema. La controlabilidad completa del
estado no es necesaria ni suficiente para controlar la salida de un sistema. Por esta razon es necesario definir por separado la controlabilidad completa de la salida. Considere el sistema definido por las ecuaciones
xk + 1)T)
Jonde
(6-9)
(6-10)
x(k7) = vector estado (de dimension n) en el k-esimo instante de muestreo u(k7) y(k7)
G
=
=
=
H = matriz de n
C
=
matriz de m x n
EI sistema definido por las ecuaciones (6-9) y (6-1 0) se dice que es de salida completamente controlable, 0 simplemente de salida control able, si es posible tener una seftal de control no restringida uCk!), definida a 10 largo de un numero finito de periodos de muestreo 0:::; kT< nTtales que, ernpezando a partir de una salida inicial yeO), la salida y(k7) pueda ser transferida al punto deseado (un f punto arbitrario) Y en el espacio de salidas, en n periodos de muestreo como maximo. A continuacion se deduce la condicion para la controlabilidad completa de la salida. Observe que si un sistema es de salida completamente controlable, entonces existe una seftal de control constante unitaria, que transferira cualquier salida inicial a cualquier punta deseado Yf en el espacio de salidas, en n periodos de muestreo como maximo. En vista de que la solucion de la ecuacion (6-9) es
x(nT)
tenemos que
n-I
y(nT)
= Cx(nT)
n-l
=
CGn x(O) +
2: CGn-j-1 Hu(jT)
j=O
es decir,
y(nT) - CGnx(O)
= 2: CGn-j-1 Hu(jT)
j=O
n-I
= CGn-l Hu(O) + CGn-2 Hu(T) + ... + CHun - l)T) = [CH: CGH: .. : CGn-l H] un ~ 2)T)
[ u(O) u n - 1)T)]
386
Copitulc c
Observe que y(n7) - CG" x(O) = Y - CG" x(O) representa un punta arbitrario en el espacio de f salidas de m dimensiones. Par 10 tanto, igual que en el caso de la controlabilidad completa del estado, una condicion necesaria y suficiente para que el sistema sea de salida completamente controlable, es que los vectores GH, CGH, ... , CG"~ I H abarquen el espacio de salidas de dimension ""_ es decir que rango [CH : CGH : ... :
CG"~
I
H]
(6-llt
De este analisis se puede ver que en el sistema definido por las ecuaciones (6-9) y (6-10). la controlabilidad completa del estado implica controlabilidad completa de la salida, si y solo si los. renglones de C son linealmente independientes. Ahora considere el sistema definido por las ecuaciones
x((k
+ 1)T)
= Gx(kT)
+ Hu(kT)
(6-1
(6-1
y(kT) = Cx(kT)
+ Du(kT)
donde
x(k7)
u(kT)
=
=
vector de estado (de dimension n) en el k-esimo instante de muestreo vector de control (de dimension r) en el k-esimo instante de muestreo matriz de n matriz de n matriz de m
x
G H D
= =
x r
C = matriz de m x n
=
La condicion para la controlabilidad completa de la salida correspondiente a este sistema deducirse como sigue. Dado que la salida y(n7) puede ser dada por la ecuacion
y(nT) = Cx(nT)
+ Du(nT)
n-l
= CG nx(O)
j~O
se obtiene
y(nT) - CGnx(O) =
=
n-l
j~O
2: CGn-j-1 Hu(jT)
CG n- 1 Hu(O)
+ Du(nT)
H]lU:(~~)T)j
u(O)
Una condici6n necesaria y suficiente para que el sistema definido por las ecuaciones (6-12) ~ sea de salida completamente controlable, es que la matriz de m x (n + I)r
: s ccion 6-2
Controlabilidad
387
= 111
(6-14)
'-jay que sefialar que la presencia de la matriz 0 en la ecuacion de salida del sistema siempre ayuda .: establecer la controlabilidad completa de fa salida. Controlabllidad de un sistema de control ell tiempo continuo lineal e invariante ell el tiempo. A continuacion se enunciara brevemente las condiciones para la controlabilidad completa jel estado y la controlabilidad de la salida de los sistemas de control en tiempo continuo lineales e nvariantes con el tiempo. Considere el sistema definido por
x = Ax + Bu
y
= Cx + Du
Jande
B = matriz de n x r
C = matriz de
D
=
111 x
n
r
matriz de m
Controlabilidad completa del estado. Una condicion necesaria y suficiente para la controlabilidad completa del estado para este sistema, puede deducirse en forma similar a como se hizo en el caso de un sistema en tiempo discreto. Aqui presentaremos solo el resultado. La condicion para la controlabilidad cornpleta del estado es que la matriz de n x 11,.
388
6-3 OBSERVABILIDAD
En esta seccion, analizaremos la observabilidad de los sistemas de control en tiempo discn e invariante con el tiempo. Considere el sistema de control en tiempo discrete sin excitacion por
xk + 1)T) y(kT)
don de
= Gx(kT)
=
Cx(kT)
x(kT) y(kT)
= =
vector de estado (de dimension n) en el k-esimo instante de muestreo vector de salida (de dimension m) en el k-esimo instante de muestreo
G = matriz de n x n
C = matriz de m
EI sistema se dice ser completamente observable si cualquier estado inicial x(O) puede det a partir de la observacion de y(kT) sobre un nurnero finito de periodos de muestreo. EI si 10 tanto, es completamente observable, si cualquier transicion del estado de manera evenn a todos los elementos del vector de salida. EI concepto de observabilidad es util para resolver el problema de la reconstruccioo bles de estado no medibles. Se vera mas adelante que los sistemas de control con realime estado, disefiados mediante el metodo de ubicacion de polos, necesitan realimentacion de de estado ponderadas. En la practica, sin embargo, en los sistemas de control con realirn estado se encuentra la dificultad de que algunas de las variables de estado no son accesib medicion directa. Entonces requiere estimar las variables de estado no medibles, a fin de seftales de control de realimentacion, En la seccion 6-6 veremos que el concepto de obs tiene un papel dominante en el disefio de los observadores de estados. La razon por la que se considera el sistema sin excitacion es la siguiente. Si el sistema descrito por las ecuaciones
xk + l)T) y(kT)
entonces
Gx(kT) + Hu(kT)
= Cx(kT) + Du(kT)
k-l Gk-j-l HuUT)
j=O
= Gkx(O) + I
k-l
= CG k x(O) + I
CGk-j-1HuUT) + Du(kT)
j=O
Dado que las matrices G, H, C y D son conocidas, y u(kT) tarnbien 10 es, el segundo y nos del segundo miembro de esta ultima ecuacion son cantidades conocidas. Por 10 restarse del valor observado de y(kT). Entonces, para la investigacion de una condicion suficiente para la observabilidad completa, basta considerar el sistema descrito por las (6-15) y (6-16).
Seccion 6-3
Observabilidad
389
Una vez que a partir de la observacion de la salida se pueda determinar x(O), tambien podra determinarse x(k7), ya que u(O), u(7), ... , uk - I)T) son conocidas.
Observabilidad completa de los sistemas en tiempo discreto. Considere el sistema definido por las ecuaciones (6-15) Y (6-16). EI sistema es completamente observable si, dada la salida y(kT) sobre un nurnero fin ito de periodos de rnuestreo, es posible determinar el vector estado inicial x(O). Ahora, deduciremos la condicion para la observabilidad completa del sistema en tiempo discreto descrito por las ecuaciones (6-15) Y (6-16). En vista de que la solucion x(k7) de la ecuacion (615) es
x(kT)
se obtiene
= G k x(O)
=
y(kT)
CGkx(O)
La observabilidad completa significa que, dado yeO), yeT), y(27), ... , es posible determinar XI(O), x 2(0), ... , x,/O). Para determinar n incognitas, necesitamos unicamente n valores de y(k7). Por 10 tanto, podemos utilizar los primeros n valores de y(k7), 0 yeO), y(7), ... , yn - 1)7) que permiten determinar xl(O), xiO), ... , x,/O). En el caso de un sistema completamente observable, dados
yeO) = Cx(O)
yeT)
=
CGx(O)
yn - 1)T)
= CGn-l x(O)
se debe ser capaz de determinar XI(O), x 2(0), ... , XI/(O). AI observar que y(k7) es un vector de dimension m, las n ecuaciones sirnultaneas anteriores dan como resultado nm ecuaciones, todas elias incluyendo XI(O), xz{O), ... ,x,lO). A fin de obtener un solo conjunto de soluciones XI(O), x 2(0), ... , XI/(O) a partir de estas nm ecuaciones, se debe escribir exactamente de entre elias n ecuaciones lineales independientes. Esto requiere que la matriz nm x n
sea de rango n. Notando que el rango de una matriz y de su transpuesta conjugada es el mismo, es posible enunciar la condicion correspondiente a la observabilidad com pIeta como sigue. Una condicion iecesaria y suficiente para que el sistema definido por las ecuaciones (6-15) y (6-16) sea completanente observable es que el rango de la matriz de n x nm
(6-17)
ea n. La matriz dada por la ecuacion (6-17) se conoce comunrnente como matriz de observabilidad. Note que en la ecuacion (6-17) los asteriscos indican transpuestas conjugadas. Si las matrices C y G
390
Cap'
son reales, entonces la notacion de transposicion conjugada como G*C* puede ser cambiada notacion de transposicion, como GTCT.]
Forma alterna de la condicion para la observabilidad completa. nido por las ecuaciones (6-15) y (6-16) que aqui se repite:
Considere el sistema
xk + l)T) = Gx(kT)
y(kT)
= Cx(kT)
Suponga que los valores caracteristicos de G son distintos, y que una matriz de transformaciea transforma a G a una matriz diagonal, de tal forma que p--I GP es una matriz diagonal. Se defiJlc
x(kT) = Pi(kT)
Entonces las ecuaciones (6-18) y (6-19) se pueden escribir como sigue:
xk + l)T)
y(kT)
Por 10 tanto,
= p- I GPi(kT) = CPx(kT)
y(nT) = CP(P-1GPYx(O)
es decir,
An
y(nT)
= CP
[
Ai
don de AI, A2 , , All son n valores caracteristicos distintos de G. El sistema es completarrlClllll observable, si y solo si ninguna de las columnas en la matriz CP de m x n esta formada de ele cero. Esto es debido a que si la i-esima columna de CP esta formada de elementos cero, entonces variable de estado Xi (0) no aparecera en la ecuacion de salida y, por 10 tanto, no podra ser det nada a partir de la observacion de y(kT). Por 10 tanto, x(O), que esta relacionada con x(O) me . la matriz no singular P, no podra ser determinada. Si la matriz G implica valores caracteristicos multiples y no puede ser transformada a matriz diagonal, entonces si se utiliza una matriz de transformacion adecuada S podemos mar Gala forma canonica de Jordan:
S-IGS
x(kT)
= Sx(kT)
xk + l)T)
y(kT)
Por 10 tanto,
CSx(kT)
y(nT)
= CS(S-IGSYX(O)
Seccion 6-3
Observabilidad
391
EI sistema es completamente observable, si y solo si I) dos bloques de Jordan en J no estan asociados con el mismo valor caracterfstico; 2) ninguna de las columnas de CS que corresponda al primer renglon del bloque de Jordan esta formada de elementos cero, y 3) ninguna columna de CS que corresponda a valores caracteristicos distintos esta formada de elementos cero. Para aclarar la condicion 2, en el ejemplo 6-3 que se muestra a continuacion, se han sefialado con lineas punteadas las columnas de CS que corresponden al primer renglon de cada bloque Jordan.
Ejemplo 6-3 Los sistemas siguientes son completamente observables:
[-1
0
(kT) =
,
[1
2.
[;:!lZ:+ :m]
x4(k I)T) xsk + I)T)
[LLIL----~][;:lZg] !
, -3 0
1 -3
x4(kT) xs(kT)
1 1 1 1
1.
2.
[UjL----~][;:lZg]
o :
: -3 1 x4(kT) 0 -3 xs(kT)
r, : Ii 1 1 ' - " ] :0: 1 (kT) [ :0: 1 1 :0: 0 x 3(kT) L..J L-I X4
[ Y2(kT) ]
Yl(kT) =
;:~zgl
xs(kT)
Condicion para la observabilidad completa en el plano z, La condicion para la observabilidad completa tambien puede enunciarse en terminos de funciones de transferencia pulso. Una condicion necesaria y suficiente para la observabilidad completa es que no ocurra ninguna cancelacion de polos ceros en la funcion de transferencia pulso. Si ocurre cancelaci6n, el modo cancelado no podra observarse en la salida.
Ejemplo 6-4 Demuestre que eI sistema siguiente es no completamente observable:
392
Capitulo 6
xk + l)T)
Gx(kT) + Hu(kT)
y(kT) = Cx(kT)
donde
4-6 6] [
5 -7 5
1 -1
-1
4 -6 5 -7
1 1 -1
-1
~1
Por 10tanto, el rango de la matriz [C* : G*C* : (G*)2 C*] es menor de 3. EI sistema no cs completamc,.te observable. De hecho, en este sistema ocurre cancelaci6n de polos ceros en la funci6n de transferencia pulse del sistema. La funci6n de transferencia pulso entre X1(z) Y U(z) es
X1(z) =
U(z)
1 (z + l)(z + 2)(z + 3)
Y(z) X = (z
1(z)
+ l)(z + 4)
Por 10 tanto, la funci6n de transferencia pulso entre la salida Y(z) y la entrada U(z) es
Y(z) _ (z + l)(z + 4) U(z) - (z + l)(z + 2)(z + 3)
Es claro que se cancelan los factores (z + I) en el numerador y en el denominador. Esto signitica qLJe existen estados inicialcs diferentes de cero x(O) que no pueden ser determinados a partir de la medici"de y(k7).
Comenturios- La funci6n de transferencia pulso no tiene cancelacion. si y s610 si, el siste es de estado completamente controlable y completamente observable. (Vea el problema A-6-4.) L significa que una funci6n de transferencia cancel ada no \leva consigo toda la informaci6n que carac
teriza al sistema dinamico.
Principio de dualidad.
xk
+ 1)T)
Gx(kT)
+ Hu(kT)
(6-21
y(kT) = Cx(kT)
2eccion 6-3
Observabilidad
393
.::onde
x(kT) u(kT) y(kT)
= = = = = =
vector de estado (de dimension n) en el k-esimo instante de muestreo vector de control (de dimension r) en el k-esimo instante de muestreo vector de salida (de dimension m) en el k-esimo instante de muestreo matriz de n x n matriz de n
x
G H C
matriz de m x n
:- su contraparte dual, que llamaremos sistema S2, definida por las ecuaciones
xk
.::onde
x(kT) u(kT) YCkT)
= = =
+ l)T)
G*x(kT)
+ C*u(kT)
(6-22) (6-23)
y(kT) = H*x(kT)
vector de estado (de dimension n) en el k-esimo instante de muestreo vector de control (de dimension r) en el k-esimo instante de muestreo vector de salida (de dimension m) en el k-esimo instante de muestreo transpuesta conjugada de G transpuesta conjugada de H transpuesta conjugada de C
G* H* C*
=
= =
.\hora se examinara una analogia entre controlabilidad y observabilidad. Esta analogia se conoce como principia de dualidad, y es debida a Kalman. El principio de dualidad dice que el sistema S\ definido por las ecuaciones (6-20) y (6-21) es Je estado completamente controlable (observable), si y solo si el sistema S2 definido por las ecuaciones 6-22) y (6-23) es de estado completamente observable (controlable). Para verificar este principio, escribarnos las condiciones necesarias y suficientes para la controlabilidad completa y la observabilidad .ornpleta del estado, correspondientes a los sistemas S\ y S2, respectivamente.
= O.RA
EL SISTEMA S\:
1. Una condicion necesaria y suficiente para la controlabilidad completa del estado es que
rango IH : GH : ... : G"- \ HI
=
2. Una condicion necesaria y suficiente para la observabilidad completa es que rango [C* : G*C* : ... : (G*)"- \ C*]
=
1. Una condicion necesaria y suficiente para la controlabilidad completa del estado es que
rango IC* : G*C* : ... : (G*)"-\ C*I = n
394
2. Una condici6n necesaria y suficiente para la observabilidad completa es que ran go [H : GH : ... : G"- I H]
=
Si se comparan estas condiciones, es evidente la verdad del principio de dualidad. Vemos que el sistema SI' siendo de estado completamente controlable, equivale al siste . completamente observable. Y el sistema SI, siendo completamente observable, es equival sistema S2 de estado completamente controlable. Mediante la utilizaci6n de este principio, la observ de un sistema dado puede verificarse al pro bar la controlabilidad del estado de su dual.
Observabilidad completa de los sistemas de control en tiempo continuo lineales e inva con el tiempo. Por ultimo, enunciaremos brevemente la condici6n de observabilidad co .
correspondiente al sistema de control en tiempo continuo lineal e invariante en el tiempo. EI si se dice completamente observable, si todos los estados iniciales x(O) pueden determinarse a p la observaci6n de yet) durante un intervalo de tiempo fin ito. Similar al caso del sistema de con tiempo discrete, necesitamos considerar s610 un sistema sin excitaci6n. Considere el sistema do por las ecuaciones
x = Ax
y = Cx
donde
x = vector de estado (de dimensi6n n)
= =
matriz de n x n matriz de m x n
Igual que en el caso de sistema de control en tiempo discreto, se puede decir que la condici6n observabilidad completa es que el rango de la matriz de n x nm
Efecto de la discretizacion de un sistema de control de tiempo continuo so controlabilidad y la observabilidad. Cuando se discretiza un sistema de control en tiempo
nuo con polos complejos, la introducci6n del muestreo puede dificultar la controlabilidad observabilidad del sistema discretizado resultante. Es decir, puede ocurrir cancelaci6n de ros al pasar del caso en tiempo continuo al caso en tiempo discreto. Por 10tanto, el sistema disc puede perder controlabilidad y observabilidad, Puede demostrarse que un sistema que sea de estado completamente controlable y co mente observable, en ausencia de muestreo, permanece en tales condiciones despues de la in ci6n del muestreo, si s610 si para cada valor caracteristico de la ecuaci6n caracteristica sistema de control en tiempo continuo, la relaci6n
Re A,
Re A,
~ecci6n
6-3
Observabilidad
395
irnplica que
(6-25)
donde T es el periodo de muestreo y n = I, 2, .... Se hace notar que, a men os que el sistema contenga polos complejos, no ocurrira cancelaci6n de polos ceros al pasar de tiempo continuo al caso de tiempo discreto.
Ejemplo 6-5 Considere el siguiente sistema de control en tiempo continuo:
(6-26) (6-27)
Este sistema es de estado cornpletarnente controlable y cornpletarnente observable. ya que el rango de la matriz de controlabilidad
[B: AB] =
is 2 and the rank of the observability matrix
r~ ~ J
[C*:A*C*] =
U ~J
EI sistema de control en tiempo discreto obtenido al discretizar el sistema de control en tiernpo continuo dcfinido por las ecuaciones (6-26) y (6-27) puede darse como sigue:
(6-28)
y(kT)
= [1
O][XI(kT)J
~~T)
~~~
dondc T cs cl periodo de muestrco. Dcmostrarcrnos que cl sistema discrctizado dado por las ccuaciones (6-28) y (6-29) es de estado complctamentc controlablc y cornpletamcntc observable. si y s610 si
cs dccir,
T,* n tt ,
n = 1,2,3, ...
Para el sistema de control en tiempo discrete obtenido al discretizar cl sistema de control en ticmpo continuo. ten cmos la siguicnte matriz de controlabilidad
[H : GH] =
1 - cos T sen T
396
Capitulo
[C* : G*C*] =
[1o
cos sen T
T]
es 2 si y s610 si T~ n tt (don de n = 1,2,3, ... ). Del anal isis anterior, podemos concluir que el sistema discretizado es de estado cornpletamente controlable y completamente observable si y s610 si T ~ n tt, don de n = 1, 2, 3, .... Observe que siempre es posible evitar la perdida de controlabilidad y de observabilidad escogiendo un perfodo de muestreo T distinto a n tt.
En esta seccion primero se venin tecnicas para transformar ecuaciones en el espacio de estados ell formas can6nicas. A continuaci6n se revisara la propiedad de invariancia de las condiciones de rango para la matriz de controlabilidad y la de observabilidad.
Como transformar en formas canonicas las ecuaciones en el espacio de estados. la ecuaci6n de estado en tiempo discreto y la ecuaci6n de salida
x(k
Considere
+ 1)
= Gx(k)
+ Hu(k) + Du(k)
(6-_
y(k) = Cx(k)
(6-31
Ahora se estudiaran tecnicas para transformar las ecuaciones en el espacio de estados definidas JXI las ecuaciones (6-30) y (6-31) en las tres formas can6nicas siguientes: 1. Forma can6nica controlable 2. Forma can6nica observable 3. Forma can6nica diagonal 0 de Jordan (Observe que la forma can6nica diagonal es un caso especial de la forma can6nica de Jordan.) supone que el sistema definido por las ecuaciones (6-30) y (6-31) es de estado completamente c trolable y completamente observable.
Forma canonica controlable. EI sistema definido por las ecuaciones (6-30) y (6-31) se p de transformar a una forma can6nica controlable, mediante la matriz de transformaci6n
T=MW
donde
y
an-I a n-2 a n-2 a n-3 a1
0 0 0
W=
a1
0 0
Ssccion 6-4
397
Los elementos
G,
IzI - GI
Puede demostrarse que
GT
~!
[
-an
0
0 -an-I
1
0 -an-z
0
1 -at
(6-35)
T'H~[~]
x(k) = Tx(k) x(k + 1)
(6-36)
(Para los detalles de la deducci6n de las dos ecuaciones anteriores, yea los problemas A-6-5 y A-66.) Ahora definamos
donde la matriz de transformaci6n Testa dada por la ecuaci6n (6-32). Entonces las ecuaciones (630) Y (6-31) se convierten en
donde
G = T-
CT,
[ x,(k + 1) xz(k + 1)
Xn-I(~ + 1)
xn(k + 1)
0 -an
a
-an-l
a
-an-z
0 0 + : u(k)
a
1
(6-37)
(6-38)
Aquf las hi son los coeficientes que aparecen en el numerador de la funci6n de transferencia pulso siguiente:
398
Capitulo.
C(zI - GtlH + D
= C(zI - Gtlil + fJ
bozn + blz n - I + z" + alz n - I +
+ bn-Iz + bn + an-Iz + an
Observe que D = b = boo El sistema dado por las ecuaciones (6-37) y (6-38) esta en una f can6nica controlable.
Forma canonica observable. El sistema definido por las ecuaciones (6-30) y (6-31) P ser transformado a una forma can6nica observable, mediante la matriz de transformaci6n
Q
donde
(WN*t l
(0-4_
0
~
1
Q-IGQ=G= ~ [
~
0
Q-I H
= iI =
[
CQ =
C=
[0 0 ...
0 1]
donde las b, son los coeficientes que aparecen en el numerador de la funci6n de transferencia pulso, dada por la ecuaci6n (6-39). (Para detalles de la deducci6n de las ecuaciones anteriores. los problemas A-6-8 y A-6-9.) Entonces, al definir
x(k)
Las ecuaciones (6-30) y (6-31) se convierten en
i(k
= Qi(k)
1)
= Gi(k) + Hu(k)
= Ci(k) + fJu(k)
y(k)
es decir,
xI(k x2(k
+ 1) + 1)
o0
1 0
xn-I(k + 1) xn(k + 1)
o0 o0
Secci6n 64
399
y(k)
= [0 0 '"
(6-42)
EI sistema definido por las ecuaciones (6-41) y (6-42) esta en Una forma can6nica observable.
Forma canonica diagonal 0 de Jordan. Si los valores caracteristicos Pi de la matriz G son distintos, entonces los vectores caracteristicos correspondientes ~I' ~~ . . . , ~f1 tambien son distintos. Defina la matriz de transformaci6n P como sigue:
Er Then
= Pi(k)
(6-43) (6-44)
se tieene que las ecuaciones (6-30) y (6-31) pueden estar dadas por las ecuaciones
i(k + 1)
donde G = p-I GP, ser escritas como
H = p-
H,
~ ][~:~Zl] [~:
+
xn(k) xn(k)
]U(k)
(6-45)
an
...
I3n][~:~Zl] +
Du(k)
(6-46)
donde las a, Ylas 13, son constantes, tales que aJ3, es el residuo en el polo z = Pi; es decir, tal que a.a, apareceran en el numerador del termino 1/(z- p) cuando se expande la funci6n de transferencia de pulso en fracciones parciales como sigue:
pn
(6-47)
400
Capit
En muchos casos escogemos a l = a 2 = ... = all = I. [Observe que la condici6n necesaria y sufici para que el sistema sea de est ado completamente controlable es que a, 2 0 (i = m, m + I, ... , n), ~ la condici6n correspondiente para que sea completamente observable, es que 13,20 (i = I, m - I + 2, ... , n).] Si existen varios valores caracteristicos P, de la matriz G, entonces escogemos la matriz transformaci6n S definida como sigue:
donde las 1/; son vectores caracteristicos (que corresponden a valores caracterfsticos distint vectores caracterfsticos generalizados (que corresponden a valores caracterfsticos multiples). ( mayor detalle sobre vectores caracterfsticos generalizados, yea el apendice A.) Entonces
S-i GS = matriz en la forma can6nica de Jordan
Ahora si definimos
x(k)
SiCk)
i(k + 1) y(k)
= Gi(k) + Hu(k)
=
ti(k) + Du(k)
don de G = S-I GS, H = S-I H, C = CS y b = D. Si, por ejernplo, la matriz G incluye un caracterfstico PI multiple de orden m y otros valores caracterfsticos Pm + I' Pm + 2' . . . , PII siendo ellos distintos y diferentes de PI y, ademas, si el rango de PI I - G es n - 1 (10 que implica polinomio minimo es identico al polinomio caracteristico), entonces las ecuaciones en el esp estados en la forma can6nica de Jordan seran:
PI 1 PI 1
0:I
1 PI: :Pm+1 I
I I I I I I I I I I I I
xI(k) x2(k)
0 0
---------------------~----------------
xn(k + 1)
pn
y(k)
[f31 f32
13; son
Secci6n 6-4
401
C(zI -
Gr H + D
l
C(zI - G)-I iI + fJ
am 131 + am132 +. . . + am13m (z - PI)m (z - PI)m-1 Z - PI
Propiedad de invariancia de las condiciones de rango para la matri; de controlabilidad y para la matriz de observabilidad. Considere sistemas relacionados por transformaciones de similitud. Definamos la matriz de controlabilidad como M:
M
Sea P (una matriz arbitraria n
x
[H:GH: :Gn-'H]
Entonces
Gn-I
P-'M
= P-'[H:GH::Gn-'H] = [p-'H:P-'GH::p-'Gn-'H]
=
P-'GP = G,
cp=
402
Capitulo 6
Entonces
P*N
P*[C*: G*C*:
En esta secci6n se presentara un metodo de disefio cornunmente conocido como tecnica de ubicacion de polos 0 de asignacion de polos. Supondremos que todas las variables de estado son medibles y disponibles para la realimentaci6n. Se podra demostrar que si el sistema considerado es de estado completamente controlable, entonces los polos del sistema en lazo cerrado pueden ubicarse en cualquier localizaci6n deseada, mediante una realimentaci6n del estado a traves de una matriz de ganancia de realimentaci6n del estado apropiada. La presente tecnica de diseno empieza con una determinaci6n de los polos en lazo cerrado deseados, basados en los requisitos de respuesta transitoria y/o respuesta en frecuencia como velocidad. factor de amortiguamiento relativo 0 ancho de banda. Una vez hechas estas consideraciones, suponga que decidimos que los polos en lazo cerrado deseados deben estar en z = Ill' Z = 1l2' . . . , Z = Ill/" (En la selecci6n del periodo de muestreo, debe tenerse cuidado de que el sistema deseado no requiera sefiales de control excesivamente grandes. De 10contrario, ocurriran fen6menos de saturaci6n en d sistema. Si este entra en saturaci6n, se volvera no lineal, por 10 que tal metodo de disefio ya no sent aplicable, en vista de que solamente 10 es para sistemas lineales e invariantes en el tiempo.) Entooces, al seleccionar una matriz de ganancia apropiada para la realimentaci6n del estado, es posible obligar al sistema a tener los polos en lazo cerrado en las posiciones deseadas, siempre y cuando d sistema original sea de estado completamente controlable. A continuaci6n, se tratara el caso en que la sefial de control es un escalar y se probara que ura condici6n necesaria y suficiente para que los polos puedan ser ubicados en localizaciones cualesquiera arbitrarias en el plano z, es que el sistema sea de estado completamente controlable. Despoes analizaremos algunos metodos para determinar la matriz de ganancia de realimentaci6n de estade requerida.
Condicion necesaria y suflciente para ia ubicacion arbitraria de los polos. Considere dI sistema de control en lazo abierto que se muestra en la figura 6-1 a). La ecuaci6n de estado es
x(k donde x(k)
u(k)
= = = =
+ 1) = Gx(k) + Hu(k)
(6-':-
vector de estado (de dimensi6n n) en el k-esimo instante de muestreo sefial de control (escalar) en el k-esimo instante de muestreo matriz de n matriz de n
x x
G H
n
1
Secci6n 6-5
403
x(k)
u(k)
(a)
u(k)
x(k)
(b)
Figura 6-1 (a) Sistema de control en lazo abierto; (b) sistema de control en lazo cerrado con u(k) = -Kx(k).
Suponemos que la magnitud de la sefial de control u(k) no esta acotada. Si la sefial de control u(k) fuera
u(k) = -Kx(k)
donde K es la matriz de ganancia de realimentaci6n del estado (una matriz de 1 x n), entonces el sistema se convierte en un sistema de control en lazo cerrado, como el que se muestra en la figura 6I b), Ysu ecuaci6n de estado
x(k
+ 1) = (G - HK)x(k)
(6-51 )
Observe que la matriz K se escoge de tal forma que los valores caracterfsticos de G - HK sean los polos en lazo cerrado deseados: JlI' JIb ... , JIll' Probaremos ahora que una condici6n necesaria y suficiente para la ubicaci6n arbitraria de los polos, es que el sistema sea de estado completamente controlable. Primero se deducira la condicion necesaria. Empezaremos por demostrar que si el sistema no es de estado completamente controlable, entonces existen valores caracteristicos de G - HK que no pueden ser controlados por realimentaci6n del estado.
404
Copftuc
Suponga que el sistema de la ecuaci6n (6-50) no es de estado completamente controlabje, Entonces el rango de la matriz de controlabilidad es menor que n, es decir, rango [H : GH : ... : Gil-I H]
=
q<n
(6-~' .
Esto significa que en la matriz de controlabilidad hay q vectores columna linealmente independi tes. Definamos estos q vectores columna linealmente independientes como f l , f 2 , , (I' Asirnis escojamos n - q vectores n adicionales v q + I' vq + 2, . . . , V,,, tales que
... :
vn ]
P-IGP = G,
Entonces
GP
es decir,
PG
Y tambien,
En vista de que tenemos q vectores columna linealmente independientes f l , f 2, , f q , pode utilizar el teorema Cayley-Hamilton para expresar las matrices Gfl , Gf2 , , Gfq en terminos estos q vectores. Es decir,
Gf l
= gl1 fl + gZI fz +
gzzfz
+ gql fq + gqzf q
fq
Gfz = g12fl + fl +
Gf q =
glq
gZq
fz + ... +
gqq
glq+1
gZq+1
gZq :
I
I
I
I
gql
gqZ
gqq :
gqq+1
gqq+z qq+lq+Z
g.
gq-:e
--~----------------+------------------------------
0 : gq+lq+1 : .
I
I
o o
glqj
gZq
:
o:
-
gnq+1
G 11
gqq
Seccion 6-5
405
;:::: ;:::~ [
gqq+1 gqq+2
[! : ... !]~G,,~(n-q)xq
g q +l q +1 gq+2q+1 [ gq+lq+2 gq+2q+2
matriz cero
. . .
;::::j :
gnn
- G22
gnq+1
gnq+2
l[
G lI : G12] ----+----0 I G
I
22
Por 10 tanto,
G = [Q~d-<?.!~]
o : G 22
(6-55)
(6-56)
Volviendo a la ecuacion (6-52), observe que el vector H puede escribirse en terminos de q vectores columna linealmente independientes f" f2, , f q Por 10 tanto,
= h ll f l + h 21 f 2 + ... + hql f q
hllfl
= [fl:f2:''':fq:vq+I;''':Vn] h q ,
o o
Par 10 tanto, (6-57) donde,
406
Capitulo
Ahora considere la ecuaci6n del sistema en lazo cerrado dada en la ecuacion (6-51). La ecuacioe caractenstica es
IzI - G + UKI = 0
Deffnase
K=
y dividase la matriz
KP
Kpara obtener
K = [K lI :Kd
(6-58,
I' . . , (Xo
(XII (XII_
Si multiplicamos las ecuaciones anteriores, en orden por mente, y se suman los resultados, se suman
(donde
(xo
I), respectiva-
G + UKI
IzI -
G + UKI = Iz [!d--~--]
[0 : I n - q
_ =
- [Q!1_~_<!l~] + [!!~I-][KlI: K ]! 0: G 0
zz
12
I --------------------,---------------
z I, - G lI + U lI K lI: -G 12 + U lI K 12 o : zI n - q - G n
-
IZIq
G lI + U lI K lIllzI n - q
Gzzi
La ecuaci6n (6-59) muestra que la matriz K = p-I tiene control sobre los q valores caracterfsticos Gil - H II K I I , pero no sobre los n - q valores caracteristicos de G 22 . Es decir, existen n - q valo caracterfsticos de G - UK que no dependen de la matriz K. Por 10 tanto, hemos demostrado que controlabilidad completa del estado es una condici6n necesaria para el control de todos los valo caracterfsticos (Iocalizaciones de polos en lazo cerrado) de la matriz G - UK. Ahora se deducira una condici6n suficiente. Probaremos que si el sistema es de estado c pletamente control able, existe una matriz K que hara los valores caracteristicos de G - UK como desean, 0 ubicara los polos en lazo cerrado en las posiciones deseadas. Los valores caracteristicos deseados de G - UK son Jil, Ji2, ... , Jill; cualesquiera valo caracteristicos complejos deben presentarse como pares conjugados. Si observamos que la ecuaci caracteristica del sistema original dado por la ecuaci6n (6-50) es
IzI - GI
T=MW
donde
(6-
3eccion 6-5
407
an - 2
an - 3
1 0
W=
o
Luezo, de las ecuaciones (6-35) y (6-36), se tiene
o o o
1
(6-61 )
o o o
o
0
o o
1
T'H=H=
A continuacion se define
~]
(6-62)
Entonces
HK=[~[S.
Iz I
- G + HKI
=
S.,
...
S,J=
a a
o o
[z I
1
G + HKI
0
a
1
zlt
z 0
0 0
0
-1 z
-[!
-an
o o : a a
a
-a n - !
I
+
[0:
a
0
o o
_la 1
~n
a
8n - 1
o
an
a
an-l
+ 8n
+ 8n - 1
(6-63)
408
Ccpituic :.
La ecuacion caracteristica, con los valores caracteristicos deseados, esta dada por
(z -
J.Ll)(Z -
= z" +
O'lZn-1
O'n-IZ
an
=0
(6-M
Igualando los coeficientes de potencias iguales de z correspondientes a las ecuaciones (6-63 ~ Y (6-64), obtenemos
= KT- 1 =
an:
.
[ an -
an-I -
. . ]
al T
-I
donde las a, y las a, son coeficientes conocidos, y T es una matriz conocida. De modo que he determinado la matriz de ganancia de realimentacion K requerida, en funcion de coeficientes c cidos y de una matriz conocida del sistema. Esto prueba la condicion de suficiencia; es decir. si sistema definido por la ecuacion (6-50) es de estado completamente controlable, entonces sie sera posible determinar la matriz de ganancia de realimentacion del estado K, requerida pan. ubicacion arbitraria de los polos. Por 10 tanto, hemos demostrado que una condicion necesaria suficiente para la ubicacion arbitraria de los polos es que el sistema sea de estado completa controlable.
Formula de Ackermann. La expresion dada en la ecuacion (6-65) no es la (mica utilizada la determinacion de la matriz de ganancia de realimentacion del estado K. Existen otras expresi disponibles. A continuacion presentaremos una de elias, comunmente conocida como formula Ackermann. Considere el sistema definido por la ecuacion (6-50). Se supone que el sistema es de e completamente controlable. Mediante el uso de la realimentacion del estado u(k) = -Kx(k), se ubicar los polos en lazo cerrado en z = JlI' Z = Jl2, ... , Z = JIll' Es decir, deseamos que la ecu caracteristica sea
IzI - G + HKI
=
(z -
J.Ll)(Z 0'1Z n- 1
J.L2)" . (z - J.Ln)
= z" +
Sea
O'n-IZ
+ an
G=G-HK
Gn +
0'1 Gn-I
0'2
Gn-Z + ... +
an-I G
5ecci6n 6-5
409
HKG 2
= (G
- HK)"
= Gn -
Si multiplicamos las ecuaciones anteriores, en orden por an an_I' ... , a o (don de a o = I), respectivamente, y se suma los resultados, la rnisma
(6-66)
Observe que
1>(G) = 0
Por 10 tanto, la ecuacion (6-66) puede modificarse a la forma
tiene rango n, y su inversa existe. Por tanto, la ecuaci6n (6-67) puede modificarse a la forma
a"_,K + adK! +
[
an_I K + an-2 KG +
410
Copitosc
[0 0
I]
[
a,,-;K + a,_,K! +
an-I
K+ a n-2 KG +
+ + KG'-;
KGn-Ij
[0 0
o
o
[0 0
La ecuaci6n (6-68) proporciona la matriz de ganancia de realimentaci6n del estado K requerida esta expresi6n en particular para la matriz K, la que comunmente se conoce como f6rmula Ackermann. [Yea el problema A-6-12 para la deducci6n de la ecuaci6n (6-68), cuando n = 3.] Comentarios. La matriz de ganancia de realimentaci6n del estado K es determinada de nera que el error (causado por perturbaciones) se reducira a cero con suficiente velocidad. Ob que para un sistema dado, la matriz K no es unica, sino que depende de las localizaciones en cerrado deseadas (que determinan la velocidad de respuesta) que se haya seleccionado. La selec de los polos en lazo cerrado deseados 0 de la ecuaci6n caracteristica deseada es un punto medio la velocidad de la respuesta del vector de error y la sensibilidad a perturbaciones y a ruido en medici6n. Es decir, si aumentamos la velocidad de la respuesta de error, entonces, por 10 gen aumentan los efectos adversos de las perturbaciones y de ruido en la medici6n. En la determina 'de la matriz de ganancia de realimentaci6n del estado K para un sistema dado, es conveniente e nar varias matrices K basadas en varias ecuaciones caracteristicas deseadas, y seleccionar aq que ofrezca un mejor desempefio general del sistema. Una vez seleccionada la ecuaci6n caracteristica deseada, existen varias formas de dete la matriz de ganancia de realimentaci6n del estado K, correspondiente al sistema definido par ecuaci6n (6-50), que se supone de estado completamente controlable. A continuaci6n se listan tro de eIlas.
1. Como se mostr6 en el analisis anterior, la matriz K se puede obtener de la ecuaci6n (
= =
. . ]
donde las a, son los coeficientes de la ecuaci6n caracteristica del sistema original
IzI - GI
z"
y las a, son los coeficientes de la ecuaci6n caracteristica deseada, correspondiente al si de control con realimentaci6n del estado; es decir,
IzI - G
+ HKI
z"
al
zn-I
+ ... +
an-I
an =
T=MW
donde My W corresponden a las ecuaciones (6-60) y (6-61), respectivamente.
(&-:
Seccion 6-5
411
Si la ecuaci6n de estado del sistema ya esta en la forma can6nica controlable, la detenninaci6n de la matriz de ganancia de realimentaci6n del estado K se puede simplificar, dado que la matriz de transfonnaci6n T se convierte en la matriz identidad. En este caso, la matriz deseada K se obtiene sustituyendo T = MW = I en la ecuaci6n (6-69). 2. La matriz de ganancia de realimentaci6n del estado K deseada puede obtenerse mediante la f6nnula de Ackermann:
K
donde
= [0 0
cP(G)
(6-71)
= Gn +
al Gn-I + ., . + an-I G + an 1
3. Si los valores caracteristicos que se desean fll' flz, ... , fI" son distintos, entonces la matriz de ganancia de realimentaci6n del estado K requerida puede ser: K donde los vectores
~l' ~2'
= [1
~"
1 satisfacen la ecuaci6n
(6-72)
. ,
~i =
(G - lLi1)-1 H,
i=I,2,oo.,n
~i
~i
satisface la
(G - HK)~i
= lLi
f,;,
1,2, ... ,n
Para una respuesta sin oscilacion, u, = flz = ... = fI" = O. La ecuaci6n (6-72), en este caso, puede simplificarse como sigue:
K = [1 0
donde
(6-73)
.'. ,
~n
= G-nH
[Para conocer los detalles de la deducci6n de las ecuaciones (6-72) y (6-73), yea los problemas A-6-12 y A-6-13.] 4. Si es bajo el orden n del sistema, sustituya K
=
[kl
IzI - G + HKI = 0
y a continuaci6n haga coincidir los coeficientes de las potencias de z de esta ecuaci6n caracteristica, con potencias iguales de z de la ecuaci6n caracteristica deseada
Un calculo directo de la matriz K como este puede resultar mas simple en sistemas de bajo orden.
Ejemplo 6-6 Considere el sistema
412
Capitulo 6
donde
z = I0.16
a, = 1,
-1 z + 1
I=
Z2
+ 0.16
a2 = 0.16
Determine una matriz de ganancia de realirnentacion del estado K adecuada, tal que el sistema tenga 1(>5 pol os en lazo cerrado en
0.5 + jO.5,
z = 0.5 - jO.5
es 2. Por 10 tanto, el sistema es de estado completamente control able, Yes posible la ubicacion arbitrana de polos. La ecuacion caracteristica para el sistema deseado es
IzI - G + HKI
= Z2 -
+ 0.5
de modo que,
a,
=
-1,
a2 = 0.5
Metoda 1. sigue:
Observe que el sistema original ya esta en la forma canonica controlable, por 10que la matriz de transf macion T se convierte en I:
T
Par 10tanto,
MW
[H:
GH][;' ~] [~
=
-nu ~]
[~ ~]
-2]
Metoda 2.
donde
cj>(G) = G
2 -
G + 0.51 = [
-1 + 0
1] fO.5 0 ] 0.5
= [0.34 -2
Secci6n 6-5
413
En concecuencia,
= [0 11[0
= [0.34
-1
-2
2.34
-2]
Metoda 3. De la ecuacion (6-72), la matriz de ganancia de realimentacion del estado K deseada, se determina como sigue:
[G - (0.5 + jO.5)Ij-1 H
= [-0.5 - jO.5
-0.16
1
-1.5 - jO.5]
-I
[1]
-1 0.66 + j ]
=
[G - (0.5 - jO.5)Ij-1 H
[~I ~21-1
0.6~ 1+ j
=
0.6~ ~ j ]-1
-0.5 + jO.5
-0.5 - jO.5
-1 + ;0.66 Por 10 tanto se determina que la matriz de ganancia de realimentacion del estado K deseada es
[ -0.7178(1 + j) -1 + ;0.66
~2]-1
K = [1
1][~1
0.7178(1 - j) 1 + jO.66
-1.4356 ] 1 + jO.66
-1
= [1 11 -0.7178(1 + j)
[ -1+jO.66
=
1.4356 + jO.66
[0.34
-2]
414
Capite: ::)
Metoda 4.
Es de observarse que, para sistemas de bajo orden como este, puede resultar mas sen.:.
sustituir en la ecuacion caracteristica, y escribir la ecuacion en funcion de las k aun sin determinar. De este me esta ecuacion sera igual a la ecuacion caracteristica deseada. El procedimiento es el que sigue:
IzI - G + HKI = \[
~ ~]- [-~.16
z
-1
-iJ
I
2 [~}kl kl\
I0.16 + k,
z + 1 + k2
= Z2
+ (1 + k 2 )z + 0.16 + k,
0 0
+ (1 + k 2 )z + 0.16 + k, = Z2
1 + k2
+ 0.5
= -1,
0.16 + k, = 0.5
de donde
k, = 0.34,
k,
-2
Observe que para sistemas de orden superior, los calculos involucrados en este metodo pueden ser laboriosos. En tal caso sera preferible usar otros metodos.
x(k + 1)
Con realimentacion de estado u(k)
=
Gx(k) + Hu(k)
x(k + 1) = (G - HK)x(k)
Observe que la solucion de esta ultima ecuacion esta dada por
x(k)
(G - HK)kX(O)
(6--
Si los valores caracteristicos J1 g de la matriz G - UK se presentan dentro del circulo unitario, e ces el sistema es asintoticamente estable. A continuacion demostraremos que si seleccionamos todos los valores caracteristicos G _ UK como cero, es posible obtener la respuesta con oscilaciones muertas, es decir,
x(k)
=
0,
para k ~ q, q
"5,
Secci6n 6-5
415
N~[~ ~ ~:: il
juega un papel de importancia. Considere, por ejemplo, la matriz de 4 x 4 de potencia nula:
N =
Observe que
[~
[~
1 0 0 0
0 1 0 0 0 0 0 0
~]
N' =
[~
10]
N' =
o o o o
~J
N' =
[~
0 0 0 0
0 0 0 0
~]
(6-75)
N" = 0
Ahora considere el sistema de estado completamente controlable dado por
x(k
+ 1)
= Gx(k)
+ Hu(k)
Hagamos que las localizaciones deseadas de los polos sean el origen, 0 bien, que los valores caracteristicos deseados sean cero: f.J1 = f.J2 = ... = f.J1I = O. Entonces podemos demostrar que la respuesta a cualquier estado inicial x(O) es con oscilaciones muertas. En vista de que la ecuacion caracteristica que tiene los valores caracteristicos deseados puede darse por
= z"
al
zn
= a2 = ... = an = 0
[-an
-an-l
-adT- 1
(6-76)
Definimos tarnbien
+ 1) = r
GTx(k)
+r
Hu(k)
= Gx(k) +
Hu(k)
416
Capih.Jc.
Si utilizamos la realimentaci6n del estado u(k) = -Kx(k) = -kTx (k), entonces esta ultima ecuacion .. convierte en
x(k + 1)
Por la ecuaci6n (6-76), G - HKT = G - H[-an
= (G - HKT)x(k)
-ad
-an-l
~[1
0 0 0 -an
1 0
0 -an-l
0 1 0 -a n- 2 0 1 0 -an- 2 0 0
0 0
-al
f]1
[-an
-an-l
1 0
0 -an-l
0 0
o o o
-al
0 1 0 0 0 1 0 0 0 0 0 0
Asi que
1 0
(G - HKT)" = 0 En terminos del estado original x(k), tenemos x(n) = (G - HK)"x(O) = (TGr 1 - THK)"x(O) = [T(G - HKT)T-1]"x(O) = T(G - HKT)" T- 1x(O) = 0
De este modo hemos demostrado que si los valores caracteristicos deseados son todos cero, ent cualquier estado inicial xeD) se puede llevar al origen en por 10menos n periodos de muestreo. respuesta es con oscilaciones muertas, siempre y cuando la sefial de control u(k) sea no aco
Comentarios acerca del control con oscilaciones muertas. EI concepto de la respuesza oscilaciones muertas es unico para los sistemas de control en tiempo discreto. En los sist control en tiempo continuo no existe la respuesta con oscilaciones muertas. En el control con ciones muertas, cualquier vector de error distinto de cero sera llevado a cero en no mas de n de muestreo, si la magnitud del control escalar u(k) no esta acotada. EI tiempo de asen depende del periodo de muestreo, ya que la respuesta se asienta en, a 10mas, n periodos de m Si el periodo de muestreo T se escoge muy pequefio, el tiempo de asentamiento tambien sera pequefio, y esto implicara que la sefial de control tenga una magnitud extremadamente grande. ser asi, no seria posible llevar la respuesta de error a cero en un periodo corto. En el control con oscilaciones muertas, el periodo de muestreo es el unico parametro de no. Por 10tanto, si se desea una respuesta con oscilaciones muertas, el disefiador debera escog cuidado el periodo de muestreo, de forma que en la operaci6n normal del sistema no se req una magnitud de control extremadamente grande. Aprecie que no es fisicamente posible a
Secci6n 6-5
417
sin limite la magnitud de la serial de control. Si la magnitud es incrementada en forma suficiente, siempre tendra lugar el fen6meno de saturaci6n. Si la saturaci6n ocurre en la magnitud de la seftal de control, entonces la respuesta ya no podra tener oscilaciones muertas. EI tiempo de asentamiento sera mayor que n periodos de muestreo. En el disefio real de los sistemas de control con oscilaciones muertas, el disefiador debe estar consciente del intercambio a efectuar entre la magnitud de la sefial de control y la velocidad de respuesta.
Ejemplo 6-7 Considere el sistema dado por
= Xl(k + [ x2(k + 1)
1)] [0 -0.16
u(k)
=
(6-77)
Determine la matriz de ganancia de realimentaci6n del estado K, tal que cuando la senal de control este dada por
-Kx(k)
el sistema en lazo cerrado (sistema de regulaci6n) exhiba la respuesta con oscilaciones muertas a un estado inicial x(O). Suponga que la seiial de controlu(k) no esta acotada. Refiriendonos a la ecuaci6n (6-76), para la respuesta con oscilaciones mucrtas, tenemos que
(6-78)
(6-78). T
EI sistema dado por la ecuaci6n (6-77) ya tiene la forma canonica control able. Por 10tanto. en la ecuaci6n = I. La ecuacion caractcristica del sistema dado por la ecuacion (6-77) es
IzI -
GI =
10.~6
~111
Z2 + Z + 0.16
Z2 + alZ + a2
Y por 10 tanto.
a,
En consecuencia, la ecuacion (6-78) se convierte en
0.16
-1]
K=[-a2
-ad=[-0.16
Esto proporciona la matriz de ganancia de realirnentacion del estado deseada. Verifiquemos que la respuesta del sistema a un estado inicial arbitrario x(O) es en realidad la respuesta con oscilaciones muertas. En vista de que la ecuaci6n de estado en lazo cerrado se convierte en
[0 -0.16
l][Xl(k)] x2(k)
=
si cl estado inicial esta dado por
[0
l][Xl(k)] x2(k)
[;~~~n [~
=
[:~m] [::m]
418
Entonces, el estado x(k) para k = 2, 3, 4, ... se convierte en cero y la respuesta tiene en \ oscilaciones muertas.
Ubicacion de polos cuando la selial de control es un vector. Hasta este momento h . considerado el problema de la ubicaci6n de polos cuando la sefial de control es un escalar. Si la s de control es una cantidad vectorial (vector de dimensi6n r), se puede acelerar la respuesta, existe mas libertad para escoger las sefiales de control u](k), uik), ... , ur(k) a fin de acelerar respuesta. Por ejemplo, en el caso de un sistema de orden n con un control escalar, la respuesta oscilaciones muertas se puede conseguir en a 10 mas n periodos de muestreo. En el caso del c de vector u(k), la respuesta con oscilaciones muertas puede conseguirse en menos de n periodos muestreo. En el caso del control con un vector, sin embargo, se hace mas compleja la determinacion je matriz de ganancia de realimentaci6n del estado K. En el apendice C presentaremos un caso de tipo. Sistema de control con entrada de referencia. Hasta ahora hemos considerado sistemas regulaci6n. En el sistema regulador, la entrada de referencia queda fija durante un largo peri las perturbaciones extemas crean estados distintos de cero. La ecuaci6n caracteristica para el sis . determina la velocidad mediante la cual los estados no nulos se acercan al origen. A contin consideraremos el caso en el que el sistema tiene una entrada de referencia. Considere el sistema mostrado en la figura 6-2. La planta queda descrita por las sigui ecuaciones de estado y de salida:
x(k
+ 1) = Gx(k) + Hu(k)
y(k)
= Cx(k)
+ 1)
(G - HK)x(k) + HKor(k)
[zI - G + HKI = 0 Como se enunci6 antes, si el sistema es de estado completamente controlable, entonces puede minarse la matriz de ganancia de realimentaci6n K, a fin de que proporcione los polos ee cerrado deseados.
tik) ulk)
Planta
x(k)
Figura 6-2
3ecci6n 6-5
419
Es importante sefialar que la realimentacion del estado puede modificar la ecuacion caracterisrica correspondiente al sistema, pero que, al hacerlo, se modifica la ganancia en estado perrnanente del sistema completo. Por 10 tanto, es necesario tener una ganancia ajustable K o en el sistema. Esta ganancia K o debe ajustarse de tal forma que la respuesta escalon unitario del sistema en estado perrnanente sea la unidad, 0 que y(x) = I. A fin de aclarar los detalles, veamos el siguiente problema de ejemplo.
Ejemplo 6-8 Considere el sistema definido por
G=[-~.16
Z1
-iJ,
H=[~J,
Z2
C=[10J
Disene un sistema de control tal que los polos en lazo cerrado deseados de la ecuacion caracteristica esten en
= 0.5 + jO.5,
= 0.5 - jO.5
Z2 -
+ 0.5
-2J
K = [0.34
Gx(k) + Hr(k)
donde
G= G -
HK,
H = HKo
La constante de ganancia K o puede determinarse en el espacio de estados 0 en el plano z, mediante la funeion de transferencia de pulso. En este ejemplo, utilizaremos este ultimo metodo. La funcion de transferencia pulso Y(z)/R(z) para este sistema, es
G = G - HK =
[ -0.16 0
H=
[~]Ko = [~J
420
Por 10tanto.
Capitu:: ::)
G(z)
[1
oJ[ 0~5
Ko
Z
z .',
T[2J
1
Z2 -
+ 0.5
As! que
Y(z) R(z)
G() z
= Z2
Ko
Z
+ 0.5
Para determinar la con stante de ganancia K(h utilizamos la condicion de que sea la unidad la salicr estado permanente y(x) para la entrada escalon unitario, es deck
limy(k)
k---+'X-
= lim(l
z-I
- Z-l)y(Z)
. z - 1 I z1l?,-z-
Ko
Z2 Z
+ 0.5 z - 1
= 2Ko = 1
En comsecuencia, hemos determinado Ko como
Ko = 0.5
La figura 6-3 muestra los diagramas de bloques del sistema disefiado. La respuesta escalon unitz estc sistema puede obtenerse con facilidad mediante el uso de MATLAB. EI programa 6-1 de \1.-\, es uno de muestra para obtener la respuesta escalon unitario. La figura 6-4 muestra la curva de re-;;:-o resultante.
r(k)
u(k)
0.5
1--+-1+
x (k + 1) = G x(k) + H u (k)
y(k)
x(k)
(a)
____.~[]I-----~-I
r(k)
(b)
Z2 -
z + 0.5
-----y(k)
(a) Diagrama de bloques del sistema de control diseiiado en eI ejcmplo 6-8; (b) diagrama de bk
Seccion 6-6
Observadores de estado
421
nurn ee [0
den~[1
r~
v~[O
grid
title(' Respuesta escalon unitario') xlebelfk") ylebel('y(k)')
Respuestaescalon urutario
1.2
".
'0
::;<
>:.
0.8
o.s
0
0.4
0.2
40
k
Figura 6-4 Respuesta escalon unitario del sistema mostrado en la figura 6-3b).
En la seccion 6-5 analizamos un metodo para el disefio de la ubicacion de polos, que utiliza la realimentacion de todas las variables de estado, con el fin de formar el vector de control deseado. En la practica, sin embargo, no todas las variables de estado estan disponibles para la medicion directa. En muchos casos practices, solo son medibles unas cuantas variables de estado de un sistema dado. mientras que las demas no 10 son. Puede ser, por ejemplo, que solo las variables de salida son
422
Capitulo 6
y(k)====~
u(k)====~
Observador de estaoo
medibles. En este caso, sera necesario estimar aquellas variables de estado que no puedan medirse directamente. Esa estimacion sue Ie llamarse observacion. En un sistema practice es necesario observar 0 estimar las variables de estado no medibles a partir de las variables de salida y las de control Un observador de estados, tambien conocido como estimador de estados, es un subsist del sistema de control que \leva a cabo una estimacion de las variables de estado, a partir de mediciones de las variables de salida y control. Aquf, el concepto de observabilidad analizado en seccion 6-3 juega un papel importante. Como veremos mas adelante, se pueden disefiar observ res de estados si, y solo si, se satisface la condicion de observabilidad. En los anal isis siguientes de los observadores de estado, utilizaremos la notacion x (k) designar el vector estado observado. En muchos casos, este vector (k) se utiliza en la realiment del estado para generar el vector de control optirno. En la figura 6-5 se muestra un esquema de observador de estados. EI observador de estado tendray(k) y u(k) como entradas, y x (k) como lida. A continuacion analizaremos, primero, la condicion necesaria y suficiente para la observaci del estado, y despues estudiaremos el observador de estados de orden comp/eto. La observacion estado de orden completo significa que observamos (estimamos) las n variables de estado, sin portar si algunas variables de estado estan disponibles para la medicion directa. A veces, C solo necesitamos la observacion de las variables de estado no medibles, pero no de aquellas di mente medibles, esto resulta innecesario. La observacion de solo las variables de estado no m se conoce como observacion de estado de orden reducido, y se analizara mas adelante en esta cion. La observacion de las variables de estado no medibles, ademas de algunas (no todas) las \ bles de estado medibles, se conoce como observacion de estado de orden reducido.
Condicion necesarla y suflciente para la observacion del estado, La figura 6-6 muestra sistema de regulacion con un observador de estados. Analizaremos una condicion necesaria ~ ciente, segun la cual puede observarse (estimarse) el vector estado. De la figura 6-6 obtenemos ecuaciones de estado y de salida como sigue:
x(k + 1)
y(k)
donde x(k)
u(k)
= vector de
matriz de n
matriz de m x n
Seccion 6-6
u(k)
Observadores de estado
y(kJ
423
x(k)
u(k)
Observador de estado
y(k)
Figura 6-6
A fin de poder observar (estimar) las variables de estado, debemos ser capaces de obtener x(k + I) en terminos de y(k), y(k - I), , .. , y(k - n + I), Y u(k), u(k - I), ... , u(k - n + I). De Ia ecuaci6n (6-79),
= G- 1 x(k +
1) - G- 1 Hu(k)
(6-81 )
+ 1) - G- 1Hu(k)] - G- 1Hu(k - 1)
= G-Zx(k +
En forma similar,
x(k - 2)
1) - G-zHu(k) - G- 1 Hu(k - 1)
= G-Zx(k)
=
- G-zHu(k - 1) - G- 1 Hu(k - 2)
x(k - n
+ 1)
= G-nx(k
+ 1) - G-nHu(k) - G-n+1Hu(k - 1)
- ... - G- 1 ~u(k - n + 1)
Sustituyendo la ecuaci6n (6-81) en Ia ecuaci6n (6-80), obtenemos
y(k)
= Cx(k) =
CG-1x(k
+ 1) - CG-1Hu(k)
424
Copitu;
- CG- 1 Hu(k - 2)
y(k - n
1) = Cx(k - n
1) = CG-nx(k
1) - CG-nHu(k)
- CG-n+1Hu(k - 1) - ... - CG-IHu(k - n Si combmamos las n ecuaciones antenores en una ecuacion matnciat, obtenemos
+ 1)
y(r(~)
[
y(k - n
1)
] = 1)
[~~-:]X(k +
CG- n
1)
[
o bien
~~=:: CG~IH
CG-nH CG-n+IH
o ][
CG~IH
~~::]X(k +
CG- n
1) = [
y(r(~
y(k - n
1)
] 1)
+
[
CG - I H CG-zH
0 CG-IH
CG- n+ 1 H
o ][
u(k) u(k - 1)
CG-nH
CG~IH
u(k ..', + 1)
Observe que el segundo miembro de la ecuacion (6-83) es total mente conocido. Por 10 tanto, x(kpuede determinarse si y solo si
I l
1
rango
lC~-Z J= n
CGII
CG-
Dado que la matriz G es no singular, multiplicar por Gil cada uno de los renglones del primer . bro de la ecuacion (6-84) no cambia la condicion de rango. Por 10 tanto, la ecuacion (6-804 equivalente a
rango
l~~::~:
I
~
1]
=
Secci6n 6-6
Observadores de estado
425
(6-85)
Es claro que esta es la condici6n de observabilidad completa del sistema definido por las ecuaciones (6-79) Y(6-80). [Refierase a la ecuaci6n (6-17).] Esto significa que si se satisface la ecuaci6n (6-85) (es decir, si el sistema es completamente observable), entonces se puede determinar x(k + I) a partir de y(k), y(k - I), ... , y(k - n + I) Y u(k), u(k - I ), ... , u(k - n + I). Por 10 tanto, hemos demostrado que la condici6n necesaria y suficiente para la observaci6n del estado es que el sistema sea completamente observable. Como caso especial, si y(k) es un escalar y la matriz C es una de I x n, entonces se puede obtener x(k + I) premultiplicando ambos miembros de la ecuaci6n (6-83) por el inverso de la matriz dada en la ecuaci6n (6-84), como sigue:
x(k + 1) =
CG - 1j - l [
C~-2
CG-n
+ ..
[
.
. .
.
o
CG-n+lH
j[
j
(6-86)
CG-n
CG-nH
CG~IH
+ 1)
La ecuaci6n (6-86) proporciona el valor x(k + I) cuando y(k) es un escalar. Como qued6 demostrado en el analisis anterior, el estado x(k + 1) puede determinarse a partir de la ecuaci6n (6-83), siempre que el sistema sea completamente observable. Por 10 tanto, para un sistema de esta clase, el vector de estado puede determinarse en n periodos de muestreo como maximo. En presencia de perturbaciones extemas y ruido en la medicion, sin embargo, este metodo puede no ofrecer una determinaci6n precisa del vector de estado. Por ello, para determinar el vector de estado, en presencia de perturbaciones y ruido en la medicion, es necesario un enfoque distinto. Asirnismo, si la matriz C no es una de 1 x n sino una de m x n (con m > 1), no puede definirse la inversa de la matriz de la ecuaci6n (6-84), y la ecuaci6n (6-86) no es aplicable. Con el fin de resolver estos casos, un metodo muy poderoso para la estimaci6n del vector de estado es utilizar un modelo dinamico del sistema original, como sigue: Considere el sistema de control definido por las ecuaciones (6-79) y (6-80). Supongamos que el estado x(k) debe aproximarse al estado x(k) del modelo dinamico:
(6-87) (6-88)
= Cx(k)
donde las matrices G, H Y C son las mismas que las del sistema original. Asimismo, supongamos que el modelo dinamico esta sujeto a la misma sefial de control u(k) que el modelo original. Si las condiciones iniciales para el sistema real definido por las ecuaciones (6-79) y (6-80), y para el modelo dinamico definido por las ecuaciones (6-87) y (6-88), son las misrnas, entonces el estado
426
Capitulo 6
X (k) y el estado x(k) seran iguales. Si las condiciones iniciales son distintas, entonces el estado x(k) y el estado x(k) seran distintos. No obstante, si la matriz G es una matriz estable, x(k) se acercara a x(k), aun en el caso, que veremos, en que las condiciones iniciales sean diferentes. Si identificamos la diferencia entre x(k) y x (k) como e(k), 0 definimos
e(k)
= x(k)
- i(k)
e(k + 1) = Ge(k)
Si la matriz G es estable, entonces e(k) se acercara a cero y (k) a x(k). Sin embargo, el comportamiento del vector de error, que solo depende de la matriz G, puede no ser aceptable. Asimismo, si 1:1 matriz G no es una matriz estable, entonces el error e(k) no se acercara a cero. Es, por 10 tanto, deseable modificar el modelo dinamico definido por las ecuaciones (6-87) y (6-88). Debe mencionarse que a pesar de que el estado x(k) puede no ser medible, la salida y(k) si 10 es : EI modelo dinamico definido por las ecuaciones (6-87) y (6-88) no utiliza la salida medida y(k). El desempefio del modelo dinamico puede mejorar si se utiliza la diferencia entre la salida medida ~I t:. y la salida estimada CX (k) para vigilar 0 monitorear el estado x (k); es decir, si el modelo dinamice de la ecuaci6n (6-87) se modi fica de la forma siguiente:
Observador de estados de orden completo. El orden del observador de estados que se zara aqui es el mismo que el correspondiente al sistema. Como ya se indico, un observador estados como este se conoce como observador de estados de orden completo. En el anal isis siguiente supondremos que el estado real x(k) no puede medirse en forma di tao Si el estado x(k) debe estimarse, es conveniente que el estado observado 0 el estado esti (k) sean tan cercanos al estado real x(k) como sea posible. Aunque no es necesario, resulta c niente que el observador de estados tenga las matrices G y H iguales a las del sistema original. Es importante observar que en el analisis presente, el estado x(k) no esta disponible para medicion directa y, en consecuencia, el estado observado (k) no puede compararse con el e
Secci6n 6-6
Observadores de estado
x(k) y(k)
427
-K
Figura 6-7 Sistema de control con realimentaci6n del estado.
real x(k). Sin embargo, dado que la salida y (k) = CX (k) sf puede medirse, es posible comparar y (k) CX (k) con y(k). Considere el sistema de control con realimentacion del estado que se muestra en la figura 6-7. Las ecuaciones del sistema son
(6-89) (6-90)
G H C K
= = =
r)
Suponemos que el sistema es de estado completamente controlable y completamente observable, pero que x(k) no esta disponible para rnedicion directa. La figura 6-8 muestra un observador de estados incorporado el sistema de la figura 6-7. EI estado observado x(k) se utiliza para formar el vector de control u(k), es decir u(k) = -Kx(k) De la figura 6-8, tenemos que (6-91 )
x(k + 1)
(6-92)
donde K, es la matriz de ganancia de realimentacion del observador (una matriz de n x m). Esta ultima ecuacion puede modificarse y resultar
(6-93)
428
u(kl
Capitulc
y(kJ
I~=============l ~K
x(k)
u(k)
Figura 6-8
EI observador de estados dado por la ecuacion (6-93) se llama observador de prediccion, pues estimado x(k + 1) esta un periodo de muestreo adelante de la medicion y(k). Los valores carae ticos de G - KeG suelen conocerse como palos del observador.
Observe que si i t t1
i(k
+ 1)
Gi(k)
+ Hu(k)
que es identica a la ecuacion de estado del sistema. Por 10 tanto, si x(k) = x(k), la respuesta sistema de observador de estados es identica a la del sistema original. Para obtener la ecuacion de error del observador, restemos 1aecuacion (6-93) de la ec (6-89): x(k + 1) - i(k + 1) = (G - K e C)[x(k) - i(k)] Ahora definamos la diferencia entre x(k) y x (k) como el error e(k):
e(k + 1)
(G - K, C)e(k)
De la ecuacion (6-95) vemos que el comportamiento dinamico de la sefial de error queda det do por los valores caracteristicos de G - KeC. Si la matriz G - KeC es una matriz estable, el de error convergira a cero para cualquier error inicial e(O). Es decir, x(k) convergira a x(k) i
Secci6n 6-6
Observadores de estado
429
dientemente de los valores de x(O) y x (0). Si los valores caracteristicos de G - KcC estan localizados de forma tal que el comportamiento dinamico del vector de error es adecuadamente rapido, entonces cualquier error tendera a cero con una velocidad adecuada. Una forma de obtener una respuesta rapida es utilizar una respuesta con oscilaciones muertas. Esto puede obtenerse si a todos los valores caracterlsticos de G - KcC se les da un valor igual a cero
Comentarios. Dado que el sistema definido por las ecuaciones (6-89) y (6-90) se supone completamente observable, es posible una ubicacion arbitraria de los valores caracteristicos de G - KcC. Para explicar esto mas arnpliamente, observe que son iguales los valores caracteristicos de G - KcC Ylos de G* - C* K: . Mediante el principio de dualidad presentado en la seccion (6-3), la condicion para la observabilidad completa del sistema definido por las ecuaciones (6-89) y (6-90) es la misma que la condicion para la controlabilidad completa del estado para el sistema
x(k
+ 1)
G*x(k)
+ C*u(k)
(6-96)
En la seccion 6-5 vimos que la ubicacion arbitraria de los polos es posible para el sistema de la ecuacion (6-96), siempre y cuando sea de estado completamente contra labIe, 0 el rango de la matriz
G [0 -0.16]
=
-1
'
C = [0 1]
Disenc un observador de estado de orden completo, suponiendo que la configuraci6n del sistema es identica a la mostrada en la figura 6-8. Los valores caracteristicos deseados para la matriz de observador son
z = 0.5 + iO.5,
z = 0.5 - iO.5
Z2 -
+ 0.5
= 0
Dado que la configuracion del observador de estados csta especificada como se muestra en la figura 6-8. el diseno del observador de estados se reduce a la determinacion de una matriz de ganancia de rcalirnentacion de observador K, apropiada. Antes de continuar. exarnincrnos la matriz de observabilidad. EI rango de
[C* : G*C*]
= [~ -
430
es 2. Por ello, el sistema es completamente observable y es posible determinar la matriz de ganancia realimentaci6n del observador deseada. Refiriendonos a la ecuaci6n (6-95),
e(k + 1) = (G - K, C)e(k)
donde
[z I - G + K,
c=0
z + 0.5 = 0
k, = 0.34,
es decir,
K,
[o~~]
Observe que existe una relaci6n dual entre la ecuaci6n de estado del sistema considerado en el 6-6 y la del sistema presente. La matriz de ganancia de realimentaci6n del estado K obteniza ejemplo 6-6 es K = [0.34 - 2]. La matriz de ganancia de realimentaci6n del observador K, obter; se relaciona con la matriz K mediante la relacion K, = K*.
Diseiio de los observadores de prediccion. Hasta ahora hemos discutido los ob= res de predicci6n de orden completo. Se trata de observadores de predicci6n porque el x(k + I) esta un periodo de muestreo delante de la medici6n y(k). Resolvimos un prob ejemplo sencillo, suponiendo una matriz K, que determinaba que la ecuaci6n caracteristica .:1 KeCi = 0 tuviera valores caracteristicos prescritos. A continuaci6n analizaremos un metooe general para determinar la matriz de ganancia de realimentaci6n del observador K; Considere el sistema definido por
x(k
+ 1)
Gx(k)
Hu(k)
y(k) = Cx(k)
Secci6n 6-6
Observodores de estodo
431
donde
x(k) = vector de estado (de dimension n) u(k) = vector de control (de dimension r) y(k) = senal de salida (escalar) G = matriz no singular de n x n H = matriz de n x r C = matriz de 1 x n
EI sistema se supone de estado completamente controlable y completamente observable. Por 10 tanto, la inversa de
= -Ki(k)
donde x (k) es eI estado observado y K es una matriz de n x r. Supongamos, adernas, que la configuracion del sistema es la misma que fa mostrada en la figura 6-8. La dinamica del observador de estados esta dada por la ecuacion i(k
= (G Primero definimos
(6-100)
Q = (WN*)-l
donde
(6-101)
N
y
(6-102)
an - 2
an - 3
W=
;: alI 1 0
alI] 1 0 :: 0 0 0 0
(6-103)
donde ai' a2 , . , a,,_1 son los coeficientes de fa ecuacion caracterfstica de la ecuacion de estado original dada por fa ecuacion (6-98),
x(k) =
Q~(k)
(6-104)
donde f;(k) es un vector de dimension n. Utilizando la ecuacion (6-104), las ecuaciones (6-98) y (6-99) pod ran modificarse a fa forma
432
~(k
Capitulo 6
(6-105) (6-106)
don de
Q'GQ
~ [I
0 0 0 0
0 0 1 0
-~n-I
-a. ]
(6-107)
-al
CQ = [0
1]
(6-108)
[Refierase al problema A-6-9 para la deducci6n de las ecuaciones (6-107) y (6-108).] Ahora, se define
x(k) = Q~(k)
Sustituyendo la ecuaci6n (6-109) en la ecuaci6n (6-100), tenemos que
(6-109)
t(k
+ 1)
~(k
= Q-\G - KeC)Qt(k)
+ Q-1Hu(k) +
Q-IKeCQ~(k)
(6-1101
(6-111)
Definamos
+ 1)
Q-l(G - K, C)Qe(k)
(6-11~1
Es necesario que la dinamica de error sea estable y que e(k) Begue a cero con velocidad suficiente. El procedimiento para la determinaci6n de la matriz K, sera, primero, seleccionar los polos de observador deseados (los valores caractetisticos de G - KeC) y, a continuaci6n, determinar la matriz K, de manera que se de los polos deseados. Si requerimos que e(k) Begue a cero tan pronto como sea posible, entonces se necesita que la respuesta del error tenga oscilaciones muertas, por 10 que debemos seleccionar todos los valores caracteristicos de G - K,C como cero. Observe que
donde
Seccion 6-6
Observadores de estado
433
(6-113)
0 0 55. ] 0
y
0 0 0
1
8n 8n - 1 8n - 2
81
-al -
se convierte en
z -1 0 0
es decir,
0 0 z 0 -1 z 0 0
0 0 0
an an-I a n- 2
+ 8n + 8n - 1 + 8n - 2 =0
al
-1
z +
+ 81
(6-114)
Es facil apreciar que cada uno de los 8", 8"_1' ... , 81esta asociado solo a uno de los coeficientes de la ecuacion caracteristica. Suponga que la ecuacion caracteristica deseada para la dinarnica de error es
(6-115) Observe que los valores caracteristicos deseados Il, (es decir, las localizaciones de los polos en lazo cerrado deseados) determinan la velocidad con la que el estado observado converge al estado real de la planta. Comparando los coeficientes de las potencias iguales de z en las ecuaciones (6-114) y (6-115),obtenemos al + 81 = 01
a:
= 02
434
de la cual obtenemos
Capitulo 6
81
al -
al
~ = a2 - a2
[] 8
n
an
an a n-l
] (6-116)
o' K t :- l = = 5n .
51
Por 10 tanto,
a n - an ] a n-l ~ a n-l al al
a n-l -
: .
al -
al
K.
Q
[
(WN*)-1
an - an ] a n-l ~ a n-l al al
(6-117)
La ecuacion (6-117) especifica la matriz de ganancia de realimentacion necesaria K e La figura 6-9 muestra una representacion altema del sistema de control con realimentacion del estado observado. Una vez seleccionados los valores caracteristicos deseados (0 la ecuacion caracterfstica que se desea), es posible designar el observador mediante un metodo similar al utilizado en el caso del
u(k)
~(k)
co
y(k)
-K
~(k)
u(k)
t=:=======1
Figura 6-9
0- K.
~=========!J
Representacion altema del sistema de control con realimentacion del estado observado.
Seccion 6-6
Observadores de estado
435
problema de ubicacion de polos. La ecuacion caracteristica deseada puede seleccionarse de tal forma que el observador responda por 10 menos cuatro 0 cinco veces mas aprisa que en el sistema en lazo cerrado; en algunas aplicaciones puede desearse una respuesta con oscilaciones muertas. Si querernos tener una respuesta con oscilaciones rnuertas, la ecuacion caracteristica deseada se convierte en
(6-118)
Cornparando la ecuacion (6-114) con la ecuacion (6-118), requerimos que
al
+ l>1
= =
0 0
a2 +
liz
Por
10
K,
~ [ 1: ~ Q
k
]
sf ~
lin ]
[ -an ]
(WN*j'
-:~,'
(6-119)
Formula de Ackermann. La expresion dada por la ecuacion (6-117) no es la (mica disponible para determinar la matriz de ganancia de realimentacion del observador K; A continuacion, deducirernos la formula de Ackermann para la determinacion de K; Considere el sistema completamente observable definido por las ecuaciones (6-98) y (6-99). Observe que en este sistema la salida y(k) es un escalar. Refiriendonos a la ecuacion (6-115), la ecuacion caracteristica para la dinarnica de error es
(6-120)
Q-IGQ
G,
-I
Ke
x.,
A
CQ =
t:
IzI - G + Keel
= 0
En el disefio del observador, deterrninamos la rnatriz Kc de tal forma que su ultima ecuacion caracterfstica sea identica a la ecuacion caracteristica deseada para el vector de error; esta es
(6-121)
Es decir,
IzI -
G + Ke tl = (z
=
436
Capitula 6
donde Jil, Ji2, ... , Jill son los valores caracteristicos de la matriz (G - Ke C). Para sistemas fisicos. los valores caractertsticos complejos siempre aparecen en pares complejos conjugados. En el analisis presente, supondremos que todos los valores caracteristicos complejos se presentan en pares complejos conjugados, de tal forma que son reales los coeficientes ai' a 2, , all de la ecuacion caracteristica, De este modo, la ecuacion caracteristica para la matriz (G * - C* K:) puede estar dada por
an-l
z +
an
=0
donde J.1i es la conjugada compleja de u; En la seccion 6-5 deducimos la formula de Ackermann para la determinacion de la matriz de ganancia de realimentacion del estado K, para el problema de disefio de la ubicacion de polos. Ahi determinamos la matriz K, de tal forma que la ecuacion caracterfstica
[z I - G + HKI = 0
seria la misma que la ecuacion caracteristica deseada, ecuacion (6-121). Aqui, en el problema de disefio del observador, deseamos determinar la matriz K~, de tal forma que la ecuacion caracteristica
[z I -
G* + C*K: I = 0
sea la misma que la ecuacion caracteristica requerida dada por la ecuacion (6-121). Es claro que estos dos problemas son uno dual (es decir, matematicamente la determinacion de la matriz Ke es igual a la determinacion de la matriz de ganancia de realirnentacion K del problema de la ubicacior; de polos). Por 10 tanto, es posible utilizar los resultados obtenidos en la seccion 6-5 con respecto a la determinacion de la matriz K, para el problema actual, como se demostrara, En el problema del disefto de bl ubicacion de polos analizado en la seccion 6-5, para la ecuacior del sistema
u(k) = -Kx(k)
la matriz deseada K se obtuvo segun la ecuacion (6-68), que se repite aqui:
K = [0 0
(6-1::::.
En este caso, en el problema del disefio del observador, para la ecuacion de estado
u(k)
= -K: x(k)
la matriz deseada K: puede, por 10 tanto, obtenerse de manera similar ala ecuacion (6-122), cot sigue:
K: = [0
(6-1
Secci6n 6-6
Observadores de estado
437
K: = [0
0 ...
Si tomamos la transpuesta conjugada de ambos miembros de esta ultima ecuacion, tenemos que
Ke
Si
[et>(G*)]*Q-I [
C~ [~]
]_1 CGn-1
1
QGkQ-I
Y, en consecuencia,
G\
0,1,2, ' . , ,n
Qet>(G)Q-I
= =
Q[Gn + al Gn-l + ... + an-I G + an I]Q-I QGn Q-I + al QGn-1 Q-I + ... + an-I QGQ-I + an I
= Gn
+ al Gn-I + .. , + an-I G + an I
et>(G)
(6-125)
Utilizando la ecuacion (6-125), la matriz de ganancia de realirnentacion del observador K, requerida, dada por la ecuacion (6-124), puede escribirse de nuevo en la forma:
Ke
et>(G)[
CGn-1
C~ [~]
]-1
1
(6-126)
donde et>(C) es el polinomio caracteristico deseado de la dinamica de error, La expresion para K" dada por la ecuacion (6- I26) suele lIamarse formula de Ackermann para la determinacion de la matriz de ganancia de realimentacion del observador K;
Resumen.
x(k
+ 1)
u(k) = -Kx(k) Si esta ultima ecuacion se sustituye en la ecuacion del observador, obtenemos x(k
+ 1)
(G - K, C - HK)x(k) + K, y(k)
438
Capitulc:
Esta ecuaci6n define el observador de predicci6n de orden completo, cuando se incorpora el control con realimentaci6n del estado observado. Como en el caso de los cuatro metodos para el diseno de la ubicaci6n de polos, por 10 regular disponibles para determinar la matriz de ganancia de realimentaci6n del observador K, para el sistema completamente observable, se pueden resumir como sigue: 1. Si nos referimos a la ecuaci6n (6-117), la matriz de ganancia de realimentaci6n del observador K, puede estar dada por
a n - an ] an-I ~ an-I [ al [ an - an ] an-I ~ an-I
Ke
(WN*t l
(6-127)
al
al -
al
donde las matrices N y W estan dadas por las ecuaciones (6-102) Y(6-103), respectivamente. Las a, son los coeficientes de la ecuaci6n caracteristica deseada
z"
l
al zn-I
+ ... +
a n-l
an
[zI -
GI
an-I
an
Observe que si el sistema ya tiene una forma can6nica observable, entonces la matriz K, puede determinarse con facilidad, pues la matriz WN* se convierte en una matriz identidad, y por 10 tanto, (WN*r 1 = I. 2. La matriz de ganancia de realimentaci6n del observador K, puede estar dada por la f6rmula de Ackermann, dada, a su vez, por la ecuaci6n (6-126):
x, =
donde
(6-128)
3. Si los valores caracteristicos deseados Ill' 1l2' ... , Il" de la matriz G - KeC son distintos, entonces la matriz de ganancia de realimentaci6n del observador K, puede estar expresada por la ecuaci6n
(6-129)
Observe que los TIt son los vectores caracteristicos de la matriz (G - KeC)*. En el caso especial en que se desee que el vector de error exhiba una respuesta con
Secci6n 6-6
Observadores de estado
439
oscilaciones muertas, de tal forma que f.J1 = f.J2 = . . . = f.Jn = 0, la ecuacion (6-129) puede simplificarse. La ecuacion siguiente dara la matriz K, para el casu de la respuesta con oscilaciones muertas:
(6-130)
i=1,2,3, ... ,n
[Para detalles de la deduccion de las ecuaciones (6-129) y (6-130), yea los problemas A-6-12 y A-6-l3.] 4. Si el orden del sistema es bajo, suponga una matriz de ganancia de realimentacion del observador K, con elementos desconocidos. Entonces los elementos de la matriz K, pueden detenninarse igualando los coeficientes con potencias iguales de z de
IzI - G + K,
(z - J.Ll)(Z - J.Lz) ... (z donde las
Ejemplo 6-10
f.Jj son
CI
an-I
Z + an
Considere el sistema del doble integrador dado por las ecuaciones x(k + 1) = Gx(k) + Hu(k)
y(k) = Cx(k)
donde
= [~
i],
=[
Ti2]'
[1 0]
y T es el periodo de muestreo. (Yea el problema A-5-l6 para la deducci6n de las ecuaciones en el espacio de estados en tiempo discreto correspondientes al sistema del doble integrador.) Suponga que la configuraci6n del observador es la misma que la mostrada en la figura 6-8, para disefiar un observador de estados para este sistema. Se desea que el vector de error exhiba una respuesta con oscilaciones muertas. Utilice los cuatro rnetodos distintos, listados en el analisis anterior. Primero, verifique la condici6n de observabilidad. Observe que el rango de
[C* : G*C*] =
[~ ~]
A
z - 1
Comparando esta ecuaci6n caracteristica con
-TI =
Z2 -
2z + 1
=0
440
obtenemos
Capitulo 6
az = 1
En vista de que se desea una respuesta con oscilaciones muertas, la ecuacion caracteristica deseada para la dinamica del error es
Par 10 tanto,
az = 0 Metoda 1.
x. = (WN*)-l [a z - at ] = (WN*)-l az al N
y
[-1]
2
donde N YW, definidas por las ecuaciones (6-102) y (6-103), respectivamente, son
= [C*: G*C*] =
[~
Por 10 tanto, la matriz de ganancia de realimentacion del observador K, se obtiene como sigue:
Metoda 2.
don de
x. =
[~ i [~ ~ [~]
1
H]
Puesto que se desea una respuesta con oscilaciones rnuertas, de la ecuacion (6-130) teneroos
donde
T}1=CG- 1,
Seccion 6-6
Observadores de estado
441
Observe que
Los vectores
1)1
= [1
oJ[ ~
-IT] = [1
- T]
T)2
=[1 oJ[~
[:
T -I
J=
[1
o][~
-iT]
=[1
-2T]
Por 10 tanto, la matriz de ganancia de realimentaci6n del observador K" se obtiene como sigue:
K.
Metoda -I.
~ ~2~ ~
nH ~H~ l~ j f ~]
x. =
Suponemos que
[z:l
Z2 1 2
Dado que deseamos una respuesta con oscilaciones rnuertas, esta ecuacion caracteristica debe ser igual a
De modo que,
es decir,
Verifiquemos que el vector de error se reduce a cero cuando mucho en dos perfodos de muestreo. Observe que la matriz de coeficientes para la ecuacion de error se convierte en
G - K< C
~ [~
n-[H'
x(O) =
01
~ [ ~~ ~]
[~J
donde
GI
Y b, son arbitrarias, y
442
donde
G,
Capitulo 6
[a]
et(k + [ ez(k + 1) -
1)] _[-1~
-
[-1
[-11
-~
[~-
[0]
Es claro que el vector de error e(k) se convierte en cero en cuando mucho dos periodos de muestreo. Por 10 tanto. la respuesta con oscilaciones muertas. Observe que para cualquier estado inicial xtO), el vector de estado observado se vuelve identico al vector de estado actual en, a 10mucho, dos period os de muestreo. Finalmente, la ecuacion del observador es
= [-\
- -
Comentarios sobre fa seleccion de fa mejor Ke- Refierase a la figura 6-8 y observe que la serial de realimentacion a traves de la matriz de ganancia de realimentacion del observador K, sirve de serial de correccion al modelo de la planta, con el fin de tomar en cuenta las incognitas en la misma. Si estan involucradas incognitas significativas, la sefial de realirnentacion a traves de la matriz K, debe ser relativamente grande. Sin embargo, si la seftal de salida esta muy contaminada por perturbaciones y ruido en la medicion, la salida y(k) no sera confiable y la sefial de realimentacion a traves de la matriz K, debera ser relativamente pequefia. En la determinacion de la matriz K, (que depende de los valores caracteristicos deseados 1'1' 1'2, ... ,I'll)' se deberia examinar cuidadosamente los efectos de las perturbaciones y de ruido implicados en la salida y(k). Recuerde que la matriz de ganancia de realimentacion del observador K, depende de la ecuacion caracteristica deseada
4>(z)
=
La seleccion de un conjunto de 1'1'1'2' ... ,I'll no es (mica. Por 10tanto, se pueden seleccionar muchas ecuaciones caracteristicas diferentes como ecuaciones caracteristicas deseadas. Para cada una de estas tendremos una matriz K, distinta. En el disefio del observador, es conveniente determinar varias matrices de ganancia de realimentacion del observador K, basadas en varias ecuaciones caracteristicas deseadas distintas. Para cada una de las matrices diferentes K e , deberan lIevarse a cabo pruebas de simulacion a fin de evaluar el desempefio resultante del sistema. A continuacion seleccionaremos la mejor K, desde el
Secci6n 6-6
Observadores de estodo
443
punto de vista del desempefio general del sistema. En muchos casos practices, Ia seleccion de la mejor matriz K" se reduce a un punto intermedio entre una respuesta rapida y la sensibilidad a perturbaciones y ruido.
Efectos de la adicion del observador ell UII sistema ell lazo cerrado. En el proceso del disefio de la ubicacion de polos, supusimos que el estado verdadero x(k) estaba disponible para la realimentacion, Pero en la practica, el estado verdadero x(k) puede no ser medible, por 10 que sera necesario que utilicemos el estado observado i (k). Investiguemos ahora los efectos de la utilizacion del estado observado x (k), en lugar del estado verdadero x(k), sobre la ecuacion caracteristica de un sistema de control en lazo cerrado. Considere el sistema de estado completamente controlable y completamente observable, definido por las ecuaciones x(k + 1)
=
Gx(k) + Hu(k)
y(k) = Cx(k) Para el control con realimentaci6n del estado basado en el estado observado
x (k),
tenemos que
u(k)
-Ki(k)
(6-131)
el error e(k):
x(k + 1)
Gx(k) - HKi(k)
(6-132)
Observe que la ecuaci6n de error del observador fue dada en la ecuacion (6-95), que se repite aqui:
e(k
+ 1)
(G - K e C)e(k)
(6-133)
X + 1)] (k [e(k + 1) [G -0 HK
=
HK G - K, C
][X(k)] e(k)
I=
0
Esta ecuacion describe la dinarnica del sistema de control con realimentacion del estado observado. La ecuacion caracteristica para el sistema es
I
es decir,
z I - G + HK
- HK
zI - G
+ KeC
IzI - G + HKllzI - G + K,
q =0
(6-134)
Observe que los polos en lazo cerrado del sistema de control con realimentacion del estado observado estan formados por los polos debidos s610 al disefio de ubicacion de polos, ademas de los polos que se deben solo al diseno del observador. Esto significa que el disefio de ubicacion de polos y el
444
Ccpitulc :
disefio del observador son independientes uno del otro. Pueden diseftarse por separado y combinarse para formar el sistema de control con realimentaci6n del estado. Los polos en lazo cerrado que se desea que se generen mediante realimentaci6n del estado (ubicaci6n de polos) se seleccionan en forma tal que el sistema satisfaga los requisitos de desernpeno. Los polos del observador por 10 general se seleccionan para que la respuesta del observador sea mucho mas rapida que la respuesta del sistema. Una regIa practica es escoger una respuesta de observador por 10 menos cuatro a cinco veces mas rapida que la respuesta del sistema, 0, en algunos casos, escoger todos los polos del observador en el origen (para una respuesta con oscilaciones muertas). En vista de que el observador no es, por 10 general, una estructura de hardware, sino un programa de computadora, es posible aumentar la velocidad de respuesta u obtener la respuesta con oscilaciones muertas de forma que el estado observado converja con rapidez al estado verdadero. La velocidad maxima de respuesta del observador queda generalmente limitada solo por los problemas de ruido y de sensibilidad involucrados en el sistema de control.
Observador actual. En el observador de prediccion, se obtiene el estado observado x (kl a partir de mediciones del vector de salida hasta y(k - I) Ydel vector de control hasta u(k - I). Por 1.:tanto, el vector de control u(k) = -Kx (k) no utiliza la informaci6n de la salida actual y(k). Lna formulaci6n diferente del observador de estados consiste en utilizar y(k) para la estimacion de x(k I Esto se puede lIevar a cabo separando el proceso de observaci6n en dos pasos. En el primer pa..'O. determinamos z(k + I), que es una aproximaci6n de x(k + I) basada en x (k) y u(k). En el segundo paso, utilizamos y(k + I) para mejorar z(k + I). La z(k + I) mejorada es x(k + I). EI observador de estado basado en esta formulaci6n se conoce como observador actual. Considere el sistema de estado completamente controlable y completamente observable, definido por las ecuaciones
x(k
+ 1) = Gx(k) + Hu(k)
y(k) = Cx(k)
donde
x(k) u(k) y(k)
= = = = = =
vector de estado (de dimensi6n n) vector de control (de dimension r) vector de salida (de dimensi6n m) matriz de n
x
G H C
matriz de n x r matriz de m x n
+ 1) =
z(k
+ 1) +
Ke[y(k
+ 1) -
Cz(k
+ 1)]
+ 1) = Gi(k) + Hu(k)
La ecuaci6n (6-136) da la predicci6n z(k + I) con base en x (k) y u(k) en la etapa k. La ecu (6-135) indica que, midiendo y(k + I), podemos mejorar z(k + I) para obtener x(k + I).
Secci6n 6-6
Observadores de estado
445
e(k)
Entonces,
x(k) - x(k)
e(k + 1)
= =
+ Hu(k)]})
= =
Por 10 tanto, la ecuaci6n de error del observador para el observador actual es similar a la del observador de predicci6n dada por la ecuaci6n (6-95). Sin embargo, en la dinamica de error aparece una diferencia. La matriz K, puede obtenerse exactamente como en el caso del observador de prediccion, excepto por que la matriz C queda remplazada por la matriz CG. Para hacer posible que los valores caracterlsticos de (G - KcCG) se ubiquen en forma arbitraria, el rango de la matriz
~~2] [ CGn
= [
CGn~l
C~ ]G
(G*)"~l
debe ser n. Observe que si la matriz G es no singular, entonces esta condici6n es equivalente a la condicion de observabilidad, es decir, rango [C* : G*C* : ... :
C*]
Si el rango de la matriz de observabilidad es n, entonces los valores caracteristicos de G - KcCG pueden ubicarse en forma arbitraria mediante una selecci6n adecuada de K c' Y la matriz K, puede determinarse de manera similar a como se hizo en el caso del observador de predicci6n. En la determinaci6n de la matriz K; remplazamos la matriz C por CG en los calculos involucrados. Por ejernplo, si la salida y(k) es un escalar, la f6rmula de Ackermann, como se dio en la ecuaci6n (6126), se modifica a la forma correspondiente:
~l[O 0
: 0 1
(6-137)
446
Capitulo 6
Con un analisis similar al dado en la secci6n 6-5 [refierase a las ecuaciones (6-55) y (6-57)], es posible utilizar una matriz de transformaci6n adecuada para transformar las matrices G y Ben G* y B, donde
0 y donde todos los valores caracteristicos de la matriz G;2 no contralable de (n - q) x (n - q) se puedan hacer cera. (Por 10tanto, se puede estabilizar el sistema.) A continuaci6n, defina * - ** * K e T - K' e - [K' ell: K' e12] Entonces,
G*
r 1 G*T
B= r 1 B
[}!!.IJ
- [}!U-J[K
0
ell'
:K*IZ] e
[~~-~-:-IJ~;u_t~h~G1;~~~~]
J -
Por 10tanto, si la matriz G es singular y el rango de la matriz de observabilidad es q, s610 necesitamos especificar q valores caracteristicos de la matriz de q x q G ; B 11 K :11'
Observador de orden minimo. Los observadores analizados hasta ahora estan disefiados para reconstruir todas las variables de estado. En la practica, algunas de las variables de estado pueden medirse con precisi6n. Estas variables de estado medibles con precisi6n no necesitan ser estimadas. Un observador que estime menos de n variables de estado, donde n es la dimensi6n del vector estado, se conoce como observador de orden reducido. Si tal observador es el minimo posible, el se conoce como observador de orden minimo. Suponga que el vector de estado x(k) es uno de dimensi6n n y que el vector de salida y(k) es de dimensi6n m, que puede medirse. Dado que las variables de salida m son combinaciones lineales de las variables de estado, m variables de estado no necesitan ser estimadas. S610 necesitamos estimar n - m variables de estado. Entonces, el observador de orden reducido se convierte en un observador de orden (n - m). Un observador de orden n - m como este, es el observador de orden minimo. La figura 6-10 muestra el diagrama de bloques de un sistema con un observador de orden minimo. Es importante notar, sin embargo, que si la medici6n de las variables de salida incluyen ruido significativo y son relativamente poco precisas, la utilizaci6n de un observador de orden completo puede dar como resultado un mejor desempefio del sistema. EI observador de orden minimo puede disefiarse dividiendo primero el vector de estado x(k) en dos partes, como sigue:
donde x,,(k) es aquella porci6n del vector de estado que puede medirse en forma directa [por 10tanto, xaCk) es un vector de dimensi6n m] Y xh(k) es la porci6n no medible del vector de estado [asi que xh(k) es un vector de dimensi6n (n - m)]. Luego, las ecuaciones de estado divididas se convierten en:
(6-138)
Seccion 6-6
Observadores de estado
u(k) x(k) y(k)
447
Transformaci6n
y(k)
Figura 6-10
Sistema de control de realirnentacion del estado observado, con un observador de orden minimo.
(6-139) donde
G aa
Gah
=
=
matriz de m x m matriz de m
x
(n - m)
G ha = matriz de (n - m) x m G hh
=
=
matriz de (n - m) matriz de m
x
x (n - m)
H, H,
matrizde (n-m) x r
Reescribiendo fa ecuacion 6-138, la ecuacion correspondiente a la porcion medible del estado se convierte en
es decir,
= GabXb(k)
(6-140)
donde son med ibles los terminos del primer miembro de la ecuacion, La ecuacion (6-140) actua como ecuacion de salida. En el disefio del observador de orden minimo, consideremos el primer miembro de la ecuacion (6-140) como una cantidad conocida. De hecho, la ecuacion (6-140) relaciona las cantidades medibles con las no medibles del estado.
448
Capitulo
De la ecuaci6n (6-138), la ecuaci6n de la porci6n no medible del estado se convierte en (6-1411 La ecuaci6n (6-141) describe la dinamica de la porci6n no medible del estado. Observe que 105 terminos G h xa(k) y H, u(k) son cantidades conocidas. a EI disefio del observador de orden minimo puede facilitarse si utilizamos la tecnica de diseno desarrollada para el observador de orden completo. Comparemos la ecuaci6n de estado correspondiente al observador de orden completo, con la correspondiente al observador de orden minimo. La ecuaci6n de estado para el observador de orden completo es
xb(k + 1)
Cx(k)
(6-1-l': I
(6-1-l3!
TABLA 6-1 L1STA DE SUSTITUCIONES NECESARIAS PARA ESCRIBIR LA ECUACION DE OBSERVADOR PARA EL OBSERVADOR DE ESTADOS DE ORDEN MINIMO
x(k)
G Hu(k)
xh(k)
GM
c.,
K" matriz de (n - m)
x m
Secci6n 6-6
Observadores de estado
449
donde la matriz de ganancia de realimentacion del observador K, es una de (n - m) x m. La ecuacion (6-143) define el observador de orden minirno. Refiriendonos a la ecuacion (6-139), tenemos que
y(k) xb(k + 1)
xa(k)
(6-144)
= (G bb - KeGab)Xb(k) + Key(k +
1)
(6-145)
+ (G ba - KeGaa)y(k) + (H b - KeHa)u(k)
Observe que para estimar ik + I) se necesita el valor medido de y(k + I). Esto no es conveniente, por 10 que deseariamos algunas modificaciones. [En el caso del observador de orden completo, (k + I) puede estimarse utilizando la medicion y(k) y no requiere de la medicion de y(k + I). Yea la ecuacion (6-93).] Yolvamos a escribir Ia ecuacion (6-145) como sigue:
(6-146)
(6-147)
y
(6-148)
Entonces, la ecuacion (6- 146) se puede escribir como sigue:
Las ecuaciones (6-148) y (6-149) definen la dinamica del observador de orden minimo. Observe que para obtener YJ(k + I) no necesitamos el valor medido de y(k + I). A continuacion obtengamos la ecuacion de error del observador. Definamos
(6-150)
Rotando la ecuacion (6-143) de Ia ecuacion (6-141), se tiene
xb(k + 1) - xb(k + 1)
= (G bb - K e Gab)[Xb(k) - xb(k)]
450
Capitulo 6
e(k + 1)
(G bb - K, Gab)e(k)
(6-151 )
Esta es la ecuacion de error del observador. Observe que e(k) es un vector de dimension (n ~ m). La dinamica de error puede determinarse como se desee, siguiendo la tecnica desarrollada para el observador de orden completo, siempre y cuando el rango de la matriz
Gab Gab G bb ] [ G G: n - m - 1 ab bb
sea n - m. (Esta es la condicion de observabilidad completa aplicable al observador de orden minimo.) La ecuacion caracteristica para el observador de orden rninimo se obtiene a partir de la ecuacion (6-151), como sigue:
(6-152)
La matriz de ganancia de realimentacion del observador K, puede determinarse a partir de la ecuacion (6-152) seleccionando primero las localizaciones de los polos en lazo cerrado deseados para el observador de orden minimo [esto es, ubicando las ratces de la ecuacion caracteristica, ecuacion (6-152) en las posiciones deseadas] y, a continuacion, mediante el uso del procedimiento desarrollado para el observador de prediccion de orden completo. Si, por ejemplo, la salida y(k) es un escalar, entonces xa(k) sera un escalar, G ah una matriz de 1 x (n - 1), Y G hh una de (n - 1) x (n - I). Para este caso, la formula de Ackermann, como se dio en la ecuacion (6-126), puede modificarse para obtener
K.
donde
G~";;bb [~ :.
-1
(6-153)
</J(G bb) = G b ! + b
G b 2 + ... + b
el n - 2
G bb +
el n - !
(6-154)
Resumen. Una vez determinada la matriz de ganancia de realimentacion del observador K,_ que es una de (n - m) x m, se puede definir el observador de orden minimo, mediante las ecuaciones (6-148) y (6-149):
+ K. xa(k)
+ (H, - K, Ha)u(k)
En forma equivalente, en terminos de e(k), mas que de Ti(k), se puede definir el valor de orden minimo mediante las ecuaciones (6-150) y (6-151):
xb(k)
e(k + 1)
= =
(6-1551 (6-1561
Observadores de estado
451
Sistema de control call realimentacion del estado observado call observador de ardell minimo. Considere el sistema de estado completamente controlable y completamente observable,
dado por
x(k
+ 1)
= Gx(k)
+ Hu(k)
(6-157) (6-158)
y(k) = Cx(k)
donde x(k) es un vector de dimensi6n n, u(k) es un vector de dimensi6n r y y(k) es un vector de dimensi6n m. Las matrices G, H YC estan dadas por
[-~~-l
Considere la combinaci6n de control con realimentaci6n del estado, en la que el estado realimentado esta formado por la porci6n medida del estado y la porci6n observada (estimada) del misrno, obtenida mediante el observador de orden minimo. La figura 6-1 I muestra eI diagrama de bloques correspondiente al sistema. En este sistema el vector de control u(k) es
u(k) = -Kx(k)
(6-159)
ulkl
x(k)
yfk)
Figura 6-11 Esquema de control con realimentacion del estado, en el que el estado realimentado esta constiituido por la porcion medida del estado y la porcion observada del rnisrno, obtenida mediante el uso del observador de orden minimo.
452
Capitulo 6
donde
x (k) esta
x h(k):
(6-160)
i(k) =
[~~{B-] = [-,](kr~~~;X-a-(k)-]
(6-161)
don de e(k)
xh(k) -
x h(k).
Defina
Entonces, utilizando esta matriz T, la ecuaci6n (6-161) puede reescribirse como sigue:
(6-162)
Las ecuaciones (6-162) y (6-156) caracterizan el sistema de control con realimentaci6n del estado. en el que el estado realimentado esta constituido por la porci6n medida del estado, x,,(k),y la porci6n observada del estado, x h(k), obtenida mediante la utilizaci6n del observador de orden minimo. Combinando las ecuaciones (6-162) y (6-156), resulta que
[~f~-~-HJ [~-~O!!~t-Gb~-~-~G~J[~f~+J
=
(6-163)
La ecuaci6n (6-163) caracteriza la dinamica del sistema con realimentaci6n del estado observado. mediante un observador de orden minimo. La ecuaci6n caracteristica del sistema es
--------------~-------------------
z I - G + HK :
: zI -
- HKr
G bb + K e Gab
I
(6-164)
La ecuaci6n (6-164) implica que los polos en lazo cerrado del sistema incluyen los polos en lazo cerrado debidos a la ubicaci6n de polos [los valores caracteristicos de la matriz (G - HK)] Y los polos en lazo cerrado debidos al observador de orden minimo [los valores caracteristicos de la matriz (G hh- K, G"h)]'
Ejemplo 6-11 Considere el sistema con doble integrador en tiempo discreto definido por las ecuaciones x(k
+ 1) = Gx(k) + Hu(k)
y(k)
=
(6-165 ) (6-166)
Cx(k)
[1 0]
Seccion 6-6
Observadores de estado
453
Utilizando la tecnica del disefto de la ubicacion de polos, determine la matriz de ganancia de realimentaci6n del estado K tal que los polos en lazo cerrado del sistema queden localizados en
Zl
= 0.6 + iOA,
Z2
= 0.6 - iOA
Suponiendo que la saliday(k) = xj(k) es la (mica variable de estado que puede medirse, disene un observador de orden minima tal que la seftal de error exhiba una respuesta con oscilaciones muertas a un error inicial arbitrario. Determine la funcion de transferencia pulso para el controlador (formado por el control mediante realirnentacion del estado y el observador de orden minimo). Primero examinaremos la controlabilidad y la observabilidad del sistema. Dado que el rango de las matrices
[C* : G*C*] =
[~ ~.2]
en ambos casos es 2, el sistema es de estado completamente controlable y completamente observable. Ahora resolveremos la porci6n de la ubicacion de polos del problema. Dado que
IzI
tenemos que
- G I = z - 1 z-0.21 = z 2 - 2z + 1 = z 2 + al z + az = 0 0 _ 1
a = 1
IzI - G + HKI
= (z - 0.6 -
= ZZ
1.2z + 0.52
Par 10 tanto,
(Xl
= -1.2,
(Xz
= 0.52
(6-167)
De la ecuaci6n (6-65) se obtiene la matriz de ganancia de realirnentacion del estado K, como sigue:
donde
T = [H: GH][a l
.
1] =
1]
K = [-0048
25 0.8] [ 25
-;:; ] =
[8 3.2]
u(k) = -Ki(k)
=
-[8 3.2{
;:~Zn =
-[8 3.2{
~;t2)]
(6-168)
454
Capitulo 6
Observe que
Dado que deseamos una respuesta con oscilaciones requeeri, la ecuacion caraeteristica requerida para el observador es
cjJ(z)=z=O
Refiriendonos a la formula de Ackermann, como fue dada por la eeuaei6n (6-153), obtenemos
K, = cjJ(G bh)[G ab
1[1]
= (1)(0.2)-1(1) = S
Refiriendonos a la ecuacion del observador de orden minirno, dada por la ecuaci6n (6-149), resulta que
+ (H b - KeHa)u(k)
=
+ (0.2 - S x 0.02)u(k)
que puede simplificarse a la forma
r,(k + 1)
-Sy(k) + O.lu(k)
(6-169)
La ecuaci6n (6-169) define el observador de orden minimo. EI control con realimentaci6n del estado observado u(k) ahora se da por
(6-170)
(6-171)
En la figura 6-12 se muestra el diagrama de bloques del sistema. De las ecuaciones (6-169), (6-170) } (6-171 ), obtenemos u(k + 1) = -Sy(k + 1) - 3.2[Sy(k + 1) + r,(k + 1)]
u(k + 1) + 0.32u(k)
-24y(k + 1) + 16y(k)
Si tomamos la transformada z de esta ultima ecuacion, y suponemos condiciones inieiales cero, obtenemos
I )
(6-172)
AI rcfcrirnos a la ecuaci6n (5-60), la funcion de transferencia pulso del sistema, definida por las ecuaciones (6-165) Y (6-166), puede ser obtenida como sigue:
Secci6n 6-6
Observadores de estado
455
u(k)
y(k)
2 (k )
L
0.1
L
Observador de orden minima
l====l
Figura 6-12
U] f . 4 - - - - - - - - - - - l
Y(z) u(z)
= [1
OJ[z -
-0.2] z - 1
[0.02] 0.2
(6-173)
0.02(z + 1) (z - 1)2
Utilizando las funciones de transferencia pulso de las ecuaciones (6-172) y (6-173). eI diagrama de bloques de la figura 6-12 puede modificarse a la forma mostrada en la figura 6-13. Utilizando la forma dada por la ecuacion (6-164).
IzI -
G +
HKllz -
G bb
+ K, Gab I = 0
(6-174)
456
Capitulo 6
Viz!
0.0211 + Z-l!Z-l 11 - z
-1!2
y(z)
Gplz)
_ 24 (1 - 0.6667z-
, +
0.32z- 1
- Go(z)
Figura 6-13
Forma modificada del diagrama de bloques del sistema disenado en eJ ejemplo 6-11
es decir.
1 ) ]
Sistema de control con entrada de referencia. Aplicaremos el metodo de realimentacion del estado observado, para disefiar sistemas de control que deban seguir entradas de referencia cambiantes. Es importante observar que la ubicacion de polos con el enfoque 0 metodo del estado observ ado no tiene control sobre la dinamica del numerador del sistema en lazo cerrado. (Para controlar 13 dinamica del numerador, consulte el metodo de ecuaciones polinomiales presentado en el capitulo 7.) Sin embargo, es posible transformar un sistema de regulacion con realimentaci6n del estado observado, en un sistema de control, como se muestra en la figura 6-14. Como se dijo antes, la parte de la ubicacion de polos determina la ecuacion caracteristica de grado n deseada para el sistema de orden n. La porcion de observador de estados determina 13 ecuacion caracteristica de error del observador de grado n 0 menor. Tal y como se obtiene de 13ecuacion (6-134) 0 la (6-164), el producto de la ecuacion caracterfstica de grado n y la ecuacion caracteristica de error del observador de estados da la ecuacion caracterfstica correspondiente a 13totalidad del sistema. Al modificar el sistema de regulacion en un sistema de control, es necesario incluir una ganancia ajustable K o en la trayectoria de entrada, de tal forma que la ganancia de entrada de la totalidad del sistema de control pueda determinarse para que sea la unidad la salida en estado permanente a una entrada escalon unitario. Esto se debe a que la ubicacion de polos con el observador de estados modi fica la ganancia de la totalidad del sistema. Por 10 tanto, a menos que Ko este correctamente ajustada, el sistema no se comportara en forma correcta.
Seccion 6-6
Observadores de estado
457
r(k)
Ko
t---.{+
u(k)
x(k)
y(k)
Observador
ilk)
K
Figura 6-14
Diagrama de bloques de un sistema de control con realimentaci6n del est ado observado.
Ejemplo 6-12 Modifique el sistema de regulaci6n considerado en el ejemplo 6-11 a un sistema de control, tal que la salida siga la entrada de referencia. A continuacion, obtenga la respuesta escal6n unitario y la respuesta rampa unitaria del sistema de control. (Suponga que el periodo de muestreo T es 0.2, es decir, que T= 0.2.) La figura 6-15 muestra un diagrama de bloques posible para el sistema de control. En este sistema de control es necesario definir la ganancia Ko de forma que no exista desplazamiento en la salida a una entrada escalon. (Observe que si K; = I, entonces la salida en estado permanente para una entrada escalon unitario no sera igual ala unidad, excepto en casos especiales.) Del diagrama de bloques, la funcion de transferencia pulso en lazo cerrado Y(z)/R(z) es
Y(z) R(z)
K o(0.02)(z + 0.32)(z + 1) (z - l)\z + 0.32) + 0.48(z + l)(z - 0.6667) K o(0.02)(z + 0.32)(z + 1) 2 Z3 - 1.2z + 0.52z
EI sistema es de tercer orden. Antes de examinar el comportamiento del sistema, es necesario determinar la constante de ganancia K o. Supongamos que R(z) es la transformada z de la secuencia escal6n unitario. Entonces, la salida en estado permanente esta dada por
R(z)
U(z)
0.02(z + 1)
(z- 1)2
Y{z)
24 ( z- 0.667 )
z 0.32
458
Capitulo 6
limy(k)
k----.=
=hm-z~1
=
0.165K o
y(oc) = 0.165K o = 1
es decir.
Ko = 6.0606
Sustituyendo K o = 6.0606 en la funcion de transferencia de pulso en lazo cerrado. obtenemos
Y(z) R(z)
La respuesta escalon unitario de este sistema puede obtenerse con facilidad utilizando MATLAB. Un programa MATLAB de muestra para la obtencion de la rcspuesta escalon unitario aparece en el MATLAB Program 6-2. La respuesta escalon unitario resultante se tiene en la figura 6-16.
k =0: 40;
y = filterlnurn.den.r ):
plottk.y.to')
grid
title(' Respuesta escalon unitarto ")
xlabel('k') ylabel('y(k)')
Asimismo, la respuesta rampa unitaria puede obtenerse si se introduce el programa MATLAB Program 6-3 en la computadora. La rcspuesta rampa unitaria resultante aparecc en la figura 6-17. EI error que sigue a la entrada rampa unitaria se obtiene como sigue: si observarnos que el periodo de muestreo T es 0.2, la entrada rampa unitaria esta dada por
R(z)
Entonces, obtenemos
0.2z- 1 (1 - z If
[1 - ~i;nR(Z)
Seccion 6-6
Observadores de estado
Respuesta escalon unitario
459
1.6 r - - - - , - - - , - - - , - - - - - - - - , - - - - r
1.4
1.2
o
.?
6~bOO~OOOOO'OOOOOOOOO,OOO,OO~-OO'OO
:;<
>..
10
15
20
k
25
30
35
40
Figura 6-16
Respuesta escalon unitario del sistema de control mostrado en la figura 6-15 can K" = 0.0606.
num = (0 0.1212 0.1600 0.03879); den = (1 -1.2 0.52 0); k = 0:20; r = (0.2k); v = [0 20 4); axis(v); y = fllterfnurn.den.r ): p/ot(k,y,'o' ,k,y,'' ,k,0.2k,'--') grid title('Unit-Ramp Response')
xlabeh'k')
ylabel('y(k)')
Par 10 tanto,
k~~
0.4485
EI error en estado permanente al seguir la entrada rampa unitaria cs 0.4485. (Vea 1'1 figura 6- I 7.)
460
Capitulo 6
4 r-----,.-------,-------.---,--------
3.5 3 2.5
2
c
.0
1.5
o
c
0.5
o
.Q
O_'-Q~-L-
_.--"----- - - - - - '
10
15
20
k
Figura 6-17 Respuesta rampa unitaria del sistema de control mostrado en la figura 6-15, con K" = 0.0606.
Por 10 general, en el sistema de seguimiento es necesario que el sistema tenga uno 0 mas integradores dentro dellazo cerrado. (A menos que la planta a controlarse tenga una propiedad integradora, a fir: de eliminar eJ error en estado permanente a entradas escal6n, es necesario afiadir uno 0 mas integradores dentro dellazo.) Una forma de introducir un integrador en el modelo matematico de un sistema en lazo cerrado, es introduciendo un nuevo vector de estado, que integre la diferencia entre el vector de comando R y el vector de salida Y. La figura 6-18 muestra una configuracion posible del diagrama de bloques para un sistema de seguimiento con realimentaci6n del estado y control integral. EI controlador integral esta formado por m elementos integradores, uno por cada uno de los componentes de 13 entrada de comando. (La entrada de comando es un vector de dimensi6n m y tiene m cornponentes. I EI integrador puede incluirse como parte de la formulaci6n de la ubicaci6n de polos presentada en 13 secci6n 6-5.
Sistema de seguimiento con lntegrador: Considere el sistema de seguimiento mostrado e1'l la figura 6-18. Se supone que la planta es de estado completamente controlable y completamente observable. Suponga que la planta no tiene un integrador. La ecuaci6n de estado de la planta y ~ ecuaci6n de salida son
x(k
+ 1)
y(k)
= Gx(k)
+ Hu(k)
(6-17S1 (6-1761
= Cx(k)
Seccion 6-7
Sistemas de seguimiento
461
,Ikl
I
I
I
I
I
I
L
Controlador integral
L
Planta
K,
I
I
Figura 6-18
don de
x(k)
u(k)
=
=
vector de estado de la planta (de dimensi6n vector de control (de dimensi6n r) vector de salida (de dimensi6n m) matriz de matriz de
11 x 11 11 x m
11)
y(k)
=
= = =
G H C
matriz de m
x 11
(Observe que en el analisis presente suponemos que las dimensiones del vector de salida y del vector de control son iguales; ambos son vectores de dimensi6n 111.) La ecuaci6n de estado del integrador es
v(k) = v(k - 1)
donde
v(k)
= =
+ r(k)
- y(k)
(6-177)
vector de error de actuaci6n (vector de dimensi6n 111) vector de entrada de comando (vector de dimensi6n 111)
r(k)
(6-178)
(6-179)
En nuestro sistema de seguimiento, la configuraci6n del sistema queda especificada en la figura 6-18. Los parametres de disefio son las matrices K , Y K c.
462
Capitulo 6
A continuacion analizaremos el procedimiento para determinar de las matrices K, Y K 2, de forma que el sistema tenga los polos en lazo cerrado deseados. De las ecuaciones (6-175), (6-178) Y (6-179), obtenemos
u(k
+ 1) =
=
-K 2x(k
+ 1) + Kjv(k + 1)
Kjr(k
(K 2
K 2 G - K, CG)x(k)
+ 1)
(6-180)
Si observamos que u(k) es una combinacion lineal de los vectores de estado x(k) y v(k), podemos definir un nuevo vector de estado formado por x(k) y u(k) [en vez de x(k) y v(k)]. De las ecuaciones (6-175) y (6-180) obtenemos la siguiente ecuacion de estado:
X(k + [ u(k + 1)
1)]
g- KjCG
L, - K2H - KjCH
=[K 2 - K 2
H
=
[0]
(6-181)
y(k)
[C
Ol[X(k)] u(k)
(6-i82)
Observe que los polos en lazo cerrado del sistema estan determinados por el sistema mismo, y no dependen de la entrada de comando r(k). En la ecuacion (6-181), los valores caracterfsticos de la matriz de estado determinan los polos en lazo cerrado del sistema. Para aplicar en forma directa la tecnica de la ubicacion de polos de la seccion 6-5 al disefio del sistema de seguimiento presente, considere el caso en el que el vector de comando r(k) es un vector constante (entrada escalon), de forma que
r(k)
=r
X(k + [ u(k + 1)
1)]
-
= [K2
K2
g- KjCG
v(oo) = v(oo) + r - y(oo)
(6-183)
Observe que para la entrada escalon, x(k), u(k) y v(k) tienden a los valores de vector constantes x(x). u(x) y vex), respectivamente. Por 10 tanto, de la ecuacion (6-177), obtenemos la ecuacion siguiente en estado permanente: es decir,
y(oo)
En la salida no hay error en estado permanente cuando la entrada de comando es un vector escalon. Asimismo, en estado permanente, la ecuacion (6-183) se convierte en
(6-184.
Seccion 6-7
Sistemas de seguimienta
463
xe(k)
x(k) - x(oo)
Xe(k + [ ue(k + 1) -
K 1 CG
L, - KzH - K] CH
][Xe(k)] ue(k)
(6-185)
La dinarnica del sistema queda determinada por los valores caracteristicos de la matriz de estado, que aparecen en la ecuacion (6-185). La (6-185) puede modificarse a
1)] = [G 0
(6-186)
rXe(k)l
~] = (n + m)
= (n
(n + m) matriz
rol l I", J
m
X
+ m)
m matnz
(n + m) matriz
(6-188)
w(k) = -K~(k)
Observe que la matriz de controlabilidad del sistema definido por la ecuacion (6-189) es
=matrizde(n+m)
m(n+m)
[H: GH: . : G
n+m-]
H]
i--:--o-t--o---:-~~~i---ff--;-~~~i----ff--
m
I I I
j
(6- I 9 I)
En vista de que la ecuacion de estado de la planta, dada por la ecuacion (6-175), se supone de estado completamente contra labIe, el rango de la matriz
464
Capitulo 6
es n. Por 10 tanto, el rango de la matriz dada por la ecuacion (6-191) es n + m. En consecuencia, si la planta es de estado completamente controlable, el sistema definido por la ecuacion (6-189) es de estado completamente controlable y, por 10tanto, en este caso es aplicable la tecnica de ubicacion de polos analizada en la seccion 6-5. Una vez especificados los polos en lazo cerrado deseados, es posible determinar la matriz K mediante la tecnica de ubicacion de polos. Utilizando la matriz Kasi determinada, podemos obtener las matrices K] y K 2, como sigue. Primero, observese que
[K2:Kj][~iG!~-~tHJ =
K=
=
(6-192)
[K2:Kd[~iG~!'-flHJ + [0: -1
m]
Por 10 tanto,
(6-193)
Las matrices K, y K 2 deseadas pueden determinarse a partir de la ecuacion (6-193). Debe observarse que. cuando u(k) es un vector de dimension m, y m > I, la matriz K no es (mica. En consecuencia, es posible determinar mas de un conjunto de matrices K] y K2 . (Cada K posible genera un conjunto de matrices K, y K 2 . ) En general, debe escogerse el conjunto de K, y K: que de el mejor desernpeno general del sistema. Finalmente, hay que notar que si no son medibles todas las variables de estado, entonces necesitaremos utilizar las variables de estado observadas en lugar de las variables de estado no medibles, para fines de la realimentacion del estado. (Asimismo, si las variables de estado medidas estan contaminadas por ruido y, en consecuencia, no son precisas, para fines de realimentacion del estado preferiremos utilizar las variables de estado observadas, y no las variables de estado actuales.) En la figura 6-19 se muestra un diagrama de bloques para el sistema de seguimiento, con realimentaci6n del estado, en el cual en vez del estado real se utiliza el estado observado.
Ejemplo 6-13 Considere el control digital de una planta mediante el uso de realirnentacion del estado y control integral. Suponga que la configuracion del sistema es la misma que la que se muestra en la figura 6-18. Tambien que la funcion de transferencia pulso de la planta es
Y(z)
U(z) = 1 Z-1
Z-2
(6-19.t1
donde Y(z) y U(z) son las transformadas z de la salida de la planta, y(k), y de la entrada de planta (sena, de control), u(k), en forma respectiva. Determine la con stante de ganancia integral K, y la matriz de ganancia de realimentaci6n de. estado K 2, de forma que la respuesta a una entrada de comando escalon unitario tenga cscilaciones muertas. Suponga que no todas las variables de estado estan disponibles para medicion directa, y utilice la configuracion de sistema mostrada en la figura 6-19 como ejemplo para un diagrama de bloques de ur sistema con un observador de estados, a fin de disefiar un observador de estados tal que el estado observado tienda al estado verdadero tan rapido como sea posible.
Secci6n 6-7
Sistemas de seguimiento
465
,IkJ
ylkl
I
L
Controlaoor integral
I
--l
L
K, xlkl
! -!
L.
Obssrvacor de estado
, ..J
Figura 6-19
Primero obtendremos una representacion en el espacio de estados para Ia funcion de transferencia puIso de la pIanta. Comparando Ia funci6n de transferencia pulso dada con la forma estandar
Y(z) U(z)
encontramos que
bo + b l Z-l + bzz z + b 3z 3 1 + al z I + a: z z + as z 3
bo = 0,
bs
= 0.5
az = 0.01, a3 = 0.12 Entonces, refiriendonos a las ecuaciones (5-8) y (5-9). podemos obtener las ecuaciones siguientes en eI
espacio de estados para la planta:
at = -1,
(6-195) (6-196)
y(k) = Cx(k)
donde
G =
[ -0.12
a a
-0.01
~ ~1]'
C = [0.5
0]
Determinacion de la constante de ganancia integral K] y de la matri: de ganancia de realimentacion del estado K, para una respuesta can oscilaciones muertas. Ahora determinarernos la con stante de ganancia integral K, y la matriz de ganancia de rcalimentacion del cstado K,. En cl sistema presentc es nccesario que la respuesta a la entrada de comando escalon tenga oscilacioncs rnuertas. (Por 10 tanto.
debcrernos uhicar los polos en Iazo ccrrado del sistema en el origcn.)
466
Capitulo 6
~(k + 1)
G~(k) + HW(k)
w(k) = -K~(k)
donde
Nuestro problema aquf es determinar la matriz k de forma tal que los polos en lazo cerrado del sistema queden en el origen, es decir, que la ecuacion caracterfstfca deseada sea
Mediante la tecnica de uhicaci6n de polos analizada en la seccion 6-5, se puede determinar facilrnente la matriz K. Refiriendonos a la formula de Ackermann, tal y como se obtuvo de la ecuaci6n (6-71), obtenemos
donde
Por 10tanto,
K = [0
0 0
1][~ ~ !
-1 1 -0.13 0.99
i'99]-1 [J'12 1 0 0 0 0
o
-0.01
o 0]' I 0
1 1
0
0.99 0.86 0.7301 0.86
[0 0 0 1][
-0.1032 0
~'99]
(6-197l
[-0.12
1]
La ecuacion (6-197) da la matriz K. La constante de ganancia integral deseada K 1 y la matriz de ganancia de realimentacion del estado K2 se obtienen de la ecuaci6n (6-193). Si observamos que
G - In : H
[--CG--rCH]
0.5
1I 0
es no singular (para ver esto, utilice las operaciones de renglones y columnas, y convierta la matriz en una triangular), obtenemos
Seccicin 6-7
Sistemas de seguimiento
467
3 :
[K2
~i12~i%lmr
=:to: ~
i :::]
[-0.12
-0.13
'.
99:2J[-~
[-0.12
0.3233
2: 0.6667J
(6-198)
K,
= 0.6667 = ~
(6-199)
= [-0.12 0.3233 2J
(6-200)
(6-196).tenemos que
y(k)
Para obtener la saliday(k). primero detcrrninaremos el vector del estado x(k) y la scnal v(k). De la figura 6-18.
x(k
X '(k)j
+ 1)
y(k)
= Gx(k)
+ 1)
+ Hu(k)
= (G - HK 2)x(k)
+ HK, v(k)
(6-205)
Asimismo, de las ecuaciones (6-202). (6-203) y (6-205) v(k + 1) = v(k) + r(k + 1) - y(k + 1)
=
v(k)
+ r(k + 1) - Cx(k + 1)
(6-206)
(6-207)
468
Capitulo 6
X + l(k
r(k + 1)
0 1
(6-208)
r(k) = 1,
Supongamos que el estado inicial es
k=0,1,2, ...
donde
Q,
[ ~:m ] [~ -~
=
v(l)
0-1
De manera similar.
y(l) = y(2)
1b + c = -1b - 1c
~d
y(3) = -~b
y(k)=l,
-1c + 1d + ~
k=4,5,6, ...
Secci6n 6-7
Sistemas de seguimiento
469
-K2x(k) + K 1 v(k)
u(k)
'=
" - [- 0.12
0.3233 21
[1] +
donde k = 4.5.6.... En vista de que u(t). para I::> -l Z'(donde res el pertoco de mucstreo i. es cousiantc. en la salida no existc oscilacion entre muestras. Entonces, la rcspuesta del sistema ticne oseilaeiones muertas. Observe que la salidav(k) l!ega a la unidad en euatro periodos de muestreo como maximo. y que se qucda ahi en auseneia de perturbacioncs 0 de nuevas entradas de cornando. [Yea. por ejemplo. la secucncia de respuesia escalon unitario de muestra que aparecc en la tigura 6-20a).j Bajo condiciones iniciales cspecialcs. por ejernplo. a = 6 = c = 0 y d = 1. la salida alcanza la unidad en tres periodos de mucstreo y se qucda ahi. es dccir, y(k) = I para k = 3. 4.5 .... [Veasc la figura 6-206).1
Diseiio de! observador de estados. ;\ continuacion. discnarcmos un observador de estados para cl sistema. En vista de que la salida de la planta y(k) es rnedible. disencmos un observador de orden minimo. Supongamos que desearnos la respuesta con oscilaciones muertas. En el sistema prcsente. la
y(k)
1.0
[',(01] [']
x 2 (OJ _ 0 x 3 (0) - 0
0.5
vIOl
y(kl
1 (kJ
= 0.5x,
+ x 2 (kl
(b)
Figura 6-20 Sccuencias de respuesta cscalon unitario de muestra para el sistema de scguimicnto, con rcalirncntacion del estado actual (rncdida) y control integral disenado en el cjcmplo 6-13.
470
matriz de salida C esta dada por
Capitulo 6
C=
Para modificar la matriz de salida C [0.5
[0.5
1 OJ
0 0], hagamos la siguiente transformaci6n: (6-209)
0] a [1
x(k)
donde
= T~(k)
0 T = [1
Observe que
+]
1
(6-210)
T- = [
0.5 1 0] 1
(6-2111
+ 1)
y(k)
= T- GT~(k)
1
+r
Hu(k)
(6-2121
= CT~(k)
(6-2131
donde
T-1GT =
[ 1 0.5
[
-~.01
0.5 1
T-1H =
!][~H!]~ H 1
0.5 1 1
CT = [0.5
O][~ ~ -~.5] = [1 OJ = C
(6-214!
(6-2151
Dado que s610 se pucde mcdir una variable de cstado, neccsitaremos obscrvar dos de elias. Por 10 tanto. cl orden del observador de orden minimo cs 2. De las ecuacioncs (6-138) y (6-114). tencmos que
Secci6n 6-7
Sistemas de seguimiento
A
471
A
G bb
K G
e
ab
= [1 0
][l
-0.25]
= [1 - k.,
La ecuacion caracteristica del observador es
I
-
= (z
=
Z2
kez(0.1l5 - 0.25k e J
-
+ (k e l
0.25k e ,
0.5) (6-216)
=0
Z2
Dado aue quercmos una resnuesta con oscilaciones mucrtas. la ecuaci6n caracteristica deseada es
=
0.5
[k,,]
[0.7404]
0.9615
(6-217)
Control integra! con observador de estados. Basta ahora hemos considerado un problema de diseno en cl cuallas variables de cstado observadas sc rcalimentan en un lazo menor. yen diazo principal se utiliza un controlador integral. En la parte del diseno de la ubicacion de polos, hemos utilizado un estado real en vez de un estado obscrvado, A continuaci6n obtendrernos las ecuaciones de sistema para el caso en el que sc utilizan el _ controlador integral y el observador de estados, EI uso del estado observado (k). donde (k) = T g(k). rnodifica la senal de controlu(k). en el control con rcalimentacion del estado, como sigue. En la ecuacion (6-204) tenemos
(6-218)
Definamos
~(k) - ~(k)
= e(k)
(6-219)
u(k) = [-0.3233
-2
0.2817][~:~Z~]
6(k)
~v(k)
+ [0.3233 2
(6-220)
472
Capite:
t l(k + t2(k + 1)
1)]
[0,5
=
-i
6(k + 1)
o 2 o
Asimismo. se puedc modificar la ecuacion (6-206) para obtcner
(6-221
v(k
cs decir,
+ 1)
v(k
t l(k )]
(6-222J
1)]
[Ll__
0.0701 -0.2596
][EI(k)]
-E;(k)
E3(k)
(6-2231
0.5 3 1 -0.5 0 0 0
-1
tl(k)
tz(k)
~3(k)
v(k)
0 0 0 + 1 r(k + 1)
0 0
(6-2241
0
La salida de la plantay(k) puedc ser
(6-225)
Se puedc dcmostrar que para la entrada de comando escalon unitario, la respuesta del sistema b; una condicion inicial arbitraria.
Seccion 6-7
Sistemas de seguimiento
473
(,(0) 6(0) 6(0)
v(O)
a b
c
d
0
a
f3
requiere de por 10 menos seis periodos de rnuestrco para complctarse. (Es decir, la salida lIega a la unidad como maximo en seis periodos de mucstreo, y despues se queda ahi en ausencia de perturbaciones y nuevas entradas de comando.) Observe que, como ya vimos, si el estado real puede ser realimentado, el sistema requicre como maximo de cuatro periodos de muestreo para cornpletar la respuesta escalon unitario. [En e! casu en que gt(O) = 0, g2(0) = 0, g,(O) = 0, y v(O) = I, el sistema solo requiere de tres periodos de mucstreo para completar la respuesta escalon unitario.] Sin embargo, si se utiliza el observador de estados. el tiernpo de respuesta aumenta. Si se utiliza el observador de orden minimo (en este casu de segundo orden), cl sistema requiere como maximo de seis periodos de muestrco, para completar la respuesta escalon unitario. [Yea, por ejcmplo, la secuencia de respuesta escalon unitario de muestra, que aparecc en la figura 621a).] Esto significa que, en casos especiales, el tiempo de respuesta es mucho mas corto. Por ejemplo. si las condiciones inicialcs son gl(O) = 0, g2(0) = 0, g,(O) = 0, v(O) = I. C2(0) = 0, y ,(0) = 0.
y(k)
1.5
~,
(0)
~2 (0) ~3 (0)
r~
1.0
4
5
vIOl
E,
(0) (0)
E 2 (0 ) E3
0.5
"l15
y(k) = ~, (k)
(a)
y(k)
~1 (0)
0 0
1.0
~2(0)
~3 (0)
a
1 0
v(O)
E 1 (01 E 2 (0) E3
0.5
(0 )
a a
y(kl = ~, (k)
(b)
Figura 6-21 Secucncia de respuesta escalon unitario de muestra para cl sistema de scguimiento con una rcalirnentacion del estado observado y un control integra! disenado en el ejemplo 6-13.
474
Capitulo 6
entonces, para complctar la rcspuesta escalon unitario, el sistema s610requiere de tres periodos de mucstrco. Vease la figura 6-21 (b).
Problema A-6-1
La definicion de controlabilidad que se da en la scccion 6-2 no cs la (mica que sc usa en los libros .. \ veces se utiliza la siguiente definicion: un sistema de control se define como de estado control able si. dado un estado inicial arbitrario x(O), es posible traer el cstado al origen del espacio de estados en un intervalo de tiernpo finito. siernpre que el vector de control no tenga restricciones (no acotado l. EI concepto de alcanzabilidad, similar al de controlabilidad. se encucntra en los libros y se utiliza en la forma siguiente: un sistema de control sc define como alcanzable si, al empczar desde el origcn de! espacio de estados, el estado puede ser llevado a un punto arbitrario en el espacio respective en un periodo finito, siernpre que el vector de control no este restringido (no acotado). Dernuestre que el sistema
Xl(k [ x2(k + 1) = [ -1 +
1)]
Soluci6n
= =
xl(1) = 0
x2(1)
= -0 + 0 +
u(O)
= u(O)
Aunque x 2( I) pucde ser llcvado a un punto arbitrario en un paso. x 1( 1) no pucdc ser control ado. En consccucncia, el sistema no cs alcanzable. Observe que el sistema presentc no es controlable en el sentido dcfinido en la scccion 6-2 (donde el estado terminal es un punto arbitrario en el espacio de estado incluycndo cl origem. porque no <e satisface la condici6n de rango rcqucrida, como rnuestra 10 siguientc: ran go
[H:GH] = rango
[~ ~] = 1 < 2
Capitulo 6
475
Como se ve en este problema, controlabilidad y alcanzabilidad (ambas definidas en este problema) son distintas. Sin embargo, si la matriz de estado G es no singular, entonces la controlabilidad completa del estado. en el sentido definido en cste problema, y la alcanzabilidad cornpleta del esrado, signitican 10 mismo, Es decir. para el sistema con una matriz no singular G. la controlabilidad cornpleta del estado signilica la alcanzabilidad cornpleta. y viceversa. Problema A-6-2 Considere cl sistema de estado complcramentc controlable definido por
x(k + 1)
don de
= Gx(k) + Hu(k)
H
= [1 0.6321]
0.3679'
-00
= [0.3679]
0.6321
:s u(k) :s
00
entonces un estado inicial arbitrario x(O) puede ser traido al origen como maximo en dos period os de mucstrco, util izando una seiial de control con stante por interval os. Deduzca la ley de control para transfcrir un estado inicial arbitrario x(O) al origen. Determine la
region en el espacio de estados en el cual el estado inicial puede ser lIevado al origcn en un periodo de rnuestrco, Si la magnitud de u(k) esta acotada, cntonces algun estado inicial no podra ser transferido al origen en dos period os de muestreo. (Pudieran requerirse de dos, tres, cuatro 0 mas de tales periodos.) Suponga que
lu(k)1 :s 1
Determine la region de los estados iniciales en el plano .1'1.1'2 que pucden ser transferidos al origen en uno yen dos periodos de muestreo, respectivamente. al usar la senal de control acotada lu(k)1 ~ I.
Soluci6n
Para el caso en que u(k) es no acotada. En vista de que cl sistema es del segundo orden, se ncccsitan como maximo dos period os de muestreo para transferir cualquier cstado inicial x(Ol al origen. AI obscrvar que
x(1)
= Gx(O) + Hu(O)
(6-226)
x(O)
-G-tHu(O) - G- 2Hu(1)
(6-227)
(6-228)
[-0.7181] 1.7181
[~
476
Capitulo t
Xl(O ] = _[ -0.7181]U(0) _ [-3.6700]U(1) ) [ xz(O) 1.7181 4.6700 Xl(l ) ] = _[ -0.7181]U(1) [ xz(l) 1.7181
Si sc commnan las ecuaciones \ O-LL'I) Y \o-z.su), se nene
(6-229 ! (6-23(1
[ Xl(O) xz(O)
que puede modifiearse a
3.6700 ][ u(O)
-4.6700 u(l)
U~l) ]
tl(l) ] xz(l)
(6-231
[ u(O) u(l)
de la eual se obtiene
U(l)] = [ -1.5820
0.5820
k = 0,1
Esta eeuaei6n da la ley de control requerida. Con esta ley cualquier estado inieial x(O) puedc transferirse al origen cuando mucho en dos periodos de muestreo. A continuaei6n se deterrninaran los estados inieiales a partir de los cuales el estado del sistema puede ser transferido al origen en un solo periodo de muestreo. Al igualar x( I) a 0 en la ecuacior. (6-226), se obtiene
x(l)
de 10 cual resulta
= 0 = Gx(O) + Hu(O)
(6-232
1.718lx1(0) + 0.7181xz(0) = 0
entonces puede ser transferido al origen en un solo periodo de muestreo. (De 10 contrario, necesitamos ce dos pcriodos para traer el estado inieial al origen.)
En el caso en que lI(k) esta acotada, es decir lu(k)l::; 1. eeuaci6n (6-232) se tiene
XI(O) = 0.7181u(0),
Dado que lu(O)1 ::; I,
Si se neeesita x(l)
0, entonces, a partir de ;l
xz(O) = -1.7181u(0)
IX1(0)15:: 0.7181,
1.718lx l(0)
+ 0.7181xz(0)
= 0,
puede ser llevado al origen en un solo periodo de muestreo. Estc scgrncnto aparecc en la figura 6-2: como AOB.
Capitula 6
477
5 4
Region correspondiente ados periodos de muestreo
3
Region (linea)
para un penoco
de muestreo
-5
x,
-2
-3 -4
-5 -6
Figura 6-22 Regiones a partir de las cualcs los estados iniciales pucdcn ser llcvados al origen en uno mucstrco, cuando u(k) esta aeotada de forma que III(k)! S I.
dos pcriodos de
C0l110
1.2433x2(0) ~ -1
1 -1
+ 0.2433x2(O) :s
~
0.5820x,(0) + 0.2433x2(0)
La region lirnitada por cstas cuatro desigualdadcs aparece en la figura 6-22. Si cl cstado inicial ocurrc en csta region. cxccpto en la Iinca A Oil. puede ser transterido cntonces al origcn en dos pcriodos de mucstrco. Si cl est ado inicial csta fucra de esta region. llcvar cl cstudo <II origcn tomaru cntonccs 111:1S de dos pcriodos.
478
Capitulo 6
Problema A-6-3
Considere el sistema de funcion de transfereneia pulso siguientc:
Y(z) U(z)
Una representacion en el espacio de estados para este sistema puede estar dado por
(6-233) (6-234 ) Para el mismo sistema se puede dar una representacion en el espacio de estados difercnte mediante
XI(k + [ x2(k + 1)
1)] = [0
= [0
(6-2351 (6-2361
y(k)
Demuestre que la representacion en el espacio de estados definida por las ccuacioncs (6-233) : (6-234) da un sistema que es de estado controlable, pero no observable. Demuestre, por otra parte, que la representacion en el espacio de estados definido por las ecuaciones (6-235) y (6-236) da un sistema que no es de estado completamente controlable, pero si observable. Explique 10 que causa la diferencia aparente en controlabilidad y observabilidad del mismo sistema. Solucion Considere el sistema de control en tiempo discreto definido por las ecuaciones (6-233) (6-234). El rango de la matriz de controlabilidad
[H : GH] =
[1 1]
-1.3
es 2. Por 10 tanto, el sistema es de est ado completamente controlable. EI rango de la matriz de observabilidac
[C* :G*C*]
= [
~.8
es I. De modo que el sistema no es observable. A continuacion, considere el sistema definido por las ccuaciones (6-235) y (6-236). El rango de 1:1 matriz de controlabilidad
-0.5
Ic*: G*C*]
[01 1]
(z
es 2. En consecuencia, el sistema es observable. La diferencia aparcnte en controlabilidad y observabilidad del mismo sistema esta causada por e. hecho de que el sistema original tiene una cancelacion polo-cero en la funci6n de transferencia de pul-e
Y(z) U(z) =
z
Z2
+ 0.8
+ 1.3z +
0.4
Capitula 6
479
Si ocurre una cancclacion polo-cero en la funcion de transfcrencia pulso, entonces la controlabilidad y la observabilidad varian, dependiendo de como se escojan las variables de estado. Note que para quc sea de estado completamente controlable y completamente observable, el sistema de funcion de transferencia pulso no debe tener ninguna cancelacion polo-cero.
Problema A-6-4
+ 1) = Gx(k) + Hu(k)
y(k) = Cx(k)
(6-237) (6-238)
+D
donde
x(k)
=
vector de estado (de dimension n) senal de salida (escalar) matriz de n matriz de n matriz de I
x
x
G H C
D
= = = =
I
n
escalar (constante)
Como se indico mediante la ecuacion (5-60), la funcion de transferencia de pulso F(::) puede darse como sigue:
F(z) = C(zI - G)-l H + D
Demuestre que si el sistema es de estado completamente controlable y completamente observable, entonces en la funcion de transferencia pulso F(z) no hay canceiacion polo-cero. Solucion Suponga que existe una cancelacion polo cero en la funcion de transferencia de pulso, aunque el sistema sea de estado completamente controlable y completamente observable. Considere la siguiente ecuacion de identidad:
I [ C(zI - G)-l
obticne
O][ZI 1 -C
GH] D
[ZI 0
G F(z) H]
Al tomar el determinante del primer miembro de la ecuacion, e igualario al del segundo micrnbro, se
IZI_~G ~I
es dccir,
= IzI - GIF(z)
F(z)
D IZI-C G HI IzI -
GI
Los polos de F(z) son las raices de IzI - G[ = 0, Ylos ceros de F(z) son las raices de
ZI - G -C
HI D
= 0
(6-239)
Ahora suponga que ocurre una cancelacion polo-cere. Supongamos que z = z, es un polo de F(z) y tarnbien es un cero de F(z), por 10 que se presenta cancelacion. Entonces z = z, es una raiz de IzI - GI = O. Tarnbien es una raiz de la ecuacion del dcterrninante dada por la ecuacion (6-239).
480
Esto significa que existc un vector
Capitulo 6
r~-]
donde v es un vector de dimension n y w es un cscalar, de forma que
es dccir.
(G - zlI)v = Hw
(6-241)
Dado que r =::1 es una raiz de la ecuacion caractenstica, el polinomio caracteristico ep(::) de G se puedc escribir como sigue:
o sea
ep(G)v
Por 10 tanto.
= <f,(G)(G - z, I)v
<f,(G)H = 0
= <f,(G)Hw
=0
En vista de que
(z ) cs un polinomio de grado n ~ I,
cl hecho de que
2
(G)H =
H. Par 10 tanto,
ran go [H : GH : ... : G,,-I HI < n Esto contradice la suposicion de que el sistema es de estado completamcnte controlable. Por 10 tanto. si cl sistema es de tal cstado, entonces en la funci6n de transferencia pulso no existe cancelacion de polocero. Ahora, refiriendonos a Ja ecuaci6n (6-240), si w = 0 y v 2: 0 se tiene entonces
(zd - G)v
=0
(6-24:> (6-243,
Cv = 0
De la ecuaci6n (6-243),
v*C* = 0
De la ecuaci6n (6-242),
(6-244'
v*G* =
Por 10 tanto.
Zl
v*
v*G*C* =
Zl
v*C* = 0
V*(G*)2C*
Capitulo 6
481
V"'(G",)k-l C'"
Par 10 tanto.
= Z~-l v"'C'" = 0,
k = 1,2,3, ... .n
=0
<n
Lo anterior contradice la suposici6n de que el sistema sea completamente observable. Entonces. si el sistema es de tal clase no existe cancelaci6n polo-cera. Esto comprueba que si el sistema es de estado cornpletamcnte controlable y completamente observable, entonces en la funci6n de transferencia pulso F(z) no existe cancelaci6n polo-cero.
Problema A-6-5
Considere el sistema de estado completamente control able
x(k
+ 1)
Gx(k)
+ Hu(k)
Demuestre que
-an~l -an] -a n - 2
(6-245)
-al
donde al' a-, ... , an son los coeficientes del polinomio caracterfstico
IzI - GI
Solucion
GM =
El primer miembra de la ecuaci6n (6-246) es
M[~o ~ =::]
1
(6-246)
-al
GM
(6-247)
EI teorema de Cayley-Hamilton dice que la matriz G satisface a su propia ecuaci6n caracteristica, es decir,
3 se tiene
G 3 + al G 2 + a2 G + a3 I
(6-248)
482
Capitulo 6
AI usar la ecuacion (6-248), la tercera columna del segundo miembro de la ccuacion (6-247) sc convierte en
Por 10tanto, la ecuaci6n (6-247), que es el segundo miembro de la ccuacion (6-246), se convierte en
M- 1GM =
0 0 -a 3 ] 1 0 -a2 [ o 1 -a1
La deduccion anterior se puede extender tacilrnente al caso general de cualquier entero positivo n. Problema A-6-6 Considere el sistema de estado completamente controlable
an - 2 an - 3 W= :: 1 [ a1 1 0
an_1 an-2
a1
0 0
0 : 0 0
11
IzI - GI
Defina tambien
= zn
T=MW
Demucstre que
T- 1GT =
0 0 0
1 0
0 1 0
0 0
1
T'H
Solucion
~ ~]
(6-249 '
T- 1GT = (MW)-1G(MW) = [
-a3
Capitula 6
483
(MW)-'G(MW)
W '(M-'GM)W
W-{
W-l[~o ~ =::]w = [ ~
1 -al
En consecuencia, debemos demostrar que
o
-a2
-a3
~ [o ~ =::]w = w[ ~
1
(6-250)
-al
-a3
Y el segundo miembro
[:: ~l ~][ ~
1 0 0
1
-a3
<a -al
~ ~] =
[-;3 ~l ~]
0 1 0 (6-251)
T- GT =
A continuaci6n, se demostrara que
T'Ho [:]
Observe que la ecuaci6n (6-25)) se puede escribir de la forma:
T[:] OMW[:]
[HGHG'HI[~: 1m]
0
[H'GH'G'HH] H
484
Por 10 tanto,
Capitulo 6
La deducci6n anterior puede extenderse con facilidad al caso general de cualquier entero positivo n. Problema A-6-7 Considere el sistema siguiente:
Observe que el sistema esta en la forma can6nica controlable. Defina la matriz de transformaci6n T como sigue:
T=MW
donde
y
W =
[ a2 at at 1
1]
Demuestre que si el sistema esta en la forma can6nica controlable, entonces T = I. En consecuencia, si el sistema esta en la forma can6nica controlable se tiene que
M- = W = [
Solucion En vista de que
a2 at
~t
~ ~
1]
o
1
se tiene
Por 10 tanto,
T~MW~[~
0 1 -at
-at -a2 + a:
j["'"
at
1 0
0 = 0
1] [1 ~] ~
0 0 1 0 0
M- = W =
[., ~]
at
~t
1 0
Capitulo 6
485
Problema A-6-8
+ 1)
y(k)
Gx(k)
= Cx(k)
N
Demuestre que
N'G(N')-'
6
-an
0 0
1 0
0 1 0 -a n- 2
(6-252)
0
-an-l
donde ai' a-, ... , an son los coeficientes del polinomio caracteristico
SoJuci6n
forma
N*G = [
~ -a3
2
(6-254)
N*G
El segundo miembro de la misma es
[C~]G [~~2] CG CG
=
3
o
-a2
El teorema de Cayley-Hamilton dice que la matriz G satisface su propia ecuaci6n caracteristica, es decir, para el caso de n = 3,
Por 10 tanto,
486
En consecuencia,
Capitulo 6
o
Se ha dernostrado asi que la ecuaci6n (6-254) es cierta, Por 10 tanto.
La deducci6n aqui presentada puede extenderse al caso general de cualquier entero positive Problema A-6-9
11.
(6-2551 (6-2561
= Cx(k) + Du(k)
w
donde las
Q,
~[:~,: T ~ 1]
= z"
IzI - GI
Definase tambien
+
Q
al zn-l
+ ... + an-I Z + an
(WN*)-l
donde las b, (k = 0, L 2, ... , 11) son los coeficientes que aparecen en cl numerador de la funci6n ce transferencia de pulso, cuando Ctzl - G r l H + D se escribc como siguc:
Capitulo 6
487
+ bn-1z + bn + an-l z + an
b.;
o' GQ
(WN*)G(WN*)-l =
0 [
a a
-a 3 ]
-a2
(6-257)
1 -al
(WN*)G(WN*)-l = W[N*G(N*)-I]W- 1 =
Por 10 tanto. se necesita demostrar que
w[ ~
-a3
~ =::]
1 -al
es decir (6-258) EI primer miembro de la ecuaci6n (6-258) es
Y el segundo.
Entonces. la ecuacion (6-258) es cierta. Por 10 tanto. se ha demostrado que la ecuaci6n (6-257) tarnbien 10es. Ahora sc dernostrara que
CQ = [0
1]
es decir,
C(WN*)-l = [0
Observe que
1]
(6-259)
[0
l](WN*) = [0
[1
0][ C~]
CG 2
[0 a 1] = C(WN*)-l
que es la ecuaci6n (6-259).
488
Ahora definamos
Capitulo 6
x =
Qi
y la ecuaci6n (6-256) en
(6-261 )
i(k + 1) =
donde
-a3]
La funci6n de transferencia pulso F(z) para el sistema definido por las ecuaciones (6-260) y (6-261) es
F(z)
Al observar que
= (CQ)(zI - Q-IGQ)-IQ-1H + D
CQ = [0 0 1]
se tiene
o z
-1
z
a3 ]-1 'Y23 + D ] a2
+ al
11
[1
o
-1
tenemos
a3
z + al
a2
]_1
=
3 2
[z2+alz+a2
Z
z + al z + a2 z + a3
+ al
1
z + al z + a2z + a3
11 Z2 +
12 Z
+ 13
= b, ~ albo, 12 = b 2 -
a 2b o Y YJ
Capitulo 6
489
Q-IH
11
b, -
QI
be
Observe que 10 que se ha deducido aqui puede extenderse facilmente al caso en donde n es cualquier entero positivo. Problema A-6-10 Considere el sistema definido por
G(z) ZZ
+ Z + 0.16
z + 1
(6-262)
Refiriendonos a la secci6n 6-4, obtenga las representaciones en el espacio de estados para este sistema en las tres configuraciones siguientes:
I. 2.
3.
Forma can6nica control able Forma can6nica observable Forma can6nica diagonal
Soluci6n I. Forma canonica controlable. Al comparar las ecuaciones (6-262) con la ecuaci6n (6-39), se obtiene
a
= 0.16,
b., = 0,
b:
1)] [0
= [1
-0.16
11[XI(k)] xz(k)
2. Forma canonica observable. En vista de que al = I, a2 = 0.16, bo = 0, b, = 1 Y b 2 = I, refiriendonos a las ecuaciones (6-41) Y (6-42), se obtiene que
1)] [0
[0 11[XI(k)]
-1
G(z)
= Z +3 0 .2 +
z +
~.8
pz = -0.8,
D = 0
PI = -0.2,
Por 10 tanto, escogiendo arbitrariamente at (6-46), resulta
= a2 =
[-0.2 0
_1
3
Y(
k)
= [~ 3
490
Problema A-6-11
Capitulo 6
xk + l)T)
donde
= Gx(kT) + Hu(kT)
G =
[~
iJ,
[~]
y donde T es el periodo de muestreo. (Yea el problema A-5-16 para la deduccion de esta ecuaci6n de estado en tiempo discreto correspondiente al sistema con un doble integrador.) Determine la matriz de ganancia de realimentaci6n del estado K tal que la respuesta a una condici6n inicial arbitraria sea con oscilaciones muertas. Para el estado inicial
x(O) =
Definamos
Entonces
=0
(6-264)
2-
T "2 k,
2
- Tk2
=0
1 + "2 k, - Tk2 = 0
De las cuales resulta
T2
Por 10 tanto,
K [;2 2~] =
A continuaci6n se dernostrara que la respuesta a las condiciones iniciales es con oscilaciones muertas. Suponga que el estado inicial es
Capitulo 6
491
xk
es decir,
+ I)T) = (G - HK)x(kT)
Observe que
Por 10 tanto, es claro que la respuesta es con oscilaciones muertas. Se determinara ahora u(O) y u(7). Note que
u(kT)
Por 10 tanto,
-Kx(kT)
-[;2
;T }(kT)
u(O) =
-[
;2 ;2
u(T)
u(T)
Para a = I Y b = I, se tiene
= -[
= T2 + 2T
u(O)
Para T= I s,
= -115,
u(O) = -2.5,
Para T= 10 s,
u(T)
= u(l) = 1.5
u(O)
= -0.16,
u(T)
= u(lO) = 0.06
Observe que para un valor pequerio del periodo de muestreo T. se hacen grandes u(O) y u(7). Al aumentar el valor de T se reducen en forma significativa las magnitudes de 1l(0) y de 1l(7).
492
Problema A-6-12 Considere el sistema definido por
Capitulo 6
x(k + 1)
= Gx(k) + Hu(k)
donde x(k) es un vector de dimension 3. Se supone que el sistema es de estado completamente controlable. Mediante la utilizaci6n de la tecnica de ubicaci6n de polos, se desea disenar el sistema con polos en lazo cerrado en z = Ill' Z = 112 YZ = 113, donde las 11, son distintas. Es decir, al usar el control con realimentaci6n del estado
u(k)
se desea obtener
-Kx(k)
(6-265)
donde
~
= (G ~i
JL; 1)-1H,
= 1,2,3
(6-266)
(G Solucion Definamos
= JLi~,
i=1,2,3
G=G-HK
Al usar el teorema de Cayley-Hamilton,
-3
G +alG +a2G+a31=cI>(G)=O
Considere las identidades sizuientes:
(6-2671
1=1
a 31 + a 2G + Cl: 1G2 + G3 = Cl:31 + Cl:2G + Cl: 1G2 + G 3 - Cl:2HK - Cl:I GHK - Cl:I HKG - G2HK - GHKG - HKG 2
Al observar que el primer miembro de esta ultima ecuaci6n es cero, esta ultima ecuacion se puede reducir a
De modo que
Capitulo 6
493
2]
= [H:GH:G
a 2 K + alKG + KG alK ~ KG
2Hr lcf>(G)
0 I], se obtiene
[0 0
o bien
1] [
a 2 K + alKG + KG alK ~ KG
2]
= [0
K = [0 0 1][H:GH:G2Hr lcf>(G)
que es la f6rmula de Ackermann. Observando que
(6-268) 268)
cf>(G) = G 3 + al G 2 +
tenemos
a2 G
+ a 31
K = [0 0
(G - fll It l H,
0 1][H:GH:G2Hr l(G -ILII)(G - 1L21)(G -1L 31)(G -ILII)-IH 2H]-I(G -1L21)(G -1L = [0 0 1][H:GH:G (6-269) 31)H
(G - ILII)(G - 1L2 I) = G 2 + {312 G + {313 1 (G - 1L21)(G - 1L 31) = G 2 + f3uG + ~I (G - 1L31)(G - ILl I) = G 2 + !3J2G + !3J31
Definamos
= [0 0 l][H'GB'G'Hr'[H'GH
'G'H{~]
=
Por 10 tanto,
[0 01{~] =1
K~I =
De manera similar,
K~ =
1,
~] = [1
En consecuencia,
K[~I ~
1 1]
es decir.
(6-270)
494
Capitulo 6
La ecuaci6n (6-270) da la matriz de ganancia de realimentaci6n del estado K deseada en terminos de g2 Y g). Para demostrar que los g, son vectores caracterfsticos de la matriz G - HK, note que
gl,
= H + (J.ti 1 = H - HK~
HK)~
+ J.t; ~
i = 1,2,3
i=1,2,3
= 1,
Por 10tanto, los vectores ~I' ~2 y~) son vectores caracteristicos de la matriz G - HK correspondiente a los valores caracterfsticos iii' 112 YIl), respectivamente. Problema A-6-13 Considere el sistema definido por x(k
+ 1) = Gx(k) + Hu(k)
donde x(k) es un vector de dimensi6n 3. Se supone que el sistema es de estado cornpletamente controlable Yque se desea respuesta con oscilaciones muertas al estado inicial x(O). (Es decir, los polos en lazo cerrado deseados deberan estar en el origen de modo que III = li2 = Ii, = 0.) Demuestre que la matriz de ganancia de realimentaci6n del estado K deseada puede darse mediante la f6rmula
(6-272)
donde
tl
~
= G-1H = G-zH
~ = G- 3H
Demuestre tambien que los vectores g, son vectores caracterfsticos generalizados de la matriz G - HK: esto es, que gj satisface las ecuaciones
(G - HK)tl = 0 (G - HK)tz
Solucion
= tl
(G - HK)~ = ~
Refiriendonos a la ecuaci6n (6-268), tenemos
(6-273)
Capitulo 6
495
gl = G- l H, se obtiene
~ [0 ~ [0
Asi que
K~
~]
0 IJm
~I
K~t =
g2 =
G- 2H, resulta
~ [0
Por 10 tanto.
l)[H'GH'G'Ht' [H'GH'G'HH]
~0
g) = G- 3 H,
se obtiene
K~ =
= [0 0 1][H:GH:G
2Hr tG 3G- 3H
= [0 0 IJ[H: GH: G2 H] - t H
~ [0
De manera que, En consecuencia se tiene que
0 I)[H'GH'G'Ht' [H'GH'G'Hj[
~] ~ 0
K~ =
K[~l
~]
= [1 0 0]
En consecuencia,
que es la ecuaci6n (6-272). Para demostrar que gl es un vector caracteristico de la matriz G - HK, observe que
En vista de que
Kg l =
I. se obtiene
(G -
HK)~1
=0
496
Capitulo 6
Para demostrar que ~2 = G- 2 H es un vector caracteristico generalizado de la matriz G - HK, observe que
(G - HK)tz
Como
K~2 =
= (G - HK)G-zH = G- 1H - HKG- 2H = ~1
(G - HK)~2
HKtz
0, se obtiene
= ~1
(G - HK)~3
Y en vista de que K~3
=
0, se obtiene
Problema A-6-14
Considere el sistema definido por
IzI - G + K.
CI = (z = Z3
az z
013
Suponga que los valores caracteristicos de G son A" A2 YA3 Y que son distintos de PI' P2 Y P3' Tambien suponga que P" P2 Y P3 son distintos. Demuestre que la matriz K, puede estar dada por
K.
don de
=~: [
1 [1] ]-1
~
i=1,2,3
fi=C(G-J..'iI)-t,
Demuestre tarnbien que las f,' son vectores caracteristicos de la matriz (G - KeC)*; esto es, r,' satisface la ecuaci6n
(G - K. C)*ft
= "iii ft ,
i = 1,2,3
donde /i, es el complejo conjugado de Pi' (Observe que cualquiera de los valores caracteristicos complejos se presentan en pares conjugados.) Solucion Refiriendonos a la f6rmula de Ackermann, tal como se dio mediante la ecuaci6n (6-126) para la matriz de ganancia de realimentaci6n del observador K" se tiene
K. ~ ~(G{~gr m
Al observar que
Capitulo 6
497
se tiene
K." (G -
m ~,I)(G ~,I)[i~r m
C(G -1'1 Itl resulta
(6-274)
(6-275)
= G2 + {312 G + {313 I (G - 1L21)(G - 1L3 I) = G2 + /322 G + /323 I (G - 1L31)(G - ILl I) = G2 + {332G + /3331
(G - ILII)(G - 1L2 I)
Entonces la ecuaci6n (6-275) se convierte en
~,G + ~'I)[i~,n~]
1][ CG2 CG2]-1 [~] = 1 C~][ C~ 1
= [/323 /322
Por 10 tanto,
Similarmente se obtiene
Yasi,
es decir,
[l}"[:]
K,
=~: [
fl] - 1
[1] ~
K, C)*, note que
(6-276)
(G - K,C)*ft
Para demostrar que las
= C* - C* + /iift = /iift
(G - K. C)*ft
(6-277)
498
Como se ha demostrado antes,
Capitulo 6
CiK.
En consecuencia,
=1 =1
- C* + liiCr
K:
Por 10tanto la ecuacion (6-277) se convierte en
tr
(G - K.C)*Cr
= C*
= liiCr
Asi que se ha demostrado que los vectores C(, f; y f 3' son vectores caracteristicos de la matriz (G - K, C)* correspondientes a los valores caracteristicos Ilb 112 Y 1l3, respectivamente. Problema A-6-15 En el problema A-6-14 se obtuvo la matriz de ganancia de realirnentacion del observador K, para el caso en que los valores caracteristicos Ilb III Y113 de G - K, C fueran distintos. Supongamos que deseamos una respuesta con oscilaciones muertas para el vector de error. Entonces requerimos que III = III = 113 = o. Demuestre que para este caso la matriz K, puede darse como sigue:
o
donde C = 2
K.
=~: [
C I]-I[I]
~
CG-
[Note que los vectores f l , f l Y f 3 dados aqui son los vectores caracteristicos 0 vectores caracteristicos generalizados de la matriz (G - K, C)*.] EI sistema se supone completamente observable. Solucion Refiriendonos a la ecuacion (6-274),
K.
Al tomar III
=
(G -
III
113
K.~G{~grm
que se puede escnbir como sigue:
2
I
(6-278)
Il:
Laecuacion (6-278) da la matriz de ganancia de realirnentacion del observador K, deseada cuando III
=
113
o.
Observe que la ecuacion (6-278) puede ser modificada para leerse
CG [0] CG[c..G- K. = 1
3
2] 1
Capitulo 6
499
CG- 3K,
es dccir, f
l
K,
=~: [
]I[l]
~
que tarnbien da la matriz de ganancia de realimentaci6n deseada, cuando III = 112 = 113 = O. Problema A-6-16 Considere el sistema
x(k + 1)
donde
= Gx(k) + Hu(k)
G [-~.16
=
-n,
u =-Kx
Utilizando MAfLAB, determine la matriz de ganancia de realimentaci6n del estado K, de modo que el sistema tenga polos en lazo cerrado en
= 0.5
+ jO.5,
z = 0.5 - jO.5
Utilice la f6rmula de Ackermann dada por la ecuaci6n (6-68). Solucion deseados. Primero construimos la matriz J, cuyos valores caracteristicos son los polos en lazo cerrado
J = [0.5 + jO.5
= poly(J)
p=
1.0000
-1.0000
0.5000
soo
Ubic ocion de polos y diseiio de observadores donde I es la matriz de identidad. Para la matriz
Capitulo 6
[-~.16 _~]
J(G) = G
2 -
G + 0.51 = [
=
[~:;i
]
0.5
-;.34]
polyvalm(polyUJ,G)
ans =
0.3400 0.3200 -2.0000 2.3400
Refiriendonos a la f6rmula de Ackermann, dada por la ecuaci6n (6-68), la matriz K deseada se obtiene a partir de
donde M = (H GH). Un programa MATLAB para la determinaci6n de la matriz de ganancia de realimentaci6n de estado K se da en el programa 6-4 de MATLAB.
MATLAB Programa 6-4
% *****Este programa determina el estado de la matriz de ganancia de % realimentaci6n K, basado en la f6rmula de Akermann ***** % Anote la matriz de estado G la de control H *****
G = [0 1;-0.16 H = [O;lJ; -lJ;
[H
G*HJ;
rank(M) ans
=
Capitulo 6
501
0;0
0.5-0.5*ij
1J = poly(J)
JJ =
1.0000 -1.0000 0.5000
1 ]*inv(M)*Phi
K=
0.3400 k1
=
-2.0000
=
K(l), k2
K(2)
k1 = 0.3400
k2 =
-2
x(k + 1) y(k)
donde x(k)
=
=
=
=[
-0.5
o
-0.2
o ], 1
1.1
[0
1 0]
502
Capitulo 6
1. Determine la matriz de ganancia de realimentaci6n del estado K, tal que el sistema muestre una respuesta con oscilaciones muertas a cualquier estado inicial. Suponiendo que el estado es completamente medible, de modo que el estado real x(k) puede realimentarse para control, es decir, u(k)
determine la respuesta del sistema al estado inicial
-Kx(k)
x(O) =
siendo
[b ] c
G, bye constantes arbitrarias. 2. Al suponer que s610 una porci6n del vector de estado es medible, es decir, solamente 10 es la salida y(k), disefie el observador de orden minima tal que la respuesta de error del observador sea con oscilaciones muertas. Suponga que la configuracion del sistema es la misma que la que se muestra en la figura 6-11. 3. Considerando que el estado observado se utiliza para realimentacion, obtenga la respuesta del sistema a
e(o)=[~]
donde e(O) es el error de observador inicial para el observador de orden minimo, y G, b, c, a y (3 son constantes arbitrarias. 4. Deduzca la funcion de transferencia de pulso Gf)(z) del regulador-observador. Soluci6n Observe que el sistema es de estado completamente controlable y observable.
1. La matriz de ganancia de realimentaci6n de estado K requerida para respuesta con oscilaciones muertas se puede obtener f'';~;lmente como sigue. Definamos
K
Entonces
= [k 1 k z k 3 ]
IzI - G
+ HKI
I ~
k,
+ 0.5 k z + 0.2 z + k 3
-
~1
.;
-
I
1.1
= Z3 + (k 3
=0
Al igualar esta ecuaci6n caracteristica a la ecuacion caracteristica deseada (para una respuesta con oscilaciones muertas),
obtenemos
x(k
es decir,
Capitulo 6
503
0 0 0
x3(2)
0 0 0
x3(3)
0 0 0
o sea
x(k) = 0,
k = 3,4,5, ...
Claramente, la respuesta es con oscilaciones muertas. 2. Ahora disefiarernos un observador de orden minirno, suponiendo que solamente la salida y(k) es medible. Primero transformaremos el vector de estado x(k) a un nuevo vector de estado (;(k), tal que la matriz de salida C se transforme de [0 1 0] a [1 0 0]. La matriz siguiente T llevara a cabo la transformaci6n requerida:
T=
Entonces definimos
00 10] 1 [0 0 10
T~(k)
l
x(k) =
De manera que las ecuaciones de sistema seran
~(k
donde
+ 1) = T- 1 GT~(k) + r
y(k)
Hu(k)
= G~(k) + ilu(k)
= CT~(k) = C~(k)
G=
T-1GT =
[~o ~ ~][ ~
0 1 -0.5
-0.5
-0.2
~ ~ ][~ ~ ~1]
1.1
0 0
-. -0.2
_ [~
~ ~] -_ [Goa 1.1 G
GOb]
Gb b
bo
H~T'H~ [! ~ mH~]
C = CT = [0
1
O][~ 0 1~] = [1 ~ 0
0 0]
-~(r+-f) ~3(k + 1)
~I(k +
J__ ][~l(k)]
~;(k) ~3(k)
+ 0 u(k)
1
[.9_]
(6-279)
y(k) = [1 : 0
O][~;t~-]
~3(k)
(6-280)
504
Capitula 6
En vista de que s610 se puede medir una variable de estado. gl(k). es necesario que sc observen dos variables de estado. Por 10 tanto. el orden del observador de orden minima es 2. Debido a que
G bb - K, Gab A A _
[0 0] -0.5 1.1 -
[ke,][O k
ez
1] _ [ 0 -0.5
1.1 - k.,
-ke,]
Por 10 tanto.
k.,
es decir.
= 0,
k., = 1.1
3. La ecuaci6n para el sistema con realimentaci6n de estado. con un observador de orden minimo. corresponde a la (6-163):
[~{~-t-H] = [Q_~/~~+G~:-~!'[-G::][-i~+]
u(k)
tenemos que
(6-281)
Volvamos a escribir la ecuaci6n (6-281) en funcion del nuevo vector de estado g(k) y del vector de error e(k). Al notar que el estado observado es el utilizado para la rcalirnentacion. esto es,
-Kt(k)
~(k
+ 1)
= G~(k)
+ Hu(k)
HK)~Ck) + HK[~Ck) - tCk)] HK)~Ck) +
= G~(k) - HKtCk)
= =
CG CG -
HKreCk)
donde
K = KT = [-0.5
-0.2
1.1][ ~ ~ ~] = [-0.2
o
0 1
-0.5
1.1]
[!f1-!-H] = [ ~--o-I!!'-t-G::~~[G:J[-~~~j
Capitulo 6
505
es decir,
+ 1) = el(k + 1) e2(k + 1)
~lk ~3(k
~1(k + 1) + 1)]
[0 01
1 0 0 0 0 0 0 0
o 0 0 -0.5 o 0 0 -0.5
La respuesta de este sistema a la condici6n inicial dada puede obtenerse como sigue. Primero observe que la condici6n inicial supuesta es
Por 10 tanto,
Es claro que la respuesta es con oscilaciones muertas. Para cualquier condici6n inicial, el tiempo de asentamiento es como maximo de cinco perfodos de muestreo. (Esto significa que como maximo se necesitan dos periodos para que el vector de error se convierta en cero y, ademas, como maximo son necesarios tres periodos de muestreo para que el vector de estado se anule.) 4. Para deducir la funci6n de transferencia de pulso GD(z) del regulador-observador, nos referimos a la ecuaci6n de estado y a la ecuaci6n de salida que se da en las ecuaciones (6-279) y (6-280), respectivamente. Las ecuaciones para el observador de orden minimo son las (6- I48) y (6-149), escritas de la forma siguiente:
+ 1) =
(G bb - K.Gab)'ij(k)
+ [(G bb -
K.Gab)K.
+ Gba
Para este problema,
K.Gaa]y(k)
+ (lib - K.Ha)u(k)
(6-282)
506
Capitulo 6
c., - x.
Gba
-
Gab
= [
-~.5 . ~ ]
x. c:
-
= [
-~.2]
Hb
KeNa =
[~]
l1(k + 1) =
es decir,
[0~5 ~ ]l1(Z)
AI resolver en funci6n de 1](z), se obtiene
= [
1.1---Z2 Z
0~5
0.2]Y(Z) +
[~]u(Z)
Z
-0.5
1.1]~(k)
U(Z)
= 0.2Y(z)
- [-0.5
- [-0.' 1.1{
nU(Z)
= [
0.2 +
0~5
Capitula 6
507
es decir,
de 10cual se obtiene la funci6n de transferencia pulso GJ)(z) del regulador-observador como sigue:
2 -
O.72z - 0.55
Z2
+ l.lz
(6-283 )
La funci6n de transferencia pulso de la planta puede obtenerse mediante la ecuaci6n (5-60) como
G (z)
P
VIz)
Y(z)
Figura 6-23
Problema A-6-18
Considere el sistema de seguimiento definido por la ecuaci6n (6-185). La ecuaci6n caracteristica para cste sistema es
r, -
K2: - KICH]I = 0
(6-284)
1[.:!,,-=-~-~_!IJ!2_~_~!-~21----.::!!---JI r K C : zlm - r,
1
1[!!!!_~_~_~_!!~]_""_!!~!.~_7-_!!~.!f:(Z}_~_-.::}_mX_I_~
0
",II!I .
L~t,,-Im
~_I!
508
Capitulo 6
.[-K~C(ii~~-=-Cfl-h~-]1
=
IZ}.!'_=-_~_~_I!~2_:!""_!!~.!~_~_I!~I_(J~!'!!_~_!'!!1~~L __=-_I}
(6-285)
La ecuacion (6-285) da la ecuaci6n caracteristica correspondiente al sistema. Se pueden determinar las matrices K 1 YK 2 de forma tal que las rakes de esta ecuaci6n caracteristica asuman los valores deseados. Par ejemplo, si se desea una respuesta con oscilaciones muertas a una entrada escalon, entonces determinaremos K 1 YK 2 de modo que todas las rakes de la ecuaci6n caracteristica esten en el origen. [Cuando el vector de control u(k) es de dimensi6n m (siendo m > 1), las matrices K 1 YK 2 no son (micas. Es decir, se puede obtener mas de un conjunto de K 1 YK 2] . Refiriendonos al problema de disefio del sistema de seguimiento analizado en el ejemplo 6-13, considere primero el problema de determinar una constante de ganancia integral K 1 Yuna matriz de ganancia de realimentaci6n del estado K b utilizando la ecuaci6n caracteristica dada por la ecuaci6n (6284),0 la ecuaci6n (6-285), tal que la respuesta escal6n unitario sea con oscilaciones muertas. A continuaci6n considere disefiar un observador de predicci6n de orden completo (tercer orden), tal que la respuesta a1 error de observador sea con oscilaciones muertas. Si se define la matriz de ganancia de realimentaci6n del observador como K" determine esta matriz igualando los coeficientes de las potencias iguales de z de
IzI-G+K.C!=O
Ylos de las potencias similares de z de la ecuaci6n caracteristica deseada, que es
Z3 = 0
Soluci6n Definamos
Al observar que
[0
G=
0
-0.12
-0.01
~ ~1]' H=[H
-0.01
C = [0.5 1 0]
Izl3 - G + HK2 + HKI C + HKI C(zII - II)-lllzII - III = IZl3 - G + HK2 + HK I C[1 + (z - l)-I]/lz - 11
=
[~o ~ ~] [~
0 z
-
-0.12
~ ~] + [~][kl
1 1
k2 k3]
o
0.12 + k l + 0.5K I Z z- 1
o
-1
z
0.01 + k 2 + K I zl
Iz - 11
z-
-1
o
(0.12 + kl)(z - 1) + 0.5K I z (0.01 + k 2)(z
-1 - 1) + K I Z (z - 1y + k 3(z - 1)
Capitulo 6
509
= Z4 + (-2 + k 3) Z 3 + (1.01 + k 2 - k 3 + K 1) Z 2
+ (0.11 + k, - k + 0.5K1)z - 0.12 - k,
Esta ecuacion earaeteristiea debe ser igual a
= 0
-2 + k, = 0
=0
k, = -0.12,
cs decir,
= [-0.12 0.3233 2]
[Es evidente que estos valores eoneuerdan eon los proporcionados por las eeuaeiones (6-199) y (6-200).] A continuacion, disenaremos un observador de predieei6n de orden eompleto. Definamos
x. =
Entonees
el
[k , e
k k., ]
G - KeC
0 0 [ -0.12
1 0 -0.01
0] - [k 1 k.,
1
k.;
el
]
[0.5
0]
=
y se tiene que
-o.se.,
!]
IzI - G + K, CI =
= Z3
=0
=
Por 10 tanto.
-1 + 0.5k el + k.,
510
Capitulo 6
AI resolver estas tres ecuaciones sirnultaneas en funcion de k'l' k,., Y k,, se obtiene
K, = k e 2 = 0.7404
e,
Esta expresi6n da la matriz de ganancia de realimentaci6n deseada K,. Recuerde que el disefio de la constante de ganancia integral K[ y la matriz de ganancia de realimentaci6n del estado K 2 (un problema de ubicaci6n de polos), y el disefio de la matriz analoga del observador K, (un problema de observador) son problemas independientes. Esto es, la matriz K, no depende de K, ni de K 2, y viceversa.
PROBLEMAS
Problema B-6-1
Considere el sistema definido por
Determine las condiciones en G, b, C Yd para la controlabilidad completa y observabilidad completa del estado.
Problema B-6-2
EI sistema de control definido oor
-1
[1
es de estado completamente controlable. Determine una secuencia de senales de control u(O) y u( I) tales que el estado x(2) sea
Problema B-6-3
Considere el sistema
[::~~ : g] [::~~n
1.
= [
= [ -
-~.16 ~
]
-1
X\(2)] _ [ x2(2) -
[0 ] -0.008
Capitulo 6
Problemas
511
2.
Problema B-6-4
Considere el sistema [Xl(k
1)]
[~ ~
x2(k + 1) = x3(k + 1) a b
Partiendo del estado inicial
1 a -b
0][ ]+ []
0 1 u(k)
no
D.
Problema B-6-5
Para el sistema definido por
= Xl(k + [ x2(k + 1)
1)] [0
(k ) = [1
-0.16
O][Xl(k)] x2(k)
y(O) = 1,
Las sefiales de control dadas son
y(l) = 2
u(O) = 2,
u(l) = -1
Problema B-6-6
Demuestre que el sistema
512
Capitulo 6
[l
0 0 0
1 0 1
0 0
es de estado completamente controlable y completamente observable. Demuestre tambien que, dado cualquier estado inicial x(O), todo vector de estado podra ser Ilevado al origen en a 10 maximo cuatro periodos de mucstreo, si y s610 si la serial de control esta dada por
!l
C = [1 0 0
OJ
u(k) = -Cx(k)
Problema B-6-7
[~:]=[-2~ -~][~:]+[~}
y
=
[3
1{~:]
A = -3 - j4 2
Este sistema es de estado completamente controlable y completamente observable. Observe que 105 valores caracteristicos de la matriz de estado son
Al = -3 + j4,
Por 10 tanto, este sistema involucra polos complejos. Como se indic6 en la secci6n 6-3, un sistema que es de estado completamente controlable :completamente observable, en ausencia de muestreo se conserva en tales condiciones despues del muestreo. si y s610 si, para todo valor caracteristico de la matriz de estado (raiz de la ecuaci6n caracteristica),
implica que
Im(A - A) J
I
'* 27Tn T
don de T es el periodo de muestreo y n = I, 2, .... Considere la versi6n discretizada de este sistema. Demuestre que para este sistema, si el peri ode de muestreo T = 7Tn/4 (siendo n = I, 2, 3, ... ), entonces el sistema discretizado es no controlable y no observable.
Problema B-6-8
2. 3.
Capitulo 6
Problemas
513
Problema B-6-9
Considere el sistema de funcion de transferencia pulso
Forma canonica control able Forma canonica observable Forma canonica diagonal
2. 3.
Problema B-6-10
Considere el sistema siguiente que se da en la forma canonica controlable:
Se desea transformar las ecuaciones del sistema a dicha forma canonica observable, mediante la transformacion del vector de estado:
x =
Qi
Problema B-6-11
Considere el sistema de doble integrador
G=[~
iJ,
y T es el periodo de muestreo. (Yea el problema A-5-16 para la deduccion de esta ecuacion de estado en
tiempo discreto en relacion con el sistema de doble integrador.) Se desea que los polos en lazo cerrado queden localizados en z = III Y Z = Ilz. Suponiendo que se utiliza el control de realirnentacion de estado
u(kT) = -Kx(kT)
determine la matriz K de ganancia de realimentacion del estado.
Problema B-6-12
Considere el sistema definido por
[ ~:~Z : ~~] [~ ~
=
O][Xl(k)] + 1 xz(k)
o
x3(k)
[1]
x3(k + 1)
-0.16 0.84
1 u(k) 1
514
Capitulo 6
Determine la matriz de ganancia de realirnentacion del estado, K, tal que cuando la serial de control este dada por
u(k) = -Kx(k)
el sistema en lazo cerrado mostrara una respuesta con oscilaciones muertas a cualquier estado inicial x(O).
Problema B-6-13
Considere el sistema
x(k
1) = Gx(k)
+ Hu(k)
y(k) = Cx(k)
donde
x(k) u(k)
= =
[-~.16
-iJ,
C = [1 1]
Disefie un observador actual para el sistema. Se desea que la respuesta al error del observador inicial sea con oscilaeiones muertas.
Problema B-6-14
Considere el sistema
x(k
+ 1) = Gx(k) + Hu(k)
y(k) = Cx(k)
donde
x(k) u(k)
= =
-0.25] , 0.5
Problema B-6-15
Considere el sistema definido por
Xl (k [ x2(k
C = [1
0]
Si se supone que es medible la saliday(k), disefie un observador de orden minimo, tal que la respuesta al error de observador inicial sea con oscilaciones muertas.
+ + 1) -
1)] _[-0.16 0
1][Xl(k)] -1 x2(k)
+ [O]U(k) 1
Utilizando MATLAB, determine la matriz K de ganancia de realirnentacion de estado, tal que cuando la serial de control este dada por
Capitulo 6
Problemas
515
u(k) = -Kx(k)
el sistema en lazo cerrado (sistema de regulacion) muestra respuesta con oscilaciones muertas a un estado inicial x(O). Escriba un pragrama MATLAB para la determinacion de la matriz de ganancia de realimentaci6n del estado. K. Problema 8-6-16 Considere el sistema definido por
x(k + 1)
donde
Gx(k) + Hu(k)
y(k) = Cx(k)
[~
-0.16] ' -1
+ jO.5,
J.L2 =
[0 1]
Mediante MATLAB. determine la matriz de ganancia de realimentaci6n de observador. K,. tal que los valores caracteristicos deseados para la matriz de observador sean J.Ll = 0.5
0.5 - jO.5
Suponga que la configuraci6n del sistema sea identica a la mostrada en la figura 6-8. Escriba un pragrama MATLAB utilizando la formula de Ackermann. Problema 8-6-17 La figura 6-24 muestra un sistema de seguimiento. donde el contralador inicial tiene un tiempo de retardo de un periodo de muestreo. (Compare este sistema con el sistema de seguimiento ilustrado en la figura 6-18.)
r(k)
y(kl
Controlador integral
Planta
Figura 6-24 Sistema de seguimiento con rcalimentaciondel estado y control integral, que incluye un retardo unitario en la trayectoria directa. Determine la ganancia de trayectoria directa K, y la ganancia de retroalirnentacion K,. donde la respuesta a la entrada de secuencia escal6n unitario r(k) = I (donde k = O. 1.2.... ) sea con oscilaciones muertas. Grafique la respuesta y(k) en funci6n de k. Problema 8-6-18 Considere c] sistema de seguimiento que aparece en la figura 6-25. (Este sistema es similar al mostrado en la figura 6-24. excepto que el contralador integral tiene un elemento de retardo unitario en el lazo
516
Capftulo 6
r(k)
y(k)
' I,I
L
I
J,
Controlador integral
I
K2
I
..-J
Planta
I ,
i ,
Figura 6-25 Sistema de seguimiento con realimentaci6n del estado y control integral, que incluye un retraso unitario en ellazo menor.
menor.) Determine la ganancia de trayectoria directa K, y la ganancia de retroalimentaci6n Kb donde la respuesta a la entrada de secuencia escal6n unitario r(k) = I (donde k = 0, I, 2, ... ), sea con oscilaciones muertas. Grafique la respuestay(k) en funci6n de k.
7
Enfoque de eeuaeiones po/inomia/es para el diseiio de sistemas de eontrol
7 7 INTRODUCCION
En el capitulo 6 se disefiaron sistemas del estado de control mediante realimentacion, 0 retroalimentacion, al usar la tecnica de ubicacion de polos. Si algunas de las variables de estado no se podian medir de manera directa, se empleaban los estados observados para propositos de realimentacion. EI disefio completo se realizo en el espacio de estados. Existe un enfoque diferente para el disefio de sistemas similares. Este se denomina enfoque de ecuaciones polinomiales y es un enfoque altemo al disefio mediante ubicacion de polos con un observador del estado de orden minimo. (EI enfoque de ecuaciones polinomiales se puede aplicar a sistemas con entradas y salidas multiples. Sin embargo, en este capitulo, solo se considera para sistemas con una entrada y una salida.) Este capitulo presenta una explicacion introductoria al enfoque de ecuaciones polinomiales para el disefio de sistemas de control. En este enfoque se resuelven las ecuaciones Diofantinas para determinar polinomios en z que se pueden utilizar para construir sistemas fisicamente realizables. Este punto de vista proporciona una solucion maternatica rapida a ciertos tipos de problemas de disefio. La organizacion del capitulo es la siguiente: la seccion 7-1 presenta algunos comentarios introductorios. La seccion 7-2 explica las ecuaciones Diofantinas y provee los fundamentos matematicos necesarios para el enfoque de ecuaciones polinomiales para el disefio de sistemas de control. La seccion 7-3 presenta un ejemplo simple para demostrar el enfoque de ecuaciones polinomiales para el disefio de un sistema de regulacion que tenga una ecuacion caracteristica deseada. La seccion 7-4 trata el enfoque de ecuaciones polinomiales al disefio de sistemas de control. La seccion 7-5 estudia el disefio de un sistema de control mediante la igualacion a un modelo. Aqui se disefia dicho sistema de modo que su respuesta a cualquier entrada sea la misma que la especificada por un
517
518
Capitulo 7
modelo matematico. Para disefiar dicho sistema, se determinan, con base en el enfoque de ecuaciones polinomiales, filtros fisicamente realizables que producen las caracteristicas deseadas del sistema.
7-2 LA ECUACION DIOFANTINA
En esta secci6n se explica la ecuaci6n Diofantina. Considere el sistema definido por la funci6n de transferencia pulse
Y(z) U(z)
donde
B(z) A(z)
(7-1)
A(z) B(z)
= =
z" + OIZn-1 +
Suponga que esta funci6n de transferencia pulso es de estado completamente controlable y cornpletamente observable. Esto es, no existe una cancelaci6n entre polos y ceros en la funci6n de trasferencia pulso, 0 A(z) Y B(z) no tiene factores en cornun. Cuando los polinomios A(z) y B(z) no tiene cancelaciones, se dice que son polinomios coprimos. Un polinomio en z se dice monico si el coeficiente del termino de mayor grade es uno. Por 10 tanto, el polinomio A(z) es m6nico. A continuaci6n se define un polinomio estable D(z) de grade (2n - I) como sigue:
D(z)
Entonces existen polinomios unicos de grado (n - I), o(z) Y (3(z) tales que
D(z)
(7-2)
donde
a
(z )
= Cl'oZ n-I +
Cl'IZ n-2
..
+ O'n-2Z + an-I
La ecuaci6n (7-2) se denomina ecuaci6n Diofantina, en honor a Diofanto de Alejandria (246?-3307 d.C.). La ecuaci6n Diofantina se puede resolver para Cl'(z) y (3(z) mediante el uso de la matriz de Sylvester E de 2n x 2n, la cual se define en terminos de los coeficientes de los polinomios coprimos A(z) y B(z) como sigue:
On On-I 01
0 On On-I
01
1
0 0 0
On On-I
01
bn bn- I bl bo
0 0 0
bn bn- I
bl
0 0 0
E=
0 0 0
bo
0 0
bn bn- I bl bo
(7-3)
0 0
[Para utilizar la ecuaci6n (7-3), el polinomio A(z) debe ser m6nico. De otra forma, se debera modificar la ecuaci6n (7-3).] Si n = 4, esta matriz se escribe como:
Seccion 7-2
La ecuccion diofantina
519
a4 a3 az E= al 1 0 0 0
0 a4 a3 az al 1 0 0
0 0 a4 a3 az al 1 0
0 0 0 a4 a3 az al
1
b4 b3 bz bl bo 0 0 0
0 b4 b3 bz bl bo 0 0
0 0 b4 b3 bz bl bo 0
0 0 0 b4 b3 bz bi bo
La matriz de Sylvester E es no singular si y solo si A(z) y B(z) son coprimos, 0 no tienen factores en comun. Este hecho se puede ver de 10 siguiente: en referencia a la matriz E anterior de 8 x 8, el determinante lEI es:
lEI
a4 a3 az al 1 0 0 0
0 a4 a3 az al 1 0 0
0 0 a4 a3 az al 1 0
0 0 0 a4 a3 az al 1
b4 b3 bz bl bo 0 0 0
0 b4 b3 bz bl bo 0 0
0 0 b4 b3 bz bl bo 0
0 0 0 b4 b3 bz bl bo
bri(AI - As)(AI - A6)(AI - A7)(AI - A8) (Az - As)(Az - A6)(Az - A7)(Az - A8) (A3 - As)(A3 - A6)(A3 - A7)(A3 - A8) (A4 - As)(A4 - A6)(A4 - A7)(A4 - A8)
(7-4)
donde ai' ... ,a4 Y bl' ... .b, son los coeficientes de A(z) y B(z), respectivamente, y AI' ... , A4 Y As ... , A8 son las raices caracteristicas de A(z) y B(z), respectivamente: A(z) = Z4 + alz 3 + azz z + a3Z + l4 = (z - AI)(Z - Az)(Z - A3)(Z - A4)
B(z) = b oz 4 + b lz 3 + bzz z + bcz + b 4 = bo(z - As)(Z - A6)(Z - A7)(Z - A8) De la ecuacion (7-4) se observa que el determinante lEI no es cero si y solo si todos los factores multiplicativos en el segundo miembro de la ecuacion no son cero, esto es, si y solo si no hay cancelaciones entre A(z) y B(z). [Para obtener la ecuacion (7-4), refierase al problema A-7-1.] Ahora se definen los vectores D y M tales que
M=
ao
520
Capitulo 7
Y f30,
La ecuaci6n (7-5) da la soluci6n a la ecuaci6n Diofantina. [Para obtener la ecuaci6n (7-5), vease el problema A-7-2.]
Ejemplo 7-1
Considere los siguientes A(z) (un polinomio m6nico de grado 2), B(z) (un polinomio de grado I), y D(z) (un polinomio de grado 3):
A(z) =
Z2
+ 0.5
B(z) = z D(z) = Z3
+2
[Es claro que no hay factores comunes en A(z) y B(z).] El problema es encontrar dos polinomios unicos a(z) y (3(z) tales que:
a(z)A(z)
+ {3(z)B(z)
= D(z)
donde
a(z) = aoz {3(z) = {3oz
+ at + {3t
(7-6)
o bien
La ecuaci6n (7-6) es una ecuaci6n Diofantina. Para resolver esta ecuaci6n para a(z) y (3(z), primero se debe observar que
at = 1,
bo = 0,
y entonces la matriz de Sylvester E se escribe como:
La inversa de esta matriz se puede obtener de una forma facil con MATLAB. La salida de MATLAB para la inversa de la matriz E es:
E=
0.5000 1.0000 1.0000
o
0.5000 1.0000 1.0000
2.0000 1.0000
o
2.0000 1.0000
o
inv(E)
o o
Seccion 7-2
La ecuocion diofantina
521
ans =
0.4000
-0.8000
o
0.4000 -0.4000
Yaque
1.6000
o
0.2000 0.8000
D(z) =
o
-0.4000 -0.6000
Z3
se tiene
do
Por 10tanto, la matriz D es
= 1,
d, = 0,
M~[~]
se obtiene la solucion de la ecuacion Diofantina de como sigue:
(inv(E))*D
M=
-1.2,
ao
= 1,
(3t = 0.3,
f30 = 0.2
o bien
a(z)
(3(z)
Los polinomios a(z) y (3(z) determinados de esta forma satisfacen la ecuacion Diofantina dada por la ecuacion (7-6). Para verificar esto, se debe notar que
522
Capitulo 7
(z - 1.2)(Z2 + Z + 0.5) + (0.2z + 0.3)(z + 2) = Z3 - 1.2z 2 + Z2 - 1.2z + 0.5z - 0.6 + 0.2z 2 + 0.3z
+ OAz + 0.6
En el capitulo 6 se discuti6 el enfoque de ubicaci6n de polos para el disefio de sistemas de control. Se estableci6 que algunas de las variables de estado podian no estar disponibles para medirse de forma directa, y que en tales casos el enfoque de ubicaci6n de polos requeria los estados estimados u observados para la realimentaci6n. Veamos el ejemplo 6-11, donde se discuti6 el sistema de regulaci6n con realimentaci6n del estado. En tal sistema la ecuaci6n caracteristica estaba dada, y una de las variables de estado fue estimada mediante el uso de un observador de orden minimo del tipo de oscilaciones muertas. En esta seccion se mostrara que ese mismo sistema de regulaci6n se puede disenar mediante el enfoque de ecuaciones polinomiales. Sistema de regulacion diseiiado en el ejemplo 6-11. EI sistema de regulaci6n disefiado en el ejemplo 6-11 se presenta en la figura 7-1. La planta es de estado completamente controlable y completamente observable. (No existe cancelaci6n entre el polinomio numerador y el polinomio denominador.) EI periodo de muestreo fue de 0.2 segundos, 0 T = 0.2. EI controlador fue disefiado con base en el enfoque de ubicacion de polos al especificar los polos de lazo cerrado en
Zl
= 0.6 + jO.4,
Zz
0.6 - jO.4
y al incorporar un observador de orden minimo para estimar las variables de estado para la
realimentaci6n. EI observador de orden minimo tenia la ecuaci6n del error de observacion (Z) EI regulador disefiado fue
GD(Z)
(7-7)
U(z)
0.02 (z + 1) (z _1)2
VIz)
-24 ( z- 0.6667 )
z+ 0.32
Figura 7-1
6-11.
Secci6n 7-3
Ejernplo ilustrativo
523
A continuaci6n se presentara el enfoque de ecuaciones polinomiales al disefio del mismo regulador dado por la ecuaci6n (7-7) mediante la soluci6n de la ecuaci6n Diofantina.
Enfoque de ecuaciones polinomiales para el disetio del sistema de regulacion. Considere el diagrama de bloques de la figura 7-2. La funci6n de transferencia realimentada (3(z)/a(z) funciona como un regulador. Se determinaran a(z) y (3(z) mediante el enfoque de ecuaciones polinomiales. Primero se debe notar que la funci6n de transferencia de la planta es
Y(z)
U(z)
B(z) A(z)
0.02(z + 1) (z - 1)2
=
[A(z) es m6nico de grado 2 y no hay cancelaci6n entre A(z) y B(z).] Entonces, aunque R(z) funci6n de transferencia puIso en lazo cerrado para el sistema esta dada por Y(z) = a(z)B(z) R(z) a(z)A(z) + (3(z)B(z) 0.02(z + l)a(z) a(z)(z - 1)2 + (3(z)0.02(z + 1)
0, la
Como se estableci6 antes, en eI ejemplo 6-1, se requiere que los polos de lazo cerrado deseados mediante realimentaci6n de estado sean z\
= 0.6 + jO.4,
Z2 =
0.6 - jO.4
+ jO.4)
= Z2 - 1.2z + 0.52 EI polinomio del error del observador de orden minimo fue
F(z) = z
Para determinar a(z) y (3(z), se resuelve la ecuacion Diofantina siguiente:
a(z)A(z) + (3(z)B(z)
donde
= F(z)H(z) = D(z)
Z3 -
(7-8)
1.2z2 + 0.52z
Observe que D(z) es un polinomio estable de grado (2n- I) en z (donde n = 2 para este caso). Ya que
R(z) =0
U(z)
-=
A(z)
8(z)
0.02 (z+l)
(z_1)2
Y(z)
~(z)
a(z)
Figura 7-2
524
Capitulo 7
A(z) = Z2 - 2z B(z)
se tiene que
al
+1
= 0.02z + 0.02
bo = 0, bl
= -2,
a2
= 1,
= 0.02,
= Z3
b2
= 0.02
- 1.2z2 + 0.52z
Para resolver la ecuacion Diofantina para o(z) y (3(z), primero se define la matriz de Sylvester E de 2n x 2n como:
E-
E- I
D=
[~:] [0.~2],
dl
=
do
-1.2 1
0.25 -0.25
M
= E-ID =
0 [ 37.5 -12.5
12.5 12.5
0.25
1 [0.32] -16 24
Por 10tanto,
al
= 0.32,
ao
a(z)
= 1,
f30 = 24
Ssccion 7-4
525
que es identico al que se disefi6 en el espacio de estado mediante el metodo de ubicaci6n de polos combinado con un observador de orden minimo.
En la secci6n 7-3 se disefi6 un sistema de regulaci6n al usar el enfoque de ecuaciones polinomiales. EI diagrama de bloques del sistema de regulaci6n disefiado se presenta en la figura 7-3. Recuerde que a(z) y fi(z) se determinaron a partir de la ecuaci6n Diofantina siguiente:
a(z)A(z)
+ fi(z)B(z)
H(z)F(z)
donde A(z) es un polinomio m6nico de grado n, B(z) es un polinomio de grado rn (rn ~ n) [se supuso que no hay factores comunes entre A(z) y B(z)), H(z) es el polinomio caracteristico deseado para la parte de ubicaci6n de polos, y F(z) es el polinomio caracteristico para el observador de orden minimo. [Ambos polinomios H(z) y F(z) son polinomios estables.) EI grado del polinomio H(z) es n y el del F(z) es n - 1. (Se supone que la salida del sistema es el unico estado medible. Por 10 tanto, el orden del observador minimo es n - 1.) A continuaci6n se explicara el disefio de sistemas de control basado en el enfoque de ecuaciones polinomiales. Se consideran dos configuraciones diferentes de sistemas de control.
Configuraclon 1 del sistema de control. EI sistema de regulaci6n presentado en la figura 7-3 se puede modificar para un sistema de control cuya salida siga a la entrada de referencia. Un diagrama de bloques posible para este sistema de control se muestra en la figura 7-4. Como todo sistema de control, requiere tener una ganancia ajustable Ko. Esta ganancia K o debe ser ajustada para que la salida en estado estable y(k) sea igual a uno euando la entrada r(k) es un secuencia de escal6n unitario.
R(z) =0
------l~+
U(z)
B(z) A(z)
y(z)
~
a(z)
Figura 7-3
regulacion.
526
Capitulo 7
R(z)
B(z) A(z)
VIz)
~(z)
a(z)
y(z) R(z)
_ K
-
_ K a(z)B(z) 0 H(z)F(z)
Observe que el sistema en lazo eerrado es de orden (2n - I), a menos que oeurra alguna cancelacion entre a(z)B(z) y H(z)F(z). Observe que la dinamica del numerador ha eambiado de B(z) a Koa(z)B(z). Para determinar K o se haee que
Iimy(k)
k-+ oo
= lim (1 - Z-I)y(Z)
:---+1
= K oH(l)F(l) =1
de donde se obtiene
K _ H(l)F(l) o - a(l)B(l)
Ejemplo 7-2
F(z) = z
a(z)
= z + 0.32
f3(z) = 24z - 16
Seccion 7-4
527
Por 10 tanto, la funcion de transferencia pulso en lazo cerrado Y(z)/R(z) se obtiene de la ecuacion (7-9) como
Y(z) R(z)
Ko
= H(l)F(l) =
a(l)B(l)
Note que el sistema es de tercer orden. La respuesta al escalon unitario y a la rampa unitaria del sistema con Ko = 6.0606 fueron presentadas en la figura 6-16 y 6-17, respectivamente.
Configuracion 2 del sistema de control. Un sistema de control con un diagrama de bloques diferente se puede disefiar mediante el uso del enfoque de ecuaciones polinomiales. Considere el diagrama de bloques de la figura 7.5. (Para obtener dicho diagrama de bloques, vease el problema A-7-3.) De la figura 7-5, se obtiene la siguiente ecuacion:
U(z)
U(z)
que se puede simplificar a F(z) U(z) = - F(z) Y(z) La funcion de transferencia pulso de la planta es Y(z) B(z) U(z) = A(z) donde A(z) es un polinomio monico de grado n y B(z) es un polinomio estable de grado m (m::; n). Ya que
(7-11 )
~(z)
R(z)
U(z)
8(z)
A(z)
Y!z)
Figura 7-5
528
Capitulo 7
= KoR(z)
Y(z) R(z)
Yaque
a(z)A(z) + {3(z)B(z)
se obtiene
H(z)F(z)
Y(z) R(z)
KoF(z)B(z) H(z)F(z)
K o B(z) H(z)
(7-12)
Note que el polinomio del observador F(z) ha sido cancelado [como F(z) es un polinomio estable, su cancelaci6n es permitida], y el polinomio caracteristico del sistema en lazo cerrado esta dado por H(z). H(z) es el polinomio estable de grado n deseado pero que, en esencia, "se escoge en forma arbitraria". Por 10 tanto, el sistema de control disenado es de orden n. (En el caso del sistema de control de la configuraci6n 1, el orden del sistema es 2n - 1, a menos que ocurra cancelaci6n en el sistema disefiado, 10 que resulta en una reducci6n del orden del sistema.) Tambien se observa que la dinamica del numerador de Y(z)/R(z) no ha cambiado en el presente enfoque. [EI numerador es B(z) multiplicado por la constante K o.]
Ejemplo 7-3
Se disenara un sistema de control con base en el diagrama de bloques de la figura 7-5. La planta que se considera esta dada por
+ 1)
1f
(EI periodo de muestreo res de 0.2 segundos). Se utilizaran los mismos polos en lazo cerrado deseados empleados en el ejemplo 7-2, es decir,
Zl
= 0.6 + jO.4,
Z2 =
0.6 - jO.4
q,(z) = z
EI polinomio caracteristico deseado H(z) se escribe asi
+ jO.4)
+ 0.52
F(z) = z
Secci6n 7-4
529
o bien
a(z)(z - 1)2
{3(z)(0.02)(z
(7-13)
= z + 0.32 = 24z - 16
Al utilizar estas a(z) y f3(z) y en referencia a la ecuacion (7-12), la funcion de transferencia pulso en lazo cerrado Y(z)/R(z) se puede escribir como:
Y(z) R(z)
KoB(z) H(z)
= Z2
Para determinar la constante K o, se requiere que y( (0) en la respuesta al escalon unitario sea igual a uno.
Iimy(k)
k_oo
= lim (1 z_l
. Z -
- Z-I)y(Z)
Z
=hm-z~1
Ko = 1 8
Ko = 8
Entonces se obtiene la funcion de transferencia pulso en lazo cerrado
Y(z) R(z) 0.16z + 0.16 1.2z + 0.52
Z2 -
Es claro que el sistema disefiado es de segundo orden. EI diagrama de bloques del sistema disenado se presenta en la figura 7-6a). La figura 7-6b) muestra el diagrama simplificado. Ahora se examinara la respuesta al escalon unitario y a la rampa unitaria del sistema disenado, EI programa para MATLAB 7-1 se utiliza para obtener la respuesta al escalon unitario. El resultado se presenta en la figura 7-7. EI programa para MATLAB 7-2 da la respuesta a la rampa unitaria. EI resultado se muestra en la figura 7-8. El error en estado estable eeoc) al seguir a la entrada rampa unitaria se obtiene como: Ya que
Y(z) R(z) 8(0.02z + 0.02) 1.2z + 0.52
Z2 -
se tiene que
E(z) = R(z) - Y(z) = [ 1 - R(z) R(z)
Y(Z)]
= (z
donde
Z2 -
R(z)
(z -
I?
530
R(z)
Capitulo 7
Y(z)
0.02 (z + 1)
(z- 1)2
--z
z 0.32
24z- 16
(a)
R(z)
8(0.02z + 0.02)
y(z)
(b)
Figura 7-6 a) Diagrama de bloques del sistema de control disenado mediante el enfoque de ecuaciones polinorniales; b) diagrama de bloques simplificado.
Por \0 tanto,
k~~
= 0.4
El error en estado estable al seguir a la entrada rampa unitaria es 0.4.
Secci6n 74
531
1.6
1.4
-r-
!
-I
1.2
00
I
o
i
!
06000000000000000000000000000001
>.
0.8
0.6
0
0.4
]
II
0.2/
01 0
Figura 7-7
~_-..l.
j
40
10
15
20
25
30
35
k
Respuesta al escalon unitario del sistema mostrado enla figura 7-6(b).
Prograrna de MATLA8 72 nurn = [0 0.16 0.161; den=[l -1.2 0.52J; k = 0:20; r = [0.2*k1; v=[O 20 0 4]; axis(v); y = iilter(nurn,den,r); plot(k,y,' o ,k,y ,k,0.2*k,-grid title(' Unit-Ramp Response')
AI comparar las respuestas al escalon unitario de los sistemas de control de la configuracion I y 2 se observa que son identicas. AI comparar las respuestas a la rampa unitaria de los dos sistemas. se nota que el sistema dc control dc la configuracion 2 tiene un error 10% men or en estado establc al scguir la entrada rampa unitaria que el sistema de control dc la configuracion I.
532
Capitulo 7
3.5 3
/
/
,/
2.5
~
>.
1.5
r
,/
/
.,'
/
/
-:
/ /
,/ ,/
0.5
/
"
o
ci
0'~-",,'--
.. 0 _ _-J--
--'-
.1.-
-J
o
Figura 7-8
10
k
15
20
En la tecnica de disefio presentada en la secci6n 7-4 (del sistema de control de la configuraci6n 2), el polinomio del observador F(z) se cancel6 entre el numerador y el denominador de la funci6n de transferencia pulso en lazo cerrado. [Vease la ecuaci6n (7-12).] La ecuaci6n caracteristica del sistema disefiado fue H(z) que es un polinomio estable de grado n. [H(z) fue un polinomio estable de grado n deseado, pero escogido en un sentido "arbitrario'?.] Suponga que la funcion de transferencia pulso de la planta es
Y(z)
B(z)
U(z) = A(z)
donde A(z) es un polinomio m6nico de grado n en z y 8(z) es un polinomio de grado m en z (m :::; n). y se supone que no hay factores comunes entre A(z) y 8(z). Si 8(z) es un polinomio estable (significa que todos los ceros estan dentro del circulo unitario en el plano z), es posible escoger H(z) tal que incluya al polinomio 8(z), 0 bien
H(z)
= B(z)H1(z)
Secci6n 7-5
533
Por 10 tanto, se eliminaron los ceros del polinomio numerador 10 que significa que si se desea se pueden eliminar los ceros de la planta. Suponga que se quieren tener ciertos ceros en el numerador y ciertos polos en el denominador. Esto es, se quiere que el sistema posea ciertos polos deseados y ciertos ceros deseados como los de un "sistema modele", 0 bien
Y(z) R(z)
= Gmodelo =
Bm(z) Am(z)
Bajo ciertas condiciones, es posible disefiar tal sistema mediante el uso del enfoque de ecuaciones polinomiales. Ya que se obliga a que la funci6n de transferencia pulso del sistema de control sea exactamente igual a la de un modelo, a este tipo de sistema de control se Ie llama sistema de control mediante la igualaci6n a un modelo. En el proceso de disefio discutido en la secci6n 7-4, H(z) se escogi6 como el polinomio caracteristico deseado de grado n. [H(z) es un polinomio estable de grade n que no es unico, pero sl un poco arbitrario con tal de que produzca una respuesta aceptable del sistema.] Se escoge un polinomio estable de grado n - m como HI (z). [HI(z) debe ser un polinomio estable pero en un sentido arbitrario que produzca una respuesta aceptable del sistema resultante.] Ahora se define el producto de B(z) por HI(z) como H(z), es decir,
Sistema de control mediante la igualaclon a un modelo. Primero se hara referencia al diagrama de bloques de la figura 7-9. Se supone que la planta B(z)/A(z) es de estado completamente controlable y completamente observable; esto es, no existen factores comunes entre A(z) y B(z). Se determinan ce(z) y f3(z) al resolver la ecuaci6n Diofantina siguiente:
a(z)A(z)
+ {3(z)B(z)
= F(z)B(z)H1(z)
donde F(z) es un polinomio estable de grade (n - I). [Observe que ce(z) y f3(z) son polinomios de grade (n - I).] Entonces, del diagrama de bloques de la figura 7-9 se tiene
U(z)
-[;~;~ U(z) -
U(z)
R(z)
VIz)
B(z)
A(z)
li(z)
F(z)
Figura 7-9
534
Capitulo 7
o bien
f3(z)
Tambien,
V(z) =
Gmodelo
HI(z)R(z)
Por 10 tanto,
Y(z) R(z)
= V(z)
=
,
GmodeloHI(z) HI (z)
= Gmodelo
= GmodeloHI(z)
Gmodelo'
entonces la funcion de transferencia pulso entre la salida Y(z) y la entrada R(z) es igual a se logra el control mediante la igualacion a un modelo.
Ast.
Comentarios. AI aplicar el presente enfoque para el disefio de un sistema de control mediante la igualacion a un modelo, es importante recordar 10 siguiente:
1. Para hacer que la funcion de transferencia pulso Gmodclo HI(z) sea ffsicamente realizable, el grado del polinomio numerador de Gmodelo HI(z) debe ser igual 0 men or que el grado del polinomio denominador de Gmodelo HI(z). De otra forma, el presente enfoque no se puede aplicar. 2. Como se hizo notar antes, el polinomio numerador B(z) de la planta debe ser estable porque la cancelacion de B(z) se realiza entre el numerador y el denominador de Y(z)!V(z). [Si B(z) no es un polinomio estable, esto es, B(z) tiene uno 0 varios ceros fuera del clrculo unitario, entonces la cancelacion de B(z) en Y(z)/V(z) producira una respuesta inestable y el sistema disenado sera inestable.]
Ejemplo 7-4
Considcre la planta definida par Y(z) _ 0.3679z + 0.2642 U(z) - (z - 0.3679)(z - 1)
Seccion 7-5
535
Suponga que el periodo de muestreo T es de I segundo. Se desea disenar un sistema de control tal que el sistema en lazo cerrado sea:
Ym(z) Rm(z)
Gmodclo, Y
= ZZ
A esta funci6n de transferencia pulso se Ie llamara funci6n de transferencia pulso del modelo,
bien,
};" (z)
Gmodclo=
0.62;; - OJ
(7-14)
R",(z)=:::'-1.2z+0.52
Se supone que se utiliza la configuraci6n del sistema dada en la figura 7-9. Observe que para la planta dada
A(z) B(z)
Por 10 tanto,
= ZZ =
1.3679z + 0.3679
0.3679z + 0.2642
aZ = 0.3679
al = -1.3679,
bo
0,
b, = 0.3679,
b z = 0.2642
Claramente, el numerador B(z) es un polinomio estable. Como la funci6n de transferencia pulso de la planta es de segundo orden (0 n = 2), se escoge a H1(z) como un polinomio estable de primer grado [de grado (n ~ 1)]. Por ejemplo, se puede escoger a H1(z) como:
Hl(z) =
+ 0.5
[La selecci6n de H,(z) es, en cierto sentido arbitraria, siempre que sea un polinomio estable.] Ahora se define
F(z) = z
[F(z) puede ser cualquier polinomio estable de grado (n - 1).] Entonces
D(z)
Por 10 tanto,
F(z)H(z)
3
F(z)B(z)Hl(z)
z
d,
0.1321,
a(z)A(z)
o bien
+ {3(z)B(z) = F(z)B(z)Hl(z)
a(z )(ZZ
+ 0.4482z z + 0.1321z
x
donde 1(z) y {3(z) son polinomios en z de primer grado. Entonces la matriz de Sylvester E de 4 este problema es:
4 para
536
Capitulo 7
E=
0.2642 0.3679 0 0
0 0.2642 0.3679 0
=
-0.3849 0 0.5359 1.0461 0.2764 0 -0.3849 1.9669 0.5197 1.0000 -0.7236 2.3056
[0'1~21]
M = E- I D =
Por 10 tanto.
a(z)
f3(z) =
f30z + 131
= 1.8680z - 0.3679
1
Z
+ 0.5
z2-l.2z+0.52
GmoJdo
EI sistema de control mediante la igualacion a un modelo disenado tienc el diagrama de bloques que se presenta en la figura 7-1 Oa). Este diagrama de bloques se puede simplificar a los mostrados en las figuras 7-10b)yc).
Secci6n 7-5
537
R(z)
Y(z)
0.3679z + 0.2642
1.8680z - 0.3679
(a)
R(z) V(z) Y(z)
z + 0.5
---
z 0.5
(b)
R(z)
Y(z)
(e)
Figura 7-10 a) Diagrama de bloques del sistema de control mediante la igualaci6n a un modelo: b) y c) diagramas de bloques simplificados.
La rcspuesta al escalon unitario y a la rampa unitaria del sistema modelo sc mucstra en las figuras 7-11 y 7-12, rcspectivamente. La respuesta al escalon unitario presenta aproximadamente un 30% de sobrepaso. y el error al scguir la entrada rampa unitaria es de alredcdor dc 0.55.
Comentarios. Es importante observar que este enfoque es diferente al de multiplicar el filtra siguiente (funcion de transferencia pulso)
(z - 0.3679)(z - 1) 0.62z - 0.3 0.3679z + 0.2642 Z2 - 1.2z + 0.52 0.3679z + 0.2642 (z - 0.3679)(z - 1)
Z2 -
y el sistema resultante tiene la funci6n de transferencia pulso del modelo, en este caso, la cancelaci6n se realiza entre un polo crfticamente estable en z = 1 Y un cera en z = I,
538
Capitulo 7
1.6 r---,----...------;----.,.-----,---.,-----.,---,
1.4
1.2
r ':'
o
::it
>..
0.8
0.6 0.4
0.2
01
0 5
10
15
40
k
Figura 7-11
Respucsta al escalon unitario del mode!o G"",I'h, dado por la ecuacion (7-14).
20 r-------r--------r-----~----"
18 16
14
12
10
8 6
4
10
15
20
k
Figura 7-12 Respucsta a la rampa unitaria dcl modelo
G"',~d"
Seccion 7-5
539
y el sistema se vuelve inestable. [Recuerde que nunca debe cancelar un polo inestable (0 crfticamente estable) con un cero.] En el presente enfoque de ecuaciones polinorniales, no ocurren cancelaciones entre polos inestables (0 crfticamente estables) y ceros durante el proceso de disefio y, por 10 tanto, el sistema resultante siempre es estable. Si no se desea que exista error en estado estable al seguir la entrada rampa, entonces se requiere cambiar el modelo. Por ejemplo, si se utiliza la funcion de transferencia pulso siguiente como la funcion de transferencia pulso del modelo revisado
0.8z-0.48
=
0 z: - 1.2z+ 0.52
G~lOdelo
(7-15)
entonces el error en estado estable al seguir la entrada rampa se hace cero. Sin embargo, el sobrepaso maximo en la respuesta al escalon unitario es de alrededor de 45%. La respuesta al escalon unitario y la respuesta ala rampa unitaria se presentan en las figuras 7-13 y 7-14, respectivamente. Observe que al cambiar el modelo no se cambia el diagrama de bloques entre Y(z) y V(z), porque Y(z)/V(z) es independiente de la funcion de transferencia pulso del modelo. Ademas, si se desea cambiar el modelo, solo se necesita cambiar la funcion de transferencia pulso del primer bloque desde Gmodelo a G~lOdelo'
1.6 r - -....- - - - . , r - - - - . - - - - r - - , - - - - r - - . - - - - ,
o
1.4"0'
1.2
.;
,
. .
:.......................
. .
.
.
;
. .
:
.
;0
>.
10
15
20
25
30
35
40
k
Figura 7-13 Respuesta al escalon unitario del modelo
G:'""""
540
Capitulo 7
20,.-------,-------.-----.,------"
18 16
14
12 ...
10
8
6
5
Figura 7-14
10
15
20
k
Respuesta a la rampa unitaria del modclo G,;""", dado par la ecuacion (7-15)
La matriz de Sylvester Ese define como b b, b2 bo b l lObo Muestre que la matriz E es no singular si y solo si no existe cancclacion entre los polinomios A(z) y B(z) Solucion Se supone que las raices de A(z)
=
o a2 al
0]
= b o Z2 - b o(A3 + A4 )z + bo A3 A4
Capitulo 7
541
De don de. al
= -(AI + Az),
=
-bo(A3
b,
+ A4 ) ,
lEI =,
AlAz 0 I' bo - bo (A3 + A4)1_1 AIA z 0 //-bo(A3 -(AI + Az) AIAz 0 bo 1 -(AI + Az)
+~)
bOA3 A4/
bo
+/AIAzOII-bo(A3+A4) boA3~ /+/-(AI+Az) AIAz IlboA3~OI 1 bo -bo(A3 + ~) 1 -(AI + Az) bo 0 _1-(AI+Az)AIAzllboA3A4 1+ll-(AI+Az)/1 boA3A4 4) 1 b o -bo(A3 + A 1 -bo(A 3 + ~) b oA3A4
= A;A; b~ = b~(A; A; -
(A; A + Al A;)b~(A3 + ~) + Al Az b~(A; + 2A 3A + A;) - AlAz b~ A3~ z 4 A;A A3 - Al A;A3 - A;Az A4 - AlA;A4 z
+ (A; + AIAz + A;)b~A3A4 - b~(AI + Az)(A3 + ~)A3A4 + b~A;A; + AlAzA; + Al AzA3~ + Al AzA; + A;A3A4 + Al AzA3~ + A;A3~ - AlA;A4 - Az A;A - Al A3A; - Az A3A; + A;A;) 4
Al reacomodar los terrninos del segundo miernbro de esta ultima ecuacion. se obtiene
lEI = b~(A;A; -
+ AIAzA; + AlAzA3A4 - AzA; A - A; Az~ 4 + AlA A A + Al A A; - Az A3A; + A;A3~ z 3 4 z - AlA;A4 - AlA3A; + A;A;)
= b~(A;
= b~(AI - A 3)(AI - ~)(Az - A3)(Az - ~) no es cera si al menos AI = A3 0 AI = A4 0 A2 = A3 0 A2 = A4 Por 10 tanto, E no es singular si y solo si no ocurre cancelacion entre A(z) y B(z). Esto es, si A(z) y B(z) son polinomios coprirnos, entonces lEI no es cera y E- 1 existe,
EI determinante
lEI
Problema A-7-2 Suponga que en los polinomios A(z) y B(z) no ocurre cancelacion y que estan dados por
A (z) =
ZZ
+ al z + az
B(z) = bozz
Entonces la matriz de Sylvester E esta dada por
+ bIz + bz
E~[r~: ~;
542
Capitulo 7
Se definen
a(z) (3(z)
= =
aoz + a,
donde
Solucion
(0'0
+ (a, a, +
=
D(z) do =
De don de,
0'0
+ f30b o
0'0
d, = a, +
a2 0 b2 EM = a, a2 b, [ 1 a, bo o 1 0
=
al comparar cada elemento del segundo miembro de esta ultima ecuaci6n con d-; db d.; Y do, respectivamente, se tiene
Capitulo 7
543
De donde,
o los cocficientes de los polinomios a(.::) y f3(.::) se pueden determinar al multiplicar E- 1 por D. Problema A-7-3 En el capitulo 6 se disenaron sistemas de rcgulacion y sistemas de control al utilizar un esquema de realimcntacion del estado observado. En sistemas de una entrada y una salida, la salida siempre es mcdible. Por 10 tanto. en dichos sistemas se requieren observadorcs de orden minimo. en lugar de observadores de orden completo. Considere el sistema de regulacion discnado mediante el enfoque de ubicacion de polos combinado con el observador de orden minimo. Las ecuaciones de la planta son
x(k + 1)
= Gx(k) + Hu(k)
=
y(k)
Cx(k)
donde x es un vector de dimension n. u(k) es un escalar, y y(k) es tambien un escalar, Se supone que la planta es de estado cornpletamente controlable y completamentc observable. Las ecuaciones de la planta se pueden rescribir como
Xa(k + = [Gao Gab ][Xa(k)] + [Ha ]U(k) [ xb(k + 1) Gba Gbb xb(k) n, y(k) = [1 OJ[Xa(k)] xb(k)
1)]
donde y(k) = ,\,(k) es la variable de estado medible y xh(k) esta formado por las variables de estado no medibles. La ecuacion para cl regulador observador (controlador) se pueden obtener de las ecuacioncs (6-148). (6-149) Y (6-159). reescritas
(7-16)
= -Ki(k)
dondc K es la matriz de ganancia de la realimentacion del estado y K,. es la matriz de ganancia del observador. Se define
donde x(k) es un vector de dimension n Y xh(k) es un vector de dimension (n - I) que consiste de las
(n - I) variables de estado observadas. Tambien sc define
544
Capitulo 7
Muestre que las ecuaciones del regulador (0 controlador) pueden estar dadas por:
Q = H, - KeHa
F(z)
=
IzI- G bb + K, Gabl = ecuaci6n caracteristica para el observador de orden minima (polinomio estable de grado n - 1)
zil(z)
PY(z) + QU(z)
(7-20) 7-20)
Ya que
-1
U(z)
Ylz)
Plant
a(z) F(z)
~(z)
F(z)
Figura 7-15
Capitulo 7
Problemas de ejernplo
y soluciones
545
i](z)
;g?
[PY(z) + QU(z)]
(7-21 )
u(k)
(7-22)
(7-23)
AI utilizar a(.:;) y (3(.:;) definidos en el enuneiado del problema, la ecuaci6n (7-23) se puede escribir como:
(7-24) de donde
Se
obtiene
o bien
_ U(z) Y(z)
f3(z) a(z)
(7-25)
[Observe que F(.:;) es un polinomio estable. Por 10 tanto. las dos F(.:;) se pueden cancelar.] La ecuacion (7-25) cs la ccuacion del rcgulador (controlador). EI diagrama de bloques que rcprcsenta ala ecuacion (7-24) se vuelve el de la figura 7-15. (Este corresponde a un sistema regulador.) Si este diagrarna de bloques se incorpora al sistema de control, se obtiene el diagrama de bloques de la figura 7-5. Problema A-7-4 En referencia al sistema de ejernplo discutido en la secci6n 7-3 (el sistema de regulaci6n discnado en cl ejemplo 7-6) y al problema A-7-3. verifique que
a(z) f3(z)
Solucion
k bW(z)Q + F(z)
z + 0.32 - 0.6667)
= Gx(k) + Hu(k)
y(k) = Cx(k)
546
donde
Capitulo 7
H
De donde.
[1 0]
Gs; = 1,
H;
Gab = 0.2,
H;
Gs: = 0,
= 0.02,
= 0.2
= Z2 -
IzI - G + HKI
1.2z + 0.52
La ganancia de realimentacion del estado K para la ecuaci6n caracteristica deseada se obtuvo como
K
Por 10 tanto.
[8 3.2]
Para la parte del observador de orden minima, la ecuaci6n caracteristica del observador fue
cP(z) = z = 0
La ganancia del observador K, se obtuvo como
K,
5
~,Gaa
= (1 - 5 x 0.2) x 5 + 0 - 5 x 1 = -5
Q = H; - K,H a = 0.2 - 5 x 0.02 = 0.1
F(z)
=
z
X
0.2)-1
=1
a(z)
k; W(z)Q + F(z)
3.2 x 1 x 0.1 + z
= z + 0.32
f3(z)
=
(k 1 + kbK,)F(z) + k; W(z)P
U(z) = X(z) 1
Capitulo 7
547
YlZ)
Rlz)
F(z) B(z)
a(z)A(z)
P(z) F(z)
t - - - -.....
Figura 7-16
R(z)
y(z)
P(z) F(z)
Figura 7-17
Problema A-7-6
1
Z2
U(z) -
+ Z + 0.16
Utilizando el enfoque de ecuaciones polinomiales, disene un sistema de control para esta planta basado en el diagrama de bloques mostrado en la figura 7-5. Suponga que la ecuaci6n caracteristica deseada es H(z) = (z - 0.6 - jOA)(z - 0.6
= Z2 - 1.2z
+ JOA)
+ 0.52
+ Z + 0.16
1.2z 2
B(z) = 1 D(z) =
Z3 -
+ 0.52z
548
Capitulo 7
E"
[T I
0 0
a(z) = aoz
6 o 1 1 o 0 o 0
01
-1 1 0 1 1 0 -0.16 0.16 [ o 1 -1 0.84 Observe que a(z) y (3(z) son polinomios de grado n - 1 = 2 -I = I, 0 bien,
E- I
= 0 0
al
D=
[~:1 [~'~21'
dl
1.2
M =
do
[:1
{31 (3o
E- 1 D como sigue:
= E- D =
[-~::521
2.56
I
a(z)
=
=
z - 2.2
(3(z)
2.56z + 0.352
En referencia a la ccuacion (7-12), el sistema disenado tiene la funci6n de transferencia pulso Y(z)/Ri: siguiente:
1 1.2z + 0.52
A continuaci6n se necesita determinar la ganancia Ko de la Figura 7-5. Se rcquicre que la salida er estado estable y(x) a una entrada escal6n unitario sea uno, 0
k_~
K z -- = 1 1.2z + 0.52 z - 1
de donde se obtiene
K o = 0.32
Por 10 tanto, la funcion de transferencia pulso del sistema diseriado es:
Y(z) R(z) =
Z2 -
Un diagrama de bloques para el sistema disenado se presenta en la figura 7-18. La respuesta al escalor unitario del sistema disenado se muestra en la figura 7-19.
Capitula 7
549
R(z)
U(z)
Z2
Ylz)
+ z 0.16
z-2.2
2.56z + 0.352
Figura 7-18
1.6 ,-----,----,----.,..----..,---,---...,-----r------,
1.4
1.2
o
-OH ..
e:
0
o
Q~~~~'o~oo.QOO'OO-oo'~o.oooOOO,OQ00-00-0
>:.
0.8
0
0.6 0.4
0
0.2
Problema A-7-7
En el problema A-6-17 se consider6 el diseno de un sistema regulador donde la planta estaba definida por
(7-26) (7-27)
dondc G = [
~ -0.5
o ], 1 -0.2 1.1
C = [0 1 0]
550
Capitulo 7
Se utiliz6 el enfoque de ubicaci6n de polos para determinar la matriz de ganancia K de realimentaci6n del estado tal que el sistema de regulaci6n presente una respuesta del tipo de oscilaciones muertas para cualquier estado inicial. Se us6 un observador de orden minimo tal que la respuesta al error de observacion fuera del tipo de oscilaciones muertas. Con el enfoque de ecuaciones polinomiales. disene un sistema de control equivalente para esta planta cuya configuraci6n del diagrama de bloques sea la misma que la que se presenta en la figura 7-4. Obtenga la respuesta al escal6n unitario y a la rampa unitaria del sistema disenado. EI periodo de muestreo T del sistema es de 0.2 segundos.
Soluci6n
[zl - G + HKI
Se define a
= Z3 = 0
Z3
H(z)
F(z)
A
= Z2
continuaci6n se define la funcion de transferencia pulso G,(::) de la planta Gp(z) = C(zI - G)-1 H
=
[0
O][~
-1
z
0.2
0.5
-~.1
]-1[0]
~
= [0
OJ " _ 11,'
0.2, + 05 [ ;,]
B(z) A(z)
donde
= Z3
A(z) B(z)
En consecuencia
Z3 -
z a2
=
al = -1.1,
0.2,
b.,
= 0,
En referencia a la figura 7-4, el diagrama de bloques para el presente sistema se puede dibujar como se muestra en la figura 7-20. EI polinomio caracterfstico para el sistema completo (sistema con realimentacion del estado observado j es
D(z) = H(z)F(z) =
Por 10 tanto.
Z3 . Z2
ZS
do = 1,
d, = 0,
d;
0,
d, = 0
Capitulo 7
551
{3(z)B(z)
=0
o bien
a(z )(Z3 - 1.1z 2
+ 0.5) +
{3(z)z
= Z5
Para determinar la funci6n de transferencia pulso 13(::)ia(::) del controlador. se resuelve esta ecuaci6n Diofantina. Para el presente problema n = 3 y la matriz de Sylvester E de Ln > 2n es de 6 . 6 como sigue:
E=
1 0 0 0 1 0 0 0 1
0 1.0000 0 0 0 0
0 0 1.0000 0 0 0
0 0 0 1.0000 0 0
0 0 0 1.0000 0 0
0 0 0 0.0000 1.0000 0
0 0 0 0 0 1.0000
ds d.
D
d2
d,
d, do
o o o o o
1
552
R(z)
Capitulo 7
VIz)
8(z)
A(z)
Z3 _
Y(z)
~(z)
u(z)
Figura 7-20
D = [0;0;0;0;0;1];
M
(inv(E))*D
M=
o
1.1000
O'IZ
0'2
Z2
+ LIz
-
+ 131 Z +
(32
= 1.01z 2
O.72z - 0.55
f3(z)
O'(z)
1.01z 2
O.72z - 0.55
Z2
+ LIz
Observe que esta funcion de transferencia pulso es la misma que la de la ccuacion (6-283). la funci6n de transfcrcncia pulso del controlador observador obtenido en el problema A-6-17. En refercncia ala figura 7-20, la funci6n de transferencia pulso en lazo ccrrado es:
Y(z)
R(z)
Capitulo 7
553
Observe que la cancelacion de ::2 ocurre entre a(::)f3(z) y 1!(::)F(z) y el sistema es de tercer orden. [EI sistema podria haber sido de orden (2n - I) (0 de quinto orden) si no hubicra cancelacion.] Para dctcrrninar la ganancia K'h se impone la condicion de que la salida en estado estable y(x) a la entrada escalon unitario sea igual a uno, es decir,
k~oo
. hmy(k)
= lim-Z
z~l
z-1Ko(z+1.1) z 3 --1 Z Z-
= 2.1Ko = 1
Por 10 tanto.
K;
0.4762
0.4762z
+ 0.5238
Z3
EI sistema es de tercer orden. La respuesta del sistema disenado al escalon unitario se muestra en la figura 7-21. Observe que en la respuesta al escalon unitario la salida alcanza la unidad en tres periodos de muestreo. La respuesta del sistema disenado a la rampa unitaria se presenta en la figura 7-22. El error al seguir la entrada rampa unitaria se puede ealcular como sigue:
E(z)
= R(z)
- Y(z)
[1 -~~;nR(Z)
R z)
= (1 - 0.4762z
z~ 0.5238 )R(Z)
(
(z - 1)(Z2 + Z + 0.5238)
Z3
1.4
1.2
0.8
0.6
c .. ....
o
0.4
0.2
10
15
20
25
30
35
40
k
Figura 7-21 Respucsta al escalon unitario del sistema diseiiado en cl problema A-7-7.
554
Capitulo 7
Figura 7-22
Tz- 1
R(z)
= (1
_ z
1/
0.2z (z - 1/
Z 3
En consecuencia,
k~x
lirn e
(k)
- 1)(z2 +
Z
+ 0.5238)
0.2z 2 (z - 1)
Por 10 tanto, el error al seguir la entrada rampa unitaria es 0.5048, como se puede observar en la figura 7-22.
Problema A-7-8
En referencia al problema A-7-7, considere la misma planta dada por las ecuaciones (7-26) y (7-27). (Tarnbien refierase al problema A-6-17.) Suponga que los polinomios H(z) y F(z) son los mismos que los utilizados en el problema A-7-7. AI emplear el enfoque polinomial, disefie un sistema de control para la planta cuyo diagrama de bloques sea el mismo que el de la figura 7-5. Entonces obtenga la respuesta al escalon unitario y a la rampa unitaria del sistema disefiado. EI periodo de muestreo T del sistema es 0.2 segundos. Solucion Para este problema
H(z)
G z
= Z3,
F(z)
= Z2
_ p( ) -
Z3 -
Capitulo 7
555
EI diagrama de bloques para el presente sistema se muestra en la figura 7-23. La ecuacion Diofantina para este problema es a(z)A(z) o bien a(z )(Z3 - l.1z 2
Esta ecuacion Diofantina se resolvio en el problema A-7-7 y el resultado fue a(z) (3(z)
- 0.55
Por 10 tanto, en referencia a la ecuacion (7-12), la funcion de transferencia pulso Y(z)/R(z) esta dada por
=7=7
Koz
s;
Para determinar la ganancia K o, se impone la condicion de que la salida en estado estable y(x) a la entrada escalon unitario sea igual a uno, es decir,
k_~
1 y (k) im
Ko z = li m -1-Z- r - - = K 0 = 1 I z z-e-I Z Z - 1
En consecuencia,
Ko = 1
Por 10 tanto, Y(z)/R(z) es
EI sistema disefiado es de segundo orden. La respuesta al escalon unitario del sistema disefiado se muestra en la figura 7-24. Observe que en la respuesta al escalon unitario la salida alcanza la unidad en dos period os de muestreo.
Rlz)
U(z)
Y(z)
P(z)
Figura 7-23
556
Capitulo 7
1.6 , - - - - , - - - - r - - - , - - - - - , - - - , - - - - - - , - - - - , - - - ,
1.4
1.2
>.
10
15
20
25
30
35
40
Figura 7-24
La respuesta a la rampa unitaria se presenta en la figura 7-25. EI error al seguir a la entrada rampa unitaria se puede ealcular como sigue: E(z)
R(z) - Y(z)
[1 - ~~;nR(Z)
l~~Z
0.2z
=
La entrada rampa unitaria R(z) es
(1 - ?)R(Z) = (z -
1) R(z)
(z - 1)2
En consecucncia,
li
k-~
1m
e (k)
I'
1m--
z-1
z - 1 (z - l)(z + 1) 0.2z 2 2 z Z (z - 1)
0.4
Por 10 tanto, el error al seguir a la rampa unitaria es 0.4, como se puede observar en la figura 7-25. Al comparar los sistemas disenados en los problemas A-7-7 y A-7-8, el ultimo sistema que utiliza la configuraci6n del diagrama de bloques de la figura 7-5 presenta un dcsernpeno superior.
Problema A-7-9
Considere una planta definida por
G( )
z + 0.5
= Z3 _ Z2
+ O.Olz + 0.12
Capitulo 7
557
4 r - - - - - - r - - - - - - , - - - - - - - - , - - - - - - ;/,
/ / / / /
,'" .0
3.5 f3 f.
.
/ /
/
"
/
/
2.5 f2 f.
.
/ /
/ /
/
.0
1.5
;.
o
-: e
0.5
o'
o ,.:'_<>_-<>'--: ----'----------'-------"'--------J /-
10
15
20
k
Figura 7-25 Respucsta a la tampa unitaria del sistema disenado en el problema A-7-8.
EI periodo de muestreo T es de un segundo. Suponga que en el prescntc problema es importante tener error de scguirnicnto cero a una entrada rampa unitaria. Se quierc discnar un controlador tal que el sistema de control tenga un comportarniento como cl del sistema modclo cuya funcion de transferencia es 0.64.:-- 0.512 Gmodclo
= (.:-'
-1.2.:-+0.52)(.:--0.6) (7-28)
(EI periodo de muestreo para este sistema tambien es un segundo.) Las rcspucstas al escalon unitario y a la rampa unitaria del sistema modelo Gmodclo se prescntan en la figura 7-26 y 7-27. rcspectivamcntc. (EI error en estado estacionario al seguir una rampa unitaria cs cero. y el sobrepaso maximo en la respuesta al escalon unitario es de alrededor de 70%.)
Soluci6n
Se va a suponer que el diagrama de bloques del sistema es el mismo que el de la figura 7-9. Para la planta dada.
A(z) ==
Z3 -
Z2
+ O.01z + 0.12
B(z)
Por 10 tanto.
==
z + 0.5
a,
bo
==
==
0.01,
as == 0.12
0,
558
Capitulo 7
2..------,---.------..---..-----,.----,----,----,
1.8 ~ ............................................. 1.6 1.4
o
1.2
0.8
o
0.4 0.2
L . - _ - L_ _-'--_ _
30
35
40
Respuesta al escal6n unitario del sistema modelo G m""" ,, dado por la ecuaci6n (7-28).
20 18 16 14 12
~
>..
10
8 6 4 2 0
10
15
20
k
Figura 7-27 Respuesta a la rampa unitaria del sistema modelo Gm"Jd" dado por la ecuaci6n (7-28)
Capitulo 7
559
Es claro que no hay factores comunes entre A(=) y B(=). En este problema se puede seleccionar HJ(z) como
HI(z) =
Z2 -
1.2z + 0.52
Aqui se selecciona H J(=) para cancelar una parte del denominador de G modcJo ' [Pero esto no es necesario. EI requisito sobre H (=) es que debe ser un polinomio estable de grado n -1 (en este problema n = 3). Existe una infinidad de selecciones posibles para H (=).) Se define
J J
H(z)
= B(z)HI(z)
=
= Z3 - 0.7z2 - 0.08z
+ 0.26
F(z)
= Z2
[F(z) debe ser un polinomio estable de grado n - I. En este caso, existe un sinnumero de opciones.) Entonces D(z) es como sigue:
D(z)
= F(z)H(z) = F(z)B(z)HI(z)
= ZS - 0.7z' - 0.08z3 + 0.26z2
Por 10 tanto.
do
1,
d, = -0.7,
d 2 = -0.08,
d, = 0.26,
d. = 0,
ds = 0
a(z)(z3 -
Z2
La matriz Sylvester de E de 6
E=
a3 a2 al
1 0 0
a3 0 a2 a3 at a2 1 al
b3 0 b2 b3 b l b2 bo b l 0 bo
0 0
0 0
b3 b2
bl
bo
0 0 0.12 0.01 -1 1 0.5 1 0 0 0 0 0 0 0.5 0 1 0.5 0 1 0 0 0 0
0.12 0.01 -1 1 0 0
0 0.12 0.01 -1 1 0
560
Capitulo 7
E=
0.5000 1.0000 0 0 0 0
0 0.5000 1.0000 0 0 0
0 0 0.5000 1.0000 0 0
D=
M=
/32
{31 {3o
o=
M=
[0;0;0.26;-0.08;-0.7;1];
M = (inv(E))*D
alZ
Capitulo 7
561
Y(z) V(z)
Como I'(::)/R(::) es
F(z)B(z)
1
-
= F(z)B(z)H1(z) = H 1(z) = Z2
=G
modclo
1 1.2z + 0,52
V(::) R(::)
f! ~)= (0.64::-0.512)(z'-1.2z+0.52)
,(-
(::'-1.2::+0.52)(z-0.6)
- 1.2.: + 0.52
EI sistema de control mediante la igualaci6n a un modelo disenado tiene el diagrama de bloque que se presenta en la figura 7-28a). Este diagrama de bloques se puede simplificar como se muestran en las figuras 7-28b) y c).
R(z)
V(z)
U(z)
z+ 0.5
Z3_
Ylz)
z2 + 0.01 z + 0.12
L
fflz)
(Z2 -
Z2 + 0.3z- 0.1 Z2
~
(a)
Z2 - 1.2z+ 0.52
t--
f----
r--
V(z)
1 z2 - 1.2z + 0.52
Ylz)
(b)
R(z)
(Z2 -
Ylz)
(e)
Figura 7-28 a) Diagramade bloques del sistemade control mediantela igualaci6n a un modelodisenado; b) y c) diagramasde bloqucssimplificados.
562
Capitulo 7
Como se establecio antes, Gmodclo Hj(z) debe ser fisicamente realizable. EI grado del polinomio numerador de Gmodclo H1(z) debe ser igual 0 menor que el grado del polinomio denominador de G modclo Hj(z). Esto significa que para
U(z) A(z) polinomio en z de grado n donde A(z) y B(z) no tienen factores en cornun, y
--=--=
B", (z)
Y(z)
B(z)
polinomio en z de grado m
G
modele
=--=-'--------=---A", (z)
polinomio en z de grado n'
se debe tener
n' - m'<> n - m
Si esta condicion no se curnple, 10 mejor es modificar Gmodclo para que esta condici6n se cumpla y se pueda aplicar el presente enfoque.
PROBLEMAS
Problema B-7-1
Considere los polinomios A(z) y B(z) definidos por
A(z) =
ZZ
= ZZ - (AI
+ Az)z + AIA z
E = [::
o
lEI
Problema B-7-2
Considere la ecuacion Diofantina siguiente:
al 0 1 0
~z t: ~z]
b, 0
= b\A I - A3)(Az - A3 )
a(z)A(z) + (3(z)B(z)
donde
=1
A(z) = B(z)
ZZ -
0.7z + 0.1
= ZZ
+ 0.2z - 0.24
Capitulo 7
Problemas
563
Problema 8-7-3
Considere la planta Y(z)lU(z), donde
Y(z) U(z) B(z) A(z)
Suponga que A(z) es un polinomio m6nico en z de grado n y que B(z) es un polinomio en z de grado m. Suponga tambien que no hay facto res comunes entre A(z) y B(2); esto es, la planta es de estado completamente controlable y completamente observable. Considere la siguiente ecuaci6n Diofantina:
y(z)A(z)
+ l3(z)B(z)
= F(z)[H(z) - A(z)]
don de H(z) es el polinomio caracteristico deseado para la parte de ubicaci6n de polos y que F(z) es el polinomio caracteristico deseado para el observador de orden minimo. [H(z) es un polinomio m6nico de grado m y F(z) es un polinomio de grado (n - 1).] Muestre que esta ecuaci6n Diofantina se resuelve para f3(z) y y(z), entonces al utilizar
U(z)
=-
Problema 8-7-4
En el ejemplo 7-3 se diseno un sistema de control tal que la ecuaci6n caracteristica para la parte de ubicaci6n de polos era
H(z) = (z - 0.6 - jO.4)(z - 0.6
+ jO.4)
z
= Z2 - 1.2z
+ 0.52
La ecuaci6n Diofantina dada por la ecuaci6n (7-13) se resolvi6 y o:(z)y f3(z) se determinaron como sigue: o:(z) = z
l3(z)
+ 0.32
- 16
= 24z
La con stante K o se determin6 como 8. La figura 7-6a) muestra el sistema disefiado, Muestre que la sefial de control u(k) puede estar dada por
+ 16y(k - 1) + 8r(k),
k=1,2,3, ...
-24y(0)
+ 8r(0)
Dibuje una grafica de u(k) contra k cuando la entrada r(k) es una secuencia de escal6n unitario.
Problema 8-7-5
Considere una planta definida por
x(k
+ 1)
y(k)
= =
Gx(k) Cx(k)
+ Hu(k)
donde
0
G
0 [ -0.16
1, 0.84 0
1 0]
[1 0 0]
564
Capitula 7
Y(z) U(z)
B(z) A(z)
Determine los polinomios A(z) y 8(z). Al emplear el enfoque de ecuaciones polinorniales, disefie un sistema de control para la planta. Se desea que el diagrama de bloques del sistema disefiado sea el mismo que el de la figura 7-4. Al resolver la ecuaci6n Diofantina
a(z)A(z) + f3(z)B(z)
F(z)H(z)
F(z)
= Z2
Obtenga la respuesta al escal6n unitario y a la rampa unitaria del sistema de control disefiado. EI periodo de muestreo T es de 1 segundo.
Problema B-7-6
Considere la misma planta que la del problema 8-7-5. Al emplear el enfoque de ecuaciones polinomiales. disefie un sistema de control para la planta. Utilice el diagrama de bloques de la figura 7-5. Suponga los siguientes H(z) y F(z):
F(z)
= Z2
Obtenga la respuesta al escal6n unitario y a la rampa unitariadel sistema de control disefiado. Suponga que el periodo de muestreo es I segundo.
Problema B-7-7
Considere la planta definida por
x(k + 1) y(k)
donde
= =
~ [r ~ -~:5 J H ~
H(z) =
m~
c
Z3
[1
0 0]
Disefie un sistema de control para la planta. Para la parte de ubicaci6n de polos, se desea tener tres polos de lazo cerrado en el origen, es decir,
y para la ecuaci6n caracteristica del observador de orden minimo, se desea tener F(z)
= Z2
Problema B-7-8
Considere la planta definida por
Y(z) U(z)
Capitula 7
Problemas
565
AI usar cl enfoquc de ecuaciones polinorniales, para disefiar un sistema de control tal que el sistema se cornporte como el modelo Gmooclo siguiente:
Obtenga la respuesta al escalon unitario y ala rampa unitaria del sistema disenado (que es el mismo que el modelo Gmooclo ) ' El periodo de rnuestreo T es I segundo. Problema 8-7-9 Considere la planta definida por
Y(z)
U(z)
Al utilizar el enfoque de ecuaciones polinomiales, discfte un sistema de control tal que el sistema se comporte como el modele G"'OOclo siguientc: 0.32 G mooclo = :::' _ 1.2z + 0.52 Obtenga la rcspuesta al escalon unitario y a la rampa unitaria del sistema de control (que es el mismo que el modele Gmooclo ' EI periodo de rnuestreo T es 0.2 segundos.
B
Sistemas de control 6ptimo cuadratico
8-1 INTRODUCCION
Los problemas de control optimo son de gran interes para los ingenieros de control. Un sistema ce control optimo -un sistema cuyo disefio "optima" (minimiza 0 rnaxirniza, segun sea el caso I e. valor de una funcion seleccionada como el indice de desempeiio-i- difiere de uno ideal en que el primero es mas alcanzable en presencia de restricciones fisicas, mientras que el ultimo bien puede ser un objetivo inalcanzable.
indices de desempeiio. Al disefiar un sistema de control optimo 0 un sistema regulador ortirno, se necesita encontrar una regia para determinar la decision de control presente, sujeta a ciertas restricciones, para minimizar alguna medida de la desviacion de un comportamiento ideal. Dichz medida es provista, general mente, por el indice de desempeno seleccionado que es una funcion cuy( valor se considera una indicacion de que tanto se parece el desempeno del sistema real al desempenc deseado. En la mayoria de los casos, el comportarniento del sistema se hace optirno al escoger e vector de control u(k) de tal forma que el indice de desempefio se minimice (0 maxirnice, dependiendo de la naturaleza del Indice de desernpefio seleccionado). La seleccion de un indice de desernpefx apropiado es importante porque, en alto grado, determina la naturaleza del sistema de control optimc resultante, Esto es, que el sistema resultante sea lineal, no lineal, estacionario, 0 variante en el tiernpo, dependera de la forma del indice de desempefio. Por 10 tanto, el ingeniero de control formula este indice en base a los requisitos que el sistema debe cumplir y 10 tom a en cuenta para determinar :.: naturaleza del sistema resultante. Los requisitos de disefio por 10 regular no solo incluyen especificaciones de desernpcfio, sino tambien, para asegurar que sea fisicamente realizable, restringen la forma del control a utilizar.
566
567
El proceso de optirnacion no solo debe proveer leyes de control optirno y configuraciones de los parametros, sino tambien debe predecir la degradacion en el desempefio debido a cualquier desvia del valor minimo (0 maximo) de la funcion del indice de desempefio que resulta cuando se aplican leyes de control no optirnas. El escoger el indice de desempefio mas apropiado para un problema dado es muy diflcil, especialmente en sistemas complejos. EI uso de la teoria de optimacion en el disefio de sistemas ha sido problernatico debido al conflicto entre la factibilidad analitica y la utilidad practica al seleccionar el Indice de desempefio. Es preferible que el criterio para un control optirno se origine desde un punto de vista practice y no maternatico. En general, sin embargo, la seleccion de un indice de desempefio implica un compromiso entre una evaluacion util del desempefio del sistema y un problema matematico,
Formulacion de los problemas de optimizacion. EI problema de optimizacion de un sistema de control se puede formular si se tiene la siguiente informacion:
1. Ecuaciones del sistema
2. Clase de vectores de control permitidos
3. Restricciones en el problema
4. Indice de desernpefto 5. Parametros del sistema La solucion de un problema de control optimo consiste en determinar el vector de control optimo
u(k) dentro de la clase de vectores de control permitidos. Este vector u(k) depende de
salida inicial
0
4. EI estado deseado
salida deseada
Excepto en algunos casos, el problema de control optimo puede ser muy complicado para obtener una solucion analitica por 10 que se tiene que obtener una solucion por computadora.
Cuestiones concernientes a la existencia de las soluciones a los problemas de control optima. Se ha establecido que el problema de control optimo, dada una condicion inicial xeD),
consiste en encontrar un vector de control permitido u(k) que transfiera al estado a la region deseada del espacio de estados y para el cual el indice de desempefio se minimiza. Es importante sefialar que a veces una combinacion particular de planta, estado deseado, indice de desempefio y restricciones, hacen que un control optimo sea imposible. Esto es cuestion de requerir un desempefio mas alia de las capacidades fisicas del sistema. Las cuestiones que tienen que ver con la existencia de un vector de control optimo son importantes, ya que sirven para informar al disefiador si un control optimo es posible 0 no para un sistema determinado y dado un conjunto de restricciones. Dos de las cuestiones mas importantes son aquelias acerca de la controlabilidad y observabilidad, que fueron presentadas en el capitulo 6.
568
Capitulo 8
Comentarios acerca de los sistemas de controt optimo. EI sistema cuyo disefio minimiza (0 maximiza) el indice de desempefio seleccionado es, por definicion, optimo. Es evidente que el indice de desempefio, en realidad, determina la configuracion del sistema. Es muy importante apuntar que un sistema de control que es optimo bajo un indice de desernpeno es, en general, no optirno bajo otro indice de desernpefio. Adernas, la realizacion en hardware de una ley de control optimo en particular puede ser algo dificil y costosa. Asi, puede ser inutil dedicar demasiados recursos para implantar un controlador optirno que es el mejor en solamente algun senti do individual limitado. A rnenudo, un sistema de control se disefta para realizar una sola tarea que se especifica completamente de antemano. En vez de esto, se disefia para realizar una tarea seleccionada en forma aleatoria a partir de un repertorio de tare as posibles, Entonces, en los sistemas practices, puede ser mejor buscar una ley de control optimo aproximada que no este atada rigidamente a un solo indice de desernpefio. Estrictamente hablando, se debe tratar que un sistema de control optirno obtenido en forma matematica de, en la mayoria de los casos, el desernpefio mas alto posible bajo el indice de desernpefio dado y es mas una herramienta de medicion que un objetivo practico. Adernas, antes de decidir si se construye un sistema de control optimo 0 algo inferior mas simple, se debe evaluar con cu;"::::rl",,: grado en el que el desempefio del sistema de control optimo complejo excede al del suboptimo simple. Solo si se puede justificar, no se debe construir un sistema de control optirno extremadamente complicado y costoso. Una vez que el grado de desernpefio maximo se encuentra mediante el uso de la teo ria de control optimo, se debe hacer un esfuerzo para disefiar un sistema simple que se acerque al optimo Con esto en mente, se construye un sistema fisico prototipo, se prueba, y se modifica hasta que 50e obtiene un sistema satisfactorio que tenga caracteristicas de desernpefio cercanas a las del sistema de control optimo que se ha trabajado en teoria. Los problemas de control optimo que se pueden resolver en forma analitica, dan una buena vision de las estructuras y algoritmos optimos que se pueden aplicar a casos practices. Un ejernplo de un problema de control optimo con solucion analitica es el problema de control optimo de sistemas lineales basados en indices de desempefio cuadratico. Los indices de desempefto cuadratico har sido muy utilizados en sistemas de control practice como una medida del desernpefio del sistema
Gx(k) + Hu(k)
u(k) G H
=
=
En el problema de control optimo cuadratico se de sea determinar una ley para el vector de centro u(k) tal que un indice de desempefio cuadratico se minimice. Un ejemplo de un Indice de desempefio cuadratico es
J =
1 N-]
u*(k)Ru(k)]
569
donde las matrices S y Q son matrices Hermiticas definidas positivas 0 semidefinidas positivas y R es una matriz Hermitica definida positiva. EI primer termino dellado derecho de esta ultima ecuacion toma en cuenta la importancia del estado final. EI primer termino dentro de los corchetes de la sumatoria toma en cuenta la importancia relativa del error durante el proceso de control, y el segundo terrnino toma en cuenta el gasto de energia de la sefial de control. Se supone que el vector de control u(k) no esta restringido. En la seccion 8-2 se demostrara que la ley de control optimo esta dada por:
u(k)
-K(k)x(k)
donde K(k) es una matriz de r x n variante en el tiempo. Si N = , entonces K(k) es una matriz constante de r x n. El disefio de sistemas de control basado en dichos indices de desempefio cuadratico depende de obtener la matriz K(k). La caracteristica principal de una ley de control optimo basada en un indice de desempefio cuadratico es que es una funcion lineal del vector de estados x(k). Dicha realimentacion del estado requiere que todos los estados esten disponibles para realimentacion, Por 10tanto es ventajoso representar al sistema en terminos de las variables de estado medibles. Si no todas las variables de estado se pueden medir, se requiere estimar u observar las variables de estado no medibles. Entonces se utilizan las variables de estado estimadas u observadas para generar las sefiales de control optirno, La ventaja de utilizar el esquema de control optimo cuadratico es que el sistema disefiado sera asintoticamente estable, excepto para algunos casos muy especiales. (Vease los problemas A-8-6 y A-8-7.) Existen diferentes enfoques para resolver los problemas de control optimo cuadratico. En este capitulo se presenta un enfoque utilizado en general basado en la tecnica de minimizacion empleando multiplicadores de Lagrange. Para el problema de control optimo cuadratico en estado estacionario, se presenta el enfoque de Liapunov. En la seccion 8-3 se mostrara que existe una relacion entre las funciones de Liapunov y los indices de desempefio cuadratico. Observe que cuando un sistema de control optimo se disefia en el espacio de estados es importante verificar las caracteristicas de respuesta en frecuencia. Algunas veces, se necesita una compensac ion especifica para efectos de ruido. Entonces llega a ser necesario modificar la configuracion optima y aceptar una configuracion sub6ptima, 0 puede llegar a ser necesario modificar el indice de desempefio.
Resumen del capitulo. La seccion 8-1 presento material introductorio. La seccion 8-2 trata el problema de control optimo cuadratico basico y su solucion. La seccion 8-3 se ocupa del problema de control optimo cuadratico en estado estacionario. Aqui se incluye el enfoque de Liapunov para resolver el problema de control optimo cuadratico, La seccion 8-4 discute el control optimo cuadratico de un sistema de seguimiento.
Los problemas de control optimo cuadratico se pueden resolver mediante muchos enfoques diferentes. En esta secci6n se resolvera el problema de control optimo cuadratico basico mediante el metodo convencional de minimizaci6n empleando los multiplicadores de Lagrange.
570
Capitulo 8
Problema de control optimo cuadrdtico. EI problema de control optimo cuadratico se puede enunciar como sigue. Dado un sistema de control lineal de tiempo discreto
x(k + 1)
=
Gx(k) + Hu(k),
x(O) = c
(8-1)
x(k)
u(k)
= = = =
G H
encuentre la secuencia de control optima u(O), u(1), u(2), ... , u(N ~ I) que minimiza un indice de desempefio cuadratico. Un ejemplo de indice de desempefio cuadratico para un proceso de tiempo finito (0 s k ::;; N) es
J =
donde
1 N-]
(8-2)
Q
R
matriz Hermitica (0 matriz real simetrica) definida positiva 0 semidefinida positiva de n x n matriz Hermitica (0 matriz real sirnetrica) definida positiva de r x r matriz Hermitica (0 matriz real sirnetrica) definida positiva 0 semidefinida positiva de n x n
Las matrices Q, R Y S se seleccionan para valorar la importancia relativa de la contribucion en el desempefio debida al vector de estado x(k) (k = 0, 1, 2, ... , N - 1), al vector de control u(k) (k = 0, I, 2, ... , N - 1), Y al estado final x(N), respectivamente. El estado inicial del sistema esta en un valor arbitrario x(O) = c. EI estado final x(N) puede ser fijo, en cuyo caso el termino +x*(N)Sx(N) se elimina del indice de desempefio de la ecuacion (8-2) y en su lugar se impone la condicion terminal x(N) = Xj' don de x j es el estado terminal fijo. Si el estado terminal x(N) no es fijo, entonces el primer termino en la ecuacion (8-2) representa el peso de la contribucion en el desempefio debida al estado final. Observe que en el problema de minimizacion, la inclusion del termino +x*(N)Sx(N) en el Indice de desempefio J implica que se desea que el estado final x(N) este tan cerca del origen como sea posible.
Soluclon mediante el metoda convencional empleando multiplicadores de Lagrange. EI problema de control optimo cuadratico es un problema de minimizacion que involucra una funci6n de varias variables. Por 10 tanto, se puede resolver por el metodo de minimizaci6n convencional. El problema de minimizacion sujeto a restricciones se puede resolver al afiadir dichas restricciones a la funci6n a minimizar mediante el uso de los multiplicadores de Lagrange. En el problema de minimizaci6n presente, se minimiza J que esta dado por la ecuacion (8-2). repetida como:
J =
2x*(N)Sx(N)
1 n-:
(8-3 )
571
+ 1) = Gx(k) + Hu(k)
x(O) = c
(8-4)
donde k = 0, I, 2, ... , N - I, Ydonde la condici6n inicial del vector de estado se especifica como
(8-5)
Ahora, al emplear un conjuntode multiplicadores de Lagrange A(I), A(2), ... , A(N),se define un nuevo indice de desempefio L como:
L
1 N-l
u*(k)Ru(k)]
La raz6n para escribir los terrninos que involucran el multiplicador de Lagrange en la forma en que se muestra en la ecuaci6n (8-6) es para asegurar que L = L *. (L es una cantidad escalar real.) Observe que
aL
ax;(k)
= 0,
= 1,2, ...
,n; k
= 1,2, ... ,N
aL
au;(k) = 0,
aL
aA;(k)
= 0,
= 1,2, ...
,n; k
= 1,2, ... ,N
Estas ecuaciones son condiciones necesarias para que L tenga un minimo. Observe que las expresiones simplificadas para las derivadas parciales anteriores son
aL
ax(k)
= 0, = 0, = 0,
k=I,2, ... ,N
k
(8-7)
aL
au(k)
= O,I, ... ,N
- 1
(8-8)
(8-9)
aL
a>:(k)
= 1,2, ... ,N
572
Capitulo 8
En referencia al Apendice A (veanse los problemas A-7 y A-8) para la diferenciacion parcial de formas cuadraticas complejas y bilineales con respecto a variables vectores, se tiene
-x*Ax=Ax
ax
a ----= x*Ay = Ay ax
Qx(k) +
G*~(k
+ 1) -
~(k) =
0,
(8-10) (8-11)
+ 1)
0,
(8-12) (8-13)
La ecuaci6n (8-13) es simplemente, la ecuacion de estados del sistema. La ecuacion (8-11) especifica el valor final del multiplicador de Lagrange. Observe que el multiplicador de Lagrange A.(k)se llama a menudo covector 0 vector adjunto. Ahora se simplificaran las ecuaciones obtenidas. De la ecuacion (8-1 D) se tiene
X(k)
= 1,2,3, ... ,N
- 1
1
(8-14)
con la condicion final }J.N) = Sx(N). Al resolver la ecuacion (8-12) para u(k) y al observar que R- existe, se obtiene
+ 1),
k = 0,1,2, .. . ,N - 1
(8-15)
x(k
+ 1)
Gx(k)
+ Hu(k),
= 0,1,2, .. . ,N -
(8-16)
que es simplemente la ecuacion de estado. Al sustituir la ecuacion (8-15) en la ecuacion (8-16) resulta en
x(k + 1)
= Gx(k)
- HR- 1 H*~(k + 1)
(8-17)
con la condicion inicial xeD) = c. Para obtener la solucion al problema de minimizacion, se necesitan resolver las ecuaciones (8-14) y (8-17) en forma simultanea, Observe que para el sistema de ecuaciones, la ecuacion (8-16), la condicion inicial xeD) esta especificada, mientras que para la ecuaci6n del multiplicador de Lagrange. la ecuacion (8-14), la condicion final A(N) esta especificada. Por 10tanto, el problema se convierte en un problema con dos puntos de valores en la frontera. Si el problema de dos puntos de valores en la frontera se resuelve, entonces el valor optimo para el vector de estado y para el vector de multiplicadores de Lagrange se pueden determinar y el vector de control optimo u(k) se puede obtener en la forma de lazo abierto. Sin embargo, si se emplea la ecuacion de Riccati, el vector de control optimo u(k) se puede obtener en la forma de lazo cerrado 0 realimentado:
573
u(k) = -K(k)x(k)
donde K(k) es la matriz de realimentacion de r x n. A continuacion, se obtendra el vector de control optirno u(k) en la forma de lazo cerrado obteniendo, primero, la ecuacion de Riccati. Al suponer que A.(k) se puede escribir en la forma siguiente:
>"(k) = P(k)x(k)
(8-18)
donde P(k) es una matriz Hermitica de n x n (0 una matriz simetrica real de n x n). Al sustituir la ecuacion (8-18) en la ecuacion (8-14) resulta en
P(k)x(k) = Qx(k)
+ G*P(k + l)x(k + 1)
HR- 1 H*P(k + l)x(k + 1)
(8-19)
x(k
+ 1)
= Gx(k) -
(8-20)
Observe que la ecuacion (8-19) y (8-20) no involucra a A.(k) y, por 10 tanto, se ha eliminado A.(k). EI proceso empleado aquf se llama transformacion de Riccati. Dicha transformacion es de una importancia extrema para resolver el problema de valores en la frontera con dos puntos. De la ecuacion (8-20) se tiene
[I + HR- 1 H*P(k +
1)]x(k
+ 1)
= Gx(k)
(8-21)
Para sistemas de estado completamente controlable, se puede demostrar que P(k + I) es definida positiva 0 semidefinida positiva. Para una matriz P(k + I) al menos semidefinida positiva se tiene
u, + HR-
H*P(k
-=1-
A = matriz de n x n, B = matriz de r x n
(V ease el apendice A.) Asi, la inversa de I + Hr- I H*P(k + I) existe. En consecuencia, la ecuacion (821) se puede escribir como:
x(k
+ 1)
(8-22)
P(k)x(k)
o bien
= Qx(k) +
G*P(k
{P(k) - Q - G*P(k
Esta ultima ecuacion se debe cumplir para toda x(k). Por 10 tanto, se debe tener
P(k) = Q + G*P(k
(8-23)
574
Capitulo 8
A = I, se obtiene
HR- 1 ,
H*P(k + 1)
=
=
La ecuaci6n (8-24) 0 su equivalente [tal como la ecuaci6n (8-23)] se denomina ecuaci6n de Riccati. En referencia a la ecuaci6n (8-11) Y(8-18), al observar que k = N se tiene
peN)
(8-25)
Por 10tanto, las ecuaciones (8-23) y (8-24) se pueden resolver hacia atras desde k = N hasta k = O. Esto es, se pueden obtener peN), peN - I), ... , P(O) al comenzar desde peN), el cual es conocido. En referencia a las ecuaciones (8-14) y (8-18), el vector de control6ptimo u(k), dado por la ecuaci6n (8-15), se escribe como
(8-26)
(8-27)
La ecuaci6n (8-26) proporciona la forma en lazo cerrado, 0 forma realimentada, para el vector de control 6ptimo u(k). Observe que el vector de control 6ptimo es proporcional al vector de estado. Note que el vector de control6ptimo u(k) se puede escribir de varias form as. En referencia a las ecuaciones (8-18) y (8-22), u(k) se puede escribir como
l)x(k + 1)
donde (8-29) Una forma ligeramente diferente del vector de control6ptimo u(k) se puede dar como
575
u(k)
= =
donde
(8-31)
La equivalencia entre las expresiones para el vector de control 6ptimo u(k) que estan dadas por las ecuaciones (8-26), (8-28) Y(8-30), se puede mostrar facilmente: vease el problema A-8-1. Las ecuaciones (8-26), (8-28) Y(8-30) indican c1aramente que la ley de control6ptimo requiere la realimentaci6n del vector de estado a traves de la ganancia variable en el tiempo K(k). La figura 8-1 muestra el esquema de control 6ptimo del sistema regulador basado en el Indice de desempefio cuadratico. Es importante apuntar que la ganancia variante en el tiempo K(k) se puede calcular antes de que el proceso cornience, una vez que la matriz de estados del sistema G, la matriz de control H, Y las matrices de peso Q, R YS esten dadas. En consecuencia, K(k) se puede precalcular fuera de linea y almacenarse para su uso posterior. Observe que el estado inicial x(O) no entra en los calculos para K(k). El vector de control6ptimo u(k) en cada etapa se puede determinar inmediatamente al premultiplicar el vector de estado x(k) por -K(k). Observe que una propicdad de la matriz de ganancia de realimentaci6n K(k) es que casi es con stante, excepto cerca del fin del proceso en k = N. (V ease el ejemplo 8-1 y el problema A-8-3.)
minI
Precalculo de K(k)
x(k)
x(k)
Figura 8-1
576
Capitulo 8
x*(k)P(k)x(k)
HR~l
Por 10 tanto,
x*(k)Qx(k)
(8-32)
u(k)
Por 10 tanto,
u*(k)Ru(k)
= =
[-x*(k + 1)P(k + 1)HR- 1]R[ -R- 1 H*P(k + 1)x(k + 1)] x*(k + 1)P(k + 1)HR- 1 H*P(k + 1)x(k + 1)
(8-33)
x*(k)Qx(k) + u*(k)Ru(k)
(8-34)
1 2x*(N)P(N)x(N)
(8-35)
~x*(O)P(O)x(O)
(8-36)
Asi, el valor minimo del indice de desempefio J esta dado por la ecuaci6n (8-36). Este es funcion del P(O) y del estado inicial x(O).
Ejemplo 8-1 Considere el sistema de control de tiempo discreto definido por
x(k + 1)
= O.3679x(k) + O.6321u(k),
x(O)
=1
i~) [x (k ) + u (k )]
2 2
577
Observe que en este ejemplo S = l , Q = \ Y R = \. Tarnbien determine el valor minimo del indice de desernpeno J. En referencia a la ecuaci6n (8-23), P(k) se obtiene como sigue:
peN) = P(lO) = S = 1
Ahora se calcula P(k) de arras hacia adelante desde k = 9 hasta k = 0:
P(9) = 1 + 0.1354 x 1(1 + 0.3996 x 1)-1 = 1.0967 P(8) P(7) P(6) P(k)
= 1 + 0.1354 x 1.0967(1 + 0.3996 x 1.0967)-1 = 1.1032 = 1 + 0.1354 x 1.1032(1 + 0.3996 x 1.1032)-1 = 1.1036 = 1 + 0.1354 x 1.1036(1 + 0.3996 x 1.1037)-1 = 1.1037 = 1.1037, k = 5,4,3,2,1,0
Observe que los valores de P(k) se aproximan rapidamente al valor en estado estacionario. El valor en estado estacionario PH se puede obtener de
Pss = 1
o bien
0.3996J>;s
Al resolver esta ultima ecuaci6n para P,." se tiene P,,= 1.1037 o -2.2674
Como P(k) debe ser positiva, se encuentra que el valor en estado estacionario de P(k) es \.\ 037. La ganancia de realimentaci6n K(k) se puede calcular de la ecuaci6n (8-27):
K(lO) = 1.7181(1 - 1) = 0
K(9) K(8)
=
1.7181(1.0967 - 1)
0.1662
Yaque
x(k
0.6321K(k)]x(k)
578
se obtiene
Capitulo 8
x(2)
X X
X
0.1781)
= 0.00424
Los valores de x(k) para k = 5, 6, ... , lOse aproxima a cero rapidarnente. Ahara, la secuencia de control optima u(k) se obtiene como sigue:
u(O) u(l) u(2) u(3) u(4) u(k)
X
X
X
X
0,
Las graficas de los valores de P(k), K(k), x(k) y u(k) se dibujan en la figura 8-2. Observe que los valores de P(k) y K(k) son constantes excepto para las etapas finales. Por ultimo, el valor minima del Indice de descmpefio J se obtiene a partir de la ecuacion (8-36,
1.1037 x i)
= 0.5518
K(k)
0.2 0.1
o
2
4
6
0.5
10
u(k)
x(k)
0.1
2
1.0
10
0.5
o
4
10
-0.2
k
Figura 8-2 Graficas de P(k) contra k, x(k) contra k, y u(k) contra k K(k) contra k para el sistema considerado en el ejemplo 8-1.
579
Enfoque de MATLAB a la soluci6n de este problema ejernplo. Un programa de MATLAB se puedc escribir facilmente para resolver este problema ejernplo. El programa 8-1 de MATLAB muestra un posible programa. [En este programa se util izo la ecuacion (8-24) para el calculo de P(k).)
= 1; xO = 1;
for i = N-1; - 1: 1, P = 0 + C'*Pnex(*G - G'*Pnext*H*inv(R+H'*Pnext*H)*H'*Pnex(*G; p(i) = P; Pnext = P; end for iN: -1 :1, K = inv(R)*H'*inv(G')*(p(i) - 0); k(i) = K; end fori=1:N-1, xnext = (G-H*k(i))*x(i); xli + 1) = xnext; end for i =1 :N, uri) = -k(i)*x(i); end
Para imprimir los val ores de PO, P 1, ' . ' , PlO [que corresponden a p( 1), p(2), , , '. p( 11)], KO, K1, , , , K10 l que corrcsponden a k(1), k(2), ' . , , k(11)), xO, x 1, , , , , x10 [que corresponde a x( 1), x(2), ' , " x(ll)), y uO, u1"", ulO [que corrcsponden a u(O), u(l),.,., u(10)u(9), u(2)",. ut l l l], se introduce cl comando de imprcsi6n como sigue.
k'
x'
u ']
1.1037 1.1037 1.1037 1.1037 1. 1037 1. 1037 1.1037 1.1036 1.1032 1.0967 1.0000
0.1781 0.1781 0.1781 0.1781 0.1781 0.1781 0.1781 0.1781 0.1773 0.1662
1.0000 0.2553 0.0652 0.0166 0.0042 0.0011 0.0003 0.0001 0.0000 0.0000 0.0000
-0.1781 -0.0455 -0.0116 -0.0030 -0.0008 -0.0002 -0.0000 -0.0000 -0.0000 -0.0000
580
Capitula 8
La primera columna de la matriz, M proporciona desde arriba hacia abajo los valores de PO, Pl, ... , Pl O. De la misma manera, la segunda, tercera y cuarta columnas proporcionan los valores de KO, Kl, ... ,Kl 0; xO, x l , ... r xl 0; y uO, u l , ... r ul 0; respectvamente.
Problema de control optima cuadrdtico discreto. A continuacion se considera el control optimo cuadratico de un sistema de control discreto. Considere el sistema de control en tiempo continuo
x=
donde
Ax + Bu
(8-37)
u(t) = u(kT),
y el indice de desernpefio a minimizar es
] =
+ u*(t)Ru(t)] dt
(8-38)
Se supone que el sistema de control de tiempo continuo esta aproximado por su equivalente discreto. La ecuacion del sistema discretizado es
]=
~x*(NT)SX*(NT)
+ 2~J [x*(kT)QI x(kT) + 2x*(kT)M 1 u(kT) + u*(kT)R u(kT)]
j
1 N-I
(8-39)
2k~J [x*(kT)Qx(kT)
1 N-I
+ u*(kT)Ru(kT)]
pero se modifica para incluir un termino cruzado que involucra a x(k7) y u(k7). Tambien se modifican las matrices Q y R. A continuacion, se considerara el problema de control optimo discreto mediante el empleo de un ejemplo simple. Considere el sistema de tiempo continuo definido por
x(t)
donde a y b son constantes y
ax(t) + bu(t)
(8-40)
u(t)
u(kT),
1 2x 2(NT)
(8-41 )
581
Se va a discretizar la ecuacion del sistema y el indice de desernpefio y se enunciara el problema de control optirno cuadratico discreto. La ecuacion (8-40) se puede discretizar como
x((k + l)T)
donde
= G(T)x(kT) + H(T)u(kT)
G(T) H(T)
o bien
= eaT
=
I
=
b eaTbdr=-(eaT-l)
a
x((k + 1)T)
(8-42)
EI fndice de desernpefio J dado por la ecuacion (8-41) se puede discretizar. Primero, J se rescribe asf
x(t) = ea(t-kT)x(kT) + =
donde
~(t
r
kT
ea(t-T) bu( r) dr
~(t
- kT)
T/(t - kT) =
1 1 N-]
!!.. [ea(t-kT) - 1]
a
J] =
I(k+])T
kT
2(kT)
1 N-]
(8-43)
582
don de
Capitulo E
QI =
M1
RI
f = f f
(k + I )T
Qf(t - kT) dt
Q~(t
kT (k + I )T
- kT)TJ(t - kT) dt
kT (k + l)T
[QTJ2(t - kT) + R] dt
kT
QI =
MI =
R1
f f
b
(k + l )T
Qe 2a(t-kT)
kT (k + l )T kT
dt = - (e 2aT 2a
-
1)
bQ
(8-+-11
Qea(t-kT)~[ea(t-kT)
=
=
L~
2
+ I)T [
Q
_
{~
[ea(t-kT) -
1]
l]dt
2a 2 ( e aT
1)2
(8-l~
+ R dt
(8-+6
1
2a 3
Q [(eaT
3)(e aT _
1)
+ 2aT] + RT
En resumen, el problema de control optimo cuadratico discreto se puede enunciar como sigue. dada la ecuacion de un sistema discretizado
xk + 1)T)
donde G(7)
=
G(T)x(kT) + H(T)u(kT)
ear
H(7)=Jz.. (ear_I)
encuentre la secuencia de control optima u(O), u(n, ... , uN - 1)7) tal que el indice de desempenc siguiente se minimice:
II
'V-I
Tal indice de desernpefio que incluye un termino cruzado que involucra los terminos x(k7) y ui]: T puede ser modificado a otra forma que no los incluya, y la solucion del problema de control optimc discreto se puede obtener de una manera similar a la del problema de control optimo cuadraticc presentada anterionnente en esta seccion. Esta cuestion se presenta a continuacion.
indice de desempeiio que incluye un termino cruzado que involucra a x(k) y u(k). Ahora se considera el problema de control optimo cuadratico en donde el sistema es como el dado por la ecuacion (8-1), el cual fue
x(k + 1) = Gx(k) + Hu(k),
y el indice de desernpefio esta dado por
N-I
x(O) = c
1= !x*(N)Sx(N) 2
583
x
donde Q y S son matrices Hermiticas definidas positivas 0 semidefinidas positivas de n matriz Hermitica definida positiva de r x r, y M es una matriz de n x r tal que la matriz
n, Res una
[x*(k)
U*(k)][
~* ~][:~Z~]
=
Q=
1
J
Q - MR- 1 M*
,
(8-48)
1 N-l
1 N-l
Se define
v(k)
1
= R- 1 M*x(k) + u(k)
1 N-l
,
(8-50)
J =
+ v*(k)Rv(k)]
(8-51)
Observe que la ecuaci6n (8-51) ya no involucra el termino cruzado. Efectivamente se ha eliminado el terrnino cruzado que involucra a x(k) y u(k). Al sustituir la ecuaci6n (8-50) en la ecuacion del sistema, la ecuacion (8-1), se obtiene
x(k + 1)
= Gx(k) + H[v(k) =
R- 1 M*x(k)]
= (G - HR- 1 M*)x(k)
+ Hv(k)
(8-52)
Gx(k) + Hv(k)
584
Capitulo 8
donde
G = G - HR-1M*
(8-53)
Observe que el control optimo cuadratico del sistema dado por la ecuaci6n (8-1) con el indice de desempefio dado por la ecuacion (8-47) es equivalente al control optimo cuadratico del sistema dado por la ecuacion (8-52) con el indice de desernpefio dado por la ecuaci6n (8-51). Por 10 tanto, el vector de control optimo v(k) que minimiza el indice de desernpefio dado por la ecuacion (8-51) se puede dar como sigue. En referencia a las ecuaciones (8-26), (8-28) Y(8-30), se tiene
(8-54) o (8-55)
o sea
v(k)
(8-561
P(k) =
Q + G*P(k +
P(N) = S
(8-57\
u(k)
v(k) - R-1M*x(k)
(8-581
donde v(k) esta dada por la ecuacion (8-54), (8-55) Y(8-56). Cualquiera que sea la expresion que se usc para v(k), la ecuaci6n (8-58) se puede reducir ala siguiente forma:
u(k)
(8-59 1
i(t)
donde
= -x(t) +
u(t),
xeD) = 1
u(t) = u(kT),
y el indice de desempefio
kT
t < (k + l)T
donde T ~ I segundo y N = 10. Discretice la ecuacion del sistema y el indice de desempeno. Entonces determine la secuencia de control optirno u{kT) para k = 0, 1,2, ... , 9; esta sera la secuencia de control pan la cual el indice de desempcno es minima. Tambicn, obtenga el valor minima de 1. En referencia a las ecuaciones (8-40) y (8-42), la ecuacion del sistema discretizado es
585
donde a
-I. b
I YT
x(k + 1)
0.3679x(k) + 0.6321u(k),
x(O)
=0
(8-62)
JI
=0
(8-63)
1 YR
QI MI
RI
=0
1 2a (ela T
1)
=0
~2 (e- 2
~(e-l -
1)
1)2
=0
0.4323
0.1998
=0
2~2(eaT -
1)2
=0
=0
=0
=0
1 1 2(_1)3[(e-
3)(e- 1
1) - 2] + 1
=0
1.1681
Asi. el indice de desempeno dado por la ecuaci6n (8-63) se puede escribir como sigue:
J1
=0
!x 2(1O) 2
+ -2
k~O
[0.4323x 2(k)
(8-64)
Par 10 tanto. este problema se convierte como sigue. Dada la ecuaci6n del sistema. ecuaci6n (8-62). cncuentre la sccuencia de control6ptimo u(k). donde k = O. 1.2..... 9 tal que el indice de desempei'io dado por la ccuacion (8-64) sea minimo. Ahora al comparar las ecuaciones (8-47) Y (8-64). se tiene
S
Observe que
=0
1,
=0
0.4323,
=0
0.1998.
=0
1.1681
Q [ M*
M]
R
=0
[0.4323 0.1998
0.1998] 1.1681
es positiva definida. EI siguiente paso es rnodificar J[ dada por la ecuacion (8-64) a la forma dada por la ecuaci6n (8-51). ya que Q = Q - Mf([ JI* = 0.3981.
J1
=0
1 2x2(1O)
(8-65)
u(k)
=0
v(k) - WI M*x(k)
u(k)
donde
=0
(8-66)
G = 0.3679
La ecuaci6n (8-66) se puede reescribir como sigue:
H= 0.6321
586
u(k) = -[1.1681 + 0.3996p(k +
= _
Capitulo 8
lW
[0 .23251 k + 1) + 0.1998]x(k) \
(8-67)
donde
(8-68 )
bien,
P(k) =
donde peN) = P(IO) = I Y
Q+
lW G
I
(8-69)
Q= G=
Q - MW 1 M*
G - HW M*
1
0.3981
P(k) = 0.3981 +
Aho~a
se calculara P(k) con la condici6n de frontera P(I 0) = I. Al utilizar la ecuaci6n (8-70), se encuentra P(kt hacia atras desde k = 9 hasta k = O. Los resultados se prescntan en la tabla 8-1. Al utilizar los valores de P(k) asf obtenidos, se calcula K(k) a partir de la ecuaci6n (8-68). Los resultados tambien se presentan en la tabla 8-1. Ahora se calculax(k). Al sustituir la ecuaci6n (8-67) en la ccuacion (8-62) y al eJiminar u(k) de estas dos ecuaciones, se obtiene
0.06750P~k + 1) 1 + 0.3421P(k + 1)
(8-70)
x(k + 1) =
x(O) = 1
(8-71 )
Tabla 8-1 VALORES DE P(k), K(k), x(k), Y u(k) PARA EL SISTEMA CONSIDERADO EN EL EJEMPLO 8-2
k
0 1 2 3 4 5 6 7
P(k)
0.4230 0.4230 0.4230 0.4230 0.4230 0.4230 0.4230 0.4231 0.4243 0.4484
K(k)
0.2230 0.2230 0.2230 0.2230 0.2230 0.2230 0.2230 0.2231 0.2257 0.2758
x(k)
i.oooc
0.2270 0.05152 0.01169 0.002653 0.000602 0.0001366 =0
~o
u(k)
-0.2230 -0.05062 -0.01149 -0.002607 -0.0005916 -0.0001342
-0.OO304 ~o ~o ~o
8
9
=0
587
Al comenzar con x(O) ~ I, los valores dex(k) se pueden caleular a partir de la ecuacion (8-71) al utilizar los valores de (k) ya obtenidos. Los resultados se muestran en la tabla 8-1. Una vez que se obtienen los valores de K(k) y x(k). la serial de control optimo u(k) se puede obtcner de la ecuacion (8-67), 0 bien
u(k) = -K(k)x(k)
Estos resultados tambien se muestran en la tabla 8-1. Finalmente, en referencia a la ccuacion (8-36), el valor minimo de J se puede obtener como sigue:
1
J1 min =
2: P(0)x 2(0) = 2 X
A
0.4230
12
= 0.2115
Comentarios. El enfoque presentado aqui es util para resolver un problema de control optirno cuadratico de tiempo fin ito de un sistema de tiempo continuo mediante simulacion en computadora. A menos que el indice de desempefio cuadratico de tiempo continuo dado se especifique claramente por alguna razon, es mejor definir un indice de desempefio cuadratico de tiempo discreto una vez que las ecuaciones del sistema se han discretizado. (Vease la seccion 8-4.) Observe que en la mayoria de los casos las matrices S, Q YR en el indice de desempefio no son fijas, pero en "cierto sentido" son matrices definidas positivas escogidas en forma arbitraria; la minimizacion de un indice de desempefio arbitrario no tiene mucho sentido. Como se apunto antes, la razon principal por la que el esquema de control optirno cuadratico sea util y se utilice con frecuencia es que produce un sistema de control asintoticamente estable, excepto en algunos casos acadernicos. (Veanse los problemas A-8-6 y A-8-7.)
x(k
+ 1)
Gx(k)
+ Hu(k)
(8-72)
J =
(8-73)
El termino x*(N)Sx(N), que aparece en la ecuacion (8-2), no esta incluido en esta representacion de J. Esto se debe a que, si el sistema regulador optimo es estable de tal forma que el valor de J converge a una constante, x( ) se hace cero y x*( x)Sx( x) = o.
588
Capitulo 8
Ahora la matriz en estado estacionario P(k) se define como P. Con referencia en la ecuacion (823), la matriz P se puede determinar como sigue:
= =
Es claro que la matriz P es determinada por la matrices G, H, Q YR. Una expresion ligeramente diferente para P se puede obtener de la ecuacion (8-24):
=Q+
(8-75)
La matriz de ganancia en estado estacionario K se puede obtener en terminos de P como sigue: De la ecuacion (8-27),
(8-76)
De la ecuacion (8-29),
K = R- I H*(P- 1
+ HR- 1a-r' G
(8-77)
(R + H*PHr l H*PG
(8-78\
La ley de control optimo para la operacion en estado estacionario esta dada por
u(k)
-Kx(k)
u(k)
(8-79)
x(k + 1)
(A + BC)-l
con A = I, B = H YC = R- 1 H'P. (Remitase al apendice A.) El indice de desempefio J asociando la ley de control optimo en estado estacionario se puede obtener de la ecuacion (8-36) al sustituir P por P(O):
i:
x*(O)Px(O)
(8-81 )
En mucho sistemas practices, en lugar de utilizar una matriz de ganancia variante en el tiempo K(k), se aproxima dicha matriz mediante la matriz constante K. Las desviaciones del desempefio optimo debidas a la aproximacion apareceran s610 cerca del fin del proceso de control.
Ecuaclon de Rlccati en estado estacionario. Al implantar el controlador optimo en estado estacionario (0 invariante en el tiempo), se requiere la solucion en estado estacionario de la ecuacion de Riccati. Existen varias formas para obtener dicha solucion,
589
Una forma es resolver la ecuaci6n de Riccati en estado estacionario dada por la ecuaci6n (8-75),
es comenzar con la ecuaci6n de Riccau en estado no estacionario, que fue dada en la ecuaci6n (8-24):
(8-83)
y comenzar la soluci6n con P(O) = 0, e iterar la ecuaci6n hasta obtener una soluci6n en estado estacionario. Al calcular la soluci6n nurnerica, es importante notar que fa matriz P es una matriz Hermitica 0 real simetrica y es definida positiva. A continuaci6n, primero se presentara un enfoque de MATLAB para resolver el problema de control optirno cuadratico en estado estacionario. Despues se estudiara otro enfoque basado en el metodo de Liapunov.
Enfoque de MATLAB para resolver el problema de control optimo cuadrdtico ell estado estacionario. Ahora se considera un problema de ejemplo del control 6ptimo cuadratico en estado
estacionario de un sistema regulador que se resuelve con MATLAB. Considere el sistema
x(k + 1)
donde
Gx(k) + Hu(k)
H
EI indice de desempeno J esta dado por
UJ
J =
donde
R
La ley de control que minimiza a J puede estar dada por
u(k)
-Kx(k)
Determine la matriz de ganancia en estado estacionario K. EI programa 8-2 de MATLAB resuelve este problema. Observe que MATLAB Ileva a cabo la solucion iterativa de
590
Capitulo 8
% -------Control 6ptimo cuadratico en estado estacionario--% ***** Se resuelve la ecuaci6n de Riccati en estado estacionario y se
encuentra la matriz de ganancia de realimentaci6n 6ptima K*****
0;0
0.4]; 0.5];
Q = [1 0;0
R = [11;
P = [0 0];
0;0
01 *****
P = [0
0;0
P
P=
1.0252 -0.0189
-0.0189 0.5724
P
P=
1.0252 -0.0189
- 0.Cl189 0.5724
',/" ***** La matriz P permanece constante. Par 10 tanto, se ha alcanzado el estado estacionario. La matriz P en estado estacionario es *****
P
P=
1.0252 -0.0189
- 0.0189 0.5724
591
0.0786
00865
P=[~ ~J
hasta que Ia solucion alcance el estado estacionario, Entonces eI programa 8-2 de MATLAB calcula Ia matriz de ganancia de realirnentacion optima K empleando la ecuacion siguiente:
(R + H'PH)-l H'PG
Enfoque de Liapunov para resolver el problema de control optima cuadnitico ell estado estacionario. A continuacion se presentara el enfoque de Liapunov para resolver el problema de optirnacion de pararnetros y el problema del regulador optimo cuadratico en estado estacionario.
Como se vera, existe una relacion directa entre las funciones de Liapunov y los indices de desempeiio cuadratico. Se considera el sistema
x(k
+ 1)
Gx(k)
(8-84)
donde la matriz G involucra uno 0 mas parametros ajustables y cuyos valores propios estan dentro del cfrculo unitario, 0 el origen x = 0 es asintoticarnente estable. Se supone que se desea minimizar el indice de desernpefio siguiente mediante el ajuste de un parametro (0 parametres):
] = 2~o x*(k)Qx(k)
(8-85)
donde Q es una matriz Hermitica (0 real simerrica) definida 0 semidefinida positiva. Ahora se mostrara que una funcion de Liapunov se puede utilizar para resolver este problema. Para el sistema de la ecuacion (8-84), una funcion de Liapunov puede estar dada por
V(x(k))
x*(k)Px(k)
.1V(x(k))
(8-86)
592
Capitulo 8
-x*(k)[G*PG - P]x(k)
Por el segundo metodo de Liapunov, se sabe que para una matriz dada Q existe una matriz P definida positiva, y como la matriz G es estable, entonces G*PG - P =-Q En consecuencia, se puede determinar P a partir de esta ecuacion. EI indice de desempefio J se puede evaluar como sigue:
(8-87)
1 1
00
00
- x*(k
+ l)Px(k + 1)]
(8-88)
Z"x*(O)Px(O)
donde P es una funcion del panimetro(s)ajustable(s). Al obtener la ecuacion (8-88) se utilize la condicion que x(y:) ~ 0, ya que todos los valores propios de G estan dentro del circulo unitario. Por 10 tanto, el indice de desempefio J se puede obtener en terminos del estado inicial x(O) y de la matriz P, la cual esta relacionada con las matrices G y Q mediante la ecuacion (8-87). La minirnizacion del indice de desempefio J se puede realizar al minimizar x*(O)Px(O) con respecto al parametro en cuestion. Es importante notar que el valor optimo del parametro depende, en general, de la condicion inicial x(O). Sin embargo, si x(O) involucra solo un componente no cero, por ejemplo, si xj(O) 0 y las otras condiciones iniciales son cero, entonces el valor optimo del parametro no depende del valor numerico dexj(O).
*'
Enfoque de Liapunov para resolver el problema de control optimo cuadratico en estado estacionario. Ahara se considera el problema de control optimo donde, dada la ecuacion de la
planta
x(k
+ 1)
= Gx(k)
+ Hu(k)
(8-89)
~~o[X*(k)QX(k) + u*(k)Ru(k)]
0
(8-91)
se minimice, don de Q es una matriz Hermitica (0 real simetrica) definida positiva positiva y R es una matriz Hermitica (0 real sirnetrica) definida positiva. Al sustituir la ecuacion (8-90) en la ecuacion (8-89), se obtiene
x(k
semi definida
(8-921
593
(8-93)
En el analisis siguiente, se supone que la matriz G - HK es estable, es decir, los valores propios de G
x*(k)(Q + K*RK)x(k)
(8-94)
(8-95)
Al comparar los dos lados de la ecuaci6n (8-95) y al notar que esta ecuacion permanece verdadera para cualquier x(k), se requiere que
(8-96)
Observe que mediante el segundo metodo de Liapunov, para una matriz estable G - HK, existe una matriz P definida positiva que satisface la ecuaci6n (8-96). La ecuacion (8-96) se puede modificar como sigue:
=0
=
Q + G*PG - P + [(R + H*PH) lI 2K - (R + H*PHr ll2H*PG]* [(R + H*PH) 1I 2K - (R + H*PHr 1l 2H*PG] - G*PH(R + H*PH)-IH*PG = 0 (8-97)
La matriz K que minimiza aJ se puede obtener alminimizar la parte izquierda de la ecuacion (8-97) con respecto a K. (Vease el problema A-8-5.) Ya que
cuando
(R + H*PH) 1I2K
Por 10 tanto, se obtiene
(R + H*PHr ll2H*PG
(8-98)
K = (R + H*PHr I H*PG
j.:,
1'\1
594
Capitula E
(8-991
La matriz P debe satisfacer la ecuacion (8-99), la cual es la misma que la ecuacion (8-75). La ecuacion (8-99) se puede modificar y obtener
(8-1001
Mediante el uso del lema de inversion de matrices
(I + HR- 1 H*pr 1
la ecuacion (8-100) se puede modificar a
(8-1011 La matriz P se puede determinar de la ecuacion (8-101). Por ultimo, el valor minimo de J se puede obtener como sigue. En referencia a las ecuaciones (893) Y(8-94) Yal notar que x(x) = 0, el valor minimo del indice de desernpefio J se obtiene como sigue
Jrnin
2"~ox*(k)(Q + K*RK)x(k)
2"~o[x*(k)Px(k) - x*(k + 1)Px(k + 1)]
1 2" x*(O)Px(O) 1
en
en
donde -0.25 :s; a < O. Se desea determinar el valor optimo de a tal que minimice el indice de dcsempen: siguiente:
J =
2:k~O x*(k)Qx(k)
oc
don de Q = I. De la ecuacion (8-88), el indice de dcsempeno J en terrninos del pararnetro a esta dado par
J = 2:x*(O)Px(O)
G*PG - P = -Q
o bien
1 [1
l[Pll
P12
595
2 2ap12 + a P22 PlI + (a - 2)p12 - ap22] [ PII + (a - 2)p12 - ap22 PlI - 2pI2
Esta ultima ecuacion resulta en las tres ecuaciones siguientes:
[-1 0]
0 -1
2aP12 + a2p22
PlI
= = =
-1
+ (a - 2)P12 - ap22
PII - 2p12
-1
~Pll
EI minimo de J oeurre en el punto final a = -0.25. Por 10 tanto, el valor minimo de J se encuentra como
1m in
Ejemplo 8-4 Considere el sistema
= -
2.3571
XI(O)] [ X2(0)
y el indice de desemperio
[1]
0
2~o[X*(k)Qx(k) + u*(k)Ru(k)]
00
donde Q = I YR = 1. De la ecuaci6n (8-98), la ley de control optimo que minimiza el indice de desempefio .J esta dada por
u(k)
U~]
596
Capitulo
1:
(8-103)
La matriz P en este problema es una matriz real simetrica. En consecuencia, la ecuaci6n (8-103) se pucde escribir como:
1)(1
Esta ultima ecuaci6n produce cuatro ecuaciones escalares. Observe sin embargo. que s610 tres de elias sor: linealmente independientes. Las euatro eeuaeiones esealares son:
pn(1 + PII) pi2 + Pll - 1 - P12 (P22 - 1)(1 + PII) (P22 - l)p12 + P12 - P22 + 1
De la primera de estas euatro ecuaciones, se obtiene
=
=
P12
(8-10-1 '
P12 = 1
y de la segunda de estas euatro eeuaeiones
P22
PII - 2
(8-IO~
pil - 3pII - 3
(8-1U6
~'E
[AI sustituir las ecuaeiones (8-1 04) Y(8-105) en la ultima de estas euatro ccuacioncs, se eneuentra que siempre se satisface.] Al resolver la eeuaei6n (8-106), se eneuentra que
p,,=3.7913
PII
P = [3.7913
En esta seccion se discutira el control optimo cuadratico de un sistema de seguimiento. La planta considerada es el pendulo invertido mostrado en la figura 8-3. Se disefiara un esquema de control para este sistema de control de pendulo invertido. El pendulo invertido es inestable ya que puede caer en cualquier momento y hacia cualquier direccion a menos de que se Ie aplique una fuerza de control. Solamente se considera el problema er, dos dimensiones en el cual el pendulo s610 se .nueve en el plano de la pagina. Se supone que la rnasa
597
z
I-+---~
-----1~
o
u-M
/.
Figura 8-3
del pendulo se concentra al final de la varilla, como se presenta en la figura. (La varilla no tiene masa.) La fuerza de control use aplica al carro. Es preferible mantener el pendulo invertido en posicion vertical tanto como sea posible y mantener el control de la posicion del carro, por ejernplo, mover el carro en forma de escalon. Para controlar la posicion del carro, se necesita construir un sistema de seguimiento tipo I. El sistema del pendulo invertido montado sobre un carro no tiene un integrador. Por ello, se alimenta la sefial de posicion y (la cual indica la posicion del carro) de regreso a la entrada y se inserta un integrador en la trayectoria directa, como se muestra en la figura 8-4. (Observe que son posibles otras configuraciones.) Se escoge el periodo de muestreo T como 0.1 segundos.
~-------~
I
r(k)
y(k)
Ii
Controlador integral
I
K
I
l
Plantaconrealimentaci6n delestado
Figura 8-4
598
Capitulo 8
EI sistema de control a disefiar incluira realimentacion del estado y un integrador en el lazo cerrado. Las variables de disefio son la constante K, y la matriz de ganancia de realimentacion K. Por 10 tanto, el disefiar el esquema de control significa determinar la constante K, y la matriz K. Se resolvera este problema de disefio y se obtendra la respuesta al escalon del sistema disefiado con ayuda de MATLAB. Para resolver este problema de disefio, primero se definen las variables de estado XI' X 2, Xl Y.v, como sigue:
X4
=i
En este sistema se quiere mantener el angulo e tan pequeno como sea posible cuando el carro es movido en forma de escalon. Se considera que el desplazamiento del carro es la salida del sistema. Asi. la ecuacion de salida es
= [0
0 1
{J
+
2 kg,
= 0.1 kg,
1= 0.5
ill
Para disefiar eJ sistema de control, se utilizara el modelo discretizado. La ecuaciones de estado y de salida discretas para la planta se pueden obtener como se muestra a continuacion, (Refierase al problema A-8-1 0 para obtener estas ecuaciones.)
x(k
+ 1) = Gx(k) + Hu(k)
y(k)
Cx(k)
Du(k)
donde
0] 0 0.1 ' 1
= -0.1035
- 0,0051] C
= [0 0 1 0],
= [0]
De la figura 8-4 la representacion en el espacio de estado para el sistema de control completo esta dada por
x(k
+ 1) = Gx(k) +
y(k) v(k) u(k)
Hu(k)
Cx(k) y(k)
donde
599
Yaque
se tiene
X(k + [ v(k + 1) -
1)] _[G
-CG
r(k + 1)
xe(k) ve(k)
= =
x(k) -
x(oo)
v(k) - v(oo)
Observe que
-K ][Xe(k)]
[ ve(k)
[G 0]
-CG
e
l'
[H]
-CH'
K=
[K
-Kd,
w(k)
ue(k)
~(k)
_ xe(k) _ - [v (k)] -
w(k)
-K~(k)
Hay que sefialar que como el sistema es continuo, se debe considerar un indice de desempefio cuadratico tambien continuo. Sin embargo, la discretizacion de un indice de desempefio continuo genera un termino cruzado que involucra a ~ y w.(Vease la seccion 8-3.) Para simplificar el proceso de
600
Capitulo 8
disefio, es mejor definir un indice de desempefio cuadratico discreto. Por 10 tanto, el problema se convierte en determinar la matriz K tal que minimice al siguiente indice de desempefio cuadratico:
J = -
donde Q y R se deben escoger en forma apropiada para que la respuesta del sistema sea aceptable. (El prop6sito de utilizar el indice de desempefio cuadratico es asegurar la estabilidad del sistema.) Se escoge a Q y a R como sigue:
o o o o
1
R =
[1]
EI enfasis esta en las variables de estado X l e Y X le. (Observe que se pueden utilizar diferentes valores de Q yR.) En el programa de MATLAB para resolver este problema, se utiliza la siguiente notaci6n Gl =
G,
Hl
= ti,
KK =
El programa 8-3 de MATLAB da la soluci6n P para la ecuaci6n de Riccati en estado estacionario, la matriz de realimentaci6n K, y la constante de ganancia integral KJ
% ------- Diseno de un sistema de control de pendulo invertido basado en la rninirnizacion de un indice de desernperio cuadratico - % ***** EI siguiente programa resuelve la ecuacion de Riccati en estado estacionario y da la matriz de ganancia de realimentacion optima K *****
601
1];
R = [1];
% ***** Se comienza a resolver la ecuaci6n de Riccati en estado estacionario % para P cuando P = diag(O, 4) *****
P = diag(O, 4); P = Q + G1'*P*G1 - G1'*P*H1*inv(R + H1'*P*H1)*H1'*P*G1;
';/0 uj"
***** Se revisa la soluci6n de P cada 20 iteraciones. La iteraci6n se detiene cuando P permanece constante *****
P
P=
1.0e + 003* 9.6887 2.1677 3.4319 2.4341 -0.1741 2.1677 0.4876 0.7743 0.5490 -0.0393 3.4319 0.7743 2.2988 1.1788 -0.1312 2.4341 0.5490 1.1788 0.7824 -0.0625 -0.1741 -0.0393 -0.1312 -0.0625 0.0185
P=
1.0e+004* 1.0707 0.2397 0.3996 0.2772 -0.0220 0.2397 0.0539 0.0902 0.0625 -0.0050 0.3996 0.0902 0.2617 0.1367 -0.0158 0.2772 0.0625 0.1367 0.0895 -0.0078 -0.0220 -0.0050 -0.0158 -0.0078 0.0021
602
Copitulo B
P=
1.0e + 004* 1.0724 02401 0.4006 0.2778 -0.0221 0.2401 0.0540 00904 00627 -0.0050 0.4006 0.0904 0.2623 0.1371 -0.0158 0.2778 0.0627 0.1371 0.0897 -0.0078 -0.0221 -0.0050 -0.0158 -0.0078 0.0021
P=
1.03 + 004* 1.0724 02401 0.4006 0.2778 -0.0221 0.2401 0.0540 0.0904 0.0627 -0.0050 0.4006 0.0904 0.2623 0.1371 -0.0158 0.2778 0.0627 0.1371 0.0897 -00078 -0.0221 -0.0050 -0.0158 -0.0078 0.0021
P=
1.Oe + 004* 1.0724 0.2401 0.4006 0.2778 -0.0221 0.2401 0.0540 0.0904 0.0627 -0.0050 0.4006 0.0904 0.2623 0.1371 -0.0158 0.2778 0.0627 0.1371 0.0897 -0.0078 -0.0221 -0.0050 -0.0158 -0.0078 0.0021
= inv(R + =
-64.9346
-10.8475 KK(4)]
-9.2871
0.5189
K = [KK(l)
K=
-64.9346 -14.4819 -10.8475 -9.2871
603
KI = -KK(5) KI
=
-0.5189
Por 10 tanto, la matriz de realimentacion K y la constante de ganancia integral K{ se detenninan como sigue:
K = [-64.9346
-14.4819
-10.8475
-9.2871],
K,
= -0.5189
= (G - HK)x(k) + HKjv(k)
v(k + 1) = v(k) + r(k + 1) - y(k + 1)
= (-CG + CHK)x(k) +
se obtiene
(1 - CHKj)v(k) + r
X + (k [ v(k +
[0] r 1
(8-107) (8-108)
y(k) = [C
donde r define
=
o][~~~~] + [O]r
I. Para determinar la respuesta al escalon unitario y(k) (la posicion del carro), primero se
G - HK GG = [ -CG + CHK
HKj] 1 - CHK j
HH
CC
=
=
[n
[C 0]
=
[0 0
0]
DD = [D] = [0] y entonces las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-108)] se convierten a la funcion de transferencia pulso Y(z)/R(z) mediante el uso del siguiente comando de MATLAB:
[num,den)
Entonces se utiliza el comandofilter:
ss2tf(GG,HH,CC,DD)
= filter(num,den,r)
604 donde t = entrada escal6n unitario. Para obtener la respuesta x\(k), se observa que
Capitulo 8
xl(k)
Se define
= [1 0 0 0 0][ v(k)
= [1 0 0 0 0]
X (k)]
FF Entonces
xl(k) - FF v(k)
[X(k)]
(8-109)
Las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-109)] se convierten a la funci6n de transferencia pulso X\(z)/R(z) mediante el comando
[num 1, den 1]
=
filtertnum 1, den 1, r)
x2(k)
Se define
= [0 1 0 0 0][ v(k)
X (k)]
(8-110)
JJ = [0 1 0 0 0]
Entonces las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-110)] se convierten a la funcion de transferencia pulso Xlz)/R(z) mediante el comando
[num2,den2J
ss2tf(GG,HH,JLDO)
filter(num2,den2,r)
LL = [0 0
1 0]
MM = [0 0 0 0 1]
las respuestas x4(k) Y xs(k) = v(k) se pueden obtener empleando los comandos
[nurn 4, den 4]
=
x4 = filter(num4,den4,r)
605
[numS,denSl = ss2tf(GG,HH,MM,DD) xS
=
filter(numS,denS,r)
El programa 8-4 de MATLAB proporciona y(k), x 1(k), xik), x 4(k) Y xs(k) cuando la entrada es un escalon unitario (r = I).
% - - Respuesta al escal6n del sistema disenada-% ***** Este programa calcula la respuesta del sistema cuanda esta sujeta a una entrada de un escal6n unitaria. Las valores que se usan para K y Kl se calcularon en el programa de MATLAB 8-3. La respuesta se abtiene al usar el rnetodo de canvertir las ecuacianes de estada en tiempa discrete en la farma de la funci6n de transferencia de pulso. La respuesta se encuentra can el camanda 'filter' canvencianal *****
% ***** Matrices K, Kl, GG, HH, Cc, FF,)j, LL, MM, DO *****
K = [-64.9346 -14.4819 -10.8475 -9.2871]; KI = -0.5189; GG = [G-H*K H*KI;-CG + CH*K 1-CH*KI]; HH = [0; 0; 0; 0; 1); CC = [0 0 1 0 0]; FF = [1 0 0 0 0]; )) = [0 1 0 0 0]; LL = [0 0 0 1 0]; MM = [0 0 0 0 1]; DO = [0]; % ***** Para abtener y(k) las ecuacianes en el espacia de estada se canvierten a la funci6n de transferencia pulse X3(z)/R(z) ***** [num, den]
=
606
Capitulo 8
% ***** Para abtener x2(k) las ecuacianes en el espacia de estada se canvierten a la funci6n de transferencia pulso X2(z)/R(z) *****
[num 2, den 2] = ss2tf(GG, HH, ll. Od);
% ***** Para abtener x4(k) las ecuacianes en el espacia de estada se canvierten a la funci6n de transferencia pulse X4(z)/R(z) *****
[num 4, den 4] = ss2tf(GG, HH, LL, DO);
% ***** Para abtener x5(k) las ecuacianes en el espacia de estado s e canvierten a la funci6n de transferencia pulso X5(z)/R(z) *****
[num 5, den 5] = s2tf(GG, HH, MM, DO);
607
Con base en los calculos de MATLAB, la posicion del carro [y(k) contra k] se puede obtener como se muestra en la figura 8-5. (N6tese que el movimiento inicial de carro es en la direcci6n negativa.) La figura 8-6 dibuja la grafica del desplazamiento angular del pendulo, x1(k) = 8(k), en funci6n de
Posicion del carro: y(k) = x3(k)
1.2~-~--~-~--~-~--~-~--~-~-~
0.8 _.
~
)(
0.6
II
0.4
-0.2 L-_
_'__-----'--_---'~_--'---_
10
20
30
40
50
60
70
80
90
100
k
Figura 8-5 Grafica de la posicion del carro y y(k) contra k.
0.2
0.15
0.1
-0.05
-0.1 l -_
_'__-'-_---'L-_--'---_~_---L_ _.i...__
_ ' __
__'__
___.J
10
20
30
40
50
60
70
80
90
100
k
Figura 8-6 Grafica del desplazamicnto angular x,(k) contra k.
608
Capitulo 8
k. La figura 8-7 muestra la grafica de la velocidad angular del pendulo, xik), en funci6n de k. La figura 8-8 presenta la grafica de la velocidad angular del carro, x4 (k), en funci6n de k. La salida del integrador. v(k) contra k, se presenta en la figura 8-9.
Velocidad angular theta punto: x2(k)
N )(
-0.1 -0.2 -0.3 -0.4 -0.5 0 10 20 30
40
50
60
70
80
90
100
k
Figura 8-7
0.8
0.6
-0.2 -0.4
10
20
30
40
50
60
70
80
90
100
k
Figura 8-8
Capitula 8
609
25 20
~
II ~
'>
x
15
;;:;
o
10 20 30
40
50
60
70
80
90
Figura 8-9
Como en el sistema presente el periodo de muestreo T es 0.\ segundos, toma alrededor 6 segundos alcanzar el estado estacionario.
x(k + 1)
donde
x(k)
= =
=
Gx(k) + Hu(k)
u(k) G H
Se desea encontrar un vector de control optimo tal que minimice el indicc de desernpeno siguiente:
lIN
donde Q y S son matrices Hermiticas definidas positivas matriz l lcrmitica dcfinida positiva de I' x r.
semidefinidas positivas de n
n y Res una
610
Capitulo 8
En la seccion 8-2 se obtuvo el vector de control optimo u(k) en la forma dada por la ecuacion (8-26)
(8-111 )
P(k)
peN)
(8-112)
(8-113 )
donde
P(k)
(8-114 )
2. Muestre que el vector de control optirno u(k) tambien puede estar dado por
u(k) = -[R
donde
(8-115 )
peN)
(8-116)
3. Muestre que las tres expresiones para P(k) dadas por las ecuacioncs (8-1 12), (8-114) y (8-1 16) son equivalentes.
Sulucion
1. Primero sc mostrara que las ecuaciones (8-111) y (8-113) son cquivalentes. Con refercncia a la
ccuacion (8-23)
(G*)-I[P(k) - Q] = (G*)-l G*P(k + 1)[1 + HR- 1H*P(k + = P(k + 1)[1 + HR- 1H*P(k + lW1G
=
lW1G
Por 10 tanto.
-R-1H*[P-1(k + 1) + HR-1H*r1Gx(k)
y se ha mostrado que las ecuaciones (8-111) y (8-113) son equivalentes. 2. Para mostrar que las ecuaciones (8-113) y (8-115) son equivalentes, observe que
[R + H*P(k + I)Hr 1H*P(k + 1)[P-l(k + 1) + HR- 1 H*] 1 1 = [R + H*P(k + I)Hr H*[I + P(k + I)HR- H*]
= [R + H*P(k +
= R-1H*
Por 10 tanto
Capitulo 8
611
u(k)
= -R- 1H*[P-I(k +
=
De esta manera, se ha mostrado que las ecuaciones (8-113) y (8-115) son equivalentes, 3. A continuacion. se probara que las ecuaciones (8-112) y (8-114) son cquivalcntcs. Si se observa que
[P-\k + 1) + HR -I H*]{P(k + 1) - P(k + l)H[R + H*P(k + l)Hr l H*P(k + I)} = 1 + HR- 1H*P(k + 1) - H[R + H*P(k + l)Hr l H*P(k + 1)
- HR- 1H*P(k + l)H[R + H*P(k + l)Hr' H*P(k + 1) = 1 - H{-R- 1 + [R + H*P(k + l)Hr l + R- 1H*P(k + l)H[R + H*P(k + l)Hr l}H*p(k + 1)
= 1 - H{[I + R- 1H*P(k + l)HJ(R + H*P(k + l)Hr l = 1- H{R-1[R + H*P(k + l)HJ(R + H*P(k + l)Hr = 1 - H[R- 1 - R-1jH*P(k + 1) = 1
Por 10 tanto.
l
R-1}H*P(k + 1) R-1}H*P(k + 1)
[P-I(k + 1) + HR-1H*r l
=
y sc tiene
Problema A-8-2
Para cI problema de control optima cuadratico donde el sistema esta dado por la ecuacion (8-1) Ycl indice de desempcno csta dado par la ecuacion (8-47), se encontro en la seccion 8-2 que el vector de control optirno u(k) puede estar dado por la ccuacion
u(k)
= v(k) - R-1M*x(k)
(8-1 17)
don de v(k) est a dada por la ecuacion (8-54). (8-55) y (8-56) como sigue:
(8-118)
P(k)
Q + G*P(k
P(N)
612
Capitulo 8
G =G-HR-
M*
Q =Q-MR-
M*
Muestre que el vector de control optirno u(k) se puede expresar como sigue:
(8-119)
Soluci6n La equivalencia entre los lados derechos de las tres expresiones de v(k) se dernostro en el problema A-8-1. De don de. se puede obtener la ecuacion (8-119) si se ernplea, por ejernplo, la ecuacion (8118) De las ecuaciones (8-117) y (8-118). se tiene
= -[R + H*P(k + l)Hr ' H*P(k + I)Gx(k) - R- 1M*x(k) = -([R + H*P(k + 1)Hr ' H*P(k + l)[G - HR- 1 M*] + [R + H*P(k + l)Hr '[R + H*P(k + 1)H]R- 1M*]x(k) = -[R + H*P(k + 1)Hr'[H*p(k + l)G - H*P(k + 1)HR- 1M* + M* + H*P(k + I)HR- 1M*]x(k)
G=[~ ~l
1 1
7
x(O) = [
~J
Determine la secuencia de control optimo u(k) que minimiza el indice de desernpefio siguiente
J
donde
Q=[~ ~l
Solucion
R = 1.
S=[~ ~J
P(k)
[1o OJ + [11 1
x {[
1)
l)J
La condicion de frontera para P(k) esta especificada por la ecuacion (8-25) y esta dado por
pes) = S =
[~ ~ J
Capitula 8
613
Ahora se calcula P(k) de atras hacia adelante desde P(7) hasta P(O):
P(7)
U~] U~ ][ ~
+
~]{ [~ ~]
[~2
o
t]
P(6)=[1
+
"7
[~ ~][~:; ~:;
7'
= [3.4286 0.8571] 0.8571 1.7143 De forma similar. sc pueden calcular P(S), P(4), ... , P(O) como se presenta en la tabla 8-2.
A continuaci6n se determinara la matriz de ganancia de realimentaci6n K(k). Con referencia a la ecuaci6n (8-27), la matriz K(k) puede estar dada por:
= [:
I;]
]rl ~ ~]
K(k) = WI H*(G*)-'[P(k) - Q]
= [1][1
oJ[ ~ ~ r'[p(k) -
Q]
TABLA 8-2 TABLA QUE MUESTRA P(k), K(k), x(k) Y u(k) PARA k = 0, 1, 2, ... , 8, RESPECTIVAMENTE, PARA EL SISTEMA CONSIDERADO EN EL PROBLEMA A-8-3
k P(k) K(k) x(k) u(k)
1 2 3 4 5 6 7 8
[ 1.0000J 0.0000 [o.OOOOJ 1.0000 [ 0.2087J 0.0000 [0.0001 J 0.2087 [0.0437J 0.0001 [0.0003J 0.0437 [0.0099J 0.0003 [ 0.0015J 0.0099 [0.0057J 0.0015
[3.7740 0.9932J 0.9932 1.7877 [3.7097 0.9677 [ 3.4286 0.8571 [2.5000 0.5000 0.9677J 1.7742 0.8571 J 1.7143 0.5000J 1.5000
614
Capitulo 8
= [p12(k) P22(k) -
1]
Por 10 tanto,
K(8) = [p12(8) P22(8) - 1] = [0.0000 0.0000] K(7) = [p12(7) P22(7) - 1] = [0.5000 0.5000]
De forma similar, se pueden ca1cular K(6), K(5), . . . ,K(O) para dar los valores que se presentan en la tabla 8-2. A continuacion, se calculara x(k). Se escribe
K(k)
Entonces
[k 1(k) k2(k)]
x(k + 1)
= Gx(k) + Hu(k)
= =
[1 -
[G - HK(k)]x(k)
k 1(k) 1
1-
k2(k)][Xl(k)] 0 x2(k)
x(O) =
x(k), donde k
=
[~]
x(1) = [ 1
~1
1-
~ 7913]U] = [~:~]
u(k) = -K(k)x(k)
Esto es,
0.7913J[
~] =
-1.0000
~] =
-0.7913
De forma similar, se pueden ca1cular u(2), u(3), ... , u(8) para dar los valores mostrados en la tabla 8-2 Como se menciono antes, la matriz de ganancia de realimentacion K(k) es constante excepto para los ultimos valores de k. Esto significa que si el numero de etapas no es 8 sino 100 entonces K(O), K( I) .. , K(93) seran constantes y K(94), K(95), ... , K( I00) variaran. Este hecho es irnportante, porque si e. numero de etapas N es suficientemente grande, entonces la matriz de ganancia de realimentacion s: convicrte en una matriz con stante y, por 10tanto, el disenador es capaz de emplear una matriz de ganancra de realirnentacion constante para aproximar a la matriz de ganancia optima variante en el tiempo. EI valor minirno de J se obtiene de la ecuacion (8-36) como sigue:
f roin =
=
~x.(O)P(O)x(O) = ~[1
1.8956
oJ[
i:~ ~:~][~]
Capitulo 8
615
Problema A-8-4
Con referencia al problema A-8-3, resuelva el problema con MATLAB. Escriba un programa en MATLAB para encontrar P(k), K(k), x(k) y u(k). Imprima P(k), K(k), x(k) y u(k).
Soluci6n
% - - Control optirno cuadratico% ***** Se resuelve la ecuacion de Riccati y se encuentra la matriz de ganancia de realimentacion optima K *****
%
***** Matrices G, H, 5,
Q Y R *****
% p22(N)
pl2(i); pl2(i)
p22{i)] - Q);
616
Capitulo 8
Al emplear este programa, la matriz P, la matriz K, el vector x y el vector u se pueden obtener como se muestra a continuaci6n
0/0 ***** Impresi6n de P, K, x, Yu ***** P = [pll ;p12;p12;p22] P= Columns 1 through 7 3.7913 1.0000 1.0000 1.7913 3.7911 0.9999 0.9999 1.7913 3.7905 0.9997 0.9997 1.7911 3.7877 0.9986 0.9986 1.7905 3.7740 0.9932 0.9932 1.7877 3.7097 0.9677 0.9677 1.7742 3.4286 0.8571 0.8571 1.7143
Columns 8 through 9 2.5000 0.5000 0.5000 1.5000 K = [kl;k2]' K= 1.0000 0.9999 0.9997 0.9986 0.9932 0.9677 0.8571 0.5000 0 x = [xl ;x2] x= Columns 1 through 7 1.0000 0 0.0000 1.0000 0.2087 0.0000 0.0001 0.2087 0.0437 0.0001 0.0003 0.0437 0.0099 0.0003 0.7913 0.7913 0.7911 0.7905 0.7877 0.7742 0.7143 0.5000 0 1.0000 0 0 1.0000
Capitulo 8
617
Columns 8 through 9
0.0015 0.0099
0.0057 0.0015
u = u'
u=
a
En esta irnpresion, PO, Pl, ... , P8 estan dados como vectores columna. La primer columna de la matriz P da PO, la segunda da Pl, Yasi sucesivamente. En cada columna el primer rengl6n da p l l , el segundo y tercero dan p 12, Yel cuarto p22. KO, Kl, ... r K8 estan dados como vectores rengl6n en la matriz K. EI primer renglon corresponde a KO y el ultimo a K8. xO, xl , ... r x8 estan dados como columnas de la matriz x. La primer columna corresponde a xO y la ultima corresponde a x8. uO, u l , ... , u8 estan dados como el primero, segundo, ... , noveno rengl6n del vector u.
Problema A-8-5
Considere el sistema de control escalar
(8-120)
(8-121) donde q > 0 y r > O. En la seccion 8-3 se mostr6 que la ley de control 6ptimo que minimiza el indice de desernpeno J puede estar dada por
u(k) = -Kx(k)
Al sustituir la ecuaci6n (8-122) en la ecuaci6n (8-120), se obtiene,
(8-122)
x(k + 1) = (g - hK)x(k)
Al sustituir la ecuaci6n (8-122) en la ecuaci6n (8-121), se tiene 1 ~ 2)x 2(k) J = 2~o (q + rK Al emplear el enfoque de Liapunov y con referencia a la ecuaci6n (8-94), se establece que
(8-123)
(8-124)
618
Capitulo 8
Esta ultima ecuacion se debe mantener para cualquier x(k), De donde, se requiere que
q + rK 2 + p(g - hK)2 - P = 0
Muestre que la ley de control optimo se puede dar por
(8-125)
(8-126) Tambien muestre que p se puede detenninar como una raiz positiva de la siguiente ecuacion: (8-127) Solucion Con referencia a la ecuaci6n (8-88), el indice de desempefio J se puede determinar como sigue:
J
= ~ px 2 (O)
ap = 0 aK
Para minimizar el valor de J para un valor dado x(O) con respecto a K, se tiene (8-128)
donde pesta dado por la ecuaci6n (8-125). Observe que en la ecuacion (8-125) q + rK 2 > O. De don de. 1 - (g - hK)2 *- O. Por 10 tanto, p puede estar dada por:
2 q + rK 1 - (g - hKf
(8-129)
1 - (g - hK)2
De las ecuaciones (8-129) y (8-130), se obtiene
rK h(g - hK)
(8-130)
rK h(g - hK)
(8-131)
~= r + ph?
ghp(r + ph 2)-1
(8-132)
Capitulo 8
619
que es la ccuacion (8-127). EI mismo resultado se puede obtener en la forma siguiente. Primero observe que la ecuacion (8-125) se puede modificar como sigue:
q + pg2 - P + ( Yr + ph 2K -
)2
r + ph?
-2
~
r + ph
h2 2
=
(8-133)
Entonces, al considerar esta ultima ecuacion como una funcion de K, el minimo dellado izquierdo de esta ecuacion con respecto a K ocurre cuando
Yr + ph 2K o
ghp
=0
(8-134) que es la ecuacion (8-126). Al sustituir la ecuacion (8-134) en la ecuacion (8-133). sc obtiene
2 g2h 2p 2 q + pg - P - - - r + ph?
que se puede simplificar como sigue:
u(k) = -Kx(k)
cualquiera que sea el valor de la matriz K. Solucion Se define a
Entonces
G HK = [-~.5 -
k2)
= [ -~.5
2]
620
Capitulo 8
IzI -
G + HKI =
Iz
= (z
-0.5 - k\,
z = 1.5
Ya que el polo en z = 1.5 esta localizado fuera del circulo unitario, el sistema es inestable, cualquiera que sea el valor de la matriz K. Por 10 tanto, la tecnica de control 6ptimo cuadratico no se puede aplicar a este sistema. (La soluci6n del problema del control 6ptimo cuadratico no existe.) Problema A-8-7 Considere el sistema
XI(O)] = [ X2(0)
y el indice de desempeno
[1]
1
(8-135)
J =
donde
tt
[x*(k)Qx(k) + u*(k)Ru(k)]
(8-136)
Q=[~ ~l
De la ecuaci6n (8-135) se tiene
R = 1
Determine la ley de control 6ptimo que minimiza el fndice de desempefio. Tambien determine el valor minima deJ. Soluci6n
G=[~ ~l H=[~]
La matriz P se puede determinar de la ecuaci6n (8-101),
0
(8-137)
Como las matrices Q, G, H YR son reales, la matriz P es una matriz real simetrica, AI sustituir las matrices dadas Q, G, H YR en la ecuaci6n (8-137), se obtiene
Capitulo 8
621
pll(l + Pll)
p12(l + Pll) = -Pi2 + P22(l + Pll) P22(1 + Pll) = -P;2 + p22(1 + Pll)
Al resolver estas tres ecuaciones para PI b
PI2
Pll
De donde
= 1,
PI2
= 0,
P22 = 0
P =
U~]
oJ[ ~ ~][ ~ ~ ]X(k)
(8-138)
La ecuaci6n (8-138) da la soluci6n requerida de la ecuaci6n de Riccati en estado estacionario. Con referencia a la ecuacion (8-79), se tiene
= -(1 + 1)-1[1
= -TI[O O]x(k) = 0
La ecuaci6n (8-139) da la ley de control optimo, EI sistema en lazo cerrado se convierte en
(8-139)
x(k + 1)
= Gx(k) + Hu(k) = [~
~] x(k)
(8-140)
La ecuaci6n (8-140) da la operaci6n 6ptima en lazo cerrado del sistema. Los polos de lazo cerrado estan en f..L1 = 1 Y f..L2 = O. EI sistema en lazo cerrado no es asint6ticamente estable. El valor minimo de J se obtiene de la ecuaci6n (8-81), como sigue:
Aunque el sistema no es asint6ticamente estable, el indice de desempei'lo es finito Yminimo. De hecho, ya que u(k) = 0 para k = 0, 1,2, ... , la ecuaci6n del sistema se convierte en
XI(k
+ 1) = 0
XI(O)
= 1,
XI(k) = 0,
k=1,2,3, ...
k
=
X2(0) = 1,
x2(k)
= 2,
1,2,3, ...
Observe que el indice de desempei'lo es finito, porque involucra en x,(k), pero no involucra a xlk).
622
Capitulo 8
Este problema de ejemplo ha mostrado que en un caso academico pero no practice, el control optimo cuadratico no produce un sistema asintoticamente estable. Problema A-8-8 Si un sistema de control de tiempo discreto lineal de orden n de una entrada y una salida es de estado completamente controlable, se necesita al menos n periodos de muestreo para lIevarlo desde un estado inicial arbitrario a un estado final deseado, considerando que el vector de control no esta limitado. Por 10 tanto, si se permite que N (N > n) periodos de muestreo, entonces se tendra libertad adicional para satisfacer especificaciones adicionales. La cantidad de energia de control que se necesita depende del intervalo de tiempo (numero de periodos de muestreo) permitido para control. Si el numero de periodos de muestreo permitido es n, el 'orden del sistema, entonces la secuencia de control de tiempo optirno u(O),u(l), ... , u(n - I) es unica. Sin embargo, si se permiten N periodos de muestreo (N) n), entonces es posible mas de una secuencia de control. Cada secuencia de control posible requiere una cierta cantidad de energia de control. En muchas aplicaciones industriales, si son posibles much as secuencias de control, es preferible lograr las tareas de control empleando la cantidad minima de energia. En este problema, se trata de transferir el estado desde un estado inicial arbitrario al estado final deseado (que se supone es el origen del espacio de estado) en N periodos de muestreo y al mismo tiempo usar la minima cantidad de energia de control. Considere el sistema de control definido por
x(k
donde
+ 1) = Gx(k) + Hu(k)
(8-141)
G H
Determine la ley de control que llevara al estado del sistema desde un estado inicial arbitrario al origen en N period os de muestreo (donde N> n) aI usar la minimacantidad de energia, donde laenergiade control se mide con
~~~ u (k )
2
Suponga que el sistema es de estado completamente controlable. Solucion como Con referencia a la ecuaci6n (5-30), el estado x(N) de la ecuaci6n (8-141) se puede escribir
x(N) = GNx(O)
(8-142)
Capitulo 8
623
fN~1
u(N - 2) - fNu(N - 1)
(8-144)
Ya que el estado es completamente controlable, los vectores flo f 2, , f n son linealmente independientes. (Los N - n vectores restantes se pueden expresar como una combinaci6n lineal de estos n vectores lineal mente independientes.) La ecuacion (8-144) se puede reescribir como
x(O) = -FU
donde
(8-145)
u(O) U = [
u~l)
u(N'- 1)
Ahora se encontrara la secuencia de control que satisface la ecuaci6n (8-145) y al mismo tiempominimiza la energia de control total. Observe que la matriz F es de n x Ny tiene rango n. Ya que F no es una matriz cuadrada, la inversa de F no esta definida. Observe que como N > n el numero de seftales de control desconocidas u(O), u( 1), ... , u(N - I) en la ecuaci6n (8-145) es mayor que el numero n de ecuaciones escalares. Un conjunto de ecuaciones escalares en esta situacion sc dice que es indeterminado y posee un numero indefinido de soluciones. Sin embargo, en este caso se tiene una limitante que hace que un conjunto de N variables desconocidas u(O), u( I), ... , u(N - 1) produzcan una norma minima:
2: ~o u 2 (k )
1 N-l
= minimum
Entonces, como se observa en el apendice A (Seccion A-8), existe una solucion unica, Dicha solucion da la secuencia de control que Ileva a un estado inicial arbitrario x(O) al origen en N periodos de muestreo yal hacer esto minimiza la energia de control total. La solucion minimizante en dicho problema, donde el numero de variables desconocidas es mayor que el numero de ecuaciones, se puede obtener en terminos de la pseudoinversa derecha (refierase al apendice A). La pseudoinversa derecha se define como sigue:
~M =
F*(FF*r1
(8-146)
Al emplear la pseudoinversa derecha, la secuencia de control de energia minima u(O), u( I), ... , u(N - 1) que transfiere a un estado inicial arbitrario x(O) al origen esta dada por (8-147) Observe que F*(FF*r' es una matriz de N x n. De donde, F*(FF*r ' posmultiplicada por x(O) es una matriz de N x I. La ecuacion (8-147) se puede rescribir como:
u~l)
[
u(O)
-F*(FF*)-1 x(O)
(8-148)
u(N - 1)
La secuencia de control dada por la ecuacion (8-148) llevara a un estado inicial arbitrario al origen en N periodos de muestreo y requerira la minima cantidad de energia entre todas las secuencias de control posibles que requieren N periodos de muestreo.
624
Problema A-8-9
Considere el sistema
Capitulo ::
x(k + 1)
don de
Gx(k) + Hu(k)
G = [1
Se desea llevar al estado inicial al origen en tres periodos de muestreo. (El periodo de muestreo se supone de I segundo.) Entre la infinidad de posibles opciones para la secuencia de control, determine la secuenciz de control6ptimo que minimizara la energia de control, 0 la que minimizara el siguiente indice de desernpefio.
1 z J = uZ(k) 2 k~O
Solucion
donde
= G-1H = [-0.7181]
1.7181 '
f
Z
= G-zH = [-3.6701]
4.6701 '
f = G- 3H = [-11.6939]
3
12.6939
De donde,
o
XI(O = _[ -0.7181 )] [ xz(O) 1.7181
-3.6701 4.6701
(8-150)
Mediante el uso de la pseudoinversa derecha, se puede obtener la soluci6n de la norma minima de la ecuaci6n (8-150) como
don de
[~m]
u(2)
F RM = F*(FF*)-I
= -FRMX(O) = -F*(FF*)-I[XI(O)]
xz(O)
F = [-0.7181 1.7181
-3.6701 4.6701
-11.6939] 12.6939
1.7181][ 4.6701 150.7326 -166.8147]-1 185.8968 12.6939 -166.8147 0.7191] 0.4738 -0.1929
de donde,
Capitulo 8
625
[0.7910 U(O)] 0.7191][ 5] _ [-0.3598] u(l) = 0.5000 0.4738 -5 - -0.1310 [ u(2) -0.2910 -0.1929 0.4908
(8-151)
La secuencia de control dada por la ecuacion (8-151) llevara al estado inicial al origen en tres periodos de muestreo y tarnbien minimiza la energia de control total. Al emplear la secuencia de control optirno dado por la ecuacion (8-151), el estado se puede transferir como:
Xl(l ) ] [ x2(1)
[1 [1
[1
= [
1.7071] -2.0669
= [
0.3524] -0.8432
1 2 1 2(0) 1 1m ;n = 2k~O u\k) = 2[u + u 2(1) + u2(2)] = 2[(-0. 3598r + (-O.131Or + (0.4908)2]
= 0.1937
Es interesante comparar la energia minima obtenida aqui con la energia requerida para el sistema de control de tiempo optirno. El sistema de control de tiempo optimo requiere 2 periodos de muestreo. En el problema A-6-2. la secuencia de control de tiempo optirno u(O) y u( 1). donde el periodo de muestreo era de 1 segundo. se encontro como
0.5820x,(0) + 0.2433x2(0)
[Refierase a la ecuacion (6-231 ).] Al tomar x1(O) = 5 y xz(O) = -5 y al sustituir estos valores en estas dos ecuaciones, se obtiene u(O) = -1.6935 Y u( 1) = 1.6935. Por 10 tanto. para el control de tiempo minima la energia total requerida es
~[U2(0)
+ u2(1)] =
~[(-1.6935r
+ (1.6935r] = 2.8679
Observe que al permitir que la duracion del control sea de tres periodos de muestreo (3 segundos). en lugar de dos periodos de muestreo, la energia requerida se puede reducir notablemente. Problema A-8-10 Considere el sistema de pendulo invertido mostrado en la figura 8-10. don de un pendulo invertido esta montado sobre un carro impulsado por un motor. En este caso se considera solo el problema en dos dimensiones en que el pendulo se mueve unicamcnte en el plano del papel. El pendulo invertido es inestable ya que puede caer en cualquier momenta a menos de que se aplique una fuerza de control adecuada. Suponga que la masa del pendulo esta concentrada en el extremo de la varilla como se muestra en la figura. (Se supone que la varilla no tiene masa.) La fuerza de control u se aplica al carro. En el diagrama. ees el angulo de la varilla respecto a la linea vertical. Se supone que ees pequefio por 10 que el sen e y el cos e se puede aproximar a e y a I respectivamente. y tambicn se supone Ii que es pequeno por 10 que 00 2 =? (Bajo estas condiciones. las ecuaciones del sistema no lineal se pueden linealizar. )
626
Capitulo 8
z
1-4----x---~
-~c----+--- m
'T' '
I
Figura 8-10
Se desea mantener el pendulo en la posicion vertical en respuesta a cambios escalon en la posicion del carro. (La fuerza de control u se aplica al carro.) Primero obtenga el modelo en el espacio de estado en tiempo continuo. Despucs discretice dicho modelo y obtenga el modelo discrcto. Suponga que el periodo de muestreo T es de 0.1 segundos. Suponga los siguientes val ores numericos para M, my I:
M = 2 kg,
m = 0.1 kg,
0.5 m
(En la seccion 8-4 se disefi6 un controlador digital para el sistema de pcndulo invertido.) Solucion Se define el angulo de la varilla desde la linea vertical como e. (Como se desea mantener al pendulo invertido en posicion vertical, se supone que ees pequeno.) Tarnbien se definen las coordenadas (x, z) del centro del gravedad de la masa como (xc;, zc;). Entonces
XG
= X
+ l sen
ZG
= l cos 0
.
.
-(senO)O 2 -(senO)O
(cos 0)0
di cos 0 =
d2 dt 2 cos 0
.
. .
=-
(cos 0)0
2 -
(sen 0)0
Capitulo 8
627
(M + m)i - ml(senO)O 0
-+-
ml(cos O)B
(8-153)
La ccuacion del movimiento de la masa III en la direccion z no se puede escribir sin considerar el movimiento de la masa III en la direccion x. Por 10 que. en lugar de considerar el movirniento de la masa m en la dircccion r. se considera el rnovimiento rotacional de la masa III alrededor del punta P. Ai aplicar la segunda ley de Newton al movimiento rotacional. se obtiene m -d' 1 cos 0 - m - d t: t:o
[m
d 2 XG
dO Z,;
,
I
sen 0
mgl sen 0
:r (x
2
mgl sen 0
mgl senO
mx cos 0 + mlB
AI sustituir el sen 0
-i-
mg sens
(8-154 )
8. cos 8 I.) aoe -i- O. las ecuaciones (8-153)) (8-154) se pucden linealizar COIllO
siguc:
(M + m)i + mlB = u
mx
(8-155) (8-156)
+ mlB
mgn
Estas ecuaciones lincalizadas son validas mientras a) 8 sean pcquenas. Las ccuacioncs (8-155) ) (8-156) dcfinen un modele matcmatico del sistema del pendulo invcriido. Las ccuaciones del sistema lincalizado, ecuacioncs (8-155) ) (8-156). se pucdc modi ficar a
MlB Mi
= =
(M + m )gO - u
(8-1571 (8-1581
u - mgt)
La ccuacion (8-157) se obtuvo al eliminar .,: de las ecuaciones (8-155)) (8-156). La ecuacion (8-158) se obtuvo al eliminar (j de las ecuaciones (8-155)) (8-156). Las variables de estado XI' X2-.Y' ) .1 4 se defincn como
Xo =
Observe que el angulo aindica la rotacion de la varilla del pendulo alrcdcdor del punto P.) X es la ubicucion del carro. Se considera a X como Ia salida del sistema. 0
Y=X=x,
Fntonces. de la definicion de las variables de cstado y de las ccuaciones (8-157)
~
628
Capitula 8
o
M+m ---y;jfg
1 0 0
00 o 0
000
tl
o o
1
M
1 Ml
(8-159)
(8-160)
Las ecuaciones (8-159) y (8-160) dan una representaci6n en el espacio de estado del sistema de pendulo invertido. (Observe que la representaci6n en el espacio de estado no es (mica. Existen una infinidad de esas representaciones. ) Al sustituir los valores numericos de M, n y I, se obtiene
M+m ---y;jf g
20.601,
m M g = 0.4905,
1 Ml = 1,
M = 0.5
Entonces la ecuaci6n de estado y de salida para el pendulo invertido con carro se convierte en:
x=
donde
Ax + Bu
(8-161 ) (8-162)
y = Cx + Du
=
[
0 20.601
-0.4905
1 0 0 0
0 0] 0 0 0 1 ' 0 0
B=[-! ],
0.5
= [0
1 0],
D = 0
Ahora, se discretiza la ecuaci6n de estado, ecuaci6n (8-161). La discretizaci6n se logra al emplear el siguiente comando de MATLAB:
[G,Hj = c2d(A,B,T)
don de T es el periodo de muestreo involucrado en el sistema de control de tiempo discreto. En este problema T = 0.1 segundos. Entonces el coman do
[G,Hj = c2d(A,B,O.1)
transforrnara la ecuaci6n de estado en tiempo continuo en la ecuaci6n de estado en tiempo discreto. Observe el siguiente comando y salida de MATLAB.
Capitulo 8
Problemas
629
[0
20.601
1 a a a a a a a 1
0];
c2d(A,B,0.1)
G=
1.1048 0.1035 2.1316 1.1048 -0.0025 -0.0001 -0.0508 -0.0025
a a
1.0000
a
0.1000 1.0000
H=
-0.0051 -0.1035 0.0025 0.0501
Por 10tanto, el modelo discretizado en el espacio de estado esta dado como sigue:
+ Du(k)
- 0.0051] -0.1035 [ 0.0025 0.0501
G=
H=
C = [0 0 1 OJ,
=0
PROBLEMAS
Problema B-8-1
Considere el sistema discreto
H=[iJ,
x(O) = [;]
Determine la secuencia de control optimo u(k) que minimiza el indice de desempeiio siguiente:
630
Capitulo 8
Q
Problema B-8-2
Considere el sistema
l~ ~l
x(k + 1)
=
1,
Gx(k) + Hu(k)
donde
G =
y el indice de descrnpeno
l-~.5 ~l
1
x
x(O)
U J
J
donde
2~)x*(k)Qx(k) + u*(k)Ru(k)]
l~ ~.5l
= 1
Determine la ley de control optirno que minimiza el indicc de descmpeno. Tambien determine cl valor minimo deJ.
Problema B-8-3
Considere cl sistema definido por
l;~~~:~n=l~ -iJl;~~~~l
donde -I :s; a < O. Determine el valor de a tal que el indice de dcscmpeno
J
donde
= -
2 k~(J
x*(k)Qx(k)
sc minimice.
Problema B-8-4
Un sistema de control discreto esta definido por la ccuacion
2k~) [x (k ) + u (k )]
2 2
Capitulo 8
Problemas
631
Problema 8-8-5 Considere el mismo sistema tratado en el problema A-8-6. (,Es posible deterrninar una matriz definida positiva P para este sistema') Utilice la ecuacion (8-101) para determinar la matriz P. Problema 8-8-6 Considere el sistema definido por las ecuaciones
x(k + 1) = Gx(k) + Hu(k) y(k) = Cx(k)
donde x(k) es un vector n, u(k) es un vector r, y(k) es un vector-,, G es una matriz de n matriz de n x r. y C cs una matriz de m x n. EI indice de desempeno es
1 oc J = 2k~O [x*(k)Qx(k)
x n.
H es una
+ u*(k)Ru(k)]
donde Q es una matriz Hermitica definida positiva de n x n y R es una matriz Hermitica definida positiva de r x r. La ley de control optimo que minimiza al indice de desernpeno esta dada como u(k) = -Kx(k). Muestrc que si el sistema es de estado cornpletamente eontrolable y observable entonces la ecuacion algebraica de Riccati
= Q + GPG*
ticne una solucion dcfinida positiva unica. Muestre tambien que el sistema en lazo cerrado optirno es establc, 0 G - HK es una matriz estable. Problema 8-8-7 Con referencia al problema A-8-9, resuelva el mismo problema con MATLAB. Determine la sccuencia de control optimo 1/(0), 1/( I) Y 1/(2). Problema 8-8-8 Considere el sistema
l][Xl(k)] o x2(k)
+ 1 u(k),
[1]
Xl(O = )] [ X2(O)
[1]
1
Se desea lIevar el estado inicial al origen en n periodos de muestreo. Determine la ley de control optima que minimiza la energia de control medida con
2, n
3yn
4.
Considere el diseno del sistema de seguirniento mostrado en la figura 8-11. La planta no involucra un integrador, por 10 que se incluye un controlador integral en eI lazo. EI periodo de muestreo T es de O. I segundos. Muestre que el sistema de ecuaciones se puede dar mediante las siguientes ecuaciones en el espacio de estado:
x(k + 1)
= Gx(k) + Hw(k)
w(k) = -Kx(k)
632
r(k)
Capitulo 8
y(kl
L.--------4 k2 ~----....I
x(k) =
v(k) - v(oo) ,
2] H = [ -2'
K = [k2
-ktl
Con referencia al problema B-8-9, se desea disefiar la matriz de ganancia de realirnentacion del estado K = [k2 -kll tal que el sistema tenga una respuesta al escalon razonable. Se supone que se emplea el esquema de control optimo cuadratico. Se supone el indice de desempefio siguiente:
J = 2~o [x(k)*Qx(k)
+ w(k)*Rw(k)]
Si Q y R se escogen como definidas positivas, el sistema resultante es estable. Para este problema, se escogen
Q =
[1~ ~l
R = 1
Observe que Q y R son solo un conjunto posible. (Se pueden seleccionar otras Q y R definidas positivas. El sistema resultante es estable pero diferente para cada conjunto distinto de Q yR.) Empleando la representacion en el espacio de estado del problema B-8-9, determine la matriz K con MATLAB. Escriba un programa en MATLAB. Al utilizar la matriz K as! determinada, obtenga la respuesta al escalon del sistema disenado can ayuda de MATLAB. Dibuje la grafica de y(k) contra k y v(k) contra K.
ApendiceA
Ana/isis vector-matrices
A-l DEFINlelONES
Las matrices que se encuentran con frecuencia en el estudio de la teorfa de control modema son la matriz simetrica, la matriz anti-simetrica, la matriz ortogonal, la matriz Hermftica, la matriz antiHermitica, la matriz unitaria y la matriz normal. Las siguientes ecuaciones definen estas matrices: AT =A AT =-A AA T =ATA= I A* =A A* =-A AA* = A*A = I AA* =A*A donde el superfndice o
A es simetrica A es anti-simetrica
A-2 DETERMINANTES
633
634
Anal i si 5 vector-matriz
x
Ap e ndic e A
3,
a: b2
bj a 2 C 3
a.bee,
C2
Para una matriz A de 4
x
C3
4.
IAI
al a2 a3 a4 b l b2 b3 b4 C[ C2 C3 C4 d[ d 2 d3 d4
I
j la a211 b, Cj C2 d,
d4 i
b41
+ fa
a2
id,
IbJ -Id l
Ib3 b4i + Ib j b211a3 a41 d 2 IC3 C C[ C2 d, d4 4 b21I Ila3 a41 + ICj c211a3 a41 d[ d2. b, b4 d2i IC3 c4
I
1
(A-II
11 x 11 tiene
las siguientes
1. Si dos renglones (0 dos columnas) del determinante se intercambian, s610 el signa del determinante se cambia. 2. EI determinante es invariante bajo la suma de un escalar multiple de un renglon (0 una columna) a otro renglon (0 columna) 3. Si una matriz de 11 x 11 tiene dos renglones (0 columnas) identicos, entonces el determinante es cero. 4. Para una matriz A de 11 x 11,
IAI
11 x 11 es
IRAI
6. Si un rengl6n (0 una columna) se multiplica por un escalar k, entonces el determinante se multiplica por k. 7. Si todos los elementos de una matriz de 11 x 11 se multiplican por k, entonces el determinante se multiplica por k', es decir,
IkAI
8. Si 10 valores propios de A son A, (i
=
knlAI
11),
1,2, ... ,
=
entonces
IAI
1.. 11..2
..
An
,11.
De donde, IAI =F 0 implica que A, =F 0 para i = 1,2, ... yea la secci6n A-6.)
Seccion A-3
Inversion de matrices
635
111,
9.
de
111 x
n y de
111 x 111,
respectivamente,
I~ ~I=I~
I~ ~I =I~
Tambien,
&\ iAilOj,
si si
IAI *-
0y
101
=t- 0
(A-2)
&1 =
0,
IC 0
si si
IAI IDI
~ 0 ~ 0
(A-3) (A-4)
[Para obtener la ecuaci6n (A-2), yea el problema A-i. Para obtener las ecuaciones (A-3) y (A-4). refierase al problema A-2.] 10. Para una matriz A de n x III y una matriz B de III x n. se tiene.
(A-5)
(Para la prueba, yea el problema A-3.) En particular, para III n x I y una matriz B de I x n, se tiene,
=
[I, + ABI
1 + BA
(A-G)
Las ecuaciones (A-2) hasta la (A-G) son utiles en el calculo de los determinantes de matrices de orden grande.
Matri; I/O singular y matri: singular: Una matriz cuadrada A es una matriz no singular si existe una matriz B tal que BA = AB = I. Si dicha matriz B existe, entonces se denota como AI A-I se llama la inversa de A. La matriz inversa A-I existe si IAI no es cero. Si A-I no existe. A se dice ser singular. Si A Y B son dos matrices no singulares, entonces el producto AB es una matriz no singular.
(ABr l = B- 1 A-I
Asimisrno,
n no singular, entonces
(kArl
!A- 1
k
636
An61isis veclor-molriz
Apendic e A
[a d ' b] e
ad - be
-=1=
1 ad - be -e
[d -ba ]
IAI-=I= a
3, donde
e ~ [; h fe] , i
b
A-I =
I~l
I~
con la condici6n de que las inversas indicadas existan. La ecuaci6n (A-7) se refiere comunmente como ellema de inversion de matrices. (Para la prueba, yea el problema A-4.) Si D = In" entonces la ecuaci6n (A-7) se simplifica a (A
+ BC)-I
= A -I - A-I B(I m
+ CA -I B)-I CA- 1
+ BC)-I
= A-I _ A-1BCA-
1 (A-8)
1 + CA-1B
La ecuaci6n (A-8) es util en que si una matriz X de n x n se puede escribir como A + BC,
Seccion A-4
637
donde A es una matriz de n x n cuya inversa es conocida y BC es el producto de un vector columna y un vector renglon, entonces X~I se puede obtener facilmente en terminos de las matrices conocidas A~I, By C. 4. Si A, B, C YD son, respectivamente, matrices de n x n, de n x m, de m x n y de m x m, entonces -A-IB(D - CA-IBr l ] (D - CA-1Br l
(A-9)
con la condicion de que IAI 0/= 0 y ID - CK 1 BI 0/= 0, A [C B]-I _ [ (A - BD- I C)-I D -D- I C(A - BD- I C)-I
0
bien
con la condici6n de que IDI P 0 YIA- BD- 1 CI P O. En particular, si C = 0 0 B = 0, entonces las ecuaciones (A-9) Y (A-I 0) se pueden simplificar como sigue:
(A-II)
o (A-I2)
[Para obtener las ecuaciones (A-9) hast a (A-12), refierase a los problemas A-5 y A-6.]
En esta seccion se revisaran algunas reglas de operaciones algebraicas con matrices y despues se dara la definicion de la derivada e integral de una matriz. Luego se presentaran las reglas de diferenciacion de matrices. Observe que el algebra de matrices difiere del algebra de numeros ordinarios en que la multiplicacion de matrices no es conmutativa y la cancelacion de matrices no es valida.
Multiplicacion por un escalar. EI producto de una matriz y de un esc alar es una matriz en la cual cada elemento esta multiplicado por el escalar. Es decir,
kA
[Z::: Z::;
kant ka n2
Multiplicacion de una matriz por una matriz: La multiplicacion de una matriz por una matriz es posible entre matrices cuyo numero de columnas en la primera matriz es igual al nurnero de renglones en la segunda. De otra forma, la multiplicaci6n no esta definida. Considere el producto de una matriz A de n x m y una matriz B de m x r:
638
Anoli si s vector-matriz
Ap e ndic e
al2
AB =
[ an
afl
an
a,mr'
a2m a nm
b 21
b l2 bn
b m2
b, b 2r ]
anI
a n2
b ml
b.;
cl2 _ [ en C21
Cnl cn
c" ] C2r
c.;
m
Cn2
donde
C,k
L a,jb
J~l
jk
Por 10 tanto, la multiplicaci6n de una matriz de n x m por una de m x r da una matriz de n x r. Sc debe notar que, en general, la multiplicaci6n de matrices no es conmutativa; es decir,
AB
*-
BA
en general
Por ejemplo
AB = [ all
a21
an
l2J[b ll b l2 J b 21 b
= [
a12 an
bn J h2
y
BA = [b ll
al2J
a22
Asi, en general AB *- BA. De donde, el orden de la multiplicaci6n es significativo y se debe preservar. Si AB = BA, las matrices A y B se dicen que conmutan. En las matrices A y B anteriores, si, por ejernplo, a l2 = a 21 = b l 2 = b2 1 = 0, entonces A y B conmutan. Para matrices diagonales A y B de n x n,
A(Be)
;.0]
a.. b
IJ
k .J
kt b
Jk
kh
Seccion A-4
639
m,n
Si A Y B son matrices de n x distributiva se cumple:
111
1,2,3, ...
111 x
y C Y 0 son matrices de
(A + B)(C + D)
AC + AD + BC + BD
Esto se puede probar al comparar el elemento (i, j) de (A + B) (C + 0) con el elemento (i, j) de (AC + AO + BC + BO).
Comentarios sobre fa cancelacion de matrices. La cancelaci6n de matrices no es valida en el algebra de matrices. Considere el producto de dos matrices singulares A y B. Tome par ejemplo,
Entonces
2. B
3.
Se puede ver facilmente que, si A y B son matrices no cera y AB = 0, entonces A y B deben ser singulares. Suponga que B no es cera y A es no singular. Entonces IAI *" 0 y A-I existen. Entonces se obtiene
A-I AB = B = 0
que contradice la suposici6n de que B no es cera. En esta forma se puede prabar que A y B deben ser singulares si A*"O Y B *" O. De forma similar, observe que si A es singular entonces tam poco AB = AC ni BA = CA implican que B = C. Sin embargo, si A es una matriz no singular, entonces AB = AC implica que B = C Y BA = CA implica que B = C.
640
An61isis
vector-matriz
Ape ndlce
Derivada e integral de una matriz: La derivada de una matriz A(t) de n x m se define como la matriz cuyos elementos (i, j) son las derivadas de las elementos (i, j) de la matriz original, si se considera que todos los elementos aij(t) tiene derivadas con respecto a t:
d dta1m(t) d dt anm(t)
De forma similar, la integral de una matriz A(t) de n x m con respecto a t se define como la matriz cuyos elementos (i, j) son las integrales de los elementos (i, j) de la matriz original, 0
A(t)dt
f f
all(t) dt
... ...
:
anl(t) dt
f f
alm(t) dt amn(t) dt
al considerar que los elementos aij(t) son integrables como funciones de t. Diferenciacion de una matriz: entonces
- (A
d dt
+ B)
= -
d d A +- B dt dt
(A-13) (A-I4)
~(AB)
dt
dAB + A dB dt dt
~ [Ak(t)]
dt
Tambien,
dA k(t) + A dk(t) dt dt
(A-I5)
f
a
bd A B dt = ABlb dt a
r
a
A dB dt
dt
(A-I6)
Secci6n A-4
641
y tambien
se obtiene
-=
aJ ax
a~l
aJ aXn
~]
. ,
a2J ax2
aJ ax\axn ]
a2 J
ax~
!!.. V(x(t
dt
ax
dt
Jacobiano. Si una matriz f(x) de m x 1 es un vector funcion de un vector-n x (nota: un vector-n es un vector de dimension n), entonces
af ax
(A-I8)
af, ah aX n aX n
Dicha matriz de n x m se llama Jacobiano. Observe que, al utilizar esta definicion de Jacobiano, se tiene -Ax = AT
a ax
(A-I9)
642
An o li si s vector-motriz
Ap e n d i c e
,t.
EI hecho de que la ecuaci6n (A-\9) se cumple, puede verse facilmente del siguiente ejemplo: Si A;x estan dados por
entonces
a -Ax = ax
[""
Ax
T
a!2 au
a" ] an
aD
= AT
Ii
r.
ax
A "-
- x T Ax
ax
= 2Ax
en;L-:~
n y x es un vector-n complejo
-x*Ax = Ax
a iJx
[Para obtener las ecuacioncs (A-20) y (A-2\), vease el problema A-7,] Para una matriz real de n x m, un vector-n real x, y un vector-m real y, se tiene
- x T Ay = Ay
ax
(A-:!2
(A-23)
x 111,
a iJx x*Ay =
-x*Ay ay
Ay
(A-24)
= A Tx
(A-25 )
642
Ano li sis
v e ctor-rn o t ri z
Ap e ridic e
EI hecho de que la ecuaci6n (A-19) se cumple, puede verse facilmente del siguiente ejernplo: Si A) x estan dados por
entonces
atl
iJx! a -Ax= ax
/Jfl
aX2
atl
ax)
["" "" ]
an a2e = AT aD a23
Asi, se tiene la siguiente f6rmula util, Para una matriz real A de n x n y un vector- real x,
- x TAx = Ax + AT x ax
Adernas, si A es una matriz real simetrica, entonces
(A-20)
- x TAx = 2Ax ax
Observe que si A es una matriz Hermitica de n
x
-x*Ax = Ax ax
[Para obtener las ecuaciones (A-20) y (A-21), vease el problema A-7.] Para una matriz real de n x m, un vector-n real x, y un vector-m real y, se tiene
-xTAy = Ay ax
(A-22)
(A-23 )
De forma Similar. para una matriz cornpleja A de n complejo y, se tiene
x
(A-24 )
_
(A-25 )
Seccion AS
Vectores
y onclisis vectorial
643
[Para obtener las ecuaciones (A-22) a (A-25), refierase al problema A-8.] Observe que la ecuaci6n (A-25) es equivalente a la siguiente ecuaci6n:
-x*Ay = A*x
ay
Los vectores
0
XI'
x2,
. . . , XII se
dicen ser
Cz X2
+ ... +
Cn X n =
donde
,ell son constantes, irnplica que C I = e2 = . . . = ell = 0. POI' el contrario, los vectores se dicen ser /inea/mente dependientes si y s610 si XI se puede expresar como una combinaci6n lineal de XI (j = 1,2, ... , n;j *- i). Es importante observar que si los vectores XI' x2 ' , XII son linealmente independientes y los vectores XI' x., ... , XII' XII+ I son Iinealmente dependientes, entonces XII I se puede expresar como una combinaci6n lineal unica de XI' X2, . . . ,
C I, C 2' . . .
XI' X2 , . . . , XII
XII'
Condiciones uecesarias Y suficientes para la independencia lineal de vectores. Se puede probar que las condiciones necesarias y suficientes para que los vectores XI (i = 1,2, ... , m) sean linealmente independientes son que:
1. m S. n. 2. Exista almenos un determinante de columna-m no cero de la matriz de n consistan de XI' X2, , XIII'
x III
cuyas columnas
XI'
x2 ,
... ,
XII la condici6n
IAI"* 0
donde A es una matriz de n x n cuya columna i esta hecha de los componentes de
XI (i =
I, 2, ... , n).
Producto inferno. Cualquier regia que asigna a cada par de vectores X y Y en un espacio vectorial una cantidad escalar se llama producto interno 0 producto esca/ar y se simboliza por (x, y), si se considera que los cuatro axiomas siguientes se satisfacen:
1.
2.
3.
4.
(X + y, z + w)
(x, x) > 0,
para x*-O
644
Ap e ndic e A
En cualquier espacio vectorial fin ito, existen muchas definiciones del producto interne, todas satisfacen los cuatro axiomas. En este libro, a menos de que se especifique otra cosa, se adoptara la siguiente definicion de producto intemo: el producto interno de un par de vectores-n x y y en un espacio vectorial Vesta dado por
n
(x,y) = X1Yl
LX,Y,
i=l
(A-26)
donde la suma es un numero complejo y donde las .x: son los complejos conjugados de los X" Esta definicion claramente satisface los cuatro axiomas. El producto interno tambien se puede expresar como: (x, y) = x*y donde x* denota la transpuesta conjugada de x. Asimismo (x,y) = (y,x) = y*x = yT x = x*y El producto interno de dos vectores-n x y y con componentes reales esta dado por
n
(A-27)
+ xnYn
En este caso, es claro que se tiene
LX,Y'
i=1
(A-28)
(x, y) = Xl Y = v' x,
Se hace notar que el vector x real 0 complejo se dice normalizado si (x, x) = I. Tambien se senala que, para un vector-n, x, x*x es un escalar no negativo, pero xx* es una matriz de n x n. Es decir,
y xx * =
x,~" 1 X2 Xn
XnXn
Observe que, para una matriz compleja A de n x n y vectores-n complejos x y y, el producto interno de x y Ay Y el de A *x y y son el mismo,
(x, Ay)
= x*Ay,
(A*x, y) = x*Ay
De forma similar, para una matriz real de n x n y vectores-n reales x y y, el producto interno de x: Ay y el de AI x y y son el mismo, 0
Seccion AS
645
Transformaciones unitarias. Si A es una matriz unitaria (es decir, si A-I = A * ), entonces el producto interno (x, x) es invariante bajo la transformaci6n lineal x = Ay, porque
(x,x) = (AY,Ay) = (y,A*Ay) = (y,A- 1Ay) = (y,y)
Dicha transformacion x
=
x,x
en 2~ =I y,y"
Transformaciones unitarias. Si A es una matriz unitaria (es decir, si A-I = A *), entonces el producto interno (x, x) es invariante bajo la transfonnaci6n lineal x = Ay, porque
(x,x) = (AY,Ay) = (y,ATAy) = (y,A-1Ay) = (y,y)
Dicha transformaci6n x
=
Ay, que transforma a 2~= I x,' en 2:'= I y,', se llama una transformaci6n
ortogonal. Normas de un vector. Una vez definido el producto interno, se puede emplear este producto intemo para definir las normas de un vector. EI concepto de norma es de alguna forma similar al del valor absoluto. Una norma es una funci6n que asigna a cada vector x en un espacio vectorial dado un nurnero real denotado por Ilxll tal que
1.
2.
3.
Ikl Ilxll,
4. 5.
para toda x y y
(desigualdad de Schwarz)
Definiciones distintas de normas se encuentran en los libros. Sin embargo, la siguiente definici6n se utiliza ampliamente. Una norma de un vector se define como la raiz cuadrada no negativa de
Las cinco propiedades de las normas listadas antes pueden ser obvias, excepto quiza las dos ultimas desigualdades. Estas dos desigualdades se pueden probar como sigue. De las definiciones del producto intemo y de la norma, se tiene
IIAx
+ IIYl12 + !ly112
2:
646
An61isis
vector-matriz
Apan dic e
Si se escoge
A--
_ (x,y)
entonces
W '
para x
=1=
y
para x Para x = 0, es claro que
=1=
(A-30)
[x +
Esta se puede probar facilmente, ya que
yll
~ Ilxll
+ Ilyll
(A-31)
[x + yW = (x + y, x + y)
~ IlxW
~ IlxW
+ lIyW + 211xllilyll
= (11xll + IIYII)2
Las ecuaciones (A-26) hasta la (A-31) son utiles en la teoria de control modema. Como ya se menciono, existen diferentes definiciones de normas. Tres de estas definiciones son las siguientes.
1. Una norma
[
i~l}~l
Q'iXiXi]1/2
2::
La matriz Q = T*T es Hermitica, ya que Q* = T*T = Q. La norma tlxl! = (X*QX)1/2 es una forma generalizada de (X*X)1/2, la cual se puede escribir como (X*IX)1I2. 2. Una norma se puede definir como la suma de las magnitudes de todos los componentes XI:
n
IIxll
;=1
2: Ix,l
Seccion AS
647
3. Una norma se puede definir como el maximo de las magnitudes de todos los componentes X,: Ilxli
=
max {IXil}
i
Se puede mostrar que las diferentes normas que se acaban de definir son equivalentes. Entre otras definiciones de normas, la norma (X*X)1/2 es la que mas se utiliza en calculos explicitos.
Normas de una matriz: EI concepto de normas de un vector se puede extender a las matrices. Existen varias definiciones diferentes de normas de una matriz, algunas de elias son las siguientes.
1. Una norma IIAII de una matriz A de n
x
n se define por
=
mink
= max{x*A*Ax;x*x = I}
=
que significa que IIAI1 2 es el maximo del "valor absoluto" del vector Ax cuando x*x 2. Una norma de una matriz A de n x n se puede definir por
n n
I.
IIAII donde laijl es el valor absoluto de aij. 3. Una norma se puede definir como IIAII
= LL laiil
i~li~1
Observe que todas las definiciones de normas de una matriz A de n propiedades: 1. IIAII
=
IIA*II IIA
IIAII
IIATII
2.
3.
+ BII
-s IIAII
+ IIBII
4.
Ortogonalidad de veetores. Si el producto interno de dos vectores x y y es cero, 0 (x, y) = 0, entonces los vectores x y y se dice que son ortogonales con respecto al otro. Por ejemplo, los vectores
648
An61isis
vector-matriz
Ap e nd ic e
son ortogonales en pares y por 10 tanto forman un conjunto ortogonal. En un espacio vectorial de dimension n, los vectores X h X 2, . . . ,
XII
se definen por
x) = 8
} 1 ,
(Xi, x.) = 1
(x., x)
0,
i oF j
donde i, j = 1, 2, ... , n. Dicho conjunto de vectores se dice ortonormal, ya que los vectores son ortogonales a cada uno de los otros y cada vector esta nonnalizado. Un vector X no cero se puede nonnalizar al dividir X entre Ilxll. El vector normalizado x/llxll es un vector unitario. Los vectores unitarios XI' x2, . . . , XII forman un conjunto ortonormal si son ortogonales por pares. Considere una matriz unitaria A. AI dividir a A en vectores columnas AI' A z, ... , AII' se tiene
Ai ] [ Ai Ai MA [A: Al A: A
Az
2
Ai An] MAn
A: An
1
de don de
At A j = (AI,A j ) = 1 At Ai = (A j , A}) = 0,
i oF j
Por 10 tanto, se ve que los vectores columna (0 vectores rengl6n) de una matriz unitaria A son ortononnales. Los mismo es verdadero para matrices ortogonales, ya que son unitarias.
Seccion A-6
649
En esta seccion se revisaran propiedades importantes del rango de una matriz y despues se daran definiciones de valores propios y vectores propios. Por ultimo, se discutiran las formas canonicas de Jordan, las transformaciones de similitud y la traza de una matriz de n x n.
Rango de una matriz: Una matriz A se dice de rango m si el nurnero maximo de renglones (0 columnas) linealmente independientes es m. Por 10 tanto, si existe una submatriz M de m x m de A tal que IMI *- 0 y el determinante de cada submatriz de r x r (donde r ~ m + I) de A es cero, entonces el rango de A es m. [Observe que, si el determinante de cada submatriz de A de (m -t- I) x (m + 1) es cero, entonces cualquier determinante de orden s (don de s > (m + I)) es cero, ya que cualquier determinante de orden s > (m + I) se puede expresar como una suma lineal de determinantes de orden m + I.] Propiedades del rango de una matriz: importantes del rango de una matriz.
A continuaci6n se enumeran algunas propiedades
1. EI rango de una matriz es invariante bajo el intercambio de dos renglones (0 columnas), 0 la suma de un escalar multiplo de un rengl6n (0 una columna) en otro renglon (0 columna), 0 la multiplicacion de cualquier rengl6n (0 columna) por un escalar no cero. 2. Para una matriz A de n x m,
rango A :s; min (n, m) 3. Para una matriz A de n x n, una condici6n necesaria y suficiente para que el rango A IAI *- o. 4. Para una matriz A de n x m, rango A * = rango A o rango AT = rango A
0
=
n es que
al rango de B;
Por 10 tanto, si A es una matriz de n x I y B es una matriz de I x m, entonces el rango AB = I a menos de que AB = O. Si una matriz tiene rango 1, entonces esta matriz se puede expresar como un producto de un vector columna por un vector renglon. 6. Para una matriz A de n x n (donde IAI *- 0) y una matriz B de n x m, rango AB = rango B De forma similar, para una matriz
A de m x m (donde IAI *=
0) y una matriz B de n x m,
rango BA
rango B
x
n, el determinante
IAI -
AI
se denomina polinomio caracteristico de A, que es un polinomio de grado n en A. La ecuacion caracteristica esta dada por
IAI - AI
650
Analisis
vector-matriz
Ap e rid i c e
fAI - AI
An + alA n- 1 + ... + a n- ! A + an = 0
Las n raices de la ecuaci6n caracteristica se denominan valores propios de A. Tambien se lIaman
raices caracteristicas.
Se hace notar que una matriz real A de n x 11 no necesariamente tiene valores propios reales. Sin embargo, para una matriz real A de n x 11, la ecuaci6n caracteristica 11.1- AI = es un polinomio con coeficientes reales, y por 10 tanto cualquier valor propio complejo debe ocurrir en pares conjugados; es decir, si a +j f3 es un valor propio de A. entonces (Y - j f3 tam bien es un valor propio de A. Existe una relaci6n importante entre los valores propios de una matriz A de n x 11 y los de A-!. Si asumimos los valores propios de A son A, y los de A I hasta {L" entonces
{L,
= A,-I,
i = 1,2, ... ,n
Es decir, si A, es un valor propio de A, entonces A~' es un valor propio de A:'. Para probar esto, observe que la ecuaci6n caracteristica de la matriz A se puede escribir como
p.,=A- I
Por 10 tanto, si A es un valor propio de A, entonces {L = 1.- I es un valor propio de A:'. Por ultimo, observe que es posible que, para dos matrices cuadradas A y B,
IAI - ABI =
(Para la prueba, vease el problema A-9.)
fAl -
BAI
se dice que es un vector propio asociado con un valor propio A, de A, donde A es una matriz de n x n. Como los cornponentes de x, se determinaron de un conjunto de n ecuaciones algebraicas homogeneas lineales con un factor constante, si x, es un vector propio, entonces para cualquier escalar a 1= 0, aX j es tambien un vector propio. EI vector propio se dice ser un vector propio normalizado si su longitud 0 valor absoluto es la unidad.
Ssccion A-6
651
Las matrices A y B n
p- I AP
La matriz B se dice que se obtiene a partir de A mediante una transformacion de similitud, en la que Pes la matriz de transformaci6n. Observe que A se puede obtener de B mediante una transformaci6n de similitud con la matriz de transformaci6n p- I , ya que
Diagonalizacion de matrices. Si una matriz A de n x n tiene n valores propios distintos, entonces existen n vectores propios linealmente independientes. Si la matriz A tiene valores propios multiples con multiplicidad k, entonces existe al menos uno y no mas de k vectores propios linealmente independientes asociados con estos valores propios. Si una matriz de n x n tiene n vectores propios linealmente independientes, se puede diagonalizar mediante una transformaci6n de similitud. Sin embargo, una matriz que no tenga un conjunto completo de n vectores propios linealmente independientes no puede ser diagonalizada. Dicha matriz se puede transformar en la forma can6nica de Jordan. Forma canonica de Jordan. Jordan si
Una matriz J de k
J=
rJ,
0
A
J"2
J~,1
a
1
a
Jp ,
1 A
a a
A
a a a a a a
Las matrices J 1', se llaman bloques de Jordan de orden PI' Observe que la A en J I' Yaquella en J 1', puede ser 0 no la misma, y que
PI + P2 + ... + P, = k
~]
POI' ejemplo, en una matriz J de 7 x 7. si PI = 3. P: = 2, P, = I, P~ = I. Ylos valores propios de J son AI. AI' AI' AI. AI' A". A7 , entonces la forma can6nica de Jordan puede estar dada pOI'
o
J=
a:
I
1 : AI:I
I
----------~--------I
"a
o
a
: Al
1_- - - _ _ - -
Al
_ --I
_~()L
: A7
652
An61isis
vector-matriz
Ap e nd ic e A
Observe que una matriz diagonal es un caso especial de la forma canonica de Jordan. La forma canonica de Jordan tiene las propiedades de que los elementos sobre la diagonal principal son los valores propios de A y de que los elementos inmediatamente arriba (0 abajo) de la diagonal principal son 1 0 0 y todos los demas elementos son cero. La determinacion de la forma exacta del bloque de Jordan puede no ser simple. Para ilustrar algunas estructuras, considere una matriz de 3 x 3 que tiene un valor propio triple de AI' Entonces una de las siguientes form as canonicas de Jordan es posible:
I= [ ~Io_ t=~0:J_~_]
I
Al
Cada una de las tres matrices anteriores tiene la misma ecuacion caracteristica (A - AI / = O. La primera corresponde al caso don de existe un solo vector propio linealmente independiente, ya que a] denotar a la primera matriz como A y al resolver la siguiente ecuacion para x,
La segunda y tercer matrices tienen, respectivamente, dos y tres vectores linealmente independientes. (Observe que s610 la matriz diagonal tiene tres vectores linealmente independientes.) Como se ha visto, si una matriz A de k x k tiene k valores propios multiples, entonces se puede mostrar 10 siguiente: 1. Si el rango de AI- A es k - s (don de I ~ s ~ k), entonces existen s vectores propios linealmente independientes asociados con A. 2. Existen s bloques de Jordan asociados con los s vectores propios. 3. La suma de los 6rdenes Pi de los bloques de Jordan es igual ala multiplicidad k. Por 10 tanto, como se demostro en las matrices de 3 x 3 anteriores, aun si la multiplicidad de los valores propios es la misma, el numero de bloques de Jordan y sus ordenes pueden ser diferentes en funcion de la estructura de la matriz A.
Transformacion de similitud cuando una matriz de n x n tiene valores propios dlstintos. Si los n valores propios de la matriz A son diferentes, existe un vector propio asociado a cada valor propio \. Se puede probar que dichos n vectores propios x., X2, .. , XII son linealmente independientes. Sea una matriz P de n x n
Pi
Xi'
i=1,2, ... ,n
Secci6n A-6
y transformaciones de similitud
653
XI'
La matriz P definida de esta forma es no singular, y p- I existe. Observe que los vectores propios X2, . . . , XII satisfacen la ecuacion
AXI = Alxj AX2 =
A2 x2
AX n =
An x,
0,
en terminos de la matriz P,
AI
AP = P 0 [
AI premultiplicar esta ultima ecuaci6n por p- I , se obtiene
Por 10 tanto, la matriz A se transforma en una matriz diagonal mediante una transformaci6n de similitud. EI proceso que transforma la matriz A en una matriz diagonal se llama diagonalizacion de la matriz A. . Como se establecio anteriormente, un multiplo escalar del vector propio Xi es tambien un vector propio, ya que ax, satisface la siguiente ecuacion:
En consecuencia, se puede escoger a para que la matriz P sea tan simple como sea posible. Para resumir, si los valores propios de una matriz A de n x n son distintos, entonces hay exactamente n vectores propios que son lineal mente independientes. Una matriz de transformacion P que transforma a A en una matriz diagonal se puede construir de los n vectores propios linealmente independientes.
Transformacion de similitud cuando una matriz de n XII tiene valores propios multiples. Se supone que una matriz A de n x n involucra un valor propio Al de multiplicidad k y otros valores propios Ak + I' Ak+2' ... , All que son distintos y diferentes de AI' Es decir, los valores propios de A son
654
An61isis
vector-matriz
Apendice
Primero se considerara el caso cuando el rango de A1 I - A es n - 1. Para este caso existe un solo bloque de Jordan para el valor propio multiple AI' y existe un solo vector propio asociado con este valor propio multiple. EI orden del bloque de Jordan es k, que es el mismo que el orden de la multiplicidad del valor propio AI. Observe que, cuando una matriz A de n x n no tiene n vectores propios linealmente independientes, no puede ser diagonalizada, pero se puede reducir a una forma canonica de Jordan. En el presente caso, s610 existe un vector propio linealmente independiente para AI. Ahora se investigara si es posible encontrar k- 1 vectores que esten asociados de alguna forma con este valor propio y que sean linealmente independientes de los vectores propios. Sin prueba, se mostrara que esto es posible. Primero, observe que el vector propio XI es un vector que satisface la ecuacion
por 10 que XI se elimina mediante A - All. Como no se tienen suficientes vectores que son eliminados por A -AI I, se buscan vectores que sean eliminados por (A - Al 1)2, (A - AI 1)3, Yasi sucesivamente, hasta obtener k - 1 vectores. Los k - 1 vectores determinados de esta forma se Haman vectores propios generalizados. Se definen los k - 1 vectores propios generalizados como X2, X3, . . . , Xk Entonces estos k - 1 vectores propios generalizados se pueden determinar de las ecuaciones
(A - AII)XI = 0 (A - AII)2 x 2
=
(A - AII)XI = 0 (A - AII)X2 = Xl
Observe que
o
(A-33) EI vector propio XI y los k - 1 vectores propios generalizados x2 , x3 , . , x, determinados de esta forma constituyen un conjunto de k vectores linealmente independientes. Una forma adecuada para determinar los vectores propios generalizados es comenzar con Xk. Es decir, se determina el xk que satisfara la ecuacion (A-32) y al mismo tiempo se obtendra un vector no cero que (A -AI It- I xk Cualquiera de estos vectores no cero se puede considerar un vector propio posible XI. Por 10tanto, para encontrar el vector propio XI' se aplica un proceso de reduccion
Seccion A-6
655
por rengl6n a (A -AI I)k Y se encuentran k vectores linealmente independientes que satisfacen la ecuaci6n (A-32). Entonces estos vectores se prueban para encontrar uno que de un vector no cero en el lado derecho de la ecuaci6n (A-33). (Observe que se comienza con XI entonces se deben hacer selecciones arbitrarias en cada paso para determinar X 2, X], . , X k Esto consume tiempo y no es conveniente. Por esta raz6n, este enfoque no se recomienda.) Para resumir 10 que se ha discutido, el vector propio Xl y los vectores propios generalizados X2, x], ... , Xh satisfacen las siguientes ecuaciones:
AXI = AlXl AX2 = Xl
AlX2
Los vectores propios xk + I' xk + 2' . , XII asociados con los valores propios distintos Ak + I' Ak + 2' A", respectivamente, se pueden determinar de
.. ,
Ahora se define
donde los n vectores columnas de S son linealmente independientes. Por 10 tanto, la matriz S es no singular. Entonces, al combinar las ecuaciones de los vectores propios anteriores y las ecuaciones de los vectores propios generalizados en una sola ecuaci6n, se obtiene
A[XI : X2: . : Xk : Xk+l : . :
xn ]
1
0:,
I I
I
I I
1 , :
AI: 0 --------------------,---------------Ak + 1 0
o:
,
I I
o
De don de
: 0
656
Anoli si s vector-matriz
Ap e n dic e
2 [J,JAL h;;;_:
o :
O_j
An
En la discusion anterior se consider6 el caso en el que el rango de AI I - A era n - 1. A continuaci6n se considera el caso en el que el rango de Al 1- A es n - s (don de 2 ::; s ::; n). Ya que la matriz A involucra k valores propios multiples AI Y otros valores propios A + I> A + 2' . . . , All que son k k distintos y diferentes de AI, se tienen s vectores linealmente independientes asociados con el valor propio AI' Por 10 tanto existen s bloques de Jordan que corresponden al valor propio AI' Por conveniencia en la notaci6n, se define los s vectores propios linealmente independientes asociado con el valor propio Al como VII' v2 1> , V,I' Se define a los vectores generalizados asociados con Vii como V , V , , v, donde i = 1,2, ... ,s. Entonces existen en total k vectores (vectores 12 i3 propios y vectores propios generalizados), que son
. ,
PI
+ P2 + ... + Ps
Observe que PI' P2' ... , p, representan el orden de cada uno de los s bloques de Jordan. (Para determinar los vectores propios generalizados, se sigue el metodo discutido antes. Para ejemplificar los detalles, vease el problema A-II.) Se define una matriz de n x k que consiste de VII' V12, , v,p, como
[XI: X2:
: X P I:
: sd
xd
= [SI : S2:
y se define
S = [S(AI) : Sk+1 : Sk+2 : ... : Sn] = [SI : S2: ... : Sn]
donde
Seccion A-6
y transformaciones de similitud
657
Observe que x, + I' x, + 2' . . . , XII son los vectores propios asociados con los valores propios Ak + iAk ~ 2' . . . , All' respectivamente. La matriz S definida de esta forma es no singular. Ahora se obtiene
JpPl)
:
:
I
Jp 2(A1)
AS = S
I
I
------------------------------,----------------
Jp,(A 1) i 0
o :A
I I
k+]
o
don de JI' (AI) esta en la forma
:
I
An
JpJA1) JpPl)
S-1 AS =
:
i
I
-------------------------------~----------------
JI'J.\]):
I I
o :
I I
0 Ak + 1 0
An
Por 10 tanto, se ha mostrado que, al utilizar un conjunto de n vectores linealmente independientes (vectores propios y vectores propios generalizados), cualquier matriz de n x n se puede reducir a una forma can6nica de Jordan mediante una transformaci6n de similitud.
Transformacion de similitud cuando una matriz de Il x Il es normal. Primero, se recuerda que una matriz es normal si es real simetrica, Hermitica, real anti-simetrica, anti-Herrnitica, ortogonal, o una matriz unitaria. Suponga que una matriz normal de n x n tiene un valor propio Al de multiplicidad k y que sus otros n ~ k valores propios son distintos y diferentes de AI' Entonces el rango de A ~ Al I es n - k. (Refierase al problema A-12 para la prueba.) Si el rango de A ~ Al I es n ~ k, hay k vectores propios XI' X2, . . . , x, linealmente independientes que satisfacen la ecuaci6n
(A - AII)x; = 0, i = 1,2, ... , k
Por 10 tanto, existen k bloques de Jordan para el valor propio AI' Ya que el numero de bloques de Jordan es el mismo que la multiplicidad del valor propio AI' todos los bloques de Jordan son de primer orden. Como los n ~ k valores propios restantes son distintos, los vectores propios asociados con estos valores propios son linealmente independientes. Por 10 tanto, la matriz normal de n x n tiene en total n vectores propios linealmente independientes, y la forma can6nica de Jordan de la matriz normal es una matriz diagonal.
658
Ano li si s vector-motriz
Ap e ridi c e
Se puede probar que si A es una matriz normal de n x n, entonces, sin importar que los valores propios incluyan valores propios multiples, existe una matriz unitaria U de n x n tal que U- 1 AU
U*AU
diag(AJ, A2 ,
. ,
An)
don de D es una matriz diagonal con sus valores propios en la diagonal principal.
1.
tr AT = tr A
B) = tr A
tr B
,
Al
+ A2 + ... + An
BA
0
AB
*- BA.
LL
i~lj~l
aijb j i
a" Ca
= tr aa T C
Observe que la ecuaci6n (A-34) se puede probar como sigue. Al emplear una transformaci6n de similitud, se tiene P I AP o SI AS Es decir
A
= = =
D = matriz diagonal
PDP- I
SJS
De forma similar,
SeccicSn A-7
Formas cuodroticcs
659
Propiedades invariantes bajo transformaciones de similitud. Si una matriz A de n x n se puede reducir a una matriz similar que tenga una forma simple, entonces se pueden observar las propiedades importantes de A. Una propiedad de una matriz se dice invariante si esta es poseida por matrices similares. Por ejemplo, el determinante y el polinomio caracteristico son invariantes bajo transformaciones de similitud, como se muestra a continuacion. Suponga que p- I AP = B. Entonces
IAI - 81 = IAI - p-I API = IP-I(AI)P - p- I API = IP-I(AI - A)PI = Ip-111AI - Allpl = IAI - AI Ip-IIIPI = IAI - AI
Observe que la traza de una matriz es tambien invariante bajo transformaciones de similitud, como se mostro anteriormente:
trA = trp-I AP
Sin embargo, la propiedad de simetria de una matriz no es invariante. Observe que s610 las propiedades invariantes de matrices presentan caracteristicas intrinsecas de la c1ase de matrices similares. Para determinar las propiedades invariantes de una matriz A, se examina la forma canonica de Jordan de A, ya que la similitud de dos matrices se puede definir en terminos de la forma canonica de Jordan como: la condicion necesaria y suficiente para que dos matrices A y B de n x n sean similares es que la forma canonica de Jordan de A y la de B sean identicas,
Formas cuadraticas,
x Ax
= 2: 2: aijXiXj,
i=1 j=1
se denomina una forma cuadratica real en XI" Con frecuencia, una forma cuadratica real se llama simplementeforma cuadrdtica. Observe que x T Ax es una cantidad escalar real. Cualquier forma cuadratica real se puede escribir siempre como x T Ax. Por ejemplo,
x,H
-1 m:]
660
entonces
Anc5lisis
vector-matriz
Ap e n d ic e
A=B+C
Observe que
y
CJ=-C
De donde, una matriz real A de n x n se puede expresar como una sum a de una matriz real simetrica y una matriz real anti-simetrica. Ya que x J Cx es una cantidad escalar real, se tiene
Esto significa que una forma cuadratica para una matriz real anti-sirnetrica es cera. Por 10 tanto,
x*Ax =
2: 2: a/jx/Xj,
i~l j~l
se denomina una forma cuadratica compleja, 0 forma Herrnitica. Observe que la cantidad escalar x* Ax es real, porque
Ay =
2: 2: aijx/Yj
i~l j~l
se denomina unaforma bilineal real en x, Y y/. x J Ayes una cantidad escalar real. Para una matriz A compleja de n x m, un vector-n x complejo, y un vector-m y complejo, la forma
n
x*Ay =
2: 2: ajjXiYj
i~l j~l
se denomina unaforma bilineal compleja. x* Ayes una cantidad escalar real. Una forma cuadratica x J Ax donde A es una matriz simetrica real (0 forma Hermitica x* Ax, donde A es una matriz Herrnitica), se dice ser definida positiva si
Definicion y semideflnicion.
xJAx>O x J Ax
=
(ox*Ax>O),
(0 x*Ax
=
para x v D para x
=
0),
Seccion A-7
Formas cuodroticcs
661
=1=
=
0 0 0
Xl
Ax
(0
Ax:2: 0 Ax
=
(0 x*Ax:2: 0),
(0 x*Ax
=
=1=
0),
para x = 0
Xl
"* 0
=
x' Ax = 0
Ax:S; 0 Ax
=
(0 x*Ax
0),
para x
=1=
0),
para x = 0
Ax (0 x*Ax) puede ser de cualquier signa, entonces Xl Ax (0 x*Ax) se dice ser indefinida. Observe que si x I Ax (0 x*Ax) es definida positiva (0 negativa) se dice que A es una matriz definida positiva (0 negativa). De forma similar, A se llama una matriz semidefinida positiva (0 negativa) si x I Ax a x* Ax es semidefinida positiva (0 negativa): la matriz se llama indefinida si Xi Ax a x* Ax es indefinida. Observe que los val ores propios de una matriz real simetrica a matriz Hermitica de n x n son reales. (Para la prueba, vease el problema A-I3.) Se puede mostrar que una matriz A real simetrica a matriz Herrnitica de n x n es una matriz definida positiva si todos los valores propios A, (i = I, 2, ... , n) son positivos. La matriz A es semidefinida positiva si todos los valores propios son no negativos, a A, :2: 0 (i = 1,2, ... , n), y al menos uno de ellos es cero. Observe que si A es una matriz definida positiva entonces IAI =1= 0, ya que todos los valores propios son positivos. Por 10 tanto, la matriz inversa siempre existe para matrices definidas positivas. En el proceso de determinar la estabilidad de un estado de equilibrio, por 10 regular se encuentra una funci6n escalar Vex). Una funci6n escalar Vex), que es funci6n de Xl' X 2, . , XII se dice definida positiva si
Si
Xl
Vex) > 0, V(O) = 0 Vex) se dice semidefinida positiva si Vex) :2: 0, V(O) = 0
para x
=1=
para x
=1=
Si -Vex) es definida positiva (0 semidefinida positiva), entonces Vex) se dice definida negativa (0 semidefinida negativa). Las condiciones necesarias y suficientes para que la forma cuadratica x I Ax (0 la forma Hermitica x*Ax) sea definida posit iva, definida negativa, semidefinida positiva, 0 semidefinida negativa han sido dadas por J. J. Sylvester. El criterio de Sylvester es el siguiente
662
Ap e ndic e A
positiva es que el determinante de A sea positivo y los menores principales sucesivos del determinante de A (los determinantes de las matrices de k x ken la esquina superior izquierda de la matriz A, donde k = 1, 2, ... , n - 1) sean positivos, es decir, se debe tener all a21
all> 0, donde
a31
... ,
IAI >
Criterio de Sylvester para la definicion negativa de una forma cuadrdtlca 0 forma HermiUna condici6n necesaria y suficiente para que una forma cuadratica Xl Ax (0 forma Hermitica x* Ax), donde A es una matriz real simetrica (0 matriz Hermitica) de n x n, sea definida negativa es que el determinante de A sea positivo si n es par y negativo si n es impar, y los menores principales sucesivos de orden par sean positivos y los menores principales sucesivos de orden impar sean negativos; es decir, se debe tener tica.
all < 0,
donde
au = aji'
Gij=
-,
[Esta condici6n se puede obtener al hacer que xJ(-A)x sea definida positiva.]
Criterio de Sylvester para la semidefinicion positiva de una forma cuadrdtica 0 forma Hermitica. Una condici6n necesaria y suficiente para que una forma cuadratica x" Ax (0 forma Hermit.ca x* Ax), donde A es una matriz real simetrica (0 matriz Hermitica) de n x n, sea semidefinida positiva es que A sea singular (IAI = 0) y los menores principales sean no negativos:
a., 2: 0,
donde i < j < k y
2:
0,
... ,
IAI
=0
Secci6n A-S
Pseudoinversas
663
(Es importante apuntar que en las pruebas de semidefinicion positiva 0 semidefinicion negativa se deben revisar los signos de los menores principales, no solo los de los menores principales sucesivos. Vease el problema A-15.)
Criterio de Sylvester para la semideflnicion negativa de una forma cuadrdtica 0 forma Hermitica. Una condicion necesaria y suficiente para que una forma cuadratica Xl Ax (0 forma Hermitica x*Ax), donde A es una matriz real simetrica (0 matriz Hermitica) de n x n, sea semidefinida
negativa es que A sea singular (IAI = 0) y los menores principales de orden par sean no negativos y aquellos de orden impar sean no positivos:
a., a.,
au ::5 0,
donde i < j < k Y
aji aki ajj akj
::5
0,
0"
IAI
=0
A-B PSEUDOINVERSAS
EI concepto de pseudoinversas de una matriz es una generalizacion de la nocion de una inversa. Es util para encontrar una "solucion" a un conjunto de ecuaciones algebraicas en el cual el numero de variables desconocidas y el numero de ecuaciones lineales independientes no es igual. A continuacion, se consideraran las pseudoinversas que permiten determinar soluciones de norma minima.
Ya que tiene dos variables independientes y una sola ecuacion, no existe una solucion unica. En lugar de esto, existe un numero infinito de soluciones. En forma grafica, cualquier punto en la linea XI + 5x z = I, como se muestra en la figura A-I, es una posible solucion. Sin embargo, si se decide escoger el punto que esta mas cerca del origen, la solucion se convierte en unica. Considere la ecuacion matriz-vector
Ax
= b
(A-35)
donde A es una matriz de n x m, x es un vector-m, y b es un vector-no Se supone que m > n (es decir, el numero de variables desconocidas es mayor que el numero de ecuaciones) y que la ecuacion tiene un numero infinito de soluciones. Se va a encontrar la solucion unica x que esta localizada mas cerca del origen 0 que tiene la norma Ilxll minima. Se define la solucion de norma minima como x". Es decir, Xo satisface la condicion de que Ax" = by Ilxoll :::; Ilxll para toda x que satisface Ax = b. Esto significa que el punto de solucion XO esta mas
664
Ancilisis
vector-matriz
Ap e n d ic e
0.6
--
0.4
0.2
~_.J..-_...l-_-'--_-L.-'=-"--=~_ _
Figura A-I
Linea x, + 5x,
I en el plano x.x..
x,
cerca del origen del espacio de dimension m entre todas las soluciones posibles de la ecuacion (A-35). A continuacion se determinara dicha solucion de norma minima.
Ax = b
donde A es una matriz de n x m que tiene rango n, x es un vector-m, y b es un vector-; la solucion que minimiza la norma Ilxll esta dada por
don de A /1M= A/(AAlr l Esto se puede probar como sigue. Primero, se nota que la norma siguiente manera:
Ilxll
se puede escribir de la
Ilxll
Ilx - XO + xOIl
= IIxoll +
(xOf(x - XC)
= [AT(AATr l bY[x -
AT(AAT)-l b}
Como
Ilx - x011
0, se obtiene
Ilxll.
Seccion A8
Pseudoinversas
665
=
La matriz ANA! = AI(AAlr l que produce la soluci6n de norma minima (11xOII ma la pseudoinversa derecha 0 inversa derecha minima de A.
minimo) se lla-
Resumen sobre /a matrizpseudoinversa derecha. La pseudoinversa derecha A NM da la soluci6n XO = A NM b que minimiza la norma, 0 hace que Ilxoll = minimo. Observe que la pseudoinversa derecha A NM es una matriz de m x n, ya que A es una matriz de n x m y
ARM
= AT(AATr l
=
=
(matriz de m matriz de m
n) (matriz de n
):'
n,
m>n
Observe que la dimensi6n de AA I es mas pequena que la dimension del vector x, la cual es m. Tambien observe que la pseudoinversa derecha A R \1 posee la propiedad de que es realmente una "matriz inversa" si se premultiplica por A:
Ax
=b
(A-36)
donde A es una matriz de n x m, x es un vector-m, y b es un vector-no Se supone que n > m. Es decir, el numero de variables desconocidas es mas pequeiio que el numero de ecuaciones. En el sentido clasico, puede existir 0 no alguna soluci6n. Si no existe solucion, se puede desear encontrar una soluci6n unica que minimice la norma IIAx - b]. Se define una "solucion" para la ecuaci6n (A-36) que minimiza a IIAx - b] como x", En otras palabras, XO satisface la condici6n
IIAx - b] ~ IIAxo - b],
para toda x
Observe que XO no es una solucion en el senti do clasico, ya que no satisface la ecuaci6n vectormatriz original Ax = b. Sin embargo, se puede Hamar a XO una "solucion aproximada", ya que minimiza la norma IIAx - b]. A continuaci6n se obtendra una soluci6n aproximada.
Ax
=b
XO
donde A es una matriz de n x m que tiene rango m, x es un vector-m, y b es un vector-, el vector que minimiza la norma IIAx - b] esta dado por
XO
donde AlA! = (AIAr l AI. Para verificar esto, primero observe que
= IIA(x -
666
Ap e nd ice
[A(x - xO)Y(Axo - b)
= (x
= (x - xOV[(ATA)(ATAt l AT - AT]b
= (X =0
Por 10 tanto,
0, se obtiene
~
minimiza a IIAx - b]. La matriz ALM = (AT A):' ATse llama pseudoinversa izquierda 0 inversa izquierda minima de la matriz A. Observe que AIM es en realidad la matriz inversa de A, en que si se postmultiplica por A se obtendra la matriz identidad L,
IDI *'
Soluci6n
n, n
m, m
n, y m
m, respectivamente, y si IAI
*'
I~ ~l I~
=
gl
[AIIDI
*' 0,
si
IAI
~]U ~][~
A-II B]
De donde,
Apendice A-
667
Solucion
Si IAI
* 0, la matriz
I~
BI {IAIID-CA -I B I, D = IDIIA-BD-Iq,
silAl'1'O silDl'1'O
[~ I~]
o
Por 10 tanto,
[1
0
0 -
A B] [ C 0 = [A r, C A BI IC 0
0][10
A-IB] CA-IB
IB
= =
=
* 0, entonces [~ : ] = [~
:][
A CI~] ~~~~1
l
y por 10 tanto
A BI = lIn BIIA BOt, ICOO 0 -D-IC COl I Cillmi = IlnllollA - BO= 10liA - BO- I CI
Problema A-3 Para una matriz A de n
x
m y una matriz B de m
n, muestre que
In [B
Con referencia al problema A-2,
-A]
1m
silAI*'O silDI*'O
I~
668
Par 10 tanto,
Anoli sis
vector-matriz
Ape ndi c e A
lB
y se tiene
lIn + ABI =
Problema A-4 Si las matrices A, B, C Y D son de n x n, n siguiente lema de inversi6n de matrices:
x
11 m +
BAI
m, m
n, y m
(A
+ BDC)-I
+ CA -I B)-I CA- I
donde se supone que las inversas indicadas existen. Pruebe este lema de inversi6n. Solucion Se premultiplican ambos lados de la ecuacion por (A + BDC):
I = I + BOCA -I - B(D- I + CA -I B)-1 CA- I - BDCA -I B(D- I + CA -I B)-I CA- I = I + BOCA-I - (B + BDCA-IB)(D- I + CA-IB)-ICA- I = I = I
n, n
m, m
n, y m
m, rcspectivamente, entonces
-A-IBD- I]
D- I al considerar que IAI *- 0 y IDI Pruebe tambien que
(A-37)
*-
O.
(A-38)
considerando que Solucion
IAI *I
0y
IDI *-
o.
Observe que
A[ O
-A-IBD-I][A B]=[ln D- I 0 D 0
A-IB-A-IB]=[ln r, 0
t.,
0]
Apendics A
669
Problema A-6
Pruebe que si las matrices A, B, C Y D son de n
x
n, n
m, m
n, y m
m, respectivarnente, entonces
"*
"* O.
-(A - BD-1q-1 BD- I ] D- I qA - BD- I BD- I + D- I
A C
B D]
- 1
_ -
cr'
"* 0 y IA -
"* o.
=
AB] [A [C D C
A [C B]-I [In D = 0
r,
0][
In 0
(A-39)
A-IB ]-l[A D - CA -I B C
r,
]-1
A [C
Por 10 tanto, [~
r,
0 ]-1
=
A-I -CA- I
r,
0 ]
A-IB ]-I[A 0]-1 B ] - I = [ IO n D - CA-IB C 1m O =[In -A-IB(O-CA-IB)-I][ A-I 0] (D - CA -I B)-I -CA -11 m = [A-I + A-IB(D - CA-IB)-lCA- 1 -A-IB(D - CA-1B)-I] -(0 - CA-IB)-ICA- I (0 - CA-IB)-l
"*
"* O.
I:]
(A-40)
Al tomar la inversa en ambos lados de la ecuaci6n (A-40) y en referencia al problema A-5, se obtiene
[~ ~r
= [A
~~ID~IC
I:rllo
cr'
0 ][In L, 0
-BDD- I
I]
"*
"*
670
Problema A-7 Para una matriz A real sirnetrica de n a)
b)
x
An61isis
veetor-matriz
Ape ndi c e A
-xAx = Ax
ax
Soluci6n
a) Observe que
~y'x= [~\
b) Observe que
x Ax =
T
ax y x
yl
a T] [ ]
= :. =y
L L aux.x,
i-lj-l
-xTAx =
j-I
ax
j-I
=Ax+ATx
que es la ecuacion (A-20). Si la matriz A es una matriz real simetrica, entonees
-xTAx = 2Ax
ax
'
si A = AT
xAx =
y
L L aijXiXj
i-Ij-l
" "
-xAx =
ax
=Ax
Apendics A
671
Observe que
-x*Ax =
a ax
Por 10 tanto,
-a-Problema A-8
Para una matriz A de n
a)
x
-x*Ax = A*x = Ax ax
ax:x*Ay = Ay
b)
Solucion
a) Observe que
x*Ay =
Por 10 tanto,
L L aijXiYj
i-li-l
"
-x*Ay = ax:
= Ay
-x*Ay =
ay
-xTAy = Ay ax '
que son las ecuaciones (A-22) y (A-23), respectivamente.
Problema A-9
Dadas las matrices A y B de n si AB '1= BA.
x
n, pruebe que los valores propios de AB y los de BA son los rnisrnos, aun
672
Solucion
An61isis
vector-matriz
Ap e nd ic e
IAI - BAI = IAI - A~'(AB)AI = IA-I(AI - AB)AI = IA~'IIAI - ABIIAI = IAI - ABI
A continuaci6n se considerara el caso donde A y B son singulares. Existen dos matrices P y Q no singulares de n x n tales que
PAQ =
[~ ~]
IAI - BAI = IAI - Q-I BAQI = IAI - Q-I BP- 1 PAQI = IAI - [Gll G12][I' 0]/ G Z1 G 22 0 0
donde
Entonces
= IAI, - GllIIAIn-,1
Asimismo,
IAI -
[~ ~][~:: ~::] I
c., - G12 1
Aln~,
=IAI_[G~l G~z]1
= IAI, -0 = lAIr - GllIIAIn~,1
Por 10 tanto, se ha probado que
BA
AB
"* BA_
A=[~
Entonces normal ice los vectores propios. Solucion Los valores propios se obtienen de
;]
IAI - AI = IA
1 A-_1
= (A - 1)(A - 2) = 0
Apendice A
673
como
y
Por 10 tanto, la matriz A tiene dos valores propios distintos. Existen dos vectores propios XI Y X 2 asociados con Al Y A2, respectivamente. Si se define
Xl -
_ [XII] ,
X21
XI
se puede encontrar de
AXl =
A1 Xl
A)Xl =
-1 [1 -1 ][XII] [0]
=
1- 2
X21
que da
X II
XI
donde
'*
AX2 =
A2 X2
A)X2 =
de don de se obtiene
Xl2 X22
C2
= [X12] = [C2]
donde
C2
0 es una constante arbitraria. Por 10 tanto, los dos vectores estan dados por
'*
X22
EI hecho de que los vectores propios XI Y Xl son linealmente independientes se puede ver del hecho de que el determinante de la matriz [XI x 2] no es cero:
674
Apendice A
Io
CI
czl
Cz
# 0
CI =
I Y C2
I/,fi,
x,
~ n ~ [~]
[ x,
Claramente, el valor absoluto de cada uno de los vectores propios se convierte en la unidad y por 10 tanto. los vectores propios estan normalizados. Problema A-II Obtenga una matriz de transformaci6n T que transforme la matriz
I -1
o o
en la forma can6nica de Jordan. Solucion La ecuaci6n caracteristica es
o
-1
-1: 0
0 : A
-3
-1
IAI -
AI
o A + 1: -1 -1 ---------....----------
o o
0 :I 1
A+2
Io A+l II 1
A -1
-1 A+2
= (A + 1)3A = 0
Por 10 tanto, la matriz A involucra los valores propios
Al = -1,
A = -1, z
A 3
= -1,
=0
A, I - A {
~ ~ = =1] r
y
que es de rango 2, 0 rango (4 - 2). De la condici6n de rango se ve que debe haber dos bloques de Jordan para el valor propio en -I, es decir un bloque de Jordan de PI x PI y otro de P2 x P2, donde PI + P2 = 3. Observe que para PI + P2 = 3 hay una sola combinaci6n (2 y I) para las 6rdenes PI y P2. Se escoge
Entonces hay un vector propio y uno generalizado para el bloque de Jordan J p I y un vector propio para el bloque de Jordan Jp2 Se define el vector propio y el vector propio generalizado para el bloque de Jordan J p I como VII y V 12' respectivamente, y el vector propio para el bloque de Jordan J p2 como v 21. Entonces deben existir los vectores Yu- V I2 Y V21 que satisfacen las siguientes ecuaciones:
(A - AII)vl! = 0,
(A - AII)VZI = 0
(A - AI I)v12 = Vl!
Apendice A
675
Para AI
A-
AI 1=
o 0
[
o
1
0 0 0
1
-1
Al observar que
(A -
AI I)2 Y12 =
y al mismo tiempo hara que (A - A, Ilv l 2 no sea cero. Un ejemplo de dicho vector generalizado v 12 puede ser
El vector propio
YII
'n
(A - A,1),,,
I]
Al
Ilv l 2 :
y
A continuacion, se determina escoge para que
V2 1
V21
V21
sc
Y21 -
_[b ~b3C]
C
-c
donde bye son constantes arbitrarias. Se escoge, por ejemplo, b
=
1Yc
O. Entonces
= X2,
676
Anolisi s ve ct o r-rn o tr i z
Ap e n d ic e
(A - A4 1)x.. = 0
Al observar que
A - A4 1 = A
=
[
1 -1
0
0 -1
j]
se cncucntra
donde d
T'AT"[~
=
It JU [-1 1: 0
0 0 1 1 -1 1 0 1 -2 1 0 0 0 1 0 -1 1 0 0 0 -1
-1
-1 0 0 1
-1
11]
o o
0 0 0 -1 0 0 1 1 -1 0 0
o -1: 0 0 ---o---oT:::.I_1.9_ o
0 0'0
oj =
~]
. dlag[J2(-1),Jl(-1),Jl(0)]
(A-41 )
Apendice A
Problemas de ejemplo
y soluciones
677
tcndra 111 vcciorcs solucion lincalmcntc mdepcndientcs. S.: cscogen los III vectores de forma que sean ortogonalcs y nonnalizados, Es dccir x.. X, . . . X", satisfara la ccuacion (A-41) Yscran orronormales S~ considcran los 1/ - 111 vectorcs x., l- X", x, tales que todos los n vcctores
+ '
Ax;=Atx;
y
pOI'
AI obscrvar que
IIAx; - Ax,W = (A - A1)xi' (A - AI)x;) = (A - A1)(A - A1)Xi' Xi) = (A - AI)(A - AI)Xi' Xi) = (A - AI)xi' (A - AI)xi) = IIA.Xi - Ax;11 2
=0
se ticne
AXi = Ax;
POI'
D.: donde,
8=0
678
Par 10 tanto, se obtiene
An dli sis
vector-matriz
Ape ndlc e A
Entonces
A - AI =
u[
(AI -oA)Im
C - Al n -
]u*
(A-42)
n- m
rango { C _
u[ ~
C _
=
:1 I ]u*}
n m
ran go
[~
Ic -
:1 In-m]
A1I n - m l i- 0
y de la ecuaci6n (A-42), Al se muestra ser el valor propio con multiplicidad m de IA - A I] = O. Ya que A] es el valor propio de A con multiplicidad k, se debe tener m = k. Por 10 tanto. el rango de A - Al I es n - k. Observe que, como el rango de A - Al I es n - k, la ecuaci6n
(A - A1 I)xi = 0
tendril k vectores propios linealmentc independientes x.,
X2, ... , Xi'
Problema A-13
Pruebe que los val ores propios de una matriz Hermftica de n x n y de una matriz real simetrica de n x n son reales. Pruebe tambien que los valores propios de una matriz anti-Hermftica y de una matriz real antisirnetrica son cero 0 imaginarios puros. Solucion Se define cualquier valor propio de una matriz l lermitica A de n vector X =I' 0 tal que Ax = (a + j(3)x La transpuesta conjugada de esta ultima ecuacion es x*A* = (a - j(3)x* Ya que A es Herrnitica A * = A. Por 10 tanto, sc obtiene x*Ax = (a - j(3)x*x Por otro lado, como Ax = (ex + j(3)x, sc tiene
x
-2jf3x*x
Ya que x*x
=0
*-
f3=O
Apendice A
679
Esto prueba que cualquier valor propio de una matriz Hermitica A de n x n es real. De donde los valores propios de una matriz real sirnetrica son tambien reales, ya que es Hermitica. Para probar la segunda parte del problema, observe que si B es anti-Hermitica, entonces jB es Hermitica. Por 10 tanto, los valores propios dejB son reales, 10 que implica que los valores propios de B son ya sea cero 0 imaginarios puros. Los valores propios de una matriz real anti-sirnetrica son tambien ya sea cero 0 imaginarios puros, ya que una matriz real anti-simetrica es anti-Hermitica. Observe que, en la matriz real anti-simetrica, los valores propios imaginarios puros ocurren en pares conjugados, ya que los coeficientes de la ecuaci6n caracteristica son reales. Observe tambien que una matriz real anti-simetrica de n x n es singular si n es impar, ya que dicha matriz debe incluir al menos un valor propio cero. Problema A-I4 Examine si la siguiente matriz A de 3
x
A=
Solucion
2 2 2 6 [ -1
1.
Primero se puede aplicar el criterio de Sylvester para la definici6n positiva de una forma cuadratica Xl Ax. Para la matriz A dada, se tiene
2 > 0,
I;
~I > 0,
I; ~ -~I
-1 0 1
X2
>0
2.
Por 10 tanto, los menores principales sucesivos son todos positivos. De esta manera, la matriz A es definida positiva. Se puede examinar la definicion posit iva de Xl Ax. Como
x Ax =
[XI X2X3l[
-1 0
~ ~][~:] 1
2x I X3
= 2x~ + 4XIX2
= (XI - X3)2
3.
se encuentra que Xl Ax es positiva excepto en el origen (x = 0). Por 10 tanto, se concluye que la matriz A es definida positiva. Se pueden examinar los valores propios de la matriz A. Observe que
IAI - AI
Por 10 tanto,
3 = A
9A 2 + 15A - 2
= (A
AI = 2, A = 0.1459, A = 6.8541 2 3 Ya que los valores propios son positivos, se concluye que A es una matriz definida posit iva.
Problema A-IS Examine si la siguiente matriz A es semidefinida positiva:
A =
12 1] [1 2 0
2 4 2
680
Soluci6n
An6lisis
vector-motriz
Ap e ndic e
En la prueba de definicion posit iva. sc nccesitan examiner los signos de todos los mcnorcs
principales adcmas del signa del deterrninante de la matriz dada. cl cual pucdc ser ccro: cs dccir. [A[ debe ser igual a O.
Para la matriz de 3 x 3
"n]
Ian a23l, a32 a33
ll la a31 al31 a33
all,
a22,
a33,
ll la a21
al2l, a22
Se nccesitan examinar los signos de todos los scis mcnores principalcs y ..:1 signa de [A], Para la matriz A dada.
all==I>O
a22 == 4> 0
a" == 0
ll la a21 al21 an
la22 a32
ll /a a31
a231
aJ~
la31
ll
a21
al2
a22 a32
Es claro que. dos menorcs principalcs son negatives. As], sc concluye que la matriz A no cs scmidcfinida positiva. Es importante observar que. como se han probado los signos de los men ores succsivos y del detcrrninantc de la matriz A.
1> 0,
IAI
1 2 11 == 2 4 2 == 0 11 2 0
se pudo habcr llcgado a la conclusion crronea de que la matriz A es scmidcfinida positiva. De hccho, para la matriz A dada.
IAI -
AI
== IA. , ' -1
A-_24 -2
=~I
A
== (A2 - 5A - 5)A
== (A - 5.8541)A(A
y los valores propios son
+ 0.8541)
Al == 5.8541,
A3 == -0.8541
Para que la matriz A sea scmidelinida positiva, todos los val ores propios dcbcn scr no negatives y al mcnos uno de cllos debe scr ccro, Sin duda, la matriz A cs una matriz indcfinida.
Apendit:e 8
1eor;0 de 10 tronsfortnodo z
B- J INTRODUCCION
En este apendice se presenta primero teoremas utiles de la teoria de la transformada z que no se trataron en el capitulo 2. Despues se discuten detalles del metodo de la integral de inversion para encontrar la transformada inversa z. Por ultimo, se estudia el metodo de la transforrnada z modi ficada. Al final del apendice (en la seccion de los problemas de ejemplo y soluciones), se discuten algunos problemas interesantes que tratan con la transformacion z, que no se vieron en el capitulo 2.
Diferenciacion compleja. Una serie de potencias en z se puede diferenciar con respecto a z en su region de convergencia cualquier numero de veces para obtener una serie convergente. Las derivadas de XC:::) convergen en la misma region de XC:::). Considere
X(z) =
L X(k)Z-k
k~O
que converge en una cierta region en el plano z. AI diferenciar a XC:::) con respecto a z, se obtiene
d X(z) dZ
k~O
(-k)x(k)z-k-l
681
682
Teorio de
10 transformodo
Apendice B
-z-d X(z) =
Z
k=O
2: kx(k)z-k
d
(B-1)
Z[kx(k)]
-z dZX(z)
(B-2)
De forma similar, al diferenciar ambos lados de la ecuacion (B-1) con respecto a z, se tiene
d d -d [ -z-d X(z) ] =
Z Z
k~O
2: (-k
cc
2)x(k)z-k-1
d - zd [ -z-X(z) ] dz dz
o
k=O
2: k 2x(k)z-k
x
Z[k x(k)]
La operacion (
= (-z
-z ~ Jimplica que se puede aplicar el operador -z:Jz dos veces. De igual manera, al
(B-3)
:zY
X(z)
Dicha diferenciacion compleja permite obtener nuevos pares de transforrnada z a partir de los pares ya conocidos.
Ejemplo B-1 La transformada z de la secuencia escalon unitario I (k) esta dada por
1 Z[I(k)] = 1 _ Z-1
Obtenga la transformadaz de la secuencia rampa unitariax(k), dondc
x(k) = k
mediante el uso del teorerna de diferenciacion compleja.
Z[x(k)]
d(
1) =
Z-1
(1
~z
-1
1)2
Integracion compleja.
g(k) = x(k) k
donde x(k)/k es finita para k = O. La transformada z de x(k)/k esta dada por
Secci6n B-2
Teoremas utiles de
10
teorio de
10
tronsformodo z
683
Z[X(k)] k
donde:[x(k)]
=
= J""X(ZI)dZ I + limX(k)
z ZI
k-O k
(8-4)
X(z).
Z[X(k)] = G(z) = x(k) Z-k k=O k k AI diferenciar esta ultima ecuaci6n con respecto a z se tiene -G(z) dz
d
=-
k=O
"" L X(k)Z-k-l
-Z-I
k=O
"" d J -d G(z)dz z Z
o
= G(oo) -
G(z)
Zl
G(z) =
AI observar que G(x) esta dado por
r
z
G(oo)
se tiene
Z[X(k)] = J"" X(ZI) dZI + limx(k) k z ZI k-O k Teorema de diferenciacion parcial. Considere una funci6n x(t, a) 0 x(kT, a) que tiene transformada z, Aqui a es una con stante 0 una variable independiente. La transformada z de x(t, a) a) se define comoX(z, a). Por 10 tanto,
0
x(kT,
Z[X(t, a)]
(8-5)
684
Teorio de 10 tronsfarmodo z
Apendice B
Obtenga la transformada.:: de csta funcion x(t, 0) mediante el empleo del teorcma de diferenciacion parcial. AI obscrvar que
Z[ te
Entonces se tiene
-a,] _
te z - (1 _ e- a T Z-I)2
-aT
-I
Z[x(t,a)]
I?
x 2(t) = 0,
C8-6)
Suponga que xlCt) Y xit) tienen transformada z y que son XICz) y X 2(z), respectivamente. Entonces
X 1(Z)X2(z)
z[ ~
xl(hT)X2(kT - hT)]
Esta ecuaci6n se denomina el teorema de convoluci6n real. Para probar este teorema, observe que
Z[~OXI(hT)X2(kT -
hT)]
= ~htoXI(hT)X2(kT
=
- hT)z-k hT)z-k
L L xl(hT)X2(kT k~Oh~O
Ya que ximT)
Teorema de la convolucion compleja. El siguiente teorema, conocido como el teorema de la convoluci6n compleja, sirve para obtener la transformada z del producto de dos secuencias x](k) y x 2( k).
Seccion B-2
Teoremos utiles de
10 te orio
de
10
tronsformodo z
685
Suponga que tanto xl(k) como x 2(k) son cera para k < O. Tambien suponga que
donde R 2 < I~I < I:i/RI Para probar este teorerna, se tom a la transforrnada z de xl(k)xik):
Z[xl(k)X2(k)]
2: X,(k)X2(k)z-k
k~O
(8-8)
La serie en ellado derecho de la ecuaci6n (8-8) converge para gencia absoluta para xl(k)xcCk). De la ecuaci6n (2-23), se tiene
x2(k)
1 = -2J. 1
TT] le
X 2(z)zk-l dz (8-9)
= -2.1. X2(~)~k-l d~
7T]le
AI sustituir la ecuaci6n (8-9) en la ecuaci6n (8-8), se obtiene
Z[xl(k)X2(k)]
AI observar que la ecuaci6n (8-8) converge uniformemente para la regi6n el orden de la sumatoria Y la integraci6n. Entonces
Yaque
2: xl(k)(C
k~O
zr k = XM- 1 z)
se tiene
Z[xl(k)X2(k)]
- ' z)d~
(8-10)
donde C es un contorno (un circulo con centro en el origen), que esta en la regi6n dada pOI' I~I > R2 Y 1(1 :1> RI,o
(8-11)
686
Teorlo de
10 tronsformodo z
Apendice B
Teorema de Parseval.
Suponga que las transformadas z de dos secuencias xj(k) Y xik) son Izi > R j (donde R j < I)
R2 <
I"
< R1
(B-12)
La ecuacion (B-12) es el teorema de Parseval. Este teorema es util para obtener la sumatoria de x 2(k).
X(z)
o
X(z)
entonces los valores dex(k7) ox(k) dan la transformada inversaz. SiX(z) esta dada en la forma de una funcion racional, la expansion en una serie infinita de potencias crecientes de Z-1 se puede lograr al dividir el numerador entre el denominador. Si la serie resultante es convergente, los coeficientes del termino Z-k en la serie son los valores de X(k7) de la secuencia de tiempo. Sin embargo, por 10 regular es diffcil obtener una expresi6n en forma cerrada. Algunas veces, las siguientes formulas son utiles para reconocer las expresiones en forma cerrada para series finitas e infinitas en Z-I .
(1 - az- I)3
=1=
(1 - az- I)4
Seccion B-3
687
(1 - az-1t l = 1 + az- I + a2 Z-2 + a 3 Z-3 + a4 Z-4 + a5 z-s + (1 - az- 1t 2 = 1 + 2az- ' + 3a2 Z-2 + 4a3 Z-3 + 5a4 Z-4 + 6as z-s + (1 - az- 1t 3 = 1 + 3az- ' + 6a2 Z-2 + lOa 3 Z-3 + 15a4 Z-4 + 21a5 z-s + 28a6 Z-6 + ... (1 - az- 1t 4 = 1 + 4az- ' + lOa2 Z-2 + 20a3 Z-3 + 35a4 Z-4 + 500 s z-s + 84a6 Z-6 + 120a7 Z-7 + . . .
Para una transformada z X(z), si se desea la expresi6n en forma cerrada para x(k), se puede usar el metodo de la expansi6n en fracciones parciales 0 el rnetodo de la integral de inversi6n que se presenta a continuaci6n.
Metoda de la integral de inversion. EI metodo de la integral de inversi6n, basado en la integral de inversi6n, es el metodo mas comun para obtener la transformada inversa z. Esta basado en la teorla de variable compleja. (Para un presentaci6n rigurasa y completa de la integral de inversion, refierase a un libra sobre la teoria de variable compleja.) AI presentar la f6rmula de la integral de inversi6n para la transformada z, se necesita revisar el teorema de los residuos y su material antecedente asociado. Repaso del material necesariopara obtener laformula de la integral de inversion. Suponga que Zo es un punto singular aislado (polo) de F(z). Se puede ver que existe un numero positivo r l tal que la funci6n F(z) es analitica en cada punto z para el cual 0 < Iz- zol ::; r I' EI circulo con centro z = Zo y radio r l se denota como Fl' Se define a F2 como cualquier circulo con centro en z = Zo Yradio Iz-zol = r2 para el cual r2 ::; r l Los circulos F I y F2 se muestran en la figura B-1. Entonces, la expansi6n en la serie de Laurent de F(z) alrededor del polo en z = Zo puede estar dada por
cc "b F(z) = ~o an(z - zoY + ~I (z _n
zo Y
an - -2' 7TJ
- 1 b, - -2'
f f
1', Z -
F(z)
Zo
0,1,2, ...
7TJ 1'2 Z -
F(z)
Zo
n=1,2,3,oo.
;w
r,
688
jw
Teorio de
10
rronsformodo z
Apendice B
Figura B-2 Region analitica para la tuncion nz) limitada por una curva cerrada T.
= -2
1T] r,
.f
F(z)dz
(8-13)
Se puede probar que el valor de la integral de la ecuaci6n (B-13) no cambia si F, se reemplaza por cualquier curva cerrada T alrededor de Zo tal que F(z) sea analitica sobre y dentro de F excepto en el polo z = 2 0 (vea la figura B-2). La curva cerrada rpuede extenderse afuera del circulo 1'1' Entonces, en referencia al teorema de Cauchy-Goursat, se tiene
F(z)dz -
r.
F(z)dz
=0
= -2.1.. F(z)dz
1T]ff
EI coeficiente hi se denomina el residua de F(z) en el polo zoo A continuaci6n, se supone que la curva cerrada F encierra m polos aislados 2 1, 2 2 , . ,2"" como se muestra en la figura B-3. Observe que la funci6n F(z) es analftica en la regi6n sombreada. De
jw
Seccion B-3
10
integral de inversion
689
acuerdo al teorema de Cauchy-Goursat, la integral de F(z) sobre la region sombreada es cero. La integral sobre el total de la region sombreada es
f
donde "1,12 , tanto.
.
F(z)dz -
f
=
F(z)dz -
11
F(z)dz - ... -
lZ
F(z)dz = 0
1m
l~" son curvas cerradas alrededor de los polos ZI' Z2' ... 'Zm' respectivamente. POI'10
f
1
F(z)dz
F(z)dz +
1\
lz
F(z)dz + '"
F(z)dz
I'm
= =
+ b1J + Km )
(B-14)
donde K! = 171 . K: = 171 .... Km = b. son los residuos de F(z) en los polos Z,. z:. . . . . Zm. respectivamente. La ecuacion (B~ 14) se conoce como ei teorema de los residuos. Este teorema establece que una funcion F(z) es analitica dentro y sobre una curva cerrada T, excepto en un numero fin ito de polos z" Z2' ... 'Zm dentro de T, entonces la integral de F(z) alrededor de Ftomada en contra de las manecillas del reloj es igual a 27Tj veces la suma de los residuos de los pol os Z" Z2' ... ,Zm'
Integral de inversion para la transformada z. Ahora se empleara el teorema de CauchyGoursat y el teorema de los residuos para obtener la integral de inversion para la transformada z, De la definicion de la transformada z: se tiene
X(z) =
2: x(kT)z-k =
k=O
+ x(kT)z-k + ...
(B-15)
Observe que la ecuacion (B-15) es la expansion en la serie de Laurent de X(Z):I-I alrededor del punto z=o. Considere un circulo C con centro en el origen tal que los polos de X(z):!-\ estan dentro de el. AI observar que el coeficiente de x(k7) asociado con el terrnino Z-I en la ecuacion (B-15) es el residuo, se obtiene
(B-16)
La ecuacion (B-16) es la integral de inversion para la transformada z, La evaluacion de la integral de inversion se puede hacer como se presenta a continuacion. Se definen los polos de X(z):I- I como Zl' Z2' ... 'Zm' Ya que la curva cerrada C encierra los polos z \' Z2' ... ,z"" entonces con referencia a la ecuacion (8-14) se tiene
X(z )Zk-Idz
= =
X(z )ZH dz +
C\
Cz
X(z )Zk-l dz
Cm
27Tj(K I + K 2 + ... + Km )
, Zm' , Zm.
(B-17)
respectivamente, y respectivamente.
donde K I, K2,
C\, C 2,
... ,
... , Km denotan los residuos de X(z):I - I en los polos Zl' Z2' CO' son pequefias curvas alrededor de los polos aislados z\, Z2'
690
Teorio de
10 tronsformodo
Apendice B
Ahora se combinan la ecuaciones (8-16) y la (8-17) para obtener un resultado muy util. Ya que X(z)/-1 tiene m pol os, esto es, ZI' Z2, ... ,Zn" x(k) = x(kT) = K 1 + K 2 + ... + K m
z,deX(z)z"]
(8-18)
AI eva1uar los residuos, observe que si el denominador de X(z)/-1 contiene un polo simple en z = z, entonces el residuo K correspondiente es
= lim
[(z - ZI)X(Z)Zk-l]
= 0 para k < O. Por 10 tanto, los valores de ken la ecuacion (8-17) se restringen a los valores enteros
no negativos. Si X(z) tiene un cero de orden r en el origen, entoncesX(z)/-1 en la ecuacion (8-17) involucrara un cero de orden r + k - 1 en el origen. Si r ~ 1 entonces r + k - 1 ~ 00 k ~ 0, y no existe un polo en z = 0 en X(z)/- I. Sin embargo, si r:::; 0, entonces habra un polo en z = 0 para uno 0 mas valores no negativos de k. En tal caso, se necesita la inversion separada de la ecuacion (8-17) para cada valor de k. Se debe observar que el metodo de la integral de inversion, cuando es evaluado por los residuos, es una tecnica muy simple para obtener la transformada inversa z, considerando que X(z)/-1 no tiene polos en el origen, z = O. Si, sin embargo, X(z)/- I tiene un polo simple 0 un polo multiple en z = 0, entonces los calculos se pueden hacer engorrosos y el metodo de expansion en fracciones parciales puede ser mas simple de aplicar.
Comentarios sobre el cdlculo de los residuos. Al obtener los residuos de una funcion X(z), observe que, sin importar la forma como se caJculan dichos residuos, el resultado final es el mismo. Por 10 tanto, se puede utilizar cualquier metodo que sea conveniente segun la situacion. Por ejemplo, considere la funcion X(z) siguiente:
Metoda I. EI residuo de esta funcion se puede obtener como la suma de los residuos de los terminos respectivos:
[Residuo K deX(z) al polo z = -1]
2 [ 2
= (3 - 1)!}~ldz2
+ (2
=11
(z + 1)
3 2z
+ 5z + 6] (z + 1)3
Secci6n B-4
691
Metoda 2.
Si los tres terminos de X(.:) se combinan en uno solo como se muestra a continua-
cion,
X( )
= 2z2 + 5z + 6
(z + 1)3
entonces el residuo se puede calcular como sigue: [Residuo K de X(.:) al polo z = -I]
=
=
! lim
1--}
(22)
=11
Metoda 3. continuacion,
X(z)
3 (z + 1)2 +
11
Z
+1
entonces el residuo de X(.:) es el coeficiente del termino 1/(.: + I). Por 10 tanto, [Residuo K de X(.:) al polo z = -I] = 11
8-4 METODa DE LA TRANSfORMADA z MODlflCADA
La transformada z modificada es una modificacion del metodo de la transformada z. Se basa en insertar un retraso ficticio puro a la salida del sistema, adernas de insertar un muestreador ficticio en la salida, y variar la cantidad de retraso ficticio para obtener la salida entre cualquiera de dos instantes de muestreo consecutivos. EI metodo de la transformada z modificada es util no solo para obtener la respuesta entre dos instantes de muestreo consecutivos, sino tarnbien para obtener la transformada z de procesos con retrasos puros 0 retrasos de transporte. Ademas, el metodo de la transformada z modificada se aplica a la mayoria de los esquemas de muestreo. Considere el sistema que se muestra en la figura B-4(a). En este sistema se inserta un retraso ficticio de (I - m)Tsegundos, donde 0 S; m S; I Y Tes el periodo de muestreo, en la salida del sistema. AI variar a m entre 0 y 1, se puede obtener la saliday(t) en t = kT - (I - m)T(donde k = 1,2,3, ...). Al observar que G'(s) esta dada por
G*(s)
= ~[g(t)e5T(t)]
Zm[G(s)]
(B-19)
692
Teorio de
10
tronsfarmodo z
Apendice B
XIs)
/
6T
X"(s)
X(z)
Y(s)
G(z. m)
6T
Y(z. m)
(a)
X(z)
Y(z, m)
(b)
Figura 8-4 (a) Sistema can retraso ficticio de (l - niil' segundos: (b) sistema can funcion de transfcrcncia pulso modificada can entrada X(z) y salida Y(z. m)
Al observar que
e- Ts .;[g(t + mT)c5r(t)]
(B-20)
se tiene
G* (s, m)
= e- Ts .;[g(t + mT)c5r(t)]
Ya que ~[g(t + m7)8/t)] es la transfonnada de Laplace del producto de dos funciones en el tiempo, con referencia a Ja ecuaci6n (3-19) se puede obtener como sigue:
.;[g(t + mT)c5r(t)]
= -2' 7TJ
1 fC+i<x
c-i<x
G(P)l_
emrp
T(s-p)dp
(B-21)
La integral en e1 lado derecho de la ecuacion (B-21) se puede Ilevar a cabo en forma similar a la discutida en Ja seccion 3-3, es decir, la integral de convolucion se puede obtener al integrar ya sea en el semiplano izquierdo 0 en el semiplano derecho. Se considera que el contomo de integracion esta a 10 largo de un sernicirculo infinito en el semiplano izquierdo. Entones
~[g(t + m7)8 j ( t ) = 2', residuo de
(B-22)
Por 10 tanto, de las ecuaciones (B-19), (B-20) Y (B-22), se obtiene la transformada z modificada de G(z) como sigue:
G(z,m)=z-l2', residuo de
(B-23)
Observe que la transformada z modificada G(z, m) y la transformada G(z) se pueden relacionar como sigue:
G(z)
lirnzG(z,m)
m-O
(B-24)
Seccion B-4
693
Con referencia a la figura B-4( b), la salida Yez, m) se obtiene como sigue:
Y(z,m) = G(z,m)X(z)
(B-25)
Como en el caso de la transformada z, la transformada z modificada Y(z, m) se puede expandir en una serie infinita en z", como sigue:
(B-26) AI multiplicar ambos lados de la ecuaci6n (B-26) por z, se tiene
(B-27)
(B-28)
(B-29)
La parte izquierda de la ecuaci6n (B-29) da los valoresy(O- ),y(T-),y(2 T-), ... , y ellado derecho da los valores y(O+), y(T+ ),y(2 T+), ... Si la saliday(k7) es continua, entonces y(kT-) = y(kT+).
Ejemplo B-3 Obtenga la transformada.:: modificada de G(s), don de
1 G(s) = - s + a Con rcferencia ala ecuaci6n (B-23), se obtiene la transformada.:: modificada de G(s) como
G(z,m) = z"
=-a ]
= Z - '-----co Z - e aT
Ejemplo B-4
>" z
e- m a T Z-l 1 - e aT Z
'
Considere el sistema que se muestra en la figura B-5(a) y (b). Obtenga la salida Y(.::, m) de cada sistema, Para el sistema que se muestra en la figura B-5ea). se obtiene
Y(z,m)
Observe que
Y(z)
= Z[Y(s)] = G 2(z)G,(z)X(z)
694
Teorio de 10 tronsformodo z
Apendice B
Xis)
X'(s) X(z)
~c_
Y(s)
Ylz, m)
(a)
Xis)
/
Or
X'(s) X(z)
,I
G, Is)
I 'I
(b)
G 2(s)
~L/
Or
y(s)
Y(z, m)
"
Figura B-5
(a) Sistema can un mucstreador entre G,(S) y G,(s); (b) sistema sin mucstrcador entre G,(s) y G,(s).
donde
Observe que
Ejemplo 8-5 Considere el sistema que se muestra en la figura 13-6. Obtenga la transformada r modificada de C(s). La salida C(z) esta dada por
G(z)
C(z) = 1 + GH(z/(z)
La transformada z modificada de C(z) esta dada par
C(z,m) = 1 + GH(z)R(z)
R(s) E(s)
G(z,m)
(8-30)
'(s) G(s)
Cis)
H(s)
Figura B-6
Seccion B-4
695
Ejemplo B-6
Considcrc el sistema que sc muestra en la figura B-7. EI periodo de mucstreo Tes de I segundo. 0 T= I. Suponga que el sistema esta sujeto a una entrada escalon unitario, Obtenga ck(m) para m = 0.5 Y k = O. I, 2..... 9. Tarnbien. verifique que la ecuaci6n (B-24) se conserva cierta. La transformada z modificada de G(s) se obticnc dc Ia ecuacion (8-23) como sigue:
r
G(z, m) =
Z-I
L residua de
..
z -I (I
-r
-I
+ lresiduode-o - - ~lInsimplepolos=-IJ
s-(s+ I) z-e
l}
S
= z (1 - z ) (2 _ l)!!~ds s
_I
-I{
+ lim
=
s~-I
[(s + 1)
z
2( 1 1)
S
e:ze
-1(1 _
2 _1)[mz - mz - Z2 + 2z (1)2 Z -
+Z
m e- z ]
-
e -I
(m - l)z1 + (2 - m)z-2 e- m z-l(l - Z-I) + 1 - e- I Z-l 1 - z" (m - 1 + e-m)z-I + (2.3679 - l.3679m - 2e- m)Z- 2 + [-0.3679(2 - m) + e- m]z-3
Z-I),
se tiene
G(z,m) 1 C(z,m) = 1 + G(z) 1 - Z-l (m - 1 + e-m)z-I + (2.3679 - l.3679m - 2e- m)Z- 2 + ( -0.7358 + 0.3679m + e- m)z-3 1 1 - 2z- + 1.6321z- 2 - 0.6321z 3
Por 10 tanto, para m
=
5 se tiene
C(
3 (B-31)
C(s)
R(sl
R(z)
sIs
+ 1)
G(s)
[;r
C(z, ml:
s;
[ck(mll
696
Teorio de la transformada z
Apendice B
Con referencia a la ecuacion (B-27), la ecuaci6n (B-3 1) se puede expandir en una serie infinita en Z-I como sigue:
C(z,0.5)
o
c(1.5)
0.6839
= c(2.5) = 1.2487
= c(4.5) = 1.2913
= c(6.5) = 0.8236 = c(7.5) = 0.8187 = c(9.5)
= 1.0447
G(z) = Z[G(s)]
1 -, 1 = Z [ ~-:-----:-]
(1 - z 1)(1 - 0.3679z I)
m~O
Por 10 tanto,
G(z)
lim zG(z,rn)
m~O
Resumen. EI propos ito principal de esta seccion ha sido presentar el metodo de la transformada z modificada para encontrar la respuesta en cualquier tiempo entre dos instantes de muestreo consecutivos. Se observa que la transformada z modificada se puede usar no solo para este proposito, sino para tratar con esquemas de muestreo con multiples frecuencias de muestreo.
Apendice B
Problemas de ejemplo
y solucione s
697
Z -k'
] 1 [1 L iv"
ee
k-O'
=1+
-I
1 1 1 + - z -2 + - z -3 + - z-4 + ...
2! 3! 4!
Problema B-2
Obtenga
k-I
~ k
(1) z
-k
(Esta serie se parcce a la de la transformada r de Ilk. peru la secuencia k comienza aqui con I en lugar de 0.)
Solucion Ya que
k~O
z:"
= 1
Z-I
Z-2
- 1 - 1z-t ,
-2
[z] > 1
-k-2
= -1---1
-
I~
o
~
Z-k- 2dz =
k-O
II ~-2_ldz z
_
Z-k-I
L...
k-O
-k _ 1 = In (1 - z I) + constante
(8-32)
donde la constante en la ecuacion (B-32) es cera, [Para verificar esto. sustituya r por x en ambos lados de la ecuacion (B-32).] Par 10tanto, la ecuacion (8-32) se puede reescribir como sigue:
Lk-I
Z-k
-k
= In (1 -
z I),
[z] > 1
Izi >
Problema B-3
698
La segunda diferencia hacia atras se define como
Teorio de 10 tronsformada z
Apendice B
= Vx(k)
y la tercera diferencia hacia arras se define como
- Vx(k - 1)
V'"x(k)
= vm-t x(k)
vm-l x(k
- 1)
Obtenga la transformada r de Vx(k), "11" x(k), V' x(k), YV'" x(k). Solucion La transforrnada z de la primera diferencia hacia atras se obtiene como sigue: Z[Vx(k)] = Z[x(k)] - Z[x(k - 1)]
= X(z) -
z-t X(z)
(8-33)
= (1
Como
- Z-l)X(Z)
= x(k)
la transformada r de "11 x(k) es
2
- 2x(k - 1) + x(k - 2)
(8-34)
Observe que la operaci6n de tomar la diferencia hacia atras correspondc a multiplicar X(;:) por (I - ;:-'). Por 10 tanto, para la m-esima diferencia hacia arras
Vm x(k) =
se tiene
vm-l
x(k) -
vm-l
x(k - 1)
(8-35)
Problema 8-4
La prirnera diferencia hacia adelante entre x(k + 1) Yx(k) sc define como
.:1 2 x(k)
x(k)]
Apendice B
699
= (z - 1)X(z) - zx(O)
Yaquc
.12 x(k) = [x(k + 2) - x(k + 1)] - [x(k + 1) - x(k)]
(B-36)
X(z) -
Z2
(B-37)
sc ticnc
m-l
L
j=()
(z - l)m- J -
1.1J
x(O)
(B-38)
Problema 8-5
Rcsuelva la siguicntc ccuacion en difercncias:
(k + 1)x(k + 1) - x(k) = 0
donde x(k) = 0 para k < 0 y x(O) = I. Observe que la ccuacion en diferencias cs de la clase varian tc en cl tiernpo. La solucion de este tipo de ccuacion en diferencia sc pucde obtener mediante cl ernpleo de la transformada r. (Sc debe tcncr cuidado ya que el cnfoque de la trasformada c aplicada a la solucion de ecuacioncs en difcrencia variantcs en el tiempo puede no ser exitosa.) Solucion Primero. observe que
Z[kx(k)] = -z ~X(z)
ya que la ccuacion cn di tcrcncias original sc pucdc cscribir como
kx(k) - x(k - 1) = 0
700
Teorio de la transformoda z
Apendice B
-z.!!:..-X(z) dz
o
Z-I
X(z) = 0
de donde se tiene
dX(z) __ dz X(z) Z2
o
InX(z)
= -
+ InK
exp z -I
se tiene
[z] > 0
X(z) =
K(l +
Z-I
1 x(k) = K k!'
Como x(O) esta dada como I, se tiene
k = 0,1,2, ...
x(O) = K = 1
De don de, se ha determinado la con stante desconocida K. Por 10 tanto, la so1uci6n para la ccuaci6n en diferencias dada es
x(k) = k! '
k = 0,1,2, ...
Problema 8-6
Resuelva la siguiente ecuaci6n en diferencias
(k + 1)x(k + 1) - kx(k) = k
donde x(k) Solucion
=
+1
0 para k:S; O.
x(1) = 1
Ahara se define
y(k) = kx(k)
1
1)2
+ 1_
Z-l
Z-l
Y(z)
= (1 _
Z-I)3
+ (1 _
Z-I)2
'-l[ (1 _ z
= He -
Z-2
1)3
] _
-
1 z(k - k)
y(k)
k)
+ k = !W + k)
kx(k)
comosigue:
= y(k) = He + k)
k
x(k)
Problema B-7
= Hk + 1),
= 1,2,3, ...
Considere el sistema que se muestra en la figura B-8. EI periodo de rnuestreo es de 2 segundos, entrada x(t) es una funcion delta de Kronecker 0o(t); es decir,
T= 2. La
Mk)={l' 0,
k=O k"'O
Obtenga la respuesta cada 0.5 segundos mediante el emplco del metoda de la transformada:: modificada. Soluci6n Como la entradax(t) es una funcion delta de Kronecker. se tienc
X(z) = 1
La Iuncion de transfercncia pulso rnodificada G(::. /II) se obticne como sigue. Con refercncia a la ccuacion (B-23 ).
0(::, m)=:: Ilrcs1duode s+O.693
_r .
G(z,m)
=z
-I{ . [
$~-O,6931
lim
eUruz]}
x(t)
/
6r
X(z)
"I
1 s + 0.6931
G(s)
~
6r
y(t)
Y(z. m)
Figura B-8
Sistema mucstreado.
Apendice B
701
y(k + 1) - y(k) = k + 1
AI tomar la transformada.:: de esta ultima ecuacion, se tiene
Z-I
1
1)2
+ 1_
Z-I
O. se tiene
Z-2
Z-I
Y(z) = (1 _
Con rcferencia al problema A-2-8. se ticne
Z-I)3
+ (1 _
Z-I)2
. -I[(1 _
Z-2 ] _ Z-I)3 -
1 2(k - k)
y(k)
= He -
k) + k
= ~(e
+ k)
kx(k)
eomosigue:
= y(k) = Hk 2 + k)
+ 1),
k=1,2,3, ...
x(k) =
Problema B-7
Hk
Considere el sistema que se muestra en la figura B-8. EI periodo de muestreo es de 2 segundos, entrada x(t) cs una funci6n delta de Kronecker 8o(t): es decir,
T= 2. La
&(k) =
{I,
0,
k=O k=f:.O
Obtenga la respuesta cada 0.5 segundos mediante el empleo del metoda de la transformada.:: modificada. Soluci6n Como la entrada x(t) es una funci6n delta de Kronecker. se tiene
X(z) = 1
La funcion de transfcrencia pulso modificada G(.::. Ill) se obticne como sigue. Con refercncia a la ecuacion (B-23).
0(.::. m) <:
_[
I
G(z,m) =
Z-I{
s~-O.6931
lim
[(s + 0.6931)
=----
s +.
16931 0
e~eZ2s]}
=Zl
_ (e-I.3862)m z
Z -
1.3862
4- m z - 0.25
y(t)
x(t)
,/
6r
X(z) .. ,
1 s + 0.6931
G(s)
~
6r
Y(z. m)
Figura B-8
Sistema muestrcado.
702
Par 10 tanto, la salida Y(z, m) se puede obtener como sigue:
Teono de 10 tronsfarmodo z
Apendice B
Y(z,m) = G(z,m)X(z) =
Can referencia a la ecuaci6n (B-27), se tiene
-z-~c....--~-.2-5
zY(z,m) = 1 - 0.25z- t
Par 10 tanto,
= 4- m - 2 Y3(m) = 4 -m-3
Para obtener la salida del sistema cada 0.5 segundos, se hace que m = 0,0.25,0.5 Y0.75. Para m = 0.25, se obtiene
yo(0.25) Yt(0.25)
Y2(0.25)
h(0.25)
= 4- 1125 = 4- 125 = 4- 2 25 = 4- 3 25
1.0
m =0 m =0.25
m =0.50 m =0.75
0.8 0.6
0.4
0.2
.0 4
2
6 3
r(segundos)
o
Figura 8-9
Apendice B
703
=
De forma similar, se pueden calcular los val ores deyim) para m muestra en la figura 8-9 como una grafica de YkCm) contra k.
Problema 8-8
Obtenga C(::, m). la transformada c modificada de la salida. del sistema que se muestra en la figura 8-10.
R(s) R(z) E(s)
~(S) G,(s)
6T 6T
C(z. m)
Figura B-10
Solucion
= =
M*(s)
o
M(z)
Tambien.
G,(z)(z)
(z)
Por 10 tanto.
R(z) - G2(z)M(z)
M(z)
de la que se obtiene
G,(z)[R(z) - G2(z)M(z)]
M(z)
Apenclit:e C
Diseno por ubicacion de polos cuando la senal de control es un vector
C- J INTRODUCCION
En el capitulo 6se present6 la tecnica de ubicaci6n de polos y el disefio del observador del estado cuando la sefial de control u(k) era un escalar. Sin embargo, si la sefial de control es una cantidad vectorial (vector-r), se puede esperar una mejoria en la respuesta caracterfstica del sistema porque se tiene mas libertad para elegir las sefiales de control u\ (k), u2(k), ... , u,.(k). Por ejemplo, en el caso de un sistema de orden n con un control escalar, la respuesta de oscilaciones muertas (deadbeat) se puede alcanzar cuando mas en n periodos de muestreo. En el caso del control vectorial u(k), la respuesta de oscilaciones muertas se puede alcanzar en menos de n periodos de muestreo. Se observa que con el control vectorial es posible escoger en forma libre mas de n parametres; es decir, adem as de ser capaz de ubicar n polos de lazo cerrado en forma adecuada, se tiene la libertad de satisfacer otros requerimientos, si existen, para el sistema en lazo cerrado. Sin embargo, en este caso del control vectorial, el calculo de la matriz de retroalimentaci6n del estado K se vuelve mas compleja, como se vera en este apendice,
C-2 DISCUSION PRELIMINAR
Considere el sistema
(C-I)
G H
704
=
=
matriz de n X n matriz de n X r
Secci6n 2
Discusiones preliminares
705
Se supone que las magnitudes de los r componentes de u(k) estan restringidos. Como en el caso del sistema con serial de control escalar, se puede probar que una condici6n necesaria y suficiente para ubicar polos en forma arbitraria para el sistema definido por la ecuaci6n (C-I) es que el sistema sea completamente controlable. Se supone que el sistema definido por la ecuaci6n (C-I) es completamente controlabJe. En el esquema de retroalimentaci6n del estado, el vector de control u(k) se escoge como
u(k)
-Kx(k)
(C-2)
donde K es la matriz de ganancia de retroalimentaci6n del estado, que es una matriz de r X 17. Con la retroalimentaci6n del estado el sistema se vuelve un sistema de lazo cerrado y su ecuaci6n de estado se convierte
x(k + 1)
(G - HK)x(k)
donde la matriz K se escoge para que los valores propios de G - HK sean los polos de lazo cerrado deseados )11' )12' ... , )1/1'
x(k + 1)
donde
x(k)
=
Gx(k) + HI u(k)
(C-3)
lI(k)
= =
17
HI =
17 X
Suponga que el sistema es completamente controlable. Entonces la matriz de controlabilidad tiene inversa. Se define
donde los f, son los vectores rengl6n. Entonces se construye una matriz de transformaci6n T 1 como sigue:
r,
= [
f;G ]-1
r, Gn-1
=
(C-4)
706
Apendico C
~ [!
y
1 0
0 -an-I
0 1 0 -an-2
-an
II
xI(k) x2(k)
(C-5)
TilH I =
f]
(C-6)
[Yea el problema C-I para obtener las ecuaciones (C-5) y (C-6).] Ahora se define
x(k + 1)
0
[ i,(k + 1)
x2(k + 1)
0 0
1 0
0
-an-I
Xn-I(~ + 1)
xn(k + 1)
=
0 -an
+
1 -al
xn-I(k) xn(k)
f]U(k)
(C-7)
Por 10 tanto, se tiene que la ecuaci6n de estado, ecuaci6n (C-3), se puede transformar en la forma can6nica controlable mediante el empleo de la matriz de transformaci6n T 1 definida por la ecuacion (C-4).
Pasos de diseho. A continuaci6n se discutira el procedimiento para determinar la matriz de ganancia de retroalimentaci6n del estado K tal que los valores propios de G - HK esten en los valores deseados Ill, 112, ... , u.: La ecuaci6n de estado que se considera a continuaci6n es la dada por la ecuaci6n (C-I):
x(k + 1)
= Gx(k) + Hu(k)
x(k + 1)
donde
[HI: H 2 :
Hr )
= H,
i = 1,2, ... , r
Seccion C-3
707
EI procedimiento para disefiar la matriz de ganancia de retroalimentaci6n del estado K involucra los siguientes pasos: Paso I. Extienda el proceso de transformaci6n [el proceso que transforma la ecuaci6n de estado dada por la ecuaci6n (C-3) en la ecuaci6n de estado en la forma can6nica controlable dada por la ecuaci6n (C-7)] al caso donde la matriz H es una matriz de n X r. Es decir, la ecuaci6n de estado dada se transforma en la forma can6nica controlable mediante el empleo de la matriz de transformaci6n T, cuya forma exacta se dara posteriormente. Se define
x(k)
= Ti(k)
i(k + 1)
(C-8)
donde G = T- 1 GT esta en la forma can6nica controlable y iI = T- I H. (Esta forma can6nica controlable es ligeramente diferente a la forma usual, como se vera mas adelante.) Paso 2. Mediante el uso de la matriz de ganancia de retroalimentaci6n del estado K, el vector de control puede estar dado por
i(k + 1)
= (G - HKT)i(k)
La matriz K se escoge para que la matriz G - HKT tenga los valores propios deseados ILl' ILz, ...,
Primero se discutira la forma como se determina la matriz de transformaci6n T para despues determinar la matriz de ganancia de retroalimentaci6n del estado K. Considere el sistema completamente controlable definido por
x(k + 1)
donde
= Gx(k) + Hu(k)
(C-9)
u(k)
G = matriz de n X n H = [HI: Hz: ... : Hr ] = matriz de n X r Se supone que el rango de la matriz H es r. Por 10 tanto, los vectores componentes HI, Hz, ... , H, de la matriz H son Iinealmente independientes, ya que el sistema se supone de estado completamente control able, el rango de la matriz de controlabilidad de n X nr
708
Apendice C
es n. La matriz de controlabilidad se puede escribir en una forma expandida como sigue: ,H . n . . n [H I:' H' : " ' : , :. GH I:. GH' 2 2:"':. GH': " ' : G 1 H 1: Gn 1 H' , 2:"': G I H r ] Se seleccionan n vectores linealmente independientes de la matriz n X nr. Se comienza con el lado izquierdo de la matriz. Ya que los primeros r vectores HI' Hz, ' .. , H, son linealmente independientes, se seleccionan estos r primeros vectores. Si es asi, que tenemos que r = 1 son vectores linealmente independientes. Entonces se examina GH I para ver si es linealmente independiente de los r vectores escogidos. A continuacion se examina GH 2, GH], ... , GH" ... en el orden que se muestra en la matriz de controlabilidad expandida hasta que se encuentren n vectores linealmente independientes. (Ya que el rango de la matriz de controlabilidad es n, siempre hay n vectores linealmente independientes.) Una vez que se seleccionan los n vectores linealmente independientes, se arreglan en la siguiente forma . 'Gn . F = [ HI:'GHI:"': \- I HI:'H' GH' 2: 2:"':
2:":. H r:. GH' r:':, G",- I H r ] Gn 2- 1 H'
(C-lO)
+ n2 + '" +
n, = n
n, como n min :
(C-ll)
Se hara referencia a esta ecuacion en la discusion de la respuesta de oscilaciones muertas. A continuacion se calcula ~1 y se define el vector renglon 17, como (, donde
17i
= nl +
n2
+ ' ,, +
ni,
= 1,2,. , . ,r
don de
T=[H'
S =
,
(C-12)
fi fiG ] [ fidni-I
Observe que la matriz de transformacion T dada por la ecuacion (C-12) es una extension de la matriz de transformacion dada por la ecuacion (C-4). Para simplificar la presentacion, ahora se considerara un caso simple donde n = 4 Y r = 2. (En este caso, solo n l Y n2 estan involucradas.) (La extension a casos mas generales es directa.) Entonces la matriz de transformacion T se convierte en una matriz de 4 X 4, La matriz de transforrnacion T dada por la ecuaci6n (C-12) se convierte en
T =
[-~~rl
Secci6n C-3
709
donde
(observe que en el caso de n = 4 existen tres posibilidades para las combinaciones n I y n 2". n 1 = I ' 2 n 3; n l = 2, n 2 = 2; y n l = 3, n 2 = 1. Por ejemplo, si n, = 2 y n 2 = 2, entonces las matrices G y H se convierten, respectivarnente, en
G= r
y
GT
[~*" .. ~~!,._c~*,!--~r!],
-aZI -an: -aZ3 -aZ4
si n l
2, n 2
(C-I3)
H=
T- I H
10 0 ' lI I I bl .:
l8
j' (Nota: b
SI
. n l --2 .n. l2
2
=
f l GH 2
0 en este caso)
(C-14)
3 y n2
I, entonces
(C-15)
iI = rIB = 0 0 ,
0 0] [-~--~p-
3, n 2 = 1 (Nota: b l 2 = f l G 2 H 2 puede
=
si n l
(C-16)
0
no ser cero)
(vea el problema C-4). A continuaci6n, se tratara el caso donde n l = 2 y n 2 = 2. (Otros casos se pueden manejar de forma similar. Por ejemplo, para el caso donde '!..I = 3 y n 2 = I, veanse los probleI ma C-3, C-4 y C-5.) Para este caso donde n l = 2 y n 2 = 2, la matriz G = T- GT puede estar dada por la ecuaci6n (C-I3) y la ecuaci6n caracteristica es
0 al4
-1
z +
aZ4
II z
I +Iz
aZI
-11I
aZZ
a13 z
-1
al41
al3)
a23) - (azzz
+ a21)(aI4z +
(C-17)
=0
710
Apendice C
donde se ha utilizado la expansion de Laplace en menores. (Vease el apendice A para los detalles.) De la ecuacion (C-17) la ecuacion caracteristica [zI - G[= 0 se convierte en (C-18) Los valores propios de G se pueden determinar al resolver la ecuacion caracteristica. A continuacion, se determinara la matriz de ganancia de retroalimentacion K para que los valores propios de G- HK sean J.Lj, J.L2' , J.Lw Se define la matriz B de 2 X 2 tal que
(Observe que b12 es una constante que aparece en la matriz H.) En el caso particular donde n j = 2 Y n2 = 2, el valor de b 12 es igual a O. Por 10 tanto, B = I. Para casos mas generales, la matriz B puede no ser la matriz identidad. Tambien, se define la matriz Ll de 2 X 4 como (C-19) Entonces se vera que la matriz K se puede dar por
= B4T- I
[~. ~, ~, ~.]
c5z1
c5zz
8n c5z4
1
-a12 -
8t2
-a22 - c5z2
Secci6n C-3
711
G + iI Bal se convierte
= [Z2 + (a12 + 812)z + au + 8u][Z2 + (a24 + Sz4)Z + a23 + Sz3] - [(aI4 + 81 )Z + a13 + 813 ][(an + Sz2)Z + a21 + Sztl 4
=0
Se quiere que los valores propios de deseada sea (C-20)
(C-21) Si se igualan los coeficientes de potencias iguales de las dos ecuaciones caracteristicas, las ecuaciones (C-20) Y(C-21), se obtienen las ecuaciones siguientes:
a12 + 812 + a24 + 8 2 = a1 4 au + cSt1 + (a12 + cSt2)(a24 + 82 + a23 + 8 2 - (a14 + 81 )(a2 + 8 2 4) 3 4 2 2) (au + cSt1)(a24 + 82 + (a12 + 81 )(a23 + 823 ) 4) 2
= a2
u(k)
= -B.1T- 1 x(k)
= (G HB.1T- 1)x(k)
x(k + 1)
Para continuar, observe que
= Gx(k)
- HB.1T- 1x(k)
Para un conjunto de valores propios deseados ILl' IL2, ~ .. ,pm se tiene los coeficientes correspondientes ai' a 2, ... , all en la ecuaci6n caracteristica IzI - G + uBal = O. Para un valor dado de ai' a 2, ... , all es posible escoger la matriz a que no es (mica. (Esto significa que se tiene cierta libertad para satisfacer otros requerimientos, si existen.)
712
10
Apendice C
Si se desea una respuesta de oscilaciones muertas, se requiere que I-tl = 1-t2 = I-tJ = 1-t4 = O. La ecuaci6n caracteristica deseada dada por la ecuaci6n (C-21) se convierte en
A =
[-:11 -:12
0
A
=:~ =:~]
G1
(C-22)
donde los elementos indicados por el asterisco son constantes arbitrarias, entonces convierte en
H B.6. se
G - HBA =
0 0
**
o o o o ** o
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0] 0
1
donde los elementos indicados por el asterisco doble son constantes arbitrarias.
(G - JiBAj'
~ ** ~
[
0
**
0 0
(G - JiBA)'
y
~ [~
~ [~
**
0 0 0 0 0
(G - UBAj'
De esta manera, se obtiene la respuesta de oscilaciones muertas. La matriz .6. dada por la ecuaci6n (C-22) no es (mica porque diferentes selecciones de elementos produciran la respuesta de oscilaciones muertas. Por 10 tanto, existe mas de una matriz de ganancia de retroalimentaci6n del estado K que produce la respuesta de oscilaciones muertas. Esto era de esperarse, ya que hay dos sefiales de control u](k) y ulk) disponibles, en lugar de una sola sefial de control. Es importante sefialar que si se selecciona a
~] ~] ~]
A
entonces
= [-a l1
-a21
-a12 -a22
-al3 -a23
(C-23)
Secci6n C-3
713
(G -
HB.l1)2
Por 10 tanto (G - HBat se hace cero para k = 2, 3, 4, ... La respuesta de oscilaciones muertas se alcanza en dos periodos de muestreo. De hecho, en general, al escoger los elementos de a en la manera dada por la ecuacion (C-23), la respuesta de oscilaciones muertas se puede alcanzar en n min pasos en lugar de n pasos, donde
Extension al caso mas general. Se ha dado una discusion detailada para el caso donde n = 4 (n j = n 2 = 2) Yr = 2. La extension de la discusion anterior al caso mas general es directa. Por ejemplo, considere el caso cuando n = 6 Yr = 3. Para este caso,
y se tienen varias combinaciones de n j , n2 Y nJ Ahora considere el caso donde n, = 3, n 2 = 2, Y nJ = I. La matriz de controlabilidad F modificada para este caso es
Se define
!!!= }n
F- 1
***
fl
=3
!t~~
fn
-r;-
=2 }n3 = 1
2
donde un rengl6n de asteriscos denota un vector rengl6n. Entonces la matriz de transformacion T se puede formar como sigue:
donde
s,
~ [~~~;l
o o
-all
s,
0 1
~ tl~-].
I I
1 0
0 0
0:I 0 0: 0
I
1 :I 0
~------------J-----
714
Apendlce C
o o
0 0
0 0
1 b l 2 b 13 H= -6---6----6o 1 b 2J
-6---6----C
donde b]2 = f l G 2 Hz, b 13 = f l G Z H 3, YbZ3 = f z GH 3 Estos valores pueden 0 no ser cero. (Observe que en la matriz G los menores principales estan en la forma can6nica controlable.) La matriz de ganancia de retroalimentaci6n del estado K esta dada como sigue:
K
donde
B.1T- 1
B
Y
~ [~
bl2 1 0
b'T
b 23 1
.1
[~'
8,,] 5
26
5 36 0 0 1 0 0 0 0 O' 0 0 1 0 0 0 0 0 0 1
Observe que
HB =
0 0 0 0 0 0 1 b 12 b 13 0 0 0 0 1 b 23 1 0 0
[~ b'T
b12 1 b 23 0 1
EI efecto de postmultiplicar la matriz B por H es eliminar a bij del producto de matrices Observe que si u(k) es un vector-r la forma general de la matriz B es
HB.
1 b 12 0 1 B= 0 0
b'I'
b 2r b 3r
(C-24)
donde las constantes bij son aquellas que aparecen en la matriz son 0 01.)
Ejemplo C-I Considere el sistema
H de n x
r. (Los elementos de
HB
Secci6n C-3
715
donde
x(k) = vector de estado (vector-S) u(k) = vector de control (vector-2)
G=
0 1 0 ] 0 0 1 , [ -0.25 0 0.5
Se desea determinar la matriz de ganancia de retroaJimentaci6n del estado K para que la respuesta al estado inicial xeD) sea de oscilaciones muertas. Observe que con la retroaJimentaci6n del estado u(k) = -Kx(k), la ecuaci6n del sistema se convierte en
x(k + 1) = (G - HK)x(k)
Primero se examinara la matriz de controlabiJidad: [H: GH: G2H] = [HI: H2 : GH t : GH2 : G2H t : G2H 2]
=
(C-25)
0 1 -0.25 0] 0 0.5
Es claro que, el rango de esta matriz de controlabiJidad es 3. Por 10 tanto, la ubicaci6n arbitraria de los polos es posible. Ahora se escogen tres vectores Jinealmente independientes comenzando desde el lado izquierdo. Estos vectores se muestran encerrados entre lineas punteadas. (Los tres vectores linealmente independientes se escogen como Hj, Hz, YGH I . ) Ahora se reacomodan estos tres vectores de acuerdo a la ecuaci6n (C-IO) y se define la matriz F como sigue:
F = [HI: GH t : H2 ]
Se observa que n l = 2 y nz = 1. AI rescribir la matriz F, se tiene
F
La matriz inversa de F es
~ [~ ~
1] 00
0.5
F' =
[~
T ~]
0]
Ahora se define el vector rengl6n TI, de F""I como f l, donde TIl = n l Y Tl2 = n l + nz. Ya que n l = 2 y nz = 1, los vectores f l Y f 2 son el segundo Y tercer vectores renglon, respectivamente. Es decir,
r, =
Ahora, se define la matriz de transformaci6n T como
[0 1 0]
f 2 = [1 0
donde
716
10
Apendice C
Par 10 tanto,
T =
y
0 1 0 0 [1 0
~]-1 [~ ~ ~]
=
0 1 0
T'
Con esta matriz de transformaci6n T, se define
~ [!
~ !]
x(k) = Ti(k)
Entonces
T- 1GT =
~ [-H?+~~J5-]
T- 1 H= H
G- DBA
~ [! ~5
=
++ [! !][:
0.5
-8 22 -8
0][8 1 821
11
[-~1I
1-
~1
Seccion C-3
717
=
IzI - G + HB.11
I 8~1
z -
-1 + 82\
0~51 + 8
8 22
12
0.25 0+ 813 1
z + 8 23
=0
Como se desca la respuesta de oscilaciones muertas, la ecuacion caracterfstica deseada es
Observe que la seleccion de las 8 no es (mica y la matriz a no es unica, Suponga que se escogen las 8 tal que
811
0,
012
= 0.5,
813
= -0.25
8 22 = 0,
Entonces
z o lo
8 23 = 0
IzI - G + HB.11 =
y por 10 tanto
-~1 0~1
Z3
=0
!]
0.5]
1 0
=
(G - HB.1)k
Por 10 tanto,
k
Observe que
= 2,3,4, ...
- T-'HKT
G-
= r1GT
= r'(G
- HK)T
Con referencia a la ecuacion (C-25) y su solucion x(k) = (G - HKi x(O), se tiene que x(k) = 0 para k = 2. 3, 4, ..., ya que
718
10
Apendics C
= T(G -
= T(G -
HB.1)2T- 1
=0
x(k) = (G - HK)kx(O) = 0,
k = 2,3,4 ...
Por 10 tanto, se ha disenado la matriz de ganancia de retroalimentaci6n del estado K para que la respuesta del sistema al estado inicial x(O) sea de oscilaciones muertas. EI estado x(k) se puede transferir al origen a 10 maximo en dos periodos de muestreo. [Observe que si la senal de control u(k) fuera un escalar entonces se podrian tomar a 10 mas tres periodos de muestreo, en lugar de los dos periodos de muestreo, para la respuesta de oscilaciones muertas.]
Problema C-I
Considere el sistema dado por
x(k
donde
x(k)
=
+ I)
= Gx(k)
+ HI u(k)
matriz de n
xn
HI = matriz de
nX I
Muestre que
T;'GT,
!
-an
1
0 0
(C-26)
0
-an-l
-an-2
Apendice C
719
o o
o
1
(C-27)
Solucion Se probaran las ecuaciones (C-26) y (C-27) para el caso donde n = 3. (Las extensi6n para un numero entero positivo arbitrario n es directa.) Por 10tanto, se obtendra que
(C-28)
Yaque
T~t [r:~] rG
=
2 3
o
-a2
-at
~ r:~]
f3 G
2
][
(C-29)
Ahora considere la transpuesta conjugada dellado derecho de la ecuaci6n (C-29). Al observar que para sistemas fisicos los coeficientes a b ab ... , an del polinomio caracteristico son reales, se tiene
Por 10tanto,
En consecuencia,
IfI'G'fHG.)'r;{
o o
1
720
10
Apendice C
la cual es la ecuacion (C-29). Por 10 tanto, se ha mostrado que la ecuaci6n (C-28) es cierta. 0
r;' GT, =
A continuacion se mostrara que
[~ ~ -u, ~]
-U3 -U2
Yaque
[H,GH,G'H,]
se obtiene
'~[::]
Por 10 tanto,
f3H, =0,
Al emplear estas ecuaciones, se obtiene
f3GH1 = 0 ,
f3G 2 H , = 1
T1'H,=
Observe que la extension de 10 prescntadoaqui al caso de un numero positivo arbitrario n se puede hacer facilmente. Problema C-2 Considere el sistema
x(k + 1)
donde x(k)
=
= Gx(k) +
Hu(k)
- 1
G =
o
o
o
1
-2
1 1 -1
Apendics C
721
Con referencia a la ecuaci6n (C-I 0), se obtiene la matriz F. Entonces, al emplear la matriz de transforrnacion T definida por la ecuacion (C-12), se determinan las matrices = T- ' GT y = T- ' H. Por ultimo, obtenga la ecuacion (C-14). Solucion Primero se escribira la matriz de controlabilidad como sigue:
2 0
-5
til
-3 2
L_~
11 3 0 -6 o 1 2
Ahora se escogen cuatro vectores lineal mente independientes de esta matriz de 4 X 8, comenzando desde el extrema izquierdo. (Estos vectores se muestran encerrados por lineas punteadas.) Los cuatro vectores linealmente independientes son HI' H 2, GH I YGH 2 A continuacion se arreglan estos cuatro vectores de acuerdo con la ecuacion (C-I 0) y se define la matriz F como sigue:
F
La inversa de esta matriz esta dada por
~ [~ -~ ~ ~]
~ [~
f l = [0
F-'
1 1 -1 -0.5 o 0.5
~ ~]
0]
Como en este caso n l = 2 Yn 2 = 2, el segundo vector rengl6n de y-I se define como f , y el cuarto vector rengl6n como f 2 Entonces
1 0
0.5 0]
donde
Por 10tanto,
T=
f~~ [
f
]_1
=
[0
~
0
o
1 0.5 -0.5
-2
o
0.5
0]-1 [2 ~ -~ 0]
f2 G
J.5 ~ i ~
722
Apendico C
G=T-IGT=[~ -~ ~ ~][-~-~ o
o
0 0.5 0.5 0 -0.5 1 0 1
Tse obtiene
1 1 -1 0 o
[-~ -~ ~~]
0 1.5 0 1.5 0 1 -1 0
o
1 0.5 -0.5
Observe que, cuando n, = n z = 2, la matriz G tiene la forma dada por la ecuacion (C-13) y la matriz tiene la forma dada por la ecuacion (C-14), 0 bien
iI
G=
[~*'!_-~~]'-f~~'--~{"],
-a21 -all I -a23
I
H = [:01__
-a24
!?:1.!~]
(Observe que, en este caso, biz es cero.) Finalmente, se obtendra la ecuacion (C-14). Observe que
F-'F ee [
~}R' GR,
H, GH,]
_[~I:I ~lg:1 ~1~2 ~lg~2] m2HI m 2GHI m2H2 m 2GH2 fzH I f2GH. f2H2 f2GH z
donde m, y mz son el primero y tercer vector renglon de Y-', respectivamente. Como y-I F es una matriz identidad, se tiene que f l H, = 0, f, Hz = 0, f, GH, = I, f, GH z = 0, f z H, = 0, f z Hz = 0, f z GH, = 0, Y f z GH z = I. Por 10 tanto, tenemos
:[~~!~]
Secci6n C-3
723
Problema C-3
Considere el sistema definido par la ecuacion (C-8):
i(k + 1)
T-IGTi(k) + rIHu(k)
Gi(k) + Hu(k)
donde la matriz de transforrnacion T estadefinida par la ecuaci6n (C-12). Suponga que la matriz G esta dada par la ecuacion (C-15) y la matriz H esta dada par la ecuaci6n (C-16). Es decir,
G=
Muestre que
-an [ -aZI
0 0
1 0
0 i: 0 1 1 0
H=
0 01 0 0 [~--~f-
o
-a12 -a22 -
o
1
a12 a22
-a13 -a23 -
a13
a23
donde
(C-30)
don de los elementos mostrados con asterisco son constantes arbitrarias, el sistema presentara una respuesta de oscilaciones muertas para cualquier estado inicial x(O); es decir,
k
Tamhien muestre que si se escoge
= 4,5,6, ...
(C-31)
a = [-an
Entonccs para k
~ nnun
-a21
-a12 -aZ2
-a13 -a23
dondc
nmin
Solucion
Para el caso donde la matriz G esta dada por la ecuacion (C-15). sc tiene
z IzI - GI
=
-1
z
al2 a22
0 -1
z+
at3 a23
0 0
z+
at4 a24
an
aZI
724
10
Apendice C
[z I _
GI
= z
+ a24
al4
al4
-111 + an 01 -1
+ an Z2 + al2 z + + a21)
(C-32)
z
= (z
a24)(z3
Por 10 tanto, el determinante lzl - G I se puede escribir corno: 3 IZI - GI = Iz + aliz2 + al2 Z + all a23Z + a22Z + a21
al. a24
Lucgo se calcula
08&
~ [1
,
(Observe que el efecto de postrnultiplicar la rnatriz H por la matriz B cs eliminar Par 10 tanto
G - HB.:1
[~
o
1
-an -a23 -
513 52 3
G - HB.:1
[~o ~ o 0] o
1 0
0 * * * 0
donde los elementos mostrados eon asterisco son constantes arbitrarias. Observe que
(G -
08&)'
~~
[
0 0 0
1 0 0
* *
0 0 0 0 0 0
(G -
""&)'
~ [~ o
~ [~
(G -
08&)'
0 0 0 0 0 0 0 0
~] ~] ~]
Apendice C
725
Par 10 tanto,
k~4
Se ha visto quc la respucsta dc oscilaciones muertas se alcanza al cscoger d como la dada por la ecuaci6n (C-30). Sin embargo, si se escoge d como la de la ecuaci6n (C-31), entonces la respuesta de oscilaciones m}lerta~ se pucde alcanzar en a 10 mas tres pcriodos de mucstreo, parquc los asteriscos que aparecen en (G - H Bd)3 sc convicrten en cero y
k
Problema C-4
Considere el sistema siguientc:
nmin
= 3
G~[-l-~ -I ~l H~[H'H'I~[~~]
= ~Kx(k),
Al emplear el control por retroalimentaci6n del estado u(k) cerrado en los siguicntes puntos:
Zl
= 0.5 + fO.5,
Z2 =
0.5 - fO.5
Z3
= -0.2,
z. = -0.8
Determine la matriz de ganancia de retroalimentaci6n del estado K requerida. Entonces, mediante las matrices G y H dadas. obtenga la ecuacion (C-16). Soluci6n Primero sc examinara la matriz dc controlabilidad:
_ -
L_~J EI rango de esta matriz de controlabilidad cs 4. Por 10tanto, la ubicaci6n arbitraria de pol os es posible. Se escogen cuatro vectores linealmente independientes comenzando desde el cxtremo izquicrdo. (Estos vectores se muestran encerrados en lineas punteadas.) Los cuatro vectores linealmente independientes se escogen como H t- H 2o GH [y G 2 H r- Ahara estos cuatro vectores se rearreglan de acuerdo con la ecuaci6n (C-IO) y la matriz F se define como sigue:
-1 :-3: 2 11 -5]
1 0 1 : 8: :-3:I I - 3 - 22 11 3 15-6 0 -1 2 (C-33)
n[
=3y
n:
F =
0 1:-3 1] [i---~~-t~-~-%
1 1: 2 0
[~+&j
726
10
Apendice C
(El mismo resultado se puede obtener facilrnente con MATLAI3.) Como n l = 3 Y n2 = I, se escoge el tercer vector como f l Y el cuarto como f 2 . (Observe que el vector rengl6n se define como 1j" don de 1j, = n l + n2 + ... + n., como f,.) Es decir,
fl
= [0 t t -tJ
f 2 = [1 ~
La matriz de transformacion T se define como
-~J
donde
Por 10tanto,
~ [!
3 -1
3 3 2
~
-t
x(k)
entonces
Ti(k)
G= r
Tambien
GT
[2
-- ---------,---
0 1 0: OJ 0 0 1 i 0 o 3 -2 1
I
(C-34)
0 :-1
-I -rlj[~ ~j [Uj
~
(C-35)
-~
1 0
Apsndice C
727
X
Con referencia a la ecuacion (C-24) y al notar que, en este caso, h l 2 = 0, la matriz B es una matriz de 2 2 dada por
(C-36)
Para este caso,
~
es una matriz de 2
4:
Por \0 tanto
G-
im~ = [~
23
-------------------------~---------
-1511 3 - 15 12 2 - 15 21 -1522
IzI - G +
Esta ecuacion caracteristica debe ser igual ala ecuacion caracteristica deseada, que es
= Z4
=0
Si se igualan los coeficientes de potencias iguales de z de las dos ecuaciones caracteristicas. se tendran cuatro ecuaciones para determinar las ocho 8. Por 10 tanto, la matriz ~ no es unica, Suponga que se escogen en forma arbitraria
15 22 = 0,
Entonces
~ = [0.34
Entonces la matriz K se obtiene como sigue:
2.66 2.08 0
-2
K =
B~T-1 =
0 -1
u(k) = -Kx(k)
728
10
Apendice C
colocara los polos de lazo cerrado en r, = 0.5 + )0.5, :':2 = 0.5 -)0.5,:,:) la matriz K no es (mica: existen muchas posiblcs matrices para K. Por ultimo. se obtiene la ecuacion (C-16). Observe que
F'F~[~}'
_ m IHI mzH I flH I [ fzH I mlGH I mzGH I flGH I fzGH I mlGzH I mzGzH I flGzH I fzGzH I
donde m, Y m, son el primero Y segundo vcctorcs rengl6n de F- I respectivamcnte. Como F- I F es la matriz identidad, f l HI = O. f l H 2 = 0, f l GH I = 0, f l G 2 HI = L f2 HI = 0 Y f 2 H 2 = 1. Dc la ecuaci6n (C33) se observa que GH 2 es linealmente dcpendiente de HI' H 2, YGH I. Por 10tanto. f l GH 2 = O'fl HI + {3f l H 2 + yt'l GH I = 0, donde 0', (3, Y 'Y son constantcs, Observe que f l G 2 H 2 puedc 0 no ser cero. En consecuencia,
Problema C-5
Con referencia al problema C-4. considere cl mismo sistema. Suponga que se dcsea una rcspucsta de oscilaciones muertas para un estado inicial arbitrario x(O). Determine la matriz de ganancia de rctroalimentacion del estado K.
Solucion
A
donde
[=:::
=::~
=::: =:::] = [~
~ -~
-n
G - HBA = 000 0
Y se encuentra
[~ ~ ~ ~]
o
0 0 0
k = 3,4,5, ...
(G -
HBA)k = 0,
Aperidice C
729
La respuesta de oscilaciones muertas sc alcanza en a 10 mas tres periodos de muestreo. [Observe que en este problema n j = 3 y n2 = I. Por 10 tanto, nmin = max (nj, n-2) =3.] La matriz de ganancia de retroalimentaci6n del estado K sc obtiene como sigue:
= Bar]
=
[~ ~][~
1 -~
o
'3
1
-2
-t J -~3:]
'3
2
:3
]_ :3 3
= [ -1
u(k)
-Kx(k)
colocara los polos de lazo cerrado en eI origen y, por 10 tanto, producira Ia respuesta de oscilaciones muertas para cualquier estado inicial x(O).
I11I1
8;"';09ro';0
A-I. Antoniou, A., Digital Filters: Analysis and Design. Nueva York: McGraw-Hill Book Company, 1979. A-2. Aseltine, J. A., Transform Method in Linear System Analysis. Nueva York: McGraw-Hill Book Company, 1958. A-3. Astrom, K. J. Y B. Wittenmark, Computer Controlled Systems: Theory and Design. Englewood Cliffs, N. 1.: Prentice Hall, lnc., 1984. B-1. Bellman, R., Introduction to Matrix Analysis. Nueva York: McGraw-Hill Book Company, 1960. B-2. Bristol, E. H., "Design and Programming Control Algorithms for DDC Systems, " Control Engineering, 24, Enero de 1977, pp. 24-26.
B-3. Butman, S, yR. Sivan (Sussman), "On Cancellations, Controllability and Observability, " IEEE Trans. Automatic Control, AC-9 (1964), pp. 317-18.
C-1. Cadzow, J. A. Y H. R. Martens, Discrete-Time and Computer Control Systems. Englewood Cliffs, N. J.: Prentice Hall, lnc., 1970. C-2. Chan, S. W., G. C. Goodwin y K. S. Sin, "Convergence Properties of the Riccati Difference Equation in Optimal Filtering of Nonstabilizable Systems," IEEE Trans. Automatic Control, AC-29 (1984), pp. 110-18. C-3. Churchill, R. V. Y J. W. Brown, Complex Variables and Applications, 4a. ed., Nueva York: McGraw-Hill Book Company, 1984. D-1. Dorato, P. y A. H. Levis "Optimal Linear Regulators: The Discrete-Time Case," IEEE Trans. Automatic Control, AC-16 (1971), pp. 613-20. E-1. Evans, W. R., "Control System Synthesis by Root Locus Method," AlEE Trans. Part 11.69 (1950), pp. 66-69.
730
Bibliograffa
731
F-I. Falb, P. L. Y M. Athans, "A direct Constructive Proof of the Criterion for Complete Controllability of Time-Invariant Linear Systems," IEEE Trans. Automatic Control. AC-9 (1964), pp. 189-90. F-2. F-3. F-4. Fortmann, T E., "A Matrix Inversion Identity," IEEE Trans. Automatic Control, AC-I5 (1970), p.599. Franklin, G. F., J. D. Powell y M. L. Workman, Digital Control ofDynamic Systems, 2nd ed., Reading, Mass.: Addison-Wesley Publishing Co., Inc., 1990. Freeman, H., Discrete-Time Systems. Nueva York: John Wiley & Sons, Inc., 1965.
G-I. Gantmacher, F. R., Theory of Matrices, Vols. I and II. Nueva York: Chelsea Publishing Co., Inc., 1959. G-2. Gopinath, B., "On the Control of Linear Multiple Input-Output Systems," Bell Syst. Tech. J, 50 (1971), pp. 1063-81. H- I. Hahn, w., Theory and Application of Liapunov 's Direct Method. Englewood Cliffs, N. J.: Prentice Hall, Inc., 1963. H-2. Halrnos, P. R., Finite Dimensional VectorSpaces. Princeton, N. 1.: D. Van Nostrand Company, 1958. I-I. J-I. J-2. J-3. J-4. J-5. J-6. J-7. J-8. Ichikawa, K., Theory for Design ofControl Systems (in Japanese). Tokyo: Gijutsu-Shoin, 1989. Jerry, A. J., "The Shannon Sampling Theorem ~Its Various Extensions and Applications: A Tutorial Review," Proc. IEEE, 65 (1977), pp. 1565-95. Jury, E. I., "Hidden Oscillations in Sampled-Data Control Systems," AlEE Trans. Part II, 75 (1956), pp. 391-95. Jury, E. I., Sampled-Data Control Systems. Nueva York: John Wiley & Sons, Inc., 1958. Jury, E. I., "Sampling Schemesin Sampled-Data Control Systems," IRE Trans. Automatic Control, AC-6 (1961), pp. 88-90. Jury, E. I., Theory and Applications ofthe z Transform Method. Nueva York: John Wiley & Sons, Inc., 1964. Jury, E. I., "A General z-Transform Formula for Sampled-Data Systems," IEEE Trans. Automatic Control, AC-12 (1967), pp. 606-8. Jury, E. I., "Sampled-Data Systems, Revisited: Reflections, Recollections, and Reassessments," ASME J Dynamic Systems, Measurement, and Control, 102 (1980), pp. 208-16. Jury, E. I. y 1. Blanchard, "A Stability Test for Linear Discrete-Time Systems in Table Forms," Proc. IRE, 49 (1961), pp. 1947-48.
K-I. Kailath, T, Linear Systems, Englewood Cliffs, N. J.: Prentice Hall, Inc., 1980. K-2. Kailath, T, y P. Frost, "An Innovations Approach to Least-Squares Estimation, Part 11: Linear Smoothing in Additive White Noise," IEEE Trans. Automatic Control, AC-13 (1968), pp. 655-60. K-3. Kalman, R. E., "On the General Theory ofControl Systems," Proc. First Intern. Cong. IFAC, Moscow, 1960. Automatic and Remote Control. Londres: Butterworth & Co., Ltd., 1961, pp. 481-92. K-4. Kalman, R. E. I J. E. Bertram, "Control System Analysis and Design via the Second Method of Liapunov: I. Continuous-Time Systems; 11. Discrete-Time Systems," ASME J Basic Engineering, ser. D, 82 (1960), pp. 371-93, 394-400.
732
BibliograHa
K-5. Kalman, R. E., Y. C. Ho Y K. S., Narendra, "Controllability of Linear Dynamical Systems," Contributions to Differential Equations, 1 (1963), pp. 189-213. K-6. Kanai, K. y N. Hori, Introduction to Digital Control Systems (in Japanese), Tokyo: Maki Shoten, 1992. K-7. Katz, P., Digital Control Using Microprocessors. Londres: Prentice Hall International, lnc., 1981. K-8. Kreindler, E. y P. E. Sarachik, "On the Concepts of Controllability and Observability of Linear Systems," IEEE Trans. Automatic Control, AC-9 (1964), pp. 129-36. K-9. Kuo B.
c., Digital
Control Systems. Nueva York: Holt, Rinehart and Winston, lnc., 1980.
L-I. LaSalle, J. P. Y S. Lefschetz, Stability by Liapunov s Direct Method with Applications, Nueva York: Academic Press, Inc., 1961. L-2. Lee, E. B. Y L. Markus, Foundations ofOptimal Control Theory. Nueva York: John Wiley & Sons, Inc., 1967. L-3. Leondes, C. T. Y M. Novak, "Reduced-Order Observers for Linear Discrete-Time Systems," IEEE Trans. Automatic Control, AC-19 (1974), pp. 42-46. L-4.
u, Y. T., 1. L. Meiry y R. E. Curry, "On the Ideal Sampler Approximation," IEEE Trans. Automatic Control, AC-17 (1972), pp. 167-68.
L-5. Luenberger, D. G., "Observing the State of a Linear Systems," IEEE Trans. Military Electronics, MIL-8 (1964), pp. 74-80. L-6. Luenberger, D. G., "An Introduction to Observers," IEEE Trans. Automatic Control, AC-16 (1971), pp. 596-602. M-I. Melsa, 1. L. y D. G. Schultz, Linear Control Systems. Nueva York: McGraw-Hili Book Company, 1969. M-2. Middleton, R. H. Y G. C. Goodwin, Digital Control and Estimation-A Unified Approach. Englewood Cliffs, N. J.: Prentice Hall, Inc., 1990. M-3. Mitra, S. K. Y R. J. Sherwood, "Canonic Realizations, of Digital Filters Using the Continued Fraction Expansion," IEEE Trans. Audio and Electroacoustics, NAU-20 (1972), pp. 185-94. M-4. Mitra, S. K. Y R. 1. Sherwood, "Digital Ladder Networks," IEEE Trans. Audio and Electroacoustics, AU-21 (1973), pp. 30-36. N-1. Neuman, C. P. Y C. S. Baradello, "Digital Transfer Functions for Microcomputer Control," IEEE Trans. Systems, Man, and Cybernetics, SMC-9 (1979), pp. 856-60. N-2. Noble, B. y J. Daniel, Applied Linear Algebra, 2nd ed. Englewood Cliffs, N. J.: Prentice Hall, Inc., 1977. 0-1. Ogata, K., State Space Analysis of Control Systems, Englewood Cliffs, N. J.: Prentice Hall. Inc. 1967. 0-2. Ogata, K., Modern Control Engineering, 2nd ed. Englewood Cliffs, N. J.: Prentice Hall, Inc., 1990. 0-3. Ogata, K., Systems Dynamics, 2a. ed., Englewood Cliffs, N. 1.: Prentice Hall, Inc., 1992. 0-4. Ogata, K., Solving Control Engineering Problems with MATLAS. Englewood Cliffs, N. J.: Prentice Hall, Inc., 1994.
Bibliografla
733
0-5. Ogata, K., Designing Linear Control Systems with .MATLAS. Englewood Cliffs, N. 1.: Prentice Hall, Inc., 1994. P-I. P-2. P-3. Pappas, T., A. 1. Laub y N. R. Sandell, Jr., "On the Numerical Solution ofthe Discrete-Time Algebraic Riccati Equation," IEEE Trans. A utomatic Control, AC-25 (1980), pp. 631-41. Payne, H. 1. Y L. M. Silverman, "On the Discrete Time Algebraic Riccati Equation," IEEE Trans. Automatic Control, AC-18 (1973), pp. 226-34. Phillips, C. L. Y H. T. Nagle, Jr., Digital Control Systems Analysis and Design, Englewood Cliffs, N. J.: Prentice Hall, lnc., 1984.
R-I. Ragazzini, J. R. Y G. F. Franklin, Sampled-Data Control Systems. Nueva York: McGraw-Hill Book Company, 1958. R-2. Ragazzini, J. R. Y L. A. Zadeh, 'The Analysis of Sampled-Data Systems," AlEE Trans. Part II, 71 (1952), pp. 225-34.
S-I. Strang, G., Linear Algebra and Its Applications. Nueva York: Academic Press, Inc., 1976. T-1. Tou, J. T., Digital and Sampled-Data Control Systems. Nueva York: McGraw-Hill Book Company, 1959. T-2. Turnbull, H. W. Y A. C. Aitken, An Introduction to the Theory of Canonical Matrices. Londres: Blackie and Son, Ltd., 1932. V-I. Van Dooren, P., "A Generalized Eigenvalue Approach for Solving Riccati Equations," SIAM .J. Scientific and Statistical Computing, 2 (1981), pp. 121-35. W-I. Willems, J. C. Y S. K. Mitter, "Controllability, Observability, Pole Allocation, and State Reconstruction," IEEE Trans, Automatic Control, AC-16 (1971), pp. 582-95. W-2. Wolovich, W. A., Linear Multivariable Systems. Nueva York: Springer-Verlag, 1974. W-3. Wortham, W. M., "On Pole Assignment in Multi-Input Controllable Linear Systems," IEEE Trans. Automatic Control, AC-12 (1967), pp. 660-65. Z-I. Zadeh, L. A. Y C. A. Desoer, Linear System Theory: The State Space Approach. Nueva York: McGraw-Hill Book Company, 1963.
indice
A
Acci6n de control PID: controlador anal6gico, 115 Alcanzabilidad,474-475 Analisis de estabilidad de Liapunov, 321-336 de sistemas en tiempo continuo, 329-332 de sistemas en tiempo discreto, 332-334 primer metodo de, 321 segundo metodo de, 321-322 Analisis de estabilidad: de sistemas lineales e invariantes en el tiempo, 328 mediante el uso de la transformaci6n bilineal y el criterio de estabilidad de Routh,191-192 Angulo: de la asintota, 207-208 de Ilegada, 209 de salida, 209
C
c2d,628 Cancelaci6n de polos y ceros, 211, 469-481 Cero, 39-40 Circuito del muestreador y retenedor, 13-14 operaci6n en el modo de retenci6n del, 1314 operaci6n en el modo de seguimiento del, 13-14 Circuitos de retenci6n de datos, 77 Circuitos de retenci6n de orden superior, 19, 82 Circuitos de retenci6n, 17-18 Codificaci6n, 6, 8 Codificador, 7 Compensaci6n: de adelanto de fase, 233 de atraso de fase, 233 de atraso-adelanto de fase, 233 Compensador de adelanto de fase, 234, 237 Compensador de adelanto, 262, 272-273 Compensador de atraso de fase, 234 Compensador de atraso, 224, 273-274
735
B
Bloque de Jordan, 383, 651-652
736
Indice
Compensador de atraso-adelanto de fase, 233 Conjunto ortogonal, 648 Constante de error estatico de posicion, 199 Con stante de error estatico, 198-201 Con stante del error estatico de aceleracion, 198-201 Con stante del error estatico de velocidad, 199 Contracci6n, 334-335, 367-368 Control6ptimo cuadratico: de sistemas de seguimiento, 596-609 en estado estacionario, 587-596 Control PID digital: algoritmo de posici6n, 116 algoritmo de velocidad, 117 Controlabilidad, 377, 379 de la salida completa, 385-386 de la salida, 387 del estado completo, 380-384, 387, 393, 406 en el plano z, 384 matrizde, 380, 401, 707-708 Controlador anal6gico, 21 Controlador digital, 20 realizaci6n de un, 122 Controlador PD, 234 Controlador PI, 234 Controlador PID digital, 114-118 Controlador PID, 117-118, 121,233-234 algoritmo de posici6n, 116 algoritmo de velocidad, 117, 157, 159-160 anal6gico, 156-159 digital, 156-159 Conversi6n anal6gica a digital, 14 Convertidor AID, 15 de tipo contador, 15 del tipo de aproximaciones sucesivas, 15 Convertidor anal6gico a digital, 7 Convertidor Dj A: mediante resistores ponderados, 16, 18 mediante un circuito en escalera R-2R, 17-18 Convertidor digital a anal6gico, 7, 16
Covector, 572 Criterio de estabilidad de Routh: transformaci6n bilineal acop1ada con el, 191-192, 258-259 Criterio de Sylvester: para definici6n negativa, 662 para definici6n positiva, 661-662, 679 para semidefinici6n negativa, 663 para semidefinici6n positiva, 662 Cuantificaci6n, I, 7 error de, 9 nivel de, 8-9 proceso de, 4 ruido de, 9, II, 126 Cuantificador,9, 10
D
Decodificaci6n,6 Decodificador,7 Definici6n negativa: de una funci6n escalar, 661 Definici6n positiva: de una funci6n escalar, 660-661 Demultiplexor, 13 Dependencia lineal de vectores, 643 Desigualdad de Schwarz, 645-646 Determinante, 633-635 propiedades de un, 634-635 Diagrama de bloques: de un sistema de control en tiempo continuo en el espacio de estados, 296 de un sistema de control en tiempo discreto en el espacio de estados, 296 Diagrama de Bode, 232-233 Diferencia hacia adelante, 322 m-esima, 699 primera, 698-699 segunda, 698 tercera, 698 Diferencia hacia atras: m-esima, 698
In dice
primera, 697 segunda, 698 tercera, 698 Diferenciaci6n cornpleja, 681-682 Diferenciaci6n: en el plano z, 165 Diofanto, 518 Discretizacion, 6, 394 de la ecuaci6n en el espacio de estados en tiempo continuo, 314 Disefio: basado en el enfoque de las ecuaciones pol inomiales, 517-540 basado en el metodo analitico, 242-257 basado en el metodo de respuesta en frecuencia, 225-242 basado en el metodo del lugar geometrico de las raices, 204-225 basado en la ubicaci6n de polos con retroalimentaci6n del estado observado, 421-460 basado en la ubicaci6n de polos, 402-421 Doblamiento,96 en frecuencia, 96 error de, 97 Dominio de atraccion, 325
737
E
Ecuaci6n de error del observador, 428, 443, 445,450 Ecuaci6n de estado lineal en tiempo discreto: soluci6n del caso invariante en el tiernpo, 302-309 soluci6n del caso variante en el tiernpo, 309-310 Ecuaci6n de estado: enfoque de la transformada z para la soluci6n de la, para el caso en tiempo discreto, 304-307 equivalente mediante el retenedor de orden cero de la, en tiempo continuo, 315-317
soluci6n de la, para el caso en tiempo continuo, 312 soluci6n de la, para el caso lineal e invariante en tiempo discreto, 302-309 soluci6n de la, para el caso lineal y variante en tiempo discreto, 309-310 Ecuaci6n de Riccati, 573-574 en estado estacionario, 588-589, 600-621 Ecuaci6n Diofantina, 518, 520-521, 523-525, 529,533,535,547,551,555,559 soluci6n a la, 520-521 Ecuaci6n indeterminada, 623 Energia de control minima, 622 Energia de control, 622 Enfoque de ecuaciones polinomiales: al disefio de sistemas de control, 525-532 al disefio de sistemas de regulacion, 523-525 Entrada delta de Kronecker, 43, 103 Error de actuaci6n en estado estacionario, 198-200 Error de actuacion, 200 Error de ganancia de un convertidor AID, 16-17 Error de linealidad de un convertidor AID, 16-17 Error de redondeo, 9 Error en estado estacionario, 196-197, 200-201 Errores en convertidores AID: error de ganancia, 16-17 error de linealidad, 16-17 error de nivel, 16-17 Espacio de estados, 294 Espectro de frecuencia: de componentes complementarias, 92 de un filtro paso bajas ideal, 92-93 de una componente prirnaria, 92 de una serial muestreada, 91-92 Estabilidad absoluta, 193 Estabilidad asint6tica uniforrne, 365 a 10 grande, 364-365
738
Indice
Estabilidad asint6tica, 325 a 10 grande, 325 Estabilidad BIBO, 326 Estabilidad de entrada-acotada salida-acotada, 326 Estabilidad relativa, 193, 195,220 Estabilidad uniforme, 324 Estabilidad,324 teorema de Liapunov sobre, 327 Estado de equilibrio aislado, 324 Estado de equilibrio, 324 Estado, 294 Estimador de estados, 422 Evaluacion en el semiplano derecho de la, 86-88 Expansi6n en series de Laurent, 141,687, 689
F
Filter, 603-604 Filtro de promediado movil, 136 Filtro de respuesta al impulso fin ita, 135-137 Filtro de respuesta al impulso infinita, 135 Filtro digital, 122 programaci6n directa de un, 123-124, 133 programacion en escalera de un, 128-135 programacion en paralelo de un, 127-128 programacion en serie de un, 126-127 programacion estandar de un, 124-125, 133-134 realizacion en paralelo de un, 163-165 rea1izaci6n en serie de un, 163-165 realizaci6n mediante un diagrama de bloque de un, 122 Filtro ideal: caracteristicas de magnitud de un, 92 respuesta al impulso unitario de un, 93-94 Filtro no recursivo, 136-138 Filtro paso bajas ideal, 92-93 Filtro recursivo, 135, 137
Forma bilineal: compleja, 660 real, 660 Forma canonica controlable, 297-298, 300, 396,398,489 Forma canonica de Jordan, 300, 302, 382, 390, 399-400,651-652,657,659,674 Forma canonica diagonal, 299-300, 399, 489 Forma can6nica observable, 298-300, 398-399,489 Forma cuadratica, 659-660 compleja, 660 rea1,659 Forma hermitiana, 660 Formas canonicas: controlable, 297-298, 300, 396, 398, 489 de Jordan, 300, 302, 382, 390, 399-400, 651-652,657,659,674 diagonal, 299-300, 399, 489 observable, 298-300, 398-399, 489 Format: corto, 318 extendido, 318 Formula de Ackermann: para el disefio de observadores de orden minimo, 450, 454 para el disefio de observadores, 435-438, 440,445,496 para la ubicacion de polos, 408-412, 466, 493 Franja primaria, 175 Franjas complementarias, 175 Frecuencia de cruce de ganancia, 274 Frecuencia de Nyquist, 96 Funcion de transferencia de fase no minima, 233 Funci6n de transferencia pulso senoida1, 227-228 Funcion de transferencia pulso, 98, 102, 104-118 de controladores digitales, 111-118 de elementos en cascada, 108-110
Indice
739
de un sistema en lazo cerrado, 110-111 matriz de, 3 10-312 Funci6n delta de Kronecker, 42, 62 Funci6n escalar: definici6n negativa de una, 322 definici6n positiva de una, 322 indefinici6n de una, 322 semidefinici6n negativa de una, 322 semidefinici6n positiva de una, 322 Funci6n rampa unitaria, 26
Integral de inversi6n: para la transformada Z, 689 Invariancia: de la ecuaci6n caracteristica, 312 propiedad de, 40 I Invariante de Kronecker, 708 Inversa de zI-G: calculo de la, 304-309 Inversa minima por la derecha, 665 Inversa minima por la izquierda, 666
G
Ganancia derivativa, 116 Ganancia integral, 116 Ganancia proporcional, 116 Generador de la funci6n escalera, 78
J
Jacobiano, 641
K
Kalman, R. E., 377
I
Impulsos unitarios: tren de, 75 Indefin idad: de una funci6n escalar, 661 Independencia lineal de vectores, 643 indice de desempefio cuadratico, 568 con terrninos cruzados, 582 indice de desempefio, 566 incluyendo terrninos cruzados, 582 valor minirno del, 575 Inestabilidad escondida, 334 Inestabilidad, 325, 327-328 Integraci6n compleja, 682-683 Integrador digital: bilineal, 172 con retardo, 171-172 sin retardo, 171 Integral de convoluci6n, 84-85 evaluaci6n en el semiplano derecho de la, 86-88 evaluaci6n en el semiplano Izquierdo de la, 84-86
L
Ley asociativa, 638 Ley de control cuadratico en estado estacionario: enfoque de Liapunov a la, 591-594 Ley de control 6ptimo: cuadratico, 568-596 de energia minima, 622-625 Liapunov: funci6n de, 322-323, 334, 591 metodo directo de, 322 primer rnetodo de, 321 segundo rnetodo de, 321-322 Lugar geometrico de las rakes, 206 Lugares geometricos de atenuaci6n con stante, 176-177 Lugares geometricos de frecuencia constante, 176-178 Lugares geornetricos de las rakes: asintotas del, 207-208 reglas generales para la construcci6n del, 207-210
740
fndice
M
Mapeo conforme, 180 Mapeo: del plano s al plano z, 299 del plano z al plano w, 299 entre el plano s y el plano z, 174-182 Matrices pseudoinversas por la izquierda, 665-666 Matrices simi lares, 651 Matriz antisirnetrica, 633 real,679 Matriz cuadrada: valores caracterfsticos de una, 649-650 Matriz de transferencia: pulso, 310-312 Matriz pseudoinversa: por la derecha, 664-665 por la izquierda, 665-666 Matriz simetrica, 633 real, 679 Matriz: antiHermitiana, 633 antisimetrica, 633 cancelaci6n de una, 639 de ganancia de retroalimentaci6n del estado, 402-403,410-414,427,492,494 de ganancia de retroalimentaci6n del observador, 427, 434, 438, 442, 449-450, 496, 499 de Sylvester, 518-520, 524, 535, 540-541, 548,551,559 de transici6n de estados, 303, 305, 309-310 definida negativa, 661 definida positiva, 661 derivada de una, 640 diagonalizaci6n de una, 651,653 diferenciaci6n de una, 640 estable, 365
exponencial, 3 13 fundamental, 303, 309 hermitiana, 633 indefinida, 661 integral de una, 640 inversa, 635-637 lema de inversi6n, 573, 636, 668 multiplicaci6n por un escalar, 637 multiplicaci6n por una matriz, 637 nilpotente, 414-416 no singular, 635 norma de una, 647 normal,633 ortogonal,633 rango de una, 649 reglas de operaciones con, 637-643 semidefinida negativa, 661 semidefinida positiva, 661 sirnetrica, 633 similar, 651 singular, 635 traza de una, 658 unitaria, 633-648 valores caracterfsticos de una, 649-650 vectores caracteristicos de una, 650 Metodo de disefio analftico, 242-257 Metodo de expansi6n en fracciones parciales, 46-50 Metodo de la integral de inversi6n, 50-52, 60-64, 64-66 Metodo de programaci6n anidada, 338, 343 Metodo de programaci6n mediante expansi6n en fracciones parciales, 339-341,345 Metodo de respuesta en frecuencia, 225-242 Metodo dellugar geometrico de las rakes, 205 condici6n de angulo en el, 206 condici6n de magnitud en el, 206 Metodo directo de la divisi6n, 40-42 Metodo directo de Liapunov, 322 Modo de retenci6n, 13 caida del, 14 Modo de seguimiento, 13
lndice
741
Muestreador can impulsos, 75-77, 83 Muestreador real, 78 Muestreador y retenedor, 6 Muestreo aleatorio, 8 Muestreo can impulsos, 75, 77 Muestreo de orden multiple, 8 Muestreo de raz6n multiple, 8 Muestreo periodico, 8 Muestreo,6 frecuencia de, 90 proceso de, 4 teorema de, 90-92 Multiplexor analogico, 12 Multiplexor, 12 Multiplicador de Lagrange, 570-572
Observador predictor, 428 de orden completo, 438 disefio de, 430-444 Operador retardo unitario, 40 Oscilaci6n escondida, 98, 361
p
Plano w: procedimiento de disefio en el, 228-242 Planta,7 Polinomio caracteristico, 649 Polinomio minima, 350-354 Polinomio monico, 5 I8 Polinomios coprirnos, 518, 541 Polo, 39-40 Palos del observador, 428 Po~y, 499 Polyvalm, 500 Principio de dualidad, 392-394 Principia de superposicion, 3 Problema can valores en frontera de dos puntas, 572 Problema de control 6ptimo cuadratico: discretizado,580-582 en estado estacionario, 592-594 enfoque de Liapunov a la soluci6n de, 592-596 Problema de cuantificaci6n de los coeficientes. 234 Problema de optimizaci6n parametrica, 59 I Problema del regulador 6ptimo cuadratico: en estado estacionario, 591-592 enfoque de Liapunov a la soluci6n de, 59 I-592 Proceso de adquisici6n de datos, 12 Proceso de distribuci6n de datos, 12 Proceso,7 Producto escalar, 643 Producto interno, 643-645, 647 Programaci6n directa, 123 metoda de, 336
N
N ivel de cuantificacion, 8 Norma Euclidiana, 324 Norma, 645-647 euclidiana, 324
o
Observabilidad, 377, 388 completa,389-390 en el plano z, 391-394 matriz de, 389, 394, 401 Observaci6n del estado: condici6n necesaria y suficiente para la, 422-425 de orden minima, 422 de orden reducido, 422 Observacion, 422 Observador corriente, 444 Observador de estados, 422 de orden completo, 422, 426-444 de orden minima, 446-456 Observador de orden minino, 446-450, 452-454,469-470,502-504 Observador de orden reducido, 446
742
fndice
Programaci6n en escalera, 128-135 Programaci6n en paralelo, 127-128 Programaci6n en serie, 126-127 Programaci6n estandar, 124-126 Programas en MATLAB: para control 6ptimo cuadratico, 579, 590-591, 600-603, 615 para encontrar la respuesta a un escal6n unitario, 119, 196, 240, 268, 421,458, 530, 605-606 para encontrar la respuesta a una entrada delta de Kronecker, 45 para encontrar la respuesta a una rampa unitaria, 120,260,459,531 para encontrar la transformada z inversa, 44,63 para encontrar las series de Fibonacci, 68 para la ubicaci6n de polos en el plano z, 500-501 Prueba de estabilidad de Jury, 185-190 Prueba de estabilidad de Schur-Cohn, 185 Pseudoinversa por la derecha, 623-624, 664-665 Punto de desprendimiento, 208-209 Punto de ruptura de entrada, 208-209
R
Respuesta en estado estacionario, 193 Respuesta transitoria, 193 especificaciones de la, 193-195 Respuesta: a perturbaciones, 202 entre dos instantes de muestreo consecutivos, 320-321 Retenci6n de datos, 6, 77 Retenedor de -esimo orden, 77 Retenedor de orden cero, 18-19, 78, 166 caracterfsticas de magnitud y fase de un, 151-153 caracterfsticas de respuesta en frecuencia de un, 94-96 diagrama de Bode de un, 95 funci6n de transferencia de un, 139 Retenedor de primer orden, 19, 80-82, 139140 caracterfsticas de magnitud y fase del, 151153 con interpolaci6n, 19-20 funci6n de transferencia del, 80-82 Retenedor de primer orden con interpolaci6n, 19-20 Retenedor de segundo orden, 19 Retenedor poligonal, 19-20 Retraso de transporte, 280
Radio de convergencia absoluta, 25 Rakes caracterfsticas, 650 Rango,649 Realizabilidad fisica: condici6n para la, 244-245 Regulador con observador, 502, 505, 543 Representaci6n en el espacio de estados: no unicidad de la, 301 Residuo, 50, 84-85, 145,399,688,690-691 teorema del, 689 Respuesta de oscilaciones muertas (deadbeat), 242,248,411,414-418,435,439-442, 444,453-454,470-471,490,494,498, 502-505,508,550,712-713,715, 717-718,723,728-729
s
Secuencia de ponderaci6n, 100 Secuencia escal6n unitario, 26 Segundo metodo de Liapunov, 322 Semidefinici6n negativa: de una funci6n escalar, 661 Semidefinici6n positiva: de una funci6n escalar, 662-663 prueba de, 680 Serial anal6gica en tiempo continuo, 1-2 Serial anal6gica, 1-2 Serial cuantificada en tiempo continuo, 1-2 Sefial de datos muestreados, 2
lndice
743
Sefial digital, 2-3 Senal en tiempo discreto, 2-3, 23 Series de Fibonacci, 67-69 Sistema de adquisicion de datos, 11-12 Sistema de control can retroalimentacion del estado observado, 428, 434 can un observador de orden minima, 447, 451-452 Sistema de control de datos muestreados, 3 Sistema de control del pendulo invert ida, 596 Sistema de control digital, 3, 5 Sistema de control en tiempo discreto, 3 Sistema de control optima, 566, 568 Sistema de distribucion de datos, 11 Sistema de regulacion optima, 566 Sistema de seguimiento tipo 1, 597 Sistema de seguirniento, 460 can retroalimentacion del estado observado, 645 can retroalirnentacion del estado y control integral, 460-461 can retroalimentacion del estado, 464 control optima cuadratico de un, 596-609 Sistema del dab Ie integrador, 361-362, 439, 490,513 Sistema del pendulo invertido, 597, 625-628 Sistema lineal e invariante en el tiempo, 3 Sistema lineal en tiempo discreto variante en el tiempo, 309-310 Sistema lineal, 3 Sistema tipo 0, 197-198 Sistema tipo I, 197-198 Sistema tipo 2,197-198 Sistema, 324 Sistemas de control mediante el acoplamiento a un rnodelo, 532-534, 536-537, 561 Sobrepaso maximo, 195 Solucion de norma minima, 624 que minimiza IIAx - b], 665 que minimiza Ilxll, 663-665 ss2tf, 603-604 Sujetador, 78
T
Tabla de estabilidad de Jury, 185, 187-188 Tecnica de asignacion de palos, 402 Teorema de Cauchy-Goursat, 688-689 Teorema de Cayley-Hamilton, 350, 380, 404, 408,481,485,492 Teorema de convolucion compleja, 684 Teorema de convolucion real, 684 Teorema de convolucion: compleja, 684 real,684 Teorema de corrirniento, 31 Teorema de diferenciacion parcial, 683 Teorema de muestreo de Shannon, 150-151 Teorema de Parseval, 686 Teorema de traslacion cornpleja, 34 Teorema de traslacion real, 3 I Teorema del valor final, 36 Teorema del valor inicial, 35 Teorema principal de estabilidad de Liapunov, 326, 363-365 Teoremas de Liapunov: sabre estabilidad asintotica, 326-327 sabre estabilidad, 327 sabre inestabilidad, 327-328 Tiempo de apertura, 14 Tiempo de establecimiento, 195 Tiempo de levantamiento, 195 Tiempo de retardo, 194-195 Tiempo derivativo, 115 Tiempo integral, 115 Tiempo pica, 195 Transductor analogico, 7 Transductor de datos rnuestreados, 7 Transductor digital, 7 Transductor, 7 Transforrnacion bilineal, 191,228,231 Transforrnacion de Riccati, 572-573
744
fndice
Transforrnacion de similitud, 30 1,311-312, 651-653, 657 bajo propiedades invariantes, 659 Transforrnacion ortogonal, 645 Transforrnacion unitaria, 645 Transformacion w, 228-229, 231 Transformacion z inversa, 37 Transformada de Laplace de una funcion asterisco, 103-104 Transformada z inversa, 37, 687 enfoque mediante ecuaciones en diferencias para la obtencion de la, 46 enfoque mediante MATLAB para la obtencion de la, 42-45 metodo de calculo para la obtencion de la, 42-46 metodo de division directa para la obtencion de la, 40-42, 62 metodo de expansion en fracciones parciales para la obtencion de la, 46-50, 64 metodo de la integral de inversion para la obtencion de la, 50-52, 60-62, 64-66 Transformada z modificada, 691-696 Transformada z, 24 bilateral,25 de la primera diferencia hacia adelante, 698-699 de la primera diferencia hacia atras, 697-698 de la segunda diferencia hacia adelante, 698-699 de la segunda diferencia hacia atras, 698 de una funcion coseno, 28 de una funcion escalon unitario, 25, 33 de una funcion exponencial, 27 de una funcion polinomial, 27 de una funcion que involucra el terrnino (I ~ e-TS)/s, 88-90 de una funcion rampa unitaria, 26 de una funcion senoidal, 27
definicion de la, 24 integral de inversion para la, 689 inversa,37 linealidad de la, 31 metodo de la integral de convoluci6n para la obtencion de la, 83 propiedades de la, 38 propiedades importantes de la, 3 I tabla de, 29-30 teorema de corrimiento para la, 31 teorema de traslaci6n compleja de la, 34 teorema de traslacion real para la, 31 teorema del valor final de la, 36 teorema del valor inicial de la, 35 unilateral, 24-25 Traslape,98 Traza, 307, 658
u
Ubicacion de pol os, 408 condiciones necesarias y suficientes para la, 402-408 diseiio cuando la sefial de control es un vector, 704-718 disefio por, 402-421, 707, 718
v
Valor caracteristico, 649-650, 678 Variables de estado, 294 Vector adjunto, 572 Vector caracteristico generalizado, 494, 496, 498,654,656,674 Vector caracteristico, 650, 674 generalizado, 654, 656 normalizado, 650 Vector de control optirno, 567 forma en lazo cerrado del, 574 forma realimentada del, 574 Vector de estados, 294
lndice
745
Vectores: dependencia lineal de, 643 independencia lineal de, 643 ortonorrnales. 648