Sunteți pe pagina 1din 32

INSTITUTO POLITÉCNICO NACIONAL

ESCUELA SUPERIOR DE ECONOMÍA

ALUMNO: VALDIVIEZO ROMERO JOSÉ EDGAR

GRUPO: 2EM14

PROFESOR: CARLOS ALBERTO YÁÑEZ JIMÉNEZ

MATERIA: OPTIMIZACIÓN DINAMICA

TRABAJO: UNIDAD III (TEORIA DEL CONTROL OPTIMO)


ANTECEDENTES

CONTROL OPTIMO:
El control óptimo es una técnica matemática usada para resolver problemas de
optimización en sistemas que evolucionan en el tiempo y que son susceptibles de
ser influenciados por fuerzas externas. Pueden ser sistemas que evolucionan en el
tiempo el cuerpo humano y el sistema económico. Una vez que el problema ha sido
resuelto el control óptimo nos da una senda de comportamiento para las variables
de control, es decir, nos indica qué acciones se deben seguir para poder llevar a la
totalidad del sistema de un estado inicial a uno final de forma óptima.
El desarrollo de la teoría del control óptimo se inició en la década de los cincuenta
gracias al esfuerzo de los científicos rusos y norteamericanos por explorar el
sistema solar. El problema que resolver era el de llevar un vehículo espacial de
algún punto en la tierra a algún otro en el espacio en tiempo mínimo y consumiendo
la menor cantidad de combustible posible. Es decir, de lo que se trataba era de
encontrar trayectorias óptimas en espacios tridimensionales. Como se puede ver, la
solución de dicho problema no podía encontrarse aplicando las técnicas de
optimización tradicionales que sólo nos dan valores de la variable independiente
para los que una función dada alcanza un punto máximo o mínimo, ya sea local o
global.
El cálculo de variaciones es el nombre dado a la optimización de integrales y tiene
su origen en el problema isoperimétrico o de la braquistocrona.
HORIZONTE INFINITO

En Economía es frecuente tratar con modelos de horizonte infinito. Un consumidor planea


maximizar su utilidad descontada, tiene un punto inicial pero nunca un punto final, en su toma de
decisión considera vivir infinitos periodos. Del mismo modo, un gobierno se imagino entero y
planea sus políticas fiscales en un horizonte infinito. En este sentido, los agentes buscan resolver
el siguiente funcional:

J ( x )=∫ f ( t , x , x ' ) ⅆt
0

S. a.
x(0) = x0
El teorema del máximo exige el acotamiento de las trayectorias admisibles, de otra forma no
queda garantizado la existencia de un extremo. Si f (t, x, x’) es creciente, entonces conforme t → ∞
el funcional no tiene un máximo, siempre existirá un valor cada vez mayor sin importar cuán
grande es t.
Encontrar una posible solución al funcional requiere estudiar las integrales impropias.
En este caso las integrales impropias de tipo 1 y se dice que la integral existe si es posible obtener
el límite.
(Definición 2.3) INTEGRAL IMPROPIA.
Sea f una función continua en el intervalo t € (a, ∞), se define la integral impropia.
∞ b

∫ f = b→
lim ∫ f

0 a

Si existe el limite entonces se dice que la integral converge. En caso contrario se dice que la
integral diverge.
Desde luego, solo interesan las integrales que convergen, ya que son integrables. Al respecto,
existen diversos criterios de convergencia que se presentan en libros de cálculo, aquí se utiliza el
siguiente:
(Teorema 2.7) Criterio de Comparación.
Sea f ≥ 0 para toda t ≥ a, y sea g una función definida para t ≥ a, continua en todo intervalo finito.
∞ ∞

Si g ≤ f para todo t ≥ a y si ∫ f converge, entonces ∫ g converge y


a a

∞ b

∫ g ≤∫ f
0 a

2
−t
Ejemplo 2.12 Comprobar si ∫ e dt converge
0

-Encontrar la integral de
b
2

lim ∫ e−t dt
b→∞ a

Es una tarea complicada. Sin embargo, la integral de


b b
1
b→∞ a
−t
lim ∫ e dt=lim ¿− t =1¿
b→∞ ⅇ 0 |
2
Existe, dado que ⅇ−t < ⅇ−t, entonces
b b
2

lim ∫ e−t dt ≤ lim ∫ e−t dt=1


b→∞ a b→∞ a

De esta manera, concluir que


b
2

lim ∫ e−t dt
b→∞ a

Existe o converge.
(Teorema 2.8) Sean f y g continuas para t ≥ a. Suponer que f decrece de manera monótona a 0
b ∞

conforme t → ∞ y que ∫ g esta acotada por todo b ≥ a, Entonces la integral ∫ fg converge.


a 0

Demostración (Lang, 1990)


El teorema es de suma utilidad en economía, la aplicación más recurrente es el estudio de un
problema de optimización de un agente económico que descuenta el flujo de pagos o de utilidad
de su consumo.
(Ejemplo 2.13) La utilidad del consumidor.
Un consumidor desea maximizar la utilidad descontada de su consumo.

max=∫ ⅇ−φ u ( ct ) ⅆt
0

Donde 0 < φ < 1 es el factor descuento, u ( c t ) es la función de utilidad que depende del único bien
en la economía.
La integral converge si satisface los requerimientos del teorema previo. Primero, la función f =ⅇ−φt
−φt
es continua y decrece en forma monótona lim ⁡ⅇ =0. . Segundo, la función g=u ( c t ) está acotada,
t→∞
b

es decir, ∫ g para todo b ≥ 0. Por ejemplo, si la función de utilidad es neoclásica: u’ > 0 y u’’ < 0 con
0
b

una cuota igual a M =∫ u ( c t ) ≤ M ,entonces el problema del consumidor tiene solución debido a la
0
convergencia de la integral.
De manera adicional, la regla de derivación bajo el signo de la integral (Regla de Leibnitz) se
preserva si la integral es convergente. Esto es, si f es una función real con dos variables (b, x)
definida para t ≥a y x en algún intervalo entonces,

g ( x )=∫ f ( t , x ) ⅆt
a

Es diferenciable y

gx ( x )=∫ fx ( t , x ) ⅆt
a

Entonces el problema,

∫ f ( t , x , x ' ) ⅆt
t0

x (t0) = x0
x (t1) = x1, t1 y x1 son libres
Equivale a

lim ∫ f ( t , x , x' ) ⅆt
b→∞ t0

x (t0) = x0
x (t1) = x1, t1 y x1 son libres
Si la integral converge, entonces proceder hasta deducir la ecuación de Euler junto con la
condición,
δt
( f −x' f x )|❑δtt → ∞+ ( f x ' )|t → ∞=0
'
Si T es libre y no finito, la condición de transversalidad es:

lim ⁡ ( f −x' f x )=0


'

t→∞

También es posible deducir la siguiente condición de transversalidad a partir de,


lim ⁡ x ( t )=constante
t→∞

Entonces,

lim ⁡ f x ' =0
t→∞

EJERCICIO.
Una mina contiene un monto B de recurso natural que el poseedor puede extraer sin costo alguno.
No obstante, sólo podrá extraerse recurso hasta el momento T, después el recurso no se utiliza o
la mina se cierra.
Sea x(t) la trayectoria de la venta acumulada, entonces x’(t) es la tasa de venta en el mismo
periodo y constituye el beneficio del poseedor de la mina.
Desde luego, los beneficios son descontados por el factor r, que es fijo.
El problema a resolver es:
T
max=∫ ⅇ−rt ln x ' ⅆt
0

s. a.
x (0) = 0
x (t) = B

f (t, x, x’) = e-rt ln x’


I. fx (t, x, x') = 0
II. fx (t, x, x') = e-rt (1 / x’) = e-rt / x’
d x' (−r ⅇ−rt ) ( x ' ) −ⅇ−rt x' ' ⅆU ⋅ v−U ⋅ⅆv
III. (t, x, x') = 2
→ 2
dt ( x' ) v

-Aplicar Ecuación de Euler


( −r ⅇ−rt )( x' ) −ⅇ−rt x ' '
0= 2
( x')
-Factorizar
e-rt (-rx’ – x’’) = 0 → -rx – x’’ = 0
x2+ rx = 0 → x (x + r) = 0 { x1 = 0, x2 = -r
x (t) = k1 e0 t + k2 e-rt
x (t) = k1 t + k2 e-rt → SOLUCIÓN GENERAL
-Sujeto a:
x (0) = 0 → k1 + k2 e0 = 0 → k1 + k2 = 0 → k1 = - k2 → Ec. 1
-Sujeto a:
x (t) = B *B = Gastos Operativos
x (t) = k1 + k2 e-rt = B → Ec. 2
-Sustituir Ec. 1 en Ec. 2
x (t) = -k2 + k2 e-rt = B
B −B
k2 (e-rt -1) = B → k 2= y
−rt
k 1= −rt
ⅇ −1 ⅇ −1
−B B
x* = −rt
+ −rt
ⅇ −1 ⅇ −1
B
x* = −rt
( ⅇ−rt−1 )
ⅇ −1

¥=H= (00 −ⅇ−rt


0
/x ' 2 )
H1 = {0 ,−ⅇ−rt / x ' 2 }
H2 = {⎸ 0 ⎹ }
-Es un Máximo Relativo
PROBLEMA ISOPERIMETRICO

Un problema isoperimétrico consiste en resolver un funcional con una restricción que contiene una
integral.
t1
max=∫ f ( t , x , x' ) ⅆt
t0

t1
'
s. a. ∫ g ( t , x , x ) ⅆt
t0

x (t0) = x0
x (t1) = x1
Donde f y g son funciones de clase c2 y ꭤ € R.
Si las restricciones se satisfacen, entonces la función Lagrangiana asociada al problema es:
t1 t1

∫ f ( t , x , x )=∫ [ f ( t , x , x ' ) −λg ( t , x , x ' ) ] dt+ λa


'

t0 t0

El problema consiste en elegir una función admisible x*(t) que sea la solución. Para ello z (t, x, x’,
λ) de forma:
t1

∫ z ( t , x , x ' , λ ) ⅆt + λa
t0

En esencia el problema es idéntico al estudiado, por lo tanto la Ecuación de Euler es:

d x'
zx (t, x, x’) = z’ (t, x, x’)
dt

d x'
(fx – λgx) = (fx’ – λgx’)
dt
Si x*(t) es el extremo que satisface la Ecuación de Euler y además no es un extremo de la
restricción que contiene la integral, entonces λ es el multiplicador indeterminado que satisface el
problema.
Ejercicio.
Resolver el siguiente problema isoperimétrico:
1
J ( x )=∫ ( x ' )2 ⅆt
0

s. a. ∫ x ⅆt =2
0

x (0) = 0
x (1) = 1
1

∫ (x ¿¿' ¿¿ 2−λx )dt +2 λ ¿ ¿


0

-Determina las condiciones


zx = -λ
zx’ = 2x’

dz x '
= 2x’’
dt
-Aplico Ecuación de Euler
-λ = 2x’’
−λ
x’’ =
2
−λ
x’ = t +k 1
2

−λ t 2
x (t) = +k 1 t+ k 2 → Ec. 1
4
-Sujeto a:
−λ(0)2
x (0) = 0 → + k 1 ( 0 ) +k 2 =0 → k2 = 0
4
−λ λ
x (1) = 1 → +k 1=1 → k1 = 1+
4 4
-Sustituye k1 y k2 en Ec. 1

−λ t 2 λ
x∗( t )=
4 ( )
+ 1+ t
4

-Sustituye x*(t) en g (t, x, x’)


1
−λ t 2 λ

0
[ 4 ( )]
+ 1+ t dt=2
4
1 1
λ
−λ
4 0
∫ [ ( )]∫
t 2 dt+ 1+
4 0
t dt=2

−λ t 3 λ 1
12
+ 1+ ( )
4 2
=2

−λ λ 1
[ ( )]
12
+ 1+
4 2
−[ 0]=2

−λ 1 λ
+ + =2
12 2 8
2 λ +3 λ 1
=2−
24 2
λ 3
= → λ=36
24 2
−36 2 36
x*(t) =
4 (
t + 1+
4
t )
x*(t) = -9t2 + 10t
CONTROL OPTIMO

3.1 Teoría del Control Optimo


El problema básico de control optimo es,
t1
max J [ x ,u]=∫ f ( t , x , u ) ⅆt
t0

s. a. x’(t) = g (t, x, u)
x (t0) = x0
x (t1) = x1
Las funciones f y son continuas en el intervalo [t 0, t1] y tienen derivadas parciales en sus
argumentos x y u. La variable u se denomina variable de control, es una función de clase C*[t 0, t1]
y determina la evolución de la variable de estado x, cuyo movimiento está gobernado por una
ecuación diferencial de primer orden.
Esta última, mapea R x R → R. De forma, para cada u € U la restricción es una ecuación
diferencial, que, bajo la condición inicial y terminal, genera una solución única y continua.
Por ejemplo, el cálculo de variaciones es un caso especial del problema de control.
Sea,
t1
max J [ x ,u]=∫ f ( t , x , u ) ⅆt
t0
s. a. x’ = u
x (t0) = x0
x (t1) = x1
Sustituir la restricción en el funcional objetivo y se obtiene el
problema de cálculo de variaciones.
t1
max J [ x ]=∫ f ( t , x , x ' ) ⅆt
t0

x (t0) = x0
x (t1) = x1
En analogía a los problemas de optimización estática, el problema de cálculo de variaciones
corresponde a un problema de optimización libre, y el problema control óptimo a uno de
optimización

restringida. Lo que permite utilizar el método de Lagrange, solo que debe ser extendido el caso de
funcionales.
(Teorema 3.1) Teorema del multiplicador de Lagrange
Sea F un funcional continuamente diferenciable de Fréchet que tiene un extremo local x* bajo la
restricción G (x*) = 0 y satisface ▼G (x*) ≠ 0. Entonces existe un elemento λ tal que el
lagrangeano del funcional asociado
L ( x ) =F ( x )+ λ G ( x )
es estacionario en x*, y satisface
▼f ¿
Para utilizar el teorema de Lagrange en el problema de control, asumir que tanto el funcional
objetivo y la restricción son diferenciales de Fréchet. La restricción consiste de todas las funciones
admisibles que satisfacen

G ( x , u )=g ( t , x ,u )−x ' =0


lo cual es equivalente a
t1

∫¿¿
t0

en el sentido que no afecta la solución. El lagrangeano asociado el problema es:


t1
L=∫ [ f ( t , x , u ) + λ ( g ( t , x , u )−x ' ) ] dt
t0

t1
L=∫ [ f ( t , x , u ) + λ ( g ( t , x , u )−λx ' ) ] dt
t0

El tercer término es integrable utilizando la técnica de integración por partes,


t1
t1
∫ λ x ' =λ x|t −∫ λ' x dt
0
t0

sustituir en la ecuación previa,


t1
L=∫ [ f ( t , x , u ) + λg ( t , x ,u )+ λ' x ] dt−λ ( t 1 ) x ( t 1 )+ λ ( t 0 ) x ( t 0 )
t0

entonces para el par de funciones (h, v) €X* U y la perturbación Ԑ,


x* = x + Ԑh

u* = u + Ԑv
la condición de primer orden se obtiene de calcular L’ (0) = 0,
t1
'
∫ [ f x h+ λ g x h+ λ h+ f u v+ λ g u v ] dt=0 ¿
t0 ¿
t1 t1
'
∫ ( fx+ λgx + λ ) h dt +∫ ( fu+ λgu ) v dt =0
t0 t0

(Teorema 3.2) Condición necesaria


Sean f y g funciones continuas en el intervalo t 0 ≤ t ≤ t1 con derivadas parciales en sus argumentos,
diferenciables en el sentido de Fréchet. Entonces la solución al problema
t1
max J =∫ f ( t , x ,u ) ⅆt
t0

s. a. x’(t) = g(t, x, u)
x (t0) = x0
x (t1) = x1

satisface las condiciones de primer orden


fx + λgx = -λ’
fu + λgu = 0
x’ = g(t, x, u)
Las condiciones de primer orden de control óptimo generan un
sistema de ecuaciones diferenciales, mientras que la Ecuación de Euler una ecuación diferencial
de segundo orden.

Ejercicio.
Resolver el siguiente problema de control óptimo:
1
max=∫ ( ux−u2 −x2 ) ⅆt
0

s. a. x’ = x + u
x (0) = 0
x (1) = 1
f (t, x, u) = ux – u2 – x2
g (t, x, u) = x + u
-Determinar la condición de primer orden.
fx + λgu = -λ’ → (u – 2x) + λ (1) = - λ’ → Ec. 1
fu + λgu = 0 → (x – 2u) + λ (1) = 0’ → Ec. 2
x’ = x + u → Ec. 3
-Despejar la Ec. 2
x λ
u= + → Ec. 4
2 2
-Sustituye Ec. 4 en Ec.1

( 2x + 2λ )−2 x + λ=−λ →− 32 x + 32 λ=−λ → λ = 32 x− 32 λ


' ' '

-Sustituye Ec. 4 en Ec. 3


x λ 3 λ
x ' =λ+ + → x ' = x+
2 2 2 2
-Sustituir la Ec. Diferencial
{λ’ = -½ λ + 3/2 x } = [ λ’ ] = [-3/2 3/2] [ λ ]
{x’ = ½ λ + 3/2 x } = [ x’ ] = [½ 3/2] [ x ]
-Necesito diagonalizar la matriz A
−3/2 3 /2
¥ A= [ 1/2 3 /2 ]
→ [ A−λI ] =0

−3

| 2
−λ

1 /2
3/2
3
2
−λ |=0

-Determinar el polinomio característico

( −32 −λ )( 32 −λ )−( 12 )( 32 )=0 →− 94 + 32 λ− 32 λ+ λ − 34 =0


2

λ 2−3=0→ λ1= √3 , λ 2=−√ 3


0
-Sustituyo λ1 y λ2 en [A – λ I] [V1] = [ ]
0
-Para λ1 = √3

−3 −3 3
( )
[ 2
−√ 3

3 /2
3
2
1 /2
a1
b
−√ 3 1 ]
[ ] = [ 0¿→ 2
0 1
−√ 3 a1+ b1=0

3
2
a +( −√ 3)b 1=0
2 1 2

½ a1 = - (3/2 - √3) b1 = (-3/2 + √3) b1 → a1 = (- 3 + 2√3) b1


a1
=¿ ] → V 1= −3+ 2 √ 3
V 1=
[]
b1 1 [ ]
[ λx]=k V e
1 1
λ1 t
+ k 2 V 2 e λ 2t =k 1 −3+2 √ 3 e √ 3 t +k 2 ¿
[ 1 ]
λ (t) = (-3 + 2 √3) k1 e√3 t – (3 + 2 √3) k2 e-√3 t
x (t) = k1 e√3 t + k2 e-√3 t
-Sujeto a:
x (0) = 0 →k1 + k2 = 0 →k1 = -k2
x (1) = 1 →k1 e√3 t + k2 e-√3 t = 1
- k2 e√3 t + k2 e-√3 t = 1 →k2 ( e-√3 t - e√3 t) = 1 →k2 = 1 / e-√3 t - e√3 t
k2 = -0.1826; k1 = 0. 1826
x* (t) = 0.1826 e√3 t – 0.1826 e-√3 t
λ* (t) = 0.0847 e√3 t + 1.1803 e-√3 t
x λ x+λ
-Ya sea u= + =
2 2 2
u* (t) = 0.1336 e√3 t + 0.4988 e-√3 t

Condición necesaria del Hamiltoniano.


Sean f y g funciones continuas en el intervalo t 0 ≥ t ≥ t1 con derivadas parciales en sus argumentos
diferenciables, en el sentido de Fréchet.
Entonces la solución al problema
t1
max J =∫ f ( t , x ,u )
t0

s. a. x’(t) = g(t, x, u)
x (t0) = x0
x (t1) = x1
-Se obtiene el Hamiltoniano
H (t, x, u, λ) = f (t, x, u) + λg (t, x, u)
Hx = - λ’
Hu = 0
x’ = g (t, x, u)
-DEMOSTRACION
Sustituir el Hamiltoniano en el problema:
1
Max=∫ u 2 dts. a. x’ = x + u
0

x (0) = 0
x (1) = e
-Se obtiene el Hamiltoniano
H (t, x, u, λ) = u2 + λ (x + u)
-Determinar las condiciones de 1er Orden
dH
= - λ’; λ = - λ’ → λ’ = - λ → Ec. 1
dx
dH
= 0; 2u + λ = 0 → u = - λ / 2 → Ec. 2
du

x’ = x + u → Ec. 3
-Sustituye Ec. 2 en Ec. 3
λ
{x’ = x− } = λ’ = - λ
2
−λ
{λ’ = - λ } = x’ = +x
2
-Por lo que el sistema de ecuaciones diferenciales

[ λ ' ] = −1 0 =¿ ]
x' [ ]
−1/2 1

¥ A= −1 0 → [ A−λI ] =0
[
−1/2 1 ]
0 =0
|−1−λ
−1/ 2 1−λ |
(- 1 – λ) (1 – λ) – 0 = 0
1 – λ2 = 0 → λ1 = 1; λ2 = -1
-Determinar el vector propio
Para λ1 = 1
[A – λ I] [V1] = [0]
0 [a ] 0 −2 0 [ a ] 0
[−1−1
−1/2 1−1 b] = [ ¿ →[
0 ]
−1/2 0 b
1

1
=[ ¿
0
1

V =[ 0 ]
1
1

Para λ2 = -1
0 [ a2 ] 0
[−1+1
−1/2 1+1 b2 ] =[ ¿
0

-½ a2 + 2 b2 = 0
-½ a2 = - 2 b2
a2 = 4 b 2
a2 4 b2 4
V 2=
[ ][ ][]
b2
=
b2
=
1

[ λx]=k V e1 1
λ1 t
+ k2 V 2 e
λ 2t

[ λx]=k [01 ] e + k [ 41 ] e
1
t
2
−t
λ (t) = 4 k2 e- t
x (t) = k1 e t + k2 e- t
−λ
¥u= =−2 k 2 e−t
2
-Sujeto a:

x (0) = 0 →k1 + k2 = 0 →k1 = -k2


x (1) = e →k1 e1 + k2 e-1= e →-k2 e1 + k2 / e = e
k2 (1 / e - e ) = e
k2 (1 – e2 / e) = e
k2 = e2 / 1 – e2 ; k1 = -e2 / 1 – e2
λ* (t) = 4 e2-t / 1 - e2
x* (t) = (-e2+t / 1 - e2) / (e2+t / 1 - e2)
u* (t) = -2 e2-t / 1 - e2
3.3 Condiciones de Transversalidad
Una de las ventajas de trabajar con problemas de control optimo con n-variables de estado es que
permiten estudiar diversas condiciones de punto final. Por ejemplo, un primer bloque de variables
de estado contiene valores fijos de punto final, el caso de la sección anterior. Otro bloque de
valores finales es libre y, por último, las restantes tienen como punto final una función terminal. El
problema se plantea como:
t1
max ∫ f ( t , x , u ) dt
t0

s. a. x1’ = g1 (t, x, u)
xn’ = gn (t, x, u)
xi (t0) = xi0 ¥ i € [1, n]
xi (t1) = xi1 i = 1, …, k
xi (t1) = libre i = 1, …, e
xi (t1) = 6 t1 i = e + 1, …, n
Igual que la sección anterior x = (x1, …, xn) y u = (u1, …, um) son
vectores de la variable de estado y control respectivamente. El
funcional objetivo y restricciones son diferenciables de Fréchet en
sus argumentos. Así mismo, las restricciones son regulares, el
teorema de la función inversa aplica y es posible utilizar el método
de los multiplicadores de Lagrange.
Antes de continuar se define

δ x i= x ( ε )| ¥ i ∈n
ⅆⅇ i ε=0

δ u i= u ( ε )| ¥ i ∈m
ⅆⅇ i ε=0

y δ t 1= t ( ε )|
ⅆt 1 ε=0
de forma que,
t 1(Ԑ )

L (Ԑ )= ∫ ¿ ¿
t0

t 1(Ԑ )

L (Ԑ )= ∫ ¿ ¿
t0

−∑ λi ( t 1 ) xi(Ԑ )+ ∑ λi (t 0 ) xi(t 0)
iԐn iԐ n

Sea H =f ( t , x ,u )+ ∑ λi gx ( t , x , u )
iԐn

Entonces,
t 1(Ԑ )

L ( Ԑ ) = ∫ [ H ( t , x ( Ԑ ) ,u ( Ԑ ) ) + ∑ λ' i xi(Ԑ )¿]dt −∑ λi ( t 1) xi ( ε )|t =t 1+ ∑ λi ( t 0 ) xi ( t 0 ) ¿


t0 iԐn iԐ n iԐn

-Obtener la condición de primer orden para un extremo


t1

∫¿¿
t0

O bien,

t1

∫¿¿
t0
En virtud que la integral es un operador lineal,
t1 t1
dH ' dH
∑∫( dxi )
+ λ i dt δxi+∫ dt δui−∑ λiδ xi|t =t 1+ f ( t 1 , x ( t 1 ) , u ( t 1 ) ) δ t 1 =0
iԐn t 0 t 0 dui iԐn

Observar que el primer par de conjuntos ecuaciones corresponden a


las condiciones de primer orden del Hamiltoniano,
dH
xi= =−λ ' i¥ i € n
dxi
dH
ui= =0 ¥ i€ m
dui
El tercer y cuarto conjunto

−∑ λiδ xi|t=t 1 + f ( t 1 , x ( t 1 ) ,u ( t 1 ) ) δ t 1
iԐn

debe igualarse a cero para ser consistente con el resultado, esto genera la condición de
transversalidad.
El primer bloque de condiciones es simple, dado que ᵹxi = ᵹt 1 = 0, entonces se obtiene el
resultado de la sección anterior.
El segundo bloque de condiciones finales permite que sea xi (t 1) sea libre cuando t1 es fijo,
entonces ᵹ xi|t=t 1 ≠ 0. La única manera de garantizar que el tercer conjunto de ecuaciones sea cero
es: λi (t1) = 0 ¥ i = k + 1, …, e.
Deducir las condiciones de transversalidad del tercer bloque de valores finales de las variables de
estado exige por un lado que ᵹxi y ᵹti sean distintas de cero, porque la curva terminal no
necesariamente es constante.
Por otro lado, requiere que el punto terminal sea igual a la función G.
Suponer que G es diferenciable, entonces por la regla de la cadena,
ᵹxi (t1) + x’i (t1) ᵹti = G’(t1) ᵹti
-Sustituir ᵹxi (t1) en la ecuación (¿?),
' t1
f ( t 1 , x ( t 1 ) ,u ( t 1 ) ) δ t 1+ ∑ λi [G ( )−x ' i¿ ( t 1 ) ]δ t 1=0 ¿
iԐn

'
[ f (t , x (t ) ,u (t ))+∑ λi x i ( t )] δ t −¿
1 1 1
iԐ n
1 1

-Utilizar la definición del Hamiltoniano, y se obtiene la condición de transversalidad


¿
-Considerar el caso de una curva final constante, G (t 1) = c, entonces
G’ (t1) = 0 y la condición de transversalidad (¿?) se reduce a

H ( t 1 , x ( t 1 ) ,u ( t 1 ) ) =0

Aunque no se demostrará, existe una condición de transversalidad


útil en problemas económicos: el caso de una línea vertical truncada. Es decir, t 1 es fijo pero xi1
varía libremente para un determinado valor permisible: x i1 ≥ xi1min . La condición de transversalidad
es:
λ(t1) ≥ 0 xi1 ≥ xi1min (xi1 - xi1min) λ1 (t1) = 0
3.4 El Principio del máximo de Pontryagin
Hasta el momento el análisis del control óptimo se ha desarrollado en términos de una solución
dH
interior, =0. La figura (¿?) muestra que el extremo de u se encuentra en la región interior del
du
conjunto de soluciones factibles del problema.
Sin embargo, cuando la variable de control es una pieza continua en el intervalo cerrado [t 0, t1] es
posible encontrar soluciones de esquina, de modo que el criterio de solución anterior, H u = 0 no
aplica. En este caso, es necesario estudiar el comportamiento de la función Hamiltoniana y
establecer que cualquier punto óptimo debe satisfacer H(t, u* i, x, λ) ≥ H(t, u, x, λ).
Por ejemplo, en la figura (¿?) existen 2 trayectorias óptimas de u. La primera corresponde a u* 1 en
virtud que la función Hamiltoniana es creciente en u, alcanzando su máximo valor en H* 1. Por el
contrario, cuando la función Hamiltoniana es decreciente en u entonces el máximo valor que toma
la función es en H2, que corresponde a u*2.
El principio del máximo de Pontryagin es la generalización a problemas de control óptimo sin
importar si existe solución interior. La demostración se omite, pero lector puede consultar (¿?)

Ejercicio.
Encontrar las trayectorias de control, estado y co-estado de:
4
max J [ x ,u]=∫ ( x−u ) dt
0

s. a. x’ = x + u
x (0) = 5
x (4) = libre
u (t) € [0, 2]
-Determinamos el Hamiltoniano asociado:
H (t, x, u, λ) = x – u + λ (x + u)
-Determinar las condiciones de 1er orden
Para Hx : 1 + λ = -λ’
λ’ + λ = -1 → λ (t) = k1 e-t – 1
-Aplico transversalidad
λ (t1) = 0 → λ (4) = 0
λ (4) = k1 e-4 – 1 = 0 → k1 e-4 = 1 → k1 = e4
λ* (t) = e4-t – 1
dH
Para Hu : = -1 + λ
du
dH
> 0 → λ (t) > 1
du
dH
< 0 → λ (t) < 1
du
-Para la 1era FASE λ (t) > 1
e4-t – 1 > 1
e4-t – 1 > 2 → ln e4-t > ln l2l
4- t > ln l2l
-t > ln l2l – 4

t < 4 - ln l2l
t < 3.3068
FASE I u* [0, 3.3068) = 2
FASE II u* (3.3068, 4] = 0
-Para la 2da FASE λ (t) < 1
e4-t – 1 < 1
e4-t – 1 < 2 → ln e4-t < ln l2l
4- t < ln l2l
-t < ln l2l – 4
t > 4 - ln l2l
t > 3.3068
-Aplico la restricción en FASE I ¥ x’ = x + u
x’ – x = u → x’ – x = 2 → xI (t) = k2 et - 2
-Sujeto a:
x (0) = 5 → k2 e0 – 2 = 5 → k2 = 7
x*I (t) = 7 et – 2
-Aplico la restricción en FASE II ¥ x’ = x + u
x’ – x = u → x’ – x = 0 → xII (t) = k3 et
-Dado que
x*I (3.3068) = x*II (3.3068)
7 e3.3068 – 2 = x*II (3.3068)
189.08 = k3 e3.3068
189.08 / e3.3068 = k3 = 6.9267
x*II (t) = 6.9267 et
-Las fases están definidas por:
FASE I.
u*I [0, 3.3068) = 2, x*I = xI [0, 3.3068) = 7 et – 2

FASE II.
u*II (3.3068, 4] = 0, x*II = xII (3.3068, 4] = 6.9267 et
-Graficas.
“Función Hamiltoniana”
H*I Hu > 0
H*II
λ> 1

λ< 1 Hu < 0
0 2 u
“Diagrama de Fases x* y u*”
u(t)
2-

1-
0 3.3068 4 t
u(t)
x(3.3068) X*II (t)
< 189.08
5-
X*I (t)
0 3.3068 4 t

No siempre las variables de control acotada se presentan en forma lineal en el Hamiltoniano; por
ejemplo, el problema de control

t1
max J [ x ,u] ∫ f (t , x , u ) dt
t0

s. a. x’ = g (t, x, u)
x (t0) = x0
a≤u≤b
Donde f (.) y g (.) son no lineales en u (t), complican la solución que
se deriva del principio del máximo. Por ende, es necesario utilizar
método de optimización no lineal: el método de Kuhn – Tucker. El problema a
resolver es:
max H=f ( t , x ,u ) + λg (t , x ,u)
s. a.
a≤u≤b
La función asociada,
L=H −N 1 ( u−b ) −N 2 (a−u)

-Las condiciones de 1er orden son:


x : Hx = -λ’
u : Hu – N1 + N2 = 0
N1 ≥ 0, N1 (u – b) = 0
N2 ≥ 0, N2 (a - u) = 0
De inmediato se deduce que:
a) El caso de la solución de esquina u* = b, entonces la variable de co-estado N 1 ≥ 0.
Suponer que b ≥ a, lo cual que implica que N 2 = 0. De este modo, Hu = N1 ≥ 0.
b) Si la condición de esquina u* = a toma lugar, entonces el caso es análogo al inciso a). La
variable de co-estado N2 ≥ 0 y N1 = 0, por ende Hu = - N2 ≤ 0.
c) Si a ≤ u* ≤ b, entonces N1 = N2 = 0, corresponde a la solución anterior: Hu = 0
El problema a resolver
max H=f ( t , x ,u ) + λg ( t , x , u )
s. a. a ≤ u ≤ b
La función Lagrangiana asociada,
L=H − ϻ1 ( u−b )− ϻ 2 (a−u)

Las condiciones de primer orden son:

X : Hx = -λ’
U : Hu - ϻ1 + ϻ2 = 0
ϻ1 ≥ 0; ϻ2 (u – b) = 0
ϻ2 ≥ 0; ϻ2 (a – u) = 0
Se deduce:
a) El caso de la solución de esquina u* = b, entonces la variable de co-estado ϻ 1 ≥ 0. Suponer
que b ≥ a, lo cual implica que ϻ2 = 0. De este modo, Hu = ϻ1 ≥ 0.
b) Si la condición de esquina u* = a toma lugar, entonces el caso es análogo al inciso a). La
variable de co-estado ϻ2 ≥ 0 y ϻ1 = 0, por ende Hu = - ϻ2 ≤ 0.
c) Si a > u* > b, entonces ϻ1 = ϻ2 = 0, corresponden a la solución interior Hu = 0.
Ejercicio.
Resolver el siguiente funcional, determinando las trayectorias de estado y co-estado.
5
max ∫ (−u 2−x ) dt
0

s. a. x’ = 0
x (0) = 0
x (5) = 4
u (t) ≥ 0 u (t) € [0, ∞)
-Determina el Hamiltoniano

H=−u2−x + λ(u)
-Por lo tanto el Lagrangiano

L=−u 2−x+ λ ( u )− ϻ ( 0−u )

L=−u 2−x+ λ u+ ϻ u

-Determina condiciones de 1er orden


Hx : -1 = -λ’ → λ’ = 1 → Ec. 1
Hu : -2u + λ + ϻ = 0 → u = λ/2 + ϻ/2 → Ec. 2
ϻ≥0 ϻ (0 – u) = 0
- ϻ (u) = 0
ϻu=0
-De la Ec. 1: λ’ = 1 → λ (t) = t + k1 → Ec. 3
-Sustituye λ (t) en Ec. 2

t k1 ϻ
u= + +
2 2 2
¥ϻ-u=0
1er FASE
Si u* (t) = 0 ϻ (t) ≥ 0 0 ≤ t ≤ t*
2da FASE
Si u* (t) ≥ 0 ϻ (t) = 0 t* ≤ t ≤ 5
-Para la 1era FASE
uI = 0 y x’ = u
x (t) = k
-Sujeto a:
x (0) = 0 → k = 0
FASE I: u*I (t) = x*I = 0 0 ≤ t ≤ t*
-Para la 2da FASE
u (t) ≥ 0 y ϻ (t) = 0
-Sustituyo en Ec. 2
λ 0 λ
u= + → u= → Ec. 4
2 2 2
-Sustituir Ec. 3 en Ec. 4

t k1
uII = + y ¥ x’ = u
2 2

t k1
x’ = +
2 2
t2 k 1 t
x (t) = + + k2
4 2
-Sujeto a:
25 5
x (5) = 4 → x (5) = + k + k =4
4 2 1 2
-Recordando que xI (t*) = xII (t*)

t∗¿2 k 1
0= + t∗+ k 2 ¿ → Ec. 5
4 2
Y ¥ uI (t*) = uII (t*)

t∗¿ k 1
0= + ¿
2 2
0 = t* + k1 → k1 = -t* → Ec. 6
-Sustituyo Ec. 6 en Ec. 5

t∗¿2 t∗¿ 2 t∗¿2 t∗¿


0= − +k 2 ¿ ¿ → 0=− + k 2 ¿ → k 2= ¿
4 2 4 4

-Sustituye k1 y k2 en x (t)

t 2 t∗¿ t∗¿2
x (t) = − t+ ¿¿
4 2 4
-Sujeto a:

25 5 ¿ t∗¿2
x (5) = 4 → − t + =4 ¿
4 2 4

t∗¿2 5 ¿ 25
− t + −4=0 ¿
4 2 4

t∗¿2 5 ¿ 9
− t + =0 ¿
4 2 4

t∗¿ 2−10 t ¿ + 9=0 ¿


(t* - 9) (t* - 1) = 0 → t*1 = 9, t*2 = 1 t* = 1
-Implica k1 = -1 y k2 = ¼
-Sustituyo en x (t) y u (t)
-En FASE 2

t2 t 1
x*II (t) = − +
4 2 4
t 1
u*II (t) = − 1≤t≤5
2 2

-Grafica.
“Diagrama de Fases x* y u*”
x(t) X*II (t)

X*I (t)
0 t* 5 t

u*II (t)
u*I (t)
5-
0 t* 5 t

CONCLUSIONES
En un problema de control óptimo el objetivo es encontrar la trayectoria óptima de la variable de
decisión, que maximiza un valor funcional. Este problema es mucho más complejo que encontrar
el máximo de una función mediante el empleo de cálculo estándar. Esto obedece a que la solución
consiste en una función completa –la trayectoria temporal de la
variable de decisión. En problemas matemáticamente complicados,
puede resultar útil iniciar por una aproximación numérica a la
solución. Ciertamente, los matemáticos y economistas suelen
converger en buscar dichas aproximaciones para con ello revisar su
validez. Cuan exitosa será la aproximación propuesta dependerá de igual modo de la intuición,
experiencia y de la suerte. En una solución de control óptimo, claramente, no es realista tratar de
adivinar la forma exacta de la trayectoria temporal de la variable de decisión. Pero, para propósitos
analíticos se puede conjeturar que la trayectoria temporal de la variable de decisión es conocida.
Por ejemplo, en la economía financiera, usualmente se asume que el tomador de decisiones elige
la trayectoria temporal óptima que maximiza el valor presente del flujo de ingreso generado por
algún activo. La función de valor óptimo asume que el tomador de decisiones maximiza el valor de
un activo; sin embargo, otros supuestos de comportamiento pueden ser más realistas. A la luz de
las recientes crisis financieras, el valor de las acciones cayó debido a que los inversionistas
perdieron la confianza de que los mandos gerenciales maximizan el valor de las empresas en
nombre de los accionistas. Esto nos conduce a que diferentes supuestos en el comportamiento de
los tomadores de decisión producirán diferentes valores en los activos.
Una cantidad importante de literatura financiera considera el conflicto de intereses entre mandos
gerenciales y accionistas, el cual afecta de manera importante la gobernanza corporativa y por
ende, el valor de las empresas. La función de valor óptimo muestra la relación entre los niveles de
ahorro y el retorno de sus activos, asumiendo aversión al riesgo y comportamiento óptimo. Al
derivar la función de valor óptimo se genera el valor de una unidad de ahorro y así como su precio
sombra.

BIBLIOGRAFIA
Cerdá, Emilio (2001), Optimización
[ CITATION Cer16 \l 2058 ]
dinámica, Madrid, España, Prentice Hall.

Pecha, A. (2005). Optimización estática y dinámica en economía. Bogotá,


Colombia: Universidad Nacional de Colombia. Facultad de Ciencias.

Chiang, A.C. (1992), Elements of dynamic optimization,


[ CITATION Alp92 \l 2058 ]
Heights, Illinois, Waveland Press.

S-ar putea să vă placă și