Documente Academic
Documente Profesional
Documente Cultură
Universidad de Córdoba
Facultad de Ingenierías
Programa de Ingeniería Industrial
Investigación de Operaciones III
VII Semestre
Montería – Córdoba
2011
PROGRAMACIÓN DINÁMICA PROBABILÍSTICA
Por otro lado, cabe resaltar, qué; cuando el estado en la siguiente etapa está
determinado por completo por el estado y la política de decisión de la etapa actual,
entonces este problema corresponde a programación dinámica determinística
(PDD).
Etapa Etapa
+1
Estado:
Contribución de
Valor: ( , ) ∗( )
PDD (Figura 1)
Etapa Etapa +1
Contribución
de la etapa 1
∗
Probabilidad (1)
Decisión
Estado: 2
( , ) ⋮ ∗
(2)
⋮
S
PDP (Figura 2) ∗
( )
En la Programación dinámica (Sea PDD ó PDP), se utiliza una relación recursiva
que identifica la política óptima para la etapa , dada la política óptima para la
etapa + 1. La forma precisa de la relación recursiva difiere de un problema a otro
de PD (Sea PDD ó PDP), pero se usa una notación general como se resume a
continuación:
: Número de etapas.
: Etiqueta para la etapa actual ( = 1,2, … ).
: Estado actual para la etapa .
: Variable de decisión para la etapa .
∗ : Valor óptimo de (Dado ).
( , ): Contribución a la función objetivo de la etapas , + 1 , … , , si el
sistema se encuentra en el estado en la etapa , la decisión inmediata es y
en adelante se toman decisiones óptimas.
∗ = ( , ∗)
∗( )= á { ( )} ∗( )= í { ( )}
, Ó ,
Hay que tener en cuenta las características básicas que distinguen los problemas
de programación dinámica (Sea PDD ó PDP), las cuales son:
5. Dado el estado actual, una política óptima para las etapas restantes es
independiente de la política adoptada en etapas anteriores. Por lo tanto, la
decisión inmediata óptima depende solo del estado actual y no de cómo se llegó
ahí. Éste es el principio de optimalidad para programación dinámica (Sea PDD ó
PDP).
( , )= [ ∗ ( )]
+
Con:
∗ ( )= í (, )
Ejemplo 1:
Imagine que tiene $ 5.000 para invertir y que tendrá la oportunidad de hacerlo en
cualquiera de dos inversiones (A ó B) al principio de cada uno de los próximos
años. Existe incertidumbre respecto al rendimiento de ambas inversiones. Si se
invierte en A, se puede perder todo el dinero o (con probabilidad más alta) obtener
$ 10.000 (una ganancia de $ 5.000) al final del año. Si se invierte en B, se pueden
obtener los mismos $ 5.000 ó (con probabilidad más baja) $ 10.000 al terminar el
año. Las probabilidades para estos eventos son las siguientes:
Cantidad
Inversión Probabilidad
obtenida ($)
A 0 0.3
10000 0.7
B 5000 0.9
10000 0.1
Se le permite hacer (a lo sumo) una inversión al año y sólo puede invertir $ 5000
cada vez. (Cualquier cantidad de dinero acumulada queda inútil).
=3
∗( ) ∗
0≤ < 5000 0
≥ 5000 + 2000
=2
( , ) ∗( ∗
)
0
0≤ < 5000 − − 0
=1
( , ) ∗( ∗
)
0
5000 8400 9800 8150 9800
Por tanto la política óptima es invertir siempre en A, con una fortuna de espera
después de tres años de $ 9800.
Solución b)
=3
( , ) ∗( ∗
)
0
0≤ < 5000 0 − − 0 0
15000 ≤ 1 1 1 1 0, ó
=2
( , ) ∗( ∗
)
0
0≤ < 5000 0 − − 0 0
10000 ≤ 1 0.73 1 1 0ó
=3
( , ) ∗( ∗
)
0
5000 0.73 0.7 0.757 0.757
Por lo tanto las políticas óptimas son (Con los números en los arcos para
representar el retorno de la inversión).
A
5000
5000 B
10000 0
B
10000 10000
0
O también:
A
5000
5000 B
10000 0óB
B
10000 10000
B
15000 0, A ó B
La programación dinámica (Sea PDD ó PDP) es una técnica muy útil para tomar
una sucesión de decisiones interrelacionadas. Requiere la formulación de una
relación recursiva apropiada para cada problema individual. Sin embargo,
proporciona grandes ahorros computacionales en comparación con la
enumeración exhaustiva para encontrar la mejor combinación de decisiones, en
especial cuando se trata de problemas grandes. Por ejemplo, si un problema tiene
10 etapas con 10 estados y 10 decisiones posibles en cada etapa, la enumeración
exhaustiva tendría que considerar hasta 1010 combinaciones, mientras que la
programación dinámica (Sea PDD ó PDP) necesita hacer cuando mucho 103
cálculos (10 para cada estado en cada etapa).
BIBLIOGRAFÍA