PAPER Progrmamcion Dinamica

1
PROGRAMACION DINAMICA
Henry Vargas Cerda, Silvio Villamarin Alvares,
henry.vargas8@utc.edu.ec, silvio.villamarin1@utc.edu.ec
Universidad Técnica de Cotopaxi

II. DERARROLLO
Resumen: Este trabajo presenta el método de
programación dinámica que es una técnica que puede A. Concepto
resolver varios problemas de optimización. Su Técnica matemática orientada a la solución de
principal contribución es el principio de optimalidad problemas con decisiones secuenciales en etapas
que indica básicamente como se puede resolver un sucesivas donde se debe minimizar el coste total de
problema adecuadamente. dichas decisiones.
Abstract: This work presents the dynamic En cada etapa se valora no sólo el coste actual de tomar
programming method that is a technique that can una decisión sino los costes futuros que se originan a
solve several optimization problems. Its main partir de ella.
contribution is the principle of optimality that Etapas: k
basically indicates how to solve a problem properly. Decisiones en cada etapa:
Palabras claves: Cuantitativa, dinámicas, optimalidad Estados (situaciones en que puede encontrarse el sistema
en cada etapa):
I.INTRODUCCIÓN El número de estados puede ser finito o infinito.
La Programación Dinámica fue desarrollada por Richard Mediante una decisión se va de un estado al
Bellman y G B Dantzing. Sus importantes comienzo de una etapa a otro estado al comienzo de
contribuciones sobre esta técnica cuantitativa de toma de
decisiones se publicaron en 1957 en un libro del primer la siguiente .
autor denominado “Dynamic Programming” (Princeton
University Press. Princeton, New Jersey).
La programación dinámica es una técnica que se puede
aplicar para resolver muchos problemas de optimización.
La mayor parte de las veces, la programación dinámica
En cada etapa se evalúa la decisión óptima para cada uno
obtiene soluciones con un avance en reversa, desde el
final de un problema hacia el principio con lo que un de sus estados . Cada estado guarda toda la
problema grande y engorroso se convierte en una serie información necesaria para tomar las decisiones futuras
de problemas más pequeños y más tratables sin necesidad de conocer cómo se ha alcanzado dicho
Así, la programación dinámica se puede definir como estado. Es un procedimiento recursivo que resuelve de
una técnica matemática útil que resuelve una serie de manera iterativa, incorporando cada vez una etapa,
decisiones secuenciales, cada una de las cuales afecta las partes cada vez mayores del problema original. El
decisiones futuras. La técnica de programación procedimiento puede hacerse hacia delante o hacia atrás.
dinámica, es basada en el principio de optimalidad de
Bellman, ha sido ampliamente utilizada en varios B. Principio de optimalidad de la DP o de Bellman
campos, tales como Teoría de Control, Investigación de Dado un estado, la política óptima para las siguientes
Operaciones, Ciencia de la Computación, Biología, etc. etapas no depende de la política tomada en las etapas
También se ha verificado su amplia aplicación en la anteriores. La decisión de óptima inmediata sólo
Ingeniería, en particular en la Ingeniería Eléctrica, en depende del estado en el que se está, no de cómo se llegó
algunos casos combinados con otras técnicas. hasta él. Toda la información sobre el pasado se resume
Conociendo el concepto de PD se realizará ejemplos en el estado en que se encuentra.
demostrativos para el mejor entendimiento de la Una vez conocida la solución óptima global, cualquier
investigación. solución parcial que involucre sólo una parte de las
etapas es también una solución óptima. Todo
subconjunto de una solución óptima es a su vez una
 solución óptima para un problema parcial.
2
C. Ejemplo: Problema del viajero

Ejemplo
El viajero desea ir de la ciudad A a la J por el camino
más corto.
Buscamos el camino más corto entre Madrid y
Barcelona y averiguamos que la solución óptima del
problema pasa por Zaragoza.
Fig. 2. Problema del viajero
DP hacia atrás (backward DP)

Fig. 1. Principio optimalidad
Empezamos por la etapa k = 4
Tabla1.
Si nos preguntamos por el camino más corto entre
Zaragoza y Barcelona, es obvio que será el mismo que el
utilizado en la solución del problema global (Madrid -
Barcelona). Si existiera un camino más corto entre
Zaragoza y Barcelona (problema parcial), lo habríamos
tomado como parte de la solución del problema global.
Para la etapa k = 3
Relación recursiva (hacia atrás) Tabla 2.
Define la politica òptima en la etapa k conocida la

politica optima en cualquier estado de la etapa
estado actual en la etapa k

Para la etapa k = 2
estado al que se llega en la etapa k+1 dependiente Tabla 3
del estado inicial y de la decision
variable de decision en la etapa k
valor acumulado de la funcion objetivo para el
estado desde la etapa k hasta N.
valor inmediato de tomar la decision desde el
estado Finalmente en la etapa k =1
Tabla 4
Coste acumulado desde una etapa k hasta el final para un
estado = Coste inmediato de dicha etapa
+ Coste acumulado desde una etapa k +1 hasta el
final para un estado
Ruta óptima: A C E H J 4+3+1+3=11

ADEHJ 3+4+1+3=11
ADF I J 3+1+3+4=11
3
El óptimo no coincide con la decisión miope A B F I J permite resolver problemas mediante una secuencia de
2+4+3+4=13 decisiones.
Este programa nos permite encontrar el camino optimo
DP hacia adelante (forward DP) hacia la mejor solución, ya sea que se analice de
principio a fin o viceversa.
Para la etapa k = 2
Tabla 5. Mediante ejemplo se concluyó que existen varias
soluciones óptimas y que la solución más predecible no
es la correcta porque nos es la más óptima.
IV. BIBLIOGRAFIA
[1] GOIC F., MARCEL. PROGRAMACIÓN DINÁMICA. FACULTAD

DE CIENCIAS FÍSICAS Y MATEMÁTICAS-DEPARTAMENTO DE
INGENIERÍA INDUSTRIAL: UNIVERSIDAD DE CHILE.
Para k = 3
Tabla 6. [2] TAHA, H. A. (2004). INVESTIGACIÓN DE OPERACIONES (7
ED.). MÉXICO: PEARSON EDUCATION.
[3] DOMÍNGUEZ, A. (NOVIEMBRE DE 2000).

PROGRAMACIÓN DINÁMICA.
HTTP://WWW.SLIDESHARE.NET/ALEXDFAR/PROGRA
MACIN-DINMICA-5688350.
Para k = 4
Tabla 7.
Finalmente para la etapa k = 5

Tabla 8.
Ruta óptima: J H E C A 3+1+3+4=11

JHEDA 3+1+4+3=11
JIFDA 4+3+1+3=11
III. CONCLUSIONES
Se concluye que la programación dinámica resuelve un

problema por etapas, en donde cada etapa interviene
exactamente una variable de optimización. Además

PAPER Progrmamcion Dinamica

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

PAPER Progrmamcion Dinamica

Încărcat de

Drepturi de autor:

Formate disponibile

1

C. Ejemplo: Problema del viajero

Fig. 2. Problema del viajero

DP hacia atrás (backward DP)

Define la politica òptima en la etapa k conocida la

estado actual en la etapa k

Ruta óptima: A C E H J 4+3+1+3=11

[1] GOIC F., MARCEL. PROGRAMACIÓN DINÁMICA. FACULTAD

[3] DOMÍNGUEZ, A. (NOVIEMBRE DE 2000).

Finalmente para la etapa k = 5

Ruta óptima: J H E C A 3+1+3+4=11

Se concluye que la programación dinámica resuelve un

S-ar putea să vă placă și