Sunteți pe pagina 1din 11

PROGRAMACIÓN DINÁMICA

NATURALEZA RECURSIVA DE LOS CÁLCULOS


DE PROGRAMACIÓN DINÁMICA (PD)
La idea principal de la programación dinámica (PD) es descomponer el problema en subproblemas (más manejables).
Los cálculos se realizan entonces recursivamente donde la solución óptima de un subproblema se utiliza como dato
de entrada al siguiente problema. La solución para todo el problema está disponible cuando se soluciona el último
subproblema. La forma en que se realizan los cálculos recursivos depende de cómo se descomponga el problema
original. En particular, normalmente los subproblemas están vinculados por restricciones comunes. La factibilidad de
estas restricciones comunes se mantiene en todas las iteraciones.
Ejemplo1 (Problema de la Ruta más corta)
Supongamos que deseamos seleccionar la ruta por carretera más corta entre dos ciudades. La red en la siguiente figura
proporciona las posibles rutas entre la ciudad de inicio en el nodo 1 y la ciudad destino en el nodo 7. Las rutas pasan por ciudades
intermedias designadas por los nodos 2 a 6.
Luego, la etapa 2 tiene dos nodos terminales, 5 y 6.
Ejercicio 2 (Problema de la Ruta más corta) Resuelva el problema, suponiendo que se utilizan las siguientes rutas:

Ejercicio 3 (Sistema de caminos y costos del problema de la diligencia.) La atención se centrará en la pregunta:
¿Cuál es la ruta que minimiza el costo total de la póliza?

Ejercicio 4 Para la red de la figura se desear determinar la ruta más corta entre las ciudades 1 y 7. Defina las etapas y los
estados por medio de la recursividad hacia atrás, y luego resuelva el problema.
Ejemplo 5. Distribución de brigadas médicas entre países
Para mejorar la atención médica en 3 países subdesarrollados se dispone de cinco brigadas médicas
que son indivisibles. Con el fin de distribuir a las brigadas entre los países de la mejor forma
posible, se utiliza como indicador de la eficiencia el número de años de vida adicionales por
persona en función del número de brigadas enviadas a cada país, que se encuentra en la tabla
adjunta (cantidades divididas por mil). ¿Cuál es la asignación que maximiza las medidas de
eficiencia?
Formulación

Ejemplo 6
Tres equipos de investigación tratan de resolver un mismo problema de forma independiente. Las
probabilidades de fracasar son 0.4,0.6 y 0.8. En consecuencia, la probabilidad actual de que los tres
equipos fracasen es (0.40)(0.60)(0.80)= 0.192. Se desea minimizar la probabilidad de fracaso y se
dispone de dos científicos más para reforzar los equipos. Para determinar a qué equipo asignarlos
se elabora la tabla siguiente, que da la probabilidad de fracaso de cada equipo cuando es
reforzado con 0,1 y 2 científicos.
Formulación.

Ejemplo 7
TEORÍA DE JUEGOS
La teoría de juegos es una teoría matemática que estudia las características generales de situaciones
competitivas de manera formal y abstracta. Además, otorga una importancia especial a los procesos
de toma de decisiones de los adversarios.

Juegos de dos personas y suma cero. Como su nombre lo indica, en estos juegos participan sólo dos
adversarios o jugadores (que pueden ser ejércitos, equipos, empresas, etc.). Son llamados juegos de suma
cero porque un jugador gana lo que el otro pierde, de manera que la suma de sus ganancias netas es cero.

Un juego de dos personas se caracteriza por


1. Las estrategias del jugador 1.
2. Las estrategias del jugador 2.
3. La matriz de pagos.

Una estrategia es una regla predeterminada que especifica por completo cómo se intenta responder a
cada circunstancia posible en cada etapa del juego.

La matriz de pagos (A veces también llamada matriz de recompensas) es una matriz que resume
la información dada por las funciones de pago en un juego rectangular o en un juego extensivo en
su forma normal.
Ejemplo
Consideremos el juego piedra, papel o tijera, donde el perdedor debe pagar una unidad monetaria
al ganador y en caso de empate no hay pago para ninguno. La siguiente tabla puede considerarse
una matriz de pagos para el juego:

FORMULACIÓN DE LA MATRIZ DE PAGOS DEL PROBLEMA DE CAMPAÑA POLÍTICA


EJEMPLO 1
Estrategia I: Pasar un día en cada ciudad
Estrategia II: Pasar dos días en la ciudad A
Estrategia II: Pasar dos días en la ciudad B
Cantidad neta en unidades de votos ganados por el político I cada
unidad equivale a 1000 votos.
Político II
Estrategias E1 E2 E3
E1 1 2 4
Político I E2 1 0 5
E3 0 1 -1
Determina la estrategia óptima para cada político, por medio de la técnica de estrategia
DOMINADA.
EJEMPLO 2
Resuelva los siguientes juegos usando estrategia dominada
a. Determina la estrategia óptima para cada jugador, por medio de la técnica de estrategia
DOMINADA.
J2
ESTRATEGIAS B1 B2 B3
A1 -2 -2 -1
J1 A2 1 5 -2
A3 5 3 0

b. considere la siguiente matriz de pagos

Estrategias Jugador II
E1 E2 E3 E4
E1 2 -3 -1 1
Jugador I E2 -1 1 -2 2
E3 -1 2 -1 3
Determine la estrategia óptima para cada jugador, por medio de la técnica de estrategia dominada.

JUEGOS DE SUMA NO CERO


Existen tres posibilidades:

 Juegos en los que dos oponentes ganan: ganar-ganar.


 Juegos en los que dos oponentes pierden: perder-perder.
 Juegos en los que uno de los oponentes gana y el otro pierde: ganar-perder

La matriz de pagos: ahora se deberán poner dos valores en cada celda, siendo el primero lo
que gana el jugador 1 y el segundo lo que gana el jugador 2.

Ejemplo 1. El siguiente juego de suma no cero, dos jugadores con 4 estrategias cada uno, se pide
aplicando las estrategias estrictamente dominadas, ¿cuáles son? Razone su respuesta y mencione,
al eliminar cada estrategia.
JUEGOS DINÁMICOS
Ejemplo 2. Considere el siguiente juego dinámico de dos jugadores: El jugador 1 escoge primero
entre Ayudar (A) o No Ayudar (NA), y luego el jugador 2 decide a su vez si ayuda (A) o no (NA),
conociendo la elección de 1. Cada jugador recibe una utilidad de 10 si ambos se ayudan y de 1 si nadie
se ayuda. Asimismo, si un jugador ayuda y el otro no, el ‘ayudante’ obtiene 0 de utilidad y el ‘no
ayudante’ 15.
a) Represente este juego en forma extensiva.
b) Represéntelo asimismo en forma estratégica (es decir, indique su matriz de pagos).
c) Indique el equilibrio (o equilibrios) de Nash en estrategias puras.
d) Halle razonadamente el único equilibrio perfecto de este juego (resuelva por inducción hacia
atrás).

Ejemplo 3. En un juego con dos jugadores (1 y 2), el jugador 1 debe elegir primero entre terminar la
relación (T) o fiarse (F) de 2. Si escoge T, el juego se termina: 1 gana 10 dólares y 2 nada. Si se fía, 2
puede ahora elegir entre devolver el favor (D) o aprovecharse de 1 (A). Elija 2 lo que elija, el
juego se acaba: Si 2 escoge D, ambos ganan 20 dólares; mientras que si escoge A, 1 gana cero dólares
y 2 gana 40 dólares. Supongamos por simplificar que la utilidad de los jugadores coincide con su pago
monetario. En ese caso: (i) Represente el árbol del juego, (ii) halle la matriz de pagos, (iii) halle todos
los equilibrios de Nash, (iv) indique cuál es el único equilibrio perfecto (razonando cómo lo obtiene).
PRÁCTICO II SEGUNDO PARCIAL (TEORÍA DE JUEGOS)

1. En los juegos (a) y (b) dados a continuación, la retribución es para el jugador A. Cada
juego tiene una solución de estrategia pura. En cada caso, determine las estrategias que
definan el punto de silla y el valor del juego.

2. En los juegos (a) y (b) dados a continuación, la retribución es para el jugador A.


Determine los valores de p y q que harán de (A2, B2) un punto de silla:
3. La Empresa, después de seguir consejo y haber conseguido resultados óptimos, decide
consultar la estrategia a seguir para competir con la empresa DII. Ha desarrollado un
modelo de pronósticos de ventas de cada uno de los productos de su empresa, en función
de sus decisiones y las de la empresa DII. Estos datos los han recogido en la matriz de pago
que se muestra. ¿Cuál es el informe que debes presentar a la empresa? Describir su
estrategia, la de DII y el valor del juego. Desarrolle por el método de estrategia dominada.

4. Dos compañías promueven dos productos competidores. En la actualidad, cada producto


controla 50% del mercado. Debido a mejoras recientes en los dos productos, cada compañía
planea lanzar una campaña publicitaria. Si ninguna de las dos compañías se anuncia,
continuarán iguales las partes del mercado. Si alguna de las compañías lanza una campaña
más agresiva, la otra compañía con toda certeza perderá un porcentaje proporcional de sus
clientes. Una encuesta del mercado muestra que se puede llegar a 50% de los clientes
potenciales por medio de la televisión, a 30% por medio de periódicos, y a 20% por medio
de la radio.
a) Formule el problema como un juego de suma cero entre dos personas, y determine el
medio publicitario para cada compañía.
b) Determine un intervalo para el valor del juego. ¿Puede operar cada compañía con
una estrategia pura única?

5. Considere un caso simplificado en el cual existen dos participantes: usuarios de buses


(pasajeros) y conductores de buses (clásico chofer de micro). Considerando el sistema de
los paraderos diferidos, vemos que cada participante tiene dos posibilidades: Usuarios:
Esperar el bus en el paradero más cercano o Esperarlo en el paradero correspondiente.
Conductores: Parar en todos los paraderos o Parar sólo en los paraderos que le
corresponden.
La siguiente matriz de pagos resume las utilidades para cada uno ante las distintas
combinaciones de estrategias.
Parar en cualquier lugar Parar en diferidos
Parar en cualquier lugar 15, 10 5, 5
Parar en diferidos 5, 5 20,30

Analizar si existe equilibrio de Nash en estrategias puras y mixtas.


6. Determine los equilibrios de Nash, tanto en estrategias puras como en estrategias mixtas:
a)
J2
X Y
J1 A 0,2 2, 0
B 5, 4 0, 1

b)
J2
X Y
J1 A 0,0 1, 1
B 2, 2 0, 0

7. Considere el siguiente juego en su forma extensiva.

(a) Especificar el conjunto de estrategias puras de cada jugador.


(b) Calcular los equilibrios de Nash perfectos en subjuegos, los pagos y la trayectoria.

8. En un juego con dos jugadores (1 y 2), el jugador 1 debe elegir primero entre terminar la
relación (T) o fiarse (F) de 2. Si escoge T, el juego se termina: 1 gana 10 dólares y 2 nada.
Si se fía, 2 puede ahora elegir entre devolver el favor (D) o aprovecharse de 1 (A). Elija 2
lo que elija, el juego se acaba: Si 2 escoge D, ambos ganan 20 dólares; mientras que si
escoge A, 1 gana cero dólares y 2 gana 40 dólares. Supongamos por simplificar que la
utilidad de los jugadores coincide con su pago monetario. En ese caso: (i) Represente el
árbol del juego, (ii) halle la matriz de pagos, (iii) halle todos los equilibrios de Nash, (iv)
indique cuál es el único equilibrio perfecto (razonando cómo lo obtiene).

9. El ejército del coronel Blotto está peleando por el control de dos posiciones estratégicas.
Blotto dispone de dos regimientos y el enemigo de tres. Una posición caerá ante el
ejército con más regimientos. De lo contrario, el resultado de la batalla es un empate.
a) Formule el problema como un juego de suma cero entre dos personas y resuélvalo
mediante programación lineal
b) ¿Cuál ejercito ganará la batalla?

10. Encontrar el valor del juego para el juego de piedra, papel y tijera, sabiendo que si la
persona paga 1Bs si pierde y recibe 1 Bs si gana. No recibe ni paga cuando empata, resuelve
empleando programación lineal.
NOTA: EL PRÁCTICO DEBEN PRESENTAR EN LA FECHA DE REVISIÓN DEL EXAMEN SEGUNDO PARCIAL.

S-ar putea să vă placă și