Documente Academic
Documente Profesional
Documente Cultură
2-4
Un hombre juega póker cada sábado en la noche en su casa con el mismo grupo de amigos. Si
un sábado en la noche ofrece refrescos (con costo esperado de $14), el siguiente, el grupo
tendrá una probabilidad de jugar de buen humor de 7/8 y de hacerlo de mal humor de 1/8. Si
no lo hace, el siguiente sábado el grupo jugara de buen humor con una probabilidad de 1/8 y
de mal humor con una probabilidad de 7/8 sin importar el humor de este sábado. Es más, si la
noche comienza de mal humor y el no ofrece refrescos, el grupo lo molestara y tendrá una
perdida esperada en el póker de $75. De otra manera su promedio de ganancias o pérdidas en
el juego es cero. El hombre quiere encontrar la política óptima para determinar cuándo ofrecer
refresco para minimizar su costo promedio esperado semanal (a largo plazo).
Estado Condición
0 Buen humor
1 Mal humor
Decisión Cik
Estado 1 2
0 14 14
1 - 75
b) Identifique todas las políticas (determinísticas estacionarias). Para cada una, elabora
una matriz de transición y obtenga la expresión del costo promedio esperado a largo
plazo por periodo en términos de las probabilidades de estado estable desconocidas.
El costo promedio esperado (a la larga) por semana para esta política es:
Conclusión:
Según la matriz de transición del problema, la mejor opción para reducir los costos al máximo
(minimizar el costo) es ofrecer refrescos en el primer sábado, ya que solo generara un costo de
21.625 y la opción de no dar nada crea un costo mucho más alto de 67.375.