09a - Programacion Dinamica Probabilistica

INVESTIGACION DE OPERACIONES 2
Programación Dinámica Probabilística
Ing. Manuel Sánchez Terán

PROGRAMACION DINAMICA PROBABILISTICA
PDP
DEFINICIONES
LOGRO DE LA SESION:
Al término de la sesión el estudiante
resuelve problemas de programación PROBLEMA 1
dinámica haciendo uso del cálculo recursivo
incluyendo probabilidades, minimizando el
proceso de cálculo al considerar solamente
los estados y las decisiones necesarias en PROBLEMA 2
cada etapa en que se divide el problema,
alcanzando la solución óptima.
DEFINICIONES
Autores
La Programación Dinámica Probabilística difiere de la
Hillier-Lieberman
Determinística en que el estado de la siguiente etapa
no está determinado por completo por el estado y la
Hamdy Taha política de decisión de la etapa actual. En su lugar
existe una distribución de probabilidad para determinar
cuál será el siguiente estado. Sin embargo, esta
Richard Bronson distribución de probabilidad si queda bien determinada
por el estado y la decisión de la etapa actual.
DEFINICIONES
Autores
La Programación Dinámica Probabilística difiere de la
Hillier-Lieberman
Determinística en que los estados y los retornos o
retribuciones en cada etapa son probabilísticos.
Hamdy Taha
Richard Bronson
DEFINICIONES
Autores
Un proceso de decisión de N etapas es probabilístico,
Hillier-Lieberman
si el rendimiento asociado con al menos una decisión
del proceso es aleatorio. Esta aleatoriedad
Hamdy Taha generalmente se presenta en una de dos formas:
• Los estados son determinados exclusivamente por

Richard Bronson las decisiones, pero los rendimientos asociados
con uno o más de los estados son inciertos.
• Los rendimientos son determinados exclusivamente

por los estados, pero los estados que se presentan
a partir de una o más de las decisiones son
inciertos.
ESTRUCTURA BASICA DE LA
PROGRAMACION DINAMICA DETERMINISTICA
Etapa Etapa
n n+1
C1
Estado: Sn Xn Sn+1
fn(sn,xn) f *n+1(sn+1)
ESTRUCTURA BASICA DE LA
Etapa
n+1
C1 1 f *n+1 (1)
Etapa
n p1
C2
Estado: Sn Xn p2 2 f *n+1 (2)
pm
fn(sn,xn)
…
Cm
Sea m el número de estados posibles en la etapa n+1. El
m f *n+1 (m)
sistema cambia al estado i con probabilidad pi ( i=1, 2, … m)
dados el estado sn y la decisión xn en la etapa n. Si el sistema
cambia al estado i, Ci es la contribución o costo de la etapa n a
la función objetivo.
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2
EJEMPLO 1 (Asignación de científicos)

Un proyecto de investigación sobre cierto problema de ingeniería tiene 3 equipos de investigadores que
buscan resolver el problema desde 3 puntos de vista diferentes. Se estima que en las circunstancias actuales
la probabilidad de que los equipos A, B, C fracasen es de: 0.40, 0.60 y 0.80 respectivamente. Así, la
probabilidad de que los 3 equipos fracasen es de: (0.40)(0.6)(0.8) = 0.192. (Un 19.2%). El objetivo es
minimizar la probabilidad de fracaso de los 3 equipos, y por ello, se asignaran al proyecto 2 nuevos
científicos de alto nivel.
Según la asignación a los equipos, la probabilidad de fracaso cambia según lo indicado en la tabla siguiente:
# de científicos Probabilidad de fracaso de los equipos

adicionales
A B C
asignados
0 0.40 0.60 0.80
1 0.20 0.40 0.50
2 0.15 0.20 0.30
Solución
Etapas: N = 3 (tres equipos A, B y C)

Función: f = minimizar probabilidad de fracaso
Estado: s = # de científicos adicionales disponibles
Variable: x = # de científicos adicionales asignados
Etapa 3 (Equipo C)
f3(s3,x3) = p3 Solución óptima
s3
x3 =0 x3 =1 x3 =2 f3*(s3) x3*
0 0.8 - - 0.8 0
1 - 0.5 - 0.5 1
2 - - 0.3 0.3 2
Etapa 3 (Equipo C)
f3(s3,x3) = p3 Solución óptima
s3
x3 =0 x3 =1 x3 =2 f3*(s3) x3*
0 0.8 - - 0.8 0
1 - 0.5 - 0.5 1
2 - - 0.3 0.3 2
Etapa 2 (Equipo B)
f2(s2,x2) = p2 * f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 f2*(s2) x2*
0 (0.6)(0.8)=0.48 - - 0.48 0
1 (0.6)(0.5)=0.30 (0.4)(0.8)=0.32 - 0.30 0
2 (0.6)(0.3)=0.18 (0.4)(0.5)=0.20 (0.2)(0.8)=0.16 0.16 2
Etapa 2 (Equipo B)
s2
x2 =0 x2 =1 x2 =2 f2*(s2) x2*
0 (0.6)(0.8)=0.48 - - 0.48 0
1 (0.6)(0.5)=0.30 (0.4)(0.8)=0.32 - 0.30 0
2 (0.6)(0.3)=0.18 (0.4)(0.5)=0.20 (0.2)(0.8)=0.16 0.16 2
Etapa 1 (Equipo A)
s1
x1 =0 x1 =1 x1 =2 f1*(s1) x1*
2 (0.4)(0.16)=0.064 (0.2)(0.3)=0.06 (0.15)(0.48)=0.072 0.06 1
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2
EJEMPLO 2 (Repartidor de leche)

Un repartidor compra a una ganadería 6 galones de leche a $1 por Demanda
galón. Cada galón lo vende a $2 y solamente comercia con 3 diaria Probabilidad
clientes. La ganadería está dispuesta a comprar los galones de (galones)
leche que el repartidor no alcance a vender pero solamente le 1 0.60
pagará la mitad de lo que él pagó al inicio. Desafortunadamente Cliente
2 0.00
para el repartidor la demanda diaria de cada uno de sus clientes es 1
incierta, es por esto que llevó el registro de sus ventas del año 3 0.40
pasado y resumió la información en probabilidades de la siguiente 1 0.50
Cliente
manera: 2 0.10
2
3 0.40
Si lo que quiere el repartidor es asignar los 6 galones de leche 1 0.40
Cliente
entre los tres clientes para maximizar los ingresos esperados (ya 2 0.30
3
que el costo siempre será $6); sabiendo además que de los galones 3 0.30
de leche enviados a un determinado cliente no se pueden enviar
los rechazados luego a otro cliente, utilice la programación
dinámica para determinar cómo el repartidor debe asignar los 6
galones de leche entre sus tres clientes.
Solución
La demanda de cualquier cliente nunca es más de tres galones.
Etapas: Clientes
Estados: Galones de leche disponibles
Decisión: ¿Cuántos galones enviar a cada cliente?
Variables:
xn = Galones enviados al cliente n (no necesariamente el cliente cogerá todos)
dn = Demanda del cliente n ( galones comprados por el cliente)
Función recursiva: Ingreso esperado obtenido
in(xn)=2dn + 0.5(xn-dn)
fn(sn,xn) = max{2dn + 0.5(xn-dn) + fn+1(sn-xn)}

Tabla de ingresos esperados in(x)

x Cliente1 Cliente2 Cliente3
0 i1(0)=0 i2(0)=0 i3(0)=0
i1(1)=(0.6)2.0+(0.0)2.0+(0.4)2.0 i2(1)=(0.5)2.0+(0.1)2.0+(0.4)2.0 i3(1)=(0.4)2.0+(0.3)2.0+(0.3)2.0
1
=2.00 =2.00 =2.00
i1(2)=(0.6)2.5+(0.0)4.0+(0.4)4.0 i2(2)=(0.5)2.5+(0.1)4.0+(0.4)4.0 i3(2)=(0.4)2.5+(0.3)4.0+(0.3)4.0
2
=3.10 =3.25 =3.40
i1(3)=(0.6)3.0+(0.0)4.5+(0.4)6.0 i2(3)=(0.5)3.0+(0.1)4.5+(0.4)6.0 i3(3)=(0.4)3.0+(0.3)4.5+(0.3)6.0
3
=4.20 =4.35 =4.35
Etapa 3
f3(s3,x3)= i3(x3) Solución óptima
s3
x3 =0 x3 =1 x3 =2 x3 =3 f3*(s3) x3*
0 0 - - - 0 0
1 - 2 - - 2 1
2 - - 3.4 - 3.4 2
3 - - - 4.35 4.35 3
Etapa 3
f3(s3,x3)= i3(x3) Solución óptima
s3
x3 =0 x3 =1 x3 =2 x3 =3 f3*(s3) x3*
0 0 - - - 0 0
1 - 2 - - 2 1
2 - - 3.4 - 3.4 2
3 - - - 4.35 4.35 3
Etapa 2
f2(s2,x2)= i2(x2)+f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 x2 =3 f2*(s2) x2*
3 0+4.35=4.35 2+3.4=5.40 3.25+2-=5.25 4.35 5.40 1
4 - 2+4.35=6.35 3.25+3.4=6.65 4.35+2=6.35 6.65 2
5 - - 3.25+4.35=7.60 4.35+3.4=7.75 7.75 3
6 - - - 4.35+4.35=8.70 8.70 3
Etapa 2
s2
x2 =0 x2 =1 x2 =2 x2 =3 f2*(s2) x2*
3 0+4.35=4.35 2+3.4=5.40 3.25+2-=5.25 4.35 5.40 1
4 - 2+4.35=6.35 3.25+3.4=6.65 4.35+2=6.35 6.65 2
5 - - 3.25+4.35=7.60 4.35+3.4=7.75 7.75 3
6 - - - 4.35+4.35=8.70 8.70 3
Etapa 1
s1
x1 =0 x1 =1 x1 =2 x1 =3 f1*(s1) x1*
6 0+8.70=8.70 2+7.75=9.75 3.10+6.65=9.75 4.20+5.40=9.60 9.75 1 (no 2)
$9.75 es el ingreso esperado (en el cual se consideraron las probabilidades), para

determinar la utilidad recuerde que la cantidad de inversión es siempre $6.
Asignar: Cliente1: 1 Cliente 2:3 Cliente3:2
No se incluye 2 en la primera etapa por tener probabilidad = 0
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2

09a - Programacion Dinamica Probabilistica

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

09a - Programacion Dinamica Probabilistica

Încărcat de

Drepturi de autor:

Formate disponibile

INVESTIGACION DE OPERACIONES 2

Programación Dinámica Probabilística

Ing. Manuel Sánchez Terán

• Los estados son determinados exclusivamente por

• Los rendimientos son determinados exclusivamente

EJEMPLO 1 (Asignación de científicos)

# de científicos Probabilidad de fracaso de los equipos

Etapas: N = 3 (tres equipos A, B y C)

EJEMPLO 2 (Repartidor de leche)

La demanda de cualquier cliente nunca es más de tres galones.

Función recursiva: Ingreso esperado obtenido

fn(sn,xn) = max{2dn + 0.5(xn-dn) + fn+1(sn-xn)}

Tabla de ingresos esperados in(x)

$9.75 es el ingreso esperado (en el cual se consideraron las probabilidades), para

S-ar putea să vă placă și