Documente Academic
Documente Profesional
Documente Cultură
PDP
DEFINICIONES
LOGRO DE LA SESION:
Al término de la sesión el estudiante
resuelve problemas de programación PROBLEMA 1
dinámica haciendo uso del cálculo recursivo
incluyendo probabilidades, minimizando el
proceso de cálculo al considerar solamente
los estados y las decisiones necesarias en PROBLEMA 2
cada etapa en que se divide el problema,
alcanzando la solución óptima.
PROGRAMACION DINAMICA PROBABILISTICA
DEFINICIONES
Autores
La Programación Dinámica Probabilística difiere de la
Hillier-Lieberman
Determinística en que el estado de la siguiente etapa
no está determinado por completo por el estado y la
Hamdy Taha política de decisión de la etapa actual. En su lugar
existe una distribución de probabilidad para determinar
cuál será el siguiente estado. Sin embargo, esta
Richard Bronson distribución de probabilidad si queda bien determinada
por el estado y la decisión de la etapa actual.
PROGRAMACION DINAMICA PROBABILISTICA
DEFINICIONES
Autores
La Programación Dinámica Probabilística difiere de la
Hillier-Lieberman
Determinística en que los estados y los retornos o
retribuciones en cada etapa son probabilísticos.
Hamdy Taha
Richard Bronson
PROGRAMACION DINAMICA PROBABILISTICA
DEFINICIONES
Autores
Un proceso de decisión de N etapas es probabilístico,
Hillier-Lieberman
si el rendimiento asociado con al menos una decisión
del proceso es aleatorio. Esta aleatoriedad
Hamdy Taha generalmente se presenta en una de dos formas:
ESTRUCTURA BASICA DE LA
PROGRAMACION DINAMICA DETERMINISTICA
Etapa Etapa
n n+1
C1
Estado: Sn Xn Sn+1
fn(sn,xn) f *n+1(sn+1)
PROGRAMACION DINAMICA PROBABILISTICA
ESTRUCTURA BASICA DE LA
PROGRAMACION DINAMICA PROBABILISTICA
Etapa
n+1
C1 1 f *n+1 (1)
Etapa
n p1
C2
Estado: Sn Xn p2 2 f *n+1 (2)
pm
fn(sn,xn)
…
Cm
Sea m el número de estados posibles en la etapa n+1. El
m f *n+1 (m)
sistema cambia al estado i con probabilidad pi ( i=1, 2, … m)
dados el estado sn y la decisión xn en la etapa n. Si el sistema
cambia al estado i, Ci es la contribución o costo de la etapa n a
la función objetivo.
PROGRAMACION DINAMICA PROBABILISTICA
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2
PROGRAMACION DINAMICA PROBABILISTICA
Según la asignación a los equipos, la probabilidad de fracaso cambia según lo indicado en la tabla siguiente:
Solución
Etapa 3 (Equipo C)
f3(s3,x3) = p3 Solución óptima
s3
x3 =0 x3 =1 x3 =2 f3*(s3) x3*
0 0.8 - - 0.8 0
1 - 0.5 - 0.5 1
2 - - 0.3 0.3 2
PROGRAMACION DINAMICA PROBABILISTICA
Etapa 3 (Equipo C)
f3(s3,x3) = p3 Solución óptima
s3
x3 =0 x3 =1 x3 =2 f3*(s3) x3*
0 0.8 - - 0.8 0
1 - 0.5 - 0.5 1
2 - - 0.3 0.3 2
Etapa 2 (Equipo B)
f2(s2,x2) = p2 * f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 f2*(s2) x2*
0 (0.6)(0.8)=0.48 - - 0.48 0
1 (0.6)(0.5)=0.30 (0.4)(0.8)=0.32 - 0.30 0
2 (0.6)(0.3)=0.18 (0.4)(0.5)=0.20 (0.2)(0.8)=0.16 0.16 2
PROGRAMACION DINAMICA PROBABILISTICA
Etapa 2 (Equipo B)
f2(s2,x2) = p2 * f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 f2*(s2) x2*
0 (0.6)(0.8)=0.48 - - 0.48 0
1 (0.6)(0.5)=0.30 (0.4)(0.8)=0.32 - 0.30 0
2 (0.6)(0.3)=0.18 (0.4)(0.5)=0.20 (0.2)(0.8)=0.16 0.16 2
Etapa 1 (Equipo A)
f1(s1,x1) = p1 * f2(s1-x1) Solución óptima
s1
x1 =0 x1 =1 x1 =2 f1*(s1) x1*
2 (0.4)(0.16)=0.064 (0.2)(0.3)=0.06 (0.15)(0.48)=0.072 0.06 1
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2
PROGRAMACION DINAMICA PROBABILISTICA
Solución
Etapas: Clientes
Estados: Galones de leche disponibles
Decisión: ¿Cuántos galones enviar a cada cliente?
Variables:
xn = Galones enviados al cliente n (no necesariamente el cliente cogerá todos)
dn = Demanda del cliente n ( galones comprados por el cliente)
in(xn)=2dn + 0.5(xn-dn)
Etapa 3
f3(s3,x3)= i3(x3) Solución óptima
s3
x3 =0 x3 =1 x3 =2 x3 =3 f3*(s3) x3*
0 0 - - - 0 0
1 - 2 - - 2 1
2 - - 3.4 - 3.4 2
3 - - - 4.35 4.35 3
PROGRAMACION DINAMICA PROBABILISTICA
Etapa 3
f3(s3,x3)= i3(x3) Solución óptima
s3
x3 =0 x3 =1 x3 =2 x3 =3 f3*(s3) x3*
0 0 - - - 0 0
1 - 2 - - 2 1
2 - - 3.4 - 3.4 2
3 - - - 4.35 4.35 3
Etapa 2
f2(s2,x2)= i2(x2)+f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 x2 =3 f2*(s2) x2*
3 0+4.35=4.35 2+3.4=5.40 3.25+2-=5.25 4.35 5.40 1
4 - 2+4.35=6.35 3.25+3.4=6.65 4.35+2=6.35 6.65 2
5 - - 3.25+4.35=7.60 4.35+3.4=7.75 7.75 3
6 - - - 4.35+4.35=8.70 8.70 3
PROGRAMACION DINAMICA PROBABILISTICA
Etapa 2
f2(s2,x2)= i2(x2)+f3(s2-x2) Solución óptima
s2
x2 =0 x2 =1 x2 =2 x2 =3 f2*(s2) x2*
3 0+4.35=4.35 2+3.4=5.40 3.25+2-=5.25 4.35 5.40 1
4 - 2+4.35=6.35 3.25+3.4=6.65 4.35+2=6.35 6.65 2
5 - - 3.25+4.35=7.60 4.35+3.4=7.75 7.75 3
6 - - - 4.35+4.35=8.70 8.70 3
Etapa 1
f1(s1,x1)= i1(x1)+f2(s1-x1) Solución óptima
s1
x1 =0 x1 =1 x1 =2 x1 =3 f1*(s1) x1*
6 0+8.70=8.70 2+7.75=9.75 3.10+6.65=9.75 4.20+5.40=9.60 9.75 1 (no 2)
PDP
DEFINICIONES
PROBLEMA 1
PROBLEMA 2