Programare Dinamica

Paradigma Programare dinamica
 Prezentarea generala a paradigmei

 Studii de caz
alocarea resurselor
drumurile minime intr-un digraf
rucsac 0/1
distanta intre siruridistanta intre siruri
subsecventa crescatoare de lungime maxima
Prezentarea formala a paradigmei
Programare dinamica - ingrediente
 probleme de optim
 definirea subproblemei (stare) si asocierea functii obiectiv
pentru subproblema
 definirea unei relatii de tranzitie intre stari (decizie)
 politica = secventa de decizii
 aplicarea Principiului de Optim pentru obtine relatia de
recurenta
Principiul de Optim (PO): o subpolitica a unei politici
optimale este la rindul ei optimala
 calculul recurentei rezolvind subproblemele de la mic la
mare si memorind valorile date de relatia de recurenta
intr-un tablou
 extragerea solutiei optime din tablou
Exemplu: retea triunghiulara de numere: modelare
a0
a1 a2
a3 a4 a5
a6 a7 a8 a9
 functia obiectiv: maxdD lg(d)
 stare: DMR(i) = subreteaua cu virful in ai
 val. asociata: i
 functia asociata: f(i) = maxdD(i) lg(d)
 decizii posibile: DMR(i)  DMR(stg(i)),
DMR(i)  DMR(drp(i))
 recurenta obtinuta: f(i) = max(f(stg(i)), f(drp(i))) + ai
Exemplu: retea triunghiulara de puncte: implementare
 Tine minte! Rezolva subproblemele de la mic la mare si

memoreaza valorile date de relatia de recurenta intr-un tablou
 valorile functiei f[] vor fi calculate in ordinea
f[n-1], f[n-2], ..., f[2], f[1], f[0]
Atentie! Transformarea recurentei in recursie duce la solutii
costisitoare (subprobleme rezolvate de mai multe ori).
 extragerea solutiei optime din tabel
 initial: sol[0] = 0
 pas curent:
• daca f[sol[i]] = f[stg[sol[i]]]+a[sol[i]]
atunci sol[i+1] = stg[sol[i]]
altfel sol[i+1] = drp[sol[i]]
Alocarea resurselor
 Pentru realizarea a p proiecte sunt disponibile r resurse.

 Alocarea a j resurse la proiectul i produce un profit c[i,j].
 Problema consta in alocarea celor r resurse astfel incat profitul
total sa fie maxim.
c[2,0]
c[2,1] c[3,2]
c[1,0]
c[1,1] c[2,0] c[3,1]

s t
c[2,1] c[2,2]
c[1,2] c[3,0]
c[2,0]
proiectul 1 proiectul 2 proiectul 3

Alocarea resurselor
 Intrare:
 Digraf etajat G = (V, A),
• V = V1  V2  … Vp  Vp+1
• Vi  Vj = Ø
• V1 = {s}. Vp+1 = {t}
• daca un arc are sursa in Vi atunci are destinatia in Vi+1
 functie de profit c : A  R
 Iesire: un drum de la s la t de profit maxim
Alocarea resurselor
 XV
 stare: DODE(j) = problema determinarii drumurilor de la j la t
 V = {0, 1, …, n-1}
 D[i,j] = drumul optim la j  Vi la t
 ValOpt[i,j] valoarea acestui drum
 decizie: DODE(j)  DODE(k)
 aplicam PO si obtinem
ValOpt[i, j] = c[j, k] + ValOpt[i+1, k]
 de unde rezulta recurenta:
ValOpt[p+1, n-1] = 0
ValOpt[i, j] = optim{c[j, k] + ValOpt[i+1, k] | k  Vi+1, (j,k)  A}
 ordinea de rezolvare a subproblemelor:
DODE(Vp+1), DODE(VpVp+1), …, DODE(V)
Alocarea resurselor
function alocRes(G, ValOpt, D)

for j  0 to G.n-2 do
ValOpt[j]  
ValOpt[G.n-1]  0
for k  G.n-1 downto 1 do
q  G.a[k]
while (q  NULL) do
j  q->varf
if (ValOpt[j] < ValOpt[k] + q->c)
then ValOpt[j]  ValOpt[k] + q->c
S[j]  k
q  q->succ
D[0]  0
D[p]  n-1
for i  1 to p-1 do
D[i]  S[D[i-1]]
return ValOpt[0]
end
Drumuri minime intr-un digraf
 Problema
 instanta:
• D = (V, A, lg), lg : A  R
• lg[i, i] = 0, lg[i, j] =  daca (i,j)  A
• lungime drum =  lungimilor arcelor de pe drum
 iesire:
• pentru orice pereche (i,j) lungimea celui mai scurt drum de
la i la j
 Modelul matematic
 stare: DMD(X) – drumuri minime cu virfuri intermediare in X
• functia asociata: LX[i, j] = lung. drumului minim de la i la j
cu virfuri intermediare in X
Drumuri minime intr-un digraf (continuare)
decizie: DMD(X{k})  DMD(X)

relatia de recurenta:
LX {k}[i, j] = min{LX[i, j], LX[i, k] + LX[k, j]}
L[i, j] = lg[i, j]
politica optima: DMD(), DMD({0}), DMD({0,1}), ...,
DMD({0,1, ...,n-1})
notatie: Lk[i, j] = L{0,1,...,k-1}[i, j]
Lk[i, j] = min{Lk-1[i, j], Lk-1[i, k] + Lk-1[k, j]}
matricele Lk sint calculate in ordinea L0, L1,…, Ln
Drumuri minime intr-un digraf: algoritm (Floyd-Warshall)
procedure DMD(D, L)
begin
for all [i,j] do
if (i,j) A)
then L[i,j]  lg[i,j]
else L[i,j]  
if (i = j) then L[i,j] = 0;
for k  1 to n do
for all [i,j] do
temp  L[i,k] + L[k,j]
if (L[i,j] > temp)
then L[i,j]  temp
if (i=j and L[i,i] < 0)
then throw “ERR:circuit negativ”
end
Problema rucsacului (varianta discreta): formulare
 instanta:
 n obiecte 0, 1, ..., n-1 de dimensiuni (greutati) w0, w1, ..., wn-1
 un rucsac de capacitate M
 un obiect i poate fi introdus in rucsac complet (xi = 1) sau de loc
(xi=0)
 introducerea in rucsac a obiectului i aduce un profit pi
 profitul total adus de alegerile x0, ..., xn-1 este i=0,n-1 xipi
 iesire:
o alegere pentru care profitul adus este maxim
Problema rucsacului (varianta discreta): solutie
 modelul matematic
stare: RUCSAC(j, X)
• functia obiectiv:
max i=0,j-1 xipi
• restrictii:
(i)xi  {0,1}
i=0,j-1 xiwi  X
X  Z, (i)wi ,pi  Z
functia asociata unei stari: fj(X) = max i=0,j-1 xipi
Problema rucsacului (varianta discreta): solutie (cont)
decizie: RUCSAC(j, X)  RUCSAC(j-1, ?)

relatia de recurenta:
  X  0,

f j ( X )  0 X  0  j  0,
max( f ( X ), f ( X  w )  p ) altfel.
 j 1 j 1 j 1 j 1
Problema rucsacului (varianta discreta): exemplu
 M = 10, p = (10, 30, 20), w = (3, 5, 6)
X 0 1 2 3 4 5 6 7 8 9 10
f0(X) 0 0 0 0 0 0 0 0 0 0 0
f1(X) 0 0 0 10 10 10 10 10 10 10 10
f2(X) 0 0 0 10 10 30 30 30 40 40 40
f3(X) 0 0 0 10 10 30 30 30 40 40 40
x2 = 0 x1 = 1 x0 = 1
Problema rucsacului (varianta discreta): functiile fi
 fi este o functie in scara

 graficul lui fi poate fi reprezentat prin multimea punctelor de
salt Si
 graficul lui gi-1(X) = fi-1(x-wi-1)+pi-1 este o translatie a
lui Si-1 ; notam (Si-1)
 graficul lui fi = max(fi-1, gi-1) se obtine prin interclasarea
graficelor Si-1 si (Si-1);
notam (Si-1,(Si-1))
Problema rucsacului (varianta discreta): algoritm
procedure Rucsac(n, p, w)
begin
/* calculeaza valoarea optima */
S0  {(0,0)}
for i  1 to n do
Si  (Si-1,(Si-1))
/* determina alegerea optima */
calc. (U,V) a.i. Xj= max{Xi|(Xi,Yi) Sn, Xi  M}
for i  n-1 downto 0 do
if ((U,V) Si then xi+1 = 0
else xi+1 = 1;
(U,V) = (U-wi+1,V-pi+1)
end
Problema rucsacului (varianta discreta): complexitate
 calculul lui Si din Si-1 se face in timpul |Si|

 punctele (Xj,Yj)din Si satisfac:
 0  Xj  M
 0  Yj  kpk  nmaxkpk
 rezulta
|Si|  min(M, nmaxkpk)  nmax(p0, p1,…, pn-1,M)
 rezulta ca Sn-1 se calculeaza in timpul
O(n2max(p0, p1,…, pn-1,M))
 calculul solutiei se face in timpul O(n)
 rezulta ca timpul de executie a algoritmului este
O(n2max(p0, p1,…, pn-1,M))
 spatiul: |S0| + |S1| + … + |Sn-1| = O(n2max(p0, p1,…, pn-1,M))
 daca max(p0, p1,…, pn-1,M) > 2n atunci timpul de executie a
algoritmului este exponential
 algoritmul este pseudo-polinomial
Algoritmi pseudo-polinomiali
 consideram probleme pentru care intrarea pentru P este data ca

o secventa de numere intregi
 presupunem ca intrarea este codificata peste alfabetul {0,1,#}
 daca x = (x0, x1,…, xn-1), atunci
cod(x) = cod(x0)#cod(x1)#…#cod(xn-1), cod(x1)  {0,1}*
 max(x) = max{x0, x1,…, xn-1}
 un algoritm A pentru P este pseudo-polinomial (relativ la
timpul de executie) daca exista un polinom p(X,Y) de doua
variabile astfel incat timpul de executie a lui A este
TA(x) = O(p(|cod(x)|, max(x)))
 daca q(X) este un polinom astfel incat max(x)  q(|cod(x)|),
atunci TA(x) este marginit de un polinom
Algoritmi pseudo-polinomiali
• nr. de biti pentru reprez. lui m este s  0

• n = [log m] + 1 i  0
• luam m = 2n-1 while (i < m) do
• presupunem ca op. i < m si i  i+1 i  i+1
se executa fiecare in timpul log i
s  s + i
• prespunem ca op. s  s + i se executa
in timpul log s
• rezulta un timp de calcul
• TA(m) = Θ(m log m) = Θ(n 2n)
• algoritmul este pseudo-polinomial
• p(X,Y) = XY
• TA(m) = Θ (p(n, m))
Distanta intre siruri – problema
 instanta
doua siruri a si b de lungime n
asupra lui a se pot face operatiile:
• modificare: M(i, c) daca ai  c
• stergere: S(i)
• inserare: I(i, c)
 iesire
o secventa de operatii de lungime minima care transforma
sirul a in b
 exemplu
a = “armata”, b = “camara”
“armata”  “amata”  “camata”  “camara”
d[“armata”, “camara”] = 3
Distanta intre siruri – propretati
 ordinea operatiilor intr-o secventa optima nu are importanta
“armata”  “amata”  “camata”  “camara”

“armata”  “amata”  “amara”  “camara”
“armata”  “carmata”  “camata”  “camara”
“armata”  “carmata”  “carmara”  “camara”
“armata”  “armara”  “amara”  “camara”
“armata”  “armara”  “carmara”  “camara”
Distanta intre siruri – proprietati (cont.)
 exista o secventa optima in care sirurile intermediare au

lungimea  n
 d[a,b] este o metrica:
d[a, a] = 0
d[a, b] = d[b, a]
d[a, c]  d[a, b] + d[b, c]
Distanta intre siruri – model
 stare: DES[i,j] = determinarea distantei minime intre

subsirurile de lungime i si respectiv j
 valoarea asociata unei stari: [i,j]
 functia asociata unei stari: d[i, j] = d[a[1..i], b[1..j]]
 decizie:
presupunem ca b[j] se obtine prin stergere:
DES[i,j]  DES[i-1, j]
presupunem ca b[j] se obtine prin modificare:
DES[i,j]  DES[i-1, j-1]
presupunem ca a[i] se obtine prin inserare:
DES[i,j]  DES[i, j-1]
Distanta intre siruri – model (cont.)
 relatia de recurenta
d[0, j] = j, d[i, 0] = i (i, j)
d[i, j] = min{d[i-1, j] + 1, d[i-1, j-1] + [i, j], d[i, j-1] + 1}
[i, j] = if (a[i] = b[j]) then 0 else 1
 timp:
calculului matricii d: O(n2)
determinarea secventei de operatii: O(n)
 spatiu: O(n2)
Distanta intre siruri - exemplu
c a m a r a
0 1 2 3 4 5 6
a 1 1 1 2 3 4 5
r 2 2 2 2 3 3 4
m 3 3 3 2 3 4 4
a 4 4 3 3 2 3 4
t 5 5 4 4 3 3 4
a 6 6 5 5 4 4 3
( M(5,’r’), S(2), I(1,’c’) )

Distanta intre siruri - variatii
 alte operatii:
 transpozitia: schimba ordinea a doua caractere adiacente
 distanta Levenshtein (de editare)
 sunt admise numai inserari, stergeri si inlocuiri
 toate operatiile au costul 1
 distanta Hamming
 sunt admise numai inlocuirile
 costul operatiei este 1
 este finita ori de cate ori |a| = |b|
 distanta “episodica” (episode distance)
 sunt admise numai inserari
 costul operatiei este 1
 distanta este sau |b|-|a| sau 
Distanta intre siruri - variatii
 distanta data de cea mai lunga subsecventa

 sunt admise numai inserari si stergeri
 toate operatiile au costul 1
a = “amxbtycsnma” si b = “bancxstymcxn”
“amxbtycsnma”  “bamxbtycsnma”  “baxbtycsnma” 
“banxbtycsnma”  “bancxbtycsnma”  “bancxtycsnma” 
“bancxstycsnma”  “bancxstymcsnma”  “bancxstymcnma” 
“bancxstymcxnma”  “bancxstymcxna”  “bancxstymcxn” = b
• (a,x,t,y,c,n) este subsecventa comuna
• este cea mai lunga?
Distanta intre siruri - aplicatii
 “matching” aproximativ peste siruri (aproximate string matching)

 problema: dat un text s de lungime n, un patern p de lungime
m, o distanta d() intre siruri si un numar k, sa se determine
pozitiile j din textul s astfel incat sa existe i cu d(p, s[i..j])  k
 distanta Levenshtein: “string matching with k differences”
 distanta Hamming: “string matching with k missmatches”
 distanta episodica: “episode matching” (modeleaza cazul cand
se cauta o secventa de evenimente intr-o perioada scurta de
timp)
 cea mai lunga subsecventa comuna: exact ce spune numele
 procesul de cautare:
• a = p, b = s
• trebuie sa modificam alg. a.i. orice pozitie j din text este
startul potential al unei potriviri; asta se realizeaza prin
setarea d[0,j] = 0
• calculul matricei se face pe coloane

• initial: d[i, 0] = i pentru i = 0, …, m
• se proceseaza textul caracter cu caracter
• presupunem ca la pasul curent se proceseaza sj
• coloana j este actualizata:
d[i, j] = if (pi = sj) then d[i-1, j-1]
else 1 + min(d[i-1, j], d[i, j-1], d[i-1, j-1])
• pozitiile j pentru care d[m,j]  k sunt raportate
• de remarcat ca numai ultimele doua coloane sunt
necesare
s u r g e r y
0 0 0 0 0 0 0 0
s 1 0 1 1 1 1 1 1
u 2 1 0 1 2 2 2 2
r 3 2 1 0 1 2 2 3
v 4 3 2 1 1 2 3 3
e 5 4 3 2 2 1 2 3
y 6 5 4 3 3 2 2 2
Paralelizare
 G. Myers. A fast Bit-Vector Algorithm for Approximate

String Matching Based on Dynamic Programming, 1998
 Δh[i,j] = d[i,j] - d[i, j-1], Δ[i,j] = d[i,j] - d[i-1, j],
 Δh[i,j], Δv[i,j] ∊ {-1,0,1} (a se vedea fig. 1 din articol)
 Δv[*,j] este reprezentata prin vectorii de tip bit
Pvj[i] ≡ Δv[i,j] = +1, Mvj[i] ≡ Δv[i,j] = -1
 se considera celule ale matricii formate din patrate (i-1, j-1), (i-
1, j), (i, j-1), (i,j)
 Eq = Eq[i,j] = if pi = sj then 1 else 0
 Δvout = min{-Eq, vin , Δhin }+ {1 -Δhin },
Δhout = min{-Eq, vin , Δhin }+ {1 -Δvin } (a se vedea fig. 2)
 (Pvout , Mvout ) = (Mhin or not (Xv or Phin), Phin and Xv),
(Phout , Mhout ) = (Mvin or not (Xh or Pvin), Pvin and Xh),
unde Xv = Eq or Mvin
Paralelizare (continuare)
 Scorej = m, Scorej = Scorej-1 + Δh[m,j]

 scanarea (a se vedea fig. 3)
Phj[i] = Mvj-1[i] or not (Xhj[i] or Pvj[i]
Mhj[i] = Pvj-1[i] and Xvj[i]
Scorej = Scorej-1 + (1 if Phj[m]) – (1 if Mhj[m])
Phj[0] = Mhj[0] = 0 (*)

Pvj[i] = Mhj-1[i] or not (Xvj[i] or Phj[i]
Mvj[i] = Phj-1[i] and Xhj[i]
 calculul pe biti (a se vedea fig. 4)

 algoritmul ((a se vedea fig. 5)
Subsecventa crescatoare maximala – problema
 instanta
 o secventa de numere intregi a = (a1, a2, …, an)
 stergand cateva elemente din a se obtine o subsecventa
 o subsecventa pastreaza ordinea relativa a elementelor
 exemplu:
• a = (9, 3, 15, 12, 7, 4, 13, 6, 8)
• subsecventa: (3, 12, 7, 6)
• subsecventa crescatoare: ( 3, 7, 13)
 iesire: subsecventa crescatoare de lungime maxima
 exemplu: exista o subsecventa crescatoare de lungime > 3?
 cum se poate rezolva utilizand distanta de editare?
Subsecventa crescatoare maximala – model
 a = (9, 3, 15, 12, 7, 4, 13, 6, 8)

1 2 3 4 5 6 7 8 9
 construim un graf G:
 varfuri: 0, 1, 2, …, 9
 arce: { (0,i) | i > 0 }  { (i,j) | a[i] <= a[j] }
0 1 2 3 4 5 6 7 8 9
 subsecventa crescatoare = drum in G

 subsecventa crescatoare maximala = drum de lungime maxima
in G
 asociem o matrice de costuri:
 c[i, j] = 1 daca i < j si (a[i] <= a[j] sau i = 0)
 c[i,j] = -  altfel
 stare: SCM(i) = subproblema determinarii celui mai lung drum
ce se termina in i
 L[i] = valoarea optima pentru SCM(i)
 PO implica L[i] = L[j] + c[j,i], j predecesorul lui i pe drumul
optim
 relatia de recurenta:
 L[0] = 0
 L[i] = max { L[j] + c[j,i] | j < i }
 a= (9, 3, 15, 12, 7, 4, 13, 6, 8)

0 1 2 3 4 5 6 7 8 9
L = (0, 1, 1, 2, 2, 2, 2, 3, 3, 4)
 extragerea solutiei:
 s[4] = 9
 s[3] = 8
 s[2] = 6
 s[1] = 2
 s[0] = 0
 timp de executie: O(n2)
 spatiu suplimentar: O(n)
Programare dinamica – prezentare formala
 Modelul matematic
probleme de optim
• functia obiectiv: optim R(x1, ..., xn)
• restrictii: g(x1, ..., xn) ? 0
decizie: d: s  s’
unei stari s asociem o valoare z si o functie f(z) a.i. daca s
corespunde starii initiale atunci f(z) = optim R(x1, ..., xn)
politica: d1: s0  s1, d2: s1  s2, . . . , dn: sn-1  sn,
Programare dinamica – prezentare formala (cont.)
PO conduce la o relatie de recurenta:

• daca
– d: s  s’ (sau d: s’  s)
– z val. asociata lui s, T(z,y) val. asociata lui s’,
– H algoritmul care calculeaza f(z) conform lui d,
atunci, aplicind PO, obtinem
f(z) = optimy H(z, y, f(T(z,y)))
Addendum: Cea mai lunga subsecventa comuna -
problema
 instanta
 X = x1 ... xm
 Y = y1 ... yn
 iesire
 Z = z1 ... zk – cea mai lunga subsecventa comuna
 exemplu:
X = abeac
Y = aebcac
Z = abac
Cea mai lunga subsecventa comuna - model
 stare:
Xi = x1 x2 ... xi
Yj = y1 y2 ... yj
LCS(Xi, Yj)
 cazuri de baza:
LCS(X0, Yj), LCS(Xi, Y0)
 decizii posibile la evaluarea LCS(Xi, Yj)
 xi == yj atunci
• zk = xi = yj /\ Zk-1 este LCS(Xi-1, Yj-1)
 xi =/= yj /\ zk =/= xi atunci
• Zk este LCS(Xi-1, Yj)
 xi =/= yj /\ zk =/= yj atunci
• Zk este LCS(Xi, Yj-1)
Cea mai lunga subsecventa comuna – model (cont.)
 recurenta:
0 i  0 j  0

c [i, j ]  c[i  1, j  1]  1 i, j  0  xi  y j
max( c[i, j  1], c[i  1, j ]) i, j  0  x  y
 i j
A T C T G A T
 exemplu: 0 0 0 0 0 0 0 0
T 0 0 1 1 1 1 1 1
G 0 0 1 1 1 2 2 2
C 0 0 1 2 2 2 2 2
A 0 1 1 2 2 2 3 3
T 0 1 2 2 3 3 3 4
A 0 1 2 2 3 3 4 4

Programare Dinamica

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Programare Dinamica

Încărcat de

Drepturi de autor:

Formate disponibile

Paradigma Programare dinamica

 Prezentarea generala a paradigmei

 Tine minte! Rezolva subproblemele de la mic la mare si

 Pentru realizarea a p proiecte sunt disponibile r resurse.

c[1,1] c[2,0] c[3,1]

proiectul 1 proiectul 2 proiectul 3

function alocRes(G, ValOpt, D)

decizie: DMD(X{k})  DMD(X)

decizie: RUCSAC(j, X)  RUCSAC(j-1, ?)

 M = 10, p = (10, 30, 20), w = (3, 5, 6)

 fi este o functie in scara

 calculul lui Si din Si-1 se face in timpul |Si|

 consideram probleme pentru care intrarea pentru P este data ca

• nr. de biti pentru reprez. lui m este s  0

 ordinea operatiilor intr-o secventa optima nu are importanta

“armata”  “amata”  “camata”  “camara”

 exista o secventa optima in care sirurile intermediare au

 stare: DES[i,j] = determinarea distantei minime intre

( M(5,’r’), S(2), I(1,’c’) )

 distanta data de cea mai lunga subsecventa

 “matching” aproximativ peste siruri (aproximate string matching)

• calculul matricei se face pe coloane

 G. Myers. A fast Bit-Vector Algorithm for Approximate

 Scorej = m, Scorej = Scorej-1 + Δh[m,j]

Scorej = Scorej-1 + (1 if Phj[m]) – (1 if Mhj[m])

Phj[0] = Mhj[0] = 0 (*)

 calculul pe biti (a se vedea fig. 4)

 a = (9, 3, 15, 12, 7, 4, 13, 6, 8)

 subsecventa crescatoare = drum in G

 a= (9, 3, 15, 12, 7, 4, 13, 6, 8)

PO conduce la o relatie de recurenta:

S-ar putea să vă placă și