3 Cap3 - A

3.
Metode de calcul pentru optimizarea cu restricii

n cazul existenei unor restricii se folosesc att metode de calcul bazate pe transformri ale problemelor cu restricii n probleme far restricii, ct i metode specifice; n cadrul ambelor categorii de metode, o importan deosebit o au condiiile Kuhn-Tucker. Folosirea multiplicatorilor Lagrange pentru rezolvarea problemelor cu restricii de tip egalitate este ilustrat n paragraful 3.1, condiiile Kuhn-Tucker sunt enunate n paragraful 3.2, utilizarea funciilor de penalizare pentru rezolvarea problemelor cu restricii de tip egalitate i inegalitate este prezentat n paragraful 3.3, iar cele mai utilizate metode specifice de rezolvare a problemelor cu restricii sunt ilustrate n paragraful 3.4. 3.1. Folosirea multiplicatorilor Lagrange pentru rezolvarea problemelor de optim cu restricii de tip egalitate n cazul cutrii extremului (de exemplu, a maximului) unei funcii criteriu de n variabile f ( x) = f ( x1 , x 2 ,K , x n ) (3.1) cu m restricii de tip egalitate hi ( x) = hi ( x1 , x 2 , K , x n ) = 0 , (3.2)
* * * i = 1, 2, ..., m (cu m < n), se demonstreaz [Bri05] c punctul x1 , x 2 ,K, x n care maximizeaz funcia criteriu (3.1), cu respectarea restriciilor (3.2), poate fi obinut prin optimizarea (maximizarea) fr restricii a funciei
L (x, ) L ( x1 , x 2 , K , x n , 1 , 2 , K , m ) = f ( x1 , x 2 ,K , x n ) + i hi ( x1 , x 2 , K , x n ) (3.3)
i =1
Funcia L ( x1 , x 2 ,K, x n , 1 , 2 ,K, m ) este denumit funcie Lagrange (sau lagrangean), iar scalarii 1, 2, ... m sunt numii multiplicatori Lagrange [Bri05]. Extremul (n exemplul considerat n continuare, extremul este un maxim) funciei Lagrange se obine prin intermediul condiiilor (2.12) aplicate acestei funcii, respectiv L / x1 = 0 L / x 2 = 0 (3.4) .................... L / x n = 0 Condiiile (2.12) rmn valabile, ntruct se caut extremul fr restricii al funciei L ( x, ) . Metoda multiplicatorilor Lagrange rezolv deci probleme de optim cu restricii de tip egalitate prin transformarea lor n probleme de optim fr restricii, deci printr-o transformare TRE, menionat n paragraful 1.2.3. Pentru ilustrare, se consider [Cl79] maximizarea funciei criteriu din (1.29)
f ( x1 , x2 ) = f (r , l ) = r 2l ,
(3.5)
- reprezentnd volumul unui rezervor cilindric, unde r este raza, iar l este nlimea acestuia n condiiile restriciei care rezult din (1.30) respectiv h1 ( x1 , x2 ) = h1 (r , l ) = 2 r l + 2 r 2 S0 = 0. (3.6) Aplicnd (3.3) se obine L ( x1 , x2 , 1 ) = L (r , l , 1 ) = f ( x1 , x 2 ) + 1 h1 ( x1 , x 2 ) =
3-1
= f (r , l ) + 1h1 (r , l ) = r 2l + 1 (2 r l + 2 r 2 S0 ) .
(3.7)
Pentru gsirea valorilor optime ropt i lopt se anuleaz derivatele pariale ale funciei L ( x1 , x2 , 1 ) n raport cu x1 i x2, conform cu (3.4), rezultnd din (3.7):
L / x1 = L / r = 2 r l + 1 (2 l + 4 r ) = 0 L / x 2 = L / l = r + 1 2 r = 0
2
(3.8) (3.9) (3.10)
Din (3.9) se obine r = 2 1 iar din (3.8) rezult: r l + 1l + 2 1r = 0 , respectiv

l= 2 1r r + 1
(3.11)
nlocuind (3.10) n (3.11) se obine 4 2 1 l= = 4 1 , 1 din (3.10) i (3.12) rezultnd l = 2r , expresie care verific i relaia (1.17) dintre valorile optime. nlocuind (3.10) i (3.12) n restricia (3.6) se obine 162 + 82 S 0 , 1 1 de unde rezult valoarea multiplicatorului Lagrange:
1 = S0 24
(3.12)
(3.13)
(3.14)
ntruct raza r i nlimea l trebuie s satisfac i condiiile de pozitivitate (1.15), din (3.10) i (3.12) rezult c n (3.14) trebuie adoptat valoarea
1 = S0 24
S0 S0 , l opt = 4 24 24
(3.15)
care - prin nlocuire n (3.10) i (3.12) - asigur obinerea valorilor optime pozitive:
ropt = 2
(3.16)
Metoda multiplicatorilor Lagrange poate fi utilizat i n cazul restriciilor de tip inegalitate, cu condiia ca acestea s fie n prealabil aduse la forma unor restricii de tip egalitate; o asemenea schimbare a formei restriciilor poate fi obinut prin intermediul unor variabile auxiliare. Astfel, presupunnd c se urmrete maximizarea funciei criteriu f ( x1 , x 2 ,K, x n ) cu restriciile inegalitate de forma (1.36) g j ( x1 , x 2 ,K , x n ) 0 j = 1, 2, ..., p, (3.17) aceste restricii pot fi transformate n restricii egalitate prin introducerea unor variabile auxiliare kj (j = 1, 2, ..., p), scriind p egaliti de forma
gj + k2 = 0, j
(3.18)
acestea reprezentnd restriciile egalitate corespunztoare restriciilor inegalitate din (3.17).
3-2
Din (3.17) i (3.18) se constat c satisfacerea egalitilor (3.18) asigur i satisfacerea inegalitilor (3.17), ntruct k 2 > 0 dac k j 0 . j Restriciile egalitate (3.18) permit folosirea metodei multiplicatorilor Lagrange pentru gsirea optimului funciei criteriu. n ultimii ani a cptat o utilizare mai larg aa numita metod a lagrangeanului extins [Cl79], [Bri05] - menionat n paragraful 3.3 - n cadrul creia se combin principiul multiplicatorilor Lagrange cu principiul funciilor de penalizare, expuse n paragraful 3.3.
3.2. Condiiile Kuhn-Tucker
Condiiile Kuhn-Tucker au o importan deosebit n cazul optimizrii cu restricii de tip inegalitate. n prezena acestui tip de restricii, relaia (2.12) - f ( x * ) f ( x * ) = 0 - poate s nu mai fie valabil, dup cum va rezulta i din exemplul care urmeaz (Fig. 3.1); presupunnd c extremul este un minim, condiiile Kuhn-Tucker afirm c prin deplasare din punctul de optim x * n orice direcie admisibil - respectiv n orice direcie care nu determin nclcarea vreunei restricii - funcia criteriu nu poate descrete. Evident, dac din x * ar exista vreo direcie admisibil n care funcia criteriu ar descrete, atunci x * nu ar mai fi punctul de minim. Acest paragraf nu i propune s prezinte demonstraia condiiilor Kuhn-Tucker, ci numai s ilustreze formularea lor prin intermediul exemplului din [Cl79]; demonstraia poate fi gsit n [Las75], [Bri05]. Presupunnd c se cere minimizarea funciei criteriu f ( x) = f ( x1 , x 2 ) = ( x1 2) 2 + ( x 2 1) 2 cu restriciile g1 ( x1 , x2 ) = x12 x2 0 i g 2 ( x1 , x2 ) = x1 + x2 2 0 , (3.19) (3.20) (3.21)
n Fig. 3.1 sunt reprezentate n planul ( x1 , x2 ) curbele circulare de nivel - obinute ca n Fig. 2.2 - precum i parabola P i dreapta D, corespunztoare cazurilor limit ale restriciilor (3.20) i (3.21), respectiv corespunztoare egalitilor x12 x 2 = 0 x1 + x 2 2 = 0 , care pot fi puse sub forma: x 2 = x12 , x 2 = x1 + 2 . (3.22) (3.23) (3.24) (3.25)
Dreapta D este determinat de intersecia dintre planul ( x1 , x2 ) i planul prin care este reprezentat n 3 funcia g 2 ( x1 , x2 ) = x1 + x2 2 , (3.26) iar parabola P este determinat de intersecia dintre planul ( x1 , x2 ) i suprafaa prin care este reprezentat n 3 funcia g1 ( x1 , x2 ) = x12 x2 . Din (3.20) rezult c punctele care corespund condiiei x 2 x12 (3.27) (3.28)
3-3
constituie domeniul admisibil (interiorul parabolei) n planul ( x1 , x2 ) , iar punctele care corespund condiiei x 2 < x12 (3.29) corespund domeniului interzis (exteriorul parabolei), ntruct ncalc restricia (3.20). n mod analog domeniul x 2 > x1 + 2 , reprezentnd domeniul interzis de restricia (3.21) este plasat deasupra dreptei D, domeniul admisibil fiind plasat sub dreapta D.
x2 2 x2 = -x1 + 2 D
C1 C2 C3 C4
' g 2 ( x* )
C5 C6
M
f ( x * )
1 Domeniul admisibil
f ( x * ) g1' ( x * )
x2 = x12
P T 0 1 2 x1 x2 = 2x1 - 1
Fig. 3.1
Rezult c din punct de vedere al respectrii ambelor restricii (3.20) i (3.21), domeniul admisibil este cel precizat n Fig. 3.1, incluznd i poriunile aferente din parabola P i dreapta D. ntruct valorile funciei criteriu f ( x1 , x 2 ) scad dinspre curba circular, de nivel C1 spre curba C6, pentru a atinge valoarea zero n punctul de minim M, cu coordonatele x1 = 2, x2 = 1, se constat, c - n condiiile respectrii restriciilor - punctul care asigur cea mai mic valoare a funciei criteriu este punctul E, cu coordonatele x1 = 1, x2 = 1 (de la interseca dreptei D cu parabola P), acesta reprezentnd soluia x * a problemei de optimizare cu restricii. Dup cum s-a menionat i la nceputul acestui paragraf, se constat c n E nu are loc relaia (2.12), care este valabil numai n punctul M, ns acesta nu aparine domeniului admisibil. n Fig. 3.1 sunt reprezentai vectorul gradientului f ( x * ) n punctul E (vector perpendicular pe tangenta la curba circular, de nivel C2, deci avnd direcia razei cercului i sensul spre curbele de nivel cu valori cresctoare C1) i vectorul - f ( x * ) , de sens opus, prelungirea acestui vector trecnd prin punctul M. Observaie. Din orice punct considerat (fcnd abstracie de existena restriciilor) prelungirea oricrui vector - f ( x * ) trece prin minimul fr restricii M, datorit faptului c curbele de nivel sunt circulare. Acest considerent conduce la concluzia c n cazul unor curbe de nivel circulare, metoda celei mai mari pante, cu alegerea direciei iniiale p = - f (x) din
3-4
(2.26), conduce ntr-un singur pas pn la minimul fr restricii, ntruct prin deplasarea pe aceast direcie se ajunge n minim i nu trebuie cutat o alt direcie. Pe aceast baz a fost elaborat metoda gradientului conjugat scalat [Cl79], care este indicat atunci cnd prin operaii de modificare a scalei (operaii de scalare) curbele de nivel de anumite forme (de exemplu, elipse) pot fi transformate n cercuri. ' Tot n Fig. 3.1 sunt reprezentai i vectorii gradient ai restriciilor g1' ( x * ) i g 2 ( x * ) , ultimul fiind perpendicular n E pe dreapta D i avnd sensul spre zona admisibil (deci sensul creterii valorilor funciei g 2 ( x1 , x 2 ) = x1 + x 2 2 ), iar primul fiind perpendicular n E pe tangenta T la parabola P (ecuaia tangentei T n E la curba x 2 = x12 fiind x 2 = 2 x1 1 ) avnd sensul spre zona admisibil, respectiv sensul creerii funciei g1 ( x1 , x2 ) = x12 x2 . Esena condiiilor Kuhn-Tucker const n exprimarea faptului c vectorul - f ( x * ) ' trebuie s se gseasca ntre vectorii g1' ( x * ) i g 2 ( x * ) - folosind o formulare mai riguroas: ' trebuie s se gseasc n conul convex generat de vectorii g1' ( x * ) i g 2 ( x * ) - respectiv trebuie s reprezinte o combinaie liniar a acestor vectori, de forma ' f ( x * ) = 1 g1' ( x * ) + 2 g 2 ( x * ) (3.30) unde 1 0, 2 0 reprezint multiplicatorii Lagrange ai restriciilor. ntr-adevr, din punct de vedere al restriciei g1(x), direciile admisibile p sunt cele care fac unghiuri mai mari de 90 cu vectorul g1' ( x * ) , iar din punct de vedere al restriciilor g2(x), ' direciile admisibile p sunt cele care fac unghiuri mai mari de 90 cu vectorul g 2 ( x * ) , ntruct aceti vectori sunt perpendiculari pe tangenta T i dreapta D i deci orice direcie care ' face unghiuri pn la 90 cu vectorii g1' ( x * ) sau g 2 ( x * ) conduce la deplasri spre zona interzis, neadmisibil; ca urmare, numai direciile p care fac unghiuri mai mari de 90 cu ' ambii vectori g1' ( x * ) i g 2 ( x * ) reprezint direcii admisibile. Conform cu (2.13), pentru ca vectorul direciei admisibile p s fac unghiuri mai mari ' de 90 cu vectorii g1' ( x * ) i g 2 ( x * ) sunt necesare condiiile g1' ( x * ) T p < 0 ;
' g 2 ( x * )T p < 0 .
(3.31)
Pe de alt parte, din relaia (2.13) a rezultat c pentru ca o direcie p s asigure descreterea funciei criteriu f(x) este necesar ca vectorul p s fac un unghi mai mic de 90 cu vectorul gradient f x' . Ca urmare, dac sunt respectate condiiile Kuhn-Tucker i vectorul - f ( x * ) se gsete ' ntre vectorii g1' ( x * ) i g 2 ( x * ) - conform relaiei (3.30) i Fig. 3.1 - atunci nu va exista nici o direcie p care s fac un unghi de pn la 90 cu vectorul - f ( x * ) i n acelai timp s poat ' face unghiuri de peste 90 cu ambii vectori g1' ( x * ) i g 2 ( x * ) (deoarece orice direcie p care ' face unghiuri mai mari de 90 cu ambii vectori g1' ( x * ) i g 2 ( x * ) va face un unghi mai mare de 90 i cu vectorul - f ( x * ) , aflat ntre cei doi vectori), deci nu va exista nici o direcie admisibil care s conduc la descreterea funciei criteriu: n consecin, punctul E reprezint punctul de optim (minim) cu restricii. Trecnd la cazul general n-dimensional n prezena a r restricii, condiia (3.30) capt aspectul
f ( x * ) = i g i' ( x * )
i =1 r
(3.32)
cu i 0 .
3-5
' Condiia ca vectorul - f ( x * ) s se gseasc ntre vectorii g1' ( x * ) i g 2 ( x * ) este evident ' echivalent cu condiia ca vectorul f ( x * ) s se gseasc ntre vectorii - g1' ( x * ) i - g 2 ( x * ) , deci condiia general (3.32) poate fi pus i sub forma
f ( x * ) = i [ g i' ( x * )] ,
i =1
(3.33)
cu i 0 . Pe lng relaia (3.32) sau (3.33), formularea condiiilor Kuhn-Tucker include i o relaie de forma i g i ( x* ) = 0 (3.34) explicat n [Las75]. Condiiile Kuhn-Tucker sunt folosite n numeroase metode de optimizare cu restricii pentru generarea de direcii de deplasare spre optim (de exemplu, n metoda proieciei gradientului, menionat n paragraful 3.4) sau pentru stabilirea unor criterii de oprire a cutrii atunci cnd verificarea condiiilor Kuhn-Tucker atest atingerea optimului.
3.3. Folosirea funciilor de penalizare pentru optimizarea cu restricii
Metoda funciilor de penalizare permite transformarea problemelor de optimizare cu restricii egalitate i inegalitate n probleme de optimizare fr restricii. Astfel, presupunnd c se urmrete minimizarea funciei criteriu f(x), cu restriciile (3.35) hi ( x) = 0 , i = 1, 2, ..., m i (3.36) g j ( x) 0 , j = 1, 2, ..., r - restricii de tipul (1.33) i (1.35) - se poate obine o variant a funciilor de penalizare transformnd n prealabil restriciile inegalitate (3.36) n restricii egalitate cu ajutorul unor variabile auxiliare kj, scriind restriciile egalitate echivalente
l j ( x) = g j ( x) k 2 = 0 , j
(3.37)
(transformare analoag cu cea din (3.18), intervenind ns semnul minus datorit deosebirii dintre (3.17) i (3.36), respectiv dintre caracterul restriciilor inegalitate) i cutnd apoi minimul fr restricii al funciei ( x, c) = f ( x) + ci [hi ( x)] + c j [l j ( x)] .
i =1 j =1 m r
(3.38)
unde funciile [hi ( x)] i [l j ( x)] sunt funcii de penalizare, care trebuie s satisfac anumite condiii, iar ci > 0 i c j > 0 sunt factori de ponderare. n cel mai simplu caz se poate adopta [hi ( x)] = [hi ( x)]2
[l j ( x)] = [l j ( x)]
2
(3.39) (3.40)
r
i relaia (3.38) capt forma ( x, c) = f ( x) + ci [hi ( x)]2 + c j [l j ( x)]2

i =1 j =1 m
(3.41)
Din (3.41) se constat c dac restriciile (3.35) i (3.37) sunt satisfcute - ceea ce nseamn c sunt satisfcute restriciile iniiale (3.35) i (3.36) - atunci funciile ( x, c) i f(x) devin egale i deci minimizarea funciei ( x, c) asigur minimul funciei criteriu f(x). Dac unele din restriciile (3.35) sau (3.37) sunt nclcate i dac sunt alese valori
3-6
suficient de mari pentru factorii de ponderare ci i cj atunci, chiar la abateri mici ale funciilor hi (x) i l j (x) de la valoarea zero rezult creteri mari ale valorii funciei ( x, c) - deci nu se poate obine un minim al acestei funcii - i prin urmare procesul de cutare este forat s revin n domeniul n care restriciile sunt respectate. O variant a funciilor de penalizare utilizat relativ frecvent a fost elaborat de Fiacco i McCormick [Cl79]. Considernd minimizarea funciei criteriu f(x), cu restriciile (3.42) g i ( x) 0 , se caut printr-un proces secvenial minimizarea fr restricii a funciei m 1 ( x, ) = f ( x) + i =1 g i ( x )
(3.43)
unde procesul de minimizare se repet pentru diferite valori descresctoare ale factorului (1 > 2 > L > k > 0) . Din (3.43) se constat ca minimul functiei ( x, ) va rezulta n interiorul domeniului admisibil delimitat de restriciile (3.42), ntruct pe frontiera acestui domeniu se obine gi ( x) = 0 i funcia ( x, ) tinde s creasc spre infinit, deci nu poate rezulta un minim. ntruct metoda presupune apropierea de optim din interiorul domeniului admisibil delimitat de restricii, punctul iniial al procesului secvenial trebuie s se gseasc n interiorul domeniului admisibil; cutarea unui punct din domeniul admisibil este prezentat n [Bri05]. Datorit caracterului secvenial, metoda a fost denumit "tehnica de minimizare secvenial fr restricii" (n limba engleza: sequential unconstrained minimization technique SUMT). n ultimii ani, metoda funciilor de penalizare a fost combinat cu metoda multiplicatorilor Lagrange n cadrul metodei lagrangeanului extins [Cl79]; pentru minimizarea unei funcii criteriu f(x) cu restriciile (3.44) g j ( x) 0 , j = 1, 2, ..., r se folosesc variabile auxiliare i se transform, problema dat, ntr-o problem de minimizare a funciei f(x) cu restriciile echivalente
l j ( x) = g j ( x) + k 2 = 0 , j
(3.45)
r
optimul fiind obinut prin minimizarea fr restricii a funciei

L ( x, k , , c) = f ( x) + j l j ( x) + c [l j ( x)] =
j =1 j =1 r
= f ( x) + j [g j ( x) + k 2 ] + c [g j ( x) + k 2 ] j j
j =1 j =1
(3.46)
aceast funcie reprezentnd lagrangeanul extins. Functia este o funcie de penalizare i din (3.46) se constat c n expresia lagrangeanului extins intervin att termeni corespunztori metodei multiplicatorilor Lagrange - de tipul celor din (3.3) - ct i termeni corespunztori funciilor de penalizare, de tipul celor din (3.38).
3.4. Metode specifice de optimizare cu restricii
Metodele de optimizare cu restricii menionate n acest paragraf sunt denumite specifice n sensul c nu fac apel la transformri ale problemelor de optimizare cu restricii n probleme de optimizare fr restricii. Principalele metode specifice se bazeaz pe generarea direciilor admisibile, respectiv a
3-7
direciilor caracterizate de faptul c efectuarea unor deplasri mici nu ncalc restriciile. Dac o astfel de deplasare asigur i o apropiere de extrem (de exemplu, asigur micorarea funciei criteriu n cazul cutrii unui minim), atunci direcia admisibil este o direcie admisibil i utilizabil. Cele mai frecvent folosite metode bazate pe generarea direciilor admisibile sunt cele elaborate de Zoutendijk i de Rosen. n cadrul metodei Zoutendijk [Cl79], pentru minimizarea funciei criteriu f(x) cu restricii de forma (3.47) g j ( x) 0 , j = 1, 2, ..., r se genereaz direcii admisibile p, care - conform celor menionate n paragraful 3.2 - trebuie s fac unghiuri mai mari de 90 cu toi gradienii restriciilor g i' ( x) , respectiv trebuie s satisfac relaii de forma (3.31): g i' ( x) T p < 0 , i = 1, 2, ..., r. (3.48) Pe de alt parte, pentru ca direciile admisibile s fie i utilizabile, ele trebuie s asigure descreterea funciei criteriu f(x), deci trebuie s satisfac o condiie de forma (2.13) f xT p f ( x) T p < 0 . (3.49) Ca urmare, metoda include un algoritm care la fiecare iteraie selecteaz o direcie admisibil i utilizabil, asigurnd satisfacerea ambelor relaii (3.48) i (3.49), deci conducnd totodat la descreterea funciei criteriu i la deprtarea de graniele domeniilor interzise, fixate prin restriciile (3.47). n cadrul metodei Rosen [Cl79], direciile admisibile sunt obinute prin intermediul utilizrii condiiilor Kuhn-Tucker, care intervin i n criteriul de oprire a procesului de cutare la atingerea optimului. Metoda este indicat ndeosebi pentru cazul restriciilor liniare g j ( x) 0 , j = 1, 2, ..., r, (3.50) care pot fi puse sub forma
aT x b j 0 , j
(3.51) (3.52)
respectiv
aT x b j . j
Ecuaiile care corespund limitei domeniilor admisibile definite de restriciile (3.52) au aspectul a T x = b j i corespund unor hiperplane. j Direciile de cutare sunt generate iterativ prin proiecia vectorului - f ( x k ) pe intersecia hiperplanelor care trec prin punctul curent xk, iar dac prin xk nu trec asemenea hiperplane (cnd punctul x se gsete n interiorul domeniului admisibil) direcia deplasrii este constituit chiar de gradientul cu semn schimbat - f ( x k ) . Datorit procedeului de generare a direciilor, metoda este denumit metoda proieciei gradientului.
3.5. Folosirea condiiilor Karush-Kuhn-Tucker pentru optimizarea cu restricii
Pentru rezolvarea problemelor de optimizare convexe cu restricii de tip inegalitate se poate folosi metoda Karush-Kuhn-Tucker (KKT) [Bri05]. Aceast metod aparine metodelor de programare neliniar i ofer un optim global n domeniul admisibil al funciei criteriu corespunztoare problemei formulate. Formularea problemei. Fie x un punct din spaiul n i f i : U n ( x, ) ,
3-8
i = 0,1,K, m , funcii continue de n variabile definite pe o sfer deschis cu centrul n x , astfel nct f i ( x) 0 , i = 1,K, m . S se determine minimul funciei f, cu restriciile f i ( x) 0 , i = 1,K, m . Soluia problemei utilizeaz metoda multiplicatorilor Lagrange i este dat de: Teorema Karush-Kuhn-Tucker. Se definete funcia L (x, ) = L ( x1 , x2 ,K, xn , 0 , 1 , 2 ,K, m )
= i f i ( x) , cu = ( 0 , 1 , 2 ,K, m )
i =0 m
(3.53)
numit funcie Lagrange ataat problemei formulate, n care i , i = 0,1,K, m sunt multiplicatorii Lagrange. Presupunem c toate funciile f i (x) , i = 1,K, m sunt difereniabile n x . Condiiile Kuhn-Tucker, respectiv Karush-Kuhn-Tucker rmn valabile n punctul x pentru o selecie nenul a multiplicatorilor Lagrange , cu 0 0 , dac sunt ndeplinite urmtoarele condiii: (a) L x ( x, ) = 0T (condiia Lagrange de staionaritate); n (b) i 0 , i = 1,K, m (condiiile de ne-negativitate); (c) i f i ( x) = 0 , i = 1,K, m (condiiile de staionaritate complementar lips de energie) Observaie. Diferena esenial fa de condiiile Lagrange const n ne-negativitatea multiplicatorilor Lagrange. Pentru o condiie de staionaritate complementar, de exemplu a i a condiie, presupune dou cazuri: fie i = 0 , fie f i ( x) = 0 . Rezult astfel un total de 2m cazuri. nainte de a prezenta suficiena condiiilor KKT formulate mai sus, precizm c un punct x n se numete punct Slater dac f i ( x ) < 0 , i = 1,K, m .
Suficiena condiiilor KKT. (i) Condiiile KKT sunt suficiente pentru optimalitate, cu condiia ca 0 = 1 . Mai exact, dac condiiile KKT sunt valabile ntr-un punct x pentru o selecie a multiplicatorilor Lagrange , cu 0 = 1 , atunci x este un punct de minim. (ii) Presupunem c exist un punct Slater. Dac condiiile KKT sunt valabile pentru o selecie a multiplicatorilor Lagrange , atunci 0 nu poate fi zero.
Pentru claritate, n cele ce urmeaz vom prezenta cteva exemple de aplicare a teoremei KKT.
Exemplul 3.1. S se gseasc punctul ( x1 , x2 ) cel mai apropiat de punctul (2, 3) cu condiiile ca: (a) suma coodonalelor acestuia s nu depeasc valoarea 2, (b) valoarea absolut a primei coordonate s nu depeasc valoarea 2. Soluie. Problema poate fi modelat ca o problem de minimizare cu restricii de tip inegalitate, astfel: s se minimizeze funcia f ( x) = ( x1 2) 2 + ( x2 3) 2 cu restriciile h1 ( x) = x1 + x2 2 0 , h2 ( x) = x12 4 0 . Pentru rezolvarea problemei utilizm teorema KKT. Definim funcia Lagrange L (x, ) = 0 ( x1 2) 2 + ( x2 3) 2 + 1 ( x1 + x2 2) + 2 ( x12 4)
(3.54)
n care vom considera 0 = 1 (Atenie, punctul (0, 0) este un punct Slater). Condiiile KKT: L / x1 = 2 ( x1 2) + 1 + 2 2 x1 = 0 L / x 2 = 2 ( x2 3) + 1 = 0
(3.55) (3.56)
3-9
1 , 2 0 1 ( x1 + x2 2) = 0
2 ( x12 4) = 0
(3.57) (3.58) (3.59)
Cazul 1: constrngerile impuse nu sunt etane, adic x1 + x2 2 < 0 i x12 4 < 0 . n aceast situaie condiiile KKT anterioare se rescriu sub forma: 1 = 2 = 0 , 2 ( x1 2) = 0 , 2 ( x2 3) = 0 din care rezult punctul x1 = 2 , x2 = 3 care ns nu este un punct admisibil, ntruct nu satisface condiia x1 + x2 2 0 . Cazul 2: numai a doua constrngere este etan, adic x1 + x2 2 < 0 i x12 4 0 . n aceast situaie condiiile KKT definite mai sus se rescriu sub forma: 1 = 0 , 2 0 , x12 4 = 0 , 2 ( x2 3) = 0 , 2 ( x1 2) + 2 2 x1 = 0 din care rezult punctul x1 = 2 , x2 = 3 care ns, ca i n cazul 1, nu este un punct admisibil. Cazul 3: numai prima constrngere este etan, adic x1 + x2 2 0 i x12 4 < 0 . n aceast situaie condiiile KKT definite mai sus se rescriu sub forma: 1 0 , 2 = 0 , x1 + x2 2 = 0 , 2 ( x1 2) + 1 = 0 , 2 ( x2 3) + 1 = 0 , din care rezult punctul x1 = 1 / 2 , x2 = 3 / 2 , cu 1 = 3 . Acesta este un punct admisibil (satiface * * restriciile impuse) i reprezint un punct de optim global. Deci, x1 = 1 / 2 , x2 = 3 / 2 , pentru care f min = f (1 / 2, 3 / 2) = 9 / 2. La acest pas ne putem opri, deoarece am gsit o soluie care este unic. Unicitatea soluiei rezult din convexitatea strict a funciei obiectiv. Condiiile KKT sunt satisfcute pentru urmtoarele valori ale multiplicatorilor Lagrange: 0 = 1 , 1 = 3 , 2 = 0 . Exemplul 3.2. S se gseasc punctul ( x1 , x2 ) care este cel mai apropiat de punctul de coordonare (2, 3) cu condiiile ca: (a) valoarea primei coordonate x1 s fie cel puin 1, (b) punctul ( x1 , x2 ) se afl pe un cerc cu centrul n origine i de raz 2. Soluie. Problema poate fi modelat ca o problem de minimizare cu restricii de tip inegalitate, astfel: s se minimizeze funcia f ( x) = ( x1 2) 2 + ( x2 3) 2 cu restriciile 2 h1 ( x) = x12 + x2 4 0 , h2 ( x) = 1 x1 0 . Pentru rezolvarea problemei utilizm Teorema KKT. Definim funcia Lagrange
2 L (x, ) = 0 ( x1 2) 2 + ( x2 3) 2 + 1 ( x12 + x2 4) + 2 (1 x1 )
(3.60)
n care vom considera 0 = 1 (Atenie, punctul (3/2, 0) este un punct Slater). Condiiile KKT: L / x1 = 2 ( x1 2) + 2 1 x1 2 = 0 L / x 2 = 2 ( x2 3) + 2 1 x2 = 0 1 , 2 0 2 1 ( x12 + x2 4) = 0 2 (1 x1 ) = 0
(3.61) (3.62) (3.63) (3.64) (3.65)
2 Cazul 1: constrngerile impuse nu sunt etane, adic x12 + x2 4 < 0 i 1 x1 < 0 . n aceast situaie condiiile KKT anterioare se rescriu sub forma: 1 = 2 = 0 , 2 ( x1 2) = 0 , 2 ( x2 3) = 0
3 - 10
din care rezult punctul x1 = 2 , x2 = 3 care ns nu este un punct admisibil, ntruct nu 2 satisface restricia x12 + x2 4 < 0 . 2 Cazul 2: numai a doua constrngere este etan, adic x12 + x2 4 < 0 i 1 x1 0 . n aceast situaie, condiiile KKT definite mai sus se rescriu sub forma: 1 = 0 , 2 0 , 1 x1 = 0 , 2 ( x2 3) = 0 , 2 ( x1 2) 2 = 0 din care rezult punctul x1 = 1 , x2 = 3 , 2 = 2 care ns, ca i n cazul 1, nu este un punct admisibil i mai mult, 2 = 2 < 0 . 2 Cazul 3: numai prima constrngere este etan, adic x12 + x2 4 = 0 i 1 x1 < 0 . n aceast situaie condiiile KKT definite mai sus se rescriu sub forma: 2 1 0 , 2 = 0 , x12 + x2 4 = 0 , 2 ( x1 2) + 2 1 x1 = 0 , 2 ( x2 3) + 2 1 x2 = 0 , din care rezult punctul x1 = 4 / 13 , x2 = 6 / 13 , cu 1 = ( 13 2) / 2 > 0 . Acesta este un punct admisibil (satiface restriciile impuse) i reprezint un punct de optim global. Deci, * * x1 = 4 / 13 , x2 = 6 / 13 , pentru care f min = f (4 / 13 , 6 / 13 ) = ( 13 2) 2 . Condiiile KKT sunt satisfcute pentru urmtoarele valori ale multiplicatorilor Lagrange: 0 = 1 , 1 = ( 13 2) / 2 > 0 , 2 = 0 . Observaie. Se putea merge i pe intuiie, n sensul c punctul cutat trebuie s se 2 gseasc pe cercul x12 + x2 4 = 0 , iar coordonata x1 s satisfac condiia 1 x1 < 0 , care de fapt reprezint cazul 3 prezentat mai anterior.
3 - 11

3 Cap3 - A

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

3 Cap3 - A

Încărcat de

Drepturi de autor:

Formate disponibile

3.

Metode de calcul pentru optimizarea cu restricii

(3.8) (3.9) (3.10)

Din (3.9) se obine r = 2 1 iar din (3.8) rezult: r l + 1l + 2 1r = 0 , respectiv

acestea reprezentnd restriciile egalitate corespunztoare restriciilor inegalitate din (3.17).

i relaia (3.38) capt forma ( x, c) = f ( x) + ci [hi ( x)]2 + c j [l j ( x)]2

optimul fiind obinut prin minimizarea fr restricii a funciei

(3.57) (3.58) (3.59)

(3.61) (3.62) (3.63) (3.64) (3.65)

S-ar putea să vă placă și