Sunteți pe pagina 1din 11

3.

Metode de calcul pentru optimizarea cu restricii


n cazul existenei unor restricii se folosesc att metode de calcul bazate pe transformri ale problemelor cu restricii n probleme far restricii, ct i metode specifice; n cadrul ambelor categorii de metode, o importan deosebit o au condiiile Kuhn-Tucker. Folosirea multiplicatorilor Lagrange pentru rezolvarea problemelor cu restricii de tip egalitate este ilustrat n paragraful 3.1, condiiile Kuhn-Tucker sunt enunate n paragraful 3.2, utilizarea funciilor de penalizare pentru rezolvarea problemelor cu restricii de tip egalitate i inegalitate este prezentat n paragraful 3.3, iar cele mai utilizate metode specifice de rezolvare a problemelor cu restricii sunt ilustrate n paragraful 3.4. 3.1. Folosirea multiplicatorilor Lagrange pentru rezolvarea problemelor de optim cu restricii de tip egalitate n cazul cutrii extremului (de exemplu, a maximului) unei funcii criteriu de n variabile f ( x) = f ( x1 , x 2 ,K , x n ) (3.1) cu m restricii de tip egalitate hi ( x) = hi ( x1 , x 2 , K , x n ) = 0 , (3.2)

* * * i = 1, 2, ..., m (cu m < n), se demonstreaz [Bri05] c punctul x1 , x 2 ,K, x n care maximizeaz funcia criteriu (3.1), cu respectarea restriciilor (3.2), poate fi obinut prin optimizarea (maximizarea) fr restricii a funciei

L (x, ) L ( x1 , x 2 , K , x n , 1 , 2 , K , m ) = f ( x1 , x 2 ,K , x n ) + i hi ( x1 , x 2 , K , x n ) (3.3)
i =1

Funcia L ( x1 , x 2 ,K, x n , 1 , 2 ,K, m ) este denumit funcie Lagrange (sau lagrangean), iar scalarii 1, 2, ... m sunt numii multiplicatori Lagrange [Bri05]. Extremul (n exemplul considerat n continuare, extremul este un maxim) funciei Lagrange se obine prin intermediul condiiilor (2.12) aplicate acestei funcii, respectiv L / x1 = 0 L / x 2 = 0 (3.4) .................... L / x n = 0 Condiiile (2.12) rmn valabile, ntruct se caut extremul fr restricii al funciei L ( x, ) . Metoda multiplicatorilor Lagrange rezolv deci probleme de optim cu restricii de tip egalitate prin transformarea lor n probleme de optim fr restricii, deci printr-o transformare TRE, menionat n paragraful 1.2.3. Pentru ilustrare, se consider [Cl79] maximizarea funciei criteriu din (1.29)

f ( x1 , x2 ) = f (r , l ) = r 2l ,

(3.5)

- reprezentnd volumul unui rezervor cilindric, unde r este raza, iar l este nlimea acestuia n condiiile restriciei care rezult din (1.30) respectiv h1 ( x1 , x2 ) = h1 (r , l ) = 2 r l + 2 r 2 S0 = 0. (3.6) Aplicnd (3.3) se obine L ( x1 , x2 , 1 ) = L (r , l , 1 ) = f ( x1 , x 2 ) + 1 h1 ( x1 , x 2 ) =

3-1

= f (r , l ) + 1h1 (r , l ) = r 2l + 1 (2 r l + 2 r 2 S0 ) .

(3.7)

Pentru gsirea valorilor optime ropt i lopt se anuleaz derivatele pariale ale funciei L ( x1 , x2 , 1 ) n raport cu x1 i x2, conform cu (3.4), rezultnd din (3.7):
L / x1 = L / r = 2 r l + 1 (2 l + 4 r ) = 0 L / x 2 = L / l = r + 1 2 r = 0
2

(3.8) (3.9) (3.10)

Din (3.9) se obine r = 2 1 iar din (3.8) rezult: r l + 1l + 2 1r = 0 , respectiv


l= 2 1r r + 1

(3.11)

nlocuind (3.10) n (3.11) se obine 4 2 1 l= = 4 1 , 1 din (3.10) i (3.12) rezultnd l = 2r , expresie care verific i relaia (1.17) dintre valorile optime. nlocuind (3.10) i (3.12) n restricia (3.6) se obine 162 + 82 S 0 , 1 1 de unde rezult valoarea multiplicatorului Lagrange:
1 = S0 24

(3.12)

(3.13)

(3.14)

ntruct raza r i nlimea l trebuie s satisfac i condiiile de pozitivitate (1.15), din (3.10) i (3.12) rezult c n (3.14) trebuie adoptat valoarea
1 = S0 24
S0 S0 , l opt = 4 24 24

(3.15)

care - prin nlocuire n (3.10) i (3.12) - asigur obinerea valorilor optime pozitive:
ropt = 2

(3.16)

Metoda multiplicatorilor Lagrange poate fi utilizat i n cazul restriciilor de tip inegalitate, cu condiia ca acestea s fie n prealabil aduse la forma unor restricii de tip egalitate; o asemenea schimbare a formei restriciilor poate fi obinut prin intermediul unor variabile auxiliare. Astfel, presupunnd c se urmrete maximizarea funciei criteriu f ( x1 , x 2 ,K, x n ) cu restriciile inegalitate de forma (1.36) g j ( x1 , x 2 ,K , x n ) 0 j = 1, 2, ..., p, (3.17) aceste restricii pot fi transformate n restricii egalitate prin introducerea unor variabile auxiliare kj (j = 1, 2, ..., p), scriind p egaliti de forma
gj + k2 = 0, j

(3.18)

acestea reprezentnd restriciile egalitate corespunztoare restriciilor inegalitate din (3.17).

3-2

Din (3.17) i (3.18) se constat c satisfacerea egalitilor (3.18) asigur i satisfacerea inegalitilor (3.17), ntruct k 2 > 0 dac k j 0 . j Restriciile egalitate (3.18) permit folosirea metodei multiplicatorilor Lagrange pentru gsirea optimului funciei criteriu. n ultimii ani a cptat o utilizare mai larg aa numita metod a lagrangeanului extins [Cl79], [Bri05] - menionat n paragraful 3.3 - n cadrul creia se combin principiul multiplicatorilor Lagrange cu principiul funciilor de penalizare, expuse n paragraful 3.3.
3.2. Condiiile Kuhn-Tucker

Condiiile Kuhn-Tucker au o importan deosebit n cazul optimizrii cu restricii de tip inegalitate. n prezena acestui tip de restricii, relaia (2.12) - f ( x * ) f ( x * ) = 0 - poate s nu mai fie valabil, dup cum va rezulta i din exemplul care urmeaz (Fig. 3.1); presupunnd c extremul este un minim, condiiile Kuhn-Tucker afirm c prin deplasare din punctul de optim x * n orice direcie admisibil - respectiv n orice direcie care nu determin nclcarea vreunei restricii - funcia criteriu nu poate descrete. Evident, dac din x * ar exista vreo direcie admisibil n care funcia criteriu ar descrete, atunci x * nu ar mai fi punctul de minim. Acest paragraf nu i propune s prezinte demonstraia condiiilor Kuhn-Tucker, ci numai s ilustreze formularea lor prin intermediul exemplului din [Cl79]; demonstraia poate fi gsit n [Las75], [Bri05]. Presupunnd c se cere minimizarea funciei criteriu f ( x) = f ( x1 , x 2 ) = ( x1 2) 2 + ( x 2 1) 2 cu restriciile g1 ( x1 , x2 ) = x12 x2 0 i g 2 ( x1 , x2 ) = x1 + x2 2 0 , (3.19) (3.20) (3.21)

n Fig. 3.1 sunt reprezentate n planul ( x1 , x2 ) curbele circulare de nivel - obinute ca n Fig. 2.2 - precum i parabola P i dreapta D, corespunztoare cazurilor limit ale restriciilor (3.20) i (3.21), respectiv corespunztoare egalitilor x12 x 2 = 0 x1 + x 2 2 = 0 , care pot fi puse sub forma: x 2 = x12 , x 2 = x1 + 2 . (3.22) (3.23) (3.24) (3.25)

Dreapta D este determinat de intersecia dintre planul ( x1 , x2 ) i planul prin care este reprezentat n 3 funcia g 2 ( x1 , x2 ) = x1 + x2 2 , (3.26) iar parabola P este determinat de intersecia dintre planul ( x1 , x2 ) i suprafaa prin care este reprezentat n 3 funcia g1 ( x1 , x2 ) = x12 x2 . Din (3.20) rezult c punctele care corespund condiiei x 2 x12 (3.27) (3.28)

3-3

constituie domeniul admisibil (interiorul parabolei) n planul ( x1 , x2 ) , iar punctele care corespund condiiei x 2 < x12 (3.29) corespund domeniului interzis (exteriorul parabolei), ntruct ncalc restricia (3.20). n mod analog domeniul x 2 > x1 + 2 , reprezentnd domeniul interzis de restricia (3.21) este plasat deasupra dreptei D, domeniul admisibil fiind plasat sub dreapta D.
x2 2 x2 = -x1 + 2 D

C1 C2 C3 C4
' g 2 ( x* )

C5 C6
M

f ( x * )
1 Domeniul admisibil

f ( x * ) g1' ( x * )

x2 = x12
P T 0 1 2 x1 x2 = 2x1 - 1

Fig. 3.1

Rezult c din punct de vedere al respectrii ambelor restricii (3.20) i (3.21), domeniul admisibil este cel precizat n Fig. 3.1, incluznd i poriunile aferente din parabola P i dreapta D. ntruct valorile funciei criteriu f ( x1 , x 2 ) scad dinspre curba circular, de nivel C1 spre curba C6, pentru a atinge valoarea zero n punctul de minim M, cu coordonatele x1 = 2, x2 = 1, se constat, c - n condiiile respectrii restriciilor - punctul care asigur cea mai mic valoare a funciei criteriu este punctul E, cu coordonatele x1 = 1, x2 = 1 (de la interseca dreptei D cu parabola P), acesta reprezentnd soluia x * a problemei de optimizare cu restricii. Dup cum s-a menionat i la nceputul acestui paragraf, se constat c n E nu are loc relaia (2.12), care este valabil numai n punctul M, ns acesta nu aparine domeniului admisibil. n Fig. 3.1 sunt reprezentai vectorul gradientului f ( x * ) n punctul E (vector perpendicular pe tangenta la curba circular, de nivel C2, deci avnd direcia razei cercului i sensul spre curbele de nivel cu valori cresctoare C1) i vectorul - f ( x * ) , de sens opus, prelungirea acestui vector trecnd prin punctul M. Observaie. Din orice punct considerat (fcnd abstracie de existena restriciilor) prelungirea oricrui vector - f ( x * ) trece prin minimul fr restricii M, datorit faptului c curbele de nivel sunt circulare. Acest considerent conduce la concluzia c n cazul unor curbe de nivel circulare, metoda celei mai mari pante, cu alegerea direciei iniiale p = - f (x) din

3-4

(2.26), conduce ntr-un singur pas pn la minimul fr restricii, ntruct prin deplasarea pe aceast direcie se ajunge n minim i nu trebuie cutat o alt direcie. Pe aceast baz a fost elaborat metoda gradientului conjugat scalat [Cl79], care este indicat atunci cnd prin operaii de modificare a scalei (operaii de scalare) curbele de nivel de anumite forme (de exemplu, elipse) pot fi transformate n cercuri. ' Tot n Fig. 3.1 sunt reprezentai i vectorii gradient ai restriciilor g1' ( x * ) i g 2 ( x * ) , ultimul fiind perpendicular n E pe dreapta D i avnd sensul spre zona admisibil (deci sensul creterii valorilor funciei g 2 ( x1 , x 2 ) = x1 + x 2 2 ), iar primul fiind perpendicular n E pe tangenta T la parabola P (ecuaia tangentei T n E la curba x 2 = x12 fiind x 2 = 2 x1 1 ) avnd sensul spre zona admisibil, respectiv sensul creerii funciei g1 ( x1 , x2 ) = x12 x2 . Esena condiiilor Kuhn-Tucker const n exprimarea faptului c vectorul - f ( x * ) ' trebuie s se gseasca ntre vectorii g1' ( x * ) i g 2 ( x * ) - folosind o formulare mai riguroas: ' trebuie s se gseasc n conul convex generat de vectorii g1' ( x * ) i g 2 ( x * ) - respectiv trebuie s reprezinte o combinaie liniar a acestor vectori, de forma ' f ( x * ) = 1 g1' ( x * ) + 2 g 2 ( x * ) (3.30) unde 1 0, 2 0 reprezint multiplicatorii Lagrange ai restriciilor. ntr-adevr, din punct de vedere al restriciei g1(x), direciile admisibile p sunt cele care fac unghiuri mai mari de 90 cu vectorul g1' ( x * ) , iar din punct de vedere al restriciilor g2(x), ' direciile admisibile p sunt cele care fac unghiuri mai mari de 90 cu vectorul g 2 ( x * ) , ntruct aceti vectori sunt perpendiculari pe tangenta T i dreapta D i deci orice direcie care ' face unghiuri pn la 90 cu vectorii g1' ( x * ) sau g 2 ( x * ) conduce la deplasri spre zona interzis, neadmisibil; ca urmare, numai direciile p care fac unghiuri mai mari de 90 cu ' ambii vectori g1' ( x * ) i g 2 ( x * ) reprezint direcii admisibile. Conform cu (2.13), pentru ca vectorul direciei admisibile p s fac unghiuri mai mari ' de 90 cu vectorii g1' ( x * ) i g 2 ( x * ) sunt necesare condiiile g1' ( x * ) T p < 0 ;
' g 2 ( x * )T p < 0 .

(3.31)

Pe de alt parte, din relaia (2.13) a rezultat c pentru ca o direcie p s asigure descreterea funciei criteriu f(x) este necesar ca vectorul p s fac un unghi mai mic de 90 cu vectorul gradient f x' . Ca urmare, dac sunt respectate condiiile Kuhn-Tucker i vectorul - f ( x * ) se gsete ' ntre vectorii g1' ( x * ) i g 2 ( x * ) - conform relaiei (3.30) i Fig. 3.1 - atunci nu va exista nici o direcie p care s fac un unghi de pn la 90 cu vectorul - f ( x * ) i n acelai timp s poat ' face unghiuri de peste 90 cu ambii vectori g1' ( x * ) i g 2 ( x * ) (deoarece orice direcie p care ' face unghiuri mai mari de 90 cu ambii vectori g1' ( x * ) i g 2 ( x * ) va face un unghi mai mare de 90 i cu vectorul - f ( x * ) , aflat ntre cei doi vectori), deci nu va exista nici o direcie admisibil care s conduc la descreterea funciei criteriu: n consecin, punctul E reprezint punctul de optim (minim) cu restricii. Trecnd la cazul general n-dimensional n prezena a r restricii, condiia (3.30) capt aspectul
f ( x * ) = i g i' ( x * )
i =1 r

(3.32)

cu i 0 .

3-5

' Condiia ca vectorul - f ( x * ) s se gseasc ntre vectorii g1' ( x * ) i g 2 ( x * ) este evident ' echivalent cu condiia ca vectorul f ( x * ) s se gseasc ntre vectorii - g1' ( x * ) i - g 2 ( x * ) , deci condiia general (3.32) poate fi pus i sub forma

f ( x * ) = i [ g i' ( x * )] ,
i =1

(3.33)

cu i 0 . Pe lng relaia (3.32) sau (3.33), formularea condiiilor Kuhn-Tucker include i o relaie de forma i g i ( x* ) = 0 (3.34) explicat n [Las75]. Condiiile Kuhn-Tucker sunt folosite n numeroase metode de optimizare cu restricii pentru generarea de direcii de deplasare spre optim (de exemplu, n metoda proieciei gradientului, menionat n paragraful 3.4) sau pentru stabilirea unor criterii de oprire a cutrii atunci cnd verificarea condiiilor Kuhn-Tucker atest atingerea optimului.
3.3. Folosirea funciilor de penalizare pentru optimizarea cu restricii

Metoda funciilor de penalizare permite transformarea problemelor de optimizare cu restricii egalitate i inegalitate n probleme de optimizare fr restricii. Astfel, presupunnd c se urmrete minimizarea funciei criteriu f(x), cu restriciile (3.35) hi ( x) = 0 , i = 1, 2, ..., m i (3.36) g j ( x) 0 , j = 1, 2, ..., r - restricii de tipul (1.33) i (1.35) - se poate obine o variant a funciilor de penalizare transformnd n prealabil restriciile inegalitate (3.36) n restricii egalitate cu ajutorul unor variabile auxiliare kj, scriind restriciile egalitate echivalente
l j ( x) = g j ( x) k 2 = 0 , j

(3.37)

(transformare analoag cu cea din (3.18), intervenind ns semnul minus datorit deosebirii dintre (3.17) i (3.36), respectiv dintre caracterul restriciilor inegalitate) i cutnd apoi minimul fr restricii al funciei ( x, c) = f ( x) + ci [hi ( x)] + c j [l j ( x)] .
i =1 j =1 m r

(3.38)

unde funciile [hi ( x)] i [l j ( x)] sunt funcii de penalizare, care trebuie s satisfac anumite condiii, iar ci > 0 i c j > 0 sunt factori de ponderare. n cel mai simplu caz se poate adopta [hi ( x)] = [hi ( x)]2
[l j ( x)] = [l j ( x)]
2

(3.39) (3.40)
r

i relaia (3.38) capt forma ( x, c) = f ( x) + ci [hi ( x)]2 + c j [l j ( x)]2


i =1 j =1 m

(3.41)

Din (3.41) se constat c dac restriciile (3.35) i (3.37) sunt satisfcute - ceea ce nseamn c sunt satisfcute restriciile iniiale (3.35) i (3.36) - atunci funciile ( x, c) i f(x) devin egale i deci minimizarea funciei ( x, c) asigur minimul funciei criteriu f(x). Dac unele din restriciile (3.35) sau (3.37) sunt nclcate i dac sunt alese valori
3-6

suficient de mari pentru factorii de ponderare ci i cj atunci, chiar la abateri mici ale funciilor hi (x) i l j (x) de la valoarea zero rezult creteri mari ale valorii funciei ( x, c) - deci nu se poate obine un minim al acestei funcii - i prin urmare procesul de cutare este forat s revin n domeniul n care restriciile sunt respectate. O variant a funciilor de penalizare utilizat relativ frecvent a fost elaborat de Fiacco i McCormick [Cl79]. Considernd minimizarea funciei criteriu f(x), cu restriciile (3.42) g i ( x) 0 , se caut printr-un proces secvenial minimizarea fr restricii a funciei m 1 ( x, ) = f ( x) + i =1 g i ( x )
(3.43)

unde procesul de minimizare se repet pentru diferite valori descresctoare ale factorului (1 > 2 > L > k > 0) . Din (3.43) se constat ca minimul functiei ( x, ) va rezulta n interiorul domeniului admisibil delimitat de restriciile (3.42), ntruct pe frontiera acestui domeniu se obine gi ( x) = 0 i funcia ( x, ) tinde s creasc spre infinit, deci nu poate rezulta un minim. ntruct metoda presupune apropierea de optim din interiorul domeniului admisibil delimitat de restricii, punctul iniial al procesului secvenial trebuie s se gseasc n interiorul domeniului admisibil; cutarea unui punct din domeniul admisibil este prezentat n [Bri05]. Datorit caracterului secvenial, metoda a fost denumit "tehnica de minimizare secvenial fr restricii" (n limba engleza: sequential unconstrained minimization technique SUMT). n ultimii ani, metoda funciilor de penalizare a fost combinat cu metoda multiplicatorilor Lagrange n cadrul metodei lagrangeanului extins [Cl79]; pentru minimizarea unei funcii criteriu f(x) cu restriciile (3.44) g j ( x) 0 , j = 1, 2, ..., r se folosesc variabile auxiliare i se transform, problema dat, ntr-o problem de minimizare a funciei f(x) cu restriciile echivalente
l j ( x) = g j ( x) + k 2 = 0 , j

(3.45)
r

optimul fiind obinut prin minimizarea fr restricii a funciei


L ( x, k , , c) = f ( x) + j l j ( x) + c [l j ( x)] =
j =1 j =1 r

= f ( x) + j [g j ( x) + k 2 ] + c [g j ( x) + k 2 ] j j
j =1 j =1

(3.46)

aceast funcie reprezentnd lagrangeanul extins. Functia este o funcie de penalizare i din (3.46) se constat c n expresia lagrangeanului extins intervin att termeni corespunztori metodei multiplicatorilor Lagrange - de tipul celor din (3.3) - ct i termeni corespunztori funciilor de penalizare, de tipul celor din (3.38).
3.4. Metode specifice de optimizare cu restricii

Metodele de optimizare cu restricii menionate n acest paragraf sunt denumite specifice n sensul c nu fac apel la transformri ale problemelor de optimizare cu restricii n probleme de optimizare fr restricii. Principalele metode specifice se bazeaz pe generarea direciilor admisibile, respectiv a
3-7

direciilor caracterizate de faptul c efectuarea unor deplasri mici nu ncalc restriciile. Dac o astfel de deplasare asigur i o apropiere de extrem (de exemplu, asigur micorarea funciei criteriu n cazul cutrii unui minim), atunci direcia admisibil este o direcie admisibil i utilizabil. Cele mai frecvent folosite metode bazate pe generarea direciilor admisibile sunt cele elaborate de Zoutendijk i de Rosen. n cadrul metodei Zoutendijk [Cl79], pentru minimizarea funciei criteriu f(x) cu restricii de forma (3.47) g j ( x) 0 , j = 1, 2, ..., r se genereaz direcii admisibile p, care - conform celor menionate n paragraful 3.2 - trebuie s fac unghiuri mai mari de 90 cu toi gradienii restriciilor g i' ( x) , respectiv trebuie s satisfac relaii de forma (3.31): g i' ( x) T p < 0 , i = 1, 2, ..., r. (3.48) Pe de alt parte, pentru ca direciile admisibile s fie i utilizabile, ele trebuie s asigure descreterea funciei criteriu f(x), deci trebuie s satisfac o condiie de forma (2.13) f xT p f ( x) T p < 0 . (3.49) Ca urmare, metoda include un algoritm care la fiecare iteraie selecteaz o direcie admisibil i utilizabil, asigurnd satisfacerea ambelor relaii (3.48) i (3.49), deci conducnd totodat la descreterea funciei criteriu i la deprtarea de graniele domeniilor interzise, fixate prin restriciile (3.47). n cadrul metodei Rosen [Cl79], direciile admisibile sunt obinute prin intermediul utilizrii condiiilor Kuhn-Tucker, care intervin i n criteriul de oprire a procesului de cutare la atingerea optimului. Metoda este indicat ndeosebi pentru cazul restriciilor liniare g j ( x) 0 , j = 1, 2, ..., r, (3.50) care pot fi puse sub forma
aT x b j 0 , j

(3.51) (3.52)

respectiv
aT x b j . j

Ecuaiile care corespund limitei domeniilor admisibile definite de restriciile (3.52) au aspectul a T x = b j i corespund unor hiperplane. j Direciile de cutare sunt generate iterativ prin proiecia vectorului - f ( x k ) pe intersecia hiperplanelor care trec prin punctul curent xk, iar dac prin xk nu trec asemenea hiperplane (cnd punctul x se gsete n interiorul domeniului admisibil) direcia deplasrii este constituit chiar de gradientul cu semn schimbat - f ( x k ) . Datorit procedeului de generare a direciilor, metoda este denumit metoda proieciei gradientului.
3.5. Folosirea condiiilor Karush-Kuhn-Tucker pentru optimizarea cu restricii

Pentru rezolvarea problemelor de optimizare convexe cu restricii de tip inegalitate se poate folosi metoda Karush-Kuhn-Tucker (KKT) [Bri05]. Aceast metod aparine metodelor de programare neliniar i ofer un optim global n domeniul admisibil al funciei criteriu corespunztoare problemei formulate. Formularea problemei. Fie x un punct din spaiul n i f i : U n ( x, ) ,

3-8

i = 0,1,K, m , funcii continue de n variabile definite pe o sfer deschis cu centrul n x , astfel nct f i ( x) 0 , i = 1,K, m . S se determine minimul funciei f, cu restriciile f i ( x) 0 , i = 1,K, m . Soluia problemei utilizeaz metoda multiplicatorilor Lagrange i este dat de: Teorema Karush-Kuhn-Tucker. Se definete funcia L (x, ) = L ( x1 , x2 ,K, xn , 0 , 1 , 2 ,K, m )
= i f i ( x) , cu = ( 0 , 1 , 2 ,K, m )
i =0 m

(3.53)

numit funcie Lagrange ataat problemei formulate, n care i , i = 0,1,K, m sunt multiplicatorii Lagrange. Presupunem c toate funciile f i (x) , i = 1,K, m sunt difereniabile n x . Condiiile Kuhn-Tucker, respectiv Karush-Kuhn-Tucker rmn valabile n punctul x pentru o selecie nenul a multiplicatorilor Lagrange , cu 0 0 , dac sunt ndeplinite urmtoarele condiii: (a) L x ( x, ) = 0T (condiia Lagrange de staionaritate); n (b) i 0 , i = 1,K, m (condiiile de ne-negativitate); (c) i f i ( x) = 0 , i = 1,K, m (condiiile de staionaritate complementar lips de energie) Observaie. Diferena esenial fa de condiiile Lagrange const n ne-negativitatea multiplicatorilor Lagrange. Pentru o condiie de staionaritate complementar, de exemplu a i a condiie, presupune dou cazuri: fie i = 0 , fie f i ( x) = 0 . Rezult astfel un total de 2m cazuri. nainte de a prezenta suficiena condiiilor KKT formulate mai sus, precizm c un punct x n se numete punct Slater dac f i ( x ) < 0 , i = 1,K, m .
Suficiena condiiilor KKT. (i) Condiiile KKT sunt suficiente pentru optimalitate, cu condiia ca 0 = 1 . Mai exact, dac condiiile KKT sunt valabile ntr-un punct x pentru o selecie a multiplicatorilor Lagrange , cu 0 = 1 , atunci x este un punct de minim. (ii) Presupunem c exist un punct Slater. Dac condiiile KKT sunt valabile pentru o selecie a multiplicatorilor Lagrange , atunci 0 nu poate fi zero.

Pentru claritate, n cele ce urmeaz vom prezenta cteva exemple de aplicare a teoremei KKT.
Exemplul 3.1. S se gseasc punctul ( x1 , x2 ) cel mai apropiat de punctul (2, 3) cu condiiile ca: (a) suma coodonalelor acestuia s nu depeasc valoarea 2, (b) valoarea absolut a primei coordonate s nu depeasc valoarea 2. Soluie. Problema poate fi modelat ca o problem de minimizare cu restricii de tip inegalitate, astfel: s se minimizeze funcia f ( x) = ( x1 2) 2 + ( x2 3) 2 cu restriciile h1 ( x) = x1 + x2 2 0 , h2 ( x) = x12 4 0 . Pentru rezolvarea problemei utilizm teorema KKT. Definim funcia Lagrange L (x, ) = 0 ( x1 2) 2 + ( x2 3) 2 + 1 ( x1 + x2 2) + 2 ( x12 4)

(3.54)

n care vom considera 0 = 1 (Atenie, punctul (0, 0) este un punct Slater). Condiiile KKT: L / x1 = 2 ( x1 2) + 1 + 2 2 x1 = 0 L / x 2 = 2 ( x2 3) + 1 = 0

(3.55) (3.56)

3-9

1 , 2 0 1 ( x1 + x2 2) = 0

2 ( x12 4) = 0

(3.57) (3.58) (3.59)

Cazul 1: constrngerile impuse nu sunt etane, adic x1 + x2 2 < 0 i x12 4 < 0 . n aceast situaie condiiile KKT anterioare se rescriu sub forma: 1 = 2 = 0 , 2 ( x1 2) = 0 , 2 ( x2 3) = 0 din care rezult punctul x1 = 2 , x2 = 3 care ns nu este un punct admisibil, ntruct nu satisface condiia x1 + x2 2 0 . Cazul 2: numai a doua constrngere este etan, adic x1 + x2 2 < 0 i x12 4 0 . n aceast situaie condiiile KKT definite mai sus se rescriu sub forma: 1 = 0 , 2 0 , x12 4 = 0 , 2 ( x2 3) = 0 , 2 ( x1 2) + 2 2 x1 = 0 din care rezult punctul x1 = 2 , x2 = 3 care ns, ca i n cazul 1, nu este un punct admisibil. Cazul 3: numai prima constrngere este etan, adic x1 + x2 2 0 i x12 4 < 0 . n aceast situaie condiiile KKT definite mai sus se rescriu sub forma: 1 0 , 2 = 0 , x1 + x2 2 = 0 , 2 ( x1 2) + 1 = 0 , 2 ( x2 3) + 1 = 0 , din care rezult punctul x1 = 1 / 2 , x2 = 3 / 2 , cu 1 = 3 . Acesta este un punct admisibil (satiface * * restriciile impuse) i reprezint un punct de optim global. Deci, x1 = 1 / 2 , x2 = 3 / 2 , pentru care f min = f (1 / 2, 3 / 2) = 9 / 2. La acest pas ne putem opri, deoarece am gsit o soluie care este unic. Unicitatea soluiei rezult din convexitatea strict a funciei obiectiv. Condiiile KKT sunt satisfcute pentru urmtoarele valori ale multiplicatorilor Lagrange: 0 = 1 , 1 = 3 , 2 = 0 . Exemplul 3.2. S se gseasc punctul ( x1 , x2 ) care este cel mai apropiat de punctul de coordonare (2, 3) cu condiiile ca: (a) valoarea primei coordonate x1 s fie cel puin 1, (b) punctul ( x1 , x2 ) se afl pe un cerc cu centrul n origine i de raz 2. Soluie. Problema poate fi modelat ca o problem de minimizare cu restricii de tip inegalitate, astfel: s se minimizeze funcia f ( x) = ( x1 2) 2 + ( x2 3) 2 cu restriciile 2 h1 ( x) = x12 + x2 4 0 , h2 ( x) = 1 x1 0 . Pentru rezolvarea problemei utilizm Teorema KKT. Definim funcia Lagrange
2 L (x, ) = 0 ( x1 2) 2 + ( x2 3) 2 + 1 ( x12 + x2 4) + 2 (1 x1 )

(3.60)

n care vom considera 0 = 1 (Atenie, punctul (3/2, 0) este un punct Slater). Condiiile KKT: L / x1 = 2 ( x1 2) + 2 1 x1 2 = 0 L / x 2 = 2 ( x2 3) + 2 1 x2 = 0 1 , 2 0 2 1 ( x12 + x2 4) = 0 2 (1 x1 ) = 0

(3.61) (3.62) (3.63) (3.64) (3.65)

2 Cazul 1: constrngerile impuse nu sunt etane, adic x12 + x2 4 < 0 i 1 x1 < 0 . n aceast situaie condiiile KKT anterioare se rescriu sub forma: 1 = 2 = 0 , 2 ( x1 2) = 0 , 2 ( x2 3) = 0

3 - 10

din care rezult punctul x1 = 2 , x2 = 3 care ns nu este un punct admisibil, ntruct nu 2 satisface restricia x12 + x2 4 < 0 . 2 Cazul 2: numai a doua constrngere este etan, adic x12 + x2 4 < 0 i 1 x1 0 . n aceast situaie, condiiile KKT definite mai sus se rescriu sub forma: 1 = 0 , 2 0 , 1 x1 = 0 , 2 ( x2 3) = 0 , 2 ( x1 2) 2 = 0 din care rezult punctul x1 = 1 , x2 = 3 , 2 = 2 care ns, ca i n cazul 1, nu este un punct admisibil i mai mult, 2 = 2 < 0 . 2 Cazul 3: numai prima constrngere este etan, adic x12 + x2 4 = 0 i 1 x1 < 0 . n aceast situaie condiiile KKT definite mai sus se rescriu sub forma: 2 1 0 , 2 = 0 , x12 + x2 4 = 0 , 2 ( x1 2) + 2 1 x1 = 0 , 2 ( x2 3) + 2 1 x2 = 0 , din care rezult punctul x1 = 4 / 13 , x2 = 6 / 13 , cu 1 = ( 13 2) / 2 > 0 . Acesta este un punct admisibil (satiface restriciile impuse) i reprezint un punct de optim global. Deci, * * x1 = 4 / 13 , x2 = 6 / 13 , pentru care f min = f (4 / 13 , 6 / 13 ) = ( 13 2) 2 . Condiiile KKT sunt satisfcute pentru urmtoarele valori ale multiplicatorilor Lagrange: 0 = 1 , 1 = ( 13 2) / 2 > 0 , 2 = 0 . Observaie. Se putea merge i pe intuiie, n sensul c punctul cutat trebuie s se 2 gseasc pe cercul x12 + x2 4 = 0 , iar coordonata x1 s satisfac condiia 1 x1 < 0 , care de fapt reprezint cazul 3 prezentat mai anterior.

3 - 11

S-ar putea să vă placă și