Sunteți pe pagina 1din 299

UNIVERSITATEA "LUCIAN BLAGA" DIN SIBIU

Dumitru Acu Mugur Acu


Petrică Dicu Ana Maria Acu

MATEMATICI APLICATE

ÎN

ECONOMIE

- NOTE DE CURS –
- PENTRU –
- ÎNVǍŢǍMÂNTUL LA DISTANŢǍ-
Cuprins

1 Introducere 6
1.1 Necesitatea utilizării matematicii ı̂n ştiinţele economice . . . . . . . . . . . . . . . . . . . 6
1.2 Modelarea matematico-economică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Câteva exemple de modele matematico–economice . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Optimizarea producţiei unei ı̂ntreprinderi . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2 Modele de gospodărire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.3 Problema dietei (nutriţiei) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 Spaţii vectoriale 12
2.1 Definiţia spaţiului vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Subspaţii vectoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Independenţa şi dependenţa liniară a vectorilor. Bază şi dimensiune . . . . . . . . . . . . 16
2.4 Produs scalar. Spaţii normate. Spaţii metrice . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5 Mulţimi convexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6 Testul Nr. 1 de verificare a cunoştinţelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3 Matrice. Determinanţi. Sisteme de ecuaţii liniare 28


3.1 Matrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2 Determinanţi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3 Sisteme de ecuaţii liniare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4 Testul Nr. 2 de verificare a cunoştinţelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4 Operatori liniari. Forme biliniare şi forme pătratice 53


4.1 Operatori liniari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2 Forme biliniare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.3 Forme pătratice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4 Testul Nr. 3 de verificare a cunoştinţelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5 Elemente de programare liniară 72


5.1 Obiectul programării matematice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.2 Noţiuni generale relative la o problemă de programare liniară . . . . . . . . . . . . . . . . 73
5.3 Algoritmul simplex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.4 Cazuri speciale ı̂ntr-o problemă de P.L. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.4.1 Soluţii multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.4.2 Soluţie infinită . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.4.3 Degenerare ı̂n problemele de programare liniară . . . . . . . . . . . . . . . . . . . . 82
5.5 Rezolvarea problemei generale de programare liniară . . . . . . . . . . . . . . . . . . . . . 83
5.6 Dualitatea ı̂n problemele de programare liniară . . . . . . . . . . . . . . . . . . . . . . . . 85
5.7 Testul Nr. 4 de verificare a cunoştinţelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3
6 Elemente de teoria grafurilor 97
6.1 Noţiuni fundamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.2 Algoritmi pentru rezolvarea unor probleme relative la grafuri . . . . . . . . . . . . . . . . 102
6.2.1 Algoritmul lui Yu Chen pentru aflarea matricei drumurilor . . . . . . . . . . . . . 103
6.2.2 Algoritmi pentru precizarea existenţei circuitelor ı̂ntr-un graf . . . . . . . . . . . . 103
6.2.3 Algoritmi pentru aflarea componentelor tare conexe ale unui graf . . . . . . . . . . 104
6.2.4 Algoritmi pentru aflarea drumurilor hamiltoniene ale unui graf . . . . . . . . . . . 108
6.2.5 Algoritmi pentru determinarea drumurilor de lungime optimă . . . . . . . . . . . . 110
6.2.6 Metoda drumului critic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.3 Problema fluxului optim ı̂n reţele de transport . . . . . . . . . . . . . . . . . . . . . . . . 118
6.3.1 Reţele de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.3.2 Algoritmul lui Ford–Fulkerson pentru determinarea fluxului maxim ı̂ntr-un graf de
reţea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.4 Testul Nr. 5 de verificare a cunoştinţelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

7 Probleme de transport 130


7.1 Modelul matematic pentru o problemă de transport . . . . . . . . . . . . . . . . . . . . . 130
7.2 Determinarea unei soluţii iniţiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.2.1 Metoda colţului Nord–Vest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.2.2 Metoda elementului minim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.2.3 Metoda diferenţelor maxime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.3 Ameliorarea (ı̂mbunătăţirea) unei soluţii . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.4 Aflarea unei soluţii optime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7.5 Degenerarea ı̂n problemele de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.6 Probleme de transport cu capacităţi limitate . . . . . . . . . . . . . . . . . . . . . . . . . 141
7.7 Testul Nr. 6 de verificare a cunoştinţelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

8 Şiruri 149
8.1 Şiruri de numere reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
8.2 Şiruri ı̂n spaţii metrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.3 Test de verificare a cunoştinţelor nr. 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

9 Serii numerice 169


9.1 Noţiuni preliminare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
9.2 Criterii de convergenţă pentru serii numerice cu termeni oarecare . . . . . . . . . . . . . . 173
9.3 Serii absolut convergente. Serii semiconvergente . . . . . . . . . . . . . . . . . . . . . . . . 176
9.4 Serii cu termeni pozitivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
9.5 Problemă economică. Fluxul de venit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
9.6 Test de verificare a cunoştinţelor nr. 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

10 Funcţii ı̂ntre spaţii metrice 190


10.1 Vecinătatea unui punct . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
10.2 Funcţii ı̂ntre spaţii metrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
10.3 Limita unei funcţii ı̂ntr-un punct . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
10.4 Continuitatea funcţiilor ı̂ntre spaţii metrice . . . . . . . . . . . . . . . . . . . . . . . . . . 206
10.5 Test de verificare a cunoştinţelor nr. 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

11 Derivarea funcţiilor reale 220


11.1 Definiţia derivatei şi proprietăţile ei de bază . . . . . . . . . . . . . . . . . . . . . . . . . . 220
11.2 Proprietăţi de bază ale funcţiilor derivabile pe un interval . . . . . . . . . . . . . . . . . . 224
11.3 Diferenţiala unei funcţii reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
11.4 Aplicaţiile derivatei ı̂n economie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
11.5 Test de verificare a cunoştinţelor nr. 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235

4
12 Derivarea funcţiilor de mai multe variabile 238
12.1 Derivate parţiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
12.2 Interpretări geometrice şi economice ale derivatelor parţiale . . . . . . . . . . . . . . . . . 241
12.3 Derivarea funcţiilor compuse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
12.4 Diferenţiala funcţiilor de mai multe variabile . . . . . . . . . . . . . . . . . . . . . . . . . 250
12.5 Extremele funcţiilor de mai multe variabile . . . . . . . . . . . . . . . . . . . . . . . . . . 254
12.6 Extreme condiţionate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
12.7 Ajustarea unor date . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
12.8 Interpolarea funcţiilor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
12.9 Test de verificare a cunoştinţelor nr. 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

13 Generalizări ale noţiunii de integrală 270


13.1 Integrale improprii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
13.2 Integrale cu parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
13.3 Integrale euleriene. Funcţia Gamma. Funcţia Beta . . . . . . . . . . . . . . . . . . . . . . 282
13.4 Integrale duble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
13.5 Test de verificare a cunoştinţelor nr. 12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297

5
Capitolul 1

Introducere

Obiective: În acest capitol introductiv se pune ı̂n evidenţă importanţa cunoaşterii matematicii
pentru un viitor economist.
Rezumat: În acest capitol sunt prezentate principiile modelării matematico-economice cu
prezentarea câtorva modele precise, cum ar fi optimizarea producţiei unei ı̂ntreprinderi, modele de gos-
podărie şi problema dietei (nutriţiei).
Conţinutul capitolului:
1. Necesitatea utilizării matematicii ı̂n ştiinţele economice
2. Modelarea matematico-economică
3. Câteva exemple de modele matematico-economice
4. Bibliografia aferentă capitolului
Cuvinte cheie: metode matematice, model matematic, optim economic, optimizarea
producţiei, modele de gospodărie, problema dietei.

1.1 Necesitatea utilizării matematicii ı̂n ştiinţele economice


În prezent şi ı̂n viitor este clar pentru oricine că o simplă observaţie a unui fenomen economic,
fără un studiu matematic şi statistic aprofundat, nu mai este satisfăcătoare şi nu poate fi acceptată fără
urmări dintre cele mai grave. Folosirea metodelor matematicii ı̂n practica economică, de orice nivel,
constituie o preocupare cu efecte benefice ı̂n rezolvarea problemelor economice actuale.
Cel care este interesat de studiul fenomenelor economice trebuie să aibă o pregătire interdisci-
plinară.
Studierea globală a aspectelor calitative şi cantitative a unui fenomen economic necesită un anu-
mit volum de noţiuni; concepte şi metode matematice care considerate ca un ansamblu dau un aşa
numit model matematic ataşat fenomenului studiat. Modelarea este un atribut al activităţii umane,
ı̂ntâlnit ı̂n procesul de cunoaştere a lumii, prin care omul reuşeşte să surprindă esenţialul şi să descopere
legile după care se guvernează fenomenele naturale, sociale şi psihice.
Utilizarea matematicii ı̂n problemele economice, prin utilizarea modelelor matematice, nu este o
chestiune simplă. Istoric, ele cochetează de mult timp, dar rezolvarea problemelor ridicate de studiul
unui fenomen economic, numărul mare de date cu care lucrează şi volumul mare de calcule necesare,
pretindea o tehnică de calcul puternică. Apariţia informaticii şi calculatoarelor rapide au făcut să
apară capitole noi ı̂n matematică, care să se preocupe de modelarea proceselor economice, ca de ex-
emplu cercetările operaţionale. Aşa cum sublinia profesorul André Brunet ”cercetarea operaţională este
pregătirea ştiinţifică a deciziilor” ([3]).
În condiţiile actuale este necesar ca la orice nivel de decizie să prelucrăm un număr mare de
informaţii şi date care să permită un raţionament logic ı̂n alegerea variantei celei mai potrivite.
Un alt motiv care pledează pentru utilizarea matematicii ı̂n studiul proceselor economice este şi
dorinţa omului de a atinge un anumit optim.
Problema alegerii dintr-o mulţime de rezultate posibile pe cel optim, ı̂n concordanţă cu un anu-
mit scop, este de o importanţă majoră pentru orice economist, teoretician sau practician. Noţiunea de

6
optim, destul de veche ı̂n gândirea economică legată direct de practică, apare ı̂ntr-o nouă lumină prin
posibilităţile oferite de matematica contemporană.
Dacă ı̂n trecut conţinutul optimului economic funcţiona, cel mai adesea, după principiul ”cu cât
mai mult, cu atât mai bine”, ı̂n prezent optimul economic lucrează după principiul ”profit maxim
ı̂n condiţii date”.
Utilizarea calculului diferenţial şi integral ı̂n economia politică, ı̂ncepând cu sfârşitul secolului al
XIX-lea şi ı̂nceputul secolului al XX-lea, era o necesitate. Aşa s-a născut economia matematică, care,
treptat s-a impus ı̂n cercetările economice.
În conformitate cu aceste preocupări, ı̂n economia matematică s-a creat conceptul de ”optim pare-
tian”, introdus de Vilfredo Pareto. S-au creat noi metode precise de optimizare a activităţii economice,
apelându-se la ramurile existente ı̂n matematică, dar şi cerând imperios găsirea de noi concepte matema-
tice, care să permită găsirea soluţiilor optime cât mai rapid şi cât mai exact. Aşa au apărut metodele
de programare matematică ı̂n rezolvarea unor probleme de optimizare a activităţii unor ı̂ntreprinderi,
a unor societăţi de comerţ, turism sau cu preocupări agricole. Problemele puse de practica economică
stimulează continuu descoperirea de noi metode matematice. Fără să greşim putem afirma că există o
conlucrare benefică, atât pentru economişti, cât şi pentru matematicieni.
Legătura concretă dintre matematică şi economie se stabileşte printr-o traducere ı̂n limbaj matem-
atic a noţiunilor şi a relaţiilor ce intervin ı̂n fenomenele economice, fapt ce se realizează prin procesul de
modelare matematică. Folosirea limbajului matematic ı̂n ştiinţele economice oferă posibilitatea formulării
necontradictorii a fenomenelor economice şi introducerii rigorii ı̂n studiul lor.

1.2 Modelarea matematico-economică


Aplicarea matematicii ı̂n economie are două direcţii principale. Prima, care foloseşte metodele
matematicii ca instrument menit să sprijine studiul calitativ al fenomenelor economice şi a doua, ı̂n
care matematica este utilizată la analiza aspectelor cantitative din practica economică (planificare,
prognoză, etc.). Utilitatea matematicii ca instrument ajutător economistului se evidenţiază ı̂n plan:
logic, empiric şi euristic. Traducând o situaţie economică ı̂ntr-o problemă matematică, ı̂i putem verifica
consistenţa, planul empiric şi, ı̂n fine, dezvăluirea de relaţii noi. Însă, o astfel de metodă de lucru impune
precizarea conceptului de model.
Esenţa metodei modelării constă ı̂n ı̂nlocuirea obiectului sau fenomenului real care ne interesează
cu un alt obiect sau fenomen, mai convenabil pentru cercetare. După o astfel de substituire nu se mai
studiază obiectul primar ci modelul, iar apoi rezultatul cercetărilor se extinde asupra obiectului sau
fenomenului iniţial, cu anumite precauţii.
Termenul de model vine de la diminutivul lui modus (măsură ı̂n limba latină), care este modulus.
În limba germană a devenit model, iar ı̂n secolul al XVI-lea ı̂n Franţa se folosea deja termenul modèle,
provenit din italienescul modello. Acelaşi cuvânt a dat ı̂n limba engleză termenul model. Încă de la
ı̂nceput sensul cuvântului model oscila ı̂ntre concret şi abstract. Se pare că primul care a folosit conceptul
de model ı̂n sensul actual a fost matematicianul italian Beltrami, ı̂n anul 1868, când a construit un model
euclidian pentru o geometrie neeuclidiană.
În ştiinţă se ı̂ntâlnesc diferite modele: modelul atomic, modelul cosmologic, modele de creştere
economică etc.
Astăzi, metoda modelării este o metodă generală de cercetare şi studiere a unor procese reale cu
ajutorul cercetării şi studierii altor procese, care pot fi mai apropiate sau mai depărtate de cele iniţiale.
Modelul trebuie să reflecte ı̂ntr-o cât mai mare măsură proprietăţile originalului care sunt legate de scopul
cercetării. Atragem ı̂nsă atenţia că modelul nu este la fel cu originalul.
Modelele ne servesc ı̂n viaţa de toate zilele, ı̂n ştiinţă, ı̂n ı̂nvăţământ, industrie, proiectare, artă, etc.
Multe din modele, cum ar fi hărţile mulajele, machetele, desenele etc., constituie o reproducere materială
a unor aspecte ale originalului cercetat. Asemenea modele materiale au posibilităţi limitate, multe din
ele servind mai mult ı̂nţelegerii şi mai puţin cunoaşterii originalelor. Pentru cunoaşterea ştiinţifică s-a
trecut la modele simbolice, care sunt modele matematice. Utilizarea limbajului matematic ı̂n
descrierea unor modele, permit acestora să aibă un ı̂nalt grad de abstractizare şi de generalizare, unul
şi acelaşi model (ecuaţie, funcţie, sistem, etc.) poate descrie cu mult succes obiecte sau situaţii total
diferite. Într-un model matematic se folosesc pentru descriere numai mijloace matematice şi logice, ceea

7
ce conduce la ı̂nlăturarea tratărilor subiective. În plus reprezentările matematice nu sunt ı̂ngrădite de
limite materiale şi nici de traducerea dintr-o disciplină ı̂n alta.
În elaborarea unui model matematic ataşat unui proces trebuiesc respectate etapele:
1. Obţinerea modelului descriptiv al procesului, care are subetapele:
1.1. formularea problemei propuse;
1.2. analiza structurii informaţionale a fenomenului abordat;
1.3. discutarea criteriilor posibile care reflectă obiectivele urmărite;
1.4. stabilirea factorilor esenţiali şi factorilor secundari;
2. Formularea matematică a modelului descriptiv, etapă ı̂n care se elaborează modelul matematic;
3. Studierea (cercetarea) modelului, adică rezolvarea practică a problemei pe model. Astăzi, ı̂n această
etapă de mare folos este calculatorul.
Modelul realizat şi testat trebuie să reflecteze originalul cu destulă precizie. S-ar putea ca modelul
să fie bine construit dar să nu dea rezultate sa- tisfăcătoare. El trebuie ı̂mbunătăţit sau abandonat.
Fidelitatea unui model se poate realiza nu numai având grijă să nu pierdem din vedere anumite
aspecte ale fenomenului studiat, ci şi prin aparatul matematic folosit.
Fidelitatea faţă de original creşte odată cu perfecţionarea aparatului matematic utilizat. În funcţie
de aparatul matematic folosit au apărut modele foarte variate, uneori chiar pentru aceeaşi problemă.
După modelul matematic utilizat se poate da următoarea clasificare a modelelor:
1) modele aritmetice (utilizate până ı̂n secolul al XVIII-lea)– folosesc numai concepte aritmetice;
2) modele bazate pe analiza matematică (utilizate ı̂ncepând cu secolul al XVIII-lea)– folosesc
concepte de analiză matematică;
3) modele liniare – utilizează concepte de algebră liniară (de exemplu, programarea liniară);
4) modele de joc – care iau ı̂n considerare şi variabile necontrolabile;
5) modele de optimizare – urmăresc optimizarea unei funcţii (numită funcţia obiectiv) supusă
unor restricţii;
6) modele neliniare – utilizează restricţii de optim sau funcţii obiectiv neliniare;
7) modele diferenţiale – care descriu prin ecuaţii diferenţiale fenomenul (de exemplu, modelul care
descrie variaţia producţiei);
8) modele de tip catrastofic – utilizate de studiul fenomenelor cu variaţii bruşte;
9) modele deterministe – mărimile care intervin sunt perfect determinate;
10) modele stohastice – mărimile care intervin sunt aleatorii;
11) modele de tip statistico-matematice – mărimile care intervin sunt date statistic;
12) modele vagi – mărimile care intervin nu sunt date cu precizie, ci doar vag;
13) modele discrete – mărimile care intervin variază discret;
14) modele continue – mărimile care intervin variază continuu.
Cu toată diversitatea conceptelor şi rezultatelor matematice, există numeroase fenomene economice
pentru care nu s-au elaborat modele pe deplin satisfăcătoare.

1.3 Câteva exemple de modele matematico–economice


În acest paragraf prezentăm câteva din cele mai cunoscute modele matematico–economice.

8
1.3.1 Optimizarea producţiei unei ı̂ntreprinderi
Să considerăm o ı̂ntreprindere care ı̂şi desfăşoară activitatea de producţie ı̂n următoarele condiţii:
i) ı̂n ı̂ntreprindere se desfăşoară n activităţi Ai , i = 1, n;
ii) există m factori disponibili Fj , j = 1, m;
iii) se cunosc coeficienţii tehnici de utilizare a celor m factori ı̂n cele n activităţi.
Vom ı̂ncerca să obţinem descrierea matematică a activităţii de producţie.
Pentru realizarea modelării acestui program de producţie să notăm cu xi nivelul activităţii Ai ,
i = 1, n, şi cu bi volumul (cantitatea) disponibil de factorul Fj , j = 1, m şi aij factorul de proporţionalitate
al consumului Fi pentru activitatea Aj .
Acum putem scrie restricţiile:


⎪ a11 x1 + a12 x2 + . . . + a1n xn ≤ b1

⎨ a21 x1 + a22 x2 + . . . + a2n xn ≤ b2
(1.1) ..

⎪ .


am1 x1 + am2 x2 + . . . + amn xn ≤ bm

Restricţiile (1.1) reprezintă condiţiile ı̂n care ı̂ntreprinderea poate să-şi desfăşoare activitatea. Ele
se pot scrie şi sub forma matricială. În acest scop facem notaţiile: A = (aij ) – matricea coeficienţilor
tehnici; x = t (x1 , x2 , . . . , xn ) (t – transpus) – vectorul coloană al nivelului producţiei; C1 , C2 , . . . , Cn –
vectorii coloană din matricea A; C0 – vectorul coloană al volumelor disponibile. Acum condiţiile (1.1) se
pot scrie sub forma
C1 x1 + C2 x2 + . . . + Cn xn ≤ C0
sau
Ax ≤ C0 .
Până aici am urmărit descrierea tehnologiei producţiei. Dar orice proces de producţie mai
urmăreşte şi o motivaţie economică, de exemplu să se realizeze o eficienţă maximă. Un astfel de
criteriu de eficienţă este dat de maximizarea profitului. Practic, finalul acestui proces este optimizarea
unei anumite funcţii, care de fapt realizează optimizarea funcţionării unui proces economic.

1.3.2 Modele de gospodărire


Orice firmă doreşte fie să-şi maximizeze veniturile, fie să-şi minimizeze cheltuielile, iar consumatorii
să-şi distribuie salariile aşa ı̂ncât să-şi satisfacă la maximum nevoile vieţii. De fapt, orice situaţie de
gospodărire impune o repartizare optimă a unor resurse disponibile limitate ı̂ntre diferite activităţi care
se desfăşoară pentru realizarea unui anumit scop.
Acest tip de procese economice poartă numele de probleme de gospodărire.
Un model pentru o problemă de gospodărire se compune din două părţi: prima referitoare la
restricţii şi o a doua care descrie criteriul sau obiectivul activităţii de derulat. Într-un astfel de model se
cere găsirea valorilor unor variabile x1 , x2 , . . . , xn pentru care o funcţie f (x1 , x2 , . . . , xn ) este optimă şi
care sunt supuse unor restricţii de forma:
F1 (x1 , x2 , . . . , xn ) ≤ 0,
F2 (x1 , x2 , . . . , xn ) ≤ 0,
......................
Fm (x1 , x2 , . . . , xn ) ≤ 0,
unde semnul ”≤” poate fi şi ”≥”.
Cum orice model de gospodărire are menirea de a stabili un program de acţiune, el a căpătat
denumirea de model de programare. Domeniile de aplicare a modelelor de programare se referă la
un număr mare de probleme de planificare din industrie, transporturi, agricultură, ş.a. Unele din ele au
o foarte mare circulaţie şi numeroase aplicaţii fapt ce le-au făcut celebre. Dăm un astfel de exemplu ı̂n
subparagraful următor.

9
1.3.3 Problema dietei (nutriţiei)
Una dintre problemele celebre de gospodărire este problema alimentării cât mai ieftine şi realizarea
unor cerinţe de alimentaţie conform unui scop propus.
O alimentaţie se consideră bună dacă se oferă anumite substanţe ı̂n cantităţi minimale precizate.
Evident că aceste substanţe se găsesc ı̂n diferite alimente cu preţuri cunoscute. Se cere să se stabilească
o dietă (raţie) care să fie corespunzătoare şi totodată cât mai ieftină. Substanţele care intră ı̂ntr-o dietă
se numesc substanţe nutritive sau principii nutritive.
Vom obţine, ı̂n continuare, modelul matematico-economic pentru problema dietei. Fie
S1 , S2 , . . . , Sm substanţele nutritive care trebuie să intre ı̂n compunerea dietei ı̂n cantităţile mini-
male b1 , b2 , . . . , bm şi A1 , A2 , . . . , An alimentele de care dispunem cu preţul corespunzător pe unitate
c1 , c2 , . . . , cn . Notăm cu aij numărul de unităţi din substanţa Si , i = 1, m, se găsesc ı̂ntr-o unitate din
alimentul Aj , j = 1, n. Se cere să se afle x1 , x2 , . . . , xn numărul de unităţi din alimentele A1 , A2 , . . . , An
aşa ı̂ncât să se obţină o raţie acceptabilă la un preţ cât de mic. De obicei datele problemei se prezintă
ı̂ntr-un tabel de forma:
Minim
Alimente
A1 A2 ... Aj ... An necesar
Substanţa
din Si
S1 a11 a12 ... a1j ... a1n b1
... ... ... ... ... ... ... ...
Si ai1 ai2 ... aij ... ain bi
... ... ... ... ... ... ... ...
Sm am1 am2 ... amj ... amn bm
Preţ alimente c1 c2 ... cj ... cn
Unităţi de consum x1 x2 ... xj ... xn

Cantitatea din substanţa Si care se realizează este ai1 x1 + ai2 x2 + . . . + ain xn , care din cerinţa
problemei trebuie să fie ≥ bi , i = 1, m. Ajungem astfel la condiţiile (restricţiile):


⎪ a11 x1 + a12 x2 + . . . + a1n xn ≥ b1

a21 x1 + a22 x2 + . . . + a2n xn ≥ b2
(1.2)

⎪ ...................................

am1 x1 + am2 x2 + . . . + amn xn ≥ bm

Natura datelor cu care lucrăm impun şi condiţiile de nenegativitate:

(1.3) x1 ≥ 0, x2 ≥ 0, . . . , xn ≥ 0.

Funcţia obiectiv care exprimă costul unei raţii este dată de:

(1.4) f = c1 x1 + c2 x2 + . . . + cn xn .

Problema dietei cere să determinăm x1 , x2 , . . . , xn aşa ı̂ncât f să fie minimă. O astfel de dietă se
numeşte optimă. Orice dietă care satisface restricţiile (1.2) şi (1.3) se numeşte admisibilă.
Modelul dietei poate fi folosit şi ı̂n alte situaţii, ca de exemplu: problema furajării raţionale (ı̂n
zootehnie), chestiunea amestecului optim (ı̂n amestecuri de benzină sau uleiuri auto, ı̂n realizarea unor
sortimente de băuturi sau ı̂ngheţată), ş.a.
Pentru alte modele matematico-economice se pot consulta lucrările [2], [3], [4], [5].

10
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul I, Editura ULB,
Sibiu, 2001.
[2] Izvercian, P.N.,Creţu, V., Izvercian, M., Resiga, R., Introducere ı̂n teoria grafurilor. Metoda
drumului critic, Editura de Vest, Timişoara, 1994.
[3] Popescu, O., Raischi, C., Matematici aplicate ı̂n economie, vol.I, II, Editura Didactică şi Peda-
gogică, Bucureşti, 1993.
[4] Raţiu-Raicu, C., Modelare şi simularea proceselor economice, Editura Didactică şi Pedagogică,
R.A., Bucureşti, 1995.
[5] Stavre, P., Matematici speciale cu aplicaţii ı̂n economie, Editura Scrisul Românesc, Craiova, 1982.

11
Capitolul 2

Spaţii vectoriale

Obiective: În acest capitol studentul va lua contact cu noţiunile teoretice fundamentale (cum
ar fi spaţiile vectoriale, prehilbertiene, normate şi metrice) necesare ı̂nţelegerii metodelor / aplicaţiilor
prezentate ı̂n capitolele următoare.
Rezumat: În acest capitol sunt prezentate noţiunile de spaţiu vectorial, subspaţiu vectorial,
sistem de vectori, combinaţie liniară, liniar independenţă şi liniar dependenţă, bază, dimensiune, produs
scalar şi spaţii prehilbertiene, normă şi spaţii normate, metrică şi spaţii metrice, mulţimi convexe, etc.
Conţinutul capitolului:
1. Definiţia spaţiului vectorial
2. Subspaţiu vectorial
3. Independenţa şi dependenţa liniară a vectorilor. Bază şi dimensiune
4. Produs scalar. Spaţii normate. Spaţii metrice
5. Mulţimi convexe
6. Test de verificare a cunoştinţelor
7. Bibliografia aferentă capitolului
Cuvinte cheie: spaţiu vectorial, bază, dimensiune, produs scalar, normă, metrică, mulţimi
convexe.

2.1 Definiţia spaţiului vectorial


În acest paragraf vom trata noţiunea de spaţiu vectorial şi principalele ei proprietăţi.

Definiţia 2.1.1 Se numeşte lege de compoziţie (operaţie) externă pe mulţimea M faţă de mulţimea K,
o funcţie f : K × M → M .
Mulţimea K se numeşte domeniul operatorilor sau scalarilor

Exemplul 2.1.1. Aplicaţia f : R × C → C definită prin formula f (a, z) = az, a ∈ R, z ∈ C, este o


operaţie externă pe C având pe R ca domeniu de operatori.
Acum, fie V o mulţime nevidă de elemente oarecare şi K un câmp de elemente α, β, γ, . . ., cu 0
elementul neutru (nul) şi 1 elementul unitate. Suma respectiv produsul elementelor α şi β din K va fi
notată cu α + β, respectiv α · β sau simplu αβ.

Definiţia 2.1.2 Se spune că pe mulţimea V s-a definit o structură de spaţiu vectorial (liniar) peste
câmplul K, dacă pe V s-a definit o lege de compoziţie internă (x, y) → x + y, x, y ∈ V , numită adunare,
şi o lege de compoziţie externă faţă de câmpul K, (α, x) → αx, α ∈ K, x ∈ V , numită ı̂nmulţire cu
scalari, astfel că pentru orice x, y, z ∈ V şi orice a, b ∈ K să avem
1. x + y = y + x (comutativitatea adunării);
2. (x + y) + z = x + (y + z) (asociativitatea adunării);
3. Există elementul θ ∈ V , astfel ca x + θ = θ + x = x;

12
4. Oricărui x ∈ V ı̂i corespunde −x ∈ V astfel cu x + (−x) = (−x) + x = θ (−x se numeşte opusul
lui x);
(Prin urmare (V , +) este un grup comutativ);
5. 1 · x = x;
6. (a + b)x = ax + bx;
7. (ab)x = a(bx);
8. a(x + y) = ax + ay.
Mulţimea V ı̂mpreună cu structura de spaţiu vectorial peste câmpul K se numeşte spaţiu vec-
torial (liniar) peste K, iar elementele sale le vom numi vectori.
Se observă că operaţia de adunare a vectorilor din V a fost notată tot cu semnul ”+” ca şi adunarea
din K, iar operaţia de ı̂nmulţire cu scalari a fost notată cu ”·” ca şi ı̂nmulţirea din K, acest lucru nu
produce confuzie deoarece ı̂n context orice ambiguitate este ı̂nlăturată.
Dacă K este corpul R al numerelor reale, atunci V se numeşte spaţiu vectorial real, iar dacă
K este corpul C al numerelor complexe, atunci V se numeşte spaţiu vectorial complex.
Elementul θ ∈ V se numeşte vectorul nul al spaţiului vectorial V .

Propoziţia 2.1.1 Dacă V este un spaţiu vectorial peste K, atunci


1. 0 · x = θ, pentru orice x ∈ V ;
2. a · θ = θ, pentru orice a ∈ K;
3. (−1)x = −x, pentru orice x ∈ V .

Demonstraţie. 1. Utilizând condiţiile 5) şi 6) din Definiţia 2.1.2, avem

x = 1 · x = (0 + 1)x = 0 · x + 1 · x = 0 · x + x,

de unde, folosind condiţia 3) din aceeaşi definiţie, rezultă 0 · x = θ.


2. Din condiţia 6) a Definiţiei 2.1.2 avem ax + aθ = a(x + θ) = ax şi ţinând seama de condiţia 3)
din aceeaşi definiţie, rezultă a · θ = θ.
3. Din condiţia 6) avem x + (−1)x = (1 + (−1))x = 0x = θ, de unde folosind 4), obţinem
(−1)x = −x.
Exemple. 2.1.2. Mulţimea R a numerelor reale cu operaţia de adunare şi cu operaţia de ı̂nmulţire cu
numere raţionale este un spaţiu vectorial peste câmpul Q al numerelor raţionale.
2.1.3. Mulţimea C a numerelor complexe cu operaţia de adunare şi cu operaţia externă de ı̂nmulţire
cu numere reale este un spaţiu vectorial peste câmpul Q al numerelor raţionale.
2.1.4. Mulţimea C a numerelor complexe cu operaţia de adunare şi cu operaţia externă de ı̂nmulţire
cu numere reale este un spaţiu vectorial peste câmpul R al numerelor reale.
2.1.5. Fie Hom(R, R) = {f |f : R → R, funcţie} ı̂n care definim operaţiile de adunare a două
funcţii şi de ı̂nmulţire a unei funcţii cu un număr real astfel:

f + g : R → R, (f + g)(x) = f (x) + g(x), (∀)f, y ∈ Hom(f, g) şi (∀)x ∈ R

şi
αf : R → R, (αf )(x) = αf (x), (∀)f ∈ Hom(f, g) şi (∀)r ∈ R.
Aceste operaţii determină pe Hom(R, R) o structură de spaţiu vectorial.
2.1.6. Fie K un câmp oarecare şi n un număr natural nenul. Considerăm produsul cartezian
K n = K × K × . . . × K , adică mulţimea sistemelor ordonate x = (x1 , x2 , . . . , xn ) de câte n elemente din
 
n ori
K. Definim pe K n operaţiile:

x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn ),

ax = (ax1 , ax2 , . . . , axn ),


pentru orice x = (x1 , x2 , . . . , xn ) ∈ K n , y = (y1 , y2 , . . . , yn ) ∈ K n şi a ∈ K.
Înzestrată cu cele două operaţii definite mai sus, mulţimea K n devine un spaţiu vectorial, numit

13
spaţiul vectorial aritmetic cu n dimensiuni peste K. Pentru K = R se obţin spaţiile euclidiene,
iar pentru K = C se obţin spaţiile unitare sau hermitice. În cazul unui vector x = (x1 , x2 , . . . , xn )
din K n , x1 , x2 , . . . , xn se numesc componentele sau coordonatele vectorului x. De aceea, când vom
nota vectorii cu indici vom folosi scrierea cu exponenţi ı̂n paranteză, pentru a se deosebi de componentele
sale.
Comentariul 2.1.1. Spaţiile vectoriale Rn şi Cn sunt instrumente matematice de bază ı̂n studiul
modelelor matematico-economice. Spaţiile R2 şi R3 conduc la vectorii utilizaţi ı̂n fizică.

2.2 Subspaţii vectoriale


O submulţime W a unui spaţiu vectorial V peste un câmp K se numeşte subspaţiu vectorial al
lui V , dacă cele două operaţii date pe V induc pe W o structură de spaţiu vectorial peste K. Vom nota
faptul că W este un subspaţiu al lui V prin W  V .
Teorema 2.2.1 Submulţimea W a unui spaţiu vectorial V peste câmpul K este subspaţiu vectorial peste
câmpul K, dacă şi numai dacă sunt ı̂ndeplinite condiţiile:
1. pentru orice x, y ∈ W avem x + y ∈ W ;
2. pentru orice x ∈ W şi orice a ∈ K avem ax ∈ W .
Demonstraţie. Dacă W  V , atunci condiţiile 1) şi 2) rezultă din faptul că operaţiile din V trebuie să
fie interne şi pe W .
Reciproc, dacă presupunem că 1) şi 2) au loc şi luând x ∈ W , din 2) rezultă că şi −x = (−1)(x) ∈
W , iar de aici, folosind 1), rezultă că θ = x + (−x) se găseşte ı̂n W . Celelalte condiţii din definiţia unui
spaţiu vectorial având loc pe V au loc şi pe W . Teorema precedentă este echivalentă cu:
Teorema 2.2.2 Submulţimea W a spaţiului vectorial V peste K este subspaţiu vectorial pentru V peste
K, dacă şi numai dacă, pentru orice a, b ∈ K şi orice x, y ∈ W avem ax + by ∈ W .

Observaţia 2.2.1 Orice subspaţiu vectorial W al unui spaţiu vectorial V conţine vectorul nul.

Exemple. 2.2.1. Dacă V este un spaţiu vectorial, atunci submulţimea {θ}, formată numai din vectorul
nul, este un subspaţiu vectorial numit subspaţiul nul.
2.2.2. Pentru spaţiul vectorial R2 şi numărul real a fixat, submulţimea W = {x ∈ R2 |x = (x1 , y1 )
cu y1 = ax1 } formează un subspaţiu vectorial.
Într-adevăr, dacă x, y ∈ W , x = (x1 , y1 ), y1 = ax2 , y = (x2 , y2 ), y2 = ax2 , atunci: x + y =
(x1 + y1 , x2 + y2 ) cu y1 + y2 = ax1 + ax2 = a(x1 + x2 ) şi deci x + y ∈ W . Pentru a ∈ R avem
αx = (αx1 , αy1 ), cu αy1 = α(ax1 ) = a(αxn ) şi deci αx ∈ W .
Cele demonstrate ne arată că, ı̂n spaţiul vectorial R2 (ı̂n plan) dreptele ce trec prin origine formează
subspaţii vectoriale pentru R2 .
2.2.3. Dacă K este un câmp, atunci mulţimea vectorilor
x = (x1 , x2 , . . . , xn ) din K n cu xn = 0 formează un subspaţiu vectorial al spaţiului vectorial K n .
Uşor se verifică faptul că intersecţia a două subspaţii vectoriale ale unui spaţiu vectorial V este tot
un subspaţiu vectorial al lui V . Prin urmare, dacă A este o submulţime a spaţiului vectorial V , atunci
există un cel mai mic subspaţiu al lui V care conţine pe A, anume intersecţia tuturor subspaţiilor lui V
ce conţin pe A, numit subspaţiu generat de A sau acoperirea (ı̂nfăşurătoarea) liniară a lui A.
Două subspaţii W1 şi W2 ale unui spaţiu vectorial se zic independente dacă W1 ∩ W2 = {0}.
Fie S = {x(1) , x(2) , . . . , x(n) } un sistem de n vectori, n ∈ N∗ , din spaţiul vectorial V peste câmpul
K.
Definiţia 2.2.1 Se spune că vectorul x ∈ V este o combinaţie liniară de vectorii sistemului S dacă
există n scalari a1 , a2 , . . . , an ∈ K astfel ca să avem

n
x= ak x(k) .
k=1

14
Teorema 2.2.3 Mulţimea vectorilor din spaţiu vectorial V care se pot scrie ca şi combinaţii liniare de
vectorii sistemului S formează un subspaţiu vectorial al lui V . Acest subspaţiu se notează prin [S] şi se
numeşte subspaţiul lui V generat de sistemul de vectori S.

n
Demonstraţie. Într-adevăr, dacă x = ak x(k) şi y = bk x(k) , atunci, pentru orice α, β ∈ K, avem
k=1 k=1

n
αx + βy = αak x(k) + βbk x(k) = (αak + βbk )x(k) ,
k=1 k=1 k=1

adică αx + βy este o combinaţie liniară de vectori a sistemului S.


Teorema 2.2.4 Subspaţiul [S] generat de sistemul de vectori S coincide cu acoperirea liniară a lui S.
Demonstraţie. Fie S ∗ acoperirea liniară a lui S. Avem S ⊆ [S] şi din definiţia lui S ∗ rezultă S ∗ ⊆ [S].

n
Reciproc, dacă x ∈ [S], atunci rezultă că x = ak x(k) , a1 , a2 , . . . , an ∈ K. Prin urmare, x ∈ S ∗ , adică
k=1
[S] ⊆ S ∗ . Rezultă că S ∗ = [S].
Definiţia 2.2.2 Un sistem de vectori S ⊂ V se numeşte sistem de generatori pentru subspaţiul W  V
dacă W = [S].
Exemplul 2.2.4. În spaţiul Rn un sistem de generatori pentru Rn este format din vectorii: e(1) =
(1, 0, 0, . . . , 0), e(2) = (0, 1, 0, . . . , 0), . . ., e(n) = (0, 0, . . . , 0, 1). În adevăr, orice x = (x1 , x2 , . . . , xn ) ∈ Rn
se scrie sub forma x = x1 e(1) + x2 e(2) + . . . + xn e(n) .
Definiţia 2.2.3 Dacă W1 şi W2 sunt subspaţii ale spaţiului vectorial V , atunci subspaţiul generat de
S = W1 ∪ W2 se numeşte suma celor două subspaţii. Notăm [S] = W1 + W2 .

Teorema 2.2.5 Suma W1 + W2 a două subspaţii vectoriale ale lui V coincide cu mulţimea vectorilor
x ∈ V care se scrie sub forma x = x(1) + x(2) , cu x(1) ∈ W1 , x(2) ∈ W2 .

Demonstraţie. Fie W = {x ∈ V |x = x(1) + x(2) , x(1) ∈ W1 , x(2) ∈ W2 }. Evident că W ⊆ W1 + W2 .


Dacă x ∈ W1 + W2 , atunci x = a1 y (1) + . . . + ar y (r) + ar+1 y (r+1) + . . . + ap y (p) , unde y (1) , . . . , y (r) ∈ W1 ,
iar y (r+1) , . . . , y (p) ∈ W2 . Punând x(1) = a1 y (1) + . . . + ar y (r) şi x(2) = ar+1 y (r+1) + . . . + ap y (p) , găsim
x = x(1) + x(2) , deci W1 + W2 ⊆ W . Rezultă W = W1 + W2 .
Exemplul 2.2.5. În R2 considerăm W1 = {(x, 0)|x ∈ R} şi
W2 = {(0, y)|y ∈ R}. Atunci avem R2 = W1 + W2 .
Definiţia 2.2.4 Suma S a două subspaţii vectoriale W1 şi W2 ale spaţiului vectorial V se numeşte directă,
dacă W1 ∩ W2 = {θ}. În acest caz scriem S = W1 ⊕ W2 , iar despre W1 şi W2 se zic că sunt subspaţii
vectoriale independente.

Teorema 2.2.6 Suma a două subspaţii vectoriale W1 şi W2 ale spaţiului vectorial V este directă, dacă
şi numai dacă orice vector x din S = W1 + W2 se scrie ı̂n mod unic sub forma x = x(1) + x(2) , x(1) ∈ W1 ,
x(2) ∈ W2 .

Demonstraţie. Să admitem că S = W1 ⊕ W2 şi să presupunem că există x ∈ S aşa ı̂ncât x = x(1) + x(2) ,
x(1) ∈ W1 , x(2) ∈ W2 şi x = y (1) + y (2) , y (1) ∈ W1 , y (2) ∈ W2 . Atunci x(1) + x(2) = y (1) + y (2) , de unde
x(1) − y (1) = x(2) − y (2) ∈ W1 ∩ W2 = {θ} şi deci x(1) = y (1) şi x(2) = y (2) . Rezultă că scrierea lui x ca
sumă de elemente din W1 şi W2 este unică.
Reciproc, să admitem că orice x ∈ S = W1 + W2 , are o scriere unică de forma x = x(1) + x(2) ,
x ∈ W1 , x(2) ∈ W2 . Dacă ar exista t ∈ W1 ∩W2 , t = θ, atunci x = (x(1) −t)+(x(2) −t), cu x(1) −t ∈ W1
(1)

şi x(2) − t ∈ W2 , ceea ce ar fi o contradicţie. Prin urmare W1 ∩ W2 = {θ}, adică S = W1 ⊕ W2 .


Definiţia 2.2.5 Două subspaţii W1 şi W2 ale spaţiului vectorial V se numesc suplimentare dacă W1 ∩
W2 = {θ} şi V = W1 ⊕ W2 .

15
Exemplul 2.2.6. Spaţiul vectorial Hom(R, R) al funcţiilor f : R → R este suma directă a subspaţiilor W1
şi W2 ale funcţiilor pare şi respectiv impare deoarece W1 ∩ W2 = {θ}. Cum, pentru orice f ∈ Hom(R, R),
avem
f (x) + f (−x) f (x) − f (−x)
f (x) = + , (∀)x ∈ R,
2 2
adică suma dintre o funcţie pară şi una impară, deducem că W1 şi W2 sunt subspaţii vectoriale supli-
mentare pentru Hom(R, R).

2.3 Independenţa şi dependenţa liniară a vectorilor. Bază şi


dimensiune
Definiţia 2.3.1 Sistemul de vectori S = {x(1) , x(2) , . . . , x(n) } din spaţiul vectorial V peste câmpul K
se zice că este liniar independent dacă o combinaţie liniară a lor a1 x(1) + a2 x(2) + . . . + an x(n) ,
a1 , a2 , . . . , an ∈ K, dă vectorul nul numai dacă a1 = a2 = . . . = an = 0.
În caz contrar, adică dacă există cel puţin o mulţime de scalari a1 , a2 , . . . , an ∈ K, nu toţi nuli,

n
astfel ca ai x(i) = θ, atunci se zice că sistemul S de vectori este liniar dependent.
i=1

Dacă sistemul S de vectori este liniar independent (liniar dependent), se mai zice că vectorii
x(1) , . . . , x(n) sunt liniar independenţi (liniar dependenţi).
Exemple. 2.3.1. Vectorii e(1) , e(2) , . . . , e(n) (v.exemplul 2.2.4) sunt liniar independenţi ı̂n Rn . În adevăr,

n
dacă a1 , a2 , . . . , an ∈ R astfel ca ai e(i) = θ, atunci rezultă (a1 , a2 , . . . , an ) = θ, de unde obţinem că
i=1
a1 = a2 = . . . = an = 0.
2.3.2. Vectorii x(1) = (1, 2, −1), x(2) = (2, 1, 1) şi x(3) = (4, −1, 5) sunt liniar dependenţi ı̂n R3
deoarece avem 2x(1) − 3x(2) + x(3) = θ.

Teorema 2.3.1 Sistemul S = {x(1) , x(2) , . . . , x(n) } de vectori este liniar dependent, dacă şi numai dacă
cel puţin unul din vectorii lui S se poate exprima ca o combinaţie liniară de ceilalţi vectori ai sistemului.

Demonstraţie. Dacă sistemul S este liniar dependent, atunci există scalarii a1 , a2 , . . . , an ∈ K, nu


toţi nuli, astfel ca a1 x(1) + . . . + an x(n) = θ. Presupunem că a1 = 0, atunci x(1) = −a2 a−1 1 x
(2)

−1 (3) −1 (n) (1)
a3 a1 x − . . . − an a1 x , ceea ce ne arată că vectorul x se exprimă ca o combinaţie liniară de
vectorii x(2) , . . . , x(n) .
Reciproc, dacă cel puţin un vector, de exemplu x(1) , se exprimă ca o combinaţie liniară de ceilalţi,
atunci putem scrie x(1) = −a2 x(2) − . . . − an x(n) , de unde x(1) + a2 x(2) + . . . + an x(n) = θ, cu coeficientul
lui x(1) nenul, ceea ce ne arată că vectorii x(1) , . . . , x(n) sunt liniar dependenţi.

Propoziţia 2.3.1 Într-un spaţiu vectorial V peste câmpul K sunt valabile afirmaţiile:

i) vectorul nul θ formează un sistem liniar dependent;

ii) orice vector x = θ formează un sistem liniar independent;

iii) orice sistem de vectori din care se poate extrage un sistem liniar dependent este de asemenea liniar
dependent.

Demonstraţie. i) Valabilitatea acestei afirmaţii rezultă din 1 · θ = θ.


ii) Pentru x = θ din ax = θ, a ∈ K, rezultă a = 0.
iii) Dacă pentru sistemul de vectori S = {x(1) , x(2) , . . . , x(n) }, n > 1, există subsistemul
{x(1) , . . . , x(m) }, m < n, liniar dependent, atunci există scalarii a1 , . . . , an ∈ K astfel cu a1 x(1) + a2 x(2) +
. . . + am x(m) = θ. De aici, avem a1 x(1) + a2 x(2) + . . . + am x(m) + 0 · x(m+1) + 0 · x(n) = θ şi deci sistemul
S este liniar dependent.

Corolarul 2.3.1 Sunt valabile afirmaţiile:

16
i) Orice sistem de vectori care conţine vectorul nul este liniar dependent;
ii) Orice subsistem al unui sistem liniar independent de vectori este, de asemenea, liniar independent.

Definiţia 2.3.2 Un sistem infinit de vectori din spaţiul vectorial V se numeşte liniar independent dacă
orice subsistem finit al său este liniar independent. În caz contrar se zice că sistemul este liniar dependent.

Exemplul 2.3.3. În spaţiul vectorial Hom(R, R) sistemul {1, x, x2 , . . . , xn , . . . este liniar independent.
Într-adevăr, orice relaţie de forma

ai1 xi1 + ai2 xi2 + . . . + aik xik = θ, (∀)x ∈ R,

unde i1 < i2 < < ik , are loc numai dacă ai1 = ai2 = . . . = aik = 0, adică orice subsistem finit este liniar
independent.
Definiţia 2.3.3 Un sistem B, finit sau infinit, de vectori din spaţiul vectorial V se numeşte bază pentru
spaţiul vectorial V , dacă B este liniar independent şi B este un sistem de generatori pentru V .
Exemple. 2.3.4. În spaţiul Rn sistemul B = {e(1) , e(2) , . . . , e(n) }, e(1) = (1, 0, . . . , 0), . . . , e(n) =
(0, 0, . . . , 1) formează o bază. S-a arătat că B este liniar independent (v.exemplul 2.3.1) şi constituie
un sistem de generatori pentru Rn (v.exemplul 2.2.4).
Această bază a lui Rn se numeşte baza canonică sau naturală.
2.3.5. În spaţiul vectorial Pn al polinoamelor de grad cel mult n, n ≥ 1, peste câmpul R, o bază
este dată de sistemul B = {1, x, x2 , . . . , xn }.
Teorema 2.3.2 Sistemul de vectori B = {e(1) , e(2) , . . . , e(n) } constituie o bază pentru spaţiul vectorial V
peste câmpul K, dacă şi numai dacă orice vector din V se exprimă ı̂n mod unic ca o combinaţie liniară
de vectorii lui B.
Demonstraţie. Dacă B este bază a spaţiului vectorial V , atunci orice x ∈ V se scrie sub forma

n
x= , ak e(k) , a1 , a2 , . . . , an ∈ K. Dacă mai avem şi x = bk e(k) , b1 , . . . , bn ∈ K, atunci obţinem
k=1 k=1

n
(ak −bk )e(k) = θ, de unde, folosind faptul că B este liniar independent, rezultă ak = bk , k = 1, 2, . . . , n,
k=1
adică scrierea lui x ı̂n baza B este unică.
Reciproc, dacă orice vector din spaţiul V se exprimă ı̂n mod unic ca o combinaţie liniară de vectorii

n
lui B, atunci şi vectorul nul are această proprietate, adică din θ = ak e(k) rezultă ak = 0, k = 1, n (se
k=1
foloseşte unicitatea scrierii), ceea ce ne arată că B este liniar independent.
Definiţia 2.3.4 Dacă B = {e(1) , e(2) , . . . , e(n) } este o bază a spaţiului vectorial V peste câmpul K, atunci

n
scalarii a1 , a2 , . . . , an ∈ K din scrierea x = ak ek se numesc componentele sau coordonatele
k=1
vectorului x ı̂n baza B.

Teorema 2.3.3 (teorema ı̂nlocuirii a lui Steinitz.) Dacă B = {e(1) , e(2) , . . . , e(n) } este o bază ı̂n

n
spaţiul vectorial V peste câmpul K şi x = ak e(k) este un vector din V ce satisface condiţia at = 0,
k=1
atunci sistemul B1 = {e(1) , e(2) , . . . , e(t−1) , x, e(t+1) , . . . , e(n) } este, de asemenea, o bază pentru V .

Demonstraţie. Să arătăm mai ı̂ntâi că B1 este liniar independent. Dacă b1 e(1) + . . . + bt−1 e(t−1) + bt x +
bt+1 e(t+1) + . . . + bn e(n) = θ, atunci ı̂nlocuind pe x cu expresia lui, găsim:

(b1 + bt a1 )e(1) + . . . + (bt−1 + bt at−1 )e(t−1) + bt at e(t) +

+(bt+1 + bt at+1 )e(t+1) + . . . + (bn + bt an )e(n) = θ.

17
Cum B este bază ı̂n spaţiul vectorial V , din egalitatea precedentă rezultă:

b1 + bt a1 = 0, . . . , bt−1 + bt at−1 = 0, bt at = 0, bt+1 + bt at+1 =

= 0, . . . , bn + bt an = 0.
Deoarece at = 0, deducem bt = 0 şi deci b1 = b2 = . . . = bn = 0, ceea ce ne arată că B1 este liniar
independent.
Să arătăm acum că B1 este un sistem de generatori pentru V . Fie y un vector din V , care ı̂n baza

n
B are scrierea y = ck e(k) . Cum at = 0, din scrierea lui x avem
k=1

e(t) = a−1
t (x − a1 e
(1)
− . . . − at−1 e(t−1) − at+1 e(t+1) − . . . − an e(n) ),

ı̂nlocuind pe e(t) ı̂n y, obţinem

(2.1) y = (c1 − a−1


t a1 ct )e
(1)
+ . . . + (ct−1 − a−1
t at−1 ct )e
(t−1)
+ a−1
t ct x+

+(ct+1 − a−1
t at+1 ct )e
(t+1)
+ . . . + (cn − a−1
t an ct )e
(n)
,
ceea ce ne arată că B1 este un sistem de generatori pentru V .

Observaţia 2.3.1 Prin inducţie matematică se poate demonstra următorul rezultat (teorema generală
a ı̂nlocuirii): dacă B = {e(1) , e(2) , . . . , e(n) } este o bază ı̂n spaţiul vectorial V peste câmpul K şi S =
{x(1) , x(2) , . . . , x(p) } este un sistem de vectori liniar independent din V , atunci p ≤ n şi putem ı̂nlocui p
vectori din B prin vectorii lui S, astfel ca, renumerotând vectorii, B1 = {x(1) , . . . , x(p) , e(p+1) , . . . , e(n) }
să fie, de asemenea, bază pentru V .

Comentariul 2.3.1 Demonstraţia Teoremei 10.3.3 ne dă şi procedeul practic de ı̂nlocuire a unui vector
dintr-o bază cu un alt vector, cât şi formulele de calcul al coordonatelor unui vector ı̂n noua bază. Intr-

n
adevăr, pentru coordonatele vectorului y = ck e(k) ı̂n noua bază B1 din formula (2.1) rezultă formulele
k=1

ck at − ak ct
(2.2) yk = ck − a−1
t ak ct = , pentru k = t
at
şi
ct
(2.3) yt = a−1
t ct = , pentru k = t.
at

Formulele (2.2) şi (2.3) ne dau regulile de aflare a componentelor lui y ı̂n baza B1 , ı̂n care ı̂n
locul vectorului e(t) s-a introdus vectorul x. Formula (2.3) arată că noua componentă a vectorului y
corespunzătoare vectorului x ce intră ı̂n locul lui e(t) , se obţine prin ı̂mpărţirea componentei sale ct (de
pe linia ”t”) la componenta at a lui x de pe coloana t, iar formula (2.2) indică regula: componenta nouă
yk a lui y, de pe o linie arbitrară k, se obţine din vechea componentă ak după regula

at ct at ck − ak ct
echivalentă cu = yk ,
ak ck at

numită şi regula dreptunghiului. Elementul at = 0 se numeşte şi pivot, ceea ce face ca regula drep-
tunghiului să se mai numească şi regula pivotului. De obicei calculele se fac ı̂n tabele succesive de

18
forma
Baza e(1) e(2) ... e(t) ... e(n) ... x y
(1)
..
e 1 0 ... 0 ... . ... a1 c1
..
e(2) 0 1 ... 0 ... . ... a2 c2
.. .. .. .. .. .. ..
. . . ... . ... . ... . .
x
(t)
..
e 0 0 ... 1 ... . ... at ct
.. .. .. .. .. .. ..
. . . ... . ... . ... . .
.. .. .. ..
e(k) . . ... . ... . ... ak ck
.. .. .. .. .. .. ..
. . . ... . ... . ... . .
e(n) 0 0 ... 0 ... 1 ... an cn
Exemplul 2.3.6. Fie vectorii x = (2, 3, 1) şi y = (3, 4, 5) scrişi ı̂n baza canonică din R3 . Scriem
componentele lui y ı̂n baza (e(1) , x, e(3) ).
Avem
Baza e(1) e(2) e(3) x y
(1)
e 1 0 0 2 3
x
 e(2) 0 1 0 3 4
e(3) 0 0 1 1 5
e(1) 1 − 23 0 0 1
3
1 4
x 0 3 0 1 3
e(2) 0 − 13 1 0 11
3

unde elementele de pe linia lui e(2) s-au ı̂mpărţit cu elementul pivot 3, iar celelalte s-au calculat cu regula
dreptunghiului. Pe coloana elementului pivot se pune 1 ı̂n locul elementului pivot şi ı̂n rest 0.
De reţinut că, utilizând această cale de lucru, se poate ı̂nlocui o bază a unui spaţiu vectorial cu o
alta.
Exemplul 2.3.7. În R2 să se ı̂nlocuiască baza canonică cu baza dată de vectorii x(1) = (2, 3) şi x(2) =
(4, 2) şi ı̂n noua bază să se scrie componentele vectorului v = (3, 4).
Avem
Baza e(1) e(2) x(1) x(2) v
x(1)
 e(1) 1 0 2 4 3
e(2) 0 1 3 2 4
1 3
x(1) 2 0 1 2 2
(2)
x
 e(2) − 23 1 0 −4 − 12
x(1) − 41 1
2 1 0 5
4
3
x(2) 8 − 14 0 1 1
8

Observaţia 2.3.2 Metoda elementului pivot este utilizată ı̂n rezolvarea multor probleme de matematică
cu aplicarea ı̂n modelele matematico-economice.

Corolarul 2.3.2 Dacă o bază a unui spaţiu vectorial este formată din n vectori, atunci orice bază a sa
are tot n vectori.

Definiţia 2.3.5 Dacă o bază a unui spaţiu vectorial V este formată din n vectori, atunci spunem că
spaţiul V are dimensiune finită egală cu n. Scriem dim V = n. Spunem că un spaţiu vectorial are o
dimensiune infinită dacă există ı̂n el o bază infinită.

De exemplu, avem dim Rn = n şi dim Hom(R, R) = ∞.


Definiţia 2.3.6 Un spaţiu vectorial V cu dim V = 1 se numeşte dreaptă vectorială ; un spaţiu V
cu dim V = 2 se numeşte plan vectorial .

19
Un subspaţiu W , cu dim W = n − 1. a unui spaţiu vectorial V , cu dim V = n, se numeşte
hiperplan vectorial. Altfel spus, un subspaţiu vectorial W este un hiperplan vectorial dacă el este
suplimentar unei drepte vectoriale.
Definiţia 2.3.7 Se numeşte rangul unui sistem S de vectori din spaţiu vectorial V , dimensiunea
spaţiului vectorial generat de S. Notăm rangul lui S prin rang S.

Propoziţia 2.3.2 Rangul unui sistem de vectori din spaţiul vectorial V nu se modifică dacă:
i) se schimbă ordinea vectorilor;
ii) se ı̂nmulţeşte un vector al sistemului cu un scalar nenul;
iii) se adună la un vector al sistemului un alt vector din sistem, ı̂nmulţit cu un scalar.

Pentru demonstraţie se observă că sistemele de vectori obţinute prin transformările i)–iii) din
propoziţie generează acelaşi subspaţiu vectorial şi deci are acelaşi rang. Transformările i), ii), iii) se
numesc transformări elementare.
Teorema 2.3.4 Rangul unui sistem finit de vectori este egal cu numărul maxim de vectori liniar
independenţi ai sistemului.
Demonstraţie. Fie S = {x(1) , x(2) , . . . , x(m) } un sistem de vectori ı̂n spaţiul vectorial V şi k ≤ m
numărul maxim de vectori liniar independenţi ai lui. Pentru comoditatea scrierii considerăm că vectorii
x(1) , x(2) , . . . , x(k) sunt liniar independenţi, ceea ce implică că ceilalţi vectori ai sistemului se vor exprima
ca şi combinaţii liniare de aceştia, adică

x(k+i) = ai1 x(1) + ai2 x(2) + . . . + aik x(k) , i = 1, 2, . . . , m − k

Acum, adunăm ı̂n sistemul S la fiecare din vectorii x(k+i) , i = 1, 2, . . . , m − k, respectiv vectorul
ai1 x + ai2 x(2) + . . . + aik x(k) şi obţinem sistemul S1 = {x(1) , x(2) , . . . , x(k) , θ, θ, . . . , θ}. După Propoziţia
(1)

2.3.2 sistemul S1 are acelaşi rang cu sistemul S.


Dar ı̂n sistemul S1 sistemul de vectori {x(1) , . . . , x(k) } este o bază, ceea ce ne arată că dimensiunea
lui este k. Prin urmare, rangul lui S1 şi deci şi al lui S este k.
Definiţia 2.3.8 Două spaţii vectoriale V şi W peste acelaşi câmp K se numesc izomorfe dacă există
o aplicaţie f : V → W care să fie izomorfism faţă de operaţiile ce definesc pe V şi W structura de spaţiu
vectorial.

Teorema 2.3.5 Printr-un izomorfism de două spaţii vectoriale se păstrează rangul unui sistem finit de
vectori

Demonstraţie. Fie f : V → W un izomorfism ı̂ntre spaţiile vectoriale V şi W şi S =


{x(1) , x(2) , . . . , x(m) } un sistem de vectori de rang k, k ≤ m, din spaţiul vectorial V . Prin f se obţine
sistemul de vectori S1 = {y (1) , y (2) , . . . , y (m) }, unde y (i) = f (x(i) ), i = 1, m, din W . Pentru comod-
itatea scrierii considerăm că vectorii x(1) , x(2) , . . . , x(k) sunt liniar independenţi. Atunci din relaţia
a1 y (1) +a2 y (2) +. . .+ak y (k) = θ, a1 , a2 , . . . , ak ∈ K, rezultă a1 f (x(1) )+a2 f (x(2) )+. . .+ak f (x(k) ) = θ, iar
de aici f (a1 x(1) +a2 x(2) +. . .+ak x(k) ) = θ. Cum f este injectivă deducem că a1 x(1) +a2 x(2) +. . .+ak x(k) =
θ şi de aici a1 = a2 = . . . = ak = 0, ceea ce ne arată că vectorii y (1) , y (2) , . . . , y (k) sunt liniar independenţi.
Acum considerând relaţiile

x(k+i) = ai1 x(1) + ai2 x(2) + . . . + aik x(k) , i = 1, 2, . . . , m − r

şi aplicând funcţia f , obţinem

y (k+i) = ai1 y (1) + ai2 y (2) + . . . + aik y (k) , i = 1, 2, . . . , m − r.

Prin urmare, sistemul de vectori y (1) , . . . , y (k) este un sistem de generatori pentru S1 şi deci
rang S1 = rang S.

20
Teorema 2.3.6 Condiţia necesară şi suficientă ca două spaţii vectoriale V şi W peste câmpul K, de
dimensiune finită, să fie izomorfe este ca ele să aibă aceeaşi dimensiune.
Demonstraţie. Necesitatea rezultă imediat aplicând Teorema 2.3.5.
Pentru suficienţă să considerăm spaţiile vectoriale V şi W cu dim V = dim W = n. Fie B =
{e(1) , e(2) , . . . , e(n) } şi B1 = {f (1) , f (2) , . . . , f (n) } câte o bază ı̂n V şi respectiv W . Definim, aplicaţia

n
n
h : V → W după regula: pentru orice x ∈ B, x = ai x(i) , h(x) = ai f (i) . Se verifică imediat că h
i=1 i=1
este un izomorfism şi deci spaţiile V şi W sunt izomorfe.
Corolarul 2.3.3 Printr-un izomorfism ı̂ntre două spaţii vectoriale V şi W de dimensiune finită o bază
din V este dusă ı̂ntr-o bază din W .

Corolarul 2.3.4 Există un izomorfism şi numai unul ı̂ntre două spaţii vectoriale V şi W de dimeniune
finită care să ducă o bază B din V ı̂ntr-o bază dată B1 din W .

Corolarul 2.3.5 Orice spaţiu vectorial V peste câmpul K de dimensiune n este izomorf cu spaţiul K n .

Corolarul 2.3.6 Pentru orice subspaţiu W al unui spaţiu vectorial V avem dim W ≤ dim V .

2.4 Produs scalar. Spaţii normate. Spaţii metrice


Fie V un spaţiu vectorial peste corpul K, unde K = R sau K = C.
Definiţia 2.4.1 Se numeşte produs scalar pe V , orice aplicaţie < · , · >: V × V → K, cu proprietăţile:
P1. < x, x >≥ 0, oricare ar fi x, y ∈ V şi < x, x >= 0, dacă şi numai dacă x = θ;
P2. < x, y >= < y, x >, (z este conjugatul lui z ı̂n C), oricare ar fi x, y ∈ V ;
P3. < λx, y >= λ < x, y >, oricare ar fi λ ∈ K şi x, y ∈ V ;
P4. < x + y, z >=< x, z > + < y, z >, oricare ar fi x, y, z ∈ V .
Dacă K = R, cum un număr real este egal cu conjugatul său rezultă că P 2 devine < x, y >=<
y, x >, adică produsul scalar este comutativ.

Definiţia 2.4.2 Un spaţiu vectorial peste câmpul K = R ∨ C ı̂nzestrat cu un produs scalar se numeşte
spaţiu prehilbertian. Dacă K = R, atunci spaţiul se numeşte euclidian, iar dacă K = C atunci spaţiul
vectorial ı̂nzestrat cu un produs scalar se numeşte unitar .

Exemple. 2.4.1. Dacă ı̂n Rn considerăm vectorii x = (x1 , . . . , xn ) şi y = (y1 , y2 , . . . , yn ) şi definim

n
< x, y >= xi yi , atunci Rn devine un spaţiu euclidian. Prin simple calcule se verifică proprietăţile
i=1
P1 − P4 .
2.4.2. În Cn produsul scalar al vectorilor x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) se defineşte prin

n
< x, y >= xi yi ,
i=1

devenind astfel un spaţiu unitar.


b
2.4.3. Pe spaţiul vectorial C[a, b] al funcţiilor reale continue, expresia < f, g >= f (x)g(x)dx
a
este un produs scalar.
Definiţia 2.4.3 Se numeşte normă peste spaţiul vectorial V peste K = R∨C orice aplicaţie  ·  : V → R
cu următoarele proprietăţi:

21
N1. x = 0, dacă şi numai dacă x = θ;

N2. λx = |λ| x, oricare ar fi λ ∈ K şi x ∈ V ;

N3. x + y ≤ x + y (inegalitatea triunghiurilor), oricare ar fi x, y ∈ V .

Dacă ı̂n N 3 punem y = −x, atunci rezultă x ≥ 0, pentru orice x ∈ V .

Definiţia 2.4.4 Un spaţiu vectorial V peste K este normat dacă pe el s-a definit o normă. Scriem
(V,  · ).

Teorema 2.4.1 Dacă (V, < · , · >) este un spaţiu euclidian, atunci pentru orice x, y ∈ V are loc
inegalitatea √
| < x, y > | ≤ < x, x > · < y, y >.
numită inegalitatea lui Cauchy–Schwarz–Buniakowscki.

Demonstraţie. Pentru orice x, y ∈ V şi orice λ ∈ R, avem < x + λy, x + λy >≥ 0. De aici, folosind
P 2 − P 4 obţinem
(2.4) < y, y > λ2 + 2λ < x, y > + < x, x >≥ 0
pentru orice λ ∈ R.
Dacă y = θ inegalitatea (10.8) devine

(2.5) 2λ < x, θ > + < x, x >≥ 0.

Dar < x, θ >=< x, x − x >=< x, x > + < x, −x >=< x, x > + < −x, x >=< x, x > − < x, x >=
0. Cum < x, x >≥ 0, rezultă că (10.8) are loc pentru y = θ şi oricare ar fi x ∈ V .
Deci, putem presupune y = θ, adică < y, y >> 0. Atunci trinomul de gradul doi ı̂n λ din (10.8) va
fi ≥ 0, oricare ar fi λ ∈ R, dacă şi numai dacă Δλ =< x, y >2 − < y, y > · < x, x >≤ 0, de unde rezultă

| < x, y > | ≤ < x, x > · < y, y > ceea ce trebuia demonstrat.
Egalitate ı̂n inegalitatea lui Cauchy–Schwarz–Buniakowski se obţine numai dacă x = −λy, adică
vectorii x şi y sunt coliniari.

Observaţia 2.4.1 Pentru x = (x1 , . . . , xn ), y = (y1 , y2 , . . . , yn ) vectori din Rn inegalitatea Cauchy–


Schwarz–Buniakowski ia forma
2 n n

xi yi ≤ x2i yi2 ,
i=1 i=1 i=1

cu egalitate numai dacă x1 /y1 = x2 /y2 = . . . = xn /yn = λ ∈ R.

Teorema 2.4.2 Dacă (V, < · , · >) este un spaţiu euclidian, aplicaţia  ·  : V → R, definită prin

x = < x, x > este o normă pe V , numită norma generată de produsul scalar.
Altfel spus, un spaţiu prehilbertian este un spaţiu normat.

Demonstraţie. Trebuiesc verificate proprietăţile normei. Din x = 0 avem < x, x >= 0, de unde, pe
baza lui P 1, deducem x = θ, ceea√ce ne demonstrază
 N 1.
Pentru N 2 avem λx = < λx, λx > = λ2 < x, x > = |λ| x, pentru orice λ ∈ R şi orice
x∈V.
Pentru a demonstra N 3 putem scrie x + y2 =< x + y, x + y >=
< x, x > +2 < x, y > + < y, y >≤ x2 + 2x · y + y2 = (x + y)2 (s-a folosit inegalitatea lui
Cauchy–Schwarz–Buniakowski), de unde rezultă x + y ≤ x + y, oricare ar fi x, y ∈ V .

Observaţia 2.4.2 Teoremele 10.4.1 şi 10.4.2 rămân adevărate şi pentru spaţiile vectoriale unitare.

22
Definiţia 2.4.5 Fie (V, < · , · >) un spaţiu vectorial euclidian. Oricare ar fi vectorii x, y ∈ V , diferiţi
de vectorul nul, numărul real ϕ ∈ [0, π] definit prin
< x, y >
cos ϕ = ,
x · y

se numeşte unghiul dintre x şi y. Unghiul ϕ se notează şi prin (


x, y).
Dacă < x, y >= 0, atunci ϕ = π/2, iar vectorii x şi y se numesc ortogonali.
Un vector v se numeşte versor dacă v = 1.

Definiţia 2.4.6 Fie A o mulţime nevidă. Se numeşte metrică (distanţă) pe A, orice aplicaţie d :
A × A → R cu următoarele proprietăţi:

M1 . d(x, y) = 0, dacă şi numai dacă x = y (separare);

M2 . d(x, y) = d(y, x), pentru orice x, y ∈ A (simetrie);

M3 . d(x, z) ≤ d(x, y) + d(y, z), pentru orice x, y, z ∈ A (inegalitatea triunghiului).

Definiţia 2.4.7 Se numeşte spaţiu metric orice mulţime nevidă A ı̂nzestrată cu o metrică. Notăm cu
(A, d) mulţimea A ı̂nzestrată cu metrica d.

Observaţia 2.4.3 Pentru orice x, y ∈ (A, d) avem d(x, y) ≥ 0.

Într-adevăr, din M3 , punând z = x, rezultă

0 ≤ d(x, y) + d(y, x) = 2d(x, y),

de unde d(x, y) ≥ 0. 
1, x = y
Exemple. 2.4.4. Aplicaţia d : A × A → R prin d(x, y) = este o metrică pe A, numită
0, x=y
metrica grosieră.
2.4.5. Aplicaţia d : R × R → R, d(x, y) = |x − y| este o metrică pe R.

Teorema 2.4.3 Dacă (V,  · ) este un spaţiu vectorial normat, atunci aplicaţia d : V × V → R definită
prin d(x, y) = x − y este o metrică pe V , numită metrica generată de normă.

Demonstraţie. Trebuie să arătăm că d verifică proprietăţile M1 − M3 . Pentru M1 din d(x, y) = 0, avem
x − y = 0, de unde, pe baza lui N1 , obţinem x = y. Proprietatea de simetrie M 2 rezultă astfel:

d(x, y) = x − y = (−1)(y − x) = |(−1)| y − x = d(y, x),

pentru orice x, y ∈ V .
Inegalitatea triunghiului pentru d rezultă astfel:

d(x, y) = x − z = x − y + (y − z) ≤ x − y + y − z = d(x, y) + d(y, z),

pentru orice x, y, z ∈ V .
Observaţia 2.4.4 Pentru spaţiile euclidiene Rn metrica generată de norma dată de produsul scalar
conduce la 
 n


d(x, y) =  (xi − yi )2
i=1

oricare ar fi x = (x1 , . . . , xn ) ∈ R şi y = (y1 , . . . , yn ) ∈ R. numită şi metrica euclidiană.

23
2.5 Mulţimi convexe
În acest paragraf vom introduce noţiunea de mulţime convexă şi proprietăţile ei. Ea are o
importanţă deosebită ı̂n rezolvarea modelelor matematico–economice de programare liniară.
Definiţia 2.5.1 Fie x = (x1 , . . . , xn ) şi y = (y1 , . . . , yn ) doi vectori din Rn . Vectorul z = ax + (1 − a)y,
cu a ∈ [0, 1] se numeşte combinaţia liniară convexă a vectorilor x şi y.
Definiţia 2.5.2 Dacă x, y ∈ Rn mulţimea {z ∈ Rn |z = ax + (1 − a)y, a ∈ [0, 1]} se numeşte segmentul
de dreaptă de extremităţi x şi y. El se notează cu [x, y]. Dacă a ∈ (0, 1), atunci segmentul deschis
dat de x şi y se notează cu (x, y).
Pe R segmentul [x, y] şi segmentul deschis (x, y) coincid cu intervalul ı̂nchis [x, y] respectiv inter-
valul deschis (x, y)
Definiţia 2.5.3 O mulţime A ⊆ Rn se numeşte mulţime convexă, dacă oricare ar fi x, y ∈ A avem
[x, y] ⊆ A. Altfel spus, oricare ar fi două puncte din A, segmentul [x, y] este o mulţime din A.
Exemple. 2.5.1. Fie a = (a1 , a2 , . . . , an ) ∈ Rn un vector fixat din Rn şi b un număr real dat. Mulţimea
H = {x ∈ Rn | < a, x >= b} este convexă.
Fie λ ∈ [0, 1]. Pentru orice x, y ∈ H avem
< a, λx + (1 − λ)y >= λ < a, x > +(1 − λ) < a, y >= λb + (1 − λ)b = b
ceea ce ne arată că [x, y] ⊆ H.
Mulţimea H este un hiperplan ı̂n Rn de ecuaţie a1 x1 +a2 x2 +. . .+an xn = b, dacă x = (x1 , . . . , xn ) ∈
R .
n

2.5.2. În ipotezele de la 2.5.1, mulţimile S1 = {x ∈ Rn | < a, x >≤ b} şi S2 = {x ∈ Rn | < a, x >≥
b}, numite şi semispaţiile determinate de hiperplanul H, sunt mulţimi convexe.
2.5.3. Mulţimile
Ma,b = {z ∈ Rn |z = ax + by, x, y ∈ Rn , a, b ≥ 0}
sunt convexe. Ele sunt numite şi conuri convexe.
2.5.4. Mulţimea S0 = {x ∈ Rn |ax ≤ 0, a ∈ Rn , fixat } este un con convex, ı̂n timp ce S1 şi S2 , cu
b = 0, din exemplul 2.5.2 nu sunt conuri convexe.
Propoziţia 2.5.1 Intersecţia a două mulţimi convexe este o mulţime convexă.
Demonstraţie. Fie A şi B două mulţimi convexe din Rn . Pentru orice λ ∈ [0, 1] şi x, y ∈ A ∩ B avem
λx + (1 − λ)y ∈ A ∩ B .
Propoziţia 2.5.1 rămâne valabilă pentru orice familie numărabilă de mulţimi convexe.
Definiţia 2.5.4 Mulţimea A ⊆ Rn se numeşte con poliedral convex, dacă oricare ar fi x ∈ A se poate
scrie ca o combinaţie liniară nenegativă de un număr finit de elemente x(i) ∈ A, adică

k
x= ai x(i) , ai ≥ 0, i = 1, k
i=1

Orice subspaţiu a lui R este un con poliedral convex.


n

Definiţia 2.5.5 Fie A ⊆ Rn o mulţime. Mulţimea tuturor combinaţiilor liniare convexe de elemente din
A se numeşte acoperirea convexă a lui A. Ea se notează prin Co(A).
Propoziţia 2.5.2 Co(A) este convexă şi A ⊆ Co(A). Dacă A este convexă, atunci Co(A) = A.
Demonstraţia propoziţiei este imediată.
Definiţia 2.5.6 Dacă A ⊆ Rn este o mulţime convexă, atunci elementul
x(0) ∈ A se numeşte punct extremal pentru A dacă nu există x, y ∈ A,
a ∈ (0, 1) aşa ı̂ncât să avem x(0) = ax + (1 − a)y, adică x(0) nu poate fi interior segmentului [x, y], oricare
ar fi x, y ∈ A.
Exemplu. 2.5.5. Vârfurile unui triunghi sunt punctele sale extremale.

24
2.6 Testul Nr. 1 de verificare a cunoştinţelor

1. Definiţi următoarele noţiuni:

a) Spaţiu vectorial;
b) Acoperirea liniară;
c) Bază a a unui spaţiu vectorial;
d) Produs scalar;
e) Normă;
f) Metrică;
g) Combinaţie liniară convexă;
h) Mulţime convexă.

2. Arătaţi că dacă (K, +, ·) este corp comutativ şi n ∈ N, iar K n = {x = (x1 , ..., xn ) | xi ∈ K, i = 1, n},
pentru n ≥ 1, atunci mulţimea K n ı̂nzestrată cu operaţiile

x + y def (x1 + y1 , ..., xn + yn )


α · x def (αx1 , ..., αxn ) , α∈K

este un spaţiu vectorial peste K.

3. Arătaţi că B = {v, u, w}, v = (2, 1, −1), u = (1, −1, 1) şi w = (1, 2, −1) este o bază ı̂n R3 şi să se
afle coordonatele vectorului t = (3, 6, 1) ı̂n această bază.

4. Fie ı̂n R4 baza B = {x1 , x2 , x3 , x4 } cu x1 = (1, 1, 2, 1), x2 = (1, −1, 0, 1), x3 = (0, 0, −1, 1), şi
x4 = (1, 2, 2, 0). Vectorul v are coordonatele (1, 2, 2, 1) ı̂n această bază. Găsiţi coordonatele lui v ı̂n
baza B  = {y1 , y2 , y3 , y4 } cu y1 = x1 , y2 = x2 , y3 = 2x1 + 2x2 + 2x3 + 2x4 şi y4 = x4 .

5. Fie ı̂n R3 baza B = {x1 , x2 , x3 } cu x1 = (1, 0, 0), x2 = (2, 1, 0), x3 = (−3, 2, 1) şi vectorul v =
−8x1 + 4x2 − x3 . Găsiţi coordonatele vectorului v ı̂n baza B  = {y1 , y2 , y3 }, cu y1 = x1 + x2 + x3 ,
y2 = x1 + x2 − x3 şi y3 = x1 − x2 + x3 .

n
6. Arătţi că (Rn , d) unde d : Rn × Rn → R, d(x, y) = |xk − yk |, x = (x1 , ..., xn ) şi y = (y1 , ..., yn )
k=1
este spaţiu metric.

7. Arătaţi că aplicaţia < ·, · > : R2 × R2 → R definită prin < x, y >= 3x1 y1 − x1 y2 − x2 y1 + 2x2 y2 ,
x = (x1 , x2 ) şi y = (y1 , y2 ), este un produs scalar.

8. Să se arate că ı̂ntr-un spaţiu prehilbertian real oarecare are loc pentru orice vectori x şi y egalitatea:
x + y2 + x − y2 = 2(x2 + y2 ).

9. Demonstraţi că orice spaţiu prehilbertian real X este şi spaţiu normat.
10. Fie a, b ∈ R cu a < b. Arătaţi că [a, b] = {x ∈ R | a ≤ x ≤ b} este o mulţime convexă.

25
Indicaţii şi răspunsuri

Testul 1

2. Se verifică condiţiile prezentate ı̂n definiţia noţiunii de spaţiu vectorial.

3. Se verifică condiţiile de liniar independenţă şi sistem de generatori ale sistemului de


vectori B. Folosind relaţiile găsite la verificarea condiţiei de sistem de generatori ale
sistemului de vectori B se găseşte tB = (−4, 4, 7).

4. Se obţine tabelul
v(xi ) 1 2 2 1
y3 (xi ) 2 2 2 2
v(yi ) -1 0 1 -1
Deci v(yi ) = (−1, 0, 1, −1).
 
3 9
5. Se foloseşte matricea de trecere şi se obţine v(yi ) = , ,2 .
2 2
6. Se verifică condiţiile impuse asupra aplicaţiei d ı̂n definiţiea noţiunii de metrică.

7. Se verifică condiţiile din definiţia noţiunii de produs scalar.


8. Se foloseşte definiţia normei induse de produsul scalar şi proprietăţile produsului scalar

(x = < x, x >).

9. Se foloseşte definiţia normei induse de produsul scalar (x = < x, x >) şi se verifică
condiţiile din definiţia noţiunii de normă. Remarcăm că folosim şi inegalitatea Cauchy-
√ √
Baniakowski-Schwarz: < x, y >≤ < x, x > · < y, y >.

10. Se arată că oricare ar fi x, y din [a, b] segmentul cu extremitatea iniţială ı̂n x şi cea finală
ı̂n y aparţine tot lui [a, b].

26
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul I,
Editura ULB, Sibiu, 2001.

27
Capitolul 3

Matrice. Determinanţi. Sisteme de


ecuaţii liniare

Obiective: Scopul acestui capitol este de a oferi studenţilor metode rapide de


soluţionare a problemelor legate de matrici, determinanţi şi sisteme de ecuaţii liniare.
Rezumat: În prezentul capitol sunt prezentate atât metodele cunoscute din liceu,
precum şi metode avansate, de aflare a inversei unei matrici, de calcul a valorii unui deter-
minant şi de rezolvare a unui sistem de ecuaţii liniare, metode care se vor aplica ı̂n capitolele
ulterioare.
Conţinutul capitolului:
1. Matrice
2. Determinanţi
3. Sisteme de ecuaţii liniare
4. Test de verificare a cunoştinţelor
5. Bibliografia aferentă capitolului
Cuvinte cheie: matrice, determinant, sistem de ecuaţii libiare, Gauss, Gauss-
Jordan, metoda lui Chio.

3.1 Matrice
Definiţia 3.1.1 Se numeşte matrice de tipul m×n peste un câmp K un tablou dreptunghiular
A format din m × n elemente din K situate pe m linii şi n coloane.
Scriem ⎛ ⎞
a11 a12 . . . a1n
⎜ a21 a22 . . . a2n ⎟
⎜ ⎟
A=⎜ . .. .. .. ⎟
⎝ .. . . . ⎠
am1 am2 am3 amn
sau condensat
A = (aij ) i=1,m ,
j=1,n

unde aij reprezintă elementul matricei situat pe linia i şi coloana j.

Elementele a11 , a22 , . . . formează diagonala principală a matricei, iar elementele


a1n , a2,n−1 , . . . diagonala secundară.
Notăm cu Mm×n (K) mulţimea matricelor de tipul m × n peste câmpul K, iar cu M(K)
mulţimea tuturor matricelor peste câmpul K. Dacă m = n, matricele se numesc pătratice
de ordin n.
Dacă m = 1, matricea se numeşte matrice sau vector linie. Dacă n = 1, matricea se
numeşte matrice sau matrice coloană.

28
Unei matrice A de tip m × n i se poate ataă sistemul ordonat de m vectori linie din
K n dat de
Li = (ai1 , ai2 , . . . , ain ), i = 1, m
şi sistemul ordonat de n vectori coloană

Cj = t (a1j , a2j , . . . , amj ), j = 1, n.

Definiţia 3.1.2 Două matrice de acelaşi tip sunt egale dacă elementele corespunzătoare sunt
egale.

Definiţia 3.1.3 Se numeşte suma matricelor A = (aij ) şi B = (bij ), ambele de tipul m × n
peste K, matricea notată cu A + B dată de regula A + B = (aij + bij ). Operaţia care realizează
această regulă se numeşte adunarea matricelor.
Matricea O ∈ Mm×n (K) cu toate elementele nule se numeşte matricea nulă. Fiind
dată matricea A = (aij ) ∈ Mm×n (K), matricea −A = (−aij ) ∈ Mm×n (K) se numeşte opusa lui
A.

Se verifică imediat că (Mm×n (K), +) este un grup comutativ.


Definiţia 3.1.4 Se numeşte produsul matricei A = (aij ) ∈ Mm×n (K) cu scalarul α ∈ K, ma-
tricea notată αA, obţinută prin regula αA = (αaij ) ∈ Mm×n (K). Operaţia dată de această
regulă se numeşte ı̂nmulţirea cu un scalar a matricelor.
Înmulţirea cu un scalar a matricelor verifică proprietăţile evidente

1 · A = A, α(A + B) = αA + αB, (α + β)A = αA + βA, α(βA) = (αβ)A,

oricare ar fi α, β ∈ K şi A, B ∈ Mm×n (K).


Rezultă că are loc propoziţia:
Propoziţia 3.1.1 Mulţimea matricelor Mm×n (K) ı̂n raport cu operaţiile de adunare şi de
ı̂nmulţire cu un scalar are o structură de spaţiu vectorial peste K.
Dimensiunea spaţiului vectorial Mm×n (K) este mn. Într-adevăr se observă că orice
A = (aij ) ∈ Mm×n (K) se scrie ı̂n mod unic sub forma

n
A= aij E (ij) ,
i=1 j=1

unde E (ij) sunt matricele de tipul m × n, care au toate elementele egale cu 0, ı̂n afară de cel
de pe linia i şi coloana j care este egal cu 1.
Definiţia 3.1.5 Se numeşte transpunere ı̂n mulţimea M(K) a matricelor peste K, aplicaţia
t : M(K) → M(K), definită prin t(A) = t A, unde A = (aij ) ∈ Mm×n (K), iar t A = (aji ) ∈
Mn×m (K). Matricea t A se numeşte transpusa lui A.
Se observă uşor că transpusa este o funcţie bijectivă, care verifică proprietăţile: 1)
( A) = A; 2) t (A + B) = t A + t B şi 3) t (αA) = αt A, oricare ar fi A, B ∈ Mm×n (K) şi α ∈ K.
t t

De aici rezultă că transpunerea este un izomorfism ı̂ntre spaţiile vectoriale Mm×n (K) şi
Mn×m (K).
Definiţia 3.1.6 O matrice pătratică A = (aij ) ∈ Mn×n (K) se numeşte simetrică dacă A = t A,
adică elementele simetrice faţă de diagonala principală sunt egale aij = aji , i, j = 1, n.

Definiţia 3.1.7 O matrice pătratică A = (aij ) ∈ Mm×n (K) e numeşte antisimetrică dacă A =
−t A, adică elementele simetrice faţă de diagonala principală sunt opuse aij = −aji i, j = 1, n.

Definiţia 3.1.8 O matrice pătratică se numeşte triunghiulară superioară respectiv inferioară


dacă toate elementele situate dedesuptul, respectiv deasupra diagonalei principale sunt nule.

29
Definiţia 3.1.9 O matrice pătratică se numeşte diagonală dacă toate elementele ei sunt nule
cu excepţia celor de pe diagonala principală.

Teorema 3.1.1 Teorema rangului. Pentru o matrice rangul sistemului de vectori linie este
egal cu rangul sistemului de vectori coloană.

Demonstraţie. Fie A = (aij ) ∈ Mm×n (K) şi r şi p rangurile sistemelor de vectori linie
Li = (ai1 , ai2 , . . . , ain ), i = 1, m şi coloană Cj = (a1j , a2j , . . . , amj ), j = 1, n. Nu restrângem
generalitatea, dacă presupunem că primele r linii sunt liniare independente, deoarece o
schimbare a ordinii liniilor păstrează rangul sistemului vectorilor linie. O astfel de schimbare
modifică vectorii coloană. Fiecare vector coloană se scrie

m
Cj = aij e(i) ,
i=1

unde B = {e(1) , e(2) , . . . , e(m) } este baza canonică din K m , este dus ı̂n vectorul

m
Cj = aij f (i) ,
i=1

unde B1 = {f (1) , f (2) , . . . , f (m) } este noua bază din K m , obţinută din B prin schimbarea ordinii
vectorilor ei, corespunzătoare schimbării liniilor matricei A. Considerăm, acum, automor-
fismul spaţiului K m , care duce baza B ı̂n baza B1 , acesta ducând vectorii Cj ı̂n vectorii Cj şi
deci păstrează rangul sistemului format de ei. Celelalte linii ale matricei A se vor exprima
ca şi combinaţii liniare de primele r, adică putem scrie

Lr+s = αr+s,1 L1 + αr+s,2 L2 + . . . + αr+s,r Lr , s = 1, 2, . . . , m − r,

de unde, folosind egalitatea vectorilor ı̂n K n , rezultă

ar+s,j = αr+s,1 a1j + αr+s,2 a2j + . . . + αr+n,r arj , j = 1, . . . , n.

Înlocuind ı̂n expresiile coloanelor Cj , obţinem

m−r
Cj = aij e(i) + ar+s,j e(r+s) =
i=1 s=1

m−r
= aij e(i) + (αr+s,1 a1j + αr+s,2 a2j + . . . + αr+s,r arj )e(r+s) , j = 1, n.
i=1 s=1

Cum coeficienţii αr+s,j , j = 1, n sunt independenţi de ordinea liniilor, grupând termenii


care conţin pe aij , obţinem


r

m−r
Cj = aij e(i) + αr+s,i e(r+s) , j = 1, n.
i=1 s=1
m−r
Punând g (i) = e(i) + s=1 αr+s,i e(r+s) , i = 1, r, rezultă

r
Cj = aij g (i) , j = 1, n.
i=1

Am dedus că cei n vectori coloană se exprimă ca şi combinaţii liniare de r vectori g (i)
din K m , iar rangul p al sistemului format de ei este cel mult egal cu numărul generatorilor
g (i) , deci p ≤ r.
Dacă acum schimbăm rolul coloanelor şi liniilor şi facem acelaşi raţionament, obţinem
r ≤ p. Din p ≤ r şi r ≤ p rezultă r = p, ceea ce trebuia demonstrat.

30
Definiţia 3.1.10 Rangul comun al sistemelor de vectori linii sau coloane a unei matrice se
numeşte rangul ei.
Altfel spus, rangul unei matrice este egal cu numărul maxim de linii sau coloane liniar
independent, ı̂ntre ele.
Propoziţia 3.1.2 Rangul unei matrici este egal cu rangul transpusei sale.
Demonstraţie. Deoarece prin transpunere sistemul de vectori linie al unei matrici devine
sistemul de vectori coloană al transpusei matricei, din teorema rangului rezultă că matricea
şi transpusa ei au acelaşi rang.
Observaţia 3.1.1 Prin transformări elementare aplicate sistemului de vectori linie sau
coloane, rangul unei matrice nu se modifică.
Valabilitatea acestei observaţii rezultă din teorema rangului şi din faptul că prin efec-
tuarea unor transformări elementare rangul unui sistem de vectori nu se modifică (v.3.3).
Propoziţia 3.1.3 Prin transformări elementare asupra liniilor şi coloanelor, orice matrice
A poate fi transformată ı̂ntr-o matrice B, având toate elementele nule cu excepţia primelor
r elemente de pe diagonala principală, care să fie egale cu 1. Matricea A are atunci rangul
r.
Demonstraţie. Considerăm matricea
⎛ ⎞
a11 a12 ... a1j ... a1n
⎜ .. .. .. .. .. .. ⎟
⎜ . . . . . . ⎟
⎜ ⎟
A=⎜⎜ ai1 ai2 ... aij ... ain ⎟

⎜ . .. .. .. .. .. ⎟
⎝ .. . . . . . ⎠
am1 am2 ... amj ... amn
Dacă A este matricea nulă, atunci afirmaţia propoziţiei este dovedită. Dacă nu, atunci
putem presupune că a11 = 0 (ı̂n caz că a11 = 0 se fac schimbări ale ordinii liniilor sau
coloanelor). Pentru a obţine 1 pe poziţia lui a11 ı̂nmulţim prima linie cu a−1 11 . Pentru a avea
0 pe poziţia ai1 , i = 2, m, ı̂nmulţim acum linia ı̂ntâi cu −ai1 . Elementul aij se ı̂nlocuieşte cu
a11 aij − a1j ai1
aij − a−1
11 a1j ai1 = , i = 2, m, j = 2, n,
an
ı̂n care se recunoaşte regula de calcul a dreptunghiului sau elementului pivot.
Aplicând repetat acest procedeu, după un număr finit de paşi, ajungem că A este
echivalentă (∼) din punctul de vedere al rangului cu matricea
⎛ ⎞
1 0 ... 0 0 ... 0
⎜ 0 1 ... 0 0 ... 0 ⎟
⎜ ⎟
⎜ .. .. .. .. .. .. .. ⎟
⎜ . . . . . . . ⎟
⎜ ⎟
B=⎜ ⎜ 0 0 . . . 1 0 . . . 0 ⎟ linia r

⎜ 0 0 ... 0 0 ... 0 ⎟
⎜ ⎟
⎜ . . .. .. .. .. .. ⎟
⎝ .. .. . . . . . ⎠
0 0 ... 0 0 ... 0
şi deci rangul lui A este r, dat de numărul de cifre 1 din B.
Demonstraţia acestei propoziţii ne dă şi procedeul practic de aflare a rangului unei
matrice, calculele făcându-se cu cunoscuta regulă a dreptunghiului.
Exemplul 3.1.1. Să se afle rangul matricei
⎛ ⎞
0 2 1 1 3
⎜ 2 −1 4 −5 −6 ⎟
A=⎜ ⎝ 1 1 2 −1 0 ⎠ .

1 −2 2 −4 −6

31
Schimbând coloana 1 cu coloana 2 şi ı̂nmulţind coloana 5 cu 1/3 obţinem
⎛ ⎞
2 0 1 1 1
⎜ −1 2 4 −5 −2 ⎟
A∼⎜ ⎝ 1 1 2 −1 0 ⎠ .

−2 1 2 −4 −2

Înmulţim prima linie cu 1/2, apoi pe linia ı̂ntâi şi coloana ı̂ntâi completăm cu 0, iar
restul elementelor le calculăm cu regula dreptunghiului, obţinând
⎛ ⎞
1 0 0 0 0
⎜ 0 2 92 − 29 − 32 ⎟
A∼⎝ ⎜ ⎟.
0 1 32 − 23 − 12 ⎠
0 1 3 −3 −1

Aplicând succesiv acelaşi procedeu avem:


⎛ ⎞ ⎛ ⎞
1 0 0 0 0 1 0 0 0 0
⎜ 0 1 0 0 0 ⎟ ⎜ 0 1 0 0 0 ⎟
A∼⎜ ⎝ 0 0 −
⎟∼⎜
⎠ ⎝
⎟∼
3
4
3
4
1
4 0 0 −3 3 1 ⎠
3 3 1
0 0 4 − 4 − 4
0 0 3 −3 −1
⎛ ⎞ ⎛ ⎞
1 0 0 0 0 1 0 0 0 0
⎜ 0 1 0 0 0 ⎟ ⎜ 0 1 0 0 0 ⎟
∼⎜⎝ 0 0 −3 3 1 ⎠ ∼ ⎝
⎟ ⎜ ⎟,
0 0 1 0 0 ⎠
0 0 0 0 0 0 0 0 0 0
şi deci rang A = 3.
Definiţia 3.1.11 O matrice pătratică de ordin n se numeşte nesingulară sau regulată dacă
rangul ei este egal cu n. În caz contrar, adică dacă rangul ei este mai mic ca n, atunci
matricea se numeşte singulară.

Definiţia 3.1.12 Se numeşte matrice extrasă dintr-o matrice A orice matrice B obţinută din
A ı̂nlăturând anumite linii şi coloane, păstrând ordinea liniilor şi coloanelor rămase.

Teorema 3.1.2 Rangul unei matrice este egal cu ordinul maxim al matricelor pătratice
nesingulare extrase din ea.

Demonstraţie. Fie A o matrice, r rangul ei şi B o matrice pătratică nesingurală extrasă din
A şi de rang maxim p. Cele p linii ale matricei A care intervin ı̂n B sunt liniar independente,
deoarece dependenţa liniară a acestor linii ı̂n A ar atrage dependenţa lor liniară şi ı̂n B, ceea
ce ar face ca B să fie singulară. Prin urmare p ≤ r. Acum să arătăm că oricare p+1 linii din A
sunt liniar independente. Să admitem că există ı̂n A (p + 1) linii liniar independente, atunci,
extrăgând din A matricea formată din ele, am obţine o matrice C de rang (p + 1). Pe baza
teoremei rangului, matricea C are şi p + 1 coloane liniar independente. Acum extrăgând din
C (deci şi din A) matricea D formată din cele p + 1 coloane liniar independente, obţinem o
matrice nesingulară de ordin p + 1, ceea ce ar contrazice alegerea lui p. Rezultă că r < p + 1
şi cum am arătat că p ≤ r, deducem că r = p.
Să introducem acum pe mulţimea M(K) a matricelor operaţia de ı̂nmulţire.
Definiţia 3.1.13 Se numeşte produsul matricei A = (aij ) ∈ Mm×n (K) cu matricea B = (bij ) ∈
Mn×p (K), matricea C = (cij ) ∈ Mm×p (K), unde

cij = ai1 b1j + ai2 b2j + . . . + ain bnj , i = 1, m, j = 1, p.

Scriem C = A · B. Operaţia care realizează acest proces se numeşte ı̂nmulţirea ma-


tricelor.

32
Propoziţia 3.1.4 Înmulţirea matricelor, când are sens, este asociativă.

Demonstraţie. Fie A = (aij ) ∈ Mm×n (K), B = (bij ) ∈ Mn×p (K), C = (cij ) ∈ Mp×q (K). Avem
n  p  n




p
A(BC) = aik bkl clj = aik bkl clj =
k=1 l=1 k=1 l=1
p  n 

= aik bkl clj = (AB)C.


l=1 k=1

Propoziţia 3.1.5 Înmulţirea matricelor este distributivă faţă de adunarea lor.


Demonstraţie. Fie A = (aij ) ∈ Mm×n (K), B = (bij ) ∈ Mn×p (K) şi C = (cij ) ∈ Mn×p (K). Avem
n n



n
A[B + C] = aik [bkj + ckj ] = aik bkj + aik ckj =
k=1 k=1 k=1

n
= aik bkj + aik ckj = AB + AC,
k=1 k=1

adică ı̂nmulţirea este distributivă la stânga faţă de adunare. În mod analog, se demonstrează
şi distributivitatea la dreapta.
Definiţia 3.1.14 Matricea pătratică In = (δij ), i, j = 1, n, unde

1, i = j
δij =
0, i = j i, j = 1, n

este simbolul lui Kronecker, se numeşte matricea unitate de ordinul n.


Altfel spus, matricea In este o matrice diagonală cu toate elementele de pe diagonala
principală egale cu 1. Când nu dorim să precizăm ordinul matricei unitate o vom nota prin
I.
Observaţia 3.1.2 Pentru orice matrice A ∈ Mm×n (K) avem

Im A = A şi AIn = A.

Observaţia 3.1.3 Înmulţirea matricelor, ı̂n general. nu este comutativă.

Din proprietăţile adunării şi ı̂nmulţirii rezultă:


Propoziţia 3.1.6 Mulţimea Mn2 (K) a matricelor pătratice de acelaşi ordin n ı̂nzestrată cu
operaţiile de adunare şi ı̂nmulţire are o structură de inel cu divizori ai lui zero.

Propoziţia 3.1.7 Transpusa unui produs de două matrice este egală cu produsul transpuselor
ı̂n ordine inversă.

Demonstraţie. Fie A = (aij ) ∈ Mm×n (K) şi B = (bij ) ∈ Mn×p (K). Avem
n n n


t t
(AB) = aik bkj = ajk bki = bki ajk = t B t A.
k=1 k=1 k=1

Rezultatul obţinut se poate extinde prin inducţie matematică la un produs cu un


număr finit de factori.
Definiţia 3.1.15 Se numeşte inversa matricei pătratice A, matricea notată cu A−1 , care sat-
isface condiţiile A · A−1 = A−1 · A = I.

33
Teorema 3.1.3 Condiţia necesară şi suficientă ca o matrice pătratică să aibă inversă este
ca ea să fie nesingulară.
Demonstraţie. Necesitatea. Presupunem că matricea A = (aij ) ∈ Mn2 (K) are o inversă pe
A−1 = (bij ) ∈ Mn2 (K). Din A−1 A = I rezultă

n
bik akj = δij , i, j = 1, n.
k=1

de unde, pentru vectorii e(i) , i = 1, n ai bazei canonice obţinem exprimarea


n
(3.1) e(i) = bik Lk ,
k=1

n
Lk , k = 1, n, fiind vectorii linie ai matricei A. Cum pentru orice x ∈ K n avem x = xi e(i) ,
i=1
ı̂nlocuind e(i) din relaţiile (3.1) deducem că orice vector x ∈ K n se exprimă ca o combinaţie
liniară de vectori linie Lk , k = 1, n. Rezultă că sistemul de vectori linie Lk , k = 1, n, generează
spaţiul K n , ceea ce ı̂nseamnă că are rangul n şi deci matricea A este nesingulară.
Suficienţa. Din faptul că A este nesingulară, rezultă că vectorii linie Lk , k = 1, n, sunt
liniar independenţi şi deci formează o bază ı̂n K n . Exprimăm vectorii e(i) , i = 1, n, ai bazei
canonice ı̂n baza dată de vectorii linie şi avem

n
e(i) = bik Lk , i = 1, n,
k=1

de unde, punând B = (bik ), obţinem BA = I.


Matricea A fiind nesingulară are şi vectorii coloană liniar independenţi, formând şi ei
o bază ı̂n K n , şi deci putem scrie AC = I. Acum obţinem
C = IC = (BA)C = B(AC) = BI = B,
de unde C = B = A−1 şi prin urmare matricea A are inversă.
Uşor se arată că inversa unei matrice este unică şi că ea este nesingulară.
Propoziţia 3.1.8 Produsul a două matrice nesingulare este o matrice nesingulară şi inversa
ei este egală cu produsul inverselor luate ı̂n ordine schimbată
(AB)−1 = B −1 · A−1
Demonstraţie. Avem
(AB)(B −1 A−1 ) = A(BB −1 )A−1 = AA−1 = I
şi
(B −1 A−1 )(AB) = B −1 (A−1 A)B = B −1 B = I,
relaţii ce demonstrează afirmaţiile din enunţ.
Rezultatul se extinde prin inducţie matematică la un produs de matrice nesingulare
cu un număr finit de factori.
Pentru aflarea inversei unei matrice se foloseşte transformarea ei ı̂n matrice unitate,
aplicând regula dreptunghiului, după schema
(A|I) =⇒ (A−1 A|A−1 I) =⇒ (I|A−1 ).
Exemplul 3.1.2. Pentru a afla inversa matricei
⎛ ⎞
2 1 3
A=⎝ 3 2 3 ⎠
2 1 2

34
procedăm astfel
⎛  ⎞ ⎛  1 ⎞
2 1 3  1 0 0 1 12 3 
2  2 0 0
(A|I3 ) =⇒ ⎝ 3 2 3  0 1 0 ⎠ =⇒ ⎝ 0 12 − 23  − 32 1 0 ⎠ =⇒
2 1 2  0 0 1 0 0 −1  −1 0 1
⎛  ⎞ ⎛  ⎞
1 0 3  2 −1 0 1 0 0  −1 −1 3
=⇒ ⎝ 0 1 −3  −3 2 0 ⎠ =⇒ ⎝ 0 1 0  0 2 −3 ⎠
0 0 −1  −1 0 1 0 0 1  1 0 −1
Prin urmare, avem ⎛ ⎞
−1 −1 3
A−1 =⎝ 0 2 −3 ⎠ .
1 0 −1
Se poate lucra utilizând regula dreptunghiului fără a ı̂mpărţi la pivot şi transformând
matricea (A|I) extinsă aşa ı̂ncât să ajungem la situaţia (D|C), unde D este matricea diagonală
⎛ ⎞
a11 0 . . . 0
⎜ 0 a22 . . . 0 ⎟
⎜ ⎟
D=⎜ . . . .. ⎟ iar C = (cij ), i, j = 1, n.
⎝ .. .. .. . ⎠
0 0 . . . ann

Pentru a afla inversa A−1 ı̂mpărţim liniile L1 , L2 , . . . , Ln ale matricei C respectiv la:
a11 a22 . . . ann , a22 . . . ann , . . . , ann .
Exemplul 3.1.3. Pentru a afla inversa matricei
⎛ ⎞
2 1 3
A=⎝ 3 3 2 ⎠
1 2 1

procedăm astfel
⎛  ⎞ ⎛  ⎞
2 1 3  1 0 0 2 1 3  1 0 0
 
(A|I3 ) =⇒ ⎝ 3 3 2  0 1 0 ⎠ =⇒ ⎝ 0 3 −5  −3 2 0 ⎠ =⇒
 
1 2 1  0 0 1 0 3 1  −1 0 2
⎛  ⎞ ⎛  ⎞
2 0 14  6 −2 0 2 0 0  −12 60 −84
=⇒ ⎝ 0 3 −5  −3 2 0 ⎠ =⇒ ⎝ 0 3 0  −6 −6 30 ⎠
0 0 12  6 −6 6 0 0 12  6 −6 6
de unde ⎛ 12 60 −84
⎞ ⎛ ⎞
− 2·3·12 2·3·12 2·3·12 − 16 5
6 − 76
A−1 = ⎝ −6
3·12
−6
3·12
30
3·12
⎠ = ⎝ −1
6 − 16 5
6
⎠.
6 6 6 1
12 − 12 12 2 − 12 1
2

Definiţia 3.1.16 O matrice pătratică A se numeşte ortogonală dacă


A · A = I.
t

Propoziţia 3.1.9 Condiţia necesară si suficientă ca o matrice pătratică să fie ortogonală
este ca ea să fie nesingulară, iar transpusa şi inversa ei să fie egale.

Demonstraţie. Necesitatea. Din t A · A = I rezultă că A este nesingulară şi, ı̂nmulţind această
egalitate la dreapta cu A−1 , obţinem t A = A−1 .
Suficienţa. Dacă A este nesingulară şi verifică t A = A−1 , atunci, prin ı̂nmulţire la
dreapta cu A, găsim t A · A = I, ceea ce ne arată că A este ortogonală.
Teorema 3.1.4 Rangul unui produs de matrice nu depăşeşte rangul fiecăruia din factorii
săi.

35
Demonstraţie. Fie A = (aij ) ∈ Mm×n (K), B = (bij ) ∈ Mn×p şi C = A · B = (cij ) ∈ Mm×p , unde

n
cij = aik bkj , i = 1, m, j = 1, p.
k=1

Ultimele relaţii ne arată că liniile matricei C se exprimă ca şi combinaţii liniare de
liniile matricei B şi deci subspaţiul generat de liniile matricei C sunt incluse ı̂n subspaţiul
generat de liniile matricei B. Aşadar, avem rang C ≤ rang B În mod analog, raţionând cu
vectorii coloană, obţinem rang C ≤ rang A.
Dacă unul din factorii produsului este o matrice nesingulară, atunci avem un rezultat
mai precis.
Teorema 3.1.5 Rangul produsului dintre o matrice A şi o matrice nesingulară B este egal
cu rangul lui A.
Demonstraţie. Fie C = AB. Din Teorema 3.1.4 avem rang C ≤ rang A. Ţinând seama
că B este nesingulară, există B −1 şi ı̂nmulţind la dreapta cu B −1 ı̂n C = AB, obţinem
A = CB −1 . Aplicând din nou Teorema 3.1.4, rezultă rang A ≤ rang C. Din rang C ≤ rang A
şi rang A ≤ rang C obţinem rang C = rang A.
Observaţia 3.1.4 Pentru simplificarea calculelor cu matrice se lucrează, deseori, cu matrice
ı̂mpărţită (partiţionată) ı̂n submatrice sau blocuri, obţinute ducând paralele la liniile şi
coloanele ei. De exemplu, matricea A ∈ Mn2 (K) se poate scrie
 
B C
A=
D E

unde B ∈ Mp2 (K), E ∈ M(n−p)2 (K), C ∈ Mp,(n−p) , iar D ∈ Mn−p,p .


Cu matricele formate din blocuri se pot face operaţii ca şi cu matrice obişnuite,
reducând calculele la matrice de ordine mai mici.
O importantă aplicaţie a partiţionării ı̂n blocuri o constituie inversarea unei matrice.
Să presupunem că B este inversa matricei A. Atunci

AB = I

sau prin partiţionare


    
A11 A12 B11 B12 I O
=
A21 A22 B21 B22 O I

Efectuând ı̂nmulţirile şi identificând matricele din cei doi membrii, vom obţine
(1) A11 B11 + A12 B21 = I,
(2) A11 B12 + A12 B22 = 0,
(3) A21 B11 + A22 B21 = 0,
(4) A21 B12 + A22 B22 = I.
Din (2) avem
B12 = −A−1
11 · A12 · B22 ,

care ı̂nlocuită ı̂n (4) ne conduce la

B22 = (A22 − A21 A−1


11 A12 )
−1

Deoarece BA = I, vom avea

B21 A11 + B22 A21 = 0,

36
de unde
B21 = −B22 A21 A−1
11

iar din (2)


B11 = A−1 −1
11 − A11 A12 B21 .

Ordinea de calculare a blocurilor matricei B este: B22 , B12 , B21 şi B11 .
Exemplul 3.1.4. Să se afle inversa matricei
⎛ ⎞
2 3 4
A=⎝ 4 2 1 ⎠
3 2 −1

Partiţionăm luând
   
4 2 1
A11 = 2, A12 = (3 4), A21 = şi A22 =
3 2 −1

Calculăm B22 = P −1 , unde


 
−4 −7
P = A22 − A21 A−1
11 A12 =
− 52 −7

Pentru a afla P −1 procedăm prin acelaşi algoritm, considerând A = P şi făcând


partiţionarea
5
A11 = −4, A12 = −7, A21 = − , A22 = −7.
2
Avem calculele    −1
5 1 8
B22 = −7 + − (−7) =−
2 4 21
 
1 8 2
B12 = (−7) − =
4 21 3
  
8 5 1 5
B21 = − − =
21 2 4 21
 
1 1 5 2
B11 = − + (−7) =−
4 4 21 3
şi  
−1 − 23 2
3
P = 5 8 .
21 − 21
Acum revenim la calculul inversei matricei A iniţială. Avem

B22 = P −1 ,
 2 2
  
1 −3 11 5
B12 = −A−1
11 A12 B22 = − (3 4) 5
3
8 = − ,
2 21 − 21 21 21
 1 
B21 = −B22 A21 A−1
11 = 3
2 ,
21
1  
1 1 4
B11 = A−1 −1
11 − A11 A12 B21 = − (3 4) 32 = − ,
2 2 21
21
rezultând  
B11 B12
A−1 =
B21 B22

37
În ı̂ncheierea acestui paragraf să prezentăm o aplicaţie a matricelor la schimbarea
bazei unui spaţiu vectorial.
Fie V un spaţiu vectorial peste câmpul K cu dim V = n şi B = {e(1) , e()2 , . . . , e(n) } o bază
a lui. Faţă de această bază un vector x ∈ V se scrie ı̂n mod unic sub forma

n
x= xi e(i) ,
i=1

ceea ce ı̂nseamnă că vectorului x ı̂i corespunde vectorul linie x = (x1 , . . . , xn ) din K n . De aici
rezultă dacă avem ı̂n V sistemul de vectori

x(i) = (xi1 , xi2 , . . . xin ), i = 1, 2, . . . , p,

atunci rangul sistemului de vectori {x(1) , x(2) , . . . , x(p) } este egal cu rangul matricei coordo-
natelor ⎛ ⎞
x11 x12 . . . x1n
⎜ x21 x22 . . . x2n ⎟
A=⎜ ⎝ ... ... ... ... ⎠.

xp1 xp2 . . . xpn


Rezultă că dacă considerăm ı̂n V sistemul de vectori B1 = {f (1) , f (2) , . . . , f (n) }, dat faţă
de B prin formulele

n
fj = aij e(i) , j = 1, n,
i=1

atunci B1 formează o bază ı̂n V dacă şi numai dacă matricea A = (aij ) ∈ Mn2 (K) este
nesingulară.
În acest caz, A se numeşte matricea schimbării de bază sau matricea de trecere de la
baza B la baza B1 .
Punând faţă de B1

n
x= yj f (j)
j=1

şi ı̂nlocuind pe fj , avem


n ⎛ ⎞

n
n
x= yj aij e(i) = ⎝ aij yi ⎠ e(i)
j=1 i=1 i=1 j=1

n
de unde, identificând cu x = xi e(i) , rezultă
i=1

n
xi = aij yj , i = 1, n,
j=1

care constituie formulele de schimbare a sistemului de coordonate, cores- punzătoare


schimbării de bază B ı̂n B1 . Sub formă matricială formulele de schimbare se scriu ast-
fel
t
x = At y.

3.2 Determinanţi
Considerăm matricea pătratică A = (aij ) ∈ Mn2 (K) cu elemente din câmpul K.
Formăm produse de forma a1i1 , a2i2 . . . anin , obţinute luând câte un element şi numai unul

38
din fiecare linie şi coloană a matricei A. Unui astfel de produs ı̂i asociem permutarea
(substituţia)  
1 2 ... n
G=
i1 i2 ... in
numită permutarea indicilor săi. Notăm cu Sn mulţimea tuturor celor n! permutări ale
mulţimii {1, 2, . . . , n}.
În permutarea σ ∈ Sn avem o inversiune dacă i < j şi σ(i) > σ(j).
De exemplu, ı̂n permutarea
 
1 2 3 4
σ=
4 2 1 2
elementele 4 şi 2 prezintă o inversiune.
Prin Inv(G) notăm numărul inversiunilor permutării G, iar prin ε(σ) = (−1)Inv(σ) sig-
natura permutărilor σ. Dacă ε(σ) = 1, avem o permutare pară, iar dacă ε(σ) = −1 avem o
permutare impară.
Definiţia 3.2.1 Numim determinantul matricei pătratice A = (aij ) ∈ Mn2 (K), elementul
det A ∈ K dat de formula

det A = ε(σ)a1i1 a2i2 . . . anin ,


σ∈Sn

unde suma se extinde la toate cele n! permutări din Sn .


Altfel spus, determinantul matricei A este elementul det A din K egal cu suma a n!
produse, unde ı̂n fiecare produs intră ca factor câte un element de pe fiecare linie şi coloană
a matricei A, produsul având semnul + sau − după cum permutarea indicilor săi este pară
sau impară. Determinantul det A se zice de ordinul n dacă matricea A are ordinul n. Pentru
det A folosim notaţia  
 a11 a12 . . . a1n 
 
 a21 a22 . . . a2n 
det A =  

 ... ... ... ... 
 an1 an2 . . . ann 
sau det A = |A| = |aij |.
Vom prezenta acum proprietăţile determinanţilor.
Propoziţia 3.2.1 Determinantul unei matrice este egal cu determinantul transpusei sale.
Demonstraţie. Valabilitatea Propoziţiei rezultă din faptul că o permutare σ şi inversa ei
σ −1 au aceeaşi paritate.
Din această propoziţie rezultă că dacă pentru liniile unui determinant avem o
propoziţie adevărată, atunci aceasta este adevărată şi pentru coloanele determinantului.
De aceea, ı̂n continuare, vom formula şi justifica proprietăţile numai pentru liniile unui
determinant.
Propoziţia 3.2.2 Dacă linia Li a matricei pătratice A = (aij ) ∈ Mn2 (K) este suma a p vectori,
atunci determinantul ei este egal cu suma a p determinanţi corespunzători matricelor care
au aceleaşi linii cu A, cu excepţia liniei Li unde are câte unul din cei p vectori.
Demonstraţie. Dacă linia Li este suma a p vectori atunci

p
(k)
aij = bij , i = 1, n
k=1

şi putem scrie




p
(k)
det A = ε(σ)a1j1 . . . aiji = ε(σ)a1j1 biji . . . anjn =
σ∈Sn σ∈Sn k=1

39

(k)
= ε(σ)a1j1 biji . . . anjn ,
k=1 σ∈Sn

ceea ce trebuia demonstrat.


Propoziţia 3.2.3 Dacă ı̂ntr-un determinant ı̂nmulţim o linie cu un factor k ∈ K, atunci
valoarea determinantului se ı̂nmulţeşte cu k.
Demonstraţie. Fie A = (aij ) ∈ Mn2 (K) şi B matricea obţinută din A, ı̂n care elementele liniei
i sunt ı̂nmulţite cu k. Atunci

det (B) = ε(σ)a1j1 . . . (kaiji ) . . . anjn =


σ∈Sn

=k ε(σ)a1i1 . . . aji anjn = k det A.


σ∈Sn

Propoziţia 3.2.4 Dacă ı̂ntr-un determinant se schimbă două linii ı̂ntre ele, atunci valoarea
lui ı̂şi schimbă semnul.
Demonstraţie. Se observă că prin schimbarea celor două linii permutarea indicilor ı̂şi
schimbă paritatea.
Propoziţia 3.2.5 Dacă ı̂ntr-un determinant două linii sunt identice, atunci valoarea lui este
zero.
Demonstraţie. Dacă ı̂n det A schimbăm ı̂ntre ele cele două linii identice, atunci, folosind
propoziţia 3.2.4 putem scrie det A = −det A, de unde det A = 0.
Propoziţia 3.2.6 Dacă ı̂ntr-un determinant avem două linii proporţionale, atunci valoarea
lui este zero.
Demonstraţie. Valabilitatea propoziţiei rezultă din Propoziţiile 3.2.3 şi 3.2.5.
Propoziţia 3.2.7 Dacă ı̂ntr-un determinant la o linie adăugăm o combinaţie liniară de cele-
lalte linii, atunci valoarea lui rămâne neschimbată.
Demosntratı̂e. Se aplică Propoziţiile 3.2.2 şi 3.2.6.
Propoziţia 3.2.8 Dacă liniile matricei care defineşte determinantul sunt liniar dependente
(matricea este singulară), atunci valoarea determinantului este zero.
Demonstraţie. Se aplică Propoziţiile 3.2.2 şi 3.2.6.
În particular, dacă pe o linie a unui determinant avem numai zero, atunci valoarea
determinantului este zero.
Definiţia 3.2.2 Numim minorul complementar al elementului aij din matricea pătratică A =
(aij ) ∈ Mn2 (K), determinantul asociat matricei extrase din A prin eliminarea liniei i şi
coloanei j.
Notăm Mij minorul complementar al elementului aij .
Definiţia 3.2.3 Numim complementul algebric al elementului aij din matricea pătratică A =
(aj ) ∈ Mn2 (K) elementul Aij ∈ K dat de relaţia

Aij = (−1)i+j Mij .

Propoziţia 3.2.9 Determinantul matricei A = (aij ) ∈ Mn2 (K) este egal cu suma produselor
elementelor liniei Li (i = 1, n) prin complemenţii lor algebrici, adică

det (A) = ai1 Ai1 + . . . + aij Aij + . . . + ain Ain .

40
Demosntraţie. Se arată că efectuând produsele aij Aij , j = 1, n obţinem toate produsele din
definiţia lui det A luate cu acelaşi semn.

Corolarul 3.2.1 Dacă ı̂n dezvoltarea determinantului det (A) după elementele liniei Li
ı̂nlocuim aceste elemente prin elementele α1 , . . . , αn din K, atunci suma obţinută reprezintă
determinantul matricei obţinută din A prin ı̂nlocuirea liniei Li cu vectorul (α1 , α2 , . . . , αn ).

Corolarul 3.2.2 Suma produselor elementelor unei linii Li ai matricei A = (aij ) ∈ Mn2 (K)
prin complemenţii algebrici ai elementelor altei linii Lj este egală cu zero.

De fapt, din Propoziţia 3.2.9 şi Corolarul 3.2.2 putem scrie


n
aij Akj = δik det A, i, k = 1, n.
j=1

Observaţia 3.2.1 Propoziţia 3.2.9 se poate generaliza prin aşa numita regulă a lui Laplace.
În acest scop se introduce noţiunea de minor de ordinul k al matricei A = (aij ) ∈ Mn2 (K),
notat prin
Mij11,i,j22,...,i
,...,jk
k

şi fiind determinatul asociat matricei de ordin k formată cu elementele ce se găsesc la


intersecţia liniilor i1 , . . . , ik cu coloanele j1 , . . . , jk (i1 < . . . < ik , j1 < . . . < jk ). Minorul com-
j1 ,j2 ,...,jk
plementar al minorului Mij11,i,j22,...,i,...,jk
k
, notat prin M i1 ,i2 ,...,ik este determinatul asociat matricei
extrase din A prin ı̂nlăturarea liniilor i1 , . . . , in şi coloanelor j1 , . . . , jk . Se numeşte comple-
mentul algebric al minorului Mij11,i,j22,...,i ,...,jk
k
elementul Aji11,i,j22,...,i
,...,jk
k
∈ K dat de relaţia
j1 ,...,jk
Aji11,...,i
,...,jk
k
= (−1)i1 +...+ik +j1 +...+jk M i1 ,...,ik .

Regula lui Laplace ne spune că determinantul unei matrice pătratice este egal cu suma
produselor minorilor de pe k linii fixate ale matricei prin complemenţii lor algebrici.

Observaţia 3.2.2 Calculul unui determinant de ordin n se poate face calculând numai
determinanţi de ordinul doi (de fapt, aplicând regula dreptunghiului fără ı̂mpărţirea la
elemntul pivot). Fie de calculat
 
 a11 a12 . . . a1j . . . a1n 
 
 ... ... ... ... ... ... 
 
det A =  ai1 ai2 . . . aij . . . ain 

 ... ... ... ... ... ... 
 
 an1 an2 . . . anj . . . ann 

Presupunem că a11 = 0. Împărţim linia ı̂ntâi cu a11 (ı̂n faţa determinantului se va
ı̂nmulţi cu a11 ). Apoi facem 0 pe prima coloană, ceea ce va face ca elementul aij să fie
ı̂nlocuit prin
a1j aij a11 − a1j ai1 bij
aij − ai1 = = , i, j = 2, n.
a11 a11 a1j
Dezvoltând acum determinantul după prima coloană şi scoţând ı̂n noul determinant
factorul 1/a11 de pe fiecare linie, obţinem formula lui Chio:
 
 b22 b23 . . . b2n 
 
1  b32 b33 . . . b3n 
det A = n−2  .
a11  . . . . . . . . . . . . 
 bn2 bn3 . . . bnn 

41
Practic se aplică repetat această formulă, ı̂n care elementele bij , i, j = 2, n, se obţin
prin ”regula dreptunghiului” fără ı̂mpărţirea la elementul pivot.
Exemplu. Avem  
 2 1 3 2   
   0 −10 −2 
 4 2 1 3   
det A =   = 1  1 −7 2  =
 2 
 3 2 1 4  2  8 8 8 
 −2 3 1 2 
 
 1 1 1   
1   1  −8 1 
 
= 2 · 8 · 2  1 −7 2  = 4 ·  = 4 · (−13) = −52.
2  0 5 1  1 5 1 

Utilizând regula lui Laplace se demonstrează:

Propoziţia 3.2.10 Determinantul produsului a două matrice A şi B de ordin n este egal cu
produsul determinanţilor acestor matrice.

Propoziţia 3.2.11 Condiţia necesară şi suficientă ca o matrice să fie nesingulară este ca
determinantul ei să fie diferit de zero.

Demonstraţie. Necesitatea. Dacă A este o matrice pătratică nesingulară, atunci admite


inversă şi din relaţia A−1 A = I avem det (A−1 ) det (A) = 1 şi deci det (A) = 0.
Suficienţa. Dacă det (A) = 0, matricea A nu poate fi singulară deoarece după consecinţa
3.2.8 ar rezulta det (A) = 0.

Corolarul 3.2.3 Rangul unei matrice este egal cu ordinul maxim al minorilor diferiţi de
zero.

Acest corolar ne dă un alt procedeu pentru aflarea rangului unei matrice.

Definiţia 3.2.4 Se numeşte matrice adjunctă a matricei A = (aij ) ∈ Mn2 (K) matricea notată
prin A∗ şi dată prin A∗ = (Aji ), unde Aij este complementul algebric al elementului aij din
A.

Altfel spus, A∗ este transpusa matricei formată cu complemenţii algebrici ai ele-


mentelor matricei A.

Propoziţia 3.2.12 Inversa unei matrice nesingulare A de ordin n este dată de formula
1
A−1 = · A∗ .
det (A)

Demonstraţie. Folosind corolarul 3.2.2, avem


⎛ ⎞

n  
1 Akj ⎠ det (A)
A· · A∗ = ⎝ aij · = δij = (δij ) = In ,
det A j=1
det (A) det (A)

ceea ce trebuia demonstrat.


Formula din Propoziţia 3.2.12 dă un alt procedeu pentru calcularea inversei unei
matrice.

3.3 Sisteme de ecuaţii liniare


În acest paragraf vom aplica matricele şi determinanţii la rezolvarea sistemelor de
ecuaţii liniare, ı̂ntâlnite ı̂n mod curent ı̂n aplicaţiile economice.

42
Definiţia 3.3.1 Se numeşte sistem de m ecuaţii liniare cu n necunoscute peste câmpul K, un
ansamblu de relaţii de forma


⎪ a11 x1 + a12 x2 + . . . + a1n xn = b1 ,

a21 x1 + a22 x2 + . . . + a2n xn = b2 ,
(3.2)

⎪ ..............................

am1 x1 + am2 x2 + . . . + amn xn = bm ,

unde aij ∈ K, i = 1, m, j = 1, n sunt coeficienţii sistemului, b1 , . . . , bn ∈ K termenii liberi ai


sistemului, iar x1 , . . . , xn ∈ K sunt necunoscutele sistemului.
Dacă cel puţin un termen liber este diferit de zero atunci vom spune că sistemul
este neomogen, iar dacă toţi termenii liberi sunt nuli, atunci vom zice că sistemul este
neomogen.

Definiţia 3.3.2 Numim soluţie a sistemului (11.8) orice ansamblu format din n elemente
α1 , α2 , . . . , αn din K cu proprietatea că ı̂nlocuind ı̂n membrii stângi ai ecuaţiilor sistemului
xi = αi , i = 1, n, şi făcând calculele, se obţin elementele corespunzătoare din membrii drepţi.

Definiţia 3.3.3 Un sistem de ecuaţii liniare se zice că este compatibil dacă are cel puţin o
soluţie şi incompatibil ı̂n caz contrar.
Matricea ⎛ ⎞
a11 a12 . . . a1n
⎜ a21 a22 . . . a2n ⎟
A=⎜ ⎝ ... ... ... ... ⎠

an1 an2 . . . amn


se numeşte matricea sistemului, iar matricea
⎛ ⎞
a11 a12 ... a1n b1
⎜ a21 a22 ... a2n b2 ⎟
A=⎜ ⎝ ... ...

... ... ... ⎠
an1 an2 ... amn bm

se numeşte matricea extinsă (completă) a sistemului (11.8)

Notând cu X = t (x1 , x2 , . . . , xn ) vectorul coloană al necunoscutelor şi cu B =


t
(b1 , b2 , . . . , bm ) vectorul termenilor liberi, sistemul (11.8) se poate scrie sub forma matriceală

AX = B.

Definiţia 3.3.4 Numim sistem Cramer un sistem de n ecuaţii liniare cu n necunoscute pen-
tru care matricea A a sistemului este nesingulară, adică det A = 0.

Pentru astfel de sisteme are loc:

Teorema 3.3.1 (Cramer). Orice sistem Cramer este compatibil determinat (are soluţie
unică) şi
Δi
, i = 1, n,
xi =
det A
unde Δi este determinantul matricei obţinută din matricea A a sistemului prin ı̂nlocuirea
coloanei Ci cu coloana B a termenilor liberi.

Demonstraţie. Ţinând seama că A este nesingulară, din forma matriceală a sistemului
obţinem X = A−1 B, care ne arată că sistemul este compatibil. Cum A−1 = (det A)−1 A∗ ,
unde A∗ este matricea adjunctă a matricei A (v. Propoziţia 3.2.12), ı̂nlocuind ı̂n X = A−1 B,

43
obţinem ⎛ ⎞

⎜ Ak1 bk ⎟
⎜ k=1 ⎟
⎜ n ⎟

⎟ ⎛ ⎞
⎜ ⎟
⎜ Ak2 bk ⎟ Δ1
⎜ k=1 ⎟ ⎜ ⎟
⎜ ⎟ ⎜ Δ2 ⎟
⎜ .. ⎟ ⎜ ⎟
⎜ ⎟ ...
1 ∗ 1 ⎜ . ⎟= 1 ⎜ ⎟
X=
det (A)
A B= ⎜
det (A) ⎜
n ⎟ det A ⎜
⎜ Δi ⎟,

⎟ ⎜ ⎟
⎜ Aki bk ⎟ ⎝
..

⎜ k=1 ⎟ .
⎜ ⎟
⎜ .. ⎟ Δn
⎜ ⎟
⎜ n . ⎟


⎝ Akm bk ⎠
k=1

de unde
Δi
xi = , i = 1, n.
det (A)
Prezentăm acum metoda eliminării totale (Gauss–Jordan) pentru aflarea soluţiilor
pentru sistemele Cramer.
În acest scop, scriem matricea extinsă a sistemului şi avem succesiv

(3.3) (A|B) =⇒ (A−1 · A|A−1 · B) =⇒ (In |X).

unde I este matricea unitate de ordinul n.


Practic se lucrează cu metoda dreptunghiului, prin care pe poziţia lui A facem să
apară In , iar pe poziţia lui B va apărea soluţia sistemului.
Exemplul 3.3.1. Să se rezolve sistemul

2x1 + 3x2 + x3 = 6
3x1 − x2 − 2x3 = 7
x1 − 2x2 + 3x3 = −3.

Avem succesiv
⎛ ⎞ ⎛ 3 1

2 3 1 6 1 2 2 3
⎝ 3 -1 -2 7 ⎠⇒⎝ 0 − 11 − 72 −2 ⎠ ⇒
2
1 -2 3 -3 0 − 72 5
2 −6
⎛ 5 27
⎞ ⎛ ⎞
1 0 − 11 11 1 0 0 2
⇒⎝ 0 1 7
11
4
11
⎠⇒⎝ 0 1 0 1 ⎠,
52
0 0 11 − 52
11
0 0 1 -1
de unde xi = 2, x2 = 2, x3 = −1.

Observaţia 3.3.1 Dacă ı̂n transformările (11.9) facem ca ı̂n locul lui In să apară o matrice
triunghiulară superioară având elementele de pe diagonala principală egale cu 1, atunci se
zice că se rezolvă sistemul prin metoda eliminării parţiale.

De exemplu, pentru sistemul din exemplul 3.3.1, lucrând prin metoda eliminării
parţiale, avem: ⎛ ⎞ ⎛ ⎞
3 1
2 3 1 6 1 2 2 3
⎝ 3 -1 -2 7 ⎠ ⇒ ⎝ 0 − 11 − 72 −2 ⎠ ⇒
2
7 5
1 -2 3 -3 0 −2 2 −6
⎛ 3 1
⎞ ⎛ ⎞
1 2 2 3 1 32 1
2 3
⇒⎝ 0 1 7
11
4
11
⎠⇒⎝ 0 1 7
11
4 ⎠
11 ,
52 52
0 0 1 − 11 0 0 1 −1

44
iar de aici
7 4 4 7
x3 = −1 : x2 + x3 = , de unde x2 = + =1:
1 11 11 11
3 1 3 1
x1 + x2 + x3 = 3, de unde x1 = 3 − + = 2.
2 2 2 2
Să revenim acum la cazul general al sistemelor de m ecuaţii liniare cu n necunoscute.
Mai ı̂ntâi să prezentăm două criterii de compatibilitate date de teorema lui Kronecker–
Capelli şi Rouché–Frobenius.
Teorema 3.3.2 Kronecker–Capelli. Condiţia necesară şi suficientă ca un sistem de ecuaţii
liniare să fie compatibil este ca rangul matricei sistemului să fie egal cu rangul matricei
extinse.
Demonstraţie. Fie A = {C1 , C2 , . . . , Cn } sistemul de vectori coloane ai matricei A a sistemului
(11.8); sistemul (11.8) poate fi scris sub forma
x1 C1 + x2 C2 + . . . + xn Cn = B,
de unde rezultă că el este compatibil dacă şi numai dacă rangul sistemului de vectori
coloane {C1 , C2 , . . . , Cn } ai matricei A este egal cu rangul sistemului de vectori coloane
{C1 , C2 , . . . , Cn , B} ai matricei extinse A, ceea ce este echivalent cu faptul că matricele A
şi A au acelaşi rang.
Definiţia 3.3.5 Numim determinantul principal pentru sistemul de ecuaţii liniare (11.8)
orice minor de ordin maxim diferit de zero al matricei sistemului.
Este evident că ordinul unui determinant principal este egal cu rangul matricei sis-
temului.
Definiţia 3.3.6 Numim determinant caracteristic asociat unui determinant principal fixat,
orice minor principal al matricei extinse obţinut prin completarea (bordarea) determi-
nantului principal cu o linie formată din elementele corespunzătoare de pe una din liniile
rămase şi cu coloana termenilor liberi corespunzători.
Dacă rangul matricei sistemului este egal cu numărul m al ecuaţiilor, atunci nu avem
determinanţi caracteristici, sistemuul fiind totdeauna compatibil deoarece rangul matricei
extinse este tot m.
Teorema 3.3.3 (Rouché–Frobenius). Condiţia necesară si suficientă ca un sistem de ecuaţii
liniare să fie compatibil este ca toţi determinanţii caracteristici asociaţi unui determinant
principal al sistemului să fie nuli.
Demonstraţie. Necesitatea. Fie r rangul matricei A a sistemului (11.8). Dacă sistemul este
compatibil, atunci după teorema lui Kronecker–Capelli, rangul matricei extinse A este egal
cu r şi deci toţi determinanţii caracteristici sunt nuli deoarece sunt minori de ordinul r + 1
pentru A.
Suficienţa. Fără a restrânge generalizarea să presupunem că
 
 a11 a12 . . . a1r 
 
 a a22 . . . a2r 
(3.4) Δp =  21 
 ... ... ... ... 
 ar1 ar2 . . . arr 

este un determinant principal pentru care toţi determinanţii caracteristici sunt nuli. Con-
siderând matricele
⎛ ⎞
a11 ... a1n b1
⎜ a21 ... a2n b2 ⎟
⎜ ⎟
(3.5) ⎜ ... ... ... ... ⎟, s = 1, 2, . . . , m − r
⎜ ⎟
⎝ ar1 ... arn br ⎠
ar+s,1 ... ar+s,n br+s

45
extrase din matricea extinsă A, constatăm că ele au toate rangul r. Într-adevăr, primele
C1 , C2 , . . . , Cr coloane sunt liniar independente deoarece Δp = 0, coloanele Cr+1 , Cr+2 , . . . , Cn
sunt combinaţii liniare de C1 , C2 , . . . , Cr pentru că matricea A are rangul r, iar coloana
Cn+1 este combinaţie liniară de C1 , . . . , Cr deoarece determinanţii caracteristici sunt nuli.
Atunci rang A = rang A şi, pe baza teoremei lui Kronecker–Capelli, rezultă că sistemul este
compatibil.

Definiţia 3.3.7 Subsistemul sitemului (11.8) de ecuaţii liniare format din ecuaţiile core-
spunzătoare liniilor unui determinant principal se numeşte subsistem principal, şi ecuaţiile
lui se numesc ecuaţii principale. Celelalte ecuaţii ale sistemului (11.8) se numesc ecuaţii se-
cundare. Necunoscutele corespunzătoare coloanelor unui determinant principal se numesc
necunoscute principale, iar celelalte se numesc necunoscute secundare (libere).

Definiţia 3.3.8 Două sisteme de ecuaţii liniare se numesc echivalente dacă orice soluţie a
unuia este soluţie şi pentru celelalt.

Uşor se verifică că această relaţie este ı̂ntr-adevăr o relaţie de echivalenţă.

Teorema 3.3.4 Un sistem liniar compatibil este echivalent cu orice subsistem principal al
său.

Demonstraţie. Este evident că orice soluţie a sistemului (11.8) este soluţie pentru orice
subsistem al său deoarece ea verifică fiecare ecuaţie a sistemului. Reciproc, să considerăm
subsistemul principal cu determinantul principal (11.9). Cum matricele (11.10) au toate
rangul r, ultima linie este o combinaţie liniară de celelalte şi deci avem:

Lr+s = λ1 L1 + λ2 L2 + . . . + λr Lr , s = 1, 2, . . . , m − r,

de unde
(3.6) ar+s,j = λ1 aj1 + λ2 aj2 + . . . + λr ajr , j = 1, n
şi
(3.7) br+s = λ1 b1 + λ2 b2 + . . . + λr br .
Dacă punem
Ei = a11 x1 + . . . + a1n xn − bi , i = 1, n,
atunci ı̂nmulţind egalităţile (11.11) corespunzător cu xj , j = 1, n, egalitatea (3.7) cu −1 şi
adunându-le obţinem

(3.8) Er+s = λ1 E1 + λ2 E2 + . . . + λr Er , s = 1, 2, . . . , m − r

Acum, dacă considerăm o soluţie a subsistemului principal atunci E1 = 0, . . . , Er = 0,


iar din (3.9) rezultă că şi Er+s = 0, s = 1, 2, . . . , m − r. Deci, sistemul (11.8) este echivalent
cu subsistemul principal considerat.
Practic, rezolvarea unui sistem compatibil de ecuaţii liniare se reduce la rezolvarea
unui subsistem principal al său, ı̂n care termenii cu necunoscutele secundare au fost trecute
ı̂n membrul doi, acestea devenind parametrii.
Subsistemul principal este un sistem Cramer şi se poate rezolva cu oricare din
metodele date mai sus.

Observaţia 3.3.2 Metodele eliminării totale sau parţiale se pot aplica şi la studierea com-
patibilităţii unui sistem de ecuaţii liniare. Şi anume, dacă nu se mai pot face cifre de 1
pe diagonala ce pleacă din a11 şi pe liniile care nu avem cifre de 1 găsim numai zerouri,
atât ı̂n matricea sistemului cât şi la termenii liberi, atunci sistemul este compatibil. În caz
contrar, sistemul este incompatibil.

46
Exemplul 3.3.2. Să considerăm sistemul

x1 − x2 + 2x3 + x4 + x5 = 1

2x1 + x2 + x3 − x4 + 3x5 = 5
x1 − 4x2 + 5x3 + 4x4 = 2.
Utilizând metoda eliminării totale, avem succesiv:
⎛ ⎞ ⎛ ⎞
1 -1 2 1 1 1 1 -1 2 1 1 1
⎝ 2 1 1 -1 3 5 ⎠ ⇒ ⎝ 0 3 -3 -3 1 3 ⎠⇒
2 -4 5 4 0 2 0 -3 3 3 -1 -3
⎛ 4

1 0 1 0 3 2
⇒ ⎝ 0 1 −1 −1 1
3 1 ⎠.
0 0 0 0 0 0
Rezultă că rangul matricei sistemului este 2 şi cum pe linia a treia avem numai zero,
deducem că avem un sistem compatibil nedeterminat. Soluţiile sistemului sunt
4 c
x1 = 2 − a − c; x2 = 1 + a + b − ; x3 = a; x4 = b; x5 = c, a, b, c ∈ R.
3 3
Exemplul 3.3.3. Să se rezolve sistemul

x1 − 3x2 + x3 + x4 = 1
x1 − 3x2 + x3 − 2x4 = −1
x1 − 3x2 + x3 + 5x4 = 6

Folosim metoda eliminării totale şi avem:


⎛ ⎞ ⎛ ⎞
1 -3 1 1 1 1 -3 1 1 1
⎝ 1 -3 1 -2 -1 ⎠ ⇒ ⎝ 0 0 0 -3 2 ⎠⇒
1 -3 1 5 6 0 0 0 4 5
⎛ ⎞
1 −3 1 0 − 13
⇒⎝ 0 0 0 1 2
3

0 0 0 0 7
Cum pe linia a treia avem o situaţie imposibilă, rezultă că sistemul este incompatibil.
În ı̂ncheierea acestui paragraf să facem câteva observaţii cu privire la sistemele omo-
gene de ecuaţii liniare.
Cum la orice sistem omogen rang A = rang A, rezultă că el este compatibil, având
evident soluţia x1 = x2 = . . . = xn = 0, numită soluţie nulă sau banală.
Un sistem omogen va avea soluţii diferite de soluţia banală numai dacă rangul său va
fi mai mic decât numărul necunoscutelor.
Teorema 3.3.5 Mulţimea soluţiilor unui sistem omogen de ecuaţii liniare peste câmpul K,
cu n necunoscute şi rang r, r < n, formează un subspaţiu vectorial V , cu dim V = n − r, al
spaţiului K n .
Demonstraţie. Considerăm că subsistemul principal asociat are determinantul principal Δp
dat de (11.9) şi notăm necunoscutele secundare xr+1 , . . . , xn−r respectiv prin λ1 , λ2 , . . . , λn−r .
Soluţia generală a sistemului omogen este:

xi = αi1 λ1 + αi2 λ2 + . . . + αi,n−r λr , i = 1, r


xr+k = λk , k = 1, n − r,

care sub formă vectorială (matriceală) se scrie

(3.9) X = λ1 Y1 + λ2 Y2 + . . . + λr Yn−r ,

47
unde ⎛ ⎞
⎛ ⎞ α12 ⎛ ⎞
α11 ⎜ ⎟ α1,n−r
⎜ ⎟ ⎜ α22 ⎟ ⎜ α2,n−r ⎟
⎜ α21 ⎟ ⎜ ⎟ ⎜ ⎟
..
⎜ .. ⎟ ⎜ . ⎟ ⎜ .. ⎟
⎜ . ⎟ ⎜ ⎟ ⎜ . ⎟
⎜ ⎟ ⎜ αr2 ⎟ ⎜ ⎟
Y1 = ⎜
⎜ αr1 ⎟ , Y2 = ⎜
⎟ ⎜
⎟ , . . . , Yn−r = ⎜ αr,n−r
⎟ ⎜
⎟,

⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟
⎜ 1 ⎟ ⎜ ⎟ ⎜ 0 ⎟
⎜ ⎟ ⎜ 1 ⎟ ⎜ ⎟
⎝ .. ⎠ ⎜ ⎟ ⎝ .. ⎠
. ⎝ .. ⎠ .
.
0 1
0
sunt soluţii particulare ale sistemului omogen.
Se observă că Y1 , Y2 , . . . , Yn−r sunt vectori liniari independenţi ı̂n K n , deoarece con-
siderând matricea formată cu componentele lor, submatricea ei compusă din ultimele n − r
linii este matricea unitate de ordinul n − r. Cu aceasta teorema este demonstrată.
Din teorema 3.3.5 şi (3.9) rezultă

Corolarul 3.3.1 Suma a două soluţii a unui sistem omogen este, de asemenea, o soluţie a
lui.

Corolarul 3.3.2 Produsul dintre o soluţie a unui sistem omogen peste un câmp K cu un
element din K este tot o soluţie a sistemului.

48
3.4 Testul Nr. 2 de verificare a cunoştinţelor

1. Definiţi următoarele noţiuni:

a) Matrice pătratică simetrică;


b) Matrice pătratică singulară;
c) Inversa unei matrice pătratice;
d) Determinant al unei matrice pătratice;
e) Sistem Cramer.

Enunţaţi următoarele teoreme:

a) Teorema rangului;
b) Teorema lui Kronecker - Capelli;
c) Teorema lui Rouché - Frobenius.

2. Aflaţi cu ajutorul transformărilor elementare rangul matricei:


⎛ ⎞
2 2 3 −1
⎜ 1 −1 0 1 ⎟
A=⎜ ⎝ −1

2 1 0 ⎠
2 −2 0 2

3. Calculaţi determinantul de ordinul n, n > 2:


 
 x1 − y1 x1 − y2 ... x1 − yn 
 
 x − y1 x2 − y2 ... x2 − yn 
D =  2 

 ... ... ... 
 xn − y1 xn − y2 ... xn − yn 

4. Să se discute după parametrul real m sistemul:



mx + 4y = 3m − 2
x + my = m2 − 2

5. Folosind metoda eliminării parţiale să se rezolve sistemul:


⎛ ⎞ ⎛ ⎞
2 1 2 1
Ax = B , cu A = ⎝ 1 0 1 ⎠ ; B = ⎝ 2 ⎠
1 1 0 1

6. Folosind metoda eliminării totale să se rezolve sistemul


⎛ ⎞ ⎛ ⎞
0 1 2 1
Ax = B , cu A = ⎝ 1 2 1 ⎠ ; B = ⎝ −1 ⎠
1 1 0 2

7. Folosind metoda eliminării totale să se rezolve sistemul:


⎛ ⎞ ⎛ ⎞
2 1 2 1
Ax = B , cu A = ⎝ 1 0 1 ⎠ ; B = ⎝ 2 ⎠
1 1 0 1

49
8. Folosind metoda lui Laplace să se calculeze determinantul
 
 1 0 0 0 2 

 0 1 0 0 3 

D =  x 0 1 0 4 
 x x 0 1 5 

 x x x 0 6 

9. Folosind metoda lui Laplace să se calculeze determinantul


 
 1 2 2 1 
 
 0 1 0 2 
D=  

 2 0 1 1 
 0 2 0 1 

10. Folosind formula lui Chio să se calculeze determinantul


 
 1 2 2 1 
 
 0 1 0 2 
D=  

 2 0 1 1 
 0 2 0 1 

50
Indicaţii şi răspunsuri

Testul 2

2. rangA = 3

3. Δ = 0
4. Dacă m = −2 atunci sistemul este incompatibil.
Dacă m = 2 atunci sistemul este compatibil nedeterminat cu soluţia x = 2−2a , y = a ∈ R.
m+4
Dacă m = ±2 atunci sistemul este compatibil determinat cu soluţia x = − ,
m+2
2
m + 2m − 1
y= .
m+2
5. Se obţine soluţia x1 = 4, x2 = −3, x3 = −2.

6. Se obţine soluţia x1 = 4, x2 = 1, x3 = −1.

7. Se obţine soluţia x1 = 4, x2 = −3, x3 = −2.

8. Δ = 2x2 − 9x + 6.

9. Δ = 9.

10. Δ = 9.

51
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul I,
Editura ULB, Sibiu, 2001.

52
Capitolul 4

Operatori liniari. Forme biliniare şi


forme pătratice

Obiective: În modelarea matematică a fenomenelor din realitatea ı̂nconjurătoare, ı̂n


particular cea economică, unul dintre cele mai des folosite concepte este cel de liniaritate.
Acesta se datorează, atât simplităţii conceptului de liniaritate, cât şi faptului că aproximarea
unor situaţii neliniare prin situaţii liniare, aşa numitul ”principiu al liniarităţii”, constituie
una din metodele de bază ı̂n studiul realităţii.
Rezumat: În prezentul capitol se vor prezenta noţiunile de
aplicaţie/transformare/operator liniar(ă), formă biliniară, formă pătratică, formă canonică
a unei forme pătratice, precum şi metode de determinare a formei canonice a unei forme
pătratice.
Conţinutul capitolului:
1. Operatori liniari
2. Forme biliniare
3. Forme pătratice
4. Test de verificare a cunoştinţelor
5. Bibliografia aferentă capitolului
Cuvinte cheie: operator liniar, transformare liniară, formă biliniară, formă
pătratică, forma canonică, metoda lui Gauss, Metoda lui Jacobi.

4.1 Operatori liniari


Fie X şi Y două spaţii vectoriale peste acelaşi câmp K.

Definiţia 4.1.1 Numim operator liniar sau transformare liniară sau omomorfism de spaţii
vectoriale, o aplicaţie T : X → Y care satisface condiţiile:
1o . T (x(1) + x(2) ) = T (x(1) ) + T (x(2) ), (∀)x(1) ∈ X, (∀)x(2) ∈ X (aditivitate),

2o . T (λx(1) ) = λT (x(1) ), (∀)λ ∈ K, (∀)x(1) ∈ X (omogenitate).

Teorema 4.1.1 Operatorul T : X → Y este liniar dacă şi numai dacă pentru orice x(1) , x(2) ∈
X şi orice λ1 , λ2 ∈ K, avem

(4.1) T (λ1 x(1) + λ2 x(2) ) = λ1 T (x(1) ) + λ2 T (x(2) ).

Demonstraţie. Să admitem că T este operator liniar, atunci, folosind condiţiile 1o şi 2o din
Definiţia 4.1.1, avem:

T (λ1 x(1) + λ2 x(2) ) = T (λ1 x(1) ) + T (λ2 x(2) ) = λ1 T (x(1) ) + λ2 T (x(2) ),

53
ceea ce trebuia demonstrat.
Reciproc, dacă ı̂n (4.1) punem λ1 = λ2 = 1, obţinem condiţia 1o din Definiţia 4.1.1, iar
dacă punem λ2 = 0. obţinem condiţia 2o din aceeaşi definiţie.
Dacă X = Y un operator liniar se numeşte endomorfism. Dacă transformarea liniară
T este bijectivă, atunci ea se numeşte izomorfism de spaţii vectoriale. Un endomorfism
bijectiv se numeşte automorfism al lui X.
Cum orice câmp K este un spaţiu vectorial peste el ı̂nsuşi, atunci putem considera un
operator liniar T : X → K, numit şi formă liniară sau funcţională liniară.
În continuare vom nota cu L(X, Y ) mulţimea operatorilor liniari definiţi pe X cu valori
ı̂n Y .
Exemple. 4.1.1. Fie Pn spaţiu vectorial al polinoamelor de grad cel mult n peste câmpul K.
Aplicaţia T : Pn → Pn−1 , T (f ) = f  , adică derivata lui f , oricare ar fi f ∈ Pn , este un operator
liniar.
Într-adevăr, oricare ar fi f1 , f2 ∈ Pn şi oricare ar fi λ1 , λ2 ∈ K avem

T (λ1 f1 + λ2 f2 ) = (λ1 f1 + λ2 f2 ) = λ1 f1 + λ2 f2 = λ1 T (f1 ) + λ2 T (f2 ).

4.1.2. Fie X un spaţiu vectorial n–dimensional peste câmpul K şi B = {e(1) , e(2) , . . . , e(n) }

n
o bază ı̂n el şi a1 , a2 , . . . , an ∈ K scalari fixaţi. Aplicaţia f : X → K, f (x) = ai xi , unde
i=1

n
(i)
x= xi e , este o funcţională liniară.
i=1
4.1.3. Fie X un spaţiu vectorial peste câmpul K şi a un element fixat din K. Aplicaţia
Ta : X → X definită prin Ta (x) = ax, pentru orice x ∈ X, este un operator liniar. Aplicaţia
Ta se numeşte omotetia spaţiului X de raport a ∈ K.

Propoziţia 4.1.1 Dacă T ∈ L(X, Y ), atunci avem

1o . T (θx) = θy, unde θx şi θy sunt vectorii nuli ai spaţiilor X şi Y ;

2o . T (−x) = −T (x), oricare ar fi x ∈ X.

Demonstraţia propoziţiei rezultă din faptul că T este un omomorfism ı̂ntre grupurile
comutative (X, +) şi (Y, +).

Propoziţia 4.1.2 Dacă T ∈ L(X, Y ) şi X1 este un subspaţiu al lui X, atunci T (X1 ) este un
subspaţiu ı̂n Y .

Demonstraţie. Pentru orice vectori y1 , y2 ∈ T (x1 ) există x(1) , x(2) ∈ X, astfel ca y1 = T (x(1) ),
y2 = T (x(2) ). Considerând λ1 , λ2 ∈ K şi folosind Teorema 4.1.1, avem

λ1 y1 + λ2 y2 = λ1 T (x(1) ) + λ2 T (x(2) ) = T (λ1 x(1) + λ2 x(2) ).

Cum λ1 x(1) + λ2 x(2) ∈ X1 , rezultă că λ1 y1 + λ2 y2 ∈ T (X1 ), ceea ce ne arată că T (x1 ) este
un subspaţiu vectorial al lui Y .
În particular, T (X) este un subspaţiu al lui Y şi se notează cu ImT . Dimensiunea lui
ImT se numeşte rangul transformării T .

Observaţia 4.1.1 Orice transformare liniară păstrează liniar dependenţa unui sistem de
vectori, iar dacă este injectivă, atunci păstrează şi liniar independenţa.
În particular, dacă B = {e(1) , . . . , e(n) } este o bază ı̂n X şi transformarea T ∈ L(X, Y )
este injectivă, atunci B1 = {T (e(1) , . . . , T (e(n) ))} este o bază ı̂n Y .

Propoziţia 4.1.3 Dacă T ∈ L(X, Y ) şi Y1 este un subspaţiu al lui Y , atunci contraimaginea
T −1 (Y1 ) este un subspaţiu al lui X.

54
Demonstraţie. Fie x(1) , x(2) ∈ T −1 (Y1 ); atunci T (x(1) ), T (x(2) ) ∈ Y1 şi deci pentru orice λ1 , λ2 ∈ K
avem λ1 T (x(1) ) + λ2 T (x(2) ) = T (λ1 x(1) + λ2 x(2) ) ∈ Y1 . Prin urmare, λ1 x(1) + λ2 x(2) ∈ T −1 (Y1 ) şi
deciT −1 (Y1 ) este subspaţiu al lui X.
În particular, T −1 ({θy}), unde θy este vectorul nul din Y , este un subspaţiu al lui X,
care se numeşte nucleul operatorului liniar T şi se notează cu ker T .
Se verifică imediat că operatorul T ∈ L(X, Y ) este injectiv dacă şi numai dacă
ker T = {θx}, θx fiind vectorul nul din X.
Dimesiunea nucleului ker T se numeşte defectul transformării liniare T . Se demon-
strează că
dim(ker T ) + dim(Im T ) = dim X (v. [2])
Deoarece operatorii liniari sunt funcţii, operaţiile cu funcţii vor conduce la operaţii
cu transformări liniare. Astfel, dacă T1 , T2 ∈ L(X, Y ), atunci T1 + T2 : X → Y , (T1 + T2 )(x) =
T1 (x) + T2 (x), (∀)x ∈ K, defineşte adunarea lor; kT1 : X → Y , (kT1 )(x) = kT1 (x), k ∈ K, (∀)x ∈ X
defineşte mulţimea operatorului liniar T1 cu un scalar k ∈ K.
De asemenea, dacă T1 ∈ L(X, Y ) şi T2 ∈ L(Y, Z), atunci T2 ◦ T1 : X → Z, (T2 ◦ T1 )(x) =
T2 (T1 (x)), (∀)x ∈ X, defineşte compunerea a două transformări liniare. T2 ◦ T1 se notează,
uneori, şi cu T2 T1 şi se numeşte produsul transformărilor T2 şi T1 .
Se verifică imediat că suma a două transformări liniare este tot o transformare liniară
şi, de asemenea, produsul unei transformări liniare cu un scalar este tot o transformare
liniară, adică L(X, Y ) este un subspaţiu vectorial al spaţiului vectorial Hom(X, Y ) peste K al
tuturor funcţiilor definite pe X cu valori ı̂n Y .
În particular mulţimea L(X, K) a funcţionalelor liniare definite pe spaţiul vectorial X
cu valori ı̂n câmpul K este un spaţiu vectorial numit dualul algebric al spaţiului vectorial
X şi este notat prin X ∗ .
Se arată că produsul a două transformări liniare este tot o transformare liniară, iar
dacă T ∈ L(X, Y ) este bijectivă, atunci T −1 ∈ L(Y, X), adică este tot o transformare liniară.
Rezultă că L(X, X) ı̂n raport cu operaţiile de adunare şi compunere este un inel cu element
unitate.
În continuare vom arăta că un operator liniar ı̂ntre două spaţii vectorial finit dimen-
sionale peste câmpul K este complet determinat de o matrice cu elemente din K.
Fie X şi Y două spaţii vectoriale peste acelaşi câmp K de dimensiuni finite, res-
pectiv n şi m; T ∈ L(X, Y ) un operator liniar, B = {e(1) , e(2) , . . . , e(n) } o bază ı̂n X şi

n
B1 = {f (1) , f (2) , . . . , f (m) } o bază ı̂n Y . Deoarece oricare ar fi x ∈ X, x = xj e(j) , avem
j=1

n
T (x) = xj T (e(j) ), iar vectorii T (e(j) ) ∈ Y , j = 1, n, se exprimă, unic ı̂n funcţie de coordo-
j=1
natele lor ı̂n baza B1 :

m
(4.2) T (e(j) ) = aij f (i) , j = 1, n,
i=1
avem ⎛ ⎞

m
n
(4.3) T (x) = xj aij f (i) = ⎝ aij xj ⎠ f (i) .
j=1 i=1 i=1 j=1

Dacă y = T (x) = t(y1 , y2 , . . . , yn ) ı̂n baza B1 , atunci comparând cu (4.3) găsim

n
(4.4) yi = aij xj , i = 1, m,
j=1

relaţii ce pot fi scrise matriceal sub forma

(4.5) y = Ax,

55
unde t x = (x1 , . . . , xn ) xi , i = 1, n fiind coordonatele lui x ı̂n baza B1 , iar matricea
A = (aij ) ∈ Mm×n (K) are pe coloane coordonatele imaginilor vectorilor din baza B ı̂n baza
B1 . Matricea A se numeşte matricea asociată (asociată) transformării T faţă de cele două
baze B şi B1 alese ı̂n spaţiile X şi Y . Ea este unic determinată de relaţiile (4.2). Relaţiile
(4.4) sau (4.5) se numesc ecuaţiile operatorului liniar ı̂n bazele B şi B1 .
Se arată că rangul transformării liniare este egal cu rangul matricei asociate ei faţă
de două baze.
În adevăr, rangul transformării T fiind, conform definiţiei, dimensiunea spaţiului imag-
ine, este egal cu rangul sistemului de vectori {T (e(j) )}j=1,n , care ı̂l generează pe aceasta. Cum
vectorii T (ej )j=1,n , sunt vectori coloană ai matricei A, rezultă că rang A = rang T .
Exemplul 4.1.4. Dacă T ∈ L(R3 , R2 ), (x) = (x1 − 3x2 , −4x1 + 2x2 + x3 ), x = (x1 , x2 , x3 ) şi
B = {e(1) , e(2) , e(3) }, e(1) = (1, 0, 0), e(2) = (0, 1, 0), e(3) = (0, 0, 1), respectiv B1 = {f (1) , f (2) },
f (1) = (1, 0), f (2) = (0, 1) sunt bazele canonice, atunci matricea ataşată lui T este
 
1 −3 0
A= ,
−4 2 1

deoarece T (e(1) ) = (1, −4), T (e(2) ) = (−3, 2), T (e(3) ) = (0, 1).
Fie acum T1 , T2 ∈ L(X, Y ) şi T = T1 + T2 suma lor. Avem

T (e(j) ) = T1 (e(j) ) + T2 (e(j) ), j = 1, n

de unde notând cu A1 matricea ataşată lui T1 , A2 matricea ataşată lui T2 şi cu C matricea
ataşată lui T , deducem că C = A1 + A2 , adică matricea transformării sumei este suma ma-
tricelor transformărilor termeni.
Analog, se arată că matricea produs dintre un scalar şi o transformare liniară este
produsul scalarului cu matricea acelei transformări, iar matricea transformării liniare pro-
dus este egală cu produsul matricelor transformărilor liniare factori.
De aici, rezultă
Propoziţia 4.1.4 i) Funcţia care asociază fiecărui operator liniar T ∈ L(X, Y ), dim X = n,
dim Y = m, matricea corespunzătoare ei faţă de două baze fixate, este un izomorfism
ı̂ntre spaţiul vectorial L(X, Y ) şi spaţiul vectorial Mm×n (K) al matricelor de tipul m × n
peste K.
ii) Funcţia care asociază fiecărui operator T ∈ L(X, X), dim X = n, matricea core-
spunzătoare ei ı̂ntr-o bază fixată ı̂n X, este un izomorfism ı̂ntre inelul L(X, X) şi inelul
matricelor pătratice de ordin n peste K.
Acum să cercetăm cum se schimbă matricea ataşată unei transformări liniare la schim-
barea bazelor.
Teorema 4.1.2 Fie B şi B  baze ı̂n spaţiul vectorial n–dimensional X peste K, iar B1 şi B1
baze ı̂n spaţiul vectorial m–dimensional Y peste acelaşi câmp K. Dacă T ∈ L(X, Y ), A este
matricea transformării T faţă de bazele B şi B1 , iar A1 este matricea transformării T faţă
de bazele B  şi B1 , atunci A1 = D−1 AC, unde C şi D sunt matricele de trecere de la baza B
la B  respectiv de la B1 la B1 .
Demonstraţie. Conform celor demnstrate ı̂n Capitolul IV, dacă (x1 , . . . , xn ) = t x sunt coor-
donatele unui vector x ∈ X ı̂n baza B şi (x1 , . . . , xn ) = t x sunt coordonatele aceluiaşi vector x
ı̂n baza B  , atunci x = Cx , unde C este matricea trecerii de la baza B la baza B  , având pe
coloane coordonatele vectorilor bazei B  ı̂n raport cu B. Analog, dacă avem (y1 , . . . , ym ) = t y
coordonatele imaginii y = T (x) ı̂n B1 şi (y1 , . . . , ym

) = t y  coordonatele lui y ı̂n baza B1 , atunci

y = Dy .
Ţinând seama că T este un operator liniar, cu notaţiile din enunţ, avem y = Ax res-
pectiv y  = A1 x , de unde ı̂nlocuind x = C −1 x, y  = D−1 y şi y = Ax ı̂n y  = A1 x , găsim
D−1 Ax = A1 C −1 x, de unde D−1 A = A1 C −1 , care este echivalentă cu D−1 AC = A1 .

56
Observaţia 4.1.2 Dacă T ∈ L(X, X), dim X = n, A matricea ataşată lui T ı̂n raport cu baza
B, iar A1 este matricea ataşată lui T ı̂n raport cu baza B1 , atunci A1 = C −1 AC, unde C este
matricea de trecere de la B la B  .
Definiţia 4.1.2 Matricele A, B ∈ Mn2 (K) se numesc asemenea, notăm aceasta prin A ∼ B,
dacă există matricea nesingulară C ∈ Mn2 (K) aşa ı̂ncât B = C −1 AC.
Se verifică imediat că asemănarea matricelor este o relaţie de echivalenţă pe Mn2 (K).
Exemplul 4.1.5. Fie T ∈ L(R3 , R4 ), x = (x1 , x2 , x3 ) ∈ R3 ,
T (x) = (2x1 − x2 + x3 , x2 − 2x3 , x1 + x2 + x3 , x1 − x2 ).
(1) (2) (3) (1)
Aflaţi matricea asociată lui T ı̂n raport cu perechea de baze B  = {e1 , e1 , e1 }, e1 =
(2) (3) (1) (2) (3) (4) (1) (2)
(0, 1, 1), e1 = (1, 0, 1), e1 = (1, 1, 0) ı̂n R3 şi B1 = {e2 , e2 , e2 , e2 }, e2 = (1, 1, 1, 1), e2 =
(3) (4)
(0, 1, 1, 1), e2 = (0, 0, 1, 1), e2 = (0, 0, 0, 1), ı̂n R4 . Se cere matricea A1 a transformării T faţă
de bazele B  şi B1 .
Deoarece ⎛ ⎞
2 −1 1 ⎛ ⎞
⎜ 0 1 −2 ⎟ x1
T (x) = ⎜⎝ 1 1
⎟ ⎝ x2 ⎠
1 ⎠
x3
1 −1 0
deducem că matricea transformării liniare T ı̂n raport cu bazele canonice B şi B1 din R3
respectiv R4 este ⎛ ⎞
2 −1 1
⎜ 0 1 −2 ⎟
A=⎜ ⎝ 1 1

1 ⎠
1 −1 0
Matricea C de trecere de la baza B la B1 este
⎛ ⎞
0 1 1
C=⎝ 1 0 1 ⎠
1 1 0
iar matricea D de trecere de la baza B  la baza B1 este
⎛ ⎞
1 0 0 0
⎜ 1 1 0 0 ⎟
D=⎜ ⎝ 1 1

1 0 ⎠
1 1 1 1
Se găseşte ⎛ ⎞
1 0 0 0
⎜ −1 1 0 0 ⎟
D−1 =⎜
⎝ 0

−1 1 0 ⎠
0 0 −1 1
şi deci avem ⎛ ⎞
0 3 1
⎜ −1 −3 0 ⎟
A1 = D AC = ⎜
−1
⎝ 3

4 1 ⎠
−3 −1 −2
Am văzut ı̂n Observaţia 4.1.2 că matricea unei transformări liniare T ∈ L(X, X),
dim X = n, depinde de alegerea bazei ı̂n X. În continuare ne punem problema de a găsi
o bază faţă de care această matrice să aibă o formă diagonală
⎛ ⎞
λ1 0 . . . 0
⎜ 0 λ2 . . . 0 ⎟
(4.6) A1 = ⎜⎝ ... ... ... ... ⎠

0 0 . . . λn

57
Ţinând seama de expresiile (4.5) care definesc matricea A1 a transformării liniare T
ı̂n baza B1 = {f (1) , . . . , f (n) } obţinem:

Teorema 4.1.3 Condiţia necesară şi suficientă ca matricea transformării liniare T ∈


L(X, X), dim X = n, să poată fi adusă la forma diagonală (4.6) este să existe o bază
B1 = {f (1) , f (2) , . . . , f (n) } ı̂n X şi n elemente λ1 , λ2 , . . . , λn ∈ K astfel ı̂ncât să avem

(4.7) T (f (i) ) = λi f (i) , i = 1, n.

Definiţia 4.1.3 Se spune că vectorul x = θ, x ∈ X, este un vector caracteristic sau propriu
pentru operatorul liniar T ∈ L(X, X) dacă există un element λ ∈ K astfel ı̂ncât să avem

(4.8) T (x) = λx.

Elementul λ corespunzător vectorului propriu x se numeşte atunci valoare caracteris-


tică sau proprie pentru transformarea liniară T .
În conformitate cu această definiţie, matricea unei transformări liniare poate fi
adusă la o formă diagonală dacă şi numai dacă transformarea are n vectori proprii liniar
independenţi. În acest caz, elementele de pe diagonala principală din matricea diagonală
sunt atunci valorile proprii corespunzătoare.
În cele ce urmează ne vom ocupa cu determinarea valorilor proprii şi vectorilor proprii
pentru un operator liniar T din L(X, X), cu dim X = n.
Fie B = {e(1) , e(2) , . . . , e(n) } o bază ı̂n X, A = (aij ) ∈ Mn2 (K) matricea asociată lui T , I
matricea unitate de ordin n şi t x = (x1 , . . . , xn ) coordonatele unui vector x ∈ V ı̂n baza B;
atunci ecuaţia (4.8) se poate scrie sub forma matriceală

(4.9) (A − λI)x = 0.

Această ecuaţie este echivalentă cu sistemul

(a11 − λ)x1 + a12 x2 + . . . + a1n xn = 0


a21 x1 + (a22 − λ)x2 + . . . + a2n xn = 0
(4.10)
.................................
an1 x1 + an2 x2 + . . . + (ann − λ)xn = 0

Sistemul (4.10) fiind liniar şi omogen, admite soluţii diferite de soluţia banală dacă şi
numai dacă determinantul matricei sistemului este egal cu zero.
Acest determinant se notează cu PA (λ) şi are forma
 
 a11 − λ a12 ... a1n 
 
 a21 a22 − λ . . . a2n 

PA (λ) = det(A − λI) =  
... ... ... ... 
 
 an1 an2 . . . ann − λ 

numit polinomul caracteristic ataşat transformării liniare T sau matricei A.


Prin urmare valorile caracteristice ale matricei A sau transformări liniare T se găsesc
printre rădăcinile ecuaţiei
(4.11) PA (λ) = 0,
numită ecuaţia caracteristică corespunzătoare matricei A sau transformării liniare T . Şirul
λ1 , λ2 , . . . , λn al tuturor rădăcinilor ecuaţiei caracteristice, unde fiecare este socotită de atâtea
ori cât indică ordinul său de multiplicitate, constituie spectrul matricei A sau a operatorului
liniar T .
Polinomul caracteristic are gradul n şi se poate scrie dezvoltat sub forma:

PA (λ) = (−1)n λn + (−1)n−1 δ1 λn−1 + (−1)n−2 δ2 λn−2 + . . . + (−1)δn−1 λ + δn ,

58
unde δi , i = 1, n, este suma minorilor diagonali de ordin i ai matricei asociate operatorului
liniar T ı̂ntr-o anumită bază, adică:
   
 a11 . . . a1i   a22 ... a2,i+1 
   
δi =  . . . . . . . . .  +  . . . ... ...  + ...+

 ai1 . . . aii   ai+1,2 ... ai+1,i+1 
 
 an−i+1,n−i+1 . . . an−i+1,n 

+  ... ... ... ,

 an,n−i+1 ... ann 

suma având Cni termeni, i = 1, n. Prin minor diagonal al matricei A ı̂nţelegem un minor
care are pe diagonala principală numai elemente de pe diagonala principală a matricei A.
Se observă că δ1 = a11 + a22 + . . . + ann = tr(A) este urma matricei A, iar δn = det A.
Propoziţia 4.1.5 Două matrice asemenea au acelaşi polinom caracteristic.

Demonstraţie. Într-adevăr, dacă matricea A este asemenea cu B, adică are loc Definiţia
4.1.2, atunci

PB (λ) = det(B − λI) = det(C −1 AC − λI) = det(C −1 (A − λI)C) =

= det C −1 · det(A − λI) det C = det(A − λI) = PA (λ).

Corolarul 4.1.1 Polinomul caracteristic al unui operator liniar T ∈ L(X, X) este invariant
la schimbarea bazei.

Valabilitatea acestui corolar rezultă din Observaţia 4.1.2 şi Propoziţia 4.1.5.
Prin urmare, ca să găsim valorile caracteristice (spectrul) şi vectorii caracteristici
pentru operatorul liniar T ∈ L(X, X), dim X = n, alegem o bază B = {e(1) , . . . , e(n) } ı̂n X,
rezolvăm ecuaţia caracteristică PA (λ) = 0 şi, introducând pe rând fiecare rădăcină λi , i = 1, n,
a acesteia ı̂n sistemul (4.10), găsim vectori caracteristici corespunzători.

Propoziţia 4.1.6 Vectorii caracteristici corespunzători unei valori caracteristice λi , i = 1, n


formează ı̂mpreună cu vectorul nul al spaţiului vectorial X un subspaţiu Vi al lui X, numit
subspaţiu caracteristic sau propriu, de dimensiune cel mult egală cu ordinul de multiplici-
tate al lui λi , i = 1, n.

Demonstraţie. Se observă că Vi este mulţimea soluţiilor ecuaţiei


(T − λi I)(x) = θ, adică nucleul transformării liniare T − λi I ∈ L(X, X) şi după Propoziţia 4.1.3
acesta este un subspaţiu al lui X. Fie acum ki = dim Vi şi mi ordinul de multiplicitate pentru
λi . Presupunem că am ales baza B = {e(1) , . . . , e(n) } ı̂n X aşa ca e(1) , . . . , e(ki ) să se găsească ı̂n
Vi . Atunci avem T (e(s) ) = λi e(s) , s = 1, 2, . . . , ki şi deci matricea A are, faţă de această bază,
forma ⎛ ⎞
λi 0 . . . 0 a1,ki +1 . . . a1n
⎜ 0 λi . . . 0 a2,ki +1 . . . a2n ⎟
⎜ ⎟
⎜ ....... ................. ⎟
⎜ ⎟
A=⎜ ⎜ 0 0 . . . λi aki ,ki +1 . . . aki ,n


⎜ 0 0 . . . 0 aki +1,ki +1 . . . aki +1,n ⎟
⎜ ⎟
⎝ ....... ................. ⎠
0 0 . . . 0 an,ki +1 . . . ann
de unde rezultă
PA (λ) = (λ − λi )ki Q(λ)
şi cum ordinul de multiplicitate al lui λi este mi , rezultă ki ≤ mi .

Corolarul 4.1.2 Unei valori caracteristice simple ı̂i corespunde un subspaţiu propriu de di-
mensiune egală cu unu.

59
Teorema 4.1.4 Dacă vectorii caracteristici x(1) , x(2) , . . . , x(m) corespund la valori caracteris-
tice distincte λ1 , λ2 , . . . , λm , atunci ei sunt liniar independenţi.

Demonstraţie. Procedăm prin inducţie matematică. Pentru m = 1, teorema este evident


adevărată. Presupunem că este adevărată pentru k şi să o demonstrăm pentru k + 1. Presu-
punem că x(1) , x(2) , . . . , x(k+1) ar fi liniar dependenţi, adică ar există scalari α1 , α2 , . . . , αk+1 ∈ K,
nu toţi nuli, aşa ı̂ncât
(4.12) α1 x(1) + α2 x(2) + . . . + αk+1 x(k+1) = θ.
Aplicând ı̂n (4.12) operatorul liniar T şi folosind ipoteza teoremei, obţinem

(4.13) α1 λ1 x(1) + α2 λ2 x(2) + +̇αk+1 λk+1 x(k+1) = θ.

Eliminând pe x(k+1) ı̂ntre relaţiile (4.12) şi (4.13) găsim

α1 (λ1 − λk+1 )x(1) + α2 (λ2 − λk+1 )x(2) + . . . +


(4.14)
+αk (λk − λk+1 )x(k) = θ

Fără să restrângem generalitatea, să admitem cu α1 = 0, atunci, ţinând seama că
x(1) , . . . , x(k) sunt liniar independenţi, deducem λ1 = λk+1 ceea ce constituie o contradicţie.
Rezultă că vectorii x(1) , x(2) , . . . x(m) sunt liniar independenţi.
Corolarul 4.1.3 Dacă operatorul liniar T are n valori caracteristice distincte atunci el poate
fi adus la forma diagonală.
Într-adevăm, ı̂n această situaţie alegând câte un vector propriu corespunzător fiecărei
valori caracteristice obţinem n vectori caracteristici liniar independenţi şi deci o bază ı̂n X.
Faţă de această bază, după Teorema 4.1.3, operatorul liniar T are forma diagonală.
Pentru cazul general se demonstrează (v. [2]):
Teorema 4.1.5 Condiţia necesară şi suficientă ca matricea operatorului liniar T ∈ L(X, X),
dim X = n, să aibă formă diagonală este ca toate valorile caracteristice să fie din câmpul K şi
subspaţiile proprii corespunzătoare să aibă dimensiunile egale cu ordinele de multiplicitate
corespunzătoare.
Exemplul 4.1.6. Să considerăm transformarea liniară T ∈ L(R3 , R3 ) definită prin

T (x) = (x2 + x3 , x1 + x3 , x1 + x2 ), x = (x1 , x2 , x4 ) ∈ R3 .

Să arătăm că T poate fi adusă la o formă diagonală şi să se precizeze o bază faţă de
care matricea ei are forma diagonală.
Matricea transformării ı̂n baza canonică a lui R3 este
⎛ ⎞
0 1 1
A = ⎝ 1 0 1 ⎠,
1 1 0

iar ecuaţia caracteristică are forma


 
 −λ 1 1 
 
 1 −λ 1 =0
 
 1 1 −λ 

de unde λ3 − 3λ − 2 = 0. De aici găsim valorile caracteristice λ1 = 2, λ2 = λ3 = −1.


Vectorii caracteristici sunt soluţiile sistemului liniar omogen

−λx1 + x2 + x3 = 0
(4.15) x1 − λx2 + x3 = 0
x1 + x2 − λx3 = 0

60
unde λ se ı̂nlocuieşte pe rând cu una din valorile caracteristice,
Pentru λ1 = 2 sistemul (4.15) are soluţia x(1) = (1, 1, 1), iar dimensiunea subspaţiului
propriu V1 este unu şi o bază ı̂n V1 este dată de x(1) .
Pentru λ1 = λ3 = −1, sistemul (4.15) se reduce la ecuaţia

x1 + x2 + x3 = 0

şi subspaţiul propriu V2 care este mulţimea soluţiilor acestei ecuaţii, are dimensiunea 2, ca
bază putând fi luaţi vectorii caracteristici x(2) = (−1, 1, 0), x(3) = (−1, 0, 1). Cum dim V2 = 2,
adică egală cu ordinul de multiplicitate al va- lorii caracteristice λ = −1, deducem că matricea
tranformării poate fi adusă la forma diagonală
⎛ ⎞
2 0 0
A1 = ⎝ 0 −1 0 ⎠
0 0 −1

iar B1 = {x(1) , x(2) , x(3) }, unde x(1) , x(2) , x(3) sunt vectorii caracteristici determinaţi, este o
bază ı̂n R3 faţă de care matricea transformării are forma diagonală A1 .
În ı̂ncheierea acestui paragraf, dă fără demonstraţie următorul rezultat (v. [2]):

Teorema 4.1.6 Cayley-Hamilton. Pentru orice operator liniar T ∈ L(X, X), dim X = n, ma-
tricea transformării A verifică ecuaţia caracteristică PA (λ) = 0.

4.2 Forme biliniare


Definiţia 4.2.1 Fie X un spaţiu vectorial peste câmpul K. Numim formă biliniară peste
câmpul K o aplicaţie f : X × X → K, care este liniară ı̂n raport cu fiecare variabilă, adică
satisface condiţiile:

1o . f (αx + βy, z) = αf( x, z) + βf (y, z).

2o . f (x, αy + βz) = αf (x, y) + βf (x, z),

oricare ar fi x, y, z ∈ X şi α, β ∈ K.

Definiţia 4.2.2 O formă biliniară f se numeşte simetrică dacă

f (x, y) = f (y, x), (∀)x, y ∈ X

şi antisimetrică dacă


f (x, y) = −f (y, x), (∀)x, y ∈ X.

Exemple. 4.2.1. Produsul scalar definit ı̂ntr-un spaţiu vectorial real este o formă biliniară.
Să notă, cu B(X) mulţimea formelor biliniare definite pe X. Dacă f, g ∈ B(X) şi
k ∈ K atunci aplicaţiile kf, f + g : X × X → K definite natural prin (kf )(x, y) = kf (x, y) şi
(f + g)(x, y) = f (x, y) + g(x, y), oricare ar fi x, y ∈ X, sunt forme biliniare, numite ı̂nmulţirea
cu un scalar a unei forme biliniare şi respectiv adunarea a două forme biliniare.
Se constată imediat că operaţiile de adunare a două forme biliniare şi de ı̂nmulţire a
unei forme biliniare cu un scalar din K definesc pe mulţimea B(X) o structură de spaţiu
vectorial peste K.
Mulţimea formelor biliniare simetrice formează un subspaţiu vectorial al lui B(X).
Să considerăm acum spaţiul vectorial X de dimensiune finită n. Fie B = {e(1) , . . . , e(n) }
o bază ı̂n X; punând x, y ∈ X

n
x= xi e(i) şi y = yj e(j) ,
i=1 j=1

61
pentru forma biliniară f avem
⎛ ⎞

n

n
f (x, y) = f ⎝ xi e(i) , yj e(j) ⎠ =
i=1 j=1

n
= xi yj f (e(i) , e(j) ).
i=1 j=1

Rezultă că forma biliniară este determinată de valorile ei pe vectorii bazei. Elementele

aij = f (e(i) , e(j) ), i, j = 1, n

se numesc coeficienţii formei biliniare, iar expresia


n
f (x, y) = aij xi yi
i=1 j=1

se numeşte expresia analitică a formei biliniare.


Dacă punem

x = t (x1 , x2 , . . . , xn ), y = t (y1 , . . . , yn ), A = (aij )i,j=1,n ∈ Mn2 (K),

atunci putem scrie


f (x, y) = t xAy,
care reprezintă forma matriceală a formei biliniare, iar A se numeşte matricea ataşată formei
biliniare ı̂n baza B.
Rangul matricei ataşate ı̂ntr-o bază dată unei forme biliniare se numeşte rangul formei
biliniare. Dacă rangul formei coincide cu dimensiunea spaţiului vectorial, atunci forma
biliniară se numeşte nedependentă. Se numeşte discriminantul unei forme biliniare ı̂ntr-o
bază dată, determinantul matricei asociate formei ı̂n baza dată.

4.3 Forme pătratice


În studiul unor probleme de analiză economică un rol deosebit ı̂l au formele pătratice.
Definiţia 4.3.1 Fie X un spaţiu vectorial peste câmpul K şi f o formă biliniară simetrică
pe X. Numim formă pătratică asociată lui f aplicaţia g : X → K, g(x) = f (x, x), oricare ar
fi x din X.
Forma biliniară f care generează forma pătratică g se numeşte forma polară a lui g.
Dacă ı̂n câmpul K avem a + a = 0, pentru orice a ∈ K, a = 0, atunci avem

g(x + y) = f (x + y, x + y) = f (x, x) + f (x, y) + f (y, x) + f (y, y) =

= g(x) + 2f (x, y) + g(y),


de unde
1
f (x, y) = [g(x + y) − g(x) − g(y)].
2
Acest rezultat ne arată că forma polară este determinată ı̂n mod unic de forma
sa pătratică. Altfel spus, ı̂ntre mulţimea formelor biliniare simetrice şi mulţimea celor
pătratice definite pe X există un izomorfism. Dacă presupunem că dim X = n şi considerăm
o bază B = {e(1) , . . . , e(n) } ı̂n el, atunci din expresia analitică a formei biliniare f (§5.2) găsim
următoarea expresie analitică pentru forma pătratică g

n
(4.16) g(x) = aij xi xj .
i=1 j=1

62
Dacă punem A = (aij ) ∈ Mn2 (K), care pentru formele pătratice este o matrice simet-
rică, obţinem expresia matriceală pentru forma pătratică:

g(x) = t xAx,

unde x = t (x1 , . . . , xn ) ∈ X.

Definiţia 4.3.2 Dacă ı̂n expresia analitică (4.16) a formei pătratice g, toţi coeficienţii aij cu
i = j sunt nuli, atunci se spune că reprezentarea formei pătratice este sub formă canonică .

Teorema 4.3.1 (Gauss). Expresia analitică a oricărei forme pătratice pe un spaţiu vectorial
X peste K, dim X = n, poate fi adusă printr-o schimbare de bază, la forma canonică.

Demonstraţie. Vom demonstra această teoremă prin inducţie matematică după numărul k
al variabilelor ce apar ı̂n expresia analitică a formei pătratice.
Evident că pentru k = 1 avem g(x) = a11 x21 , care este scrisă sub forma canonică.
Presupunem teorema valabilă pentru k − 1 variabile şi o demonstrăm pentru k. Fără a
restrânge generalitatea presupunem că a11 = 0 (ı̂n caz contrar renumerotăm variabilele, iar
dacă toţi a11 = 0, i = 1, n, atunci ı̂ntr-un produs xi xj facem schimbarea de variabile xi = yi −yj ,
xj = yi + yj ). Acum, scriem expresia analitică (4.16) a formei pătratice astfel
⎡ ⎤
1 ⎣ 2 2
n
n
g(x) = a11 x1 + 2 a11 a1j x1 xj ⎦ + aij xi xj =
a11 j=2 i,j=2

n 2
1

n
= a1j xj + bij xi xj ,
a11 i=1 i,j=2

noii coeficienţi bij rezultă din reducerea termenilor asemenea după formarea pătratului
perfect.
Făcând schimbarea de variabile

n
y1 = a1j xj , yk = xk , k = 2, n
j=1

obţinem
1 2
g(x) = y + h(y),
a11 1
unde

n
h(y) = bij yi yj
i=1 j=2

nu depinde de x1 , deci ı̂n expresia ei analitică avem doar k − 1 variabile. Folosind ipoteza
inducţiei, există o bază (o schimbare de coordonate) a spaţiului X ı̂n care

h(y) = λ2 y22 + . . . + λm ym
2
.

Atunci
g(x) = λ1 y12 + . . . + λm ym
2
, λ1 = 1/a11 .
Teorema este demonstrată. Demonstraţia teoremei ne oferă şi un procedeu practic
de a scrie o formă pătratică sub forma canonică numită metoda lui Gauss. Astfel, mai ı̂ntâi
se formează un pătrat perfect cu termeni care conţin pe x1 , apoi cu termenii ce conţin pe
x2 ş.a.m.d.
Exemplul 4.3.1. Să reducem la forma canonică forma pătratică g : R3 → R, g(x) = 2x21 + x1 x2 +

63
x22 + 4x1 x3 + 4x23 .
Utilizând metoda lui Gauss avem
1 1$ x2 %2
g(x) = (4x21 + 2x1 x2 + 8x1 x3 ) + x22 + 4x23 = 2x1 + + 2x3 +
2 2 2
15 1 1 $ x2 % 2
+ x22 + 3x23 − x2 x3 = 2x1 + + 2x3 +
16 2 2 2
  
16 15
2
8 1 $ x2 %2
+ x22 − x2 x3 + 3x3 = 2x1 + + 2x3 +
15 16 15 2 2
 2
16 16 1 44
+ x2 − x3 + x23 .
15 16 4 15
Punând
x2 15 x3
(4.17) y1 = 2x1 +
+ 2x3 , y2 = x2 − , y3 = x3
2 16 4
obţinem forma canonică pentru g:
1 2 16 2 44 2
(4.18) g(x) = y + y + y .
2 1 15 2 15 3
Din (4.17) avem:
1 4 16
x1 = y1 − y2 − y3
2 15 15
16 4
x2 = y2 + y3
15 15

x3 = y3
sau matriceal x = Cy, unde x = t (x1 , x2 , x3 ), y = t (y1 , y2 , y3 ), x, y ∈ R3 şi
⎛ 1 4

2 − 15 − 16
15
C=⎝ 0 16
15
4
15

0 0 1

Cum C este nesingulară şi are


 rangul  3 deducem
 că forma
 pătratică
 este nedegenerată,

(1) 1 (2) 4 10 (3) 16 4
iar vectorii coloană din C, f = , 0, 0 , f = − , , 0 , f = − , , 1 constituie
2 15 15 15 15
noua bază faţă de care g are forma canonică (4.18).
Exemplul 4.3.2. Să aducem la forma canonică forma pătratică g : R4 → R, g(x) = x1 x2 +
x1 x3 − 2x2 x3 + x3 x4 .
Deoarece nu avem termeni ı̂n x21 , i = 1, 2, 3, 4, facem schimbare de variabile

(4.19) x1 = y1 − y2 , x2 = y1 + y2 , x3 = y3 , x4 = y4

şi obţinem
(4.20) g(x) = y12 − y22 − y1 y3 − 3y2 y3 + y3 y4 .
Acum aplicând metoda lui Gauss avem succesiv,
$ y 3 %2 1
g(x) = y1 − − y22 − y32 − 3y2 y3 + y3 y4 =
2 4
$  2
y 3 %2 3
= y1 − − y2 + y3 + 2y32 + y3 y4 =
2 2
$    2
y 3 %2
2
3 1 1 1
= y1 − − y2 + y3 + 2y3 + y4 − y42 .
2 2 2 2 8

64
Dacă punem
y3 3 1
(4.21) z1 = y 1 − , z2 = y 2 + y 3 , z3 = 2y3 + y4 , z4 = y4 ,
2 2 2
obţinem
1 1
(4.22) g(x) = z12 − z22 + z32 − z42 .
2 8
Din (4.21) găsim
1 3 3
x1 = z1 − z2 + z3 − z4
2 8 32
3 9 9
x2 = z1 + z2 − z3 + z4
2 8 32
1 1
x3 = z3 − z4
2 8

x4 z4
care constituie schimbarea de variabile prin care g(x) se scrie sub forma canonică (4.22).
O altă metodă de aducere la forma canonică a unei forme pătratice a fost dată de
Jacobi.
Teorema 4.3.2 Jacobi. Fie g : X → K o formă pătratică pe spaţiul vectorial n–dimensional
X peste K şi A = (aij ) ∈ Mn2 (K) matricea formei ı̂n baza B = {e(1) , . . . , e(n) } a spaţiului X.
Dacă determinanţii  
 a a12 
Δ1 = a11 , Δ2 =  11 ,...,
 a21
 a22
(4.23)  a11 . . . a1i 
 
Δi =  . . . . . . . . .  , . . . , Δn = det A
 ai1 . . . aii 

sunt toţi nenuli, atunci există o bază B1 = {h(1) , . . . , h(n) } a spaţiului X aşa ı̂ncât g are forma
canonică

n
Δi−1 2
(4.24) g(x) = y , Δ0 = 1,
i=1
Δi i
unde (y1 , y2 , . . . , yn ) sunt coordonatele vectorului x ı̂n baza B1 .
Demonstraţie. Pentru găsirea bazei B, vom considera vectori h(i) , i = 1, n de forma
h(1) = b11 e(1)
h(2) = b21 e(1) + b22 e(2)
(4.25) ..
.
h(n) = bn1 e(1) + bn2 e(2) + . . . + bnn e(n)
şi vom impune condiţiile
f (h(i) , e(j) ) = 0, pentru 1 ≤ j < i ≤ n,
(4.26)
f (h(i) , e(i) ) = 1, pentru 1 ≤ i ≤ n,
unde f este forma polară a formei pătratice g.
Condiţiile (4.26) determină ı̂n mod unic vectorii h(i) , i = 1, n. Astfel, ca să determinăm
vectorul h(i) = hi1 e(1) + hi2 e(2) + . . . + bii e(i) , i = 1, n, ı̂n condiţiile (4.26) obţinem sistemul liniar
a11 αi1 + a21 αi2 + . . . + a1i αii = 0
a21 αi1 + a22 αi2 + . . . + a2i αii = 0
...................................
ai−1,1 αi1 + ai−1,2 αi2 + . . . + ai−1,i αii = 0
ai1 αi1 + ai2 αi2 + . . . + aii αii = 1

65
care are o soluţie unică deoarece determinantul său este Δi = 0.
Se arată uşor că vectorii h(1) , . . . , h(n) astfel construiţi sunt liniar independenţi. Acum
să arătăm că B1 = {h(1) , . . . , h(n) } esste baza ı̂n care matricea formei pătratice g este C =
(cij ) = Mn2 (K), cu aij = 0, i = j şi cij = Δi−1 /Δi , i = 1, n.
Avem
cij = f (h(i) , h(j) ) = f (h(i) , bj1 e(1) + bj2 e(2) + . . . + bjj e(j) ) =
= bj1 f (h(i) , e(1) ) + bj2 (h(i) , e(2) ) + . . . + bjj f (h(i) , e(j) ),
de unde folosind condiţiile (4.25), găsim
cij = 0, dacă i = j şi cii = bii = Δi−1 /Δi , i = 1, n.
Teorema este astfel demonstrată.
Exemplul 4.3.3. Utilizând metoda lui Jacobi să aflăm formele canonice pentru formele
pătratice din Exemplele 4.3.1 şi 4.3.2.
Matricea formei pătratice din Exemplul 4.3.1 este
⎛ 1 ⎞
2 2
⎜ 2 ⎟
⎜ ⎟
⎜ ⎟
A=⎜⎜ 1 ⎟
1 0 ⎟
⎜ 2 ⎟
⎝ ⎠
2 0 4
cu  
 1 
 2 
 2  7
Δ0 = 1, Δ1 = 2, Δ2 =  =
 4 şi Δ3 = det A = 3,
 1 
 1 
2
iar din (4.23) obţinem
1 2 8 2 7
y + y + y2 .
g(x) =
2 1 7 2 12 3
Pentru forma pătratică din exemplul 4.3.2 utilizăm forma (4.20) şi avem
⎛ 1 ⎞
1 0 − 0
⎜ 2 ⎟
⎜ ⎟
⎜ ⎟
⎜ 3 ⎟
⎜ 0 −2 − 0 ⎟
⎜ 2 ⎟
⎜ ⎟
A=⎜ ⎟
⎜ 1 3 1 ⎟
⎜ − − ⎟
⎜ 0 ⎟
⎜ 2 2 2 ⎟
⎜ ⎟
⎝ ⎠
1
0 0 0
2
cu
1 1
Δ0 = 1, Δ1 = 1, Δ2 = −1, Δ3 = − şi Δ4 = det A =
2 4
de unde, folosind (4.23), găsim
g(x) = z12 − z22 + 2z32 − 2z42 .
Observaţia 4.3.1 Pentru determinarea formei canonice a unei forme pătratice g se pot
utiliza şi valorile caracteristice (proprii) ale matricei A ataşatei ei ı̂ntr-o bază. Dacă
λ1 , λ2 , . . . , λn sunt valorile caracteristice corespunzătoare lui A, atunci forma canonică este
g(x) = λ1 y12 + λ2 y22 + . . . + λn yn2 (v. [2]).
În studiul punctelor de extrem avem nevoie de semnul unei forme pătratice.

66
Vom considera acum o formă pătratică peste un spaţiu vectorial peste R.
Definiţia 4.3.3 Fie g : X → R o formă pătratică reală adusă la o formă canonică ı̂ntr-o bază.
Dacă ı̂n această formă canonică p coeficienţii sunt strict pozitivi, q sunt strict negativi iar
r = n − (p + q) sunt nuli, atunci tripletul (p, q, r) se numeşte signatura formei pătratice.
Se demonstrează (v. [2]) următorul rezultat:
Teorema 4.3.3 (inerţiei). Signatura unei forme pătratice este invariantă la schimbarea
bazei.
Definiţia 4.3.4 O formă pătratică reală g : X → R se numeşte pozitiv definită respectiv
negativ definită dacă g(x) > 0 respectiv g(x) < 0, pentru orice x ∈ X, x = θ.
Forma g se numeşte semidefinită pozitiv sau semidefinită negativ după cum g(x) ≥ 0
sau g(x) ≤ 0, pentru orice x ∈ X. Forma g se numeşte nedefinită dacă există vectorii x(1) ∈ X
şi x(2) ∈ X astfel ı̂ncât g(x(1) ) > 0 şi g(x(2) ) < 0.
Teorema 4.3.4 (Sylvester). În condiţiile Teoremei lui Jacobi, forma pătratică g : X → R
este pozitiv definită dacă şi numai dacă Δi ≥ 0, i = 1, n şi negativ definită dacă şi numai
dacă (−1)i Δi > 0, i = 1, n.
Demonstraţie. Să considerăm că g este pozitiv definită. Arătăm mai ı̂ntâi că Δi = 0,
i = 1, n. Să presupunem prin obsurd că există k ∈ {1, 2, . . . , n} pentru care Δk = 0. Atunci
ı̂n determinantul Δk una din linii este o combinaţie liniară a celorlalte, adică există scalarii
α1 , α2 , . . . , αk astfel ı̂ncât
(4.27) α1 a1j + α2 a2j + . . . + αk akj = 0, j = 1, k.
Dacă f este polara formei pătratice g, ţinând seama că aij = f (e(i) , e(j) ), i, j = 1, n, din
(4.27) avem
0 = α1 f (e(1) , e(j) ) + α2 f (e(2) , e(j) ) + . . . + αk f (e(k) , e(j) ) =
= f (α1 e(1) + α2 e(2) + . . . + αk e(k) , e(j) ), j = 1, k
Înmulţind corespunzător cu αj , i = 1, k, egalităţile precedente şi ı̂nsumându-le,
obţinem
f (α1 e(1) + α2 e(2) + . . . + αk e(k) , α1 e(1) + α2 e(2) + . . . + αk e(k) ) = 0,
adică
(4.28) g(α1 e(1) + α2 e(2) + . . . αk e(k) ) = 0.
Cum g este pozitiv definită deducem că (4.28) este posibilă numai dacă α1 e(1) +
α2 e + . . . + αk e(k) = θ, ceea ce contrazice liniar independenţa vectorială a bazei B =
(2)

{e(1) , e(2) , . . . , e(n) }. Prin urmare, presupunerea că ar exista un Δk = 0 este falsă şi deci
Δi = 0, i = 1, n.
Acum, folosind Teorema lui Jacobi, există o bază B1 = {h(1) , h(2) , . . . , h(n) } faţă de care

n
Δi−1
g(x) = yi2 .
i=1
Δi

Cum g(x) > 0, pentru orice x nenul. ı̂n particular pentru (y1 , . . . , yi , . . . , yn ) =
(0, . . . , 1, . . . , 0), obţinem Δi−1 /Δi > 0, i = 1, n. Deoarece Δ0 = 1 şi Δ0 /Δ1 > 0, avem Δ1 > 0 şi
din aproape ı̂n aproape obţinem Δi > 0, i = 1, n.
Reciproc, dacă Δi > 0, i = 1, n, atunci Δi−1 /Δi > 0, i = 1, n, şi

n
Δi−1
g(x) = y12 ≥ 0
i=1
Δi
cu egalitate numai dacă y1 = y2 = . . . = yn = 0, adică x = θ, ceea ce ne arată că g este pozitiv
definită.
Dacă g este negativ definită atunci forma pătratică −g : X → R este pozitiv definită,
matricea ei fiind −A = (−aij ) cu minorii diagonali Δi = (−1)i Δi . Deoarece −g este pozitiv
definită numai dacă Δi > 0 rezultă că g este negativ definită numai dacă (−1)i Δi > 0, i = 1, n.

67
Corolarul 4.3.1 O formă pătratică reală pe un spaţiu n–dimensional este pozitiv respectiv
negativ definită dacă şi numai dacă una din condiţiile de mai jos este ı̂ndeplinită:

1o . signatura ei este (n, 0, 0) respectiv (0, n, 0);

2o . toate valorile caracteristice ale matricei A ataşate formei ı̂ntr-o bază sunt strict pozi-
tive (strict negative).

Forma pătratică din Exemplul 4.3.1 este pozitiv definită deoarece signatura ei este
(3, 0, 0).

68
4.4 Testul Nr. 3 de verificare a cunoştinţelor

1. Definiţi următoarele noţiuni:


a) Transformare liniară;
b) Formă liniară;
c) Nucleul unui operator liniar;
d) Vector caracteristic;
e) Formă biliniară;
f) Formă pătratică;
g) Forma canonică a unei forme pătratice;
h) Signatura formei pătratice.
2. Arătaţi că următoarea aplicaţie este o transformare liniară: f : R3 → R2 , f (x1 , x2 , x3 ) =
(2x1 + x2 , 4x3 ).
3. Fie aplicaţiile f : R2 → R2 , f (x1 , x2 ) = (2x1 − x2 , 3x2 ) şi g : R2 → R2 , g(x1 , x2 ) = (x2 − x1 , 4x1 ).
Arătaţi că f şi g sunt operatori liniari, apoi determinaţi f ◦ g şi g ◦ f şi verificaţi că sunt
operatori liniari.
4. Fie transformarea liniară f : R3 → R3 care ı̂n baza canonică este dată de matricea
⎛ ⎞
5 −3 2
A = ⎝ 6 −4 4 ⎠ .
4 −4 5
Găsiţi valorile şi vectorii caracteristici ataşaţi transformării.
5. Fie transformarea liniară T : R3 → R3 cu exprimarea ı̂n baza B dată de matricea
⎛ ⎞
7 −12 6
A = ⎝ 10 −19 10 ⎠ .
12 −24 13
Arătaţi că există o bază B  ı̂n R3 faţă de care matricea transformării T are forma
diagonală.
6. Diagonalizaţi matricea ⎛ ⎞
4 −2 2
A = ⎝ −5 7 −5 ⎠ .
−6 6 −4
7. Să se aducă la forma canonică, cu ajutorul metodei lui Gauss, forma pătratică:
f (x) = x21 + x22 + x23 − 2x24 − 2x1 x2 + 2x1 x3 − 2x1 x4 + 2x2 x3 − 4x2 x4 .

8. Să se aducă la forma canonică, cu ajutorul metodei lui Gauss, forma pătratică:
f (x) = x1 x2 + 3x1 x3 + 5x2 x3 .

9. Să se aducă la forma canonică, cu ajutorul metodei lui Jacobi, forma pătratică:
f (x) = x21 + 2x22 + 3x23 + 3x24 − 2x2 x3 − 2x1 x3 + 2x1 x4 + 6x2 x4 .

10. Să se aducă la forma canonică, cu ajutorul metodei lui Jacobi, forma pătratică:
f (x) = x21 + 4x1 x2 + 2x1 x4 + 3x22 − 2x2 x3 + 2x2 x4 + 2x23 − 4x3 x4 − x24 .

69
Indicaţii şi răspunsuri

Testul 3

2. Se verifică condiţia f (αx + βy) = α · f (x) + β · f (y) (∀) α, β ∈ R şi (∀) x, y ∈ R3 .

3. Se soluţionează analog cu problema precedentă.

4. Se obţin valorile caracteristici λ1 = 1, λ2 = 2, λ3 = 3 şi vectorii caracteristice v1 =


(a, 2a, a), a ∈ R cu reprezentatul v1 = (1, 2, 1); v2 = (a, a, 0), a ∈ R cu reprezentantul
v2 = (1, 1, 0); v3 = (a, 2a, 3a), a ∈ R cu reprezentantul v3 = (1, 2, 2).

5. Se obţin valorile caracteristice λ1 = −1, λ2 = λ3 = 1 şi vectorii caracteristici v1 = (3, 5, 6),


v2 = (2, 1, 0) şi v3 = (−1, 0, 1). Apoi se arată că v1 , v2 , v3 sunt liniar independenţi.
⎛ Deoarece

−1 0 0
din R3 = 3 se obţine {v1 , v2 , v3 } baza căutată iar matricea ataşată este ⎝ 0 1 0 ⎠.
0 0 1
6. Se determină valorile caracteristice λ1 = 3, λ2 = λ3 = 2, vectorii caracteristici v1 =
(2, −5, −6), v2 = (0, 1, 1), v3 = (1, 1, 0) care se arată că sunt liniar indepedenţi.
⎛ ⎞ Deci
3 0 0
{v1 , v2 , v3 } bază ı̂n R3 şi matricea transformării are forma diagonală ⎝ 0 2 0 ⎠.
0 0 2

7. Forma canonică este f (y) = y12 − 3y22 + 3y32 .


x1 + x2 x1 − x2
8. Folosim transformarea: y1 = , y2 = , y3 = x3 şi obţinem f (y) = y12 − y22 +
2 2
8y1 y3 − 2y2 y3 . Apoi aplicând metoda lui Gauss obţinem forma canonică:

f (z) = z12 − z22 − 15z32 .

9. Avem Δ0 = 1, Δ1 = 1, Δ2 = 2, Δ3 = 3, Δ4 = −20, deci forma canonică:


1 2 3
f (y) = y12 + y22 + y32 − y42 .
2 3 20

10. Analog cu soluţia problemei precedente se obţine forma canonică:


1 1
f (y) = y12 − y22 + y32 − y42 .
3 4

70
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul I,
Editura ULB, Sibiu, 2001.
[2] Cruceanu, V., Elemente de algebră liniară şi geometrie, Editura Didactică şi peda-
gogică, Bucureşti, 1973.

71
Capitolul 5

Elemente de programare liniară

Obiective: Scopul acestui capitol este de a pune la dispoziţia studenţilor (viitorii


economişti) a unuia dintre cele mai utile modelări matematice cu aplicaţii economice,
ı̂mpreună cu algoritmul de rezolvare al acestui model.
Rezumat: În acest capitol se vor prezenta noţiunile fundamentale legate de pro-
gramarea matematică cu accent pe programarea liniară şi ı̂n special a algoritmului simplex
pentru rezolvarea problemelor de programare liniară.
Conţinutul capitolului:
1. Obiectul programării matematice
2. Noţiuni generale relative la o problemă de programare liniară
3. Algoritmul simplex
4. Cazuri speciale ı̂ntr-o problemă de programare liniară
5. Rezolvarea problemei generale de programare liniară
6. Dualitatea ı̂n problemele de programare liniară
7. Test de verificare a cunoştinţelor
8. Bibliografia aferentă capitolului
Cuvinte cheie: programare matematică, programare liniară, soluţie posibilă,
soluţie de bază, soluţie optimă, algoritmul simplex, problema duală.

5.1 Obiectul programării matematice


Am văzut ı̂n Capitolul I că aplicarea conceptelor matematice ı̂n studiul proceselor
economice a căpătat o dezvoltare deosebită, prin rezolvarea unui număr tot mai mare de
probleme. Astăzi, problemele de producţie, de planificare sau de proiectare se cer rezolvate
nu la ı̂ntâmplare, ci aşa fel ı̂ncât soluţiile obţinute să fie corespunzătoare unui anumit scop.
De exemplu, realizarea unui proces de producţie să se facă cu cheltuieli cât mai mici şi cu
venit cât mai mare.
Organizarea ştiinţifică a proceselor economice, ı̂n scopul luării unei decizii conştiente,
ı̂n raport cu ţelurile urmărite şi ı̂n urma unei analize a corelaţiilor dintre diferiţii factori ce
intervin, constituie obiectul a ceea ce se numeşte programare matematică.
În general, problema programării desfăşurării unor fenomene economice este o prob-
lemă complexă şi vastă, pentru rezolvarea cărora matematica oferă diverse metode din
multitudinea de ramuri, ca: aritmetica, algebra, geometria, analiza matematică, calculul
probabilităţilor, analiza funcţională, ecuaţii diferenţiale, ecuaţii integrale, etc.
Forma generală a unei probleme de programare matematică (v. cap.I, §1.2 şi §1.3)
cere să se determine valorile variabilelor xj , j = 1, n, astfel ı̂ncât ele să satisfacă restricţiile
(5.1) gk (x1 , . . . , xn ) ≥ 0, k = 1, m,
iar funcţia z = f (x1 , x2 , . . . , xn ), numită funcţia obiectiv (scop, eficienţă), să ia valoarea optimă
(maximă, respectiv minimă).

72
Deseori, pe lângă restricţiile (5.1), se mai adaugă şi condiţiile de nenegativitate xj ≥ 0,
j = 1, n. Astfel că modelul matematic al unei probleme de programare arată astfel:

(optim)z = f (x1 , . . . , xn )
(5.2) gk (x1 , x2 , . . . , xn ) ≥ 0, k = 1, m
xj ≥ 0, j = 1, n.

Clasificarea problemelor de programare matematică se face după forma funcţiilor f şi


gk , natura necunoscutelor xj , j = 1, n şi respectiv, natura coeficienţilor necunoscutelor ı̂n f
şi gk , k = 1, m.
Dacă funcţiile f şi gk , k = 1, m, sunt forme liniare, atunci problema de programare are
denumirea consacrată de problemă de programare liniară, prescurtat (P.L).
Când funcţia z, sau unele restricţii, sunt funcţii neliniare, problema poartă denumirea
de problemă de programare neliniară. De exemplu, dacă f este o formă pătratică, atunci
spunem că avem o problemă de programare pătratică.
Dacă necunoscutele x1 , . . . , xm se caută ı̂n numere ı̂ntregi, spunem că avem programare
ı̂ntreagă (ı̂n numere ı̂ntregi).
Dacă toţi coeficienţii necunoscutelor xj , j = 1, n, ı̂n f şi gk , k = 1, m, sunt constanţi,
atunci se zice că avem o problemă de programare deterministă. În caz că cel puţin unul din
aceşti coeficienţi este variabil (depinzând de parametrii), avem programare parametrică.
Dacă cel puţin unul din aceşti coeficienţi este o variabilă aleatoare, atunci spunem că avem
programare aleatoare sau stochastică.
În acest capitol ne vom ocupa de problema programării liniare (P.L.). Programarea
liniară este o ramură unitară a matematicilor aplicate ı̂n economie, având metode proprii
şi generale de rezolvare a problemelor respective.
Constituirea obiectului de programare liniară s-a datorat faptului că ı̂n viaţa social–
economică există multe aplicaţii care conduc la probleme liniare de programare (v. §1.3).
Rezolvarea problemelor de programare liniară poate fi făcută folosind diferite metode,
unele particulare (metoda repartizării, metoda grafică), altele generale (metoda simplex).
Primele probleme de programare liniară au fost formulate de L.V.Kantorovici (1939)
şi de F.L.Hitchcock (1941). Programarea liniară se naşte ı̂nsă ı̂n anii de după cel de-al
doilea război mondial, o dată cu formularea ei generală ı̂n 1947, de către G.B.Dantzig, care
a propus, totodată şi un procedeu eficient de rezolvare metoda simplex.
Astăzi, se poate vorbi despre un mod unitar de abordare al tuturor problemelor de
programare liniară. Diversele metode de rezolvare existente au ca ţel sporirea rapidităţii
ı̂n calcule, având ı̂n vedere ı̂n special utilizarea calculatoarelor.

5.2 Noţiuni generale relative la o problemă de programare


liniară
Problema de P.L., sub forma cea mai simplă pe care o vom numi forma standard sau
forma algebrică, este dată prin modelul matematic

(5.3) (optim)f (x) = c1 x1 + c2 x2 + . . . + cn xn




⎪ a11 x1 + a12 x2 + . . . + a1n xn = b1

a21 x1 + a22 x2 + . . . + a2n xn = b2
(5.4)

⎪ ..............................

am1 x1 + am2 x2 + . . . + amn xn = bm
(5.5) xj ≥ 0, j = 1, n,
unde (5.3) este funcţia de scop, (5.4) sunt restricţiile, iar (5.5) condiţiile de nenegativitate.
Sistemul de restricţii (5.4) reprezintă concordanţa internă a unui proces economic.
Coeficienţii aij , i = 1, m, j = 1, n, sunt coeficienţi tehnici constanţi, planificaţi sau determinaţi

73
ı̂n mod statistic. Necunoscutele xj , j = 1, n, sunt mărimi care trebuie găsite, iar termenii
liberi bi , i = 1, m, sunt mărimi constante date, determinate de condiţiile locale ale procesului
economic. numiţi coeficienţi de restricţie ai programului dat.
Dacă sistemul liniar (5.4) de ecuaţii de condiţii (restricţii) este compatibil determinat,
atunci din punct de vedere economic avem un proces economic cu concordanţă internă
rigidă. În acest caz nu mai are rost să se pună problema determinării valorii optime pentru
funcţia scop deoarece ea are o valoare unică bine determinată, corespunzătoare soluţiei
sistemului (5.4).
Când sistemul liniar (5.4) de ecuaţii de restricţii este compatibil nedeterminat, atunci
concordanţa internă a procesului economic este elastică, deoarece oferă posibilitatea alegerii
dintr-o infinitate de soluţii ale sitemului numai pe acelea care fac funcţia de scop optimă.
Utilizând puternicul aparat al matematicii, problema de programare liniară (5.3)–
(5.5) poate fi prezentată şi ı̂n alte moduri.
Fie matricele
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a11 a12 . . . a1n b1 x1
⎜ a21 a22 . . . a2n ⎟ ⎜ b2 ⎟ ⎜ x2 ⎟
A=⎜ ⎟,B = ⎜ ⎜

⎟ , x =
⎜ ⎟
⎜ .. ⎟ ,
⎝ ... ... ... ... ⎠ ⎝ .. ⎠
.
⎝ . ⎠
am1 am2 . . . amn b x
m n
⎛ ⎞
0
⎜ .. ⎟
c = (c1 , . . . , cn ), θ = ⎝ . ⎠
0
Cu aceste notaţii, problema de programare liniară (5.3)–(5.5) ia forma matriceală:

⎨ (optim)f (x) = cx
Ax = b

x≥θ

Dacă notăm cu Pj , j = 1, n, vectorii ale căror componente sunt elemente core-


spunzătoare coloanelor matricei A, atunci problema de programare liniară (5.3)–(5.5) ia
forma ⎧
⎨ (optim)f (x) = cx
x1 P1 + x2 P2 + . . . + xn Pn = b

x≥θ
numită forma vectorială a problemei de programare liniară.
Definiţia 5.2.1 Se numeşte soluţie posibilă a problemei de programare liniară standard orice
vector coloană x(0) ≥ θ, care verifică sistemul de restricţii, adică Ax(0) = b.
Pe baza celor demonstrate ı̂n §3.5, rezultă că mulţimea tuturor soluţiilor posibile
pentru o problemă de programare liniară este convexă.
Definiţia 5.2.2 Se numeşte soluţie de bază pentru o problemă de programare liniară orice
soluţie posibilă, care are cel mult m componente strict pozitive. Ea se obţine dintr-o soluţie
posibilă, când necunoscutelor secundare se atribuie valoarea zero.

Definiţia 5.2.3 O soluţie de bază este numită nedegenerată, dacă are exact m componente
strict pozitive. În caz contrar ea este numită soluţia de bază degenerată.

Definiţia 5.2.4 Soluţia posibilă x(1) este numită mai bună decât soluţia posibilă x(2) , dacă
f (x(1) ) ≤ f (x(2) ) când pentru f se cere minimul, respectiv f (x(1) ) ≥ f (x(2) ), când pentru f se
cere maximul.

Definiţia 5.2.5 O soluţie de bază x(0) este soluţie optimă dacă f (x(0) ) este valoarea optimă
pentru f .

74
Definiţia 5.2.6 Dacă avem k soluţii optime x(1) , . . . , x(k) , atunci soluţia generală este
combinaţia liniară convexă a soluţiilor optime, adică

k
x= αi x(i) ,
i=1

k
cu αi = 1, αi ∈ [0, ∞), i = 1, k.
i=1

Observaţia 5.2.1 Într-o problemă de programare liniară putem lucra considerând optimul
drept minim deoarece dacă se cere maximul, atunci din relaţia max f = − min(−f ) se deduce
că este suficient să se determine min(−f ), iar apoi, cu semn schimbat, vom avea maximul
lui f .

Observaţia 5.2.2 Într-o problemă economică concretă, de obicei, restricţiile problemei de


programare liniară sunt inecuaţii, caz ı̂n care spunem că avem o problemă generală de
programare liniară. Modelul matematic al acesteia, sub forma matricială, arată astfel:

(optim)f (x) = cx


⎪ A1 x = b(1)

A2 x ≥ b(2)

⎪ A x ≤ b(3)
⎩ 3
x ≥ θ.

5.3 Algoritmul simplex


Metoda generală de rezolvare a problemelor de programare liniară este cunoscută ı̂n
literatura de specialitate sub numele de metoda simplex sau algoritmul simplex. Ea este
datorată lui G.B.Dantzig, care a publicat primele lucrări ı̂n 1947. Ulterior s-au dat diverse
variante ı̂mbunătăţite ale metodei. Ea are la bază metoda eliminării complete de rezolvare
a unui sistem de ecuaţii liniare, desigur adaptată scopului urmărit: aflarea soluţiilor cu
componente nenegative, respectiv a soluţiei (sau soluţiilor) pentru care funcţia liniară de
scop f are valoarea optimă.
Pe baza Observaţiei 5.2.1 este suficient să considerăm problema de P.L. standard.

n
minf = cj xj
j=1


⎪ a11 x1 + a12 x2 + . . . + a1n xn = b1

a21 x1 + a22 x2 + . . . + a2n xn = b2

⎪ ..............................

am1 x1 + am2 x2 + . . . + amn xn = bm
xj ≥ 0, j = 1, n.
Ideea metodei simplex constă ı̂n a găsirea mai ı̂ntâi a unei soluţii de bază, apoi de un
procedeu prin care din aceasta se obţin soluţii de bază mai bune, până la aflarea soluţiilor
optime.
Pentru determinarea unei soluţii de bază vom utiliza metoda eliminării complete
(Gauss–Jordan).
Utilizând metoda elementului pivot şi presupunând că am lucrat pe primele m coloane

75
cu m ≤ n, obţinem
⎛ ⎞
1 0 ... 0 α1,m+1 ... α1n β1
⎜ 0 1 ... 0 α2,m+1 ... α2n β2 ⎟
⎜ ⎟
⎜ ... ... ... ... ... ... ... ... ⎟
(A|b) ∼ ⎜



⎜ 0 0 ... 0 αi,m+1 ... αin βi ⎟
⎝ ... ... ... ... ... ... ... ... ⎠
0 0 ... 1 αm,m+1 ... αmn βm

În ipoteza că βi ≥ 0, i = 1, m (ı̂n caz contrar se aleg alte necunoscute principale), vom
putea considera soluţia de bază

x1 = β1 , . . . , xm = βm , xm+1 = 0, . . . , xn = 0

adică
t (1)
x = (β1 , β2 , . . . , βm , 0, . . . , 0).
Pentru această soluţie x(1) avem

m
f (x(1) ) = cj βj .
j=1

Acum vrem să trecem de la soluţia de bază x(1) la o nouă soluţie de bază x(2) care să
fie mai bună. Să admitem că αi,m+1 = 0, adică poate fi considerat ca element pivot. Atunci
putem ı̂nlocui necunoscuta principală xi prin xm+1 . Aplicând metoda elementului pivot,
obţinem
⎛ α β α1,m+1

1 0 . . . − α1,m+1 . . . 0 0 γ1,m+2 . . . γ1,n β1 − αi i,m+1
⎜ i,m+1

⎜ 0 1 . . . − αα2,m+1 . . . 0 0 γ2,m+2 . . . γ2,n β α2,m+1
β2 - αi i,m+1 ⎟
⎜ i,m+1 ⎟
⎜ ........................................... . . . ⎟

(A|b) ∼ ⎜ ⎟
1 αi,m+2 αi,n ⎟
⎜ 0 0 . . . − αi,m+1 . . . 0 1 αi,m+1 . . . αi,m+1
βi
αi,m+1 ⎟
⎜ ⎟
⎝ ........................................... ... ⎠
αm,m+1 βi αm,m+1
0 0 . . . − αi,m+1 . . . 1 0 γm,m+2 . . . γm,n βm − αi,m+1

Noua soluţie x(2) are componentele


βi α1,m+1 βi αi−1,m+1
x11 = β1 − , . . . , xi−1 = βi−1 − , xi = 0,
αi,m+1 αi,m+1

βi αi+1,m+1 βi αm,m+1
xi+1 = βi+1 − , . . . , xm = βm − ,
αi,m+1 αi,m+1
βi
xm+1 = , xm+2 = 0, . . . , xn = 0.
αi,m+1
Pentru ca x(2) să fie soluţie de bază trebuie ca
βi
(5.6) ≥0
αi,m+1

şi respectiv:
βi αj,m+1
(5.7) βj − ≥ 0, j = 1, m, j = i,
αi,m+1
Cum βi ≥ 0, din (5.6) găsim
(5.8) αi,m+1 > 0.

76
Inegalităţile (5.7) pentru care αj,m+1 ≤ 0 sunt evidente. Pentru αj,m+1 > 0, din (5.7)
găsim
βj βi
≥ ,
αj,m+1 αi,m+1
care ne arată că
βi
(5.9) λ=
αi,m+1
βj
este minimul rapoartelor , cu αj,m+1 > 0. Aşadar, vom obţine prin trecerea de la
αi,m+1
x(1) la x(2) o nouă soluţie de bază dacă elementul pivot este pozitiv, iar pivotul va fi acela
care furnizează cel mai mic raport λ, când termenii liberi se ı̂mpart la elementele pozitive
corespunzătoare de pe coloana pe care lucrăm. În limbaj vectorial, se mai spune că am
găsit condiţia prin care precizăm vectorul care iese din bază.
Acum să vedem ı̂n ce condiţii x(2) este o soluţie de bază mai bună ca x(1) .
Avem
   
(2) βi α1,m+1 βi αi−1,m+1
f (x ) = c1 β1 − + . . . + ci−1 βi−1 − +
αi,m+1 αi,m+1
   
βi αi+1 βi αm,m+1 βi
+ci+1 βi+1 − + . . . + cm βm − + cm+1 =
αi,m+1 αi,m+1 αi,m+1
βi
= f (x(1) ) + [cm+2 − (c1 α1,m+1 + c2 α2,m+1 + . . . + ci αi,m+1 + . . . +
αi,m+1
cm αm,m+1 )] .
Dacă notăm

zm+1 = c1 α1,m+1 + c2 α2,m+1 + . . . + ci αi,m+1 + . . . + cm αm,m+1

atunci putem scrie


f (x(2) ) − f (x(1) ) = λ(cm+1 − zm+1 )
Cum λ > 0, rezultă că f (x(2) ) < f (x(1) ) dacă Δm+1 = cm+1 − zm+1 < 0.
Prin urmare, vom trece de la o soluţie de bază x(1) la una x(2) mai bună, dacă diferenţa
Δm+1 = cm+1 −zm+1 , corespunzătoare vectorului Pm+1 , corespunzător necunoscutei xm+1 care
va deveni principală, este mai mică decât 0.
Practic, trebuie să calculăm mărimile

zj = c1 α1j + c2 α2j + . . . + cm αmj = CB , Pj , j = 1, n,

adică produsul scalar dintre vectorii CB = (c1 , c2 , . . . , cm ) al coeficienţilor necunoscutelor de


bază şi t Pj = (α1j , α2j , . . . , αmj ) al componentelor coloanei j; apoi diferenţele Δj = cj − zj ,
j = 1, n. Cum f (x(2) ) − f (x(1) ) = λΔj , rezultă că x(2) va fi o soluţie mai bună dacă Δj < 0.
Aceasta ı̂nseamnă că dacă toate diferenţele Δj ≥ 0, j = 1, n, atunci nu se poate obţine o
ı̂mbunătăţire a soluţiei, şi ı̂n consecinţă, soluţia x(1) de bază este optimă. Din cele de mai
sus, rezultă pentru algoritmul simplex următorii paşi:
Pasul 1. Se determină o soluţie de bază a problemei de P.L., prin aplicarea metodei ele-
mentului pivot care respectă condiţiile (5.8) şi (5.9);
Pasul 2. Se calculează toate valorile zj , j = 1, n, obţinute prin produsul scalar al vectorilor
CB şi Pj ;
Pasul 3. Dacă există diferenţe Δj = cj − zj < 0 se trece la găsirea unei alte soluţii de bază
prin introducerea ı̂n bază a vectorului pentru care Δj < 0 este cea mai mare ı̂n valoare
absolută. Dacă toate diferenţele Δj ≥ 0, atunci se trece la Pasul 5;
Pasul 4. Se repetă paşii 2 şi 3 până când nu mai există diferenţe Δj < 0. Acum s-a ajuns la
soluţia optimă.

77
Pasul 5. Se scrie soluţia optimă: variabilele principale (ale căror vectori coloană conţin nu-
mai o cifră de 1 restul fiind zero) au valorile corespunzătoare din coloana termenilor liberi,
variabilele secundare au toate valoarea zero, iar min f = CB , SB , unde SB este soluţia de
bază.
De obicei, pentru lucrul manual, paşii algoritmului simplex se efectuează ı̂ntr-un tabel.
Acest tabel reprezintă, de fapt, transformările de la metoda eliminării complete aplicată la
rezolvarea sistemului de restricţii, dar completate cu o primă linie formată din coeficienţii
funcţiei scop f şi cu ı̂ncă două coloane: CB – a coeficienţilor bazei, respectiv cu baza B.
În momentul ı̂n care s-a ajuns la o soluţie de bază tabelul se completează cu două linii
pentru calcularea valorilor lui zj , respectiv Δj . Un astfel de tabel are forma

c c1 c2 c3 ... cn
CB B b P1 P2 P3 ... Pn
e1 b1 a11 a12 a13 ... a1n
e2 b2 a21 a22 a23 ... a2n
Pj .. .. .. .. .. ..
−→
←− . . . . . aij .
ei

em bm am1 am2 am3 ... amn

zj f
Δj -
Pj
−→
←− semnifică faptul că vectorul ei pleacă din bază, ı̂n locul lui intrând vectorul Pj . Să
ei
ilustrăm acestea printr-un exemplu.
Exemplul 5.3.1. Să se rezolve problema de P.L.

(min)f (x) = x1 + 2x2 + x3 + 3x4

cu restricţiile ⎧
⎨ 2x1 + x2 − x3 + 2x4 = 6
x1 + x2 + 2x3 = 5

−x1 + 2x2 + x3 + x4 = 8
xj ≥ 0, j = 1, 4.
Avem
c 1 2 1 3
CB B b P1 P2 P3 P4
P1
−→
←− e1 6 2 1 -1 2
e1
e2 5 1 1 2 0
e3 8 -1 2 1 1
1
1 P1 3 1 2 − 12 1
P2
−→ 1 5
←− e2 2 0 2 2 -1
e2
5 1
e3 11 0 2 2 2
1 P1 1 1 0 -3 2
2 P2 4 0 1 5 -2
P4
−→
←− e3 1 0 0 -12 7
e3

P3
−→ 5 3
←− 1 P1 7 1 0 7 0
P1
30 11
2 P2 7 0 1 2 0 Prima
1
3 P4 7 0 0 − 12
7 1 soluţie
68
zj 7 1 2 − 11
7 3 de bază
13
Δj – 0 0 7 0

78
&5 30 1
'
Cum Δj ≥ 0, j = 1, 4, rezultă că soluţia de bază găsită este şi optimă: t xmin = 7 , 7 , 0, 7
şi min f = 68
7 .

Observaţia 5.3.1 Dacă printre vectorii Pj avem vectori unitari din baza canonică, atunci
aceştia pot fi luaţi direct ı̂n baza B.

Exemplul 5.3.2. Să se rezolve problema de P.L.


1
(max)f (x) = −3x1 + 7x2 − x3 − 5x4 − 3x5
2

⎨ 2x1 + x2 + x3 − x4 + x6 =2
−x1 + 2x2 − 2x3 − 2x4 + x7 = 3

3x1 − x2 + x3 + x5 =9
xj ≥ 0, j = 1, 7
Cerinţa de maxim poate fi ı̂nlocuită prin cea de minim (vezi Observaţia 5.2.1), con-
siderând
1
(min)(−f (x)) = 3x1 − 7x2 + x3 + 5x4 + 3x5
2
Se mai observă că vectorii P5 , P6 şi P7 sunt din baza canonică, deci, pot fi consideraţi
direct ı̂n baza B.
Avem
1
c 3 -7 2 5 3 0 0
CB B b P1 P2 P3 P4 P5 P6 P7
P1
−→
←− 0 P6 2 2 1 1 -1 0 1 0
P6
Prima
0 P7 3 -1 2 -2 -2 0 0 1 soluţie
de bază
3 P5 9 3 -1 1 0 1 0 0
zj 27 9 -3 3 0 3 0 0
Δj – -6 -4 − 52 5 0 0 0
1 1
3 P1 1 1 2 2 − 12 0 1
2 0
P2
A doua
5
−→
←− 0 P7 4 0 2 − 23 − 52 0 1
2 1 soluţie
P7
de bază
3 P5 6 0 − 52 − 21 3
2 1 − 32 0
zj 21 3 − 13
2 0 3 3 -3 0
Δj – 0 − 12 1
2 2 0 3 0
P3
1 4 2
−→
←− 3 P1 5 1 0 5 0 0 5 − 15
P1
A treia
8
-7 P2 5 0 1 − 53 -1 0 1
5
2
5
soluţie
de bază
3 P5 10 0 0 -2 -1 1 -1 1
97 3
zj 5 3 -7 5 4 3 − 16
5 − 25
1 16 2
Δj – 0 0 − 10 1 0 5 5
1 1 5 1
2 P3 4 4 0 1 0 0 2 − 14
7 3 1 1
-7 P2 4 4 1 0 -1 0 2 4
21 5 1
3 P5 2 2 0 0 -1 1 0 2
A patra
155 23 1
zj 8 8 -7 2 4 3 − 13
4 − 38 soluţie
de bază
1 13 3
Δj – 8 0 0 1 0 4 8

79
& 7 1Cum toţi' Δj ≥ 0. j = 1, 7, rezultă că am găsit soluţia optimă, dată de t x =
21
0, 4 , 4 , 0, 2 , 0, 0 , iat min(−f (x)) = 155/8. Rezultă că problema de P.L. dată are aceeaşi
soluţie de optim, iar (max)f (x) = − min(−f (x)) = −155/8.
Observaţia 5.3.2 O problemă de P.L. de maxim se poate rezolva şi direct, fără a o mai
reduce la una de minim, numai că atunci vom avea soluţia optimă când Δj ≤ 0, j = 1, n.
Dacă avem şi Δj > 0, atunci vom alege pe cea mai mare Δj > 0, aceasta determinând
vectorul care intră ı̂n bază. Vectorul care iese din bază se stabileşte ca şi la problema de
P.L. de minim.
Observaţia 5.3.3 Dacă ı̂n unele ecuaţii de restricţii avem termeni liberi negativi, respectivele
ecuaţii pot fi ı̂nmulţite cu −1.

5.4 Cazuri speciale ı̂ntr-o problemă de P.L.


În acest paragraf vom analiza câteva situaţii speciale care pot apărea ı̂ntr-o problemă
de P.L.

5.4.1 Soluţii multiple


În orice tabel simplex toate diferenţele Δj corespunzătoare vectorilor bazei (necunos-
cutelor principale) sunt nuli. Dacă ı̂n tabelul simplex, care conţine soluţia optimă, numărul
zerourilor din linia diferenţelor Δj este mai mare ca m (numărul vectorilor unitari), atunci
problema de P.L. poate avea mai multe soluţii optime. Pentru a găsi celelalte soluţii op-
time se introduc ı̂n bază, dacă este posibil, vectorii Pj pentru care Δj = 0. Numărul maxim
de soluţii optime este Ckm , unde k este numărul de zerouri din linia diferenţelor Δj . După
obţinerea tuturor soluţiilor optime se scrie soluţia optimă generală ca şi o combinaţie liniară
convexă (vezi Definiţia 5.2.6).
Exemplul 5.4.1. Să se rezolve problema de P.L.
(min)f (x) = 3x1 + 2x2 + 2x3 + x4

⎨ x1 +x2 +x3 +x4 = 100
−x1 −x2 +x3 +x4 =0

x2 +x4 = 10
xj ≥ 0, i = 1, 4.
Rezolvarea problemei de P.L. cu algoritmul simplex este dată ı̂n tabelul următor
c 3 2 2 1
CB B b P1 P2 P3 P4
e1 100 1 1 1 1
e2 0 -1 -1 1 1
P2
−→
←− e3 10 0 1 0 1
e3
e1 90 1 0 1 0
P3
−→
←− e2 10 -1 0 1 2
e2
2 P2 10 0 1 0 1
P1
−→
←− e1 80 2 0 0 -2
e1
2 P3 10 -1 0 1 2
2 P2 10 0 1 0 1
3 P1 40 1 0 0 -1
2 P3 50 0 0 1 1 Prima soluţie de bază
2 P2 10 0 1 0 1
zj 240 3 2 2 1
Δj – 0 0 0 0

80
Cum toate diferenţele Δj ≥ 0 rezultă că avem soluţia optimă

x(1) = (40, 10, 50, 0), cu (min)f (x) = 240.

Cum avem patru zerouri pe linia lui Δj este posibil să obţinem şi o altă soluţie optimă,
introducând pe P4 ı̂n bază. Cum λminim se obţine pentru P2 , vectorul P4 va intra ı̂n locul
lui P2 . Tabelul simplex pentru problema P.L. se continuă astfel:
c 3 2 2 1
CB B b P1 P2 P3 P4
3 P1 50 1 1 0 0
2 P3 40 0 -1 1 0
1 P4 10 0 1 0 1
zj 240 3 2 2 1
Δj – 0 0 0 0

Se obţine a doua soluţie optimă

x(2) = (50, 0, 40, 10), cu (min)f (x) = 240.

Se observă că alte soluţii optime nu mai există.


Soluţia generală a problemei va fi:

x = αx(1) + βx(2) , unde α, β ≥ 0, α + β = 1,

adică
x = (40α + 50β, 10α, 50α + 40β, 10β), (min)f (x) = 240.
Observaţia 5.4.1 În general, soluţia optimă generală nu este şi soluţie de bază, numărul
componentelor sale nenule fiind mai mare decât m.

5.4.2 Soluţie infinită


Fie o problemă de P.L. de minim. Există situaţii ı̂n care avem o diferenţă Δj < 0,
dar componentele vectorului Pj sunt toate negative sau 0, ceea ce face imposibilă alegerea
elementului pivot. Vom arăta că ı̂n această situaţie funcţia de eficienţă are un minim infinit,
adică valoarea ei poate fi făcută oricât de mică.
Considerăm tabelul simplex
c c1 c2 ... cm ... cj ... cn
CB B b P1 P2 ... Pm ... Pj ... Pn
c1 P1 β1 1 0 ... 0 ... α1j ... α1n
c2 P2 β2 0 1 ... 0 ... α2j ... α2n
.. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . .
cm Pm βm 0 0 ... 1 ... αmj ... αmn
zj zb c1 c2 ... cm ... zj ... zn
Δj – 0 0 ... 0 ... Δj ... Δn

cu soluţia de bază x(1) = (β1 , . . . , βm , 0, . . . , 0), Δj < 0 şi αij < 0, i = 1, m.


Atribuim necunoscutei xj valoare M > 0 (oricât de mare ), adică xj = M , iar celorlalte
necunoscute secundare le atribuim valoare 0, adică xm+1 = 0, . . . , xj−1 = 0, xj+1 = 0, . . . , xn = 0.
Obţinem astfel soluţia posibilă

x(2) = (β1 − α1j M, βx − α2j M, . . . , βm − αmj M, 0, . . . , M, 0, . . . , 0)

Valoarea funcţiei de scop f pentru x(2) este:

f (x(2) ) = c1 (β1 − α1j M ) + c2 (β2 − α2j M ) + . . . + cm (βm − αmj M ) + cj M =

81
= f (x(1) ) + M [cj − (c1 α1j + c2 α2j + . . . + cm αmj )] = f (x(1) ) + M Δj .
Cum Δj < 0 şi M → ∞, rezultă că f (x(2) ) → −∞, ceea ce trebuia demonstrat.
Pentru o astfel de problemă de P.L. sse spune că ea are soluţie (optimă) infinită.
Exemplul 5.4.2. Să se rezolve problema de P.L.:

(min)f (x) = −2x1 + x2 − 2x3 − 3x4



⎨ 4x1 +x2 −3x4 = 10
2x1 −x2 +x3 =6

2x1 −x2 +3x4 = 6
xj ≥ 0, j = 1, 4.
Utilizând algoritmul simplex obţinem tabelul:

c -2 1 -2 -3
CB B b P1 P2 P3 P4
e1 10 4 1 0 -3
-2 P3 6 2 -1 1 0
P4
−→
←− e3 6 2 -1 0 3
e3
P1 ←−
−→ e1 e1 16 6 0 0 0
-2 P3 6 2 -1 1 0
2
-3 P4 4 3 − 13 0 1
8
-2 P1 3 1 0 0 0
2
-2 P3 3 0 -1 1 0
22
-3 P4 3 0 − 13 0 1
zj − 86
3 -2 3 -2 -3
Δj – 0 -2 0 0

Deoarece Δ2 = −2 < 0, iar α12 = 0, α22 = −1 < 0, α32 = − 13 < 0, rezultă că (min)f = −∞.
Într-adevăr, luând x2 = M > 0, x1 = 83 , x3 = 23 + M , x4 = 22
3 + M , avem

86
f (x) = − − 2M
3
şi astfel când M → ∞, obţinem f → −∞.

5.4.3 Degenerare ı̂n problemele de programare liniară


Considerăm problema de P.L. standard

(min)f (x) = cx

Ax = b
x ≥ θ.
Aceasta, conform Definiţiei 5.2.3, va avea o soluţie degenerată dacă numărul compo-
nentelor sale strict pozitive este mai mic decât m, adică cel puţin o necunoscută principală
are valoarea zero (ı̂n vectorul coloană b există zerouri). Situaţia de degenerare ı̂ntr-o prob-
lemă de P.L., apare, fie la ı̂nceput, fie pe parcurs, când la introducerea ı̂n bază a unui vector
există mai multe elemente pozitive care furnizează acelaşi raport minim. În această ultimă
situaţie apare aşa numitul fenomen de ciclare. Pentru a evita acest fapt, elementul pivot, se
demonstrează, va fi ales acela care furnizează cea mai mică linie ı̂n ordonarea lexicografică.
Definiţia 5.4.1 Linia (b1 ; x1 , x2 , . . . , xn ) este mai mică ı̂n ordine lexicografică decât linia
(b2 ; y1 , y2 , . . . , yn ) dacă b1 < b2 , sau b1 = b2 şi x1 < y1 , sau b1 = b2 , x1 = y1 şi x2 < y2 , sau
şi aşa mai departe b1 = b2 , x1 = y1 , . . . , xn−1 = yn−1 şi xn < yn .

82
Exemplul 5.4.3. Să se rezolve problema de P.L. standard:

(max)f (x) = x1 + 4x2 + 5x3 + 2x4



⎨ 3x1 +x2 +x3 +x4 = 6
x1 +2x2 +x3 +x4 = 6

2x1 +x2 +3x3 =7
xj ≥ 0, j = 1, 4.
Înlocuim cerinţa de maxim prin

(min)(−f (x)) = −x1 − 4x2 − 5x3 − 2x4 .

Acum, utilizând algoritmul simplex, avem:

c -1 -4 -5 -2
CB B b P1 P2 P3 P4
e1 6 3 1 1 1
P2
−→
←− e2 6 1 2 1 1
e2
e3 7 2 1 3 0
P1
−→ 5 1 1
←− e1 3 2 0 2 2
e1
1 1 1
-4 P2 3 2 1 2 2
3 5
e3 4 2 0 2 − 12
6 1 1
-1 P1 5 1 0 5 5
12 2 2
-4 P2 5 0 1 5 5
P3
11 11
−→
←− e3 5 0 0 5 − 45
e2
3
-1 P1 1 1 0 0 11
6
-4 P2 2 0 1 0 11 Prima soluţie de bază
4
-5 P3 1 0 0 1 − 11
7
zj -14 -1 -4 -5 − 11
15
Δj – 0 0 0 − 11
11 11
-2 P4 3 3 0 0 1
-4 P2 0 -2 1 0 0
7 4
-5 P3 3 3 0 1 0
zj -19 -4 -4 -5 -2
Δj – 3 0 0 0

La tabelul care a dat prima soluţie de bază avem Δ4 = − 15 11 < 0,iar raportul minim
11
λ= este obţinut şi pe linia lui P1 şi pe linia lui P2 . Cum b2 = 1 < b2 = 2, rezultă că ı̂n
3
ordinea lexicografică linia lui P1 este mai mică decât linia lui P2 . Aşa că la acest pas s-a ales
3
elementul pivot 11 din linia lui P1 .
Soluţia optimă obţinută este degenerată
 
7 11
x(1) = 0, 0, , , pentru care (min)(−f ) = −19.
3 3
(1)
Soluţia x1 este soluţie optimă şi pentru problema de P.L. de maxim, când (max)f =
− min((−f ) = 19.

5.5 Rezolvarea problemei generale de programare liniară


Într-o problemă generală, de programare liniară unele restricţii apar şi sub formă de
inecuaţii (vezi Observaţia 5.2.2). Rezolvarea unei astfel de probleme se face prin transfor-
marea ei ı̂ntr-una standard, prin introducerea necunoscutelor de compensare.

83
Astfel, pentru o restricţie de forma
ai1 x1 + ai2 x2 + . . . + ain xn ≤ bi
considerăm necunoscuta de compensare xn+1 ≥ 0 şi transformăm inecuaţia ı̂n ecuaţie astfel
ai1 x1 + ai2 x2 + . . . + ain xn + xn+1 = bi
Pentru o restricţie de forma
ak1 x1 + ak2 x2 + . . . + akn xn ≥ bk
considerăm necunoscuta de compensare xn+2 ≥ 0 şi transformăm inecuaţia ı̂n ecuaţie, astfel
ak1 x1 + ak2 x2 + . . . + akn xn − xn+2 = bk
Câte restricţii de tip inecuaţie avem, atâtea necunoscute de compensare vom intro-
duce.
În funcţia de eficienţă necunoscutele de compensare se introduc cu coeficienţii egali cu zero.
În soluţia optimă din tabelul simplex s-ar putea să apară şi unele necunoscute de com-
pensare, dar ı̂n soluţia obţinută a problemei de P.L. generală acestea nu se consideră.
Exemplul 5.5.1. Să se rezolve problema generală de P.L.:
(min)f (x) = 3x1 − 2x2 + 4x3 − x4

⎪ 2x1 +3x2 −x3


+x4 =7
5x1 +2x2 +x3 −x4 ≥5

⎪ x1 +x 2 +2x 3 +2x 4 ≤ 10

2x1 +2x2 +x3 +x4 ≤9
xj ≥ 0, j = 1, 4.
Transformăm problema generală ı̂n una standard, introducând variabile de compen-
sare x5 , x6 , x7 :
(min)f (x) = 3x1 − 2x2 + 4x3 − x4


⎪ 2x1 +3x2 −x3 +x4 =7

5x1 +2x2 +x3 −x4 −x5 =5

⎪ x1 +x 2 +2x 3 +2x 4 +x 6 = 10

2x1 +2x2 +x3 +x4 +x7 = 9
xj ≥ 0, j = 1, 7.
Acum, aplicăm algoritmul simplex şi avem:
c 3 -2 4 -1 0 0 0
CB B b P1 P2 P3 P4 P5 P6 P7
e1 7 2 3 -1 1 0 0 0
P2
−→
←− e2 5 5 2 1 -1 -1 0 0
e2
0 P6 10 1 1 2 2 0 1 0
0 P7 9 2 2 1 1 0 0 1
P2
11
−→
←− e1 5 0 5 − 75 7
5
2
5 0 0
e2
2 1
3 P1 1 1 5 5 − 15 − 51 0 0
3 9 11 1
0 P6 9 0 5 5 5 5 1 0
6 3 7 2
0 P7 7 0 5 5 5 5 0 1
25 −7 7 2
-2 P2 11 0 1 11 11 11 0 0
1 5 5 3
3 P1 11 1 0 11 − 11 − 11 0 0
84 24 20 1
0 P6 11 0 0 11 11 11 1 0
47 15 5 2
0 P7 11 0 0 11 11 11 0 1
zj − 47
11 3 -2 29
11
29
− 11 − 13
11 0 0
15 18 13
Δj – 0 0 11 11 11 0 0

84
Cum toţi Δj ≥ 0, j = 1, 7. rezultă că soluţia problemei de P.L. standard este
 
1 25 84 47 47
x(1) = , , 0, 0, 0, , , (min)f (x) = − ,
11 11 11 11 11

iar a problemei generale


 
(1) 1 25 47
x = , , 0, 0 , (min)f (x) = − ,
11 11 11

caz ı̂n care nu am mai luat ı̂n seamă valorile necunoscutelor de compensare.

5.6 Dualitatea ı̂n problemele de programare liniară


Plecând de la o problemă de P.L., totdeauna se poate formula o nouă problemă de
P.L., folosind aceleaşi date numerice ale problemei date, care ı̂nsă să ceară determinarea
valorii optime contrare. Între soluţiile celor două probleme de P.L. există strânse legături.
Perechea de probleme de P.L. astfel construite respectă un principiu general din
ştiinţă, ı̂n particular din matematică, numit principiul dualităţii, iar problemele respective
sunt numite probleme duale (se mai ı̂ntâlneşte şi termenul de probleme conjugate) una
alteia. De obicei problema de P.L. iniţială se numeşte primală, iar cea obţinută prin dualitate
se numeşte duală.
Noţiunea de dualitate ı̂n problemele de P.L. are, pe lângă ı̂nsemnătatea teoretică, şi
o mare importanţă practică, deoarece, fiind date două probleme duale, există posiblitatea
alegerii pentru rezolvare a problemei mai convenabile din punct de vedere calculatoriu.
Mai exact, tabelul simplex, ce conţine soluţia optimă a unei probleme, cuprinde soluţia
optimă a problemei duale, componentele acestei soluţii se află pe linia diferenţelor Δj ale
acestui tabel, ı̂n dreptul vectorilor (necunoscutelor) de compensare corespunzător problemei
duale. În caz că avem mai puţin de m vectori (necunoscute de compensare) se adaugă vectori
unitari ej ı̂n completare (numiţi vectori ajutători sau artificiali), cu coeficienţi zero pe linia
lui c.

Definiţia 5.6.1 Spunem că ı̂ntr-o problemă de P.L. avem o restricţie concordantă dacă ea
conţine semnul ”≥” ı̂ntr-o problemă de minim şi, respectiv, semnul ”≤” ı̂ntr-o problemă
de maxim.

Definiţia 5.6.2 Spunem că ı̂ntr-o problemă P.L. avem o restricţie neconcordantă dacă ea
conţine semnul ”≤” ı̂ntr-o problemă de minim şi, respectiv, semnul ”≥” ı̂ntr-o problemă
de maxim.

Prin urmare, ı̂ntr-o problemă de P.L. avem următoarele categorii de restricţii: con-
cordante, neconcordante şi egalităţi.
Pentru a cuprinde toate situaţiile posibile vom considera că şi pentru necunoscute
(variabile) putem avea următoarele categorii: nenegative, (xj ≥ 0), nepozitive (xj ≤ 0) şi
libere (xj ∈ R).

85
Acum, putem da regulile de corespondenţă ı̂n formarea problemelor de P.L.

P.L. primal P.L. dual


minim maxim
maxim minim
necunoscută nenegativă restricţie concordantă
necunoscută nepozitivă restricţie neconcordantă
variabilă liberă restricţie egalitate
restricţie concordantă variabilă nenegativă
restricţie neconcordantă variabilă nepozitivă
restricţie egalitate variabilă liberă
număr de necunoscute
număr de restricţii
(variabile)
număr de necunoscute
număr de restricţii
(variabile)

termenii liberi ai restricţiilor coeficienţii funcţiei obiectiv


coeficienţii funcţiei obiectiv termenii liberi ai restricţiilor
coloanele matricei restricţiilor liniile matricei restricţiilor
necunoscute principale necunoscute de compensare
necunoscute de compensare necunoscute principale
linia ”Δj ” din tabelul simplex
coloana ”b” din tabelul simplex
(eventual cu semn schimbat)
coloana ”b” din tabelul simplex
linie ”Δj ” din tabelul simplex
(eventual cu semn schimbat)
Exemplul 5.6.1. Se dă problema primală de P.L.

(min)f (x) = x1 + x2


⎪ 4x1 +3x2 ≥ 24

5x1 +9x2 ≥ 45

⎪ 3x1 −4x2 ≥ −44

−x1 ≥ −8
x1 ≥ 0, x2 > 0.
Să se scrie duala acestei probleme.
Având patru restricţii şi, respectiv, două necunoscute din programul primal, vom avea
patru necunoscute şi, respectiv, două restricţii. Aşadar, programul dual va avea forma:

(max)g(y) = 24y1 + 45y2 − 44y3 − 8y4

(termenii liberi ai restricţiilor au devenit coeficienţii funcţiei obiectiv),



4y1 +5y2 +3y3 −y4 ≤ 1
3y1 +9y2 −4y3 ≤1

yj ≥ 0, j = 1, 4.
Exemplul 5.6.2. Fie dată problema principală de P.L.:

(max)f (x) = 2x1 + 2x2 + 3x3 + 3x4 ,



⎨ x1 +x2 +x3 +x4 ≤5
7x1 +5x2 +3x3 +x4 ≤1

3x1 +5x2 +10x3 +15x4 ≤ 1
xj ≥ 0, j = 1, 4,

86
duala ei are forma:
(min)g(y) = 5y1 + y2 + y3


⎪ y1 +7y2 +3y3 ≥2

y1 +5y2 +5y3 ≥1
⎪ 1
⎪ y +3y 2 +10y 3 ≥3

y1 +y2 +15y3 ≥ 3
yj ≥ 0, j = 1, 3.
Exemplul 5.6.3. Pentru problema primală de P.L.

(min)f (x) = 2x1 + x2 − 3x3



⎨ x1 +2x2 +x3 ≥6
x1 −2x2 +3x3 ≤ 8

2x1 −x3 =5
xj ≥ 0, j = 1, 3,
duala are forma
(max)g(y) = 6y1 + 8y2 + 5y3

⎨ y1 +y2 +2y3 ≤ 6
2y1 −2y2 ≤8

y1 +3y2 −y3 ≤5
y1 ≥ 0, y2 ≤ 0, y3 liberă (oarecare).
Am văzut până acum o primă legătură ı̂ntre problemele duale de programare, ı̂n
sensul că una se obţine din cealaltă prin mijloacele menţionate mai sus.
În continuare vom prezenta o altă legatură, sub aspectul unor relaţii dintre soluţii şi
funcţiile de eficienţă.
Să considerăm problemele duale, scrise matricial:

P.L. primală
⎧ ⎧P.L. duală t
⎨ (min)f (x) = cx ⎨ (max)g(y) = by
(1) Ax = b (2) t
Ay ≤ t c
⎩ ⎩
x≥θ y arbitrar

unde t y = (y1 , . . . , ym ).
Teorema 5.6.1 Dacă x(0) şi y (0) sunt soluţii posibile oarecare ale problemelor (1) şi (2),
atunci
g(y (0) ) = t by (0) ≤ cx(0) = f (x(0) ).
Demonstraţie. Din faptul că x(0) şi y (0) sunt soluţii posibile ale problemelor (1) şi (2)
respectiv, avem:
t
Ay (0) ≤ t c, cu y (0) arbitrar,
respectiv
Ax(0) = b, cu x(0) ≥ 0.
Astfel putem scrie

g(y (0) ) = t by (0) = t (Ax(0) )y (0) = (t x(0)t A)y (0) = t x(0) (t Ay (0) ) ≤ t x(0)t c =

= t (cx(0) ) = t f (x(0) ) = f (x(0) ),


ceea ce trebuia demonstrat.
Teorema 5.6.2 Pentru problemele duale (1) şi (2) de programare liniară au loc una şi numai
una din următoarele situaţii:

87
a) ambele probleme au soluţii optime finite şi atunci (min)f = (max)g;
b) una din probleme are soluţie infinită, iar cealaltă este incompatibilă (nu are soluţie);
c) una dintre probleme are soluţie degenerată, iar cealaltă problemă poate avea soluţii
multiple.
Demonstraţie. a) Fie x(1) o soluţie optimă a problemei (1) şi y (1) o soluţie optimă a problemei
(2).
Din Teorema 5.6.1 avem
min f (x) = f (x(1) ) ≥ g(y (1) ) = max g(y).
Acum, din obţinerea tabelului simplex rezultă că dacă notăm cu Γ matricea de tipul
m × m din A, dată de vectorii principali Pj care dau soluţia optimă x(1) , atunci x(1) = Γ−1 b.
Analog avem t y (1) = cB Γ−1 .
Atunci rezultă
f (x(1) ) = cB x(1) = cB Γ−1 b = t y (1) b = g(y (0) ),
adică min f (x) = max g(y).
În mod analog se stabilesc acum, fără mare greutate şi punctele b) şi c) ale teoremei.
Observaţia 5.6.1 Teoremele 5.6.1 şi 5.6.2 poartă numele de teoreme ale dualităţii.
Ele ne justifică cele afirmate la ı̂nceputul paragrafului: prin rezolvarea uneia dintre
problemele duale avem şi soluţia celeilalte. De aceea, practic putem alege pe cea ı̂n care
calculele sunt mai simple.
Exemplul 5.6.4. Să considerăm problema de P.L. din exemplul 5.6.1. Aici se observă că
este mai convenabil să rezolvăm problema duală deoarece ea conţine numai două restricţii.
O aducem la forma standard, introducând variabilele de compensare y5 şi y6
(max)g(y) = 24y1 + 45y2 − 44y3 − 8y4

4y1 +5y2 +3y3 −y4 +y5 =1
3y1 +9y2 −4y3 +y6 =1
yi ≥ 0, i = 1, 6
Aplicând algoritmul simplex, obţinem:
c 24 45 -44 -8 0 0
CB B b P1 P2 P3 P4 P5 P6
0 P5 1 4 5 3 -1 1 0
P2
−→
←− 0 P6 1 3 9 -4 0 0 1
P6
zj 0 0 0 0 0 0 0
Δj – 24 45 -44 -8 0 0
P1
4 7 47
−→
←− 0 P5 9 3 0 9 -1 1 − 59
P5
1 1
45 P2 9 1
3 0 − 94
0 1
9
zj5 15 45 -20 0 0 5
Δj– 9 0 -24 -8 0 -5
4 47 3 3 5
24 P121 1 0 21 − 7 7 − 21
1 25 1 1 4
45 P221 0 1 − 21 7 −7 21
47 1 25 27 20
zj 7 24 45 7 − 7 7 7
309 29 27
Δj– 0 0 − 7 −7 −7 − 20
7
(1)
&4 1 '
Cum toate Δj ≤ 0, rezultă că y = 21 , 21 , 0, 0 este soluţie optimă pentru problema duală,
cu min g(y) = 47
7 . De pe linia lui Δj , ı̂n dreptul vectorilor de compensare P5 şi P6 , găsim
soluţia problemei primale:
 
27 20 47
x(1) = , , 0, 0 , cu max f (x) = .
7 7 7

88
Observaţia 5.6.2 Există situaţii ı̂n care rezolvarea unei probleme de P.L. se lungeşte prin
calculele care conduc la determinarea unei baze formată din vectorii Pj ai problemei. Este
preferabil ca ı̂ntr-o astfel de situaţie să lucrăm cu b ı̂n care avem şi componente bi < 0,
folosind un algoritm simplex modificat, aplicat asupra problemei duale, numit algoritmul
(metodă) simplex modificat (dual).
Paşii de lucru sunt aceeaşi, deosebindu-se de metoda simplex primală numai prin
următoarele:

1) Criteriul de ieşire din bază. Pe coloana lui b se alege

bi0 = min{bi }.
bi <0

2) Criteriul de intrare ı̂n bază. Dacă pe linia lui bi0 toate elementele αi0 j sunt nenegative,
atunci problema este imposibilă. Dacă există αi0 j < 0, atunci determinăm
 
 Δj 
αi0 j0 = min  ,
αi0 j <0 αi0 j 

urmând ca vectorul corespunzător lui αi0 j0 să intre ı̂n noua bază.

Se aplică repetat aceşti paşi până când b ≥ θ şi Δj verifică condiţiile din simplex primal,
situaţie ı̂n care b dă soluţia optimă.
Exemplul 5.6.5. Să se rezolve problema de P.L.:

(min)f (x) = 4x1 + 5x2 + 3x3



⎨ 3x1 +2x2 +x3 ≥ 7
x1 −x2 +2x3 ≥ 6

2x1 +x2 −x3 ≥ 8
xj ≥ 0, j = 1, 3.
Se observă că dacă am lucra cu problema primală necunoscutele de compensare ar
fi introduse cu coeficienţii −1 deci vectorii de compensare nu ar putea fi folosiţi ı̂n baza
iniţială.
Înmulţind cu −1 restricţiile, obţinem problema de P.L.:

(min)f (x) = 4x1 + 5x2 + 3x3



⎨ −3x1 −2x2 −x3 ≤ −7
−x1 +x2 −2x3 ≤ −6

−2x1 −x2 +x3 ≤ −8
xj ≥ 0, j = 1, 3.
Acum introducem variabilele de compensare x4 , x5 şi x6 şi problema ia forma:

(min)f (x) = 4x1 + 5x2 + 3x3



⎨ −3x1 −2x2 −x3 +x4 = −7
−x1 +x2 −2x3 +x5 = −6

−2x1 −x2 +x3 +x6 = −8
xj ≥ 0, j = 1, 6.

89
Cum b ≤ θ este mai convenabil să aplicăm algoritmul simplex dual.
Avem:
c 4 5 3 0 0 0
CB B b P1 P2 P3 P4 P5 P6
0 P4 -7 -3 -2 -1 1 0 0
0 P5 -6 -1 1 -2 0 1 0
P1
−→
←− 0 P6 -8 -2 -1 1 0 0 1
P6
zj 0 0 0 0 0 0 0
Δj – 4 5 3 0 0 0
0 P4 5 0 − 12 − 52 1 0 − 32
P3
3
−→
←− 0 P5 -2 0 2 − 52 0 1 − 12
P5
1
4 P1 4 1 2 − 12 0 0 − 12
zj 16 4 2 -2 0 0 -2
Δj – 0 3 5 0 0 2
0 P4 7 0 -2 0 1 -1 -1
4
3 P3 5 0 − 35 1 0 − 25 1
5
22 1
4 P1 5 1 5 0 0 − 15 − 25
zj 20 4 -1 3 0 -2 -1
Δj – 0 6 0 0 2 1
Cum b ≥ θ şi Δj ≥ 0, j = 1, 6, rezultă că avem soluţia optimă:
 
(1) 22 4
x = , 0, , min f (x) = 20
5 5

Observaţia 5.6.3 Dualitatea ı̂n problemele de P.L. se poate interpreta şi economic. Astfel,
problema primală ⎧
⎨ (max)f (x) = cx
Ax ≤ b

x≥θ
reprezintă modelul unui proces economic ı̂n care se realizează n produse, folosind m resurse,
aij reprezentând unitatea din resursa i utilizată la produsul j, i = 1, m, j = 1, n, bi –cantitatea
disponibilă din resursa i, i = 1, m; cj venitul pentru o unitate din produsul j şi xj numărul
de unităţi realizate din produsul j, j = 1, n (vezi §1.3). Funcţia obiectiv reprezintă venitul
total realizat. În problema primală se cere să se determine numărul de unităţi din fiecare
produs aşa ı̂ncât venitul să fie maxim.

Acum, să urmărim procesul economic după criteriul cheltuieli–venit. Fie yi preţul fixat
pentru unitatea din resurse i, i = 1, m. Costul resursei i ı̂n cantitate de bi unităţi, consumată
pentru fabricarea produselor, este bi yi . Cheltuielile necesare pentru toate resursele folosite
sunt
g(y) = b1 y1 + b2 y2 + . . . + bm ym .
Cum consumul din resursa i pentru realizarea unităţii de produs j este aij , costul
acestei cote care realizează unitatea de produs j este aij · yi . Costul total al cotelor din

m
resursele i, i = 1, m, care participă la crearea unităţii de produs j, este aij yi , care trebuie
i=1
să satisfacă condiţiile

m
aij yi ≥ cj , j = 1, n.
i=1

Cum dorim ca să avem cheltuieli minime, obţinem problema de P.L.:

(min)g(y) = b1 y1 + b2 y2 + . . . + bm ym

90

m
aij yi ≥ cj , j = 1, n
i=1

yj ≥ 0, j = 1, n,
care constituie duala problemei primale de maxim.

91
5.7 Testul Nr. 4 de verificare a cunoştinţelor

1. Definiţi următoarele noţiuni:

a) Soluţie posibilă a problemei de programare liniară standard;


b) Soluţie de bază a problemei de programare liniară;
c) Soluţie nedegenerată a problemei de programare liniară;
d) Soluţie degenerată a problemei de programare liniară;
e) Restricţie concordantă ı̂ntr-o problemă P.L.;
f ) Restricţie neconcordantă ı̂ntr-o problemă P.L.

2. Rezolvaţi problema de programare liniară (min)f (x) = 2x1 + x2 + 3x3 + 5x4 − x5



⎨ 2x1 + x2 + x3 = 4
x1 + 2x3 + x5 = 7

3x1 + 2x2 + x4 = 10

xi ≥ 0 , i = 1, 5.

3. Rezolvaţi problema de programare liniară (max)f (x) = 4x1 + 3x2 + 4x3



⎨ x1 + 3x2 − x3 + 2x5 = 7
−2x1 + 4x3 + x4 = 12

−4x2 + 3x3 + 8x5 + x6 = 10

xi ≥ 0 , i = 1, 6.

4. Rezolvaţi problema deşeurilor minime: Se dispune de baze de fier de 14 m lungime


din care trebuie tăiate 500 bucăţi de 8 m, 800 bucăţi de 5,25 m şi 450 bucăţi de 2,5 m.
Se cere să se stabilească modul de tăiere care asigură cantitatea minimă de deşeuri.

5. Rezolvaţi problema de programare liniară (max)f (x) = 4x1 − x2 + 2x3 + 4x4



⎨ 6x1 + x2 − 3x4 = 11
4x1 − x2 + 2x3 = 8

4x1 − x2 + 3x4 = 8

xi ≥ 0 , i = 1, 4.

6. Rezolvaţi problema de programare liniară (max)f (x) = 4x1 + 5x2 + 8x3 + 2x4 + 3x5

⎨ 2x1 + 3x2 + 3x3 + x4 + 2x5 = 10
x1 − x2 + 2x3 − 6x4 + 3x5 = 5

x1 + x2 + x3 − 2x4 + 2x5 = 4

xi ≥ 0 , i = 1, 5.

7. Rezolvaţi problema generală de programare liniară (min)f (x) = 4x1 + 8x2 − 2x3 + x4

⎨ x1 + x2 + x4 = 2
x1 + 2x2 + x3 ≤ 5

x2 + x3 ≥ 3

xi ≥ 0 , i = 1, 4.

92
8. Aduceţi următoarea problemă generală de programare liniară la forma canonică:
(max)f (y) = 3y1 − 4y2 
y1 + y2 ≤ 8
y1 − y2 ≥ 1
y1 ∈ R , y2 ≤ 0.

9. Găsiţi valoarea optimului următoarei probleme de programare liniară folosind duala


ei: (max)f (x) = −x1 + x2 ⎧
⎨ x1 + x2 ≤ 4
−2x1 + x2 ≤ 3

3x1 − x2 ≤ 5
x1 ≥ 0 , x2 ≥ 0.

10. Găsiţi valoarea optimului următoarei probleme de programare liniară folosind duala
ei: (max)g(y) = 6y1 + 8y2 ⎧
⎨ 2y1 + y2 ≤ 4
y1 + 2y2 ≤ 2

y1 − 2y2 ≤ 1
y1 , y2 ∈ R.

93
Indicaţii şi răspunsuri

Testul 4

2. Se palică algoritmul Simplex şi se obţine optimul finit t x = (0, 4, 0, 2, 7) şi min(f ) = 7.
 
86 29 82
3. Se aplică algoritmul simplex şi se obţine soluţia optimă finită t x = , , , 0, 0, 0 şi
12 13 13
759 759
min g = − (de unde g = −f ) şi astfel max f = .
13 18
4. Se observă că există cinci soluţii de tăiere pentru o bară: 1) se taie o bucată de 8 m
3
şi alta de 5,25 m obţinându-se deşeu 0, 75 = m; 2) se taie o bucată de 8 m şi două
4
bucăţi de 2,5 m obţinându-se deşeu 1 m; 3) se taie două bucăţi de 5,25 m şi una de 2,5
m obţinându-se deşeu 1 m; 4) se taie o bucată de 5,25 şi trei de 2,5 m obţinându-se
5 6
deşeu 1, 25 = m; 5) se taie cinci bucăţi de 2,5 m obţinându-se deşeu de 1, 5 = m.
4 4
Notând cu xi , i = 1, 5 numărul de bare planificate a se tăia ı̂n modul ”i” obţinem
problema de programare liniară
1
(min)f = (3x1 + 4x2 + 4x3 + 5x4 + 6x5 )
4
x1 + x2 = 500
x1 + 2x3 + x4 = 800
2x2 + x3 + 3x4 + 5x5 = 450
xi ≥ 0 , i = 1, 5.

Pentru a uşura calculele se va folosi funcţia obiectiv f1 = 3x1 + 4x2 + 4x3 + 5x4 + 6x5 .
Se aplică algoritmul Simplex şi se obţin soluţiile optime t x1 = (500, 0, 150, 0, 60), t x2 =
(500, 0, 90, 120, 0), t x3 = (380, 120, 210, 0, 0), deci ı̂n final min(f1 ) = 2460(m) ⇒ min(f ) =
615(m) cu t (x) = α ·t x1 + β ·t x2 + γ ·t x3 cu α, β, γ ∈ [0, 1], α + β + γ = 1.

5. Se aplică algoritmul Simplex pentru funcţia obiectiv g = −f şi se obţine optim infinit:
19 1 1 2 1 128 4
x2 = M > 0 (foarte mare), x1 = , x3 = + · M , x4 = + · M , min(g) = − − M,
10 5 2 15 3 15 3
128 4
de unde max(f ) = + M.
15 3
6. Se plică algoritmul Simplex şi se obţin soluţii multiple şi anume:
   
1 5 5 13 1
t t
x1 = 2, , , 0, 0 , x2 = 0, , , 0, ⇒t x = α ·t x1 + β ·t x2
3 3 6 6 2

cu α, β ∈ [0, 1], α + β = 1 şi min(g) = −23, deci max(f ) = 23.

7 Se introduc variabilele ecart x5 şi x6 obţinem forma canonică

(min)f (x) = 4x1 + 8x2 − 2x3 + x4


x1 + x2 + x4 = 2
x1 + 2x2 + x3 + x5 = 5
x2 + x3 − x6 = 3
xi ≥ 0 , i = 1, 6.

Se aplică algoritmul Simplex şi se obţine optimul finit t x = (0, 0, 5, 2, 0, 0), adică x1 = 0,
x2 = 0, x3 = 5, x4 = 2 şi min(f ) = −8.

94
8. Se obţine forma canonică:


⎪ (min)g(x) = −3x1 + 3x2 − 4x3

x1 − x2 − x3 + x4 = 8
⎪ x1 − x2 + x3 − x5 = 1


xi ≥ 0 , i = 1, 5.

9. Avem duala:
(min)g(y) = 4y1 + 3y2 + 5y3
y1 − 2y2 + 3y3 ≥ −1
y1 + y2 − y3 ≥ 1
yi ≥ 0 , i = 1, 3.
Forma canonică a acestei probleme de programare liniară este:


⎪ (min)g(y) = 4y1 + 3y2 + 5y3

y1 − 2y2 + 3y3 − y4 = −1

⎪ y1 + y2 − y3 − y5 = 1

yi ≥ 0 , i = 1, 5.
 
t 1 2
Se aplică algoritmul Simplex şi se obţine soluţia optimă finită y = , , 0 şi
33 
10 10 1 11
min(g) = ⇒ maxf = . Se poate obţine şi soluţia problemei iniţiale: t x = , .
3 3 3 3
10. Duala problemei considerate este:

(min)f (x) = 4x1 + 2x2 + x3



⎨ 2x1 + x2 + x3 = 6
x1 + 2x2 − 2x3 = 8

xi ≥ 0 , i = 1, 3.

Se aplică algoritmul simplex şi se obţine soluţia optimă finită t x = (0, 5, 1) şi min(f ) =
11 ⇒ max(g) = 11.

95
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul I,
Editura ULB, Sibiu, 2001.

96
Capitolul 6

Elemente de teoria grafurilor

Obiective: Scopul acestui capitol este de familiariza studenţii cu noţiunea de graf şi
aplicaţiile acesteia ı̂n economie. Termenul de ”graf” are cu totul altă semnificaţie decât
cel de grafic. Prima lucrare de teoria grafurilor a fost scrisă de renumitul matematician
elveţian Euler, ı̂n 1736, ı̂n scopul rezolvării unor jocuri şi amuzamente matematice. Dez-
voltarea ulterioară a matematicii şi ı̂n special a aplicaţiilor ei ı̂n diferite domenii ştiinţifice
a dat un impuls puternic dezvoltării teoriei grafurilor. Utilizarea ei ı̂n domenii variate,
teoretice sau practice, de la probleme economice la fundamentarea deciziilor politice, de la
studiul reţelelor electrice la critica textelor, etc., ı̂i conferă ı̂n zilele noastre o importanţă
aparte.
Folosirea grafurilor ı̂n elaborarea programelor de producţie, investiţii, transport, des-
facere etc. ale unităţilor economice a devenit o necesitate de prim ordin.
Rezumat: În acest capitol se vor aborda câteva din conceptele fundamentale ale
teoriei grafurilor, precum şi câţiva algoritmi utili ı̂n rezolvarea unor probleme economice.
Conţinutul capitolului:
1. Noţiuni fundamentale
2. Algoritmi pentru rezolvarea unor probleme relative la grafuri
3. Problema fluxului optim ı̂n reţele de transport
4. Test de verificare a cunoştinţelor
5. Bibliografia aferentă capitolului
Cuvinte cheie: graf, matricea drumurilor, componente tare conexe ale unui graf,
drumuri hamiltoniene, drum de lungime optimă, metoda drumului critic, rele de trasport.

6.1 Noţiuni fundamentale


Fie X o mulţime nevidă şi cel puţin numărabilă de elemente numite noduri sau vârfuri.
Definiţia 6.1.1 Numim graf perechea (X, Γ), unde Γ ⊆ X × X, adică o mulţime de perechi
ordonate sau nu de elemente din X.
Dacă X este o mulţime finită, atunci graful (X, Γ) se numeşte graf finit, În caz contrar
se zice că avem un graf infinit.
Putem da pentru graf şi următoarea definiţie echivalentă:
Definiţia 6.1.2 Numim graf perechea (X, f ), unde f este o funcţie definită pe X cu valori ı̂n
mulţimea P(X) a părţilor (submulţimilor) lui X.

Definiţia 6.1.3 Dacă toate perechile distincte din Γ sunt ordonate, graful se numeşte orien-
tat. În cazul contrar, graful se numeşte neorientat.

Pentru un graf orientat (X, Γ) perechea ordonată (x, y) ∈ Γ, x, y ∈ X, se numeşte arc, x


fiind extremitatea iniţială, iar y extremitatea finală a arcului. În cazul unui graf neorientat

97
o pereche neordonată (x, y) ∈ Γ, x, y ∈ X se numeşte muchie.
În continuare noi o să lucrăm numai cu grafuri orientate şi finite, fără a mai specifica
acest lucru, menţionând totuşi ı̂n câteva locuri şi denumirea noţiunilor corepsunzătoare de
la grafurile neorientate.
Un graf orientat şi finit va fi notat prin (X, Γ), unde X = {x1 , x2 , . . . , xn } va reprezenta
mulţimea vârfurilor, iar Γ mulţimea arcelor.
Un graf (X, Γ) se reprezintă geometric ı̂n modul următor: a) fiecare vârf este
reprezentat printr-un punct din plan; b) fiecare arc (xi , xj ) ∈ Γ se reprezintă printr-o linie
(dreaptă sau curbă) care uneşte cele două extremităţi şi pe care se află o săgeată cu sensul
de la xi la xj (vezi fig.1). Dacă xi coincide cu xj , zicem că avem o buclă.

Fig.1
Într-un graf neorientat muchia se reprezintă printr-un arc fără săgeată.
Într-un arc (xi , xj ) vârful xi se numeşte predecesorul lui xj , iar xj succesorul lui xi .
Exemplul 6.1.1. Graful (X, Γ) dat prin X = {x1 , x2 , x3 , x4 , x5 }, Γ =
{(x1 , x2 ), (x1 , x3 ), (x1 , x4 ), (x2 , x3 ), (x3 , x2 ), (x2 , x4 ), (x3 , x4 ), (x3 , x5 ), (x4 , x5 )} este reprezentat ı̂n
figura 2. În aceeaşi figură este reprezentat şi graful neorientat corespunzător lui.

Fig.2

Definiţia 6.1.4 Două arce ale grafului (X, Γ) se numesc adiacente dacă au cel puţin o ex-
tremitate comună.

Definiţia 6.1.5 Într-un graf (X, Γ) mulţimea arcelor cu extremitatea iniţială xi se numeşte
mulţimea arcelor incidente spre exterior şi se notează cu Γ+xi . Mulţimea arcelor incidente
spre interior vârfului xi se va nota cu Γ− xi . Atunci Γ xi = Γ+ −
xi ∪ Γxi este mulţimea arcelor
incidente vârfului xi .

Definiţia 6.1.6 Un graf (X, Γ) se numeşte simetric dacă oricare ar fi arcul (xi , xj ) ∈ Γ avem
şi (xj , xi ) ∈ Γ.
Graful (X, Γ) se numeşte antisimetric, dacă există un arc (xi , xj ) ∈ Γ astfel ı̂ncât arcul
(xj , xi ) ∈ Γ.

Definiţia 6.1.7 Un graf (X, Γ) se numeşte complet dacă pentru orice xi , xj ∈ X din (xi , xj ) ∈ Γ
rezultă (xj , xi ) ∈ Γ.

Exemplul 6.1.2. Graful din figura 3 este simetric, cel din figura 4 este antisimetric, iar cel
din figura 5 este complet.

98
Fig.3 Fig.4 Fig.5
Definiţia 6.1.8 Fie (X, Γ) un graf. Numim graf parţial al grafului dat, un graf (X, Γ1 ), unde
Γ1 ⊂ Γ, adică el se obţine din graful (X, Γ) prin suprimarea unor arce.

Definiţia 6.1.9 Fie (X, Γ) un graf dat. Numim subgraf al grafului dat, un graf (X1 , Γ1 ), unde
X ⊂ X1 şi Γ1 ⊂ Γ.
Subgraful (X1 , Γ1 ) se obţine din graful (X, Γ) prin suprimare a unuia sau a mai multor
vârfuri şi a arcelor aferente lor.

Exemplul 6.1.3. Graful din figura 7 este un graf parţial al celui din figura 6, iar graful din
figura 7 un subgraf.

Fig.6 Fig.7 Fig.7

Definiţia 6.1.10 Numim drum ı̂ntr-un graf o succesiune de arce, adiacente două câte două,
la fel orientate, la care extremitatea finală a unui arc coincide cu extremitatea iniţială a
arcului precedent.
Un drum ı̂n care extremitatea finală a ultimului arc coincide cu extremitatea iniţială
a primului arc se numeşte circuit.
Un drum se dă prin scrierea ı̂ntre acolade (sau alte tipuri de paranteze) a succesiunii
vârfurilor prin care trec arcele care constituie drumul sau menţionând arcele din care se
compune.
Exemplul 6.1.4. În graful din figura 6 putem considera drumurile:

d1 = {x1 , x2 , x4 , x3 }, d2 = {x1 , x2 , x4 , x2 , x4 , x5 }

d3 = {x2 , x4 , x2 }, care este un circuit.


Definiţia 6.1.11 Numărul de arce dintr-un drum se numeşte lungimea lui.

99
Definiţia 6.1.12 Un drum al unui graf se numeşte elementar dacă fiecare vârf al său este
utilizat o singură dată. În caz contrar, drumul este numit neelementar.
Un drum elementar care trece prin toate vârfurile grafului se numeşte hamiltonian,
iar unul neelementar care are aceeaşi proprietate se numeşte drum nehamiltonian (pre-
hamiltonian).

Definiţia 6.1.13 Un drum al unui graf se numeşte simplu dacă utilizează fiecare arc al său
o singură dată. În caz contrar, drumul se numeşte compus.
Un drum simplu care foloseşte arcele grafului se numeşte eulerian, iar unul compus
care are aceeaşi proprietate se numşte drum neeulerian (preeulerian).

Exemplul 6.1.5. În graful din figura 6 drumul d1 = {x1 , x2 , x4 , x3 , x5 } este hamiltonian, dar
nu este eulerian. Drumul d2 = {x1 , x2 , x4 , x2 , x4 , x3 , x5 } este nehamiltonian. Drumul d3 =
{x1 , x2 , x4 , x5 } este simplu, iar d4 = {x1 , x2 , x4 , x2 , x4 , x5 } este compus.

Observaţia 6.1.1 Într-un graf neorientat noţiunea de drum este ı̂nlocuită cu cea de lanţ,
iar cea de circuit cu cea de ciclu.

Definiţia 6.1.14 Un graf (X, Γ) se numeşte conex dacă ı̂ntre oricare două vârfuri ale sale
există un lanţ. Dacă ı̂ntre oricare două vârfuri ale grafului există un drum, atunci el se
numeşte tare conex.

Definiţia 6.1.15 Un subgraf conex al unui graf conex se numeşte componentă conexă a
grafului, iar un subgraf tare conex al unui graf tare conex se numeşte componentă tare
conexă.

Se observă că un graf este conex, respectiv tare conex, dacă şi numai dacă el are o
singură componentă conexă, respectiv tare conexă.
Exemplul 6.1.6. În figurile 8 şi respectiv 9 avem reprezentate un graf conex şi respectiv
unul tare conex. În figurile 10 şi 11 avem reprezentate un graf neconex şi respectiv unul
care nu este tare conex.

Fig.8 Fig.9

Fig.10 Fig.11

Graful din figura 10 are două componente conexe, iar cel din figura 11 are două
componente tare conexe.

100
Definiţia 6.1.16 Numim arbore un graf conex şi fără cicluri. Numim pădure un graf
neconex şi fără cicluri.

Exemplul 6.1.7. În figura 12 avem un arbore, iar ı̂n figura 13 o pădure cu 3 arbori:

Fig.12 Fig.13

Definiţia 6.1.17 Numim arborescenţă un graf fără circuite, ı̂n care: a) un vârf şi numai
unul (numit rădăcină) nu este precedat de nici un altul; b) orice alt vârf este precedat de
un singur cârf. Vârfurile care nu au succesori se numesc frunze sau vârfuri suspendate
(terminale).

Cel mai cunoscut exemplu de arborescenţă este ”arborele genealogic”.


Exemplul 6.1.8. În figura 14 avem o arborescenţă cu rădăcina x1 şi cu 6 frunze.

Fig.14

Dacă numărul de vârfuri ale unui graf este mare, atunci reprezentarea geometrică
devine greoaie. De aceea, s-au căutat alte modalităţi de reprezentare. Cea mai convenabilă
s-a dovedit a fi cea cu ajutorul matricelor.
Fie (X, Γ) un graf orientat cu X = {x1 , x2 , . . . , xn }.

Definiţia 6.1.18 Matricea pătratică B = (bij ), i, j = 1, n, definită astfel



1 , dacă (xi , xj ) ∈ Γ
bij =
0 , dacă (xi , xj ) ∈ Γ

se numeşte booleană (asociată) ataşată grafului (X, Γ)

Exemplul 6.1.9. Fie (X, Γ) graful din figura 15.

101
Fig.15
Matricea booleană ataşată grafului este
x1 x2 x3 x4 x5
x1 0 1 1 0 0
x 0 0 0 1 0
B= 2
x3 0 1 0 0 1
x4 0 1 0 0 1
x5 0 0 0 0 0
Definiţia 6.1.19 Matricea pătratică D = (dij ), i, j = 1, n, definită astfel

1 , există drum de la xi la xj
dij =
0 , nu există drum de la xi la xj ,
se numeşte matricea drumurilor ataşată grafului (X, Γ).
Exemplul 6.1.10. Pentru graful din figura 15 matricea drumurilor este
x1 x2 x3 x4 x5
x1 0 1 1 1 1
x 0 1 0 1 1
D= 2
x3 0 1 0 1 1
x4 0 1 0 1 1
x5 0 0 0 0 0
Definiţia 6.1.20 Matricea pătratică L = (lij ), i, j = 1, n, definită astfel

xi xj , dacă (xi , xj ) ∈ Γ
lij =
0 , dacă (xi , xj ) ∈ Γ
se numeşte matricea latină ataşată grafului (X, Γ).
Exemplul 6.1.11. Pentru graful din figura 15 matricea latină este
x1 x2 x3 x4 x5
x1 0 x1 x2 x1 x3 0 0
x 0 0 0 x2 x4 0
L= 2
x3 0 x3 x2 0 0 x3 x5
x4 0 x4 x2 0 0 x4 x5
x5 0 0 0 0 0

În rezolvarea unor probleme teoretice sau practice se introduc şi alte tipuri de matrice
ataşate unui graf, care se difineşte ı̂n cadrul respectiv.

6.2 Algoritmi pentru rezolvarea unor probleme relative la gra-


furi
În acest paragraf vom prezenta câţiva algoritmi pentru rezolvarea unor probleme
relative la grafuri.

102
6.2.1 Algoritmul lui Yu Chen pentru aflarea matricei drumurilor
În asigurarea unor algoritmi relativi la probleme de teoria grafurilor avem nevoie de
 
operaţiile de adunare booleană (+) şi ı̂nmulţire booleană (×), definite după cum urmează
 
+ 0 1 × 0 1
0 0 1 0 0 0
1 1 1 1 1 1
Algoritmul lui Yu Chen are următorii paşi:
Pasul 1. Se scrie matricea booleană B a grafului (X, Γ);
Pasul 2. Se adună boolean la prima linie toate liniile corespunzătoare la vârfurile care au
cifra 1 pe prima linie. Noile cifre de 1 care apar se marchează cu o ∗.
Pasul 3. Se adună boolean la linia ı̂ntâi toate liniile corespunzătoare vârfurilor care au cifra
1∗ pe prima linie. Noile cifre de 1 care apar se marchează cu ∗∗. Acest pas se continuă până
când nu mai apar cifre noi de 1 pe linia ı̂ntâi.
Pasul 4. Se aplică paşii 2 şi 3 la fiecare din liniile matricei booleene.
În final, obţine matricea D a drumurilor.
Justificarea algoritmilor este imediată.
Exemplul 6.2.1. Pentru graful din figura 15 să aflăm matricea drumurilor, folosind algorit-
mul lui Yu Chen.
Scriem matricea booleană ataşată grafului
x1 x2 x3 x4 x5
x1 0 1 1 0 0
x 0 0 0 1 0
B= 2
x3 0 1 0 0 1
x4 0 1 0 0 1
x5 0 0 0 0 0
Aplicând paşii algoritmului obţinem
x1 x2 x3 x4 x5
x1 0 1 1 1∗ 1∗
x 0 1∗ 0 1 1∗
D= 2
x3 0 1 0 1∗ 1
x4 0 1 0 1∗ 1
x5 0 0 0 0 0
care este tocmai matricea găsită la Exemplul 6.1.10.

6.2.2 Algoritmi pentru precizarea existenţei circuitelor ı̂ntr-un graf


Vom prezenta doi algoritmi.
Algoritmul marcării cu ”∗”. Paşii acestui algoritm sunt:
Pasul 1. Se marchează cu ”∗” toate vârfurile fără succesori;
Pasul 2. Marcăm cu ”∗” toate vârfurile ale căror succesori au fost marcaţi;
Pasul 3. Se continuă procesul de la Pasul 2 până când nu mai putem face marcări.
Dacă toate vârfurile au fost marcate, atunci graful este fără circuite. În caz că a
rămas cel puţin un vârf nemarcat, graful este un circuit.
Exemplul 6.2.2. Să cercetăm dacă graful din figura 16 are circuite.

103
Fig.16

La pasul ı̂ntâi putem marca doar vârful x7 , fiind singurul fără succesori. La pasul
2 putem marca vârful x6 deoarece succesorul său x7 a fost marcat. Nu mai putem face
marcare de vârfuri deoarece vârfurile rămase au succesori nemarcaţi. Aşadar, graful dat
are circuite.
Algoritmul matricei drumurilor. Cum un circuit este un drum ce ı̂ncepe şi se termină
ı̂n acelaşi vârf, rezultă că un graf va avea circuite dacă ı̂n matricea drumurilor apare cifra 1
pe diagonala principală. Rezultă că, pentru a cerceta dacă un graf are sau nu circuite, este
suficient să găsim matricea drumurilor.
Exemplul 6.2.3. Să aplicăm acest algoritm la graful din figura 16. Scriem matricea booleană
B:
x1 x2 x3 x4 x5 x6 x7
x1 0 1 0 1 0 0 0
x2 0 0 1 0 1 0 0
x3 0 0 0 1 0 0 0
B=
x4 0 0 0 0 1 0 1
x5 0 0 1 0 0 1 1
x6 0 0 0 0 0 0 1
x7 0 0 0 0 0 0 0
Aplicând algoritmul Yu Chen pentru aflarea matricei drumurilor, obţinem:
x1 x2 x3 x4 x5 x6 x7
x1 0 1 1∗ 1 1∗ 1∗∗ 1∗
x2 0 0 1 1∗ 1 1∗ 1∗
x 0 0 1∗∗ 1 1∗ 1∗∗ 1∗
D= 3
x4 0 0 0 0 1 1∗ 1
x5 0 0 0 0 0 1 1
x6 0 0 0 0 0 0 1
x7 0 0 0 0 0 0 0
Având ı̂n D o cifra de 1 pe diagonala principală, conchidem că graful are circuite.

6.2.3 Algoritmi pentru aflarea componentelor tare conexe ale unui graf
Aflarea componentelor tare conexe ale unui graf este importantă pentru practică
deoarece se obţine o partiţie a grafului ı̂n subgrafele tare conexe.
Algoritmul marcării cu ”±”. Pasul 1. Se marchează cu ”±” un vârf ı̂n care intră şi iese cel
puţin câte un arc.
Pasul 2. Se marchează cu ”±” vârfurile care sunt extremităţi finale pentru arce care pleacă
dintr-un vârf marcat cu ”±” şi se marchează cu ”–” vârfurile iniţiale pentru arce ale căror
vârfuri finale sunt marcate cu ”–”.
Pasul 3. Se aplică repetat pasul 2, până nu se mai pot face marcări. Dacă toate vârfurile
au fost marcate cu ”±”, atunci graful este tare conex, având o sigură componentă tare
conexă.
Dacă există vârfuri care nu au fost marcate cu ”±”, atunci se consideră mulţimea C1
formată din toate vârfurile marcate cu ”±”. C1 formează o primă componentă tare conexă.
Pasul 4. În graful dat se elimină vârfurile din componenta C1 şi toate arcele aferente
acestora. Noului graf (de fapt, subgraf al grafului iniţial) i se aplică Paşii 2–3 până se
găsesc toate componentele tare conexe ale grafului.
Pentru a evidenţia geometric (intuitiv) descompunerea grafului dat ı̂n componente
tare conexe se aranjează vârfurile pe componente şi se trasează arcele din graful iniţial.
Exemplul 6.2.4. Să considerăm graful din figura 17.

104
Fig.17

Deoarece ı̂n vârful x1 iese şi intră cel puţin câte un arc ı̂l marcăm cu ”±”. Apoi
marcăm cu ”+” vârfurile x2 şi x5 şi cu ”–” vârful x3 . Acum marcăm cu ”–” vârful x2 şi cu
”+” vârfurile x4 şi x6 . Procesul de marcare nu mai poate continua, rămânând vârfuri care
nu sunt marcate cu ”±”.
Prima componentă tare conexă a grafului este C1 = {x1 , x2 , x3 }.
Suprimăm vârfurile x1 , x2 , x3 şi arcele adiacente lor şi obţinem graful din figura 18.

Fig.18

Imediat se marchează cu ”±” numai vârfurile x4 şi x5 , obţinând cea de-a doua
componentă tare conexă C2 = {x4 , x5 }. Vârful x6 formează cea de-a treia componentă tare
conexă C3 .
În figura 19 prezentăm graful cu vârfurile sale ı̂mpărţite ı̂n componente tare conexe.

105
Fig.19
Algoritmul lui Yu Chen. Acest algoritm pentru aflarea componentelor tare conexe foloseşte
ideea de lucru de la algoritmul lui Chen pentru determinarea matricei drumurilor.
Pasul 1. Se scrie matricea booleană B a grafului (X, Γ).
Pasul 2. Se determină toate drumurile care pleacă din x1 spre alte vârfuri, procedând ca
la paşii 2 şi 3 de la algoritmul Yu Chen pentru determinarea matricei drumurilor, adică
se introduc prin adunare booleană toate cifrele de pe linia ı̂ntâi. Notăm cu V1 mulţimea
vârfurilor care au cifra 1 pe linia ı̂ntâi astfel obţinută.
Pasul 3. Ca la pasul 2 procedăm pe coloana ı̂ntâi, determinând toate vârfurile care sunt
legate prin drumuri cu x1 . Notăm cu V2 mulţimea vârfurilor care au cifra 1 pe coloana
ı̂ntâi astfel obţinută.
Pasul 4. Determinăm prima componentă tare conexă, luând C1 = (V1 ∩ V2 ) ∪ {x1 }.
Pasul 5. În matricea B se elimină liniile şi coloanele care au vârfurile ı̂n C1 . La matricea
obţinută se aplică, din nou paşii 2–5. Se aplică algoritmul până se epuizează vârfurile
grafului.
Exemplul 6.2.5. Să considerăm graful din figura 20. Să-i aflăm componentele tare conexe.

Fig.20
Scriem matricea booleană ataşată grafului:
x1 x2 x3 x4 x5 x6 x7 x8
x1 0 1 1 0 0 0 0 0
x2 0 0 0 0 0 0 0 0
x3 0 1 0 1 0 0 0 1
B = x4 0 1 0 0 1 0 0 0
x5 0 1 0 0 0 1 0 0
x6 0 1 0 0 1 0 0 0
x7 0 0 0 1 0 1 0 1
x8 1 0 0 1 0 0 1 0
Determinăm toate legăturile prin drumuri ce pleacă din x1 spre alte vr̂furi:
 x1 x2 x3 x4 x5 x6 x7 x8
x1 1∗∗ 1 1 1∗ 1∗∗ 1∗∗∗ 1∗∗ 1∗
de unde V1 = {x1 , x2 , x3 , x4 , x5 , x6 , x7 , x8 }.
Procedăm la fel pe coloana ı̂ntâi, scriind tabelul, pentru economie de spaţiu, tot pe
orizontală
x1 1∗∗ 1∗ 1∗ 1
x1 x2 x3 x4 x5 x6 x7 x8

106
De aici V2 = {x1 , x3 , x7 , x8 }.
Acum găsim prima componentă tare conexă C1 = (V1 ∩ V2 ) ∪ {x1 } = {x1 , x3 , x7 , x8 }.
Eliminăm ı̂n matricea B liniile şi coloanele corespunzătoare vârfurilor din C1 şi obţinem
matricea
 x2 x4 x5 x6
x2 0 0 0 0
B = x4 1 0 1 0
x5 1 0 0 1
x6 1 0 1 0
Cum pe linia lui x2 ı̂n B1 avem numai cifra 0, deducem că următoarea componentă
tare conexă este C2 = {x2 }.
Eliminând linia şi coloana corespunzătoare vârfului x2 din B1 , obţinem

x4 x5 x6
x 0 1 0
B2 = 4
x5 0 0 1
x6 0 1 0

Imediat rezultă şi componenta tare conexă C3 = {x4 }, rămânând matricea

x5 x6
B3 = x5 0 1
x6 1 0

pentru care avem:


x5 x6
, V1 = {x5 , x6 }
x5 1∗ 1∗
x5 1∗ 1
, V2 = {x5 , x6 }
x5 x6
deci mai avem componenta tare conexă C4 = {x5 , x6 }.

Observaţia 6.2.1 Deoarece oricare două vârfuri dintr-o componentă tare conexă sunt legate
ı̂ntre ele prin drumuri, rezultă că un graf poate fi reprezentat prin unul care are ca vârfuri
componentele tare conexe, arcele de legătură, ı̂ntre ele stabilindu-se după arcele din graful
dat. În cazul exemplului nostru obţinem graful din figura 21. Graful astfel obţinut se
numeşte graful condensat ataşat grafului dat.

Fig.21

Graful condensat este important ı̂n rezolvarea multor probleme practice deoarece
reduce dimensiunea sistemelor complexe.

107
6.2.4 Algoritmi pentru aflarea drumurilor hamiltoniene ale unui graf
În multe aplicaţii practice avem de stabilit succesiunea unui număr de operaţii, cu
respectarea unei anumite oridini. Din punctul de vedere a teoriei grafurilor aceasta revine
la găsirea unui drum hamiltonian ı̂n graful asociat aplicaţiei respective.
Algoritmul Yu Chen pentru grafe fără circuite.
Pasul 1. Se determină matricea D a drumurilor ataşată grafului.
Pasul 2. La matricea D se mai adaugă o coloană ”a”, pe care se trec numărul de cifre 1
de pe fiecare linie din D. Aceste numere se numesc puterile de atingere corespunzătoare
vârfurilor grafului (ele reprezintă numărul de vârfuri, care sunt legate prin drumuri plecând
din vârful respectiv).
Pasul 3. Dacă pe coloana ”a” avem puteri de atingere diferite două câte două, atunci graful
are drum hamiltonian. Succesiuna vârfurilor ı̂n drumul hamiltonian se obţine ı̂n ordinea
descrescătoare a puterilor de atingere (n − 1, n − 2, . . . , 2, 1, 0).
Dacă cel puţin două puteri de atingere sunt egale, atunci graful nu are drumuri
hamiltoniene.
Observaţia 6.2.2 Dacă un graf fără cricuite are drum hamiltonian, atunci el este unic.
Exem,plul 6.2.6. Fie graful din figura 22. Să cercetăm dacă are drum hamiltonian.

Fig.22

Matricea booleană ataşată grafului este

x1 x2 x3 x4 x5 x6
x1 0 0 0 0 0 0
x2 0 0 0 0 0 1
B = x3 0 1 0 0 0 1
x4 1 1 1 0 1 0
x5 1 0 1 0 0 0
x6 1 0 0 0 0 0

iar matricea drumurilor


x1 x2 x3 x4 x5 x6 a
x1 0 0 0 0 0 0 0
x2 1∗ 0 0 0 0 1 2
D = x3 1∗ 1 0 0 0 1 3
x4 1 1 1 0 1 1∗ 5
x5 1 1∗ 1 0 0 1∗ 4
x6 1 0 0 0 0 0 1

Cum pe coloana a avem puteri de atingere diferite două câte două, rezultă că graful
admite un drum hamiltonian. Acesta este dH = {x4 , x5 , x3 , x2 , x6 , x1 }.

108
Algoritmul Yu Chen pentru grafuri cu circuite.
Acest algoritm are următorii paşi:
Pasul 1. Se determină componentele tare conexe ale grafului (X, Γ), notate cu C1 , C2 , . . ..
Pasul 2. Se determină graful condensat asociat grafului (X, Γ), care este un graf fără circuite.
Pasul 3. Se determină drumul hamiltonian ı̂n graful condensat, când există.
Pasul 4. Se aranjează componentele tare conexe ı̂n ordinea dată de drumul hamiltonian
determinat la Pasul 3.
Pasul 5. Se scriu toate drumurile hamiltoniene din fiecare componentă tare conexă.
Pasul 7. Stabilim legăturile de la o componentă la alta ı̂n funcţie de arcele de incidenţă
(legătură) din graful dat, citind apoi toate drumurile hamiltoniene.
Observaţia 6.2.3 Dacă ı̂n graful condensat nu există drum hamiltonian sau ı̂ntre două com-
ponente nu există legătură, atunci graful nu are drumuri hamiltoniene.
Exemplul 6.2.7. Să aflăm drumurile hamiltoniene ale grafului din figura 20.
La exemplul 6.2.5 am găsit componentele tare conexe
C1 = {x1 , x3 , x7 , x8 }, C2 = {x2 }, C3 = {x4 }, C4 = {x5 , x6 }
şi graful condensat din figura 21.
Se observă că ı̂n graful condensat avem drumul hamiltonian
dCH = {C1 , C3 , C4 , C2 }.
Acum, scriem componentele tare conexe ı̂n ordinea din drumul dCH şi sub ele scriem
toate drumurile hamiltoniene din fiecare componentă:
C1 C3 C4 C2

x1 x3 x8 x7  x5 x6 
x4  x2
x7 x8 x1 x3  x6 x7
Apoi stabilim legăturile ı̂ntre ultimele elemente din drumurile dintr-o componentă şi
primele vârfuri din componenta următoare (le indicăm prin săgeţi).
Obţinem drumurile hamiltoniene:
d1H = {x1 , x3 , x8 , x7 , x4 , x5 , x6 , x2 }
d2H = {x7 , x8 , x1 , x3 , x4 , x5 , x6 , x2 }
Algoritmul matricilor latine. Vom prezenta un procedeu prin care se pot găsi toate dru-
murile elementare, deci şi cele hamiltoniene, precum şi circuitele hamiltoniene. Fie (X, Γ)
un graf.
Vom utiliza matricea latină (Definiţia 6.1.20) L = (lij ), unde

xi xj , dacă (xi , xj ) ∈ Γ
lij =
0 , dacă (xi , xj ) ∈ Γ, i, j = 1, n.

Construim matricea L, ( obţinută din L prin ı̂nlăturarea lui xi din succesiunea xi xj ,


când acasta există.
Acum, definim o ı̂nmulţire specială de matrice, numită ı̂nmulţirea latină şi notată
prin ”∗”, după cum urmează: a) ı̂nmulţirea se face linii prin coloane; b) ı̂n locul ı̂nmulţirii
obişnuite se face o alăturare de elemente, dacă acestea nu se repetă, sau se scrie 0 ı̂n caz
contrar; c) ı̂n locul adunării obişnuite se iau grupele obţinute la b, când avem astfel de
grupe. Prescurtat, vom scrie L ∗ L ( = L2 . Analog, calculăm L2 ∗ L( = L3 , . . . , Lk−1 ∗ L
( = Lk . Se
k
observă că L conţine toate drumurile elementare de lungime k.
Prin urmare, ı̂n matricea Ln−1 figurează toate drumurile hamiltoniene. Dacă dorim
să obţinem circuitele hamiltoniene se va calcula Ln , dar admitem, ca excepţie, situaţia de
repetare a primului şi a ultimului vârf (cel care ı̂nchide circuitul).
Exemplul 6.2.8. Pentru graful din figura 23 să se determine drumurile hamiltoniene.

109
Fig.23
( prin suprimarea primei litere:
Scriem matricea latină L, iar apoi din ea găsim L

a b c d e a b c d e
a 0 ab ac 0 0 a 0 b c 0 0
b 0 0 bc 0 be (= b 0 0 c 0 e
L= , L
c 0 0 0 cd 0 c 0 0 0 d 0
d da db 0 0 0 d a b 0 0 0
e 0 0 ec 0 0 e 0 0 c 0 0

Acum calculăm
a b c d e
a 0 0 abc acd abe
(= b
L2 = L ∗ L
0 0 bec bcd 0
c cda cdb 0 0 0
dac
d 0 dab dbc 0 dbe
e 0 0 0 ecd 0

Apoi avem:

a b c d e
a 0 acdb abec abcd 0
3 2 (= b bcda 0 0 becd 0
L =L ∗L
c 0 cdab 0 0 cdbe
dabc
d 0 0 dbec 0 dabe
e ecda ecdb 0 0 0

şi
a b c d e
a 0 0 0 abecd acdbe
(= b becda 0 0 0 0
L4 = L3 ∗ L
c 0 0 0 0 cdabe
d 0 0 dabec 0 0
e 0 ecdab 0 0 0
În concluzie, graful dat are 6 drumuri hamiltoniene: d1H = {a, b, e, c, d}, d2H =
{a, x, d, b, e}, d3H = {b, e, c, d, a}, d4H = {c, d, a, b, e}, d5H = {d, a, b, e, c} şi d6H = {e, c, d, a, b}.
Pentru a obţine circuitele hamiltoniene se va calcula L5 = L4 ∗ L, ( dar acum se admite ca
primul şi ultimul vârf să se repete.

6.2.5 Algoritmi pentru determinarea drumurilor de lungime optimă


În multe probleme practice suntem puşi ı̂n situaţia de a ataşa fiecărui arc din graful
asociat problemelor respective un număr (timp de deplasare de-a lungul arcului, cost de

110
transport de-a lungul arcului, beneficiu etc.) care, ı̂ntr-o astfel de situaţie, se interpretează
ca lungimea sau capacitatea arcului. De obicei, ı̂ntr-o astfel de problemă practică se cere
drumul de lungime optimă (maximă sau minimă).
Vom mai considera că graful asociat problemei nu are circuite, dar are un vârf de
intrare x1 şi un vârf de ieşire xn .
Algoritmul elementar (Bellman). El are la bază principiul de optimalitate al lui Bellman:
orice politică optimală este formată din subpolitici optimale.
Prin acest algoritm fiecui vârf xi i se ataşează un număr di , reprezentând lungimea
minimă a drumurilor de la x1 la xi .
Considerăm d1 = 0. Acum, să presupunem că dorim să găsim pe dl , unde vârful xl este
succesorul vârfurilor xi , xj şi xk , la care au fost deja calculate numerele di , dj şi dk . Atunci
lungimea minimă dl de la x1 la xl se determină prin formula

dl = min(di + cil , dj + cjl , dk + ckl )

unde cil , cjl şi ckl sunt capacităţile corespunzătoare arcelor (xi , xl ), (xj , xl ) şi (xk , xl ).
În formula lui dl subliniem ı̂n paranteze valoarea pentru care minimul este atins.
După determinarea tuturor numerelor d1 , d2 , . . . , dn , valoarea lui dn este lungimea minimă a
drumului de la x1 la xn , iar pornind de la xn spre x1 şi citind vârfurile subliniate, obţinem
drumul de lungime minimă.
Pentru un drum de lungime maximă se lucrează ı̂n mod analog, ı̂nlocuind minimul
cu maximul.
Exemplul 6.2.9. Pentru graful din figura 24 să se afle drumul de lungime minimă.

Fig.24

Avem succesiv:
d1 = 0,
d3 = min{d1 + 7} = 7,
d2 = min{d1 + 2, d3 + 4} = min{2, 10} = 2,
d4 = min{d2 + 3, d3 + 9} = min{5, 16} = 5,
d5 = min{d2 + 4, d4 + 8} = min{6, 13} = 6,
d6 = min{d5 + 3, d4 + 2} = min{9, 7} = 7,
d7 = min{d5 + 9, d6 + 7} = min{15, 14} = 14.

Prin urmare, lungimea minimă este 14, iar drumul care are această lungime este:
dmin = {x1 , x2 , x4 , x6 , x7 }. În figura 24 arcele drumului minim sunt dublate cu linie ı̂ntreruptă.
Algoritmul Bellman–Kalaba. Ideea de lucru este aceeaşi cu cea de la algoritmul elementar:
succesiv,pentru fiecare vârf, se calculează câte o cotă (un număr). Căutăm tot drumuri de
lungime minimă. Introducem matricea pătratică C = (cij )i,j=1,n , definită astfel

⎨ l(xi , xj ) , dacă există arcul (xi , xj )
cij = 0 , dacă i = j

∞ , dacă nu există arcul (xi , xj )

111
unde l(xi , xj ) este lungimea arcului (xi , xj ).
Notăm cu lik , i = 1, n, cota ataşată vârfului xi la pasul k, unde de obicei, luăm li,1 = cin ,
când se caută drumul de lungime minimă ı̂ntre x1 şi xn .
Determinăm valorile lik , pas cu pas, prin rezolvarea sistemului

li,k = min (cij + lj,k−1 ), k = 2, 3, . . . , i = 1, n.


j=1,n

Algoritmul se ı̂ncheie când li,k = li,k+1 situaţie ı̂n care l1,k reprezintă lungimea minimă
a drumului de la x1 la xn .
Stabilirea drumului de lungime minimă se face astfel: pornind de la xn , pentru fiecare
arc (xi , xj ) se decide apartenenţa sa la drumul minim dacă

lj,k − li,k = cij = l(xi , xj ).

Practic, algoritmul lucrează după următorii paşi:


Pasul 1. Se scrie matricea C.
Pasul 2. Se calculează cotele li,1 , i = 1, n. Pentru aceasta matricei C i se adaugă ultima
coloană, pe care o notăm cu li,1 . Apoi, se ı̂nmulţeşte C cu această coloană li,1 după regula:
inmulţirea se ı̂nlocuieşte cu adunare, iar adunarea cu operaţia de luare a minimului. Rezultă
astfel valorile de pe coloana li,2 .
Pasul 3. Procesul de la pasul 2 se repetă cu coloana li,2 ş.a.m.d. până se obţin două coloane
identice li,k şi li,k+1 .
Exemplul 6.2.10. Să găsim drumul de lungime minimă din graful dat ı̂n figura 24 utilizând
algoritmul Bellman–Kalaba.
Avem sucesiv
x1 x2 x3 x4 x5 x6 x7 li,1 li,2 li,3 li,4 li,5
x1 0 2 7 ∞ ∞ ∞ ∞ ∞ ∞ 15 14 14
x2 ∞ 0 ∞ 3 4 ∞ ∞ ∞ 13 12 12 12
x3 ∞ 4 0 9 ∞ ∞ ∞ ∞ ∞ 17 16 16
x4 ∞ ∞ ∞ 0 8 2 ∞ ∞ 9 9 9 9
x5 ∞ ∞ ∞ ∞ 0 3 9 9 9 9 9 9
x6 ∞ ∞ ∞ ∞ ∞ 0 7 7 7 7 7 7
x7 ∞ ∞ ∞ ∞ ∞ ∞ 0 0 0 0 0 0

Cum li,4 coincide cu li,5 , algoritmul s-a ı̂ncheiat. Avem

lmin (x1 , x7 ) = l1,4 = 14,

iar drumul de lungime minimă se află prin selectarea arcelor (xi , xj ) pentru care lj,k −li,k = cij .
Aceste arce sunt: (x1 , x3 ), (x2 , x4 ), (x4 , x6 ), (x6 , x7 ), de unde rezultă că drumul de lungime
minimă este dmin = {x1 , x2 , x4 , x6 , x7 }.
Observaţia 6.2.4 Pentru drumul de lungime maximă matricea C este analoagă numai că ı̂n
loc de +∞ se ia −∞.
Teoria grafurilor, ca instrument matematic utilizat ı̂n rezolvarea problemelor din
diferite domenii, este foarte bogată ı̂n algoritmi. Pentru cei care doresc să aprofundeze
această minunată colecţie, poate apela la lucrările [2], [3], [4], [5], [6], [7], [8].

6.2.6 Metoda drumului critic


Metoda drumului critic (Critical Path Method – C.P.M.) este un instrument matem-
atic util specialiştilor ı̂n rezolvarea programelor complexe de planificare, investiţii, producţie
etc. Principiul metodei constă ı̂n descompunerea unui program complex ı̂n părţi compo-
nente, numite activităţi sau operaţii, la un nivel care să permită corelarea funcţională a
acestora, adică să facă posibilă stabilirea intercondiţionărilor ı̂ntre părţile componente. La

112
stabilirea listei (reţelei) de activităţi xi , specialiştii care participă la această operaţie trebuie
să precizeze activităţile care condiţionează sau preced ı̂n mod necesar activitatea xi . Astfel,
se formează o listă de ateriorităţi obligatorii. Cu ajutorul acestor date se construieşte un
graf G – graful asociat sau graful program – ı̂n felul următor:

a) fiecărei activităţi i se asociază un arc (xi , xj ), unde vârful (evenimentul) xi reprezintă


ı̂nceputul operaţiei, iar xj sfârşitul ei;

b) vârful x1 este numai vârful de ı̂nceput (intrare) ı̂n graf, vârful xn este numai vârf de
sfârşit (ieşire), iar celelalte vârfuri sunt şi de intrare şi de ieşire ı̂n graf;

c) condiţionarea (anterioritatea) a două activităţi se reprezintă prin succesiunea arcelor


corespunzţoare;

d) fiecărui arc (xi , xj ) i se asociază un număr nenegativ tij , semnificând durata activităţii
respective;

e) nici o activitate nu poate ı̂ncepe ı̂naintea terminării tuturor activităţilor precedente şi
nu se poate finaliza după ı̂nceperea activităţilor următoare.
Graful astfel ataşat unei reţele de activităţi este un graf conex orientat, fără circuite,
cu un singur vârf x1 de intrare ı̂n graf şi un singur vârf xn de ieşire din graf. Acest graf–
program evidenţiază legăturile funcţionale (tehnologie, economie ş.a.) dintre activităţi.
Menţionăm că un astfel de graf, asociat unui program complex, poartă numele de reţea de
planificare.
Este evident că ı̂ntr-o reţea de planificare există cel puţin o succesiune de activităţi
de la intrare la ieşire. O astfel de succesiune reprezintă un drum de la intrare la ieşire,
având o anumită lungime.
În C.P.M. esenţial este de remarcat faptul că cea mai ”lungă” succesiune de activităţi
de la intrare la ieşire determină durata minimă posibilă de execuţie integrală a programu-
lui.
Această succesiune de activităţi poartă numele de drum critic (drumul de lungime
maximă). Arcele lui reprezintă operaţiile critice, adică acele activităţi pentru care efectu-
area lor nu poate ı̂ntârzia, fără ca să fie afectat termenul de finalizare a ı̂ntregii lucrări.
Într-o reţea de activităţi pot apare operaţii care se desfăşoară ı̂n serie (una după alta),
care ı̂n graf se reprezintă ca o succesiune de arce, şi operaţii care se desfăşoară ı̂n paralel
(simultan), care ı̂n graf se reprezintă astfel

Această reprezentare poate crea confuzia că un arc (xi , xj ) reprezintă două acţiuni
diferite. Pentru a ı̂nlătura acest neajuns, uneori, se introduc aşa numitele operaţii fictive
de durată zero, aşa cum se arată ı̂n figura

Activităţile fictive se desenează punctat şi au durata zero pentru că nu consumă nici
timp şi nici resurse.
Având graful unei reţele de activităţi, se trece la determinarea parametrilor progra-
mului. Aceştia sunt:

113
a) durata drumului critic ı̂ntre două vârfuri xi şi xj , notat prin tc (xi , xj ) şi obţinut prin
valoarea maximă a duratei drumurilor dintre vârfurile xi şi xj ;

b) durata drumului critic al programului este dată de tc (x1 , xn ). În realizarea unui program
reţea de activităţi ne interesează dacă o operaţie necritică poate fi amântă cu un anumit
interval de timp astfel ı̂ncât nici una din operaţiile care o succed să nu fie stânjenită ı̂n
privinţa duratei ce i-a fost programată. Asta ı̂nseamnă că durata ı̂ntregului program
trebuie să rămână tc (x1 , xn );
c) ti – timpul cel mai devreme (scurt) de realizare a evenimentului xi . Avem ti = tc (x1 , xi );
d) t∗i – timpul cel mai târziu (lung) de realizare a evenimentului xi . Avem

t∗i = tc (1, n) − tc (i, n)

Se observă că ti se calculează ca durata drumurilor de lungime maximă par-


curgând reţeaua ı̂n sens direct, iar t∗i ca durata drumurilor de lungime maximă obţinute
prin parcurgerea reţelei ı̂n sens invers.
e) R(xi ) – rezerva de timp a evenimentului xi dată prin formula

R(xi ) = t∗i − ti .

Intervalul [ti , t∗i ] se numeşte intervalul de fluctuaţie al evenimentului xi adică intervalul


ı̂n care se va putea realiza evenimentul xi fără a produce modificări la timpul total
de realizae a programului. Pentru evenimentul critic avem R(xi ) = 0, iar pentru cele
necritice avem R(xi ) > 0;
f ) R(xi , xj ) – rezerva (marja) totală de timp pentru operaţia (activitatea)(xi , xj ) reprezintă
timpul maxim cu care se poate mări durata activităţii fără să se afecteze durata totală
a programului. Avem formula de calcul

R(xi , xj ) = t∗i − ti − t(xi , xj )

unde t(xi , xj ) reprezintă timpul necesar realizării operaţiei (xi , xj );


g) r(xi , xj ) – rezerva de timp liberă (marja liberă) a operaţiei (xi , xj ) reprezintă partea din
rezerva totală cu care se poate dilata durata de realizare a activităţii (xi , xj ) fără să fie
afectat termenul cel mai devreme de realizare a evenimentului xi . Avem

r(xi , xj ) = tj − ti − t(xi , xj ).

h) rs (xi , xj ) – rezerva de timp sigură (marja sigură)a activităţii (xi , xj ) se defineşte prin
formula
rs (xi , xj ) = tj − t∗i − tij
Dacă rs (xi , xj ) < 0, atunci se spune că activitatea (xi , xj ) nu are marjă sigură.
Intervalele de fluctuaţie şi marjele libere măsoară elasticitatea unui program. Cu cât
acestea sunt mai mici, cu atât programul este mai rigid.
Determinarea tuturor acestor parametrii ataşaţi unei reţele de planificare se poate
realiza prin ı̂ntocmirea unui tabel de forma:

i j tij ti tj t∗i t∗j R(xi ) R(xi , xj ) r(xi , xj ) rs (xi , xj )

În prealabil se vor calcula duratele tc (x1 , xi ), respectiv tc (xi , xn ) ale drumurilor critice,
folosind algoritmii pentru determinarea drumurilor de lungime maximă. Valorile aflate se
pot scrie lângă vârfurile grafului astfel

[tc (xi , xj ), tc (xi , xn )]

114
Exemplul 6.2.10. Să analizăm programul unei investiţii pentru care dorim să studiem durata
şi modul de execuţie. În urma analizei programului, specialiştii au stabilit următorul tabel
de operaţii (activităţi), lista de anteriorităţi obligatorii şi durata de execuţie ı̂n luni:

Nr. Denumire activităţii Anteriorităţi Durata


crt. (Notaţia prescurtată) obligatorii (luni)
1. Proiectarea (P ) – 8
2. Eliberarea terenului (E) P 3
3. Comenzi utilaje (C, U ) P 4
4. Organizare şantier – etapa 1 (OS1 ) P 2
5. Formare cadre calificate (F ) D 11
6. Execuţie drumuri interioare – etapa 1 (D1 ) E; OS1 3
7. Execuţii reţele tehnice – etapa 1 (R1 ) E; OS1 6
8. Livrări, recepţie utilaje (L, U ) C, U 7
9. Lucrări construcţii montaj – etapa 1 (C1 ) E; OS1 5
10. Organizare şantier – etapa 2 (OS2 ) OS1 3
11. Execuţii drumuri interioare – etapa 2 (D2 ) D1 ; OS2 ; R1 4
12. Execuţii reţele tehnice – etapa 2 (R2 ) R1 6
13. Lucrări construcţii montaj – etapa 2 (C2 ) L, U, C1 , Rj 11

Ţinând seama de informaţiile din tabelul precedent, obţinem următorul graf pentru
reţeaua de planificare.

Acum, folosind algoritmul lui Bellman, determinăm numerele ti şi t∗i , trecându-le pe
graf ı̂ntre paranteze drepte.

115
116
Cu ajutorul parametrilor ti şi t∗i ı̂ntocmim tabelul de mai jos pentru a calcula
rezervele (marjele) R(xi ), R(xi , xj ), r(xi , xj ) şi rs (xi , xj ).

i j tij ti tj t∗i t∗j R(xi ) R(xi , xj ) r(xi , xj ) rs (xi , xj )


1 2 8 0 8 0 8 0 0 0 0
2 3 4 8 12 8 12 0 0 0 0
2 4 2 8 10 8 23 0 13 0 0
2 5 3 8 11 8 14 0 3 0 0
2 9 11 8 30 8 30 0 11 11 11
3 7 7 12 19 12 19 0 0 0 0
4 8 3 10 14 23 26 13 13 1 -12
5 6 6 11 17 14 24 3 7 0 -3
5 7 5 11 19 14 19 3 2 3 0
5 8 3 11 14 14 26 3 12 0 -3
6 9 5 17 30 25 30 8 8 8 0
7 9 11 19 30 19 30 0 0 0 0
8 9 4 14 30 26 30 12 12 12 0

Drumul critic este dcr = {x1 x2 , x3 , x7 , x9 }, fiind marcat ı̂n ultimul graf prin săgeţile
duble. Operaţiile critice se recunosc ı̂n tabelul de mai sus după R(xi , xj ) = 0. Timpul cel
mai devreme de ı̂ncheiere a ı̂ntregului program este 30 (de luni), adică durata (lungimea
maximă) drumului critic.
Examinarea rezervelor de timp permite cunoaşterea posibilităţilor pe care le are la
dispoziţie cel care coordonează programul ı̂n vederea unei intervenţii optime pentru ex-
ecutarea ı̂n termen a proiectului. De exemplu, pentru activitatea D2 ([x8 , x9 ]), cu durata
de execuţie 4 luni, deducem că nu poate ı̂ncepe mai devreme de trecerea a 14 luni de la
ı̂nceputul execuţiei programului (t8 = 14). Aşadar, activitatea D2 poate ı̂ncepe a fi executată
ı̂n intervalul de fluctuaţie [14, 26], fără a modifica ı̂ntr-un fel timpul minim necesar execuţiei
programului de investiţie.

Observaţia 6.2.5 Atunci când numărul operaţiilor dintr-un program nu este prea mare, pen-
tru analiza grafului, cât şi pentru urmărirea realizării lui, se paote folosi diagrama Gantt.
Pentru descrierea ei se procedeză astfel:

a) se ordonează activităţile (xi , xj ) după j crescător, cele cu acelaşi j succedându-se ı̂n


ordinea crescătoare dată de i,

b) se reprezintă prin bare orizontale duratele activităţilor, marcându-le extremităţile lor


cu numerele de ordine ale evenimentelor;

c) se reprezintă punctat drumul critic.

Pentru graful programului studiat ı̂n exemplul 6.2.10, diagrama Gantt este dată ı̂n
figura de mai jos.

117
Diagrama Gantt ne descrie ı̂n mod intuitiv fluctuaţiile evenimentelor şi rezervele
(marjele) activităţilor din programul studiat.

De exemplu, cu evenimentul 6 se termină activitatea (5, 6) şi ı̂ncepe activitatea (6, 9);
rezultă că operaţia (5, 6) s-ar putea amâna cu cel mult 7 unităţi de timp deoarece, ı̂n caz
contrar, operaţia (6, 9) s-ar deplasa spre dreapta, peste durata ı̂ntregului program. Rezultă
că fluctuaţia evenimentului 6 este de 7 unităţi.

6.3 Problema fluxului optim ı̂n reţele de transport


Noţiunea de flux joacă un rol important ı̂n domenii de importanţă pentru economie,
cum sunt: teoria informaţiei, cibernetică, transport, planificare etc.
În acest paragraf vom studia problema determinării fluxului optim ı̂ntr-o reţea de
transport.

6.3.1 Reţele de transport


Fie (X, Γ) un graf orientat.

Definiţia 6.3.1 Graful orientat (X, Γ) se numeşte reţea de transport dacă este fără circuite,
are un singur vârf de intrare x1 (Γ− +
x1 = ∅), un singur vârf de ieşire xn (Γxn = ∅) şi oricare
arc a ∈ Γ are o capacitate pozitivă c(a).

Definiţia 6.3.2 Se numeşte flux ı̂ntr-o reţea de transport o funcţie ϕ : Γ → R+ , care satisface
condiţile:

i) ϕ(a) ≤ c(a), pentru orice arc a ∈ Γ;

ii) ı̂n orice vârf xi ∈ X avem satisfăcută egalitatea



ϕ(a) = ϕ(a),
a∈Γ+
xi a∈Γ−
xi

numită proprietate de conservare.

Numărul ϕ(a) se mai numeşte şi fluxul asociat arcului a şi reprezintă, din punct de
vedere practic, cantitatea de materie ce trece prin arcul a, ca de exemplu: cantitate de
informaţie, număr de produse etc.
Condiţia ii) din Definiţia 6.3.2 exprimă faptul că suma fluxurilor ce intră ı̂ntr-un vârf

118
este egală cu suma fluxurilor ce ies din acel vârf (”legea lui Kirchoff”).
Din aceeaşi condiţie ii) rezultă că

ϕ(a) = ϕ(a).
a∈Γ+
x1 a∈Γ−
xn

Definiţia 6.3.3 Numărul real pozitiv Φ, definit prin egalitatea


Φ= ϕ(a)
a∈Γ+
x1

se numeşte valoarea fluxului ϕ ı̂n reţea.


Exemplul 6.3.1. În graful din fig 6.3.1. să se definească un flux şi să se calculeze valoarea
fluxului ı̂n reţea. În paranteze drepte sunt trecute capacităţile arcelor.

Fig.6.3.1.

Pentru a defini un flux ı̂n reţeaua dată de graful 6.3.1. folosim Definiţia 6.3.2.
Funcţia ϕ definită prin tabelul

Γ (x1 , x2 ) (x1 , x3 ) (x1 , x4 ) (x2 , x3 ) (x2 , x5 ) (x3 , x5 ) (x4 , x3 )


ϕ(a) 5 1 7 1 4 2 0

(x4 , x5 ) (x4 , x6 ) (x5 , x7 ) (x6 , x5 ) (x6 , x7 )


1 6 10 3 3
este un flux ı̂n reţea. Valoarea fluxului ı̂n reţea este Φ = 5 + 1 + 7 = 10 + 3 = 13. Şi aplicaţia
ϕ1 : Γ → R+ dată prin tabelul

Γ (x1 , x2 ) (x1 , x3 ) (x1 , x4 ) (x2 , x3 ) (x2 , x5 ) (x3 , x5 ) (x4 , x3 )


ϕ1 (a) 5 2 6 1 4 5 2

(x4 , x5 ) (x4 , x6 ) (x5 , x7 ) (x6 , x5 ) (x6 , x7 )


1 3 10 0 3
este un flux ı̂n reţeaua din fig.6.3.1, iar valoarea fluxului ı̂n reţea este

Φ1 = 5 + 2 + 6 = 10 + 3 = 13

Definiţia 6.3.4 Într-o reţea de transport ı̂nzestrată cu fluxul ϕ arcul a se numeşte saturat
dacă ϕ(a) = c(a). Un drum ı̂n reţea se zice că este saturat dacă conţine cel puţin un arc
saturat.

Definiţia 6.3.5 Un flux ϕ pentru care toate drumurile de la x1 la xn sunt saturate se numeşte
flux complet.

119
Exemplul 6.3.2. Pentru fluxul ϕ asociat grafului din fig.6.3.1. drumul d = (x1 , x2 , x5 , x7 ) este
saturat deoarece arcele (x2 , x5 ) şi (x5 , x7 ) sunt saturate. Se verifică imediat că fluxul ϕ este
complet. Într-adevăr, se observă că singurul drum de la x1 la x7 care nu trece prin arcul
(x5 , x7 ) este d1 = (x1 , x4 , x6 , x7 ), care are ı̂nsă arcul saturat (x1 , x4 ).
Fluxul ϕ1 nu este complet deoarece drumul d1 = (x1 , x4 , x6 , x7 ) nu este saturat.
Observaţia 6.3.1 Orice flux se paote transforma ı̂ntr-unul complet. În acest scop pe fiecare
drum nesaturat d de la x1 la xn se măresc fluxurile arcelor cu cantitatea k = min(c(a) − ϕ(a)).
a∈d

Exemplul 6.3.3. Să considerăm graful din fig.6.3.1. cu fluxul incomplet ϕ1 . Se observă
că singurul drum nesaturat este d1 = (x1 , x4 , x6 , x7 ). Mărim fluxul pe arcele sale cu k =
min(7 − 6, 6 − 3, 14 − 3) = 1 şi obţinem arcul saturat (x1 , x4 ). Astfel fluxul ϕ1 s-a transformat
ı̂n fluxul complet ϕ2 dat prin tabelul:

Γ (x1 , x2 ) (x1 , x3 ) (x1 , x4 ) (x2 , x3 ) (x2 , x5 ) (x3 , x5 ) (x4 , x3 )


ϕ2 (a) 5 2 7 1 4 5 2

(x4 , x5 ) (x4 , x6 ) (x5 , x7 ) (x6 , x5 ) (x6 , x7 )


1 4 10 0 4
Fluxul ı̂n reţea este Φ2 = 14.

6.3.2 Algoritmul lui Ford–Fulkerson pentru determinarea fluxului maxim


ı̂ntr-un graf de reţea
În acest paragraf vom descrie un algoritm de marcare iterativă cu + şi − a vârfurilor
grafului reţelei de transport. Dacă prin acest proces se va ajunge la marcarea vârfului xn ,
atunci fluxul nu este maxim, ı̂n caz contrar fluxul complet va fi maxim.
Algoritmul de marcare cu + şi − (Ford–Fulkerson) are următorii paşi:

1) se marchează x1 cu +;

2) dacă xi este un vârf marcat şi există arcul nesaturat (xi , xj ) ∈ Γ, atunci xj se marchează
cu +;

3) dacă vârful xi este marcat şi există arcul (xj , xi ) ∈ Γ cu flux pozitiv, atunci xj se
marchează cu −;

4) se repetă paşii 2) şi 3) atât timp cât este posibil;

5) dacă prin procedeul de marcare nu s-a ajuns la vârful xn , atunci fluxul este maxim;
dacă prin procesul de marcare s-a ajuns la xn , atunci fluxul complet nu este maxim şi
se trece la pasul următor;

6) se majoreză fluxul cu cantitatea

m = min {c(a) − ϕ(a), ϕ(a1 )}.


a,a1 ∈L

Aici, am notat cu L lanţul care trece prin toate vârfurile marcate de la x1 la xn ,


a tipul de arc din L precizat la pasul 2), iar a1 tipul de arc din L precizat la pasul 3).
Majorarea fluxului se face astfel: cantitatea m se adună la fluxul de pe arcele a şi se
scade la fluxul de pe arcele a1 ;

7) se reia procesul de marcare a vârfurilor.

Pentru justificarea mai comodă a algoritmuui Ford–Fulkerson introducem noţiuneaa


de tăietură ı̂ntr-un graf.

120
Definiţia 6.3.6 Numim tăietură ı̂n graful F = (X, Γ) o partiţionare a vârfurilor X ı̂n două
submulţimi Y şi C(Y ), astfel ı̂ncât x1 ∈ Y şi xn ∈ C(Y ). Notăm prin Y /X tăietura deter-
minată de Y ı̂n graful G. Valoarea tăieturii, notată prin v(Y /X) este, prin definiţie, suma
capacităţilor arcelor cu vârful iniţial ı̂n Y şi vârful final ı̂n C(Y ), adică

)
v(Y /X) = c(a), unde Γ+ Y = Γ+
xi .
a∈Γ+ xi ∈Y
Y

Propoziţia 6.3.1 Fie ı̂n graful reţea G = (X, Γ) o tăietură Y /X. Pentru orice flux ϕ are loc
inegalitatea
Φ ≤ v(Y /X).

Demonstraţie. Având ı̂n vedere că suma fluxurilor ce intră ı̂n Y este egală cu suma
fluxurilor ce ies din Y , putem scrie

Φ+ ϕ(aij ) = ϕ(aij ),
i=1
− aij ∈Γ+
Y
aij ∈Γ
Y

de unde

Φ= ϕ(aij ) − ϕ(aij ) ≤ c(aij ) = v(Y /X).


aij ∈Γ+
Y
i=1
− aij ∈Γ+
Y
aij ∈Γ
Y

Propoziţia 6.3.2 Dacă utilizând algoritmul lui Ford–Fulkerson nu se poate marca vârful xn ,
atunci valoarea fluxului Φ corespunzător este maximă.

Demonstraţie. Fie Y mulţimea vârfurilor marcate prin algoritmul lui Ford–Fulkerson.


Avem x1 ∈ Y şi xn ∈ Y . Cum nu se mai poate marca nici un vârf, un arc aij = (xi , xj ) cu
xi ∈ Y şi xj ∈ Y verifică ϕ(aij ) = c(aij ), iar un arc aji = (xj , xi ) cu xi ∈ X şi xj ∈ Y verifică
ϕ(aji ) = 0. Deci:

Φ= ϕ(aij ) − = c(aij ) = v(Y /X).


aij ∈Γ+
Y
i=1
− aij ∈Γ+
Y
aij ∈Γ
Y

Folosind propoziţia 6.3.1, rezultă că Φ are valoarea maximă.

Teorema 6.3.1 (Ford–Fulkerson). Într-un graf G = (X, Γ) valoarea maximă a unui flux Φ
este
max Φ = min v(Y /X).
ϕ Y /X

Demonstraţie. Veridicitatea teoremei rezultă din propoziţiile 6.3.1 şi 6.3.2.


Exemplul 6.3.4. Să se determine fluxul maxim ı̂n graful reţea de transport dat ı̂n fig.6.3.1.
Plecăm de la fluxul complet obţinut ı̂n Exemplul 6.3.3. şi ı̂ncepem procesul de marcare
a vârfurilor cum este ilustrat ı̂n fig.6.3.2.

121
Fig.6.3.2.

Marcăm mai ı̂ntâi vârful x1 cu +. Apoi marcăm cu + vârfurile x2 şi x3 deoarece arcele
(x1 , x2 ) şi (x1 , x3 ) sunt nesaturate.
Vârful x4 se marchează cu − pentru că arcul (x4 , x3 ) are fluxul pozitiv. Se marchează
cu + vârful x5 şi x6 deoarece arcele (x4 , x5 ) şi (x4 , x6 ) sunt nesaturate. În fine, se marchează
cu + vârful x7 deoarece arcul (x6 , x7 ) este nesaturat.
Întrucât s-a marcat x7 deducem că fluxul nu este maxim. El poate fi majorat cu
cantitatea m = min{3 − 2, 2, 6 − 4, 13 − 4} = 1, minimul fiind luat pe lanţul L = {x1 , x3 , x4 , x6 , x7 }.
Rezultă fluxul complet

Γ (x1 , x2 ) (x1 , x3 ) (x1 , x4 ) (x2 , x3 ) (x2 , x5 ) (x3 , x5 ) (x4 , x3 )


ϕ3 (a) 5 3 7 1 4 5 1

(x4 , x5 ) (x4 , x6 ) (x5 , x7 ) (x6 , x5 ) (x6 , x7 )


1 5 10 0 5
cu valoare Φ3 = 15.
Încercăm o nouă marcare (al doilea semn + sau −). Se poate marca din nou vârfurile
lanţului L = (x1 , x2 , x3 , x4 , x6 , x7 ). Rezultă că fluxul ϕ3 nu este maxim. El poate fi majorat
cu cantitatea
m = min{6 − 5, 2 − 1, 1, 6 − 5, 13 − 5} = 1.
Rezută fluxul complet

Γ (x1 , x2 ) (x1 , x3 ) (x1 , x4 ) (x2 , x3 ) (x2 , x5 ) (x3 , x5 ) (x4 , x3 )


ϕ4 (a) 6 3 7 2 4 5 0

(x4 , x5 ) (x4 , x6 ) (x5 , x7 ) (x6 , x5 ) (x6 , x7 )


1 6 10 0 6
cu valoarea Φ4 = 6 + 3 + 7 = 10 + 6 = 16.
Deoarece s-a marcat x7 deducem că trebuie continuat algoritmul Ford–Fulkerson.
Marcăm cu + vârful x1 (al treilea +) şi se observă că nu se mai pot marca alte vârfuri
deoarece arcele (x1 , x2 ), (x2 , x3 ) şi (x1 , x4 ) sunt saturate. Rezultă că fluxul Φ4 = 16 este maxim.
Tăietura cu valoare minimă este dată de mulţimea Y = {x1 } cu v(Y /X) = 6 + 3 + 7 = 16.
Exemplul 6.3.5. Trei depozite D1 , D2 , D3 dispun de 11, 10, 13 tone dintr-un produs din care
patru consumatori C1 , C2 , C3 , C4 au nevoie de 9, 8, 9 şi 11 tone. Posibilităţile de transport
limitate de capacităţile mijloacelor de transport sunt date ı̂n tabelul:

Di \ Cj C1 C2 C3 C4
D1 5 3 0 6
D2 3 0 9 0
D3 0 6 1 5

Existenţa numărului 0 ne indică că de la depozitele D respective nu se face nici un


transport la consumatorii corespunzători.
Să se determine un plan optim de transport astfel ı̂ncât să poată fi asigurată integral
cererea consumatorilor C2 şi C3 , iar cererea consumatorilor C1 şi C4 ı̂n cea mai mare
măsură.
Transformăm problema ı̂ntr-un graf de reţea de transport, considerând vârful de
intrare x1 , vârfurile x2 , x3 , x4 corespunzătoare depozitelor D1 , D2 , D3 , vârfurile x5 , x6 , x7 ,
x8 corespunzătoare celor patru consumatori şi x9 vârful de ieşire. Problemei noastre ı̂i
corespunde graful din figura 6.3.3.

122
5

10

4 11

Fig.6.3.3.
Rezolvarea problemei revine la determinarea unui flux maxim ı̂n reţeaua de transport din
fig.6.3.3.
Vom utiliza algoritmul lui Ford–Fulkerson.
Mai ı̂ntâi trebuie să determinăm un flux ϕ pentru reţea. Prin ı̂ncercări, respectând
condiţiile din Definiţia 6.3.2, construim fluxul
Γ (x1 , x2 ) (x1 , x3 ) (x1 , x4 ) (x2 , x5 ) (x2 , x6 ) (x2 , x8 ) (x3 , x5 )
ϕ 7 8 6 4 2 1 0
(x3 , x7 ) (x4 , x6 ) (x4 , x7 ) (x4 , x8 ) (x5 , x9 ) (x6 , x9 ) (x7 , x9 ) (x8 , x9 )
8 5 1 0 4 7 9 1
cu valoarea Φ = 21.
Se observă că fluxul ϕ este incomplet deoarece drumurile d1 = (x1 , x2 , x5 , x9 ), d2 =
(x1 , x2 , x6 , x9 ), d3 = (x1 , x2 , x8 , x9 ), d4 = (x1 , x3 , x5 , x9 ), d5 = (x1 , x4 , x6 , x9 ), d6 = (x1 , x4 , x8 , x9 ) sunt
nesaturate.
Pe fiecare din aceste drumuri fluxul poate fi majorat corespunzător cu k1 = min(11 −
7, 5 − 4, 9 − 4) = 1, k2 = min(11 − 7, 3 − 2, 8 − 7) = 1, k3 = min(11 − 7, 6 − 1, 11 − 1) = 4, k4 =
min(10 − 8, 3 − 0, 9 − 4) = 2, k5 = min(13 − 6, 6 − 5, 8 − 7) = 1, k6 = min(13 − 6, 5 − 0, 11 − 1) = 5.
Obţinem noul flux ϕ1 :
Γ (x1 , x2 ) (x1 , x3 ) (x1 , x4 ) (x2 , x5 ) (x2 , x6 ) (x2 , x8 ) (x3 , x5 )
ϕ1 11 10 12 4 2 5 2
(x3 , x7 ) (x4 , x6 ) (x4 , x7 ) (x4 , x8 ) (x5 , x9 ) (x6 , x9 ) (x7 , x9 ) (x8 , x9 )
8 6 1 5 6 8 9 10
cu Φ1 = 11 + 10 + 22 = 6 + 8 + 9 + 10 = 33.
Deoarece prin majorare cu k3 arcul (x1 , x2 ) s-a saturat, drumurile d1 şi d2 au devenit
saturate prin urmare nu s-au mai putut majora fluxurile pe d1 şi d2 .
Este evident că fluxul ϕ1 este complet deoarece pe fiecare din drumurile de la x1 la x9
se află cel puţin un arc saturat.
Acum trecem la ı̂mbunătăţirea fluxului prin folosirea algoritmului Ford–Fulkerson.
Marcăm x1 cu +. Cum arcul (x1 , x4 ) este nesaturat, marcăm x4 cu +. Deoarece arcele
(x4 , x6 ), (x4 , x7 ), (x4 , x8 ) sunt saturate, rezultă că marcarea nu mai poate fi continuată. Prin
urmare, vârful x9 nu poate fi marcat. Deducem că valoarea fluxului maxim este 33. Tăietura
de capacitate minimă este Y = {x1 , x4 } cu
v(Y /X) = 11 + 10 + 6 + 1 + 5 = 33.
Programul optimal dat de fluxul ϕ1 se poate reprezenta şi prin tabelul
Cj x5 x6 x7 x8 Cantităţi din produse Cantităţi
Dj C1 C2 C3 C4 disponibile ı̂n depozite consumate
x2 D1 4 2 0 5 11 11
x3 D2 2 0 8 0 10 10
x4 D4 0 6 1 5 13 13
Cererile
9 8 9 11
consumatorilor
Cereri
6 8 9 10
satisfăcute

123
Valorile (xi , xj ) din tabel au fost citite din fluxul optimal ϕ1 şi reprezintă cantitatea
de produs luată din depozitul xi şi transportată la consumatorul xj .

Observaţia 6.3.2 Algoritmul Ford–Fulkerson se poate utiliza şi la rezolvarea problemei de-
terminării numărului maxim de cuplaje (legături independente) ı̂ntr-un graf bipartit. Un
graf G = (X, Γ) se numeşte bipartit dacă există o partiţie a mulţimii X = X1 ∪X2 , X1 ∩X2 = ∅
astfel ı̂ncât fiecare arc a lui G are o extremitate ı̂n X1 şi cealaltă ı̂n X2 .

124
6.4 Testul Nr. 5 de verificare a cunoştinţelor

1. Definiţi noţiunile următoare:


a) Graf;
b) Graf simetric;
c) Drum ı̂ntr-un graf;
d) Drum hamiltonian;
e) Graf tare conex.
2. Definiţi noţiunile următoare
a) Arbore;
b) Matricea booleană ataşată unui graf;
c) Reţea de transport;
d) Flux complet ı̂ntr-o reţea de transport.
3. Să se găsească cu ajutorul algoritmului lui Bellman drumul minim x1 → x5 din
următorul graf:

X2

2 5

1 3 X5
X1 X4
2
1
5
3

X3

4. Găsiţi drumurile, fără circuite, de lungime 1, 2 şi 3 din graful următor

X2

X5

X1

X4

X3

5. Determinaţi cu ajutorul algoritmului lui Bellman drumul de lungime maximă x1 → x14


din graful următor, precizând şi lungimea acesteia:

X4 7 X5 5 X8 8 X11
5 7
2
2 X3 10 0 X13
6 X14
X1 X2 9 5
X10 X12 3
4 9
3 10

X6 8 X7 9 X9

125
6. Găsiţi cu ajutorul algoritmului Bellman - Kalaba drumul minim x1 → x7 şi lungimea
acestuia din următorul graf:

X2 4 X5

10
5 2
6
4 X7
3 X3
X1
5 9
1
7
8 X6
X4

7. Găsiţi cu ajutorul algoritmului Bellman - Kalaba drumul maxim x1 → x7 şi lungimea


acestuia din graful de la problema precedentă.

8. Folosind metoda drumului critic să se determine elementele caracteritice ale


următoarei reţele de activităţi:

X4 7 X5 5 X8 8 X11
5 7
2
2 X3 10 0 X13
6 X14
X1 X2 9 5
X10 X12 3
4 9
3 10

X6 8 X7 9 X9

9. Stabiliţi folosind algoritmul marcării dacă următorul graf are circuite:

X2

X1 X3

X4
X5

10. Scrieţi matricea booleană asociată grafului

X2 X5

X1 X6

X4
X3

126
Indicaţii şi răspunsuri

Testul 5

3. Drumul minim este [x1 , x2 , x4 , x5 ] şi are lungimea 6.

4. Se obţin matricile:
L x1 x2 x3 x4 x5
x1 0 x1 x2 0 x1 x4 x1 x5
x2 0 0 x2 x3 0 x2 x5
x3 x3 x1 0 0 0 0
x4 0 0 x4 x3 0 x4 x5
x5 0 0 0 0 0
L∗ x1 x2 x3 x4 x5
x1 0 x1 0 x1 x1
x2 0 0 x2 0 x2
x3 x3 0 0 0 0
x4 0 0 x4 0 x4
x5 0 0 0 0 0

L2 = L∗ · L x1 x2 x3 x4 x5
x1 0 0 x1 x2 x3 0 x1 x2 x5
x1 x4 x3 x1 x4 x5
x2 x2 x3 x1 0 0 0 0
x3 0 x3 x1 x2 0 x3 x1 x4 x3 x1 x5
x4 x4 x3 x1 0 0 0 0
x5 0 0 0 0 0

L3 = L∗ · L2 x1 x2 x3 x4 x5
x1 0 0 0 0 0
x2 0 0 0 x2 x3 x1 x4 x2 x3 x1 x5
x3 0 0 0 0 x3 x1 x2 x5
x3 x1 x4 x5
x4 0 x4 x3 x1 x2 0 0 x4 x3 x1 x5
x5 0 0 0 0 0

5. Drumul de lungime maximă este [x1 , x2 , x4 , x5 , x3 , x7 , x8 , x11 , x13 , x14 ] şi lmax = 48.
6. Se obţine lmin (x1 → x7 ) = 17 şi drumul minim [x1 , x3 , x6 , x7 ].

7. Se obţine lmax (x1 → x7 ) = 28 şi dmax (x1 → x7 ) = [x1 , x4 , x3 , x5 , x6 , x7 ].

127
8. Se obţine tabelul final:

i j lij ti tj sj mij Mij


1 2 2 0 2 2 0 0
2 3 9 2 16 16 5 5
2 4 5 2 7 7 0 0
2 6 3 2 5 12 0 7
3 7 4 16 20 20 0 0
4 5 7 7 14 14 0 0
5 3 2 14 16 16 0 0
5 8 5 14 30 30 11 11
6 7 8 5 20 20 7 7
7 8 10 20 30 30 0 0
7 9 9 20 29 35 0 5
7 10 9 20 29 34 0 5
8 11 8 30 38 38 0 0
9 13 10 29 45 45 6 6
10 12 5 29 38 39 4 5
11 13 7 38 45 45 0 0
12 13 6 38 45 45 1 1
13 14 3 45 48 48 0 0

9. Se vor marca ı̂n ordine x3 , x4 , x5 , x2 , x1 şi astfel se deduce că avem un graf fără circuite.

10. matricea booleană asociată este:


⎛ ⎞
0 1 1 0 1 0
⎜ 0 0 0 0 1 0 ⎟
⎜ ⎟
⎜ 1 0 0 1 0 0 ⎟
⎜ ⎟
⎜ 0 1 0 0 1 1 ⎟
⎜ ⎟
⎝ 0 0 1 0 0 1 ⎠
0 0 0 0 0 0

128
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul I,
Editura ULB, Sibiu, 2001.
[2] Blaga, P., Mureşan, A., Matematici aplicate ı̂n economie, vol.I, II, Transilvania Press,
Cluj–Napoca, 1996.
[3] Ionescu, T., Grafuri. Aplicaţii, vol.I, vol.II, Editura Didactică şi Pedagogică, Bu-
cureşti, 1973, 1974.
[4] Izvercian, P.N.,Creţu, V., Izvercian, M., Resiga, R., Introducere ı̂n teoria grafurilor.
Metoda drumului critic, Editura de Vest, Timişoara, 1994.
[5] Popescu, O., Raischi, C., Matematici aplicate ı̂n economie, vol.I, II, Editura Didactică şi
Pedagogică, Bucureşti, 1993.
[6] Roşu, A., Teoria grafurilor, algoritmi, aplicaţii, Editura Militară, Bucureşti, 1974.
[7] Tamaş, V. (coord.), Brănzei, D., Smadici, C., Moicovici, T., Modele matematice ı̂n
economie, Editura Graphix, Iaşi, 1995.
[8] Văduva, I., Dinescu, C., Săvulescu, B., Metode matematice de organizare şi condu-
cerea producţiei, Editura Didactică şi Pedagogică, Bucureşti, 1974.

129
Capitolul 7

Probleme de transport

Obiective: În acest capitol se doreşte familiarizarea studenţilor cu problemele de


transport, probleme cu o imporatnţa deosebită ı̂n optimizarea a numeroase procese eco-
nomice. O problemă de transport constă ı̂n aflarea unui plan de transport a unui produs, de
la anumite centre producătoare (depozite), ı̂n scopul satisfacerii cerinţelor unor consuma-
tori şi minimizării cheltuielilor de transport.
Problemele de tip transport se ı̂ntâlnesc ı̂n multe procese economice, ca de exem-
plu: transporturi de bunuri; proiectarea de canale de energie (informaţii, electricitate), de
canale ı̂n agricultură; proiectarea de depozite ı̂n acelaşi spaţiu productiv; repartiţia optimă
a sarcinilor de producţie pe maşini, secţii, ı̂ntreprinderi, optimizarea unor probleme de
producţie şi stocaj etc.
Rezumat: Modelul matematic al problemelor de transport se ı̂ncadrează ı̂n mo-
delul problemelor de programare liniară. Având ı̂n vedere numărul mare de variabile, re-
zolvarea unei probleme de transport prin algoritmul simplex este ı̂n general puţin eficientă.
De aceea, pentru rezolvarea problemelor de tip transport se folosesc tehnici speciale. Acest
capitol este dedicat prezentării, sub o formă simplă, a acestor tehnici.
Conţinutul capitolului:
1. Modelul matematic pentru o problemă de transport
2. Determinarea unei soluţii iniţiale
3. Ameliorarea (ı̂mbunătăţirea) unei soluţii
4. Aflarea unei soluţii optime
5. Degenerarea ı̂n problemele de transport
6. Probleme de transport cu capacităţi limitate
7. Test de verificare a cunoştinţelor
8. Bibliografia aferentă capitolului
Cuvinte cheie: probleme de transport, soluţie iniţială a unei probleme de trasport,
soluţie optimă a unei probleme de transport, probleme de trasport cu capacităţi limitate.

7.1 Modelul matematic pentru o problemă de transport


O problemă de transport a fost formulată la Capitolul 1, problema 2. Să o formulăm
din nou. Un produs (marfă) se află ı̂n depozitele D1 , D2 , . . ., Dm cu capacităţile a1 , a2 ,
. . ., am şi trebuie transportat(ă) la centrele de consum C1 , C2 , . . ., Cn ı̂n cantităţile b1 , b2 ,
. . ., bn . Cunoscând costul transportului pe unitate de produs de la depozitul Di , i = 1, m la
centrul de consum Cj , j = 1, n, notat cu cij , se cere să se ı̂ntocmească un astfel de plan de
repartiţie a produsului ı̂ncât costul total al transportului să fie minim.
Dacă notăm cu xij cantitatea de produs ce se va transporta de la depozitul Di , i = 1, m,
la centrul de consum Cj , j = 1, n, atunci modelul matematic pentru probleme de transport

130
se scrie astfel: ⎧ n




⎪ xij = ai , i = 1, m




j=1


x = b , i = 1, n
m

ij i
(7.1)

⎪ i=1

⎪ xij ≥ 0, i = 1, m, j = 1, n




m
n



⎩ (min)f = cij xij .
i=1 j=1

Intuitiv, modelul matematic (7.1) al problemei de transport se poate reprezenta prin


Tabelul 7.1.
Di \ Cj C1 C2 ... Cn Disponibil
c11 c12 c1n
D1 ... a1
x11 x12 x1n
c21 c22 c2n
D2 ... a2
x21 x22 x2n
.. .. .. .. .. ..
. . . . . .
cm1 cm2 cmn
Dm ... am
xm1 xm2 xmn
Necesar b1 b2 ... bn T
cij
Cuplul poartă numele de căsuţă.
xij
Algoritmul de rezolvare a unui model de transport cere ca acest model să fie echilibrat,
adică să fie ı̂ndeplinită condiţia de echilibru

n
ai = bj ,
i=1 j=1

adică totalul disponibilului să fie egal cu totalul necesarului. Valoarea comună T a acestui
total se trece ı̂n căsuţa (m + 1, n + 1).
În caz contrar, modelul se echilibrează prin considerarea, fie a unui depozit fictiv
Dm+1 , fie a unui centru de consum fictiv Cn+1 , care oferă, sau cere, diferenţa dintre cele
două sume. Deoarece cantităţile transportate de la un depozit arbitrar, respectiv la acest
centru fictiv, nu există ı̂n realitate, costurile de transport corespunzătoare le considerăm
nule.
Se observă că ı̂ntr-o problemă de transport cu m depozite şi n centre de consum mode-
lul matematic conţine m · n variabile necunoscute şi cel mult m + n − 1 restricţii independente
(nu s-au inclus condiţiile de nenegativitate). Numărul variabilelor necunoscute fiind evi-
dent mai mare ca cel al restricţiilor, rezultă că valorile variabilelor ce verifică sistemul de
restricţii nu sunt unic determinate.
O soluţie realizabilă a problemei, care conţine cel mult (m + n − 1) componente strict
pozitive, se numeşte soluţie de bază. Soluţia de bază cu exact (m + n − 1) componente poz-
itive se numeşte soluţie de bază nedegenerată, iar ı̂n caz contrar, degenerată.
Se constată că modelul matematic reprezintă o problemă de programare liniară de o
formă specială. Cu toate că ı̂n restricţii coeficienţii necunoscutelor sunt 0 sau 1, rezolvarea
prin metoda simplex cere un volum de calcule foarte mare. De aceea, se preferă pentru
rezolvarea unei probleme de transport o cale cu tehnică specifică.
În general, pentru rezolvarea unei probleme de transport se parcurg etapele:
a) Determinarea (aflarea) unei soluţii iniţiale (de bază, nedegerată);
b) Ameliorarea (ı̂mbunătăţirea) unei soluţii;
c) Aflarea (determinarea) soluţiei optime.

131
7.2 Determinarea unei soluţii iniţiale
Pentru aflarea unei soluţii iniţiale ı̂ntr-o problemă de transport se cunosc mai multe
metode. În cele ce urmează vom prezenta trei metode.

7.2.1 Metoda colţului Nord–Vest


Această metodă constă ı̂n a atribui, pe rând, valori variabilelor necunoscute ı̂ncepând
cu cea din colţul Nord–Vest al tabelului. Astfel, mai ı̂ntâi luăm x11 = min(a1 , b1 ). Dacă
min(a1 , b1 ) = a1 , atunci x12 = . . . = x1n = 0, iar dacă min(a1 , b1 ) = b1 , atunci x21 = x31 = . . . =
xm1 = 0. Metoda continuă apoi cu x21 = min(a2 , b1 − a1 ) ı̂n prima situaţie, respectiv cu
x12 = min(a1 − b1 , b2 ) ı̂n cealaltă situaţie. Procesul se repetă până când este repartizată şi
ultima cantitate disponibilă.
Exemplul 7.2.1. Se consideră trei furnizori D1 , D2 şi D3 care au disponibile corespunzător
cantităţile de un anumit produs a1 = 50, a2 = 30 şi a3 = 40. Acestea sunt solicitate de patru
consumatori C1 , C2 , C3 şi C4 ı̂n cantităţile b1 = 45, b2 = 15, b3 = 25 şi b4 = 35. Cunoscând
costurile unitare de transport 3, 2, 1, 1; 2, 3, 2, 1 şi 4, 2, 3, 2 unităţi monetare de la D1 , D2 şi D3 ,
să se scrie modelul matematic al problemei de transport, când se urmăreşte minimizarea
costului total.
Utilizând metoda colţului Nord–Vest să se găsească o soluţie iniţială.
Dacă notăm cu xij cantitatea de produs ce se va transporta de la furnizorul Di , i = 1, 2, 3
la beneficiarul Cj , j = 1, 2, 3, 4, atunci obţinem următorul model matematic:

x11 +x12 +x13 +x14 = 50


x21 +x22 +x23 +x24 = 30
x31 +x32 +x33 +x34 = 40
x11 +x21 +x31 = 45
x12 +x22 +x32 = 15
x13 +x23 +x33 = 25
x14 +x24 +x34 = 35

xij ≥ 0, i = 1, 2, 3, j = 1, 2, 3, 4.
(min)f = 3x11 + 2x12 + x13 + x14 + 2x21 + 3x22 +
+2x23 + x24 + 4x31 + 2x32 + 3x33 + 2x34
Sub formă tabelară modelul matematic este
Di \ Cj C1 C2 C3 C4 Disponibil
3 2 1 1
D1 50
x11 x12 x13 x14
2 3 2 1
D2 30
x21 x22 x23 x24
4 2 3 2
D3 40
x31 x32 x33 x34
Necesar 45 15 25 35 120

Pentru aflarea soluţiei iniţiale cu metoda colţului Nord–Vest procedăm astfel: alegem
x11 = min(45, 50) = 45; atunci x21 = x31 = 0; apoi x12 = min(15, 5) = 5 şi x13 = x14 = 0; ı̂n
continuare x22 = min(10, 30) = 10 şi x32 = 0; mai departe x23 = min(20, 25) = 20 şi x24 = 0 şi ı̂n
final x33 = 5 şi x34 = 35.
De obicei, se determină soluţia iniţială ı̂n tabel, micşorându-se de fiecare dată disponi-

132
bilul şi necesarul respectiv şi scriind alăturat cel rămas. Astfel avem

Di \ Cj C1 C2 C3 C4 Disponibil
3 2 1 1
D1 50; 5; 0
45 5 0 0
2 3 2 1
D2 30; 20; 0
0 10 20 0
4 2 3 2
D3 40; 35; 0
0 0 5 35
Necesar 45 15 25 35 120
0 10 5 0
0 0

Tabelul 7.2.1.
Valoarea funcţiei cost total pentru soluţia iniţială găsită este

f = 3 · 45 + 2 · 5 + 3 · 10 + 2 · 20 + 3 · 5 + 2 · 35 = 300

Această metodă este foarte simplă dar puţin eficientă deoarece nu ţine cont de valorile
costurilor cij .

7.2.2 Metoda elementului minim


Metoda constă ı̂n a atribui, pe rând, valori variabilelor necunoscute, ı̂ncepând cu aceea
la care costul unitar cij este minim.
Apoi din cele rămase se lucrează tot cu aceea care corespunde costului minim. Dacă
sunt mai multe costuri minime egale, atunci se va considera mai ı̂ntâi acea variabilă care
poate lua valoarea mai mare. Valoarea variabilei se va afla ca şi la metoda Nord–Vest,
considerând minimul dintre disponibil şi necesar.
Exemplul 7.2.2. Utilizând metoda elementului minim să aflăm o soluţie iniţială pentru
problema de transport de la Exemplul 7.2.1.
Deoarece c13 = c14 = c24 = 1 este costul minim, mai ı̂ntâi vor determina valoarea
variabilei x14 ı̂ntrucât vom obţine valoarea maximă (x13 = 25; x14 = 35; x24 = 30). Aşadar,
luăm x14 = 35, ceea ce implică c24 = 0, x34 = 0. Apoi alegem x13 = 15 deoarece c13 = 1 este
costul minim din cele rămase. Avem x11 = x12 = 0. Considerând costurile egale cu 2 alegem
x21 = 30 şi x22 = x23 = 0. Acum luăm x32 = 15, x33 = 10 şi x31 = 15.
Ilustrarea intuitivă prin tabel este dată ı̂n Tabelul 7.2.2.
Valoarea lui f pentru această soluţie este

f = 1 · 15 + 1 · 35 + 2 · 30 + 4 · 15 + 2 · 15 + 3 · 10 =

= 50 + 60 + 60 + 60 = 230.
Di \ Cj C1 C2 C3 C4 Disponibil
3 2 1 1
D1 50; 15; 0
0 0 15 35
2 3 2 1
D2 30; 0
30 0 0 0
4 2 3 2
D3 40; 0
15 15 10 0
Necesar 45 15 25 35 120
15 0 10 0
0 0
Tabelul 7.2.2.

133
7.2.3 Metoda diferenţelor maxime
Valorile variabilelor se atribuie ca şi ı̂n cazul metodelor precedente, dar ordinea de
atribuire se face după o altă regulă. Pentru stabilirea ordinii de urmat se calculează, pentru
fiecare linie, respectiv pentru fiecare coloană, diferenţa dintre cele mai mici două elemente
(costuri). Apoi pe linia sau coloana cu diferenţa maximă se determină variabilele din căsuţa
cu cost minim. Apoi procedeul se repetă. La diferenţe maxime egale se consideră mai ı̂ntâi
costul minim.
La lucrul cu tabel diferenţele pe linii se trec ı̂n stânga tabelului, iar cele pe coloane
deasupra tabelului.
Exemplul 7.2.3. Să se afle o soluţie iniţială cu metoda diferenţelor maxime pentru problema
de transport din Exemplul 7.2.1.
Calculăm diferenţele pe linii şi coloane. Avem următorul tabel cu diferenţe
3 2 1 1 1
2 3 2 1 1
4 2 3 2 1
1 1 1 1
calculate astfel: 2 − 1 = 1 pentru linia ı̂ntâi, 2 − 1 = 1 pe linia a doua, 3 − 2 = 1 pentru linia a
treia, 3 − 2 = 1 pentru coloana ı̂ntâi, 3 − 2 = 1 pentru coloana a doua, 2 − 1 = 1 pentru coloana
a treia şi 2 − 1 = 1 pentru coloana a patra.
Se observă că avem toate diferenţele egale cu 1. Alegem x14 = 35 deoarece dă cea mai
mare repartizare pentru preţurile minime. Atunci x24 = x35 = 0.
Recalculăm diferenţele pe liniile şi coloanele rămase, obţinem tabelul
3 2 1 1
2 3 2 1
4 2 3 1
1 1 1
Toate diferenţele sunt egale. Ţinând seama de costul minim alegem x13 = 15 şi x11 =
x12 = 0.
Pentru liniile şi coloanele necompletate recalculăm diferenţele şi obţinem tabelul
2 3 2 1
4 2 3 1
2 1 1
Diferenţa maximă este 2 şi corespunde coloanei ı̂ntâi. Alegem x21 = 30 şi x22 = x23 = 0.
Acum, pe linia a treia luăm x31 = 15, x32 = 15 şi x33 = 10.
Sub formă de tabel calculele arată astfel:
Di \ Cj C1 C2 C3 C4 Disponibil
3 2 1 1
D1 50; 15; 0
0 0 15 35
2 3 2 1
D2 30; 0
30 0 0 0
4 2 3 2
D3 40
15 15 10 0
Necesar 45 15 25 35 120
15 10 0
Valoarea lui f pe această soluţie iniţială este
f = 1 · 15 + 1 · 35 + 2 · 30 + 4 · 15 + 2 · 15 + 3 · 10 = 230
Se observă că s-a obţinut aceeaşi soluţie iniţială ca şi la utilizarea metodei elementului
minim.

134
Observaţia 7.2.1 Toate cele trei soluţii iniţiale găsite pentru problema de transport din Ex-
emplul 7.2.1. sunt soluţii de bază nedegenerate, având 4 + 3 − 1 = 6 componente pozitive.

7.3 Ameliorarea (ı̂mbunătăţirea) unei soluţii


Pentru a elabora un mod de ameliorare a unei soluţii corespunzătoare unei probleme
de transport, adică de a trece de la o soluţie de bază la una mai bună, vom recurge la
problema duală.
Problema de transport are modelul matematic dat de (7.1), §7.1. Pentru a scrie duala
trebuie să introducem variabilele duale u1 , u2 , . . . , um , corespunzătoare primelor m restricţii,
şi v1 , v2 , . . . , vn corespunzătoare următoarelor n restricţii. Obţinem


⎪ u1 + v1 ≤ c11 , u1 + v2 ≤ c12 , . . . , u1 + vn ≤ c1n ,


⎨ u2 + v1 ≤ c21 , u2 + v2 ≤ c22 ..., u2 + vn ≤ c2n ,
(7.2) ... ... ... ...



⎪ u m + v 1 ≤ cm1 , u m + v 2 ≤ cm2 . . . , um + vn ≤ cmn ,

ui , i = 1, m, vj , j = 1, n, arbitrare

(max)g = a1 u1 + a2 u2 + . . . + am um + b1 v1 + b2 v2 + . . . + bn vn .
Teoremele de dualitate (v. Teoremele 5.6.1 şi 5.6.2) ne asigură că o soluţie X (0) =
(0)
(xij ) i=1,meste optimă dacă variabilele duale verifică restricţiile
j=1,n

(0) (0)
(7.3) ui + vj = cij , dacă xij = 0 (xij este necunoscuta principală)

(0) (0)
(7.4) ui + vj ≤ cij , dacă xij = 0 (xij este necunoscuta secundară)
numite condiţii de optimalitate pentru soluţia unei probleme de transport.
Fie X = (xij ) i=1,m o soluţie iniţială a problemei de transport.
j=1,n
Căsuţele din tabelul soluţiei cu xij = 0 le numim căsuţe ocupate, iar cele cu xij = 0 le
numim căsuţe libere.
Relaţiile (7.3) formează un sistem liniar de m+n−1 ecuaţii (corespunzătoare căsuţelor
ocupate) cu m + n necunoscute. Se observă că acest sistem este compatibil nedeterminat.
Pentru aflarea unei soluţii putem lua o necunoscută secundară egală cu 0, de obicei vom
alege u1 = 0.
Valorile găsite pentru u1 , u2 , . . . , um şi v1 , v2 , . . . , vn se trec pe marginea tabelului soluţie
ı̂n mod corespunzător (de aceea se mai numesc şi valori marginale), iar sumele ui + vj se
scriu ı̂n colţul din dreapta sus al căsuţelor ocupate, alături de coeficienţii cij , adică structura
unei astfel de căsuţe ocupate arată astfel

cij u i + vj
xij

Acum verificăm condiţiile de optimalitate (7.4) pentru căsuţele libere. Dacă toate
condiţiile (7.4) sunt ı̂ndeplinite, atunci soluţia iniţială este optimă. Dacă cel puţin o
condiţie (7.4) nu este verificată, atunci se trece la procesul de ameliorare (ı̂mbunătăţire) a
soluţiei.

Definiţia 7.3.1 Numim ciclu corespunzător unei căsuţe libere o succesiune de căsuţe ocu-
pate, două câte două alăturate pe aceeaşi linie, sau respectiv pe aceeaşi coloană, cu tre-
ceri alternative pe linii şi coloane, succesiunea ı̂ncepând imediat după căsuţa liberă şi ter-
minându-se ı̂n vecinătatea aceleiaşi căsuţe libere.
Într-un ciclu marcăm alternativ cu + şi − căsuţele, ı̂ncepând cu căsuţa liberă. Sem-
nele se trec ı̂n colţul din stânga jos al căsuţei.

135
Pentru ı̂mbunătăţirea soluţiei se determină valoarea minimă θ a valorii xij din căsuţele
marcate cu −. Apoi, valoarea minimă θ se adună la valorile xij din căsuţele marcate cu +
şi se scade din valorile xij din căsuţele marcate cu −.
Ciclul se alege pentru căsuţa liberă corespunzătoare diferenţei Δij = cij − (ui + vj ) cea
mai mare ı̂n valoare absolută dintre diferenţele Δij < 0.
Prin acest proces se obţine o nouă soluţie a problemei de transport, mai bună decât cea de
la care am plecat.

Exemplul 7.3.1. Să considerăm problema de transport din Exemplul 7.2.1 cu soluţia iniţială
din Tabelul 7.2.1, obţinută prin metoda colţului Nord–Vest.
Considerăm variabilele marginale u1 , u2 , u3 şi v1 , v2 , v3 , v4 . Sistemul (7.3) corespunzător
căsuţelor ocupate din Tabelul 7.2.1 este:

u1 + v1 = 3, u1 + v2 = 2, u2 + v2 = 3, u 2 + v3 = 2
(7.5)
u3 + v3 = 3, u3 + v4 = 2.

Alegând u1 = 0, găsim v1 = 3, v2 = 2, u2 = 1, v3 = 1, u3 = 2, v4 = 0.
Acum verificăm condiţiile de optimalitate (7.4) pentru căsuţele libere. Avem:

u1 + v3 = 1 = c13 ≥ 1; u1 + v4 = 0 ≤ c14 = 1; u2 + v1 = 4 > 2,


u2 + v4 = c24 ≤ 1; u3 + v1 = 5 > 4,
u3 + v2 = 4 > 2,

de unde observăm că pentru căsuţele libere (2, 1), (3, 1) şi (3, 2) nu sunt verificate condiţiile
de optimalitate. Prin urmare, soluţia iniţială din Tabelul 7.2.1 nu este optimă.
Calculele de mai sus se pot reprezenta ca ı̂n Tabelul 7.3.1.

vj v1 = 3 v2 = 2 v3 = 1 v4 = 0
ui Di \ Cj C1 C2 C3 C4 Disponibil
3 3 2 2 1 1 1 0
u1 = 0 D1 50
- 45 + 5 0 0
2 4 3 3 2 2 1 1
u2 = 1 D2 30
+ 0 - 10 20 0
4 5 2 4 3 3 2 2
u3 = 2 D3 40
0 0 5 35
Necesar 45 15 25 35

Tabelul 7.3.1.
Sistemul (7.5) se poate rezolva direct pe Tabelul 7.3.1, plecând de la u1 + v1 = 3 şi
u1 = 0.
Acum stabilim căsuţa liberă pentru care considerăm ciclul. În acest scop calculăm
diferenţele Δij pentru căsuţele libere ı̂n care nu au fost ı̂ndeplinite condiţiile de optimalitate:

Δ21 = −2, Δ31 = −1 şi Δ22 = −2.

Cum max(| − 2|, | − 1|, | − 2|) = 2 este atins pentru două căsuţe libere (2, 1) şi (2, 2), vom
alege unul din ciclurile determinate de ele. De exemplu, să ne fixăm pe cel determinat de
căsuţa (2, 1).
Acesta este dat de căsuţele (2, 1), (1, 1), (1, 2) şi (2, 2). Marcăm alternativ căsuţele
ciclului cu + şi −, ı̂ncepând cu cea liberă. Numărul θ este dat de

θ = min{45, 10} = 10.

136
Adunăm θ la xij din căsuţele cu + şi scădem acelaşi număr la cele marcate cu −.
Obţinem noua soluţie dată de Tabelul 7.3.2.

Di \ Cj C1 C2 C3 C4 Disponibil
3 2 1 1
D1 50
35 15 0 0
2 3 2 1
D2 30
10 0 20 0
4 2 3 2
D3 40
0 0 5 35
Necesar 45 15 25 25

Tabelul 7.3.2
Valoarea funcţiei cost total pentru noua soluţie (din Tabelul 7.3.2) este

f = 3 · 35 + 2 · 15 + 2 · 10 + 2 · 20 + 3 · 5 + 2 · 35 = 280

7.4 Aflarea unei soluţii optime


În paragrafele precedente am văzut cum se află o soluţie iniţială şi cum poate ea
fi ameliorată (ı̂mbunătăţită). Acum putem prezenta un algoritm pentru aflarea soluţiei
optime pentru o problemă de transport. Acesta poartă numele de algoritmul distributiv
sau algoritmul potenţialelor.
Paşii algoritmului sunt:
Pasul 1. Se determină o soluţie iniţială a problemei de transport;
Pasul 2. Se găsesc valorile marginale ui , i = 1, m şi vj , j = 1, n, ca soluţii ale sistemului de
ecuaţii ui + vj = cij , unde i şi j sunt indicii căsuţelor ocupate;
Pasul 3. Se verifică condiţiile de optimalitate a soluţiei găsite, adică dacă au loc inegalităţile
ui + vj ≤ cij pentru toţi indicii (i, j) de căsuţe libere;
Pasul 4. Dacă soluţia nu este optimă, adică cel puţin o condiţie de optimalitate nu este
ı̂ndeplinită, atunci se calculează diferenţele Δij = cij − (ui + vj ) < 0 corespunzătoare căsuţelor
libere pentru care condiţia de optimalitate nu este verificată. Cea mai mare diferenţă Δij ı̂n
valoare absolută determină căsuţa liberă (i, j) pentru care alegem ciclul folosit ı̂n ameliorarea
soluţiei.
Pasul 5. Se marchează alternativ cu + şi − căsuţele ciclului, ı̂ncepând cu căsuţa liberă.
Pasul 6. Se determină valoarea minimă θ a valorilor xij din căsuţele ciclului marcate cu −.
Pasul 7. Valoarea minimă θ se adună la valorile xij din căsuţele marcate cu + şi se scade
din valorile xij din căsuţele marcate cu −. Se obţine astfel o nouă soluţie pentru problema
de transport.
Pasul 8. Se reiau paşii 2–7 cu noua soluţie şi se continuă repetarea lor până când toate
condiţiile de optimalitate sunt ı̂ndeplinite, adică s-a obţinut o soluţie optimă.
Pasul 9. Se scrie soluţia optimă şi se calculează valoarea minimă a funcţiei obiectiv (scop).
Exemplul 7.4.1. Să rezolvăm problema de transport din Exemplul 7.2.1.
Vom porni de la soluţia iniţială obţinută prin metoda elementului minim (vezi Tabelul
7.2.2). Vom parcurge calculele algoritmului direct pe tabel.

137
Avem
vj v1 = 2 v2 = 0 v3 = 1 v4 = 1
ui Di \ Cj C1 C2 C3 C4 Disponibil
3 2 2 0 1 1
u1 = 0 D1 50
0 0 + 15 - 35
2 3 0 2 1 1 1
u2 = 0 D2 30
30 0 0 0
4 2 3 2 3
u3 = 2 D3 40
15 15 - 10 + 0
Necesar 45 15 25 35

Tabelul 7.4.1.
şi ı̂ntrucât u3 + v4 = 3 > 2 = c34 , deducem că soluţia nu este optimă. Avem o singură căsuţă
liberă cu Δij < 0 şi anume căsuţa (3, 4). Formăm ciclul determinat de ea prin căsuţele (3, 4),
(3, 3), (1, 3) şi (1, 4). Marcăm alternativ cu + şi − căsuţele ciclului. Valoarea minimă θ este
dată de θ = min{10, 35} = 10. Se obţine astfel o nouă soluţie reprezentată ı̂n Tabelul 7.4.2

vj v1 = 3 v2 = 1 v3 = 1 v4 = 1
ui Di \ Cj C1 C2 C3 C4 Disponibil
3 3 2 1 1 1
u1 = 0 D1 50
+ 0 0 25 - 25
2 3 0 2 0 1 0
u2 = −1 D2 30
30 0 0 0
4 2 3 2 2
u3 = 1 D3 40
- 15 15 0 + 10
Necesar 45 15 25 35

Tabelul 7.4.2.
Reluăm calculul valorilor marginale şi verificarea condiţiilor de optimalitate pentru
noua soluţie. Lucrăm pe Tabelul 7.4.2.
Se observă că soluţia obţinută ı̂n tabelul 7.4.2. este optimă deoarece ui + vj ≤ cij
pentru toate căsuţele libere.
Deci, o soluţie optimă a problemei de transport 7.2.1 este
⎛ ⎞
0 0 25 25
X1 = ⎝ 30 0 0 0 ⎠
15 15 0 10

iar min f = 1 · 25 + 1 · 25 + 2 · 30 + 4 · 15 + 2 · 15 + 2 · 10 = 220.

Observaţia 7.4.1 Este posibil ca soluţia optimă a uni probleme de transport să nu fie unică,
adică să aibă soluţii multiple. Vom avea soluţii multiple atunci când există mai multe
căsuţe la care ui + vj = cij , adică condiţia de optimalitate este ı̂ndeplinită cu egalitate.
Celelalte soluţii optime, când există, se obţin aplicând procedeul ameliorării soluţiilor
pentru căsuţele la care ui + vj = cij . Soluţia generală se va scrie ca o combinaţie liniară
convexă a soluţiilor optime găsite.

În cazul exemplului nostru, se observă că ı̂n tabelul 7.4.2 avem căsuţa (1, 1) pentru
care u1 + v1 = 3 = c11 = 3. Formăm ciclul (1, 1), (1, 4), (3, 4) şi (3, 3). Marcăm cu + şi − căsuţele
ciclului.
Valoarea minimă θ este dată de

θ = min{15, 25} = 15

138
Obţinem o nouă soluţie optimă dată prin
⎛ ⎞
15 0 25 10
X2 = ⎝ 30 0 0 0 ⎠
0 15 0 25

Soluţia generală este


⎛ ⎞
15β 0 25α + 25β 25α + 10β
X = αX1 + βX2 = ⎝ 30α + 30β 0 0 0 ⎠
15α 15α + 15β 0 10α + 25β

unde α ≥ 0, β ≥ 0, α + β = 1.

7.5 Degenerarea ı̂n problemele de transport


Am văzut (§7.1) că soluţia unei probleme de transport este degenerată dacă are mai
puţin de m + n − 1 valori nenule (căsuţe ocupate). Degenerarea ı̂n problemele de transport
apare ı̂n următoarele situaţii: a) când soluţia iniţială este degenerată, situaţie posibilă dacă
valoarea disponibilului este egală cu valoarea necesarului, pentru o anumită linie şi coloană;
b) la ı̂mbunătăţirea unei soluţii, când valoarea minimă din căsuţele ciclului marcate cu −
este atinsă ı̂n cel puţin două cazuri.
În ambele situaţii se obţin mai puţine căsuţe ocupate, având mai puţine ecuaţii decât
m + n − 1. Rezultă că variabilele duale (marginale) nu pot fi determinate.
Pentru ı̂nlăturarea acestui inconvenient se foloseşte metoda zerourilor esenţiale.
Acesta constă ı̂n tranformarea unor căsuţe libere ı̂n căsuţe ocupate cu un 0∗ , numit zero
esenţial. Acest 0∗ se pune ı̂n căsuţele libere cu costuri minime, care nu formează cicluri cu
căsuţele deja ocupate. În final, trebuie ca numărul total al căsuţelor ocupate să fie m + n − 1.
În situaţia b) zerourile esenţiale se ı̂nscriu ı̂n căsuţe care se eliberează şi ı̂n care cos-
turile sunt mai mici.
Exemplul 7.5.1. Trei ı̂ntreprinderi I1 , I2 şi I3 produc patru tipuri de produse P1 , P2 , P3 şi
P4 cu cheltuielile unitare de producţie diferite. Cheltuielile pentru producerea unei unităţi
din fiecare tip de produs, de către fiecare ı̂ntreprindere, sunt date ı̂n tabelul 7.5.1.

Ii \ Pi P1 P2 P3 P4
I1 4 3 2 3
I2 2 4 5 2
I3 2 4 4 5

Tabelul 7.5.1.
Cele trei ı̂ntreprinderi au capacităţi egale de producţie, fiecare putând produce cel
mult 40 de unităţi din cele patru produse luate la un loc. Cantităţile necesare din cele
patru produse sunt egale cu 40, 30, 50 şi 40 unităţi.

i) Să se determine un plan de producţie comun pentru cele trei ı̂ntreprinderi astfel ı̂ncât
să se asigurea ı̂ntr-o măsură cât mai mare cantităţile necesare din cele patru produse,
cu cheltuieli totale de producţie minime.

ii) Să se interpreteze din punct de vedere economic soluţia optimă obţinută.

iii) Este unică soluţia optimă?

i) Se observă că avem o problemă de transport deoarece putem considera cele patru
tipuri de produse ca patru centre consumatoare, iar cele trei ı̂ntreprinderi ca trei centre de

139
depozitare. Obţinem astfel problema de transport din Tabelul 7.5.2.

Ii \ Pj P1 P2 P3 P4 Disponibil
4 3 2 3
I1 40
2 4 5 2
I2 40
2 4 4 5
I3 40
120
Necesar 40 30 50 40
160

Tabelul 7.5.2
Deoarece modelul este neechilibrat, totalul de necesar este mai mare decât totalul de
disponibil, vom introduce un centru fictiv de producţie I4 , care să ”producă” diferenţa de
40 unităţi. Pentru acest centru fictiv costurile unitare sunt nule. Modelul problemei de
rezolvat ia forma din Tabelul 7.5.3.
Ii \ Pj P1 P2 P3 P4 Disponibil
4 3 2 3
I1 40
2 4 5 2
I2 40
2 4 4 5
I3 40
0 0 0 0
I4 40
Necesar 40 30 50 40 160

Tabelul 7.5.3.
Aplicăm metoda elementului minim şi găsim soluţia iniţială din Tabelul 7.5.4.

vj v1 = 0 v2 = 2 v3 = 2 v4 = 0
ui Ii \ Pj P1 P2 P3 P4 Disponibil
4 0 3 2 2 3 0
u1 = 0 I1 40; 0
0 0 40 0
2 4 2 5 4 2
u2 = 2 I2 40
0∗ 0 0 40
2 4 4 5 2
u3 = 2 I3 40
+ 0∗ - 30 10 0
0 0 2 0 2 0 0
u4 = 0 I4 40; 0
- 40 + 0 0 0
Necesar 40 30 50 40 160

Tabelul 7.5.4.
Soluţia determinată este degenerată. Introducem 0∗ (esenţial) la căsuţele (2, 1) şi (3, 1).
Determinăm valorile duale (marginale) trecute pe marginea Tabelului 7.5.4. Formăm ciclul
(4, 2), (4, 1), (3, 1) şi (3, 2) care se marchează cu + şi − ca ı̂n Tabelul 7.5.4.

140
Cu θ = min{30, 40} = 30, obţinem soluţia ı̂mbunătăţită din Tabelul 7.5.5.
vj v1 = 0 v2 = 2 v3 = 2 v4 = 0
ui Ii \ Pj P1 P2 P3 P4 Disponibil
4 0 3 0 2 3 0
u1 = 0 I1 40
0 0 40 0
2 4 2 5 4 2
u2 = 2 I2 40
0∗ 0 0 40
2 4 2 4 5 2
u3 = 2 I3 40
+ 30 0 - 10 0
0 0 0 2 0 0
u4 = 0 I4 40
- 10 30 + 0 0
Necesar 40 30 50 40
Tabelul 7.5.5.
Pentru soluţia din Tabelul 7.5.5 determinăm valorile marginale. Considerăm ciclul
(4, 3), (4, 1), (3, 1) şi (3, 3), marcat cu + şi − ca ı̂n Tabelul 7.5.5. Cu θ = min{10, 10} = 10, găsim
soluţia din Tabelul 7.5.6.
vj v1 = 2 v2 = 2 v3 = 2 v4 = 2
ui Ii \ Pj P1 P2 P3 P4 Disponibil
4 0 3 2 2 3 0
u1 = 0 I1 40
0 0 40 0
2 4 2 5 2 2
u2 = 0 I2 40
0∗ 0 0 40
2 4 2 4 2 5 2
u3 = 0 I3 40
40 0 0 0
0 0 0 0 0 0
u4 = −2 I4 40
0 30 10 0
Necesar 40 30 50 40
Tabelul 7.5.6.
Reluând procesul de ameliorare a unei soluţii pentru cea din Tabelul 7.5.6. se constată
că sunt ı̂ndeplinite toate condiţiile de optimizare. Prin urmare, soluţia găsită
⎛ ⎞
0 0 40 0
X = ⎝ 0 0 0 40 ⎠
40 0 0 0
este optimă, iar min f = 2 · 40 + 2 · 40 + 2 · 40 = 240.
ii) Soluţia optimă găsită ne arată că fiecare ı̂ntreprindere trebuie să producă numai
un tip de produs: ı̂ntreprinderea I1 să producă P3 , ı̂ntreprinderea I2 să producă P4 , iar
ı̂ntreprinderea I3 să producă P1 . Cele trei ı̂ntreprinderi ı̂şi folosesc la maxim capacităţile de
producţie. Cu toate acestea, necesarul de produs P2 nu este satisfăcut complet (mai trebuie
30 de unităţi), precum şi 10 unităţi din produsul P3 . Cheltuielile minime de producţie totale
sunt egale cu 240 unităţi monetare.
iii) În Tabelul 7.5.6 pentru căsuţele (4, 1) şi (4, 4) avem u1 + v1 = 0 = c41 şi respectiv
u4 + v4 = 0 = c44 . Deoarece nu avem cicluri plecând de la aceste căsuţe libere, rezultă că nu
mai obţinem o nouă soluţie optimă. Rezultă că problema are o singură soluţie optimă, cea
găsită mai sus.

7.6 Probleme de transport cu capacităţi limitate


Sunt situaţii ı̂n care ı̂ntr-o problemă de transport pe unele rute avem capacităţi limi-
tate. Notăm cu dij capacitatea maximă ce poate fi transportată pe ruta ce leagă depozitul

141
Di de centrul de consum Cj .
Dacă păstrăm notaţiile din §7.1., atunci modelul matematic al acestei probleme, nu-
mită problemă de transport cu capacităţi limitate, este
⎧ n




⎪ xij = ai , i = 1, m




j=1


x = b , j = 1, n
m

ij j

⎪ i=1

⎪ 0 ≤ xij ≤ dij , i = 1, m, j = 1, n




m
n



⎩ (min)f = cij xij
i=1 j=1

sau sub formă de tabel


Di \ Cj C1 C2 ... Cn Disponibil
c11 c12 c1n
D1 ... a1
d11 x11 d12 x12 d1n x1n
c21 c22 c2n
D2 ... a2
d21 x21 d22 x22 d2n x2n
... ... ... ... ... ...
cm1 cm2 cmn
Dn ... am
dm1 xm1 dm2 xm2 dmn xmn

m
ai
i=1
Necesar b1 b2 ... bn

n
bi
i=1

Tabelul 7.6.1.

Observaţia 7.6.1 Din condiţiile de limitare a capacităţilor rezultă că este necesar ca pe
fiecare linie, respectiv coloană, să fie verificate inegalităţile:

n
dij ≥ ai , i = 1, m
j=1

respectiv

m
dij ≥ bj , j = 1, n
i=1

Metoda de rezolvare a unei probleme de transport cu capacităţi limitate este aproape


identică cu cea a unei probleme de transport fără limite de capacitate.
La determinarea unei soluţii iniţiale valoarea variabilei din căsuţa ce se ocupă se
află acum ca minimul dintre disponibilul necesar şi capacitatea corespunzătoare varabilei
respective. Când acest minim este egal cu capacitatea respectivă, valoarea se va sublinia,
ceea ce ı̂nseamnă că pe linia, respectiv coloana căsuţei restul variabilelor nu se vor lua
automat egale cu zero. Aceasta ı̂nseamnă că, ı̂n general, vor fi ocupate mai mult decât
m + n − 1 căsuţe. Se vor considera un număr de m + n − 1 variabile nebarate.
Trecând la problema duală, se găsesc următoarele condiţii, de optimalitate pentru
probleme de transport cu capacităţi limitate:

1) ui + vj ≤ cij , pentru căsuţele libere (i, j);

2) ui + vj ≥ cij , pentru căsuţele (i, j) cu valori subliniate;

142
unde ui , i = 1, m şi vj , j = 1, n sunt variabilele duale ui şi vj , date de sistemul
ui + vj = cij
unde (i, j) este indice de căsuţă ocupată (corespunzătoare la variabila de bază).
La determinarea unei soluţii iniţiale, din cauza capacităţilor limitate, sunt situaţii ı̂n
care nu se pot repartiza ı̂n căsuţe tot disponibilul şi tot necesarul.
Pentru a nu ajunge la o astfel de situaţie, se recomandă următorul procedeu de
ocupare a căsuţelor: a) pe linia (sau coloana) costului minim se ocupă căsuţele ı̂n ordine
crescătoare a costurilor; b) se procedează analog pe coloana (linia) ultimei căsuţe ocupate
din linia (coloana) de la a); c) se continuă ı̂n mod analog, alternativ, până la epuizarea
disponibilului şi necesarului.
Exemplul 7.6.1. Să se rezolve problema de transport cu capacităţi limitate:


⎪ x11 + x12 + x13 + x14 = 150



⎪ x21 + x22 + x23 + x24 = 250



⎪ x31 + x32 + x33 + x34 = 210



⎪ x11 + x21 + x31 = 100


⎨ x11 + x21 + x32 = 160
x11 + x23 + x33 = 190



⎪ x11 + x24 + x34 = 160



⎪ xij ≥ 0, i = 1, 2, 3 şi j = 1, 2, 3, 4



⎪ x12 ≤ 80, x23 ≤ 170, x31 ≤ 80, x32 ≤ 120



⎪ (min)f = 3x11 + 12x12 + 5x13 + 9x14 + 2x21 + 13x22 +

+5x23 + 6x24 + x31 + 7x32 + 8x33 + 18x34 .
Vom determina o soluţie iniţială folosind metoda elementului minim. Obţinem astfel
Tabelul 7.6.2.
v1 = 2 v2 = 13 v3 = 5 v4 = 6 Disponibil
3 2 12 13 5 9 6
u1 = 0 150; 0
0 80 0 150 0
2 13 5 6
u2 = 0 250; 220; 200; 40; 0
20 40 30 160
1 80 7 8 18 9
u3 = 3 210; 120; 10
80 120 120 10 0
Necesar 100 160 190 160 610
20 40 180 0
0 0 30
0
Tabelul 7.6.2.
Se observă că pentru soluţia iniţială avem 3 + 4 − 1 = 6 variabile de bază (core-
spunzătoare la căsuţe ocupate cu valori nesubliniate).
Aşadar, putem trece la verificarea optimalităţii. Calculăm valorile duale (marginale)
şi observăm că soluţia nu este optimă deoarece pentru căsuţa liberă (1, 2) avem u1 + v2 =
13 > c12 = 12. Ciclul corespunzător acestei căsuţe este (1, 2), (1, 3), (2, 3) şi (2, 2).
Marcăm cu + şi −. Valoarea minimă θ = min{40, 150} = 40 ne permite să scriem soluţia
ı̂mbunătăţită dată ı̂n Tabelul 7.6.3.
v1 = 2 v2 = 12 v3 = 5 v4 = 6 Disponibil
3 2 12 5 9 6
u1 = 0 150
0 80 40 110 0
2 13 12 5 6
u2 = 0 250
20 0 170 70 160
1 5 7 15 8 18 9
u3 = 3 210
80 80 120 120 10 0
Necesar 100 160 190 160 610

143
Tabelul 7.6.3.
Se observă că noua soluţie găsită este optimală deoarece pentru toate căsuţele libere
avem ui + vj ≤ cij , iar pentru căsuţele ocupate cu valori subliniate avem ui + vj ≥ cij . Avem
⎛ ⎞
0 40 110 0
X = ⎝ 20 0 70 160 ⎠
80 120 10 0
cu
min f = 12 · 40 + 5 · 110 + 2 · 20 + 5 · 70 + 6 · 160 + 1 · 180 + 7 · 120 + 8 · 10 = 3380

Observaţia 7.6.2 În procesul de ı̂mbunătăţire a unei soluţii putem avea situaţia ı̂n care
ui +vj ≤ cij pentru toate căsuţele libere şi să existe o căsuţă ocupată (r, s) cu valoare subliniată
pentru care ur + vs < crs . În acest caz se continuă procesul de ı̂mbunătăţire formând un
ciclu cu vârf negativ ı̂n căsuţa (r, s) (ocupată cu valoarea subliniată).

144
7.7 Testul Nr. 6 de verificare a cunoştinţelor

1. Precizaţi noţiunea de problemă de transport.


2. Precizaţi etapele generale ale rezolvării unei probleme de transport.
3. a) Precizaţi metoda colţiului Nord-Vest pentru determinarea unei soluţii iniţiale a
unei probleme de transport;
b) Precizaţi metoda elementului maxim pentru determinarea unei soluţii iniţiale a
unei probleme de transport;
c) Prezentaţi metoda diferenţelor maxime pentru determinarea unei soluţii iniţiale
a unei probleme de transport.
4. a) În ce constă ı̂mbunătăţirea unei soluţii a unei probleme de transport?
b) precizaţi algoritmul distributiv (algoritmul potenţialelor) pentru determinarea
soluţiei optime a unei probleme de transport.
5. Se consideră doi furnizori F1 şi F2 , care au cantităţile disponibile a1 = 40 unităţi şi res-
pectiv a2 = 25 unităţi. Acestea sunt solicitate de trei beneficiari B1 , B2 , B3 ı̂n cantităţile
b1 = 10 unităţi, b2 = 35 unităţi şi b3 = 20 unităţi. Cunoscând costurile unitare de trans-
port c11 = 4, c12 = 2, c13 = 1, respectiv c21 = 2, c22 = 1, c23 = 3 unităţi monetare, să se
scrie modelul matematic şi să se determine o soluţie iniţială a problemei de transport
considerate.
6. Considerând problema de transport prezentată ı̂n enunţul problemei precedente (in-
clusiv soluţia iniţială determinată) să se găsească valorile marginale şi să se verifice
condiţiile de optimalitate.
7. Considerând probleme de transport prezentate ı̂n enunţul problemei 8, să se determine
o soluţie iniţială folosind metoda colţului nord-vest, iar apoi să se utilizeze algoritmul
distributiv pentru ı̂mbunătăţirea acesteia şi rezolvarea completă a problemei respec-
tive.
8. Să se rezolve problema de transport:


⎪ x11 + x12 + x13 = 10



⎪ x21 + x22 + x23 = 20



⎪ x31 + x32 + x33 = 30

x11 + x21 + x31 = 50

⎪ x12 + x22 + x32 = 5



⎪ x13 + x23 + x33 = 5



⎪ xij ≥ 0 , i = 1, 3 , j = 1, 3

f = 4x11 + 3x12 + x13 + 2x21 + 4x22 + 5x23 + x31 + 2x32 + 6x33 → minim

9. Presupunând că la un moment dat ı̂n timpul rezolvării unei probleme de transport s-a
ajuns la tabelul (situaţie):

4 4 2 2 1 4
10 20 0
2 3 1 1 3 3
0 2 20

Să se analizeze situaţia dată, apoi să se ı̂ncerce formarea ciclului căsuţei (1, 3). Să se
rezolve situaţia de degenerare apărută.

145
10. Să se rezolve problema de transport:


⎪ x11 + x12 + x13 = 11



⎪ x 21 + x22 + x23 + x24 = 17



⎪ x 31 + x32 + x33 + x34 = 14


⎨ 11 + x21 + x31 = 5
x
x12 + x22 + x32 = 15



⎪ x13 + x23 + x33 = 7



⎪ x14 + x24 + x34 = 15



⎪ xij ≥ 0 , i = 1, 3 , j = 1, 4

f = 4x11 + 2x12 + 5x13 + x14 + 6x21 + 5x22 + 4x23 + 4x24 + 6x31 + 8x32 + x33 + 5x34 → minim

146
Indicaţii şi răspunsuri

Testul 6

5. Notând cu xij cantitatea ce se va transporta de la furnizorul Fi (i = 1, 2) la beneficiarul


Bj (j = 1, 3) se obţine modelul matematic:


⎪ x12 + x12 + x13 = 40



⎪ x21 + x22 + x23 = 25


⎨ x11 + x21 = 10
x12 + x22 = 35



⎪ x13 + x23 = 20



⎪ xij ≥ 0 , i = 1, 2 , j = 1, 3

f = 4x11 + 2x12 + x13 + 2x21 + x22 + 3x23 → min
Apoi folosind metoda diferenţelor maxime obţinem soluţia iniţială: x11 = 0, x12 = 20,
x13 = 20, x21 = 10, x22 = 15, x23 = 0 şi f = 95.
6. Se obţine:
v1 = 3 v2 = 2 v3 = 1
4 3 2 2 1 1
u1 = 0
0 20 20
2 2 1 1 3 0
u2 = −1
10 15 0
 
0 20 20
deci toate condiţiile de optimizare sunt verificate şi astfel soluţia X =
10 15 0
cu f = 95 este optimă.
7. Se obţine soluţia iniţială:
4 2 1
10 30 0
2 1 3
0 5 20
Folosind valorile marginale se deduce că soluţia nu este  optimă. Aplicând
 mai departe
0 20 20
algoritmul distributiv se obţine soluţia optimă X = cu fmin = 95.
10 15 0
⎛ ⎞
0 5 5
8. Folosind metoda diferenţelor maxime se obţine soluţia iniţială X = ⎝ 20 0 0 ⎠. La
30 0 0
aplicarea algoritmului distributiv se ajunge la degenerare şi se va introduce un zero
esenţial. În final se deduce că soluţia iniţială va fi optimă şi se calculează lmin = 90.
9. Se rezolvă situaţia de degenerare prin introducerea unui zero esenţial ı̂n căsuţa (1, 2).
⎛ ⎞
0 0 0 11
10. Folosind metoda diferenţelor maxime se obţine soluţia iniţială X 0 = ⎝ 0 15 0 2 ⎠
5 0 7 2
cu f = 141. Aceasta va fi optimă, dar ı̂n căsuţa liberă (1, 2) avem condiţia de optima-
litate verificată cu egalitate. Formând ciclul căsuţei respective
⎛ şi verificând
⎞ şi condiţia
0 11 0 0
de optimalitate se deduce o nouă soluţie optimă: X 1 = ⎝ 0 4 0 13 ⎠ cu fmin = 141.
5 0 7 2
Deci avem soluţia generală X = α · X 0 + β · X 1 cu α, β ∈ [0, 1] şi α + β = 1.

147
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul I,
Editura ULB, Sibiu, 2001.

148
Capitolul 8

Şiruri

Obiective: Recapitularea şi completarea noţiunilor despre şiruri de numere reale,


cunoscute din ı̂nvăţământul preuniversitar, urmate de introducerea şi studiul şirurilor ı̂n
spaţii metrice.
Rezumat: Prezentul capitol ı̂ncepe cu reluarea cunoştinţelor esenţiale despre şiruri
de numere reale. Se continuă cu studiul şirurilor pe spaţii metrice, cu particularizări ı̂n
spaţiile Rm , m ≥ 1 şi principiul contracţiei.
Conţinutul capitolului:
1. Şiruri de numere reale
2. Şiruri ı̂n spaţii metrice
3. Test de verificare a cunoştinţelor
4. Bibliografia aferentă capitolului
Cuvinte cheie: şir de numere reale, şir monoton, şir mărginit, limită, şir fun-
damental, dobândă compusă, şir de puncte ı̂ntr-un spaţiu metric, spaţiu metric complet,
contracţie, principiul contracţiei.

8.1 Şiruri de numere reale


Acest paragraf este consacrat recapitulării noţiunilor principale despre şiruri de nu-
mere reale şi completării lor cu câteva noţiuni şi rezultate necesare ı̂n expunerile ulterioare.

Definiţia 8.1.1 Se numeşte şir de numere reale sau şir numeric o funcţie f : Np → R, unde
Np = {p, p + 1, p + 2, . . .}, p fiind un număr natural.

Scriind f (n) = an , şirul se notează prin (an )n≥p sau {an }n≥p . În mod uzual se ia p = 1
sau, uneori, p = 0. Pentru comoditate, fără a restrânge generalitatea, vom considera şirurile
(an )n≥1 , scriind simplu (an ); an se va numi termenul general al şirului.
Un şir poate fi dat prin termenul general, enumerând termenii şirului sau printr-o
formulă de recurenţă.

Definiţia 8.1.2 Un şir de numere reale (an ) este mărginit superior (majorat) dacă mulţimea
termenilor săi este majorată.

Altfel spus, şirul numeric (an ) este majorat dacă există numărul real β aşa ı̂ncât an ≤ β,
n = 1, 2, 3, . . ..

Definiţia 8.1.3 Un şir de numere reale (an ) este mărginit inferior (minorat) dacă mulţimea
termenilor săi este minorată.

Cu alte cuvinte, şirul numeric (an ) este minorat dacă există numărul real aşa ı̂ncât
α ≤ an , n = 1, 2, 3, . . ..

149
Definiţia 8.1.4 Spunem că şirul numeric (an ) este mărginit dacă simultan este majorat şi
minorat, adică dacă există numerele reale α şi β aşa ı̂ncât α ≤ an ≤ β, n = 1, 2, 3, . . ..
Deoarece orice interval [α, β] este inclus ı̂ntr-un interval simetric faţă de 0 de forma
[−M, M ], cu M > 0, putem afirma că şirul (an ) este mărginit dacă şi numai dacă există un
număr real M > 0 aşa ı̂ncât să avem

|an | ≤ M, n = 1, 2, 3, . . . .

Definiţia 8.1.5 Şirul numerelor (an ) este nemărginit dacă nu este mărginit, adică dacă ı̂n
afara oricărui interval mărginit există cel puţin un termen al şirului.
Exemple:
8.1.1 Şirul an = 2 + (−1)n este mărginit deoarece |an | ≤ 3, (∀)n ∈ N.
8.1.2 Şirul an = 3n nu este mărginit superior dar este mărginit inferior (an ≥ 1, (∀)n ∈ N ).
8.1.3 Şirul an = −3n nu este minorat, dar este majorat (an < 0, (∀)n ∈ N).
8.1.4 Şirul an = (−1)n · 2n nu este nici minorat şi nici majorat.

Definiţia 8.1.6 Şirul (an ) este crescător (strict crescător) dacă an ≤ an+1 , (respectiv an <
an+1 ) pentru orice n ∈ N∗ .

Definiţia 8.1.7 Şirul (an ) este descrescător (strict descrescător) dacă an+1 ≤ an (respectiv
an+1 < an ) pentru orice n ∈ N∗ .

Un şir crescător sau descrescător se numeşte şir monoton, iar un şir strict crescător
sau strict descrescător se numeşte şir strict monoton.
Exemple:
2n − 1
8.1.5 Şirul an = este strict crescător.
n
2n + 1
8.1.6 Şirul an = este strict descrescător.
n
8.1.7 Şirul an = 2 + (−1)n nu este monoton.

Definiţia 8.1.8 Fie (an ) un şir de numere reale, iar (nk ) un şir strict crescător de numere
naturale. Şirul yk = ank , k ∈ N, se numeşte subşir al şirului (an ).

Definiţia 8.1.9 Şirul numeric (an ) are limita l ∈ R dacă pentru orice număr real ε > 0, există
un număr natural nε astfel ı̂ncât să avem |an − l| < ε, pentru orice n natural, n > nε .

Dacă şirul (an ) are limita l se scrie lim an = l sau an → l pentru n → ∞ şi se mai spune
n→∞
că (an ) este convergent la l.
Geometric, faptul că (an ) converge la l ı̂nseamnă că ı̂n afara intervalului
V (l, ε) = (l − ε, l + ε) (numit vecinătate de centru l şi rază ε) se află un număr finit
de termeni, a1 , a2 , . . . , anε , iar interiorul lui V (l, ε) se află o infinitate de termeni ai şirului
(fig.8.1.1).

Fig.8.1.1.

150
Rezultă că orice şir numeric convergent este mărginit.

Definiţia 8.1.10 Şirul numeric (an ) are limita +∞ dacă pentru orice număr real pozitiv E,
există nE ∈ N aşa ı̂ncât an > E, pentru orrice n natural, n > nE .

Dacă şirul (an ) are limita +∞ ı̂nseamnă că ı̂n afara intervalului V (∞) = (E, ∞) (numit
vecinătate a lui +∞) se află un număr finit de termeni a1 , a2 , . . . , anE (fig.8.1.2).

Fig.8.1.2.

Definiţia 8.1.11 Şirul numeric (an ) are limita −∞ dacă pentru orice număr real negativ E,
există nE ∈ N aşa ı̂ncât an < E, pentru orice n natural, n > nE .

Dacă şirul an are limită −∞ se scrie lim an = −∞ sau an → −∞ pentru n → ∞.


n→∞
Geometric, faptul că şirul (an ) are limita −∞ ı̂nseamnă că ı̂n afara intervalului
V (−∞) = (−∞, E) (numit vecinătate a lui −∞) se află un număr finit de termeni ai şirului:
a1 , a2 , . . . , anE (fig.8.1.3).

Fig.8.1.3.
Dacă un şir de numere reale are limita +∞ sau −∞ se mai zice că are limită infinită.
Un şir de numere reale care are limită infinită sau nu are limită se spune că este divergent.

Propoziţia 8.1.1 Dacă un şir de numere reale are limită, finită sau infinită, atunci ea este
unică.

Veridicitatea acestei propoziţii rezultă prin reducere la absurd şi folosind definiţia
limitei unui şir.

Teorema 8.1.1 Dacă (an ) şi (bn ) sunt şiruri de numere reale astfel ı̂ncât lim an = l1 ,
n→∞
lim bn = l2 , l1 şi l2 finite sau infinite, iar an ≤ bn pentru n natural, n ≥ n0 , atunci l1 ≤ l2 .
n→∞

Demonstraţie. Vom demonstra numai ı̂n cazul l1 şi l2 finite. În celelalte situaţii demonstraţia
este analoagă.
Presupunem că l1 > l2 . Putem alege ε > 0 aşa ı̂ncât l1 − ε > l2 + ε > l2 . Atunci
există n1ε ∈ N aşa ı̂ncât dacă n > n1ε să avem |an − l1 | < ε adică ε < an − l1 < ε, de unde
an > l1 − ε > l2 + ε. Din lim bn = l2 rezultă că există n2ε să avem |bn − l2 | < ε, de unde
n→∞
bn < l2 + ε. Acum, deducem că pentru n > max{n0 , n1ε , n2ε } are loc inegalitatea an > bn , ceea
ce contrazice ipoteza. Aşadar, l1 ≤ l2 .
Utilizând această teoremă, se deduce valabilitatea următoarelor criterii de comparaţie,
utile ı̂n aflarea limitelor de şiruri.

Propoziţia 8.1.2 (Criteriul majorării pentru limită finită). Dacă pentru şirul de numere
reale (an ) există un număr real l şi un şir numeric (bn ), cu lim bn = 0, astfel ı̂ncât |an −l| ≤ bn ,
n→∞
atunci lim an = l.
n→∞

151
Observaţia 8.1.1 În practică, cea mai ı̂ntâlnită situaţie este an = xn yn , cu (xn ) şir mărginit
şi (yn ) un şir convergent la zero.
 
1 1 1  1
Exemplul 8.1.8. Şirul an = sin , n ∈ N∗ are limita 0 deoarece lim = 0 şi sin  ≤ 1.
n n n→∞ n n
Propoziţia 8.1.3 (Criteriul minorării pentru limita +∞). Dacă pentru şirul de numere reale
(an ) există şirul numeric (bn ), cu lim bn = +∞, şi numărul natural n0 aşa ı̂ncât an ≥ bn ,
n→∞
pentru orice n ≥ n0 , atunci lim an = +∞.
n→∞
√ √
Exemplul 8.1.9. Şirul an = n 1 + 22 + 33 + . . . + nn , n ∈ N∗ , are limita +∞ deoarece an ≥ n nn =
n, pentru orice n ∈ N∗ , şi lim an = +∞.
n→∞

Propoziţia 8.1.4 (Criteriul majorării pentru limita −∞). Dacă pentru şirul numeric (an )
există şirul de numere reale (bn ), cu lim bn = −∞, şi numărul natural n0 , aşa ı̂ncât an ≤ bn ,
n→∞
pentru orice n ≥ n0 , atunci lim an = −∞.
n→∞

Propoziţia 8.1.5 (Criteriul ı̂ncadrării unui şir ı̂ntre două şiruri care au aceeaşi limită sau
criteriul cleştelui).
Dacă pentru şirul numeric (an ) există şirurile (bn ) şi (cn ) de numere reale aşa ı̂ncât
bn ≤ an ≤ cn pentru n ≥ n0 , n0 ∈ N, cu lim bn = lim cn = l, atunci şirul (an ) are limită şi
n→∞ n→∞
lim an = l.
n→∞

Exemplul 8.1.10. Pentru şirul


1 1 1
an = √ + √ + ... + √ ,
3
8n3 +n+1 3 3
8n + 2n + 2 3
8n + n2 + n
3

n ∈ N∗ , avem
n n
√ < an < √ , pentru orice n ∈ N∗ .
3
8n3 + n3 + n 3
8n3 + n + 1
Cum
n n 1
lim √ = lim √ = ,
n→∞ 3
8n3 + n2 + n n→∞ 3 8n3 + n + 1 2
deducem că
1
lim an = .
n→∞ 2
Propoziţia 8.1.6 Fie (an ) şi (bn ) şiruri de numere reale cu lim an = l1 şi lim bn = l2 , l1 şi l2
n→∞ n→∞
finite sau infinite. Dacă l1 + l2 are sens, atunci lim (an + bn ) = lim an + lim bn = l1 + l2 .
n→∞ n→∞ n→∞

Demonstraţie. Să considerăm cazul l1 şi l2 finite. Pentru orice ε > 0 există numerele naturale
n1ε şi n2ε aşa ı̂ncât
ε
|an − l1 | < , pentru orice n natural n > n1ε
2
şi
ε
|bn − l2 | < , pentru orice n natural n > n2ε
2
Fie nε = max{n1ε , n2ε }. Atunci, pentru orice n natural n > nε , avem, ı̂n conformitate
cu cele două inegalităţi:
ε ε
|(an + bn ) − (l1 + l2 )| ≤ |an − l1 | + |bn − l2 | < + = ε,
2 2
ceea ce ne arată că
lim (an + bn ) = l1 + l2 .
n→∞

În mod analog se demonstrează că: dacă l1 = +∞ şi l2 finit, atunci l1 + l2 = +∞; dacă
l1 = +∞ şi l2 = +∞, atunci l1 + l2 = +∞, iar dacă l1 = −∞ şi l2 = −∞, atunci l1 + l2 = −∞.

152
Observaţia 8.1.2 Pentru l1 = +∞ şi l2 = −∞ operaţia l1 + l2 este fără sens (numit şi caz de
excepţie sau caz de nedeterminare) deoarece ı̂n acest caz nu se poate preciza de la ı̂nceput
valoarea lui l1 + l2 , aceasta putând să fie orice număr real, +∞, −∞ sau să nu existe, ı̂n
funcţie de (an ) şi (bn ).

Observaţia 8.1.3 Afirmaţiile din Propoziţia 8.1.6 rămân valabile şi pentru un număr finit
de termeni independent de n.

Astfel, putem scrie


 
1 2 k
lim + + ··· + = 0 (k independent de n)
n→∞ n n n

dar nu putem scrie  


1 2 n
lim + + ... + = 0 + ... + 0 = 0
n→∞ n n n  
∞·0

Corect, avem
 
1 2 n 1 + 2 + ... + n
lim + + ... + = lim =
n→∞ n n n n→∞ n

n(n + 1) n+1
= lim = lim = ∞.
n→∞ 2n n→∞ 2
Propoziţia 8.1.7 Fie (an ) şi (bn ) două şiruri de numere reale cu lim an = l1 şi lim bn = l2 .
n→∞ n→∞
Dacă l1 · l2 are sens, atunci lim (an bn ) = lim an · lim bn = l1 · l2 .
n→∞ n→∞ n→∞

Demonstraţie. Să considerăm l1 şi l2 finite. Dacă l2 = 0, atunci ţinând seama că an este
mărginit, pe baza Observaţiei 8.1.1, găsim lim an bn = 0.
n→∞
Să presupunem că l2 = 0. Cum (an ) este convergent, pe de o parte este mărginit, adică
există M > 0 aşa ı̂ncât |an | < M , pentru orice n ∈ N∗ , iar pe de altă parte, pentru orice ε > 0
există n1ε ∈ N aşa ı̂ncât
ε
|an − l1 | < , pentru orice n > n1ε
2|l2 |
Din lim bn = l2 rezultă că pentru orice ε > 0 există n2ε ∈ N aşa ca
n→∞

ε
|bn − l2 | < , pentru orice n > n2ε .
2M
Considerând nε = max{n1ε , n2ε }, avem

|an bn − l1 l2 | = |an bn − an l2 + an l2 − l1 l2 | = |an (bn − l2 ) + l2 (an − l1 )| ≤


ε ε
≤ |an | |bn − l2 | + |l2 | |an − l1 | < M · + |l2 | = ε,
2M 2|l2 |
pentru orice n > nε , adică lim (an bn ) = l1 l2 .
n→∞
Analog se arată că: dacă l1 finit şi l2 = +∞, atunci l1 · l2 = +∞, dacă l1 > 0 şi l1 l2 = −∞,
dacă l1 < 0, dacă l1 finit şi l2 = −∞, atunci l1 l2 = −∞, dacă l1 > 0 şi l1 l2 = +∞, dacă l1 < 0;
dacă l1 = +∞ şi l2 = −∞, atunci l1 l2 = −∞, dacă l1 = +∞ şi l2 = +∞, atunci l1 l2 = +∞ iar
dacă l1 = −∞ şi l2 = −∞, atunci l1 l2 = +∞.
Observaţia 8.1.4 Pentru l1 = 0 şi l2 = ±∞, operaţia l1 l2 este fără sens.

Observaţia 8.1.5 Cele afirmate la Observaţia 8.1.3 rămân valabile şi la produsul de şiruri.

Propoziţia 8.1.8 Fie (an ) un şir de numere reale cu lim an = l.


n→∞

153
1 1
i) Dacă l ∈ R∗ , atunci lim = ;
n→∞ an l
1
ii) Dacă l = +∞ sau l = −∞, atunci lim = 0;
n→∞ an
1
iii) Dacă l = 0 şi an > 0 pentru toţi n ≥ n0 , atunci lim = +∞, iar dacă an < 0 pentru
n→∞ an
1
toţi n ≥ n0 , atunci lim = −∞.
n→∞ an
Demonstraţie. i) Cum l = 0 rezultă că 1/an este definit cu excepţia eventual, a unui număr
finit de termeni.
Cum | |an | − |l| | ≤ |an − l|, Deducem că lim |an | = |l|. Acum există n1 ∈ N aşa ı̂ncât
n→∞
|l| |l|
| |an | − |l| | < , de unde |an | > , pentru orice n ≥ n1 .
2 2
Pentru orice ε > 0 există n2/ε ∈ N aşa că

|l|2
|an − l| < ε, pentru orice n > n2ε .
2
Fie nε = max{n1 , n2ε }; atunci
 
 1 1  |an − l| |l|2 ε 1 2
 − = < · · = ε,
 an l  |an | |l| 2 |l| |l|
1 1
pentru orice n > nε . Prin urmare, lim = .
an l
n→∞
În mod analog se demonstrează punctele ii) şi iii) din enunţul Propoziţiei 8.1.8.
Observaţia 8.1.6 Folosind Propoziţiile 8.1.7 şi 8.1.8, acum, putem preciza limita câtului a
două şiruri. Dacă lim an = l1 , lim bn = l2 şi l1 /l2 are sens (cazuri de excepţie sunt 0/0 şi
n→∞ n→∞
±∞/ ± ∞), atunci lim an /bn = l1 /l2 .
n→∞

Propoziţia 8.1.9 Fie (an ) şi (bn ) două şiruri de numere reale, an > 0, pentru orice n ∈ N∗ ,
lim an = a şi lim bn = b.
n→∞ n→∞

i) Dacă a ∈ (0, ∞) şi b ∈ R, atunci lim abnn = ab ;


n→∞

ii) Dacă a = 0 şi b ∈ R − {0}, atunci



0 , pentru b > 0
lim abnn =
n→∞ +∞ , pentru b < 0;

iii) Dacă a ∈ (0, +∞) şi b = +∞, atunci



∞ , pentru a > 1
lim abnn =
n→∞ 0 , pentru a ∈ (0, 1);

iv) Dacă a ∈ (0, +∞) şi b = −∞, atunci



0 , pentru a > 1
lim abnn =
n→∞ ∞ , pentru a ∈ (0, 1);

v) Dacă a = +∞ şi b ∈ (0, ∞), atunci



+∞ , pentru b > 0
lim abnn =
n→∞ 0 , pentru b < 0.

154
În cazul ridicării la putere avem cazurile de excepţii, situaţiile 00 , ∞0 şi 1∞ .
Pentru demonstraţie acestei propoziţii se poate consulta cartea [4].

Propoziţia 8.1.10 Sunt adevărate afirmaţiile:

i) Orice şir de numere reale monoton şi mărginit este convergent;

ii) Orice şir numeric crescător şi nemărginit are limita +∞;
iii) Orice şir numeric descrescător şi nemărginit are limita −∞.

Demonstraţie.

i) Fie (an ) un şir crescător şi mărginit. Punem α = sup{an | n ∈ N∗ }. Avem an ≤ α, pentru
orice n ∈ N∗ . Deoarece α este majorant, pentru orice ε > 0, există nε ∈ N∗ aşa ı̂ncât
α − ε < anε ≤ α. Cum şirul (an ) este crescător, pentru orice n ∈ N, n ≥ nε va rezulta
an ≥ anε . Deci, α − ε < anε ≤ an ≤ α, de unde |an − α| < ε pentru n > nε , ceea ce ne arată
că lim an = α.
n→∞

ii) Fie (an ) un şir numeric monoton crescător şi nemărginit. Atunci mulţimea termenilor
şirului este mărginită inferior de a1 , dar nu este majorată. Rezultă că, pentru orice
E > 0, există un nE ∈ N aşa ı̂ncât anE > E. Acum, pentru n ∈ N, n > nε , putem scrie
an ≥ anε > E, ceea ce ne arată că lim an = +∞.
n→∞

iii) Se demonstrează la fel ca ii).

Observaţia 8.1.7 Propoziţia 8.1.10 se poate enunţa scurt: orice şir monoton de numere
reale are o limită ı̂n R = R ∪ {−∞, +∞}.

Exemplul 8.1.11. Fie şirul en = (1 + 1/n)n , n ∈ N∗ . Să arătăm că (en ) este convergent.
Să pornim de la identitatea

(8.1) bk − ak = (b − a)(bk−1 + bk−2 a + · · · + bak−2 + ak−1 ),

care este valabilă pentru orice a, b ∈ R şi orice k natural. Din (8.1), pentru 0 < a < b, obţinem
inegalitatea
(8.2) bk < ak + k(b − a)bk−1 .
Luând ı̂n (8.2) a = 1 + 1/(n + 1), b = 1 + 1/n şi k = n + 1, găsim
 
1 n+1 n 1
1+ en = bn+1 < an+1 + b = en+1 + en ,
n n(n + 1) n

de unde rezultă en < en+1 , ceea ce ne arată că şirul (en ) este strict crescător. Să arătăm că
şirul (en ) este mărginit superior. Luăm ı̂n (8.2) a = 1, b = 1 + 1/(2n) şi k = n şi obţinem
 n  n−1  n
1 1 1 1 1
1+ <1+n· 1+ <1+ 1+ ,
2n 2n 2n 2 2n

de unde găsim  n
1
1+ < 2,
2n
care conduce la e2n < 4. Deoarece (en ) este un şir strict crescător, urmează că en < 4 pentru
orice n ∈ N∗ . Din punctul i) al Propoziţiei 8.1.10 deducem că şirul (en ) este convergent.
Limita şirului (en ) se notează cu e, care este un număr des ı̂ntâlnit ı̂n matematică şi ştiinţă.
valoarea lui este 2, 71828 . . ..

155
Propoziţia 8.1.11 (Lema lui Cesaró). Orice şir mărginit de numere reale conţine cel puţin
un subşir convergent.
Demonstraţie. Fie (an ) un şir mărginit de numere reale. Considerăm submulţimile
Ak = {ak , ak+1 , . . .}, k ∈ N∗ şi notăm cu bk marginile lor superioare (acestea există deoarece
mulţimea A1 = {a1 , a2 , . . .} este mărginită). Din Ak ⊃ Ak+1 , rezultă bk ≥ bk+1 k ∈ N∗ , şi deci
şirul (bn ) este descrescător. Cum Ak ⊂ A1 , pentru orice k ∈ N∗ şi A1 mărginită rezultă că
şirul (bk ) este mărginit inferior. Rezultă că şirul (bk ) este convergent.
Dacă pentru orice k ∈ N∗ avem bk ∈ Ak , atunci putem lua bk = ank cu nk ≥ k. Din nk ≥ k
obţinem lim nk = ∞, ceea ce ne arată că putem extrage un subşir (nk ) strict crescător de
n→∞
numere naturale, iar subşirul (ank ) va fi un subşir al şirului (an ), care are limită.
Acum, să presupunem că există un indice i ∈ N aşa ı̂ncât bi ∈ Ai . Din faptul că bi
este marginea superioară a mulţimii Ai , deducem că pentru orice n ∈ N∗ există kn aşa ı̂ncât
1 1
bi − < ai+kn ≤ bi , adică putem scrie |ai+kn − bi | < . De aici, pe baza criteriului majorării
n n
pentru limită finită, obţinem lim ai+kn = bi . Să arătăm că şirul (kn ) de numere naturale
n→∞
este nemărginit. Într-adevăr, dacă ar exista un n0 astfel ca kn = kn0 , pentru toţi n ≥ n0 ,
1
atunci am avea |ai+kn 0 − bi | ≤ pentru toţi n > n0 , ceea ce ar ı̂nsemna că ai+kn0 = bi şi bi ∈ Ai ,
n
ceea ce ar constitui o contradicţie. Prin urmare, subşirul (ai+kn ) este un subşir convergent
pentru şirul (an ).
Definiţia 8.1.12 Un şir (an ) de numere reale se numeşte şir fundamental sau şir Cauchy
dacă pentru orice ε > 0, există un număr natural nε , astfel ı̂ncât pentru orice n, m ∈ N∗ ,
n > nε , m > nε să avem |am − an | < ε.
Dacă n = m, atunci condiţia din definiţia precedentă este evident satisfăcută. De
aceea, putem considera, fără a restrânge generalitatea, că m > n, adică m = n + p, unde
p ∈ N∗ . Atunci Definiţia 8.1.12 se poate scrie sub forma echivalentă.
Definiţia 8.1.13 Un şir (an ) numeric se numeşte şir fundamental sau şir Cauchy dacă,
pentru orice ε > 0, există un număr natural nε aşa ı̂ncât pentru orice n ∈ N, n > nε şi orice
p ∈ N să avem |an+p − an | < ε.

Propoziţia 8.1.12 Orice şir fundamental de numere reale este mărginit

Demonstraţie. Aplicăm Definiţia 8.1.12 pentru ε = 1. Atunci există n1 ∈ N aşa ı̂ncât pentru
orice n, m ∈ N, n > n1 , m > n1 , să avem |an − am | < 1. Acum, putem scrie

|an | = |an − an1 +1 + an1 +1 | ≤ |an − an1 +1 | + |an1 +1 | < 1 + |an1 +1 |

pentru orice n > n1 . Dacă punem α = max{|a1 |, |a2 |, . . . , |an1 |, |1 + |an1 +1 |}. atunci |an | ≤ α,
pentru orice n ∈ N∗ , adică şirul (an ) este mărginit.
Teorema 8.1.2 (Criteriul lui Cauchy). Un şir de numere reale este convergent dacă şi
numai dacă este şir fundamental.
Demonstraţie. Necesitatea. Fie (an ) un şir de numere convergent la l. Să arătăm că este
fundamental. Din lim an = l, rezultă că pentru orice ε > 0 există nε ∈ N aşa ı̂ncât |an −l| < ε/2
n→∞
pentru orice n ∈ N, n > nε . Atunci, pentru orice n, m ∈ N, m > nε , n > nε avem
ε ε
|an − am | = |an − l + l − am | ≤ |an − l| + |am − l| < + =ε
2 2
ceea ce ne dovedeşte că (an ) este un şir fundamental.
Suficienţa. Să admitem că (an ) este un şir fundamental şi să arătăm că există l ∈ R aşa
ı̂ncât lim an = l. Şirul (an ) fiind fundamental, rezultă ca este mărginit (Propoziţia 8.1.12).
n→∞
Atunci conform Lemei lui Cesaró (Propoziţia 8.1.11), şirul (an ) va conţine un subşir (ank )

156
convergent; fie l limita sa. Deoarece ank → l, pentru k → ∞, rezultă că pentru orice ε > 0
există kε ∈ N aşa ı̂ncât
ε
(8.3) |ank − l| < , pentru orice k ∈ N, k > kε .
2
Din faptul că (an ) este şir fundamental avem că există n1ε ∈ N aşa ı̂ncât
ε
|an − am | < , pentru orice n, m ∈ N, n > n1ε , m > n1ε .
2
Fie acum nε = max{kε , n1ε } şi luând k > nε ı̂n (8.3), obţinem:
ε ε
|an − l| = |an − ank + ank − l| ≤ |an − ank | + |ank − l| < + = ε,
2 2
pentru orice n ∈ N, n > nε .
Prin urmare, şirul (an ) are limita l ∈ R, adică este convergent.
Observaţia 8.1.8 Criteriul lui Cauchy permite studierea convergenţei unui şir fără să
cunoaştem limita lui. Pentru aceasta este suficient să cercetăm dacă şirul este funda-
mental.
Exemplul 8.1.12. Să arătăm că şirul
cos x cos 2x cos nx
an = + 2
+ ... + , n ∈ R,
3 3 2n
este şir Cauchy, deci convergent.
Avem
cos x cos 2x cos nx cos(n + 1)x cos(n + p)x
an+p = + 2
+ ... + n
+ n+1
+ ... + ,
3 3 3 3 3n+p
cu p ∈ N∗ .
Atunci  
 cos(n + 1)x cos(n + p)x 

|an+p − an | = 
3n+1
+ ... +
3n+p ≤
 
1 1 1 1 − 31p 1 1 1
≤ n+1 + . . . + n+p = n+1 · 1 + 2 · 3n 1− p < .
3 3 3 1− 3 3 2 · 3n
Cum 1/2 · 3n → 0, rezultă că pentru orice ε > 0 există nε ∈ N aşa ı̂ncât 1/2 · 3n < ε,
pentru orice n ∈ N, n > nε . Atunci, pentru orice n > nε şi orice p ∈ N∗ , avem |an+p − an | < ε,
ceea ce ne asigură că (an ) este şir Cauchy.
Exemplul 8.1.13. Să arătăm că şirul
1 1
an = 1 + + ... +
2 n
nu este fundamental, deci nu este şir convergent.
Se observă că avem
1 1 1 1 1 1 1
a2n − an = + + ... + > + ... + =n· = ,
n+1 n+2 2n 2n  2n 2n 2
de n ori
ceea ce ne arată că (an ) nu poate fi şir Cauchy.
Aplicaţie economică. Dobânda compusă. Se investeşte o sumă S, dată ı̂ntr-o anumită
unitate monetară, care acumulează o dobândă compusă de r% anual.
Dacă dobânda se adaugă anual, atunci la sfârşirul primului an vom avea suma

S1 = S + rS = S(1 + r).

157
După doi ani, vom avea suma

S2 = S(1 + r)2 ,

iar după trecerea a k ani, suma acumulată va fi

Sk = S(1 + r)k .

Dacă dobânda s-ar adăuga de n ori pe an, atunci la trecereea a k ani am avea suma
$ r %kn
Sn,k = S 1 + .
n
Se observă că şirul (Sn,k ) este crescător ı̂n raport cu n. Apare ı̂ntrebarea: dacă n ar
creşte, adică adăugarea dobânzii s-ar face cât mai des, valoarea sumei acumulate ı̂n cei k
ani, ar creşte foarte mult?
Pentru a răspunde la ı̂ntrebare să calculăm limita şirului (Sn,k ) când n → ∞. Avem
$ *$ + r ·nk
r %nk r % nr n
lim Sn,k = lim S 1 + = S lim 1+ = Serk ,
n→∞ n→∞ n n→∞ n

ceea ce ne arată că, practic, valoarea sumei finale depinde de suma iniţială S, dobânda
anuală r şi de numărul de ani k, influenţa desimii adăugării dobânzii fiind de mai mică
importanţă.
De exemplu, dacă am depune o sumă S = 1$ cu dobândă compusă anuală de 1% pe o
perioadă de 1 an, oricât de des am adăuga dobânda, valoarea sumei acumulate la sfârşirul
anului ar oscila ı̂n jurul lui e = 2, 71828 . . . $. (v. [2], [3], [5]).

8.2 Şiruri ı̂n spaţii metrice


Definiţia 8.2.1 Se numeşte şir de puncte ı̂n spaţiul metric (X, d) o aplicaţie a mulţimii N ∗ =
{1, 2, . . . , n, . . .} ı̂n X.

Pentru un astfel de şir folosim notaţia (xn )n≥1 sau simplu (xn ) ca şi ı̂n cazul şirurilor
de numere reale.

Definiţia 8.2.2 Şirul de puncte (xn ) din spaţiul metric (X, d) este convergent la x ∈ X dacă
şirul de numere reale pozitive (d(xn , x)) are limita zero.

Ca şi la şirurile reale folosim notaţia lim xn = x sau xn → x (n → ∞).


n→∞
Altfel spus, şirul xn → x (n → ∞) ı̂n spaţiul metric (X, d) dacă pentru orice ε > 0, există
nε ∈ N, astfel ı̂ncât d(xn , x) < ε dacă n > nε .

Propoziţia 8.2.1 Dacă şirul de puncte ((xn ) din (X, d) este convergent ı̂n spaţiul metric
(X, d), atunci limita lui este unică.

Demonstraţie. Fie lim xn = x şi lim xn = y. Din Definiţia 8.2.2 avem lim d(xn , x) =
n→∞ n→∞ n→∞
0 şi lim d(xn , y) = 0. Atunci din d(x, y) ≤ d(x, xn ) + d(xn , y) avem d(x, y) ≤ lim d(xn , x) +
n→∞ n→∞
lim d(xn , y) = 0, de unde deducem că d(x, y) = 0. Deci avem x = y.
n→∞

Definiţia 8.2.3 Şirul de puncte (xn ) din spaţiul metric (X, d) este mărginit dacă există x0 ∈ X
şi M > 0 aşa ı̂ncât d(xn , x0 ) ≤ M , pentru orice n ∈ N∗ .

Propoziţia 8.2.2 Orice şir convergent de puncte din spaţiul metric (X, d) este mărginit.

158
Demonstraţie. Fie lim xn = x; pentru ε = 1 există n1 ∈ N aşa ı̂ncât d(xn , x) < 1, oricare ar
n→∞
fi n > n1 . Punând M = max{d(x1 , x), d(x2 , x), . . . , d(xn1 , x), 1}, avem d(xn , x) ≤ M , pentru orice
n ∈ N∗ , ceea ce ne arată că şirul de puncte (xn ) este mărginit ı̂n (X, d).
Definiţia 8.2.4 Şirul de puncte (yn ) din spaţiul (X, d) este subşir al şirului de puncte (xn ) din
(X, d) dacă există un şir (kn )n≥1 de numere naturale, strict crescător, aşa ı̂ncât yn = xkn .

Propoziţia 8.2.3 Dacă şirul de puncte (xn ) este convergent la x ı̂n (X, d), atunci orice subşir
al său are de asemenea limita x.

Demonstraţie. Valabilitatea propoziţiei rezultă din Propoziţia 8.1.11, de la şiruri de


numere reale deoarece dacă (yn ) este un subşir al şirului de puncte (xn ), atunci şirul real
(d(yn , x)) este subşir al şirului numeric (d(xn , x)).
Propoziţia 8.2.4 (Criteriul majorării). Dacă pentru şirul de puncte (xn ) din (X, d) există
x ∈ X şi şirul (an ) de numere reale aşa ca d(xn , x) ≤ |an | şi lim an = 0, atunci (xn ) este
n→∞
convergent şi lim xn = x.
n→∞

Demonstraţia se obţine folosind criteriul majorării de la şiruri de numere reale şi


Definiţia 8.2.2.
Definiţia 8.2.5 Şirul de puncte (xn ) din (X, d) se numeşte şir fundamental sau şir Cauchy
dacă pentru orice ε > 0 există nε ∈ N aşa ı̂ncât pentru orice n, m ∈ N, n > nε , m > nε , să
avem d(xm , xn ) < ε.
Dacă ı̂n Definiţia 8.2.5 luăm m = n + p, p ∈ N∗ , atunci obţinem formularea echivalentă:
şirul (xn ) din (X, d) este fundamental dacă, pentru orice ε > 0 şi orice p ∈ N∗ există nε ∈ N
astfel ı̂ncât, pentru orice n ∈ N, n > nε , avem d(xn+p , xn ) < ε.
Propoziţia 8.2.5 Orice şir fundamental ı̂n spaţiul metric (X, d) este mărginit.
Demonstraţie. Fie (xn ) un şir Cauchy ı̂n (X, d). Pentru ε = 1 există n1 ∈ N aşa ı̂ncât,
pentru orice n, m ∈ N, n > n1 , m > n1 , să avem d(xn , xm ) < 1. Dacă punem

M = max{1, d(x1 , xn1 +1 ), d(x2 , xn1 +1 ), . . . , d(xn1 , xn1 +1 )}

atunci d(xn , xn1 +1 ) ≤ M , pentru orice n ∈ N∗ . Prin urmare, şirul (xn ) este mărginit ı̂n (X, d).
Teorema 8.2.1 Orice şir convergent de puncte din (X, d) este şir Cauchy ı̂n (X, d).
Demonstraţie. Fie (xn ) un şir convergent de puncte din (X, d). Dacă lim xn = x, x ∈ X,
n→∞
atunci pentru orice ε > 0 există nε aşa ı̂ncât, oricare ar fi n ∈ N, n > nε , să avem d(xn , x) < ε/2.
Cum pentru orice p ∈ N∗ şi orice n ∈ N , n > nε , avem şi d(xn+p , x) < ε/2, putem scrie

d(xn+p , xn ) ≤ d(xn+p , x) + d(x, xn ) < ε/2 + ε/2 = ε,

pentru orice n > nε . De aici, rezultă că şirul (xn ) este şir fundamental.
Reciproca Teoremei 8.2.1 nu este adevărată ı̂n orice spaţiu metric.
'n 8.2.1. În spaţiul metric (R, | |), ínzestrat cu metrica dată de modul, şirul en =
Exemplul
&
1 + n1 , n ∈ N∗ este convergent (deci şi fundamental) şi are limita e.
Spaţiul metric (Q, | |) este un subspaţiu al lui (R, | |). Proprietatea şirului (en ) de a
fi fundamental se păstrează şi ı̂n (Q, | |), dar el nu mai este convergent ı̂n (Q, | |) deoarece
numărul e ∈ Q (e este număr iraţional).
Definiţia 8.2.6 Spaţiul metric (X, d) se numeşte complet dacă orice şir fundamental din
(X, d) este convergent ı̂n (X, d).
Exemplul 8.2.2. Spaţiul metric (R, | |) este complet pe baza criteriului lui Cauchy (v.
Teorema 8.1.2).

159
Definiţia 8.2.7 Un spaţiu vectorial normat şi complet se numeşte spaţiu Banach, iar un
spaţiu prehilbertian şi complet se numeşte spaţiu Hilbert.

Fie (X, d1 ), (Y, d2 ) două spaţii metrice şi Z = X × Y produsul cartezian al celor două
spaţii metrice. Dacă z1 = (x1 , y1 ), z2 = (x2 , y2 ) sunt două puncte din Z, atunci definim
,
d(z1 , z2 ) = d21 (x1 , x2 ) + d22 (y1 , y2 ).

Propoziţia 8.2.6 (Z, d) este un spaţiu metric.

Demonstraţie. Trebuie să verificăm pentru d axiomele metricii.


1. Evident d(z1 , z2 ) ≥ 0, oricare ar fi (z1 , z2 ) ∈ Z. Dacă d(z1 , z2 ) = 0, atunci d1 (x1 , x2 ) = 0 şi
d2 (y1 , y2 ) = 0, 
de unde rezultă x1 = x2 , y1 = y2 , adică z1 = z2 .
2. d(z1 , z2 ) = d21 (x1 , x2 ) + d22 (y1 , y2 ) = d21 (x2 , x1 ) + d22 (y2 , y1 ) = d(z2 , z1 ), oricare ar fi z1 , z2 ∈ Z.
3. Fie z3 = (x3 , y3 ) ı̂ncă un punct arbitrar din Z. Avem
,
d(z1 , z2 ) = d21 (x1 , x2 ) + d22 (y1 , y2 ) ≤

≤ (d1 (x1 , x3 ) + d1 (x3 , x2 ))2 + (d2 (y1 , y3 ) + d2 (y3 , y2 ))2 ≤
, ,
≤ d21 (x1 , x3 ) + d22 (y1 , y3 ) + d21 (x3 , x2 ) + d22 (y3 , y2 ) =
= d(z1 , z3 ) + d(z3 , z2 ),
adică d verifică inegalitatea triunghiului.
Prin urmare (Z, d) este spaţiu metric.

Observaţia 8.2.1 Valabilitatea Propoziţiei 8.2.6 se poate extinde la produsul cartezian al


unui număr finit de spaţii metrice.

Teorema 8.2.2 Şirul zn = (xn , yn ), n ∈ N, din spaţiul metric (Z, d) este convergent către
z = (x, y) ∈ Z dacă şi numai dacă, lim xn = x şi lim yn = y.
n→∞ n→∞

Demonstraţie. Fie lim zn = z, atunci, pentru orice ε > 0, există nε ∈ N, aşa ı̂ncât, pentru
n→∞
orice n > nε , să avem d(zn , z) < ε. Cum
,
d1 (xn , x) ≤ d21 (xn , x) + d22 (yn , y) = d(zn , z) < ε

şi ,
d2 (yn , y) ≤ d21 (xn , x) + d22 (yn , y) = d(zn , z) < ε,
pentru orice n ∈ N, n > nε , deducem că lim xn = x şi lim yn = y, ceea ce trebuie demonstrat.
n→∞ n→∞
Reciproc, dacă lim xn = x şi lim yn = y, atunci pentru orice ε > 0 există n1ε aşa ı̂ncât,
n→∞ n→∞ √
pentru orice n > n1ε , √ să avem d1 (xn , x) < ε/ 2 şi există n2ε astfel ı̂ncât, pentru orice n > n2ε ,
să avem d2 (yn , y) < ε/ 2.
Cum, pentru orice n > nε , nε = max{n1ε , n2ε } avem
, -
2 2 ε2 ε2
d(zn , z) = d1 (xn , x) + d2 (yn , y) < + = ε,
2 2
rezultă lim zn = z.
n→∞
Din Teorema 8.2.2 rezultă că putem scrie
$ %
lim (xn , yn ) = lim xn , lim yn .
n→∞ n→∞ n→∞

160
Observaţia 8.2.2 Rezultatul Teoremei 8.2.2 rămâne valabil şi la produsul cartezian al unui
număr finit de spaţii metrice.

Corolarul 8.2.1 Un şir din spaţiul Rm este convergent, dacă şi numai dacă, şirurile reale
componente sunt convergente.

Valabilitatea corolarului rezultă din Teorema 8.2.1 şi faptul că Rm este produsul
cartezian al spaţiului metric R, repetat de m ori.
Exemplul 8.2.3. Să calculăm limita şirului din R3
  n 
√ 1 3n2 − n + 1
zn = n n, 1 + , , n ≥ 2.
n 4n2 + n + 1
Avem   n 
√ 1 3n2 − n + 1
lim zn = lim n n, lim 1+ , lim =
n→∞ n→∞ n→∞ n n→∞ 4n2 + n + 1
 
3
= 1, e, .
4
Teorema 8.2.3 Şirul de puncte zn = (xn , yn ), n ∈ N∗ , din spaţiul metric (Z, d) este şir fun-
damental, dacă şi numai dacă, (xn ) şi respectiv (yn ) sunt şiruri fundamentale ı̂n (X, d1 ) şi
respectiv (Y, d2 ).
Demonstraţie. Să considerăm, mai ı̂ntâi, că şirul (zn ) este fundamental ı̂n (Z, d), adică,
pentru orice ε > 0 şi orice p ∈ N∗ , există nε ∈ N aşa ı̂ncât, pentru orice n > nε , să avem
d(zn+p , zn ) < ε. Deoarece
,
d1 (xn+p , xn ) ≤ d21 (xn+p , xn ) + d22 (yn+p , yn ) = d(zn+p , zn ) < ε

şi ,
d2 (yn+p , yn ) ≤ d21 (xn+p , xn ) + d22 (yn+p , yn ) = d(zn+p , zn ) < ε
pentru orice p ∈ N şi orice n ∈ N, n > nε , rezultă că şirul (xn ) şi respectiv (yn ) sunt funda-
mentale ı̂n (X, d1 ) şi respectiv (Y, d2 ).
Reciproc, fie (xn ) şi respctive (yn ) şiruri fundamentale ı̂n (X, d1 ) şi respectiv (Y, d2 ). Să
arătăm ca zn = (xn , yn ), n ∈ N∗ este şir fundamental ı̂n (Z, d).
Pentru orice ε > 0 şi orice p ∈ N∗ există nε ∈ N aşa ı̂ncât, pentru orice n > n1ε să avem
ε
d1 (xn+p , xn ) < √
2
şi există n2ε ∈ N aşa ı̂ncât pentru orice n > n2ε să avem
ε
d2 (yn+p , yn ) < √ .
2
Deoarece, pentru orice n ∈ N, n > nε , nε = max{n1ε , n2ε } avem
, -
2 2 ε2 ε2
d(zn+p , zn ) = d1 (xn+p , xn ) + d2 (yn+p , yn ) < + = ε,
2 2
deducem că şirul (zn ) este fundamental ı̂n (Z, d).
Din Teorema 8.2.3 rezultă că şirul zn = (xn , yn ), n ∈ N∗ , din (Z, d) este fundamental,
dacă şi numai dacă, componentele sale (xn ), respectiv (yn ) sunt şiruri fundamentale ı̂n (X, d1 )
şi respectiv (Y, d2 ). Prin urmare, spaţiul (Z, d) este complet, dacă şi numai dacă, (X, d1 ) şi
(Y, d2 ) sunt complete.
Observaţia 8.2.3 Rezultatul Teoremei 8.2.3 rămâne valabil şi la produsul cartezian al unui
număr finit de spaţii metrice.

161
Corolarul 8.2.2 Spaţiile Rm sunt complete.

Valabilitatea corolarului rezultă din Observaţia 8.2.3 şi din faptul că spaţiul R este
complet (Exemplul 8.2.2).
Definiţia 8.2.8 În spaţiul metric (X, d), o funcţie f : X → X se numeşte contracţie, dacă
există α ∈ [0, 1) aşa ı̂ncât, oricare ar fi x, y ∈ X avem

(8.4) d(f (x), f (y)) ≤ αd(x, y).

Exemplul 8.2.4. Fie X = Rm cu metrica euclidiană



m


d(x, y) =  (xi − yi )2 ,
i=1

unde x = (x1 , x2 , . . . , xm ) ∈ X, y = (y1 , y2 , . . . , ym ) ∈ X. Considerăm aplicaţia f : X → X dfinită


prin f (x) = (αx1 , αx2 , . . . , αxm ), α ∈ [0, 1). Avem
 
m m



d(f (x), f (y)) =  (αxi − αyi ) = α (xi − yi )2 = αd(x, y),


2

i=1 i=1

pentru orice x, y ∈ X, adică (8.4) este verificată pentru α ∈ [0, 1), ceea ce ne arată că f este
o contracţie.
Exemplul 8.2.5. Funcţia f : R → R, definită prin
a √
f (x) = 2 , a > 0, b > 0, a < b b
x +b
este o contracţie a spaţiului metric (R, | |).
În adevăr, pentru orice x, y ∈ R, avem
 
 a a 

d(f (x), f (y)) = |f (x) − f (y) =  2 − =
x + b y2 + b 
a|x + y|
d(x, y).
(x2 + b)(y 2 + b)

Cum |t| ≤ (t2 + b)/2 b, pentru orice t ∈ R, putem scrie

x2 + b y 2 + b 1
|x + y| ≤ |x| + |y| ≤ √ + √ = √ (x2 + y 2 + 2b) ≤
2 b 2 b 2 b
1 2 1
≤ √ (x2 + b)(y 2 + b) = √ (x2 + b)(y 2 + b)
2 bb b b
Atunci
a
d(f (x), f (y)) ≤ √ d(x, y),
b b

cu α = a/b b ∈ [0, 1), ceea ce ne arată că f este o contracţie a spaţiului metric R.
Numeroase probleme practice conduc la rezolvarea unei relaţii de forma f (x) = x,
unde f este o aplicaţie a unui spaţiu metric X ı̂n el ı̂nsăşi. Un astfel de punct x ∈ X pentru
care f (x) = x se numeşte punct fix al funcţiei f .
Astfel, dacă f este aplicaţia identică a unui spaţiu metric ı̂n el ı̂nsuşi, adică f (x) = x,
pentru orice x ∈ X, atunci toate punctele lui X sunt puncte fixe.
În continuare vom prezenta un rezultat fundamental al Analizei Matematice, cu multe
aplicaţii ı̂n matematică şi ştiinţele practice, numit principiul contracţiei sau teorema de
punct fix a lui Banach care asigură, ı̂n anumite condiţii, existenţa şi unicitatea unui punct
fix.

162
Teorema 8.2.4 (Principiul contracţiei). Orice contracţie a unui spaţiu metric complet ı̂n el
ı̂nsuşi admite un singur punct fix.
Demonstraţie. Fie (X, d) un spaţiu metric şi f : X → X o contracţie a sa.
Unicitatea punctului fix. Să admitem că ar exista două puncte fixe x şi y din X, cu
x = y, aşa ı̂ncât f (x) = x şi f (y) = y. Atunci

d(x, y) = d(f (x), f (y)) ≤ αd((x, y), α ∈ [0, 1),

de unde
(1 − α)d(x, y) ≤ 0.
Cum d(x, y) > 0 şi (1 − α) > 0, avem o contradicţie. Prin urmare, presupunerea noastră
este falsă, deci există un singur punct fix.
Existenţa punctului fix. Să considerăm x0 ∈ X un punct arbitrar şi să definim recurent
şirul (xn ) prin x1 = f (x0 ), x2 = f (x1 ), . . ., xn+1 = f (xn ), . . ..
Vom arăta că şirul (xn ) este un şir fundamental.
Avem
d(x2 , x1 ) = d(f (x1 ), f (x0 )) ≤ αd(x1 , x0 ),
d(x3 , x2 ) = d(f (x2 ), f (x1 )) ≤ αd(x2 , x1 ) ≤ α2 d(x1 , x0 ).
Prin inducţie matematică deducem că

(8.5) d(xn+1 , xn ) ≤ αn d(x1 , x0 ), pentru orice n ∈ N.

Pentru n, p numere naturale, p = 0, conform cu (8.5), putem scrie

(8.6) d(xn+p , xn ) ≤ d(xn+p , xn+p−1 ) + d(xn+p−1 , xn+p−2 ) + . . . +

+d(xn+1 , xn ) ≤ (αn+p−1 + αn+p−2 + . . . + αn )d(x1 , x0 ) =


1 − αp αn
= αn d(x1 , x0 ) ≤ d(x1 , x0 ).
1−α 1−α
Să luăm d(x1 , x0 ) > 0 (ı̂n caz contrar, punctul fix este x0 şi demonstraţia existenţei
este terminată). Deoarece α ∈ [0, 1), rezultă lim αn = 0, de unde pentru orice ε > 0, există
n→∞
nε ∈ N aşa ı̂ncât, pentru orice n > nε , avem
ε(1 − α)
(8.7) αn < .
d(x1 , x0 )
Din (8.6) şi (8.7) rezultă că, pentru orice ε > 0 şi pentru orice p ∈ N∗ , există nε ∈ N,
aşa ı̂ncât d(xn+p , xn ) < ε, pentru orice n ∈ N, n > nε , adică şirul (xn ) este fundamental.
Cum (X, d) este spaţiul metric complet, există x ∈ X aşa ı̂ncât lim xn = x. Mai trebuie
n→∞
arătat că x este punct fix.
Într–adevăr, putem scrie

d(f (x), x) ≤ d(f (x), xn+1 ) + d(xn+1 , x) = d(f (x), f (xn ))+

+d(xn+1 , x) ≤ αd(x, xn ) + d(xn+1 , x).


De aici, folosind că lim d(x, xn ) = 0, lim d(xn+1 , x) = 0 şi ţinând cont de criteriul ma-
n→∞ n→∞
jorării pentru şiruri reale, deducem că d(f (x), x) = 0, adică f (x) = x.
Demonstraţia teoremei lui Banach de punct fix ne arată nu numai existenţa şi unic-
itatea punctului fix, ci şi o metodă de aflare a punctului fix x şi de asemenea, punerea
ı̂n evidenţă a unei formule pentru evaloarea erorii ce se comite considerând respectiva
aproximaţie.
Într–adevăr, deoarece
αn
d(xn , x) ≤ d(xn , xn+p ) + d(xn+p , x) ≤ d(x1 , x0 ) + d(xn+p , x),
1−α

163
rezultă, pentru p → ∞ că
αn
d(xn , x0 ) ≤ d(x1 , x0 ),
1−α
inegalitatea ce ne arată cu ce eroare aproximează xn punctul fix x.
În acest fel, pornind de la x0 ∈ X arbitrar, punctele xn = f (xn−1 ), n = 1, 2, . . ., apar
drept aproximaţii succesive ale punctului fix x, ceea ce face ca metoda de aproximare să
poarte numele de metoda aproximaţiilor succesive.
În aplicarea efectivă a metodei aproximaţiilor succesive partea dificilă constă ı̂n de-
terminarea convenabilă a spaţiului metric complet (X, d) şi a contracţiei f . Cu toată această
dificultate, metoda aproximaţiilor succesive este una dintre cele mai puternice procedee de
aproximare numerică a multor probleme puse de matematică şi ştiinţele practice (inclusiv
cele economice).
Exemplul 8.2.6. Fie ecuaţia x3 + 4x − 1 = 0 şi să ne propunem să-i găsim aproximativ singura
rădăcină reală pe care o are (demonstraţi acest fapt !).
Scriem ecuaţia sub forma
1
x= 2
x +4
şi considerăm funcţia f : R → R, f (x) = 1/(x2 + 4).
Din Exemplul 8.2.5, pentru a = 1 şi b = 4, găsim că f este o contracţie a spaţiului
metric (R, | |), cu α = 1/8. Pe baza principiilor contracţiei f are un singur punct fix x şi
deci ecuaţia dată va avea o singură rădăcină reală. Folosind şirul aproximaţiilor succesive,
considerând x0 = 0, găsim:
1
x1 = f (x0 ) = = 0, 25
4
x2 = f (x1 ) = 0, 2461
x3 = f (x2 ) = 0, 2463,
...................
2
iar xn va aproxima pe x cu o eroare d(xn , x) ≤ .
7 · 8n

164
8.3 Test de verificare a cunoştinţelor nr. 7
1. Definiţi următoarele noţiuni:

a) Şir de numere reale convergent;


b) Şir de numere reale fundamental;
c) Şir ı̂ntr-un spaţiu metric;
d) Spaţiu metric complet.

2. Enunţaţi:

a) Criteriul lui Cauchy pentru şiruri de numere reale;


b) Principiul contracţiei.

3) Utilizând criteriul lui Cauchy să se arată că următoarele şiruri sunt convergente:
2n + 1
a) an = ;
5n + 2
1 1 1
b) bn = 1 + + 2 + ... + n ;
2 2 2
c) cn = a0 + a1 q + a2 q 2 + ... + an q n cu |ak | < M (∀)k ∈ N şi |q| < 1;
cos x cos 2x cos nx
d) dn = + + ... + ;
3 32 3n
cos a1 cos a2 cos an
e) en = + + ... + cu ai ∈ R (∀) i ∈ N.
1·2 2·3 n(n + 1)
4. Să se calculeze lim zn , unde zn = xn + iyn cu
n→∞

.
n
k 1p + 2p + ... + np
xn = a (k+1)! , a > 1 şi yn = .
np+1
k=1

5. Să se calculeze lim un , un = (un , un , u


n ), cu
n→∞
√ √ √
un = n + 1 − 2 n + n − 1,
$ 1 %
un = n 2 n − 1 ,
1 1 1
u
n = √ + √ + ... + √ .
9
9n9 2
+ 5n + 1 9 9 2
9n + 5n + 2 9
9n + 5n2 + n
9

6. Să se calculeze lim , un = (un , un , u


n ), cu
n→∞

12 + 22 + ... + n2
un = ,
nn
√ √ n
n
a+ n2
un = cu a, b ∈ R∗+ ,
b

u 33n  .
n =  3n
1
3+
n
7. Să se calculeze lim un , un = (un , un , u
n ) cu
n→∞

n
k! · k
un = k=1
,
(n + 1)!

165
$  %
un = sin nπ n3 + 3n2 + 4n − 5 ,
3


n  
1 2 k−1
u
n = n + 1 − + + ... + .
2! 3! k!
k=2

8. Într-o progresie aritmetică, ı̂n care al n-lea termen este an şi suma primilor n termeni
Sm m2 am 2m − 1
Sn , avem = 2 . Să se arate că = .
Sn n an 2n − 1
9. Să se determine limita inferioară şi limita superioară pentru şirul (an ) cu
n+1 1
an = a(−1) + , a > 0.
n
10. Folosind principiul contracţiei găsiţi cu o eroare de 10−2 soluţia ecuaţiei 10x − 1 = sin x.

166
Indicaţii şi răspunsuri Testul nr. 7

3. Se impune |an+p − an | < ε şi se găseşte nε astfel ı̂ncât (an ) să fie şir Cauchy.
1
4. zn → a + i · .
p+1
 
1
5. un → 0, ln 2, √9
.
9
 
√ 1
6. un → 1, ab, .
e

3
7. un → 1, ,e .
2

8. Se foloseşte faptul că suma primilor n termeni ai unei progresii aritmetice a1 , an , ..., an , ...
n[2a1 + (n − 1)r]
cu raţia r este Sn = .
2
1
9. Pentru a < 1 avem lim an = şi lim an = a.
a
1
Pentru a > 1 avem lim an = a şi lim an = .
a
Pentru a = 1 avem lim an = lim an = lim an = 1.
n→∞

sin x + 1 sin x + 1
10. Se scrie ecuaţia sub forma x = . Notăm f (x) = . Se arată că
10 10
1
|f  (x)| ≤ < 1 deci f este o contracţie. Apoi folosind principiul contracţiei se găseşte
10
1
sin +1

soluţia aproximativă căutată x = 10 .
10

167
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul II,
Editura ULB, Sibiu, 2002.
[2] Allen, R.G.D., Analiză matematică pentru economişti, Editura Ştiinţifică (traducere),
Bucureşti, 1971.
[3] Lancaster, K., Analiză economică matematică, Editura Ştiinţifică, Bucureşti, 1973.
[4] Nicolescu, M., Dinculeanu, N., Marcus, S., Manual de analiză matematică, Vol.I,
1962, Vol.II, 1964, Editura Didactică şi Pedagogică, Bucureşti.
[5] Vasiliu, D.P., Matematici economice, Editura Eficient, Bucureşti, 1996.

168
Capitolul 9

Serii numerice

Obiective: Prezentarea noţiunilor generale legate de seriile numerice şi aplicaţiile


economice ale acestora (de exemplu fluxul de venit).
Rezumat: În acest capitol sunt introduse şi studiate noţiunile de serie numerică,
convergenţa seriilor numerice, serii cu termeni pozitivi şi criteriile de convergenţă pentru
acest tip de serii.
Conţinutul capitolului:
1. Noţiuni preliminare
2. Criterii de convergenţă pentru serii numerice cu termeni oarecare
3. Serii absolut convergente. Serii semiconvergente
4. Serii cu termeni pozitivi
5. Problemă economică. Fluxul de venit
6. Test de verificare a cunoştinţelor
7. Bibliografia aferentă capitolului
Cuvinte cheie: serie numerică, serie convergentă, criterii de convergenţă, serie
absolut convergentă, serie semiconvergentă, serie cu termeni pozitivi, fluxul de venit.

9.1 Noţiuni preliminare


Se cunoaşte că pentru orice număr finit de numere reale a1 , a2 , . . . , an , putem efectua
suma lor, utilizând proprietatea de asociativitate a adunării de numere reale. Astfel, mai
ı̂ntâi calculăm a1 + a2 , apoi se efectuează

a1 + a2 + a3 = (a1 + a2 ) + a3 , a1 + a2 + a3 + a4 = (a1 + a2 + a3 ) + a4

şi, ı̂n general


a1 + a2 + . . . + an−1 + an = (a1 + a2 + . . . + an−1 ) + an .
Acum, este firesc să ne punem problema efectuării sumei termenilor unui şir (an )n≥1
de numere reale, adică a unei sume cu un număr infinit de termeni.

Definiţia 9.1.1 Fiind dat şirul de numere reale (an ), se numeşte serie de numere reale sau
serie numerică problema adunării termenilor şirului (an ), adică problema efectuării sumei

(9.1) a1 + a2 + . . . + an + . . . .



În locul sumei (9.1) scriem prescurtat an sau an sau simplu an , an fiind
n=1 n≥1
numit termenul general al seriei numerice.
Prin urmare, observăm că seriile numerice constituie problema adunării unei in-
finităţii numărabile de numere reale.

169
Cum ştim efectua adunări de numere reale ı̂n care numărul termenilor este finit, dar

oricât de mare, este natural ca pentru efectuarea sumei an să utilizăm sume finite de
n=1
tipul Sn = a1 + a2 + . . . + an , ı̂n care să facem pe n să tindă la infinit.

Definiţia 9.1.2 Numin sumă parţială a seriei numerice an , suma

n
Sn = ai = a1 + a2 + . . . + an ,
i=1

iar şirul de numere reale (Sn ) se numeşte şirul sumelor parţiale.


Observaţia 9.1.1 În literatura matematică, deseori, se defineşte seria numerică an prin
cuplul de şiruri (an ) şi (Sn ) ([2], [4]).

Definiţia 9.1.3 Spunem că seria an este convergentă dacă şirul sumelor parţiale (Sn ) este
convergent.

În acest caz, dacă lim Sn = S, atunci S se numeşte suma seriei an şi scriem
n→∞

S= an = a1 + a2 + . . . + an + . . . .

Definiţia 9.1.4 Spunem că seria an este divergentă, dacă şirul sumelor parţiale (Sn ) este
divergent.

Exemplul 9.1 Seria numerică aq n , unde a, q ∈ R, se numeşte serie geometrică . Dacă


n=0
a = 0, avem Sn = 0 pentru orice q ∈ R, de unde rezultă că seria este convergentă, având
suma 0. Să considerăm a = 0. Atunci, pentru q = 1, avem

1 − q n+1
Sn = a + aq + . . . + aq n = a ,
1−q
iar pentru q = 1
Sn = a(n + 1).
a
Pentru q ∈ (−1, 1), deoarece lim q n+1 = 0, avem lim Sn = . Prin urmare, pentru
n→∞ 1−q n→∞
|q| < 1, seria geometrică este convergentă, având suma S = a/(1 − q).
Dacă q ≥ 1, atunci şirul (Sn ) are limita +∞ sau −∞ după cum a > 0 sau, a < 0,
iar pentru q ≤ −1 limita şirului (Sn ) nu există. Deci, pentru |q| ≥ 1 seria geometrică este

divergentă. În concluzie, seria geometrică aq n cenverge pentru a = 0, oricare q ∈ R şi


n=0
pentru a = 0 şi q ∈ (−1, 1). Prin urmare, pentru |q| < 1, putem scrie


a
aq n = a + aq + . . . + aq n + . . . = .
n=0
1−q



1
Exemplul 9.1.2. Seria este convergentă. Într-adevăr, avem
n=1
(2n − 1)(2n + 1)

n
1 n  
1 1 1
Sn = = − =
(2h − 1)(2h + 1) 2 2h − 1 2h + 1
h=1 h=1

170

1 1 1 1 1 1
= + − + − + ...+
1−
2 3 3 5 5 7

1 1 1 1
+ − + − =
2n − 3 2n − 1 2n − 1 2n + 1
 
1 1
= 1− .
2 2n + 1
1
Prin urmare, lim Sn = , ceea ce arată că seria dată este convergentă, având suma
n→∞ 2
1/2.

Observaţia 9.1.2 O serie an ı̂n care termenul general se poate pune sub forma an =
bn − bn+1 poartă numele de serie telescopică.

Exemplul 9.1.3. Seria (−1)n−1 este divergentă deoarece S2k−1 = 1 şi S2k = 0, pentru
n=1
orice k ∈ N∗ , şirul sumelor parţiale (Sn ) fiind divergent.


1
Exemplul 9.1.4. Seria , numită seria armonică, este divergentă.
n=1
n
1 1
În adevăr, şirul sumelor parţiale Sn = 1 + + . . . + este divergent deoarece nu este
2 n
şir Cauchy (v. Exemplul 8.1.13).

1
Observaţia 9.1.3 Seria este numită serie armonică deoarece an = 1/n este media ar-
n
monică a numerelor an−1 , an+1 , adică 2/an = 1/an−1 + 1/an+1 .

Propoziţia 9.1.1 Dacă seria an converge, atunci lim an = 0.


n→∞

Demonstraţie. Seria an fiind convergentă , avem lim Sn = S. Dar an = Sn − Sn−1 , de


n→∞
unde lim an = lim Sn − lim Sn−1 = S − S = 0.
n→∞ n→∞ n→∞

Corolarul 9.1.1 Dacă pentru seria an şirul (an ) nu converge la 0, atunci seria este di-
vergentă.

Observaţia 9.1.4 Condiţia lim an = 0 este necesară dar nu şi suficientă pentru convergenţa

n→∞
seriei an .


1
De exemplu, seria armonică este divergentă, deşi lim 1/n = 0.

√ n √n→∞
Exemplul 9.1.5. Seria n
n este divergentă deoarece lim n n = 1 = 0.
n→∞
n≥2

Definiţia 9.1.5 Fiind dată seria an , numim rest de ordinul k al ei, notat cu rk seria
n=1

an = ak+1 + ak+2 + . . .
n=k+1




Propoziţia 9.1.2 Seria an , seria rest an au aceeaşi natură, adică sunt ambele con-
n=1 n=k+1
vergente sau ambele divergente.

171
Demonstraţie. Fie n > k; notăm cu Sn şi respectiv Tn sumele parţiale corespunzătoare



termenului an din seria an şi respectiv an . Avem
n=k+1

Tn = Sn − (a1 + a2 + . . . + ak ).

Dacă an este convergentă, adică lim Sn = S, atunci lim Tn = S − (a1 + a2 + . . . +



n→∞ n→∞

ak ), ceea ce ne arată că seria an este tot convergentă. Reciproc, dacă an este
n=k+1 n=k+1
convergentă, adică lim Tn = T , atunci lim Sn = T + (a1 + . . . + ak ), ceea ce arată că seria

n→∞ n→∞
an este convergentă.
Evident că, dacă unul din şirurile (Sn ) şi (Tn ) este divergent atunci şi celălalt este



divergent. Prin urmare, dacă una din seriile an şi an este divergentă, atunci şi
n=1 n=k+1
cealaltă este divergentă.
Corolarul 9.1.2 Dacă unei serii numerice i se suprimă sau i se adaugă un numă finit de
termeni, atunci natura ei nu se schimbă.

Propoziţia 9.1.3 Dacă seria an converge atunci şirul resturilor (rk )k≥1 este convergent
la zero.

Demonstraţie. Dacă seria an este convergentă, atunci lim Sn = S. Cum, pentru orice
n→∞
k ∈ N∗ , avem rk = S − Sk , de unde lim rk = S − S = 0.
k→∞



Definiţia 9.1.6 Dacă considerăm seriile an şi bn se numeşte seria sumă seria nu-
n=1 n=1
merică

(an + bn ) = (a1 + b1 ) + (a2 + b2 ) + . . . + (an + bn ) + . . .


n=1

şi serie produs cu scalarul λ ∈ R seria numerică



(λan ) = λa1 + λa2 + . . . + λan + . . . .


n=1

Teorema 9.1.1 Dacă seria an converge, având suma A, iar seria bn converge, având

suma B atunci seria (an + bn ) converge şi are suma A + B.

n
Demonstraţie. Fie An = ak şi B = bk . Cum lim An = A, iar lim Bn = B, rezultă că
n→∞ n→∞
k=1 k=1

An + Bn = (ak + bk ) converge la A + B, ceea ce ne permite să scriem (an + bn ) = A + B.


k=1

Teorema 9.1.2 Dacă λ ∈ R − {0},atunci seriile an şi λan au aceeaşi natură.

n
Demonstraţie. Fie Sn = ak . Dacă an converge, atunci lim ak = S, ceea ce
n→∞
h=1 h=1

implică şi lim λSn = λS. Cum λa1 + . . . + λan = Tn = λSn , rezultă că şi seria λan este
n→∞

convergentă şi are suma λS. Dacă an este divergentă, atunci şirul (Sn ) diverge, ceea ce
n=1

172

atrage după sine că şirul Tn = λSn diverge, adică seria λan este divergentă. Reciproc
rezultă prin ı̂nlocuirea lui λ cu 1/λ.
Teorema 9.1.3 Dacă ı̂ntr-o serie convergentă se asociază termenii seriei ı̂n grupe cu un
număr finit de elemente, păstrând ordinea, atunci se obţine tot o serie covnergentă cu
aceeaşi sumă.

Demonstraţie. Fie seria an convergentă, Sn = a1 + a2 + . . . + an şi lim Sn = S. Să



n→∞
aranjăm termenii seriei an ı̂n grupe cu un număr finit de termeni astfel

(9.2) (a1 + a2 + . . . + an1 ) + (an1 +1 an2 +2 + . . . + an2 ) + . . . +


+(ank−1 +1 + ank−1 +2 + . . . + ank ) + . . .
păstrând ordinea termenilor. Notând bi = ani−1 +1 + ann−1 +2 + . . . + ani , i = 1, 2, 3, . . . şi Tk =
b1 + b2 + . . . + bk , k = 1, 2, . . . scriem Tk = Snk , k = 1, 2, . . . ceea ce ne arată că (Tk ) este un subşir
al şirului (Sn ). Deoarece lim Sn = S, deducem că lim Tk = lim Snk = S, ceea ce ne arată că
n→∞ k→∞ k→∞
seria (9.2) este convergentă, iar suma ei este S.

Observaţia 9.1.5 Reciproca teoremei nu are loc, adică dacă ı̂ntr-o serie an convergentă
ı̂n care termenii sunt grupe cu un număr finit de termeni, atunci prin desfăşurarea grupelor
(ı̂nlăturarea parantezelor), păstrând ordinea termenilor, se poate obţine o serie divergentă.
De exemplu, seria
(9.3) (1 − 1) + (1 − 1) + (1 − 1) + . . .
este convergentă, ı̂n imp ce seria

(9.4) 1 − 1 + 1 − 1 + 1 − 1 + ... = (−1)n−1


n=1

este divergentă.
Observaţia 9.1.6 Într-o serie divergentă se pot aranja termenii ı̂n grupe cu un număr finit
de elemente, păstrând ordinea, aşa ı̂ncât seria obţinută să fie convergentă. Astfel, seria
(9.4) este divergentă iar seria (9.3) este convergentă.

9.2 Criterii de convergenţă pentru serii numerice cu termeni


oarecare

Dacă ı̂n seria an nu facem nici o precizare asupra semnului termenilor, atunci se
mai spune că avem o serie numerică cu termeni oarecare. În acest paragraf ne interesează
să găsim criterii prin care să putem preciza convergenţa unei serii de numere reale. Este
important să cunoaştem convergenţa unei serii deoarece, cunoscând acest fapt, chiar dacă
nu-i cunoaştem suma, o putem evalua luând sume parţiale cu un număr cât mai mare de
termeni.

Teorema 9.2.1 (Criteriul lui Cauchy). Seria an este convergentă dacă şi numai dacă
pentru orice ε > 0 există un număr natural nε astfel ı̂ncât, pentru orice n natural, n > nε şi
orice p ∈ N∗ să avem
|an+1 + an+2 + . . . + an+p | < ε
Demonstraţie. Fie (Sn ) şirul sumelor parţiale, Sn = a1 + a2 + . . . + an . Cum seria an este
convergentă dacă şi numai dacă şirul (Sn ) este convergent,
iar şirul (Sn ) este covnergent
dacă şi numai dacă este şir fundamental , rezultă că serie an este convergentă dacă si

numai dacă, pentru orice ε > 0 şi orice p ∈ N , există nε ∈ N aşa ı̂ncât, petru orice n ∈ N,
n > nε să avem |Sn+p − Sn | < ε. De aici, prin ı̂nlocuirea corespunzătoare a sumelor Sn+p şi
Sn , obţinem valabilitatea criteriului lui Cauchy pentru serii numerice.

173

Teorema 9.2.2 (Criteriul Dirichlet). Seria an bn este convergentă dacă şirul sumelor

parţiale al seriei an este mărginit, iar şirul (bn ) este descrescător şi convergent la 0.

Demonstraţie. Fie (Sn ) şirul sumelor parţiale al seriei an , fiind mărginit, există un
M > 0 aşa ı̂ncât |Sn | ≤ M , pentru orice n natural.
Utilizând faptul că şirul (bn ) este descrescător putem scrie succesiv:

(9.5) |an+1 bn+1 + an+2 bn+2 + an+3 bn+3 + . . . + an+p bn+p | =

= |bn+1 (Sn+1 − Sn ) + bn+2 (Sn+2 − Sn+1 ) + bn+3 (Sn+3 + Sn+2 ) + . . . +


+bn+p (Sn+p + Sn+p−1 )| =
= | − bn+1 Sn + (bn+1 − bn+2 )Sn+1 + (bn+2 − bn+3 )Sn+2 + . . . +
+(bn+p−1 − bn+p )Sn+p−1 + bn+p Sn+p | ≤
≤ |Sn | |bn+1 | + |bn+1 − bn+2 | |Sn+1 | + |bn+2 − bn+2 | |Sn+2 | + . . . +
+|bn+p−1 − bn+p | Sn+p−1 | + |bn+p | Sn+p | ≤
≤ M (bn+1 + bn+1 − bn+2 + bn+2 − bn+3 + . . . + bn+p−1 − bn+p + bn+p ) =
= 2M bn+1
Deoarece bn+1 → 0 pentru n → ∞, pentru orice ε > 0 există nε ∈ N aşa ı̂ncât, pentru
orice n ∈ N, n > nε , să avem bn+1 < ε/2M . Acum, din (9.5) rezultă

|an+1 bn+1 + an+2 bn+2 + . . . + an+p bn+p | < ε

pentru orice n ∈ N, n > nε . Prin urmare,



sunt ı̂ndeplinite condiţiile din criteriul lui Cauchy
(Teorema 9.2.1), rezultând că seria an bn este convergentă.


sin nx

Exemplul 9.2.1. Fie seria √ , unde x ∈ R. Se observă că seria sin nx are şirul
n=1
n n=1
sumelor parţiale (Sn (x)) mărginit. Într-adevăr dacă x = 2kπ, k ∈ Z, ı̂nmulţind Sn (x) cu
2 sin x2 , găsim & '
cos x2 − cos n + 12 x
Sn (x) = ,
2 sin x2
de unde  & ' 
cos x − cos n + 1 x
2   2
|Sn (x)| = | sin x + . . . + sin nx| = ≤
2 sin x2 
2 1
≤   
x = 
 , pentru orice n ∈ N.

2 sin 2 sin x2 
Dacă x = 2kπ, k ∈ Z, atunci Sn (x) = 0. Deci, ı̂n ambele situaţii există M > 0 aşa ı̂ncât
|Sn (x)| ≤ M , pentru orice n ∈ N∗ . √
Pe de altă parte, şirul bn = 1/ n tinde descrescător la 0. Prin urmare, fiind ı̂ndeplinite


sin nx
condiţiile criteriului lui Dirichlet rezultă că seria √ este convergentă pentru orice
n=1
n
x ∈ R.

Teorema 9.2.3 (Criteriul lui Abel). Dacă seria an este convergentă şi (bn ) este un şir

monoton şi mărginit, atunci seria an bn este convergentă.

174
Demonstraţie. Cum şirul (bn ) este monoton şi mărginit rezultă că el este convergent; fie
lim bn = b. Fără a restrânge generalitatea demonstraţiei putem considera că şirul (bn ) este
n→∞
crescător. Atunci şirul (b − bn ) va fi un şir descrescător şi cu limita 0. Din faptul că serie

an este convergentă rezultă că şirul sumelor parţiale este mărginit. Aplicând criteriul

lui Dirichlet, deducem că serie an (b − bn ) este convergentă. Dar an fiind convergentă

rezultă că şi ban este convergentă. Acum, utilizând teorema 9.1.1, obţinem că seria

an bn este convergentă deoarece an bn = −an (b − bn ) + ban , pentru orice n ∈ N∗ . Cu această


teorema este demonstrată.  n


1
1 1
Exemplul 9.2.2. Fie seria n
1+ . Observăm că seria este convergentă, fiind
n=1
2 n 2n
1 & 'n
serie geometrică cu raţia ∈ (−1, 1), iar şirul bn = 1 + n1 , n ∈ N∗ , este strict crescător şi
2
mărginit (Exemplul 8.1.1). Cum sunt ı̂ndeplinite condiţiile criteriului lui Abel, deducem că
seria dată este convergentă.

Definiţia 9.2.1 O serie an se numeşte serie alternantă (sau alternată) dacă an an+1 < 0,
n=1
pentru orice n ∈ N∗ , adică dacă termenii săi alternează ca semn.

Este evident că orice serie alternantă poate fi scrisă ı̂n una din formele: (−1)n−1 an
n=1

sau (−1)n an , unde an ≥ 0, pentru orice n ∈ N∗ .


n=1



1 1 1 1 1 1 1 1
Exemplul 9.2.3. Seriile (−1) n−1
= 1− + − +. . . şi (−1)n = −1+ − + −. . .
n 2 3 4 n=1
2n − 1 3 5 7
sunt serii alternate.

Teorema 9.2.4 (Criteriul lui Leibniz). Dacă ı̂n serie alternantă (−1)n−1 an şirul (an ) este
n=1
descrescător şi convergent la zero, atunci seria este convergentă.


Demonstraţie. Cum seria (−1)n−1 are şirul sumelor parţiale mărginit (|Sn | ≤ 1, oricare
n=1
ar fi n ∈ N∗ ), iar şirul (an ) este descrescător şi convergent la 0 rezultă, conform criteriului
lui Dirichlet că seria alternantă este convergentă.


1
Exemplul 9.2.4. Seria (−1)n−1 este convergentă deoarece sunt ı̂ndeplinite
2n − 1
n=1 $ %
1
condiţiile criteriului lui Leibniz, adică şirul 2n−1 este descrescător şi convergent la
n≥1
zero.

Corolarul 9.2.1 Dacă seria (−1)n−1 an ı̂ndeplineşte condiţiile din Criteriul lui Leibniz
n=1
(Teorema 9.2.4) şi S este suma ei, atunci
|S − Sn | ≤ an+1 , pentru orice n ∈ N∗ ,

n
unde Sn = (−1)k−1 ak sumă parţială de rang n.
k=1

Demonstraţie. Într-adevăr, cum ak − ak+1 ≥ 0, k ∈ N∗ , atunci


 


n 
 
|S − Sn | =  (−1)n−1 an − (−1)k−1 ak  =
 
n=1 k=1

175
|(−1)n an+1 + (−1)n+1 an+2 + (−1)n+2 an+3 + . . . | =
= |(−1)n [(an+1 − an+2 ) + (an+3 − an+4 ) + . . .]| =
= (an+1 − an+2 ) + (an+3 − an+4 ) + . . . =
= an+1 − (an+2 − an+3 ) − (an+4 − an+5 ) − . . . ≤ an+1 .


1
Exemplul 9.2.5. Seria (−1)n−1 (numită seria armonică alternantă) este convergentă
n
  n=1
1
deoarece şirul este descrescător şi convergent la 0. Fie (Sn ) şirul sumelor parţiale al
n
seriei. Cum şirul
1 1
xn = 1 + + . . . + − ln n, n ∈ N∗ ,
n n
este convergent la γ–constanta lui Euler, avem
2n+1

1
S2n+1 = (−1)k−1 = x2n+1 + ln(2n + 1) − (γn + ln n) =
k
k=1

2n + 1
= x2n+1 − xn + ln ,
n
de unde
lim S2n+1 = γ − γ + ln 2 = ln 2.
n→∞

Deoarece şirul (Sn ) este convergent şi subşirul (S2n+1 ) are limita ln 2, rezultă că şi şirul
(Sn ) are limita S = ln 2. Atunci, pe baza Corolarului 9.2.1, putem scrie
1
|Sn − ln 2| ≤ , n ∈ N∗ ,
n+1
adică eroarea absolută prin care şirul (Sn ) aproximează pe ln 2 nu depăşeşte pe 1/(n + 1).

9.3 Serii absolut convergente. Serii semiconvergente




1
Am văzut ı̂n Exemplul 9.2.5. că seria armonică alternantă (−1)n−1 este conver-
n
∞  
n=1


 
gentă ı̂n timp ce seria (−1)n−1 1  = 1
, adică seria armonică, este divergentă (Exemplul
 n  n
n=1 n=1
9.1.1). Acest exemplu ne permite să considerăm definiţiile de mai jos, care ne permit o
clasificare a seriilor convergente.

Definiţia 9.3.1 Seria an se numeşte absolut convergentă, dacă seria |an | este conver-
gentă.


(−1)n−1
Exemplul 9.3.1. Seria este absolut convergentă.
n=1
2n

Propoziţia 9.3.1 Dacă seria an este absolut convergentă, atunci seria an este conver-
gentă.

Demonstraţie. Deoarece an este absolut convergentă rezultă că |an | este conver-
gentă. Atunci, conform cu criteriul lui Cauchy, pentru orice ε > 0, există nε ∈ N∗ aşa ı̂ncât,
pentru orice n ∈ N, n > nε şi orice n ∈ N∗ , să avem

|an+1 | + |an+2 | + . . . + |an+p | < ε.

176
Cum
|an+1 + an+2 + . . . + an+p | ≤ |an+1 | + |an+2 | + . . . + |an+p |,
obţinem că, pentru orice ε > 0, există nε ∈ N∗ , astfel ı̂ncât, pentru orice n ∈ N, n > nε şi orice
p ∈ N∗ , are loc
|an+1 + an+2 + . . . + an+p | < ε,

adică seria an satisface criteriul lui Cauchy, ceea ce ne arată că ea este o serie convergentă.

Observaţia 9.3.1 Reciproca Propoziţiei 9.3.1 nu are loc. Există serii convergente pentru
care seria valorilor absolute este divergentă; de exemplu, seria armonică alternantă.

Definiţia 9.3.2 Seria an se numeşte serie semiconvergentă sau condiţionat convergentă



dacă seria an este convergentă dar seria |an | este divergentă.

Exemplul 9.3.2. Seria (−1)n−1 este semiconvergentă.


n=1

Observaţia 9.3.2 (Riemann). Dacă an este o serie semiconvergentă, atunci există o


permutare a termenilor săi astfel ı̂ncât să se obţină: i) o serie convergentă cu suma un
număr real dat; ii) o serie divergentă cu suma +∞ sau −∞; iii) o serie divergentă cu şirul
sumelor parţiale fără limită (divergent, oscilant) (v. [3]).

Această observaţie ne avertizează că ı̂n seriile semiconvergente trebuie să fim atenţi
la schimbarea ordinii termenilor, deoarece putem obţine serii cu naturi diferite.



Definiţia 9.3.3 Fiind date seriile an şi bn se numeşte produs Cauchy sau de convoluţie
n=1 n=1


n
al celor două serii, serie cn ı̂n care cn = ak bn−k+1 .
n=1 k=1



(−1)n−1
Exemplul 9.3.3. Pentru seria √ produsul de convoluţie cu ea ı̂nsăşi este seria
n=1
n

cn , unde
n=1

n
(−1)k−1 (−1)n−k
n
1
cn = √ ·√ = (−1)n−1  ,
k=1
n n−k+1 n=1 k(n − k + 1)
n = 1, 2, . . ..


(−1)n−1
Se observă ı̂n exemplul precedent că seria √ este convergentă, conform cri-
n

n=1
teriului lui Leibniz, ı̂nsă seria cn a produsului de convoluţie este divergentă deoarece

n
1

n
1
|cn | =  ≥ √ √ = 1,
k=1
k(n − k + 1) k=1
n n

pentru orice n ∈ N∗ , adică lim cn = 0.


n→∞

Teorema 9.3.1 (Mertens). Dacă două serii sunt convergente şi cel puţin una este absolut
convergentă, atunci seria produs Cauchy al celor două serii este convergentă, iar suma sa
este egală cu produsul sumelor celor două serii.

177



Demonstraţie. Fie seria an = A şi bn = B, cu (An ) şi (Bn ) şirurile corespunzătoare ale
n=1 n=1

sumelor parţiale, iar cn seria produs de convoluţie, cu (Cn ) şirul sumelor parţiale. Să
n=1

presupunem că an este absolut convergentă. Avem


n=1

Cn = c1 + c2 + . . . + cn = a1 b1 + (a1 b2 + a2 b1 ) + . . . +
+(a1 bn + a2 bn−1 + . . . + an b1 ) =
= a1 (b1 + b2 + . . . + bn ) + a2 (b1 + . . . + bn−1 ) + . . . + an−1 (b1 + b2 ) + an b1 =
= a1 Bn + a2 Bn−1 + . . . + an−1 B2 + an B1 .

Deoarece seria bn este convergentă şi are suma B, şirul dn = Bn − B, n = 1, 2, . . .,


n=1
este convergent. Acum putem scrie
Cn = a1 (dn + B) + a2 (dn−1 + B) + . . . + an (d1 + B) =
B(a1 + a2 + . . . + an ) + a1 dn + a2 dn−1 = . . . + an d1 =
= BAn + a1 dn + a2 dn−1 + . . . + an d1 ,
de unde
(9.6) Cn − An B = a1 dn + a2 dn−1 + . . . + an d1 .

Cum seria |an | este convergentă rezultă că şirul sumelor ei parţiale este mărginit,
n=1
adică există un M > 0 aşa ı̂ncât

n
(9.7) |ak | < M, pentru orice n ∈ N∗ .
k=1

Din faptul că şirul (dn ) este convergent la 0, deducem că, pentru orice ε > 0, există
n1ε ∈ N∗ aşa ı̂ncât, pentru orice n > n1 să avem
ε
(9.8) |dn | < .
2M

Pe de altă parte, deoarece seria an este convergentă avem că an → 0. Atunci,


pentru orice ε > 0 există n2 ∈ N∗ aşa ı̂ncât, pentru orice n ∈ N, n > n2 , să avem
ε
|an | < .
2(|d1 | + |d2 | + . . . + |dn2 |)
Acum, din (9.6), (9.7) şi (9.8), pentru orice n natural, n > n1 + n2 − 1, avem
|Cn − An B| ≤ (|a1 | |dn | + |a2 | |dn−1 + . . . + |an−n1 | |dn1 +1 )+
+(|an−n1 +1 | |dn1 | + . . . + |an | |d1 |) <
ε
< (|a1 | + |a2 | + . . . ||an−n1 |)+
2M
ε
+ (|dn1 | + . . . + |d1 |) <
2(|d1 | + . . . + |dn1 |)
ε ε
< ·M + =ε
2M 2
Ceea ce ne arată că lim (Cn − An B) = 0. De aici, obţinem lim Cn = lim An B = A · B,
n→∞ n→∞ n→∞
ceea ce trebuia demonstrat.

178
9.4 Serii cu termeni pozitivi

În paragraful precedent am văzut că o serie an absolut convergentă este şi conver-

gentă. Cum ı̂n seria |an | avem |an | ≥ 0, n = 1, 2, . . ., rezultă că prezintă interes să obţinem

criterii de convergenţă pentru serii an , cu an > 0, n = 1, 2, 3, . . ..



Definiţia 9.4.1 O serie an cu an > 0, n = 1, 2, 3, . . ., se numeşte serie cu termeni pozitivi.


n−1

Teorema

9.4.1 (Criteriul mărginirii şirului sumelor parţiale). Seria cu termeni pozitivi


an este convergentă dacă şi numai dacă şirul sumelor parţiale este mărginit.

Demonstraţie. Dacă seria an este convergentă, atunci şirul sumelor parţiale (Sn ) este
convergent şi, prin urmare, mărginit.
Reciproc dacă şirul sumelor parţiale (Sn ) este mărginit, observând că el este strict
crescător (Sn+1 − Sn =
an+1 > 0, n = 1, 2, . . .), deducem că el este convergent, ceea ce ne
demonstrează că seria an este convergentă.
Criteriul mărginirii şirului sumelor parţiale ne va permite să obţinem condiţii sufi-
ciente pentru convergenţa seriilor cu termeni pozitivi.

Teorema 9.4.2 (Criteriul de comparaţie a termenilor generali). Fie seriile cu termenii poz-





itivi an şi bn astfel ca an ≤ bn , pentru orice n ∈ N∗ . i) Dacă bn este convergentă,


n=1 n=1 n=1





atunci şi an este convergentă; ii) Dacă an este divergentă, atunci şi bn este di-
n=1 n=1 n=1
vergentă.

Demonstraţie. Fie An = a1 + a2 + . . . + an şi Bn = b1 + b2 + . . . + bn pentru n ∈ N∗ . Din an ≤ bn


rezultă
(9.9) An ≤ Bn , pentru orice n ∈ N∗

i) Dacă bn este convergentă, atunci şirul (Bn ) este mărginit şi din (9.9) deducem că
n=1
şirul (An ) este mărginit, deci, conform criteriului mărginirii şirului sumelor parţiale,


seria an este convergentă.
n=1

ii) Dacă seria an este divergentă, atunci şirul (An ) este divergent şi crescător; deci,
n=1

şirul (Bn ) este divergent şi crescător. Prin urmare, seria bn este divergentă.
n=1

Observaţia 9.4.1 Criteriul de comparaţie al termenilor generali se păstrează şi dacă an ≤ bn


pentru orice n > n0 , n0 ∈ N.


1
Exemplul 9.4.1. Seria α
, α ∈ R se numeşte seria armonică generalizată.
n=1
n
Pentru α = 1 seria este divergentă (Exemplul 9.1.4.).


1
Dacă α < 1, atunci 1/nα > 1/n, pentru orice n ∈ N∗ . Cum seria este divergentă,
n=1
n

179


1
conform criteriului de comparaţie a termenilor generali obţinem că seria α
este diver-
n=1
n
gentă pentru α < 1.
Fie α ∈ R, α > 1. Avem
1≤1
1 1 1 1
+ α ≤ 2 · α = α−1
2α 3 2 2
 2
1 1 1 1 1 1
+ α + α + α <4· α <
4α 5 6 7 4 2α−1

 α t−1
1 1 1 1 1
+ + . . . + t α < 2 · n−1 α = ,
(2t−1 )α (2t−1 + 1)α (2 1) (2 ) 2α−1
de unde
t 1
2
−1
t 1 − (2α−1
1 1 )t 2α − 1
S2t −1 = < = 1 < α−1 ,
k α (2α−1 )k−1 1 − 2α−1 2 −1
k=1 k=1

adică subşirul (S2 t−1 ) al şirului sumelor parţiale (Sn ) este mărginit.
Cum şirul (Sn ) este crescător şi pentru orice n ∈ N există un t ∈ N aşa ı̂ncât n < 2t − 1,
deducem că şirul (Sn ) este mărginit. Prin urmare, conform criteriului mărginirii sumelor


1
parţiale rezultă că seria este convergentă pentru orice α ∈ R, α > 1.
n=1



1
Este bine de reţinut că seria armonică generalizată α
este convergentă pentru
n=1
n
α > 1 şi divergentă pentru α ≤ 1.


1
Exemplul 9.4.2. Seria  este convergentă deoarece
n=1 n(n + 1)(n + 2)

1 1
 <√ ,
n(n + 1)(n + 2) n3

1
iar seria este convergentă fiind o serie armonică generalizată cu α = 3/2 > 1.
n3/2
Teorema


(Criteriul de comparaţie al limitei raportului termenilor generali). Fie seri-
9.4.3
ile an şi bn cu termenii pozitivi.
an
i) Dacă există lim = λ şi λ ∈ (0, ∞), atunci cele două serii au aceeaşi natură.
n→∞ bn
an

ii) Dacă lim = 0, atunci dacă bn este convergentă rezultă că şi an este conver-
n→∞ bn

gentă, iar dacă an este divergentă rezultă că şi bn este divergentă.
an

iii) Dacă lim = ∞, atunci dacă an este convergentă rezultă că şi bn este conver-
n→∞ bn

gentă, iar dacă bn este divergentă rezultă că şi an este divergentă.
an
Demonstraţie. i) Din lim = λ rezultă că, pentru orice ε > 0, există nε ∈ N, aşa ı̂ncât,
n→∞ bn
 an 

pentru orice n > nε , să avem  − λ < ε, de unde
bn
an
λ−ε< < λ + ε.
bn

180
De aici, luând ε = λ/2, găsim
λ 3
(9.10) bn < an < λ · bn ,
2 2
pentru orice n > nλ/2 .
Din (9.10), aplicând teorema 9.4.2, rezultă afirmaţia de la i).
ii) Dacă λ = 0, atunci pentru orice ε > 0, există nε ∈ N, astfel ı̂ncât să avem −ε <
an /bn < ε, pentru orice n > n0 , de unde obţinem
(9.11) an < εbn , pentru orice n > n0 .
Aplicând criteriul de comparaţie a termenilor generali, din (9.11) rezultă afirmaţia de
la ii).
iii) Dacă lim an /bn = ∞, atunci rezultă că lim bn /an = 0, de unde, conform cu ii) al
n→∞ n→∞
teoremei, obţinem afirmaţiile de la iii).


1

n
Exemplul 9.4.3. Seria ( 2 − 1) este divergentă deoarece, considerând seria ,
n=2
n
cum √ 1
n
2−1 2n − 1
lim 1 = lim 1 = ln 2 > 0,
n→∞ n→∞
n n

1
rezultă conform teoremei 9.4.3i), că seria dată are aceeaşi natură ca şi seria armonică ,
n
adică divergentă.

Teorema 9.4.4 (Criteriul raportului – D Alembert). Fie seria numerică an cu termeni


n=1
an+1
pozitivi. Dacă ≤ λ < 1, pentru orice n ∈ N∗ , atunci seria este convergentă, iar dacă
an
an+1
≥ 1, pentru orice n ∈ N∗ , atunci seria este divergentă.
an
an+1
Demonstraţie. Dacă ≤ q < 1. atunci putem scrie
an
a2 a2 an
an = a1 · · · ... · ≤ a1 · q · q . . . q = a1 q n−1 ,
a1 a2 an−1  
(n−1) ori

de unde an ≤ a1 q n−1 . Cum q < 1, rezultă că seria geometrică aq n−1 este convergentă, iar
n=1

de aici, folosind criteriul de comparaţie, a termenilor generali, deducem că seria an este
convergentă, ı̂n acest caz.
an+1
Dacă ≥ 1, rezultă că şirul de numere pozitive (an ) este crescător, deci lim an = 0.
an
n→∞
Utilizând Corolarul 9.1.1, rezultă că seria an este divergentă.

an+1
Corolarul 9.4.1 Fie seria an cu termeni pozitivi. Dacă exită lim = l, atunci:
n→∞ an

i) dacă l < 1, seria an este covnergentă;


ii) dacă l > 1, seria an este divergentă.


an+1
Demonstraţie. i) Dacă lim = l < 1, atunci pentru orice ε, cu 0 < ε < 1 − l, există nε ∈ N
n→∞an
astfel ca, pentru orice n > ε, să avem
 
 an+1 
 
 an − l < ε,

181
de unde
an+1
< l + ε < 1, pentru orice n > nε .
an

Acum, folosind prima parte a Teoremei 9.4.4, obţinem că seria an este convergentă.
ii) În situaţia l > 1, procedând ı̂n mod analog, găsim
an+1
> l − ε > 1, pentru n > nε
an

De aici, utilizând a doua parte a Teoremei 9.4.4, deducem că seria an este diver-
gentă.
Observaţia 9.4.2 Corolarul 9.4.1 nu este aplicabil ı̂n situaţia l = 1. În acest caz, trebuie
apelat la alte metode pentru a preciza natura seriei de studiat.
Exemplul 9.4.4. Seria de numere reale


3n n!
,
n=1
nn

este cu termeni pozitivi. Vom studia natura ei utilizând criteriul raportului cu limită. Avem
succesiv:
3n+1 ·(n+1)!  n
an+1 (n+1)n+1 n
lim = lim 3n ·n!
= lim 3 =
n→∞ an n→∞ n→∞ n+1
nn
1 3
= 3 lim & n+1 'n =
n→∞
n
e
Cum 3/e > 1, rezultă că seria este divergentă.

Teorema 9.4.5 (Criteriul rădăcinii – Cauchy). Fie seria an cu termeni pozitivi. Dacă
√ √
n a
n ≤ λ < 1. pentru n ≥ 1, atunci seria este convergentă, iar dacă n an ≥ 1, pentru n ≥ 1,
atunci seria este divergentă.

Demonstraţie. Dacă n an ≤ λ < 1, atunci avem

an = ( n an )n ≤ λn , pentru orice n ≥ 1.

Cum seria geometrică λn este convergentă deoarece λ < 1, conform criteriului de


comparaţie a termenilor generali, rezultă că şi seria an este convergentă.



Dacă an ≥ 1, atunci an ≥ 1, deci lim = 0 şi deci, pe baza Corolarului 9.1.1, rezultă
n


n→∞
că seria an este divergentă.

Corolarul 9.4.2 (Criteriul rădăcinii cu limită). Fie seria an cu termeni pozitivi. Dacă
√n
există lim an = l, atunci seria este convergentă pentru l < 1 şi este divergentă pentru
n→∞
l > 1.

Demonstraţie. Dacă lim n an = l < 1, atunci pentru orice ε, cu 0 < ε < 1 − l, există un
n→∞
număr natural nε , aşa ı̂ncât

| n an − l| < ε, pentru n > nε ,

de unde

n
an < l + ε < 1, pentru n > nε ,
adică
an < (l + ε)n , pentru n > nε .

182

Cum seria geometrică (l + ε)n este convergentă, conform criteriului de comparaţie


a termenilor generali, rezultă că seria an este convergentă.


Dacă l > 1, procedând ı̂n mod analog, găsim

an > (l − ε)n , cu l − ε > 1, pentru n > nε ,


de unde obţinem că seria an este divergentă.


Exemplul 9.4.5. Seria numerică
∞ 

n
2a · n + 1
, cu a > 0,
n=1
n+1

este cu termeni pozitivi.


Utilizând criteriul rădăcinii cu limită, avem
/ n
n 2a · n + 1 2a · n + 1
lim = lim = 2a.
n→∞ n+1 n→∞ n+1

Dacă 2a < 1, adică a < 1/2, atunci seria numerică dată este convergentă, iar dacă
2a > 1, adică a > 1/2, atunci seria dată este divergentă.
Dacă a = 1/2 atunci termenul general al seriei este 1, ceea ce implică că seria este
divergentă.

Teorema 9.4.6 (Criteriul Raabe–Duhamel cu limită). Fie seria an cu termeni pozitivi.


Dacă  
an
lim n − 1 = l,
n→∞ an+1
atunci seria este convergentă când l > 1 şi este divergentă când l < 1.

Demonstraţie. Dacă l > 1, atunci pentru orice ε ∈ (0, l − 1) există nε ∈ N aşa ı̂ncât
 
an
n − 1 > l − ε, pentru n > nε ,
an+1

de unde
(9.12) (l − ε)an+1 < nan − nan+1 , pentru n > nε .
Fără a restrânge generalitatea, putem considera că (9.12) are loc pentru orice n ∈ N∗ .
Dând succesiv valorile 1, 2, . . . , n − 1 ı̂n (9.12) obţinem

(l − ε)a2 < a1 − a2

(l − ε)a3 < 2a2 − 3a3


..
.
(l − ε)an < (n − 1)an−1 − (n − 1)an ,
care adunate membru cu membru conduc la
(l − ε)(a2 + a3 + . . . + an ) <
(9.13)
< a1 + a − 2 + . . . + an−1 − (n − 1)an .

Punând Sn = a1 + a2 + . . . + an , n ∈ N∗ , din (9.13) obţinem

(l − ε)(Sn − a1 ) < Sn − nan < Sn , pentru orice n ∈ N∗ ,

183
de unde găsim
a1 (l − ε)
Sn < , pentru orice n ∈ N∗ ,
l−ε−1
ceea ce ne arată că şirul sumelor parţiale este mărginit.

Prin urmare conform cu criteriul
mărginirii şirului sumelor parţiale, deducem că seria an este convergentă.
Dacă l < 1, atunci pentru orice ε ∈ (0, 1 − l) există nε ∈ N astfel ı̂ncât
 
an
n − 1 < l + ε < 1, pentru orice n > nε ,
an+1

de unde
nan − nan+1 < an+1 , n > nε
adică
(9.14) nan < (n + 1)an+1 , n > nε .
Fără a micşora generalitatea, putem presupune că (9.14) are loc pentru orice n ∈ N∗ .
Luând succesiv ı̂n (9.14) pentru n valorile 1, 2, . . . , n − 1, obţinem

a1 < 2a2 , 2a2 < 3a3 , . . . , (n − 1)an−1 < nan ,

care ı̂nmulţite membru cu membru conduc la a1 < nan , de unde


1
an > a1 .
n

1
Cum seria armonică este divergentă, conform criteriului de comparaţie a terme-
n
nilor generali, deducem că şi seria an este divergentă.
Exemplul 9.4.6. Fie seria numerică


2 · 4 · 6 . . . 2n 1
· .
n=1
1 · 3 · 5 . . . (2n − 1) 2n +1

Să cercetăm natura acestei serii de termeni pozitivi. Notând cu an termenul general
al seriei, avem
0
an+1 2 · 4 · 6 . . . 2n(2n + 2) 1 2 · 4 . . . 2n 1
= · · =
an 1 · 3 · 5 . . . (2n + 1) 2n + 3 1 · 3 . . . (2n − 1) 2n + 1

2n + 2
= .
2n + 3
an+1
Cum lim = 1, rezultă că nu putem preciza natura seriei cu ajutorul criteriului
n→∞ an
raportului. Aplicăm criteriul Raabe–Duhamel:
   
an 2n + 3
lim n − 1 = lim n −1 =
n→∞ an+1 n→∞ 2n + 2

n 1
= lim = < 1,
n→∞ 2n + 2 2
de unde rezultă că seria dată este divergentă.

184
9.5 Problemă economică. Fluxul de venit
În problemele de capitalizare se pune problema: ce sumă trebuie investită ca după x
ani să se obţină o sumă egală cu a, dacă se cunoaşte dobânda r% şi frecvenţa capitalizării
ei.
Să notăm cu S suma investită (ce trebuie aflată). Ea se numeşte valoarea prezentă şi
scontată a sumei a, disponibilă peste x ani.
Dacă dobânda r% se capitalizează o dată pe an, atunci din aplicaţia economică din
1.1, rezultă că suma disponibilă peste x ani este S(1 + r)x . Atunci, din

S(1 + r)x = a,

rezultă
a
S= .
(1 + r)x
Dacă dobânda s-ar capitaliza de n ori pe an, cu r%, atunci
a
S=& 'nx .
1 + nr

În fine, dacă, dobânda s-ar adăuga continuu, cu r%, atunci

S = ae−rx .

Parametrii de care depinde S sunt r şi n, care reprezintă dobânda şi frecvenţa cap-
italizării. Se observă că suma prezentă S este cu atât mai mică cu cât dobânda este mai
mare şi cu cât se capitalizează mai des.
Problema pusă se poate extinde astfel: dacă dorim să variem veniturile de la an la an
cu valorile a0 , a1 , . . . , am , adăugându-se ı̂n fiecare an dobânda r%,a tunci valoarea variaţiei
venitului, numită flux de venituri, ar fi
a1 a2 am
(9.15) a0 + + + ... + .
1 + r (1 + r)2 (1 + r)m

Suma (9.15) se numeşte valoarea de capital a fluxului de venit. Ea este suma S ce


trebuie investită pentru a obţine veniturile a0 , a1 , . . . , am ı̂n anii următori.
Se observă că dacă numărul anilor de capitalizare ar creşte indefinit, atunci suma
(9.15) reprezintă o serie de tip geometric.
Să considerăm acum un flux de venit ı̂n valoare a care ı̂ncepe ı̂n anul următor şi
continuă timp de n ani cu dobânda anuală r%. Atunci valoarea prezentă a fluxului va fi
a a a
S= + 2
+ ... + =
1 + r (1 + r) (1 + r)n
1 *  n +
a 1 − (1+r) n a 1
· 1 = 1− .
1+r 1 − 1+r r 1+r
Dacă fluxul de venit continuă indefinit, atunci valoarea prezentă se obţine prin

trecere la limită, făcând n → ∞, adică suma seriei geometrice convergente a/(1 + r)n .
n=1
Prin urmare, valoarea prezentă S a sumei a, care va fi capitalizată la nesfârşit, cu rata
dobânzii r% anual, este a/r.

185
9.6 Test de verificare a cunoştinţelor nr. 8
1. Definiţi următoarele noţiuni:

a) Serie numerică;
b) Serie numerică convergentă;
c) Suma unei serii numerice;
d) Serie numerică semiconvergentă.

2. Enunţaţi:

a) Criteriul lui d Alembert (raportului) pentru serii cu termeni pozitivi;


b) Criteriul lui Cauchy (radicalului) pentru serii cu termeni pozitivi;
c) Criteriul lui Raabe - Duhamel pentru serii cu termeni pozitivi;
d) Criteriul lui Leibniz pentru serii alternante;
e) Primul criteriu de comparaţie pentru serii cu termeni pozitivi.

1
3. Aflaţi suma seriei un cu un = .
n(n + 1)
n≥1


n2 + n − 3
4. Aflaţi suma seriei un cu un = .
n!
n≥2

5. cercetaţi natura seriilor un cu:


n≥1

nn
a) un = ,
n!
a · n!
n
b) un = cu a > 0, a = e,
nn
n2
c) un = n .
2

6. Să se studieze natura seriilor un cu:


n≥1
 n
2n + 1
a) un = ,
3n + 2
1 2n
b) un = (n + 1)(n + a) − n cu a > 0,
1
c) un =  n2 ,
1
1+
n
 n
13 + 23 + ... + n3 n
d) un = − .
n3 4

7. Să se studieze natura seriei un , unde


n≥1

n!
un = cu λ ∈ R.
(λ + 1)(λ + 2)...(λ + n)

8. Să se studieze natura seriilor

186

* +a
1 · 3 · 5 · ... · (2n − 1) 1
a) un cu un = · cu a ∈ R3 .
2 · 4 · 6 · ... · (2n) nn
n≥1

1
b) un , cu un = √ , folosind primul criteriu de comparaţie pentru serii cu
n≥1
3
n4 + 1
termeni pozitivi.

c) un cu:
n≥1
1
i) un = , α ≤ 1,

1
ii) un = α , α ≥ 2.
n
folosind criteriul general al lui Cauchy.

9. Să se studieze absolut convergenţa şi semiconvergenţa seriei numerice un cu:


n≥1

(−1)n−1
a) un =  ,
n(n + 1)
sin na
b) un = , a ∈ R.
2n

10. Să se studieze natura seriei un cu:


n≥1

1
a) un = (−1)n · ,
3n
n
b) un = (−1)n · 2 .
n −1

187
Indicaţii şi răspunsuri Testul nr. 8

3. S = 1.

4. S = 4.

5. a) Serie divergentă;
b) Serie divergentă pentru a > e, respectiv convergentă pentru a < e;
c) Serie convergentă.

6. a) Pentru a < 1 seria converge. Pentru a ≥ 1 seria diverge;


b) Serie convergentă;
c) Serie convergentă;
d) Serie convergentă.

7. Pentru λ > 1 seria converge. Pentru λ ≤ 1 seria diverge.

8. a) Pentru a ≤ −2 seria diverge. Pentru a > −2 seria converge;



1
b) Se compară cu seria 4 care converge, deci şi seria dată converge.
n≥1
n3
c) La (i) seria diverge iar la (ii) seria converge.
9. a) Serie semiconvergentă;
b) Serie absolut convergentă, deci şi convergentă.

10. a) Serie absolut convergentă, deci şi convergentă;


b) Serie convergentă.

188
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul II,
Editura ULB, Sibiu, 2002.
[2] Donciu, N., Flondor, D., Algebră şi analiză matematică. Culegere de probleme,
Editura Didactică şi Pedagogică, Bucureşti, 1979.
[3] Nicolescu, M., Dinculeanu, N., Marcus, S., Manual de analiză matematică, Vol.I,
1962, Vol.II, 1964, Editura Didactică şi Pedagogică, Bucureşti.
[4] Olaru, V., Halanay, A., Turbatu, S., Analiză matematică, Editura Didactică şi Ped-
agogică, Bucureşti, 1983.

189
Capitolul 10

Funcţii ı̂ntre spaţii metrice

Obiective: Prezentarea noţiunilor generale legate de funcţiile ı̂ntre spaţii metrice (ı̂n
special cazurilor Rn şi R).
Rezumat: În acest capitol sunt introduse şi studiate noţiunile de vecinatate a unui
punct ı̂ntr-un spaţiu metric, funcţie ı̂ntre spaţii metrice, limită a unei funcţii ı̂ntr-un punct,
continuitatea funcţiilor ı̂ntre spaţii metrice.
Conţinutul capitolului:
1. Vecinătate a unui punct
2. Funcţii ı̂ntre spaţii metrice
3. Limita unei funcţii ı̂ntr-un punct
4. Continuitatea funcţiilor ı̂ntre spaţii metrice
5. Test de verificare a cunoştinţelor
6. Bibliografia aferentă capitolului
Cuvinte cheie: funcţie ı̂ntre spaţii metrice, vecinătate, limită, continuitate.

10.1 Vecinătatea unui punct


Noţiunea de vecinătate a unui punct ı̂ntr-un spaţiu metric este fundamentală ı̂n setarea
noţiunilor de limită şi de continuitate.
Definiţia 10.1.1 Fie (X, d) un spaţiu metric şi a un punct arbitrar din X şi r un număr real
pozitiv.
Mulţimea
S(a, r) = {x ∈ X|d(a, x) < r}
se numeşte sferă (bilă) deschisă sau de centru a şi rază r, iar mulţimea

S(a, r) = {x ∈ X|d(a, x) ≤ r}

se numeşte sferă (bilă) ı̂nchisă de centru a şi rază r.


Exemplul 10.1.1. Pentru X = R şi d(x, y) = |x − y|, pentru orice x, y ∈ R. sfera deschisă

S(a, r) = {x ∈ R⊥ : |x − a| < r} = (a − r, a + r)

este intervalul deschis, centrat ı̂n a, iar sfera ı̂nchisă

S(a, r) = {x ∈ R⊥ : |x − a| ≤ r}

este intervalul ı̂nchis [a − r, a + r].


Exemplul 10.1.2. Pentru X = R2 , sfera ı̂nchisă, şi respectiv deschisă, de centru (a, b)
şi de rază r ı̂n raport cu metrica euclidiană

d(x, y) = (x1 − y1 )2 + (x2 − y2 )2 , unde x = (x1 , x2 ) şi

190
y = (y1 , y2 ∈ R2 ),sunt date, repectiv, ı̂n figurile 10.1.1. şi 10.1.2.

Fig.10.1.1. Fig.10.1.2.

Exemplul 10.1.3. Pentru X = R2 şi d(x, y) = max{|x1 − y1 |, |x2 − y2 |}, dacă x = (x1 , x2 ),
y = (y1 , y2 ), sfera deschisă de rază r şi centru x0 = (a, b) ∈ R2 este trasată ı̂n figura 10.1.4.,
iar sfera ı̂nchisă de aceeaşi rază şi acelaşi centru este trasată ı̂n figura 10.1.3.

Fig.10.1.3. Fig.10.1.4.

Exemplul 10.1.4. Dacă X = R3 şi d(x, y) = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 , unde x =
(x1 , x2 , x3 ), y = (y1 , y2 , y3 ), atunci sfera deschisă S(x0 , r) coincide cu interiorul sferei cu centrul
ı̂n x0 = (a, b, c) şi de rază r, iar sfera ı̂nchisă S(x0 , r) coincide cu mulţimea punctelor din R3
aflate ı̂n interiorul sferei sau pe sfera de rază r şi centru x0 .
Definiţia 10.1.2 Fie spaţiul metric (X, d) şi x0 un punct arbitrar din X. Numim vecinătate
a punctului x0 o mulţime V (x0 ) a spaţiului X pentru care există o sferă deschisă centrată
ı̂n x0 , conţinută ı̂n V .
Altfel spus, V (x0 ) este vecinătate a lui x0 dacă există r > 0 aşa ı̂ncât S(x0 , r) ⊂ V (x0 ).

Propoziţia 10.1.1 Fie (X, d) un spaţiu metric şi x0 un punct arbitrar din X. Sunt valabile
următoarele proprietăţi:

1) dacă V (x0 ) este o vecinătate a punctului x0 , atunci orice supramulţime a sa, V , este,
de asemenea vecinătate a punctului x0 ;

2) dacă V1 (x0 ) şi V2 (x0 ) sunt două vecinătăţi ale punctului x0 , atunci V1 (x0 ) ∩ V2 (x0 ) este
vecinătate a punctului x0 ;

3) dacă V (x1 ) este o vecinătate a punctului x0 atunci x0 ∈ V (x0 );

4) dacă V (x0 ) este o vecinătate a punctului x0 , atunci există o vecinătate W (x0 ) a punc-
tului x0 astfel ca pentru orice y ∈ W (x0 ) mulţimea V (x0 ) să fie vecinătate a punctului
y.

191
Demonstraţie. 1) Cum V (x0 ) este vecinătate a lui x0 rezultă că există r > 0 aşa ı̂ncât
S(x0 , r) ⊂ V (x0 ). Dar atunci S(x0 , r) ⊂ U , adică U este o vecinătate a lui x0 .
2) Din faptul că V1 (x0 ) şi V2 (x0 ) sunt vecinătăţi ale lui x0 rezultă că există r1 > 0 şi r2 > 0,
aşa ı̂ncât S(x0 , r1 ) ⊂ V1 (x0 ) şi S(x0 , r2 ) ⊂ V2 (x0 ). Considerând r = min(r1 , r2 ) se observă că
S(x0 , r) ⊂ Vi (x0 ), i = 1, 2; deci S(x0 , r) ⊂ V1 (x0 ) ∩ V2 (x0 ). Prin urmare, V1 (x0 ) ∩ V2 (x0 ) este o
vecinătate a lui x0 .
3) Această proprietate rezultă din definiţia vecinătăţii lui x0 .
4) Cum V (x0 ) este vecinătate a lui x0 rezultă că există r > 0 aşa ca S(x0 , r) ⊂ V (x0 ).
Considerăm W (x0 ) = S(x0 , r). Dacă y ∈ W (x0 ), ı̂ntrucât d(y, x0 ) < r, luând r1 aşa ı̂ncât
0 < r1 < r − d(y, x0 ), avem S(y, r1 ) ⊂ S(x0 , r) ⊂ V (x0 ). Într-adevăr, dacă z ∈ S(y, r), atunci
d(y, z) < r1 şi ţinând seama de alegerea lui r1 , avem d(z, x0 ) ≤ d(z, y) + d(y, x0 ) < r1 + d(x0 , y) < r,
ceea ce ne arată că z ∈ S(x0 , r). Prin urmare, S(y, r1 ) ⊂ V (x0 ), adică V (x0 ) este vecinătate
pentru y ∈ W (x0 ).
Din demonstraţia proprietăţii 4) a Propoziţiei 10.1.1, rezultă:

Corolarul 10.1.1 Orice sferă deschisă dintr-un spaţiu metric este vecinătate pentru orice
punct al său.

Teorema 10.1.1 (Proprietatea de separaţie Hausdorff ). Dacă a şi b sunt două puncte dis-
tincte ale spaţiului metric (X, d),a tunci există o vecinătate V (a) a punctului a şi o vecinătate
U (b) a punctului b astfel ca V (a) ∩ U (b) = ∅.
 
k
Demonstraţie. Cum a = b, rezultă d(a, b) = k > 0. Considerăm V (a) = S a, şi U (b) =
  3
k
S b, . Evident că V (a) şi U (b) sunt vecinătăţi respectiv ale punctelor a şi b. Vom arăta că
3
k
V (a) ∩ U (b) = Φ. Presupunem contrariul, adică există z ∈ V (a) ∩ U (b). Atunci avem d(a, z) <
3
k k k 2k 2
şi d(b, y) < . Dar putem scrie k = d(a, b) ≤ d(a, z) + d(z, b) < + = , de unde 1 < , ceea
3 3 3 3 3
ce evident este absurd. În concluzie, V (a) ∩ U (b) = Φ.

Definiţia 10.1.3 O submulţime D a spaţiului metric (X, d) se numeşte mulţime deschisă ı̂n
X fie dacă D = Φ, fie dacă D este o vecinătate pentru orice punct al său, adică dacă pentru
orice x ∈ D există r > 0 astfel ca S(x, r) ⊂ D.

Exemplu 10.1.5. Orice sferă deschisă S(x0 , r) dintr-un spaţiu metric este o mulţime deschisă.
Valabilitatea acestei afirmaţii rezultă din Corolarul 10.1.1. În particular, dacă luăm X = R
cu metrica euclidiană, atunci orice interval de forma (x0 − r, x0 + r), cu r > 0, este o mulţime
deschisă.
Exemplu 10.1.6. În X = R cu metrica euclidiană, orice interval de forma (a, b), a < b, sau
(a, +∞) sau (−∞, b), cu a, b ∈ R, este o mulţime deschisă.
Exemplul 10.1.7. Mulţimile D1 = {(x, y) ∈ R2 |2 < x < 4, −3 < y < 2} şi D2 = {(x, y) ∈ R2 |x2 +y 2 =
4} sunt deschise.
Exemplul 10.1.8. Mulţimea {x ∈ R|3 < x ≤ 4} nu este deschisă ı̂ntr-ucât (3, 4] nu este
vecinătate pentru 4 (nici o sferă cu centrul ı̂n 4 nu este conţinută ı̂n (3, 4]).

Propoziţia 10.1.2 Fie (X, d) un spaţiu metric. Sunt valabile următoarele afirmaţii:

1) Orice reuniune (finită sau infinită) de mulţimi deschise este o mulţime deschisă;

2) Intersecţia a doua mulţimi deschise este o mulţime deschisă;

3) X este o mulţime deschisă;

4) Orice mulţime deschisă nevidă se poate reprezenta ca o reuniune de sfere deschise.

192
)
Demonstraţie. 1) Fie (Di )i∈I o familie oarecare de mulţimi deschise ale lui X şi fie D = Di .
i∈I
Dacă D = Φ, atunci D este deschisă pe baza Definiţiei 10.1.3. Dacă D = Φ, să considerăm
un x ∈ D arbitrar. Atunci rezultă că există Di0 aşa ı̂ncât x ∈ Di0 . Cum Di0 este mulţime
deschisă rezultă că Di0 este vecinătate pentru x. Dar Di0 ⊂ D şi atunci ı̂n conformitate cu
proprietatea 1) din Propoziţia 10.1.1, obţinem că D este vecinătate a punctului x. Deoarece
x a fost ales arbitrar rezultă că D este o mulţime deschisă.
2) Fie D1 şi D2 două mulţimi deschise şi D = D1 ∩ D2 . Dacă D = Φ, atunci proprietatea este
evidentă. Dacă D = Φ, atunci fie x ∈ D arbitrar. Atunci x ∈ D1 şi x ∈ D2 . Cum D1 şi D2
sunt deschise, rezultă că D1 şi D2 sunt vecinătăţi ale punctului x. Folosim proprietatea 2)
din Propoziţia 10.1.1, rezultă că şi D este vecinătate pentru punctul x. Cum x a fost ales
arbitrar rezultă că D este o mulţime deschisă.
3) Este evidentă.
4) Fie D = Φ o )
mulţime deschisă;
) atunci pentru orice x ∈ D există)rx > 0 aşa ı̂ncât S(x1 , rx ) ⊂
D. Dar D = {x} ⊂ S(x, rx ) ⊂ D, de unde rezultă D = S(x, rx ), ceea ce trebuie
x∈D x∈D x∈X
demonstrat.
Corolarul 10.1.2 Intersecţia unui număr finit de mulţimi deschise este o mulţime deschisă.
Justificarea acestui corolar rezultă din afirmaţia 2) de la Propoziţia 10.1.2.
O intersecţie infinită de mulţimi deschise poate să nu mai fie o mulţime deschisă. Se
poate vedea acest fapt din exemplul următor.  
1 1
Exemplul 10.1.9. În spaţiu metric X = R cu metrica euclidiană mulţimea Dk = − , este
k k

3
deschisă, pentru orice k ∈ N∗ . Se observă că Dk = {0} care nu este o mulţime deschisă
k=1
deoarece pentru orice r > 0, intervalul (−r, r) ⊂ {0}.
Definiţia 10.1.4 O submulţime H a spaţiului metric (X, d) se numeşte ı̂nchisă dacă comple-
mentara C(X) = X − H este deschisă.
Exemplul 10.1.10. Mulţimile X şi Φ sunt ı̂nchise deoarece C(x) = Φ şi C(Φ) = X sunt deschise.
Exemplul 10.1.11. Orice sferă ı̂nchisă dintr-un spaţiu metric (X, d) este o mulţime ı̂nchisă.
Într-adevăr, fie S(x0 , r) = {x ∈ X|d(x, x0 ) ≤ r} şi fie y ∈ C(S(x0 , r)) ales arbitrar. Dacă
luăm 0 < r1 < d(y, x0 ) − r, atunci se observă că S(y, r1 ) ⊂ C(S(x0 , r)), adică C(S(x0 , r)) este
vecinătate pentru punctul y.
În particular, pentru X = R intervalul ı̂nchis [a, b], a, b ∈ R, a ⊂ b este o mulţime ı̂nchisă.
Utilizând Propoziţia 10.1.2 şi formulale lui Morgan rezultă valabilitatea următoarei
propoziţii:
Propoziţia 10.1.3 Dacă (X, d) este un spaţiu metric, atunci:
1) Orice intersecţie de mulţimi ı̂nchise ale lui X este o mulţime ı̂nchisă;
2) Orice reuniune finită de mulţimi ı̂nchise ale lui X este o mulţime ı̂nchisă.

Observaţia 10.1.1 Un spaţiu metric conţine şi submulţimi care nu sunt nici deschise nici
ı̂nchise. De exemplu, dacă X = R cu metrica euclidiană, atunci un interval de forma [a, b)
cu a, b ∈ R, a < b, nu este nici mulţime deschisă nici ı̂nchisă. Nu este deschisă deoarece
mulţimea [a, b) nu este vecinătate pentru punctul a şi nu este ı̂nchisă deoarece complementara
C([a, b)) = R − [a, b) = (−∞, a) ∪ [b, ∞) nu este mulţime deschisă, nefiind vecinătate pentru
punctul b.

Definiţia 10.1.5 Dacă A este o submulţime nevidă a spaţiului metric (X, d), numim di-
ametrul mulţimii A, notat δ(A), elementul din R+ = (0, ∞) ∪ (+∞) definit prin

δ(A) = sup{d(x, y)|x ∈ A, y ∈ A}.

193
2
Exemplul 10.1.13. Dacă X = R  este ı̂nzestrat cu metrica
√ euclidiană şi A = {(x, y) ∈ R2 |1 ≤
2 2
x ≤ 2, 1 ≤ y < 3}, atunci δ(A) = (2 − 1) + (3 − 1) = 5.
Definiţia 10.1.6 Fie A o submulţime nevidă a spaţiului metric (X, d). Spunem că A este o
mulţime mărginită dacă δ(A) < +∞. Dacă δ(A) = +∞, atunci spunem că mulţimea A este
nemărginită. Practic, pentru a arăta că o mulţime A este mărginită este suficient să rătăm
că mulţimea {d(x, y)|x, y ∈ A} este majorată.

Propoziţia 10.1.4 O mulţime nevidă A ⊂ (X, d) este mărginită dacă şi numai dacă există o
sferă deschisă S(x0 , r). aşa ı̂ncât A ⊂ S(x0 , r).

Demonstraţie. Fie A = Φ şi mărginită. Dacă A conţine un singur punct, atunci proprietatea
este evidentă. Să presupunem că A conţine cel puţin două puncte. Considerăm x0 şi x1
două puncte arbitrare diferite din A. Fie r ∈ R, r > d(x0 , x1 ) + δ(A); evident r > 0. Pentru
sfera S(x0 , r) avem A ⊂ S(x0 , r) deoarece, pentru orice y ∈ A, avem d(y, y0 ) < δ(A) < r.
Reciproc, dacă există o sferă deschisă S(x0 , r) aşa ı̂ncât A ⊂ S(x0 , r), atunci δ(A) ≤
δ(S(x0 , r)) ≤ 2r, adică A este o mulţime mărginită.
Definiţia 10.1.7 Fie A o submulţime nevidă a spaţiului metric (X, d). Un punct x0 ∈ A este
numit punct interior al mulţimii A dacă A este o vecinătate pentru x0 , dacă există r > 0
aşa ı̂ncât S(x0 , r) ⊂ A.

Definiţia 10.1.8 Mulţimea tuturor punctelor interioare mulţimii A se numeşte interiorul lui
A şi se notează cu Å sau int A.

Exemplul 10.1.14. Fie X = R spaţiul metric ı̂nzestrat cu metrica euclidiană, iar A1 = [a, b],
A2 = [a, b), A3 = (a, b], A4 = (a, b) submulţimi ale lui X. Se observă că: Å1 = Å2 = Å3 = Å4 =
(a, b). Punctul a nu este interior lui A1 deoarece A1 nu este vecinătate pentru a.
Teorema 10.1.2 Mulţimea A nevidă din spaţiul metric (X, d) este deschisă dacă şi numai
dacă A = Å.
Demonstraţie. Să presupunem că A este deschisă; atunci pentru orice x ∈ A avem că A este
o vecinătate a lui x, adică x ∈ Å. Cum totdeauna Å ⊂ A, obţinem A = Å.
Reciproc, dacă A = Å, atunci orice x ∈ A este punct interior lui A şi deci A este o
vecinătate a lui x, ceea ce ne arată că A este deschisă.
Definiţia 10.1.9 Fie A o submulţime nevidă a spaţiului metric (X, d). Un punct interior
complementarei lui A se numeşte punct exterior mulţimii A, iar int C(A) se numeşte exte-
riorul lui A, notat prin Ext A.

Definiţia 10.1.10 Fie A o submulţime a spaţiului metric (X, d) un element x0 ∈ X se numeşte


punct aderent mulţimii A dacă pentru orice vecinătate V (x0 ) a lui x0 avem V ∩ A = Φ.

Definiţia 10.1.11 Dacă A ⊂ (X, d), mulţimea tuturor punctelor aderente mulţimii se numeşte
aderenţa sau ı̂nchiderea mulţimii A, notată cu A.

Exemplul 10.1.15. Orice punct al mulţimii A din Definiţia 10.1.10 este punct aderent al
mulţimii A. Evident că avem A ⊆ A.
Exemplul 10.1.16. Pentru mulţimea A = (a, b) ⊂ R, a, b ∈ R, a < b, punctele a, b sunt puncte
aderente deoarece orice vecinătate a lor are puncte comune cu A. Avem A = [a, b].
Teorema 10.1.3 Mulţimea A din spaţiul metric (X, d) este ı̂nchisă dacă şi numai dacă A = A.
Demonstraţie. Să admitem că A este o mulţime ı̂nchisă. Atunci conform Definiţiei 10.1.4,
deducem că mulţimea C(A) este deschisă. Cum A ⊆ A trebuie să arătăm că A ⊆ A. Dar
A ⊆ A este echivalent cu C(A) ⊆ C(A). Fie x ∈ C(A) arbitrar, cu C(A) deschisă. Atunci
conform Definiţiei 10.1.3 rezultă că C(A) este vecinătate a lui X. Însă C(A) ∩ A = Φ, ceea ce
implică x ∈ A, deci x ∈ C(A).

194
Reciproc, să presupunem că A = A. Fie x ∈ C(A) = C(A); atunci x ∈ A, deci există o
vecinătate V (x) a punctului x, cu proprietatea V (x) ∩ A = Φ. Rezultă că V (x) ⊂ C(A); de
unde, pe baza proprietăţii 1) din Propoziţia 10.1.1, obţinem că C(A) este o vecinătate a
punctului x. Cum x a fost ales arbitrar din C(A), deducem că C(A) este o mulţime deschisă,
adică A este ı̂nchisă.
Definiţia 10.1.12 Fie A o submulţime a spaţiului metric (X, d). Numim frontiera mulţimii
A, notată cu ∂A sau F r A, mulţimea A ∩ C(A). Punctele mulţimii F r A se numesc punctele
frontieră ale mulţimii A.
Este evident că F r A = A − Å.

Exemplul 10.1.17. Dacă A = [a, b], atunci F r A = {a, b}.


Exemplul 10.1.18. Dacă A = Q, atunci A = Q = R, C(Q) = R şi F r A = R.
Exemplul 10.1.19. Dacă A = R2 , atunci F r A = Φ.

Definiţia 10.1.13 O submulţime A a unui spaţiu metric X, d) se numeşte densă ı̂n X dacă
X = A.

Exemplul 10.1.20. Mulţimea Q este densă ı̂n R (ı̂nzestrat cu metrica euclidiană) deoarece
Q = R. La fel mulţimea numerelor iraţionale R − Q este densă ı̂n R.
Exemplul 10.1.21. Mulţimea Qn = Q × Q × . . . × Q (de n ori) este densă ı̂n R.

Definiţia 10.1.14 Un spaţiu metric (X, d) se numeşte separabil dacă conţine o submulţime
A numărabilă şi densă ı̂n X.

Exemplul 10.1.22. Spaţiul metric R ı̂nzestrat cu metrica euclidiană este separabil deoarece
Q este mulţime numărabilă şi densă ı̂n R.
Exemplul 10.1.23. Spaţiu metric Rn , n ≥ 1, ı̂nzestrat cu metrica euclidiană este separabil
deoarece mulţimea Qn este numărabilă şi densă ı̂n Rn .

Definiţia 10.1.15 Fie A o submulţime a spaţiului metric (X, d). Un punct x ∈ X se numeşte
punct de acumulare pentru mulţimea A dacă pentru orice vecinătate V (x) a lui x are loc
(V (x) − {x}) ∩ A = Φ, adică ı̂n orice vecinătate V (x) a punctului x se găsesc puncte din A,
diferite de x.
Mulţiema punctelor de acumulare ale mulţimii A se numeşte mulţimea derivată şi se
notează cu A .

Observaţia 10.1.2 Orice punct de acumulare este un punct aderent.

Observaţia 10.1.3 În orice vecinătate a unui punct de acumulare x0 se găseşte o infinitate
de puncte din A. Într-adevăr, dacă propunem că există o vecinătate V (x0 ) a punctului x0
care să conţină numai un număr finit de puncte x1 , x2 , . . . , xn , diferite de x0 şi aparţinând
lui A, atunci alegând r aşa ı̂ncât 0 < r < min λd(x0 , xi )}, sfera S(x0 , r) nu mai conţine nici
i=1,n
un punct din A diferit de x0 , ceea ce contrazice definiţia punctului de acumulare.

Din această observaţie rezultă că o mulţime finită nu are puncte de acumulare.

Definiţia 10.1.16 Fie A o submulţime a spaţiului metric (X, d). Un punct x ∈ A care nu este
punct e acumulare pentru A se numeşte punct izolat.
Altfel spus, un punct x ∈ A este izolat dacă există o vecinătate V (x) a sa astfel ı̂ncât
V (x) ∩ A = {x}.

Exemplul 10.1.24. Pentru mulţimea A = (0, 1) ∪ {2, 3} din R avem A = [0, 1], iar punctele 2 şi
3 sunt izolate.

Teorema 10.1.4 (de caracterizare a punctelor aderente şi a punctelor de acumulare). Fie
A o submulţime a spaţiului metric X, d).

195
1) un punct x ∈ X este aderent mulţimii A dacă şi numai dacă există un şir (xn ) de
puncte din A astfel ca lim xn = x (ı̂n X).
n→∞

2) Un punct x ∈ X este punct de acumulare al mulţimii A dacă şi numai dacă există un
şir (xn ) de puncte din A astfel ı̂ncât xn = x, pentru orice n ∈ N, şi lim xn = x (ı̂n X).
n→∞

Demonstraţie. 1) Să presupunem că  x ∈A, adică este punct aderent pentru A. Atunci,
1
pentru orice n ∈ N∗ , sfera deschisă S x, are puncte comune cu A. Alegem câte un punct
  n
1
xr ∈ A ∩ S x, , pentru orice n ∈ N ∗ . Obţinem, astfel, şirul de puncte (xn ) din A cu
n
1 1
d (xn , x) < , pentru orice n ∈ N∗ . Din d(xn , x) < rezultă lim d(xn , x) = 0, ceea ce ne arată
n n n→∞
că lim xn = x (ı̂n X).
n→∞
Reciproc, dacă (xn ) este un şir de puncte din A, astfel ı̂ncât lim xn = x (ı̂n X), atunci,
n→∞
pentru orice ε > 0, există un nε ∈ N astfel ı̂ncât xn ∈ S(x, ε) de ı̂ndată ce n > nε . Rezultă că
pentru orice ε > 0 avem S(x, ε) ∩ A = Φ, ceea ce ne asigură că x ∈ A.
2) Demonstraţia se face ı̂n acelaşi mod ca la punctul 1), utilizând definiţia punctului
de acumulare.

Definiţia 10.1.17 Spaţiul metric (X, d) se numeşte compact, dacă orice şir din X conţine un
subşir convergent.

Definiţia 10.1.18 Mulţimea A din spaţiul metric (X, d) este compactă, dacă orice şir (an )
din A conţine un subşir convergent către un punct x0 din A.
Altfel spus, mulţimea A din (X, d) este compactă dacă şi numai dacă spaţiul metric
(A, d) este compact.

Exemplul 10.1.25. Mulţimea A = [a, b] ⊂ R, a < b, este compactă ı̂ntrucât, conform Lemei lui
Cesàro (vezi Propoziţia (8.1.11), orice şir de puncte din [a, b] conţine un subşir convergent
şi cum [a, b] este ı̂nchis, limita acestui subşir aparţine lui A.
1
Exemplul 10.1.26. Mulţimea A = (a, b] ⊂ R, a < b, nu este compactă deoarece şirul xn = a +
n
nu conţine nici un subşir convergent la un punct din (a, b) (toate subşirurile lui xn converg
la a care nu aparţine mulţimii A).

Definiţia 10.1.19 Fie (X, d) un spaţiu metric arbitrar şi A o submulţime a sa. O familie
D = {Di |Di ⊂ X, i ∈ I} de părţi ale lui X se numeşte acoperire a mulţimii A dacă
)
A⊂ Di .
i∈I
)
Dacă D1 ⊂ D şi A ⊂ Di , spunem că D1 este o subacoperire a lui D.
Di ∈D
O acoperire D a mulţimii A se va numi deschisă dacă elementele lui D sunt mulţimi
deschise.
 
1
Exemplul 10.1.27. Fie A = (1, 2) ⊂ R. Familia D formată din intervalele Di = 1 + , 2 ,
i
i = 2, 3, . . . formează o acoperire deschisă pentru A deoarece pentru orice x ∈ A există un
1
i0 ∈ N∗ aşa ı̂ncât 1 + < x, adică orice x ∈ A se află ı̂n cel puţin un interval Di .
i0
Propoziţia 10.1.5 (Lebesgue). Dacă A este o mulţime compactă ı̂n spaţiul metric (X, d) iar
D = {Di |i ∈ I} este o acoperire deschisă a lui A, atunci există un ε > 0 aşa ı̂ncât pentru
orice x din A să existe un i ∈ I aşa ca S(x, ε) ⊂ Di .

196
Demonstraţie. Vom proceda prin reducere la absurd.
Să presupunem că A este compactă dar pentru orice ε > 0 există un xε ∈ A aşa ı̂ncât
pentru orice i ∈ I, S(xε , ε) ⊂ Di . În particular, pentru ε = 1/n există xn ∈ A astfel ı̂ncât
pentru orice i ∈ I are loc  
1
(10.1) S xn , ⊂ Di .
n
Deoarece A este compactă, şirul (xn ) conţine un sub şir (xnk ) convergent la un punct
x ∈ A. Cum D constituie o acoperire pentru A, există o mulţime Di0 ∈ D aşa ı̂ncât x ∈ Di0 .
Mulţimea Di0 fiind deschisă există o sferă deschisă S(x, r) aşa ca

(10.2) S(x, r) ⊂ Dio

Din lim xnk = x ∈ A rezultă că există un număr natural k0 depinzând de r/2 aşa ca
k→∞ $ r%
pentru orice k ≥ k0 să avem xnk ∈ S x, , adică
2
r
(10.3) d (xnk , x) < .
2
1
Cum lim = 0, există un k1 (r) ∈ N aşa ı̂ncât pentru orice k > k1 să rezulte
k→∞ nk
1 r
(10.4) < .
nk 2

Fie k2 = max{k0 , k1 }. Pentru orice k > k0 , din relaţiile (10.2), (10.3) şi (10.4) obţinem
 
1
S xnk , ⊂ S(x, r) ⊂ Di0 ,
nk

incluziune ce contrazice (10.1). Cu aceasta teorema este demonstrată.

Propoziţia 10.1.6 Dacă A este o mulţime ı̂n spaţiul metric (X, d), atunci pentru orice ε > 0
există o familie finită de sfere deschise cu raza ε care constituie o acoperire deschisă a
mulţimii A.

Demonstraţie. Vom raţiona tot prin reducere la absurd. Presupunem că A este o mulţime
compactă in (X, d) aşa ı̂ncât există un ε > 0 pentru care nu există o acoperire finită cu sfere
deschise de rază ε.
Fie x1 ∈ A; atunci sfera S(x1 , ε) ⊃ A. Alegem x2 ∈ A aşa ı̂ncât x2 ∈ S(x1 , ε).
Acum considerăm sferele S(x1 , ε) şi S(x2 , ε), pentru care A ⊂ S(x1 , ε) ∪ S(x2 , ε). Prin
urmare, există x3 ∈ A aşa ca x3 ∈ A şi x3 ∈ S(x1 , ε), x3 ∈ S(x2 , ε).
Din aproape ı̂n aproape, construim şirul (xn ) de puncte din A aşa ı̂ncât

xn ∈ A, xn ∈ S(xi , ε), i = 1, n − 1.

De aici rezultă că avem d(xn , xi ) ≥ ε, i = 1, n − 1, pentru orice n ∈ N∗ . Prin urmare,


şirul (xn ) astfel construit cere proprietatea că xn ∈ A pentru orice n ∈ N∗ , dar

(10.5) d(xn , xm ) ≥ ε, pentru orice n, m ∈ N∗ ,

cu n = m.
Acum, se observă că şirul (xn ) nu poate conţine nici un subşir convergent, ı̂ntrucât,
dacă ar exista un asemenea subşir acesta ar trebui să fie şir Cauchy, ceea ce ar contrazice
(10.5) .
Aşadar, şirul (xn ) nu poate conţine nici un subşir convergent, ceea ce contrazice faptul
că A este o mulţime compactă. În concluzie enunţul teoremei este adevărat.

197
Teorema 10.1.5 O mulţime A dintr-un spaţiu metric (X, d) este compactă dacă şi numai
dacă din orice acoperire deschisă a sa se poate extrage o subacoperire finită.
Demonstraţie. Să considerăm că A este o mulţime compactă. Fie D = {Di |i ∈ I} o acoperire
deschisă a mulţimii compacte A. Conform Propoziţiei 10.1.5 există ε > 0 aşa ı̂ncât pentru
orice x ∈ A să existe i ∈ I aşa ca
(10.6) S(x, ε) ⊂ Di .
Din Propoziţia 10.1.6, pentru acest ε > 0 există un număr finit de sfere cu raza ε care
să acopere mulţimea A, adică
)n
A⊂ S(xk , ε).
k=1

Din (10.6) rezultă că S(xk , ε) ⊂ Di,k , pentru orice k = 1, 2, . . . , n. Atunci


)
n
A⊂ Di,k ,
k=1

adică din acoperirea D a lui A am extras o subacoperire finită D1 = {Di,k |k = 1, n} a sa, ceea
ce trebuia demonstrat.
Reciproc, să admitem că din orice acoperire deschisă a mulţimii A se poate extrage o
subacoperire finită. Vom raţiona prin reducere la absurd. Să presupunem că A nu este o
mulţime compactă. Atunci, există un şir (xn ) ⊂ A care nu conţine nici un subşir convergent,
ceea ce ı̂nseamnă că mulţimea termenilor săi nu are nici un punct de acumulare. De aici,
rezultă că pentru orice x ∈ A există o sferă S(x, εx ) care conţine cel mult un număr finit
de termeni ai şirului (xn ) deoarece, ı̂n caz contrar, ar exista un subşir al lui (xn ) care să
conveargă la x.
Familia D = {S(y, εy )|y ∈ A} constituie o acoperire deschisă pentru A. Deci, din D se
poate extrage o subacoperire finită

D1 = {S(yi , εyi )|i = 1, m}.

Cum (xn ) ⊂ A ⊂ D1 iar fiecare din sferele S(yi , εyi ) conţine cel mult un număr finit de
termeni ai şirului (xn ) rezultă că şirul (xn ) are un număr finit de termeni, ceea ce constituie
o contradicţie. Prin urmare, mulţimea A este compactă.
Teorema 10.1.6 Orice submulţime compactă a unui spaţiu metric este mărginită şi ı̂nchisă.
Demonstraţie. Să considerăm A o submulţime compactă a spaţiului metric (X, d).
Mai ı̂ntâi, să arătăm că A este mărginită. Să observăm că familia sferelor deschise
D = {S(x, 1)|x ∈ A} formează o acoperire deschisă pentru A. Conform cu Teorema 10.1.5,
cum A este compactă, se poate extrage o subacoperire finită D1 = {S(xi , 1)|xi ∈ A, i = 1, n}.
Fie B = {xi |i = 1, n}, care este finită şi diametrul său δ(B) < ∞.
Să considerăm acum x şi y două puncte arbitrare din A. Atunci există o sferă deschisă
S(xi , 1) ∈ D1 , care conţine pe x şi, de asemenea, există sfera deschisă S(xj , 1) aşa ca y ∈ S(xj , 1).
Utilizând inegalitatea triunghiului, obţinem

d(x, y) ≤ d(x, xi ) + d(xi , xj ) + d(xj , y) < 2 + d(xi , xj ) < 2 + δ(B),

pentru orice x, y din A. Aşadar, δ(A) ≤ 2 + δ(B) < +∞, ceea ce ne arată că A este mărginită.
Acum, să arătăm că A este ı̂nchisă, ceea ce este echivalent cu C(A) = x−A este deschisă.
Fie x un punct arbitrar din C(A) şi fie y ∈ A. Cum x = y, utilizând proprietatea de separaţie
Hausdorff (Teorema 10.1.1) a spaţiului metric (X, d) rezultă că există sferele deschise S(y, ry )
şi S(x, rx,y ) aşa ı̂ncât
(10.7) S(y, ry ) ∩ S(x, rx,y ) = Φ.
Familia D = {S(y, ry )|y ∈ A} este o acoperire deschisă pentru A şi cum A este compactă
există o subacoperire finită a sa D1 = {S(yi , ryi )|i = 1, n} (Teorema 10.1.5).

198
Fiecărei sfere S(yi , ryi ) ı̂i corespunde, pe baza lui (10.7), o sferă deschisă S(x, rx,yi ).
3
n
Fie r = min {rx , yi }; atunci S(x, r) = S(x, rx,yi ) iar S(x, r) ∩ A = Φ deoarece A ⊂
i=1,n
i=1
)
n
S(yi , ryi ) şi, din (10.7), avem S(x, r) ∩ S(yi , ryi ) = Φ. Aşadar, S(x, r) ⊂ C(A), adică C(A)
i=1
este vecinătate pentru x. Cum x a fost ales arbitrar ı̂n C(A) rezultă că mulţimea C(A) este
deschisă deoarece ea este vecinătate pentru orice punct al ei.
Condiţiile ca mulţimea A să fie mărgnită şi ı̂nchisă sunt necesare pentru ca A să fie
compactă. Aceste două condiţii nu sunt, ı̂n general, suficiente pentru compactitatea unei
mulţimii ı̂ntr-un spaţiu metric.
Vom arăta că ı̂n spaţiile Rn , n ≥ 1, ı̂nzestrate cu metrica euclidiană, aceste condiţii
sunt şi suficiente.
Mai ı̂ntâi vom demonstra următorul rezultat general.
Teorema 10.1.7 Dacă (X, d1 ) şi (Y, d2 ) sunt două spaţii metrice compacte, atunci şi spaţiul
Z = X × Y , ı̂nzestrat cu metrica din Propoziţia 8.2.6, este compact
Demonstraţie. Fie (zn ) un şir arbitrar din Z, cu zn = (xn , yn ), xn ∈ X, yn ∈ Y , n = 1, 2, . . .. Cum
(X, d1 ) este compact, şirul (xn ) conţine un subşir (xnk )k∈N convergent la x ∈ X. Considerând
subşirul (ynk )k∈N al şirului (yn ) şi ţinând seama că şi (Y, d2 ) este compact, rezultă că există
un subşir (ynkt )t∈N al său, convergent la un punct y ∈ Y .
Ţinând seama de Teorema 8.2.2 rezultă că

lim znkt = lim (xnkt , ynkt ) = (x, y),


t→∞ t→∞

ceea ce ne arată că spaţiul Z este compact.


Propoziţia 10.1.7 Intervalul [a, b] din R, a < b, este o mulţime compactă.
Demonstraţie. Dacă (xn ) este un şir arbitrar din [a, b], rezultă că (xn ) este mărginit. Atunci,
conform lemei lui Cesàro (Propoziţia 8.1.11) el conţine un subşir (xnk ) convergent la un
punct din R. Cum [a, b] este mulţime ı̂nchisă rezultă că x ∈ [a, b]. Deci, [a, b] este o mulţime
compactă ı̂n R.
Definiţia 10.1.20 Fie [ai , bi ], i = 1, n, n ≥ 1, n intervale ale lui R. Mulţimea P ⊂ Rn , unde

P = [a1 , b1 ] × [a2 , b2 ] × . . . × [an , bn ],

se numeşte paralelipiped ı̂nchis ı̂n Rn .

Propoziţia 10.1.8 Orice paralelipiped ı̂nchis din Rn , n ≥ 1, este o mulţime compactă.

Demonstraţie. Valabilitatea propozoţiei rezultă imediat, utilizând Teorema 10.1.7 şi


Propoziţia 10.1.7.
Acum putem demonstra:
Teorema 10.1.8 O submulţime A a lui Rn (n ≥ 1) este compactă dacă şi numai dacă este
mărginită şi ı̂nchisă.
Demonstraţie. Dacă A este compactă, atunci pe baza Teoremei 10.1.6, deducem că ea este
marginită şi ı̂nchisă.
Reciproc, să admitem că submulţimea A a lui Rn este mărginită şi ı̂nchisă şi să arătăm
că este compactă.
Cum A este mărginită, există un paralelipiped ı̂nchis P aşa ı̂ncât A ⊆ P .
Fie (xn ) un şir abritrar ı̂n A; atunci el este şi ı̂n P şi cum P este o mulţime compactă
rezultă că există un subşir (xnk ) convergent la un punct x ∈ P . Dar x este punct aderent
mulţimii A şi cum A este ı̂nchisă rezultă că A = A (Teorema 10.1.3). Deducem că x ∈ A şi

199
deci A este compactă.
În finalul acestui paragraf vom introduce noţiunea de conexitate, care, intuitiv, descrie
faptul că o mulţime este formată ”dintr-o bucată”, adică nu poate fi descompusă ı̂n două
sau mai multe părţi separate.
Definiţia 10.1.21 Spaţiul metric (X, d) se numeşte conex dacă nu există două mulţimi D1 ,
D2 deschise, nevide şi disjuncte astfel ca X = D1 ∪ D2 . În caz contrar spaţiul (X, d) se
numeşte neconex sau disconex.
Deoarece D1 = C(D2 ) şi D2 = C(D1 ), rezultă că mulţimile D1 şi D2 sunt, ı̂n acelaşi timp,
şi inchise, rezultând imediat următorul rezultat:
Propoziţia 10.1.9 Într-un spaţiu metric (X, d) următoarele afirmaţii sunt echivalente:
1) (X, d) exte conex;
2) Nu există două mulţimi ı̂nchise F1 şi F2 , nevide şi disjuncte, aşa ı̂ncât X = F1 ∪ F2 ;
3) Singura mulţime nevidă din X simultan deschisă şi ı̂nchisă este ı̂ntreg spaţiul X.

Definiţia 10.1.22 O submulţime A a spaţiului metric (X.d) este conexă dacă (A, d) este un
spaţiu metric conex.
Altfel spus, A este conexă dacă nu există două mulţimi deschise ı̂n X, cu proprietăţile:

1) D1 ∩ A = Φ, D2 ∩ A = Φ
2) A ⊂ D1 ∪ D2
3) D1 ∩ D2 ∩ A = Φ.

Exemplul 10.1.28. Orice interval al lui R este o mulţime conexă.


Să demonstrăm acest fapt. Presupunem contrariul; adică există un interval A ⊂ R
care este o mulţime neconexă. Conform Definiţiei 10.1.22, există două mulţimi deschise,
nevide, D1 şi D2 ı̂n R aşa ı̂ncât

D1 ∪ D2 = A; D1 ∩ D2 = Φ.

Există punctele a ∈ D1 şi b ∈ D2 , a = b (putem presupune că a < b). Cum A este interval
rezultă că şi [a, b] este interval şi [a, b] ⊂ A. Notăm c = sup(D1 ∩ [a, b]). Cum D1 este, ı̂n acelaşi
timp, ı̂nchisă ı̂n A rezultă că c ∈ D1 . Însă b ∈ D2 şi deci c ∈ D1 ∩ [a, b), adică c = b, deoarece, ı̂n
caz contrar, c = b ∈ D2 , ceea ce ar conduce la c ∈ D1 ∩ D2 , lucru absurd. Aşadar, c ∈ D1 ∩ [a, b)
şi D1 fiind deschisă ı̂n A există ε > 0 astfel ı̂ncât c + ε ∈ D1 ∩ [a, b), ceea ce contrazice faptul că
sup(D1 ∩ [a, b)) = c. Prin urmare, presupunerea făcută este falsă, rezultând că A este conexă.
Observaţia 10.1.4 Are loc şi reciproca pentru afirmaţia din exemplul 10.1.28: orice
submulţime nevidă şi conexă a lui R este un interval.
Vom raţiona prin reducere la absurd. Să admitem că există o mulţime A ⊂ R conexă,
care nu este interval. Atunci există trei puncte x1 , x2 , x3 din R aşa ı̂ncât x1 , x3 ∈ A, x1 <
x2 < x3 , iar x2 ∈ A. Considerăm mulţimile D1 = (−∞, x2 ) ∩ A şi D2 = A ∩ (x2 , +∞). Evident
că D1 şi D2 sunt ı̂nchise ı̂n A, D1 ∪ D2 = A şi D1 ∩ D2 = Φ. Prin urmare, A este o mulţime
neconexă, ceea ce constituie o contradicţie. Aşadar, A este un interval.
Exemplul 10.1.29. În spaţiul metric R mulţimea A = (1, 2) ∪ (3, 4) este neconexă. Într-
adevăr, mulţimile D1 = (1, 2) şi D2 = (3, 4) sunt deschise, A = D1 ∪ D2 , iar D1 ∩ D2 ∩ A = Φ,
D1 ∩ A = (1, 2) = Φ, D2 ∩ A = (3, 4) = Φ.
Definiţia 10.1.23 O mulţime deschisă şi conexă se numeşte domeniu. O mulţime ı̂nchisă şi
conexă se numeşte continuu.
Exemplul 10.1.30. O sferă deschisă din Rm este un domeniu, iar una ı̂nchisă este un continuu.

200
10.2 Funcţii ı̂ntre spaţii metrice
Definiţia 10.2.1 Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice. O apliacţie f : A → B, A ⊆ X şi
B ⊆ Y , se numeşte funcţie definită ı̂ntre două spaţii metrice.

Definiţia 10.2.2 Dacă X = Rm , m ∈ N, m ≥ 1 şi Y = R, atunci funcţia f : A → R, A ⊆ Rm , se


numeşte funcţie reală de o variabilă vectorială x = (x1 , x2 , . . . , xm ) ∈ A sau funcţie reală de m
variabile reale şi se notează prin y = f (x) sau y = f (x1 , x2 , . . . , xm ).

Este evident că valorile y ale funcţiei y = f (x1 , x2 , . . . , xm ) depind de cele m variabile.
Din punct de vedere sistemic variabilele independente x1 , x2 , . . . , xm reprezintă mărimi ce
pot fi controlate sau precizate, numite date de intrare, iar variabila dependentă y precizează
valoarea rezultată prin acţiunea lui f asupra datelor de intrare şi se numeşte data de ieşire
(v.fig.10.2.1).

Fig.10.2.1

Observaţia 10.2.1 Funcţiile reale de mai multe variabile se mai numesc şi funcţii scalare
sau câmpuri scalare.

Graficul unei funcţii reale de m variabile reale, definită pe o mulţime A ⊆ Rm , este


o mulţime de puncte din Rm+1 , ceea ce face să avem o imagine geometrică numai pentru
m ≤ 2. Astfel, dacă m = 1 atunci funcţia y = f (x), x ∈ A ⊂ R are ca şi grafic o curbă plană,
iar dacă m = 2 funcţia reală f : A ⊆ R2 → R, y = f (x1 , x2 ) are ca şi grafic o suprafaţă (Σ) ı̂n
spaţiul R3 (v.fig.10.2.2).

Fig.10.2.2

Definiţia 10.2.3 Dacă X = Rm şi Y = Rp , o funcţie f : A → B, A ⊆ X, B ⊆ Y , se numeşte


funcţie vectorială de variabilă vectorială.

201
Dacă x = (x1 , . . . , xm ) ∈ A iar y = (y1 , . . . , yp ) ∈ B, atunci funcţia vectorială poate fi scrisă

y = f (x),

iar desfăşurat:

(y1 , . . . , yp ) = (f1 (x1 , . . . , xm ), f (x1 , . . . , xm ), . . . , fp (x1 , . . . , xm ))

unde fi , i = 1, p, sunt funcţii de m variabile reale definite pe A cu valori ı̂n R.


Funcţiile yi = fi (x1 , x2 , . . . , xm ), i = 1, p se numesc componentele funcţiei vectoriale f .
Rezultă că studiul unei funcţii vectoriale se reduce la studiul unor funcţii reale de mai
multe variabile reale.
Cazuri particulare. 10.2.1. Dacă p = 1, atunci funcţia vectorială de variabilă vectorială
se reduce la o funcţie reală de mai multe variabile reale.
10.2.2. Dacă p = 2 şi m = 1, atunci funcţia vectorială are forma
−−→
(y1 , y2 ) = (x, y) = f (t) = (f1 (t), f2 (t)), t ∈ A ⊆ R,

de unde
x = f1 (t), y = f2 (t), t ∈ A,
care constituie reprezentarea parametrică a unei curbe plane Γ (v.fig.10.2.3).

Fig.10.2.3

10.2.3. Dacă p = 3 şi m = 1, atunci funcţia vectorială are forma


−−→
(y1 , y2 , y3 ) = (x, y, z) = f (t) = (f1 (t), f2 (t), f3 (t)), t ∈ A ⊆ R,

de unde
x = f1 (t), y = f2 (t), z = f3 (t), t ∈ A,
care constituie reprezentarea parametrică a unei curbe ı̂n spaţiu.
10.2.4. Dacă p = 3 şi m = 2, atunci funcţia vectorială are forma


(y1 , y2 , y3 ) = (x, y, z) = f (u, v) =

= (f1 (u, v), f2 (u, v), f3 (u, v)), (u, v) ∈ A ⊆ R2 ,


de unde
x = f1 (u, v), y = f2 (u, v), z = f3 (u, v), (u, v) ∈ A,

care constituie reprezentarea parametrică a unei suprafeţe ı̂n spaţiu (v.fig.10.2.4).

202
Fig.10.2.4

10.2.5. Dacă p = 3 şi m = 3, atunci o astfel de funcţie vectorială se numeşte câmp vectorial.
De obicei, modelele matematice utilizate ı̂n descrierea fenomenelor economice se de-
scriu prin funcţii reale de mai multe variabile reale.
Exemplul 10.2.1. Funcţia de producţie. O problemă des ı̂ntâlnită ı̂n practica economică
se referă la condiţiile de combinare a factorilor pentru producerea unui produs Y de către
o ı̂ntreprindere: Dacă condiţiile tehnice ale producţiei sunt date, cantitatea y din pro-
dusul Y realizată depinde numai de factorii variabili ai producţiei folosiţi X1 , X2 , . . . , Xm .
Dacă x1 , x2 , . . . , xm sunt cantităţile folosite din aceşti factori, atunci putem scrie funcţia de
producţie
y = f (x1 , x2 , . . . , xm ),
care este o funcţie de m variabile reale.
Exemplul 10.2.2. Funcţia cererii. Să presupunem că n mărfuri de consum Y1 , Y2 , . . . , Yn se
vând la preţuri invariabile x1 , x2 , . . . , xn pe o piaţă cu concurenţă, care constă dintr-un număr
de consumatori, cu gusturi şi venituri date. În această situaţie cantitatea yk de marfă Yk ,
k = 1, n, cerută pe piaţă depinde numai de preţurile tuturor mărfurilor de pe piaţă. Aceasta
ı̂nseamnă că funcţia cererii pentru marfa Yk este

yk = fk (x1 , x2 , . . . , xn ),

care este o funcţie de n variabile. Funcţia cerere pentru toate cele n mărfuri va fi o funcţie
vectorială
(y1 , y2 , . . . , yn ) = (f1 (x1 , . . . , xn ), . . . , fn (x1 , . . . , xn )).
În practică, ı̂ntre funcţiile cerere yk = fk (x1 , . . . , xn ), k = 1, n, se studiază anumite
corelaţii.
Exemplul 10.2.3. Funcţia costurilor de producţie. Să admitem că o ı̂ntreprindere produce
mărfurile X1 , X2 , . . . , Xn ı̂n condiţii tehnice de producţie şi condiţii de aprovizionare date.
Atunci funcţia costurilor de producţie este

y = f (x1 , . . . , xn ),

unde x1 , x2 , . . . , xn sunt cantităţile de mărfuri λ1 , λ2 , . . . , λn produse, iar y este costul total.


Pentru comoditate, ı̂n cazul a două mărfuri X şi Y funcţia costurilor se poate lua de forma
particulară
z = ax2 + by 2 + cxy + dx + ey + f.

203
10.3 Limita unei funcţii ı̂ntr-un punct
Fie (X, d1 ) şi (X, d2 ) două spaţii metrice, F : A → Y , A ⊆ X, o funcţie şi x0 un punct de
acumulare al mulţimii A (x0 ∈ A ).
Definiţia 10.3.1 (cu vecinătăţi.) Spunem că funcţia f are limită ı̂n punctul x0 , dacă există
un punct l ∈ Y astfel ı̂ncât, pentru orice vecinătate U (l) a lui l, există o vecinătate V (x0 )
aşa ı̂ncât, pentru orice x ∈ V (x0 ) ∩ A − {x0 }, să avem f (x) ∈ U (l), adică

f (V (x0 ) ∩ A − {x0 }) ⊂ U (l).

Scriem lim f (x) = l.


x→x0

Intuitiv noţiunea de limită a funcţiei f ı̂n punctul x0 exprimă faptul că dacă ne
apropiem de x0 prin puncte din mulţimea A, atunci valorile funcţiei ı̂n aceste puncte se
apropie oricât de mult de punctul l din Y .
Teorema 10.3.1 (de caracterizare a noţiunii de limită.) Fie f : A → (Y, d2 ), unde A ⊆ (X, d1 )
şi x0 ∈ A . Atunci următoarele afirmaţii sunt echivalente:
1) l este limita funcţiei f ı̂n punctul x0 (definiţia cu vecinătăţi);
2) pentru orice sferă deschisă SY (l, ε) din spaţiul metric Y există o sferă deschisă
SX (x0 , δε ) din spaţiul metric X astfel ı̂ncât, pentru orice x ∈ SX (x0 , δε ) ∩ A − {x0 } să
avem f (x) ∈ SY (l, ε) (definiţia cu sfere);
3) pentru orice ε > 0 există δε > 0 astfel ı̂ncât pentru orice x ∈ A − {x0 } cu d1 (x, x0 ) < δε să
avem d2 (f (x), l) < ε (definiţia cu ε şi δ);
X Y
4) pentru orice şir convergent de puncte din A−{x0 } cu lim xn = x0 să rezulte lim f (xn ) =
n→∞ n→∞
l (definiţia cu şiruri sau definiţia lui Heine)
Demonstraţie. Să arătăm mai ı̂ntâi că din 1) rezultă 2). Luăm U (l) = SY (l, ε), unde ε > 0
este arbitrar. Conform cu 1), există o vecinătate V (x0 ) aşa ı̂ncât, pentru orice x ∈ V (x0 ) ∩
A − {x0 } să avem f (x) ∈ U (l). Cum V (x0 ) este o vecinătate pentru x0 , există o sferă deschisă
SX (x0 , δε ) ⊂ V (x0 ). Atunci pentru orice x ∈ SX (x0 , δε ) ∩ A − {x0 } avem f (x) ∈ U (l) = SY (l, ε),
adică 2) este ı̂ndeplinită.
Acum să arătăm că din 2) rezultă 3). Pentru aceasta este suficient să exprimăm sferele
şi condiţiile de la 2) prin inegalităţi.
Să demonstrăm acum că din 3) rezultă 4). Fie (xn ) un şir de puncte din A{ x0 } cu
X
lim xn = x0 . Din 3) rezultă că, pentru orice ε > 0, există δε > 0 aşa ı̂ncât, pentru orice
n→∞
X
x ∈ A − {x0 } cu d1 (x, x0 ) < δε să avem d2 (f (x), l) < ε. Cum lim xn = x0 , există un nδε ∈ N aşa
n→∞
ca pentru orice n ∈ N, n > nδε să rezulte d1 (xn , x0 ) < δε . Atunci d2 (f (x), l) < ε pentru orice
n ∈ N, n > nδε = nε . Aşadar, pentru orice ε > 0 există nε ∈ N aşa ı̂ncât pentru orice n ∈ N,
n > nε să avem d2 (f (xn ), l) < ε, adică lim f (xn ) = l, ceea ce trebuia demonstrat.
n→∞
Demonstraţia teoremei este ı̂ncheiată dacă arătăm că din 4) rezultă 1). Vom raţiona
prin reducere la absurd. Să presupunem că există o vecinătate U (l) a lui R astfel ca, oricare
ar fi V (x0 ) o vecinătate a lui x0 , să existe x∈ V (x0 ) ∩ A − {x0 } pentru care f (x) ∈ U (l).
1
Pentru orice n ∈ N∗ luăm V (x) = S x0 , . Atunci există xn ∈ V (x0 ) ∩ A − {x0 } cu
n
 
1 1
xn = x0 aşa ı̂ncât f (xn ) ∈ U (l). Cum xn ∈ S x0 , , avem dX (xn , x0 ) < , oricare ar fi
n n
n ∈ N∗ . De aici rezultă că lim xn = x0 . Conform cu 4), deducem că lim f (xn ) = l; atunci
n→∞ n→∞
există n1 ∈ N aşa ı̂ncât pentru orice n ∈ N, n > n1 să avem f (xn ) ∈ U (l), ceea ce contrazice
f (xn ) ∈ U (l). Prin urmare, presupunerea făcută este falsă şi deci din 4) rezultă 1).

204
Observaţia 10.3.1 Afirmaţiile 1) – 4) din teorema 10.3.1 fiind echivalente logic, rezultă că
oricare din ele poate fi luată ca definiţie a limitei unei funcţii ı̂ntr-un punct. În contin-
uare, noi vom folosi mai mult definiţia cu şiruri deoarece ne va permite ca să obţinem
proprietăţile limitelor de funcţii din proprietăţile limitelor de şiruri.

Observaţia 10.3.2 Definiţia limitei cu şiruri a limtiei unei funcţii ı̂ntr-un punct se utilizează
la a dovedi că o funcţie nu are limită ı̂ntr-un punct. Pentru aceasta este suficient să găsim
un şir (xn ), (xn ) ⊂ A − {x0 }, cu lim xn = x0 aşa ı̂ncât lim f (xn ) să nu existe sau să aflăm
n→∞ n→∞
(1) (2) (1)
două şiruri (xn ) şi (xn ) din A−{x0 }, ambele convergente la x0 , pentru care şirurile (f (xn ))
(2)
şi (f (xn )) să aibă limite diferite ı̂n Y .

Teorema 10.3.2 Fie spaţiile metrice (X, d1 ) şi (Y, d2 ), A ⊆ X, x0 ∈ A şi f : A → Y o funcţie.
Dacă f are limită ı̂n x0 , atunci această limită este unică.

Demonstraţie. Valabilitatea afirmaţiei rezultă aplicând definiţia cu şiruri a limitei unei


funcţii ı̂ntr-un punct şi ţinând seama că limita unui şir de puncte dintr-un spaţiu metric
este unică.

− →

Teorema 10.3.3 Fie f : A → Rp , A ⊆ Rm , m ≥ 1, p ≥ 2, funcţia vectorială f = (f1 , f2 , . . . , fp ),


unde fi : A → R, i = 1, p şi x0 ∈ A . Atunci f are limita l = (l1 , l2 , . . . , lp ) ı̂n punctul x0 dacă
şi numai dacă există lim fi (x) = li , i = 1, p.
x→x0

Demonstraţie. Afirmaţia rezultă imediat folosind definiţia limtiei unei funcţii cu şiruri
şi faptul că ı̂n Rn convergenta unui şir de elemente este echivalentă cu convergenţa pe
coordonate (v.Teorema 8.2.2).
Observaţia 10.3.3 Din Teorema 10.3.3 rezultă că studiul limitei funcţiilor vectoriale se re-
duce la studiul funcţiilor reale de mai multe variabile reale f : A → R, A ⊆ Rm .
Dacă x0 = (a1 , a2 , . . . , am ) ∈ A se obişnuieşte a nota lim f (x), x = (x1 , x2 , . . . , xm ) ∈ Rm ,
x→x0
prin
lim
x1 →a1
f (x1 , x2 , . . . , xm )
x2 →a2

..
.
xm →am

Utilizând cele demonstrate la şiruri pentru funcţiile care iau valori reale rezultă:
Teorema 10.3.4 Fie f, g : A → R, unde A ⊆ (X, d) şi x0 ∈ A . Dacă există lim f (x) = l1 şi
x→x0
lim f (x) = l2 , cu l1 , l2 ∈ R, atunci există
x→x0

1) lim (f + g)(x) şi valoarea ei este l1 + l2 ;


x→x0

2) lim (f + g)(x) şi valoarea ei este l1 l2 ;


x→x0

l1
3) lim f (x) şi valoarea ei este , dacă l2 = 0 şi g(x) = 0 pentru x ∈ A.
x→x0 l2

Observaţia 10.3.4 Dacă l1 , l2 ∈ R, atunci pot să apară aşa numitele ”operaţii fără sens”,
care se elimină prin diferite metode.

Observaţia 10.3.5 Fie f : A → (Y, d), cu A ⊆ R, o funcţie şi x0 ∈ A . Dacă există x→x
lim f (x) =
0
x<x0

ls (respectiv x→x
lim f (x) = ld ), atunci spunem că f are limită la stânga (respectiv limită la
0
x>x0

dreapta) ı̂n punctul x0 . Limitele la stânga şi la dreapta ı̂ntr-un punct poartă numele de
limită laterală.

205
Se arată că f are limită ı̂n punctul x0 dacă şi numai dacă există atât limita la stânga
ls cât şi limita la dreapta ld ı̂n punctul x0 pentru f şi lim f (x) = ls = ld .
x→x0
Exemple. 10.3.1. Să calculăm
 2 
x + x3 2
2
a) l1 = lim , (1 + x) , x + x + 1
2x
x→0 2x
 
2 2 1 x2 + 1
b) l2 = x→0
lim x y + 1, (1 + xy) , 2xy

y→0
x + y2

a) Avem
x2 + x3 x + x2
lim = lim = 0;
x→0 2x x→0 2
2 1
lim (1 + x) 2x = lim [(1 + x) x ]2 = e2 ;
x→0 x→0

de unde l1 = (0, e2 , 1).


b) Pentru l2 avem
1
lim (x2 + y 2 + 1) = 1;
x→0
lim (1 + xy) xy = e
x→0
y→0 y→0

şi  
x2 y  x2 y  x2 |y|
lim 
= 0, deoarece  2 ≤ = |y|,
x→0 x2 + y 2
y→0
x + y2  x2

de unde l2 = (1, e, 0).


xy
10.3.2. Să se arate că f (x, y) = 2 nu are limită ı̂n punctul (0, 0) = θ. Considerăm şirul
  x + y2
1 α
de puncte zn = , , α ∈ R şi convergent la θ = (0, 0). Avem
n n
  α
1 α 2 α
f , = 1 n α = ,
n n n2 + n2
1 + α2
  
1 α
adică limita şirului f , depinde de α, de unde rezultă că funcţia f nu are limită ı̂n
n n
(0, 0).

10.4 Continuitatea funcţiilor ı̂ntre spaţii metrice


În acest paragraf vom adânci studiul ideii intuitive de ”apropiere” a valorilor unei
funcţii de valoarea ei ı̂ntr–un punct dat x0 de ı̂ndată ce valorile argumentului sunt suficient
de aproape de x0 .
Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice şi f : A → Y o funcţie, unde A ⊆ X este o
submulţime a lui X.

Definiţia 10.4.1 (cu vecinătăţi.) Spunem că funcţia f este continuă ı̂n punctul x0 ∈ A dacă
pentru orice vecinătate U (f (x0 )) a lui f (x0 ) există o vecinătate V (x0 ) a lui x0 aşa ı̂ncât pentru
orice x ∈ V (x) ∩ A să avem f (x) ∈ U (f (x0 )).
Dacă funcţia f nu este continuă ı̂n punctul x0 ∈ A, atunci spunem că funcţia f este
discontinuă ı̂n punctul x0 sau că x0 este punct de discontinuitate a funcţiei f .

Teorema 10.4.1 Funcţia f : A → Y , A ⊆ X, este continuă ı̂n punctul x0 ∈ A dacă şi numai
dacă are loc una din situaţiile:

i) sau x0 este punct izolat;

206
ii) sau x0 este punct de acumulare pentru A şi
lim f (x) = f (x0 ).
x→x0

Demonstraţie.

i) Într-adevăr, ı̂n orice punct izolat al domeniului de definiţie o funcţie este continuă. Fie
x0 un punct izolat pentru mulţimea A; atunci există o vecinătate V (x0 ) a sa, aşa ı̂ncât
V (x0 ) ∩ A = {x0 }. Acum, rezultă că pentru orice vecinătate U (f (x0 )) există o vecinătate
V (x0 ) astfel ı̂ncât, pentru orice x ∈ V (x0 ) ∩ A, să avem f (x) ∈ U (f (x0 )).

ii) Să admitea că f este continuă ı̂n punctul x0 . Atunci pentru orice vecinătate U (f (x0 ))
există o vecinătate V (x0 ) a lui x0 aşa ı̂ncât pentru orice x ∈ V (x0 ) ∩ A să avem
f (x) ∈ U (f (x0 )). Evident că această afirmaţie are loc şi pentru x = x0 , ceea ce implică
lim f (x) = f (x0 ).
x→x0

Reciproc, dacă presupunem că lim f (x0 ) = f (x0 ), atunci pentru orice U (x0 ), există o
x→x0
vecinătate V (x0 ) aşa ı̂ncât, pentru orice x ∈ V (x0 ) ∩ (A − {x0 }) să avem f (x) ∈ U (f (x0 )). Cum
pentru x = x0 ∈ A avem evident f (x0 ) ∈ U (f (x0 ), rezultă că pentru orice x ∈ V (x0 ) ∩ A avem
f (x) ∈ U (f (x0 ))), ceea ce ne arată că f este continuă ı̂n x0 .

Observaţia 10.4.1 Dacă x0 este punct de acumulare din A şi funcţia f este continuă ı̂n x0 ,
atunci putem scrie  
lim f (x) = f lim x ,
x→x0 x→x0

ceea ce ne spune că operaţia de trecere la limită este permutabilă cu funcţia f .

Teorema 10.4.2 (de caracterizare a continuităţii ı̂n punct). Fie f : A → (Y, d2 ) o funcţie,
unde A ⊆ (X, d1 ) şi x0 ∈ A. Atunci următoarele afirmaţii sunt echivalente:

1) f este continuă ı̂n punctul x0 (definiţia cu vecinătăţi 10.4.1)

2) pentru orice sferă deschisă SY (f (x0 ), ε) din spaţiul metric Y , există o sferă deschisă
Sλ (x0 , δε ) din spaţiul metric X astfel ı̂ncât, pentru orice x ∈ SX (x0 , δε ) ∩ A să avem
f (x) ∈ SY (f (x0 ), ε) (definiţia cu sfere);

3) pentru orice ε > 0 există δε > 0 astfel ı̂ncât pentru orice x ∈ A cu d1 (x, x0 ) < δε , să avem
d2 (f (x), f (x0 )) < ε(definiţia cu ε şi δ);
X Y
4) pentru orice şi convergent de puncte din A cu lim xn = x0 să rezulte lim f (xn ) = f (x0 )
n→∞ n→∞
(definiţie cu şiruri).

Demonstraţie. Valabilitatea teoremei rezultă imediat din Teorema 10.3.1 de caracterizare


a noţiunii de limită.

Teorema 10.4.3 Fie f : A → Rp , A ⊆ Rm , m ≥ 1, p ≥ 2, funcţia vectorială f = (f1 , f2 , . . . , fp ),


unde fi : A → R, i = 1, p şi x0 ∈ A. Atunci f este continuă ı̂n punctul x0 ∈ A, dacă şi numai
dacă funcţiile fi sunt continue ı̂n x0 , i = 1, p.

Demonstraţie. Utilizând Teoremele 10.4.1 şi 10.3.4, rezultă imediat valabilitatea celor afir-
mate ı̂n enunţul teoremei.

Definiţia 10.4.2 Fie f : A → (Y, d2 ), unde A ⊂ (X, d1 ), o funcţie. Zicem că funcţia f este
continuă pe D dacă f este continuă ı̂n orice punct din D.

207
Exemple. 10.4.1. Fie (X, d) un spaţiu metric şi k un element fixat din X. Funcţia f : X → X,
X
f (x) = k, oricare ar fi x ∈ X, este continuă pe X deoarece dacă x0 ∈ X şi xn −→ x0 , atunci
X
f (xn ) −→ k = f (x0 ), adică este satisfăcută definiţia cu şiruri a continuităţii ı̂n x0 .
10.4.2. Fie 1X : (X, d) → (X, d) aplicaţia identică, adică 1X (x) = x, oricare ar fi x ∈ X. Atunci
1X este continuă pe X. Într-adevăr, să considerăm un x0 ∈ X arbitrar; atunci pentru orice
X X X
şir (xn ) ⊂ X cu lim xn = x0 avem lim 1x (xn ) = lim xn = x0 = 1X (x0 ), ceea ce ne arată că 1X
n→∞ n→∞ n→∞
este continuă ı̂n x0 .
10.4.3. (Continuitatea funcţiilor compuse.) Fie (X, d1 ), (Y, d2 şi (Z, d3 ) trei spaţii metrice şi
fie funcţiile f : X → Y , y : Y → Z. Dacă f este continuă ı̂n x0 ∈ X şi g este continuă ı̂n
f (x0 ) ∈ Y , atunci g ◦ f este continuă ı̂n x0 .
X
Folosim definiţia cu şiruri a continuităţii. Fie (xn ) un şir arbitrar din X cu lim xn = x0 .
n→∞
Y
Din continuitatea lui f ı̂n x0 rezultă lim f (xn ) = f (x0 ). Acum, ţinând seama de continuitatea
n→∞
Z Z
lui g ı̂n f (x0 ), obţinem că lim g(f (xn )) = g(f (x0 )), adică lim (g ◦ f )(xn ) = (g ◦ f )(x0 ), ceea ce
n→∞ n→∞
ne arată că g ◦ f este continuă ı̂n x0 ∈ X.
10.4.4. (Prelungirea prin continuitate). Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice, A ⊂ X şi
x0 un punct de acumulare din A. Dacă f : A − {x0 } → Y este o funcţie definită pe A − {x0 },
atunci am putea prelungi funcţia f la mulţimea A ı̂n diferite moduri atribuindu-i lui f o
Y
valoarea arbitrară ı̂n x0 . Dacă există lim f (x) = l ∈ Y , am putea considera funcţia
x→x0

f (x) , dacă x ∈ A − {x0 },
f( : A → Y, f((x) =
l , dacă x = x0 ,

care este, evident, o prelungire a lui f pe A.


Deoarece lim f((x) = l = f((x0 ), rezultă că f este continuă ı̂n x0 . Funcţia f( ataşată
x→x0
funcţiei f poartă numele de prelungirea funcţiei f prin continuitatea ı̂n punctul x0 .
10.4.5. (Funcţii continue cu valori reale). Fie f, g : (X, d) → R funcţii continue şi λ ∈ R.
Atunci:
1) f + g, λf şi f g sunt continue pe X;
f
2) : X − {x ∈ X|g(x) = 0} → R este continuă pe X − {x ∈ X|g(x) = 0};
g
3) |f | este continuă pe X.
Pentru a demonstra aceste afirmaţii să observăm mai ı̂ntâi că dacă x0 este punct izolat,
atunci valabilitatea celor trei afirmaţii rezultă din teorema 10.4.1, punctul i). Dacă x0 este
punct de acumulare atunci afirmaţiile 1) şi 2) rezultă din teorema 10.3.4, utilizând definiţia
cu şiruri a continuităţii.
X
Pentru a demonstra 3) este suficient să arătăm că dacă lim xn = x0 ,atunci lim |f (xn )| =
n→∞ n→∞
|f (x0 )|. Cum
| |f (xn )| − |f (x0 )| | ≤ |f (xn ) − f (x0 )|,
pentru orice n ∈ N, şi din f continuă ı̂n x0 , obţinem că lim |f (xn )| = |f (x0 )|, adică |f | este
n→∞
continuă ı̂n x0 .
10.4.6. (Continuitate laterală). Fie f : A → R, unde A ⊂ R, şi fie x0 ∈ A un punct acumulare
pentru D. Dacă există limita la stânga ı̂n x0 , f (x0 − 0) = fs (x0 ) = x→x
lim f (x), iar fs (x0 ) = f (x0 ),
0
x<x0

atunci spunem că f este continuă la stânga ı̂n x0 . Dacă există limită la dreapta ı̂n x0 ,
f (x0 + 0) = fd (x0 ) = x→x
lim f (x), iar fd (x0 ) = f(x0 ) atunci spunem că f este continuă la dreapta ı̂n
0
x>x0
x0 .
Ţinând seama de Observaţie 10.3.5, deducem că o funcţie f este continuă ı̂n x0 dacă
şi numai dacă f este continuă atât la stânga cât şi la dreapta ı̂n punctul x0 .

208
Punctul de acumulare x0 ∈ A se numeşte punct de discontinuitate de speţa (specia)
ı̂ntâia dacă f nu este continuă ı̂n x0 , fs (x0 ) şi fd (x0 ) există, sunt finite şi diferite. Punctul
x0 ∈ A se numeşte de discontinuitate de speţa a II-a dacă este punct de discontinuitate şi
nu este de speţa ı̂ntâia.
Dacă x0 ∈ A este un punct de discontinuitate de speţa ı̂ntâia pentru funcţie f , atunci
expresiile
sf (x0 ) = |fd (x0 ) − fs (x0 )|
şi
osc (f ; x0 ) = max{|fd (x0 ) − fs (x0 )|, |f (x0 ) − fs (x0 )|,
, |f (x0 ) − fd (x0 )|}
se numesc saltul lui f ı̂n x0 şi respectiv oscilaţia lui f ı̂n x0 .
10.4.7. (Discontinuităţile funcţiilor monotone). O funcţie monotonă f , definită pe intervalul
(a, b),
−∞ ≤ a < b ≤ +∞, poate avea puncte de discontinuitate numai de speţa ı̂ntâia.
Să presupunem că funcţia f este crescătoare şi să alegem un punct x0 arbitrar din
(a, b). Există punctele x1 , x2 ∈ (a, b) astfel ı̂ncât x1 < x0 < x2 . Pentru orice x ∈ (x1 , x0 ) avem
f (x1 ) ≤ f (x) ≤ f (x0 ), de unde prin trecere la limită rezultă f (x1 ) ≤ lim f (x) ≤ f (x0 ),
x → x0
x < x0
ceea ce ne arată că f (x0 − 0) este finită. În mod analog, considerând x ∈ (x0 , x2 ), obţinem că
f (x0 + 0) este finită. Prin urmare, dacă x0 este punct de discontinuitate, atunci el este de
speţa ı̂ntâia.
Din demonstraţie rezultă că pentru orice x0 ∈ (a, b) au loc inegalităţile

f (x0 − 0) ≤ f (x0 ) ≤ f (x0 + 0).

Definiţia 10.4.3 Fie X şi Y două spaţii liniare normate. Spunem că operatorul liniar T :
X → Y este mărginit dacă există un număr M > 0 aşa ı̂ncât

(10.8) T (x) ≤ M x,

pentru orice x ∈ X.
Vom arăta că ı̂n cazul operatorilor liniari, mărginirea este echivalentă cu continuitatea
lor.
Teorema 10.4.4 Dacă T este un operator liniar ı̂ntre spaţiile liniare normate X şi Y , atunci
următoarele afirmaţii sunt echivalente:
1) T este continuu pe X;
2) T este continuu ı̂n originea θx a spaţiului X;
3) T este mărginit.
Demonstraţie. Din 1) rezultă imediat deoarece T fiind continuu pe X este continuu ı̂n orice
punct al lui X, deci şi ı̂n θx. Acum, să arătăm că din 2) rezultă 3). Din faptul că operatorul
T este continuu ı̂n θx rezultă că pentru orice ε > 0 există δε aşa ı̂ncât, pentru orice x ∈ X
cu x < δε , să avem T (x) − T (θx) = T (x) < ε. În particular, luând ε = 1 există δ1 > 0 aşa
ı̂ncât din ||x|| < δ1 să rezulte ||T (x)|| < 1.
Se observă că (10.8)4 este verificată
4 pentru x = θx. Fie acum x = θx. Să considerăm
δ1 x 4 δ1 x 4 δ1
y= . Atunci y = 4 4
4 2 · x 4 = 2 < δ1 , ceea ce conduce la T (y) ≤ 1. De aici obţinem
2 x
4  4 4 4
4 4 4 4
4T δ1 x 4 = 4 δ1 T (x)4 ≤ 1,
4 2 x 4 4 2x 4

209
de unde
δ1
T (x) ≤ 1,
2x
adică
2
T (x0 ) ≤ x,
δ1
pentru orice x ∈ X. Prin urmare, operatorul T este mărginit.
Să arătăm că 3) implică 1). Din faptul că T este mărginit rezultă că există M > 0 aşa
ı̂ncât (10.8) să aibă loc.
ε
Fie xo ∈ X arbitrar. Pentru orice ε > 0 şi orice x ∈ X, aşa ı̂ncât x − x0  < , avem
M
ε
T (x) − T (x0 ) = T (x − x0 ) ≤ M x − x0  < M · = ε,
M
ceea ce exprimă continuitatea operatorului T .
Corolarul 10.4.1 Dacă T : Rn → Rp este un operator liniar, atunci el este continuu.
Demonstraţie. Fie T = (T1 , T2 , . . . , Tp ), unde
Ti : Rn → R, i = 1, p. Dacă T este operator liniar, atunci rezultă că şi aplicaţiile Ti
sunt liniare.
Conform Teoremei 10.4.3, a arăta că T este un oeprator liniar continuu revine la a
arată că Ti , i = 1, p, sunt funcţii continue. Prin urmare, este suficient să arătăm că un
operator liniar T : Rn → R este continuu.
Fie B = {e1 , e2 , . . . , en } baza canonică a lui Rn . Dacă x ∈ Rn atunci x = (x1 , x2 , . . . , xn ) şi

n
deci x = xi ei . Atunci
i=1 n


n
T (x) = T xi ei = xi T (ei ),
i=1 r=1

de unde, utilizând inegalitatea lui Cauchy–Schwartz–Buniakowski, avem


  12 n 12

n 

 
|T (x)| =  xi T (ei ) ≤ T 2 (ei ) x2i = M x,
 
i=1 i=1 i=1

pentru orice x ∈ R , care ne arată că T este un operator liniar mărginit. Aşadar, conform
n

Teoremei 10.4.4, rezultă că T este operator continuu.


În continuare vom prezenta câteva proprietăţi cu privire la transformarea mulţimilor
deschise, respectiv ı̂nchise, compacte şi conexe printr-o aplicaţie continuă.
Teorema 10.4.5 Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice şi f : X → Y o funcţie. Atunci
următoarele afirmaţii sunt echivalente:
1) f este continuă pe X;
2) pentru orice mulţime deschisă D din Y , imaginea inversă f −1 (D) este mulţime deschisă
ı̂n X;
3) pentru orice mulţime ı̂nchisă B din Y , imaginea inversă f −1 (B) este mulţime ı̂nchisă
ı̂n X;
4) pentru orice submulţime A a lui X, avem f (A) ⊂ f (A).
Demonstraţie. Să arătăm că din 1 rezultă 4). Fie x ∈ A aşa ca y = f (x). Cum x ∈ A rezultă
X
că există un şir de puncte (xn ) din mulţimea A aşa ı̂ncât lim xn = x. Din continuitatea
n→∞
Y
lui f rezultă lim f (xn ) = f (x) = y,adică am arătat că ı̂n mulţimea f (A) există un şir de
n→∞

210
Y
puncte (f (xn )) aşa ca lim f (xn ) = y. Prin urmare, y ∈ f (A), ceea ce ne arată că am dovedit
n→∞
incluziunea f (A) ⊂ f (A).
Acum, să arătăm că 4) implică 3). Fie B o mulţime ı̂nchisă ı̂n Y , adică B = B ı̂n Y .
Notăm f −1 (B) cu A. Conform ipotezei 4) avem

f (A) ⊂ f (A) = f (f −1 (B)) ⊂ B = B,

de unde
A ⊂ f −1 (f (A)) ⊂ f −1 (B) = A.
Cum A ⊂ A, rezultă că A = A, ceea ce ne arată că A = f −1 (B) este ı̂nchisă ı̂n X.
Să arătăm că 3) implică 2). Fie D o mulţime deschisă ı̂n Y . Atunci B = Y − D este
ı̂nchisă ı̂n Y . Conform ipotezei 3) mulţimea f −1 (B) = f −1 (Y − D) este ı̂nchisă ı̂n X. De aici
rezultă că
X − f −1 (B) = X − [f −1 (Y ) − f −1 (D)] = f −1 (D)
este deschisă ı̂n X.
Mai avem de demonstrat că din 2) rezultă 1). Fie x0 un punct arbitrar din X şi
D = SY (f (x0 ), ε) o sferă deschisă din Y . Conform ipotezei 2), mulţimea f −1 (D) este mulţime
deschisă ı̂n X. Rezultă că f −1 (D) este o vecinătate pentru x0 ∈ X.
Atunci există o sferă SX (x0 , δε ) ⊂ f −1 (D) aşa ı̂ncât pentru orice x ∈ SX (x0 , δε ) să avem
f (x) ∈ SY (f (x0 ), ε) = D, ceea ce ne arată că f este continuă ı̂n x0 (vezi Teorema 10.4.2).

Observaţia 10.4.2 Mulţimea funcţiilor continue pe X cu valori ı̂n Y se notează prin C(X, Y ).

Definiţia 10.4.4 Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice şi f : A ⊂ X → Y o funcţie. Spunem
că f este uniform continuă pe A, dacă oricare ar fi ε > 0 există δε > 0 (acelaşi pentru toate
punctele x ∈ A) astfel ı̂ncât, oricare ar fi x1 , x2 ∈ A cu proprietatea d1 (x1 , x2 ) < δε are loc
d2 (f (x1 ), f (x2 )) < ε.

Propoziţia 10.4.1 Dacă f : A ⊂ X → Y este o funcţie uniform continuă pe A, atunci f este


continuă pe A.

Demonstraţie. Să considerăm x0 un punct arbitrar din A. Din faptul că f este uniform
continuă pe A rezultă că, pentru orice ε > 0, există δε > 0 astfel ı̂ncât, pentru orice x1 , x2 ∈ A
cu d1 (x1 , x2 ) < δε , are loc d2 (f (x1 ), f (x2 )) < ε. Atunci, oricare ar fi x ∈ A aşa ı̂ncât d1 (x, x0 ) < δε ,
are loc d(f (x), f (x0 )) < ε, adică f este continuă ı̂n x0 . Cum x0 a fost ales arbitrar din A, rezultă
că f este continuă pe A.

Observaţia 10.4.3 Reciproca Propoziţiei 10.4.1 este falsă, adică există funcţii continue pe
o mulţime, care nu sunt uniform continue.

Exemplul 10.4.8. Fie f : (0, 1] → R definită prin f (x) = 1/x, x ∈ (0, 1]. Se observă că f este
continuă pe (0, 1].
Să presupunem că f este uniform continuă pe (0, 1], adică pentru orice ε > 0 există
un δε > 0, acelaşi pentru toate punctele x ∈ (0, 1], aşa ı̂ncât pentru orice x1 , x2 ∈ (0, 1] cu
proprietatea |x1 − x2 | < δε să aibă loc |f (x1 ) − f (x2 )| < ε. Să luăm, ı̂n particular, ε = 1/2,
când obţinem că există δ 21 > 0 astfel ı̂ncât pentru orice x1 , x2 ∈ (0, 1] cu |x1 − x2 | < δ 12 , avem
 
1 
 − 1  < 1.
 x1 x2  2
2
Fie x1 = 1/n şi x2 = 1/(n + 1) cu n ∈ N∗ ales aşa ı̂ncât < δ1/2 . Atunci, cum |x1 − x2 | =
  n
1 2  1 1  1
< < δ 21 , ar trebui ca  −  = |n − (n + 1)| = 1 < , ceea ce constituie o
n(n + 1) n x1 x2 2
contradicţie. Prin urmare, presupunerea făcută este falsă deci f nu este uniform continuă
pe (0, 1].

211
Observaţia 10.4.4 Uniform continuitatea este o proprietate globală pentru o funcţie,
referindu-se la ı̂ntreg domeniul de definiţie, al funcţiei, ı̂n timp ce, continuitatea unei
funcţii ı̂ntr-un punct este o proprietate locală.

Definiţia 10.4.5 Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice. Spunem că aplicaţia f : A ⊂ X → Y
este lipschitziană pe A, dacă există un număr α ≥ 0 astfel ı̂ncât oricare ar fi x1 , x2 ∈ A,
are loc d2 (f (x1 ), f (x2 )) ≤ αd1 (x1 , x2 ). Se mai zice că f este lipschitziană ı̂n raport cu α, sau
α–lipschitziană.

Propoziţia 10.4.2 Orice contracţie a unui spaţiu metric (X, d) este o funcţie lipschitziană.

Demonstraţie. Fie f o contracţie a lui X. Atunci, conform Definiţiei 8.2.8, există α ∈ [0, 1)
aşa că pentru orice x1 , x2 ∈ X, avem d(f (x1 ), f (x2 )) ≤ αd(x1 , x2 ), care ne arată că f este
lipschitziană.
Propoziţia 10.4.3 Orice funcţie lipschitziană este uniform continuă.
Demonstraţie. Fie f : A ⊂ (X, d1 ) → (Y, d2 ) o funcţie α–lipschitziană pe A, adică pentru orice
x1 , x2 ∈ A, are loc d2 (f (x1 ), f (x2 )) ≤ αd1 (x1 , x2 ). Fie ε > 0. Dacă α = 0,a tunci d2 (f (x1 ), f (x2 )) ≤
0, pentru orice x1 , x2 ∈ A. Rezultă că f (x1 ) = f (x2 ) oricare ar fi x1 , x2 ∈ A, deci f este
constantă pe A şi prin urmare este uniform continuă pe A.
Dacă α > 0, luând δε = ε/α, atunci pentru orice x1 , x2 ∈ A cu d1 (x1 , x2 ) < δε , are loc
ε
d2 (f (x1 ), f (x2 )) ≤ αd1 (x1 , x2 ) < α · = ε, ceea ce ne arată că f este uniform continuă pe A.
α
Acum, să facem câteva precizări asupra funcţiilor continue pe mulţimi compacte.
Teorema 10.4.6 Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice şi f : X → Y o funcţie continuă.
Dacă A este o submulţime compactă a lui X, atunci f (A) este o submulţime compactă a lui
Y.
Demonstraţie. Fie (yn ) un şir din f (A). Atunci, pentru orice n ∈ N, există xn ∈ K, aşa ı̂ncât
f (xn ) = yn . Mulţimea K fiind compactă, conform cu Definiţia 10.1.18, şirul (xn ) conţine
un subşir (xnk ) convergent. Din continuitatea lui f rezultă că şirul (f (xnk )) este un subşir
convergent al şirului (yn ) şi prin urmare, f (A) este o mulţime compactă din Y .
Definiţia 10.4.6 Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice. Spunem că o funcţie f : A ⊆ X → Y
este mărginită dacă mulţimea f (A) este mărginită ı̂n Y .
Acum, din Teorema 10.4.6 obţinem următorul rezultat.
Corolarul 10.4.2 Orice funcţie continuă pe un compact dintr-un spaţiu metric este
mărginită.
Demonstraţie. Fie f : A ⊂ (X, d1 ) → (Y, d2 ) o funcţie continuă şi A o submulţime compactă
a lui X; conform Teoremei 10.4.6 rezultă ca f (A) este compactă ı̂n Y . Atunci f (A) este
mărginită ı̂n Y şi deci funcţia f este mărginită pe A.
În caz particular, din Corolarul 10.4.2 obţinem următorul rezultat cunoscut din liceu:
Corolarul 10.4.3 Dacă funcţia f : [a, b] → R este continuă, atunci f este mărginită.

Observaţia 10.4.5 Dacă mulţimea A, pe care funcţia f este continuă, nu este compactă,
atunci rezultatul Corolarului 10.4.2 nu se mai păstrează.

Într-adevăr, dacă considerăm funcţia f : (0, 2) → R definită prin f (x) = 1/x; pentru orice
x ∈ (0, 2), aceasta este continuă pe (0, 2), dar f (0, 2) = (1/2, ∞) şi deci f nu este mărginită.
Definiţia 10.4.7 Fie (X, d) un spaţiu metric, f : X → R o funcţie, M = sup f (x) – marginea
x∈X
superioară a lui f pe X şi, respectiv, m = inf f (x) – marginea inferioară a lui f pe X.
x∈X
Spunem, că f ı̂şi atinge marginea superioară, respectiv marginea inferioară pe

212
mulţimea X dacă există un punct x1 ∈ X, respectiv un punct x2 ∈ X, aşa ca M = f (x1 )
, respectiv f (x2 ) = m.
Spunem că f ı̂şi atinge marginile pe X dacă f ı̂şi atinge atât marginea superioară cât
şi marginea inferioară pe X.

Teorema 10.4.7 (Weierstrass). Dacă A este o submulţime compactă a spaţiului metric (X, d)
şi f : X → R este continuă, atunci f ı̂şi atinge marginile pe mulţimea A.

Demonstraţie. Pe baza Corolarului 10.4.2 rezultă că f (A) este mărginită ı̂n R. Fie
M = sup f (x) şi m = inf f (x). Deoarece M şi m sunt puncte aderente pentru mulţimea
x∈A x∈A
f (A) rezultă că M ∈ f (A) şi m ∈ f (A). Din f (A) este compactă rezultă că este mulţime
ı̂nchisă şi atunci M ∈ f (A) şi m ∈ f (A).
Deci, rezultă că există x1 ∈ A aşa ı̂ncât f (x1 ) = M şi există x2 ∈ A aşa ca f (x2 ) = m,
ceea ce ne arată că f ı̂şi atinge marginile pe A.
În particular, din Teorema 10.4.7 obţinem cunoscuta teoremă a lui Weierstrass stu-
diată ı̂n liceu.

Corolarul 10.4.4 Funcţia f : [a, b] → R continuă pe [a, b] este mărginită şi ı̂şi atinge marginile
pe [a, b].

Dăm acum o reciprocă pentru Propoziţia 10.4.1.

Teorema 10.4.8 (Cantor.) Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice. Dacă f : A ⊆ X → Y
este o funcţie continuă pe A, iar A este o mulţime compactă ı̂n X, atunci f este uniform
continuă pe A.

Demonstraţie. Presupunem că f nu este uniform continuă. Atunci, există un ε0 > 0 aşa ı̂ncât
pentru orice δ > 0 există x1,δ , x2,δ ∈ A cu proprietatea că d1 (x1,δ , x2,δ ) < δ şi d2 (f (x1,δ ), f (x2,δ )) ≥
ε0 .
În particular, dacă δ = 1/n cu n ∈ N∗ şi notăm x1,δ = xn , x2,δ = yn obţinem şirurile (xn ),
(yn ) din A cu proprietatea că d1 (xn , yn ) < δ şi d2 (f (xn ), f (yn )) ≥ ε0 .
Din faptul că mulţimea A este compactă rezultă că şirul (xn ) conţine un subşir (xnk )
convergent la punctul x0 ∈ A. Considerăm subşirul (ynk ) a şirului (yn ). Cum

1
d1 (ynk , x0 ) ≤ d1 (ynk , xnk ) + d1 (xnk , x0 ) ≤ + d1 (xnk , x0 )
nk
şi  
1
lim + d1 (xnk , x0 ) = = 0,
k→∞ nk
Y
rezultă că lim d1 (ynk , x0 ) = 0, adică lim ynk = x0 .
n→∞ n→∞
Funcţia f fiind continuă, rezultă că
Y Y
lim f (xnk ) = f (x0 ) şi lim f (ynk ) = f (x0 ),
k→∞ k→∞

de unde
lim d2 (f (xnk ), f (ynk )) = 0,
k→∞

care este ı̂n contradicţie cu d2 (f (xn ), f (yn )) ≥ ε0 .


Aşadar, f este uniform continuă pe A.
În ı̂ncheierea acestui paragraf să abordăm câteva proprietăţi ale funcţiilor continue
pe mulţimi conexe.

Teorema 10.4.9 Fie (X, d1 ) şi (Y, d2 ) două spaţii metrice şi f : A ⊆ X → Y o funcţie continuă
pe A. Dacă A este conexă ı̂n X, atunci f (A) este conexă ı̂n Y .

213
Demonstraţie. Vom proceda prin reducere la absurd. Să presupunem contrariul. Atunci
există două mulţimi nevide. D1 , D2 , deschise ı̂n Y , aşa ca

(10.9) D1 ∩ D2 ∩ f (A) = ∅, D1 ∩ f (A) = ∅, D2 ∩ f (A) = ∅

f (A) ⊂ D1 ∪ D2 .
Din faptul că f este continuă, pe baza Teoremei 10.4.5, rezultă că mulţimile Δ1 =
f −1 (D1 ) şi Δ2 = f −1 (D2 ) sunt deschise ı̂n X. În plus, Δ1 = ∅, Δ2 = ∅, Δ1 ∩ Δ2 ∩ A = f −1 (D1 ) ∩
f −1 (D2 ) ∩ A = f −1 (D1 ∩ D2 ) ∩ A = ∅, Δ1 ∩ A = ∅, Δ2 ∩ A = ∅ şi A ⊂ Δ1 ∪ Δ2 . De aici, rezultă că
A este neconexă, ceea ce este o contradicţie. Prin urmare, f (A) este conexă ı̂n Y .
Corolarul 10.4.5 (Proprietatea valorilor intermediare). Fie (X, d) un spaţiu metric şi A o
submulţime conexă a sa. Dacă funcţia f : A → R este continuă pe A, a, b ∈ A şi f (a) < f (b),
atunci pentru orice λ ∈ (f (a), f (b)) există cλ ∈ A aşa ca f (cλ ) = λ.
Demonstraţie. Din Teorema 10.4.9 rezultă că f (A) este conexă. De aici, pe baza Observaţiei
10.1.4, deducem că f (A) este interval. Prin urmare, dacă f (a), f (b) ∈ f (A),atunci intervalul
(f (a), f (b)) este ı̂nclus ı̂n f (A), de unde rezultă afirmaţia din Corolar.
Din Corolarul 10.4.5 obţinem rezultatul cunoscut:
Corolarul 10.4.6 Dacă I este un interval al lui R şi f : I → R este o funcţie continuă pe I,
atunci mulţimea f (I) este un interval.

Definiţia 10.4.8 Fie (X, d1 ) şi (Y, d2 două spaţii metrice. Spunem că funcţia f : X → Y
are proprietatea lui Darboux dacă transformă orice submulţime conexă a lui X ı̂ntr-o
submulţime conexă a lui Y .

Observaţia 10.4.6 Teorema 10.4.9 ne spune că orice funcţie continuă are proprietatea lui
Darboux.

Observaţia 10.4.7 În particular, o funcţie reală f : I → R, I interval din R, are proprietatea
Darboux dacă pentru orice a, b ∈ I cu a < b şi pentru orice λ ∈ (f (a), f (b)) sau λ ∈ (f (b), f (a)),
există un element cλ ∈ (a, b) aşa ca f (cλ ) = λ

Propoziţia 10.4.4 Fie f : I → R o funcţie, unde I este un interval al lui R. Dacă f are
proprietatea lui Darboux, atunci f poate avea numai discontinuităţi de speţa a doua.

Demonstraţie. Vom folosi metoda reducerii la absurd. Presupunem că funcţia f are un
punct x0 ∈ I de discontinuitate de speţa ı̂ntâia. Atunci, există limitele laterale fs (x0 ) şi fd (x0 )
finite şi ori f (x0 ) = fs (x0 ), ori f (x0 ) = fd (x0 ). Să presupunem că f (x0 ) < fd (x0 ). Considerăm
λ ∈ R aşa ı̂ncât f (x0 ) < λ < fd (x0 ); de aici, avem fd (x0 ) − λ > 0. Din definiţia limitei rezultă
că pentru ε = fd (x0 ) − λ > 0 există δε > 0 aşa ca, pentru orice x ∈ (x0 , x0 + δε ), să avem

|f (x) − fd (x0 )| < ε = fd (x0 ) − λ,

de unde f (x) > λ, pentru orice x ∈ (x0 , x0 + δε ).


Cum x0 + δε /2 ∈ (x0 , x0 + δε ), avem f (x + δε /2) > λ > f (x0 ), adică λ este valoare
intermediară. Atunci, din faptul că f are proprietatea lui Darboux rezultă că există
cλ ∈ (x0 , x0 + δε ) aşa ca f (cλ ) = λ, ceea ce contrazice f (x) > λ, pentru orice x ∈ (x0 , x0 + δε ).
Presupunerea făcută este falsă, rezultând că f nu poate avea decât puncte de discontinuitate
de speţa a doua.
Corolarul 10.4.7 Fie f : I → R o funcţie, unde I este un interval al lui R. Dacă f este
monotonă şi are proprietatea lui Darboux, atunci f este continuă pe I.
Demonstraţie. Conform Exemplului 10.4.3 funcţia f fiind monotonă ar putea avea numai
discontinuităţi de speţa ı̂ntâia, iar, conform Propoziţiei 10.4.4, posedând proprietatea Dar-
boux, poate avea numai discontinuităţi de speţa a doua. Prin urmare, f trebuie să fie
continuă.

214
Teorema 10.4.10 Fie I un interval al lui R, f : I → R o funcţie continuă şi J = f (I). Atunci
f este o bijecţie de la I la J dacă şi numai dacă f este strict monotonă. În acest caz inversa
f −1 : J → I este, de asemenea, strict monotonă (de acelaşi sens) şi continuă.

Demonstraţie. Să considerăm că f nu este strict monotonă. Atunci există trei puncte
x1 , x2 , x3 ı̂n I aşa ca x1 < x2 < x3 dar f (x1 ) > f (x2 ) şi f (x2 ) < f (x3 ) (sau f (x1 ) < f (x2 ) şi
f (x2 ) > f (x3 )). Fie λ = min(f (x1 ), f (x2 )) şi μ = (λ + f (x2 ))/2. Fără a influenţa rigurozitatea
demonstraţiei, putem alege λ = f (x1 ). Atunci

λ + f (x2 ) f (x1 ) + f (x2 )


f (x2 ) < μ = = < f (x1 )
2 2
şi cum f , fiind continuă, are proprietatea lui Darboux, rezultă că există c ∈ (x1 , x2 ) aşa ca
μ = f (c). Dar avem şi
λ + f (x2 )
f (x2 ) < μ = < f (x3 ),
2
rezultă de aici că există d ∈ (x2 , x3 ) aşa ca f (d) = μ. Rezultă că f (c) = f (d) şi fum f este
bijectivă obţinem c = d, ceea ce este imposibil deoarece x1 < c < x2 < d < x3 .
Aşadar, presupunerea făcută este falsă. Rezultă că f este strict monotonă.
Reciproc, să considerăm că f : I → J este strict monotonă şi continuă. De aici, rezultă
că f este injectivă (strict monotonă) şi surjectivă (J = f (I)), deci f este bijectivă.
Fără a restrânge generalitatea, să presupunem că f este strict crescătoare şi să arătăm
că şi f −1 : J → I are aceeaşi proprietate.
Fie y1 , y2 din J cu y1 < y2 . Notăm cu x1 = f −1 (y1 ) şi cu x2 = f −1 (y2 ). Atunci f (x1 ) = y1 şi
f (x2 ) = y2 . Cum f −1 este injectivă, avem f −1 (y1 ) = f −1 (y2 ). Dacă am avea f −1 (y1 ) > f −1 (y2 ),
atunci, cum f este strict crescătoare, rezultă f (f −1 (y1 )) > f (f −1 (y2 )), de unde y1 > y2 , ceea
ce este ı̂n contradicţie cu y1 < y2 . Rămâne că f −1 (y1 ) < f −1 (y2 ), ceea ce arată că f −1 este
strict crescătoare. Cum f −1 este strict monotonă şi posedă proprietatea lui Darboux, de
unde, pe baza Corolarului 10.4.7, rezultă că f −1 este continuă.

Observaţia 10.4.8 Utilizând această teoremă, se arată cu uşurinţă că funcţiile inverse ale
principalelor funcţii elementare sunt continue.

215
10.5 Test de verificare a cunoştinţelor nr. 9
1. Definiţi următoarele noţiuni:
a) Funcţie ı̂ntre două spaţii metrice;
b) Limita unei funcţii ı̂ntre două spaţii metrice (definiţia cu şiruri);
c) Funcţie continuă ı̂ntr-un punct (f : (X, d1 ) → (Y, d2 ) cu (X, d1 ) şi (Y, d2 ) spaţii me-
trice);
d) Funcţie vectorială;
e) Funcţie uniform continuă.
2. Să se demonstreze că o funcţie f : R → R periodică şi care nu este constantă nu are
limită la +∞ şi −∞.
1
3. Calculaţi L = lim (2x + x) x .
x→∞
1 π2
4. a) Fie funcţia f : 0, → R,
2

⎪ 2 1

⎨ x sin x
f (x) = , x = 0
⎪ sin x


1 , x = 0.

Să se studieze continuitatea funcţiei f .


b) Se dă funcţia f : [a, b] → [a, b] continuă pe [a, b]. Să se arate că (∃) c ∈ [a, b] astfel
ı̂ncât f (c) = c.
5. a) Folosind definiţia să se arate că:

lim (x2 + xy) = 4


(x,y)→(1,3)

2xy
b) Arătaţi cu ajutorul definiţiei cu şiruri că funcţia f (x, y) = , (x, y) = (0, 0) nu
x2 + y2
are limită ı̂n origine.
y 2 + 2x 2
6. Arătaţi cu ajutorul definiţiei cu şiruri că funcţia f (x, y) = , y − 2x = 0 nu are
y 2 − 2x
limită ı̂n origine.
7. Cercetaţi limitele iterate şi limita globală (dacă este cazul) ı̂n origine pentru funcţia:
x − y + x2 + y 2
a) f (x, y) = , x + y = 0,
x+y
1
b) f (x, y) = x sin , y = 0.
y
8. Calculaţi:
xy
a) L = lim √ ,
(x,y)→(0,0) xy + 1 − 1
sin(xy)
b) L = lim .
(x,y)→(0,0) x
9. Studiaţi uniform continuitatea funcţiei:
1+x
f (x) = arctg , x ∈ (1, ∞).
1−x

216
10. Studiaţi uniform continuitatea funcţiei:
x
f : (1, 2) × (1, 2) → R , f (x, y) = .
y

217
Indicaţii şi răspunsuri Testul nr. 9

2. Se foloseşte definiţia cu şiruri.

3. L = 2.
$ π2
4. a) f continuă pe 0, ;
2
b) Se foloseşte consecinţa lui Darboux: Dacă

f : [a, b] → [a, b]

continuă pe [a, b] şi f (a) · f (b) ≤ 0 atunci (∃)c ∈ [a, b] astfel ı̂ncât f (c) = c.
   
1 3 1 1
5. b) Se consideră şirurile , şi , .
n n n n
   
1 1 1 2
6. Se consideră şirurile , şi , .
n2 n n2 n
7. a) lim lim f (x, y) = 1 şi lim lim f (x, y) = −1, deci nu există limita globală ı̂n (0, 0).
x→0 y→0 y→0 x→0

b) Avem lim lim f (x, y) = 0 dar nu există lim lim f (x, y). Avem limita globală
y→0 x→0 x→0 y→0

lim f (x, y) = 0.
(x,y)→(0,0)

8. a) L = 2;
b) L = 2.

9. f este uniform continuă pe (1, ∞). Se foloseşte identitatea:


α−β
arctg α − arctg β = arctg şi inegalitatea arctg x ≤ x.
1 + αβ
10. f este uniform continuă pe (1, 2) × (1, 2).

218
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul II,
Editura ULB, Sibiu, 2002.

219
Capitolul 11

Derivarea funcţiilor reale

Obiective: Recapitularea noţiunilor legate de derivarea funcţiilor reale de o vari-


abilă reală cunoscute din ı̂nvăţământul preuniversitar şi completarea acestora cu acele
noţiuni, legate de subiectul prezentului capitol, strict necesare pentru parcurgerea capi-
tolelor următoare.
Rezumat: În acest capitol sunt recapitulate şi completate noţiunile legate de
derivata unei funcţii reale de o variabilă reală şi proprietăţile acesteia, proprietăţile de bază
ale funcţiilor reale derivabile pe un interval real (teoremele lui Fermat, Rolle, Cauchy, La-
grange, Darboux, Taylor), diferenţiala unei funcţii reale de o variabilă reală şi proprietăţile
acesteia. Capitolul se ı̂ncheie cu prezentarea unor aplicaţii imediate ale noţiuni de derivată
ı̂n economie.
Conţinutul capitolului:
1. Definiţia derivatei şi proprietăţile ei de bază
2. Proprietăţi de bază ale funcţiilor derivabile pe un interval
3. Diferenţiala unei funcţii reale
4. Aplicaţiile derivatei ı̂n economie
5. Test de verificare a cunoştinţelor
6. Bibliografia aferentă capitolului
Cuvinte cheie: derivată a unei funcţii reale de o variabilă reală, derivabilitate,
teorema lui Fermat, teorema lui Rolle, teorema lui Lagrange, teorema lui Darboux, teorema
lui Taylor, diferenţiala unei funcţii reale de o variabilă reală, producţie medie, ritm mediu,
elasticitate medie.

11.1 Definiţia derivatei şi proprietăţile ei de bază


Fie funcţia f : A → R, unde A este o submulţime a lui R şi fie x0 ∈ A un punct de
acumulare pentru A.

Definiţia 11.1.1 Spunem că funcţia f are derivată ı̂n punctul x0 dacă există ı̂n R limita

f (x) − f (x0 )
lim ,
x→x0 x − x0

notată, de obicei, cu f  (x0 ).


Dacă derivata f  (x0 ) există şi este finită zicem că funcţia f este derivabilă ı̂n punctul
x0 . Dacă f  (x0 ) = +∞ sau f  (x) = −∞, atunci vom spune că f are derivata infinită ı̂n
punctul x0 .

Propoziţia 11.1.1 Dacă funcţia f : A → R este derivabilă ı̂n x0 ∈ A ∩ A , atunci f este


continuă ı̂n x0 .

220
Demonstraţie. Din ipoteză avem că există şi este finită

f (x) − f (x0 )
lim = f  (x0 ).
x→x0 x − x0

Se observă că pentru orice x ∈ A − {x0 }, avem

f (x) − f (x0 )
f (x) = (x − x0 ) + f (x0 ),
x − x0

de unde prin trecere la limită obţinem lim f (x) = f (x0 ), ceea ce ne arată că f este continuă
x→x0
ı̂n x0 .

Observaţia 11.1.1 Reciproca Propoziţiei 11.1.1 este falsă deoarece există funcţii continue
ı̂ntr-un punct care nu sunt derivabile ı̂n acel punct. Pentru aceasta, este suficient să
considerăm funcţia f (x) = |x|, x ∈ R, care este continuă pe R dar nu este derivabilă ı̂n 0.

Definiţia 11.1.2 Dacă funcţia f : A → R, A ⊆ R, este derivabilă ı̂n orice punct al unei
submulţimi B a lui A, atunci spunem că f este derivabilă pe B.

Dacă B este formată din toate punctele lui A ı̂n care funcţia f este derivabilă, atunci
B se numeşte domeniul de derivabilitate a lui f .
În acest caz, funcţia definită pe B cu valori reale care asociază fiecărui punct x ∈ B
derivata f  (x) ı̂n punctul x se numeşte derivata lui f pe mulţimea B şi notăm prin f  .
Operaţia prin care din funcţia f obţinem funcţia f  se numeşte operaţie de derivare.

Definiţia 11.1.3 Fie f : A ⊂ R → R şi x0 ∈ A un punct de acumulare pentru A ∩ (−∞, x0 ).


Dacă există limita
f (x) − f (x0 )
fs (x0 ) = x→x
lim
x<x0
0 x − x0
atunci numim această limită derivata la stânga a funcţiei f ı̂n punctul x0 .
Dacă x0 ∈ A este punct de acumulare pentru A ∩ (x0 , +∞) şi există limita

f (x) − f (x0 )
fd (x0 ) = x→x
lim ,
0
x>x0
x − x0

atunci numim această limită derivata la dreapta a funcţiei f ı̂n punctul x0 .


Dacă fs (x0 ), respectiv fd (x0 ), este finită, atunci spunem că f este derivabilă la stânga,
respectiv la dreapta, ı̂n punctul x0 .

Observaţia 11.1.2 Dacă funcţia f este definită pe un interval [a, b] şi are derivată la dreapta
ı̂n punctul a, respectiv la stânga ı̂n punctul b, atunci convenim să spunem că f are derivată
ı̂n a, respectiv ı̂n b.

Din legătura ı̂ntre limita unei funcţii ı̂ntr-un punct şi limitele laterale ı̂n acel punct,
obţinem:

Propoziţia 11.1.2 O funcţie f : A ⊂ R → R are derivată ı̂n punctul x ∈ A ∩


A dacă şi numai dacă f are derivată la dreapta şi la stânga ı̂n punctul x0 , iar
fs (x0 ) = fd (x0 ) = f  (x0 ).

Teorema 11.1.1 Fie f, g : A → R două funcţii derivabile ı̂n x0 ∈ A ∩ A şi λ ∈ R. Atunci sunt
variabile afirmaţiile:

1) Suma f + g este derivabilă ı̂n x0 şi

(f + g) (x0 ) = f  (x0 ) + g  (x0 );

221
2) Produsul λf este derivabilă şi
(λf ) (x0 ) = λf  (x0 );

3) Produsul f g este derivabilă ı̂n x0 şi


(f g) (x0 ) = f  (x0 )g  (x0 ) + f (x0 )g  (x0 ).

4) Dacă g(x0 ) = 0, atunci funcţia cât f /g este derivabilă ı̂n x0 şi


 
f f  (x0 )g(x0 ) − f (x0 )g  (x0 )
(x0 ) = .
g (g(x0 ))2

Demonstraţia teoremei se face utilizând definiţia derivatei. De exemplu, să demon-


străm afirmaţia de la 3). Avem
(f g)(x) − (f g)(x0 ) f (x)g(x) − f (x0 )g(x0 )
lim = lim =
x→x0 x − x0 x→x0 x − x0
g(x)[f (x) − f (x0 )] + f (x0 )[g(x) − g(x0 )]
= lim =
x→x0 x − x0
f (x) − f (x0 ) f (x0 )[g(x) − g(x0 )]
= lim g(x) + lim =
x→x0 x − x0 x→x0 x − x0
= g(x0 )f  (x0 ) + f (x0 )g  (x0 ),
ceea ce trebuia demonstrat.
Teorema 11.1.2 (Derivarea funcţiilor compuse sau regula lanţului) Fie f : I ⊂ R → J ⊂ R,
g : J → R, I şi J fiind intervale. Dacă f este derivabilă ı̂n punctul x0 ∈ I şi g este derivabilă
ı̂n punctul f (x0 ), atunci funcţia h : I → R, h(x) = g(f (x0 )) (h = g ◦f ) este derivabilă ı̂n punctul
x0 şi h (x0 ) = g  (f (x0 ))f  (x0 ) adică (g ◦ f ) = (g  ◦ f )f  .
Demonstraţie. Considerăm funcţia ajutătoare u : J → R, definită prin

⎨ g(y) − g(y0 )
, dacă y = y0
(11.1) u(y) = y−y
⎩ g  (y ) 0 , dacă y = y0 = f (x0 )
0

Cum lim u(y) = g  (y0 ) rezultă că u este continuă ı̂n punctul y0 = f (x0 ). Din (11.1)
y→y0
obţinem:
g(y) − g(y0 ) = u(y) · (y − y0 ), pentru orice y ∈ J
Deci avem
g(f (x)) − g(f (x0 )) = u(f (x0 ))(f (x) − f (x0 )),
pentru orice x ∈ I.
Rezultă că, pentru orice x ∈ I − {x0 } avem
g(f (x)) − g(f (x0 )) f (x) − f (x0 )
(11.2) = u(f (x))
x − x0 x − x0
Cum f este derivabilă ı̂n x0 rezultă că f este continuă ı̂n x0 , de unde, ţinând seama
de continuitatea lui u ı̂n y0 = f (x0 ), deducem că funcţia compusă u ◦ f este continuă ı̂n x0 .
Acum, utilizând derivabilitatea lui f ı̂n punctul x0 obţinem din (11.2) că există limita
g(f (x)) − g(f (x0 ))
(11.3) lim = u(f (x))f  (x0 )
x→x0 x − x0
Dar din (11.1), avem u(y0 ) = u(f (x0 )) = g  (y0 ) =

= g (f (x0 )) şi atunci din (11.3) obţinem
(g ◦ f ) (x0 ) = g  (f (x0 ))f  (x0 ),
ceea ce trebuia demonstrat.

222
Teorema 11.1.3 Fie f : I → J, I, J intervale ale lui R, o funcţie continuă şi bijectivă. Dacă
f este dervabilă ı̂n punctul x0 ∈ I şi f  (x0 ) = 0, atunci funcţia inversă f −1 este derivabilă ı̂n
punctul f (x0 ) = y0 şi are loc formula
1
(f −1 ) (y0 ) = ,
f  (x0 )
adică
1
(f −1 ) =
f  ◦ f −1
Demonstraţie. Ţinând seama de Teorema 10.4.10 rezultă că f este strict monotonă. În
această situaţie deducem că funcţia inversă f −1 este strict monotonă şi continuă. Fie
y ∈ I − {y0 } şi x = f −1 (y). Deoarece y = y0 , ţinând seama de strict monotonia lui f −1 ,
rezultă că şi x = x0 . Acum, putem scrie

f −1 (y) − f −1 (y0 ) f −1 (f (x)) − f −1 (f (x0 ))


= =
y − y0 f (x) − f (x0 )
x − x0 1
= ,
f (x) − f (x0 ) f (x)−f (x0 )
x−x0

de unde prin trecere la limită rezultă

f −1 (y) − f −1 (y0 ) 1 1
lim = =  .
y→y0 y − y0 f (x) − f (x0 ) f (x0 )
lim
x→x0 x − x0

În finalul acestui paragraf să introducem noţiunea de derivată de ordin superior.
Fie f : D → R o funcţie derivabilă pe mulţimea D. În acest caz, există funcţia derivată
f  : D → R.
Definiţia 11.1.4 Spunem că funcţia f : D → R2 este de două ori derivabilă ı̂ntr-un punct
x0 ∈ D, dacă f este derivabilă ı̂ntr-o vecinătate a punctului x0 şi f  este derivabilă ı̂n
punctul x0 . În acest caz derivata lui f  ı̂n punctul x0 se numeşte derivata a doua a lui f ı̂n
x0 şi o notăm cu f  (x0 ).
Dacă f  este derivabilă pe D, atunci derivata lui f  se numeşte derivata a doua (sau
de ordinul doi) a lui f şi se notează cu f  .
În general, spunem că f este derivabilă de n (n ≥ 2, n ∈ N) ori ı̂n x0 ∈ D dacă f este
de (n − 1) ori derivabilă pe o vecinătate V a lui x0 şi dacă derivata de ordin (n − 1), notată
prin f (n−1) , este derivabilă ı̂n punctul x0 .
Spunem că f este derivabilă de n ori pe D dacă f este derivabilă de n ori ı̂n orice
punct x ∈ D.
Derivatele succesive ale lui f se notează prin f (1) = f  , f (2) = f  , f (3) = f  , . . ., f (n)
pentru orice n ∈ N∗ . Convenim, de asemenea, să notăm prin f (0) = f .
În general, aflarea derivatei de ordinul n a funcţiei f se face prin inducţie matematică.
Exemplul 11.1.1. Se consideră funcţia f : E → R, f (x) = (ax + b)α , α ∈ R, iar E domeniul
maxim de definiţie al lui f . Să se calculeze f (n) . Avem

f  (x) = αa(ax + b)α−1

f  = α(α − 1)a2 (ax + b)α−2 . . .


Presupunem că f (n) (x) = α(α−1) . . . (α−n+1)an (ax+b)α−n şi să demonstrăm că f (n+1) (x) =
α(α − 1) . . . (α − n + 1)(α − n)(ax + b)α−n−1 .
Avem

f (n+1) (x) = (f (n) (x)) = (α(α − 1) . . . (α − n + 1)an (ax + b)α−n ) =

223
= α(α − 1) . . . (α − n + 1)(α − n)an+1 (a + b)α−n−1
Aşadar, avem
(11.4) ((ax + b)α )(n) = α(α − 1) . . . (α − n + 1)an (ax + b)α−n
Cazuri particulare. 1. Dacă α = n, atunci din (11.4) găsim ((ax + b)n )(n) = n!an , de unde
pentru a = 1 şi b = 0 obţinem (xn )(n) = n!.
2. Dacă α = −1, atunci din (11.4) obţinem
 (n)
1 (−1)n · n!an
= .
ax + b (ax + b)n+1
3. Dacă α = 12 , atunci din (11.4) obţinem

√ (n) n−1 1 · 3 · 5 · . . . · (2n − 3) ax + b
( ax + b) = (−1) n
, n ≥ 2.
2 (ax + b)n
Exemplul 11.1.2. (Formula lui Leibniz.) Fie f, g : D ⊆ R → R două funcţii de n ori derivabile
pe D. Atunci are loc egalitatea

n
(f g)(n) (x) = Cnk f (n−k) (x)g (k) (x),
k=0

pentru orice x ∈ D, numită formula lui Leibniz.


Avem (f · g) (x) = f  (x)g (0) (x) + f (0) (x)g  (x), pentru orice x ∈ D, deci egalitatea este
adevărată pentru n = 1.
Presupunem egalitatea adevărată pentru n = k şi să demonstrăm că este adevărată şi
pentru n = k + 1.
Putem scrie
k 

(k+1) (k)  i (k−i) (i)


(f g) (x) = ((f g) ) (x) = Ck f (x)g (x) =
i=0

k 1 2
= Cki f (k−i+1) (x)g (i) (x) + f (k−i) (x)g (i+1) (x) =
i=0

= Ck0 f (k+1) (x)g (0) (x) + [Ck0 + Ck1 ]f (k) (x)g (1) (x)+
+[Ck1 + Ck2 ]f (k−1) (x)g (2) (x) + . . . + [Ckk−1 + Ckk ]f (1) (x)g (k) (x)+
+Ckk f (0) (x)g (k+1) (x).
Deoarece Ck0 = Ck+1
0 k+1
= 1, Ckk = Ck+1 = 1 şi Cki−1 + Cki = Ck+1
i
, i ≤ k, egalitatea precedentă
conduce la

k+1
(k+1−i) (i)
(f g)k+1 (x) = i
Ck+1 f(x) · g(x) ,
i=0
ceea ce trebuia demonstrat. Aşadar, formula lui Leibniz este adevărată.

11.2 Proprietăţi de bază ale funcţiilor derivabile pe un interval


Definiţia 11.2.1 Fie f : A ⊆ R → R o funcţie. Un punct x0 ∈ A se numeşte punct de maxim
local (sau relativ) al funcţiei f dacă există o vecinătate V (x0 ) a lui x0 aşa ı̂ncât f (x) ≤ f (x0 ),
pentru orice x ∈ V (x0 ) ∩ A.
Un punct x0 ∈ A se numeşte punct de minim local (sau relativ) dacă există o vecinătate
V (x0 ) a lui x0 aşa ı̂ncât f (x) ≥ f (x0 ), pentru orice x ∈ V (x0 ) ∩ A.
Punctele de maxim sau minim local ale funcţiei f se numesc puncte de extrem relativ
(sau local) ale funcţiei f, iar valorile funcţiei ı̂n punctele sale de extrem se numesc extreme
ale funcţiei f .

224
Teorema 11.2.1 (Teorema lui Fermat). Fie I un interval al lui R şi fie funcţia f : I → R.
Dacă x0 este un punct de extrem local interior al intervalului I şi f este derivabilă ı̂n x0 ,
atunci f  (x0 ) = 0.

Demonstraţie. Să presupunem că x0 este un punct de maxim local pentru f , adică există
o vecinătate V (x0 ) a punctului x0 astfel ca f (x) ≤ f (x0 ), pentru orice x ∈ V (x0 ) ∩ I. Atunci,
pentru x ∈ V (x0 ) ∩ I cu x < x0 putem scrie

f (x) − f (x0 )
(11.5) ≤ 0,
x − x0
iar pentru x ∈ V (x0 ) ∩ I cu x > x0 avem

f (x) − f (x0 )
(11.6) ≥ 0.
x − x0
Cum f este derivabilă ı̂n punctul interior x0 ∈ I, deducem că există fs (x0 ), fd (x0 ) şi
f (x0 ) = fs (x0 ) = fd (x0 ) ∈ R. Ţinând seama de aceasta şi trecând la limită ı̂n (11.5) şi (11.6),


obţinem, pe de o parte că f  (x0 ) = fs (x0 ) ≤ 0, iar, pe de altă parte, că f  (x0 ) = fd (x0 ) ≥ 0. De
aici, rezultă că f  (x0 ) = 0, ceea ce trebuia demonstrat.
Observaţia 11.2.1 Teorema lui Fermat dă numai o condiţie necesară dar nu şi suficientă
pentru existenţa punctelor de extrem. Se poate ı̂ntâmpla ca ı̂ntr-un punct derivata să se
anuleze fără ca punctul respectiv să fie punct de extrem local. Rădăcinile derivatei unei
funcţii se numesc puncte critice sau puncte staţionare pentru funcţia respectivă.

Observaţia 11.2.2 Geometric, teorema lui Fermat afirmă că graficul unei funcţii derivabile
are tangentă paralelă cu axa Ox ı̂n punctele de extrem interioare intervalului de definiţie a
funcţiei.

Teorema 11.2.2 (Teorema lui Rolle). Fie funcţia f : [a, b] → R, unde a, b ∈ R şi a < b. Dacă
sunt ı̂ndeplinite condiţiile:
i) f este continuă pe [a, b],
ii) f este derivabilă pe (a, b),
iii) f (a) = f (b),
atunci există un punct c ∈ (a, b) aşa ı̂ncât f  (c) = 0.

Demonstraţie. Dacă f este constantă pe [a, b], atunci f  = 0 pe (a, b) şi deci orice punct
c ∈ (a, b) satisface cerinţa f  (c) = 0.
Să admitem acum că f nu este constantă pe [a, b]. Cum f este continuă pe intervalul
compact [a, b], conform Corolarului 10.4.3. rezultă că f este mărginită şi ı̂şi atinge marginile.
Dacă m = inf f (x) şi M = sup f (x), atunci există x1 ∈ [a, b] şi x2 ∈ [ a, b] aşa ı̂ncât f (x1 ) = m
x∈[a,b] x∈[a,b]
şi f (x2 ) = M . Cum f nu este constantă pe [a, b] deducem că m < M . Se observă că x1 şi x2
nu pot fi ambele situate ı̂n extremităţile intervalului [a, b]. Într-adevăr, dacă am presupune
că x1 = a sau x1 = b, cum f (a) = f (b), din f (x1 ) = f (a) = m < M = f (x2 ) rezultă că x2 nu poate
coincide nici cu a şi nici cu b, deci x2 ∈ (a, b). Atunci, conform Teoremei lui Fermat, avem
f  (x2 ) = 0 şi deci există c = x2 ∈ (a, b) aşa ca f  (c) = 0.
Observaţia 11.2.3 Geometric, teorema lui Rolle afirmă că ı̂n condiţiile din enunţul teoremei
există cel puţin un punct al graficului funcţiei f , care nu coincide cu extremităţile, ı̂n care
tangenta este paralelă cu axa Ox.

Observaţia 11.2.4 Dacă ı̂n teorema lui Rolle f (a) = f (b) = 0, atunci rezultă că ı̂ntre două
rădăcini a, b ale funcţiei f există cel puţin o rădăcină c a derivatei.

225
Observaţia 11.2.5 Între două rădăcini reale consecutive ale derivatei unei funcţii pe un
interval se află cel mult o rădăcină reală a funcţiei.

Într-adevăr, fie c1 < c2 două rădăcini consecutive ale derivatei. Să presupunem că
există două răcini reale diferite x1 şi x2 ale funcţiei, f (x1 ) = f (x2 ) = 0, c1 < x1 < x2 < c2 .
După teorema lui Rolle ı̂ntre x! şi x2 trebuie să existe o rădăcină a derivatei, ceea ce nu se
poate, c1 şi c2 fiind rădăcini consecutive ale derivatei.
Această observaţie permite să separăm rădăcinile reale ale ecuaţiei f (x) = 0, dacă se
cunosct rădăcinile ecuaţiei f  (x) = 0. Fie c1 < c2 < c3 < . . . < ck rădăcinile ecuaţiei f  (x) = 0
aşezate ı̂n ordine crescătoare pe intervalul [a, b]. Formăm şirul lui Rolle

f (a), f (c1 ), f (c2 ), . . . , f (ck ), f (b).

Conform observaţiei 11.2.5, ı̂n fiecare interval (a, c1 ), (c1 , c2 ), . . . , (ck , b) există cel mult o
rădăcină a funcţiei. Există o rădăcină pe unul din aceste intervale numai dacă funcţia ia
valori de semne contrare la capetele intervalului respectiv. Prin urmare, ecuaţia f (x) = 0
are atâte rădăcini reale ı̂n [a, b] câte variaţii de semn are şirul lui Rolle.
Teorema 11.2.3 (Teorema lui Cauchy; a doua teoremă de medie a calculului diferenţial).
Fie f, g : [a, b] → R două funcţii care verifică condiţiile:
i) f, g sunt continue pe [a, b].
ii) f, g sunt derivabile pe (a, b).
iii) g  (x) = 0 pentru orice x ∈ (a, b).
Atunci există un punct c ∈ (a, b) astfel ca

f (b) − f (a) f  (c)


=  .
g(b) − g(a) g (c)

Demonstraţie. Observăm că g(b) = g(a) deoarece ı̂n caz contrar, conform Teoremei lui Rolle,
aplicată funcţiei g, ar există ξ ∈ (a, b) cu g  (ξ) = 0, ceea ce este ı̂n contradicţie cu condiţia
(iii) din enunţ.
Acum, considerăm funcţia auxiliară
f (b) − f (a)
h(x) = f (x) − g(x), x ∈ [a, b],
g(b) − g(a)

care este continuă pe [a, b], derivabilă pe (a, b), cu

f (b) − f (a) 
h (x) = f  (x) − g (x), x ∈ (a, b)
g(b) − g(a)

şi h(a) = h(b). Deci, Teorema lui Rolle este aplicabilă funcţiei h, ceea ce implică existenţa
unui punct c ∈ (a, b) aşa că h (c) = 0, echivalentă cu

f (b) − f (a) f  (c)


=  .
g(b) − g(a) g (c)
Observaţia 11.2.6 Teorema lui Cauchy ne permite să deducem aşa numitele ”Reguli ale lui
l Hospital” de aflare a limitelor de funcţii ı̂n cazul nedeterminărilor 00 şi ∞
∞.

Prima regulă a lui l Hospital.Fie I un interval din R, x0 ∈ I şi f, g : I → R. Dacă sunt


ı̂ndeplinite condiţiile:
i) funcţiile f şi g sunt derivabile pe I − {x0 };
ii) există lim f (x) = lim g(x) = 0;
x→x0 x→x0

226
iii) g  (x) = 0, oricare ar fi x ∈ I − {x0 };
f  (x)
iv) există lim = l ∈ R,
x→x0 g  (x)
atunci are loc
f (x) f  (x)
lim = lim  = l.
x→x0 g(x) x→x0 g (x)
Pentru demonstraţie considerăm funcţiile

f (x) , dacă x ∈ I − {x0 }
F (x) =
0 , dacă x = x0

şi 
g(x) , dacă x ∈ I − {x0 }
G(x) =
0 , dacă x = x0
Aceste funcţii sunt continue pe I derivabile pe I − {x0 } şi G (x) = 0, oricare ar fi
x ∈ I − {x0 }. Aplicăm teorema lui Cauchy funcţiilor F (x) şi G(x) pe intervalul compact [x0 , x]
şi avem
F (x) − F (x0 ) F  (c) f  (c)
=  =  , x0 < c < x.
G(x) − G(x0 ) G (c) g (c)
De aici, utilizând condiţia iv), prin trecere la limită obţinem:

f (x) f  (x)
lim = lim  = l.
x→x0 g(x) x→x0 g (x)

A doua regulă a lui l Hospital.Fie a > 0 şi f, g : (a, +∞) → R două funcţii. Dacă sunt
ı̂ndeplinite condiţiile:

i) funcţiile f şi g sunt derivabile pe (a, +∞);

ii) lim f (x) = lim g(x) = 0;


x→∞ x→∞

iii) g (x) = 0 pentru orice x > a;
f  (x)
iv) există lim = l ∈ R, atunci are loc egalitatea
x→∞ g  (x)

f (x) f  (x)
lim = lim  .
x→∞ g(x) x→∞ g (x)

Pentru&demonstraţie
' se face schimbarea de variabilă x = 1/t şi se aplică prima regulă a lui l Hospital
1
pe intervalul 0, a pentru x → 0.

Observaţia 11.2.7 Dacă avem lim f (x) = lim y(x) = +∞, atunci scriem
x→x0 x→x0

1
f (x) f (x)
lim = lim 1
x→x0 g(x) x→x0 g(x)

şi se aplică prima regulă a lui l Hospital.

Observaţia 11.2.8 Cazurile de nedeterminare ∞ − ∞, 00 , 1∞ , ∞0 se reduc prin transformări


(operaţii) algebrice la situaţiile 00 sau ∞
∞.

Teorema 11.2.4 (Teorema lui Lagrange – teorema creşterilor finite – prima formulă de medie
a calculului diferenţial). Fie f : [a, b] → R o funcţie care satisface condiţiile:

227
i) f este continuă pe [a, b];

ii) f este derivabilă pe (a, b),

atunci există un punct c ∈ (a, b) aşa ca

f (b) − f (a)
= f  (c).
b−a
Demonstraţie. Luăm ı̂n Teorema lui Cauchy funcţia g(x) = x, x ∈ [a, b].

Observaţia 11.2.9 Dacă funcţia f are derivată nulă pe un interval I, atunci f este constantă
pe I.

Demonstraţie. Fie x0 un punct fixat din I şi x ∈ I un punct arbitrar. Aplicăm teorema
lui Lagrange pe intervalul [x0 , x] (sau [x, x0 ]) şi rezultă că există c ∈ (x0 , x) (sau (x, x0 )) aşa
ı̂ncât
f (x) − f (x0 ) = f  (c)(x − x0 ).
Cum f  (x) = 0, oricare ar fi x ∈ I, rezultă că f (x) = f (x0 ), oricare ar fi x ∈ I, şi deci f
este cosntantă pe intervalul I.

Observaţia 11.2.10 Dacă două funcţii sunt derivabile pe un interval I şi derivatele sunt
egale pe acest interval, atunci diferenţa lor este o constantă.

Demonstraţie. Dacă f  (x) = g  (x) pentru orice x ∈ I, atunci rezultă că (f − g) (x) = 0,
oricare ar fi x ∈ I. Atunci, pe baza Observaţiei 11.2.9, rezultă, (f − g)(x) = k, oricare ar fi
x ∈ I, adică f (x) − g(x) = k, pentru orice x ∈ I.

Observaţia 11.2.11 Fie f o funcţie derivabilă pe intervalul I.

i) Dacă f  (x) ≥ 0, oricare ar fi x ∈ I, atunci f este crescătoare pe I;

ii) Dacă f  (x) ≤ 0, oricare ar fi x ∈ I, atunci f este descrescătoare pe I;

iii) Dacă f  (x) > 0, oricare ar fi x ∈ I, atunci f este strict crescătoare pe I;


iv) Dacă f  (x) < 0, oricare ar fi x ∈ I, atunci f este scrict descrescătoare pe I.

Demonstraţie. Vom justifica numai punctul i), celelalte cazuri demonstrându-se ı̂n
mod analog.
Fie x1 , x2 două puncte arbitrare din I aşa ı̂ncât x1 < x2 . Aplicăm teorema lui Lagrange
pe intervalul [x1 , x2 ] şi rezultă că există c ∈ (x1 , x2 ) aşa ı̂ncât f (x2 ) − f (x1 ) = f  (c)(x2 − x1 ).
Cum f  (x) ≥ 0, oricare ar fi x ∈ I, rezultă că f (x2 ) − f (x1 ) ≥ 0, adică f (x2 ) ≥ f (x1 ).
Aşadar, f este crescătoare pe I.
Afirmaţiile de la punctele i) şi ii) ale Observaţiei admit şi reciproce, ı̂n timp ce
afirmaţiile de la punctele iii) şi iv) nu mai admit reciproce.

Observaţia 11.2.12 Fie f o funcţie continuă pe un interval I şi x0 ∈ I. Dacă f este dervabilă
pe I − {x0 } iar derivata sa f  are limită (finită sau infinită) ı̂n punctul x0 , atunci există
derivata funcţiei f şi ı̂n punctul x0 şi ı̂n plus

f  (x0 ) = lim f  (x).


x→x0

Pentru demonstraţie se aplică teorema lui Lagrange pe intervalele [x, x0 ] şi [x0 , x] şi se
face x → x0 .

Observaţia 11.2.13 Dacă funcţia f are derivata mărginită pe I, atunci f este funcţia lips-
chitziană pe I.

228
Demonstraţie. Fie x1 , x2 două puncte arbitrare diferite din I. Aplicăm teorema lui
Lagrange pe intervalul [x1 , x2 ] (sau [x2 , x1 ]) şi există c ∈ (x1 , x2 ) aşa ı̂ncât f (x1 ) − f (x2 ) =
f  (c)(x1 − x2 ). Cum |f  (x)| ≤ M , M > 0, oricare ar fi x ∈ I, avem

|f (x1 ) − f (x2 )| = |f  (c)(x1 − x2 )| = |f  (c)| |x1 − x2 | ≤ M |x1 − x2 |,

ceea ce ne arată că f este lipschitziană pe I.

Teorema 11.2.5 (Teorema lui Darboux). Dacă f : I → R este o funcţie derivabilă pe I,


atunci derivata sa f  are proprietatea lui Darboux pe acel interval.

Demonstraţie. Fie x1 , x2 ∈ I cu x1 < x2 . Să presupunem că f  (x1 ) < f  (x2 ) şi
λ ∈ (f  (x1 ), f  (x2 )). Considerăm funcţia auxiliară g : I → R, g(x) = f (x) − λx, care verifică
inegalităţile: g  (x1 ) < 0 şi g  (x2 ) > 0.
Deoarece g este derivabilă pe [x1 , x2 ] ∈ I rezultă că g este continuă pe compactul [x1 , x2 ]
deci ı̂şi atinge marginile. Atunci există c ∈ [x1 , x2 ] aşa ı̂ncât g(c) = min g(x). Să arătăm
x∈[x1 ,x2 ]
1)
că c = x1 şi c = x2 . Din g  (x1 ) < 0 rezultă că există ε > 0 aşa ı̂ncât g(x)−g(x
x−x1 < 0, pentru
orice x ∈ (x1 , x1 + ε), de unde obţinem că g(x) < g(x1 ), pentru orice x ∈ (x1 , x1 + ε). Această
ultimă inegalitate ne arată că g ı̂şi atinge marginea inferioară ı̂ntr-un punct diferit de x1 ;
deci c = x1 . În mod analog, demonstrăm că c = x2 . Acum, aplicând teorema lui Fermat
funcţiei g pe intervalul [x1 , x2 ] rezultă că g  (c) = 0, adică f  (c) = λ.

Teorema 11.2.6 (Teorema lui Taylor). Fie I un interval deschis al lui R. Dacă funcţia
f : I → R este derivabilă de n + 1 ori pe I, atunci pentru orice două puncte x, x0 ∈ I, cu
x = x0 , există un punct c ∈ (x, x0 ) (sau (x0 , x)) aşa ı̂ncât

f  (x0 ) f  (x0 )
f (x) = f (x0 ) + (x − x0 ) + (x − x0 )2 + . . . +
1! 2!
f (n) (x0 ) f (n+1) (c)
+ (x − x0 )n + (x − x0 )(n+1) ,
n! (n + 1)!
numită formula lui Taylor.

Demonstraţie. Ne propunem să scriem pe f sub forma:

f  (x0 ) f  (x0 )
f (x) = f (x0 ) + (x − x0 ) + (x − x0 )2 + . . . +
1! 2!
(11.7)
f (n) (x0 )
+ (x − x0 )n + K(x − x0 )(n+1) , (∀)x ∈ I,
n!
unde K este un număr real. Considerăm funcţia auxiliară

f  (t) f  (t)
g(t) = f (t) + (x − t) + (x − t)2 + . . . +
1! 2!
f (n) (t)
+ (x − t)n + K(x − t)(n+1) , (∀)t ∈ I.
n!
Observăm că g este derivabilă pe I, g(x) = f (x), g(x0 ) = f (x0 ). Aşadar, funcţia g
satisface condiţiile teoremei lui Rolle pe [x, x0 ] (sau [x0 , x]). Atunci există un punct c ∈ (x, x0 )
(sau (x0 , x)) aşa ı̂ncât g  (c) = 0.
Dar
f  (t) f  (t) f  (t) f  (t)
g  (t) = f  (t) + (x − t) − + (x − t)2 − (x − t)+
1! 1! 2! 1!
f (n+1) (t) f (n) (t)
+... + (x − t)n − (x − t)n−1 − K(n + 1)(x − t)n ,
n! (n − 1)!

229
(∀)t ∈ I, de unde
f (n+1) (t)
g  (t) = (x − t)n − K(n + 1)(x − t)n , (∀)t ∈ I.
n!
De aici obţinem g  (c) = 0, adică
f (n+1) (c)
(x − c)n = K(n + 1)(x − c)n ,
n!
de unde găsim
f (n+1) (c)
K= ,
(n + 1)!
care ı̂nlocuită ı̂n (11.7) conduce la formula lui Taylor.
Observaţia 11.2.14 Formula lui Taylor este o formulă de aproximare a funcţiei f prin poli-
nomul
f  (x0 ) f  (x0 )
(Tn f )(x) = f (x0 ) + (x − x0 ) + (x − x0 )2 + . . . +
1! 2!
f (n) (x0 )
+ (x − x0 )n ,
n!
numit polinomul lui Taylor de grad n asociat funcţiei f . Expresia
f (n+1) (c)
(vn t)(x) = (x − x0 )n+1 ,
(n + 1)!
se numeşte restul sub forma Lagrange al formulei lui Taylor.
Proprietatea esenţială a polinomului lui Taylor este dată de relaţiile:
(Tn f )(x0 ) = f (x0 ); (Tn f ) (x0 ) = f  (x0 );
(Tn f )(2) (x0 ) = f (2) (x0 ); . . . ; (Tn f )(n) (x0 ) = f (n) (x0 ).
Observaţia 11.2.15 Dacă ı̂n formula lui Taylor considerăm x0 = 0,atunci obţinem Formula
lui MacLaurin, adică
f  (0) f  (0) 2 f (n) (0) f (n+1) (c) n+1
f (x) = f (0) + x+ x + ... + + x .
1! 2! n! (n + 1)!
Observaţia 11.2.16 Dacă ı̂n formula lui Taylor considerăm n = 0, atunci obţinem formula
creşterilor finite a lui Lagrange (v.Teorema 11.2.4).
Observaţia 11.2.17 Punctul c din intervalul deschis determinat de punctele x şi x0 depinde
de x, x0 şi n. Punctul c se poate scrie şi sub forma c = x0 + θ(x − x0 ), unde θ ∈ (0, 1).
Exemple. 11.2.1. Funcţia f (x) = ex , x ∈ R, este de clasă C ∞ pe R iar f (k) (x) = ex , oricare
ar fi k ∈ N şi oricare ar fi x ∈ R. Cum f (k) (0) = 1, k ∈ N∗ , formula MacLaurin pentru ex are
forma:
x x2 xn xn+1 θx
ex = 1 + + + ... + + e , (∀)x ∈ R.
1! 2! n! (n + 1)!
11.2.2. Funcţia f (x) = ln(1 + x), x ∈ (−1, ∞), este indefinit derivabilă pe (−1, ∞). Cum
(k − 1)!
f (k) (x) = (−1)k−1 , k ∈ N∗ , (∀)x ∈ (−1, ∞)
(1 + x)k
(vezi Exemplul 11.1.1), avem f (0) = 1, f (k) (0) = (−1)k−1 ·
(k − 1)!, k ∈ N∗ şi formula de tip MacLaurin
x x2 x3 x4 xn
ln(1 + x) = − + − + . . . + (−1)n−1 +
1 2! 3! 4! n!
n+1
x 1
+(−1)n ·
n + 1 (1 + θx)n+1
(∀)x ∈ (−1, ∞), θ ∈ (0, 1).

230
11.3 Diferenţiala unei funcţii reale
În acest paragraf introducem noţiunea de diferenţială relativă la o funcţie reală de o
variabilă reală.
Definiţia 11.3.1 Fie f : I → R o funcţie definită pe intervalul deschis I.
Spunem că f este diferenţiabilă ı̂n punctul x0 ∈ I dacă există numărul real A, care
depinde de f şi x0 , şi o funcţie α : I → R cu lim α(x) = α(x0 ) = 0 astfel ı̂ncât
x→x0

(11.8) f (x) − f (x0 ) = A(x − x0 ) + α(x)(x − x0 ),

pentru orice x ∈ I.

Teorema 11.3.1 Funcţia f : I → R, interval deschis, este diferenţiabilă ı̂n punctul x0 ∈ I


dacă şi numai dacă f este derivabilă ı̂n x0 .

Demonstraţie. Să admite că f este diferenţiabilă ı̂n punctul x0 ∈ I. Atunci există
A ∈ R şi o funcţie α : I → R cu lim α(x) = α(x0 ) = 0 astfel ı̂ncât să aibă loc (11.8).
x→x0
Considerând x = x0 şi ı̂mparţind ı̂n (11.8) ambii membrii prin x − x0 obţinem
f (x) − f (x0 )
A + α(x), (∀)x ∈ I − {x0 }.
x − x0
f (x) − f (x0 )
Cum lim α(x) = 0, rezultă că există lim = A, adică f este derivabilă ı̂n
x→x0 x→x0 x − x0
punctul x0 şi A = f  (x0 ).
Reciproc, să presupnem că f este derivabilă ı̂n punctul x0 . Din definiţia derivatei lui
f ı̂n punctul x0 avem
f (x) − f (x0 )
lim = f  (x0 ).
x→x0 x − x0
Considerăm funcţia α : I → R,

⎨ f (x) − f (x0 )
− f  (x0 ) , pentru x ∈ I − {x0 }
α(x) = x − x0
⎩ 0 , pentru x = x . 0

Se observă că lim α(x) = α(x0 ) = 0, adică α este continuă ı̂n x0 . Din definiţia lui α
x→x0
pentru x = x0 avem
f (x) − f (x0 ) = f  (x0 )(x − x0 ) + α(x)(x − x0 ),
egalitate evident verificată şi pentru x ≡ x0 . Rezultă că f este diferenţiabilă ı̂n x0 şi A =
f  (x0 ).
Observaţia 11.3.1 Teorema 11.3.1 exprimă faptul că pentru funcţiile reale de o variabilă
reală noţiunile de diferenţiabilitate şi derivabilitate ı̂ntr-un punct sunt echivalente.

Observaţia 11.3.2 Dacă f este diferenţiabilă ı̂n punctul x0 , atunci pentru valori mici ale lui
h = x − x0 diferenţa
f (x) − f (x0 ) se poate aproxima cu f  (x0 )h, adică

(11.9) f (x0 + h) − f (x0 ) ≈ f  (x0 )h

Definiţia 11.3.2 Fie f : I → R, I interval deschis din R, derivabilă ı̂n punctul x0 ∈ I. Funcţia
liniară şi omogenă
g : R → R, g(h) = f  (x0 )h, h ∈ R,
se numeşte diferenţiala funcţiei f ı̂n punctul x0 şi se notează prin df (x0 ), adică

(11.10) df (x0 )(h) = f  (x0 )h.

231
Acum, relaţia (11.9) se mai poate scrie

f (x0 + h) − f (x0 ) ≈ df (x0 )(h).

Diferenţiala lui f ı̂ntr-un punct oarecare x ∈ I o notăm prin df (x).


Dacă ı̂n (11.10) alegem, ı̂n particular, ca f aplicaţia identică, atunci diferenţiala lui
f ı̂ntr-un punct x ∈ I este df (x)(h) = h, (∀)h ∈ R, adică h = d(x)(h). Folosind notaţia simplă
d(x) = dx, avem dx(h) = h. Revenind cu acest rezultat ı̂n (11.10), obţinem

df (x)(h) = f  (x)dx(h), (∀)h ∈ R,

de unde găsim
(11.11) df (x) = f  (x)dx.
Din (11.11) rezultă şi scrierea

df (x)
f  (x) = ,
dx
care constituie exprimarea derivatei lui f ı̂n limbajul diferenţialelor.
Ţinând seama de (11.11), obţinem imediat din regulile de derivare următoarele reguli
de diferenţiere: dacă f, g : I → R sunt funcţii derivabile pe intervalul deschis I ⊂ R, atunci

d(f + g) = df + dg; d(λt) = λdf, d(f g) = gdf + f dg,

iar dacă, ı̂n plus g = 0, atunci  


f gdf − f dg
d = .
g g2
Teorema 11.3.2 (diferenţiala unei funcţii compuse). Fie I şi J două intervale deschise ale
lui R şi fie u : I → J şi f : J → R două funcţii derivabile respectiv pe I şi J. Atunci

df (u) = f  (u)du.

Demonstraţie. Avem

df (u(x)) = (f (u(x))) dx = f  (u(x)) · u (x)dx = f  (u(x)) · du(x),

oricare ar fi x ∈ I.
Definiţia 11.3.3 Numim diferenţiala de ordinul doi a funcţiei f ı̂n punctul x, notată prin
d2 f (x), expresia d(df (x)), adică avem

d2 f (x) = d(df (x)).

În general, dn f (x) = d(dn−1 f (x)). Avem:

d2 f (x) = d(f  (x)dx) = d(f  (x)) · dx + f  (x)d(dx) =

= f  (x)dx · dx = f  (x)dx2 ,
deoarece d(dx) = 0 (derivata de ordinul doi a funcţiei identice este egală cu 0).
Prin inducţie matematică obţinem că dn f (x) = f (n) (x)dxn . Se mai zice că diferenţialele
de ordin superior sunt invariante faţă de ordinul de derivare.
Această proprietate nu se mai păstrează pentru diferenţiala funcţiilor compuse.

232
11.4 Aplicaţiile derivatei ı̂n economie
Economia este considerată cea mai ”exactă” dintre ştiinţele sociale, [?], deoarece, ı̂n
general, procesele economicce sunt studiate prin modele matematice. În §3.2 am văzut
că relaţiile dintre diferite mărimi economice se pot exprima prin funcţii. Pentru a studia
variaţia unei astfel de funcţii şi a trasa graficul ei se folosesc derivatele funcţiei de ordinul
ı̂ntâi şi doi.
În domeniul economic ı̂n descrierea variaţiei mărimii y ı̂n raport cu o altă mărime
x, dată prin funcţia y = f (x), x ∈ I, I interval din R, se utilizează conceptul de medie şi
conceptul de marginal. (vezi partea introductivă la capitolul 4).

Definiţia 11.4.1 Numim valoarea medie a lui f pe intervalul [x, x + h] ⊂ I,h > 0, notată cu
f (x), raportul
Δf f (x + h) − f (x)
= .
Δx h
Exemple: 11.4.1. Fie P (t) numărul de unităţi produse ı̂ntr-un flux tehnologic după t ore de
la ı̂nceperea proccesului. Valoarea medie a lui P (t) ı̂ntr-un interval de h ore este

P (t + h) − P (t)
= P (t)
h
şi se numeşte producţie medie.
11.4.2. Dacă funcţia de cost total pentru realizarea a x unităţi dintr-un produs este
2
C(x) = x9 + x + 100, x ≥ 1 să stabilim câte unităţi trebuie realizate pentru a avea cel mai
scăzut preţ mediu pe unitate de produs.
Trebuie să studiem variaţia funcţiei preţ mediu

C(x) x 100
C(x) = = + , x ≥ 1.
x 9 x
 1 100
Cum C(x) = 9 − x2 are rădăcina x = 30, din tabelul de variaţie

x 1 30 ∞

C (x) − − − 0 + + +
910 23
C(x) 9  3  ∞

rezultă că vom avea cel mai scăzut preţ mediu dacă se produc 30 unităţi de produs.

Definiţia 11.4.2 Numim valoare marginală a funcţiei f : I → R, ı̂n punctul x ∈ I

f (x + h) − f (x) df (x)
lim = f  (x) =
h→0 h dx

Exemplul 11.4.3. În cazul Exemplului 11.4.1, valoarea marginală a producţiei P (t) este
productivitatea
P (t + h) − P (t)
P  (t) = lim .
h→0 h
Definiţia 11.4.3 Numim variaţia relativă a funcţiei
f : I → R ı̂n punctul x ∈ I raportul

Δf (x) f (x + h) − f (x)
= , h > 0.
f (x) f (x)

Definiţia 11.4.4 5 Numim ritmul mediu de variaţie a funcţiei f : I → R ı̂n punctul x ∈ I


Δf (x)
raportul f (x) h şi se notează cu Rf,m .

233
Definiţia 11.4.5 Numim ritmul local (marginal) a funcţiei f : I → R ı̂n punctul x limita
lim Rf,m , adică
h→0 0
Δf (x) Δf (x) 1 f
lim h = lim · = = (ln f ) ,
h→0 f (x) h→0 h f (x) f
care este derivata logaritmică a lui f . Ritmul local a lui f ı̂n x se notează prin Rf,x .

Definiţia 11.4.6 Numim elasticitatea medie a funcţiei f : I → R ı̂n punctul x, notată prin
Em , raportul variaţiilor relative ale lui f (x) şi x, adică
0
Δf (x) h Δf (x) x
Ef,m = = · .
f (x) x h f (x)

Definiţia 11.4.7 Numim elasticitatea locală (marginală) a funcţiei f : I → R, ı̂n punctul x


limita elasticităţii medii când h → 0. Ea se notează prin Ef,m .
Avem
x Δf (x) x (ln f )
Ef,m = lim · = · f  = x(ln f ) = .
h→0 f (x) h f (ln x)

Proprietatea importantă a elasticităţii unei funcţii este aceea că ea este ca mărime
independentă de unităţile de măsură ı̂n care au fost măsurate variabilele f (x) şi x.
Exemplul 11.4.4. Fie x = ap + b, a > 0, b > 0 o funcţie cerere pentru o marfă de preţ p.
Elasticitatea marginală a cererii ı̂n p este
ap
Eap+b,p = p(ln(ap + b)) = .
ap + b
Cum Eap+b,p < 1, rezultă că la o cerere de tip liniar la o creştere relativă a preţului
corespunde o creştere relativă mai mică pentru cerere.

Observaţia 11.4.1 Noţiunile introduse ı̂n acest paragraf se transpun uşor la noţiunile din
domeniul economic. Astfel, avem cost mediu, cost marginal, elasticitatea costului, cerere
medie, cerere marginală, elasticitatea cererii etc.

234
11.5 Test de verificare a cunoştinţelor nr. 10
1. Definiţi următoarele noţiuni:
a) Derivata unei funcţii reale de o variabilă reală;
b) Diferenţiala unei funcţii reale de o variabilă reală.
2. Enunţaţi:
a) Teorema lui Fermat;
b) Teorema lui Rolle;
c) Teorema lui Lagrange;
d) Teorema (formula) lui Taylor;
c) Teorema lui Cauchy.
3. Studiaţi derivabilitatea funcţiei:

a) f : R → R, f (x) = 3 x3 − 3x + 2;
-
x2
b) f : R → R, f (x) = (x − 1) · arcsin ı̂n punctul x = 0.
x2+1
a0 2a1 22 a2 2n an
4. Numerele a0 , a1 , ..., an verifică condiţia + + + ... + = 0. Să se arate că
1 2 3 n+1
2
funcţia f : [1, e2 ] → R, f (x) = a0 + a1 ln x + a2 ln x + ... + an ln x are cel puţin un zero ı̂n
n

intervalul (1, e2 ).
5. a) Se consideră fincţia f : (−1, ∞) → R, f (t) = ln(1 + t). Aplicând teorema lui Lagrange
funcţiei f pe intervalul [0, x], x > 0, să se arate că oricare ar fi x > 0 are loc relaţia:
x − (1 + x) · ln(1 + x) < 0;
1
b) Să se arate că funcţia g : (0, ∞) → R, g(x) = (1 + x) x este monoton descrescătoare.
6. Utilizând teorema lui Cauchy să se demonstreze inegalitatea:
arctgx
ln(1 + x) > , x > 0.
1+x

7. a) Precizaţi punctele de extrem local ale funcţiei:

f :R→R , f (x) = |x2 − 1|.

b) Determinaţi derivata de ordinul n, n ∈ N, pentru funcţia f (x) = sin x.


c) calculaţi derivata de ordinul 20 a funcţiei

h(x) = x3 · sin x.

8. Să se dezvolte după puterile lui x funcţia

f : (−1, ∞) → R , f (x) = ln(1 + x).

9. Să se dezvolte f (x) = ex , x ∈ R, după puterile lui x + 1.


10. Să se determine n ∈ N astfel ı̂ncât polinomul lui Taylor Tn (x) ı̂n punctul x0 = 0 asociat
√ 1
funcţiei f (x) = 1 + x, x ∈ [−1, ∞] să difere de funcţie cu mai puţin de ı̂n intervalul
16
[0, 1].

235
Indicaţii şi răspunsuri
Test nr. 10

3. a) f este derivabilă pe R\{−2, 1}, iar (−2, 0) este punct de inflexiune şi (1, 0) este punct
de ı̂ntoarcere.
b) f este derivabilă ı̂n x = 0, iar (0, 0) este punct unghiular.

4. Se consideră funcţia g : [1, e2 ] → R,

a0 ln x a1 ln2 x an lnn+1 x
g(x) = + + ... +
1 2 n+1
şi se aplică teorema lui Rolle.

5. b) Se calculează g  (x) şi se foloseşte punctul (a).


6. Se aplică teorema lui Cauchy funcţiilor f, g : [0, x] → R, cu x > 0, f (t) = (1 + t) ln(1 + t),
g(t) = arctg (t).

7. a) (−1, 0) şi (1, 0) sunt puncte de minim local, iar (0, 1) este punct de maxim local;
$ π%
b) f (n) (x) = sin x + n , (∀)n ∈ N.
2
& ' & '
c) h (x) = 6 · 20 − 3x2 · 120 · cos x + x3 − 6x · 20
(20) 3
20 · sin x.

8. Se aplică formula lui Mac Laurin şi se obţine:

x2 x3 xn+1
ln(1 + x) = x − + + ... + (−1)n · +
2 3 n+1
xn+2 1
+(−1)n+1 · · cu θ ∈ (0, 1).
n + 2 (1 + θx)n+2

9. Se aplică formula lui Taylor cu x0 = −1 şi se obţine:


* +
1 x + 1 (x + 1)2 (x + 1)n
e = · 1+
x
+ + ... + +
e 1! 2! n!

(x + 1)n+1 −1+θ(x+1)
+ ·e .
(n + 1)!

10. Se impune ca restul formulei lui Mac Laurin să aibă valoarea absolută mai mică sau
1
egală cu şi se obţine n ≥ 2.
16

236
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul II,
Editura ULB, Sibiu, 2002.

237
Capitolul 12

Derivarea funcţiilor de mai multe


variabile

Obiective: Introducerea noţiunilor de derivată parţială, diferenţiala funcţiilor de mai


multe variabile, extremele funcţiilor de mai multe variabile, ajustarea datelor şi interpolarea
funcţiilor.
Rezumat: Capitolul ı̂ncepe cu definirea conceptului de derivată parţială şi
aplicaţiile economice imediate ale acestuia. Se continuă cu generalizarea noţiunii de
diferenţială pentru funcţiile reale de mai multe variabile reale, noţiuni necesare ı̂n studiul
extremelor condiţionate ale funcţiilor de mai multe variabile. Capitolul continuă cu studiul
metodelor de aflare a extremelor (simple şi condiţionate) ale funcţiilor de mai multe vari-
abile, metoda celor mai mici pătrate pentru ajustarea datelor şi câteva noţiuni legate de
interpolarea funcţiilor.
Conţinutul capitolului:
1. Derivate parţiale
2. Interpretări geometrice şi economice ale derivatelor parţiale
3. Derivarea funcţiilor compuse
4. Diferenţiala funcţiilor de mai multe variabile
5. Extremele funcţiilor de mai multe variabile
6. Extreme condiţionate
7. Ajustarea unor date
8. Interpolarea funcţiilor
9. Test de verificare a cunoştinţelor
10. Bibliografia aferentă capitolului
Cuvinte cheie: derivată parţială, diferenţială, extremele funcţiilor reale de mai
multe variabile reale, ajustare, interpolare.

12.1 Derivate parţiale


Să considerăm o funcţie de două variabile f : D ⊆ R2 → R, z = f (x, y) şi M (a1 , a2 ) un
punct din D.

Definiţia 12.1.1 Dacă există limitele

f (x, a2 ) − f (a1 , a2 ) f (a1 , y) − f (a1 , a2 )


lim şi lim
x→a1 x − a1 x→a2 y − a2
şi sunt finite, atunci spunem că funcţia f este derivabilă parţial ı̂n punctul M , ı̂n cazul
primei limite, ı̂n raport cu x şi ı̂n cazul al doilea, ı̂n raport cu y.

238
Aceste limite se numesc respectiv derivata parţială a funcţiei f ı̂n raport cu x şi
derivata parţială a funcţiei f ı̂n raport cu y, ı̂n punctul M (a1 , a2 ). Ele se notează prin

∂f (a1 , a2 ) ∂f (a1 , a2 )
fx (a1 , a2 ) = şi respectiv fy (a1 , a2 ) = .
∂x ∂y
Este evident că dacă funcţia f este derivabilă ı̂n raport cu x şi respectiv cu y, atunci
f este continuă ı̂n raport cu x şi respectiv ı̂n raport cu y.
Dacă funcţia f este derivabilă parţial ı̂n orice punct din domeniul D, atunci derivatele
parţiale resprezintă noi funcţii de două variabile, definite pe D şi asociate funcţiei f .

Practic, pentru a calcula derivata parţială ı̂n raport cu x a funcţiei z = f (x, y) se


consideră f ca funcţie de x, considerându-se y constantă, şi se aplică formulele de derivare
cunoscute, pentru această funcţie de variabilă x.
Pentru a calcula derivata parţială ı̂n raport cu y se consideră x constantă.
Exemplul 12.1.1. Să calculăm derivatele parţiale pentru funcţia
x+y
f (x, y) = , (x, y) ∈ R2 .
x2 + y2 + 1
Avem
∂f (x, y) 1(x2 + y 2 + 1) − 2x(x + y)
fx (x, y) = = =
∂x (x2 + y 2 + 1)2
y 2 − x2 − 2xy + 1
= ,
(x2 + y 2 + 1)2
∂f (x, y) 1(x2 + y 2 + 1) − 2y(x + y)
fy (x, y) = = =
∂y (x2 + y 2 + 1)2
x2 − y 2 − 2xy + 1
= ,
(x2 + y 2 + 1)2
oricare ar fi (x, y) ∈ R2 .
Exemplul 12.1.2. Pentru funcţia f (x, y) = x2y definită pe D = {(x, y) ∈ R2 |x > 0, y ∈ R}
derivatele parţiale sunt
∂f (x, y)
fx (x, y) = = 2y · x2y−1
∂x
şi
∂f (x, y)
fy (x, y) = = x2y 2 ln x.
∂y
Observaţia 12.1.1 Derivatele parţiale ale unei funcţii de n variabile, n ≥ 3, se definesc ı̂n
mod analog. Fie funcţia f : D ⊆ Rn → R, z = f (x1 , x2 , . . . , xn ) şi punctul M (a1 , a2 , . . . , an ) ∈ D.
Spunem că funcţia f este derivabilă parţial ı̂n punctul M ı̂n raport cu variabila xk , dacă

f (a1 , . . . , ak−1 , xk , ak+1 , . . . , an ) − f (a1 , a2 , . . . , an )


lim
xk →ak x − ak
există şi este finită. Această limită o numim derivata parţială a funcţiei f ı̂n raport cu
variabila xk ı̂n punctul M şi o notăm prin

∂f (M ) ∂f (a1 , a2 , . . . , an )
fx k (M ) = fx k (a1 , a2 , . . . , an ) sau =
∂xk ∂xk
O funcţie de n variabile derivabilă ı̂n fiecare punct al domeniului D este derivabilă
parţial ı̂n acel domeniu şi derivatele parţiale sunt funcţii de n variabile definite ı̂n acel
domeniu. Calculul lor se face pe aceleaşi principii ca la funcţiile de două variabile.

239
Exemplul 12.1.3. Pentru funcţia u = ln(x2 + y 2 + z 2 ) definită pe R − {(0, 0, 0)} = D, avem
derivatele parţiale:
∂u 2x ∂u 2y
ux = = 2 , uy = = 2 ,
∂x x + y2 + z2 ∂y x + y2 + z2
∂u 2z
uz = = 2 .
∂z x + y2 + z2
3z
Exemplul 12.1.4. Pentru funcţia u = xy definită pe D = {(x, y, z) ∈ R3 |x > 0, y > 0, z ∈ R},
derivatele parţiale sunt:
∂u 3z ∂u 3z
= y 3z xy −1 , = xy 3z · y 3z−1 ln x,
∂x ∂y
∂u 3z
= xy y 3z ln y ln x.
∂z
Acum să introducem derivatele parţiale de ordin superior.
Derivatele parţiale pentru funcţia f : D ⊆ R2 → R, z = f (x, y) sunt noi funcţii de două
variabile. Dacă derivatele parţiale fx (x, y), fy (x, y) sunt la rândul lor derivabile parţial ı̂n
raport cu x şi y, atunci derivatele lor parţiale se numesc derivate parţiale de ordinul doi ale
funcţiei f . Ele se notează prin
 
∂f ∂f ∂2f
(fx )x = fx2 sau = ;
∂x ∂x ∂x2
 
   ∂ ∂f ∂2f
(fx )y = fxy sau = ;
∂y ∂x ∂y∂x
 
   ∂f ∂f ∂2f
(fy )x = fyx sau = ;
∂y ∂x ∂y∂x
 
   ∂ ∂f ∂2f
(fy )y = fy2 sau = .
∂y ∂y ∂x2
Exemplul 12.1.5. Pentru funcţia f (x, y) = ln(x2 + y 2 + 3), (x, y) ∈ R2 , avem
2x 2y
fx = , fy = 2 ,
x2 + y 2 + 3 x + y2 + 3
 
2x 2(x2 + y 2 + 3) − 2x · 2x 2(y 2 − x2 + 3)
fx2 = = = ,
x2 + y 2 + 3 x (x2 + y 2 + 3)2 (x2 + y 2 + 3)2
 
 2x 4xy
fxy = =− 2 ,
x2 + y 2 + 3 y (x + y 2 + 3)2
 
 2y −4xy
fyx = = 2 ,
x2 + y 2 + 3 x (x + y 2 + 3)2
 
 2y 2(x2 + y 2 + 3) − 4y 2 2(x2 − y 2 + 3)
fy2 = = = .
x2 + y 2 + 3 y (x2 + y 2 + 3)2 (x2 + y 2 + 3)2

Se observă că derivatele fxy şi yx , numite şi derivate parţiale mixte, sunt egale. În
general ele nu sunt egale. Următoarea teoremă dă condiţii suficiente ca derivatele parţiale
mixte să fie egale.
Teorema 12.1.1 (A.Schwarz). Dacă funcţia f : D ⊆ R2 → R, z = f (x, y) are derivate parţiale

de ordinul doi ı̂ntr-o vecinătate V a lui (x, y) ∈ D şi dacă fxy este continuă ı̂n punctul (x, y),
 
atunci fxy (x, y) = fyx (yx).

240
Nu prezentăm demonstraţia acestei teoreme.

Observaţia 12.1.2 În mod analog se definesc derivatele parţiale de ordin n, n ≥ 3.

Rezultatul Teoremei lui Schwarz se păstrează.

Observaţia 12.1.3 Derivatele parţiale de ordin superior se definesc şi pentru funcţiile de n
variabile, n ≥ 3. Pentru derivatele lor mixte se păstrează afirmaţia din Teorema 12.1.1.

Exemplul 12.1.6. Să calculăm derivatele parţiale de ordinul doi pentru funcţia

f (x, y, z) = x2 + y 2 + z 2 , (x, y, z) ∈ R3 .

Avem:
x y
fx =  , fy =  ,
x2 + y 2 + z 2 x2 + y 2 + z 2
z
fz = 
x2 + y2 + z2
 x2
x2 + y 2 + z 2 − √
x2 +y 2 +z 2 y2 + z2
fx2 = = ,
x2 + y 2 + z 2 (x2 + y 2 + z 2 )3/2
  yx
fxy = fyx =− ,
(x2 + y 2 + z 2 )3/2
  xz
fxz = fzx =− 2 ,
(x + y 2 + z 2 )3/2
  yz
fyz = fzy =− 2 ,
(x + y 2 + z 2 )3/2
x2 + z 2
fy2 = ,
(x2 + y 2 + z 2 )3/2
x2 + z 2
fz2 = , (x, y, z) ∈ R3 − {(0, 0, 0)}.
(x2 + y 2 + z 2 )3/2
∂3u
Exemplul 12.1.7. Să calculăm dacă u = exyz , (x, y, z) ∈ R3 .
∂x∂y∂z
Avem
∂u
= xyexyz ,
∂z
∂2u
= xexyz + xy · xzexyz = (x + x2 yz)exyz ,
∂y∂z
∂3u
= (1 + 2xyz)exyz + (x + x2 yz)yzexyz =
∂x∂y∂z
= (1 + 3xyz + x2 y 2 z 2 )exyz , oricare ar fi (x, y, z) ∈ R3 .

12.2 Interpretări geometrice şi economice ale derivatelor


parţiale
Semnificaţia geometrică a derivatelor parţiale rezultă limpede dacă le interpretăm
cu ajutorul reprezentărilor geometrice. În figura 12.2.1. fie M (a, b, f (a, b)) un punct de
pe suprafaţa z = f (x, y), (x, y) ∈ D ⊆ R2 . Prin M pot fi duse două secţiuni verticale, una
perpendiculară pe Oy (y = b) şi cealaltă perpendiculară pe Ox (x = a).

241
Fig.12.2.1.
Prima este o curbă de pe suprafaţă, care trece prin M ı̂n direcţia lui Ox şi arată
variaţia lui z când x variază. În această secţiune valoarea lui y este b. Panta tangentei M Tx
la secţiune ı̂n M este măsurată de derivata lui z ca funcţie de x, adică de derivata parţială
∂z ∂f (a,b)
∂x (a, b) = ∂x .
(a,b)
La fel, valoarea ∂z(a,b)
∂y = ∂f∂y măsoară panta lui M Ty , tangenta ı̂n M (a, b) la secţiunea
verticală a suprafeţei perpendiculară pe Ox ı̂n x = a.
În concluzie, derivatele parţiale ∂f ∂f
∂x (a, b) şi ∂y (a, b) măsoară pantele suprafeţei z = f (x, y)
ı̂n două direcţii perpendiculare duse ı̂n punctul M (a, b), una perpendiculară pe Oy, iar
cealaltă pe Ox.
Utilizând interpretarea geometrică a derivatelor parţiale ale funcţiei z = f (x, y) ı̂n
punctul M (a, b, f (a, b)) putem scrie ecuaţia planului tangent la suprafaţa z = f (x, y) ı̂n punctul
M (a, b, f (a, b)). Acesta are forma
∂f (a, b) ∂f (a, b)
(x − a) + (y − b) = z − f (a, b).
∂x ∂y
Exemplul 12.2.1. Să scriem ecuaţia planului tangent la suprafaţa z = xy + 2x − 3y + 1 ı̂n
punctul M (1, 1, 1).
Avem
zx = y + 2, zx (1, 1) = 3,
zy = x − 3, zx (1, 1) = −2,
z(1, 1) = 1,
iar ecuaţia planului tangent este:
(x − 1)3 + (y − 1)(−2) = z − 1

242
adică
3x − 2y − z = 0.
Din punct de vedere economic derivatele parţiale au interpretări analoage cu cele de
la derivata funcţiilor reale de o variabilă reală.
De exemplu, dacă cererea pieţei pentru o marfă X este o funcţie de toate preţurile
pieţei
x = f (p1 , p2 , . . . , pn ), (p1 , p2 , . . . , pn ) ∈ Rn+ ,
atunci derivatele parţiale ale acestei funcţii arată variaţiile cereri când unul din preţuri
variază, celelalte rămânând constante.
Elasticitatea parţială a cererii pentru X ı̂n raport cu preţul său px este
∂(ln x) pk ∂x
nk = − =− · ,
∂(ln pk ) x ∂pk
care este o expresie independentă de unităţile de măsură ale cererii sau preţului. Ea dă
viteza descreşterii relative a cererii pentru o creştere relativă a preţului.
∂x
Raportul x/pk poate fi numit cerere medie, iar derivata parţială ∂p k
, cererea marginală
dată de preţul pk ı̂n combinaţia de preţuri (p1 , p2 , . . . , pn ).

12.3 Derivarea funcţiilor compuse


Fie z = f (u, v) o funcţie de două variabile definită ı̂ntr-un domeniu D ⊂ R2 , cu derivate
parţiale continue pe D. Dacă u = u(x) şi v = v(x), sunt două funcţii de variabilă x, definite
şi derivabile ı̂n intervalul I ⊆ R,a tunci funcţia compusă z(x) = f (u(x), v(x)) este derivabilă
pe I şi avem formula
∂f ∂f 
(12.1) z  (x) = · u (x) + · v (x).
∂u ∂v
Demonstraţia formulei rezultă din egalitatea
z(x) − z(x0 ) f (u(x), v(x)) − f (u(x0 ), v(x)) u(x) − u(x0 )
= · +
x − x0 u(x) − u(x0 ) x − x0

f (u(x0 ), v(x)) − f (u(x0 ), v(x0 )) v(x) − v(x0 )


+ ·
v(x) − v(x0 ) x − x0
prin trecere la limită când x → x0 , x0 fiind un punct arbitrar din I.
Derivatele de ordin superior ale acestor funcţii compuse se scriu ţinând seama de
formula (12.1) şi de regulile de derivare.
Exemplul 12.3.1. Să calculăm z (n) (x) dacă

z = f (u, v), u = ax + b, v = cx + d, x ∈ R.

Avem
∂f ∂f  ∂f ∂f
z  (x) =
· u (x) + v (x) = a +c ,
∂u ∂v ∂u ∂v
 
∂f ∂f
z  (x) = (z  (x))x = a +c =
∂u ∂v x
    *     +
∂f ∂f ∂ ∂f ∂ ∂f
=a +c =a u (x) + v  (x) +
∂u x ∂v x ∂u ∂u ∂v ∂u
*     +
∂ ∂f  ∂ ∂f 
+c u (x) + v (x) =
∂u ∂v ∂v ∂v
* 2 + * +
∂ f ∂2f ∂2f ∂2f
+a a 2 + c +c a +c 2 =
∂u ∂u∂v ∂u∂v ∂v

243
∂2f ∂2f ∂2f
= a2 2
+ 2ac + c2 2 .
∂u ∂y∂v ∂v
Simbolic acest rezultat se scrie sub forma
 (2)
∂ ∂
y  (x) = a +c f (u, v),
∂u ∂v
∂ ∂
cu semnificaţia că se ridică binomul la pătrat şi exponenţii puterilor pentru ∂u şi ∂v se iau
ca ordine de derivare pentru f (u, v) ı̂n raport cu u şi v.
Prin inducţie matematică se arată că
 (n)
(n) ∂ ∂
(12.2) z (x) = a +c f (u, v)
∂u ∂v
Pentru n = 3 avem
∂3f ∂3f ∂3f ∂3f
z (3) (x) = a3 3
+ 3a2 c 2 + 3ac2 2
+ c3 3 .
∂u ∂u ∂v ∂u∂v ∂v
Funcţiile compuse considerate mai sus sunt funcţii compuse de o singură variabilă. Se
pot considera funcţii din mai multe variabile. Astfel putem forma funcţia compusă de două
variabile
(12.3) z(x, y) = f (u(x, y), v(x, y)), (x, y) ∈ D ⊆ R2 .
Presupunem că funcţia f (u, v) admite derivate parţiale de ordinul ı̂ntâi continue şi
funcţiile u(x, y), v(x, y) au, de asemenea, derivate parţiale de ordinul ı̂ntâi.
Utilizând (12.1) ı̂n raport cu x şi y, din (12.3) găsim:
∂z ∂f ∂u ∂f ∂v
= zx = · + ·
∂x ∂u ∂x ∂v ∂x
∂z ∂f ∂u ∂f ∂v
= zy = · + · .
∂y ∂u ∂y ∂v ∂y
Derivatele parţiale de ordin superior ale acestor funcţii se calculează ı̂n mod analog,
ţinându-se seama că şi derivatele parţiale obţinute sunt funcţii compuse.
Aplicaţia 12.3.1. Funcţii omogene. Un polinom P de două sau mai multe variabile este
omogen de gradul k, k ∈ N, dacă toţi termenii polinomului sunt de gradul k. Aceste poli-
noame au proprietatea evidentă
P (tx1 , tx2 , . . . , txn ) = tk P (x1 , x2 , . . . , xn )
pentru orice t real.
Extindem această definiţie pentru funcţii de mai multe variabile.
Definiţia 12.3.1 Funcţia f (x1 , x2 , . . . , xn ) de n variabile, definită ı̂ntr-un domeniu D ⊆ Rn ,
este omogenă de gradul k, k ∈ R, dacă este ı̂ndeplinită condiţia
(12.4) f (tx1 , tx2 , . . . , txn ) = tk f (x1 , x2 , . . . , xn ),
oricare ar fi t ∈ R.
De exemplu, funcţia

x4 + x2 y 2 + y 4
f (x, y) = , (x, y) ∈ R2 − {(0, 0)}
x4 + y 4
este omogenă de gradul −2 deoarece

t2 x4 + x2 y 2 + y 4
f (tx, ty) = = t−2 f (x, y),
t4 (x4 + y 4 )
oricare ar fi t ∈ R − {0}.

244
Pentru funcţiile omogene este valabil următorul rezultat:
Teorema 12.3.1 Pentru ca funcţia f (x1 , x2 , . . . , xn ) să fie omogenă de gradul k este necesar
şi suficient să avem identitatea
x1 fx 1 (x1 , x2 , . . . , xn ) + x2 fx 2 (x1 , . . . , xn ) + . . . +
+xn fx n (x1 , . . . , xn ) = kf (x1 , x2 , . . . , xn ),
numită identitatea lui Euler.
Demonstraţie. Necesitatea. Funcţia f fiind omogenă de gradul k satisface (12.4). Membrul
ı̂ntâi al acestei relaţii este o funcţie compusă de t. Derivând ambii membrii ı̂n raport cu t,
avem egalitatea

n

xi ftxi
(tx1 , . . . , txn ) = ktk−1 f (x1 , . . . , xn )
i=1
care este adevărată şi pentru t = 1, adică

n
xi fx i (x1 , . . . , xn ) = kf (x1 , . . . , xn ),
i=1

care este tocmai indetitatea lui Euler.


Suficienţa. Considerăm funcţia auxiliară
f (tx1 , . . . , txn )
F (t) = , t = 0
tk
şi să presupunem că f satisface identitatea lui Euler.
Avem

n
tk xi fx i (tx1 , . . . , txn ) − ktk−1 f (tx1 , . . . , txn )
F  (t) = i=1
=
t2k

n
t xi fx i (tx1 , . . . , txn ) − kf (tx1 , . . . , txn ))
i=1
= =0
tk+1
pentru orice t = 0.
Rezultă că F (t) este o funcţie constantă. Valoarea constantei este dată de F (1) =
f (x1 , . . . , xn ). Atunci
f (tx1 , . . . , txn )
F (t) = = f (x1 , . . . , xn ),
tk
de unde
f (tx1 , . . . , txn ) = tk f (x1 , . . . , xn ),
adică funcţia f este omogenă de gradul k.
Aplicaţia 12.3.2. Formula lui Taylor. O altă aplicaţie a derivării funcţiilor compuse este
extinderea formulei lui Taylor la funcţiile de mai multe varaibile reale.
Teorema 12.3.2 (Taylor.) Fie funcţia f : D ⊂ R2 → R şi punctul interior M (a1 , a2 ) ∈ D.
Dacă funcţia f are derivate parţiale până la ordinul n + 1, n ∈ N, ı̂ntr-o vecinătate V (M ) a
lui M , atunci există punctul P (ξ, η) ∈ V (M ) aşa ı̂ncât să aibă loc formula

n * +(k)
1 ∂ ∂
f (x, y) = (x − a1 ) + (y − a2 ) f (a1 , a2 )+
k! ∂x ∂y
k=0
* +(n+1)
1 ∂ ∂
+ (x − a1 ) + (y − a2 ) f (ξ, η),
(n + 1)! ∂x ∂y
oricare ar fi (x, y) ∈ V (M ), numită formula lui Taylor

245
Demonstraţie. Considerăm funcţia compusă

F (t) = f (a1 + t(x − a1 ), a2 + t(y − a2 )), (x, y) ∈ V (M )

şi t ∈ [0, 1]. Pentru t = 0 avem F (0) = f (a1 , a2 ), iar pentru t = 1 avem F (1) = f (x, y).
Funcţia de o singură variabilă F (t) este definită şi posedă derivate pe variabilă până
la ordinul (n + 1) continue ı̂n origine şi deci se poate dezvolta după formula lui Maclaurin
ı̂n jurul originii:

t  tn tn+1
F (t) = F (0) + F (0) + . . . + F (n) (0) + F (n+1) (θt),
1! n! (n + 1)!

θ ∈ (0, 1). Pentru t = 1 obţinem:


1  1 (n) 1 (n+1)
(12.5) F (1) = f (x, y) = F (0) + F (0) + ... + F(0) + F
1! n! (n + 1)! (θ)

Utilizând formula (12.2) de la exemplul 12.3.1, obţinem


* +(k)
∂ ∂
F k (t) = (x − a1 ) + (y − a2 ) f (a1 + t(x − a1 ), a2 + t(y − a2 ))
∂x ∂y

k= 0, 1, ..., n+ 1; de unde
* +(k)
∂ ∂
k
F(0) = (x − a1 ) + (y − a2 ) f (a1 , a2 ), k = 0, n.
∂x ∂y

Acum din (12.5) rezultă formula lui Taylor, cu ξ = a1 + θ(x − a1 ),


η = a2 + θ(y − a2 ), θ ∈ (0, 1).
Pentru n= 0 formula lui Taylor conduce la formula creşterilor finite sau
formula lui Lagrange pentru funcţiile de două variabile:

f (x, y) = f (a1 , a2 ) + (x − a1 )fx (ξ, η) + (y − a2 )fy (ξ, η),

cu ξ = a1 + θ(x − a1 ), η = a2 + θ(y − a2 ), θ ∈ (0, 1)

Observaţia 12.3.1 Formula lui Taylor pentru două variabile se poate generaliza pentru
funcţiile cu m variabile, ı̂n condiţii analoage. Pentru funcţia z = f (x1 , x2 , ..., xm ), definită
ı̂ntr-o vecinătate a unui punct M (a1 , a2 , ..., am ) şi care are derivate parţiale până la ordinul
(n+ 1), continue, este valabilă formula lui Taylor:

n * +k
1 ∂ ∂
f (x1 , x2 , ..., xm ) = (x1 − a1 ) + ... + (xm − am ) f (M )+
k! ∂x1 ∂xm
k=0

* +(n+1)
1 ∂ ∂
+ (x1 − a1 ) + ... + (xm − am ) f (ξ1 , ξ2 , ..., ξm )
(n + 1)! ∂x1 ∂xm
ξ1 = a1 + θ(x1 − a1 ), ξ2 = a2 + θ(x2 − a2 ), ξm = am + θ(xm − am ),
θ ∈ (0, 1).

Aplicaţia 12.3.3. Derivata după o direcţie. Fie funcţia f : D ⊆ Rn → R, M (a1 , a2 , ..., an )



n
un punct interior din D şi vectorul l = (l1 , l2 , ..., ln ) ∈ Rn , pentru care ||l||2 = lk2 = 1.
k=1

∂f (M )
Definiţia 12.3.2 Numim derivata funcţiei f după direcţia l ı̂n punctul M, notată prin ∂l ,
numărul real definit prin
∂f (M ) f (x) − f (M )
= lim ,
∂l x→M d(x, M )

246
unde X = (x1 , x2 , ..., xn ) ∈ D iar d(X, M) este distanţa dintre punctele X şi M.
Considerând l = ek = (0, ..., 1, 0, ..., 0), obţinem

∂f (M ) ∂f (M )
= , k = 1, n
∂ek ∂xk
adică derivatele parţiale ale lui f ı̂n punctul M.

Teorema 12.3.3 Dacă funcţia f : D ⊆ Rn → R are derivate parţiale de ordinul ı̂ntâi ı̂n raport
cu fiecare din argumentele xk , k = 1, n, ı̂n punctul M (a1 , a2 , ..., an ) ∈ D, atunci derivata după
direcţia vectorului l = (l1 , ..., ln ), cu ||l|| = 1, este

∂f (M ) ∂f (M ) ∂f (M ) ∂f (M )
= · l1 + · l2 + ... + · ln
∂l ∂x1 ∂x2 ∂xn
Demonstraţie. Ţinând seamă că X = (x1 , ..., xn ) ∈ D situat pe direcţia l se scrie sub forma
M (a1 + tl1 , ..., an + tln ), t ∈ [0, 1], avem

∂f (M ) f (a1 + tl1 , an + tln ) − f (a1 , ..., an )


= lim =
∂l t→0 t
∂f (a1 + tl1 , ..., an + tln )
= |t=0
∂t
Folosind formula de derivare a funcţiilor compuse, putem scrie

∂f (M ) ∂f (M ) ∂(a1 + tl1 ) ∂f (M ) ∂(a2 + tl2 )


= · + · + ...+
∂l ∂x1 ∂t ∂x2 ∂t

∂f (M ) ∂(an + tln )
+ · =
∂xn ∂t
∂f (M ) ∂f (M ) ∂f (M )
= · l1 + · l2 + ... + · ln ,
∂x1 ∂x2 ∂xn
ceea ce trebuia demonstrat.
Exemplul 12.3.2. Să calculăm derivata ∂f ∂l pentru funcţia f (x, y, z) = xyz+x+y+z+1, (x, y, z) ∈
R3 , ı̂n punctul M(3, 2, 1), după direcţia l dată de dreapta MX, unde X(1, 3, 2).
Avem
M X = (1, 3, 2) − (3, 2, 1) = (−2, 1, 1),
 
√ √ −2 1 1
||M X|| = 4 + 1 + 1 = 6, l = √ , √ , √ ,
6 6 6
fx (M ) = 3, fy (M ) = 4, fz (M ) = 7
şi
∂f 6 4 7 5
(M ) = − √ + √ + √ = √
∂l 6 6 6 6
Aplicaţia 12.3.3. Fie F : D ⊆ R2 → R o funcţie de două variabile. O funcţie f : A → B cu
A × B ⊆ D astfel ı̂ncât F (x, f (x)) = 0 pentru orice x ∈ A se numeşte funcţie definită implicit
sau pe scurt funcţie implicită.
Cu alte cuvinte, funcţiile y= f(x) definite cu ajutorul ecuaţiilor F(x, y)= 0 se numesc
funcţii implicite. O astfel de ecuaţie poate să aibă pe A una, mai multe soluţii sau nici
una. Se pune problema studierii proprietăţilor (de continuitate, de derivabilitate, etc.) ale
funcţiilor implicite direct de pe ecuaţia de definiţie, fără a face explicitarea lor. Teoremele
care stabilesc astfel de proprietăţi se numesc teoreme de existenţă

Teorema 12.3.4 Fie F o funcţie reală de două variabile definită pe A × B, A ⊆ R, B ⊆ R şi


(a1 , a2 ) un punct interior lui A × B (a1 punct interior lui A, a2 punct interior lui B). Dacă

247
i) F (a1 , a2 ) = 0

ii) F, Fx , Fy sunt continue pe o vecinătate U × V a lui (a1 , a2 ),


U × V ⊂ A × B;

iii) Fy (a1 , a2 ) = 0, atunci

1) există o vecinătate U0 ⊆ U a lui a1 , o vecinătate V0 ⊆ V a lui a2 şi o funcţie unică


f : U0 → V0 , y = f (x), astfel ı̂ncât f (a1 ) = a2 şi F (x, f (x)) = 0 pentru x ∈ U0 ;

2) funcţia f are derivata continuă pe U0 dată de formula

Fx (x, y)
f  (x) = − ;
Fy (x, y)

3) dacă F are derivate parţiale de ordinul k continue pe U × V , atunci f are derivate de


ordinul k continuă pe U0 .

Nu prezentă demonstraţia riguroasă a acestei teoreme de existenţă. Însă dăm modalitatea


practică de obţinere a derivatei f  . În acest scop , considerăm ı̂n ecuaţia F (x, y) = 0 pe
y = f (x) şi derivăm ı̂n raport cu x utilizând regula de derivare a funcţiilor compuse. Avem

Fx + Fy · y  (x) = 0,

de unde
Fx
y  (x) = f  (x) = − .
Fy
Pentru calculul derivatelor de ordin superior ale funcţiei f se procedează ı̂n mod analog.
Exemplul 12.3.3. Ecuaţia x3 +3xy+y 3 = 1 defineşte pe y ca funcţie de x, pentru (x, y) ∈ D ⊂ R2 .
Să se calculeze y  , y  , y  (1) şi y  (1).
Derivăm ı̂n raport cu x ı̂n ecuaţia care defineşte pe y ca funcţie de x şi avem

x2 + y + xy  + y 2 y  = 0.

De aici, pentru x + y 2 = 0, obţinem

x2 + y
(12.6) y = − .
x + y2

Pentru a calcula pe y  procedăm astfel:

(2x + y  )(x + y 2 ) − (x2 + y)(1 + 2yy  )


y  = − =
(x + y 2 )2

x2 − y + xy  − 2x2 yy  − y 2 y  + 2xy 2
=− .
(x + y 2 )2
Acum, ı̂nlocuim cu y  cu expresia din (12.6) şi obţinem

6x2 y 2 − 2xy + 2xy 4 + 2x4 y


(12.7) y  = − .
(x + y 2 )2

Pentru x= 1 din ecuaţia dată avem

1 + 3y(1) + (y(1))3 = 1,

de unde y(1)= 0. Atunci, din (12.6) şi (12.7) obţinem y  (1) = −1 şi y  (1) = 0

248
Observaţia 12.3.2 Se pot considera funcţii implicite z = f (x1 , x2 , ..., xn ) de variabile definite
printr-o ecuaţie F (x1 , x2 , ..., xn , z) = 0. Calculul derivatelor parţiale ale lui z se obţin printr-
un procedeu analog cu cel de la derivarea funcţiilor implicite de o variabilă reală.
Exemplul 12.3.4. Să se calculeze derivatele parţiale de ordinul ı̂ntâi ale funcţiei z(x, y)
definită implicit de ecuaţia
2x + y + xyz = ez
Derivăm ı̂n raport cu x şi y ţinând seama că z este funcţie de x şi y. Avem
∂z ∂z
2 + yz + xy = ez · ,
∂x ∂x
∂z ∂z
1 + xz + xy = ez · ,
∂y ∂y
de unde
∂z 2 + yz ∂z 1 + xz
= z , = z ,
∂x e − xy ∂y e − xy
dacă ez − xy = 0.
Observaţia 12.3.3 Există situaţii practice sau teoretice ı̂n care intervin funcţii definite im-
plicit de sisteme de ecuaţii. Să considerăm cazul simplu a două ecuaţii cu patru variabile:

F1 (x, y, u, v) = 0,

F2 (x, y, u, v) = 0.
În anumite condiţii, acest sistem defineşte implicit două funcţii u = f (x, y) şi v = g(x, y)
Pentru calculul derivatelor parţiale de ordinul ı̂ntâi ale funcţiilor u şi v se derivează
ecuaţiile sistemului ı̂n raport cu x şi y, ţinând cont că u şi v sunt funcţii de x şi y. Avem:
∂F1 ∂F1 ∂u ∂F1 ∂v
+ · + · = 0,
∂x ∂u ∂x ∂v ∂x
∂F2 ∂F2 ∂u ∂F2 ∂v
+ · + · = 0,
∂x ∂u ∂x ∂v ∂x
∂F1 ∂F1 ∂u ∂F1 ∂v
+ · + · = 0,
∂y ∂u ∂y ∂v ∂y
∂F2 ∂F2 ∂u ∂F2 ∂v
+ · + · = 0.
∂y ∂u ∂y ∂v ∂y
∂u ∂v
Se observă că primele două ecuaţii formează un sistem liniar ı̂n necunoscutele ∂x şi ∂x .
Ambele sisteme au ca determinant pe
 
D(F1 , F2 )  ∂F
∂u
1 ∂F1 
∂v ,
=  ∂F2 ∂F2 
D(u, v) ∂u ∂v

numit determinantul funcţional sau iacobianul funcţiilor F1 , F2 ı̂n raport cu u, v. Dacă


D(F1 , F2 ) ∂u ∂v ∂u ∂v
= 0, atunci din sistemele de mai sus se află , , , .
D(u, v) ∂x ∂x ∂y ∂y
Exemplul 12.3.5. Sistemul x + 2y + u2 + v 2 = 6, x2 + xy + 2u3 − v 3 = 7 defineşte pe u şi v ca
∂u ∂v ∂u ∂v
funcţii de x şi y, cu u(2, 1)= 1 şi v(2, 1)= 1. Să calculăm derivatele parţiale , , ,
∂x ∂x ∂y ∂y
ı̂n punctul (2, 1).
∂u ∂v
Pentru a calcula şi derivăm ecuaţiile sistemului ı̂n raport cu x, ţinând seama că
∂x ∂x
u şi v sunt funcţii de x. Avem
∂u ∂v
1 + 2u + 2v =0
∂x ∂x

249
∂u ∂v
2x + 6u2 − 3v 2 = 0,
∂x ∂x
∂u ∂v
care este un sistem liniar ı̂n necunoscutele ∂x şi ∂x ,
cu determinantul
 
 2u 2v 
  = −6uv(v + 2u).
 6u2 −3v 2 

Dacă (x, y) ∈ R2 aşa ı̂ncât 6uv(v + 2u) = 0, atunci


 
 1 2v 

∂u  2x −3v 2  3v + 4x
= =− ,
∂x 6uv(v + 2u) 6u(v + 2u)
 
 2u 1 

∂v  6u2 2x  2x − 3u
= =
∂x 6uv(v + 2u) 3v(v + 2u)
În mod analog, derivând ecuaţiile sistemului ı̂n raport cu y, obţinem
∂u ∂v
2 + 2u + 2v =0
∂y ∂y
∂u ∂v
x + 6u2 − 3v 2 =0
∂y ∂y
şi dacă 6uv(v + 2u) = 0, avem

∂u 3v + x ∂v x − 6u
= , = .
∂y 3u(v + 2u) ∂y 3v(v + 2u)

Dacă x= 2, y= 1, atunci sistemul dat ia forma

u2 (2, 1) + v 2 (2, 1) = 2

2u3 u(2, 1) − v 3 (2, 1) = 1


care are soluţia u(2, 1)= 1 şi v(2, 1)= 1.
Acum, utilizând expresiile derivatelor parţiale ale funcţiilor u şi v, găsim
∂u 11 ∂v 1
(2, 1) = − , (2, 1) = ,
∂x 18 ∂x 9
∂u 5 ∂v 4
(2, 1) = − , (2, 1) = − .
∂y 9 ∂y 9

12.4 Diferenţiala funcţiilor de mai multe variabile


Fie f : D ⊆ R2 → R o funcţie de două variabile şi M (a1 , a2 ) un punct interior lui D.
Teorema 12.4.1 Dacă funcţia f admite derivate parţiale de ordinul ı̂ntâi ı̂ntr-o vecinătate
V(M) a punctului M şi dacă aceste derivate parţiale sunt continue ı̂n M, atunci există două
funcţii α1 , α2 : V (M ) → R, continue ı̂n M şi având proprietatea

lim α1 (x, y) = lim α2 (x, y) = 0


x→a1 , y→a2 x→a1 , y→a2

astfel ı̂ncât
(12.8) f (x, y) − f (a1 , a2 ) = fx (a1 , a2 )(x − a1 ) + fy (a1 , a2 )(y − a2 )+
+α1 (x, y)(x − a1 ) + α2 (x, y)(y − a2 ).

250
Demonstraţie. Avem

f (x, y) − f (a1 , a2 ) = [f (x, y) − f (a1 , y)] + [f (a1 , y) − f (a1 , a2 )] .

Aplicăm fiecărei paranteze drepte formula creşterilor finite şi avem:

f (x, y) − f (a1 , a2 ) = fx (ξ, y)(x − a1 ) + fy (a1 , η)(y − a2 ),

unde ξ este cuprins ı̂ntre a1 şi x, iar η este cuprins ı̂ntre a2 şi y. Acum putem scrie

f (x, y) − f (a1 , a2 ) = fx (a1 , a2 )(x − a1 ) + fy (a1 , a2 )(y − a1 )+


6 7
+ [fx (ξ, y) − fx (a1 , a2 )] (x − a1 ) + fy (a1 , a2 ) − fy (a1 , a2 ) (y − a2 )
În continuare, notăm:
α1 (x, y) = fx (ξ, y) − fx (a1 , a2 )
α2 (x, y) = fy (a1 , η) − fy (a1 , a2 ).
Cum din (x, y) → (a1 , a2 ) rezultă (ξ, y) → (a1 , a2 ) şi (a1 , η) → (a1 , a2 ) şi deoarece fx şi fy sunt
continue ı̂n M (a1 , a2 ) avem

lim α1 (x, y) = lim [fx (ξ, η) − fx (a1 , a2 )] = 0


(x,y)→(a1 ,a2 ) (x,y)→(a1 ,a2 )

şi
lim α2 (x, y) = lim [fy (a1 , η) − fy (a1 , a2 )] = 0
(x,y)→(a1 ,a2 ) (x,y)→(a1 ,a2 )

În final obţinem

f (x, y) − f (a1 , a2 ) = fx (a1 , a2 )(x − a1 ) + fy (a1 , a2 )(y − a2 )+

+α1 (x, y)(x − a1 ) + α2 (x, y)(y − a2 ),


unde funcţiile α1 şi α2 sunt continue ı̂n M şi

lim α1 (x, y) = lim α2 (x, y) = 0.


(x,y)→(a1 ,a2 ) (x,y)→(a1 ,a2 )

Teorema este demonstrată.


Pentru (x, y) suficient de aproape de (a1 , a2 ) din (12.1) avem

f (x, y) − f (a1 , a2 ) = fx (a1 , a2 )(x − a1 ) + fy (a1 , a2 )(y − a2 ),

iar dacă notăm x − a1 = h şi y − a1 = k, atunci obţinem

f (x, y) − f (a1 , a2 ) = fx (a1 , a2 )h + fy (a1 , a2 )k.

Definiţia 12.4.1 Funcţia liniară g : R2 → R,

g(h, k) = fx (a1 , a2 )h + fy (a1 , a2 )k

se numeşte diferenţiala funcţiei ı̂n punctul M (a1 , a2 ).


Notăm g prin df (a1 , a2 ). Dacă considerăm f (x, y) = x şi f (x, y) = y, (x, y) ∈ R2 găsim h = dx şi
k = dy. Acum diferenţiala lui f ı̂n (a1 , b1 ) ia forma

df (a1 , a2 ) = fx (a1 , a2 )dx + fy (a1 , a2 )dy.

Diferenţiala funcţiei f ı̂ntr-un punct arbitrar (x, y) ∈ D se scrie

df (x, y) = fx (x, y)dx + fy (x, y)dy =

251
∂f ∂f
= dx + dy.
∂x ∂y
În unele situaţii este avantajos să folosim scrierea
 
∂ ∂
df = dx + dy f,
∂x ∂y

unde produsul din dreapta este un produs ı̂ntre operatorul


∂ ∂
d= dx + dy,
∂x ∂y
numit operator de diferenţiere şi funcţia f.
Exemplul 12.4.1.Fie f (x, y) = y 2 xe3x+y , (x, y) ∈ R2 . Avem

∂f ∂f
df = dx + dy = y 2 (1 + 3x)e3x+y dx + xy(2 + y)e3x+y dy
∂x ∂y

Observaţia 12.4.1 Pentru o funcţie de n variabile f (x1 , x2 , ..., xn ) diferenţiala se defineşte


prin
∂f ∂f ∂f
df = dx1 + dx2 + ... + dxn
∂x1 ∂x2 ∂xn
iar operatorul de diferenţiere este
∂ ∂ ∂
d= dx1 + dx2 + ... + dxn .
∂x1 ∂x2 ∂xn
∂f
Uneori df se numeşte diferenţiala totală a funcţiei f, iar ∂xi dxi , i = 1, n, se numesc
diferenţialele parţiale.
Se observă imediat că operatorul de diferenţiere este liniar

Observaţia 12.4.2 Metoda directă de a diferenţia o funcţie este de a folosi formula funda-
mentală

n
∂f
df = · dxk .
∂xk
k=1

Uneori este mai convenabil să se folosească regulile de diferenţiere, care sunt analoage cu
regulile de derivare.

Exemplul 12.4.2. Să calculăm diferenţiala funcţiei u = x2 + y 2 + z 2 , (x, y, z) ∈ R3
Avem
d(x2 + y 2 + z 2 ) d(x2 ) + d(y 2 ) + d(z 2 )
du =  =  =
2 x2 + y 2 + z 2 2 x2 + y 2 + z 2
x y z
= dx +  dy +  dz,
2 2
x +y +z 2 2
x +y +z 2 2 x + y2 + z2
2

(x, y, z) ∈ R3 − {(0, 0, 0)}.


În aplicaţii sunt utile proprietăţile diferenţialei date ı̂n următoarele două teoreme.

Teorema 12.4.2 Condiţia necesară şi suficientă ca diferenţiala unei funcţii f : D ⊆ R2 →


R, z = f (x, y), să fie identic nulă pe D este ca f să fie constantă pe D.

Demonstraţie. Dacă f (x, y) = k, k constantă, pentru orice (x, y) ∈ D, atunci alegând pe rând
x constant şi y constant, obţinem ∂f ∂f
∂x = 0, ∂y = 0, deci df = 0 pe domeniul D. Reciproc, dacă
df = ∂f
∂x dx + ∂f
∂y dy = 0, pentru orice (x, y) ∈ D, atunci alegând pe rând x constant şi constant,
∂f ∂f
obţinem ∂x = 0 şi ∂y = 0.

252
Teorema 12.4.3 Dacă o expresie diferenţială E = P (x, y)dx + Q(x, y)dy, cu funcţiile P şi Q
continue pe domeniul D ⊆ R2 , este diferenţiala unei funcţii f : D → R, pentru orice (x, y) ∈ D,
∂x şi Q = ∂y , pentru orice (x, y) ∈ D
atunci P = ∂f ∂f

Demonstraţie: Pentru orice (x, y) ∈ D avem df = ∂f


∂x dx + ∂f
∂y dy = P dx + Qdy, de unde
   
∂f ∂f
−P dx + − Q dy = 0,
∂x ∂y

pentru orice ((x, y) ∈ D.


De aici, utilizând Teorema 12.4.2., obţinem ∂f
∂x = P şi ∂f
∂y = Q, oricare ar fi (x, y) ∈ D.

Observaţia 12.4.3 Proprietăţile diferenţialei din Teoremele 12.4.2. şi 12.4.3. se menţin şi
pentru funcţiile de n variabile, n ≥ 3.
Ca şi la funcţiile de o variabilă se pot introduce diferenţialele de ordin superior.

Definiţia 12.4.2 Numim diferenţială de ordinul doi a unei funcţii de mai multe variabile,
diferenţiala diferenţialei de ordinul ı̂ntâi.
În general, diferenţiala de ordinul n, n ∈ N∗ , este diferenţiala diferenţialei de ordinul (n-
1).

Dacă f : D ⊆ R2 → R este o funcţie derivabilă parţial de două ori pe D, cu toate derivatele


parţiale de ordinul doi continue, atunci avem
 
∂f ∂f
d2 f = d(df ) = d dx + dy =
∂x ∂y
   
∂f ∂f ∂f
=d dx + d(dx) + d dy + d(dy)
∂x ∂x ∂y
Cum d(dx) = 0 şi d(dy) = 0, putem scrie
*     +
2 ∂ ∂f ∂ ∂f
d f= dx + dy dx+
∂x ∂x ∂y ∂x
*     +
∂ ∂f ∂ ∂f
+ dx + dy dy =
∂x ∂y ∂y ∂y
∂2f 2 ∂2f ∂2f
= 2
dx + 2 dxdy + 2 dy 2 .
∂x ∂x∂y ∂y
Operatorul
∂2 ∂2 ∂2
d2 = 2
dx2 + 2 2 dxdy + 2 dy 2 =
∂x ∂x y ∂y
* +(2)
∂ ∂
= dx + dy
∂x ∂y
se numeşte operatorul de diferenţiere de ordinul doi. Cu ajutorul acestui operator avem
* +(2)
∂ ∂
d2 f = dx + dy f.
∂x ∂y

Prin inducţie matematică se arată că


* +(n)
∂ ∂
dn f = d(dn−1 f ) = dx + dy f (x, y).
∂x ∂y

253
Pentru o funcţie de n variabile, diferenţiala de ordinul m are forma
* +(m)
m ∂ ∂ ∂
d f= dx1 + dx2 + ... + dxn f (x1 , x2 , ..., xn )
∂x1 ∂x2 ∂xn

În caz particular, pentru m= 2 avem:


* +(2)
2 ∂ ∂ ∂
d f= dx1 + dx2 + ... + dxn f (x1 , ..., xn ) =
∂x1 ∂x2 ∂xn

∂2f 2 ∂2f 2 ∂2f 2


= 2 dx1 + 2 dx2 + ... + dx +
∂x1 ∂x2 ∂x2n n
∂2f ∂2f ∂2f
+2 dx1 dx2 + 2 dx1 dx3 + ... + 2 dx1 dxn +
∂x1 ∂x2 ∂x1 ∂x3 ∂x1 ∂xn
∂2f ∂2f
+2 dx2 dxn + ... + 2 dxn−1 dxn .
∂x2 ∂xn ∂xn−1 ∂xn
Se observă că d2 f pentru o funcţie de n variabile este o formă pătratică ı̂n variabilele
dx1 , dx2 , ..., dxn , care are matricea
H = (hij )i,j=1,n ,
∂2f
unde hij = ∂xi ∂xj , i, j = 1, n, numită matricea hessiană sau matricea lui Hess.

Observaţia 12.4.4 În cazul funcţiilor compuse de mai multe variabile formula diferenţialei
de ordinul ı̂ntâi se păstrează, spunându-se că ”diferenţiala de ordinul ı̂ntâi este invariantă
faţă de operaţia de compunere a funcţiilor”. Formula pentru diferenţialele de ordin superior
nu se mai păstrează pentru funcţiile compuse de mai multe variabile, adăugându-se câţiva
termeni suplimentari.

12.5 Extremele funcţiilor de mai multe variabile


Aflarea extremelor funcţiilor de mai multe variabile este una din cele mai importante prob-
leme de matematică deoarece multe chestiuni practice (ştiinţifice, tehnice, economice etc.)
conduc la optimizarea unor modele descrise prin funcţii de mai multe variabile.
Fie f : D ⊆ R2 → R, z = f (x, y) o funcţie de două variabile.

Definiţia 12.5.1 Un punct M (a1 , a2 ), (a1 , a2 ) ∈ D, se numeşte punct de minim local (relativ)
respectiv maxim local (relativ) al lui f dacă există o vecinătate V(M) a lui M aşa ı̂ncât
pentru orice (x, y) ∈ V (M ) ∩ D să avem f (x, y) ≥ f (a1 , a2 ) respectiv f (x, y) ≤ f (a1 , a2 ).
Cel mai mare dintre toate maximele locale se numeşte maxim absolut, iar cel mai mic
dintre toate minimele locale, minim absolut. Maximele şi minimele unei funcţii se numesc
extremele funcţiei.

Teorema 12.5.1 Fie (a1 , a2 ) ∈ D, D ⊆ R2 , punct de extrem local pentru funcţia f : D → R.


Dacă există derivatele parţiale fx şi fy , atunci fx (a1 , a2 ) = 0 şi fy (a1 , a2 ) = 0.

Demonstraţie. Pentru y = a2 , funcţia f (x, a2 )are ı̂n punctul x = a1 , un punct de extrem şi
este derivabilă ı̂n acest punct deci, conform teoremei lui Fermat avem fx (a1 , a2 ) = 0.
În mod analog, pentru x = a1 , funcţia f (a1 , y) are ı̂n punctul y = a2 un punct de extrem
şi deci fy (a1 , a2 ) = 0.
Reciproca teoremei nu are loc, adică dacă fx (a1 , a2 ) = 0, fy (a1 , a2 ) = 0 nu rezultă că (a1 , a2 )
este punct de extrem. Punctele (a1 , a2 ) pentru care fx (a1 , a2 ) = 0, fy (a1 , a2 ) = 0 se numesc
puncte staţionare. Aşadar, punctele de extrem ale funcţiei f se găsesc printre soluţiile
sistemului fx = 0, fy = 0, ı̂nsă nu toate soluţiile acestui sistem sunt puncte de extrem.

254
Observaţia 12.5.1 Într-un punct de extrem avem fx (a1 , a2 ) = 0, fy (a1 , a2 ) = 0, deci df (a1 , a2 ) =
0.
Ne interesează o condiţie suficientă ca un punct staţionar să fie punct de extrem.

Teorema 12.5.2 Fie punctul (a1 , a2 ) interior domeniului D ⊆ R2 , punct staţionar al funcţiei
f : D → R. Presupunem că funcţia f are derivate parţiale de ordinul doi continue ı̂ntr-o
vecinătate V (a1 , a2 ) a punctului (a1 , a2 ). Se consideră matricea Hess
2 2
∂ f ∂ f
∂x2 ∂x∂y
H= ∂2f ∂2f
∂x∂y ∂y 2

cu minorii principali
∂ 2 f (a1 , a2 )
1 = , 2 = det H(a1 , a2 )
∂x2
Cu aceste notaţii au loc afirmaţiile:
i) dacă 1 > 0 şi 2 > 0, atunci punctul (a1 , a2 ) este punct de minim local pentru f ;
ii) dacă 1 < 0 şi 2 > 0, atunci punctul (a1 , a2 ) este punct de maxim local pentru f ;
iii) dacă 2 < 0, atunci punctul (a1 , a2 ) nu este punct de extrem.

Demonstraţie. Natura punctului staţionar (a1 , a2 ) este dată


de semnul diferenţei f (x, y) − f (a1 , a2 ). Ţinând seama că
fx (a1 , a2 ) = 0, fy (a1 , a2 ) = 0, din formula lui Taylor pentru n= 2 (Teorema 12.3.2)
avem f (x, y) = f (a1 , a2 )+
* +(2)
1 ∂ ∂
+ (x − a1 ) + (y − a2 ) f (a1 , a2 ) + R2 (f, x, y)
2! ∂x ∂y
pentru (x, y) ∈ D ∩ V ((a1 , a2 )). Dacă (x, y) este suficient de aproape de punctul (a1 , a2 ), atunci
semnul diferenţei f (x, y) − f (a1 , a2 ) nu este influenţat de restul R2 (f, x, y) al formulei. Aşadar,
avem *
1 ∂2f
f (x, y) − f (a1 , a2 ) = (x − a1 )2 2 (a1 , a2 )+
2 ∂x
2 2
+
∂ f (a1 , a2 ) 2 ∂ f (a1 , a2 )
+2(x − a1 )(y − a2 ) + (y − a2 ) ,
∂x∂y ∂y 2
care este o formă pătratică ı̂n variabilele x − a1 şi y − a2 , având matricea chiar hessiana.
Conform rezultatelor cunoscute de la formele pătratice, avem că:
i) dacă 1 > 0 şi 2 > 0, atunci forma pătratică este pozitiv definită, adică diferenţa
f (x, y) − f (a1 , a2 ) > 0 pentru (x, y) = (a1 , a2 ), deci f (x, y) > f (a1 , a2 ) şi, prin urmare,
punctul (a1 , a2 ) este punct de minim;
ii) dacă 1 < 0 şi 2 > 0, atunci forma pătratică este negativ definită, adică diferenţa
f (x, y) − f (a1 , a2 ) < 0 pentru (x, y) = (a1 , a2 ), deci f (x, y) < f (a1 , a2 ) şi, prin urmare,
punctul (a1 , a2 ) este punct de maxim local;
iii) dacă 2 < 0, atunci forma pătratică este nedefinită, deci (a1 , a2 ) nu este punct de
extrem local
Exemplul 12.5.1. Să determinăm punctele de extrem local pentru funcţia

f (x, y) = x5 + y 5 − 5xy, (x, y) ∈ R2 .

Mai ı̂ntâi determinăm punctele staţionare. Pentru aceasta calculăm derivatele parţiale de
ordinul ı̂ntâi:
∂f ∂f
= 5x4 − 5y, = 5y 4 − 5x.
∂x ∂y

255
Egalându-le cu zero, avem sistemul

x4 = y, y 4 = x,

care are soluţile (0, 0) şi (1, 1). Acestea sunt punctele staţionare ale funcţiei f. Printre
acestea se vor afla punctele de extrem ale funcţiei f. Calculăm derivatele parţiale de ordinul
doi ale lui f:
∂2f 3 ∂2f ∂2f
= 20x , = −5, = 20y 3 .
∂x2 ∂x∂y ∂y 2
Prin urmare, matricea hessiană este
 
20x3 −5
.
−5 20y 3

Pentru punctul staţionar (0, 0) se obţine


 
0 −5
H(0,0) = , 1 = 0, 2 = −25 < 0
−5 0

deci punctul (0, 0) nu este punct de extrem local.


Pentru punctul staţionar (1, 1) se obţine
 
20 −5
, 1 = 20 > 0, 2 = 375 > 0,
−5 20

deci (1, 1) este punct de minim local şi avem fmin = f (1, 1) = −3.
Observaţia 12.5.2 În cazul unei funcţii f : D ⊆ Rn → R,
z = f (x1 , x2 , ..., xn ), n ≥ 3, se procedează ı̂n mod analog.
Punctele ei staţionare se află printre soluţiile sistemului

fx 1 = 0, fx 2 = 0, ..., fx n = 0

Dacă A(a1 , a2 , ..., an ) este un punct staţionar al funcţiei f, atunci pentru precizarea naturii
lui se consideră matricea Hess
H = (hij )i,j = 1, n,
unde hij = fxi xj (A), i, j = 1, n. Notăm minorii ei principali cu k , adică
 
 h11 h12 ... h1k 

 h h22 ... h2k 
k =  21 , k = 1, n
 ... ... ... ... 
 hk1 hk2 ... hkk 

Cu aceste notaţii, conform cu cele cunoscute de la formele pătratice avem:


i) dacă k > 0, k = 1, n, atunci punctul A este punct de minim local pentru funcţia f,
(condiţie echivalentă cu d2 f (A) > 0 );
ii) dacă 1 < 0, 2 > 0, 3 < 0, ..., (−1)n n > 0, atunci punctul A este punct de maxim local
pentru funcţia f (condiţie echivalentă cu d2 f (A) < 0);
iii) dacă 2 < 0, atunci punctul A nu este punct de extrem local (condiţie echivalentă cu
d2 f (A) nu este definită).
Exemplul 12.5.2. O firmă produce trei sortimente de produse, ı̂n cantităţile x, y, şi z.
Dacă funcţia profitului este dată de
3
f (x, y, z) = 170x + 110y + 120z − 3x2 − 2y 2 − z 2 − 2xy − xz − yz − 50,
2

256
x ≥ 0, y ≥ 0, z ≥ 0,
atunci să se determine volumele celor trei produse astfel ı̂ncât profitul să fie maxim.
Mai ı̂ntâi aflăm punctele staţionare ale lui f, prin rezolvarea sistemului de ecuaţii
⎧ 
⎨ fx (x, y, z) = 170 − 6x − 2y − z = 0
f  (x, y, z) = 110 − 4y − 2x − z = 0
⎩ y
fz (x, y, z) = 120 − 3z − x − y = 0

Soluţia acestui sistem este x= 20, y= 10 şi z= 30. Aşadar, funcţia f are un singur punct
staţionar A(20, 10, 30).
Pentru a stabili natura punctului A calculăm derivatele parţiale de ordinul doi ale lui f.

fx2 = −6, fy2 = −4, fz2 = −3


     
fxy = fyz = −2, fxz = fzx = −1, fyz = fzy = −1
şi scriem hessiana ⎛ ⎞
−6 −2 −1
H = ⎝ −2 −4 −1 ⎠ .
−1 −1 −3
Minorii principali ai lui H ı̂n punctul A au valorile
 
 −6 −2 
1 = −6 < 0, 2 =   = 20 > 0
−2 −4 

3 = det H = −54 < 0.


Rezultă că punctul A este un punct de maxim. Valoarea maximă a profitului este fmax =
f (20, 10, 30) = 4000.

12.6 Extreme condiţionate


Multe probleme practice conduc la aflarea punctelor de extrem supuse unor condiţii
(legături).
Fie f : D ⊆ R2 → R, z = f (x, y) o funcţie de două variabile şi fie F (x, y) = 0 o ecuaţie, unde
F : D → R. Notăm cu A mulţimea soluţilor ecuaţiei F (x, y) = 0.

Definiţia 12.6.1 Un punct (a1 , a2 ) ∈ A este punct de extrem condiţionat (cu legături) al
funcţiei f dacă există o vecinătate V a punctului (a1 , a2 ) astfel ı̂ncât pentru orice (x, y) ∈ A
se verifică una din inegalităţile:

f (x, y) ≤ f (a1 , a2 ), pentru maxim local condiţionat;


f (x, y) ≥ f (a1 , a2 ), pentru minim local condiţionat.

Geometric, problema punctelor de extrem condiţionate cere să determinăm punctele curbei
dată de ecuaţia F(x, y)= 0, ı̂n care ia valori extreme, ı̂n comparaţie cu celelalte valori ale
sale ı̂n punctele de pe această curbă.

Acum să presupunem că funcţia F ı̂ndeplineşte condiţiile nece-


sare existenţei unei funcţii implicite. Fie y = ϕ(x) funcţia implicită
definită de F (x, y) = 0. Atunci problema găsiri punctelor de extrem
condiţionate ale funcţiei f revine la aflarea punctelor de extrem ale funcţiei
z(x) = f (x, ϕ(x)), pe un anumit interval precizat.
Punctele staţionare, printre care se găsesc şi posibile puncte de extrem condiţionate sunt
soluţiile reale ale ecuaţiei
(12.9) z  (x) = fx + fy y  = 0,

257
unde y  este derivata funcţiei implicite definită de ecuaţia F (x, y) = 0

(12.10) Fx + Fy y  = 0

Soluţiile sistemului dat de ecuaţiile (12.9) şi (12.10) găsim

fx Fx
=
fy Fy

În concluzie, punctele staţionare ale funcţiei f sunt punctele ale căror coordonate verifică
ecuaiile
fx fy
= ; F (x, y) = 0.
Fx Fy
Pentru rezolvarea acestui sistem notăm cu −λ valoarea celor două rapoarte şi obţinem
sistemul: ⎧ 
⎨ fx + λFx = 0
(12.11) f  + λFy = 0 .
⎩ y
F (x, y) = 0
La sistemul (12.11) putem ajunge şi pe cale formală. Considerăm funcţie auxiliară

L(x, y) = f (x, y) + λF (x, y),

numită funcţia lui Lagrange, unde λ este un parametru auxiliar, numit multiplicatorul lui
Lagrange. Căutăm punctele staţionare ale funcţiei L(x, y) cu legătura F (x, y) = 0, obţinând
sistemul ⎧ 
⎨ Lx = fx + λFx = 0
L = fy + λFy = 0
⎩ y
F (x, y) = 0 ,
adică tocmai sistemul (12.6.3).
Din cele de mai sus deducem că dacă (a1 , a2 , λ1 ) este un punct staţionar condiţionat al
funcţiei auxiliare L, atunci (a1 , a2 ) este punct staţionar condiţionat al funcţiei date f.
Pentru precizarea naturii punctelor de extrem condiţionat se cercetează semnul
diferenţei f (x, y) − f (a1 , a2 ) ı̂n vecinătatea punctului (a1 , a2 ), ţinând seama de legătura dată.
Aceasta revine la studierea semnului diferenţialei a doua a funcţiei lui Lagrange, d2 L(x, y),
ţinând cont de dF= 0.
Această metodă de aflare a punctelor de extrem condiţionate se numeşte metoda multi-
plicatorilor lui Lagrange.
Exemplul 12.6.1. Să se ı̂nscrie ı̂ntr-un cerc un dreptunghi de arie maximă.
Fie cercul de rază a, a > 0, cu centrul ı̂n origine (fig. 12.6.1)

258
Fig.12.6.1.

x2 + y 2 = a2 .

Notând cu x, y coordonatele unui vârf al dreptunghiului, ţinând seama de simetria figurii,


aria dreptunghiului ı̂nscris este z = 4xy
Problema propusă se formulează astfel: să se afle extremele funcţiei z = 4xy, x > 0, y > 0,
cu condiţia x2 + y 2 = a2 .
Utilizăm metoda multiplicatorilor lui Lagrange.
Considerăm funcţia auxiliară

L(x, y) = 4xy + λ(x2 + y 2 − a2 )

şi formăm sistemul ⎧ 


⎨ Lx = 4y + 2λx = 0
L = 4x + 2λy = 0
⎩ 2y
x + y 2 = a2
Sistemul are soluţia √
a 2
λ = −2, x = y =
2
$ √ √ %
Pentru a preciza natura punctului staţionar condiţionat a 2 2 , a 2
2 cercetăm semnul
diferenţialei a doua a funcţiei auxiliare.
Avem
d2 L = Lx2 dx2 + 2Lxy dxdy + Ly2 dy 2 =
= 2λdx2 + 8dxdy + 2λdy 2
şi √ √
2 a 2 a 2
d L , = −4(dx2 − 2dxdy + dy 2 )
2 2
Diferenţiind relaţia de legătură avem

2xdx + 2ydy = 0,

259

a 2
de unde dy = − xy dx. Pentru x = y = 2 găsim dy= -dx. Atunci, ı̂nlocuind ı̂n d2 L, găsim
√ √
a 2 a 2
d2 L , = −8dx2 < 0,
2 2
$ √ √ %
ceea ce ne arată că punctul a 2 2 , a 2 2 este un maxim condiţionat.
Am găsit că dreptunghiul √de arie maximă ı̂nscris ı̂n cercul
x2 + y 2 = a2 este pătratul de latură 2x = a 2 şi arie zmax = 2a2 .
Să considerăm acum cazul general al aflări extremelor funcţiei

f : D ⊆ Rn → R, z = f (x1 , x2 , ..., xn )

cu m, m < n, condiţii de legătură




⎪ F1 (x1 , ..., xn ) = 0

⎨ F2 (x1 , ..., xn ) = 0
..

⎪ .


Fm (x1 , ..., xn ) = 0

Metoda directă de aflare a extremelor condiţionate constă ı̂n a exprima m argumente ı̂n
funcţie de celelalte n- m şi a le ı̂nlocui ı̂n f. Obţinem o funcţie de n-m variabile ale cărei
puncte de extrem local vor fi puncte de extrem condiţionate pentru f.
Metoda multiplicatorilor lui Lagrange constă ı̂n considerarea funcţiei auxiliare

L(x1 , x2 , ..., xn ) = f (x1 , ..., xn ) + λ1 F1 (x1 , ..., xn )+

+λ2 F2 (x1 , ..., xn ) + ... + λm Fm (x1 , ..., xn ),


unde parametrii λ1 , λ2 , ..., λn se numesc multiplicatorii lui Lagrange.
Apoi, se determină punctele staţionare ale funcţiei L din condiţiile



∂L ∂f
= ∂x + λ1 ∂F 1 ∂Fm
∂x1 + ... + λm ∂x1 = 0
⎪ ∂x
⎪ 1 1
⎨ ∂L = ∂f ∂F1 ∂Fm
∂x2 ∂x2 + λ1 ∂x2 + ... + λm ∂x2 = 0
⎪ ...



⎩ ∂L = ∂f + λ ∂F1 + ... + λ ∂Fm = 0
∂xn ∂xn 1 ∂xn m ∂xn

la care se adună legăturile ⎧



⎨ F1 (x1 , ..., xn ) = 0
..
⎪ .

Fm (x1 , ..., xn ) = 0
Avem un sistem de n+m ecuaţii cu n+m necunoscute: x1 , x2 , ..., xn , λ1 , ..., xm .
Dacă xi = ai , i = 1, n şi λj = λ∗j , i = 1, n, este o soluţie a sistemului, atunci punctul
A(a1 , a2 , ..., an ) este punct staţionar condiţionat pentru funcţia f.
Pentru precizarea naturii lui A, ı̂n diferenţiala de ordinul doi

n
∂ 2 L(A)
d2 L(A) = dxi dxj
i=1 j=1
∂xi ∂xj

se introduc legăturile date prin diferenţialele legăturilor


n
∂Fk (A)
dFk (A) = dxn = 0, k = 1, m
i=1
∂xi

260
Forma pătratică d2 L(A) astfel obţinută se aduce la forma canonică. Dacă d2 L(A) > 0,
atunci punctul A este punct de minim local condiţionat pentru funcţia f, iar dacă d2 L(A) < 0,
atunci A este punct de maxim local condiţionat pentru funcţia f.
Exemplul 12.6.2.Să se afle punctele de extrem legate pentru funcţia

f (x, y, z) = xyz, (x, y, z) ∈ R3

cu legăturile
x + y − z = 3, x − y − z = 8.
Metoda directă Din sistemul 
y−z =3−x
y+z =x−8
găsim y = − 52 şi z = 2x−11
2 .
Înlocuind ı̂n f găsim funcţia

5 2x − 11 −10x2 + 55x
h(x) = x(− ) = , x∈R
2 2 4
Aflăm punctele de extrem local pentru funcţia h. Din h (x) = 0, obţinem x = 11 4 . Cum
h = − 52 < 0, deducem că x = 11
4 este punct de maxim pentru h.
Atunci punctul x = 11 5 11
4 , y = − 2 , z = − 4 este punct de maxim condiţionat pentru f, cu
605
fmin = 32
Metoda multiplicatorilor lui Lagrange.
Considerăm funcţia Lagrange auxiliară

L(x, y, z) = xyz + λ1 (x + y − z − 3) + λ2 (x − y − z − 8)

Determinăm punctele staţionare ale lui L din ecuaţiile


⎧ ∂L
⎨ ∂x = yz + λ1 + λ2 = 0
∂y = xz + λ1 − λ2 = 0
∂L
⎩ ∂L
∂z = xy − λ1 − λ2 = 0

la care se adaugă legăturile 


x+y−z =3
x−y−z =8
Soluţia acestui sistem este:
11 5 11 11 231
x= , y = − , z = − , λ1 = , λ2 = − .
4 2 4 32 32
& '
Punctul staţionar condiţionat pentru f este A 11 5 11
4 , −2, − 4 .
Pentru a decide natura lui A calculăm d2 L. Avem
∂2L 2 ∂2L 2 ∂2L
d2 L = dx + dy + +
∂x2 ∂y 2 ∂z 2

∂2L ∂2L ∂2L


+2 dxdy + 2 dxdz + 2 dydz =
∂x∂y ∂x∂z ∂y∂z
= 2zdxdy + 2ydxdz + 2xdydz;
care ı̂n punctul A este:
11 11
d2 L(A) = − dxdy − 5dxdz + dydz.
2 2
Prin diferenţierea celor două legături rezultă relaţiile:

dx + dy − dz = 0

261
dx − dy − dz = 0,
de unde găsim dz = dx, dy = 0, care substituite ı̂n d2 L = −5dx2 < 0. Rezultă că punctul A
este punct de maxim condiţionat pentru funcţia f. Se observă că am obţinut acelaşi rezultat
ca şi la metoda directă.
Exemplul 12.6.3.Să considerăm funcţia de producţie dată prin

f (x, y) = x0,2 y 0,7 ,

x reprezentând capitalul, iar y forţa de muncă. Ne propunem să determinăm producţia


maximă cu restricţia 2x + 5y = 360
Utilizăm metoda multiplicatorilor lui Lagrange
Funcţia auxiliară a lui Lagrange este

L(x, y) = x0,2 y 0,7 + λ(2x + 5y − 360).

Pentru determinarea punctelor staţionare condiţionate avem sistemul:


⎧ 
⎨ Lx = 0, 2 · x−0,8 · y 0,7 + 2λ = 0
L = 0, 7 · x0,2 · y −0,3 + 5λ = 0
⎩ y
2x + 5y = 360

Dacă se exprimă λ din fiecare din primele două expresii, atunci se obţine că y = 75 x. Acum
1
din ecuaţia de legătură se obţine x = 40, y = 56. Pentru λ găsim valoarea − 10 40−0,8 · 500,7 .
Diferenţiala de ordinul doi al funcţiei L este D2 L =

= −0, 16 · x−1,8 y 0,7 dx2 + 2 · 0, 14x−0,8 y −0,3 dxdy − 0, 21x0,2 y −1,3 dy 2

Prin diferenţierea relaţiei de legătură avem 2dx + 5dy = 0, de unde dy = − 25 dx. Înlocuind pe
x = 40, y = 56 şi dy = − 25 dx ı̂n d2 L, obţinem

d2 L(40, 56) = −(40−1,8 560,7 + 0, 28 · 40−0,8 56−0,3 +

+0, 21 · 400,2 · 56−1,3 )dx2 < 0


ceea ce ne arată că punctul x = 40, y=56 este un punct de maxim local condiţionat. Valoarea
maximă pentru f este
fmax = f (40, 56) = 400,2 · 560,7
.

12.7 Ajustarea unor date


Adesea ı̂n urma unor experimente obţinem pentru două marimi x şi y următorul tabel de
valori
x x1 x2 ... xn
y y1 y2 ... yn
Încercăm să exprimăm legătura dintre variabilele x şi y printr-o funcţie continuă y =
f (x, a1 , ..., am ), unde a1 , a2 , ..., am sunt parametrii care urmează să fie determinaţi aşa ı̂ncât
f (xi , a1 , ..., am ) să aproximeze cât mai bine valorile yi , i = 1, n. În acest scop se foloseşte
metoda celor mai mici pătrate. Aceasta constă ı̂n a determina parametrii a1 , a2 , ..., am aşa
ı̂ncât suma pătratelor erorilor comise să fie minimă, adică

n
(yi − f (xi , a1 , ..., an ))2 = min.
i=1

Detreminarea valorilor yi = f (xi , a1 , ..., am ) aşa ı̂ncât ele să aproximeze cât mai bine valo-
rile yi , i = 1, n, se numeşte ajustare. Funcţia y − f (x, a1 , ..., am ) e funcţie de ajustare. De

262
obicei, forma funcţiei de ajustare se alege din reprezentarea grafică a perechilor de puncte
(xi , yi ), i = 1, n, obţinute experimental.
Problema determinării parametrilor a1 , a2 , ..., am este o aplicaţie a problemei aflări ex-
tremelor funcţiei de m variabile

n
S(a1 , a2 , ..., am ) = (yi − f (xi , a1 , ..., am ))2 .
i=1

Se constată imediat că punctele de staţionare sunt puncte de minim, iar ecuaţiile care dau
aceste puncte numite ecuaţii normale, sunt

⎪ n


∂S
= −2 (yi − f (xi , a1 , ..., am )) ∂a
∂f
=0

⎪ ∂a1 1
⎨ i=1
..
⎪ .

⎪ 


n
⎩ ∂a ∂S
m
= −2 (yi − f (xi , a1 , ..., am )) ∂a ∂f
m
=0
i=1

Să considerăm cazul cel mai simplu, ı̂n care funcţia de ajustare este de gradul ı̂ntâi, adică
y = ax + b.
Trebuie să determinăm a şi b aşa ı̂ncât

n
S(a, b) = (yi − axi − b)2
i=1

să fie minimă. Condiţiile de minim


∂S
n
= −2 (yi − axi − b)xi = 0
∂a i=1

∂S
n
= −2 (yi − axi − b) = 0,
∂b i=1
conduc la sistemul liniar ⎧
⎪ 
n 
n 
n

⎨ a x2i + b xi = xi yi
i=1 i=1 i=1 ,
⎪ 
n 
n

⎩ a xi + bn = yi
i=1 i=1

cu necunoscutele a şi b.
Dacă ı̂mpărţim ambele ecuaţii cu n şi notăm

n 
n
xi yi
i=1 i=1
x= , y= ,
n n

n 
n
x2i xi yi
i=1 i=1
x2 = , xy = ,
n n
atunci sistemul liniar ia forma 
x2 a + xb = xy
xa + b = y.
Prin eliminarea lui b, găsim
(x2 − x2 )a = xy − x y.
Dacă notăm σx2 = x2 − x2 , numită dispersia lui x, şi cxy = xy − x y, mărime numită corelaţia
variabilelor x şi y, atunci avem
cxy σy cxy σy
a= = · = · rxy
σx2 σx σx σy σx

263
c
Raportul rxy = σxxy
σy se numeşte coeficient de corelaţie a variabilelor x, y şi măsoară intensi-
tatea dependenţei liniare dintre variabilele x şi y.
Obervăm că b = y − ax şi avem y = a(n − x) + y, de unde
σy
y= rxy (x − x),
σx
care este dreapta care ajustează cel mai bine datele iniţiale. Dreapta găsită este numită
dreapta de regresie.
Exemplul 12.7.1. Să se ajusteze cu o dreaptă datele ce reprezintă numărul de piese produse
ı̂n cele cinci zile de lucru dintr-o săptămâmă, date trecute ı̂n tabelul

zilele 1 2 3 4 5
numărul de piese 4 5 7 6 6

Notăm cu y numărul de piese şi cu x zilele săptămânii. Avem n = 5, x1 = 1, x2 = 2, x3 =


3, x4 = 4, x5 = 5, şi y1 = 4, y2 = 5, y3 = 7, y4 = 6, y5 = 6.
1+2+3+4+5 4+5+7+6+6 28
x= = 3; y = =
5 5 5
4 + 10 + 21 + 24 + 30 89
xy = =
5 5
12 + 22 + 32 + 42 + 52 55
x2 = = = 11
5 5
σx2 = x2 − x2 = 11 − 9 = 2
89 28 89 − 84
cxy = −3· = =1
5 5 5
cxy 1 28 3 41
a= = ; b = y − ax = − =
σx2 2 5 2 10
x 41
şi y = + .
2 10
Observaţia 12.7.1 Ajustarea datelor se poate folosi şi ı̂n rezolvarea problemelor de prognoză.
Având găsită funcţia de ajustare, putem evalua mărimea valorii y şi ı̂n alte puncte.

Astfel, ı̂n exemplul 12.7.1 putem prognoza care să fie numărul de piese ı̂n ziua a şasea.
Avem y = 62 + 41 1 1
10 = 3 + 4 + 10 = 7 + 10 , de unde rezultă că ı̂n ziua a şasea atrebui să se
producă 7 piese.

12.8 Interpolarea funcţiilor


Ca şi ı̂n cazul ajustărilor, să presupunem că pentru mărimea y, care variază continuu ı̂n
raport cu mărimea x, cunoaştem tabelul de valori

x x0 x1 ... xn
, n ≥ 1,
y y0 y1 ... yn

cu xi ∈ [a, b], i = 0, n, distincte două câte două.


Prin interpolare ı̂nţelegem procesul de alegere a unei funcţii
I : [a, b] → R, dintr-o anumită clasă de funcţii, aşa ı̂ncât I(xi ) = yi , i = 0, n se numeşte funcţie
de interpolare.
Ţinând seama că cele mai simple şi convenabile funcţii sunt polinoamele vom alege
funcţie de interpolare un polinom P. O vom numi ı̂n continuare polinom de interpolare.

264
Având ı̂n vedere că avem n+ 1 condiţii P (xi ) = yi , i = 0, n, alegem

P (x) = a0 xn + a1 xn−1 + ... + an−1 x + an

Cele n+ 1 condiţii conduc la sistemul liniar




⎪ a0 xn0 + a1 xn−1
0 + ... + an−1 x0 + an = y0

a0 xn1 + a1 xn−1
1 + ... + an−1 x1 + an = y1

⎪ .... .... .... ....

a0 xnn + a1 xn−1
n + ... + a x
n−1 n + an = yn

ı̂n necunoscutele a0 , a1 , ..., an .


Determinantul sistemului este determinantul Vandermond
 n 
 x0 xn−1 ... x0 1 
 n 0 
 x1 xn−1 ... x1 1 
 1 
V (x0 , x1 , ..., xn ) =  . . .. .. =
 .. .
. . . 
 
 xn xn−1 ... xn 1 
n n
.
= (xi − xj ) = 0
0≤j<i≤n

Rezultă că sistemul determină coeficienţii ai , i = 0, n, ai polinomului P ı̂n mod unic.


Pentru polinomului P de interpolare există mai multe forme. O formă simplă şi uşor de
aplicat ı̂n cazurile practice a fost dată de Lagrange.
El a introdus polinoamele fundamentale li , i = 0, n, de grad n date prin expresiile

(x − x0 )(x − x1 )...(x − xi−1 )(x − xi+1 )...(x − xn )


li (x) = , i = 0, n
(xi − x0 )(xi − x1 )...(xi − xi−1 )(xi − xi+1 )...(xi − xn )

Se observă imediat că 


0, j = i
li (xj ) = δij =
1, j = i
Utilizând polinoamele fundamentale polinomul de interpolare Lagrange are forma

n
P (x) = li (x)yi
i=0

Întradevăr, avem

n
P (xj ) = li (xj )yi = yj , j = 0, n
i=0

Exemplul 12.8.1. Să determinăm polinomul de interpolare pentru datele din tabelul

x 1 2 3 4
y 3 2 4 5

şi apoi calculaţi valoarea lui y pentru x = 32


Avem n = 3, x0 = 1, x1 = 2, x2 = 3, x3 = 4, şi y0 = 3,
y1 = 2, y2 = 4, y3 = 5.
Polinoamele fundamentale sunt:
(x − 2)(x − 3)(x − 4) (x2 − 5x + 6)(x − 4)
l0 (x) = = =
(1 − 2)(1 − 3)(1 − 4) −6
1
= − (x3 − 9x2 + 26x − 24),
6

265
(x − 1)(x − 3)(x − 4) (x2 − 4x + 3)(x − 4)
l1 (x) = = =
(2 − 1)(2 − 3)(2 − 4) 2
1 3
= (x − 8x2 + 19x − 12),
2
(x − 1)(x − 2)(x − 4) (x2 − 3x + 2)(x − 4)
l2 (x) = = =
(3 − 1)(3 − 2)(3 − 4) −2
1
= − (x3 − 7x2 + 14x − 8),
2
(x − 1)(x − 2)(x − 3) (x2 − 3x + 2)(x − 3)
l3 (x) = = =
(4 − 1)(4 − 2)(4 − 3) 6
1 3
(x − 6x2 + 11x − 6)
=
6
Atunci polinomul de interpolare are expresia
1 1
P (x) = − (x3 − 9x2 + 26x − 24) · 3 + · (x3 − 8x2 + 19x − 12) · 2−
6 2
1 1
− (x3 − 7x2 + 14x − 8) · 4 + (x3 − 6x2 + 11x − 6) · 5 =
2 6
2 3 11 2 27
= − x + x − x + 11
3 2 2
Acum, avem  
3 7
P = = y.
2 8
Observaţia 12.8.1 Dacă pentru valorile y ı̂n funcţie de valorile lui x, date la ı̂nceputul aces-
tui paragraf, există o funcţie continuă y = f (x), cu f (xi ) = yi , i = 0, n, atunci polinomul de
interpolare este o aproximare a funcţiei f care satisface condiţiile P (xi ) = f (xi ), i = 0, n.

266
12.9 Test de verificare a cunoştinţelor nr. 11
1. Definiţi următoarele noţiuni:

a) Derivata parţială a unei funcţii de mai multe variabile;


b) Diferenţiala unei funcţii de mai multe variabile;
c) Punct de extrem local pentru o funcţie de mai multe variabile;
d) Integrarea funcţiilor.

2. a) Găsiţi extremele locale ale funcţiei

f : R2 → R , f (x, y) = x3 + y 3 + 3xy.

b) Găsiţi extremele locale ale funcţie:

f : R2 → R , f (x, y) = x2 + y 4.

3. Găsiţi extremele locale ale funcţiei

f :Δ×Δ→R , Δ = (−∞, −1] ∪ [1, ∞), cu

f (x, y) = x4 + y 4 − 4x2 + 8xy − 4y 2 − 5.

4. Găsiţi extremele locale ale funcţiei f : R2 → R, f (x, y) = x2 + y 3 .

5. O firmă produce două sortimente de bunuri, ı̂n cantităţile x şi y. Dacă funcţia profitului
este dată prin f : [0, ∞) × [0, ∞) → R, f (x, y) = 160x − 3x2 − 2xy − 2y 2 + 120y − 18, să se
determine volumele celor două bunuri astfel ı̂ncât profitul să fie maxim.

6. Găsiţi extremele locale ale funcţiei f : R2 → R, f = 6 − 4x − 3y condiţionate de ecuaţia


x2 + y 2 = 1.
7. Găsiţi extremele locale ale funcţiei f (x, y, z) = xy + xz + yz condiţionate de ecuaţia
xyz = 1, ı̂n domeniul x > 0, y > 0, z > 0.

8. Să se determine dreptunghiul de arie maximă ı̂nscris ı̂ntr-o elipsă

x2 y2
2
+ 2 − 1 = 0.
a b

9. Găsiţi punctele de extrem local ale funcţiei f : R4 → R, f (x, y, z, t) = xy + xz − 3xt + y 2 +


z 2 + t2 + 10x + 6y condiţionate de ecuaţiile

ϕ1 (x, y, z, t) = x + 2y + 3z + 2t = 0 şi

ϕ2 (x, y, z, t) = −x + y + z + t = 0.

10. Fie funcţia de producţie f : [0, ∞) × [0, ∞) → R cu f (x, y) = x0,3 · y 0,5 , unde x este capitalul
iar y este forţa de muncă. Să se determine producţia maximă cu restricţia 6x+2y = 384.

267
Indicaţii şi răspunsuri Test nr. 11

2. a) (−1, −1) este punct de maxim cu f (−1, −1) = 1.


b) (0, 0) este punct de minim.

3. (2, −2) este punct de minim cu f (2, −2) = −37; (−2, 2) este punct de minim cu f (−2, 2) =
−37.

4. Nu are nici un punct de extrem local.


5. x = 20, y = 20 cu profilul f (20, 20) = 2782.
     
4 3 4 3 4 3
6. , punct de minim condiţionat cu f , = 1, iar − , − punct de maxim
5 5   5 5 5 5
4 3
condiţionat cu − , − = 11.
5 5
7. (1, 1, 1) este punct de minim condiţionat cu f (1, 1, 1) = 3.
a b
8. Pentru x = √ şi y = √ se obţine dreptunghiul de arie maximă (A max = 2ab).
2 2
   
5 3 5 3 25
9. −1, − , 3, − este punct de minim condiţionat cu f −1, − , 3, − =− .
2 2 2 2 2
10. (24, 120) este punct de maxim condiţionat iar producţia maximă este 240,3 · 1200,5 .

268
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul II,
Editura ULB, Sibiu, 2002.

269
Capitolul 13

Generalizări ale noţiunii de integrală

b
Obiective: Ştim că f (x)dx reprezintă o integrală Riemann, dacă sunt ı̂ndeplinite
a
condiţiile: a = −∞ şi b = ∞; f funcţie mărginită pe [a, b] şi f funcţie reală de o singură
b
variabilă reală. Dacă una din aceste condiţii nu este ı̂ndeplinită, atunci expresia f (x)dx
a
constituie o extindere a noţiunii de integrală. Scopul acestui capitol este de a prezenta
câteva astfel de extinderi ale noţiunii de integrală.
Rezumat: În acest capitol sunt prezentate extinderi ale noţiunii de integrală şi
anume inegralele improprii, integralele ce depind de unul sau mai mulţi parametri, inte-
gralele euleriene (Funcţiile Gamma şi Beta ale lui Euler), inegralele duble (inclusiv metode
de calcul ale acestora).
Conţinutul capitolului:
1. Integrale improprii
2. Integrale cu parametri
3. Integrale euleriene. Funcţia Gamma. Funcţia Beta
4. Integrale duble
5. Test de verificare a cunoştinţelor
6. Bibliografia aferentă capitolului
Cuvinte cheie: integrală improprie, integrală ce depinde de parametri, funcţia
Gamma, funcţia Beta, inegrale duble, coordonate polare.

13.1 Integrale improprii


În multe situaţii practice apar integrale care au intervalul de integrare de lungime infinită
şi integrale pentru care funcţia de integrat nu este mărginită.
Astfel de integrale se numesc improprii sau generalizate. Dacă lungimea intervalului
este infinită, adică avem una din situaţiile


+∞ b
+∞
I= f (x)dx , I = f (x)dx , I = f (x)dx = f (x)dx,
a −∞ −∞ R

atunci spunem că avem integrale improprii de speţa ı̂nâi. Dacă funcţia de integrat este
nemărginită pe [a, b], atunci spunem că avem integrale improprii de speţa a doua. Dacă atât
intervalul de integrare este de lungime infinită, cât şi f este nemărginită ı̂n acest interval,
atunci spunem că avem integrale improprii mixte.

270
Definiţia 13.1.1 Fie f : [a, ∞) → R o funcţie integrabilă pe orice interval [a, b], b ∈ R, b > a.
b
Dacă există lim f (x)dx, atunci prin definiţie
b→∞
a

∞ b
f (x)dx = lim f (x)dx;
b→∞
a a

când limita este finită spunem că integrala este convergentă iar ı̂n caz contrar, adică dacă
limita nu există sau este infinită, spunem că integrala improprie este divergentă.

În mod analog definim


b
f (x)dx = lim f (x)dx
a→−∞
−∞

şi
∞ b
f (x)dx = a→−∞
lim f (x)dx.
b→∞
−∞ a

Imediat se observă că avem relaţiile

b ∞
f (x)dx = f (−t)dt
−∞ −b

şi

+∞ C
+∞

f (x)dx = f (x)dx + f (x)dx , C ∈ R,


−∞
−∞ C

care ne arată că este suficient să studiem cazul intervalului [a, ∞].
Exemplul 13.1.1. Să considerăm integrala

dx
; a > 0 şi λ ∈ R.

a

Pentru b > a şi λ = 1 avem


b
dx 1
= (b1−λ − a1−λ ).
xλ 1−λ
a

Limita
1
lim (b1−λ − a1−λ )
b→∞ 1−λ
a1−λ
este finită, fiind egală cu , pentru 1 − λ < 0, adică λ > 1.
λ−1
În cazul λ = 1 avem
∞ b
dx dx
= lim = lim (ln b − ln a) = ∞,
x b→∞ x b→∞
a a

integrala fiind divergentă.

271

dx a1−λ
În concluzie, avem că = pentru λ > 1, adică este convergentă, iar pentru λ ≤ 1
xλ λ−1
a
integrala improprie este divergentă.
Exemplul 13.1.2. Fie de calculat integrala improprie

+∞
dx
.
x2 + 4
−∞

Avem

+∞ b
dx dx
= a→−∞
lim =
x2 + 4 b→∞
x2 + 4
−∞ a
 
1 b a 1 $ π $ π %% π
= a→−∞
lim arctg − arctg = − − = .
b→∞
2 2 2 2 2 2 2

Observaţia 13.1.1 Putem scrie


∞ k
k+1
k+n

f (x)dx = f (x)dx + f (x)dx + ... + f (x)dx + ...,


a a k k+n−1

k ∈ N, k > a.

k+n k
Dacă notăm un = f (x)dx, n = 1, 2, ..., u0 = f (x)dx, atunci
k+n−1 a

∞ ∞

f (x)dx = un ,
k n=0

∞ ∞

adică integralei f (x)dx ı̂i corespunde seria numerică un . Integrala improprie şi seria
a n=0
asociată au aceeaşi natură.
Această observaţie ne permite să adaptăm criteriile de convergenţă de la seriile numerice
la integralele improprii de speţa ı̂ntâi.

Teorema 13.1.1 (Criteriul lui Cauchy) Integrala improprie f (x)dx, este convergentă dacă
a
şi numai dacă pentru orice ε > 0 există M (ε) ∈ R+ aşa ı̂ncât pentru orice α, β ∈ R, β > α >
M (ε) să avem  β 
 
 
 f (x)dx < ε.
 
 
α

Demonstraţia rezultă imediat din Criteriul lui Cauchy scris pentru seria numerică un .
n≥0

Definiţia 13.1.2 Integrala improprie f (x)dx se numeşte absolut convergentă dacă inte-
a

grala improprie |f (x)|dx este convergentă.
a

272

Teorema 13.1.2 Dacă f (x)dx este absolut convergentă, atunci ea este convergentă.
a

Pentru demonstraţie se foloseşte Teorema 13.1.2 şi inegalitatea


 b 
  b
 
 f (x)dx ≤ |f (x)|dx.
 
 
a a

Şi criteriile de comparaţie de la serii cu termeni pozitivi se extind imediat la integrale


improprii.

Teorema 13.1.3 (primul criteriu de comparaţie) Fie f, g funcţii definite şi integrabile pentru
x ≥ a. Dacă 0 ≤ f (x) ≤ g(x) pentru x ≥ a, atunci:
∞ ∞
1) dacă g(x)dx este convergentă, atunci şi f (x)dx este convergentă;
a a

∞ ∞
2) dacă f (x)dx este divergentă, atunci şi g(x)dx este divergentă.
a a

Teorema 13.1.4 (Al doilea criteriu de comparaţie) Fie funcţiile f, g : [a, ∞) → (0, ∞). dacă
∞ ∞
f (x)
lim = k, k ∈ (0, ∞), atunci integralele improprii f (x)dx şi g(x)dx su aceeaşi natură,
x→∞ g(x)
a a
adică ambele sunt convergente sau ambele sunt divergente. Dacă k = 0, atunci convergenţa
∞ ∞
integralei g(x)dx implică convergenţa integralei f (x)dx.
a a

Corolarul 13.1.1 Fie f : [a, ∞) → (0, ∞), a > 0. Dacă există lim xλ f (x) = k, k constantă reală
x→∞

finită, pentru λ > 1, atunci integrala f (x)dx este convergentă. Dacă λ ≤ 1 şi k > 0, atunci
a
integrala este divergentă.

Valabilitatea Corolarului rezultă din Teorema 13.1.3.



Exemplul 13.1.3. Integralele improprii xα e−x dx, a > 0, sunt convergente pentru orice α
a
real.
Într-adevăr, pentru x > 0 putem scrie
x xn xn
ex = 1 + + ... + + ... > , n ∈ N.
1! n! n!
n! n!
De aici, avem 0 < e−x < n
, adică 0 < xα e−x < n−α . Alegând n ∈ N aşa ı̂ncât n − α = λ > 1
x x
n!
şi aplicând primul criteriu de comparaţie pentru f (x) = xα e−x , g(x) = λ , λ > 1, obţinem
x
afirmaţia din enunţul exemplului.

Pm (x)
Exemplul 13.1.4. Integralele improprii dx, Pm şi Qn fiind funcţii polinomiale cu
Qn (x)
a
coeficienţi reali, cu gradele m şi respectiv n, Qn = 0 pentru x ≥ a, sunt convergente pentru
n − m ≥ 2.

273
Avem
Pm (x) am xm + am−1 xm−1 + ... + a0
lim xλ = lim xλ =
x→∞ Qn (x) x→∞ bn xn + bn−1 xn−1 + ... + b0
am−1 a0
am + + ... + m
= lim xλ+m−n · x x = am
x→∞ bn−1 b0 bn
bn + + ... + n
x x
dacă λ = n − m. Conform Corolarului 13.1.1, integrala dată este convergentă dacă n − m ≥ 2.
În mod analog se studiază şi integralele improprii de speţa a doua.

Definiţia 13.1.3 Fie funcţia f : [a, b) → R, nemărginită ı̂n b, dar mărginită şi integrabilă pe
β
orice subinterval ı̂nchis [a, β] ⊂ [a, b). dacă există lim f (x)dx, atunci prin definiţie
β→b
β<b
a

b β
f (x)dx = lim f (x)dx.
β→b
β<b
a a

Dacă limita este finită, atunci spunem că integrala improprie este convergentă iar ı̂n caz
contrar spunem că integrala este divergentă.
Dacă f este nemărginită ı̂n a atunci

b b
f (x)dx = α→a
lim f (x)dx,
α>a
a α

iar dacă f este nemărginită ı̂ntr-un punct c, a < c < b, atunci

b c b
f (x)dx = f (x)dx + f (x)dx.
a a c

b
Pe baza acestor considerente, ne putem limita numai la cazul f (x)dx, cu lim |f (x)| = ∞.
x→b
x<b
a
b
dx
Exemplul 13.1.5. Integrala este convergentă pentru λ < 1 şi divergentă pentru
(b − x)λ
a
λ ≥ 1.
Avem
β β
dx 1 1 
=  =
(b − x)λ λ − 1 (b − x)λ−1 a
a
* +
1 1 1
= − ,
λ − 1 (b − β)λ−1 (b − a)λ−1
cu * +
1 1 1 1 1
lim − = ·
β→b
β<b
λ − 1 (b − β)λ−1 (b − a)λ−1 1 − λ (b − a)λ−1

pentru λ < 1 şi +∞ pentru λ > 1. Deci λ = 1 valoarea integralei este − ln |b − x| |βa → ∞ când
β → b, β < b, deci este divergentă.

274
Dacă b − a > 1, atunci putem scrie
1 1
b
b−1
b− 2

b− 3

f (x)dx = f (x)dx + f (x)dx + f (x)dx + ...+


a a b−1 b− 12

1

b− n+1

+ f (x)dx + ...,
1
b− n
1

b−1
b− n+1

iar dacă punem u0 = f (x)dx şi un = f (x)dx, n = 1, 2, ..., atunci obţinem


a 1
b− n

b ∞

f (x)dx = un ,
a n=0

care exprimă integrala improprie de speţa a doua printr-o serie numerică.


Ca şi la integralele improprii de speţa ı̂ntâi, putem transforma criteriile de convergenţă
de la seriile de numere reale ı̂n criterii de convergenţă pentru integrale improprii de speţa
a doua.
b
Teorema 13.1.5 (Criteriul lui Cauchy). Integrala improprie f (x)dx, cu lim |f (x)| = ∞, este
x→b
x<b
a
convergentă dacă şi numai dacă pentru orice ε > 0 există un număr M (ε) > 0 aşa ı̂ncât
 b 
 

pentru orice α şi β cu b − M (ε) < α < β < b să avem  f (x)dx < ε.
 
a

Definiţia 13.1.2 şi Teoremele 13.1.2 şi 13.1.3 se păstrează fără modificări şi pentru inte-
gralele improprii de speţa a doua.

Teorema 13.1.6 (Al doilea criteriu de comparaţie). Fie funcţiile f, g : [a, b) → (0, ∞). Dacă
b b
f (x)
lim = k, k ∈ (0, ∞), atunci integralele improprii f (x)dx şi g(x)dx au aceeaşi natură.
x→b g(x)
x<b
a a
b
Dacă k = 0, atunci convergenţa integralei improprii g(x)dx implică convergenţa integralei
a
b
improprii f (x)dx.
a

Corolarul 13.1.2 Fie f : [a, b) → (0, ∞) cu lim f (x) = ∞. Dacă lim (b − x)λ f (x)dx = k, k con-
x→b x→b
x<b x<b

b
stantă reală finită, pentru λ < 1, atunci integrala improprie f (x)dx este convergentă. Dacă
a
λ ≥ 1 şi k = 0, atunci integrala este divergentă.
1
dx
Exemplul 13.1.6. Să studiem convergenţa integralei √ .
6
1 − x6
0

275
1
Funcţia f : [0, 1) → (0, ∞), f (x) = √ divine infinită când x → 1, x < 1, deci avem o
1 − x6
6

integrală improprie de speţa a doua. Cum


1 1
f (x) = √ √ ≤ √ ,
6 2
1−x· 1+x+x +x +x +x 3 4 5 6
1−x

1 1
x ∈ [0, 1) şi √ dx = dx este convergent (v. Exemplul ??, λ = 1/6 < 1),
6
1−x (1 − x)1/6
deducem că integrala dată este convergetă.
Exemplul 13.1.7. Să studiem natura integralei
b
dx
 .
(x − a)(b − x)
a

1
Se observă că funcţia f : (a, b) → (0, ∞), f (x) =  devine +∞ atât ı̂n a cât şi
(x − a)(b − x)
ı̂n b.
Pentru studierea naturii integralei utilizăm Corolarul 13.1.2.
Avem
1 1 1
lim (b − x)λ f (x) = lim (b − x)λ− 2 · √ =√
x→b
x<b
x→b
x<b
x−a b−a
1
pentru λ = < 1 şi
2
1 1 1
lim (x − a)λ− 2 · √
lim (x − a)λ f (x) = x→a =√
x→a
x>a x>a b−x b−a
1
pentru λ = < 1, deci integrala dată este convergentă.
2
Observaţia 13.1.2 Din consideraţiile anterioare, deducem că proprietăţile principale ale in-
tegralei Riemann se păstrează şi ı̂n cazul integralelor improprii convergente. Astfel, de
exemplu, pentru o integrală improprie de speţa ı̂ntâi are loc formula lui Leibniz - Newton.
Teorema 13.1.7 Fie f : [a, ∞) → R, integrabilă şi fie F o primitivă a funcţiei f pe intervalul

[a, ∞). Atunci integrala improprie f (x)dx este convergentă dacă şi numai dacă există
a
lim F (x) şi ı̂n plus este valabilă formula Leibniz - Newton
x→∞


f (x)dx = F (∞) − F (a) , F (∞) = lim F (x).
x→∞
a

8b
Demonstraţie. Pentru orice b > a avem f (x)dx = F (b) − F (a) şi prin trecere la limită se
a
obţin afirmaţiile din enunţ.
În mod analog se extind schimbarea de variabilă şi integrarea prin părţi.
Exemplul 13.1.8. Să calculăm

(x − 1)e−x dx.
0
Avem ∞
∞ 
−x

−x 
(x − 1)e dx = −xe  = 0.

0 0

276
Observaţia 13.1.3 În cazul unor integrale improprii divergente se ataşează o valoare printr-
un procedeu datorat lui Cauchy.

Acesta este aplicabil integralelor improprii de speţa ı̂ntâi de forma


+∞

f (x)dx
−∞

şi integralelor improprii de speţa a doua

b
f (x)dx
a

ı̂n care f devine infinită ı̂ntr-un punct c, a < c < b.


+∞

Definiţia 13.1.4 Integrala improprie f (x)dx se numeşte convergentă ı̂n sensul valorii prin-
−∞
cipale Cauchy, dacă limita

a
+∞

lim f (x)dx = v · p · C f (x)dx


a→∞
−a −∞

există şi este finită.

2
dx
Exemplul 13.1.9. Pentru integrala improprie divergentă avem
x
−1
⎡ ⎤
2 ε 2
dx dx dx ⎦
v·p·C = lim ⎣ + = ln 2.
x ε→0 x x
−1 −1 ε

13.2 Integrale cu parametri


Să trecem la extinderea noţiunii de integrală ı̂n cazul funcţiilor de mai multe variabile.
Dacă funcţia de integrat este de mai multe variabile şi ea este integrată Riemann ı̂n raport
cu una din variabile, atunci spunem că avem o integrală cu paramentri. Acestea au forma
generală
b
I(λ1 , λ2 , ..., λp ) = f (x, λ1 , λ2 , ..., λp )dx,
a

unde λ1 , λ2 , ..., λp sunt parametrii reali cu valori din anumite mulţimi de numere. Se observă
imediat că o integrală de acest fel definişte o funcţie de p variabile λ1 , λ2 , ..., λp .
În legătură cu astfel de funcţii se pune problema studierii proprietăţilor de bază (trecerea
la limită, continuitatea, derivabilitatea şi integrabilitatea) fără a calcula efectiv integrala
care defineşte funcţia.
În continuare, ne vom limita numai la cazul p = 1, adică la funcţiile de forma:

b
(13.1) I(λ) = f (x, λ)dx , λ ∈ Y ⊆ R.
a

277
Teorema 13.2.1 (Teorema trecerii la limită) Fie f : [a, b] × Y → R o funcţie de două variabile,
integrabilă ı̂n raport cu x pe [a, b] şi λ0 un punct de acumulare pentru Y . Dacă există
lim f (x, λ), atunci
λ→λ0

b b  
lim I(λ) = lim f (x, λ)dx = lim f (x, λ) dx.
λ→λ0 λ→λ0 λ→λ0
a a

Demonstraţie. Fie ε > 0 şi notăm lim f (x, λ) = g(λ); atunci există δ(ε) > 0 astfel ca pentru
λ→λ0
|λ − λ0 | < δ(ε) să avem |f (x, λ) − g(λ)| < ε/(b − a). Atunci putem scrie:
 b 
 b 
 
 f (x, λ)dx − g(λ)dx =
 
 
a a
 b 
  b
   b

=  (f (x, λ) − g(λ)dx) ≤ f (x, λ) − g(λ)a dx < ε,
 
a a

ceea ce demonstrează Teorema 13.2.1.

Observaţia 13.2.1 Teorema 13.2.1 ne arată că ı̂ntr-o integrală cu parametru putem inter-
venti operaţia de integrare cu operaţia de trecere la limită.

Pentru a putea aprofunda studiul proprietăţilor funcţiei I(λ) vom considera Y = [c, d].

Teorema 13.2.2 Dacă funcţia f : [a, b] × [c, d] → R este continuă ı̂n raport cu ansamblul
variabilelor pe dreptunghiul [a, b] × [c, d], atunci funcţia I definită de (13.1) este continuă pe
intervalul [c, d].

Demonstraţie Fie λ0 un punct din intervalul [c, d]. Formăm diferenţa

b
I(λ) − I(λ0 ) = [f (x, λ) − f (c, λ0 )]dx.
a

Funcţia de două variabile f , fiind continuă ı̂n dreptunghiul [a, b] × [c, d], este şi uniform
continuă ı̂n acest domeniu. Atunci, pentru orice ε > 0, există un δ(ε) > 0, aşa ı̂ncât să avem
ε
|f (x, λ) − f (x, λ0 )| <
b−a
dacă |λ − λ0 | < δ(ε).
Acum, putem scrie

b
ε
|I(λ) − I(λ0 )| ≤ |f (x, λ) − f (x, λ0 )|dx < (b − a) = ε,
b−a
a

dacă |λ − λ0 | < δ(ε).


Deci, avem lim I(λ) = I(λ0 ), ceea ce ne arată că funcţia I este continuă ı̂n λ0 . Cum λ0 a
λ→λ0
fost ales arbitrar din intervalul [c, d], rezultă că funcţia I este continuă pe [c, d].

Teorema 13.2.3 (De derivare sub semnul integrală) Dacă f : [a, b] × [c, d] → R este continuă
ı̂n dreptunghiul [a, b] × [c, d] şi există derivata parţială fλ continuă ı̂n raport cu ansamblul

278
b
variabilelor ı̂n acelaşi dreptunghi, atunci funcţia I(λ) = f (x, λ)dx este derivabilă pe [c, d] şi
a
are loc formula
b

I (λ) = fλ (x, λ)dx.
a

Demonstraţie Fie λ0 un punct fixat din [c, d]. Din egalitatea


b
I(λ) − I(λ0 ) f (x, λ) − f (x, λ0 )
= dx,
λ − λ0 λ − λ0
a

prin trecere la limită sub integrală, avem


b
I(λ) − I(λ0 )
lim = fλ (x, λ0 )dx,
x→x0 λ − λ0
a

care ne arată că funcţia I este derivabilă ı̂n λ0 şi are loc formula din enunţul teoremei.
Exemplul 13.2.1. Să calculăm derivata funcţiei I definită prin
1
sin λx
I(λ) = dx , λ ∈ R.
x
0

sin λx
Integrala nu este improprie deoarece lim = λ.
x→0 x
Avem
1 1
 cos λx
I (λ) = x· dx = cos λxdx =
x
0 0
1
sin λx  sin λ
=  = .
λ 0 λ

Observaţia 13.2.2 În unele situaţii se consideră integrale cu parametru ı̂n care şi limitele
de integrare depind de parametru, adică avem


b(λ)

I(λ) = f (x, λ)dx , λ ∈ [c, d].


a(λ)

Dacă, pe lângă condiţiile din Teorema 13.2.3, mai adaugăm faptul că funcţiile a şi b sunt
derivabile ı̂n raport cu λ pe [c, d], atunci are loc formula


b(λ)

I (λ) = fλ (x, λ)dx + b (λ)f (b(λ), λ) − a (λ)f (a(λ), λ).
a(λ)

Teorema 13.2.4 (de integrare) Dacă funcţia f : [a, b] × [c, d] → R este continuă ı̂n raport cu
ansamblul variabilelor ı̂n dreptunghiul [a, b] × [c, d], atunci oricare ar fi intervalul [α, β] ⊆ [c, d]
are loc egalitatea
⎛ ⎞ ⎛ ⎞
β β b b β
I(λ)dλ = ⎝ f (x, λ)dx⎠ dx = ⎝ f (x, λ)dx⎠ dx.
α α a a α

279
Cu alte cuvinte, ı̂n condiţiile teoremei se poate integra sub semnul integralei, sau se
poate schimba ordinea de integrare.
Demonstraţie Fie z ∈ [c, d]; vom demonstra egalitatea mai generală
⎛ ⎞ ⎛ ⎞
z b b z
⎝ f (x, λ)dx⎠ dλ = ⎝ f (x, λ)dλ⎠ dx.
α a a α

Facem notaţiile ⎛ ⎞
z b
ϕ(z) = ⎝ f (x, λ)dx⎠ dλ
α a

şi ⎛ ⎞
b z
ψ(z) = ⎝ f (x, λ)dλ⎠ dx.
a α

Avem
b

ϕ (z) = f (x, λ)dx,
a

şi
b

ψ (z) = f (x, λ)dx,
a

oricare ar fi z ∈ [c, d]. De aici, rezultă că ϕ(z) − ψ(z) = C - constantă. Cum ϕ(α) − ψ(α) = 0,
obţinem C = 0, ceea ce ne arată că ϕ(z) = ψ(z), oricare ar fi z ∈ [c, d]. Teorema este
demonstrată.
Exemplul 13.2.2. Să considerăm integrala cu parametru

1
I(λ) = xλ dx.
0

Integrăm funcţia I pe intervalul [a, b], 0 < a < b, şi avem


⎛ ⎞ ⎛ ⎞
b b 1 1 b
I(λ)dλ = ⎝ xλ dx⎠ dλ = ⎝ xλ dλ⎠ dx
a a 0 0 a

de unde 1
b  1 λ b
xλ+1  x 
 dλ = dx
λ + 1 ln x a
a 0 0
sau
b 1
dλ xb − xa
= dx,
λ+1 ln x
a 0

ceea ce conduce la
1
xb − xa b+1
dx = ln(λ + 1)|ba = ln .
ln x a+1
0

Se observă că, utilizând proprietatea de intervertire a ordinii de integrare ı̂ntr-o integrală


cu parametru, am reuşit să calculăm o integrală greu de calculat pe altă cale.

280
De fapt, aceasta este una dintre aplicaţiile importante ale integralelor cu parametrii:
calculul unor integrale greu de evaluat pe altă cale.
Deseori, integrale fără parametru sunt transformate ı̂n integrale cu parametru la care,
apoi, se aplică derivarea sau integrarea sub semnul integralei şi se obţine o valoare mai
generală pentru integrala dată. Prin particularizarea parametrului se obţine valoarea inte-
gralei date.
Exemplul 13.2.3. Să calculăm integrala
1
arctgx
I= √ dx.
x 1 − x2
0

arctgx
Se observă că integrala nu este improprie deoarece lim √ = 1. Considerăm inte-
x→0 x 1 − x2
grala mai generală
1
arctgλx
I(λ) = √ dx , λ ∈ [0, ∞).
x 1 − x2
0
Derivăm ı̂n raport cu parametrul λ şi avem
1 1
(λ) x 1 dx
I = 2 2
· √ dx = √ .
1 + λ x x 1 − x2 (1 + λ2 x2 ) 1 − x2
0 0

Făcând schimbarea de variabilă x = cos t, găsim


 π2
2
π 
dt 1 tgt 
I  (λ) = =√ arctg √  =
1 + λ2 cos2 t 1 + λ2 1 + λ2 
0
0

π 1
·√ . =
2 1 + λ2
De aici, integrând ı̂n raport cu λ, găsim
π 
I(λ) = ln(λ + 1 + λ2 ) + C.
2
Cum I(0) = 0, rezultă C = 0 şi
π 
I(λ) = ln(λ + 1 + λ2 ).
2
Pentru λ = 1 avem √
π
I(1) = I = ln(1 + 2).
2
Observaţia 13.2.3 În cazul când integrala ce depinde de un parametru este improprie, cele
expuse ı̂n acest paragraf rămân valabile cu condiţia ca integralele improprii cu care se
lucrează să fie convergente.

Exemplul 13.2.4. Să considerăm integrala



sin x
I(α) = e−αx dx , α ∈ (0, ∞).
x
0

Scriem
1 ∞
−αx sin x sin x
I(λ) = e dx + e−αx dx.
x x
0 1

281
sin x
lim e−αx
Cum x→0 = 1, rezultă că prima integrală este convergentă.
x>0
x
Deoarece, pentru x ≥ 1 avem  
 −αx sin x 
e  ≤ e−αx
 x 
şi ∞
∞ 
−αx  −α
−αx e  =e ,
e dx = −
α  α
1 1

sin x
deducem că e−αx dx este convergentă. Prin urmare, I(α) este bine definită.
x
1
Aplicând teorema de derivare a integralelor cu parametru, avem:
∞ ∞
 −αx sin x
I (α) = e (−x) dx = − e−αx sin xdx,
x
0 0

care este o integrală improprie convergentă. Integrând prin părţi, obţinem

I  (α) = −1 − α2 I  (α),

de unde
1
I  (α) = − ,
1 + α2
din care rezultă
I(α) = −arctgα + C.
Pentru determinarea constantei C calculăm
π
lim I(α) = − + C,
α→∞ 2
pe de o parte, şi din
∞   ∞
 −αx sin x  1
|I(α)| ≤ e  dx ≤ e−αx dx =
x  α
0 0

lim I(α) = 0.
α→∞
π π π
Avem deci C − = 0, de unde C = . Rezultă că I(α) = − arctgα. din acest rezultat,
2 2 2
prin trecere la limită când α → 0, α > 0, găsim

sin x π
dx = .
x 2
0

13.3 Integrale euleriene. Funcţia Gamma. Funcţia Beta


În orice activitate există anumite rezultate care trebuiesc studiate mai aprofundat şi chiar
reţinute. Această situaţie se ı̂ntâlneşte şi ı̂n clasa integralelor cu parametri şi improprii.
Există anumite funcţii, numite uneori şi funcţii speciale, definite prin integrale cu parametrii
la care apelăm deseori ı̂n calculele matematice.
Două dintre aceste funcţii speciale sunt funcţiile Gamma şi Beta, numite sub un generic
comun integrale euleriene.

282
Definiţia 13.3.1 Funcţia Γ : (0, ∞) → R definită prin

Γ(p) = e−x xp−1 dx
0

se numeşte funcţia Gamma sau funcţia lui Euler de speţa a doua, iar funcţia B : (0, ∞) ×
(0, ∞) → R definită prin
1
B(p, q) = xp−1 (1 − x)q−1 dx
0

se numeşte funcţia Beta sau funcţia lui Euler de speţa ı̂ntâi.

Teorema 13.3.1 Funcţiile Γ şi B sunt bine definite, adică integralele improprii care le de-
finesc sunt convergente.

Demonstraţie Să arătăm că funcţia Γ este bine definită. Scriem Γ ca sumă de două
integrale, anume:
1 ∞
Γ(p) = e x dx + e−x xp−1 dx.
−x p−1

0 1

1
Prima integrală I1 = e−x xp−1 dx pentru p ≥ 1 nu este improprie. pentru p ∈ (0, 1) avem
0

lim xλ e−x xp−1 = x→0


x→0
lim xλ+p−1 e−x = 1
x>0 x>0

dacă λ = 1 − p < 1, de unde, conform cu Corolarul 13.1.2, deducem că integrala I1 este
convergentă.

Convergenţa integralei I2 = e−x xp−1 dx rezultă din Exemplul ??.
1
Din I1 şi I2 convergente şi faptul că Γ(p) = I1 + I2 , rezultă că integrala improprie ce
defineşte funcţia Gamma este convergentă.
Utilizând acelaşi Corolar 13.1.2 se arată imediat că şi funcţia B este bine definită.
În continuare, vom prezenta câteva din proprietăţile mai uzuale ale funcţiilor Γ şi B.

Teorema 13.3.2 Pentru funcţia Γ sunt adevărate următoarele afirmaţii:

1) Γ(1) = 1;

2) Γ(p + 1) = pΓ(p);

3) Γ(n + 1) = n! , n ∈ N;

2
4) Γ(p) = 2 e−t · t2p−1 dt;
0

π
5) Γ(p)Γ(1 − p) = , p ∈ (0, 1) (numită formula complementelor).
sin pπ
 
1 √
6) Γ = π.
2

Demonstraţie

283

1) Γ(1) = e−x dx = −e−x |∞
0 =1
0

2) Aplicăm integrarea prin părţi succesiv şi avem



Γ(p + 1) = e−x xp dx = −(e−x xp )|∞
0 +
0


+p e−x xp−1 dx = pΓ(p).
0

3) Se aplică ı̂n mod repetat formula se recurenţă de la 2):

Γ(n + 1) = nΓ(n) = n(n − 1)Γ(n − 1) = ... =

= n(n − 1)...2 · 1 · Γ(1) = n!.

4) Efectuăm schimbarea de variabilă x = t2 şi avem


∞ ∞
−t2 2 p−1 2
Γ(p) = 2 e (t ) tdt = 2 e−t t2p−1 dt,
0 0

ceea ce trebuia demonstrat.


5) Demonstraţia formulei complementelor este mai complicată şi de aceea renunţăm la
prezentarea ei.
1
6) Dacă luăm ı̂n formula complementelor p = , atunci avem
2
   
1 1
Γ ·Γ = π,
2 2
 
1 √
de unde Γ = π.
2
Teorema 13.3.3 Pentru funcţia B sunt adevărate următoarele relaţii:

y p−1
1) B(p, q) = dy;
(1 + y)p+q
0

1
tp−1 + tq−1
2) B(p, q) = dt;
(1 + t)p+q
0

Γ(p) · Γ(q)
3) B(p, q) = (formula de legătură dintre funcţiile B şi Γ sau formula lui Dirich-
Γ(p + q)
let);
4) B(p, q) = B(q, p) (proprietatea de simetrie);
p−1
5) B(p, q) = B(p − 1, q); p > 1, q > 0;
p+q−1
q−1
B(p, q) = B(p, q − 1), p > 0, q > 1.
p+q−1

284
Demonstraţie
y
1) Facem schimbarea de variabilă x = şi avem
y+1
∞  p−1  q−1
y y dy
B(p, q) = 1− =
y+1 y+1 (y + 1)2
0

y p−1
= dy.
(1 + y)p+q
0

2) Utilizând formula de la 1), putem scrie


1 ∞
y p−1 y p−1
B(p, q) = dy + dy.
(1 + y)p+q (1 + y)p+q
0 1

În integrala a doua facem schimbarea de variabilă y = 1/t şi obţinem formula de la 2).

3) În Γ(p) = e−x xp−1 dx facem schimbarea de variabilă x = ty, t parametru real pozitiv şi
0
obţinem

(13.2) Γ(p) = t p
e−ty y p−1 dy.
0

În acest rezultat ı̂nlocuim pe t prin 1 + t şi p prin p + q şi obţinem



Γ(p + q)
= e−(1+t)y y p+q−1 dy
(1 + t)p+q
0

Multiplicăm ambii membri ai formulei precedente cu tp−1 şi egalitatea obţinută o in-
tegrăm ı̂n raport cu t de la 0 la ∞ şi avem:

tp−1
Γ(p + q) dt =
(1 + t)p+q
0
⎛ ⎞
∞ ∞
⎝tp−1 e−(1+t)y y p+q−1 dy ⎠ dt =
0 0
⎛ ⎞
∞ ∞
= e−y y q−1 ⎝y p e−yt tp−1 dt⎠ dy.
0 0
Acum, conform cu 1) şi cu (13.2), ı̂n care schimbăm pe t cu y, obţinem:

Γ(p + q) · B(p, q) = e−y y q−1 Γ(p)dy =
0

= Γ(p) e−y y q−1 dy = Γ(p) · Γ(q),
0
de unde găsim
Γ(p) · Γ(q)
B(p, q) = ,
Γ(p + q)
adică ceea ce trebuia demonstrat.

285
4) Rezultă imediat din 3).
5) Aceste formule rezultă din formula de legătură de la 3) şi utilizând formula de recurenţă
pentru Γ.

Observaţia 13.3.1 Integralele euleriene sunt utile ı̂n studiul multor funcţii neelementare.
De aceea, valorile lor au fost tabelate.
Calculul multor integrale se reduce prin diferite transformări, la evaluarea funcţiilor B
şi Γ.

Exemplul 13.3.1. Să arătăm că


∞ √
−x2 π
e dx = (integrala lui Poisson).
2
0

Facem schimbarea de variabilă x2 = t şi avem


∞ ∞
2 1 1
e−x dx = e−t t− 2 dt.
2
0 0

1
În integrala din membrul doi se recunoaşte expresia funcţiei Γ pentru p − 1 = − , adică
2
1
p = . Atunci, putem scrie
2
∞   √
2 1 1 π
e−x dx = Γ = .
2 2 2
0
Exemplul 13.3.2. Să calculăm
∞ √
4
x
I= dx.
(1 + x)2
0
Putem scrie
∞ 1
x4
I= dx,
(1 + x)2
0
1
care comparată cu exprimarea lui B dată de 1) din Teorema 13.3.3, conduce la p − 1 = şi
4
5 3
p + q = 2, de unde p = şi q = .
4 4
Rezultă că  
5 3
I=B , ,
4 4
de unde, utilizând formula de legătură dintre B şi Γ, obţinem
       
5 3 1 1 3
Γ Γ Γ Γ
4 4 4 4 4
I=   = =
5 3 Γ(2)
Γ +
4 4
   
1 1 3
= Γ Γ .
4 4 4
Acum, utilizând formula complementelor avem

1 π π 2
I= · = .
4 sin π 4
4

286
În general, integralele de forma

xm
I= dx , np > m + 1
(1 + xn )p
0

se calculează prin funcţiile B şi Γ, făcând schimbarea de variabilă xn = t.


Exemplul 13.3.3. Să se reducă la funcţiile B şi Γ calculul integralelor de forma
b
Im,n = (x − a)m (b − x)n dx,
a

m şi n numere reale aşa alese ı̂ncât integrala să fie convergentă.


Facem schimbarea de variabilă

x = (1 − t)a + bt , t ∈ [0, 1]

şi avem
1
Im,n = (b − a) m+n+1
tm (1 − t)n dt =
0
= (b − a)m+n+1 B(m + 1, n + 1) =
Γ(m + 1)Γ(n + 1)
= (b − a)m+n+1 .
Γ(m + n + 2)
1  
1
Exemplul 13.3.4. Să calculăm I = lnp dx, p ∈ R, p > −1
x
0
Facem schimbarea de variabilă x = e−t şi avem

I= tp e−t dt = Γ(p + 1).
0

13.4 Integrale duble


La integralele cu parametrii funcţia de integrat era de mai multe variabile, ı̂nsă calculul
integralei se aplică numai la una din variabile, celelalte le considerăm parametrii. Ne
propunem să extindem noţiunea de integrală pentru funcţiile de mai multe variabile aşa
ı̂ncât ı̂n evaluarea lor să utilizăm toate variabilele. Astfel de integrale le vom numi multiple.
Dacă f : D ⊆ Rn → R z = f (x1 , ..., xn ), atunci o integrală m-multiplă o notăm prin

...
f (x1 , ..., xn )dx1 dx2 ...dxn .
D
Dacă n = 2, atunci spunem că avem o integrală dublă, iar dacă n = 3, atunci spunem că
avem o integrală triplă.
Pentru comoditatea tratării considerăm numai cazul integralelor duble.
Fie f : D ⊂ R2 → R, z = f (x, y) o funcţie de două variabile. Mai presupunem că D este un
domeniu mărginit.
Să considerăm o partiţie (descompunere) arbitrară a domeniului D ı̂n n subdomenii
D1 , D2 , ..., Dn cu Di = ∅, i = 1, n şi Di ∩ Dj = ∅, i = j, i, j = 1, n. O astfel de partiţie a lui D
se numeşte diviziune a lui D şi o notăm prin (Δn ). Notăm cu ai aria sub domeniului Di ,
i = 1, n şi cu di diametrul lui Di (cea mai mare dintre distanţele dintre două puncte din Di ),
i = 1, n. Numărul Δn  = max di se numeşte norma diviziunii (partiţia) Δn .
i=1,n

287
În fiecare subdomeniu Di al diviziunii (Δn ) alegem un punct arbitrar de coordonate
(ξi , ηi ), i = 1, n, numite puncte intermediare.
Cu aceste precizări, introducem suma integrală

n
σ(Δn , ξ, η, f ) = f (ξi , ηi )ai .
i=1

Evident că suma σ(Δn , ξ, η, t) depinde de diviziunea Δn , de punctele intermediare (ξi , ηi )


şi de funcţia f .
Definiţia 13.4.1 Spunem că funcţia f este integrabilă pe domeniul D dacă oricare ar fi
şirul de diviziuni (Δn )n≥1 cu şirul normelor (Δn )n≥2 tinde la zero şi oricare ar fi punctele
intermediare (ξi , ηi ) ∈ Di , i = 1, 2, ..., n şirul sumelor integrale (σ(Dn , ξ, η, f ))n≥1 are o limită
finită.
Notăm această limită prin

f (x, y)dxdy sau f (x, y)da.
D D
şi o numim integrala dubă a funcţiei f pe domeniul D.
Aşadar, putem scrie


n
f (x, y)dxdy = n→∞
lim f (ξk , ηk )ak .
D Δn →0 k=1

Ca şi la funcţiile de o variabilă reală se arată că orice funcţie continuă pe domeniul D
este integrabilă.
Şi proprietăţile integralei duble sunt analoage cu cele ale integralei Riemann.
Teorema 13.4.1 (de liniaritate) Dacă f, g : D ⊂ R2 → R sunt funcţii integrabile pe D, atunci
oricare ar fi α, β ∈ R funcţia αf + βg este integrabilă pe D şi avem

(αf (x, y) + βg(x, y))dxdy =
D

=α f (x, y)dxdy + β g(x, y)dxdy.
D D
Această proprietate ne spune că integrala dublă pe domeniul D este o funcţională liniară.
Demonstraţia teoremei este imediată.
Teorema 13.4.2 (de aditivitate faţă de domeniu) Dacă funcţia f : D ⊂ R2 → R este inte-
grabilă pe D, iar D = D1 ∪ D2 , D1 ∩ D2 = ∅, atunci f este integrabilă pe D1 şi pe D2 şi
avem
f (x, y)dxdy = f (x, y)dxdy + f (x, y)dxdy.
D D1 D2
Afirmaţia din această teoremă se demonstrează cu ajutorul definiţiei.
Teorema 13.4.3 (de interpretare geometrică) Dacă f : D ⊂ R2 → (0, ∞) este integrabilă,
atunci avem
f (x, y)dxdy = V (f ),
D
unde V (f ) este volumul barei cilindrice mărginită de domeniul D şi suprafaţă dată de z =
f (x, y), având generatoarele paralele cu axa Oz.

288
Pentru cazul particular f ≡ 1, avem

dy = aria(D).
D

Teorema 13.4.4 (de semn) Dacă f : D ⊂ R2 → (0, ∞), atunci



f (x, y)dxdy ≥ 0.
D

Proprietatea din enunţ rezultă imediat din nenegativitatea sumelor integrale.

Teorema 13.4.5 (de monotonie) Dacă f, g : D ⊂ R2 → R sunt integrabile pe D şi f ≤ g pe D,


atunci
f (x, y)dxdy ≤ g(x, y)dxdy.
D D

Pentru demonstraţie se aplică funcţiei g − f ≥ 0 proprietatea de semn.

Teorema 13.4.6 (modulului) Dacă funcţia f : D ⊂ R2 → R este integrabilă pe D şi atunci |f |


este integrabilă pe D şi avem
 
 
 
 f (x, y)dxdy  ≤ |f (x, y)|dxdy.

 D  D

Formula din teoremă rezultă imediat din inegalitatea −|f | ≤ f ≤ |f |.

Teorema 13.4.7 (de medie) Dacă f, g : D ⊂ R2 → R sunt integrabile pe D, m = inf f (x, y),
(x,y)∈D
M= sup f (x, y) şi g are semn constant pe D, atunci există un număr real μ ∈ [m, M ] aşa
(x,y)∈D
ı̂ncât
f (x, y)d(x, y)dxdy = μ g(x, y)dxdy,
D D
numită formula de medie generalizată pentru integrala dublă.

Demonstraţie Considerăm g ≥ 0 pe D. Atunci din m ≤ f (x, y) ≤ M rezultă mg(x, y) ≤


f (x, y)g(x, y) ≤ M g(x, y). Utilizând proprietatea de monotonie a integralei duble, putem
scrie:
m g(x, y)dxdy ≤ f (x, y)g(x, y)dxdy ≤
D D
(13.3)
≤M g(x, y)dxdy = 0.
D

Dacă g(x, y)dxdy = 0, atunci f (x, y)g(x, y)dxdy = 0 şi putem alege orice μ ∈ [m, M ]
D D
ca să avem formula din Teorema de medie.

289

Dacă g(x, y)dxdy = 0, atunci prin ı̂mpărţire cu acest număr ı̂n (13.3) avem
D

f (x, y)g(x, y)dxdy
D
m≤ ≤ M,
g(x, y)dxdy
D

de unde rezultă că putem lua



f (x, y)g(x, y)dxdy
D
μ= .
g(x, y)dxdy
D

Cazuri particulare
13.4.1 Dacă f este continuă pe D, atunci există un punct (ξ, η) ∈ D aşa ı̂ncât μ = f (ξ, η).
13.4.2 Dacă g ≡ 1 pe D, atunci formula de medie ia forma

f (x, y)dxdy = μ aria(D),
D

numită formula de medie pentru integrala dublă.


Calculul integralelor duble se reduce la calculul a două integrale definite (Riemann),
succesive. pentru ı̂nceput să considerăm cazul unui domeniu dreptunghiular.

Teorema 13.4.8 Dacă f : [a, b] × [c, d] → R este integrabilă pe dreptunghiul D = [a, b] × [c, d] şi
dacă pentru orice x constant din intervalul [a, b], funcţia f este integrabilă ı̂n raport cu y,
adică există
d
F (x) = f (x, y)dy , x ∈ [a, b],
c

atunci avem
b d
f (x, y)dxdy = dx f (x, y)dy.
D a c

Demonstraţie Vom considera diviziunile Dx şi Dy , respectiv pentru intervalele [a, b] şi
[c, d], definite prin
Dx : a = x0 < x1 < ... < xm = b
Dy : c = y0 < y1 < ... < yn = d
şi având normele
Dx  = max (xi − xi−1 )
i=i,m

respectiv
Dy  = max (yj − yj−1 ).
j=1,n

Cele două diviziuni Dx şi Dy determină pe D diviziunea D dată de subdreptunghiurile

Di,j = {(x, y) ∈ D| xi−1 ≤ x ≤ xi , yj−1 ≤ y ≤ yj } ,

290
i = 1, m, j = 1, n şi având norma D dată de i=1,m
max di,j , de unde dij este diametrul dreptun-
j=a,n
ghiului Dij .
Se observă imediat că dacă Dx  → 0 şi Dy  → 0, atunci D → 0 şi reciproc.
Alegem punctele intermediare (ξi , ηj ) ∈ Dij , ξi ∈ [xi−1 , xi ], ηj ∈ [yj−1 , yj ], i = 1, m, j = 1, n.
Deoarece f este integrabilă pe D, iar funcţia F există şi este integrabilă pe [a, b], avem
succesiv

m
n
f (x, y)dxdy = lim f (ξi , ηj )ariaDij =
D →0
D i=1 j=1

n
= lim f (ξi , ηj )(xi − xi−1 )(yj − yj−1 ) =
Dx →0
Dy →0 i=1 j=1
⎛ ⎞

n
= lim (xi − xi−1 ) ⎝ lim f (ξi , ηj )(yj − yj−1 )⎠ =
Dx →0 Dy →0
i=1 j=1

m d
= lim (xi − xi−1 ) f (ξi , y)dy =
Dx →0
i=1 c

m b
= lim F (ξi )(xi − xi−1 ) = F (x)dx =
Dx →0 a
i=1

b d
= dx f (x, y)dy,
a c

ceea ce trebuia demonstrat.


Deseori, integrala pe dreptunghiul D = [a, b] × [c, d] se notează prin

b d
f (x, y)dxdy.
a c

Aşadar, formula din enunţul Teoremei ia forma

b d b d
f (x, y)dxdy = dx f (x, y)dy.
a c a c

În mod analog, se arată că avem şi formula

b d d b
f (x, y) = dy f (x, y)dx.
a c c a

Exemplul 13.4.1. Să calculăm


1 2
dxdy
I= .
(x + y + 1)2
0 1

Avem 
1 2 1  2
dy 1 
I= dx = dx −  =
(x + y + 1)2 x + y + 1 
0 1 0 1

291
1  
1 1
= − + dx =
x+3 x+2
0

= − ln(x + 3)|10 + ln(x + 2)|10 =


9
= − ln 4 + ln 3 + ln 3 − ln 2 = ln .
8
Să trecem acum la calculul integralelor duble pe un domeniu D regulat ı̂n raport cu una
din axele de coordonate .

Definiţia 13.4.2 Spunem că un domeniu D este regulat ı̂n raport cu una din axele de coor-
donate dacă orice paralelă la una din axele de coordonate ı̂ntâlneşte curba care mărgineşte
domeniul ı̂n cel mult două puncte.

Să considerăm că domeniul D este regulat ı̂n raport cu axa Oy (fig 13.4.1). Un astfel de
domeniu se descrie astfel:

D = {(x, y)| a ≤ x ≤ b, ϕ(x) ≤ y ≤ ψ(x)}.


y
y=R(x)
d

y=n(x)
c
0 a b x

Fig. 13.4.1

Teorema 13.4.9 Dacă funcţia f este definită şi integrabilă pe domeniul D = {(x, y)| a ≤ x ≤
b, ϕ(x) ≤ y ≤ ψ(x)} şi pentru fiecare x ∈ [a, b] există integrala


ψ(x)

F (x) = f (x, y)dy,


ϕ(x)

atunci are loc formula



b
ψ(x)

f (x, y)dxdy = dx f (x, y)dy.


D a ϕ(x)

Demonstraţie Folosim Teorema 13.4.8. Considerăm dreptele paralele cu Ox, y = c şi


y = d, astfel ca c ≤ ϕ(x) şi d ≥ ψ(x), x ∈ [a, b] (Fig. 13.4.1) şi notăm cu Δ dreptunghiul
[a, b] × [c, d]. Introducem funcţia auxiliară

f (x, y) , dacă (x, y) ∈ D
g:Δ→R , g(x, y) =
0 , dacă (x, y) ∈ Δ − D.

Funcţia g este integrabilă pe dreptunghiul Δ fiind integrabilă atât pe D, cât şi pe domeniul
Δ − D, unde este nulă.

292
Folosind proprietatea de aditivitate a integralei duble faţă de domeniu (Teorema 13.4.2),
putem scrie
g(x, y)dxdy =
D
(13.4) g(x, y)dxdy + g(x, y)dxdy =
D Δ − D

= f (x, y)dxdy,
D

deoarece g(x, y)dxdy = 0.
Δ−D
Dar, integrala g(x, y)dxdy se poate calcula folosind şi formula din Teorema 13.4.8.
D
Avem
8b 8d
g(x, y)dxdy = g(x, y)dxdy =
D a c

b d b
ϕ(x)

= dx g(x, y)dy = dx ⎝ g(x, y)dy+
a c a c

(13.5)
ψ(x) d

+ g(x, y) + g(x, y)dy ⎠ =
ϕ(x) ψ(x)
b
ψ(x)

= dx f (x, y)dy
a ϕ(x)

deoarece

ϕ(x) d
g(x, y)dy = 0 şi g(x, y)dy = 0.
c ψ(x)

Din (13.4) şi (13.5) rezultă formula din enunţul Teoremei 13.4.9.
Dacă domeniul D este regulat ı̂n raport cu axa Ox, adică el are forma D =
{(x, y) c ≤ y ≤ d, ϕ(y) ≤ x ≤ ψ(y)} atunci avem formula

d
ψ(y)

f (x, y)dxdy = dy f (x, y)dx.


D c ϕ(y)

Exemplul 13.4.2. Să calculăm integrala dublă



I= (3x − y + 2)dxdy
D

dacă D este domeniul mărginit de curbele y = x şi y = x2 .


Examinăm domeniul D (Fig. 13.4.2) şi observăm că el este situat ı̂ntre dreapta y = x şi
parabola y = x2 şi punctele O(◦, ◦) şi A(1, 1).

293
y
1 A(1, 1)

x
y=

x 2
y=
0 1 x
Fig. 13.4.2

D este regulat ı̂n raport cu axa Oy şi avem

D = {(x, y)| 0 ≤ x ≤ 1, x2 ≤ y ≤ x}.

Atunci putem scrie succesiv:

1 x
I= dx (3x − y + 2)dy =
0 x2

1   x
y2 
= 3xy − + 2y  dx =
2 
 2
0 x

1  
x2 x4
= 3x2 − + 2x − 3x3 + − 2x2 dx =
2 2
0

1  
x4 3 x2 31
= − 3x + + 2x dx = .
2 2 60
0

Observaţia 13.4.1 Dacă avem de calculat o integrală dublă pe un domeniu arbitrar, atunci
ı̂ncercăm să găsim o partiţie a sa ı̂n domenii regulate şi apoi aplicăm proprietatea de
aditivitate faţă de domeniu.

Ca şi ı̂n cazul integralelor Riemann, calculul unor integrale duble se poate face cu o
schimbare de variabile.
Se demonstrează ([2], [3]) că are loc următoarea teoremă de schimbare de variabile:

Teorema 13.4.10 Fie f : D ⊂ R2 → R o funcţie integrabilă pe D şi fie transformare x =


ϕ(u, v), y = ψ(u, v) a domeniului Δ ⊂ R2 ı̂n domeniul D. Dacă funcţiile ϕ şi ψ au derivate
parţiale de ordinul ı̂ntâi continue pe domeniul Δ, iar determinantul funcţional (jacobianul
transformării)  
 ∂ϕ(u, v) ∂ϕ(u, v) 
 
D(x, y)  ∂u ∂v 
 = 0,
J= =
D(u, v)  ∂ψ(u, v) ∂ψ(u, v) 
 
∂u ∂v
atunci are loc formula de schimbare de variabile ı̂n integrala dublă

f (x, y)dxdy = f (ϕ(u, v), ψ(u, v))|J|dudv.
D Δ

294
O schimbare de variabile des utilizată este cea polară:

x = r cos θ , y = r sin θ,

prin care se trece de la coordonatele carteziene (x, y) la cele polare (r, θ).
Geometric (Fig. 13.4.3), dacă avem punctul A(x, y) din planul xOy,  atunci coordonatele
polare ale lui A sunt date de distanţa de la origine la A, adică r = x2 + y 2 , şi de unghiul
y
pe care ı̂l face axa Ox cu direcţia OA, adică tgθ = .
x
y

A(x, y)
r

2
0 x
Fig. 13.4.3

Jacobianul transformării polare este


 
 ∂x ∂x   
   cos θ −r sin θ 
D(x, y)  ∂r ∂θ  
=
J= =    = r.
D(r, θ)  ∂y ∂y  sin θ r cos θ 
 
∂r ∂θ
Exemplul 13.4.3. Să calculăm integrala dublă

dxdy
I=  ,
D 1 + x2 + y 2

unde D = {(x, y) ∈ R| x2 + y 2 ≤ a2 , a > 0, x ≥ 0, y ≥ 0}.


Se observă că D este mărginit de sfertul de cerc x2 + y 2 = r2 din primul cadran şi de axele
Ox şi Oy (Fig. 13.4.4).

r
2
a x
0
Fig. 13.4.4

Utilizăm coordonatele polare, prin care domeniul D este transformat ı̂n dreptunghiul
9 π:
Δ = (r, θ)| 0 ≤ r ≤ a, 0 ≤ θ ≤ ,
2

295
şi avem
π
a 2
1 rdrdθ
I = √ rdrdθ = √ =
Δ 1 + r2 1 + r2
0 0 a
a 2
π 
 
rdr π 
= √ dr dθ = 1 + r2  =
1 + r2 2 
0 0 
π  0
2
= ( 1 + a − 1).
2
Observaţia 13.4.2 Prin analogie cu integralele improprii din funcţiile de o variabilă reală,
se pot introduce şi integrale duble (ı̂n general, multiple ) improprii.

Observaţia 13.4.3 În domeniul economic integralele duble apar deseori ı̂n studiul modelelor
matematico - economice descrise prin variabile aleatoare bidimensionale.

296
13.5 Test de verificare a cunoştinţelor nr. 12
1. Definiţi următoarele noţiuni:

a) Integrală improprie de prima speţă;


b) Funcţiile Beta şi Gamma ale lui Euler;
c) Integrală dublă.
1
2
dx
2. a) Studiaţi convergenţa integralei ,
x · ln2 x
0

dx
b) Studiaţi convergenţa integralei ,
1 + x4
1
1
dx
c) Studiaţi convergenţa integralei I = √ ,
3
1 − x4
0
d) Studiaţi convergenţa integralei

| sin x|
I= dx , w > 1.
xw
1


1 − e−ax
3. Să se calculeze integrala I(a) = dx care depinde de parametrul real a > −1.
x · ex
0

4. Calculaţi integrala
π
2
1 1 + b sin x
I(b) = ln dx cu b ∈ R.
sin x 1 − b sin x
0

5. a) Calculaţi integrala:
π
2
I(b) = ln(cos2 x + b2 sin2 x)dx
0

care depinde de parametrul real 0 < b < ∞.



1 − cos yx −kx
b) Calculaţi I(y, k) = ·e dx cu y ≥ 0, k > 0.
x
0

6. Calculaţi cu ajutorul integralelor euleriene:


1 
a) I = x − x2 dx;
0
∞ 1
x4
b) I = dx;
(1 + x)2
0

x
c) I = dx;
1 + x3
0

297

x2
d) I = .
(1 + x4 )2
0

7. Calculaţi:

dxdy
a) I = , unde D este dreptunghiul [3, 4] × [1, 2];
D (x + y)2

1 1
ydxdy
b) I = 3 ;
(1 + x2 + y 2 ) 2
0 0
1 0
c) I = x exy dxdy.
0 −1

8. a) Calculaţi I = (x2 + y)dxdy unde D este domeniul mărginit de parabolele y = x2
D
şi y 2 = x.

x2
b) Calculaţi I = dxdy unde D este mărginit de dreptele x = 2, y = x şi hiperbola
D y2
xy = 1.

9. Calculaţi I = xydxdy, unde D este sfertul de cerc x2 + y 2 ≤ R2 situat ı̂n primul
D
cadran.

x2 sin(xy)
10. Calculaţi I = dxdy, unde D este domeniul mărginit de parabolele x2 = y,
D y
π 2
x = 2y, y = x, y 2 = πx.
2
2

298
Indicaţii şi răspunsuri Test nr. 12

2. a) integrala este convergentă.


1
b) Din lim xw · = 1 pentru w = 4 > 1 se deduce convergenţa integralei.
x→∞ 1 + x4
* + w= 1 <1
1 3 2
lim (1 − x) · √
c) Din x→1 w
======= 2− 3 se deduce convergenţa integralei.
3
1 − x 4
x<1


| sin x| 1 dx
d) Folosind w
≤ w şi converge pentru w > 1 se deduce convergenţa inte-
x x xw
1
gralei.
3. I(a) = ln(a + 1).
4. I(b) = π · arcsin (b).
 
b+1
5. a) I(b) = π ln .
2
 
1 y2
b) I(y, k) = ln 1 + 2 .
2 π
 
3 3 π
6. a) I = β , = .
2 2 8
  √
5 3 π 2
b) I = β , = .
4 4 4
 
1 2 1 2π
c) I = β , = √ .
3 3 3 3 3
  √
1 3 5 π 2
d) I = β , = .
4 4 4 16
2 4
dx 25
7. a) I = dx = ln .
(x + y)2 24
1 3
1 1 √ √ 

ydx (1 + 2) 2
b) I = dx 3 = ln √ .
(1 + x2 + y 2 ) 2 1+ 3
0 0
⎛ √ ⎞
1 x
⎜ ⎟ 33
8. a) I = ⎝ (x2 + y)dy ⎠ dx = .
100
0 x2
⎛ ⎞
2 x 2
⎜ x ⎟ 9
b) I = ⎝ dy ⎠ dx = .
y2 4
1 1
x

9. Folosind coordonatele polare se obţine:


π
2 R
R4
I= ρ3 cos θ · sin θ · dρdθ = .
8
0 0

2 π
1 2 π
10. I = u · sin(uv) · dudv = − unde x2 = u · y cu 1 ≤ u ≤ 2 şi y 2 = vx cu ≤ v ≤ π.
3 3π 2
1 π
2

299
Bibliografia aferentă capitolului:
[1] Acu, A.M., Acu D., Acu M., Dicu P., Matematici aplicate ı̂n economie - Volumul II,
Editura ULB, Sibiu, 2002.
[2] Nicolescu, M., Dinculeanu, N., Marcus, S., Manual de analiză matematică, Vol.I,
1962, Vol.II, 1964, Editura Didactică şi Pedagogică, Bucureşti.
[3] Stănăşilă, O., Analiză matematică, Editura Didactică şi Pedagogică, Bucreşti, 1981.

300

S-ar putea să vă placă și