Sunteți pe pagina 1din 109

UNIVERSITATEA DE ŞTIINŢE AGRICOLE ŞI MEDICINĂ VETERINARĂ

„ION IONESCU DE LA BRAD” IAŞI


FACULTATEA DE ZOOTEHNIE
ÎNVĂŢĂMÂNT LA DISTANŢĂ

Prof. dr. ILIE BURDUJAN

MATEMATICI APLICATE

2002
Referenţi ştiinţifici: Prof. dr. Alexandru Neagu
Univ. Tehnică „Gh. Asachi”- Iaşi
Conf. dr. Veronica Teodora Borcea
Univ. Tehnică „Gh. Asachi”- Iaşi
CUPRINS

Capitolul I. MULŢIMI. RELAŢII. FUNCŢII


§1. Elemente de teoria mulţimilor……………………………………1
§2. Relaţii binare………………………………………………………2
§3. Funcţii………...……………………………………….............................5
1. Moduri de a defini o funcţie…………………………….……5
2. Procedeie de introducere a funcţiilor în cercetarea din Biologie ...6
a) Ajustarea prin funcţii polinomiale…………….…………6
b) Construcţia de polinoame de interpolare………………10
§4. Frecvenţe .………………………………………..………………11
§5. Caracteristici numerice ale mulţimii valorilor unei funcţii
reale………………………………………………..……………..15
a) Caracteristici numerice de poziţie………...……………..15
1°. Media valorilor unei funcţii……..………….……….15
calculul mediei (metoda zeroului fals) ………...…….…16
2°. Mediana…………………...………………………….17
3°. Valoarea modală…………………………….…….…18
4°. Momente ……………………………..……………....18
b) Caracteristici numerice de împrăştiere…………..……..21
1°. Amplitudinea…………..…………………………….21
2°. Dispersia………...……………………………………21
3° Cuartile …………...………………………………….22
c) Alte caracteristici numerice ale unei funcţii…….………24
1°. Coeficientul de variabilitate……..………….………24
2°. Coeficientul de asimetrie……….…………..………..25
3°. Coeficientul de aplatizere (boltire) …………………26
d) Caracteristici numerice pentru familii de funcţii...……26
1°. Covarianţa a două funcţii (caractere)………...……26
2°. Matricea de covarianţă a p funcţii ………...…...….28
4°. Regresia liniară ………………………………..…....29

Capitolul II. ELEMENTE DE ALGEBRĂ ABSTRACTĂ ……………....33


§1. Lege de compoziţie…………………………………….………...33
§2. Structuri algebrice de bază…………….……………………….35
§3. Pătrate latine……………………………….……………………37

Capitolul III. SPAŢII VECTORIALE……………………………………..39


§1. Spaţii vectoriale…………………………………………….……39
1. Definiţii. Exemple………………………………………..39
§2. Subspaţii vectoriale………………………………………….…..45
1.Definiţii. Exemple……………………………………..…...45
2. Rangul unui sistem de vectori………………………..…..45
3. Rangul unei matrice………………………………………46
4. Inversarea matricelor..…………… …………………….47
I
5. Calculul determinanţilor………….……………….……..49
6. Rezolvarea sistemelor de ecuaţii liniare………...…..…...49

Capitolul IV. ELEMENTE DE PROGRAMARE LINIARĂ.....................53


§1. Metoda simplex de rezolvare a problemelor
de programare liniară ……………..…………………………….53
1. Probleme care conduc la programe liniare………...……53
a) Reartiţia optimă a culturilor agricole………...……..53
b) Problema dietei ……………………………………….54
2. Descrierea algoritmului Simplex......................................56
§2. Problema transporturilor……………….………………………63
1. Modelul matematic al problemei transporturilor ….....63
2. Determinarea unei soluţii admisibile de bază
nedegenerate …………………………………………….66
3. Ameliorarea unei soluţii admisibile de bază
nedegenerate …………………………………………….68
4. Rezolvarea unor probleme de transport neechilibrate..70

Capitolul V. ELEMENTE DE TEORIA GRAFURILOR……….………..73


§1. Grafuri orientate …………………….………………………….73
1. Definiţii. Exemple……………………………………......73
§2. Grafuri neorientate……………………….……………………..78
§.3 Probleme de optim în grafuri………………………….………..79
1. Problema arborelui parţial minimal/maximal…………79
2. Problema drumului minim/maxim ……………...……..80
3. Problema fluxului maxim şi a secţiunii minime……....86

Capitolul VI. ELEMENTE DE TEORIA PROBABILITĂŢILOR ...........87


§1. Experienţe aleatoare. Evenimente aleatoare...............................87
§2. Câmpuri de evenimente................................................................92
§3. Funcţie de probabilitate ...............................................................93
§4. Probabilităţi condiţionate.............................................................94
§5. Probabilitatea evenimentelor dependente. Inegalitatea
lui Boole..........................................................................................98
§6. Formula probabilităţii totale. Formula lui Bayes.......................99
§7. Scheme probabilistice clasice .....................................................101
Schema Poisson......................................................................101
Schema binomială (Bernoulli)..............................................101
Schema multinomială............................................................102
Schema hipergeometrică.......................................................103
§8. Variabile aleatoare......................................................................104

Capitolul VII. Procese stochastice. Lanţuri Markov ................................107


§1. Procese stochastice. Lanţuri şi procese Markov.......................107
§2. Aplicaţii în Genetică..............................................................................109

II
Capitolul I

MULŢIMI. RELAŢII. FUNCŢII

Prin mulţime vom înţelege o colecţie de obiecte dintr-un univers U ce este


considerată ca o entitate (un tot). Faptul că un obiect din universul U intră în
componenţa unei mulţimi îi conferă acestuia calitatea de element. De obicei
mulţimile vor notate cu litere mari, iar elementele lor – cu litere mici; vor
exista şi excepţii motivate de specificul domeniului aplicaţiei.

Mulţimile apar implicit sau explicit pretutindeni în universul în care


existăm. Populaţiile biologice (staţionare) sunt exemplele de mulţimi cele mai
obişnuite şi mai uşor de perceput.

§1. ELEMENTE DE TEORIA MULŢIMILOR

Vom presupune cunoscute elementele uzuale de teoria mulţimilor (se


pot consulta eventual manualele de liceu sau §1 din [1]).
Reamintim notaţiile standard:
∈ - apartenenţa (unui element la o mulţime),
∉ - nonapartenenţa (unui element la o mulţime),
= - egalitatea (fie a două elemente, fie a două mulţimi)
≠ - contrara situaţiei precedente
⊂ , ⊃ - incluziunea unei mulţimi în alta
⊄ - nonincluziunea
∅ - mulţime vidă,
Π(M) – mulţimea părţilor unei mulţimi,
∪ - reuniunea a două mulţimi,

U - reuniunea unei familii de mulţimi


i∈I
∩ - intersecţia a două mulţimi,

I - intersecţia unei familii de mulţimi


i∈I
\ - diferenţa a două mulţimi,
CM(A) – complementara mulţimii A∈Π(M) în M,
∆ - diferenţa simetrică a două mulţimi,
card M sau |M|- cardinalul unei mulţimi finite (adică numărul de
elemente din mulţime)
× - produsul cartezian a două mulţimi.

Partiţia unei mulţimi. Se numeşte partiţie a mulţimii nevide A orice familie


{A i }i∈I (I fiind o familie oarecare de indici) de părţi nevide ale mulţimii A cu

proprietăţile:
a) Ai ∩ Aj = ∅ , ∀i ≠ j , i,j ∈ I , b) A = U Ai .
i ∈I

Familia de părţi nevide {A i }i∈I care acoperă A (adică satisface b)) este o partiţie

a mulţimii A dacă fiecare element al mulţimii A aparţine cel mult unei părţi din
această familie.

Exemplul 1. 1B. În avifauna ţării noastre, păsările din familiile Ardeidae,


Ciconiidae şi Threskiornitidae dau o partiţie a mulţimii păsărilor ordinului
Ciconiiformes.
2°. Culturile C1, C2,..., Cn realizate de o exploatare agricolă vor conduce la o
partiţie a terenului acestei exploatări.

Exerciţiul 1. Daţi exemple concrete de mulţimi şi partiţii ale unor mulţimi care
apar în activitatea dumneavoastră. Exemplificaţi fiecare dintre noţiunile amintite
mai sus.
Răspuns ………………………………………………………………………………………………..................…..

…………………………………………………………………………………
…………………………………………………………………………………
…………………………………………………………………………………
…………………………………………………………………………………

§2. RELAŢII BINARE

Între perechile de elemente ale unei populaţii se stabilesc diverse relaţii.


Modelul matematic general al acestora este noţiunea de relaţie binară. Printre
relaţiile binare pe o mulţime se disting relaţiile de echivalenţă (care apar
implicit în orice activitate de clasificare) şi relaţiile de ordine (care se implică

2
în orice activitate de ierarhizare). Ambele tipuri de relaţii sunt implicit utilizate
în taxonomia filogenetică.

Definiţia 1. 1º. Se numeşte relaţie binară între mulţimile A şi B orice triplet


(ordonat) R = (A, B, G) unde G ⊂ A × B.

Denumiri. A = domeniul relaţiei R


B = codomeniul relaţiei R
G = graficul relaţiei R,
DR = {x ∈ A | ∃ y ∈ B astfel încât (x, y) ∈ G} =domeniul strict al relaţiei
binare R,
Im R = {y ∈ B | ∃ x ∈ A astfel încât (x, y) ∈ G} = imaginea relaţiei binare R.

Notaţii. a) Dacă (x, y) ∈ G scriem : x R y.


b) Dacă A = B scriem R = (A, G) în loc de R = (A, A, G) ; în acest caz spunem
că este dată o relaţie între elementele mulţimii A sau o relaţie binară pe A.

Exerciţiul 2. a) Daţi definiţiile operaţiilor uzuale cu relaţii binare: reuniunea,


intersecţia. b) Definiţi relaţia de incluziune între două relaţii. c) Daţi definiţia
inversei unei relaţii. d) Definiţi operaţia de compunere a două relaţii binare.
Verificaţi-vă pe baza definiţiilor din [1] pag. 20.

Definiţia 2. Relaţia binară R = (A, G) se numeşte:


a) reflexivă dacă (x,x) ∈ G oricare ar fi x ∈ A (adică ∆ A ⊂ R),
b) simetrică dacă din (x, y) ∈ G rezultă (y, x) ∈ G (adică R = R -1),
c) tranzitivă dacă din (x, y) ∈ G şi (y, z) ∈ G rezultă (x, z) ∈ G(adică R o R
⊂ R),
-1
d) antisimetrică dacă ((x, y) ∈ G şi (y, x) ∈ G) ⇒ (x = y) (adică R ∩ R
⊂ ∆ A ).
Exerciţiul 3. Precizaţi, pentru fiecare dintre relaţiile următoare, care dintre
proprietăţile a), b), c), d) sunt satisfăcute:
1°. R=(A,G) cu A={1, 2, 3, 4, 5, 6}, G={(1, 1), (3, 3), (5, 5), (6, 6)},
2°. R=(A,G) cu A={1, 2, 3, 4, 5, 6}, G={(1, 3), (3, 1), (3, 4), (4, 3), (5, 6), (6, 5)},
3°. R=(A,G) cu A={1, 2, 3, 4, 5, 6}, G={(1, 2), (1, 3), (1, 5), (1, 6), (2, 3),
(2, 5), (2, 6), (3, 3), (3, 5), (3, 6), (5, 3), (5, 5), (5, 6), (6, 3), (6, 5), (6, 6)},
4°. R=(A,G) cu A={1, 2, 3, 4, 5, 6}, G={(1, 2), (3, 4), (5, 6)}.
1°...a)......,..b)...... ,..c)......,.d)......(marcaţi căsuţele corespunzătoare răspunsurilor)
3
2°....a)......,..b)......,..c)......,.d).....
3°....a)......,..b)......,..c)......,.d).....

4°....a)......,..b)......,..c)......,.d)......

Definiţia 3. Orice relaţie R = (A, G) care este reflexivă, simetrică şi tranzitivă


se numeşte relaţie de echivalenţă pe A.

Exemplul 2. Pe mulţimea P a tuturor păsărilor dintr-un ecosistem E se pot


defini (verificaţi!) următoarele relaţii de echivalenţă :
1) aR1 b dacă şi numai dacă a şi b au acelaşi sex,
2) aR2 b dacă şi numai dacă a şi b aparţin aceleiaşi specii.
MASC este clasa de echivalenţă a păsărilor de sex masculin şi FEM - clasa de
echivalenţă a păsărilor de sex feminin, deci A/R1={MASC, FEM}.
A/R2 este formată din mulţimea speciilor de păsări din ecosistem.

Definiţia 4. O relaţie R = (A, G) care este reflexivă şi tranzitivă se numeşte


relaţie de preordine pe A. Orice relaţie R = (A, G) care este reflexivă,
antisimetrică şi tranzitivă se numeşte relaţie de ordine pe A; orice mulţime
dotată cu o relaţie de ordine se numeşte mulţime ordonată.

Exerciţiul 4. Verificaţi că relaţia binară R = (A, G), unde A={1, 2, 3, 4, 5} şi


G={(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (1, 2), (1, 3) (1, 4), (1, 5), (2, 3), (2, 4),
(2, 5), (3, 2), (4, 5)} este o relaţie de preordine pe A. Folosiţi eventual
reprezentarea grafică a relaţiei R. Apoi, verificaţi că relaţia binară R = (A, G),
unde A={1, 2, 3, 4, 5} şi G={(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (1, 2), (1, 3), (1,
4), (1, 5), (2, 3), (2, 4), (2, 5), (4, 5)} este o relaţie de ordine pe A.

6
.......................................................
.......................................................
5 .......................................................
.......................................................
4
.......................................................
3 .......................................................
.......................................................
2 .......................................................
1 .......................................................
.......................................................
0 ......................................................
0 1 2 3 4 5 6

4
§3. FUNCŢII
Definiţia 5. Se numeşte funcţie orice triplet ordonat (A, B, f) format din
mulţimile A, B şi legea de corespondenţă (sau corespondenţa) f care asociază
fiecărui element x ∈A un singur element (şi numai unul) y ∈ B numit imaginea
lui x prin corespondenţa f şi notat cu f(x); A se numeşte domeniul funcţiei, iar
B se numeşte codomeniul funcţiei.
Pentru funcţia din definiţia de mai sus se folosesc de obicei notaţiile
mai comode
f
f :A→B A
→ B
sau - atunci când domeniul şi codomeniul sunt cunoscute - se foloseşte doar
simbolul f.

1. Moduri de a defini o funcţie

Se disting următoarele două moduri de a defini o funcţie :


a) sintetic, b) analitic.
a) Funcţii definite sintetic. Fie f : A → B având ca domeniu mulţimea finită A
= { a1, a2,..., an } . Spunem că f este definită sintetic dacă se precizează direct
imaginea fiecărui element din domeniu. Acest lucru se realizează de obicei prin
tabele de tipul următor:

x a1 a2 ... an

f(x) b1 b1 ... bn

Astfel de funcţii se evidenţiază în orice experiment în care se determină


valorile numerice ale unei caracteristici cantitative.
b) Funcţii definite analitic. Sunt funcţii f : A → B pentru care legea de
corespondenţă se defineşte cu ajutorul unei proprietăţi (relaţii) care leagă un
element oarecare (generic) din domeniu cu imaginea sa. Concret, aceasta este
echivalent cu a da ecuaţia graficului funcţiei. De exemplu, funcţia f cu domeniul
¡, codomeniul ¡ şi care reflectă directa proporţionalitate dintre element şi
imaginea sa de coeficient (rată) de proporţionalitate ½, este de fapt funcţia :
f : ¡ → ¡, f ( x) = 2x, ∀x ∈ ¡.

Exerciţiul 5. Definiţi câteva funcţii elementare. Controlaţi-vă pe baza manua-


lelor de liceu!

5
Exerciţiul 6. Daţi definiţiile pentru: funcţia identitate, funcţia constantă şi funcţia
caracteristică a unei mulţimi. Pentru control consultaţi [1] pag. 31.

Pentru funcţia (X, Y, f) şi părţile nevide A ⊂ X şi B ⊂ Y se definesc


mulţimile

f(A) = {f(x) | ∀x ∈ A} f −1 (B) = {x ∈ X | f(x) ∈ B} ;

f(A) se numeşte imaginea mulţimii A prin f, iar f -1(B) se numeşte contraima-


ginea prin f a mulţimii B. Mulţimea Im f = f(X) se numeşte imaginea funcţiei f.
Dacă B = {b} atunci notăm f -1({b}) cu f -1
(b) ; deci f -1
(b) = {x ∈ A | f(x) =
-1
b}, adică f (b) este mulţimea tuturor soluţiilor ecuaţiei f(x) = b.

Exemplul 3. Se consideră o populaţie dialelică P cu familia de alele {a, A}; fie G


= {aa, aA, AA} mulţimea genotipurilor acestei populaţii. Fiecare individ din P
are un anumit genotip. Definim funcţia (P, G, f) prin care se asociază fiecărui
individ din P genotipul propriu. Dacă PH ⊂ P este submulţimea homozigoţilor,
atunci f(PH) = {aa, AA}. În plus, f-1(aA) este submulţimea heterozigoţilor din P.
Precizaţi submulţimile f-1({aa }), f-1({AA}), f-1({aa, AA}).

Exerciţiul 7. Definiţi noţiunile: funcţie injectivă, surjectivă, bijectivă ([1] pag.


32). Daţi exemple de fiecare fel. Folosiţi pentru exemplificare şi funcţiile din
Exemplele 3 şi 4.

2. Procedee de introducere a funcţiilor în cercetarea


din Biologie
Dintre procedeele de introducere a funcţiilor în Biologie prezentăm:
a) ajustarea prin funcţii polinomiale,
b) construcţia de polinoame de interpolare.

a) Ajustarea prin funcţii polinomiale.


Fie Pi(ti, ni), i = 1, 2, ..., m punctele corespunzătoare la m determinări
dintr-o experienţă. Ne propunem să determinăm o funcţie dintr-o clasă aleasă,
având ecuaţia graficului y = f(x) şi cu proprietatea că suma pătratelor abaterilor
dintre ordonatele ni ale punctelor Pi(ti, ni) şi ordonatele f(ti) ale punctelor
curbei să fie minimă. Procedeul de determinare a unei astfel de funcţii, având
la bază condiţia de minimizare a sumei pătratelor abaterilor, este cunoscut sub
numele de metoda celor mai mici pătrate (şi este datorată lui K. F. Gauss).
6
Ne propunem să determinăm funcţia (polinomială) liniară f : ¡ → ¡, f(t)
= at + b (adică să determinăm numerele reale a şi b) astfel încât
m
h(a, b) = ∑ (n - a t - b )
i =1
i i
2
să fie minimă.

Se demonstrează că dacă utilizăm notaţiile:


1 m 1 m 1 m 2
M ( t ) = ∑ t i , M (n ) = ∑ n i , M ( t 2 ) = ∑ ti ,
m i =1 m i =1 m i =1
1 m
D 2 (t ) = M(t 2 ) − [M(t )]2 , M(t ⋅ n ) = ∑ t n , S(t, n)=M(t·n)-M(t)M(n)
m i =1 i i
funcţia căutată corespunde valorilor
S( t , n )
(1) a0 = , b0 = M(n) – a0 M(t).
D 2 (t )

Pentru aplicaţiile concrete este utilă remarca


D2(t-a)=D2(t), S(t-a, n-b)= S(t, n), ∀a, b ∈¡.
În particular, dacă a=M(t) atunci M(t-a)=0, S(t, n)= S(t-a, n)=M((t-a)·n)) iar
coeficienţii de ajustare devin
S( t − a , n )
a0 = , bo = M(n).
D 2 (t − a)

Deci funcţia liniară f : ¡ → ¡, f(t) = aot + bo este funcţia căutată. Această func-
ţie se numeşte funcţie liniară de ajustare a datelor sau ajustare liniară a date-
lor.

Exemplul 4. În 1923, E.Dudich a măsurat lungimea totală y şi lungimea x a


mandibulei pentru coleopterul Cyclommatus tarandus şi a obţinut datele urmă-
toare :

lungimea totală y 20,4 33,1 38,4 47,3 54,2 66,1 74,0

lungimea mandibulei x 3,9 10,7 14,1 19,9 24,0 30,7 34,5


Pe baza acestor date vom obţine funcţia de ajustare liniară f(x)=a0x +b0.
Construim tabelul următor:
xi yi xiyi xi2
3,9 20,4 79,56 15,21
10,7 33,1 354,17 114,49
14,1 38,4 541,44 198,81
19,9 47,3 941,27 396,01
24,0 54,2 1300,8 576,00

7
30,7 66,1 2029,27 942,49
34,5 74,0 2553,00 1190,25
Σxi=137,8 Σyi=333,5 Σxiyi=7799,51 3433,26
M(x)=19,68571 M(y)=47,64286 M(xy)=1114,216 M(x2)=490,4657

Folosind formulele (1) rezultă


f(x)=1,712987x+13,92149.
După rotunjiri la două zecimale obţinem
f(x)=1,71x+13,92.
Pentru a stabili cât de bună este această ajustare considerăm tabelul
yi y i =1,71xi+13,92 yi − yi ( y i − y i )2

20,4 20,589 -0,189 0,035721


33,1 32,217 0,883 0,779689
38,4 38,031 0,369 0,136161
47,3 47,949 -0,649 0,421201
54,2 54,96 -0,760 0,577600
66,1 66,417 -0,317 0,100489
74,0 72,915 1,085 1,177225
h(a0,b0)= 3,228086

Deci min h(a, b) = h(a0, b0) ≅ 3,228086.


În locul funcţiilor de ajustare liniară se pot folosi funcţii de ajustare
polinomiale de grad ≥2; astfel de ajustări se numesc generic ajustări parabo-
lice. În particular, ajustarea parabolică de gradul doi se face printr-o funcţie de
forma f : ¡ → ¡, f(t) = a2t2 + a1t + ao pentru care coeficienţii formează soluţia
unică a sistemului:

 m m m

ma 0 + a 1 t i + a 2 t i2 =

∑ ∑ ni
i =1 i =1 i =1
 m m m m

∑ ∑ 2
a 0 t i + a 1 t i + a 2 t i = ∑ 3
∑ tini .
 i =1 i =1 i =1 i =1
 m m m m
a
 0 ∑ t 2
i
+ a 1 ∑ t 3
i
+ a 2 ∑ t 4
i
= ∑ t i2 n i
 i =1 i =1 i =1 i =1

Aceste formule sunt consecinţa cerinţei ca


8
m
h(a 0 , a1 , a 2 ) = ∑ ( ni - a 2 t i2 - a 1 t i − a 0 )2 = minimă
i=1

Exemplul 5. Vom ajusta parabolic datele din Exemplul 4. Se obţine tabelul


xi yi xiyi xi2 xi3 xi4 xi2yi
3,9 20,4 79,56 15,21 59,319 231,3441 310,284
10,7 33,1 354,17 114,49 1225,043 13107,96 3789,619
14,1 38,4 541,44 198,81 2803,221 39525,42 7634,304
19,9 47,3 941,27 396,01 7880,599 156823,9 18731,27
24,0 54,2 1300,8 576,00 13824,00 331776,0 31219,2
30,7 66,1 2029,27 942,49 28,934,44 888287,4 62298,59
34,5 74,0 2553,00 1190,25 41063,63 1416695,0 88078,5
3 4
Σxi= Σ y i= Σxiyi= 3433,26 Σxi = Σxi = Σxi2yi=
=137,8 =333,5 =7799,51 =95790,25 =2846447 =212061,8
2 3 4
M(x)= M(y)= M(xy)= M(x )= M(x )= M(x )= M(x2y)=
19,68571 47,64286 1114,216 =490,4657 =13684,3214 =406635,2857 =30294,5428

Coeficienţii căutaţi sunt componentele soluţiei sistemului:

7a + 137,8a + 3433,26a = 333,5


 0 1 2
137,8a 0 + 3433,26a 1 + 95790,25a 2 = 7799,51 .
3433,26a + 95790,25a + 2846447,103a = 212061,769
 0 1 2

Se obţine funcţia de ajustare f(x) = 0,0304x2 + 1,5939x +14,7733. Valorile


ajustate y i = 0,0304ti2 + 1,5939ti +14,7733 şi abaterile de la valorile măsurate

sunt prezentate în tabelul de mai jos:

yi yi yi − yi ( y i − y i )2
20,4 21,0359 -0,6359 0,4044
33,1 32,1767 0,9233 0,8525
38,4 37,8525 0,5475 0,2998
47,3 47,6971 -0,3971 0,1577
54,2 54,7797 -0,5797 0,3361
66,1 66,5738 -0,4738 0,2245
74,0 73,3843 0,6157 0,3791
2,6540

Valoarea minimă a funcţiei h(a0, a1, a2) este ≈h(14,7733; 1,5939;


0,00304)≈2,6540 şi este mai mică decât valoarea minimă 3,2281 corespunzătoare
ajustării liniare. Prin urmare este firesc să utilizăm ajustarea parabolică.

b) Construcţia de polinoame de interpolare.


9
Problemă: să se determine un polinom cu proprietatea că graficul său
trece prin m+1 puncte Pi(ti, xi), i = 0, 1, 2,..., m.
Se demonstrează că există un singur polinom de gradul m cu această proprietate.
Polinomul
m
(t - t o )(t - t1)...(t - t i -1)(t - t i +1)...(t - t m )
L( t o , t1 ,..., t m ; t) = ∑ ⋅ xi .
i = o ( t i - t o )( t i - t1)...( t i - t i -1)( t i - t i +1 )...( t i - t m )

este soluţie a acestei probleme; el este cunoscut sub numele de polinomul de


interpolare Lagrange .
Exemplul 6 . Să determinăm polinomul de grad minim al cărui grafic trece
prin punctele Po(0,1), P1(1,1), P2(2,-1), P3(4,1) precum şi valoarea lui în t = 3.
Polinomul Lagrange corespunzător este

(t − 1)(t − 2)(t − 4) (t − 0)(t − 2)(t − 4) (t − 0)(t − 1)(t − 4)


L(0, 1, 2 , 4; t ) = ⋅1+ ⋅1 + ⋅ ( −1) +
− 1( −2)(−4) (1 − 0)(1 − 2)(1 − 4) ( 2 − 0)(2 − 1)(2 − 4)
(t − 0)(t − 1)(t − 2) 1 1 1
+ ⋅ 1 = − ⋅ (t − 1)(t − 2)(t − 4) + ⋅ t(t − 2)(t − 4) + t(t − 1)(t − 4) +
(4 − 0)(4 − 1)(4 − 2) 8 3 4
1 1 5
+ t(t − 1)(t − 2) = t 3 − t 2 + 2t + 1 .
24 2 2

Evident, putem acum calcula L(0, 1, 2, 4; 3)= -2. Se putea calcula valoarea în
t=3 şi direct (adică fără să determinăm polinomul de interpolare) şi anume:
( 3 − 1)(3 − 2)(3 − 4) ( 3 − 0)(3 − 2)(3 − 4) ( 3 − 0)(3 − 1)(3 − 4)
L(0, 1, 2 , 4; 3) = ⋅1 + ⋅1+ ⋅ ( −1) +
− 1( −2)(−4) (1 − 0)(1 − 2)(1 − 4) ( 2 − 0)(2 − 1)(2 − 4)
( 3 − 0)(3 − 1)(3 − 2)
+ ⋅ 1 = −2
(4 − 0)(4 − 1)(4 − 2)

Exerciţiul 8. Datele din Exemplul 3 conduc la considerarea punctelor P0(3,9;


20,4), P1(10,7; 33,1), P2(14,1; 38,4), P3(19,9; 47,3), P4(24, 54,2), P5(30,7; 66,1),
P6(34,5; 74). Determinaţi polinomul de interpolare Lagrange corespunzător
acestor date şi apoi calculaţi valoarea acestuia în x=15,3 şi în x=29,9. Calculaţi
apoi aceleaşi valori direct.

În cazul în care momentele to, t1,...,tm sunt echidistante polinomul de


interpolare capătă forma mai simplă de mai jos, cunoscută şi sub numele de
polinomul de interpolare al lui Newton :
∆x 0 ∆k x 0 ∆m x 0
Pm (t 0 + θh ) = x 0 + θ + ... + θ(θ − 1)...(θ − k + 1)... + θ(θ − 1)...(θ − m + 1)
1! k! m!

t - to
unde: h = ti - ti-1, θ = şi ∆x i = x i +1 − x i , ∆k +1 x i = ∆k x i +1 − ∆k x i .
h

10
Cantităţile ∆k x i , k = 1,2,... se numesc diferenţe finite progresive; se pot defini
şi diferenţe finite regresive şi diferenţe centrale şi câte un polinom de
interpolare Newton corespunzător.

Exemplul 7. Să determinăm polinomul de grad minim al cărui grafic


trece prin punctele punctele Po(0,1), P1(1,1), P2(2,-1), P3(3,1), după care vom
determina valoarea lui în t = 1,3. Vom determina mai întâi diferenţele finite
progresive care apar. Calculul lor se organizează sub forma tabelului următor:
xi ∆ xi ∆2 xi ∆3 xi
1 0 -2 6
1 -2 4
-1 2
1
Ţinând cont că h = 1, to = 0, θ = t, polinomul de interpolare Newton este
P(t ) = 1 − t (t − 1) + t(t − 1)(t − 2) sau P(t ) = t 3 − 4t 2 + 3t + 1 .

Prin înlocuire în polinom obţinem: P(1,3) = 0,337.


Se putea calcula direct această valoare punând θ=1,3 în formula lui Newton; se
obţine P(1,3) =1- 1,3.0,3- 1,3.0,3.0,7 =1 – 0,39 – 0,273 = 0,337.
Rezolvaţi această problemă şi folosind formula lui Lagrange!

Exerciţiul 9. Să se determine polinomul de grad minim al cărui grafic trece


prin punctele P0(-2, 3), P1(-1, 5), P2(0, -1), P3(1, 2), P4(2, -1). Folosiţi ambele
formule de interpolare. Comparaţi volumele de muncă necesare. Calculaţi apoi
valorile polinomului în t =1,27 cu două şi cu patru zecimale. Comentaţi
rezultatele!

§4. Frecvenţe
Fie f : Ω → Ω ' o funcţie surjectivă pentru care Ω = {ω1 , ω 2 ,..., ω n } şi
Ω’={x1, x2,…, xm} (cu m ≤ n ).

Frecvenţa absolută a valorii x∈Ω’=Im f este numărul fa(x) de elemente


din Ω în care funcţia ia valoarea x, iar frecvenţa relativă fr(x) a valorii x este
raportul dintre frecvenţa sa absolută şi numărul de elemente din domeniul
funcţiei. Numărul 100.fr(x) este procentul de elemente din domeniu în care
funcţia ia valoarea x.
11
De exemplu, pentru funcţia din Exemplul 3, frecvenţa absolută a valorii AA este
numărul de indivizi din populaţie care sunt homozigoţi dominanţi; frecvenţa
relativă a valorii AA este proporţia de indivizi homozigoţi dominanţi din
populaţie.
Vom nota cu ni frecvenţa absolută a valorii xi (i=1, 2, ..., m) şi cu fi
frecvenţa relativă a valorii xi (i=1, 2, ..., m). Evident, suma tuturor frecvenţelor
absolute ale valorilor funcţiei f este n, iar suma tuturor frecvenţelor relative ale
valorilor funcţiei f este 1, adică
n 1 + n 2 + ... + n m = n, f 1 + f 2 + ... + f m = 1 .

Se asociază funcţiei f tabelul

x1 x2 ... xm

n1 n2 . . . ........ nm
~ ~
care defineşte (sintetic) o nouă funcţie f : Ω’→ ¡. Funcţia f se va numi şi
repartiţia frecvenţelor absolute ale valorilor funcţiei f. De asemenea îi putem
asocia funcţia f : Ω ' → ¡ care asociază fiecărei valori xi ∈ Ω ' numărul fi
(adică frecvenţa relativă a valorii xi). Funcţia f se va numi şi repartiţia
frecvenţelor relative ale valorilor funcţiei f.

Exerciţiul 10. Definiţi histograma în batoane. Controlaţi-vă pe baza manua-


lului [1] pag.46.
...............................................................................................................................
...............................................................................................................................
Putem asocia funcţiei f cu domeniul de definiţie finit funcţiile gs, gd,
g s , g d : ¡ → ¡ definite prin:
• gs(x) este suma tuturor frecvenţelor absolute corespunzătoare valorilor ≤x şi
se numeşte frecvenţa absolută cumulată crescătoare a valorii x
• g s ( x ) este suma tuturor frecvenţelor relative corespunzătoare valorilor ≤x

şi se numeşte frecvenţa relativă cumulată crescătoare a valorii x


• gd(x) este suma tuturor frecvenţelor absolute corespunzătoare valorilor ≥x
şi se numeşte frecvenţa absolută cumulată descrescătoare a valorii x
• g d ( x) este suma tuturor frecvenţelor relative corespunzătoare valorilor ≥x

şi se numeşte frecvenţa relativă cumulată descrescătoare a valorii x.


Funcţia g s se numeşte funcţia de repartiţie a funcţiei f şi se notează în
mod obişnuit cu F.
12
Exemplul 7. Pentru a aprecia starea generală a animalelor pe care le are
un mic fermier a cântărit fiecare din cele 40 oi pe care le are şi a obţinut datele din
Tabelul 1. Acest tabel se poate interpreta ca fiind o funcţie f definită sintetic cu
domeniul de definiţie mulţimea celor 40 de oi (identificată pentru comoditatea
prezentării cu mulţimea {1, 2, ... ,40 }), codomeniul mulţimea numerelor reale
şi legea de corespondenţă cea care asociază fiecărei oi masa sa.
Tabelul 1
Nr. crt. Masă Nr.crt. Nr. crt. Nr. crt.
Masă Masă Masă

1. 37 11. 39 21. 40 31. 36


2. 36 12. 41 22. 39 32. 38
3. 37 13. 41 23. 38 33. 38
4. 31 14. 39 24. 37 34. 32
5. 35 15. 35 25. 35 35. 37
6. 33 16. 37 26. 33 36. 35
7. 32 17. 32 27. 31 37. 34
8. 34 18. 34 28. 36 38. 33
9. 33 19. 36 29. 40 39. 35
10. 40 20. 38 30. 39 40. 39

Frecvenţele absolute şi cele relative ale valorilor acestei funcţii sunt date
în Tabelul 2.
Tabelul 2
Masă Frecvenţa absolută Frecvenţe relative
xi ni fi
31 2 0,050
32 3 0,075
33 4 0,100
34 3 0,075
35 5 0,125
36 4 0,100
37 5 0,125
38 4 0,100
39 5 0,125
40 3 0,075
41 2 0,050
Total 40 1,00

În construcţia Tabelului 2 s-a ţinut cont că fmin = 31 şi fmax = 41 .Din Tabelul 2


se constată că 5 oi au greutatea 37 Kg., adică frecvenţa absolută a valorii 37
este 5; frecvenţa relativă a valorii 37 este 5/40=0,125. Determinarea funcţiilor
13
asociate gs, gd, g s , g d (şi, în particular, a funcţiei de repartiţie F) funcţiei f este
realizată în Tabelul 3 .
Tabelul 3
Masă Frecvenţa Frecvenţa g s ( xi ) F( xi ) = ~
g s ( xi ) g d ( xi ) ~
g d ( xi )
xi absolută relativă
ni fi
31 2 0,050 2 0,050 40 1,000
32 3 0,075 5 0,125 38 0,950
33 4 0,100 9 0,225 35 0,875
34 3 0,075 12 0,300 31 0,775
35 5 0,125 17 0,425 28 0,700
36 4 0,100 21 0,525 23 0,575
37 5 0,125 26 0,650 19 0,475
38 4 0,100 30 0,750 14 0,350
39 5 0,125 35 0,875 10 0,250
40 3 0,075 38 0,950 5 0,125
41 2 0,050 40 1,000 2 0,050

Din Tabelul 3 se vede, de exemplu, că


- există 21 oi cu greutatea de cel mult 36 kg,
- există 23 oi cu greutatea de cel puţin 36 kg.
Pe baza legăturii dintre frecvenţele relative şi procente se vede că 12,5% dintre
oi au cel mult 37 kg şi că 70% oi au cel puţin 35 kg.

Exerciţiul 11. Dintr-o plantaţie de flori de mac s-au ales 40 de flori la care s-a
determinat numărul stigmatelor. Datele obţinute sunt înregistrate în tabelul
următor:
Numărul stigmatelor xi 7 8 9 10 11
Frecvenţele absolute ni 6 18 8 6 2
~
Identificaţi funcţiile f, f , f , g s , g s , g d , g d şi determinaţi frecvenţele absolute şi

relative simple şi cumulate. Completaţi tabelul următor. Desenaţi apoi histogra-


mele corespunzătoare şi uniţi extremităţile batoanelor prin segmente de dreaptă.
Citiţi apoi câte un rezultat din fiecare coloană şi precizaţi ce reprezintă.

xi ni fi gs gs gd gd
7 6
8 18
9 8

14
10 6
11 2

§5. Caracteristici numerice ale mulţimii valorilor


unei funcţii reale
Pentru orice funcţie reală cu domeniul finit se pun următoarele probleme:
a) există sau nu un număr real în jurul căruia să se grupeze majoritatea valorilor
funcţiei,
b) cât de împrăştiate sunt valorile funcţiei pe axa reală.
Corespunzător acestor probleme distingem două tipuri de caracteristici :
a) caracteristici numerice de poziţie
b) caracteristici numerice de împrăştiere.

a) Caracteristici numerice de poziţie


Printre caracteristicile numerice de poziţie distingem: media, mediana,
valoarea modală, momentele simple şi centrate.

1°. Media valorilor unei funcţii


Media M(f) a valorilor unei funcţii reale f, cu domeniul finit, este media arit-
metică a tuturor valorilor ei, adică
(1) [
M(f ) = 1 f (ω1 ) + f (ω 2 ) + ... + f (ω n )
n
].
Dacă f: Ω → ¡ cu |Ω| = n are m<n valori distincte x1, x2, ..., xm cu frecvenţele
relative f1, f2,...,fm media sa, notată cu M(f), se calculează cu ajutorul formulei
m
(2) M (f ) = ∑ xifi .
i =1

Exemplul 9. Pe baza datelor din Exemplul 8 media M(f) este egală, conform
formulei (2) şi utilizând datele din Tabelul 1, cu:
M(f ) = 31 ⋅ 0,050 + 32 ⋅ 0,075 + 33 ⋅ 0,100 + 34 ⋅ 0,075 + 35 ⋅ 0,125 + +36 ⋅ 0,100 +
+ 37 ⋅ 0,125 + 38 ⋅ 0,100 + 39 ⋅ 0,125 + 40 ⋅ 0.075 + 41 ⋅ 0,050 = 36,125

Exerciţiul 12. Calculaţi media funcţiei din Exerciţiul 11.


M(f)= ....................................................................................................................

În cazul în care majoritatea frecvenţelor absolute sunt egale cu 1 calculul mediei


se face direct pe baza definiţiei; în acest caz frecvenţele relative îşi pierd din
importanţă.

15
Proprietăţile mediei
.1. M(a)=a, pentru orice funcţie constantă a
2. min f (ω) ≤ M(f ) ≤ max f (ω)
ω∈Ω ω∈Ω
3. M(af)=aM(f), ∀a∈¡, ∀f: Ω → ¡
4. M(f+g)=M(f)+M)g), ∀f, g: Ω → ¡
5. | M(f ⋅ g ) |≤ M(f 2 ) ⋅ M(g 2 ) , ∀f, g: Ω → ¡.

6. M(a 1 f 1 + a 2 f 2 + ... + a k f k ) = a 1 M(f 1 ) + a 2 M(f 2 ) + ... + a k M(f k )


∀ a1, a2, ... , ak ∈ ú şi ∀ f1, f2,..., fk : Ω → ú.

Calculul mediei
În multe situaţii calculul mediei şi mai ales al momentelor de ordin
superior implică utilizarea unor numere mari, fapt care îngreunează calculele.
O soluţie importantă pentru evitarea acestei situaţii este metoda „zeroului fals”
pe care o prezentăm în cele ce urmează.

Metoda zeroului fals


- se alege o valoare xo ∈ ¡ cât mai aproape de valoarea medie (în cazu-
rile concrete, se cunoaşte de obicei o zonă în care se află valoarea medie reală)
- se construieşte funcţia θxo (f) = f - xo (care ia valori grupate în jurul lui 0)

- se ţine cont de egalitatea evidentă M( θxo (f)) = M(f) - x o .

Exemplul 10. Vom determina folosind metoda zeroului fals media funcţiei din
Exemplul 8. Deşi numerele care se folosesc nu sunt atât de mari încât să
justifice utilizarea metodei zeroului fals vom calcula media şi folosind abaterile
funcţiei f de la valoarea xo = 35, adică folosind funcţia θ 35(f) = f – 35.
Calculele se prezintă în Tabelul 4.
Tabelul 4
Masă Abateri Frecvenţe relative
xi xi - 35 fi (xi - xo)·fi
31 -4 0,050 -0,200
32 -3 0,075 -0,225
33 -2 0,100 -0,200
34 -1 0,075 -0,075

16
35 0 0,125 0,000
36 1 0,100 0,100
37 2 0,125 0,250
38 3 0,100 0,300
39 4 0,125 0,500
40 5 0,075 0,375
41 6 0,050 0,300

M( θ 35) = 1,125

Din egalitatea M( θ 35(f)) = M(f) - 35 rezultă M(f) = 35 + 1,125 = 36,125,


adică se regăseşte valoarea calculată direct mai sus. Este de remarcat faptul că şi în
acest caz, simplu de tratat direct, se obţine mult mai uşor valoarea mediei prin
utilizarea abaterilor de la o valoare deoarece, în afara faptului că se lucrează cu
numere mult mai mici, apare şi avantajul compensării unor valori negative cu
unele pozitive.
Pentru funcţia din Exemplul 11 se calculează M(θ7(f))=1,05, deci M(f)
= 7+1,05 = 8,05; se regăseşte rezultatul obţinut utilizând fie definiţia fie formula
de calcul.

Funcţia θxo (f ) se numeşte abaterea funcţiei f de la valoarea xo. Dacă xo

= M(f) notăm θ(f ) în loc de θxo (f ) şi o numim abaterea de la medie a funcţiei f.

Exerciţiul 12. Verificaţi că M(θ(f)) = 0 pentru orice funcţie f.

2°. Mediana

Se numeşte mediana funcţiei f : Ω → ¡ numărul real µ = m f care satisface


simultan proprietăţile
1 1 1 1
⋅ {ω ∈ Ω | f( ω) ≤ µ } ≥ şi ⋅ {ω ∈ Ω | f( ω) ≥ µ } ≥ .
n 2 n 2
Deci mediana µ are proprietatea că valorile funcţiei ≤ µ sunt „aproape” la fel
de frecvente ca valorile funcţiei ≥ µ .
Exemplul 11. Dacă Ω = 7 şi f are valorile 1, 2, 2, 4, 4, 5, 6 atunci µ f = 4; într-

adevăr, există 5 numere ≤4 (adică primul raport este 5 ≥ 12 ) şi 4 numere ≥4


7

(adică al doilea raport este 4 ≥ 12 ). Se verifică uşor că alte valori numerice nu


7

satisfac condiţiile din definiţia medianei. În cazul Ω = 8 şi f are valorile 1, 2,

17
2, 3, 3, 4, 5, 5 atunci µ f = 3 iar dacă Ω = 8 şi f are valorile 1, 2, 2, 3, 4, 4, 4, 6

atunci µ f este orice număr cuprins între 3 şi 4.

Ca mediană µ f pentru funcţia din Exemplul 8 se poate lua orice număr


cuprins între 35 şi 36.

Într-adevăr, pe baza Tabelului 3, rezultă că mediana funcţiei este între 35 şi 36


deoarece în coloana gs a lui citim gs(35)=0,425 < 0,500 < 0,525 = gs(36). Se va
prefera valoarea µ f = 35,750 obţinută folosind o interpolare liniară şi anume

0,500 − 0,425
µ = 35 + = 35,75 .
0,525 − 0,425

Mediana este un estimator robust al valorii centrale pentru că, spre deosebire
de medie, este puţin sensibil la valorile extreme mari.

3°. Valoarea modală


Valoarea modală (sau, pe scurt, modulul sau moda) a funcţiei f: Ω → ¡ este acea
valoare care are frecvenţa maximă. De exemplu, pentru funcţiile din Exemplul
11, valorile modale sunt 2 şi 4 pentru prima funcţie, 2, 3 şi 5 pentru a doua funcţie
şi respectiv 4 pentru a treia funcţie. Deci primele funcţii sunt plurimodale, iar
ultima este unimodală. Pentru funcţia f din Exemplul 8 valorile 35, 37 şi 39 sunt
modale pentru că apar cu frecvenţa maximă 5; deci funcţia este plurimodală.

4°. Momente

Fie funcţia f: Ω → ¡ unde Ω = {ω1 , ω 2 ,..., ωn } şi k este un număr natural


(nenul) fixat. Se numeşte moment de ordinul k al funcţiei f numărul notat cu
Mk(f) definit prin:

Mk(f) = M(f k).

În particular M0(f)=1, şi M1(f) = M(f). Calculul momentelor de ordinul


k se face utilizând abaterile valorilor funcţiei faţă de valoarea xo folosită şi în
calculul valorii medii şi utilizând formula:
k

M k (f) = ∑ Cki M k -i (θxo (f)) xo .


i

i =o

În cazul în care xo = M(f), notăm mk = Mk(θ(f)) şi îl numim momentul


centrat de ordinul k. Din formula precedentă rezultă

18
k k

Mk (f) = ∑ Cki mk -i [M(f )]i şi mk = ∑ (-1 ) Cki M k -i (f){M(f)}i .


k

i =o i =o

Exerciţiul 13. Pe baza formulelor precedente stabiliţi formulele

M 2 (f ) = m 2 + [M(f )]2 , m 2 = M 2 (f ) − [M(f )]2 .

În acelaşi fel deduceţi că formulele de calcul pentru M3(f), M4(f), m3 şi m4 sunt


următoarele:

M 3 (f ) = M 3 (θ x (f )) + 3M 2 (θ x (f )) ⋅ x 0 + 3M(θ x (f )) ⋅ x 02 + x 03
0 0 0
M 4 (f ) = M 4 (θ x (f )) + 4M 3 (θ x (f )) ⋅ x 0 + 6M 2 (θ x (f )) ⋅ x 02 + 4M(θ x (f )) ⋅ x 03 + x 40
0 0 0 0

m 3 = M 3 (f ) − 3M 2 (f ) ⋅ M (f ) + 2[M(f )]3
m 4 = M 4 (f ) − 4M 3 (f ) ⋅ M(f ) + 6M 2 (f )[M(f )]2 − 3[M(f )]4

Exemplul 12. Să determinăm acum momentele de ordinul 2, 3 şi 4 ale funcţiei


f din Exemplul 8. Se construieşte tabelul următor în care se foloseşte notaţia yi
= xi - xo .
Tabelul 5
xi yi y i2 y i3 y i4 fi y i · fi y i 2 · fi y i 3 · fi y i 4 · fi
31 -4 16 -64 256 0,050 -0,200 0,800 -3,200 12,800
32 -3 9 -27 81 0,075 -0,225 0,675 -2,025 6,075
33 -2 4 -8 16 0,100 -0,200 0,400 -0,800 1,600
34 -1 1 -1 1 0,075 -0,075 0,075 -0,075 0,075
35 0 0 0 0 0,125 0,000 0,000 0,000 0,000
36 1 1 1 1 0,100 0,100 0,100 0,100 0,100
37 2 4 8 16 0,125 0,250 0,500 1,000 2,000
38 3 9 27 81 0,100 0,300 0,900 2,700 8,100
39 4 16 64 256 0,125 0,500 2,000 8,000 32,000
40 5 25 125 625 0,075 0,375 1,875 9,375 46,875
41 6 36 216 1296 0,050 0,300 1,800 10,800 64,800

M( θ 35(f))= M2( θ 35(f))= M3( θ 35(f))= M4( θ 35(f))=


=1,125 =9,125 =25,875 = 174,425

Se vor folosi formulele din Exerciţiul 13 şi rezultatele din Tabelul 5.


Rezultă că pentru funcţia cu care lucrăm momentele de ordinele 2, 3 şi 4 sunt
respectiv :

M2(f) = 9,125 + 2 × 1,125 × 35 + 352 = 1312,875,

M3(f) = 25,875 + 3 × 9,125 × 35 + 3 × 1,125 × 352 + 353 = 47993,375,

19
M4(f) = 174,425 + 4 × 25,875 × 35 + 6 × 9,125 × 352 + 4 × 1,125 × 353 + 354 = 1764428,175 .

Aplicaţie

Nu este totdeauna important să utilizăm valorile exacte ale unor măsurători.


Prelucrarea datelor trebuie făcută şi în acest caz. Vom ilustra modul de lucru pe
următorul exemplu.

Cei 2000 pui ai unui fermier au greutăţile din următorul tabel

Clase de greutăţi îm grame Număr pui

1800-2000 128

2000-2200 170

2200-2400 280

2400-2600 800

2600-2800 320

2800-3000 180

3000-3200 120

Pentru a asocia caracteristici numerice unui astfel de tabel, îi asociem funcţia


care ia ca valori valoarea medie a fiecărei clase, adică

Centrul clasei Număr pui

1900 128

2100 170

2300 280

2500 800

2700 320

2900 180

3100 120

S-a obţinut o funcţie pentru care se pot determina în mod obişnuit toate
caracteristicile numerice. Evident aceste valori sunt diferite de cele ale funcţiei
care ar asocia fiecărui pui greutatea sa în grame. Pentru a obţine valori mai
20
apropiate de valorile reale se folosesc corecţiile lui Sheepard. Corecţiile pentru
primele patru momente sunt

M' ( f ) = M ( f ) m' (f ) = m(f ) = 0


2 2
M '2 (f ) = M 2 (f ) + d m '2 (f ) = m 2 (f ) − d
12 12
' ( )= 2 ' ( )=
M3 f M 3 (f ) + d M (f ) m3 f m 3 (f )
4
2 4 2 4
M '4 (f ) = M 4 (f ) + d M 2 (f ) + d m '4 (f ) = m 4 (f ) − d m 2 (f ) + 7d
2 80 2 240

unde d este amplitudinea clasei (d=200 în exemplul de mai sus).


Propunem ca exerciţiu determinarea momentelor simple şi centrate de ordin ≤
4 pentru seria de determinări cu clase de valori de mai sus.

b) Caracteristici numerice de împrăştiere

Dintre caracteristicile numerice de împrăştiere distingem: amplitudinea, disper-


sia sau varianţa, cuartilele şi intervalul intercuartilic.

1°. Amplitudinea
Amplitudinea Af a funcţiei f este diferenţa dintre valoarea maximă şi cea
minimă ale funcţiei. Pentru funcţia din Exemplul 8 amplitudinea este
Af=41-31=10.

2°. Dispersia (varianţa)


Considerăm funcţia (caracterul) f : Ω → ¡ unde Ω = {ω1 , ω 2 ,..., ω n } .
Valorile ei pot fi mai mult sau mai puţin dispersate (depărtate unele de altele).
Împrăştierea valorilor funcţiei f se măsoară cu ajutorul unui parametru numit
dispersie sau varianţă.

Definiţia 6. Dispersia sau varianţa funcţiei f este numărul notat D2(f)


sau cu σ f2 sau cu V(f) definit prin:
def 1
2 2 2 2
D (f) = σf = M[(f - M(f) ) ] = V(f) adică: D (f) = ∑
n ω∈Ω
[f( ω) - M(f) ]2 .

Oricare ar fi funcţiile f, g : Ω → ¡ unde Ω = {ω1 , ω 2 ,..., ω n } au loc afirmaţiile


:

21
Proprietăţile dispersiei
1°. D2(f) ≥ 0, ∀ f ; D2(f) = 0 dacă şi numai dacă f este funcţie constantă

2°. D2(f) = M(f 2) - [ M(f) ] 2,


3°. D2(af) = a2D2(f), ∀ a ∈¡, ∀ f,
4°. D2(a + f) = D2(f), ∀ f şi oricare ar fi funcţia constantă a,
5°. D2(f + g) = D2(f) + D2(f), dacă şi numai dacă M(fg) = M(f) M(g) .

Cantitatea σ = σ f = D 2 (f ) , se numeşte abaterea pătratică (de la) medie şi se


măsoară cu aceeaşi unitate de măsură ca valorile funcţiei.

Exemplul 13. Pentru funcţia f din Exemplul 8 dispersia se calculează cu


ajutorul formulei 2° şi se obţine

D2(f)= m2(f) =1312,875-(36,125)2=7,859375.

Abaterea pătratică (de la) medie sau abaterea standard a funcţiei f este σf=2,8035.

3°. Cuartile
Prima cuartilă µ1(f)= µ1 se defineşte prin relaţiile:

1 1 1 3
⋅ {ω ∈ Ω | f( ω) ≤ µ 1 } ≥ şi ⋅ {ω ∈ Ω | f( ω) ≥ µ 1 } ≥
n 4 n 4

iar a treia cuartilă µ3(f)= µ3 se defineşte prin relaţiile:

1 3 1 1
⋅ {ω ∈ Ω | f( ω) ≤ µ 3 } ≥ şi ⋅ {ω ∈ Ω | f( ω) ≥ µ 3 } ≥ .
n 4 n 4
Evident, a doua cuartilă µ 2 definită prin analogie cu µ 1 şi µ 3 este chiar
mediana. Intervalul determinat de µ 1 şi µ 3 se numeşte interval intercuartilic, dar
prin abuz de limbaj şi diferenţa µ 3 - µ 1 se numeşte tot interval intercuartilic.

Exemplul 14. Dacă Ω = 7 şi f are valorile 1, 2, 2, 4, 4, 5, 6 atunci µ1=2, µ2=4,

µ3= 5. În general, dacă |Ω|=4p+3 şi f are valorile x1, x2,..., x4p+3 atunci µ1=xp+1,
µ2=x2p+2, µ3= x3p+3. În cazul Ω = 8 şi f are valorile 1, 2, 2, 3, 3, 4, 5, 5 atunci

µ1=2, µ2=3, µ3= 5 iar dacă Ω = 8 şi f are valorile 1, 2, 2, 3, 4, 4, 4, 6 atunci

µ1=2, µ2 este orice număr cuprins între 3 şi 4 iar µ3= 4.

Pentru funcţia din Exemplul 8 pag. 13, pe baza Tabelului 3 şi utilizând


interpolarea liniară, găsim µ1=33,250, µ2=35,750, µ3=38 (Verificaţi!).

22
Intervalul intercuartilic are lungimea µ3-µ1=4,750 şi reprezintă lungimea unui
interval care conţine jumătate din numărul valorilor funcţiei. El dă evident
informaţii asupra împrăştierii valorilor funcţiei.

Evident, cuartilele nu sunt neapărat unic definite dar sunt estimatori


robuşti în sensul că sunt mai puţin sensibili la prezenţa unor valori extreme
mari. Calculul cuartilelor se face uşor utilizând funcţia de repartiţie a funcţiei
(caracterului).
Diferenţa intercuartilică are de jucat faţă de abaterea pătratică medie acelaşi rol
pe care îl joacă mediana vis-à-vis de medie.

Inegalitatea lui Cebîşev. Fie f: Ω → ¡ cu Ω = {ω1 , ω 2 ,..., ω n } , x1,


x2,..., xm - valorile distincte ale funcţiei f şi fi – frecvenţa relativă a valorii xi ( i
=1,2,…,m). Se pune problema să se determine frecvenţa relativă υ ε a valorilor

f(ω) ale funcţiei f pentru care | f (ω) − M(f ) |< ε , adică


1
υε = card {ω ∈ Ω | | f (ω) − M(f ) |< ε } .
n

Suntem conduşi la inegalitatea (vezi [1] pag.54)


D 2 (f )
υε ≥ 1 −
ε2

cunoscută sub numele de inegalitatea lui Cebîşev.

Exemplul 15. Revenind la exemplul 8 prezentat anterior, dacă dorim să estimăm


frecvenţa relativă υ ε a numărului de oi care au masa între 34 şi 38 kg aplicăm

formula lui Cebîşev cu M(f)=35,125, ε=2,875, D2(f)=7,859375 şi obţinem


7,859375
υ2 ≥ 1 − ≅ 0,049 , deci cel puţin 4, 9% dintre oi vor avea masa între 34 şi
2,875 2

38 kg. Evident, această estimaţie este grosieră (vezi demonstraţia din [1], pag.
54) dar are avantajul că este uşor de făcut. Într-adevăr, în realitate sunt 21 oi cu
masa între 34 şi 38 kg, adică peste 50%. Ineficienţa acestei inegalităţi în acest
exemplu este motivată de faptul că ε2 şi dispersia funcţiei au valori
comparabile.

Exemplul 16. Numărul xi de purcei la o fătare la rasa Marele Alb la o fermă


este dat în tabelul următor

23
xi 5 6 7 8 9 10
ni 7 10 15 25 25 18
(ni este numărul de scroafe care au avut xi purcei la o fătare). Se consideră
funcţia reală f definită pe mulţimea tuturor scroafelor şi care asociază fiecărei
scroafe numărul de purcei pe care i-a fătat. Atunci M(f)=8,05 şi D2(f) = 2,1475.
Dacă dorim să estimăm frecvenţa relativă υ ε a numărului de scroafe care fată

între 6 şi 10 purcei (la o fătare) aplicăm formula lui Cebîşev cu M(f)=8, ε=2,
2,1475
D2(f) = 2,1475 şi obţinem υ 2 ≥ 1 − ≅ 0,46 , deci cel puţin 46% dintre
4
scroafe vor făta între 6 şi 10 purcei. Evident, şi această estimaţie este grosieră
(vezi demonstraţia din [1], pag. 54) dar este mai utilă decât cea din exemplul
precedent..

Inegalitatea lui Cebîşev este de interes teoretic major.

b) Alte caracteristici numerice ale funcţiilor


1°. Coeficientul de variabilitate

Coeficientul de variabilitate (Pearson) al funcţiei f este numărul notat


prin C.V.(f)=C.V. definit prin formula

σf
C.V . = .
M (f )

În practică se obişnuieşte să se folosească coeficientul de variabilitate


procentual C.V.% definit prin C.V.%= C.V.⋅100.

În zootehnie funcţionează următoarea convenţie:

0 < C.V.% < 10% - variabilitatea este mică,

10% < C.V.% < 20% - variabilitatea este medie,

C.V.% > 20% - variabilitatea este mare.

De exemplu, pentru funcţia din Exemplul 8 avem

2,8035
C.V.= ≅ 0,0798 sau C.V.%=7,8%<10%.
35,125

Apreciem deci că variabilitatea este mică.

24
2°. Coeficientul de asimetrie

Pentru aprecierea simetriei graficului frecvenţelor se folosesc în mod


obişnuit mai mulţi indici.
m 3 (f )
Numărul γ1(f)= γ1 definit prin γ 1 (f ) = se numeşte coeficientul de
σ f3
asimetrie al funcţiei f; γ1 dă informaţii asupra abaterii graficului funcţiei f de la
simetria în raport cu dreapta x=M(f).
Pentru funcţia din Exemplul 8 se calculează, cu ajutorul formulelor din
Exerciţiul 13 şi al formulei de definiţie pentru γ1

m3(f) = - 2,07421875 γ1= - 0,094139 .

Se poate accepta că asimetria este mică.


În fapt, toate momentele centrate de ordin impar dau informaţii asupra
abaterilor de la simetrie. Aceşti indicatori sunt sensibili la prezenţa valorilor
extreme mari. Există şi indicatori robuşti ai abaterilor de la simetrie dintre care
cităm coeficientul de disimetrie c=c(f) şi indicele asimetriei As=As(f) (Pearson).
Coeficientul de disimetrie este definit prin

µ + µ 3 − 2µ 2
c = c(f ) = 1 .
µ 3 − µ1

c ia valori între –1 şi +1. Se fac următoarele constatări:


c=0 atunci când graficul este simetric,
c>0 şi mai apropiat de +1 dacă graficul are ramura dreaptă de pantă lină,
c<0 şi mai apropiat de -1 dacă graficul are ramura stângă de pantă lină.
De exemplu, pentru funcţia din Exemplul 8 coeficientul de disimetrie este
33,250 + 38 − 2 ⋅ 35,750
c= ≅ −0,05882 ≅ −0,06 .
38 − 33,250

Se apreciază că asimetria este mică, cu graficul uşor abătut spre dreapta


(ramura stângă de pantă mai lină).
Indicele asimetriei (Pearson) este

M(f ) − Mo(f )
A s (f ) = A s = .
σf

Dacă As<0 distribuţia punctelor graficului are asimetrie dreaptă (ramura stângă
de pantă mai lină), dacă As>0 distribuţia punctelor graficului are asimetrie

25
stângă (ramura dreaptă de pantă mai lină) iar dacă As=0 distribuţia este aproape
simetrică. Evident, acest indicator se foloseşte numai pentru funcţii unimodale.

3°. Coeficientul de aplatizare (boltire)

m 4 (f )
Numărul γ2(f)= γ2 definit prin γ 2 (f ) = se numeşte coeficientul de
σ f4

aplatizare (boltire) al funcţiei f; γ2 dă informaţii asupra turtirii graficului funcţiei


f comparativ cu graficul distribuţiei normale cu aceeaşi medie (vezi [2], pag. 90)
pentru care γ2 =3.
Pentru funcţia din Exemplul 8 se calculează, cu ajutorul formulelor din Exerciţiul
13 şi al formulei de definiţie pentru γ2
m4(f) = 122,4750488125 γ2= 1,9827662<3.
Curba este deci mai turtită decât graficul distribuţiei normale, adică este o curbă
platicurtică.

d) Caracteristici numerice pentru familii de funcţii


1°. Covarianţa a două funcţii (caractere)
Fie f, g: Ω → ¡ două funcţii (caractere) definite pe mulţimea Ω=
= {ω1 , ω 2 ,..., ωn } . Se numeşte covarianţa perechii (f,g) numărul notat cu S(f,g)

definit ca medie a variabilei h = (f - M(f)) ⋅ (g - M(g)) , adică :


S(f, g) = M[(f - M(f)) ⋅ (g - M(g))] .

Covarianţa este pozitivă când h ia "în dominantă" valori pozitive, adică


covarianţa este pozitivă când f şi g au tendinţa să varieze în acelaşi sens şi
negativă când f şi g au tendinţa să varieze în sensuri contrare.
Evident S(f,f) = D2(f), adică dispersia este un caz particular al covarianţei.

Proprietăţile covarianţei
1°. S(f, g) = S(g, f) , ∀f, g: Ω → ¡
2°. S(f, g) = M(fg) - M(f) ⋅ M(g) , ∀f, g: Ω → ¡
3°. S(αf, β g) = αβ S(f, g) , ∀α , β ∈ ¡, ∀f, g: Ω → ¡
4°. S(f − a, g − b) = S(g, f) , ∀f, g: Ω → ¡, ∀funcţiile constante a şi b

În practică, în locul covarianţei (corelaţiei) se foloseşte des un alt


indicator al dependenţei dintre două funcţii şi anume coeficientul de corelaţie

26
care are avantajul că este adimensional şi are o interpretare geometrică simplă
ca fiind cosinusul unghiului a doi vectori din ¡n.
Se numeşte coeficientul de corelaţie al funcţiilor f, g numărul notat cu
ρ (f, g) definit prin:

S(f, g)
ρ(f, g) = .
D (f) ⋅ D (g)
2 2

Proprietăţile coeficientului de corelaţie


1°. ρ(f, g) = ρ(g, f ) , ∀f, g: Ω → ¡

2°. ρ(αf, β g) = |αβ


αβ|
ρ(f, g) , ∀α , β ∈ ¡, ∀f, g: Ω → ¡

3°. ρ(f − a, g − b) = ρ(g, f ) , ∀f, g: Ω → ¡, ∀funcţiile constante a şi b


Inegalitatea Cauchy-Schwartz-Buniakowschi asigură că totdeauna ρ(f , g ) ≤ 1

şi că ρ(f , g ) = 1 dacă şi numai dacă între funcţiile f şi g există o relaţie de

forma af + bg + c = 0 cu a,b,c ∈ ¡.

Exerciţiul 14. Scrieţi formulele pe baza cărora se fac calculele pentru determi-
narea directă a covarianţei şi a coeficientului de corelaţie:

S(f,g)=....................................................................................................................
ρ(f,g)=....................................................................................................................
Verificaţi-vă pe baza formulelor (9) şi(11) din [1], pag.56 şi 57.
Exemplul 17. În urma unei experienţe în care s-au urmărit două caractere X şi
Y s-au obţinut următoarele date
X 1,24 1,43 1,60 1,66 1,73 1,82 1,85 1,90 1,98
Y 0,57 0,14 0,75 0,60 0,50 0,35 0,25 0,19 0,97
Ne propunem să determinăm covarianţa şi coeficientul de corelaţie ale celor
două caractere. Putem aplica direct definiţiile dar putem apela la “centrări”
convenabile. Avem M(X)=1,69 şi M(Y)=0,48 – valori exacte (nerotunjite).
X Y X-1,69 Y-0,48 (X-1,69)(Y-0,48) (X-1,69)2 (Y-0,48)2
1,24 0,57 -0,45 0,09 -0,0405 0,2025 0,0081
1,43 0,14 -0,26 -0,34 0,0884 0,0676 0,1156
1,60 0,75 -0,09 0,27 -0,0243 0,0081 0,0729
1,66 0,60 -0,03 0,12 -0,0036 0,0009 0,0144
1,73 0,50 0,04 0,02 0,0008 0,0016 0,0004
1,82 0,35 0,13 -0,13 0,0169 0,0169 0,0169

27
1,85 0,25 0,16 -0,23 0,0368 0,0256 0,0529
1,90 0,19 0,21 -0,29 0,0609 0,0441 0,0841
1,98 0,97 0,29 0,49 0,1421 0,0841 0,2401
Suma= Suma= Suma= Suma= Suma= Suma= Suma=
=15,21 =4,32 =0 =0 =0,0483 =0,4514 =0,6054

0,0483
Atunci S( X, Y ) = = 0,054 adică X şi Y sunt foarte slab corelate. În plus,
9

D2(X)=0,0501, D2(Y)=0,0673 , σX=0,2239, σY=0,2594


0,054 0,0315
ρ( X, Y ) = = ≅ 0,09297 .
0,2239 ⋅ 0,2594 0,05807966

Aceasta înseamnă că X şi Y nu acceptă legături de tip liniar.

2°. Matricea de covarianţă (corelaţie) a p funcţii


Date p funcţii f1, f2,..., fp : Ω → ¡ unde Ω = {ω1 , ω 2 ,..., ω n } , se defineşte
matricea de covarianţă ca fiind p × p-matricea S(f1, f2,..., fp) = [s ij ] , unde sij =

S(fi, fj).
Se poate defini şi matricea coeficienţilor de corelaţie R(f1, f2,..., fp)
= [ρ ij ] , unde ρ ij = ρ(f i , f j ) pentru i ≠ j şi ρ ii =1 pentru i = 1,2,...,n.

Exerciţiul 15. Se studiază pentru 11 specii de păsări următoarele trei variabile:


X – greutatea adultului (în grame)
Y – vârsta de maturitate sexuală (în ani)
Z – durata de incubaţie a ouălelor (în zile).
Rezultatele sunt prezentate în tabelul de mai jos:
X 1050 770 400 500 800 1500 1700 120 320 300 360
Y 4,0 3,0 2,5 2,5 4,0 4,0 5,0 2,0 2,5 2,0 2,5
Z 28 25 26 25 26 28 27 21 24 23 21
Arătaţi că matricea de covarianţă a celor trei caractere (funcţii) este
 266249 482,91 1012,10
 
S( X, Y, Z) =  482,91 0,991 1,910 .
1012,10 1,910 6,091

Determinaţi apoi matricea de corelaţie ρ(X, Z, Y) a celor trei caractere.

Remarcă. Am prezentat elemente de studiul corelaţiilor pentru funcţii


numerice. Se pot defini aceste noţiuni şi pentru caractere calitative sau ordinale.

28
3°. Regresia liniară

Fie f,g: Ω → ¡ două funcţii (caractere) definite pe Ω = {ω1 , ω 2 ,..., ω n } .


Ne propunem să găsim funcţia de forma a + bf (liniară în f) care să descrie cel
mai bine comportarea lui g . Aceasta înseamnă să determinăm numerele a şi b
care minimizează expresia:

h(a, b) = ∑ [g(ω) - a - bf( ω) ]2 = n ⋅ M((g - a - b ⋅ f )2 )


ω∈Ω

Se demonstrează că funcţia h(a,b) ia valoarea minimă h(a0,b0) unde

S(f, g)
ao = M(g) - bo M(f) şi bo = 2
.
D (f)

Numerele ao şi bo se numesc coeficienţii regresiei funcţiei g asupra funcţiei f.


Dreapta y = ao + bo x se numeşte dreapta de regresie a lui g asupra lui f sau
regresia caracterului g asupra caracterului f. Similar se defineşte regresia lui f
asupra lui g; dreapta de regresie a lui f asupra lui g este x = a1 + b1y , unde
S(f, g)
a1 = M(f) - b1 M(g) b1 = 2
.
D (g)

Exemplul 18. In cazul Exemplului 17 dreapta de regresie a caracterului Y


asupra caracterului X are ecuaţia
0,0054 0,0054
y= x + 0,48 − ⋅ 1,69 adică y=0,1078 x+0,5826.
0,0501 0,0501

Similar se găseşte că dreapta de regresie a caracterului X asupra caracterului Y


are ecuaţia
x=0,02082y+1,68001 .

Exerciţiul 16. Rezultatele măsurătorilor a două caractere cantitative f şi g sunt


înregistrate în tabelul următor
i 1 2 3 4 5 6 7 8 9 10
f 0,25 0,37 0,44 0,55 0,60 0,62 0,68 0,70 0,73 0,75
g 2,57 2,31 2,12 1,92 1,75 1,71 1,60 1,51 1,50 1,41

i 11 12 13 14 15 16 17
f 0,82 0,84 0,87 0,88 0,90 0,95 1,00
g 1,33 1,31 1,25 1,20 1,19 1,15 1,00
Verificaţi că:

29
M(f) = 0,7029, M(g) = 1,5782, D2(f)=0,0418, σf=0,2042, D2(g)=0,1806,
σg=0,4250, S(f, g)=-0,0863, ρ(f, g) = 0,09943.
Determinaţi apoi dreapta de regresie a caracterului f asupra lui g şi a carac-
terului g asupra lui f.

Aplicaţie
Pentru un hibbrid de porumb H dorim să analizăm două caracteristici,
lungimea ştiuletelui şi numărul de boabe pe rând , în vederea comparării cu alţi
hibrizi. În acest scop se aleg 15 ştiuleţi pentru care se determină valorile celor
două caracteristici. Datele obţinute sunt înregistrate în Tabelul 6.
Acestui tabel îi asociem funcţiile cu valori reale f şi g definite pe
mulţimea D = {1, 2, …, 15} prin legile de corespondenţă f(i) = xi şi g(i) = yi
(tabelul este de fapt definiţia sintetică a celor două funcţii). Ne propunem să
determinăm covarianţa, coeficientul de corelaţie, regresia funcţiei f asupra
funciei g şi regresia funcţiei g asupra funcţiei f.
Datele necesare determinării acestor caracteristici numerice sunt conţinute
în Tabelul 7.
Tabelul 6 Nr. Lung.ştiul. mm Nr. boabe/rând
crt. xi yi
1 188 36
2 185 38
3 166 41
4 158 32
5 162 41
6 173 39
7 177 42
8 156 37
9 168 35
10 182 46
11 171 45
12 157 38
13 156 37
14 179 36
15 187 42
M(f)=171 M(g)=39

Tabelul 7
Nr. Lung.şt Nr.
Crt. iul. mm boabe/ xi - M(f) yi – (xi - M(f))× (xi - M(f))2 (yi –
xi rând M(g) (yi – M(g)) M(g))2
yi
1 188 36 17 -3 -51 329 9
2 185 38 14 -1 -14 196 1
3 166 41 -5 2 -10 25 4
4 158 32 -13 -7 91 169 49
5 162 41 -9 2 -18 81 4

30
6 173 39 2 0 0 4 0
7 177 42 6 3 18 36 9
8 156 37 -15 -2 30 225 4
9 168 35 -3 -4 12 9 16
10 182 46 11 7 77 121 49
11 171 45 0 6 0 0 36
12 157 38 -14 -1 14 196 1
13 156 37 -15 -2 30 225 4
14 179 36 8 -3 -24 64 9
15 187 42 16 3 48 256 9
M(f)= M(g)=39 S(f,g)= D2(f)= D2(g)=
=171 =13,(3) =129,0(6) =13,6
Covarianţa S(f,g) = 13,(3) este pozitivă şi indică faptul că cele două
caractere variază în dominantă în acelaşi fel . Coeficientul de corelaţie este
13, ( 3)
ρ(f , g ) = ≈ 0,317
129,0(6) ⋅ 13,6

Faptul că ρ(f,g) are valoarea apropiată de zero nu se interpretează ca semn al


unei slabe dependenţe între cele două caractere ci ca un semn al lipsei unei
dependenţe de tip liniar între cele două funcţii. Într-adevăr, există exemple de
caractere (funcţii) legate prin relaţii funcţionale nebanale pentru care coeficientul
de corelaţie este nul.
Dreapta de regresie a funcţiei f asupra funcţiei g este de forma x =
= co + doy, unde
13, ( 3)
do = ≈ 0.98, c o = 171 − 0,98 ⋅ 39 = 132,78
13,6
adică x= 132,78 + 0,98 y este dreapta de regresie căutată. Similar se determină
şi coeficienţii dreptei de regresie a funcţiei g asupra funcţiei f; se obţin valorile
13, (6)
bo = ≈ 0,105, a o ≈ 21,045
129,0(6)

adică y = 21,045 + 0,105 x este dreapta de regresie căutată.


Trebuie menţionat că în acest caz am determinat cele două drepte de
regresie pentru a exemplifica concret modul de lucru în acest caz. Aşa cum am
menţionat mai sus , faptul că ρ(f,g) este apropiat de zero ne spune că aproximă-
rile f ≈ co +dog şi g ≈ ao +bof nu sunt utilizabile. Acest lucru se vede din
Tabelul 8.
Tabelul 8
Nr.crt. xi co+doyi yi ao+boxi
1 188 168,06 36 40,785
2 185 170,02 38 40,470
3 166 172,96 41 38,475
4 158 163.36 32 37,635

31
5 162 172,96 41 38,055
6 173 171,00 39 39,210
7 177 173,94 42 39,630
8 156 169,04 37 37,425
9 168 167,08 35 38,685
10 182 177,86 46 40,155
11 171 177,08 45 39,000
12 157 170,02 38 37,530
13 156 169,04 37 37,425
14 179 168,06 36 39,840
15 187 173,94 42 40,680

Acceptând cele două aproximări, apare problema să decidem care dintre


ele este mai bună. Pe baza analizei Tabelului 8, s-ar părea că aproximarea g ≈
ao +bof este mai bună decât aproximarea f ≈ co +dog, dar lucrurile nu sunt clare
doar dintr-o simplă analiză a tabelului. Într-adevăr abaterea de 20 mm raportată
la valoarea medie 171 mm este comparabilă cu abaterea de 4,785 raportată la
media 39 . Prin urmare cele două aproximări sunt la fel de bune sau la fel de
rele. În concluzie, o comparaţie a două astfel de aproximări trebuie făcută pe
criterii clare, cum este – de exemplu - raportarea la valoarea medie (şi de
preferat aproximarea corespunzătoare raportului minim).

Trebuie remarcat că de această dată am calculat caracteristicile cerute


direct pe baza definiţiilor lor. Acest lucru a fost avantajos de făcut din următoarele
motive:
- mediile funcţiilor f şi g sunt numere întregi,
- frecvenţele absolute ale valorilor funcţiilor sunt , în marea lor majo-
ritate, egale cu 1 ,
- valorile funcţiilor sunt mici

Simplul fapt că valorile mediilor funcţiilor sunt numere întregi era un


motiv suficient de bun pentru a face centrările în aceste medii.
În sfârşit, trebuie menţionat că deşi caracteristicile numerice se pot
calcula totdeauna ele nu se pot utiliza totdeauna în interpretarea rezultatelor.
Rezultatele de mai sus cu privire la dreptele de regresie ne exemplifică această
afirmaţie. Astfel de calcule se fac în mod obişnuit în statistica descriptivă.
Rezultatele lor sugerează anumite concluzii care sunt sau nu validate prin
metodele statisticii decizionale (inferenţiale).

32
Capitolul II

ELEMENTE DE ALGEBRĂ ABSTRACTĂ

Problemele din ce în ce mai complexe puse ştiinţei contemporane spre


rezolvare au impus transpunerea acestora în limbaj algebric în speranţa că vor
deveni mai accesibile. Speranţele au fost parţial justificate de succesele obţinute
utilizând elemente de teoria semigrupurilor, grupurilor, inelelor şi câmpurilor
finite în rezolvarea unor probleme din genetică, chimie, fizică, cristalografie,
artă, etc..

§1. Lege de compoziţie


Definiţia 1. Fie M o mulţime nevidă. Se numeşte lege de compoziţie sau operaţie
binară pe M orice aplicaţie ϕ : M × M → M . Pentru orice (x,y) ∈ M × M,
elementul z= ϕ (x, y) se numeşte compusul lui x cu y prin legea de compoziţie φ.

În locul notaţiei ϕ (x, y) , pentru compusul elementelor x şi y, se preferă să


se folosească notaţii de forma : x + y , x • y , x ∗ y , x ∨ y , x ∧ y , x ⊥ y , x o y , etc..

Pentru a arăta că pe mulţimea M este dată legea de compoziţie (operaţia) ϕ se


folosesc notaţiile (M , ϕ ) sau M (ϕ ) .

Exemplul 1.1°. Adunarea (+) şi înmulţirea (·) sunt operaţii binare pe fiecare
dintre mulţimile de numere cunoscute ¥, ¢, ¤, ¡, £. Scăderea (-) nu este operaţie pe
¥ (de ce?), dar este operaţie pe ¢, ¤, ¡, £. 2°. Reuniunea ( ∪ ), intersecţia ( ∩ ),
diferenţa ( \ ) şi diferenţa simetrică (∆) sunt operaţii binare pe mulţimea P(X) a
tuturor părţilor mulţimii nevide X. 3°. Pe mulţimea Rn = { 0, 1, 2, ... , n-1 } se
definesc operaţiile: adunarea modulo n ( ⊕ ) şi înmulţirea modulo n (e).
Exerciţiul 1. Definiţi operaţiile: adunarea modulo 4 ( ⊕ ) şi înmulţirea modulo
4 (e).Verificaţi-vă pe baza manualului [1], pag. 66.
Răspuns..........................................................................................................................

.....................................................................................................................................
O mulţime nevidă dotată cu una sau mai multe operaţii (binare sau nu) se
numeşte structură algebrică sau sistem algebric.
33
Definiţia 2. Operaţia binară ϕ : M × M → M se numeşte:
1°. asociativă dacă ϕ(ϕ(x, y), z) = ϕ(x, ϕ(y, z)) ∀x,y,z∈M.
2°. comutativă dacă ϕ(x, y) = ϕ(y, x) ∀ x, y ∈ M .

Exerciţiul 2. În cazul în care operaţia binară este notată cu "*","+","·" proprietăţile


de asociativitate şi comutativitate au respectiv formele : (completaţi!)
.....................................................................................................................................
......................................................................................................................................
......................................................................................................................................
Exerciţiul 3. Folosind eventual modelul din [1] pag.67, completaţi tablele Cayley
pentru R5 dotat operaţiile de adunare şi înmulţire modulo 5:

⊕ 0 1 2 3 4 e 0 1 2 3 4
0 0 0
1 1 3
2 2 3 4 0 1 2 1
3 3 4
4 4 2

Exemplul 2.1°. Adunarea (+) şi înmulţirea (·) sunt operaţii şi asociative şi


comutative pe fiecare dintre mulţimile de numere ù, Z, Q, ú, ÷ . 2°. Reuniunea
" ∪ " şi intersecţia " ∩ " sunt operaţii şi asociative şi comutative pe mulţimea P (X ).
3°. Scăderea (-) pe Z, Q, ú, ÷ este operaţie şi neasociativă şi necomutativă.

Definiţia 3. Elementul e ∈ M se numeşte element neutru pentru legea de compoziţie


"*", sau element neutru pentru M(*), dacă satisface condiţia: e * x = x * e = x, ∀x ∈ M.

Dacă există element neutru pentru o operaţie binară "*", acesta este unic.

Exerciţiul 4. Daţi exemple de operaţii binare care au element unitate şi exem-


ple de operaţii binare care nu au element unitate.

Definiţia 4. Fie "*" o operaţie binară pe M având elementul neutru e. Elementul x


se numeşte simetrizabil dacă există x' ∈ M astfel încât x * x' = x' * x = e. În
acest caz x' se numeşte simetricul elementului x.
Dacă x' este simetricul lui x, atunci x este simetric pentru x', adică x=(x')'.

Exerciţiul 5. Daţi exemple de elemente simetrizabile.

Definiţia 5. Se spune că operaţia "*" este :


1°. distributivă la stânga în raport cu operaţia "·" dacă

34
x * (y · z) = (x * y) · (x * y), ∀ x, y, z ∈ M;
2°. distributivă la dreapta în raport cu operaţia "·" dacă
(y · z) * x = (y * x) · (z * x), ∀ x, y, z ∈ M,
3°. distributivă dacă este şi distributivă la stânga şi distributivă la dreapta.

§2. Structuri algebrice de bază

Definiţia 6. M(*) se numeşte


1. semigrup dacă "*" este operaţie asociativă,
2. monoid dacă M(*) este semigrup cu element neutru,
3. cvasigrup dacă ecuaţiile a * x = b şi x * a = b au soluţii unice oricare ar fi a, b ∈M;
4. loop (sau buclă) dacă este cvasigrup cu element neutru
5. grup dacă este monoid pentru care fiecare element este simetrizabil.
Dacă în plus "*" este şi comutativă M(*) se numeşte respectiv semigrup comu-
tativ, monoid comutativ, cvasigrup comutativ, loop comutativ şi respectiv grup
comutativ sau abelian.

Exemplul 3. 1°. N*(+‘) este semigrup comutativ. 2°. ¥k(+) şi ¥k(·) sunt semigru-
puri comutative (aici ¥k = { k, k+1, ...} ).3°. ¥ (+), ¢(+) sunt monoizi comutativi.
4°. F (X)(○) este monoid (necomutativ).5°. Mulţimea ¡* a tuturor numerelor
reale nenule, dotată cu operaţia "•" definită prin x • y = x3 · y ∀ x, y ∈ ¡* este
cvasigrup (necomutativ). 6°. ¢(+), ¤(+), ¡(+), £(+) sunt grupuri comutative
(abeliene).7°. Mulţimea Sn a tuturor permutărilor de n > 2 elemente este grup
(necomutativ!) în raport cu operaţia de compunere a permutărilor.

Dată M(*), pentru orice element fixat a ∈ M se pot defini aplicaţiile


La , Ra : M → M prin: La (x) = a * x , Ra (x) = x * a ∀x ∈ M . La , Ra se numesc
translaţia (multiplicarea) stângă prin a şi respectiv translaţia (multiplicarea)
dreaptă prin a . De exemplu, pentru R5(⊕) translaţia stângă L2 este
x 0 1 2 3 4
L2(x) 2 3 4 0 1
iar pentru R5(u) translaţia dreaptă R3 este
x 0 1 2 3 4
R3(x) 0 3 1 4 2
În orice cvasigrup, loop sau grup , toate translaţiile stângi şi toate translaţiile
drepte sunt aplicaţii bijective.

35
Exerciţiul 6. Cum interpretaţi bijectivitatea translaţiilor stângi şi/sau drepte
pentru structurile algebrice de ordin finit? Concretizaţi pentru cvasigrupuri şi
loopuri. Verificaţi-vă pe baza manualului [1], pag. 73.
Exerciţiul 7. Enumeraţi proprietăţile şi regulile de calcul ale structurilor algebrice
enumerate mai sus.

Definiţia 7. O mulţime nevidă I dotată cu două legi de compoziţie, una notată


aditiv (+) şi numită adunare iar cealaltă notată multiplicativ (·) şi numită înmulţire
se numeşte inel dacă: I1. I(+) este grup comutativ, I2. I(·) este monoid, I3.
înmulţirea este distributivă faţă de adunare. Dacă în plus înmulţirea este
comutativă inelul se numeşte inel comutativ.

Exemplul 4. 1°. ¢(+,·) este inel comutativ. 2°. Mulţimea Mn(¡)(+,·) este inel
(necomutativ).
Elementele lui I simetrizabile în raport cu înmulţirea se numesc elemente
inversabile sau unităţi. Unităţile inelului ¢(+,·) sunt -1 şi +1.
Exemplul 5. 1°. ¢(+,·) este inel comutativ fără divizori ai lui zero, adică este
domeniu de integritate. 4°. Mulţimea Mn(¡)(+, ·) este inel (necomutativ) cu
divizori ai lui zero .

Exerciţiul 8. Arătaţi că R n (⊕, e ) este inel comutativ fără divizori ai lui zero
când n este număr prim şi inel cu divizori ai lui zero dacă n nu este prim.
Definiţia 8. Un inel K(+, ⋅ ) pentru care 0 ≠ 1 şi având proprietatea că orice
element ≠ 0 este inversabil se numeşte corp. Orice corp comutativ se numeşte câmp.

Exerciţiul 9. Verificaţi că: 1º. R 5 (⊕, e) este câmp.


2º.Mulţimea K = { 0, 1, a, b } dotată cu operaţiile "+" şi " ⋅ " date prin tablele
Cayley de mai jos este câmp.

+ 0 1 a b ⋅ 0 1 a b

0 0 1 a b 0 0 0 0 0

1 1 0 b a 1 0 1 a b

a a b 0 1 a 0 a b 1

b b a 1 0 b 0 b 1 a

§3. Pătrate latine

Fie M o mulţime cu n elemente.


Definiţia 9. 1. Un tablou L format din n linii şi n coloane cu elemente din M se
numeşte pătrat latin peste M dacă fiecare element din M apare în L o dată şi
numai o singură dată în fiecare linie şi în fiecare coloană. Se obişnuieşte ca

36
elementele lui M să se numească elementele pătratului latin L. 2. Două pătrate
latine de ordinul n se numesc ortogonale dacă prin suprapunere fiecare element al
primului pătrat se cuplează o dată şi numai o singură dată cu fiecare element al
celuilalt pătrat latin

Exemplul 6. Tabla Cayley a oricărui cvasigrup , loop sau grup , de ordin n , G (*)
este un pătrat latin de ordinul n peste G.

Exerciţiul 10. Descrieţi o metodă de construcţie de pătrate latine ortogonale.


Consultaţi eventual [1] pag. 82.

Exerciţiul 11. Descrieţi un experiment care impune utilizarea pătratelor latine.

Exemplul 7. Vom considera câmpul K(+, .) din Exerciţiul 9. Vom construi pe


baza Teoremei 2, [1], pag.82, pătratele latine corespunzătoare lui u=a şi u=b şi
vom arăta că sunt ortogonale. Pentru a aplica formula din teoremă redenumim
elementele lui K şi anume : 0=x0, 1=x1, a=x2, b=x3. Pentru u=a avem

x a00 = a ⋅ x 0 + x 0 = 0 x 10
a
= a ⋅ x 1 + x 0 = a x a20 = a ⋅ x 2 + x 0 = b x a30 = a ⋅ x 3 + x 0 = 1
x a01 = a ⋅ x 0 + x 1 = 1 x 11
a
= a ⋅ x 1 + x 1 = b x a21 = a ⋅ x 2 + x 1 = a x a31 = a ⋅ x 3 + x 1 = 0
x a02 = a ⋅ x 0 + x 2 = a x 12
a = a ⋅ x + x = 0 xa = a ⋅ x + x = 1 xa = a ⋅ x + x = b
1 2 22 2 2 32 3 2
x a03 = a ⋅ x 0 + x 3 = b x 13
a = a ⋅ x + x = 1 xa = a ⋅ x + x = 0 xa = a ⋅ x + x = a
1 3 23 2 3 33 3 3

S-a obţinut pătratul latin La


0 1 a b
a b 0 1
b a 1 0
1 0 b a
În mod asemănător se va obţine pătratul latin Lb. Pentru u=b avem

x b00 = b ⋅ x 0 + x 0 = 0 x 10
b
= b ⋅ x1 + x 0 = b x b20 = b ⋅ x 2 + x 0 = 1 x b30 = b ⋅ x 3 + x 0 = a
b b
x 01 = b ⋅ x 0 + x 1 = 1 x 11 = b ⋅ x 1 + x 1 = a x b21 = b ⋅ x 2 + x 1 = 0 x b31 = b ⋅ x 3 + x 1 = b
x b02 = b ⋅ x 0 + x 2 = a x 12
b = b ⋅ x + x = 1 xb = b ⋅ x + x = b xb = b ⋅ x + x = 0
1 2 22 2 2 32 3 2
x b03 = b ⋅ x 0 + x 3 = b x 13
b = b ⋅ x + x = 0 xb = b ⋅ x + x = a xb = b ⋅ x + x = 1
1 3 23 2 3 33 3 3

Obţinem pătratul latin Lb

0 1 a b
b a 1 0
1 0 b a
a b 0 1
Pentru a verifica ortogonalitatea celor două pătrate latine vom identifica elemen-
tele 0, 1, a, b respectiv cu A, B, C, D în La şi cu α, β, γ, δ în Lb. Tabelele astfel
transformate le suprapunem pentru a constata ortogonalitatea.
37
A B C D α β γ δ Aα Bβ Cγ Dδ
C D A B δ γ β α Cδ Dγ Aβ Bα
D C B A β α δ γ Dβ Cα Bδ Aγ
B A D C γ δ α β Bγ Aδ Dα Cβ

Exerciţiul 12. Folosind tablele Cayley din Exerciţiul 9, construiţi pătratele latine
L1, L2, L3, L4 corespunzătoare elementelor din R5 şi verificaţi că sunt ortogonale
două câte două.

Aplicaţie
Să considerăm experienţa care constă în administrarea a trei raţii diferite
la vaci în lactaţie. Deoarece curba de lactaţie variază mult de la o vacă la alta este
greu să se alcătuiască loturi omogene şi de aceea se obişnuieşte ca cele trei raţii
A, B, C să se experimenteze pe acelaşi animal în trei perioade succesive. Se aleg
deci, prin tragere la sorţi, trei vaci V1, V2, V3. Având în vedere că ordinea de
administrare a raţiilor are influenţă asupra efectelor acestor raţii, raţiile se vor
administra astfel încât să se elimine aceste influenţe. Acest lucru se realizează
administrând fiecare raţie la câte o singură vacă într-o anumită perioadă,
perioadele fiind separate de intervale de timp suficient de mari astfel încât să se
elimine influenţa ordinii administrării celor trei raţii. Cum fiecare vacă trebuie să
folosească fiecare dintre raţii se ajunge la o planificare de tipul următor , care a
condus la un pătrat latin L peste mulţimea M = {A, B, C}.
L
V1 V2 V3

perioada I A B C
perioada II B C A
perioada III C A B

38
Capitolul III

SPAŢII VECTORIALE

Se ştie că rezolvarea multor probleme din toate domeniile de activitate se reduce


în final la rezolvarea unor sisteme de ecuaţii liniare (de exemplu, orice ajustare
polinomială utilizată în legătură cu orice experiment din biologie revine la rezol-
varea unui sistem de ecuaţii liniare) sau la determinarea vectorilor şi valorilor
proprii ale unor operatori (de exemplu, determinarea funcţiilor de undă asociate
unui sistem de microparticule se reduce la determinarea de vectori şi valori pro-
prii). În fapt, s-a ajuns la transpunerea unor probleme concrete în cadrul algebrei
liniare. Unul dintre obiectele de bază ale algebrei liniare este spaţiul vectorial sau
liniar. Ca exemple cităm spaţiile vectoriale reale ale vectorilor liberi din spaţiu sau
din plan, spaţiile vectoriale ale componentelor atomice şi moleculare.

§1. Spaţii vectoriale

1. Definiţii. Exemple

Definiţia 1. Fie K un câmp. Se numeşte spaţiu vectorial sau spaţiu liniar


peste câmpul K orice mulţime nevidă V dotată cu o operaţie binară +:V × V →
r r r
V, (u, v ) → u + v numită adunare şi o aplicaţie ·:K × V → V, (α , u ) → α ⋅ u ,
r r r r

numită operaţie externă (sau lege de compoziţie externă) care satisfac axiomele:
1°. V(+) este grup abelian,
r r r
2°. 1· v = v , ∀ v ∈ V (1 este elementul neutru la înmulţirea din K),
r r r r r r
3°. α ·( u + v) = α · u + α · v , ∀ α ∈ K, ∀ u , v ∈ V,
r r r r
4°. ( α + β )· u = α · u + β · u , ∀ α, β ∈ K, ∀ u ∈ V,
r r r
5°. α ·( β · u ) = ( α · β )· u , ∀ α, β ∈ K, ∀ u ∈ V.

Terminologie. 1°. Elementele lui V se numesc vectori iar operaţia de


adunare se numeşte adunarea vectorilor. Din motive didactice preferăm să notăm
(mai greoi) vectorii prin litere având o săgeată deasupra; aceasta permite să-i

39
distingem uşor de elementele din câmpul K. 2°. Elementele lui K se numesc
scalari iar operaţia externă se numeşte înmulţire cu scalari. 3°. Când K = , V se
numeşte spaţiu vectorial real, iar când K = , V se numeşte spaţiu vectorial
complex. 4°. Elementul neutru pentru adunare se numeşte vectorul zero şi se
r
notează cu 0 ; mai târziu vom nota şi vectorul zero cu 0 (la fel ca scalarul zero)
pentru că, din context, va fi totdeauna clar când este vorba de vectorul zero sau de
r r r r
scalarul zero. 5°. Opusul v' al vectorului v şi se va nota cu v ′ = - v .

Exemplul 1. 1°. Spaţiul vectorial peste câmpul K definit pe grupul abelian {0}
dotat cu înmulţirea cu scalari definită prin α ⋅ 0 = 0 , ∀ α ∈ K se numeşte
spaţiul vectorial nul.
2
2°. Mulţimea dotată cu operaţiile:
(x1 , x 2 )+ (y 1 , y 2 ) = (x1 + y 1 , x 2 + y 2 ), ( ) (
α ⋅ x1 , x 2 = α ⋅ x1 , α ⋅ x 2 )
r r r
este spaţiu vectorial real. Într-adevăr, dacă x = (x 1 , x 2 ) , y = ( y1 , y 2) , z = (z 1 , z 2 )
2
sunt trei vectori oarecare din , egalităţile
(( ) ( )) ( )
(xr + yr ) + zr = x 1 , x 2 + y 1 , y 2 + z 1 , z 2 = ( x 1 + y 1 + z 1 , x 2 + y 2 + z 2 ) ,
r r r
(( ) ( )) (
x + (y + z ) = (x 1 , x 2 ) + y 1 , y 2 + z 1 , z 2 = x 1 + y 1 + z 1 , x 2 + y 2 + z 2 )
asigură că adunarea este operaţie asociativă. Vectorul (0, 0) este element neutru la
adunare, iar vectorul (-x1, -x2) este opusul vectorului (x1, x2) . Comutativitatea
adunării este uşor de verificat.

Exerciţiul 1. 1°.Arătaţi că adunarea matricelor şi înmulţirea matricelor cu scalari


organizează mulţimea M m×n ( ) ca spaţiu vectorial real.

2°. Arătaţi că mulţimea ς3 a vectorilor liberi din spaţiu, dotată cu operaţiile


obişnuite de adunare (definită, de exemplu, prin regula paralelogramului) şi
înmulţire cu scalari, este spaţiu vectorial real.

Exerciţiul 2. Enumeraţi regulile de calcul dintr-un spaţiu vectorial:


1°. ...............................................................................................................................
2°. ...............................................................................................................................
3°. ...............................................................................................................................
4°. ...............................................................................................................................
5°. ...............................................................................................................................
r r r
Definiţia 2. Spunem că sistemul de vectori S = { v1 , v 2 ,..., vm } este un sistem
r r
liniar independent, sau că vectorii v 1 , v 2 ,..., vr m sunt liniar independenţi (sau că

40
r r
vectorii v 1 , v 2 ,..., vr m formează un sistem liniar independent), dacă orice relaţie de
r r
forma µ1 v 1 + µ 2 v 2 + ... + µm vr m = 0 implică µ 1 = µ 2 = ... = µ m = 0 . În caz con-

trar se va spune că vectorii (sau sistemul de vectori) sunt liniar dependenţi. Dacă
orice vector din V este combinaţie liniară a vectorilor sistemului S spunem că S
este un sistem de generatori pentru spaţiul vectorial V.
r r 2
Exemplul 2. Vectorii v 1 = (1,−2), v 2 = ( −1,1) ∈ sunt liniar independenţi deoarece

µ − µ = 0
orice relaţie µ 1 v 1 + µ 2 v 2 = (0,0) , este echivalentă cu sistemul  1 2 care
− 2µ 1 + µ 2 = 0
r r r r
are numai soluţia µ1=µ2=0. Dar sistemul de vectori { v 1 , v 2 , v 3 } ⊂ ú2, cu v 1 = (1,−2),
r r r r r
v 2 = ( −1,1), v 3 = (1,0) este liniar dependent pentru că v 1 + 2 v 2 + v 3 = 0 . Sistemul de

r r
vectori S= { v 1 , v 2 } ⊂ ú2 este un sistem de generatori pentru 2
pentru că orice vector
r 2 r
v = (α 1 , α 2 ) ∈ se poate scrie: v = µ 1 v 1 + µ 2 v 2 unde µ1=-α1-α2, µ2=-2α1-α2.

Definiţia 3. Sistemul de vectori S se numeşte bază a spaţiului vectorial V dacă


1°. S este un sistem liniar independent,
2°. S este un sistem de generatori pentru V.
r r 2
Exemplul 3. 1°.Pe baza Exemplului 2 rezultă că S= { v 1 , v 2 } este bază în .
r r r r
2°. Sistemul de vectori Bc = {e1 , e 2 } cu e1 = (1,0), e 2 = (0,1) este bază în 2. Într-
r r r r
adevăr, egalitatea µ 1 e1 + µ 2 e 2 = (µ 1 , µ 2 ) implică µ 1 e1 + µ 2 e 2 = (0,0) ⇔ µ 1 = µ 2 = 0)
r r r
şi v = (α 1 , α 2 ) = α 1 e1 + α 2 e 2 adică Bc este şi sistem liniar independent şi sistem de
2 2
generatori în . Bc se numeşte baza canonică din .
r r r
Teorema 1 (de caracterizare a bazei). Sistemul de vectori B = {e1 , e 2 ,..., e n }
r
este bază a spaţiului vectorial V dacă şi numai dacă orice vector v ∈ V se scrie
r r r r
în mod unic sub forma v = µ1 e1 + µ 2 e 2 + ... + µn e n cu µ 1 , µ 2 ,..., µ n ∈ K.
r r r r
Definiţie 4. Dacă B = {e1 , e 2 ,..., e n } este bază în V şi v este un vector oarecare din V
atunci scalarii µ 1 , µ 2 ,..., µ n ∈K, unic determinaţi de reprezentarea
r r r r
v = µ 1 v 1 + µ 2 v 2 + ... + µ n v n ,
r
se numesc coordonatele vectorului v în baza B.
r r 2 r
Exemplul 4. Dacă Bc = {e1 , e 2 } este baza canonică din pentru orice vector v
2 r r r
∈ au loc egalităţile v = ( x 1 , x 2 ) = x 1 e1 + x 2 e 2 , adică componentele x1, x2 sunt
r
chiar coordonatele de acelaşi nume ale vectorului v . Din Teorema 1 rezultă că
baza Bc este singura bază cu această proprietate şi de aceea poartă numele de bază
canonică sau bază naturală din 2.
41
r r r n
Exerciţiul 3. Definiţi baza canonică Bc = {e1 , e 2 ,..., e n } din şi arătaţi că au loc
r r r r
egalităţile v = ( x 1 , x 2 ,..., x n ) = x 1 e1 + x 2 e 2 + ... + x n e n .

n n
Rezultă că, în baza canonică din , orice vector din are i-componenta
(i = 1, 2,..., n) egală cu i-coordonata în baza Bc . Această bază este singura bază cu
această proprietate şi de aceea această bază se numeşte baza canonică sau baza
n
naturală din .

Exerciţiul 4. Arătaţi că în spaţiul vectorial real E3 al vectorilor liberi din spaţiu,


orice sistem format din trei vectori (nenuli) necoplanari este o bază pentru E3.

Teorema 2. Din orice sistem de generatori al unui spaţiu vectorial V se poate


extrage o bază a acestui spaţiu .

Instrumentul de lucru care se poate utiliza în rezolvarea majorităţii proble-


melor de algebră liniară este aşa-numita lema substituţiei pe care o prezentăm în cele
ce urmează.
r r r r
Lema substituţiei. Fie B = {e1 , e 2 ,..., e n } o bază a spaţiului vectorial V, u ∈ V -
r r r r
un vector fix cu u = α 1 e1 + α 2 e 2 + ... + α n e n şi sistemul de vectori B* obţinut din
r r r r r r r r
B înlocuind vectorul e i cu vectorul u (adică B* = {e1 , e 2 ,..., e i −1 , u, e i +1 ,..., e n } ).

Au loc afirmaţiile :
1°. B* este bază dacă şi numai dacă α i ≠ 0 ,

2°. dacă B* este bază a lui V, atunci coordonatele λ1* , λ 2* ,..., λn* în baza
r
B* ale unui vector x ∈ V se exprimă în funcţie de coordonatele λ1 , λ 2 ,..., λn în
r αj
baza B ale lui x prin egalităţile λ i* = λ i , λ j* = λ j − ⋅ λi pentru j ≠ i.
αi αi

Calculele care trebuiesc făcute pentru a determina coordonatele în baza B*


r r
ale vectorilor u , x când se cunosc coordonatele acestora în baza B se organi-
zează sub forma tablourilor:

42
r r r r
B ... u ... x ... B* ... u .... x ...
r r
e1 α1 λ1 e1 0 λ 1 − (λ i / α i )α 1
. . . . . .
. . . . . .
r r
ei αi λi ⇒ ei 1 λi / αi

. . . . . .
. . . . . .
r r
ej αj λj ej 0 λ j − (λ i / α i )α j
. . . . . .
. . . . . .
r r
en αn λn en 0 λ n − (λ i / α i )α n

În aceste tablouri, pe coloane se găsesc coordonatele vectorilor corespun-


zători în bazele indicate la începutul fiecărui tablou . Deoarece s-a presupus că
r r
α i ≠ 0 rezultă că putem înlocui ei cu u . Elementul α i se va numi pivot ca o
recunoaştere a rolului important pe care îl are de jucat. De obicei pivotul se
marchează punându-se într-un dreptunghi sau într-un cerculeţ (fie va fi scris cu
caractere mai îngroşate decât restul textului).
Trecerea de la tabloul B la tabloul B* se face în felul următor :

1°. elementele liniei din B* corespunzătoare liniei pivotului se obţin


împărţind la pivot toate elementele liniei pivotului,
2°. se completează coloana corespunzătoare pivotului cu 0-uri,

3°. toate elementele λ i cu j ≠ i se înlocuiesc cu λ j = λ j - λ i ⋅ α j .


*

αi
Trecerea de la λ j la λ*j se poate face formal pe baza următoarei reguli

cunoscută sub numele de regula dreptunghiului şi prezentată schematic în


desenul de mai jos:
λi
1− − − −
α i − − − −λ i αi
| | ⇒ | |
α j − − − −λ j λi
0 − − − −λ j − αj
αi

Exerciţiul 5. Cum se poate folosi lema substituţiei pentru a arăta că un sistem de


vectori este o bază? Verificaţi-vă pe baza manualului [1] pag.95.

43
Exemplul 5. Vom verifica faptul că sistemul de vectori S = (v 1 , v 2 , v 3 ) ⊂
r r r 3
unde
r r r 3
v 1 = (2,3,-1), v 2 = (1,0,1), v 3 = (1,−1,2) este o bază în şi vom determina
r
coordonatele vectorului v =(4, 3, 0) în baza S. Construim tabelele următoare
r r r r r r r r
Bc v1 v2 v3 v B1 v1 v2 v3 v
r r
2 1 1 4
e1 2 1 1 4 v2
r r
e2 2 0 -1 3 e2 2 0 -1 3
r r
e3 -1 1 2 0 e3 -3 0 1 -4

r r r r r r r r
B2 v1 v2 v3 v B3 v1 v2 v3 v
r r
v2 5 1 0 8 v2 0 1 0 3
r r
e2 -1 0 0 -1 v1 1 0 0 1
r r
v3 -3 0 1 -4 v3 0 0 1 -1

3 3
Deoarece B3 este bază în , rezultă că sistemul S este bază în şi că
r r r r r
v = v 1 + 3 v 2 − v 3 , adică 1, 3, -1 sunt coordonatele lui v în baza S.

Exerciţiul 6. Rezolvaţi problema din Exemplul 5 pornind în primul tablou de la


pivotul din locul (3,2) şi utilizând indicaţiile din [1] pag.96, Remarca 3.
Exemplul 6. Vom stabili că sistemul de vectori S = {v 1 , v 2 , v 3 , v 4 }⊂
r r r r 4 r
unde v 1 =
r r r
=(2,3,-1,0), v 2 = (1,0,1,−1), v 3 = (1,−1,2,−1), v 4 = (6,7,−1,0) este liniar dependent şi

vom determina o relaţie de dependenţă liniară între vectorii sistemului.


r r r r r r r r
Bc v1 v2 v3 v4 B1 v1 v2 v3 v4
r r
e1 2 1 1 6 e1 2 0 0 6
r r
e2 3 0 -1 7 e2 3 0 -1 7
r r
e3 -1 1 2 -1 e3 -1 0 1 -1
r r
e4 0 -1 -1 0 v2 0 1 1 0

r r r r r r r r
B2 v1 v2 v3 v4 B3 v1 v2 v3 v4
r r
e1 2 0 0 6 e1 0 0 0 0
r r
e2 2 0 0 6 v1 1 0 0 3
r r
v3 -1 0 1 -1 v3 0 0 1 -1
r r
v2 1 1 0 1 v2 0 1 0 1
r
Sistemul nu este independent deoarece v 4 nu poate fi introdus în bază. Din ultima
r r r r r r
coloană rezultă v 4 = 3 v 1 + v 2 − v 3 , adică 3 v 1 + v 2 − v 3 − v 4 = 0 este o relaţie de

dependenţă liniară între vectorii sistemului.


44
Exerciţiul 7. Arătaţi că între vectorii sistemului S = {v 1 , v 2 , v 3 , v 4 }⊂
r r r r 5 r
unde v 1 =
r r r
=(2,3,-1,0,2), v 2 = (1,−1,2,−1,−1), v 3 = (1,2,−1,0,−2), v 4 = ( −2,−9,7,−2,0) există o relaţie

de dependenţă liniară. Care este numărul maxim de vectori liniar independenţi


din sistem?
r r r
Teorema 3 (a bazei). Dacă V are o bază B = {e1 , e 2 ,..., e n } atunci
1°. orice sistem liniar independent din V are cel mult n vectori,
2°. orice bază a lui V are n vectori.

Definiţie 5. Spunem că spaţiul vectorial V peste câmpul K are dimensiunea n


peste K şi scriem n = dimKV dacă în V există o bază formată din n vectori.
n
Din Exerciţiul 3 rezultă că dim = n.
Tot pe baza lemei substituţiei se stabileşte rezultatul :

Teorema 4. Fie V un spaţiu vectorial de dimensiune n peste câmpul K. Pentru


r r r
orice sistem de n vectori S = { v1 , v 2 ,..., vn } următoarele afirmaţii sunt echivalente :
1°. S este bază pentru V,
2°. S este un sistem de generatori pentru V,
3°. S este un sistem liniar independent .

Exerciţiul 8. Folosind Teorema 5, verificaţi că sistemul de vectori S = {v 1 , v 2 , v 3 }


r r r

3 r r r 3
⊂ unde v 1 = (1,2,-1), v 2 = (0,3,1), v 3 = ( 2,0,−3) este o bază în .

§2. Subspaţii vectoriale

1. Definiţii. Exemple
Fie V un spaţiu vectorial peste câmpul K.
Definiţia 6. O submulţime nevidă L ⊂ V se numeşte subspaţiu vectorial al lui V
dacă operaţiile din V induc pe L o structură de spaţiu vectorial.
Propoziţia 1. Submulţimea nevidă L a spaţiului vectorial V este subspaţiu
vectorial dacă şi numai dacă :
r r r r
1°. ∀x, y∈L ⇒ x + y∈ L
r r
2°. ∀α∈ K ,∀x∈L ⇒ α ⋅ x ∈ L .

2. Rangul unui sistem de vectori


r r r
Fie S = { v 1 , v 2 ,..., v m } un sistem de vectori din spaţiul vectorial real V.
r r r
Considerăm mulţimea notată L( v 1 , v 2 ,..., v m ) definită prin :
45
r r r r r r r r
L( v 1 , v 2 ,..., v m ) = { v ∈ V | v = µ 1 v 1 + µ 2 v 2 + ... + µ m v m , µ 1 , µ 2 ,..., µ m ∈ K } .

r r r
L( v1 , v 2 ,..., vm ) este subspaţiu vectorial al lui V şi se numeşte subspaţiul
liniar generat de sistemul de vectori S.
Definiţia 7. Se numeşte rangul sistemului de vectori S = {v1 , v 2 ,..., vm} numărul
r r r
r r r
notat rang S egal prin definiţie cu dimK L( v1 , v 2 ,..., vm ).

Se vede că rangul sistemului de vectori S este egal cu numărul maxim de


vectori liniar independenţi din sistem.
r r 4
Exemplul 8. Să determinăm rangul sistemului de vectori S = { v 1 , v 2 , v 3 , v 4 } ⊂ ,
r r r r
unde v 1 =(1, 2, -3, -5), v 2 =(-1, 0, 2, 7), v 3 =(1, 4, - 4, -3), v 4 =(-1, 2, 1, 9).
Construim tabelele
r r r r r r r r
Bc v 1 v 2 v 3 v4 B1 v1 v2 v3 v4
r r
e1 1 -1 1 -1 v2 -1 1 -1 1
r r
e2 2 0 4 2 e2 2 0 4 2
r r
e3 -3 2 -4 1 e3 -1 0 -2 -1
r r
e4 -5 7 -3 9 e4 2 0 4 2

r r r r
B2 v1 v2 v3 v4
Rezultă că rang S=2. În plus, din ultimul tabel
r r r r r r r
v2 0 1 1 2 rezultă că v 3 = 2 v 1 + v 2 , v 4 = v 1 + 2 v 2 .
r
e2 0 0 0 0
r
v1 1 0 2 1
r
e4 0 0 0 0

3. Rangul unei matrice


Fiecărei matrice A = a ij [ ] m×n îi asociem vectorii coloană

 a11   a12   a1n 


     
 a21   a22   a2n 
 ⋅   ⋅   ⋅ 
C 1A =   , C 2A =   ,... , C nA =  
 ⋅   ⋅   ⋅ 
 ⋅   ⋅   ⋅ 
     
am1 am 2  amn 
pe care îi identificăm cu elemente din m şi vectorii linie
LA [
1 = a 11 a 12 ....a 1n
], LA2 = [ a 21 a 22 ...a 2n ],..., LAm = [ a m1 a m 2 ...a mn ]
pe care îi identificăm în mod natural cu elemente din n.

46
Teorema 5 (Kronecker). Pentru orice matrice A ∈M m×n ( ) au loc egalităţile

rang {C1A , C2 A ,..., Cn A } = rang {LA1 , LA2 ,..., LAm } = rang A .


Teorema lui Kronecker permite să calculăm rangul unei matrice cu
ajutorul lemei substituţiei şi anume: este suficient să calculăm, , rangul sistemului
de vectori coloană (linie).
 1 2 0 1 − 1
 
2 0 2 2 2
Exemplul 9. Vom determina rangul matricei A= .
 3 2 2 3 1
 
 6 4 4 5 2

Vom utiliza sistemul de vectori linie. Se obţin tabelele:

Bc C1A C 2A C 3A C 4A C 5A B1 C 1A C 2A C 3A C 4A C 5A
r r
e1 1 2 0 1 -1 e1 1 2 0 1 -1
r
e2 2 0 2 2 2 C 3A 1 0 1 1 1
r r
e3 3 2 2 3 1 e3 1 2 0 1 -1
r r
e4 6 4 4 5 2 e4 2 4 0 1 -2

B2 C 1A C 2A C 3A C 4A C 5A B3 C 1A C 2A C 3A C 4A C 5A
r r
e1 0 0 0 0 0 e1 0 0 0 0 0
C 3A 0 -2 1 0 2 C 3A 0 -2 1 0 2
C 4A 1 2 0 1 -1 C 4A 0 0 0 1 0
r
e4 1 2 0 0 -1 C1A 1 2 0 0 -1

Pe baza ultimului tabel putem spune că rang A =3.


Ca exerciţiu vă propunem să determinaţi rangul matricei A folosind sistemul de
vectori linie.
4. Inversarea matricelor

Pentru orice matrice pătratică inversabilă A = [a ij ]∈ M n ( ) sistemul de


vectori coloană {C1A , C2A ,..., Cn A} este bază în n. În plus, pentru matricea
[ ]
inversă A-1 = b ij ∈ M n ( ), elementele bij (i =1, 2,…, n) ale coloanei j sunt
coordonatele vectorului CjI n în baza {C1A , C2 A ,..., Cn A } ⊂ n
.
Procedeul practic care decurge de aici este următorul : se construieşte

primul tabel care conţine atât vectorii sistemului {C1A , C2 A ,..., Cn A } ⊂ n


cât şi
vectorii coloană ai matricei unitate de ordinul n după care se înlocuiesc pe rând,
n
elementele bazei iniţiale cu vectorii sistemului {C1A , C2A ,..., Cn A } ⊂ (utilizând
lema substituţiei).
47
 1 1 2 1
 
−1 1 3 2
Exemplul 10. Vom determina inversa matricei A= . Construim
 3 4 1 1
 
 2 3 2 − 1

tabelele:
Bc C1A C2A C3A C4A I
C14 C 24
I I
C 34
I
C 44
e1 1 1 2 1 1 0 0 0
e2 -1 1 3 2 0 1 0 0
e3 3 4 1 1 0 0 1 0
e4 2 3 2 -1 0 0 0 1

B1 C1A C2A C3A C4A I


C14 C 24
I I
C 34
I
C 44
e1 -2 -3 1 0 1 0 -1 0
e2 -7 -7 1 0 0 1 -2 0
C4A 3 4 1 1 0 0 1 0
e4 5 7 3 0 0 0 1 1

B2 C1A C2A C3A C4A I


C14 C 24
I I
C 34
I
C 44
C3A -2 -3 1 0 1 0 -1 0
e2 -5 -4 0 0 -1 1 -1 0
C4A 5 7 0 1 -1 0 2 0
e4 11 16 0 0 -3 0 4 1

B3 C1A C2A C3A C4A I


C14 C 24
I I
C 34
I
C 44
C3A 7/4 0 1 0 7/4 -3/4 -1/4 0
C2A 5/4 1 0 0 1/4 -1/4 1/4 0
C4A -15/4 0 0 1 -11/4 7/4 1/4 0
e4 -9 0 0 0 -7 4 0 1

B4 C1A C2A C3A C4A I


C14 C 24
I I
C 34
I
C 44
C3A 0 0 1 0 7/18 1/36 -1/4 7/36
C2A 0 1 0 0 -13/18 11/36 1/4 5/36
C4A 0 0 0 1 1/6 1/12 1/4 -5/12
C1A 1 0 0 0 7/9 -4/9 0 -1/9

Din ultimul tabel rezultă

48
 7 −4 0 − 1
 9 9 9
 − 13 11 1 5
A −1 =  18 36 4 36  .
 7 1 −1 7 
 18 36 4 36 
 1 1 1 − 5
 6 12 4 12 

2 1 1 1
 
3 1 2 1
Exerciţiul 9. Determinaţi inversa matricei A =  .
1 3 1 4
 
2 2 − 1 3

5. Calculul determinanţilor

Dacă dorim să calculăm valoarea determinantului ∆ al matricei pătratice


[ ]
A = a ij ∈Mn(ú) construim tabelul

Bc C1A C 2A ... C nA după care, utilizând lema substituţiei,


vom înlocui numărul maxim posibil de
e1 a11 a12 ... a1n
vectori ai bazei canonice cu coloane ale
e2 a21 a22 ... a2n
matricei A; dacă acest număr este mai
. ........…….........
mic decât n, unele coloane ale matricei A
en an1 an2 ... ann
vor fi combinaţii liniare ale celorlalte

coloane şi deci ∆ = det A = 0. În cazul în care toţi vectorii bazei canonice se


înlocuiesc cu coloanele matricei A, înseamnă că am trecut de la matricea dată fie
la matricea unitate fie la o matrice obţinută din aceasta printr-o permutare a
coloanelor. Valoarea determinantului va fi ∆ = α1 α2 ... αn (-1)s unde s este
numărul de schimbări de coloane necesare pentru a transforma matricea finală în
matricea unitate.
De exemplu, determinantul matricei A din Exemplul 11 este
Det A = 1.1.(-4).(-9).(-1)4 = 36.

6. Rezolvarea sistemelor de ecuaţii liniare


Fie (S) un sistem de m ecuaţii cu necunoscutele x1, x2,..., xn :

 a 11 x 1 + a 12 x 2 + ... + a 1n x n = b 1
 a x + a x + ... + a x = b
 21 1 22 2 2n n 2
(S) 
 .................................................
 a m1 x 1 + a m 2 x 2 + ... + a mn x n = b m

49
unde aij, bi ∈ , 1 ≤ i ≤ m, 1 ≤ j ≤ n, iar xj∈ , 1 ≤ j ≤ n sunt numere reale
necunoscute . Folosind notaţiile
b 1  x1 
   
b 2  x 2 
A=[aij] ∈Mm×n( ), b = .  , X = . 
   
.  . 
b m  x 
   n

sistemul (S) se poate pune sub forma


(S’) A·X = b .
Prin utilizarea coloanelor matricei A sistemul (S) capătă forma

(S“) C 1A x 1 + C 2A x 2 + ... + C nA x n = b .

Exerciţiul 10. Definiţi noţiunea de soluţie a unui sistem liniar. Ce semnificaţie


are această noţiune pentru fiecare din cele trei tipuri de forme de prezentare a
unui sistem liniar? Ce interpretare are noţiunea de soluţie a sistemului (S”)?
Pentru verificare comparaţi cu [1] pag. 109.
...............................................................................................................................
...............................................................................................................................
...............................................................................................................................
Exemplul 11. Folosind interpretarea din Exerciţiul 14 vom rezolva sistemul
 x 1 + x 2 + x 3 − x 4 = −6

x 1 + x 2 − x 3 − x 4 = 0
 x + 2 x + 3 x + 4x = 5
 1 2 3 4 .
 2x + x + 2x + 3x = 1
 1 2 3 4
3x 1 + 2x 2 + x 3 + 2x 4 = 1

Construim tablourile
Bc C1A C2A C3A C4A b
e1 1 1 1 -1 -6
e2 1 1 -1 -1 0
e3 1 2 3 4 5
e4 2 1 2 3 1
e5 3 2 1 2 1
e1 0 0 2 0 -6
C1A 1 1 -1 -1 0
e3 0 1 4 5 5
e4 0 -1 4 5 1
e5 0 -1 4 5 1
e1 0 0 2 0 -6

50
C1A 1 0 -5 -6 -5
A
C2 0 1 4 5 5
e4 0 0 8 10 6
e5 0 0 8 10 6
A
C3 0 0 1 0 -3
A
C1 1 0 0 -6 -20
A
C2 0 1 0 5 17
e4 0 0 0 10 30
e5 0 0 0 10 30
A
C3 0 1 1 0 -3
A
C1 1 0 0 0 -2
A
C2 0 0 0 0 2
C4A 0 0 0 1 3
e5 0 0 0 0 0
A A A A
Deoarece b = −2C1 + 2C1 − 3C 3 + 3C 4 , rezultă că x1=-2, x2=2, x3=3, x4=3 este

unica soluţie a sistemului (sistemul de vectori coloane este bază într-un


subspaţiu ce conţine pe b, deci b se exprimă în mod unic ca o combinaţie
liniară a elementelor bazei).

Exerciţiul 11. Scrieţi sistemul din Exemplul precedent sub formele (S’) şi (S”).
Verificaţi apoi că (-2, 2, -3, 3) este soluţie pentru sistemul prezentat sub cele
trei forme.

Exerciţiul 12. Definiţi noţiunile:


sistem compatibil..................................................................................................
sistem incompatibil...............................................................................................
sistem compatibil determinat................................................................................
sistem compatibil nedeterminat.............................................................................

Exerciţiul 13. Enunţaţi teorema Kronecker-Capelli şi teorema Rouché-Frobenius.

Exemplul 12. Vom determina soluţia generală a sistemului


 2x 1 + x 2 − 4x 5 − x 6 = −9

4 x 1 + 3 x 2 + 2 x 3 + 2 x 4 − 2 x 5 + x 6 = 5
x + 2x + 2x + 6x + 2x = 23
 2 3 4 5 6
5x + 4x + 3x + 3x − x + x = 12
 1 2 3 4 5 6
10x 1 + 7 x 2 + 4x 3 + 4x 4 − 8x 5 − x 6 = 1

Construim tabelele
Bc C1A C2A C3A C4A C5A C6A b
e1 2 1 0 0 -4 -1 -9
e2 4 3 2 2 -2 1 5
e3 0 1 2 2 6 2 23
51
e4 5 4 3 3 -1 2 12
e5 10 7 4 4 -8 -1 1
C2A 2 1 0 0 -4 -1 -9
e2 -2 0 2 2 10 4 32
e3 -2 0 2 2 10 4 32
e4 -3 0 3 3 15 6 48
e5 -4 0 4 4 20 6 64
C2A 2 1 0 0 -4 -1 -9
C3A -1 0 1 1 5 2 16
e3 0 0 0 0 0 0 0
e4 0 0 0 0 0 0 0
e5 0 0 0 0 0 0 0
Rezultă egalităţile
C1A = 2C 2A − C 3A X 1 = (1,−2,1,0,0,0)
C 4A = C 3A X 2 = (0,0,1,−1,0,0)
C 5A = −4C 2A + 5C 3A ⇒ X 3 = (0,4,−5,0,1,0) .
X 4 = (0,1,−2,0,0,1)
C 6A = −C 2A + 2C 3A
X p = (0,−9,16,0,0,0)
b = −9C 2A + 16C 3A

Soluţia generală este X=Xp+k1X1+k2X2+k3X3+k4X4 ∀ k1, k2, k3, k4∈ , adică


x1 = k 1 x 3 = 16 + k 1 + k 2 − 5k 3 − 2k 4 x5 = k 3
.
x 2 = −9 − 2k 1 + 4k 3 + k 4 x 4 = −k 2 x6 = k 4
Xp este soluţie de bază nedegenerată. (De ce?)
Reamintim că sistemul omogen asociat sistemului nostru este
 2x 1 + x 2 − 4x 5 − x 6 = −9

4 x 1 + 3 x 2 + 2 x 3 + 2 x 4 − 2 x 5 + x 6 = 5
x + 2x + 2x + 6x + 2x = 23
 2 3 4 5 6 ;
5x + 4x + 3x + 3x − x + x = 12
 1 2 3 4 5 6
10x 1 + 7x 2 + 4x 3 + 4x 4 − 8x 5 − x 6 = 1

soluţia generală a lui este X=k1X1+k2X2+k3X3+k4X4 ∀ k1, k2, k3, k4∈ , adică
x1 = k 1 x 3 = k 1 + k 2 − 5k 3 − 2k 4 x5 = k 3
.
x 2 = −2k 1 + 4k 3 + k 4 x 4 = −k 2 x6 = k 4

În exemplul următor prezentăm un sistem incompatibil.

Exerciţiul 14. Arătaţi că sistemul


 x 1 − 2x 2 + 3x 3 − 4x 4 + x 5 = 4

 x 2 − x 3 + x 4 + 2x 5 = − 3
 x + 3x − 3x + 3x = 1
 1 2 4 5
 − 7 x + 3x + x + x = −3
 2 3 4 5
2x 1 + x 2 + 3x 3 − 7 x 4 + 4x 5 = 6

este incompatibil.

52
Capitolul IV

ELEMENTE DE PROGRAMARE LINIARĂ

Programarea liniară este acea ramură a programării matematice care se


ocupă de rezolvarea problemelor de programare pentru care atât funcţia obiectiv
cât şi restricţiile sunt funcţii liniare. Forma matematică generală a problemelor
de programare liniară, în forma în care este şi astăzi acceptată, a fost propusă
de G. Dantzig în 1947 care a propus şi un procedeu eficient de rezolvare –
metoda simplex.

§1. Metoda simplex de rezolvare a problemelor de


programare liniară
Ne vom ocupa numai de o anumită problemă simplificată dar a cărei rezol-
vare se generalizează şi se poate aplica în multe alte cazuri. Este vorba de aşa-
numita problemă standard de programare liniară.

1. Probleme care conduc la programe liniare


Vom prezenta mai întâi câteva probleme care vor permite să formulăm proble-
ma generală de programare liniară şi care vor evidenţia şi importanţa rezolvării
unei astfel de probleme.

a) Repartiţia optimă a culturilor agricole


O fermă agricolă are suprafaţa arabilă totală S pe care se vor cultiva culturile
A1, A2,..., An. Pe baza datelor statistice se ştie că producţia medie la hectar
pentru cultura Ai este qi t/ha. Cheltuielile de producţie (directe şi comune)
pentru cultura Ai sunt de ci mii lei/ha şi sunt limitate la un total C. Pe baza
acordului cu finanţatorul şi a comenzilor/necesităţilor proprii, fermierul îşi
planifică producţiile Qi pentru culturile Ai (i=1, 2, ..., n). Ştiindu-se că
beneficiul pe tona de produs Ai este bi se cere să se determine suprafeţele x1,
x2, ... , xn ce trebuie cultivate cu culturile A1, A2,..., An astfel încât să se obţină

53
beneficiu maxim fără a se depăşi totalul de cheltuieli alocate, cu realizarea
producţiei planificate şi cultivarea întregii suprafeţe.
Se obţine modelul matematic următor.
max (b 1 q 1 x 1 + b 2 q 2 x 2 + ... + b n q n x n )
 x + x + ... + x = S
 1 2 n
c x + c x + ... + c x ≤ C

 1 1 2 2 n n
q 1 x 1 ≥ Q 1 .
q x ≥ Q
 2 2 2
...................
q x ≥ Q
 n n n

b) Problema dietei
Este bine stabilit că menţinerea stării normale a unui individ este condi-
ţionată de prezenţa în hrană a unor anumite principii nutritive N 1 , N 2 ,..., N m
(glucide, lipide, calorii, etc.) în cantităţile b 1 , b 2 ,... şi respectiv bm ; cantităţile
b 1 , b 2 ,..., b m se numesc necesaruri biologice şi sunt stabilite de către biologi. Se
ştie că aceste principii nutritive se găsesc în alimentele A 1 , A 2 ,..., A n ; mai exact, se
ştie că într-o unitate din alimentul Aj se găsesc aij unităţi din principiul nutritiv
Ni . De asemenea se ştie că o unitate din alimentul Ai costă ci unităţi monetare.
Să se determine un meniu (raţie alimentară) care să asigure necesarul biologic la
un preţ minim. Dacă vom nota cu xi ( i =1,2,..,n) cantitatea (încă necunoscută)
din alimentul Ai care trebuie inclusă în meniu (raţie), determinarea meniului
înseamnă determinarea vectorului ( x 1 , x 2 ,..., x n ).
Datele acestei probleme se pun sub forma următorului tabel

A1 A2 … Aj … An Necesar biologic
N1 a11 a12 … a1j … a1n b1
N2 a21 a22 … a2j … a2n b2
: : : … : … : :
Ni ai1 ai2 … aij … ain bi
: : : … : … : :
Nm am1 am2 … amj … amn bm
Cost unitar c1 c2 … cj … cn
Rezultă că costul total al raţiei alimentare este
n
(1) f ( x 1 , x 2 ,..., x n )= t C ⋅ X = ∑c
j=1
j ⋅xj.

Condiţia ca meniul ( x 1 , x 2 ,..., x n ) să asigure necesarul biologic de bi unităţi din


principiul nutritiv Ni este

54
n

∑a
j=1
ij x j ≥ b i (i = 1, m ) .

Înseamnă că funcţia obiectiv (1) va fi minimizată în raport cu restricţiile:


n
(2) ∑a
j=1
ij x j ≥ bi i = 1, m .

În plus, aşa cum este firesc, trebuie satisfăcute condiţiile de nenegativitate

(3) xj ≥ 0 j = 1, n .

Suntem conduşi la problema


 t
min CX

 n
(P.L.I) ∑ a ij x j ≥ b i i = 1,2,..m .
 j=1

x i ≥ 0, i = 1,2,...n

Problemele practice descrise mai sus, conduc la următoarea problemă
matematică, problemă care face obiectul programării liniare.

Fie A = [a ij ]mxn o matrice reală, C = t [c 1 c 2 ... c n ] şi b= t [b 1 b 2 ... b m ] -

vectori coloană cunoscuţi iar X= t [x 1 x 2 ... x n ] vectorul coloană al necunoscutelor.


Se pune problema să se determine maximul funcţiei obiectiv tCX în raport cu
restricţiile:

(4) AX = b

(5) X≥0

(aici X ≥ 0 este o notaţie prescurtată pentru condiţiile x j ≥ 0 j = 1, n ).

Suntem deci interesaţi să rezolvăm problema



max t CX


 n

(P.L.S.)  ∑
 j=1
a ij x j = b i i = 1,2,..m .



x i ≥ 0, i = 1,2,...n


Această problemă se numeşte program liniar standard .

55
2. Descrierea algoritmului simplex
Se presupune că m = r , că există o bază admisibilă B şi că X 0 este
soluţia admisibilă de bază corespunzătoare. Fără a restrânge generalitatea vom
presupune că B = { a 1 , a 2 ,......, a m } şi că X0=[x10, x20, ... ,xm0, 0,...,0]. Fie

( )
λ jk j = 1, m; k = 1, n coordonatele vectorilor a k în baza B = {a 1 , a 2 ,......, a m };
m
se calculează cantităţile TCXo şi d k = ∑ λ ik ⋅ c i − c k , k = 1,2,..., n şi se comple-
i =1

tează tabelul 1.
Tabelul 1
CB Cj → c1 c2 ... cm c m +1 ... cj ... cn
↓ B X0 a1 a2 ... am am + 1 ... aj ... an
c1 a1 x10 1 0 ... 0 λ 1, m + 1 ... λ 1, j ... λ 1, n
c2 a2 x 20 0 1 ... 0 λ 2 ,m + 1 ... λ 2, j ... λ 2 ,n

. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
ci ai xi 0 0 0 ... 0 λ i ,m + 1 ... λ i, j ... λ i ,n

. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
cm am xm 0 0 0 1 λ m ,m + 1 ... λ m, j ... λ m ,n
T
CX 0 0 0 ... 0 dm +1 ... dj ... dn

După completarea Tabelului 1 se testează optimalitatea soluţiei cu ajutorul


Teoremei 4. Dacă răspunsul este afirmativ, adică toţi dk ≥0, problema poate fi
considerată rezolvată (deoarece s-a găsit o soluţie optimă şi în general nu se
urmăreşte obţinerea tuturor soluţiilor optime, ci numai a uneia dintre ele).
În caz contrar, adică dacă există j astfel încât d j < 0 , soluţia iniţială X0

nu este optimă.
Există două posibilităţi :
1.Dacă există un indice j pentru care cantitatea d j este strict negativă şi toţi

(
λ . ij ≤ 0 i = 1, m ) atunci programul liniar nu are optim finit şi determinarea lui nu
mai interesează din punct de vedere matematic.
2. În caz contrar cazului 1 soluţia se poate îmbunătăţi. Se iniţiază prima iterată
a algoritmului simplex. Aceasta revine la determinarea vectorilor a j şi a i care

intră şi respectiv ies din bază.


56
Vectorul a j (cel care intră în bază) se corespunde cantităţii d j de

valoare negativă minimă: d j = min {d i | d i < 0} .

Vectorul a i , care intră în bază, se determină corespunzător indicelui


x i0 x
pentru care = min k 0 ,
λ ij λ kj > 0 λ kj

Odată stabiliţi cei doi vectori, se recalculează elementele Tabelului 1


construind un tabel de acelaşi tip corespunzător noii baze, adică vor fi
calculate, pe baza lemei substituţiei, coordonatele vectorilor coloană în baza
obţinută înlocuind ai cu aj .
După completarea noului tabel cu cantităţile d k , k = 1,2,.., n , se testează
optimalitatea noii soluţii. Dacă noua soluţie este optimă algoritmul se opreşte.
Dacă nu, se începe o nouă iteraţie.
În cazul în care testul de optimalitate dă răspuns afirmativ, ultimul tabel
simplex conţine soluţia programului liniar. Componentele din coloana X 0 sunt
chiar componentele bazice ale soluţiei optime (celelalte sunt nule), iar t C ⋅ X 0
reprezintă valoarea optimă a funcţiei obiectiv.

Ţinând cont de egalitatea min f(x) = - max [-f(x)], se pot rezolva şi


probleme de minimizare.

Exemplul 1. Să se determine soluţia optimă a programului liniar


min ( − x1 + 3x 2 + 2x 3 − 3x 5 )

  2x 1 − 2 x 2 + x 3 − 3 x 4 ≤ −5

3x1 + 4x 2 − 2x 3 − 3x 4 = 12 .
  2x − x + 3 x + x + x = 4
 1 2 3 4 5
x1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0, x 4 ≥ 0, x 5 ≥ 0

Ţinând cont că min (-x1+3x2+2x3-3x5)= -max (x1-3x2-2x3+3x5) şi de faptul că este


indicat ca toţi termenii liberi să fie nenegativi trecem la rezolvarea problemei
max ( x1 − 3x 2 − 2x 3 + 3x 5 )

  − 2x 1 + 2 x 2 − x 3 + 3 x 4 ≥ 5

3x1 + 4x 2 − 2x 3 − 3x 4 = 12 .
  2x − x + 3 x + x + x = 4
 1 2 3 4 5
x1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0, x 4 ≥ 0, x 5 ≥ 0

Pentru a obţine un program liniar standard transformăm prima restricţie în ega-


litate folosind variabila de compensare (de ecart) y. Rezultă

57
max ( x1 − 3x 2 − 2x 3 + 3x 5 )

  − 2x 1 + 2x 2 − x 3 + 3x 4 − y = 5

3x1 + 4x 2 − 2x 3 − 3x 4 = 12 .
  2x − x + 3x + x + x = 4
 1 2 3 4 5
x1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0, x 4 ≥ 0, x 5 ≥ 0, y ≥ 0

Matricea sistemului de restricţii conţine numai coloana a treia a matricei unitate


de ordinul 3 deci nu putem obţine o bază admisibilă şi soluţia admisibilă de
bază corespunzătoare (în caz că există). Apelăm la metoda celor două faze
(vezi [1] pag. 147) dar vom introduce atâtea variabile artificiale cât va fi
suficient să putem găsi uşor o bază admisibilă. Vom construi programul
ajutător
min ( z 1 + z 2 ) = − max ( − z 1 − z 2 )

  − 2x 1 + 2x 2 − x 3 + 3x 4 − y + z 1 = 5

3x1 + 4x 2 − 2x 3 − 3x 4 + z 2 = 12 .
  2x − x + 3x + x + x = 4
 1 2 3 4 5
x1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0, x 4 ≥ 0, x 5 ≥ 0, y ≥ 0, z 1 ≥ 0, z 2 ≥ 0

Matricea sistemului de restricţii este


− 2 2 −1 3 0 −1 0 1
 
A= 3 4 −2 −3 0 0
1 0
 2 − 1
.
3 1 1 0 0 0
a1 a2 a3 a4 a5 a6 a7 a8

Se constată că baza B=(a7, a8, a5) este bază admisibilă pentru care X0=(0, 0, 0,
0, 4, 0, 5, 12) este soluţia admisibilă de bază corespunzătoare. Coordonatele
coloanelor matricei A în baza B sunt chiar componentele lor deoarece B este
chiar baza canonică din 3. Deoarece rangul matricei A este egal cu numărul de
restricţii construim tabelele
cB cj → 0 0 0 0 0 0 -1 -1
↓ B X0 a1 ⇓ a2 a3 a4 a5 a6 a7 a8
-1 ↵ a7 5 -2 2 -1 3 0 -1 1 0
-1 a8 12 3 4 -2 -3 0 0 0 1
0 a5 4 2 -1 3 1 1 0 0 0
-17 -1 -6 3 0 0 1 0 0
0 a2 5/2 -1 1 -1/2 3/2 0 -1/2 1/2 0
-1 ↵ a8 2 ⇓7 0 0 3 0 2 -1/2 1
0 a5 13/2 1 0 5/2 5/2 1 -1/2 1/2 0
-2 -7 0 0 -3 0 -1 1/2 0
0 a2 39/14 0 1 -1/2 27/7 0 -3/14 6/7
0 a2 2/7 1 0 0 3/7 0 2/7 -1/14 1/7
0 a5 87/14 0 0 5/2 29/14 1 -1/14 13/28

58
0 0 0 0 0 0 0 1 1
Faza II
cB cj → 2 3 1 -2 0 0
↓ B X0 a1 a2 ⇓ a3 a4 a5 ⇓ a6
3 a2 39/14 0 1 -1/2 3/14 0 -3/14
2 a1 2/7 1 0 0 -9/7 0 2/7
0 ↵ a5 87/14 0 0 5/2 53/14 1 -11/14
125/7 0 0 -5/2 1/14 0 -1/14
3 a2 141/35 0 1 0 34/35 1/5 -26/70
2 ↵ a1 2/7 1 0 0 -9/7 0 2/7
1 a3 87/35 0 0 1 53/35 2/5 -11/35
104/35 0 0 0 12/35 1 -6/7
3 a2 22/5 13/10 1 0 -3/7 1/5 0
0 a6 1 7/2 0 0 -9/2 0 1
1 a3 98/35 11/10 0 1 1/10 2/5 0
16 3 0 0 57/70 1 0
Din ultimul tabel rezultă că valoarea optimă este –16 iar soluţia optimă este
Xopt=(0, 3, 98/35, 0, 0).

Exemplul 2. Vom rezolva problema dietei corespunzătoare tabelului următor


F1 F2 Necesar biologic (bi)
N1 0,1 0,2 0,4
N2 0,3 0,1 0,6
N3 0,1 0,4 0,8
N4 0,2 0,1 1,2
Costuri unitare cj 1,4 1,8
Modelul matematic corespunzător este
min (1,4x1 + 1,8x 2 )
 0,1x + 0,2x ≥ 0,4
 1 2
0,3x + 0,1x ≥ 0,6
1 2 .
0,1x + 0,4x ≥ 0,8
 1 2
0,2x + 0,1x ≥ 1,2
 1 2
x1 ≥ 0, x 2 ≥ 0

Trecem la problema echivalentă


min (14x1 + 18x 2 ) = 2 min( 7 x1 + 9x 2 )
 x + 2x ≥ 4
 1 2
3x + x ≥ 6
1 2 .
x + x ≥ 8
 1 2
2x + x ≥ 12
 1 2
x1 ≥ 0, x 2 ≥ 0

Utilizând variabile de compensare (ecart) îi asociem în mod obişnuit programul


liniar standard

59
max(−7 x1 − 9x 2 )

  x 1 + 2x 2 − u 1 = 4
3x + x − u = 6
1 2 2 .
x + x − u = 8
 1 2 3
2x + x − u = 12
 1 2 4
x1 ≥ 0, x 2 ≥ 0, u 1 ≥ 0, u 2 ≥ 0, u 3 ≥ 0, u 4 ≥ 0
Matricea sistemului de restricţii nu conţine coloanele matricei unitate de ordinul 4,
deci vom folosi metoda celor două faze. Programul liniar standard asociat este:
min( v 1 + v 2 + v 3 + v 4 ) = − max(− v 1 − v 2 − v 3 − v 4 )

  x 1 + 2x 2 − u 1 + v 1 = 4
3x + x − u + v = 6
1 2 2 2 .
x + x − u + v = 8
 1 2 3 3
2x + x − u + v = 12
  1 2 4 4
x 1 ≥ 0, x 2 ≥ 0, u 1 ≥ 0, u 2 ≥ 0, u 3 ≥ 0, u 4 ≥ 0, v 1 ≥ 0, v 2 ≥ 0, v 3 ≥ 0, v 4 ≥ 0
Matricea sistemului de restricţii are 10 coloane pentru care B=(a7, a8, a9, a10)
este bază admisibilă a cărei soluţii admisibile de bază corespunzătoare este
X0=(0, 0, 0, 0, 0, 0, 4, 6, 8, 12). Deoarece baza B este baza canonică din 4
coloanele matricei sistemului de restricţii se exprimă în mod evident sub formă
de combinaţii liniare ale bazei B.
Faza I
cB cj → 0 0 0 0 0 0 -1 -1 -1 -1
↓ B X0 ⇓a1 ⇓a2 ⇓a3 ⇓a4 a5 a6 a7 a8 a9 a10
-1 ↵a7 4 1 2 -1 0 0 0 1 0 0 0
-1 a8 6 3 1 0 -1 0 0 0 1 0 0
-1 a9 9 1 4 0 0 -1 0 0 0 1 0
-1 a10 12 2 1 0 0 0 -1 0 0 0 1
-31 -7 -8 1 1 1 1 0 0 0 0
0 a2 2 ½ 1 -½ 0 0 0 ½ 0 0 0
-1 a8 4 5/2 0 ½ -1 0 0 -½ 1 0 0
-1 ↵a9 1 -1 0 2 0 -1 0 -2 0 1 0
-1 a10 10 3/2 0 ½ 0 0 -1 -½ 0 0 1
-15 -3 0 -3 1 1 1 4 0 0 0
0 a2 9/4 1/4 1 0 0 -1/4 0 0 0 1/4 0
-1 ↵a8 15/4 11/4 0 0 -1 1/4 0 0 1 -1/4 0
0 a3 1/2 -½ 0 1 0 -½ 0 -1 0 ½ 0
-1 a10 39/4 7/4 0 0 0 1/4 -1 0 0 -1/4 1
-27/2 -9/2 0 0 1 -½ 1 1 0 3/2 0
0 a2 21/11 0 1 0 1/11 -3/11 0 0 -1/11 0
0 a1 15/11 1 0 0 -4/11 1/11 0 0 4/11 -1/11 0
0 a3 13/11 0 0 1 -2/11 -5/11 0 -1 2/11 0
-1 ↵a10 81/11 0 0 0
7/11 1/11 -1 0 -7/11 -1/11 1

0 0 0 -7/11 -1/11 1 1 18/11 1/11 0


0 a2 6/7 0 1 0 0 -2/7 1/7 0
0 a1 39/7 1 0 0 0 1/7 -4/7 0
0 a3 23/7 0 0 1 0 -3/7 -2/7 -1
0 a4 81/7 0 0 0 1 1/7 -11/7 0 -1 -1/7
0 0 0 0 0 0 0 1 1 1 1

60
Trecem la Faza II. Renunţăm la coloanele corespunzătoare necunoscutelor arti-
ficiale dar revenim la costurile iniţiale.

Faza 2
cB cj → -7 -9 0 0 0 0
↓ B X0 a1 a2 a3 a4 a5 a6
-9 a2 6/7 1 0 0 0 -2/7 1/7
-7 a1 39/7 0 1 0 0 1/7 -4/7
0 a3 23/7 0 0 1 0 -3/7 -2/7
0 a4 81/7 0 0 0 1 1/7 -11/7
327/7 0 0 0 0 11/7 19/7
Prin urmare valoarea optimă este 2/10·327/7 iar soluţia optimă este Xopt=(39/7; 6/7).
Construim acum problema dual-simetrică asociată programului analizat mai sus.
max (4y 1 + 6y 2 + 9y 3 + 12y 4 )

y 1 + 3y 2 + y 3 + 2y 4 ≤ 7
  2y + y + 4y + y ≤ 9 .
 1 2 3 4
y ≥ 0, y ≥ 0
 1 2

Folosind variabile de compensare obţinem programul standard


max (4y 1 + 6y 2 + 9y 3 + 12y 4 )

y 1 + 3y 2 + y 3 + 2y 4 + z 1 = 7
  2y + y + 4y + y + z = 9 .
 1 2 3 4 2
y ≥ 0, y ≥ 0, y ≥ 0, y ≥ 0, z ≥ 0, z ≥ 0
 1 2 3 4 1 2

Matricea sistemului de restricţii conţine coloanele matricei unitate de ordinul


doi, deci B=(a5, a6) este bază admisibilă cu soluţia admisibilă de bază X0=(0, 0,
0, 0, 7, 9). Construim tabelele
cB cj → 4 6 9 12 0 0
↓ B X0 a1 a2 ⇓ a3 ⇓ a4 a5 a6
0 ↵ a5 7 1 3 1 2 1 0
0 a6 9 2 1 4 1 0 1
0 -4 -6 -9 -12 0 0
12 a4 7/2 1/2 3/2 1/2 1 1/2 0
0 a6 11/2 3/2 -1/2 7/2 0 -1/2 1
42 2 12 -3 0 6 0
12 a4 18/7 2/7 11/7 0 1 4/7 -1/7
9 a3 11/7 3/7 -1/7 1 0 -1/7 2/7
327/7 23/7 81/7 0 0 39/7 6/7
Exerciţiul 1. Citiţi din ultima linie a problemei duale soluţia problemei primale
şi din ultima linie a problemei primale soluţia problemei duale. Se verifică sau
nu indicaţiile teoretice din [1] pag. 161-162?

Exemplul 3. Vom pregăti pentru rezolvare programul liniar


61
min ( −2x 1 + x 2 + x 3 )

x 1 − 2x 2 + 5x 3 ≥ 5
  2x + x − 3 x ≤ 2 .
 1 2 3
x > 0, x < 0, x − oarecare
 1 2 3

Introducem variabilele nenegative y1, y2, y3 prin y1=-x2, x3=y2-y3. Problema se


transformă în

min ( −2x 1 − y 1 + y 2 − y 3 )

x 1 + 2y 1 + 5y 2 − 5y 3 ≥ 5
  2x − y − 3y − y ≤ 2 .
 1 1 2 3
x > 0, y > 0, y ≥ 0, y ≥ 0
 1 1 2 3

Utilizând variabilele de compensare z1 şi z2 se trece la problema

max ( 2x 1 + y 1 − y 2 + y 3 )

x 1 + 2y 1 + 5y 2 − 5y 3 − z 1 = 5
  2x − y − 3y − y + z = 2 .
 1 1 2 3 2
x > 0, y > 0, y ≥ 0, y ≥ 0, z ≥ 0, z ≥ 0
 1 1 2 3 1 2

Această problemă se rezolvă utilizând metoda celor două faze (Exerciţiu!).

62
Capitolul V

ELEMENTE DE TEORIA GRAFURILOR

În numeroase domenii de activitate şi mai ales în cercetare se întâlnesc


scheme care pot fi reprezentate prin puncte şi arce (orientate sau nu) care unesc
aceste puncte. Ca exemple cităm: circuitele electrice în fizică, electronică şi elec-
trotehnică, diagramele moleculare în chimie, reţelele de comunicaţii şi transport,
dendogramele şi reţelele neuronice în biologie, diagramele de organizare în
economie, etc..
La început, teoria grafurilor părea a fi un capitol destul de neînsemnat al
matematicii având de a face mai mult cu jocurile şi amuzamentele matematice.
Apariţia în 1736 a primului memoriu de teoria grafurilor, datorat lui L. Euler, a
atras atenţia asupra importanţei acestui domeniu.
În prezent, pe lângă utilizarea în cercetarea matematică, teoria grafurilor
este intens utilizată în biologie, economie, psihologie, etc..

§1. Grafuri orientate


1. Definiţii. Exemple
Grafurile sunt obiectele matematice obţinute abstractizând figurile geome-
trice formate din linii (curbe simple) care unesc o familie de puncte; dacă aceste
linii sunt toate orientate se vorbeşte de grafuri orientate.

Definiţia 1. a) Un graf orientat G este o pereche G = (X,U) formată dintr-o mulţi-


me nevidă X ale cărei elemente se numesc vârfuri şi o mulţime U de perechi
ordonate de elemente din X ale cărei elemente se numesc arce.
b) Pentru un arc u=(x, y)∈U vârful x se numeşte extremitate iniţială (sau origine)
iar vârful y se numeşte extremitate finală (sau extremitate); se mai spune că
vârfurile x şi y sunt adiacente sau că x şi y sunt incidente arcului u. Un vârf
neincident nici-unui arc se numeşte vârf izolat
c) Dacă u = (x, y) ∈ U se spune că u este incident spre exterior din x şi incident
spre interior lui y; se mai spune că muchia u este adiacentă vârfurilor x şi y.
Exerciţiul 1. Arătaţi că Definiţia 1 este echivalentă cu Definiţia 1 din [1] pag. 178.

Graful format numai din vârfuri izolate se numeşte graf nul.


Dacă X şi U sunt mulţimi finite, vom spune că graful G este graf finit ;
numărul X = card X se numeşte ordinul grafului. În cele ce urmează ne vom

ocupa numai de grafuri finite.

Un arc pentru care extremităţile coincid se numeşte buclă. Pentru con-


secvenţa prezentării, vom considera pe orice buclă orientarea dată de sensul direct
trigonometric; de obicei bucla este considerată de două ori (odată cu un sens,
odată cu sensul opus) , dar noi vom folosi convenţia făcută mai înainte .
Fiecărui graf i se poate asocia o imagine geometrică obţinută reprezentând
elementele mulţimii X prin puncte sau cerculeţe mici iar mulţimea arcelor prin
curbe fără autointersecţii orientate (prin săgeţi care indică orientarea de la originea
spre extremitatea fiecărui arc). În reprezentarea grafică se caută ca - atât cât este
posibil - arcele să nu se intersecteze, pentru a nu se confunda intersecţiile arcelor
cu vârfuri ale grafului. Grafurile pentru care este posibil acest lucru se numesc
grafuri planare. Grafurile planare sunt utilizate în proiectarea şi realizarea circui-
telor electronice. Există grafuri care nu sunt planare.

Exemplul 1. Considerăm graful G = (X,U) unde X = {x1, x2, x3, x4, x5, x6, x7} şi
U = {(x1, x1), (x1 ,x2), (x1 ,x3), (x2 ,x1), (x2 ,x3), (x2 ,x4), (x3 ,x1), (x3 ,x2), (x3 ,x4),
(x5 ,x6)}. Imaginea geometrică a acestui graf este dată în Fig.1.

X2
X4 X7

X6
X1
X5
X3

Fig. 1
Exerciţiul 2. Identificaţi în graful de mai sus vârfurile izolate şi câteva perechi de
vârfuri neadiacente.
Răspuns..........................................................................................................................

Definiţia 2. a) Un graf G’ = (X’, U’) se numeşte subgraf al grafului G = (X,U)

74
dacă X’⊂X, U’ ⊂ U şi U’ este format numai din arce adiacente la vârfuri din X’.
În cazul particular X’=X se spune că G’ este graf parţial.
b) Graful GA=(A, V) unde A⊂X este o submulţime nevidă de vârfuri iar V este
mulţimea tuturor arcelor din U cu extremităţile în A se numeşte subgraful lui G
generat de A.
c) Graful GV=(A, V) unde V⊂U este o submulţime nevidă de arce iar A este
mulţimea tuturor vârfurilor din X adiacente arcelor din V se numeşte subgraful
lui G generat de V.

Exerciţiul 3. În graful din Exerciţiul 1 identificaţi două grafuri parţiale, subgraful


generat de familiile de vârfuri A1= {x1, x2, x3, x4 }, A2= {x5, x6 }, A3= {x7},
subgraful generat de familia de arce V= {(x2 ,x1), (x2 ,x3), (x3 ,x1), (x3 ,x2), (x5 ,x6)}.

Definiţia 3. a) Un arc u = (x, y) ∈U este incident spre exterior mulţimii (nevide)


de vârfuri A ⊂ X dacă x ∈A şi y ∉ A; vom nota cu ω + (A) mulţimea arcelor
incidente spre exterior mulţimii A.
b) Un arc u = (x, y) ∈ U este incident spre interior mulţimii nevide de
vârfuri A ⊂ X dacă x ∉ A şi y ∈ A; vom nota cu ω-(A) mulţimea arcelor
incidente spre interior mulţimii A.
c) Un arc u = (x, y) ∈ U este incident mulţimii (nevide) de vârfuri A ⊂ X
dacă sau x ∈ A sau y ∈ A dar {x, y} ⊄ A; mulţimea ω (A) = ω + (A) ∪ ω − (A)
reprezintă mulţimea arcelor incidente mulţimii A.

Exerciţiul 4. În graful din Exerciţiul 1 determinaţi ω + (A), ω − (A) şi ω (A) pentru


A= {x1, x2, x4, x6}.
Răspuns....................................................................................................................................

Definiţia 4. a) Se numeşte lanţ de lungime q în graful orientat G = (X, U) o


succesiune ordonată de q arce (ui1 ,..., ui q ) cu proprietăţile :

• ui k ≠ ui k +1 , ∀ k ∈ {1, 2, ... , q –1},

• pentru orice k (2 ≤ k ≤ q-1) , una dintre extremităţile arcului ui k coincide

cu o extremitate a arcului ui k -1 , iar cealaltă extremitate coincide cu o extremitate a

arcului ui k +1 .

75
b) Extremitatea x a arcului u i1 care nu este extremitate a lui u i 2 şi

extremitatea y a arcului u i q care nu este extremitate pentru u i q −1 se numesc

extremităţile libere ale lanţului. Vom nota cu Lx,y un lanţ pentru care x, y sunt
extremităţile libere; îl vom numi şi x,y-lanţ. c) Un lanţ pentru care extremităţile
libere coincid se numeşte ciclu.

Este de remarcat faptul că prima condiţie din Definiţia 7 asigură că într-un


lanţ nu se vor folosi arce care să fie parcurse consecutiv o dată într-un sens şi o
dată în sens contrar .

Definiţia 5.a) Un lanţ se numeşte simplu dacă la parcurgerea sa fiecare arc


este întâlnit o singură dată. b) Un lanţ se numeşte elementar dacă la parcurgerea
sa fiecare vârf este întâlnit o singură dată. c) Un ciclu elementar care conţine toate
vârfurile grafului se numeşte ciclu hamiltonian. d) Un ciclu care foloseşte toate
arcele grafului se numeşte ciclu eulerian.

Definiţia 6. Un lanţ (ui1 ,..., ui q ) se numeşte drum dacă pentru orice k, 2 ≤

k ≤ q, extremitatea iniţială a lui ui k coincide cu extremitatea finală a arcului ui k -1 ;


dacă x şi y sunt extremităţile libere ale drumului, atunci spunem că avem un x,y-
drum şi-l notăm generic cu Dx,y . Un drum pentru care extremităţile libere coincid
se numeşte circuit. Drumul Dx,y este simplu sau elementar după cum lanţul
corespunzător este simplu sau elementar. Un drum este hamiltonian sau eulerian
după cum lanţul corespunzător este hamiltonian sau eulerian.

Exemplul 2. Considerăm graful reprezentat în Fig.2.

Lanţul L x x = (u2, u14, u11, u12,


1 8

u13, u14, u9) este de lungime 7,


are extremităţile libere x1 şi x8
şi foloseşte arcul u14 de două
ori, deci, implicit, foloseşte
vârfurile x4 şi x7 de câte două

Fig. 2
ori; în consecinţă, acest lanţ nu
este nici simplu nici elementar.

76
Lanţul L x x = (u14, u9, u10, u11, u7) este simplu dar nu este elementar pentru că
4 6

foloseşte de două ori vârful x7

Un exemplu de lanţ şi simplu şi elementar este lanţul L x x


= (u14, u9, u8, u6).
4 6

Lanţul L x x = (u2, u14, u11, u10) este drum simplu şi elementar pentru că,
1 8

începând cu arcul al doilea, originea unui arc este extremitate pentru arcul
precedent. Ca exemplu de ciclu evidenţiem lanţul (u14, u11, u12, u13), iar ca
exemplu de circuit evidenţiem drumul (u6, u8, u9, u5).

Exerciţiul 5. Evidenţiaţi în graful din Fig.2 un lanţ/drum simplu, un lanţ/drum


simplu care nu este elementar, un lanţ/drum care nu este simplu, un ciclu şi un
circuit.
Răspunsuri……………………………………………………………………………

……………………………………………………………………………………
…………...……………………………………………………………………….
Definiţia 7. a) Un graf orientat G = (X, U) se numeşte conex dacă pentru orice
două vârfuri distincte x,y ∈ X , există un x,y-lanţ. Orice subgraf conex
maximal al unui graf orientat G = (X, U) se numeşte componentă conexă a
grafului G; se acceptă că vârfurile izolate (neadiacente altor vârfuri) formează
componente conexe.
b) Un graf orientat G = (X, U) se numeşte tare-conex dacă pentru orice două
vârfuri distincte x,y ∈ X , există un x,y-drum .

Definiţia 8. a) Un graf conex, fără cicluri, care are cel puţin două vârfuri se
numeşte arbore. b) Un graf ale cărui componente conexe sunt arbori se numeşte
pădure. c) Un arbore care este graf parţial se numeşte arbore parţial.

Are loc următoarea teoremă de caracterizare a arborilor .

Teorema 1. Fie G = (X, U) un graf finit care are cel puţin două vârfuri şi n =
card X = X ≥ 2 . Următoarele proprietăţi sunt echivalente:

1°. G este arbore,


2°. G este fără cicluri şi are n-1 arce,
3°. G este conex şi are n-1 arce,
4°. oricare două vârfuri sunt unite printr-un lanţ şi numai unul.

77
Această teoremă dă posibilitatea să verificăm uşor dacă un graf este sau
nu un arbore.

Teorema 2. Un graf conţine un arbore parţial dacă şi numai dacă este conex.

Definiţia 9. Vârful a ∈X se numeşte rădăcină a grafului G = (X, U) dacă pentru


orice x ∈ X (a ≠x) există un drum de la a la x (adică orice vârf diferit de a este
accesibil din a în lungul unui drum).
Definiţia 10. Graful G = (X, U) se numeşte cvasi-tare-conex dacă pentru orice
două vârfuri x,y ∈ X, x ≠ y, există un vârf z ∈ X astfel încât x şi y sunt
accesibile dealungul unor drumuri ce pleacă din z .

Remarca 1. Orice graf cvasi-tare-conex este conex; reciproca nu este adevărată.

Definiţia 11. Orice arbore care are o singură rădăcină se numeşte arborescenţă.

Este nevoie să recunoaştem uşor dacă un graf este sau nu o arborescenţă.


În acest scop prezentăm următorul rezultat.

Teorema 3. Fie G = (X, U) un graf orientat finit care are cel puţin două vârfuri şi
n = card X = | X | . Următoarele proprietăţi sunt echivalente:
1°. G este arborescenţă,
2°. G este cvasi-tare-conex şi fără cicluri,
3°. G este cvasi-tare-conex şi are n-1 arce,
4°. există un vârf a ∈ X, care poate fi unit cu oricare alt vârf al grafului
printr-un singur drum ce pleacă din a.

Dacă G = (X, U) este un graf cvasi-tare-conex, atunci lăsând la o parte,


atât cât este posibil, arcele a căror îndepărtare nu modifică proprietatea de cvasi-
tare-conexitate, se obţine o arborescenţă.

§2. Grafuri neorientate

Fie X o mulţime nevidă. Definim perechea neorientată de extremităţi x şi


y ca fiind submulţimea {(x, y), (y, x)} ⊂ X × X ; vom nota cu [x, y] perechea
neorientată de extremităţi x şi y.

Definiţia 12. a) Un graf neorientat G este o pereche G = (X,U) formată dintr-o


mulţime nevidă X ale cărei elemente se numesc vârfuri şi o mulţime U de
perechi neordonate de elemente din X ale cărei elemente se numesc muchii.
78
b) Pentru muchia u=[x, y]∈U vârfurile x şi y se numesc extremităţi; se mai spune
că vârfurile x şi y sunt adiacente sau că x şi y sunt incidente muchiei u. Un vârf
neincident nici-unui arc se numeşte vârf izolat

Fiecărui graf neorientat i se poate asocia o imagine geometrică obţinută


reprezentând elementele mulţimii prin puncte sau cerculeţe mici iar mulţimea
muchiilor prin arce simple (fără autointersecţii) de curbă.

§3. Probleme de optim în grafuri

Suntem conduşi să asociem unui graf orientat sau nu, G = (X, U), o funcţie
l:U→ pe care o numim (în mod tradiţional) funcţie lungime sau lungime chiar
şi în cazul în care ia şi valori pozitive şi valori negative. Pentru grafuri dotate cu
funcţie de lungime se pun probleme de optimizare. Astfel de probleme se pot
rezolva şi prin metodele programării liniare, dar abordarea lor cu ajutorul
metodelor teoriei grafurilor este mai eficientă.

1. Problema arborelui parţial minimal/maximal

Exerciţiul 6. Revedeţi/ copiaţi algoritmul lui Kruskal ([1], pag. 188).

Exemplul 3. Să rezolvăm problema arborelui parţial minimal pentru graful neori-


entat G = (X, U) din Fig 3 dotat cu lungimi pozitive evidenţiate pe fiecare muchie
(ignoraţi pe moment numerele din paranteze!).
x2 2(3) x3
o o
4 4(6) 5
x1 o 8 o
1(2) o x8
3(5) 1
3(4) 5 1(1)
o o x6
x4 6 o
5(7)
x5

Fig. 3
x2 2(3) x3
o o
4(6)
x1 o 8 o
1(2) o x8
3(5) 1
3(4) 1(1)
o o x6
x4 o
5(7)
x5
Fig. 4

Pasul 1. Se ia u* = [x6, x8], v1=u*, V1={[x6, x8]} şi se trece la Pasul 2.


79
Pasul 2. - Se ia u* = [x7, x8], v2=u*, V2={[x6, x8], [x7, x8]} şi se reia Pasul 2.
- Se ia u* = [x2, x3], v3=u*, V3={[x6, x8], [x7, x8], [x2, x3]} şi se reia Pasul 2.
- Se ia u* = [x1, x4], v4=u*, V4={[x6, x8], [x7, x8], [x2, x3], [x1, x4], [x2, x4]} şi se
reia Pasul 2.
- Se ia u* = [x2, x4], v5=u*, V5={[x6, x8], [x7, x8], [x2, x3], [x1, x4], [x2, x4]} şi se
reia Pasul 2.
- Se ia u* = [x3, x7], v6=u*, V6={[x6, x8], [x7, x8], [x2, x3], [x1, x4], [x2, x4], [x3,
x7]} şi se reia Pasul 2.
- Se ia u* = [x5, x6], v7=u*, V7={[x6, x8], [x7, x8], [x2, x3], [x1, x4], [x2, x4], [x3,
x7], [x5, x6]} şi se reia Pasul 2.
- De această dată nu mai există u* cu proprietăţile indicate la Pasul 2.ii al algo-
ritmului, deci algoritmul se opreşte. Soluţia obţinută este arborele parţial H =
(X, V7).

Numărul pus între paranteze reprezintă ordinea alegerii muchiilor: prima


muchie aleasă va purta indicele (1), a doua (2), etc.. Îngroşând muchiile alese, se
evidenţiază arborele parţial minimal căutat, reprezentat şi separat în Fig. 4.

O soluţie a problemei arborelui parţial maximal pentru acelaşi graf este


reprezentată în Fig.5.

x2 2 x3
o o
4(5) 5(4)
8(1) 4(6)
x1 o o o x8
3(5) 1
1 1
3(7) 5(3)
o o x6
x4 6(2) o
5
x5
Fig. 5
Şi în rezolvarea problemei arborelui parţial maximal se recomandă să se îngroaşe
fiecare muchie aleasă şi să se scrie în paranteze lângă ea numărul care indică
numărul alegerii.(vezi Fig. 5).

2. Problema drumului minim/maxim

Exerciţiul 7. Revedeţi/ copiaţi algoritmul I (Dantzig, [1], pag. 188).


Exemplul 4. Să rezolvăm problema drumului minim pentru graful neorientat G =
(X, U) din Fig 6.

80
7 d
c o 1 e
o o
3 7
7 2 5
a o 2 4 1 o b
o
h
8 3
6 3
o o
f 8 g

Fig. 6.
Pasul 1. t(a) = 0, X1 = { a }.
Pasul 2. k = 1 : ω+(X1) = {(a,c),(a,f)}, min {t(a) + ℓ (a,c), t(a) + ℓ(a,f)} =
min {0+3, 0+6} = 3 = t(a) + ℓ(a,c), adică u* = (a,c). Deci y* = c, t(c) = 3, X2 = {a,c}.
k = 2 : ω+(X2) = {(a,f),(c,f),(c,d)}, min {t(a) + ℓ(a,f), t(c) + ℓ(c,f), t(c) +
ℓ(c,d)} = min {0+6, 3 +2, 3 + 7 } = 5 = t(c) + ℓ (c,f), adică u* = (c,f). Deci y* = f,
t(f) = 5, X3 = {a, c, f}.
k = 3 : ω+(X3) = {(f,d), (f,h), (f,g),(c,d)}, min {t(f) + ℓ (f,d), t(f) + ℓ (f,g),
t(c) + ℓ (c,d)} = min {5 +4, 5 + 8, 3 + 7} = 9 = t(f) + ℓ(f,d), adică u* = (f,d). Deci
y* = d, t(d) = 9, X4 = {a, c, f, d}.
k = 4 : ω+(X4) = {(d, e), (d, g), (d, h), (f, g), (f, h)}, min {t(d) + ℓ (d, e), t(d)
+ ℓ(d, g), t(d) + ℓ(d, h), t(f) + ℓ(f, g), t(f) + ℓ(f, h)} = min {9 + 1, 9 + 2, 9 + 7, 5 + 8,
5+8} = 10 = t(d) + ℓ(d, e), adică u* = (d, e). Deci y* = e, t(e) = 10, X5 = {a, c, f, d, e}.
k = 5 : ω+(X5) = {(d, g), (e, b), (e, g), (f, g),(f, h)}, min {t(d)+ ℓ(d, g), t(e)
+ ℓ( e, b), t(e) + ℓ(e, g), t(f) + ℓ(f, g), t(f) + ℓ(f, h)} = min {9+2, 10+ 7, 10 + 1, 5 +
8, 5 + 8} = 11 = t(e) + ℓ( e, g), adică u* = (e, g). Deci y* = g, t(g) = 11, X6 = {a, c,
f, d, e, g}. Evident, eticheta lui g se putea determina şi pe baza lui (d, g).
k = 6 : ω+(X6) = {(e,b),(g,b)}, min {t(e) + ℓ(e,b), t(g) + ℓ(g,b)} = min {10
+ 7, 11 + 3} = 14 = t(g) + ℓ(g,b), adică u* = (g,b). Deci y* = b, t(b) = 14, X7 =
={a, c, f, d, e, g, b}.
k = 7 : ω + (X7) = ∅ .
Se trece la Pasul 3 pentru că procedura de etichetare s-a încheiat.
Pasul 3. Deoarece b ∈ X7, rezultă că există drum de lumgime minimă
D *a ,b între a şi b având lungimea l( D *a ,b ) = t(b ) = 14. Drumul căutat este D *a ,b =

{(a,c), (c, f), (f, d), (d, e), (e, g), (g,b)}. Având în vedere că la pasul k=5 eticheta
lui g se putea determina şi pe baza lui (d, g), rezultă că şi drumul D *a ,b = {(a,c), (c,
f), (f, d), (d, g), (g,b)} este tot soluţie a problemei.

81
În aplicaţiile practice se obişnuieşte să se pună într-un cerc, lângă fiecare
vârf etichetat, eticheta care se calculează pe baza algoritmului şi să se îngroaşe
muchia u* determinată la etapa de lucru respectivă.

Exerciţiul 8. Aplicaţi pe exemplul de mai sus ”algoritmul” obţinut din algoritmul I


înlocuind peste tot operatorul minim cu operatorul maxim. Arătaţi că h nu are
etichetă unică. Se obţine sau nu răspuns la problema drumului maxim pentru
acest graf? Ce explicaţie daţi?

Exemplul 5. Vom rezolva problema drumului minim dintre vârfurile a şi b


pentru graful din Exemplul 4, utilizând algoritmul Bellman-Kalaba. În acest scop,
mai întâi redenumim vârfurile grafului ca în Fig. 7
x3
x2 7 o 1 x4
o o
3 7
7 2 5
x1 o 2 4 o x8
x
o 7
1
8 3
6 3
o o
x5 8 x6

Fig. 7
Construim tabelul
x1 x2 x3 x4 x5 x6 x7 x8
x1 0 3 +∞ +∞ 6 +∞ +∞ +∞
x2 +∞ 0 7 +∞ 2 +∞ +∞ +∞
x3 +∞ +∞ 0 1 +∞ 2 7 +∞
x4 +∞ +∞ +∞ 0 +∞ 1 +∞ 7
x5 +∞ +∞ 4 +∞ 0 8 8 +∞
x6 +∞ +∞ +∞ 5 +∞ 0 3 3
x7 +∞ +∞ +∞ +∞ +∞ +∞ 0 +∞
x8 +∞ +∞ +∞ +∞ +∞ +∞ +∞ 0
mi(0) +∞ +∞ +∞ 7 +∞ 3 +∞ 0
mi(1) +∞ +∞ 5 4 11 3 +∞ 0
mi(2) 17 12 5 4 9 3 +∞ 0
mi(3) 15 11 5 4 9 3 +∞ 0
mi(4) 14 11 5 4 9 3 +∞ 0
mi(5) 14 11 5 4 9 3 +∞ 0
Un drum minim de la x1=a la x8=b este Da,b*={(x1, x2), (x2, x5), (x5, x3), (x3, x6),
(x6, x8)}.
Exemplul 6. Vom rezolva problema drumului maxim dintre vârfurile x1 şi x8 ale
grafului din Fig. 8.

82
x3
x2 8 o 1 x4
o o
5 12
4 5 10 8
x1 o 7 o x8
o
9 x7 5
3 11
o o
x5 4 x6

Fig. 8
Construim tabelul următor:
x1 x2 x3 x4 x5 x6 x7 x8
x1 0 5 -∞ -∞ 3 -∞ 7 -∞
x2 -∞ 0 8 -∞ -∞ -∞ 4 -∞
x3 -∞ -∞ 0 1 -∞ -∞ -∞ -∞
x4 -∞ -∞ -∞ 0 -∞ -∞ -∞ 12
x5 -∞ -∞ -∞ -∞ 0 4 -∞ -∞
x6 -∞ -∞ -∞ 8 -∞ 0 -∞ 11
x7 -∞ -∞ 5 10 9 5 0 -∞
x8 -∞ -∞ -∞ -∞ -∞ -∞ -∞ 0
mi(0) -∞ -∞ -∞ 12 -∞ 11 -∞ 0
mi(1) -∞ -∞ 13 12 15 20 22 0
mi(2) 29 26 13 12 24 20 25 0
mi(3) 32 29 13 12 24 20 33 0
mi(4) 40 37 13 12 24 20 33 0
mi(5) 40 37 13 12 24 20 33 0

Un drum maxim de la x1=a la x8=b este D*x x = {(x1, x7), (x7, x5), (x5, x6), (x6,
1 8

x4), (x4, x8)}.


Exemplul 7. Vom rezolva problema drumului minim pentru graful din Fig.
9.a). În acest scop alegem arborescenţa H0 reprezentată în Fig. 9.b) care este
arbore parţial minimal.
x3
x2 5 o 7 x4
o o
-4 -3
1 -6 6
x1 o 2 -3 o x8
o 5
5 x7 8
-5 2
o o
x5 5 x6

Fig. 9.a)

83
-9
H0 x3 -2
-4 x 5 o 7 x4
2
o o
-4 -3
1 -6 6 -5
x8
0 x1 o 2 -3 o
o -3 5
5 x7 8
-5 -2
o o
-5 x5 5 x6 -5
Fig. 9.b)
Arcele neutilizate de H0 sunt {(x1, x7), (x2, x3), (x5, x6), (x6, x4), (x6, x8), (x7,
x4), (x7, x5), (x7, x6)}. Au loc relaţiile:
 − 3 = t 2 ( x 7 ) < t 2 ( x 1 ) + l( x 1 , x 7 ) = 0 + 2 = 2
 − 9 = t ( x ) < t ( x ) + l( x , x ) = − 4 + 5 = 1
 2 3 2 2 2 3
 − 5 = t ( x ) < t ( x ) + l( x , x ) = − 5 + 5 = 0
 2 6 2 5 5 6
 − 2 = t ( x ) < t ( x ) + l( x , x ) = − 5 + 5 = 0
 2 4 2 6 6 4

 − 5 = t 2 ( x 8 ) > t 2 ( x 6 ) + l( x 6 , x 8 ) = − 5 − 2 = − 7
 − 2 = t ( x ) < t ( x ) + l( x , x ) = − 3 + 6 = 3
 2 4 2 7 7 4
 − 5 = t ( x ) < t ( x ) + l( x , x ) = − 3 + 5 = 2 .
 2 5 2 7 7 5
 − 5 = t ( x ) < t ( x ) + l( x , x ) = − 3 + 8 = 5
 2 6 2 7 7 6

Alegem u*=(x6, x8) şi construim arborescenţa H1 reprezentată în Fig. 9.c).

-9
H1 x3 -2
-4 x 5 o 7 x4
2
o o
-4 -3
1 -6 6 -7
x8
0 x1 o 2 -3 o
o -3 5
5 x7 8
-5 -2
o o
-5 x5 5 x6 -5

Fig. 9.c)
Arcele neutilizate de H1 sunt {(x1, x7), (x2, x3), (x4, x8), (x5, x6), (x6, x4), (x7,
x4), (x7, x5), (x7, x6)}. Au loc relaţiile:
 − 3 = t 3 ( x 7 ) < t 3 ( x 1 ) + l( x 1 , x 7 ) = 0 + 2 = 2
 − 9 = t ( x ) < t ( x ) + l( x , x ) = − 4 + 5 = 1
 3 3 3 2 2 3
 − 7 = t ( x ) < t ( x ) + l( x , x ) = − 2 − 3 = − 5
 3 8 3 4 4 8
 − 5 = t ( x ) < t ( x ) + l( x , x ) = − 5 + 5 = 0
 3 6 3 5 5 6

84
 − 2 = t 3 ( x 4 ) < t 3 ( x 6 ) + l( x 6 , x 4 ) = − 5 + 5 = 0
 − 2 = t ( x ) < t ( x ) + l( x , x ) = − 3 + 6 = 3
 3 4 3 7 7 4
 − 5 = t ( x ) < t ( x ) + l( x , x ) = − 3 + 5 = 2 .
 3 5 3 7 7 5
 − 5 = t ( x ) < t ( x ) + l( x , x ) = − 3 + 8 = 5
 3 6 3 7 7 6

Algoritmul se opreşte şi D*x x = {(x1, x2), (x2, x7), (x7, x3), (x3, x4), (x4, x6), (x6,
1 8

x8)} este drumul de lungime minimă egală cu –7.

Exemplul 8. Vom rezolva problema drumului maxim pentru graful din figura 10.
x3
x2 -1 o 6 x4
o o
3 -4
-5 8 2
x1 o -6 7 o x8
x -3
o 7
-2 -5
-3 -2
o o
x5 7 x6

Fig. 10
Conform algoritmului III, se trece la graful din Fig. 11.a) căruia i se aplică
algoritmul II. În acest scop se alege de exemplu arborescenţa H0 reprezentată
în Fig. 11.b) care este arbore parţial minimal.
x3
x2 1 o -6 x4
o o
-3 4
5 -8 -2
x1 o 6 -7 o x8
x
o 7
3
2 5
3 2
o o
x5 -7 x6

Fig. 11.a)
-4 x3
-3 x2 1 o -6 x-10
4
o o
-3 4
5 -8 -2
0 x1 o 6 -7 o x8 -2
x
o 7
3
2 5
3 5 2
o o
3 x5 -7 -4 x6

Fig. 11.b)
Continuarea o propunem ca exerciţiu. După ce algoritmul de minimizare pentru
graful din Fig. 11.b) se opreşte, conform indicaţiilor algoritmului III, conside-
răm graful obţinut schimbând semnul lungimilor arcelor în ultimul graf.
Eticheta lui x8 va fi lungimea drumului maxim de la x1 la x8.

85
3. Problema fluxului maxim şi a secţiunii minime
Exemplul 9. Să determinăm fluxul maxim pentru reţeaua de transport redusă
reprezentată în Fig.12 ; lângă arce, în paranteze, sunt trecute capacităţile arcelor
corespunzătoare.

Pornim de la fluxul nul . Folosind marcajele construite pe baza algorit-


mului, se aleg pe rând lanţurile şi cantităţile ε corespunzătoare :
1°. L x1 ,x8 = {(x1, x6), (x6, x5), (x5, x8)} = L+x1x8 , ε = ε1 = min {10 - 0, 4 - 0, 6 - 0} = 4,

2°. L x1 ,x8 = {(x1, x2), (x2, x3), (x3, x8)} = L+x1x8 , ε = ε1 = min {9 - 0, 6 - 0, 17 - 0} = 6,

3°. L x1 ,x 8 = {(x1, x2), (x2, x7), (x7, x8)} = L+x1x8 , ε = ε1 = min {9 - 6, 5 - 0, 11 - 0} = 3,

4°. L x1 ,x8 = {(x1, x4), (x4, x2), (x2, x7), (x7, x8)} = L+x1x8 , ε = ε1 = min {7 - 0, 3 - 0,

5 -3, 11 - 3} = 2,
5°. L x1 ,x 8 = {(x1, x4), (x4, x7), (x7, x8)} = L+x1x8 , ε = ε1 = min {7 - 2, 8 - 0, 11 - 5} = 5,

6°. L x1 ,x 8 = {(x1, x6), (x6, x7), (x7, x8)} = L+x1x 8 , ε = ε1 = min {10 - 4, 5 - 0, 11 - 10} = 1,

X2 (6) X3
) (1
(3 7)
)

(3)
(9

(7) (6)
(5

X1
)

X5 X8
X4
(8
)

(10) ) )
(4 (11

X6 (5) X7
fig.12
7°. L x1 ,x 8 = {(x1, x6), (x6, x7), (x4, x7), (x4, x3), (x3, x8)} = L+x1x 8 ∪ L−x x , unde
1 8

L+x1x 8 = {(x1, x6), (x6, x7), (x4, x3), (x3, x8)}, L+x1x 8 = {(x4, x7)},

ε1 = min {10 - 5, 5 - 1, 3 - 0, 17 - 6} = 3, ε2 = 8-5 = 3, ε = 3.


Pe graf sunt marcate de această dată noile valori (nenule) ale fluxului. La
fiecare nouă aplicare a algoritmului se adaugă la valorile vechi ale fluxului noile
valori ale acestuia . După cea de a 7-a aplicare se obţine fluxul maxim. În plus,
mulţimea A = {x1, x2, x4, x6, x7} determină o secţiune minimă pentru reţeaua de
transport dată.

86
Capitolul VI

ELEMENTE DE TEORIA
PROBABILITĂŢILOR

Teoria probabilităţilor este acea ramură a matematicii care studiază pro-


prietăţile structurilor care modelizează fenomenele în a căror desfăşurare inter-
vine hazardul. Teoria probabilităţilor este instrumentul de bază în dezvoltarea
şi motivarea principalelor proceduri ale statisticii matematice; în acest sens,
una dintre valenţele ei principale este cea care permite să se precizeze condi-
ţiile în care se poate face extrapolarea la întreaga populaţie a rezultatelor con-
statate pe un eşantion. În fapt, se poate spune că procedurile de lucru din statis-
tica matematică sunt în esenţă reflectarea în planul realităţii a unor rezultate de
teoria probabilităţilor.
Obiectele concrete de studiu ale teoriei probabilităţilor sunt evenimen-
tele. La rândul lor, acestea sunt intrinsec legate de calitatea lor de a se realiza
sau nu; teoria probabilităţilor îşi propune să determine o măsură pentru şansa
de realizare a fiecărui eveniment de interes. În general, se poate spune că pro-
babilitatea unui eveniment este o expresie cuantificată a previziunii de a se
produce acel eveniment.

§1. Experienţe aleatoare. Evenimente aleatoare


Experienţă aleatoare. Orice realizare a unui complex de condiţii bine precizate
se numeşte experienţă. Dacă rezultatul unei experienţe nu poate fi unic deter-
minat prin cunoaşterea condiţiilor de definiţie ale experienţei, se spune că ex-
perienţa este aleatoare.
- Orice realizare a unei experienţe se numeşte probă.

87
- Fiecare dintre rezultatele care pot apare în urma efectuării unei experienţe se
numeşte caz posibil. Mulţimea tuturor rezultatelor posibile ale unei experienţe
E formează spaţiul de selecţie asociat experienţei şi se va nota cu Ω.

Exemplul 1. a) În cazul experienţei aruncării zarului pe o suprafaţă plană ori-


zontală, se va nota cu (i) rezultatul care constă în apariţia feţei cu i puncte la o
efectuare a experienţei. Spaţiul de selecţie asociat acestei experienţe este Ω =
{(1),(2),(3),(4),(5),(6)}.
b) Se încrucişează două Regina nopţii cu flori roz. Plantele obţinute au fie flori
albe, fie roz, fie roşii. Deci spaţiul de selecţie este Ω = {alb, roz, roşu}.

Evenimente aleatoare. Orice situaţie potenţială legată de o experienţă (aleatoare)


E, despre care putem spune cu certitudine că s-a creat (s-a realizat) sau nu numai
după o efectuare a experienţei se numeşte eveniment aleator sau eveniment.
- Cazurile posibile care asigură realizarea unui eveniment A se numesc cazuri
favorabile evenimentului A. De exemplu, apariţia unei feţe cu un număr impar
de puncte este un eveniment legat de experienţa aruncării cu zarul; cazurile favo-
rabile lui sunt (1), (3) şi (5).
Cu (i) vom nota şi evenimentul apariţiei feţei cu i puncte la o efectuare
a experienţei.
Apariţia unei plante cu flori albe este un eveniment legat de experienţa din
Exemplul 1 b).

Evenimente egale sau echivalente. Două evenimente sunt egale dacă şi numai
dacă toate cazurile favorabile unuia sunt cazuri favorabile şi celuilalt; în acest caz
se foloseşte notaţia A = B.

Evenimentul cert. Evenimentul care se realizează la orice efectuare a experi-


enţei se numeşte evenimentul cert şi se notează cu Ω.

Evenimentul imposibil. Evenimentul care nu se realizează la nici-o efectuare


a experienţei se numeşte evenimentul imposibil şi se notează cu ∅ .

Implicaţia. Dacă realizarea lui A atrage în mod necesar realizarea lui B se


spune că B este implicat de A sau că A implică B; această situaţie se notează cu
B ⊃ A, respectiv A ⊂ B.
- De exemplu, evenimentul (3) implică evenimentul A={(1), (3), (5)}.

88
- Este util să acceptăm (prin definiţie) că pentru orice eveniment A are loc implica-
ţia ∅ ⊂ A .
- Implicaţia este o relaţie de ordine pe mulţimea evenimentelor asociate unei
experienţe.

Eveniment elementar. Eveniment compus. Orice eveniment ≠ ∅ care nu


este implicat decât de evenimentul imposibil şi de el însuşi se numeşte eveni-
ment elementar. Orice eveniment care nu este elementar se numeşte eveniment
compus.

Contrarul unui eveniment. Evenimentul care se realizează ori de câte ori nu


se realizează evenimentul A se numeşte contrarul evenimentului A şi se
notează cu A sau cu ¬A.

Reuniunea evenimentelor. Se numeşte reuniunea evenimentelor A şi B eveni-


mentul, notat cu A ∪ B, care se realizează atunci când, la o efectuare a experi-
enţei, se realizează sau A sau B.

Intersecţia evenimentelor. Se numeşte intersecţia evenimentelor A şi B


evenimentul, notat cu A ∩ B, care se realizează atunci când, la o efectuare a
experienţei, se realizează şi A şi B.

Diferenţa evenimentelor. Se numeşte diferenţa evenimentelor A şi B eveni-


mentul, notat cu A \ B, care se realizează atunci când, la o efectuare a experi-
enţei, se realizează A dar nu se realizează B.

Evenimente compatibile. Evenimente incompatibile. Două evenimente, aso-


ciate aceleiaşi experienţe E, se numesc compatibile dacă se pot realiza (simul-
tan) la aceeaşi efectuare a experienţei şi se numesc incompatibile în caz con-
trar. Prin urmare, două evenimente sunt incompatibile dacă realizarea unuia
exclude realizarea celuilalt.

Exerciţiul 1. La o fermă de vaci o parte dintre animale suferă de mamită. Se


extrag succesiv două vaci şi se notează cu A1=evenimentul „prima vacă are
mamită”, A2=evenimentul „a doua vacă are mamită”. Să se exprime cu ajutorul
evenimentelor A1 şi A2 evenimentele:
A = evenimentul „prima vacă este sănătoasă”, B = evenimentul “cel puţin o
vacă este bolnavă”, C = evenimentul ”ambele vaci sunt bolnave”, D = eveni-
mentul „o vacă este bolnavă şi una este sănătoasă”.

89
Pe baza teoremei de reprezentare (teorema lui Stone), fiecare eveniment
se identifică cu mulţimea cazurilor favorabile care îl realizează (de exemplu,
evenimentul A citat în Exemplul 1 se identifică cu {(1),(3),(5))}. Prin acest
izomorfism evenimentului cert i se asociază mulţimea Ω∈P(Ω) iar evenimen-
tului imposibil i se asociază partea vidă ∅ ∈ P(Ω) a spaţiului de selecţie (apare
deci şi motivaţia pentru notaţiile folosite pentru aceste evenimente). Este de remar-
cat că dacă evenimentele A şi B se identifică prin acest izomorfism cu submulţimile
corespunzătoare ale spaţiului de selecţie, evenimentele A ∪ B, A ∩ B şi A \ B se
vor identifica corespunzător cu reuniunea, intersecţia şi respectiv diferenţa acestor
submulţimi.

Definiţia clasică a probabilităţii. Presupunem că experienţa E a fost


repetată de n ori şi că evenimentul A s-a realizat de p ori. Numărul p se numeş-
te frecvenţa absolută a evenimentului A în acest set de experienţe şi se mai
notează cu fa(A); numărul fr(A) = p/n se numeşte frecvenţa relativă a eveni-
mentului A.

Exerciţiul 2. Demonstraţi că frecvenţa relativă a evenimentelor legate de expe-


rienţa E are proprietăţile:

1º. fr(Ω) = 1, 2º. 0 ≤ fr(A) ≤ 1, 3º. fr(A∪B) = fr(A)+fr(B) dacă A şi B sunt


incompatibile, 4º. fr(A\B) = fr(A)-fr(B) dacă B implică A , 5º. fr(A\B) = fr(A)-
fr(A ∩ B), 6º. fr(A ∪ B) = fr(A)+fr(B)-fr(A ∩ B), 7º. fr(A) = 1- fr(A).

Experimental s-a constatat că, pentru multe experienţe, atunci când numărul n
de repetări ale experienţei E se măreşte frecvenţele relative se grupează în jurul
unei valori P(A) care dă o măsură a şansei de realizare a evenimentului A numită
şi probabilitatea lui A. S-a constatat că, în cazul când spaţiul de selecţie este
finit iar rezultatele care-l compun au şanse de realizare egale, P(A) este direct
proporţional cu numărul cazurilor favorabile şi invers proporţional cu numărul
cazurilor posibile; de aceea este plauzibil să se considere că P(A) este raportul
dintre numărul elementelor (cardinalul) mulţimii cazurilor favorabile evenimen-
tului A (cu care se identifică evenimentul A) şi numărul elementelor (cardinalul)
spaţiului de selecţie (adică numărul cazurilor posibile); deci
numarul cazurilor favorabile
P(A) =
numarul cazurilor posibile

90
adică, în acest caz, P(A) este chiar frecvenţa relativă de realizare a evenimen-
tului A.
Aceasta este de fapt definiţia clasică a probabilităţii unui eveniment. Din
păcate această definiţie se aplică numai în cazul ideal când rezultatele posibile ale
experienţei au şanse egale de realizare (se spune în acest caz că aceste rezultate
sunt echiprobabile). În situaţiile concrete această definiţie este rareori legal aplica-
bilă; în mod normal, frecvenţa relativă este doar o estimare a şansei de realizare a
evenimentului analizat.

Exemplul 2. Un fermier are 10 vaci din care 3 sunt bolnave. Se aleg aleator
două vaci. Se cere:
a) probabilitatea ca cele două vaci să fie sănătoase,
b) probabilitatea ca cele două vaci să fie bolnave,
c) probabilitatea ca prima vacă să fie sănătoasă şi a doua bolnavă,
d) probabilitatea ca prima vacă să fie bolnavă şi a doua sănătoasă,
e) probabilitatea ca ambele vaci să fie sau sănătoase sau bolnave,
f) probabilitatea ca o vacă să fie sănătoasă iar cealaltă bolnavă.

Vom calcula de fiecare dată numărul cazurilor favorabile şi cel al cazurilor


posibile. Deoarece extragerile sunt aleatorii, perechile de animale au şanse
egale de a fi alese, deci se poate folosi definiţia clasică a probabilităţii. Este util
să reamintim că C kn este numărul de submulţimi (neordonate) formate din K

elemente distincte ale unei mulţimi cu n elemente şi că A kn este numărul de

submulţimi ordonate formate din K elemente distincte ale unei mulţimi cu n


elemente.
a) Fie A1 evenimentul „cele două vaci sunt sănătoase”. În acest caz există
C 72 = 21 2 = 45 cazuri posibile; deci P(A )=
cazuri favorabile şi C10 1
21 = 7 .
45 15

b) Fie A2 evenimentul „cele două vaci sunt bolnave”. În acest caz există
C 23 = 3 cazuri 2 = 45 cazuri posibile; deci P(A )=
favorabile şi C10 1
3 = 1 .
45 15

c) Fie A3 evenimentul „prima vacă să fie sănătoasă şi a doua bolnavă”. În


2 = 90 cazuri posibile; deci
acest caz există 7·3=21 cazuri favorabile şi A 10
21 =
P(A3)= 90 7 .
30

91
d) Fie A4 evenimentul „prima vacă să fie bolnavă şi a doua sănătoasă”. În
2 = 90 cazuri posibile; deci
acest caz există 7·3=21 cazuri favorabile şi A 10
21 =
P(A3)= 90 7 .
30

e) Fie A4 evenimentul „vacile sunt ambele sănătoase sau ambele bolnave”.


În acest caz există C 23 + C 72 = 3 + 21 = 24 cazuri favorabile şi C10
2 = 45 cazuri

24 = 8 .
posibile; deci P(A4)= 45 15

e) Fie A4 evenimentul „vacile sunt una sănătoasă iar cealaltă bolnavă”. În


2 = 45 cazuri posibile; deci
acest caz există 2·7·3=42 cazuri favorabile şi C10

P(A4)= 42 = 14 .
45 15

§2. Câmp de evenimente

Fiecărei experienţe E i se asociază spaţiul de selecţie corespunzător Ω


şi mulţimea tuturor evenimentelor. Nu este totdeauna necesar să lucrăm cu
mulţimea tuturor evenimentelor. Ne putem restrânge, în funcţie de problema-
tica de interes, la o submulţime a mulţimii tuturor evenimentelor. O astfel de
submulţime trebuie să satisfacă câteva condiţii care să asigure consistenţa lim-
bajului introdus anterior. Ne vor interesa familiile K de evenimente care conţin
odată cu un eveniment şi contrarul acestuia şi sunt stabile la reuniuni finite
(respectiv, numărabile); perechile (Ω , K) se vor numi câmpuri (resp. σ-câm-
puri) de evenimente.
Pentru orice (Ω , K) se constată imediat că ∅, Ω ∈ K şi că orice câmp (resp. σ-
câmp) de evenimente este stabil relativ la reuniunile şi intersecţiile finite resp.
numărabile de evenimente (adică orice reuniune sau intersecţie finită resp.
numărabilă de evenimente din K este un eveniment din K).
Convenţie. Vom utiliza sintagma (σ-) câmp de evenimente în afirmaţiile ade-
vărate atât pentru câmpuri de evenimente cât şi pentru σ-câmpuri de eveni-
mente.
Definiţia 1. Se spune că evenimentele familiei (Ai)i∈I din (σ-) câmpul K for-
mează un sistem complet de evenimente pentru K dacă
1°. Ai ≠∅, ∀ i∈ I,
2°. sunt incompatibile două câte două, adică Ai ∩ Aj = ∅ dacă i ≠ j,

92
3°. ∪
i ∈I
Ai = Ω .

În cazul particular când I este finită se poate considera că I = {1,2,...,n}.

Exemplul 3. Un abator achiziţionează porci pentru sacrificare de la fermele F1,


F2, F3 şi F4 pe care îi pune, până la sacrificare, în acelaşi ţarc. Fie Ai (i =
1,2,3,4) evenimentul ca un porc sacrificat (din ţarc) să provină de la ferma Fi.
Familia de evenimente {A1, A2 , A3 , A4} formează un sistem complet de
evenimente pentru experienţa care constă în sacrificarea unui porc din ţarc.
Într-adevăr, evenimentele sunt diferite de evenimentul imposibil pentru că se
fac achiziţii efective de la toate fermele. Un porc sacrificat provine de la una şi
numai una dintre ferme, deci cele patru evenimente sunt incompatibile două
câte două. În sfârşit, orice porc sacrificat provine de la una din ferme, deci
reuniunea celor patru evenimente este evenimentul cert.

§3. Funcţie de probabilitate


Definiţia 2.a) Se numeşte funcţie de probabilitate pe câmpul de evenimente
(Ω, Κ) orice funcţie P: Κ → + cu proprietăţile:
1°. P(Ω) = 1,
2°. oricare ar fi evenimentele incompatibile A, B∈ Κ
P(A ∪ B) = P(A) + P(B).
b) Se numeşte funcţie de probabilitate pe σ-câmpul de evenimente
(Ω,Κ) orice funcţie P: Κ → + cu proprietăţile:
1°. P(Ω) = 1,
2°. P( ∪ An ) =∑ P( An ) , oricare ar fi familia numărabilă de eveni-
* *
n∈N n∈N

mente An∈ Κ, n ∈ *
, incompatibile două câte două (adică Ai ∩ Aj = ∅, ∀
i ≠ j).
c) Tripletul (Ω,Κ,P) format din (σ-) câmpul de evenimente (Ω, Κ) şi
funcţia de probabilitate P se numeşte (σ-) câmp de probabilitate.

Propoziţia 1. Funcţia de probabilitate a oricărui (σ-) câmp de probabilitate


(Ω,Κ,P) are proprietăţile:
1°. P(∅ ) = 0,
2°. P( A ) = 1 - P(A), ∀ A∈ Κ,
3°. P(B \ A) = P(B) - P(A ∩ B), ∀A, B ∈ Κ şi, în particular,
93
3’. P(B \ A) = P(B) - P(A), ∀A, B ∈ K cu A ⊂ B,
4°. P (A) ≤ P (B) dacă A ⊂ B şi A, B∈ Κ,
5°. 0 ≤ P(A) ≤ 1, ∀ A∈ Κ,
6°. P(A ∪ B) = P (A) + P (B) - P(A ∩ B), ∀ A, B ∈ Κ
 n  n
P  U A i  = ∑ P ( A i ) − ∑ P ( A i ∩ A j ) + ... +
7°.  i =1  i =1 i< j
n +1
+(−1) P ( A1 ∩ A 2 ∩ ... ∩ A n ), ∀A1 , A 2 ,..., A n ∈ K.
8°. P(A∆B) = P(A ) + P(B) - 2P(A ∩ B), ∀A, B ∈ Κ
9°. P( U An ) ≤ ∑ P ( An ) , cu An ∈ K , ∀n ∈ N .
n∈N n∈N

Remarca 1. 1°. Se spune că un eveniment diferit de evenimentul cert se realizează


aproape sigur sau că este eveniment aproape sigur dacă are probabilitatea de
realizare 1. 2°. Se spune că un eveniment diferit de evenimentul imposibil este
eveniment aproape imposibil dacă are probabilitatea de realizare 0.

Remarca 2. În cazul particular când Ω = {e1,...,en}, de obicei se consideră Κ =


Π(Ω) şi se notează cu ei evenimentele elementare {ei} (i=1,2,...,n). Fie P: Κ →¡+
o funcţie de probabilitate pe (Ω, Κ). Dacă evenimentele elementare ei (i=1,2,...,n)
sunt echiprobabile, adică P(e1) = P(e2) =...= P(en) = p, atunci P(Ω) = 1 = P(e1) +
P(e2) + ... + P(en) = np şi, prin urmare, p=1/n. Rezultă atunci că evenimentul A
= { e i1 , ... , e ik } are probabilitatea

1
P ( A ) = P ( e i 1) + ... + P ( e ik ) = k ⋅ p = k ⋅ .
n

Se regăseşte în acest caz definiţia clasică a probabilităţii.

§4. Probabilităţi condiţionate


Introducerea noţiunii de probabilitate condiţionată este sugerată de
următoarea problemă.
Problemă. Se consideră o urnă în care sunt n bile identice din care: a bile
marcate cu A, b bile marcate cu B şi c bile marcate şi cu A şi cu B. Dacă A =
evenimentul extragerii unei bile care poartă marca A iar B = evenimentul
extragerii unei bile care poartă marca B, se cere să se determine probabilitatea
de realizare a evenimentului B în ipoteza că A s-a realizat. Această probabilitate
se notează cu PA(B) sau cu P(B / A). In ipoteza că A s-a realizat, vor fi a + c
c
cazuri posibile dintre care c sunt cazuri favorabile lui B, deci PA(B) = . Se
a + c
P(A ∩ B)
constată imediat că P A (B ) = .
P(A)

94
Suntem conduşi să dăm următoarea definiţie care abstractizează situaţia
din problema de mai sus.

Definiţia 2. Fie (Ω, Κ, P) un (σ-) câmp de probabilitate şi A ∈ Κ un eveniment


având P(A) ≠ 0. Se numeşte probabilitatea evenimentului B condiţionată de
evenimentul A numărul notat cu PA(B) (sau cu P(B/A)) definit prin
P(A∩B)
(1) PA ( B ) = P ( B / A ) = .
P(A)

S-a obţinut în acest fel o funcţie PA : Κ →¡+; se demonstrează că (Ω, Κ,


PA) este un câmp de probabilitate (exerciţiu!).

Din formula (1) se obţine egalitatea

P ( A ∩ B ) = P ( A )⋅ PA ( B ) .
Dacă şi P(B) ≠ 0, au loc egalităţile

PB ( A ) P (B)
P ( A ) ⋅ P A ( B ) = P ( B ) ⋅ PB ( A ) ⇒ = A .
P(A) P(B)

adică, „frecvenţa relativă” de realizare a evenimentului A în ipoteza că B s-a


realizat este egală cu „frecvenţa relativă” de realizare a evenimentului B în
ipoteza că A s-a realizat.

Exemplul 4. Una dintre experienţele lui Mendel se referă la încrucişarea mazării


homozigote cu flori galbene şi verzi. Se ştie că la prima generaţie s-a obţinut
numai mazăre heterozigotă cu flori galbene. Încrucişând mazărea din prima
generaţie (adică, doi heterozigoţi) s-a ajuns la a doua generaţie la mazăre cu flori
galbene şi la mazăre cu flori verzi. Ne propunem să determinăm probabilitatea p
ca o plantă cu flori galbene din a doua generaţie să fie heterozigotă. Avem deci de
calculat o probabilitate condiţionată. Mai exact, dacă notăm
G = evenimentul că planta are flori galbene,
V = evenimentul că planta are flori verzi,
H = evenimentul că planta este heterozigotă,
atunci p = PG(H). Dacă A şi a sunt cele două alele ale genei legate de culoarea
florii, există în generaţia a doua 4 evenimente elementare echiprobabile: AA, Aa,
aA, aa. Gena A este dominantă şi prin urmare
G = {AA, Aa, aA} şi H∩G={Aa, aA} = H.
P( H ∩ G ) 2
Rezultă că P(G)=3/4, P(H∩G)= ½ şi p = = .
3
P (G )

95
Definiţia 3. Se spune că evenimentele A şi B sunt independente (sau P-inde-
pendente) dacă
P ( A ∩ B ) = P ( A )⋅P ( B ) .

Două evenimente pot fi independente relativ la o funcţie de probabilitate şi


dependente relativ la altă funcţie de probabilitate. Deci independenţa evenimentelor
nu este o noţiune intrinsecă a evenimentelor în discuţie ci este dependentă de
modul de cuantificare a şanselor lor de realizare. Două evenimente independente
nu sunt în mod necesar condiţional independente în raport cu orice eveniment.
Se vede că dacă A şi B sunt independente au loc egalităţile
P ( B ) = PA ( B ) = PA ( B ) , P ( A ) = P B ( A ) = P B ( A ) .

Egalităţi similare au loc şi pentru B şi A. Prin urmare, pentru o pereche de


evenimente independente, şansa de realizare sau nerealizare a unui eveniment
este independentă de realizarea sau nerealizarea celuilalt; aceasta este în
concordanţă atât cu intuiţia cât şi cu sensul uzual al noţiunii de independenţă.

Exemplul 5. Se doreşte să se măsoare valoarea diagnosticului unui examen


clinic E într-o boală B. Acest examen este practicat pe un eşantion de volum n
format din indivizi clasaţi în prealabil în bolnavi (B+) şi sănătoşi (B-) cu ajutorul
unui test de referinţă presupus fără eroare de clasificare. Rezultatele experienţei
sunt trecute în tabelul de mai jos.

B+ B-
prezenţa absenţa
Examen pozitiv E+ a b a+b
Examen negativ E- c d c+d
a+c b+d n=a+b+c+d

Pentru a compara testul E cu testul de referinţă se vor aprecia performan-


ţele sale ca proporţie a celor ale testului de referinţă, adică se va considera
a
raportul care este de fapt P(E+/ B+). Se poate da deci tabloul care dă
a + c
distribuţia probabilităţilor rezultatelor examenului E condiţionate de B şi anume
B+ B-
prezenţa absenţa
Condiţia P(B+) P(B-)
Examen pozitiv E+ P(E+/ B+) P(E+/ B-)

96
Examen negativ E- P(E-/ B+) P(E-/ B-)
Total 1 1

Se poate considera şi tabloul care dă distribuţia probabilităţilor rezulta-


telor examenului de referinţă condiţionate de E şi anume

Condiţia B+ B- Total
prezenţa absenţa
Examen E+ P(B+) P(B+/ E+) P(B-/ E+) 1
pozitiv
Examen E- P(B-) P(B+/ E-) P(B-/ E-) 1
negativ
Exemplul 6. Se ştie că efectele secundare ale unui medicament survin la
10 % bolnavi. Un veterinar tratează două animale cu acest medicament. Se pune
problema să se determine probabilitatea ca cele două animale să aibă efecte
secundare. Vom nota cu A = evenimentul ca primul animal tratat să aibă efecte
secundare şi cu B = evenimentul ca al doilea animal tratat să aibă efecte
secundare. In acest caz se poate presupune că cele două evenimente sunt inde-
pendente deoarece nu există nici-un motiv ca apariţia efectelor secundare la unul
dintre animale să justifice apariţia efectelor secundare la celălalt animal. Dacă C
= evenimentul ca ambele animale tratate să aibă efecte secundare, atunci
C=A ∩ B P ( C ) = P ( A ∩ B ) = P ( A ) ⋅ P ( B ) = 0,1 ⋅ 0,1 = 0,01 .

Aici s-a ţinut cont că proporţia de bolnavi care au efecte secundare este p = 0,1 şi
p este chiar probabilitatea ca un animal tratat să aibă efecte secundare.

Exemplul 7. In condiţiile exemplului precedent, ne punem problema să determinăm


probabilitatea ca cel puţin unul din cele două animale să aibă efecte secundare.
Dacă D = evenimentul ca cel puţin unul din cele două animale tratate să aibă
efecte secundare, rezultă că D = A ∪ B şi, prin urmare,

P ( A ∪ B ) = P ( A ) + P ( B ) - P ( A ∩ B ) = 0,1 + 0,1 - 0,1 ⋅ 0,1 = 0,19 .

Definiţia 4.a) Se spune că evenimentele Ai ∈ Κ (i = 1, 2, ... ,n) sunt independente


(în totalitate} dacă pentru orice număr natural K (2 ≤ K ≤ n) şi orice numere
naturale i1, ... , iK cu 1 ≤ i1 < ... < iK ≤ n are loc egalitatea
P ( A i1 ∩ ... ∩ A ik ) = P ( A i1 ) ⋅ ... ⋅ P ( A ik ) .

b) Două sisteme complete de evenimente (A1, A2,...,Am) şi (B1, B2,...,Bn) sunt


independente dacă
P(Ai∩Bj)=P(Ai)P(Bj), ∀i=1, 2, ... , m, ∀j=1, 2, ..., n.
97
§5. Probabilitatea evenimentelor dependente.
Inegalitatea lui Boole

Fie (Ω, Κ, P) un (σ-) câmp de probabilitate şi A1,A2,...,An un sistem de


n
evenimente care nu sunt independente şi pentru care P ( ∩ A i ) ≠ 0 . Utilizând
i =1

inducţia completă rezultă formula


n
P( ∩ Ai ) = P ( A1 ) ⋅ PA ( A2 ) ⋅ PA ∩ A
1 1 2
( A3 ) . . . P
A1 ∩ A 2 ∩ ... ∩ An −1
( An )
i =1

Această formulă este cunoscută şi sub numele de formula de înmulţire a proba-


bilităţilor.
In practică se preferă deseori să se determine un minorant al numărului
n
P ( ∩ A i ) determinat prin inegalitatea lui Boole:
i =1

n n
P( ∩ Ai ) ≥ ∑
i =1
P ( Ai ) - ( n - 1 ) .
i = 1

Exemplul 8. Să comparăm două teste T şi B pentru paratuberculoza bovină. Pe


un lot de 1000 animale s-au obţinut datele :

B+ B- Total

T+ 55 175 230

T- 45 725 770

Total 100 900 1000

Rezultă
100 230
P(B+) = = 0,10 P(T+) = = 0,23
1000 1000
;
55 175
P ( T +|B + ) = = 0,55 P ( T + | B - ) = = 0,1946
100 900

deoarece P(T+/ B+) şi P(T+/ B-) sunt mult diferite rezultă că rezultatul testului T
depinde de realizarea sau nerealizarea lui B, adică cele două teste nu sunt indepen-
dente. Prin urmare, experienţe realizate independent şi pe care le percepem ca inde-
pendente, nu sunt independente probabilistic (adică între ele există legături care
depăşesc posibilităţile obişnuite de analiză şi apreciere).

98
§6. Formula probabilităţii totale. Formula lui Bayes

Fie (Ω, Κ, P) un (σ-) câmp de probabilitate şi {A1,A2,...,An} un sistem


complet de evenimente pentru care P ( Ai ) ≠ 0 , i = 1, 2, ... , n. Atunci proba-
bilitatea oricărui eveniment A ∈ Κ se determină cu formula
P ( A ) = P ( A 1 ) ⋅ P A1 ( A ) + P ( A 2 ) ⋅ P A 2 ( A ) + ... + P ( A n ) ⋅ P An ( A ) .

Această formulă se numeşte formula probabilităţii totale.

Elementele unui sistem complet de evenimente se interpretează adesea ca


fiind cauzele care participă la realizarea evenimentului A. Apare atunci în mod
firesc întrebarea: ştiindu-se că evenimentul A s-a realizat, care este contribuţia
(ca proporţie) a cauzei Ai la realizarea lui?

Are loc formula


P ( Ai ) ⋅ P Ai ( A )
P A ( Ai ) = n
∑ P ( Aj ) ⋅ P A j
(A)
j=1

cunoscută sub numele de formula lui Bayes. Această formulă este baza unei
ramuri a statisticii numită statistica bayesiană, care are importante aplicaţii în
medicină, meteorologie, risc financiar, etc..

Exemplul 9. Reluăm situaţia din Exemplul 3. Pe baza facturilor s-a calculat că


17% din porcii cumpăraţi sunt de la ferma F1, 29% sunt de la ferma F2, 15%
sunt de la ferma F3, 39% sunt de la ferma F4. De asemenea, pe baza informaţiilor
de la achiziţiile anterioare s-a calculat că :
2% din porcii de la ferma F1 au trichiniloză
3% din porcii de la ferma F2 au trichiniloză
1% din porcii de la ferma F3 au trichiniloză
2% din porcii de la ferma F4 au trichiniloză.
Se sacrifică un porc ales la întâmplare. Se cere :
1° să se calculeze probabilitatea ca porcul sacrificat să fie bolnav ,
2° ştiind că porcul sacrificat a fost bolnav, să se calculeze probabilitatea
ca el să provină de la ferma F2.

1° Notăm cu A evenimentul "porcul sacrificat este bolnav". Folosind


formula probabilităţii totale rezultă :

99
P ( A ) = P ( A1 ) ⋅ P ( A | A1 ) + P ( A 2 ) ⋅ P ( A | A 2 ) +
+ P ( A3 ) ⋅ P ( A | A3 ) + P ( A4 ) ⋅ P ( A | A4 )

deci
P ( A ) = 0,17 ⋅ 0,02 + 0,29 ⋅ 0,03 + 0,15 ⋅ 0,01 + 0,39 ⋅ 0,02 = 0,0214

2° Din formula lui Bayes rezultă


P ( A2 ∩ A ) 0,03 ⋅ 0,29
P ( A2 | A ) = , P ( A2| A ) = = 0,4065 .
P(A) 0,0214

Exemplul 10. Reluăm situaţia din Exemplul 4 a încrucişării mazării cu flori


galbene cu mazăre cu flori verzi şi luăm o plantă cu flori galbene din a doua
generaţie. Pe lângă notaţiile de acolo notăm cu D = evenimentul ca planta să fie
homozigotă. Atunci, PG(D)=1/3, PG(H)=2/3. Vom încrucişa această plantă cu
flori galbene cu o plantă cu flori verzi şi obţinem 5 plante cu flori galbene. Fie A
evenimentul obţinerii acestor 5 plante. Ne propunem să determinăm probabilitatea
ca planta să fie homozigotă. Ţinem cont că dacă planta este homozigotă, cele 5
plante obţinute după încrucişare sunt toate heterozigote şi au florile galbene adică
PD(A)=1; dacă planta este heterozigotă, fiecare descendent are şansa ½ de a avea
flori galbene şi probabilitatea (½)5 ca cei 5 descendenţi să aibă florile galbene.
Atunci
1 ⋅1
PA ( D ) = 3 ≅ 0,941 .
3
( )( )
1 ⋅1 + 2 ⋅ 1
3 32

Atât formula probabilităţii totale cât şi formula lui Bayes se extind la σ-


câmpuri de probabilitate (Ω, Κ, P) pentru care există sisteme complete
numărabile de evenimente (An)n∈ù.
Se poate considera că cunoaşterea apriorică a fenomenului studiat este rezumată
în valorile P(A1), P(A2), ... , P(An).
§7. Scheme probabilistice clasice

Prin scheme probabilistice clasice se înţelege o familie de metode de rezol-


vare a unor clase de probleme care apar des în aplicaţiile teoriei probabilităţilor.

Schema lui Poisson

Se aplică la rezolvarea următoarei clase de probleme.


Se consideră o experienţă E care constă în efectuarea a n experienţe
independente E1, E2, ... , En. Fie A1, A2, ... , An evenimente asociate expe-
rienţelor E1, E2, ... , respectiv En, având probabilităţile de realizare p1 = P(A1), p2

100
= P(A2) ... şi respectiv pn = P(An). Se cere să se determine probabilitatea ca la o
efectuare a experienţei E să se realizeze evenimentul A care constă în realizarea a
exact K (0 ≤ K ≤ n) dintre evenimentele A1, A2, ... , An.
Soluţia acestei problemei este

P(A) = coeficientul lui xK din polinomul (p1x + q1)(p2x + q2)..(pnx + qn)


unde qi=1-pi, i=1, 2, ... , n.

Exemplul 11. În condiţiile Exemplului 9, dacă se sacrifică câte un porc de


la fiecare fermă, care este probabilitatea să fie sacrificaţi 3 porci sănătoşi şi unul
bolnav ? Suntem în cazul schemei Poisson. Deci, dacă notăm cu A evenimentul
"3 porci sunt sănătoşi şi unul bolnav", P(A) este coeficientul lui x3 din polinomul

( 0,98 x + 0,02 ) ( 0,97 x + 0,03 ) ( 0,99 x + 0,01 ) ( 0,98 x + 0,02 ) ,

adică

P ( A ) = 0,98 ⋅ 0,97 ⋅ 0,99 ⋅ 0,02 + 0,98 ⋅ 0,97 ⋅ 0,01 ⋅ 0,98 +


+ 0,98 ⋅ 0,03 ⋅ 0,99 ⋅ 0,98 + 0,02 ⋅ 0,97 ⋅ 0,99 ⋅ 0,98 = 0,075

Schema binomială (Bernoulli)

Este cazul particular al schemei Poisson aplicate experienţei E pentru care


p1 = p2 = ... = pn = p. Notând q = 1 - p rezultă

P(A) = coeficientul lui xK din polinomul (px + q)n = CnKpKqn-K.

Schema lui Bernoulli se aplică des în rezolvarea unor probleme modelate în felul
următor.

Se consideră o urnă care conţine a bile albe şi b bile negre. Din această
urnă se fac n extrageri, punându-se de fiecare dată bila extrasă înapoi în urnă. Să
se determine probabilitatea evenimentului A care constă în obţinerea exact de K
(0 ≤ K ≤ n) ori a unei bile albe în cele n extrageri.
Evident, fiecare din cele n extrageri se poate considera a fi una din cele n
experienţe independente din cazul "schemei Poisson".
a b
Deci P(A) = CnKpKqn-K, unde p = şi q = .
a + b a + b

Deoarece după fiecare extragere bila extrasă se repune în urnă, schema


Bernoulli se mai numeşte şi schema bilei revenite sau schema bilei întoarse.

101
Evident schema binomială se aplică ori de câte ori experienţa de interes
constă în repetarea unei anumite experienţe.

Exemplul 12. Se ştie că o parte dintre vacile unei ferme sunt infectate cu
virusul leucozei bovine enzootice. Se extrag fără revenire trei vaci. Dorim să
determinăm probabilitatea ca numai un singur animal ales să fie infectat, ştiind că
proporţia de animale infectate este de trei ori mai mică decât cea a animalelor
neinfectate.
Dacă p notează proporţia de animale infectate, rezultă că p = 0,25. Notăm
cu A evenimentul ca o singură vacă din cele 4 alese este infectată. Conform
schemei Bernoulli

P ( A ) = C 31 p q 2 adică P ( A ) = 3 ⋅ 0,25 ⋅ 0, 75 2 = 0,421875 ≈ 0,42 .

Schema multinomială

Această schemă este o generalizare a schemei binomiale la cazul când


urna conţine bile de m (>2) culori.
O urnă conţine a1 bile de culoarea c1, a2 bile de culoarea c2,..., am bile de
culoarea cm (m>2). Din urnă se extrag n ≤ a1+a2+…+am=N bile punând de
fiecare dată bila extrasă înapoi în urnă. Se cere probabilitatea ca în cele n
extrageri să obţinem n1 bile de culoarea c1, n2 bile de culoarea c2,..., nm bile de
culoarea cm, cu n1+n2+…+nm =n. Dacă A este evenimentul de interes, atunci
răspunsul problemei este
n! n n n
P( A ) = p 1 p 2 ...p mm
n 1 ! n 2 !...n m ! 1 2

ai
unde p i = , i = 1,2,..., m şi p1+p2+…+pm=1.
N

Exemplul 13. Se consideră un locus dialelic pentru o populaţie panmictică şi


infinită de animale. Cele două gene A şi a au proprietatea că indivizii AA şi Aa
au fenotip normal iar indivizii aa mor înainte de maturitate. Se ştie că o proporţie
de p=⅛ indivizi au gena a. Se extrag 10 indivizi din populaţie. Care este probabi-
litatea evenimentului B ca în grupa de pui extrasă să fie 5 indivizi AA, 3 indivizi
Aa şi 2 indivizi aa? Se stabileşte uşor că, pentru populaţia de urmaşi, p1 = P(AA)
= (⅞)2, p2=P(Aa) =2·⅛·⅞ şi p3=P(aa)=(⅛)2. Atunci

102
10! 5 3 2
P( B ) = p p p = 2,65.10 − 5 .
5!3!2! 1 2 3

Schema hipergeometrică

Se aplică la rezolvarea următoarei clase de probleme.


Se consideră o urnă U care conţine a bile albe şi b bile negre. Din această
urnă se fac n ( n ≤ a + b) extrageri fără a pune bila extrasă înapoi în urnă. Să se
determine probabilitatea evenimentului A care constă în extragerea a α (0 ≤ α ≤
a) bile albe şi a β = n – α bile negre.
Rezolvare. Având în vedere că o grupă de α bile albe şi β = n - α bile
negre este formată reunind o grupă de α bile albe cu o grupă de β = n - α bile
negre, rezultă că există Caα⋅Cbβ posibilităţi de a extrage o astfel de grupă favorabilă.
Cum există Ca+bn moduri de a extrage o grupă de n bile din urna U, rezultă că

Caα ⋅ Cβb
P(A) = .
Caα ++bβ

Exemplul 14. La ferma de vaci F cu un efectiv de 1000 de vaci 100 suferă de


mamită. Dacă sunt analizate 5 vaci alese aleator, care este probabilitatea ca două
vaci să fie bolnave iar 3 să fie sănătoase ?
Dacă A este evenimentul ca două vaci din cele 5 să sufere de mamită,
aplicând schema hipergeometrică rezultă
2 3
C100 ⋅ C 900
P(A) = 5
.
C1000

§8. Variabile aleatoare


Conceptul de variabilă aleatoare (v.a.) formalizează noţiunea de mărime
care variază în funcţie de rezultatul unei experienţe aleatoare. Variabilele aleatoare
sunt funcţii pentru care nu este suficient să cunoaştem numai valorile ci trebuiesc
cunoscute şi probabilităţile cu care se iau aceste valori. O v.a. cu un număr finit
de valori se numeşte v.a. simplă şi este prezentată cu ajutorul unui tabel de forma
 x1 x 2 ... x n   x 
ξ :  
 sau ξ :  i  i ∈ { 1 , 2 , ... , n }
 p1 p 2 ... p n   pi 
n
pentru care este satisfăcută condiţia ∑ pi = 1 (0≤pi≤1, i=1,2,…,n).
i =1

103
V.a. ξ care ia ca valori numărul de puncte care apar la aruncarea unui zar are
tabloul de repartiţie
1 2 3 4 5 6
ξ : 1 1 1 1 1 1 .
 
6 6 6 6 6 6
Dacă ξ şi η sunt v.a. simple (resp. discrete) având tablourile de repartiţie
 xi   yj 
ξ :  
 şi respectiv η :  
 pi  qj 
 
n m
cu i = 1, 2, ... , n şi j = 1, 2, ... , m şi cu ∑ pi = 1 şi ∑ qj = 1 , atunci definim
i =1 j=1

v.a. ξ + η, ξ - η, ξ ⋅ η, ξ / η (dacă η ≠ 0), ξ + K, Kξ, ξn şi |ξ|α prin :


 xi + y j   x - yj   x ⋅ yj   x / yj 
ξ + η:  ,ξ - η :  i , ξ ⋅ η :  i ,ξ / η :  i ,
 pi j   p   p   pi j 
   ij   ij   

 xi + k   k ⋅ xi   n   | x |α 
ξ + k :  , k ξ :   , ξn :  xi , | ξ |α :  i 
pi   p   p   p 
   i   i   i 

unde pij = P((X=xi) ∩(Y=yj)) cu i = 1, 2, ... , n şi j = 1, 2, ... , m.


V.a. ξ şi η sunt independente dacă (X=xi) şi (Y=yj)) sunt independente cu i = 1, 2,
... , n şi j = 1, 2, ... , m.
Funcţia Fξ : ú → ú definită prin Fξ(x) = P(ξ < x), ∀ x ∈ ú se numeşte funcţia de
repartiţie a v.a. ξ. Ea are proprietăţile
P1. F este nedescrescătoare (adică dacă x1 < x2 atunci F(x1) ≤ F(x2) ),
P2. F este continuă la stânga în orice x ∈ ú ( adică F(x) = F(x - 0), ∀ x ∈ ú ),
P3. F ( - ∞ ) = lim F(x) = 0, F ( + ∞ ) = lim F ( x ) = 1,
x → −∞ x→∞

P4. P(a ≤ ξ < b) = F(b) - F(a)


P(a < ξ < b) = F(b) - F(a) - P(ξ = a)
P(a < ξ ≤ b) = F(b) - F(a) + P(ξ = b) - P(ξ = a)
P(a ≤ ξ ≤ b) = F(b) - F(a) + P(ξ = b)
P5. F este continuă în x dacă şi numai dacă P(ξ = x) = 0.
Trebuie menţionat că există v.a. care iau o familie numărabilă de valori dar şi v.a.
ale căror valori umplu un interval.
Fie F funcţia de repartiţie a unei v.a. ξ. Dacă există o funcţie nenegativă
ρ : ú → ú, integrabilă pe ú astfel încât

104
x
F(x) = ∫ ρ (t ) d t ∀ x ∈ R,
-∞

se spune că ρ este densitate de probabilitate sau densitate de repartiţie a v.a. ξ.


b) Dacă v.a. ξ are densitate de probabilitate, se spune că ξ este absolut continuă.
Dacă ρ este densitate de probabilitate a v.a. ξ atunci:
b ∞
1°. P ( a ≤ ξ < b ) = ∫ ρ(x) dx , 2°. ∫ ρ(x) dx = 1 .
a -∞

Denumirea de densitate de probabilitate este justificată de relaţia


P( x < ξ < x + h )
ρ( x ) = lim .
h→0 h

Menţionăm că de obicei ρ(x)≠P(ξ=x).

Spunem că v.a. de tip continuu X are repartiţie (distribuţie) normală de


parametri m şi σ2, sau că X are repartiţie N(m,σ2), dacă are densitatea de repartiţie

1 (x - m )2
ρ(x;m, σ 2) = e - 2 σ2 .
σ 2π

Se spune că o v.a. are repartiţie normală standard dacă are repartiţie N(0, 1).
Pentru astfel de v.a. au loc egalităţile
1
F(x) = + Φ (x) P(a ≤ X < b) = F(b) - F(a) = Φ (b) - Φ (a)
2

unde Φ este funcţia lui Laplace (care este tabelată). Dacă X are repartiţie N(0, 1)
atunci Y = X−m are repartiţie N(0, 1); se spune că Y este normalizata lui X.
σ

Ţinând cont de procedeul de normalizare rezultă că pentru o v.a. cu repartiţie


N(m, σ2) are loc formula
 a-m X-m b-m   b-m   a-m 
P(a ≤ X < b) = P ≤ <  = Φ  - Φ .
 σ σ σ   σ   σ 

Exemplul 15. Se ştie că greutatea la naştere a unui purcel din rasa Bazna
urmează o distribuţie normală de medie m = 1,5 Kg şi o dispersie σ 2 = 0,0256 . Să
se determine :1) probabilitatea să se nască un purcel cu greutatea mai mică
decât 1,6 Kg , 2) probabilitatea să se nască un purcel cu greutatea între 1,2 Kg
şi 1,6 Kg.
Dacă notăm cu X v.a. care ia ca valori greutatea la naştere a purceilor din rasa
Bazna atunci rămâne să determinăm P( X < 1,6) şi P(1,2 < X < 1,6) . Cum X are

105
X − 1,5
repartiţie N(1,5 ; 0,0256), variabila normalizată Y = are repartiţie N( 0,1).
0,0256

Prin urmare
 X − 1,5 1,6 − 1,5  1
P( X < 1,6) = P < = P( Y < 0,625) = + Φ (0,625) = 0,73401 .
 0,0256 0,0256  2

Similar se obţine că :
 1,2 − 1,5 X − 1,5 1,6 − 1,5 
P(1,2 < X < 1,6) = P < < =
 0,0625 0,0625 0,0625  .

P( −1,875 < Y < 0,625) = Φ(0,625) − Φ ( −1,875) = 0,23401 + 0,46961 = 0,70362

Media unei v.a. simple. Fie ξ o v.a. simplă având tabloul de repartiţie
 x1 x 2 ... x n 
ξ :  .

 p1 p 2 ... p n 

Se numeşte media v.a. ξ numărul notat M(ξ) definit prin


n
M ( ξ ) = p1 x1 + p 2 x 2 + ... + p n x n = ∑ pi xi .
n =1

Media unei v.a. simple are aceleaşi proprietăţi cu media valorilor unei funcţii.
Pentru v.a. continuă ξ cu densitatea de probabilitate ρ, pentru care inte-
+∞ +∞
grala ∫ xρ( x)dx este absolut convergentă expresia M(ξ ) = ∫ xρ(x)dx se numeşte
−∞ −∞

media (sau speranţa matematică). Media v.a. continue are exact aceleaşi proprie-
tăţi cu media unei v.a. simple cu condiţia ca mediile care apar în formularea
acestor proprietăţi să existe.
În momentul în care media este definită se pot defini în aceiaşi termeni
toate caracteristicile numerice întâlnite la funcţii.

106
Capitolul VII

PROCESE STOCHASTICE. LANŢURI


MARKOV
Una dintre problemele cele mai fireşti ale vieţii de zi cu zi este studiul
evoluţiei în timp a unor sisteme care, sub influenţa unor condiţii exterioare, îşi
pot schimba starea în mod aleator. Un astfel de sistem este orice ecosistem,
orice populaţie, orice oscilator cu oscilaţii întreţinute, etc..

§1. Procese stochastice. Lanţuri şi procese Markov


Fie S(t) = {s i (t)}i∈I(t) mulţimea stărilor posibile ale unui sistem Σ la

momentul t. Deşi, de obicei, familia stărilor posibile ale unui sistem Σ variază
continuu în timp vom presupune că schimbările de stare se produc numai la
momente discrete to, t1, …, tn,…pe care le vom nota pentru simplitate cu 0, 1,
…, n,… . Acceptăm deci că sistemul poate fi în fiecare moment n în una dintre
stările S(n) = {s i (n)}i∈I(n) , n = 0,1,2,... , iar I(n) este o mulţime de indici cel mult

numărabilă. Evenimentul care constă în faptul că sistemul Σ se află la momentul


n în starea si(n) îl vom nota tot cu si(n). Având în vedere faptul că la fiecare
moment n (n=0,1,2,…) sistemul Σ va lua una şi numai una dintre stările
mulţimii S(n) rezultă că, pentru fiecare n din {0,1,2,…}, familia de evenimente
{si(n) | i∈I(n)}, formează un sistem complet de evenimente. Rezultă că fiecărui
moment n îi putem asocia o v.a. Xn care ia ca valori mulţimea S(n) iar ca
probabilităţi pi(n)=P(si(n)), i∈I(n). Se obţine deci un şir (Xn)n∈ù de v.a..

Vom nota cu xn una dintre stările posibile ale sistemului Σ la momentul


n ∈ {0,1,2,…}.

Orice şir de stări xo, x1,…,xn,…se numeşte proces stochastic. Un proces


stochastic este cunoscut probabilistic dacă, pentru fiecare n ∈{ 0, 1, 2, …}, se
cunoaşte probabilitatea pn ca xn= si(n), i∈I(n). Este firesc să se accepte că,
pentru n≥1, valoarea lui pn este condiţionată de stările sistemului Σ la momentele
anterioare momentului n, adică p n = Px ∩ x 1 ∩ ...∩ x n −1 (x n = s i (n)), n = 0,1,2,... ,
o

107
în ipoteza că P(x 0 ∩ x1 ∩ ... ∩ xn −1 ) ≠ 0, n ≥ 1 . Rezultă că

∑ Px ∩ x ∩ ... ∩ x (x n = s i (n)) = 1 .
o 1 n −1
i∈I(n )

Dacă sistemul Σ are proprietatea că starea lui la un moment este


condiţionată numai de starea lui la momentul anterior, indiferent de succesiunea
tuturor stărilor anterioare ale sistemului, se spune că mulţimea {S(n)| n=0, 1, 2,
3,…} a tuturor stărilor posibile ale sistemului formează un lanţ Markov.
Oricare dintre procesele posibile xo, x1,…,xn,… se numeşte proces Markov.

Aceasta înseamnă că
Px ∩ x ∩ ... ∩ x (x n = s i (n)) = Px (x n = s i (n)), ∀i ∈ I(n) .
o 1 n −1 n −1

Prin urmare, un proces Markov este un proces stochastic pentru care


probabilitatea ca sistemul să intre într-o stare depinde numai de starea
precedentă în care s-a aflat, nu de evoluţia anterioară (istoria) a procesului. Prin
urmare, probabilitatea de a trece din starea si în starea sj este aceeaşi fie că se
referă la probele 2 şi 3 fie la probele 121 şi 122.

Exemplul 1. Dacă o urnă conţine 10 bile albe şi 12 bile negre şi se fac


22 extrageri fără revenire, probabilitatea ca la extragerea 7 să obţinem bilă albă
depinde de toate extragerile precedente, deci rezultatul tuturor extragerilor va fi
un proces stochastic dar nu va fi un proces Markov.

Exemplul 2. Într-o populaţie dialelică indivizii sunt clasaţi după


genotipul lor (independent de sex) : AA, Aa, aa. Apariţia unui individ de un
anumit genotip într-o anumită generaţie depinde numai de starea (structura)
populaţiei din generaţia precedentă, deci starea (structura) populaţiei la o
anumită generaţie depinde numai de starea (structura) populaţiei din generaţia
precedentă. Se obţine astfel un exemplu de lanţ Markov asociat mulţimilor
stărilor generaţiilor populaţiei. Considerăm mulţimea formată alegând câte un
singur individ din fiecare generaţie. Mulţimea genotipurilor acestor indivizi
este un exemplu de proces Markov.
Un lanţ Markov (respectiv, un proces Markov) se numeşte finit sau
infinit după cum şirul care-l defineşte are sau nu un număr finit de termeni.
În cele ce urmează ne vor interesa lanţuri şi procese Markov pentru care
fiecare S(n) are un număr finit de elemente. Pentru a simplifica expunerea vom
considera că

108
S(n)=S={s1,s2,…sr} ∀ n ∈{ 0, 1, 2, …}.
Ca exemplu serveşte lanţul Markov asociat situaţiei din Exemplul 2, în care
fiecare S(n)={AA, Aa, aa}, n ∈{ 0, 1, 2, …}.
Dacă pi(n)=P(xn=si) şi pj(n+1)=P(xn+1=sj) atunci probabilitatea pij(n)
de trecere de la starea si la momentul n la starea sj la momentul n+1 este
p ij (n) = Px = s (x n + 1 = s j ) .
n i

Dacă matricea de trecere este independentă de n vom spune că lanţul Markov


este omogen. În caz contrar, lanţul Markov se va numi neomogen.
Pentru un lanţ Markov omogen, matricea de trecere este constantă şi o
vom nota cu [τ] , adică
 p11 p12 ....... p1n 
 
p 21 p 22 ....... p 2n 
[τ] = ....... ....... ....... .......
.
 
 p n1 p n 2 ....... p nn 

În acest caz
[p(n)] = [p(0)]⋅ [τ]n , n = 0,1,2,... [τ(n1 , n 2 )] = [τ]n 2
− n1
n1 < n 2 .

Prin urmare, pentru un lanţ Markov omogen, probabilitatea ca sistemul


să treacă din starea i în starea j după m momente (transformări) este elementul
(i, j) al matricei [τ]m .

§7. Aplicaţii în Genetică


Se ştie că un caracter (o trăsătură) este guvernat de două gene care apar în două
tipuri (alele): un tip dominant (d) şi un tip recesiv (r). Un individ poate fi de tip
D=dd (pur dominant), H=rd=dr (hibrid) sau R=rr (pur recesiv). Dacă doi
indivizi se încrucişează urmaşii iau câte o genă de la fiecare părinte (reprodu-
cerea diploidă), dar alegerea genelor este aleatoare.
Aplicaţia 1. Încrucişarea continuă cu un hibrid
Presupunem că un individ de genotip arbitrar se încrucişează cu un
hibrid iar urmaşul este încrucişat tot cu un hibrid, ş. a. m. d.. Se obţine deci un
exemplu de proces Markov. Situaţia este descrisă în următoarele diagrame:

109
dd-dr dr-dr dr-rr

½ ½ ¼ ¼ ½ ½

½
dd dr dd dr rr rd rr

Rezultă că matricea de trecere a acestui proces Markov este

D H R
1 1 0 
D 2 2
 1
[ τ] = H  1 1
4 2 4
R  0 1 1 
 2 2

Deoarece [τ]2 > 0 rezultă că lanţul Markov este regulat. Vectorul Perron-
Frobenius [p]=[p1 p2 p3] se determină rezolvând sistemul

p = 1 p + 1 p
 1 2 1 4 2
 1 (
p 2 = 2 p1 + p 2 + p 3 ).
1 = p + p + p
 1 2 3

Se obţine [p]=[¼ ½ ¼], adică în timp, independent de genotipul indivizilor


iniţiali, 25% din urmaşi vor fi pur dominanţi, 50% vor fi hibrizi (adică 75%
vor fi dominanţi în dominanţă completă) şi 25% vor fi vor fi pur recesivi.
Aplicaţia 2. Încrucişare cu un dominant
Realizăm acelaşi experiment ca mai sus, dar de această dată vom face
încrucişarea cu un dominant pur. Matricea de trecere a acestui proces Markov
este
D H R
D1 0 0
 
[ τ] = H  1 1 0
2 2
R  0 1 0 

Există o clasă absorbantă (clasa {D}) şi două clase de tranziţie (clasele {H} şi
{R}). Rezultă că în timp, urmaşii vor fi pur dominanţi. Pentru a calcula
numărul de generaţii după care urmaşii sunt toţi pur dominanţi calculăm
matricea fundamentală

H R H R
−1
H 1 0 H  2 0
M = (1 − Q ) −1 =  2  =  

R  − 1 1  R  2 1 

110
Dacă individul iniţial este hibrid, numărul mediu de generaţii este suma ele-
mentelor primei linii, adică este 2; dacă individul iniţial este recesiv, numărul
mediu este suma elementelor liniei a doua, adică este 3. În ultimul caz va fi în
medie un recesiv şi doi dominanţi înainte ca dominanţa să se instaleze.

111
BIBLIOGRAFIE
1. I. Burdujan - Matematici cu aplicaţii în Biologie, Ed. „Ion Ionescu de la
Brad”, 1999
2. I. Burdujan - Elemente de Matematici cu aplicaţii în Biologie, Ed.
„Vasiliana’98”, 2001
3. I. Burdujan - Capitole de Matematici aplicate(pentru biologi), Ed.
„Vasiliana’98”, 2002
4. I. Burdujan - Matematici cu aplicaţii în Biologie, Ediţia a 2-a, Ed. Pim,
2002
5. M. Micula – Matematici aplicate în agronomie, Casa de editură
TRANSILVANIA PRESS, CLUJ-NAPOCA 1997
6. L. Răileanu – Matematici cu aplicaţii în Biologie, Rotaprint Univ. „Al. I.
Cuza” Iaşi, 1978
7. L. Răileanu –Tabele statistice, Rotaprint Univ. „Al. I. Cuza” Iaşi, 1978
8. V. Tamaş, ş.a. – Matematici generale pentru economişti, Ed. Graphix, Iaşi,
1993
9. V. Tamaş, ş.a. – Modele matematic în Economie, Ed. Graphix, Iaşi, 1995
An univ. 2002-2003
Temă ID-Zootehnie
1. Folosind lema substituţiei, determinaţi soluţia sistemului
2 x1 + x 2 − x3 + 3 x 4 + 4 x5 = 9
x + 5x = 6
 1 5

3 x1 + x 2 − x3 + 4 x 4 + x5 = 8 .
x + 7 x = 6
 1 5

5 x1 − 2 x 2 + 3 x3 + 6 x 4 + x5 = 13
Care este valoarea determinantului matricei coeficienţilor necunoscutelor?

2. Folosind lema substituţiei, determinaţi soluţia generală a sistemului


2 x1 + 4 x 2 + 3 x3 + x 4 − 2 x5 = 14
 x + 2 x − x + x − 2 x = 12
 1 2 3 4 5
 .
 − x1 + 5 x 2 − x 3 + 2 x 4 − 3 x 5 = 27
3 x1 − x 2 + 4 x3 − x 4 + x5 = −13

3. Folosind lema substituţiei determinaţi


 1 −1 −1 1
− 1 1 −1 1
a) inversa matricei A =  ,
− 1 1 2 − 1
 
 1 1 1 − 1
 1 2 −1 0 1 0
 0 1 1 1 2 1
b) rangul matricei A =  .
 −1 1 0 −1 1 3
 
 1 −1 1 2 0 − 3

4. Determinaţi soluţia optimă a problemei


min ( x1 + x 2 + x 4 + 2 x5 )
 x1 − x 2 − 2 x3 ≤ 3

 x 3 − x 4 + x 5 = 2 .
  x − 2 x − x ≤ −3
 2 4 5
x
 1 ≥ 0, x 2 ≥ 0 , x3 ≥ 0, x 4 ≥ 0, x5 ≥ 0

5. Rezolvaţi problema de transport corespunzătoare tabelului


B1 B2 B3 B4 si
F1 4 1 5 6 21
F2 3 5 2 4 29
F3 7 2 1 3 30
bj 14 28 16 20

Folosiţi pe rând ca soluţie iniţială soluţia determinată respectiv prin meto-


da colţului de Nord-Vest, metoda minimelor pe linii şi metoda minimului
pe tabel. Îmbunătăţiţi soluţia atât prin algorimul pe bază de cicluri cît şi
prin algoritmul dual.

6. Determinaţi fluxul maxim şi secţiunea minimă în reţeaua de


transport redusă desenată mai jos.
x3
x2 (9) o (11) x4
o o (8)
(12)
(5) (7)
x1 o (15) o x9
(8) (7)
(23) (16)
o o
x7
(14)
(3) (4)
(17)
o
x5 x8
x6
(22) o (13)

7. Determinaţi un drum de lungime maximă între vîrfurile x1 şi x8


ale grafului:
x3
x2 2 o -8 x4
o o
-4 5
3 -7 -5
x1 o 7 -9 o x8
x 4
o 7
4 6
5 4
o o
x5 -9 x6

8. S-au numărat boabele la 40 spice de grâu şi s-au obţinut datele


din tabelul de mai jos
Nr. boabe 51 56 50 54 59 60 57 58
Nr. spice 4 9 8 2 4 3 8 2
Calculaţi: a) frecvenţele absolute simple şi cumulate, b) coeficienţii de
asimetrie Pearson şi Fisher, c) coeficientul de boltire şi cel da aplatizare, d)
coeficientul de variabilitate Pearson.

9. Lungimea corpului xi şi adâncimea ugerului yi la 22 vaci de lapte


sunt prezentate în tabelul următor:
xi 145 146 148 148 150 150 151 151 154 155 157 158 159 159
yi 66 71 67 68 65 65 69 70 67 71 71 70 70 73
...
161 161 163 165 168 169 169 176
69 73 69 69 71 68 74 74
Să se determine dreapta de regresie a lungimii corpului asupra adâncimii
ugerului şi dreapta de regresie a adâncimii ugerului asupra lungimii corpului.
Determinaţi apoi diferenţele dintre valorile măsurate şi cele estimate pe
baza dreptelor de regresie.
10. Se dau două urne identice la exterior. Una conţine 3 bile albe şi
4 bile negre, iar cealaltă conţine 5 bile albe şi 2 bile negre. Din una dintre
aceste urne, aleasă la întâmplare, se extrage o bilă. Dacă bila extrasă este
albă, care este probabilitatea ca ea să provină din urna cu primul tip de
compoziţie?

S-ar putea să vă placă și