Sunteți pe pagina 1din 9

Modele neliniare.

Teorie şi aplicaţii

Marin Vlada, Universitatea din Bucureşti, vlada[at]fmi.unibuc.ro

Abstract
Lucrarea prezintă modelele matematice neliniare ce estimează evoluţia proceselor sau
fenomenelor pe baza unor parametri ce definesc procesele şi fenomenele în vederea realizării
de calcule şi aproximări (fitare) ale datelor experimentale. Se abordează modelul nelinear
(nelinear regression), metoda celor mai mici pătrate (MCMMP) cu exemplificări. Sunt
prezentate calculele teoretice pentru modelele logaritmic şi exponenţial realizându-se şi o
comparaţie cu rezultatele obţinute prin utilizarea aplicaţiilor software.

1. Modelul matematic al regresiei neliniare

În activitatea practică din diverse domenii


ştiinţifice, economice, sociale, etc. apar cele
mai complexe probleme ce trebuie rezolvate.
Ştiinţele şi cercetarea ştiinţifică s-au
dezvoltat influenţate de complexitatea
acestor probleme şi de proiectele societăţii
umane. Tezaurul conoaşterii umane este
influenţat de ştiinţă şi tehnică, de cultură şi
artă, şi în special de modul de rezolvare a
problemelor nerezolvate din societatea
umană.
Astfel de probleme apar în chimie, biologie
şi medicină, în fizică şi geologie, în
economie şi sociologie, etc. Pentru studierea
şi analiza proceselor şi fenomenelor aceste activităţi reclamă metode şi tehnici valide şi eficiente,
astfel că modele utilizate să elimine căt mai mult incertitudinile şi aproximările.

Regresia neliniară (Nonlinear Regression)


Date fiind valorile observate pentru două variabile aleatoare X şi Y, fie acestea (xi,yi), i=1,…,n, prin
funcţie de regresie se va înţelege acea funcţie Y = f(X) care aproximează cel mai bine setul de date
observate. De regulă, criteriul ales este dat de metoda celor mai mici pătrate (MCMMP), adică
acea funcţie f pentru care se minimizează suma patratelor erorilor între valorile măsurate şi cele
estimate (procedeu de fitare), adică suma
n
S  [ yi  f ( xi )]2
i 1
Dacă f este o funcţie neliniară, atunci se obţine regresia neliniară, reprezentată grafic printr-o
(curba de regresie). Dreapta de regresie, împreună cu abaterile standard ale variabilelor X şi Y,
sau cu coeficientul de corelaţie, pot constitui o rezumare rezonabilă a distribuţiei comune a celor
două variabile X si Y. Adecvanţa modelului neliniar este mai bună atunci când diagrama de
împrăştiere are formă de elipsă.
58 Universitatea din Bucureşti şi Universitatea „Transilvania” din Braşov

Metoda celor mai mici pătrate (MCMMP)


Dependenţa funcţională a unei variabile aleatoare Y (dependentă-efect) faţă de altă variabilă X
(independentă-cauză) poate fi studiată empiric, pe cale experimentală, efectuîndu-se o serie de
măsurători asupra variabilei Y pentru diferite valori ale variabilei X. Rezultatele se pot prezenta sub
formă de tabel sau grafic.
Problema care apare în acest caz este de a găsi reprezentarea analitică a dependenţei funcţionale
căutate (procedeu de fitare), adică de a alege o expresie (formulă sau model matematic) care să
descrie rezultatele experimentului printr-un model matematic.

Formula (modelul matematic-expresia analitică) se alege dintr-o mulţime de formule determinate


(modele de aproximare neliniare), de exemplu:
 y = ax2 + bx + c (parabola),
 y = ax3 + bx2 + cx + d (polinom gradul 3),
 y = ax4 + bx3 + cx2 + dx + e (polinom gradul 4),
 y = a + b ln x (logaritm),
 y = aebx (exponentiala),
 y = a / ( 1 - c e-bx ) (exponential decay); y = a / ( 1 + c e-bx ) (logistic),
 y = a exp(-(x- c)/ b)2 (modelul gaussian)
 y = a xb (putere),
 y = a sin( bx + c) + d (sinusoida).
Pin urmare, problema constă în a determina parametrii a, b, c, etc. în timp ce formula (expresia
analitică) este cunoscută dinainte, ca urmare a unor considerente teoretice sau după forma
prezentării grafice a datelor, în mod empiric.
Să considerăm, cazul general când avem p parametri, si astfel vom nota dependenţa funcţională prin
y = f(x; a1, a2, ..., ap)
Parametrii a1, a2, ..., ap nu se pot determina exact pe baza valorilor empirice y1, y2,...,yn ale
funcţiei, deoarece acestea din urmă conţin erori aleatoare. Problema reprezintă obţinerea unei
estimări "suficient de bune".

Formularea problemei
Dacă toate măsurătorile valorilor varabilei Y sunt y1, y2,...,yn, atunci estimaţiile parametrilor a1,
a2,..., ap se determină din condiţia ca suma pătratelor abaterilor valorilor măsurate yk de la cele
calculate f(xk; a1, a2,..., an) să ia valoarea minimă, adică sa fie minimă expresia
n
S (a1 , a2 ,, a p )  [ yk  f ( xk ; a1 , a2 ,...,a p )]2
k 1
Consideraţia formulată se păstrează şi în general, pentru determinarea parametrilor unei funcţii de
mai multe variabile (2, 3, etc.), adica o variabila dependenta (efect) si mai multe variabile
independente (cauze). De exemplu, pentru variabila Z (efect) ce depinde de două variabile
independente (cauze) X şi Y, adică Z=f(X,Y), estimaţiile parametrilor a0, a1,..., ap se determină
din condiţia ca expresia
n
S ( a1 , a 2 , , a p )   [ z k  f ( x k , y k ; a1 , a 2 ,..., a p )] 2
k 1
să fie minimă. Determinarea valorilor parametrilor a1, a2,..., ap, se face prin aplicarea condiţiilor de
obţinere a valorii minime în derivatele parţiale ale funcţiei S considerată în variabilele a1, a2,..., ap ,
adică funcţia cu p variabile S(a1, a2,..., ap). Obţinerea acestor valori înseamnă rezolvarea sistemului
de p ecuaţii cu p necunoscute:
Conferinţa Naţională de Învăţământ Virtual, ediţia a X-a, 2012 59

S
0
a1
S
0
a 2

S
0
a p

2. Modelul logaritmic

Modelul logaritmic f(x)= a +b ln(x)

În cazul modelului logaritmic se studiază numai


două variabile X (cauză), Y(efect) şi se doreşte
găsirea dependenţei Y = f(X), unde f(x) = a + b
lnx este o dependenţă neliniară (funcţie
logaritmică) cu p=2 parametri a şi b.

Teorema 2.1 Dacă pentru variabilele X (cauză),


Y(efect) se cunosc n probe (măsurători,
observaţii) prin valorile datelor (xi ,yi), i=1,..., n,
modelul logaritmic f(x)= a + b ln(x) este determinat de coeficienţii a si b având următoarele
expresii:

n n n n
( y i ) (ln xi ) 2  ( ln xi )( y i ln xi )
a i 1 i 1
n
i 1
n
i 1

n (ln xi )  ( ln xi ) 2 2

i 1 i 1

n n

 yi ln xi  a  ln xi
n

y i  na
b i 1
n
i 1
sau b  i 1 .
n
 (ln x )
i 1
i
2
 ln x
i 1
i

Demonstraţie. În urma celor n probe (măsurători, observaţii) se cunosc datele (xi ,yi), i=1,..., n şi
trebuie să se determine coeficienţii a şi b astfel încât suma
n
S (a, b)  [ yi  (a  b ln xi )]2
i 1
să fie minimă.
Vom avea următoarele calcule:
2
[ y i  ( a  b ln x i )] 2  a 2  2 ab ln x i  2 ay i  2by i ln x i  b 2 (ln x i ) 2  y i ,
60 Universitatea din Bucureşti şi Universitatea „Transilvania” din Braşov

prin urmare
n
S ( a , b )   [ y i  ( a  bLn x i )] 2 
i 1
n n n n n
 na 2  2ab ln xi  2a  y i  2b ( y i ln xi )  b 2  (ln xi ) 2   y i2 .
i 1 i 1 i 1 i 1
Derivatele parţiale ale funcţiei S(a,b) sunt:
S n n
 2na  2b ln xi  2 y i
a i 1 i 1

S n n n
 2a  ln xi  2 ( y i ln xi )  2b (ln xi ) 2 .
b i 1 i 1 i 1
Condiţiile de obţinere a parametrilor a şi b sunt:
 S
 a  0
 , ceea ce conduce la sistemul de 2 ecuaţii cu 2 necunoscute:

 0S
 b
n n
2na  2b ln xi  2 y i  0
i 1 i 1
n n n
2a  ln xi  2 ( y i ln xi )  2b (ln xi ) 2  0
i 1 i 1 i 1
n
Pentru rezolvarea acestui sistem se înmulţeşte prima ecuaţie cu expresia  (ln x )
i 1
i
2
iar a doua

n
ecuaţie cu expresia  ln x
i 1
i , după care din prima ecuaţie se scade a doua ecuaţie.

Se va abţine următoare ecuaţie:


n n n n n n
2na  (ln xi ) 2  2a ( ln xi ) 2  2 ( y i ln xi )( ln xi )  2( y i ) (ln xi ) 2  0 ,
i 1 i 1 i 1 i 1 i 1 i 1
adica
n n n n
( y i ) (ln xi ) 2  ( ln xi )( y i ln xi )
a i 1 i 1
n
i 1
n
i 1
,
n (ln xi )  ( ln xi ) 2 2

i 1 i 1
şi prin urmare din a doua ecuaţie, respectiv prima ecuaţie avem determinat coeficientul b:
n n n

y i ln x i  a  ln x i y i  na
b i 1 i 1 sau b  i 1 .
n n

 (ln x )
i 1
i
2
 ln x
i 1
i
Conferinţa Naţională de Învăţământ Virtual, ediţia a X-a, 2012 61

Aplicaţia 1. Pentru variabilele X şi Y presupunem că avem următoarele măsurători (observaţii)


din tabelul 1:
Modelul logaritmic: f(x)= a +b ln(x)
Pentru a realiza calculul direct al coeficienţilor a şi b conform teoremei 2.1, vom realiza în Excel
calculele din tabelul de mai jos:

X Y Ln X Y ln X lnX^2
0.1 1310 -2.30259 -3016.39 5.301898
0.2 1300 -1.60944 -2092.27 2.59029
0.3 1293 -1.20397 -1556.74 1.449551
0.4 1283 -0.91629 -1175.6 0.839589
0.5 1276 -0.69315 -884.456 0.480453
0.6 1267 -0.51083 -647.216 0.260943
0.7 1260 -0.35667 -449.41 0.127217
0.8 1251 -0.22314 -279.153 0.049793
0.9 1243 -0.10536 -130.963 0.011101
1 1233 0 0 0
Suma 12716 -7.92144 -10232.2 11.11083
Tabelul 1. Calcule directe pentru modelul logaritmic

Se obţin următoarele valori:


a = 1245.508 si b = -32.9391, f(x)= 1245.508 -32.9391 ln(x), R2 = 0.9083.

1330
y = -32.939Ln(x) + 1245.5
1320
R2 = 0.9083
1310

1300

1290

1280 Series1

1270 Log. (Series1)

1260

1250

1240

1230

1220
0 0.2 0.4 0.6 0.8 1 1.2

Figura 1. Modelul logaritmic obtinut cu programul Excel

Prelucrările au fost realizate cu programul Excelsi şi arată că valorile pentru a şi b obţinute


conform teoremei 2.1 sunt identice cu valorile obţinute prin aplicarea modelului logaritmic oferit
de programul Excel.
62 Universitatea din Bucureşti şi Universitatea „Transilvania” din Braşov

3. Modelul exponenţial

Modelul exponenţial f(x)= aebx

În cazul modelului exponenţial se studiază numai două


variabile X (cauză), Y(efect) şi se doreşte găsirea
dependenţei Y = f(X), unde f(x) = a ebx este o dependenţă
neliniară (funcţie exponenţială) cu p=2 parametri a şi b.

Teorema 3.1. Dacă pentru variabilele X (cauză), Y(efect)


se cunosc n probe (măsurători, observaţii) prin valorile
datelor (xi ,yi), i=1,..., n, modelul exponenţial f(x) = a ebx
este determinat de coeficienţii a şi b având următoarele
expresii:

n n n

 xi  ln yi  n ( xi ln yi )
b i 1 i 1
n
i 1
n
şi a= ep , unde
( xi ) 2  n  xi
2

i 1 i 1

n n n n

 (x i ln y i )  b xi
2
 ln y i  b xi
p i 1
n
i 1
sau p 
i 1 i 1
.
n
 xi
i 1
Demonstraţie. În urma celor n probe (măsurători, observţtii) se cunosc datele (xi ,yi), i=1,..., n şi
trebuie să se determine coeficienţii a şi b astfel încât suma
n
S (a, b)  [ yi  a exp(bxi )]2
i 1
să fie minimă. Analog calculelor de la teorema 3.4 se poate realiza demonstraţia pentru
determinarea coeficienţilor a şi b. Calculul şi rezolvarea sistemului de ecuaţii este mai laborios. În
cele ce urmează vom aplica o altă metodă, şi anume vom face transformările necesare pentru a
aplica modelul liniar. De aceea, datele celor două variabile X şi Y, (xi ,yi), i=1,..., n, vor fi
transformate astfel (xi , lnyi), i=1,..., n, iar modelul exponenţial va fi transformat într-un model
liniar astfel:
g(x) = ln(f(x), adica g(x) = bx + lna,

prin urmare este vorba de un model liniar g(x) de coeficienţi b (panta) şi lna (termenul liber) ce
trebuie aplicat datelor (xi , lnyi), i=1,..., n. Din acest motiv, în expresiile coeficienţilor obtinuţi
pentru modelul liniar se va substitui yi cu lnyi . Să presupunem că modelul liniar căutat este notat
cu h(x) = x + , atunci dacă expresiile pentru coeficienţii  şi  sunt determinate, pentru modelul
iniţial (exponenţial) avem:
b =  şi a = e .
Conferinţa Naţională de Învăţământ Virtual, ediţia a X-a, 2012 63

Dacă vom considera un model liniar notat prin h(x) = ax + b (pentru comoditate a nu se confunda
coeficienţii a şi b cu cei de la funcţia g), sistemul de ecuaţii ce rezultă din anularea derivatelor
parţiale ale modeluluil h (dreapta de regresie) conduce la următoarele:
 n  n n n

2  y i  (ax i  b)( x i )  0   i i


     bx i  0
2
2 x y 2 ax i 2
 i 1  i 1 i 1 i 1
 n   n n n
2  y  (ax  b)  0 2 y  2 ax  2 b  0
 
i 1
i i
 i 1
i 
i 1
i 
i 1
n n n n
Se notează: x y
i 1
i i  S xy x
i 1
2
i  S xx x
i 1
i  Sx y
i 1
i  Sy şi sistemul de

ecuaţii devine:
Sxy  aS xx  bSx  0
 .
S y  aSx  nb  0
Se obţin următoarele expresii pentru cei doi parametri a şi b:
S x S y  nSxy 1 S xy  aS xx
a
(S x )  nSxx 2
şi b 
n

S y  aS x sau b 
Sx
 .

Cei doi parametri ai funcţiei model h(x) = ax + b s-au obţinut pentru datele (xi ,yi), i=1,..., n, de
aceea prin substituirea yi cu lnyi vom obţine:
n n n n n

 x  ln y i i  n ( xi ln y i )  (x i ln y i )  a  xi
2

a i 1 i 1
n
i 1
n
, b i 1
n
i 1
sau
( xi )  n  xi x
2 2
i
i 1 i 1 i 1
n n

 ln yi  a xi
b i 1 i 1

n
Concluzie. În cazul modelului exponenţial pentru datele (xi ,yi), i=1,..., n trebuie să se determine
coeficienţii a şi b prin transformări asupra datelor iniţiale şi asupra modelului exponenţial pentru a
se aplica modelul liniar. Se vor urma următoarele etape:
1. datele celor două variabile X si Y, (xi ,yi), i=1,..., n, vor fi transformate astfel: (xi , lnyi),
i=1,..., n;
2. modelul exponenţial va fi transformat într-un model liniar astfel: g(x) = ln(f(x) = bx +
lna;
3. se determină modelul liniar notat cu h(x) = x +  ce se aplica datelor transformate;
4. coeficienţii b şi a sunt determinaţi pentru modelul iniţial (exponenţial), folosind relaţiile b
=  şi a = e.

Aplicaţia 2. Vom aplica modelul exponenţial pentru variabilele X şi Y de la Aplicaţia 1.


Conform pasului 3 se aplică modelul liniar datelor transformate şi astfel se obţine
y = -0.0658x + 7.184, coeficientul de determinare R2 = 0.999.
64 Universitatea din Bucureşti şi Universitatea „Transilvania” din Braşov

La pasul 4, coeficienţii a şi b sunt determinaţi, pentru modelul iniţial (exponenţial), folosind


relaţiile b =  şi a = e, adică b = -0.0658 şi a = e7.184 = 1318.218.

7.19
y = -0.0658x + 7.184
R2 = 0.999
7.18

7.17

7.16

Series1
7.15
Linear (Series1)

7.14

7.13

7.12

7.11
0 0.2 0.4 0.6 0.8 1 1.2

Figura 2. Modelul liniar folosit pentru modelul exponenţial

Pentru a argumenta şi compara rezultatele obţinute conform etapelor de mai sus, vom aplica
modelul exponenţial datelor iniţiale (xi ,yi), i=1,..., n cu ajutorul programului Excel, şi astfel se
obţine:
y = 1318.2e-0.0658x, coeficientul de determinare R2 = 0.999.

1320
y = 1318.2e-0.0658x
1310
R2 = 0.999
1300

1290

1280
Series1
1270
Expon. (Series1)
1260

1250

1240

1230

1220
0 0.2 0.4 0.6 0.8 1 1.2

Figura 3. Modelul logaritmic obtinut cu programul Excel


Conferinţa Naţională de Învăţământ Virtual, ediţia a X-a, 2012 65

Pentru a realiza calculul direct al coeficienţilor a şi b conform teoremei 3.1, vom realiza în Excel
calculele din tabelul de mai jos:

X Y Ln Y X^2 XLnY
0.1 1310 7.177782 0.01 0.717778
0.2 1300 7.17012 0.04 1.434024
0.3 1293 7.16472 0.09 2.149416
0.4 1283 7.156956 0.16 2.862783
0.5 1276 7.151485 0.25 3.575743
0.6 1267 7.144407 0.36 4.286644
0.7 1260 7.138867 0.49 4.997207
0.8 1251 7.131699 0.64 5.705359
0.9 1243 7.125283 0.81 6.412755
1 1233 7.117206 1 7.117206
5.5 12716 71.47853 3.85 39.25891
Tabelul 2. Calculul direct pentru modelul exponenţial

b -0.06579
a 1318.218 1318.218

Prelucrările au fost realizate cu programul Excelsi şi arată că valorile pentru a şi b obţinute


conform teoremei 3.1 sunt identice cu valorile obţinute prin aplicarea modelului exponenţial oferit
de programul Excel.

4. Concluzii
În practică, la studiul diverselor procese şi fenomene apare o mare varietate de modele neliniare.
Diversitatea acestor modele neliniare este funcţie de varietatea domeniile: chimie, fizică, medicină,
biologie, sociologie, economie, etc. Matematica şi Informatica au schimbat esenţial metodele şi
analiza pivind analiya datelor experimentale. Chimia, Biologia, Farmacocinetica sunt
domenii/discipline ce au beneficiat din plin de dezvoltarea teoriilor, metodelor şi tehnicilor din
Matematică şi Informatică prin intermediul calculatorului. Astăzi procedurile pentru testarea
medicamentelor includ rezultate importante obţinute în cercetarea privind utilizarea
medicamentelor la tratarea diverselor boli. Bioinformatica, Biostatistica şi Biofarmacia sunt
discipline ce oferă diverse metode şi analize privind domeniul Farmacocineticii.

Bibliografie
1. Kai Oliver Arras, An Introduction To Error Propagation, 1998, http://www.nada.kth.se/~kai-
a/papers/arrasTR-9801-R3.pdf
2. Lucian Boiculese, Biostatistică teme , Şcoala doctorală, UMF Iaşi
3. David W. A. Bourne, Pharmacokinetics and Biopharmaceutics, (Java Applets - On line Graphs,
JavaScript Calculators Online), http://www.boomer.org/c/p1/
4. David W. A. Bourne, Mathematical modeling of pharmacokinetic data, Technomic Publishing Co.,
ISBN 1-56676-204-9, 1995
5. Lucia Căbulea, Nicoleta Breaz, Interpretarea statistică a informaţiilor. Elememnte de data mining şi
prognoză, Modul de instruire nr.7, Universitatea “1 decembrie 1918” Alba Iulia
6. M. Vlada, pagina principală, http://www.unibuc.ro/prof/vlada_m/ Informatica.php
7. M. Vlada, Informatică aplicată. Modele de aproximare, software şi aplicaţii, Editura Universităţii din
Bucureşti, 2012