Documente Academic
Documente Profesional
Documente Cultură
231
Anexe
mărimi – întotdeauna vor exista şi alte influenţe (perturbaţii sau fluctuaţii), ca să nu
mai vorbim de imprecizii ale metodei, aparatelor sau chiar experimentatorului.
Considerând valabilă (la o anumită scală şi pe un anumit domeniu) dependenţa de
mai sus, să subliniem că există două cazuri, complet diferite din punct de vedere
fizic, tratate însă identic din punct de vedere statistic! În primul caz, forma funcţiei
f este cunoscută, eventual până la o constantă (coeficient, factor, exponent, termen
liber), din legile fizicii – există şi situaţia în care se doreşte chiar verificarea legii
(sau regulii) respective, deci f se cunoaşte în totalitate. Al doilea caz are în vedere
situaţia în care nu se cunoaşte nici măcar forma dependenţei y(x), corelarea datelor
neavând decât alternativa încercării unor dependenţe tipice din punct de vedere
matematic (polinom, putere, exponenţială, logaritmică, etc.). Statistic vorbind,
ambele cazuri vor fi tratate identic, pentru că legile fizicii respectă (în general)
acelaşi tip de dependenţe – mai mult, din diverse raţiuni (simplificări, neglijări,
generalizări), modelele din fizică se abat de la realitate (vezi cazul gazului ideal) şi
trebuie ”ajustate” oricum pentru corecţii de acelaşi tip (coeficienţi, exponenţi,
termeni liberi). Se obţin astfel relaţii empirice, bazate în totalitate pe analiza
numerică a datelor experimentale – corelate fără a şti vreo formă a dependenţei
y(x), respectiv semi-empirice (au la bază o lege fizică, ajustată astfel încât să
corespundă unui set de date experimentale). Trebuie subliniat că toate cantităţile
numerice obţinute astfel (aflarea funcţiei f se numeşte regresie) sunt dependente de
unităţile de măsură în care au fost introduse datele experimentale! Practic, aceste
constante sunt dimensionale (vezi Partea I, capitolul 3 şi Anexa III) şi trebuie
manevrate cu atenţie. Majoritatea lor (mai ales în cazul modelelor empirice) nu au
nici măcar un sens fizic!
Prezentăm mai jos principiile regresiei liniare şi multiliniare. Se va opera
cu termeni specifici statisticii, cum ar fi medii, dispersii (împrăştieri), abateri
(erori) relative sau absolute, coeficient de corelaţie, etc. Informaţii complete pot fi
găsite în orice carte de specialitate – s-au indicat câteva în Bibliografie. Cea mai
simplă metodă de regresie este cea liniară, numită şi ”metoda celor mai mici
232
Anexe
pătrate” (în acelaşi timp este şi cea mai veche!). Dacă se postulează (sau se ştie!)
dependenţa:
y f ( x ) b 0 b1 x (A.1)
(adică ecuaţia unei drepte), găsirea ”formei” f înseamnă aflarea celor doi parametri,
ordonata la origine (b0), respectiv panta (coeficientul unghiular), b 1. Se aplică un
algoritm de optimizare, mai exact de minimizare a pătratelor abaterilor, exprimate
ca diferenţe între valorile calculate cu (A.1) şi notate y calc, respectiv cele măsurate,
notate yexp:
n
yk ,exp yk ,calc 2 min (A.2)
k 1
n
y k ,exp b 0 b1 x k 2 0
b 0 k 1
y
n
b1 k ,exp 0 1 k
b b x 2
0
k 1
n
2
y k,exp b 0 b1 x k 0
k 1
n
2 x y
k k
k ,exp b 0 b1 x k 0
1
233
Anexe
Se obţine un sistem de două ecuaţii ce poate fi scris în formă matriceală (după
simplificare, rearanjare şi introducerea sumelor în paranteze, deoarece ele
acţionează doar pentru xk şi yk):
b0 b1
1 x k
y k,exp (A.3)
x k x 2k x k y k,exp
Se observă că determinantul sistemului este simetric faţă de prima diagonală,
precum şi faptul că, pentru rezolvarea sistemului prin metoda ştiută, trebuie
evaluate sumele ce joacă rol de coeficienţi. Dacă până nu demult se recomanda
întocmirea unui tabel şi efectuarea de sume pe coloane, astăzi se poate lucra în
Microsoft Excel, software ce cuprinde facilităţi pentru ambele aspecte (tabel şi
sumare). După obţinerea celor doi parametri, ecuaţia de regresie liniară trebuie
verificată! Subliniem că această etapă, de obicei trecută cu vederea, este la fel de
importantă ca celelalte – aici intră teste de semnificaţie ale coeficienţilor,
experimente repetate în acelaşi punct, etc. De regulă se calculează doar coeficientul
de corelaţie (aici liniară), după formula:
n x k y k ,exp x k y k ,exp
n x y k ,exp 2
ry x (A.4)
x k n y 2k ,exp
2 2
k
234
Anexe
În situaţia descrisă mai sus (când corelaţia liniară se dovedeşte
falimentară), echivalentă cunoaşterii a priori a unei dependenţe neliniare,
algoritmul descris aici poate fi generalizat la aşa-numita regresie multiliniară. De
exemplu, o funcţie liniară dependentă de două variabile independente care se
doreşte a fi găsită prin regresie are forma:
y f ( x ) b 0 b1 x b 2 z (A.5)
După un tratament absolut similar (abateri pătratice minimizate, sistem omogen
generat de anularea derivatelor parţiale), consecinţa apariţiei termenului
suplimentar este regăsită în ”bordarea” ecuaţiei matriceale (A.3) cu linii şi coloane
corespunzătoare noii variabile, forma elementelor fiind aceeaşi:
1 x k zk y k,exp
b0 b1 b2 x k x k zk x k
2
x k y k ,exp
z k z k x k z 2k z k y k,exp
Determinantul sistemului a fost construit ţinând cont de simetria faţă de prima
diagonală, precum şi de scrierea liniilor 2 şi 3 pornind de la prima linie amplificată
pe rând cu xk, respectiv zk (valabil şi pentru coloana termenilor liberi). Devine
limpede procedura prin care se poate ”extinde” regresia la oricâte variabile
independente, forma ecuaţiei fiind în continuare liniară. Se complică doar
evaluarea determinanţilor – probabil că utilizarea computerelor devine
indispensabilă (vezi exemplul de mai jos). Absolut acelaşi lucru se obţine şi dacă se
doreşte o regresie pătratică (parabolică), sau, mai general, polinomială – dacă în
relaţia (A.5) se substituie variabila z cu x2 ecuaţia matriceală devine:
x 0k x1k x 2k x 0k y k ,exp
b0 b1 b 2 x1k x 2k x 3k x1k y k ,exp
x 2k x 3k x 4k x 2k y k ,exp
în care, pentru simetrie, s-a înlocuit 1 cu x 0. Este foarte clar procedeul prin care se
poate extinde regresia la ecuaţii cubice sau de orice ordin. Observaţi că forma
235
Anexe
elementelor determinantului se pretează perfect la utilizarea calculatorului, precum
şi faptul că sumele ce trebuie calculate suplimentar sunt tot mai puţine.
Aplicaţie.
Să se stabilească ecuaţia de regresie cubică pentru datele de mai jos:
236
Anexe
astfel încât, împreună cu parametrii regresiei, obţinem şi confirmarea că ecuaţia
obţinută reprezintă foarte bine datele experimentale. Eventual, se pot încerca mai
multe regresii polinomiale (de diverse ordine) urmărind valorile parametrului r y-x în
scopul maximizării lui (acesta nefiind proporţional cu rangul polinomului!).
În sfârşit, procedura de regresie multiliniară poate fi extinsă la (aproape)
orice dependenţă y(x), cu condiţia liniarizării ei prealabile prin artificii matematice
(logaritmări, inversări ori combinări de variabile, etc.). De exemplu, aflarea
parametrilor cinetici din relaţia Arrhenius (I.11) presupune artificiul:
E 1
ln k ln k 0 Ga
R T
astfel că identificarea cu relaţia (A.1) conduce la necesitatea logaritmării constantei
de viteză şi la inversarea temperaturii în vederea aplicării algoritmului (prelucrare
primară în raport cu regresia). Ulterior aflării constantelor, trebuie făcută
delogaritmarea lui b0 pentru aflarea lui k0, respectiv înmulţirea cu (– R G) pentru
calculul energiei de activare.
Aplicaţie.
Să se afle parametrii cinetici prin regresie pe următoarele date experimentale:
E a 4,73 10 7 J / kmol .
237
Anexe
Un alt exemplu este aflarea coeficienţilor din ecuaţia Antoine (vezi Partea a II-a,
capitolul 2) din date experimentale de presiuni de vapori funcţie de temperatură
B0
ln pV B1
B2 T
Forma relaţiei reclamă în cadrul prelucrării primare atât logaritmarea presiunii (cu
logaritm natural sau zecimal), cât şi aducerea expresiei în forma:
T ln p V B1 B 2 B0 B1 T B 2 ln p V
Aplicaţie.
Într-un experiment de filtrare s-au obţinut următoarele perechi de date (volum
filtrat, în cm3 – timp de colectare, în min):
238
Anexe
Ordonata la origine b0, respectiv panta b1, din ecuaţia de regresie liniară (A.1) se
calculează cu funcţiile amintite (intercept şi slope) în extremitatea dreaptă a
tabelului; cu ajutorul lor putem calcula apoi datele din ultima coloană, V calc.
Utilizarea funcţiei forecast este ilustrată în tabel prin calculul ”derivatelor” (de
fapt, a rapoartelor de diferenţe) din coloana (dt / dV) calc – pentru comparaţie, se
reprezintă grafic şi valorile experimentale ale acestui raport, utilizate de altfel ca
argumente în funcţia respectivă, împreună cu volumele corespunzătoare:
239