Sunteți pe pagina 1din 35

NOŢIUNI INTRODUCTIVE PRIVIND PREZENTAREA ŞI

PRELUCRAREA DATELOR EXPERIMENTALE ÎN LABORATORUL


DE CHIMIE FIZICĂ

1. Prezentarea datelor experimentale


1.1. Unităţi de măsură. Analiză dimensională
1.1.1. Dimensiune. Unitate de măsură. Sisteme de unităţi de măsură
Orice mărime fizică măsurabilă este caracterizată de o dimensiune şi de o unitate de
măsură. Împreună, aceste caracteristici ne dau posibilitatea de a compara între ele rezultatele
măsurătorilor şi de a stabili relaţii cantitative între mărimile măsurate.
În contextul determinărilor experimentale, dimensiunea unei mărimi este “clasa de
măsură” din care aceasta face parte. Dimensiunea este o proprietate care determină
modalitatea de măsurare a mărimii respective. Pe de altă parte, unitatea de măsură este o
valoare bine determinată a unei mărimi care este folosită, în mod convenţional, ca etalon
pentru măsurarea tuturor mărimilor cu aceeaşi dimensiune. De exemplu, lungimea unei
legături chimice, raza covalentă a unui atom şi diametrul unui pahar Berzelius sunt mărimi cu
dimensiune de lungime (fac parte din clasa de măsură a lungimii). Fiecare din aceste mărimi
poate fi exprimată în picometri (pm), nanometri (nm) sau centimetri (cm), acesta fiind unităţi
de măsură acceptabile pentru lungimi.
Trebuie subliniat că dimensiunea este o proprietate obiectivă a unei mărimi (o durată
are dimensiune de timp, iar un diametru are dimensiune de lungime, indiferent de contextul în
care sunt folosite). Pe de altă parte, unitatea de măsură este un etalon convenţional (durata
poate fi măsurată în secunde, ore sau ani, iar diametrul în picometri sau metri, în funcţie de
context). Pentru a fixa şi uniformiza aceste etaloane convenţionale, au fost create sisteme de
unităţi de măsură, dintre care cel mai larg folosit este sistemul internaţional (SI), ale cărui
etaloane sunt stabilite şi păstrate de Biroul Internaţional de măsuri şi Greutăţi din Paris.
Fiecare sistem de unităţi de măsură împarte (mai mult sau mai puţin convenţional)
mărimile (deci şi unităţile lor) în fundamentale şi derivate. Pentru mărimile fundamentale,
etaloanele de măsură sunt fixate prin convenţie, în timp ce unităţile mărimilor derivate se
obţin prin operaţii aritmetice asupra unităţilor fundamentale. De exemplu, în sistemul
internaţional, lungimea şi timpul sunt mărimi fundamentale măsurate convenţional în metri
(m), respectiv în secunde (s). Viteza, pe de altă parte, este mărime derivată, a cărei unitate se
1
obţine împărţind unităţile de măsură pentru lungime şi timp (m/s).
Unităţile de măsură cele mai folosite în chimia fizică sunt:

Pentru lungime: metrul cu submultiplii săi (decimetrul, centimetrul, milimetrul, micrometrul,


nanometrul, picometrul şi femtometrul, reprezentând, respectiv 10 1 , 10 2 , 10 3 , 10 6 , 10 9 ,
1012 şi 1015 dintr-un metru).

Pentru timp: secunda cu multiplii săi (minutul, ora, ziua, anul).

Pentru masă: kilogramul cu submultiplii săi (gramul, miligramul etc.).

Pentru cantitatea de substanță: molul cu submultiplii săi.

Pentru presiune: Pascalul (Pa) cu multiplii săi kilopascalul ( 103 Pa ), megapascalul ( 10 6 Pa )


şi barul ( 1 bar = 105 Pa ). Unităti tolerate sunt torrul (milimetrul coloană de mercur) şi
atmosfera (atm): 1 atm = 101325 Pa = 760 mmHg .

Pentru temperatură: Kelvinul (K) şi gradul Celsius (°C). Mai rar, în literatura anglo-saxonă
se foloseşte şi gradul Fahrenheit (°F).

Pentru energie: Joule-ul (J). Unităţi tolerate (în uz, dar în afara sistemului internaţional) sunt
caloria (cal), litrul-atmosferă (L atm), electron-volt-ul (eV) şi ergul (erg). Relaţiile de
transformare sunt:
1 1
1J = cal = L  atm = 0, 625 1019 eV = 107 erg
4,184 101,325
Unităţi de măsură pentru alte mărimi se pot stabili prin analiză dimensională (v. mai
jos). Reţinem, însă, că unitatea de măsură a unei mărimi derivate este mai mult decât o
expresie dimensională. De exemplu, lucrul mecanic şi momentul unei forţe au aceeaşi
expresie dimensională (forţă înmulţită cu lungime) şi, în sistemul internaţional, se măsoară în
N  m . Dar numai în cazul lucrului mecanic 1 N  m =1 J , pentru că doar lucrul mecanic are
semnificaţia unei energii, iar Joule-ul este o unitate de măsură pentru energie. Legat de
această observaţie, mai notăm că există unităţi de măsură pentru unele mărimi adimensionale.
De exemplu, radianul este o unitate de măsură pentru raportul dintre lungimea arcului de cerc
şi rază, care este adimensional.
1.1.2. Conversii. Operaţii cu unităţi de măsură. Analiză dimensională
Din prezentarea anterioară se poate vedea că unele mărimi pot fi exprimate în mai
multe unităţi de măsură. Pentru a putea compara mărimi exprimate în unităţi de măsură
diferite (dar având aceeaşi dimensiune), este necesar ca unităţile de măsură să fie convertite
una în cealaltă.
Operaţia de conversie este posibilă doar între mărimi cu aceeaşi dimensiune (de
exemplu, putem converti metri în nanometri, dar nu în secunde sau kilograme) şi se realizează
cu ajutorul factorilor de conversie, care sunt expresii unitate (au valoarea egală cu 1) şi
adimensionale (nu au dimensiune), deci înmulţirea cu un produs de factori de conversie nu
schimbă nici dimensiunea şi nici valoarea intrinsecă a unei mărimi.
Factorii de conversie se obţin prin expresii aritmetice asupra unităţilor de măsură ale
aceleiaşi dimensiuni. De exemplu, din relaţiile din secţiunea anterioară rezultă:
1 atm
1 atm = 101325 Pa  =1
101325 Pa
Raportul astfel obţinut este factorul de conversie de la Pascal la atmosferă şi este,
unitar şi adimensional. Trebuie menţionat rolul esenţial al unităţilor de măsură, pentru că,
evident, avem:
1
1
101325
Modul de utilizare al factorilor de transformate poate fi înţeles cel mai bine pe baza
unui exemplu. Vom determina valoarea constantei gazelor ideale în L  atm  mol  K , pornind
de la valoarea sa în sistemul internaţional:
R = 8,314 J  mol  K

= 8,314Pa  m3  mol  K
1
= 8,314 Pa  m3  mol  K  atm  Pa 1 1000 L  m 3
101325
= 0, 082L  atm  mol  K
Şirul de egalităţi de mai sus poate fi scris pentru că factorii de conversie utilizaţi sunt
unitari şi adimensionali, deci înmulţirea cu ei nu afectează nici valoarea şi nici dimensiunea
constantei universale a gazelor.
Conversiile sunt posibile între mărimi cu aceeaşi dimensiune. O altă problemă, care
face obiectul analizei dimensionale, este stabilirea dimensiunii unei mărimi şi, în acest scop,
sunt necesare câteva reguli de calcul cu dimensiuni, care se pot extinde direct la unităţile de
măsură asociate. Regulile de calcul sunt următoarele:

3
Extragerea dimensiunii permută cu operațiile elementare. Astfel, notând cu [ x ]
dimensiunea, respectiv unitatea de măsură a mărimii x , avem:
[ x  y ] = [ x]  [ y ], [ x  y ] = [ x]  [ y ]

 x  [ x]
[ xy] = [ x][ y],  y  = [ y]
 
 xn  = [ x]n

Funcțiile transcendente sunt adimensionale. Justificarea acestei afirmaţii vine are la bază
definiţia matematică a funcţiilor transcendente ca limite ale unor serii de puteri. De exemplu,
pentru funcţia exponenţială, avem:

xn
exp( x) = 
n =0 n!

ceea ce înseamnă că argumentul exponenţialei trebuie să fie adimensional (altfel adunările nu


s-ar putea efectua pentru că x n şi x n 1 au dimensiuni diferite), deci întreaga serie (şi odată cu
ea şi funcţia exponenţială) trebuie să fie adimensională. De aceea,o expresie în care apar
funcţii transcendente este validă doar dacă poate fi scrisă astfel încât funcţiile transcendente să
fie aplicate unor argumente adimensionale.

Orice ecuație trebuie să fie omogenă dimensional. Mai simplu, această regulă afirmă că
membrul stâng şi cel drept al unei ecuaţii trebuie să fie comparabili, deci trebuie să aibă
aceeaşi dimensiune. Omogenitatea dimensională este şi un discriminant (condiţie necesară)
pentru validitatea formulelor: o formulă neomogenă dimensional nu poate fi corectă.

Trecerea la limită nu afectează dimensiunea. Justificarea acestei reguli stă în definiţia


limitei ca punct de acumulare al mulţimii termenilor unui şir convergent. Rezultă de aici că
fiecare termen al şirului este o aproximare a limitei, deci trebuie să aibă aceeaşi semnificaţie
fizică şi, implicit, aceeaşi dimensiune cu aceasta.

1.1.3. Aplicaţii ale analizei dimensionale


Determinarea dimensiunii constantei gazelor ideale
Pornim de la ecuaţia gazului ideal:
Pv
Pv = nRT  R =
nT
care trebuie să fie omogenă dimensional, deci:
 Pv  [ Pv] [ P][v]
[ R] =   = =
 nT  [nT ] [n][T ]
de unde, folosind unităţile de măsură ale sistemului internaţional:
Pa  m3 J
[ R] = =
mol  K mol  K

Unitatea de măsură a unei mărimi definită printr-o derivată


Analizăm mai întâi cazul derivatei totale a cărei definiţie este:
df f ( x)  f ( x0 )
f ( x0 ) = ( x0 ) = lim
dx x  x0 x  x0
Cum trecerea la limită nu afectează dimensiunea, avem:
 f ( x)  f ( x0 )  [ f ( x)  f ( x0 )] [ f ]
[ f ] =  = =
 x  x0  [ x  x0 ] [ x]

deci dimensiunea derivatei este raportul dintre dimensiunea funcţiei şi dimensiunea


argumentului.
Derivatele parţiale se definesc similar:
f f ( x0  ei )  f ( x0 )
( x0 ) = lim
xi  0 
în care ei este versorul direcţiei lui xi . Aplicând aceleaşi reguli ca mai sus şi observând că

[ ] = [ xi ] (altfel expresia x0   ei n-ar mai avea sens), rezultă:

 f  [ f ]
 =
 xi  [ x]
adică dimensiunea unei derivate parţiale este raportul dintre dimensiunea funcţiei şi cea a
variabilei de derivare.
Ca aplicaţie, ştiind că derivata energiei interne cu temperatura este capacitatea
calorică, putem scrie:
 U  [U ]
[Cv ] =  =
 T  [T ]
sau, folosind unităţile sistemului internaţional,
J
[Cv ] =
mol  K

Unitatea de măsură a unei mărimi definită printr-o integrală


Analizăm mai întâi integrala simplă (Riemann), definită ca:
5
n

a f ( x)dx = lim  f (i )( xi  xi1 )


b

 0 i =1

în care  = ( x0 = a, x1 , , xn 1 , xn = b) este o diviziune a intervalului de integrare,

 = max i =1,n | xi  xi 1 | este norma diviziunii, iar i [ xi 1 , xi ], i = 1, n este un sistem de


puncte intermediare în diviziune. Aplicând regulile de calcul enunţate mai sus, avem:

 b f ( x)dx  =  f ( )( x  x )  =  f ( )( x  x )  = [ f ][ x]
n

 a  
i =1
i i i 1 

i i i 1

deci dimensiunea unei integrale Riemann este produsul dintre dimensiunea funcţiei şi
dimensiunea argumentului.
Un alt caz interesant în termodinamică este cel al integralelor curbilinii
(Riemann–Clairaut) de speţa a doua, care, folosind parametrizarea traiectoriei de integrare se
reduc la integrale Riemann:
b
 f ( x),dx = 
a
f [ x( )], x( ) d

unde <  > reprezintă produsul scalar,  este parametrul traiectoriei. iar  a şi  b sunt valorile

parametrului la capetele traiectoriei de integrare. Folosind regulile de mai sus avem:


 f ( x), dx  =  f ( x), x( )  [ ] = [ f i ][ xi ], i = 1, n
 
pentru că toţi termenii produsului scalar trebuie să aibă aceeaşi dimensiune pentru ca
produsul să poată fi calculat.
Unitatea de măsură a integralelor multiple se stabileşte asemănător, apelând la formula de
reducere la succesiuni de integrale simple:

 [ a ,b ][ c , d ]
f ( x, y)dxdy = 
a
b
  f ( x, y)dy  dx
d

de unde rezultă:
 
 [ a ,b ][ c ,d ] f ( x, y )dxdy  = [ f ][ x][ y ]
adică dimensiunea integralei duble este produsul dintre dimensiunea funcției şi dimensiunile
variabilelor de integrare.
Formulele de mai sus se extind cu uşurinţă la integrale multiple şi integrale pe varietăţi (de
suprafaţă, volum etc.).
Ca aplicaţie, să stabilim dimensiunea lucrului mecanic de volum, definit ca:

l =  Pdv =  b P( )v( )d
a

Folosind formula de mai sus pentru dimensiunea integralei Riemann–Clairaut, avem:


[v ]
[l ] = [ P] [ ] = [ P][v]
[ ]
ceea ce arată că produsul dintre presiune şi volum are dimensiune de energie, justificând
astfel folosirea litrului-atmosferă ca unitate de măsură a energiei. În sistemul internaţional
avem:
[l ] = Pa  m3 = J

1.2. Reprezentarea grafică a datelor experimentale


Reprezentarea grafică a datelor experimentale are două scopuri majore:
• Obţinerea unor parametri de regresie (de exemplu, panta şi ordonata la origine a dreptei
de regresie).
• Ilustrarea unei dependenţe funcționale.

Indiferent de scopul pentru care este construit, un grafic trebuie să respecte câteva
reguli pentru a fi utilizabil:
• Curba şi/sau setul de puncte trebuie să ocupe o porţiune cât mai mare din suprafaţa
graficului. Astfel, toată suprafaţa de reprezentare va fi utilizată pentru ilustrarea relaţiei dintre
cele două mărimi, fără a lăsa zone “moarte”, care nu au nici o utilitate practică, dar reduc
rezoluţia reprezentării.
• Axele graficului trebuie divizate prin puncte echidistante, nu prin valorile observate ale
variabilelor corespunzătoare. Aceasta face mult mai simplă citirea şi interpretarea graficului,
în aceeaşi măsură în care gradaţiile echidistante de pe o riglă gradată o fac utilizabilă pentru
măsurarea lungimilor.
• Axele trebuie etichetate cu precizarea unităţii de măsură a mărimii reprezentate. Aceasta
face posibilă interpretarea graficului, întrucât o axă pe care este reprezentată o mărime
necunoscută cu unităţi de măsură neprecizate nu poate servi nici unei analize.

Etichetarea axelor este o operaţie extrem de simplă, dar alegerea domeniului de


reprezentare astfel încât curba şi/sau setul de puncte să ocupe cât mai mult din suprafaţa
graficului necesită utilizarea unui algoritm de scalare special (folosit în majoritatea
programelor de grafică tehnico-ştiinţifică), prezentat în continuare.

7
1.2.1. Scalarea axelor liniare
Algoritmul de mai jos este utilizat pentru stabilirea domeniului optim de reprezentare
şi a diviziunilor de pe axele liniare, adică de pe axele pentru care lungimile geometrice (de
exemplu în mm) sunt proporţionale cu lungimile intervalelor reprezentate (în unitatea de
măsură a mărimii reprezentate). Algoritmul nu poate fi aplicat axelor neliniare (de exemplu,
logaritmice) în care această proporţionalitate nu mai este respectată.
Paşii algoritmului sunt următorii:
1. Se ordonează crescător valorile care trebuie reprezentate pe axă. Se notează cu xmin ,

respectiv xmax , cea mai mică, respectiv cea mai mare, dintre aceste valori.

2. Se determină m  [1,10) şi e din relaţia:

xmax  xmin = m 10e


3. Se alege intervalul dintre diviziunile axei (notat cu  ) astfel:
 10e1 pentru 1  m  1, 25

  0,5 10e pentru 1, 25  m  10

 10
e
pentru 10  m  10

4. Se rotunjesc valorile extreme “în afară” la multipli întregi de  :


x 
min =  min   
  
x 
max =  max   
  
5. Se ajustează valorile extreme pentru a elimina spaţiile excesive de la marginile axei:
 
 min   min  dacă xmin   min 
2 2
 
 max   max  dacă xmax   max 
2 2
în ambele cazuri distanţa dintre diviziuni reducându-se la jumătate.
6. Se marchează pe axă diviziunile  min ,  min   , ,  max .

1.2.2. Exemplu: construcţia unui grafic


Pentru a înţelege mai bine modul de aplicare al algoritmului de mai sus, să urmărim
pas cu pas construcţia graficului pentru datele din tabelul 1, inclusiv trasarea dreptei de
regresie.
Tabelul 1: Date pentru graficul exemplificativ
1
103 , K 1 ln( P, bar )
T
3,532 -1,87
3,470 -1,629
3,411 -1,401
3,354 -1,186
3,299 -0,976
3,245 -0,773
3,193 -0,576
3,143 -0,385
3,095 -0,202
3,037 0,013
Pe baza acestor date, graficul se realizează în următorii paşi:
1. Scalarea axei absciselor. Aplicând formulele de mai sus, obţinem succesiv:
xmax  xmin = 4,95 104 ,  = 0,5 104 , min = 3,0, max = 3,55
2. Scalarea axei ordonatelor. Aplicând formulele de mai sus se obţine succesiv:
ymax  ymin = 1,883,  = 0, 25,  min = 2, 0,  max = 0, 25
3. Se reprezintă punctele experimentale.
4. Se trasează dreapta de regresie.

Figura 1. Construcţia manuală a unui grafic

9
Procesul este ilustrat în figura 1 în care numerele corespund cu paşii descrişi mai sus,
cu menţiunea că diviziunile de pe axa absciselor au fost etichetate din două în două pentru a
nu încărca excesiv graficul.

2. Prelucrarea datelor experimentale


Prelucrarea datelor experimentale are în vedere extragerea unor informaţii din date pe
baza unui model matematic. De regulă, aceste informaţii sunt conţinute în parametrii
modelului (dacă aceştia au semnificaţie fizică) sau chiar în coeficientul de determinare al
modelului, care măsoară calitatea corelării. În ambele cazuri, informaţia este utilă numai dacă
modelul matematic descrie corect datele experimentale, ceea ce înseamnă că o prelucrare
corectă cuprinde în mod obligatoriu doi paşi:
• Determinarea modelului de regresie optim. În general, aceasta înseamnă determinarea
parametrilor optimi ai unui model cu structură fixată, printr-o metodă de regresie liniară sau
neliniară. În acest îndrumar va fi discutată doar regresia liniară, întrucât toate modelele
utilizate în laboratorul de Chimie Fizică sunt liniare sau liniarizabile.
• Determinarea calităţii regresiei. În această etapă, experimentatorul decide dacă modelul
este suficient de flexibil pentru a caracteriza corect datele experimentale dar, în acelaşi timp,
suficient de rigid pentru a evita modelarea erorilor (supra-corelarea). În acest îndrumar vom
discuta doar despre analiza flexibilităţii modelelor, întrucât detectarea supra-corelării necesită
instrumente statistice mai avansate care depăşesc cadrul activităţilor din laboratorul didactic
de Chimie Fizică.

2.1 Regresie liniară şi multiliniară


Regresia liniară este o metodă de identificare a dreptei care corelează optim un set de
puncte experimentale. Faţă de metodele mai avansate ale regresiei neliniare, regresia liniară
are două avantaje clare:
• Simplitatea. Parametrii modelului de regresie pot fi calculaţi cu ajutorul unui calculator de
buzunar pentru seturi mici de date (mai puţin de 15 puncte).
• Geometria modelului. Dependenţa liniară dintre două mărimi este identificabilă imediat
din grafic, ceea ce simplifică foarte mult validarea modelului. Mai mult, datorită geometriei
foarte simple, dreapta nu poate modela erori, deci o repartizare strânsă a punctelor în jurul
modelului de regresie (sau o valoare mare a coeficientului de determinare) este suficientă
pentru a-i stabili validitatea.
De cele mai multe or, însă, datele trebuie transformate pentru a putea fi corelate cu un
model liniar. Această transformare (numită liniarizare) poate fi identificată în două moduri:
Dacă se cunoaşte un model teoretic pentru fenomenul studiat transformarea de liniarizare
se obţine din modelul teoretic prin substituţii convenabile, care să-l transforme în ecuaţia unei
drepte. De exemplu, relaţia dintre presiunea de vapori a unui lichid şi temperatură este dată
(pe domenii înguste de temperatură departe de punctul critic) de ecuaţia Clausius-Clapeyron:

P  v H  1 1 
= exp    
Po  R  T0 T  

în care v H este entalpia de vaporizare a substanţei respective, iar ( P0 , T0 ) este un punct de

pe curba de fierbere. Ecuaţia este valabilă pentru temperaturi apropiate de T0 dacă T0 Tc .


Modelul este puternic neliniar, dar prin logaritmare devine:
v H 1 v H
ln P =    ln P0 
R T RT0
care, prin substituţia:
1 v H v H
X = , Y = ln P, A = , B = ln P0 
T R RT0
devine:
Y =  AX  B
care descrie o dreaptă. Prin urmare, o posibilă transformare de liniarizare pentru un set de
date presiune de vapori – temperatură este
1
X= , Y = ln P
T
În urma transformării, dacă ipotezele care stau la baza modelului Clausius–Clapeyron
sunt satisfăcute, punctele experimentale se vor aşeza pe o dreaptă descrescătoare. Figura 1 a
fost construită aplicând o astfel de transformare unor date de echilibru lichid–vapori pentru
acetonă.

Dacă nu se cunoaşte modelul teoretic al fenomenului atunci transformarea se poate obţine


prin încercări pornind de la reprezentarea grafică a datelor netransformate. De exemplu, dacă
geometria graficului sugerează o dependenţă exponenţială, atunci transformarea de liniarizare
poate fi o logaritmare. În acest caz, o bună corelare liniară între datele transformate confirmă
validitatea modelului iniţial.

11
Figura 2. Liniarizarea empirică a seturilor de date.

Ca exemplu, în figura 2 (stânga) sunt prezentate două seturi de date aparent foarte
asemănătoare. Geometria ambelor grafice sugerează o dependenţă hiperbolică între presiune
şi volum (caracteristică transformării izoterme a unui gaz ideal). Totuşi, după aplicarea
transformării de liniarizare:
1
X = , Y=P
v
se vede (dreapta) că doar unul dintre seturi este descris de dependenţa hiperbolică presupusă
iniţial. Deviaţiile de la linearitate din graficul transformat al celui de-al doilea set indică o
relaţie mai complexă.
Graficul din figura 2 justifică ubicuitatea regresiei liniare, ilustrând capacitatea de
discriminare a modelelor liniare: deşi datele brute sunt greu de diferenţiat, liniarizarea permite
o diferenţiere clară între ele, deviaţiile de la liniaritate (dreapta) fiind mult mai uşor de
observat decât deviaţiile de la un model hiperbolic (stânga).
Întreaga discuţie de mai sus se poate generaliza cu uşurinţă la o clasă de modele
numite multiliniare. Generalizarea are la bază observaţia că ecuaţia unei drepte este algebric
liniară atât în parametrii, cât şi în variabila independentă. Totuşi, din punctul de vedere al
analizei de regresie, liniaritatea importantă este cea în raport cu parametrii, ceea ce înseamnă
că un model de tipul:
n
y = a1 f1 ( x)  a2 f 2 ( x)   an f n ( x) = ai fi ( x)
i =1

în care ai  , i = 1, n , iar f i sunt funcţii complet determinate de variabila independentă,


poate fi tratat cu aceleaşi instrumente de analiză ca şi ecuaţia dreptei. Observăm că acest
model este algebric liniar (adică aditiv şi omogen) în toţi parametrii ai . Pentru detalii privind

diferenţa dintre liniaritatea geometrică şi cea algebrică, v. secţiunea de complemente


matematice.
De exemplu, ecuaţia Redlich–Kister
Y = Y10 x1  Y20 (1  x1 )  x1 (1  x1 ) a  b(1  2 x1 )  c(1  2 x1 ) 2  

în care Y este o proprietate molară oarecare a unui amestec binar (de exemplu, volumul
molar), x1 este fracţia molară a primului component, iar a, b, c, sunt parametri ajustabili,

poate fi reformulată ca un model multiliniar de tipul:


Y  x1Y10  (1  x1 )Y20 = af1 ( x1 )  bf 2 ( x1 )  cf3 ( x1 ) 
în care:
fi ( x1 ) = x1 (1  x1 )  (1  2 x1 )i 1, i 1
astfel încât parametrii săi ajustabili pot fi determinaţi prin metodele relativ simple ale regresiei
(multi)liniare, evitând complicaţiile caracteristice analizei de regresie cu modele neliniare (de
exemplu, alegerea aproximărilor iniţiale pentru parametrii ajustabili).

2.1.1. Determinarea parametrilor în regresia liniară simplă


Dreapta de regresie este definită ca fiind dreapta care trece „cel mai aproape” de toate
punctele experimentale. Pentru ca această definiţie să fie operantă, avem nevoie de o
modalitate de a cuantifica (evalua numeric) noţiunea de distanţă. Calea cea mai simplă este
oferită de geometria analitică euclidiană, în care distanţa dintre două puncte x, y  n
este
dată de:
n
d (x, y ) = ( x  y )
i =1
i i
2

iar distanţa dintre două obiecte geometrice mai complicate se defineşte pornind de la formula
de mai sus (de exemplu, suma distanţelor dintre vârfurile a două poligoane, sau distanţa dintre
centrele lor de greutate).
Oricum ar fi definită, pentru a avea proprietăţile asociate intuitiv cu noţiunea de
distanţă, funcţia D(, ) : n
 n
 trebuie să satisfacă un set de condiţii, numite axiome
metrice:
Distanţa dintre două puncte distincte este întotdeauna pozitivă. Distanţa dintre două puncte
este nulă dacă şi numai dacă punctele coincid:
d (x, y ) 0; d ( x, y ) = 0  x = y

13
Distanţa dintre două puncte nu depinde de direcţia de măsură:
x, y  • d (x, y ) = d (y, x)
Distanţa dintre două puncte este măsurată pe drumul cel mai scurt:
x, y , y  • d ( x , y ) d ( x, z )  d ( z , y )

Cea mai simplă cale de a obţine o distanţă (în sensul acestor axiome) între modelul de
regresie şi setul de puncte este următoarea:
1. Setul de puncte experimentale (fie el {xi , yie }i =1,n ) se separă în setul valori {xi } ale

predictorului (variabilei independente) şi setul de valori { yie } ale răspunsului (variabilei

dependente).
2. Folosind modelul liniar y = ax  b se calculează setul de valori { yic = axi  b}i =1,n .

3. Distanţa dintre setul de date şi model este dată de distanţa dintre vectorii y e  n
şi

yc  n
:
n n

  yie  yic  =  y  axi  b 


2 2
 ( a, b) = d ( y e , y c ) = e
i (1)
i =1 i =1

Figura 3. Distanţa de la model la setul de date experimentale măsurată prin discretizare pe valorile
predictorului. Modelul din stânga este “mai aproape” de date decât cel din dreapta.

Figura 3 ilustrează această definiţie, reprezentând acelaşi set de date împreună cu două
modele liniare diferite. În sensul distanţei definite mai sus, modelul din partea stângă este
“mai aproape” de date decât cel din partea dreaptă.
Observăm că distanţa dintre model şi setul de date este funcţie de parametrii modelului
şi, în acest sens, identificarea dreptei de regresie revine la minimizarea funcţiei  : 2
 .
Evident, cum radicalul este o funcţie strict crescătoare, minimizarea funcţiei  este
echivalentă cu minimizarea funcţiei  2 , care este mai simplu de prelucrat. Datorită formei
particulare a funcţiei  2 (sumă de pătrate), această metoda de regresie mai este numită şi
metoda celor mai mici pătrate.
Calea cea mai directă de minimizarea a unei funcţii este anularea gradientului. În acest
caz,  2 = 0 este un sistem de ecuaţii liniare compatibil şi determinat, deci are o singură
soluţie care, în mod obligatoriu, trebuie să corespundă minimului funcţiei  2 . Prin urmare nu
mai este nevoie să investigăm natura extremului cu ajutorul matricii hessiene.
Sistemul de ecuaţii din care se determină parametrii modelului de regresie este:
  2
 a =0
 2 = 0   2
  =0
 b

care, folosind definiţia mărimii  devine:


 n 2 n n

 a 
 i =1
xi  b 
i =1
xi = xi yie
i =1
 n n
a x  bn
  i =  yi
i =1 i =1

Folosind notaţiile:
n n n n
S x = xi , S 2 = xi2 , S y = yi , S xy = xi yi
x
i =1 i =1 i =1 i =1

soluţia sistemului de mai sus se poate obţine cu metoda Cramer:


S xy Sx
a Sy n nS xy  S x S y
a= = =
 nS 2   S x 
2
S2 Sx
x x
Sx n
(2)
S S xy
x2

b Sx Sy S 2 S y  S x S xy
x
b= = =
 nS 2   S x 
2
S2 Sx
x x
Sx n

2.1.2. Determinarea parametrilor în regresia multiliniară


Formulele (2) definesc individual parametrii dreptei de regresie. Acest lucru este

15
acceptabil pentru modele cu un număr mic de parametri, dar, în cazul modelelor multilinare
tipice, cu un număr mare de parametri, este cu mult mai utilă o reprezentare compactă a
setului optim, care să poată fi utilizată în orice mediu de programare cu suport pentru calculul
matriceal.
În cele ce urmează vom presupune că setul de date este dat sub forma unui tabel
( xi , yi )i =1,n , iar modelul de regresie are forma:
p
y = ai fi ( x) (3)
i =1

Pentru a obţine o astfel de reprezentare compactă, pornim de la sistemul:


a0  a1 f1 ( x1 )   a p f p ( x1 ) = y1e

a0  a1 f1 ( x2 )   a p f p ( x2 ) = y2e

a0  a1 f1 ( xn )   a p f p ( xn ) = yne

cu ecuaţia matricială echivalentă:


Xa = y e (4)

în care matricea X dată de X ij = f j xi este aşa numita “matrice de modelare” (design matrix).

Această ecuaţie descrie situaţia ideală în care setul de date este reprezentat exact de model.
Evident, erorile de măsură fac această situaţie imposibilă, deci ecuaţia (4) poate fi rezolvată
doar în sens optimal (în sensul celor mai mici pătrate, ceea ce presupune identificare soluţiei
a* care minimizează eroarea de reprezentare:
2 2
a* : Xa*  y e = min Xa*  y e
2 2
a p

unde  2 reprezintă norma euclidiană.

Pentru a rezolva problema de minim de mai sus, vom observa că:

 Xa  y e  ,  Xa*  y e  =  2 (a)
2 T
Xa*  y e = *
2

în care ,  reprezintă produsul scalar euclidian, iar  este o funcţie echivalentă cu distanţa
(1). Aplicând regulile obişnuite de calcul din algebra liniară, norma erorii de reprezentare
devine:
 2 (a) = aT X T Xa  2aT X T y e  y eT y e
Minimizarea funcţiei  revine, ca de obicei, la anularea gradientului. Pentru a obţine
o expresie cât mai convenabilă pentru  , vom introduce notaţia H = X T X şi vom observa
că:
• Matricea X T X este simetrică. Într-adevăr:
n n n
H ij = ( X T X )ij = ( X T )ik X kj = X ki X kj = X kj X ki = H ji
k =1 k =1 k =1

• Din simetria matricii H rezultă:


(aT Ha) = 2 Ha
Într-adevăr,
 T  p p p p

ak
(a Ha) =
ak
H ij ai a j = H ij (ai jk  a jik ) =
i =1 j =1 i =1 j =1

p p

H
i =1
ik ai  H kj a j = ( Ha) k  (a H ) k = ( Ha) k  ( H a) k = 2( Ha) k
j =1
T T

de unde rezultă imediat egalitatea de mai sus.


• Pe baza unui raţionament analog:
(aT X T y e ) = X T y e
Cu aceste observaţii, putem scrie:
2
 X T a  ye = 0  X T Xa = X T y e (5)
2

de unde rezultă pentru setul optim de parametri ai modelului multiliniar formula:

a =  X T X  X T ye
1
(6)

Formula de mai sus poartă numele de formulă Moore-Penrose, iar expresia


( AT A) 1 AT poartă nulele de pseudo-inversă Moore–Penrose a matricii A .
Formula Moore–Penrose este o expresie compactă pentru calculul setului optim de
parametri ai unui model multiliniar. Evident, pentru cazul regresiei liniare simple, ea se
reduce la expresiile (2), iar pentru sisteme de dimensiuni moderate poate fi aplicată cu
uşurinţă manual.

2.1.3. Aplicaţie: corelarea non-parametrică a temperaturii de fierbere


Datele experimentale din tabelul 2 reprezintă un set de puncte de fierbere măsurate la
presiune atmosferică pentru diverse amestecuri de acetonă şi metanol. Ne propunem să
determinăm modelul Redlich-Kister generalizat care corelează optim aceste valori:
T = x1T10  (1  x1 )T20  x1 (1  x1 ) a  b(1  2 x1 )  c(1  2 x1 ) 2  

în care Ti 0 sunt temperaturile normale de fierbere ale celor doi componenţi, iar a, b, c, sunt

parametri ajustabili. Notăm că acest model este non-parametric în sensul că nu are nici un
suport teoretic cu privire la relaţia dintre temperatura de fierbere şi compoziţie. Astfel de
17
modele de regresie au avantajul de a nu introduce ipoteze suplimentare în analiza datelor
experimentale, dar nu pot furniza nici un fel de informaţii despre sistem în afara relaţiei strict
matematice între cele două mărimi implicate. Modele de acest tip se folosesc în testarea
consistenţei termodinamice a datelor experimentale la presiuni joase şi moderate.

Tabelul 2. Puncte de fierbere ale amestecurilor de acetonă (1) şi metanol (2) la presiune atmosferică
x1 0,0 0,05 0,1 0,2 0,30 0,40 0,5 0,6 0,7 0,80 1,0
t , °C 64,5 63,60 62,5 60,2 58,65 57,55 56,7 56,0 55,3 55,05 56,1

Pentru regresie vom folosi un model Redlich–Kister generalizat cu 3 parametri:


T = x1T10  (1  x1 )T20  x1 (1  x1 ) a  b(1  2 x1 )  c(1  2 x1 )2 

care poate fi adus la forma (3) cu notaţiile:


y = T  x1T10  (1  x1 )T20 , fi ( x) = x(1  x)(1  2 x)i 1
Pentru identificarea parametrilor acestui model, vom construi tabelul 3 ale cărui ultime
trei coloane formează matricea de modelare:
 0, 0000 0, 00000 0, 000000 
 
 0, 0475 0, 04275 0, 038475 
 0, 0900 0, 07200 0, 057600 
 
 0,1600 0, 09600 0, 057600 
 0, 2100 0, 08400 0, 033600 
 
X =  0, 2400 0, 04800 0, 009600 
 0, 2500 0, 00000 0, 000000 
 
 0, 2400 0, 04800 0, 009600 
 0, 2100 0, 08400 0, 033600 
 
 0,1600 0, 09600 0, 057600 
 
 0, 0000 0, 00000 0, 000000 
Tabelul 3. Valorile regresiei non-parametrice a punctelor de fierbere în sistemul acetonă+metanol.
x1 x1 t , °C T,K y f1 f2 f3
0,00 0,000 64,50 337,65 0,00 0,0000 0,00000 0,000000
0,05 0,102 63,60 336,75 -0,48 0,0475 0,04275 0,038475
0,10 0,186 62,50 335,65 -1,16 0,0900 0,07200 0,057600
0,20 0,322 60,20 333,35 -2,62 0,1600 0,09600 0,057600
0,30 0,428 58,65 331,80 -3,33 0,2100 0,08400 0,033600
0,40 0,543 57,55 330,70 -3,59 0,2400 0,04800 0,009600
0,50 0,586 56,70 329,85 -3,60 0,2500 0,00000 0,000000
0,60 0,656 56,00 329,15 -3,46 0,2400 -0,04800 0,009600
0,70 0,725 55,30 328,45 -3,32 0,2100 -0,08400 0,033600
0,80 0,800 55,05 328,20 -2,73 0,1600 -0,09600 0,057600
x1 x1 t , °C T,K y f1 f2 f3
1,00 1,000 56,10 329,25 0,00 0,0000 0,00000 0,000000
Aplicând formula Moore–Penrose (ecuaţia (6)), rezultă:
a  14,896211
  T 1 T  
 b  = ( X X ) X y =  0,894907 
c  2, 297342 
   
Graficul modelului rezultat este prezentat, împreună cu datele experimentale,
în figura 4.

Figura 4. Curba de fierbere a sistemului acetonă (1) + metanol (2) la presiune atmosferică

2.2. Calitatea regresiei. Coeficientul de determinare


Analiza de regresie în forma prezentată anterior cuprinde trei etape principale:
1. Analiza şi prelucrarea preliminară a datelor experimentale. În această etapă se alege clasa
modelului de regresie, se identifică şi se aplică o eventuală transformare de liniarizare, se
estimează erorile de măsură etc.
2. Determinarea modelului optim de regresie. În această etapă se determină parametrii
modelului de regresie ales, folosind una dintre metodele descrise anterior dacă modelul este
(multi)liniar, sau o metodă de optimizare bazată pe aceeaşi funcţie distanţă dacă modelul este
neliniar. Reţinem că, în acest context, liniaritatea este utilizată în sens algebric şi este evaluată
în raport cu parametrii şi nu cu predictorul.
3. Validarea modelului de regresie. În această etapă modelul de regresie este evaluat din
punctul de vedere al performanţelor de reprezentare pentru a evita sub– sau supra–corelarea

19
datelor experimentale.

Validarea modelului de regresie este necesară pentru că metodele clasice de regresie


presupun fixarea a priori a clasei sale algebrice (ecuaţie liniară, funcţie Redlich–Kister cu un
anumit număr de parametri etc.). Astfel, deşi parametrii determinaţi prin regresie sunt optimi
în sensul distanţei dintre model şi date, această optimizare este restricţionată la clasa aleasă
pentru model. De exemplu, prin regresie liniară putem determina cea mai bună dreaptă care
trece printre punctele experimentale, fără nici o garanţie că aceste puncte sunt într-adevăr
corelate optim de o dreaptă. O posibilă situaţie de acest tip este ilustrată în figura 5 în care
sunt corelate cu un model liniar două seturi de date reprezentând destinderea izotermă a unui
gaz. Transformarea de liniaritate a fost aleasă în baza ecuaţiei de stare a gazului ideal şi, după
cum se poate observa din figură, doar datele din setul a sunt corelate optim de o dreaptă. Deşi
dreapta de regresie din graficul b este optimală în sensul apropierii de punctele experimentale,
ea nu redă corect fenomenul pentru că datele în sine nu se corelează liniar (clasa modelului a
fost incorect aleasă). Prin urmare, orice interpretare fizică a parametrilor săi este, inerent,
invalidă.

Figura 5. Validitatea modelului liniar în analiza de regresie.

Fenomenul ilustrat în figura 5 este aşa-numita sub-corelare a datelor experimentale de


către modelul de regresie — modelul liniar nu este suficient de flexibil pentru a reda corect
relaţia dintre predictor (inversul volumului) şi răspuns (presiunea). O altă problemă generată
de alegerea a priori a clasei modelului este supra–corelarea, ilustrată în figura 6. Datele
reprezentate sunt punctele normale de fierbere ale amestecurilor de acetonă (1) şi metanol (2),
iar modelul de corelare este o funcţie Redlich–Kister generalizată cu 3 parametri (graficul a),
respectiv cu 7 parametri (graficul b). Se observă cum ecuaţia cu 3 parametri redă dependenţa
punctului de fierbere de compoziţie (inclusiv existenţa azeotropului) în mod corect (curba de
fierbere este peste tot convexă) trecând printre puncte, pe când modelul cu 7 parametri trece
prin puncte (distanţa faţă de datele experimentale este practic nulă), dar introduce
caracteristici nefizice în curbă, cum ar fi punctele de inflexiune din vecinătatea azeotropului.
Într-un anumit sens, putem spune că modelul cu 7 parametri este “prea flexibil” şi, ca atare,
este influenţat nu doar de valorile mărimilor măsurate, ci şi de erorile de măsură care le
afectează.

Figura 6. Supra-corelarea în analiza de regresie.

Deşi validitatea modelului de regresie poate fi evaluată calitativ prin inspecţia


reprezentării grafice a modelului şi datelor experimentale, există şi o serie de instrumente
cantitative care pot fi folosite în acest scop. Cel mai simplu (şi mai frecvent folosit) este
coeficientul de determinare al modelului. Acest coeficient poate fi calculat pentru orice tip de
model (nu numai pentru modele liniare) şi este dat de formula:
n

  y
2
e
i  f ( xi ) 
R2 = 1  i =1
n 2
(7)
  y
i =1
e
i y 
e

în care y e este media aritmetică a valorilor răspunsului, restul notaţiilor fiind cele deja
cunoscute.
În esenţă, acest coeficient compară două cazuri extreme: cel în care predictorul şi
răspunsul sunt corelate, iar modelul f redă corect această dependenţă şi cel în care

21
variabilele nu sunt corelate, caz în care răspunsul este “constant” în raport cu predictorul, deci
modelul optim este o linie orizontală cu ordonata dată de media valorilor sale. Observăm, în
treacăt, că, dacă panta dreptei de regresie este nulă (dreapta de regresie este o linie orizontală),
valoarea optimă a ordonatei sale este chiar media aritmetică a valorilor y e , ceea ce justifică
utilizarea mediei aritmetice şi în acest caz.
O valoare apropiată de unitate a coeficientului de determinare indică o bună adecvare
a modelului în raport cu datele experimentale. La limită, dacă modelul este exact (este un
model de interpolare), coeficientul său de determinare este egal cu unitatea. O valoare mică
(eventual negativă) pentru R2 indică un model invalid. Astfel, pentru situaţia din figura 5
avem:
Ra2 = 1,000, Rb2 = 0,919
ceea ce sprijină observaţia anterioară că datele din graficul a al figurii sunt corelate optim de o
dreaptă, iar cele din graficul b – nu.
Trebuie, însă, remarcat că utilizarea coeficientului de determinare fără reprezentarea
grafică a modelului şi datelor experimentale, poate duce la concluzii greşite. Astfel, pentru
situaţia din figura 6, avem:
Ra2 = 0,951, Rb2 = 0,993
Aparent, corelarea din graficul b este cu mult mai bună, dar inspecţia graficului
propriu-zis arată că modelul cu 7 parametri supra-corelează datele, reproducând şi erorile de
măsură şi introducând artefacte nefizice în reprezentare. Aşadar, o valoare mare a
coeficientului de determinare este un indicator de validitate, dar, considerată izolat, poate
ascunde senzitivitatea excesivă a modelului de regresie faţă de erorile experimentale (aşa-
numita “modelare a erorilor”).
Detectarea supra-corelării este, în general, o problemă foarte delicată, care necesită
instrumente de inferenţă statistică a căror prezentare depăşeşte cadrul acestui îndrumar.

3. Complemente de matematică
În discuţiile anterioare privitoare la analiza dimensională şi prelucrarea datelor
experimentale, au fost utilizate anumite noţiuni de matematică a căror detaliere este
importantă pentru înțelegerea demonstraţiilor şi argumentelor prezentate. Aceste noţiuni, în
principiu deja cunoscute din liceu, sunt reluate mai amănunţit în cele ce urmează.
3.1. Inversarea unei matrici
În aplicarea formulei Moore–Penrose pentru calculul parametrilor optimi ai modelelor
(multi)liniare, este necesară inversarea matricii X T X , în care X este matricea de modelare.
Matricea X T X este totdeauna pătrată, de un ordin egal cu numărul de parametri ai modelului.
Există mai multe metode de inversare, dintre care vom discuta două:
3.1.1. Metoda analitică
Această metodă se bazează pe formula:
1 T
A1 = C
| A|

în care A  nn ( ) este o matrice pătrată de ordinul n , | A | este determinantul matricii A ,

iar C este matricea cofactorilor, definită prin:


Cij = (1)i  j akl k ,l =1, n
k  i ,l  j

sau, altfel spus, cofactorul elementului aij este determinantul matricii A exclusiv linia şi

coloana acestuia.
Metoda presupune calculul unor determinanţi de ordinul n  1, deci este incomodă
pentru inversarea matricilor cu ordin mai mare de 4 . De exemplu, pentru matricea
1 2 3  1 2 3
  5 6 4 6 4 5
A = 4 5 6  avem: 4 5 6 = 1  (2)   3 = 3
 7 8 10  8 10 7 10 7 8
  7 8 10

 5 6 4 6 4 5
   
 8 10 7 10 7 8
 2 2 2 3 
3 1 3 1 2 
C =     = 4 11 6 
 8 10 7 10 7 8   

   3 6 3 
2 3

1 3

1 2
 5 6 4 6 4 5 

Rezultă:
 2 4 
 3 
3
1
 
2 11
A = 
1
2 
 3 3 
 
 1 2 1

 
Se poate verifica imediat că A1 A = AA1 = I3 , în care I 3 este matricea unitate de ordinul 3.

3.1.2. Metoda iterativă Gauss


Această metodă presupune transformarea succesivă a matricii originale în matricea
unitate de acelaşi ordin (eliminare Gauss). Inversa matricii originale se obţine aplicând exact
23
aceeaşi secvenţă de transformări asupra matricii unitate. Altfel spus, algoritmul
implementează transformarea:

 A, I n    I n , A1 
în care n este ordinul matricii A .
Transformările constau în:
• Amplificarea unei linii cu un număr real:
Ak ,i   Ak ,i , i = 1, n,  

• Înlocuirea unei linii cu suma dintre aceasta şi o altă linie:


Ak ,i  Ak ,i  Al ,i , i = 1, n

Factorul  se alege astfel încât, pe fiecare coloană a matricii, elementul diagonal să


devină egal cu unitatea, iar celelalte să se anuleze.
Aplicând acest algoritm aceleiaşi matrici ca mai sus, avem:
Se formează perechea iniţială:
1 2 3  1 0 0
   
 4 5 6 , 0 1 0
  7 8 10  0 0 1
   
Se amplifică prima linie cu 4 şi se adună la a doua, apoi se amplifică prima linie cu 7 şi
se adună la a treia; aceleaşi transformări se aplică şi matricii unitate:
1 2 3   1 0 0
   
  0 3 6  ,  4 1 0  
  0 6 11  7 0 1  
   
Se împarte a doua linie cu 3 ; rezultatul se amplifică prin 2 şi se adună la prima linie,
apoi se amplifică prin 6 şi se adună la a treia. Aceleaşi transformări se aplică şi celei de-a
două matrici:
  5 2 
   3 3 0
  1 0 1  
0 1 2 ,  4  1 0
   3 3 
  0 0 1   
  1 2 1  
 
  
Ultima linie se adună la prima, apoi se amplifică prin 2 şi se adună la a două; aceleaşi
transformări se aplică şi celei de-a doua matrici:
  2 4 
  3 
3
1 
1 0 0  
0 1 0,  2 11
2  
   3 3 
  0 0 1   
  1 2 1 
 
  

Se observă că a doua matrice din pereche a devenit egală cu A1 (v. şi rezultatul
metodei analitice mai sus).

3.2. Dreapta în plan


Majoritatea prelucrărilor efectuate asupra datelor experimentale în laboratorul de
Chimie Fizică implică şi o transformare de liniarizare. Scopul acestei transformări este acela
de a aduce graficul punctelor experimentale la forma unei drepte. De aceea, este util să
examinăm câteva din proprietăţile geometrice ale dreptei în plan.

3.2.1. Definiţia analitică a dreptei


Prin definiţie, numim dreaptă mulţimea punctelor între ale căror coordonate există o
relaţie afină (v. mai jos):
 = ( x, y)  2
| m, n  • y = mx  n

Ecuaţia din definiţia de mai sus se numeşte ecuaţie carteziană a dreptei. Pornind de la ea se
pot obţine celelalte două ecuaţii importante:
 : ax  by  c = 0, a, b, c  ecuația implicită

 x =  x   x
 : , a, b,  ecuații parametrice
 y =  y   y

3.2.2. Câteva din proprietăţile dreptei


Fiecare din aceste ecuaţii este utilă, întrucât unele formule au expresii mai simple în
anumite formulări decât în altele. De exemplu:
Versorul director şi cel normal
Pornind de la ecuaţia implicită, avem:
 b 
 2 
a  b2
v=  (versorul director)
 a 
 
 a b
2 2

25
 a 
 2 
a  b2
n=  (versorul normal)
 b 
 2 
 a b
2

Aceşti vectori sunt folosiţi în stabilirea coliniarităţii punctelor şi a ortogonalităţii
dreptelor. Figura 7 ilustrează semnificaţia geometrică a acestor doi vectori.

Figura 7. Versorul normal şi cel director al dreptei.

Panta şi ordonata la origine


Folosind ecuaţia carteziană a dreptei, obţinem pentru pantă si pentru ordonata la
origine expresiile:
 y mx
 = =m (panta)
 : y = mx  n   x x
 y =n (ordonata la origine)
 x =0

Aceşti parametri sunt cel mai des utilizaţi în prelucrarea datelor experimentale,
întrucât semnificaţia lor fizică se poate determina prin comparaţie cu modelul teoretic
liniarizat. Semnificaţia lor geometrică este ilustrată în figura 8. Figura ilustrează, de
asemenea, şi modalitatea de determinare a parametrilor ecuaţiei carteziene a dreptei:
• Panta se determină alegând arbitrar două puncte pe dreaptă, determinând distanţa între ele
pe cele două direcţii canonice (verticală şi orizontală) şi calculând raportul lor, ca în definiţia
de mai sus.
• Ordonata la origine se determină geometric, prelungind dreapta până intersectează axa
Oy şi citind ordonata acelui punct.
În practică, pentru determinarea pantei se aleg două puncte cât mai depărtate pe
dreaptă, pentru a reduce la minimum erorile de citire. Evident, dacă se cunoaşte ecuaţia
carteziană a dreptei (de exemplu, dintr-un calcul de regresie) panta este coeficientul variabilei
independente, iar ordonata la origine este termenul liber, aşa cum arată definiţia de mai sus.

Figura 8. Panta dreptei şi ordonata sa la origine.

Distanţa până la un punct exterior dreptei


Fie P un punct exterior dreptei  şi M piciorul perpendicularei din P pe  . Atunci
distanţa de la P la  este, prin definiţie:

d ( P,  ) = d ( P, M ) = ( xP  xM ) 2  ( yP  yM ) 2

Această distanţă se poate determina cu uşurinţă observând că M se găseşte simultan


pe dreapta  şi pe perpendiculara din P pe  :
axM  bym = c ecuația dreptei

bxm  ayM = bxP  ayP ecuația perpendicularei

Rezolvând acest sistem de ecuaţii liniare şi înlocuind soluţia în definiţia distanţei, se


obţine:
| axP  by p  c |
d=
a 2  b2
Această distanţă este folosită în aşa-numita “regresie totală” (regresie Deming) în care
distanţa de la modelul de regresie la setul de date este măsurată perpendicular pe model
(implicând ambele variabile) şi nu pe verticală ca în regresia clasică, descrisă mai sus. Figura
9 ilustrează definiţia distanţei.

27
Figura 9. Distanţa de la un punct exterior dreptei la dreaptă.

3.3. Liniaritate algebrică şi liniaritate geometrică


Pe parcursul multor demonstraţii şi definiţii din chimia fizic este folosit termenul
“liniar”. O potenţială sursă de confuzie legată de acest termen este semnificaţia lui diferită, în
funcţie de contextul de utilizare. Această semnificaţie va fi discutată în cele ce urmează.

3.3.1. Liniaritate geometrică


În context geometric (în discuţii privitoare la forma unui grafic, la imaginea unui drum
parametrizat, la forma unei dependenţe) termenul liniar indică faptul că graficul unei funcţii,
sau imaginea (hodograful) unui drum parametrizat are forma unei drepte. În acest sens, de
exemplu, funcţia f ( x) = 3 x  4 este liniară, pentru că graficul său este o dreaptă cu panta 3 şi
ordonata la origine 4 .
În laboratorul de Chimie Fizică funcţiile liniare (în sens geometric) joacă un rol
important, pentru că dreapta este figura geometrică a cărei formă poate fi recunoscută imediat
prin simpla inspecţie a graficului. De asemenea, forma dreptei o face foarte puţin susceptibilă
de a supra–corela datele experimentale, ceea ce înseamnă că validitatea modelului poate fi
evaluată prin simplul calcul al coeficientului de determinare. Mai mult, există un număr
important de modele matematice care, deşi nu sunt liniare în sine, pot fi aduse la forma unei
funcţii liniare prin aplicarea unor transformări convenabile asupra variabilei independente
şi/sau a celei dependente. De exemplu, funcţia:
 v H  1 1 
P = P0 exp    
 R  T0 T  
întâlnită în modelarea echilibrelor lichid–vapori pentru substanţe pure, poate fi adusă la o
formă liniară (poate fi liniarizată) prin transformarea
1 
( X , Y ) =  , ln P 
T 
prin care se obţine:
v H v H
Y = X  ln P0
R RT0
care este o funcţie liniară cu parametrii:
v H v H
a= , b=  ln P0
R RT0
reprezentând, respectiv, panta graficului şi ordonata sa la origine. Semnificația simbolurilor
implicate este cea obişnuită în termodinamica echilibrelor de faze şi nu este relevantă în acest
context.
Din punctul de vedere al analizei datelor de laborator, funcţiile liniare au avantajul că
parametrii lor pot fi determinaţi cu uşurinţă, fie prin regresie simplă (formulele (2)), fie direct
din grafic, aşa cum s-a arătat în secţiunea precedentă. Dezavantajul este că din graficele lor nu
se pot determina decât doi parametri, ceea ce le limitează utilitatea.

3.3.2. Liniaritate algebrică


Un al doilea sens (mult mai larg întâlnit) al termenului “liniar” se referă la liniaritatea
algebrică. Din punct de vedere algebric, o funcţie (sau, mai general, un operator) este liniară
(liniar) dacă satisface relaţia:
f ( x   y ) =  f ( x)   f ( y )
în care x şi y sunt puncte arbitrare din domeniul de definiţie al funcţiei (operatorului), iar
 şi  sunt constante reale (în fapt, aceste constante pot aparţine şi altor mulţimi, dar pentru
discuţia de faţă este suficient să le considerăm ca fiind constante reale).
Liniaritatea algebrică definită mai sus poate fi extinsă prin inducţie la orice număr de
argumente:
 n  n
f  i xi  = i f ( xi ), xi  f , i  , i = 1, n
 i =1  i =1
în care f reprezintă domeniul funcţiei (operatorului) f . Această proprietate este frecvent

formulată ca “permutarea cu orice combinaţie liniară de argumente”. De asemenea,


liniaritatea algebrică este echivalentă cu existenţa simultană a proprietăţilor de aditivitate şi

29
omogenitate:
 n  n
f  xi  =  f ( xi ) (operatorul f este aditiv)
 i =1  i =1
f ( x) =  f ( x) (operatorul f este omogen)
Liniaritatea algebrică a unor operatori stă la baza multor formule de calcul şi/sau
demonstraţii din Chimia Fizică. De exemplu, legea lui Kirchhoff este consecinţa imediată a
liniarităţii operatorului de integrare Riemann:
N N N N
 r HT =  i H i0 (T ) =  i  H i0 (T0 )   CP0 ,i dT  =  i H i0 (T0 )   
T T
i T CP0 ,i dT
i =1 i =1  T0  i =1 i =1 0

 n 
T0  
T T
=  r HT   i CP0 ,i  dT =  r HT    r CP dT (8)
0
i =1  0 T0

Să mai observăm că între cele două tipuri de liniaritate există o legătură, în sensul că o
funcţie f :  care este liniară algebric este liniară şi geometric (graficul său este o
dreaptă), dar nu şi invers. Într-adevăr, pentru o funcţie de forma f ( x) = ax  b , avem:
f ( x   y ) = a ( x   y )  b =  ax   ay  b   f ( x )   f ( y ) =  ax   ay  (   )b
În fapt, singura situaţie în care o funcţie liniară geometric este liniară şi algebric este
b = 0 . Se poate arăta că aceste funcţii (de forma f ( x) = ax ) sunt singurele funcţii reale liniare
de variabilă reală.
Pentru a face o distincţie clară între cele două tipuri de liniaritate, funcţiile geometric
liniare mai sunt numite şi funcţii afine.

3.4. Rezolvarea numerică a ecuaţiilor neliniare


Multe dintre mărimile de interes în modelarea matematică a fenomenelor fizico-
chimice sunt definite ca soluţii ale unor ecuaţii neliniare fără soluţie analitică (simbolică).
Pentru a putea determina valoarea unei astfel de mărimi, este necesar să rezolvăm ecuaţia
respectivă pe cale numerică, prin rafinarea succesivă a unei aproximări iniţiale a soluţiei, sau
prin restrângerea succesivă a unui interval presupus a conţine soluţia. În cele ce urmează, vom
discuta câte o metodă din fiecare categorie.
În ambele cazuri, ecuaţia se presupune a fi adusă la forma canonică:
f ( x) = 0
cu funcţia din membrul stâng cel puţin continuă pe un domeniu care conţine soluţia căutată.

3.4.1. Metode de încadrare: metoda bisecţiei


Metoda bisecţiei este una dintre cele mai robuste metode de rezolvare pentru ecuaţiile
neliniare. Este robustă pentru că nu necesită decât ipoteza de continuitate a funcţiei a cărei
rădăcină se caută şi are avantajul că menţine permanent încadrarea soluţiei. Metoda necesită
specificarea unui interval iniţial care conţine soluţia şi pe care îl restrânge succesiv, astfel
încât la fiecare pas, soluţia să se găsească în intervalul curent. Algoritmul se opreşte în
momentul în care lungimea intervalului de încadrare a soluţiei devine mai mică decât un prag
prespecificat.
Metoda se bazează pe continuitatea funcţiei din membrul stâng al formei canonice şi
pe unicitatea soluţiei în intervalul iniţial. Identificarea acestui interval (ca şi a contracţiilor
sale succesive) se bazează pe proprietatea lui Darboux: dacă [ a, b]  este un interval de
continuitate pentru funcţia f , atunci
  [inf ( f [a, b]),sup( f ([a, b])] • x  [a, b] • f ( x) = 
sau, altfel spus, orice număr cuprins între minimul şi maximul funcţiei f pe intervalul [ a , b ]
este valoare a funcţiei.
Un corolar evident şi important al proprietăţii lui Darboux este acela că, dacă funcţia
schimbă semnul între capetele intervalului [ a , b ] , atunci ea are cel puţin o rădăcină în acest
interval.
Cu aceste precizări, algoritmul de bisecţie poate fi descris astfel (se presupune că
intervalul iniţial şi funcţia din membrul stâng al formei canonice sunt cunoscute şi că s-a
stabilit că funcţia are cel mult o rădăcină în intervalul iniţial):
1. Dacă intervalul este mai îngust decât limita de toleranţă prestabilită, atunci punctul
median al intervalului este cea mai bună aproximare a soluţiei:
ab
b  a   x* =
2
Dacă nu, se trece la pasul următor.
2. Se calculează produsul f (a )  f (b) . Dacă f (a )  f (b) 0 , atunci se trece la pasul
următor; dacă nu, funcţia nu are soluţie în intervalul iniţial, deci algoritmul se opreşte.
ab
3. Se determină punctul median al intervalului iniţial, c = şi se evaluează funcţia în
2
acest punct.
4. Dacă f (c )  f (a ) 0 , atunci se restrânge intervalul la [ a , c ] şi se revine la pasul 1. Dacă
nu, intervalul se restrânge la [c, b] şi se revine la pasul 1.
Metoda funcţionează bine pentru ecuaţii pentru care se cunoaşte exact intervalul în
care există soluţia şi se poate presupune în mod rezonabil că aceasta este unică. Cum la

31
fiecare pas lungimea intervalului de căutare se reduce la jumătate, numărul de paşi în care
algoritmul obţine convergenţa este dat de majorantul întreg al logaritmului binar al raportului
dintre lungimea intervalului iniţial şi toleranţă (raportul de reducere a intervalului iniţial):
 ba
nmax = log 2
  
Ca exemplu, să calculăm punctul de fierbere al unui amestec echimolar ideal de ne-electroliţi,
folosind ecuaţia:
  v H1  1 1    v H 2  1 1 
0,5exp   0     0,5exp   0   1 = 0
 R  T1 T    R  T2 T  
în care  v H1,2 sunt entalpiile de vaporizare ale celor doi componenţi ai amestecului, T1,20 sunt

punctele lor de fierbere (saturaţie), iar R este constanta gazelor ideale (Regnault). Folosind
valorile:
 v H1 v H 2
= 6000 K , T10 = 353 K , = 5000 K , T20 = 393 K
R R
şi ştiind că ecuaţia are exact o soluţie în intervalul [T10 , T20 ] , evoluţia algoritmului poate fi

urmărită în tabelul 4.

Tabelul 4. Evoluţia algoritmului de bisecţie pentru punctul de fierbere al unui amestec binar ideal.
ab  ab
Pasul a , K f (a ) b,K f (b) ,K f 
2  2 
1 353,000 -0,3817325648 393,0000 2,3203031685 373,0000 4,966290e-01
353,000 -0,3817325648 373,0000 0,4966290031 363,0000 -2,669456e-02
373,000 0,4966290031 363,0000 -0,0266945562 368,0000 2,103432e-01
363,000 -0,0266945562 368,0000 0,2103432306 365,5000 8,615427e-02
363,000 -0,0266945562 365,5000 0,0861542724 364,2500 2,836967e-02
363,000 -0,0266945562 364,2500 0,0283696699 363,6250 5,044699e-04
363,000 -0,0266945562 363,6250 0,0005044699 363,3125 -1,317746e-02
363,625 0,0005044699 363,3125 -0,0131774575 363,4688 -6,357204e-03
363,625 0,0005044699 363,4688 -0,0063572040 363,5469 -2,931558e-03
363,625 0,0005044699 363,5469 -0,0029315580 363,5859 -1,214843e-03
363,625 0,0005044699 363,5859 -0,0012148434 363,6055 -3,555118e-04
363,625 0,0005044699 363,6055 -0,0003555118 363,6152 7,439775e-05
Din tabel rezultă că:
• Punctul de fierbere al amestecului binar este T = 363, 615 K cu o eroare absolută mai
mică de 0, 01 K .
• Algoritmul satisface criteriul de convergenţă după un număr de paşi egal cu
 40 
nmax = log 2 = 12
 0,01
Metoda bisecţiei funcţionează bine în acest caz pentru că intervalul de încadrare este
cunoscut (temperatura de fierbere a amestecului se află totdeauna între temperaturile de
fierbere ale componenţilor puri) şi se cunoaşte că în acest interval ecuaţia are exact o soluţie
(amestecul nu poate avea mai multe temperaturi de fierbere).

3.4.2. Metode de rafinare a aproximării: metoda Newton-Raphson


Deşi extrem de robustă, metoda bisecţiei necesită cunoaşterea unui prim interval de
încadrare în care ecuaţia trebuie să aibă exact o soluţie. Din nefericire, acest lucru nu este
totdeauna posibil, uneori cunoscându-se doar o valoare aproximativă a rădăcinii, fără nici o
informaţie cu privire la intervalul de încadrare. Mai mult, metoda este destul de lentă, numărul
de evaluări ale funcţiei fiind egal cu logaritmul binar al raportului de reducere a intervalului
inițial.
Metoda Newton-Raphson rezolvă ambele neajunsuri, ea necesitând doar o aproximare
punctuală a soluţiei (nu un interval de încadrare şi unicitate) şi oferind o viteză mult
superioară de convergenţă. Pentru a putea oferi această performanţă, metoda impune restricţii
suplimentare asupra funcţiei din membrul stâng al formei canonice.
Dată fiind o aproximare x* a soluţiei, metoda constă în următorii paşi:
1. Se liniarizează local membrul stâng al formei canonice prin dezvoltare în serie Taylor în
jurul lui x* :
l ( x) = f ( x* )  f ( x* )( x  x* )
2. Forma afină astfel obţinută se substituie în ecuaţia originală, rezultând o ecuaţie de
gradul I cu soluţia:
f ( x* )
x = x* 
f ( x* )
3. Valoarea astfel determinată devine noua aproximaţie a soluţiei. Dacă este îndeplinit
criteriul de convergenţă, atunci algoritmul se opreşte, dacă nu se reia de la pasul 1.
Etapa cheie în evoluţia algoritmului este rafinarea aproximării curente a soluţiei cu

33
ajutorul funcţiei de recurenţă
v( x)
 ( x) = x 
f ( x)
pentru care soluţia ecuaţiei originale este un punct fix. Conform teoremei lui Picard, pentru a
obţine convergenţa, funcţia  trebuie să fie o contracţie. O condiţie necesară pentru aceasta
este ca derivata ei să fie mărginită în modul de o constantă subunitară pe un domeniu care
include toate aproximaţiile succesive ale soluţiei. Din nefericire, nu există nici o metodă de a
verifica a priori această condiţie dar, pentru majoritatea ecuaţiilor, dacă se porneşte de la o
aproximaţie iniţială suficient de apropiată de soluţie, metoda converge cu o viteză
satisfăcătoare. O altă condiţie de convergenţă este ca derivata funcţiei să nu se anuleze în nici
una din aproximaţiile intermediare şi, în particular, soluţia ecuaţiei să nu fie rădăcină dublă a
membrului stâng. Pentru a satisface această condiţie, este suficient ca membrul stâng să fie
monoton într-o vecinătate a soluţiei, iar aproximarea iniţială să fie în această vecinătate.
Ca exemplu, să utilizăm metoda Newton–Raphson pentru a calcula presiunea de
vapori a triclorurii de bor la T = 373,15 K folosind ecuaţia Frost–Kalkwarf–Thodos:
B P
ln P = A   C ln T  D 2
T T
în care constantele A, B, C , D au valorile:
A = 46,103, B = 4443,16, C = 5, 404, D = 2228, 0
Din considerente termodinamice, ştim că funcţia P = P (T ) este strict crescătoare între
punctul triplu şi cel critic, deci ecuaţia trebuie să aibă o singură soluţie la orice temperatură.
Folosind aproximația iniţială P0 = 2 bar şi expresiile:

B P
f ( P ) = ln P  A   C ln T  D 2
T T
1 1
f ( x) = D 2
P T
se obţin datele din tabelul 5.

Tabelul 5. Evoluţia algoritmului Newton–Raphson pentru calculul Pv a triclorurii de bor la 373,15 K.


Pasul P , bar f (P) f ( P)
1,000000 -2,209450e+00 0,98399896
3,245378 -1,068146e+00 0,29212945
6,901792 -3,721035e-01 0,12888885
9,788803 -6,884064e-02 0,08615649
10,587822 -3,160518e-03 0,07844709
10,628110 -7,221370e-06 0,07808906
Pasul P , bar f (P) f ( P)
10,628203 -3,785358e-11 0,07808824
10,628203 -4,163336e-16 0,07808824

Din tabel se observă că:


• Presiunea de saturaţie a triclorurii de bor la T = 373,15 K este de 10,628 bar.
• În 7 iteraţii se obţine rezultatul cu trei zecimale exacte, spre deosebire de metoda bisecţiei,
unde au fost necesare 12 iteraţii pentru a obţine doar două zecimale exacte.

Observând că, deşi neverificabile a priori, condiţiile de convergenţă ale metodei


Newton–Raphson sunt îndeplinite în majoritatea cazurilor de interes practic, aceasta este
metoda cea mai des folosită în rezolvarea numerică a ecuaţiilor neliniare, datorită
proprietăţilor sale superioare de convergenţă.

35

S-ar putea să vă placă și