Sunteți pe pagina 1din 20

Modele empirice

Calcul de regresie

Calcul de regresie
Utilizare: o modelarea proceselor complexe in chimie, biologie, tehnica, procese economice, monitorizare mediu, o prognoze, optimizare

Justificare
Nu se cunoaste natura dependentei variabileleor unui proces
Se pot obtine date experimentale care arata o dependenta intre variabile Se propune un model- o relatie sau un set de realtii, care reflecta dependenta variabilelor Regresie = intoarcere (intoarcere si comparare cu datele experimentale)

Etapele calculului de regresie


Inventarierea variabilelor Obtinerea datelor experimentale Alegerea regresie (propunerea) unui model de

Calculul coeficientilor modelului de regresie Testarea modelului

Inventarierea variabilelor
Se analizeaza sistemul si se stabileste care este variabila dependenta si care sunt variabilele independente sau factori

Y variabila dependenta X1, X2, Xn variabilele independente (factori) Exemple: 1. Randamentul unei reactii depinde de temperatura de reactie si de raportul dintre reactanti:

Y = randament
X1 = temperatura, X2 = raportul dintre reactanti

2. Capacitatea calorica a uni gaz depinde de temperatura: Y = Cp

X = temperatura
3. Nivelul salariului depinde de gradul de educatie (ani de scoala/studii):

Y= salariul
X = nr ani de studii 4. Costul unui vas depinde de volumul sau: Y = cost X = volum vas

Obtinerea datelor experimentale


Obtinerea datelor in regim aleator:

Datele masurate sa acopere tot domeniul de interes


Datele masurate sa fie numeroase Obtinerea datelor in regim programat

Date ce nu arata o corelare y = f(x)

Cresterea lui x implica o scadere a valorii y

Valorile y variaza dupa o curba

Din analiza datelor experimentale se remarca faptul ca valorile Y depind de valorile variabilei independente X. Daca se cunoaste procesul in profunzime se incearca sa se gaseasca un model (o relatie) care sa reflecte variatia datelor experimentale, adica sa se gaseasca o functie f astfel incat y=f(x). Daca y depinde de mai multi factori atunci relatia devine y=f(x1,x2,xn)

Alegerea formei modelului


Relatia pe care ocautam constituie modelul de regresie. In calculul de regresie se considera ca variabilele X nu sunt afectate de eroare de masurare. Variabila dependenta Y este variabila afectata de erori de experimentare.

X=t Y=h

Regresie liniara
experimental

calculat

Diferenta dintre valoarea experimentala si cea data de model se exprima ca

k yk y

Modelul liniar cu o variabila independenta

b0 b1 x y
k )2 SSE ( yk y
k 1 m

Suma patratelor abaterilor (Sum of squared errors)

Cea mai buna dreapta va corespunde minimului sumei celor mai mici patrate ( metoda celor mai mici patrate)
SSE ( yk b0 b1 * xk ) 2
k 1 m

M = nr puncte experimentale

Functia obiectiv

min SSE
( b0 ,b1 )

Ecuatiile caracteristice ale metodei celor mai mici patrate


SSE 2 ( yk b0 b1 * xk ) *(1) 0 b0 k
SSE 2 ( yk b0 b1 * xk ) *( xk ) 0 b1 k

mb0 b1 xk yk
k 1 k 1

b0 xk b1 x xk yk
k 1 k 1 2 k k 1

Exemplu
nr exp (k) 1 2 3 4 5 6 7 temperatura, C x 120 130 135 138 144 154 163 984 Randament, % y 60 63 64 67 68 71 73 466 x*x 14400 16900 18225 19044 20736 23716 26569 139590 x*y 7200 8190 8640 9246 9792 10934 11899 65901

7 b0 984 b1 466 984 b0 139590 b1 65901

b0=22,8

b1=0.311

Rezolvare in EXCEL
75 y = 0.3114x + 22.803 R2 = 0.9776

70

randament, %

65

60

55

50 120

125

130

135

140

145

150

155

160

165

170

temperatura, C

Regresie liniara multipla


b0 b1 x1 b2 x2 ...bn xn y

Exmplu:

b0 b1 x1 b2 x2 y
k )2 SSE ( yk y
k 1 m

SSE ( yk b0 b1 * x1,k b2 x2,k ) 2


k 1

min SSE
( b0 ,b1 ,b2 )

Sistemul de ecuatii pentu 2 variabile independente


SSE 2 ( yk b0 b1 * x1,k b2 x2,k ) *(1) 0 b0 k SSE 2 ( yk b0 b1 * x1,k b2 x2 , k ) *( x1 , k ) 0 b1 k SSE 2 ( yk b0 b1 * x1,k b2 x2 , k ) *( x2 , k ) 0 b2 k

mb0 b1 x1 ,k b2 x2,k yk
k 1 k 1 k 1

b0 x1, k b1 x b2 x1, k x2, k x1, k yk


k 1
m

k 1
m

2 1, k

k 1

k 1
m

b0 x2, k b1 x1,k x2,k b2 x


k 1 k 1 k 1

2 2, k

x2, k yk
k 1

Model de tip polinomial


y b0 b1 x b2 x 2
Exemplul tipic :

(3)

Cp a b t c t 2
Modelul poate fi transformat intr-un model liniar: Cp=y t=x1 t2=x2 Relatia propusa pentru variatia capacitatii calorice cu temperatura poate fi considerata de tipul relatiei 2

Verificarea gradului de corelare, coeficientul de determinare R2


R2 1
2 ( y y ) k k k 1 m 2 ( y Y ) k k 1 m

y
k 1

media artmetica

R2 este o masura a gradului in care modelul potriveste datele experimentale. Daca R2 este 1 variatia lui y este total explicata de modelul propus
Toate softurile dedicate regresiei calculeaza valoarea R2

Rezolvare in EXCEL
nr exp, k 1 2 3 4 5 6 7 8 9 t(C) 20 100 200 300 400 500 600 700 800 Cp CO2 (cal/molC) 6.96 6.97 7 7.06 7.12 7.2 7.28 7.35 7.44

7.5 7.4 7.3

y = 0.0006x + 6.8972 R2 = 0.9736

y = 5E-07x 2 + 0.0003x + 6.9425 R2 = 0.997

Cp, cal/molC

7.2 7.1 7 6.9 6.8 0 100 200 300 400 t, C 500 600 700 800 900

Regresie pt modelul y=b0+b1x1+b2x2


nr experim, k 1 2 3 4 5 6 7 t, C 20 25 30 35 40 45 50 durata stationare, min randam, % 50 65 55 68 60 70 70 75 80 77 90 78 100 79

randam y t x1 tau x2
y 58.80714 0.904286 x1 0.24 x2 R 2 0.962

SUMMARY OUTPUT Regression Statistics Multiple R 0.980908 R Square 0.962181 Adjusted R Square 0.943271 Standard Error 1.300412 Observations 7 ANOVA df Regression Residual Total SS MS F Significance F 2 172.0929 86.04643 50.88279 0.00143 4 6.764286 1.691071 6 178.8571

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0% Intercept 58.80714 3.191029 18.4289 5.1E-05 49.94741 67.66688 49.94741 67.66688 X Variable 10.904286 0.376254 2.403394 0.074083 -0.14036 1.948936 -0.14036 1.948936 X Variable 2 -0.24 0.217601 -1.10294 0.331947 -0.84416 0.364157 -0.84416 0.364157