Sunteți pe pagina 1din 12

Bazele Prelucrarii Datelor

04 Mai 2020

REGRESIA LINIARA in
Excel

1
APLICATIE

Turbiditatea (=concentratie de
particule solide in suspensie in
apa) este utilizata pentru a indica
calitatea apei.
Pentru a studia daca Temperatura
influenteza Turbiditatea apei dintr-
un lac, au fost realizate masuratori
in ultima saptamana din luna
Aprilie si prima saptamana din luna
Mai.
Folosind regresia liniara, sa se
determine legatura dintre
Temperatura si Turbiditatea.

2
Excel
Tool → Data Analysis → Regression → OK

3
1. Select Y Range (B1:B15) – variabila dependenta
2. Select X Range (A1:A15) – variabila independenta
3. Check Labels
4. Click in the Output Range box – select cell A19
5. Check Residuals
6. Click OK 4
5
R- coeficientul de corelatie;
R Square (R2) - coeficientul de
determinare indica cat la suta din
variatia variabilei dependente este
explicata de ecuatia de regresie;
Standard Error- eroarea standard
a estimatiei.

R = 0.638 indica o corelatie slaba intre Temperature si Turbiditate.

R Square = 0.406 indica ca doar 40.6% din turbiditate se explica


prin variabila independenta Temperatura.

6
Tabelul ANOVA contine informatiile privind:
• statistica F cu ajutorul careia se testeaza semnificatia globala a
variabilelor independente;
• Significance F - probabilitatea critica a testului.

Daca Significance F < α (de obicei 0.05) se respinge ipoteza “lipsei


de semnificatie a variabilelor independente” in favoarea ipotezei ca
“modelul regresional este unul semnificativ”.

In Tabelul ANOVA, 0.014 < 0.05, modelul regresional este unul


semnificativ.

7
Tabelul Coefficients contine informatiile privind:
• Coefficients - valoarea coeficientului;
• Standard Error - eroarea standard a coeficientului;
• t - statistica testului de semnificatie a coeficientului;
• P-value - probabilitatea critica a testului.

Un coeficient este semnificativ (diferit de zero in ecuatia de


regresie) daca P-value < α.

8
Pentru exemplul din table, se poate scrie ecuatia de regresie:

Turbiditatea = 26.308 × Temperatura - 510.713.

Toti coeficientii sunt semnificativi statistic P-value <0.05.

Ecuatia de regresie poate fi utilizata si pentru a realiza predictii


(forecast).
De exemplu, se poate estima Turbiditatea pentru temperature de 27.5 ºC:

Turbiditatea = 26.308 × 27.5 - 510.713 = 212.76.

9
Residuals – diferenta
dintre valoarea
dependenta/masurata si
valoarea estima pe baza
ecuatiei de regresie.

De exemplu, pentru Observatia 1, valoarea msurata este 125, valoarea


estimate este 91.747, reziduul = 125 - 91.747 = 33.253

10
Residual Plot
150

100

50
Residuals

-50

-100

-150
20 22 24 26 28 30
Temperatura (ºC), x

11
Lucrarea practica individuala

Un articol in Concrete Research


(Near Surface Characteristics of
Concrete: Intrinsic Permeability,
Vol. 41, 1989) a publicat date
despre rezistenta la compresiune
in MPa (x) si permeabilitate (y)
pentru diferite tipurile de beton.

Folosind regresia liniara, sa se


determine legatura dintre
rezistenta la compresiune
(Strength) si permeabilitate
(Permeability). Pentru o
rezistenta la compresiune de 5
MPa sa se estimeze
permeabilitatea.
12

S-ar putea să vă placă și