Sunteți pe pagina 1din 9

Regresia Liniară Simplă

Exercițiul 1: Pentru un eşantion de 5 puncte de vânzare ale unei firme s-au inregistrat preţul
unui produs, exprimat în lei, şi valoarea vânzărilor produsului, exprimată în mii lei.
Datele sunt prezentate mai jos.

Punct vanzare Pret (lei) Vanzari (mii lei)


1 16 9
2 18 7
3 20 7
4 22 4
5 24 3
Total 304 30

Se cere:
1. Care este volumul eşantionului- din tabelul ANOVA (pe linia Total avem n-1, ca atare
n=5)
2. Să se precizeze ecuaţia estimată a modelului de regresie.
 variabilele statistice sunt instrumente care măsoară realitatea economică:
− variabila dependentă se notează cu Y și cuantifică un fenomen complex
determinat de o serie de factori.
− variabila independentă se notează cu X și măsoară acțiunea unui factor
economic asupra variabilei dependente.
− variabila aleatoare sau reziduală sau eroare sintetizează funcția factorilor
care nu apar explicit în model dar și erorile de modelare determinate e procesul de
culegere a datelor și de metoda statistică și se notează cu ε.
 Parametri.Estimatori.Estimații:
− Parametrii modelului se mai numesc și coeficienți de regresie și sunt
mărimi fixe dar necunoscute care apar în modelul econometric lângă
variabile, constituind obiectul procesului de estimare. Se notează cu litere
grecești.
− Estimatorii sunt variabile aleatoare construite cu scopul de a estima
parametrii modelului.
− Estimațiile sunt valori posibile ale estimatorilor, fiind construite la nivelul
eșantionului, ca atare sunt valori cunoscute calculate pe baza datelor de
observație. Se notează cu litere latine.

Y = β0 + β 1∗X 1+ ε – ecuația de la nivelul populație;


Y =b0 +b1∗X +e – ecuația estimată de la nivelul eșantionului.

β 0= parametru asociat unei constante ( valoarea 1 ) , termen liber sau intercept


șiindică valoarea medie a variabilei dependenteYatunci când variabila
independetă X ia valoarea 0 ;
β 1=indică variația absolută medie a variabilei dependente la
o variație absolută cu o unitate a variabilei independente sau arată

1
răspunsul variabilei Y la o creștere sau scădere cu o unitate a variabilei X .

-pentru a scrie ecuația estimată a modelului trebuie să ne uităm la tabelul 3


”Coeficienților de regresie”, în acest tabel pe prima linie avem valoarea estimată a lui
β 0 iar pe cea de a doua linie valoarea estimată a lui β 1. Cu ajutorul valorilor din tabel,
de pe prima coloană, ecuația estimată va fi:
𝑌 = 𝑏0 + 𝑏1 ∗ 𝑋 + 𝑒
Val vanzari=21−0.75∗Pret

3. Să se interpreteze estimaţiile punctuale ale parametrilor de regresie


-pentru a interpreta estimațiile punctuale ale coeficienților de regresie ne vom folosi tot
de valorile din tabelul 3.
Interpretare:b 0= valoarea medie a vânzărilor atunci când prețul este 0 lei, este de 21 mii
lei.
Interpretare:b 1 = la o creștere cu un leu al prețului, valoarea vânzărilor scade în medie
cu 0.75 mii lei.
Reguli de interpretare a lui b 1:
1. Dacă b 1=0, între cele două variabile nu există o legătură de tip liniar sau variabila
independetă nu influențează liniar variabila dependetă, ca atare nu putem afirma
decât- prețul nu influențează semnificativ variabila vânzări;
2. Dacă b 1>0 , între cele două variabile avem o legătură directă sau pozitivă, iar
variabilele variază în același sens- dacă prețul scade cu o unitate, scad și vânzările
în medie cu b 1 sau dacă prețul crește cu o unitate, cresc și vânzările în medie cu b 1;
3. Dacă Dacă b 1<0 , între variabile există o relație inversă – dacă prețul scade cu o
unitate, valoarea vânzărilor va crește în medie cu valoarea lui b 1
4. Să se determine şi să se interpreteze intervalele de încredere obţinute pentru parametrii
modelului de regresie
-pentru a calcula intervalele de încredere pentru parametrii ne vom folosi din nou de
tabelul 3, dar plecând de la formula:
IC : ^
β0 ± t α ∗ σ^β = [ 21 ±3,182∗2,258 ] =[ 21 ±7,184 ] =[13,813 ; 28,187]
[ 2
;n−k ] 0

IC : ^
[ β ±t
1 α
2
;n−k
∗σ^ =[ −0,75 ±3,182∗0,122 ] =[ −0,75 ± 0,3882 ] =[−1,106 ;−0,394]
] β1

- k reprezintă numărul de parametrii din model, în cazul nostru va fi 2 ( β 0 , β 1 ¿ .


- σ^β siσ β se citesc din tabelul “Coefficients” de pe coloana Standard Error
0 1

Interpretare: Cu o probabilitate de 95% putem afirma că parametrul β 0 este acoperit de


intervalul de încredere ce are limită inferioară 13,813 și limită superioară 28,187
Interpretare: Cu o probabilitate de 95% putem afirma că parametrul β 1 este acoperit de
intervalul de încredere ce are limită inferioară −1,106 și limită superioară −0,394
5. Să se estimeze şi să se interpreteze valorile raportului de corelaţie şi ale raportului de
determinaţie
Analiza de corelație deseori insoțește analiza de regresie pentru a măsura
intensitatea relaților stabilite între variabila dependentă și cele independente. Indicatorii
sunt:

2
-coeficientul de corelație numit si Pearson ce se notează cu ρ iar estimația cu r;
- raportul de determinație notat cu η2iar estimația cu R2
- raportul de corelație notat cu η iar estimația cu R.
Pentru a citi valoarea indicatorilor η2 și η vom folosi tabelul 1, ”Model
Summary”.
Prima valoarea din tabel este valoarea estimată a raportului de corelație (R) =
0.968.
Interpretare: Conform valorii estimate a raportului de corelație putem afirma că între
variabila dependetă valoarea vânzărilor și variabila independentă prețul există o
legătură liniară puternică ( deoarece se apropie de 1).
Cea de a doua valoare din tabel este valoarea estimată a raportului de determinație
2
( R ¿ = 0.938
Interpretare: 93,8% din variația variabilei dependente valoarea vânzărilor este explicată
de modelul de regresie construit.
Raportul de corelație și cel de determinație pot fi estimați si pe baza tabelului 2
”ANOVA”, folosind descompunerea estimației variației totale astfel.

- Variația Totală = Variația Explicată + Variația Reziduală - (ecuație de la nivelul


populației)
- TSS (estimația variației totale) = ESS (estimația variației explicate) + RSS(estimația
variației reziduale) – (ecuația de la nivelul eșantionului)
ESS 22,5
R 2= = =0.937
TSS 24
R=√ R 2=√ 0.937=0.968
6. Să se estimeze punctual şi să se interpreteze valoarea coeficientului de corelaţie
Pentru a citi valoarea estimată a coeficientului de corelație ne vom folosi de tabelul 4
”Correlations”. Valoarea estimată se regăsește la intersecția dintre variabile.
r = -0.968.
Reguli de interpretare a lui r:
1. Dacă r =0, între cele două variabile nu există o legătură de tip liniar sau variabila
independetă nu influențează liniar variabila dependetă, ca atare nu putem afirma
decât- prețul nu influențează semnificativ variabila vânzări;
2. Dacă r >0, între cele două variabile avem o legătură directă sau pozitivă, iar
variabilele variază în același sens- dacă prețul scade cu o unitate, scad și vânzările
în medie cu b 1 sau dacă prețul crește cu o unitate, cresc și vânzările în medie cu b 1;
3. Dacă Dacă r <0, între variabile există o relație inversă – dacă prețul scade cu o
unitate, valoarea vânzărilor va crește în medie cu valoarea lui b 1.
4. Cu cât valoarea estimată este mai aproape de 1 sau -1 cu atât legătura este mai
puternică.
5. Cu cât valoarea estimată este mai aproape de 0, cu atât legătura este mai slabă.
6. O valoare estimată în jur de 0.5 sau -0.5 indică o legătură medie
Interpretare: Cu o probabilitate de 95% putem afirma că între varibila dependentă
valoarea vânzărilor și variabila independentă prețul există o legătură directă, inversă
și puternică
7. Să se verifice semnificaţia coeficientului de corelaţie Pearson

3
Verificarea semnificație înseamnă testarea statistică a coeficientului de corelație
Pearson. Pentru a testa semnificația vom urma pașii obișnuiți folosiți în testare.
I. Stabilirea ipotezelor:
1. Ipoteza nulă
H 0 : ρ=0 ¿
variabilele nu sunt corelate
2. Ipoteza alternativă
H 1 : ρ≠ 0 ¿
prinurmare între variabile există o legătură liniară
II. Alegerea pragului de semnificație- riscul considerat
α =0.05 sau 5 %
III. Calcularea statisticii test- în cazul testării coeficientului de corelație vom folosi
statistica Student t iar formula de calcul este:
n−2 5−2

IV.
t calculat =r
√(1−r )
2
=−0.968
√(1−0.937 )
=−6.733

Valoarea critică – vom căuta în tabelul Student t valoarea teoretică pentru datele
problemei
t α =t 0.025 ,3=3.182
, n−2
2
V. Regula de Decizie:
|t calculat|>tteoretic =se respinge ipoteza nul ă ,coeficientul de corelație este
semnificatic statistic , prinurmare variabilele sunt corelate
|t calculat|<tteoretic =nu se respinge ipoteza nul ă ,coeficientul de corelație nu este
semnificatic statistic , prinurmare variabilele nu sunt corelate

VI. Decizie:
|t calculat|>tteoretic ≡|6.733|>3.182 → serespinge ipoteza nul ă , prin urmare variabila independentă preț
și variabiladependdetă valoarea vânzărilor sunt corelate

8. Să se testeze semnificaţia parametrului de regresie 0, considerând un risc de 5%


9. Să se prezinte demersul testării semnificaţiei parametrului 1 şi să se interpreteze
rezultatul, pentru un risc de 5%
10. Să se testeze semnificaţia raportului de corelaţie, considerând un risc de 5%
11. Să se testeze dacă modelul de regresie este semnificativ sau corect specificat (să se
testeze semnificaţia influenţei variabilei independente asupra variabilei dependente)
12. Cu cat variaza vanzarile daca pretul scade cu 2 lei?
13. Estimati valoarea vanzarilor pentru un pret de 16 lei
14. Cu cat ar trebui sa se reduca pretul pentru a creste vanzarile cu 3 mii lei?

2
∑ y i ∑ x i −∑ xi ∑ x i y i n ∑ x i y i −∑ xi ∑ y i
b0 = 2
, b1 = 2
2
n ∑ xi −(∑ xi ) n ∑ x2i −(∑ xi )

4
9.00

8.00

7.00
Val_vanzari

6.00

5.00

4.00

3.00

16.00 18.00 20.00 22.00 24.00

Pret

Figura 1. Legătura dintre Preţ şi Valoarea vânzărilor

Tabelul 1. Model Summary


Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .968a .938 .917 .70711
a. Predictors: (Constant), Pret

Tabelul 2. Procedeul ANOVA pentru regresie


ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 22.500 1 22.500 45.000 .007a
Residual 1.500 3 .500
Total 24.000 4
a. Predictors: (Constant), Pret
b. Dependent Variable: Val_vanzari

este linia Tabelul 3. Coeficienţii de regresie


pentru estimatia Coefficientsa
lui β 0 Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 21.000 2.258 9.299 .003 13.813 28.187
Pret -.750 .112 -.968 -6.708 .007 -1.106 -.394
a. Dependent Variable: Val_vanzari

este linia
pentru estimatia
lui β 1

5
Tabelul 4. Coeficientul de corelaţie Pearson
Correlations

Pret Val_vanzari
Pret Pearson Correlation 1 -.968**
Sig. (2-tailed) .007
N 5 5
Val_vanzari Pearson Correlation -.968** 1
Sig. (2-tailed) .007
N 5 5
**. Correlation is significant at the 0.01 level (2-tailed).

Exercițiul 2: Pentru județele din România s-au înregistrat valorile medii pentru Rata
Natalității și Rata Mortalității pentru anul 2018. O parte din date sunt prezentate în tabelul de mai
jos.

Tabelul 5. Datele colectate

Se cere:
1. Care este volumul eşantionului?
2. Să se precizeze ecuaţia estimată a modelului de regresie
3. Să se interpreteze estimaţiile punctuale ale parametrilor de regresie

6
4. Să se determine şi să se interpreteze intervalele de încredere obţinute pentru parametrii
modelului de regresie
5. Să se estimeze şi să se interpreteze valorile raportului de corelaţie şi ale raportului de
determinaţie
6. Să se estimeze punctual şi să se interpreteze valoarea coeficientului de corelaţie
7. Să se verifice semnificaţia coeficientului de corelaţie Pearson
8. Să se testeze semnificaţia parametrului de regresie 0, considerând un risc de 5%
9. Să se prezinte demersul testării semnificaţiei parametrului 1 şi să se interpreteze
rezultatul, pentru un risc de 5%
10. Să se testeze semnificaţia raportului de corelaţie, considerând un risc de 5%
11. Să se testeze dacă modelul de regresie este semnificativ sau corect specificat (să se
testeze semnificaţia influenţei variabilei independente asupra variabilei dependente)
12. Estimati rata natalității pentru o rată a mo\za „rtalității de 9 unități.

Figura 2. Legătura dintre rata nat. Și rata mort.

Tabelul 6. Model Summary


Model Summaryb

Model R R Square Adjusted R Square Std. Error of the


Estimate

1 ,556a ,309 ,292 ,9805

7
a. Predictors: (Constant), rata_mort
b. Dependent Variable: rata_nat
Tabelul 7. Procedeul ANOVA pentru regresie

ANOVAa

Model Sum of Squares df Mean Square F Sig.

Regression 17,218 1 17,218 17,911 ,000b

1 Residual 38,453 40 ,961

Total 55,671 41

a. Dependent Variable: rata_nat


b. Predictors: (Constant), rata_mort

Tabelul 8. Coeficienţii de regresie


Coefficientsa

Model Unstandardized Coefficients Standardized t Sig. 95,0% Confidence Interval for B


Coefficients

B Std. Error Beta Lower Bound Upper Bound

(Constant) 13,991 1,209 11,572 ,000 11,547 16,434


1
rata_mort -,422 ,100 -,556 -4,232 ,000 -,624 -,221

a. Dependent Variable: rata_nat

Tabelul 9. Coeficientul de corelaţie Pearson

Correlations

rata_mort rata_nat

Pearson Correlation 1 -,556**

rata_mort Sig. (2-tailed) ,000

N 42 42
**
Pearson Correlation -,556 1

rata_nat Sig. (2-tailed) ,000

N 42 42

**. Correlation is significant at the 0.01 level (2-tailed).

8
9

S-ar putea să vă placă și