Econometrie
Econometrie
Exercițiul 1: Pentru un eşantion de 5 puncte de vânzare ale unei firme s-au inregistrat preţul
unui produs, exprimat în lei, şi valoarea vânzărilor produsului, exprimată în mii lei.
Datele sunt prezentate mai jos.
Se cere:
1. Care este volumul eşantionului- din tabelul ANOVA (pe linia Total avem n-1, ca atare
n=5)
2. Să se precizeze ecuaţia estimată a modelului de regresie.
variabilele statistice sunt instrumente care măsoară realitatea economică:
− variabila dependentă se notează cu Y și cuantifică un fenomen complex
determinat de o serie de factori.
− variabila independentă se notează cu X și măsoară acțiunea unui factor
economic asupra variabilei dependente.
− variabila aleatoare sau reziduală sau eroare sintetizează funcția factorilor
care nu apar explicit în model dar și erorile de modelare determinate e procesul de
culegere a datelor și de metoda statistică și se notează cu ε.
[Link]ții:
− Parametrii modelului se mai numesc și coeficienți de regresie și sunt
mărimi fixe dar necunoscute care apar în modelul econometric lângă
variabile, constituind obiectul procesului de estimare. Se notează cu litere
grecești.
− Estimatorii sunt variabile aleatoare construite cu scopul de a estima
parametrii modelului.
− Estimațiile sunt valori posibile ale estimatorilor, fiind construite la nivelul
eșantionului, ca atare sunt valori cunoscute calculate pe baza datelor de
observație. Se notează cu litere latine.
1
răspunsul variabilei Y la o creștere sau scădere cu o unitate a variabilei X .
IC : ^
[ β ±t
1 α
2
;n−k
∗σ^ =[ −0,75 ±3,182∗0,1 12 ] = [−0,75 ± 0,3 56 2 ] =[−1,106 ;−0,394]
] β1
2
- coeficientul de corelație numit si Pearson ce se notează cu ρ iar estimația cu r;
Măsoară intensitatea și ne dă sensul de variație ale celor 2 variabile.
- raportul de determinație notat cu η2iar estimația cu R2
Indică procentul de variație explicată a Variabilei Dependente de către cea
Independentă.
- raportul de corelație notat cu η iar estimația cu R.
Măsoară doar intensitatea legăturii.
Raportul de corelație și cel de determinație variază între 0 și 1.
Pentru a citi valoarea indicatorilor η2 și η vom folosi tabelul 1, ”Model
Summary”.
-dacă valoarea lui R este aproape de 0 avem o legătură slabă
- aproape de 1 legătură puternică
- 0 =nu avem o legătură liniară între variabile
- 1 = legătură perfectă
- 0.5 = legătură de intensitate medie
Prima valoarea din tabel este valoarea estimată a raportului de corelație (R) =
0.968.
Interpretare: Conform valorii estimate a raportului de corelație putem afirma că între
variabila dependentă Valoarea Vânzărilor și variabila independentă Prețul există o
legătură liniară puternică ( deoarece se apropie de 1).
Cea de a doua valoare din tabel este valoarea estimată a raportului de determinație
( R2 ¿ = 0.938 (această valoare se poate transforma în procente)
Interpretare: 93,8% din variația variabilei dependente Valoarea Vânzărilor este
explicată de modelul de regresie construit sau este explicată de variația variabilei
independente Prețul.
Raportul de corelație și cel de determinație pot fi estimați si pe baza tabelului 2
”ANOVA”, folosind descompunerea estimației variației totale astfel.
3
2. Dacă r >0, între cele două variabile avem o legătură directă sau pozitivă, iar
variabilele variază în același sens- dacă prețul scade cu o unitate, scad și vânzările
în medie cu b 1 sau dacă prețul crește cu o unitate, cresc și vânzările în medie cu b 1;
3. Dacă r <0, între variabile există o relație inversă – dacă prețul scade cu o unitate,
valoarea vânzărilor va crește în medie cu valoarea lui b 1.
4. Cu cât valoarea estimată este mai aproape de 1 sau -1 cu atât legătura este mai
puternică.
5. Cu cât valoarea estimată este mai aproape de 0, cu atât legătura este mai slabă.
6. O valoare estimată în jur de 0.5 sau -0.5 indică o legătură de intensitate medie.
Interpretare: Cu o probabilitate de 95% putem afirma că între varibila dependentă
Valoarea Vânzărilor și variabila independentă Prețul există o legătură inversă și
puternică.
7. Să se verifice semnificaţia coeficientului de corelaţie Pearson.
Verificarea semnificație înseamnă testarea statistică a coeficientului de corelație
Pearson. Pentru a testa semnificația vom urma pașii obișnuiți folosiți în testare.
I. Stabilirea ipotezelor:
1. Ipoteza nulă
H 0 : ρ=0 ¿
variabilele nu sunt corelate)
2. Ipoteza alternativă
H 1 : ρ≠ 0 ¿
prinurmare între variabile există o legătură liniară)
II. Alegerea pragului de semnificație- riscul considerat
α =0.05 sau 5 %
III. Alegerea statisticii test- în această etapă conform literaturii de specialitate vom
lucra cu statistica Student pentru că nu avem informații cu privire la gradul de
împrăștiere al populației.
Vom căuta în tabelul Student t valoarea teoretică având datele problemei
t teoretic=t α =t 0.025 ,3 =3.182
,n−k
2
IV. Calcularea statisticii test- în cazul testării coeficientului de corelație vom folosi
statistica Student t iar formula de calcul este:
n−2 5−2
V. Regula de Decizie
√(
t calculat =r
)
1−r 2
√(
=−0.968 )
1−0.937
=−6.733
4
Testarea cu ajutorul lui Sig- ne vom uita tot în tabelul „Correlations”, pe linia lui Sig
Pentru problema noastră avem (Sig = 0.007) < ¿ = 0.05 ) → se respinge ipoteza nulă,
coeficientul de corelație este diferit de zero, prin urmare este semnificativ statistic, ca atare
variabilele considerate în analiză prezintă o legătură liniară.
! Întotdeauna decizia luată pe baza Sig-ului trebuie să fie aceași cu decizia luată pe baza
statisticii test.
^β 0 21.000
t calculat = = =9.299
σ^ β 0
2.258
-pentru a calcula valoarea lui t în această etapă vom folosi din nou tabelul
„Coefficients”,
pentru numărător vom folosi estimația lui β 0 din coloana „Unstandardized
Coefficients” „B”;
iar la numitor vom folosi estimația abaterii standard a estimatorului lui β 0, din
coloana „Unstandardized Coefficients” „[Link]”.
Regulile de Decizie
5
|t calculat|>tteoretic =¿se respinge ipoteza nulă, coeficientul de regresie este
semnificativ diferit de zero, prin urmare este semnificativ statistic
|t calculat|<t teoretic = nu se respinge ipoteza nulă, coeficientul de regresie nu este
semnificativ diferit de zero, prin urmare nu este semnificativ statistic
Decizia
|t calculat|>tteoretic ≡|9.299|>3.182 → se respinge ipoteza nulă, asta înseamnă că
parametrul β 0 este semnificativ statistic.
Testarea cu ajutorul lui Sig- ne vom uita tot în tabelul „Coefficients”, în coloana Sig, pe
linia corespunzătoare lui β 0.
Pentru problema noastră avem (Sig = 0.003) < ¿ = 0.05 ) → se respinge ipoteza nulă asta
înseamnă că parametrul β 0 este semnificativ statistic.
9. Să se prezinte demersul testării semnificaţiei parametrului b1 şi să se interpreteze
rezultatul, pentru un risc de 5%
Stabilirea ipotezelor:
Ipoteza nulă
H 0 : β1 =0(parametrul de regresie nu este semnificativ statistic, ca atare
variabila independentă Prețul nu are o influență liniară asupra variabilei
dependente Valoarea Vânzărilor)
Ipoteza alternativă
H 1 : β 1 ≠ 0(parametrul de regresie este semnificativ statistic, ca atare variabila
independentă Prețul are o influență liniară asupra variabilei dependente
Valoarea Vânzărilor)
^β 1 −0.750
t calculat = = =−6.708
σ^ β1
0. 112
-pentru a calcula valoarea lui t în această etapă vom folosi din nou tabelul
„Coefficients”,
6
pentru numărător vom folosi estimația lui β 1 din coloana „Unstandardized
Coefficients” „B”;
iar la numitor vom folosi estimația abaterii standard a estimatorului lui β 1, din
coloana „Unstandardized Coefficients” „[Link]”.
Regulile de Decizie
|t calculat|>tteoretic =¿se respinge ipoteza nulă, coeficientul de regresie este
semnificativ diferit de zero, prin urmare este semnificativ statistic
|t calculat|<t teoretic = nu se respinge ipoteza nulă, coeficientul de regresie nu este
semnificativ diferit de zero, prin urmare nu este semnificativ statistic
Decizia
|t calculat|>tteoretic ≡|6.708|>3.182 → se respinge ipoteza nulă, asta înseamnă că
parametrul β 1 este semnificativ statistic, prin urmare Prețul influențează
semnificativ Valoarea Vânzărilor.
Testarea cu ajutorul lui Sig- ne vom uita tot în tabelul „Coefficients”, în coloana Sig, pe
linia corespunzătoare lui β 1.
Pentru problema noastră avem (Sig = 0.007) < ¿ = 0.05 ) → se respinge ipoteza nulă asta
înseamnă că parametrul β 1 este semnificativ statistic, prin urmare Prețul influențează
semnificativ Valoarea Vânzărilor.
7
Calcularea statisticii test- pentru a calcula statistica Fisher ne vom folosi de
ANOVA
ESS 22,500
∗n−k (v 2) ∗3
RSS 1,500
F calculat = = =45
k −1(v 1) 1
ESS reprezintă estimația variației explicată a variabilei dependente de
către variabila independentă și o citim din tabelul ANOVA „Sum of
Squares”, de pe linia „Regression”
RSS reprezintă estimația variației reziduală sau cea ce nu poate explica
modelul construit iar valoarea o citim din tabelul ANOVA „Sum of
Squares”, de pe linia „Residual”
Regulile de Decizie
F calculat > F teoretic=¿se respinge ipoteza nulă, Raportul de Corelație este
semnificativ diferit de zero, prin urmare este semnificativ statistic iar
variabilele sunt corelate.
Decizia
F calculat > F teoretic=45>10,128 → se respinge ipoteza nulă, asta înseamnă că
indicatorul Raportul de Corelație este semnificativ statistic, iar între variabila
dependentă și cea independentă există o relație liniară semnificativă.
Testarea cu ajutorul lui Sig- valoarea estimată a probabilității Sig o vom lua din
tabelul ANOVA
Pentru problema noastră (Sig = 0.007) < (ᾳ = 0.05) ca atare respingem ipoteza
nulă, raportul de corelație fiind semnificativ statistic, prin urmare variabilele sunt
corelate liniar.
11. Să se testeze dacă modelul de regresie este semnificativ sau corect specificat (să se
testeze semnificaţia influenţei variabilei independente asupra variabilei dependente)
- Aici tot tabelul ANOVA îl vom folosi pentru a testa modelul. Un model corect
specificat sau semnificativ înseamnă un model care explică semnificativ cum
reacționează variabila dependentă la modificările variabilei independente.
! Cu mici excepții, demersul de testare a modelului de regresie pentru Regresia
Simplă este același cu testarea Raportului de Corelație sau Raportului de
Determinație
Stabilirea ipotezelor:
Ipoteza nulă
H 0 : β 0 , β 1=0(parametrii modelului nu sunt semnificativi diferiți de 0, prin
urmare modelul de regresie nu este semnificativ statistic, nu este corect
8
specificat sau nu explică comportamentul variabilei dependente influențat de
variabila independentă)
Ipoteza alternativă
H 1 : β 0 , β 1 ≠ 0(parametrii modelului sunt semnificativi statistici asta înseamnă
că modelul este semnificativ statistic iar modelul explică variabila dependentă
influențată de variabila independentă)
Alegerea pragului de semnificație- riscul considerat
idem
Alegerea statisticii test
idem
Calcularea statisticii test
idem
Regulile de Decizie
idem
Decizia- se respinge ipoteza nulă așadar modelul este corect specificat, iar
comportamenul variabilei dependente este explicat de comportamentul variabilei
independente.
Testarea cu ajutorul lui Sig- valoarea estimată a probabilității Sig o vom lua din
tabelul ANOVA
Și la fel vom lua decizia ca la testarea Raportului de Corelație
2
∑ y i ∑ x i −∑ xi ∑ x i y i n ∑ x i y i −∑ xi ∑ y i
b0 = 2
, b1 = 2
2
n ∑ xi −(∑ xi ) n ∑ x2i −(∑ xi )
9
9.00
8.00
7.00
Val_vanzari
6.00
5.00
4.00
3.00
Pret
Interpretare Grafic:
din grafic observăm că avem o legătură liniară puternică (deoarece toate punctele sunt
dispuse în jurul liniei și aproape de aceasta);
orientarea liniei indică faptul că avem o legătură inversă, cu cât prețul este mai mare cu
atât valoarea vânzărilor este mai mică
Raportul de
determinatie
Raportul de
Tabelul 1. Model Summary
corelatie
Coloana aceasta se poate folosi pt. a calcula F
Model Summary astfel:
22.500
Adjusted Std. Error of F cal= =45
Model R R Square R Square the Estimate 0.500
1 .968a .938 .917 .70711
a. Predictors: (Constant), Pret
10
este linia Tabelul 3. Coeficienţii de regresie
pentru estimatia Coefficientsa
lui β 0 Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 21.000 2.258 9.299 .003 13.813 28.187
Pret -.750 .112 -.968 -6.708 .007 -1.106 -.394
a. Dependent Variable: Val_vanzari
este linia
pentru estimatia
lui β 1
Tabelul 4. Coeficientul de corelaţie Pearson
Correlations
Pret Val_vanzari
Pret Pearson Correlation 1 -.968**
Sig. (2-tailed) .007
N 5 5
Val_vanzari Pearson Correlation -.968** 1
Sig. (2-tailed) .007
N 5 5
**. Correlation is significant at the 0.01 level (2-tailed).
11
Exercițiul 2: Pentru județele din România s-au înregistrat valorile medii pentru Rata Natalității
și Rata Mortalității pentru anul 2018. O parte din date sunt prezentate în tabelul de mai jos.
Se cere:
1. Care este volumul eşantionului?
2. Să se precizeze ecuaţia estimată a modelului de regresie
3. Să se interpreteze estimaţiile punctuale ale parametrilor de regresie
4. Să se determine şi să se interpreteze intervalele de încredere obţinute pentru parametrii
modelului de regresie
5. Să se estimeze şi să se interpreteze valorile raportului de corelaţie şi ale raportului de
determinaţie
6. Să se estimeze punctual şi să se interpreteze valoarea coeficientului de corelaţie
7. Să se verifice semnificaţia coeficientului de corelaţie Pearson
8. Să se testeze semnificaţia parametrului de regresie b0, considerând un risc de 5%
12
9. Să se prezinte demersul testării semnificaţiei parametrului b1 şi să se interpreteze
rezultatul, pentru un risc de 5%
10. Să se testeze semnificaţia raportului de corelaţie, considerând un risc de 5%
11. Să se testeze dacă modelul de regresie este semnificativ sau corect specificat (să se
testeze semnificaţia influenţei variabilei independente asupra variabilei dependente)
12. Estimati rata natalității pentru o rată a mortalității de 9 unități.
13
b. Dependent Variable: rata_nat
ANOVAa
Total 55,671 41
Correlations
rata_mort rata_nat
N 42 42
**
Pearson Correlation -,556 1
N 42 42
14
**. Correlation is significant at the 0.01 level (2-tailed).
15