Sunteți pe pagina 1din 37

ECONOMETRIE

Conf. univ. dr. Mariana HATMANU

- anul universitar 2020-2021 -

1
2. Regresia liniară simplă (II)

2.1. Prezentarea modelului de regresie liniară simplă


2.2. Estimarea punctuală şi prin interval de încredere
a parametrilor modelului de regresie liniară simplă
2.3. Testarea semnificaţiei parametrilor modelului
de regresie liniară simplă
2.4. Estimarea indicatorilor de corelaţie
2.5. Testarea indicatorilor de corelaţie
2.6. Testarea modelului de regresie

2
2.3. Testarea semnificaţiei parametrilor
modelului de regresie liniară simplă
• Ipoteze statistice

• Alegerea pragului de semnificaţie 

• Alegerea testului statistic (statisticii test)

• Valoarea critică a statisticii test, pentru riscul  admis

• Valoarea calculată a statisticii test

• Regula de decizie

• Decizie şi Interpretare 3
2.3. Testarea semnificaţiei parametrilor
modelului de regresie liniară simplă
• 1. Formularea ipotezelor:
H0: β=0
H1: β≠0

• 2. α=0,05 (cel mai frecvent)

• 3. Alegerea testului statistic


ˆ   ˆ
t t
ˆ ˆ , care sub ipoteza nulă devine
 ˆ ˆ
4
2.3. Testarea semnificaţiei parametrilor
modelului de regresie liniară simplă
4. Valoarea critică a testului t se citeşte din tabelul
repartiţiei Student , pentru riscul  / 2 şi (n-k) grade
de libertate, t / 2, n  k
unde k reprezintă numărul coeficienților de regresie /
parametrilor din model.
Pentru regresia simplă k=2.

5
2.3. Testarea semnificaţiei parametrilor
modelului de regresie liniară simplă

5. În ipoteza H 0 şi pentru o estimaţie b a parametrului


 , expresia testului t devine (valoarea calculată a
testului):
b
t
s ̂

6
2.3. Testarea semnificaţiei parametrilor
modelului de regresie liniară simplă

4. Regula de decizie
- Dacă | t |> t / 2 , n  2 sau Sig   , se respinge ipoteza
 t / 2 , n  2 Sig  
Dacă | t | H 0 sau , NU se respinge
ipoteza , în condițiile riscului asumat

7
Regula de decizie
8
Exemplu

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 3.901 .937 4.163 .001 1.940 5.863
GDP_PPC .082 .037 .454 2.221 .039 .005 .160
a. Dependent Variable: CH_Educatie

9
.

• 1. De ce testăm egalitatea cu 0 a
coeficienților dreptei de regresie?

10
.

• 1. În practică, se întâmplă rar să avem informații


privind valoarea coeficienților. Obiectivul cel mai
frecvent este să demonstrăm că variabila X
influențează variabila Y, fără a avea anticipat nicio
măsură a coeficienților relației de regresie.

11
2.3. Estimarea indicatorilor de corelaţie

Intensitatea legăturii dintre două variabile se


măsoară cu ajutorul indicatorilor de
corelaţie:
- coeficientul de corelaţie;
- raportul de determinaţie;
- raportul de corelaţie.

12
a) Coeficientul de corelaţie
• Se utilizează pentru măsurarea intensităţii legăturii în
cazul unei regresii liniare simple.
• Se calculează după formula:
Cov( X , Y )
(X , Y ) 
 X  Y
cov( X , Y )
1 
 X2
X
 ( X , Y )  1
Y
• unde:  si  - abaterea standard a variabilei X,
X Y
respectiv, Y
Cov(X, Y) – covarianța dintre variabilele X și Y
13
a) Coeficientul de corelaţie

Semnul coeficientului de corelaţie coincide cu semnul


coeficientului de regresie.
Coeficientului de corelaţie poate lua valori în
intervalul
-1≤ρ≤1

14
a) Coeficientul de corelaţie

Interpretare
- valorile extreme (-1 şi 1) semnifică o legătură liniară
perfectă (funcţională);
- dacă ρ=0, echivalent cu 1  0 , nu există legătură între
cele două variabile;
- dacă ρ>0, echivalent cu 1  0 , legătura dintre
variabilele X şi Y este directă, variabilele sunt corelate
pozitiv ;
- dacă ρ<0, echivalent cu   0 , legătura este
1
indirectă, variabilele sunt corelate negativ.

15
a) Coeficientul de corelaţie
• Dacă valoarea parametrului ρ este apropiată de 0, se
consideră că legătura este slabă.
• Dacă   0,7 se consideră că intensitatea legăturii este
semnificativă / puternică.
• Dacă valoarea absolută a parametrului ρ este apropiată
de1, se consideră că legătura este foarte puternică.

16
a) Coeficientul de corelaţie
• La nivelul unui eşantion de volum n se determină
coeficientul de corelaţie empiric, care reprezintă o estimaţie
pentru parametrul ρ:
n  xi yi   xi  yi
Cov( X , Y ) r i i i
r
s X  sY [n  xi2  ( xi ) 2 ][ n  yi2  ( yi ) 2 ]
i i i i

• Dacă, la nivelul eşantionului, variabilele X si Y se


standardizează, între r şi b1 are loc relația r  b1
adică, coeficientul de corelație este egal cu valoarea
standardizată a coeficientului de regresie 1 .

17
,

• Interpretare….

18
b) Raportul de determinaţie

- poate fi aplicat atât în cazul regresiei liniare cât şi a celei


neliniare, simple sau multiple.
- Descompunerea variaţiei totale a variabilei dependente
(grafic)
- Măsoară cât din variaţia totală a variabilei dependente este
explicată de modelul de regresie:
2 VE VR
   1
VT VT

2 ESS RSS
R  1
TSS TSS
19
Relația de descompunere a variației totale
n
VT , respectiv, TSS reprezintă variaţia totală, TSS   ( yi  y ) 2
i

VE , respectiv, ESS - variaţia variabilei Y explicată prin modelul de


regresie n
ESS   ( y xi  y ) 2
i 1
VR , respectiv, RSS – variaţia reziduală
n
RSS   ( yi  y xi ) 2   (ei ) 2
i i
TSS  ESS  RSS

20
b) Raportul de determinaţie
• Interpretare:
Raportul de determinație măsoară ponderea variaţiei explicată
prin modelul de regresie în variaţia totală. Ca urmare, valoarea
raportului de determinație este un număr cuprins în intervalul [0; 1].

0≤ ≤1
2

Valoarea 1 arată existenţa unei legături funcţionale, cazul când
variaţia variabilei Y depinde numai de variaţia variabilei X, și
variaţia reziduală este egală cu zero.

21
• Interpretare….

22
c) Raportul de corelaţie
23.10.2020

Raportul de corelaţie măsoară intensitatea


legăturii dintre cele două variabile şi se
determină după relaţia:
  2
0  1

O estimaţie a raportului de corelaţie se notează


cu R.

23
• În regresia liniară simplă, între raportul de
determinație și coeficientul de corelație există
relația:
R2  r 2
sau R  r

24
2.5.a) Testarea semnificaţiei coeficienților
de corelaţie
a) Coeficientul de corelație
b) 1. Formularea ipotezelor
• H 0 :  =0
• H1 :  ≠0

2. În condiţiile ipotezei nule, estimatorul ̂ se


transformă în statistica t, prin relaţia:
ˆ
t ~ tn2
1  ˆ 2
n2 25
2.5.a) Testarea semnificaţiei coeficientului
de corelaţie
3. Valoarea critică a testului: t / 2 , n  2

4. Valoarea calculată a statisticii t:


r r n2
t 
s ˆ 1 r2

1 r2
sˆ 
n2

26
2.5.a) Testarea semnificaţiei coeficientului de
corelaţie

5. Regula de decizie:
– Dacă |tcalc |>tα/2;n-2 sau Sig <  se respinge
ipoteza H0, pentru riscul  admis; Coeficientul
de corelaţie este semnificativ diferit de zero, între
cele două variabile există o legătură
semnificativă.


– Dacă |tcalc | tα/2;n-2 sau Sig
 
NU se respinge
ipoteza H0 , cele două variabile sunt liniar
independente
27
2.5.a) Testarea semnificaţiei coeficientului
de corelaţie
6. Decizia

7. Interpretare

28
Exemplu
• . Correlations

GDP_PPC CH_Educatie
GDP_PPC Pearson Correlation 1 .454*
Sig. (2-tailed) .039
N 23 21
CH_Educatie Pearson Correlation .454* 1
Sig. (2-tailed) .039
N 21 24
*. Correlation is significant at the 0.05 level (2-tailed).

29
2.5.b) Testarea raportului de corelaţie

1. Formularea ipotezelor:
H 0 :  0
H1 :   0
2. Se alege statistica Fisher, cu expresia:

ˆ 2 n  k
F 
2
1  ˆ k  1

3. Valoarea critică: F , v , v
1 2

30
2.5.b) Testarea raportului de corelaţie
4. Valoarea calculată pe baza datelor
eşantionului:
R2 n  k ESS n  k
F 2
 F 
1 R k 1 RSS k  1
5. Regula de decizie:

- Dacă F  F , v1 , v2 se respinge ipoteza H0 , pentru riscul


admis. Raportul de corelaţie este semnificativ statistic.
Deci, variabila independentă influenţează
semnificativ variabila dependentă, prin modelul de
regresie specificat.

31
Exemplu: estimarea şi testarea raportului de
corelaţie
Model Summaryb
• .
Adjusted Std. Error of
Model R R Square R Square the Estimate
1 .454a .206 .164 1.02856
a. Predictors: (Constant), GDP_PPC
b. Dependent Variable: CH_Educatie

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 5.218 1 5.218 4.932 .039a
Residual 20.101 19 1.058
Total 25.319 20
a. Predictors: (Constant), GDP_PPC
b. Dependent Variable: CH_Educatie
32
2.6. Testarea modelului de regresie

Presupune testarea semnificaţiei influenţei, în ansamblu, a


tuturor variabilelor independente asupra variabilei
dependente, prin modelul de regresie specificat. Se
bazează pe descompunerea variaţiei totale pe
componente (vezi descompunerea variatiei unei variabile):
VT  VE  VR

TSS  ESS  RSS

33
2.6. Testarea modelului de regresie

1. Ipoteze statistice:
H 0 : modelul NU este semnificativ statistic
H1 : modelul explică semnificativ legătura dintre variabile

2. Se alege riscul ….
3. Se aplică testul Fisher, cu expresia:

VˆE n  k
F 
VˆR k  1
unde
k – numărul de parametri ai modelului de regresie
34
2.6. Testarea modelului de regresie

4. Valoarea critică a testul F se citeşte din tabelul


repartiţiei Fisher, pentru riscul  admis, şi v1 şi v2
grade de libertate, v1  k  1; v2  n  k , notată F , v1 ,v2

5. Valoarea statisticii F se calculează astfel:


ESS n  k
F 
RSS k  1

35
2.6. Testarea modelului de regresie
6. Regula de decizie (grafic):
 F  F ,v1 ,v2 sau Sig   se respinge ipoteza nulă H 0 ,
pentru riscul  admis

 F  F , v1 , v2 sau Sig   se acceptă ipoteza nulă H 0

7. Decizia şi Interpretare
Ex: dacă valoarea calculata a statisticii F este mai mare
decat valoarea critica, se decide respingerea ipotezei
nule, modelul este semnificativ statistic, in conditiile
riscului  acceptat.

36
Exemplu
• Testarea modelului de regresie

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 400.000 1 400.000 40.000 .008a
Residual 30.000 3 10.000
Total 430.000 4
a. Predictors: (Constant), Ch_publicitate
b. Dependent Variable: Val_vanzari

37

S-ar putea să vă placă și