Sunteți pe pagina 1din 64

ECONOMETRIE

1
Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.

2
2. Modelul de regresie liniară simplă
2.1. Noţiuni introductive
2.2. Forma generală a modelului de regresie liniară simplă
2.3. Ipoteze clasice formulate
2.4. Estimarea parametrilor modelului
2.5. Estimarea indicatorilor de corelaţie
2.6. Testarea modelului şi a parametrilor
2.7. Aplicaţii

3
2.1. Noţiuni introductive

 Natura datelor: variabile numerice.

 Obiectivele analizei de regresie: studiul legăturilor


dintre fenomene şi folosirea modelului în scop
predictiv.

 Corelaţie.

4
2.2. Forma generală a modelului
de regresie liniară simplă
A. Identificarea pe cale grafică a formei legăturii dintre
variabile:

5
2.2. Forma generală a modelului
de regresie liniară simplă
B. Modelul econometric de regresie liniară simplă

Y   0  1  X  

y i   o   1  xi   i
Dacă se consideră că regresia este o medie condiționată,
componenta deterministă este:

M ( Y / X  xi )   o   1  xi
iar modelul este:  
6
Parametrii modelului:
Y   0  1  X  
yi  bo  b1  xi  ei
y xi  bo  b1  xi
Parametrii modelului sunt:
β0 – este constanta modelului (intercept).
β1 – este panta dreptei de regresie.

7
2.3. Ipoteze clasice
 Normalitatea, homoscedasticitatea și autocorelarea
erorilor;
 Multicoliniaritatea.

(tratate în ultimul capitol)

Dacă se admite ipoteza  i ~ N ( 0 , 2 ), atunci variabila


dependentă este o variabilă aleatoare normal
distribuită de forma: Y ~ N (  0   1 X ; 2 )

8
2.4. Estimarea parametrilor modelului
a. Noţiuni teoretice
b. Metoda de estimare
c. Estimarea punctuală a parametrilor modelului
d. Estimarea prin interval de încredere
e. Valorile estimate ale parametrilor modelului de
regresie în SPSS

9
a. Noţiuni teoretice

 Estimarea reprezintă procedeul de determinare a


unui parametru al unei populaţii (β0, β1) pe baza
datelor înregistrate la nivelul unui eşantion.
 Se poate realiza prin:

1. estimare punctuală.
2. estimare prin interval de încredere.

10
b. Metoda de estimare

 i ) min
(
i
e 2

11
b. Metoda de estimare
Metoda celor mai mici pătrate:
2
i 
S   e   yi  y xi    y b
2
i o  b1  xi   min
2

i i i

12
c. Estimarea punctuală a parametrilor
modelului
S   ei2  min
i

S
 2   ( yi  b0  b1  xi )  ( 1 )  0
b0
S
 2   ( yi  b0  b1  xi )  (  xi )  0
b1
13
2
 i  i   xi   xi  y i
y  x
b0  sau b0  y  b1 x
n   xi2    xi  2

n   xi y i   xi   y i
b1 
n xi2    xi  2

14
Derivatele parţiale de ordinul doi:

 S
2
 S 2
 S
2

b0
2
 2 n;
b0 b1
 2 
i
xi ;
b1
2
 2 
i
x 2
i .

Matricea derivatelor parţiale de ordinul doi:

n
 x
i
i 

 
  xi i xi 
2

 i
15
Derivatele parţiale de ordinul doi – pozitiv
definite:
2
 
n x    xi   n   2  0
2
i
i  i 

16
d. Estimarea prin interval de încredere (IC) a
parametrilor modelului
 Estimatorii parametrilor βi urmează o lege normală
şi sunt:
 nedeplasaţi (în condiţiile respectării ipotezei că
variabila X este nestochastică şi pe baza proprietăţii
că variabilele aleatoare yi urmează aceeaşi lege de
repartiţie);
 convergenţi (pentru un volum al eşantionului
suficient de mare);
 eficienţi.
17
d. Estimarea prin interval de încredere (IC) a
parametrilor modelului
A.- Parametrul β0 ˆ
 0 ~ N (  0 ,  ˆ )
2
0

i
x 2

M ( ˆ0 )   0 ; V ( ˆ0 )   2ˆ  i


  2

n    xi  x 
0 2 

18
 I.C. este definit de limitele de încredere care acoperă
valoarea unui parametru, pentru un coeficient de
încredere.

ˆ
 0 ~ N (  0 ,  ˆ )  Z ~ N (0,1)
2
0

după relaţia:
ˆ0   0
Z
ˆ ˆ
0

19
sau când nu se cunoaşte varianţa:

ˆ0   0
t
sˆ
0

20
 Această variabilă t Student (Z) permite să se
construiască un interval de încredere, astfel:
ˆ0   0
P(t / 2   t / 2 )  1  
sˆ
0

unde: α este un nivel al probabilităţii cuprins între


zero şi unu (numit şi risc asumat).

21
Prin prelucrarea datelor la nivelul unui eşantion, se
obţine o estimaţie punctuală a parametrului β0,
respectiv valoarea b0.

b0   0
P( t / 2   t / 2 )  1  
s ˆ
0

22
I.C. pentru parametrul β0:

b  t
0  / 2 ;n  2  s ˆ
0

unde:
▪ b0 este o estimaţie punctuală a parametrului β0;

▪ t α/2,n-2 este o valoare a statisticii t Student care se


citeşte pentru un risc α (de regulă, egal cu 0,05) şi
(n-2) grade de libertate.

23
 i
x 2

sˆ  i
 se2
n    xi  x 
0 2

e 2
i
s 
2
e
i
; ei  yi  y xi ; y xi  b0  b1  xi
n2
24
B. Parametrul β1:

ˆ
1 ~  ( 1 ,  ˆ )
2
1

ˆ ˆ  2
M ( 1 )  1 ; V ( 1 )   ˆ 
2 

  xi  x 
1 2

25
 I.C. pentru parametrul β1:
b  t
1  |2 ;n  2  sˆ
1

unde: b1 este o estimaţie punctuală a parametrului β1;

se2
sˆ 
  xi  x 
1 2

26
e 2
i
se2  i
; ei  yi  y xi .
n2

y xi  b0  b1  xi

27
e. Valorile estimate ale parametrilor modelului
de regresie în SPSS
Pret (lei/kg) Consum (kg)

5 15
7 12

9 13

11 10

14 8
28
e. Valorile estimate ale parametrilor modelului
de regresie în SPSS

29
Exemplu:
Pe baza datelor din output-ul de mai sus, cunoscând
n=5, se cere:
1. Să se scrie modelul legăturii dintre cele două
variabile;
2. Să se precizeze sensul legăturii dintre aceste
variabile;
3. Să se calculeze limitele intervalului de încredere
pentru parametrul β1, considerând un risc de 0.05.

30
2.5. Estimarea indicatorilor de corelaţie
 Obiectiv: studiul intensităţii legăturii dintre
variabile.

2.5.1 Indicatori de corelaţie:


1. Coeficientul de corelaţie
2. Raportul de determinaţie
3. Raportul de corelaţie

31
1. Coeficientul de corelaţie

cov( X , Y )
 (x i   X )  ( yi  Y )
  i

 X  Y N  X  Y

X
  1 
Y
• Domeniul de variaţie
• Interpretare 32
Observaţie:
 Dacă se realizează o standardizare a variabilelor X
şi Y, atunci estimatorul coeficientului de corelaţie
pentru aceste variabile este identic cu cel al
coeficientului de regresie β1.

33
Exemplu

34
2. Raportul de determinaţie
 măsoară gradul de corelaţie dintre variabile şi
calitatea ajustării norului de puncte prin dreapta de
regresie (goodness of fit).

 ecuaţia de analiză a variaţiei:


Variaţia totală = Variaţia explicată + Variaţia
reziduală sau
VT=VE +VR

35
  yx  y 
2
VE VR
 
2 i
  1

 yi  y  2
VT VT
i

36
 Domeniul de variaţie

 Interpretare

 Estimarea raportului de determinaţie

37
 ( yxi
y) 2
 ( b0  b1  xi  y ) 2
ESS RSS
2
R  i
 i
  1
 ( yi  y )2
 i
( y  y )2
TSS TSS
i i
 ESS este estimaţia variaţiei explicate;
 RSS este estimaţia variaţiei reziduale;
 TSS este estimaţia variaţiei totale.

38
Exemplu

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 25.970 1 25.970 24.125 .016a
Residual 3.230 3 1.077
Total 29.200 4
a. Predictors: (Constant), Pret
b. Dependent Variable: Consum

39
Observaţii:
 raportul de determinaţie poate fi folosit pentru
compararea calităţii modelelor care au aceeaşi
variabilă dependentă Y.

 pentru modelul de regresie liniară simplă:


ρ2=η2 şi r2=R2.

40
3. Raportul de corelaţie


 xy  y  2
VE VR
  2 i
  1
  yi  y 
2
VT VT
i

- domeniul de variaţie.

41
Estimarea raportului de corelaţie

  yx  2
y
2
i
ESS RSS
R R  i
  1
  yi  y 
2
TSS TSS
i

42
2.5.2 Indicatori de corelaţie în SPSS

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .943a .889 .853 1.03755
a. Predictors: (Constant), Pret

43
Exemplu

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 25.970 1 25.970 24.125 .016a
Residual 3.230 3 1.077
Total 29.200 4
a. Predictors: (Constant), Pret
b. Dependent Variable: Consum

44
2.6 Testarea parametrilor modelului
 Ipoteze statistice

 Calculul statisticii test

 Regula de decizie

 Interpretare

45
Exemplu

46
Exemplu

47
Pe baza datelor din output-ul de mai sus, se cere:

1. Să se testeze semnificaţia parametrului β0


2. Să se testeze semnificaţia parametrului β1 , pentru
un risc de 5%.

48
2.7 Testarea modelului de regresie
 Ipoteze
Ho: β0= 0; β1= 0
H1: β0 # 0; β1# 0
 Calculul statisticii test
ESS
Fcalc  k  1
RSS
nk
49
 Regula de decizie

Dacă F  F , atunci se
calc  , k 1, n  k

respinge ipoteza Ho, cu o probabilitate de 1  

50
Exemplu

51
Exemplu

52
2.8. Testarea indicatorilor de corelaţie
a) Testarea coeficientului de corelaţie
 Ipoteze statistice

 Statistica test

 Calculul statisticii test

 Decizie
53
Exemplu

54
Exemplu

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 25.970 1 25.970 24.125 .016a
Residual 3.230 3 1.077
Total 29.200 4
a. Predictors: (Constant), Pret
b. Dependent Variable: Consum

55
b) Testarea raportului de corelaţie
 Ipoteze statistice

 Statistica test

 Calculul statisticii test

 Decizie

c) Testarea raportului de determinaţie

56
Exemplu

57
Exemplu

58
2.9 Regresia prin origine
 Parametrul β0 poate să nu fie semnificativ statistic.
 Modelul de regresie este:
Y  1  X  

 Metoda celor mai mici pătrate:


S   ei2   y i  y xi  2    yi  b1  xi  2  min
i i i

59
S
 2   ( y i  b1  xi )  (  xi )  0
b1

2
b1   xi   xi y i

60
Probleme:
1. Nerespectarea condiţiei  ei  0
i

2. Pentru acest model de regresie prin origine, R2 poate


fi negativ. În literatură există un alt indicator:
2
 ( xi y i )
r2  i
2 2
 xi  y i
i i

61
Observaţii:
 Se recomandă evitarea eliminării parametrului β0 din
ecuaţia de regresie.
 În cazul variabilelor standardizate, problemele
menţionate mai sus dispar (panta dreptei de regresie
este egală cu valoarea coeficientului de corelaţie
Pearson şi nu este necesară calcularea unui alt
coeficient).

62
Aplicație modelul de regresie liniară simplă
Chelt. public. (mii
 Vânzări (mil lei)
lei)
7 8
14 10
12 12
27 20
19 15
25 17
15 10
18 15
25 17
8 9
Se cere:
1. Să se scrie ecuaţia estimată a legăturii dintre Vânzări și
Cheltuieli de publicitate.
2. Să se precizeze cu cât cresc, în medie, vânzările dacă se
măresc cheltuielile de publicitate cu 10 mii lei.
3. Să se estimeze cât ar trebui să se cheltuiască pentru
publicitate pentru a avea vânzări de 20 mil. lei.
4. Să se testeze dacă influența cheltuielilor de publicitate asupra
vânzărilor este semnificativă statistic (pentru un risc de 0.05).
5. Să se testeze dacă modelul de regresie este corect specificat
(pentru un risc de 0.05).

S-ar putea să vă placă și