Sunteți pe pagina 1din 176

ECONOMETRIE (C1)

-note de curs –

conf. univ. dr. Ciprian I. TURTUREAN


IAŞI
-2021-2022-
Obiectivul pricipal al cursului

Identificarea, modelarea si extrapolarea


relatiilor/ legaturilor care se stabilesc intre
fenomenele economice.

22
Bibliografie selectivă
Suport de curs
Jemna, D.V., Econometrie cu aplicații în R, Editura Sedcom Libris, Iaşi, 2017
Bibliografie
Andrei T., Bourbonnais, R., Econometrie, Economica, Bucureşti, 2008
Berdot, J.P., Économétrie, CNED, Poitiers-Futurscope, 2001
Bourbonnais, R., Économétrie, Dunod, Paris, 2000
Greene, W.H., Econometric analysis, Mac Millan, 1993
Gujarati, D.N., Basic econometrics, McGraw-Hill, New York, 1995
Hamilton, J.D., Time series analysis, Princeton University Press, 1994
Kmenta, J., Elements of Econometrics, MacMillan Publishing, 1986
Pecican, E.S., Econometria pentru economişti, Editura Economică, Bucureşti, 2003

3
Structura cursului de econometrie

C1 - Introducere
C2-4 - Regresia liniară simplă
C5-7 - Regresia liniară multiplă
C8-9 - Regresia neliniară
Săptămâna a10-a - Test de Evaluare (PARȚIAL)
TEST GRILA
Materia de examen - primele 7 cursuri

C11-13 - Verificarea ipotezelor modelului de regresie


C14 - Recapitulare

4
CURS 1 - Introducere
1 oră de curs recapitulativ cu privire la:
inferenţa statistică
variabile aleatoare și repartiţii
estimatori şi proprietăţi

1 ora de curs despre natura şi problemele cercetării econometrice:


exemplificare cu privire la ceea ce poate face econometria
model econometric
noţiuni, termeni şi notaţii
demersul cercetării

5
Mod de evaluare
1. Evaluare pe Parcurs - 60% din nota finală

Seminar - 20% (participare şi o tema de evaluare – scris, clasic.


Pentru a primi notă la seminar, fiecare student trebuie să fie prezent la
minimum 7 seminarii.

Test evaluare - 40% (test grilă). Testul de evaluare are valoare de


parţial, materia din primele 7 cursuri care nu se mai dau la examenul
final.
Testul se da la curs în săptămâna a 9-a.

2. Examen în sesiune - 40% din nota finală. Examenul se dă din


modele neliniare si testarea ipotezelor clasice, teorie şi probleme, sub
formă de test grilă.

6
Econometria: Date->informații

Econometria este modalitatea prin care datele economice pot


fi transformate în informații.
Datele nu vorbesc de la sine ci doar reflectă o situație
existentă.
Cum?
Prin identificarea de pattern-uri, modele, relații care să le
facă mai accesibile!
Care este procesul prin care se trece de la date la
informații?
Procesul de analiză econometrică

77
Econometria și rolul său în economiile moderne

Pentru a testa/ valida cum se manifestă în realitate teoriile


economice.
Teoria economică este de obicei o reflecție, de cele mai multe
ori filozofică, cu privire la reguli/ legi care guvernează
economia. Ea ia forma unei formulări ideale care ignoră
anumiți factori importanți.
Econometria prin specificul său poate aduce imbunătățiri la
teoriile economice devenind un mediator important între
TEORIE și PRACTICĂ!
Teoria economică a funcționat destul de bine în perioadele de
început când dinamismul vieții economice și instrumentele
economice existente pe piața nu erau atât de variate!
88
Econometria și rolul său în economiile moderne

Economia actuală este o economie extrem de dinamică în care


pot aparea noi factori determinanți (ex. internetul, comunicațiile
mobile, GPS-UL, banii electronici ș.a.).

De cele mai multe, ori apariția și, cu atât mai mult, impactul
acestora asupra economiilor nu poate fi anticipat de NICI O
TEORIE ECONOMICĂ!

Acesta este motivul pentru care economia tinde să capete un


caracter din ce în ce mai empiric/ aplicativ, apărând astfel conceptul
de ECONOMIE EMPIRICĂ!

Pentru economia empirică, care lucrează în mod curent cu datele,


econometria nu este un ”moft” ci o NECESITATE!!!
99
1. Definirea termenului de econometrie

Econometria reprezintă analiza cantitativă a


fenomenelor economice, având la bază
teoria economică şi date empirice,
utilizând metode specifice
inferenţei statistice.
Samuelson, P.,Koopmans, T., & Stone, R.

ECONOMETRICS
=
ECONO + METRICS

10
Ce este ECONOMETRIA?

11
11
2. Obiectul de studiu al econometriei

Aria de studiu a econometriei este realitatea economică privită ca


un ansamblu de relaţii şi intercondiţionări abordate în special sub
aspect cantitativ.

Econometria studiază legăturile dintre fenomenele economice și


comportamentul acestora.

12
3. Metoda de lucru a econometriei

Econometria studiază realităţile economice sub aspect


cantitativ, utilizând metoda statisticii.

Econometria contribuie la cunoaşterea realităţii economice


cu ajutorul unui instrument specific: modelul econometric.

13
4. Scopul econometriei

Scopul econometriei este de a crea, estima şi testa modele


econometrice, care surprind relaţiile esenţiale dintre fenomenele
economice reale și/ sau tendinţele evoluţiei acestora.

Pe baza modelelor econometrice validate urmează a se realiza


predicţii ale realităţii economice.

Scopul econometriei este creearea unui suport empiric utilizat atât


pentru formularea şi verificarea teoriilor economice cât și pentru
elaborarea politicilor economice.
14
14
Precizări cu privire la modele econometrice
Modelul, în economie, are o conotaţie explicativă, prin care se încearcă
descrierea realității.
Modelul economic reprezintă o prezentare schematică,
simplificată a realităţii economice studiate, cu scopul de a descrie/
explica modul în care aceasta funcţionează.
Econometria construieşte MODELE (expresii cantitative) pentru
realităţile economice studiate care au un corespondent în teoriile
economice.
Econometria estimează, prin procedeele de inferenţă statistică,
parametrii MODELELOR şi realizează predicţii cu privire la
fenomenele studiate.
Modelul econometric ia forma unei ecuaţii/ sistem de ecuaţii dintre
două sau mai multe variabile statistice.
În construirea unui model econometric se formulează un set obiective
clare în concordanţă cu care se aleg factorii explicativi ai modelului.
15
Exemplu: Modelul consumului – Keynes
Y = β0 + β1 X + ε
unde:
Y - consumul populaţiei;
X – venitul populaţiei;
β0 - consumul autonom (parametru);
β1- înclinaţia marginală către consum (parametru).

OBS: - în modelul lui Keynes pot fi cuprinse şi alte variabile dar


16
care trebuie să fie în concordanţă cu obiectivele modelării !!!
16
Date pentru modelul lui Keynes

Veniturile 2104 Cheltuielile 2014


Macroregiuni si regiuni de (Lei/pers) (Lei/pers)
dezvoltare (X) (Y)
Regiunea NORD-VEST 967,21 879,3
Regiunea CENTRU 934,06 843,18
Regiunea NORD-EST 791,72 757,17
Regiunea SUD-EST 816,48 733,72
Regiunea BUCURESTI - ILFOV 1343,36 1142,31
Regiunea SUD-MUNTENIA 896,02 821,82
Regiunea SUD-VEST OLTENIA 860,65 773,3
Regiunea VEST 976,3 919,68
Sursa: INSE
Venituri totale medii lunare/ persoană, pe regiuni de dezvoltare (X)
Cheltuieli totale medii lunare/ persoană, pe regiuni de dezvoltare (Y)
17
17
Reprezentarea grafică a modelului Keyns pentru Romania (2014) pe
baza datelor înregistrate la nivel de regiune

18
18
Estimarea și testarea modelului Keyns pentru Romania (2014)
pe baza datelor înregistrate la nivel de regiune (EXCEL)
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.987
R Square 0.974
Adjusted R Square 0.969
Standard Error 22.893
Observations 8.000

ANOVA
  df SS MS F Sig. F
Regression 1 116255.540116255.540 221.832 0.000
Residual 6 3144.421 524.070
Total 7 119399.962     

  Coeff. Std. Err. t Stat P-value Lower 95% Upper 95%


19Intercept
Venituri(X)
152.831
0.745
48.086
0.050
3.178 0.019
14.894 0.000
35.168
0.622
270.494
0.867
19
5. Noţiuni şi notaţii (1)

A. Variabilele statistice
În cercetarea econometrică se utilizează variabile statistice,
(construite pentru populaţii reale, finite) între care există relaţii de
interdependenţă. Acestea vor fi notate cu majuscule ale alfabetului
latin: X, Y, Z etc.
Valorile variabilelor vor fi notate cu aceleaşi litere ca şi
variabilele dar, de data aceasta, vor fi scrise cu caractere mici
urmate de un indice care ne oferă informaţii cu privire la numărul
de ordine al valorii variabilei respective: xi, yi, zi etc.
X: xi, i = 1, n

20
5. Noţiuni şi notaţii (2)
Tipuri de variabile utilizate în modelul econometric:
- variabila dependentă (Y), numită şi variabilă rezultativă, efect;
- variabilele independente (Xi, i= 1, p ), numite şi variabile explicative,
factoriale. Acestea determină un anumit efect asupra variabilei dependente.
- variabila eroare (ε), variabila eroare de modelare/ reziduală. De regulă,
această variabilă apare în model ca sumă a tuturor influenţelor necunoscute
sau care nu apar explicit în model.
În modelarea econometrică, variabila eroare trebuie să îndeplinească un
set de condiţii care vor fi testate pentru fiecare model în parte.
Ipotezele clasice cu privire la variabila eroare testate sunt: ipoteza de
normalitate, ipoteza de homoscedasticitate şi ipoteza de independenţă a
variabilei eroare.
Pe baza analizei variabilei eroare se poate determina acurateţea
modelului econometric.

21
5. Noţiuni şi notaţii (3)

B. Parametri, Estimaţie, Estimator


Parametrii modelului econometric, numiţi şi coeficienţi de regresie, sunt
mărimi reale, fixe şi necunoscute care apar în model în diferite expresii alături
de variabile.
Parametrii fac obiectul procesului de estimare şi testare statistică. Aceştia se
vor nota cu litere mici ale alfabetului grecesc: βi; i= 0şi, pvor fi în număr de
k=p+1.
Estimatorii sunt variabile de selecție, convenabil construite în procesul de
estimare, cu distribuţii de probabilitate cunoscute şi cu proprietăţi specifice în
baza cărora se realizează procesul de estimare a parametrilor modelului
econometric.
Aceştia se vor nota cu aceleaşi litere mici ale alfabetului grecesc dar de data
aceasta însoţite de semnul ^, . ˆi
Estimaţiile sunt valori posibile ale estimatorilor calculate pe baza unei
selecţii (set de date reale) observate în realitate.
22
ˆ

6. Proprietăţi ale estimatorilor

În procesul de estimare, cele mai importante proprietăţi ale


estimatorilor sunt:
- nedeplasarea – un estimator este nedeplasat dacă media matematică
a acestuia este egală cu parametrul.
M(β̂)  β
-convergenţa – un estimator este convergent dacă varianţa sa tinde
spre zero pentru un eşantion cu volum suficient de mare.
V(β̂)  0, când n  N
- eficienţa – estimatorul este eficient dacă are dispersia sau varianţa
cea mai mică dintre toţi estimatorii posibili pentru parametru β.
V(β̂)  minim

23
7. Ipotezele şi Testele statistice
7.1. Ipotezele statistice
În econometrie există un set de ipoteze cu privire la variabilele care
intră în componenţa modelului econometric. Acestea poartă denumirea
de ipotezele modelului clasic de regresie. Pe lângă acestea se
regăsesc şi ipoteze cu privire la parametrii modelului de regresie.

7.2. Testele statistice


- sunt procedee statistice pe baza cărora se ia decizia de a se accepta
sau a respinge ipotezele statistice. La baza procesului de testare se află
rezultatul comparării dintre valoarea teoretică a unei variabile
aleatoare numite statistică cu valoarea aceleiaşi statistici calculată/
estimată pe baza unei selecţii.
Statisticile sunt variabile aleatoare care au legi de distribuţie
cunoscute şi complet specificate şi sunt alese în concordanţă cu ipoteze
24
statistice testate.
8. Demersul metodologic

1. Formularea unei teorii economice sau a unui set de ipoteze;


2. Prezentarea teoriei sub forma de model;
VALIDARE

3. Obţinerea datelor pentru modelare;


4. Specificarea modelului econometric;
5. Estimarea parametrilor modelului econometric;
6. Testarea ipotezelor cu privire la modelul econometric;
7. Predicţia fenomenului pe baza modelului econometric;
8. Utilizarea modelului în practica economică în scop decizional.

25
RECAPITULARE

Metodologia econometrică tradiţională constă în parcurgerea


următoarelor etape [D. N. Gujarati, p.3]:
1. Formularea teoriei economice /ipotezelor de lucru
2. Specificarea modelului matematic asociat teoriei economice
3. Specificarea teoretică a modelului econometric
4. Obţinerea datelor
5. Estimarea parametrilor modelului econometric pe baza datelor
observate
6. Testarea parametrilor modelului econometric
7. Analiza statistică a erorii de modelare si testarea ipotezelor
corespunzătoare acesteia
8. Validarea modelului econometric
9. Prognoza statistică pe baza modelului validat
10.Utilizarea modelului în scop decizional
Tipuri de date utilizate in econometrie

Serii de moment (de secțiune transversală/ cross-section/ de moment)


-> sunt inregistrări corespunzătoare mai multor unități statistice
înregistrate la un moment de timp fixat

Serii de timp (longitudinale/ dinamice)


-> sunt înregistrări corespunzătoare unei unități statistice pentru mai
multe perioade de timp succesive

Serii de tip panel (simultan de secțiune transversală și longitudinală)


–> sunt înregistrări corespunzătoare mai multor unități teritoriale
pentru mai multe unități de timp.
Criterii de clasificare a modelelor econometrice

I. După numărul factorilor de influenţă:

1. modele de regresie simplă (unifactoriale)


- variabila Y este explicată printr-un singur factor determinant,
ceilalţi factori au o acţiune aleatoare sau nesemnificativă.
Exemplu: funcţia de consum (consum-venituri).

2. modele de regresie multiplă


- variabila Y este explicată de doi sau mai mulţi factori.
Exemplu: funcţia de producţie Q=f(L,K)+ε,
unde:Q – producţia L - factorul muncă K – capitalul
28
28
II. După forma legăturii dintre variabile

1. modele de regresie liniară – dacă Y este o funcţie liniară de variabila


sau variabile explicative;

Y  0  1 X   Y  0  i X i  

2. modele de regresie neliniară

Y   0  1 X   2 X 2  

29
III. După timpul la care se referă datele din model:
1. Modele de regresie statice
- variabilele incluse în model se referă la acelaşi moment
de timp sau la aceeaşi perioadă de timp.
- se construiesc pe baza datelor de sondaj sau a
cercetărilor de moment.

2. Modele de regresie dinamice


- sunt modele în care factorul timp apare explicit, ca
variabilă independentă sau ca indice:
Yt=f(t)+εt Yt=Xt+εt

30
Gruparea modelelor de regresie după natura seriilor,
numărul de variabile incluse și forma legăturii

Serie de tip
Numărul de Forma
cross-section/ Serii de timp/ Serii de tip
variabile legaturii
serii de serii dinamice panel
independente
moment
Liniară
Univariate
Neliniară
Liniară
Mutivariate
Neliniară

31
31
ECONOMETRIE

CURS 2

- note de curs -
IAŞI
- 2021-2022-
C2. REGRESIA LINIARĂ SIMPLĂ (1)

TEMATICA CURS 02
Prezentarea modelului - regresia empirică și cea teoretică

Estimarea punctuală şi prin interval de încredere a


parametrilor - MCMMP

Testarea parametrilor

Probleme specifice utilizând SPSS si Excel


1.Scurt istoric al regresiei

1886 - Francis Galton,. “Family Likeness in Stature”,


Proceedings of Royal Society, London, vol. 40, 1886, pp. 42-
72

1897 - G. U. Yule, "On the Theory of Correlation", Journal of


the Royal Statistical Society , pp. 812-54.

1903 - Karl Pearson, G. U. Yule, Norman Blanchard, and


Alice Lee, "The Law of Ancestral Heredity", Biometrika

1925 - R.A. Fisher, Statistical Methods for Research Workers


2. Noţiuni (1)
Regresia este o legătură statistică între două sau mai multe
variabile statistice.

În descrierea legăturilor statistice pentru variabilele


dependente utilizăm variabile aleatoare (stohastice), ceea ce
înseamnă că acestora le corespund distribuţii de probabilitate
(fig. 1).
y1 ... y j ... ym
xi→ Y: ( ) => M(Y│xi) = f(xi) => yi=f(xi)+εi
ni ... n j ... nm

X – variabilă independentă - variabilă nestohastică


Y – variabilă dependentă – variabilă stohastică (prezintă
distribuţii pentru fiecare valoare a lui X)
2. Noţiuni (2) - Fig.1
În legăturile de tip funcţional unei valori i se asociază o
altă valoare şi nu o distribuţie de probabilitate.

xi→ yi => f(xi)=yi

Analiza de regresie studiază forma legăturii dintre una


sau mai multe variabile => Model de regresie

Analiza de corelaţie studiază intensitatea legăturii dintre


una sau mai multe variabile puse în relație printr-un model
de regresie.
Modele de regresie

Modele de
Simple Multiple
regresie

Liniare C = β0 + β1X + ε C = β0 + β1 X1 + β2X2 + ε

Neliniare C  eβ 0 β1X  ε Ce β 0 β1X1 β 2 X 2  ε


3. Modelul de regresie liniară simplă

εi=yi-M(Y│X=xi)  yi = M(Y│X=xi)+εi = β0+β1xi+εi

> M(Y│X=xi)=β0+β1xi – media condiționată de X=xi, a variabilei


stohastice Y,
> β0= f(0) – parametrul “intersecţia dreptei de regresie liniară cu axa
OY” (engl. intercept)
> β1– parametrul “panta a dreptei” care reprezintă variaţia absolută in
medie a variabilei Y atunci când variabila X creşte cu o unitate (β1 =ΔY/
Δ X):
- β1>0: legătură directă între variabile, Y variază în acelaşi sens
cu X
- β1<0: legătură inversă între variabile, Y nu variază în acelaşi
sens cu X
3. Modalități de scriere ale modelului
liniar simplu

Dacă este scris pentru valorile variabilelor

yi = β0+ β1xi + εi

Dacă este scris pentru variabile în general

Y= β0+ β1X+ ε
4. Componentele modelului de regresie

A.Componenta deterministă (β0+ β1xi)

B. Componenta aleatoare (εi).


Factorii care influențează componenta aleatoare:
- natura fenomenului studiat;
- specificarea modelului ;
- erorile de măsurare s.a.
5. Ipoteze clasice ale modelului de regresie
Ipotezele modelului de regresie vizează variabila reziduală şi
variabila independentă.
Cele mai importante ipoteze cu privire la variabila reziduală sunt:
- normalitatea erorilor : , adică variabila reziduală urmează
2
 i ~ N ( i ,  i )μi şi varianţă σ i 2;
o lege de repartiţie normală de medie
-media erorilor de modelare este nulă: M(εi)=0=>
2
-homoscedasticitate:  i ~erorii
,adică varianţa i )
N (0,este
V( i )  M
constantă la nivelul distribuţiilor (  i2 )   2 de tipul
condiţionate
-> Yi X  xi
 i ~ N (0,  )erorilor:
- necorelarea
2
,adică erorile nu se
influenţează reciproc; cov( ,  )  0, i  j; i, j  1, n
i j
- lipsa corelaţiei dintre variabila independentă şi variabila eroare:
.
cov(  i , xi )  0
6. Exemple de modele liniare simple
Funcţia de consum
- cererea sau consumul populaţiei în funcţie de venit:
, 
Ci   0  1Vi  i
unde parametrul 1 arată cu cât creşte in medie consumul unui
anumit produs ( ) la o creştere cu o unitate a venitului şi este de
regulă pozitiv. Ci

Legea cererii
- cererea populaţiei pentru o gamă de produse în funcţie de preţul
acestora:
, unde parametrul 1 este de regulă negativ şi arată
câtscade
0  1 Pi   i
cu 
C in medie cererea la o creştere a preţului cu o unitate.
i
STOP
7. Estimarea punctuală parametrilor
modelului de regresie prin MCMMP
MCMMP (engl. Method of Ordinary Least Sqares - OLS)
ˆ estimate
ˆ (teoretice ale lui Y)
y i   0  1 xi
Fie: -ˆvalorile

și - valorile reale, înregistrate


ˆ ˆ
yi   0  1 xi  ˆi
Erorile estimate pot fi obtinute ca diferenta intre valorile reale si valorile
teoretice:

Pentru a ușura 
ˆi mai
Astfel relația de i seyva
ysus
notațiile
i 
ˆ  vom
y deestimare
înˆprocesul
scrie:i 0 
1 i  
ˆ xutilizadirect ˆ  pentru
yi notațiile
0
ˆ x estimații.

1 i 

Notăm
n n n n

 ei    yi  yˆi     yi  (b0  b1 xi )    yi  b0  b1 xi   min .


2 2 2 2

i 1 i 1 i 1 i 1
n n
S   e    y i  b0  b1 xi 
2 2
i
i 1 i 1
Rezolvarea acestei probleme de minim presupune
îndeplinirea a două condiţii:
1. Anularea derivatelor parţiale de ordinul I ale lui S în
raport b0 şi b1:
 S n n n

 b  2  yi  b0  b1 xi   1  0  nb0  b1  xi   yi
 0 i 1 i 1 i 1

S n  n n n
  2  yi  b0  b1 xi   xi   0  b0  xi  b1  xi   yi xi
2
 b1 i 1 i 1 i 1 i 1

b
b0  0 
 y x x x y
i
2
i i i i

 n x    x 
2 2
i i

sau b 0  y  b1 x
b1 n xi yi   xi  yi
b1  
 n xi2    xi 
2
2. Matricea derivatelor parţiale de ordinul doi să fie pozitiv
definită:
 2S 2S 
 2  2n  2 xi 
  b0 b0 b1   2n 2 xi 
 0
det  2   0  det
 2 xi 2 xi 
2
  S  2 xi  S  2 xi2 
2

 b b  2b1 
 0 1 

n
 det 
x
i 
0
 x x 2
 i i 

Matricea derivatelor partiale de ordin doi este pozitiv


definită deoarece n  x i    x i   n 2 2  0
2 2
7. Proprietățile estimatorilor parametrilor
modelului de regresie
Estimatorii parametrilor modelului de regresie sunt variabile
de selecţie care:

 
- urmează o distribuţie normală:̂ 0 ~ N  0 ,  2ˆ , ̂ 1~ N  1 ,  2ˆ
0 1
 
 
- sunt nedeplasaţi: M ˆ 0   0 ,  
M ˆ1   1

- convergenţi (in probabilitate): ˆ0   nN



p
0 ,  ˆ 
1 nN 
p
1

- eficienţi: dintre toţi estimatorii posibili pentru 1 , ˆ1 are


varianţa cea mai mică
8. Estimarea prin interval de încredere a
parametrilor modelului de regresie liniară

Atât pentru  0 , cât şi pentru 1 , intervalele de încredere pentru se


vor construi astfel:

 0  b0  t / 2,n  k sˆ , b0  t / 2,n  k sˆ
0 0


1  b1  t / 2,n  k s ˆ , b1  t / 2,n  k s ˆ
1 1

unde k = numărul parametrilor estimaţi din model (pentru
modelul liniar k=2)
Precizari suplimentare
Vezi exemplu excel (n=19 iar α=5%): Y-> greutatea (kg) si X->
inaltimea (cm) Y=β0+β1X+ε -> K=2

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


  (bi) ( sˆi , i  0,1 ) (t calc) (sig.) (Li) (Ls)
Intercept (β0) -151.816 (b0) s
61.808( ̂ 0) -2.456 0.025 -282.219 -21.412
Inaltimea (X) (β1) 1.266 (b1) s
0.364( ̂1) 3.483 0.003 0.499 2.034

t / 2,n  k -> aceasta este o valoare teoretica si se ia din tabelul valorilor statisticii Student
si nu din tabelul de mai sus!!!!


 0  b0  t / 2,n  k sˆ , b0  t / 2,n  k sˆ
0 0
 = -151.816 2,11*61,808 -> vezi Li si Ls din
tabelul de mai sus


1  b1  t / 2,n  k s ˆ , b1  t / 2,n  k s ˆ
1 1
 = 1,266  2,11*0,364 -> vezi Li si Ls din
tabelul de mai sus

t / 2,n  k  t0, 025;(19  2)  t0, 025;17  2,11

Student t Distribution Table (thoughtco.com)


5. Testarea parametrilor modelului liniar
1. Formularea ipotezelor
pentru β0 pentru β1
H0: β0=0 H0: β1=0
H1: β0#0 H1: β1#0

2. Fixarea pragului de semnificaţie


α=0,05
3. Alegerea si calcul statisticii test
b0 b1
t  ? tteoretic  t / 2, n  2 t 1  ? t teoretic  t / 2 , n  2
0
sˆ sˆ
0 1

4. Criterii de decizie:
|tcalc| ≤ tteoretic= tα/2, n-2 sau sig.≥α=> AH0 cu o probabab. de 1-α.
|tcalc| > tteoretic= tα/2, n-2 sau sig.<α => RH0 cu un risc asumat α.
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
  (bi) ( sˆ , i  0,1 )
i
(t calc) (sig.) (Li) (Ls)
Intercept (β0) -151.816 61.808 -2.456 0.025 -282.219 -21.412
Inaltimea (X) (β1) 1.266 0.364 3.483 0.003 0.499 2.034
1. Formularea ipotezelor
pentru β0 pentru β1
H0: β0=0 H0: β1=0
H1: β0#0 H1: β1#0
2. Fixarea pragului de semnificaţie
α=0,05
b 3. Alegerea si calcul statisticii test b1
tcalc b0  0 ~ t / 2, n  2 tcalc b1  ~ t / 2 , n2
sˆ sˆ
0 1

4. Criterii de decizie:
|tcalc β0| =|-2,456| > tteoretic= t0,025; 17=2,11 |tcalc β1|=|-2,456| ≤ tteoretic= t0,025; 17 =2,11
sig.=0.025<α=0,05 sig.=0.003<α=0,05
5. Probleme specifice analizei de corelație și regresie
Analiza de regresie si corelație în SPSS

Se consideră datele cu privire la Valoarea vânzărilor şi


Cheltuielile cu publicitatea pentru un eşantion de 4 firme.
Datele sunt prezentate în tabelul alăturat.

xi yi
10 2500
20 4100
50 5000
100 7500
180 19100
ECONOMETRIE

CURS 3
- note de curs -

IAŞI
- 2021-2022-
C 3 - REGRESIA LINIARĂ SIMPLĂ

TEMATICA CURS 03

Indicatorii de corelație
1. Estimarea indicatorilor de corelaţie (coeficient, raport)
2. Relația coeficient corelație - coeficient de regresie
3. Testarea indicatorilor de corelaţie
4. Testarea modelului
5. Probleme specifice utilizând SPSS si Excel
1. Estimarea indicatorilor de corelaţie
Coeficientul de corelaţie - se foloseşte doar pentru modelul liniar

Parametrul coeficientul de corelație (ρ)

sau N

cov( X , Y ) 
( xi   x )( yi   y )
 ( X ,Y )   i 1
 x y N x y

, -1≤ρ≤+1
n n n
N  xi yi  xi  yi
 ( X ,Y )  i 1 i 1 i 1
n n n n
[ N  x  ( xi ) ][ N  y ( yi ) 2 ]
2
i
2 2
i
i 1 i 1 i 1 i 1
Interpretarea lui ρ

Coeficientul de corelație ρ caracterizează intensitatea


legăturii liniare dintre două variabile X și Y.

Astfel:

Pentru -1≤ρ<0 – > legătura între X și Y este negativă;

Pentru 0<ρ≤+1 ->legătura între X și Y este pozitivă;

Pentru |ρ|->0 => legătura este foarte slabă

|ρ|->1=> legătura este foarte puternică.


Estimația coeficientului de corelație (r)

 (x i  x )( yi  y )
r i 1

ns x s y
n n n
n  xi yi  xi  yi
r se interpretează la fel ca ρ.
 i 1 i 1 i 1
n n n n
[ n xi2  ( xi ) 2 ][n  yi2 ( yi ) 2 ]
i 1 i 1 i 1 i 1
Raportul de determinaţie
Parametrul raportului de determinație (η2)(desen)
 i
(ŷ  y) 2
VE V
η 2 i
  1 R , cu 0<η2<1
 i
(y
i
 y) 2
VT VT

VE, VT și VR reprezintă parametrii variațiiei explicată,


variația totale și variației reziduale.
VT =VE+VR
Interpretarea raportului de determinație

η2 aparține intervalului [0; 1].


Cu cât η2 -> 0 cu atât legătura este mai slabă între
variabila dependentă și variabila independentă.
Cu cât η2 -> 1 cu atât legătura este mai puternică între
variabila dependentă și variabila independentă.

OBS: Raportul de determinație poate fi calculat pentru


toate tipurile de legaturi: liniare sau neliniare, simple sau
multiple.
Interpretarea lui η2 în modelul de regresie

De obicei η2 este exprimat în valoare procentuală, ia valori


de la 0% la 100%, și arată cât la % din variația variabilei
dependente (Y) este explicată de variația variabilei
independente (X) printr-un model specificat (de ex prin
modelul liniar yxi= β0 +β1 X)
STOP
OBS: Pentru modelul liniar simplu (MLS) se stabilește
următoarea relație între η2 și ρ: η2=ρ2  |ρ|=η relație care se
extinde și asupra etimațiilor acestora: R2=r2  |r|=R
Estimația raportului de determinație (R2)
 (ŷ  y)
2
ESS RSS
R 2
= i
  1
 (y  y)
i
i
2
TSS TSS

ESS, TSS și RSS reprezintă estimațiile variaței explicate,


variației totale respectiv variaței reziduale.

SS-este Suma pătratelor [abaterilor] (eng. Sum of Sqare)

TSS=ESS+RSS

Interpretarea estimației R2 este aceeași cu cea a parametrului


η2 .
Calculul TSS, ESS și RSS și determinarea
gradelor de libertate corespunzătoare acestora

TSS   ( yi - y) 2 ; ESS   (ŷ i - y) 2 ; RSS   ( yi - ŷ i ) 2 ;


i i i

     
df T  n - 1; df E  k - 1; df R  n - k

dfT=dfE+dfR
2. Relația coeficientul de corelație (r) -
coeficientul de regresie (b1)

Legătura dintre estimația coeficientului de corelație (r) și


estimația coeficientului de regresie liniară (b1) se realizează
prin relația: cov( y, x) 
r
s x s y  sx
 r  b1
cov( y, x)  sy
b1 
s x2 
2 2
unde s , s si s x , s yreprezintă estimațiile varianțelor
x y
respectiv estimațiile abaterilor standard ale variabilelor X și Y.

OBS: În cazul modelului de regresie standardizat (s2X=1, s2Y=1) r=b1.


EXEMPLU

Se consideră datele cu privire la Valoarea vânzărilor şi Cheltuielile cu


publicitatea pentru un eşantion de 4 firme. Datele sunt prezentate în
tabelul următor.

xi yi
10 2500
20 4100
50 5000
100 7500
180 19100
Rezultatele analizei in SPSS
3. Testarea indicatorilor de corelaţie
I. Testarea coeficientul de corelaţie
1. Formularea ipotezelor H0: ρ=0(->ρ0=0)
H1: ρ≠0 (->Test Bilateral->tα/2, n-k =tth)
2. Fixarea pragului de semnificaţie α (ex. α=0,05)
3. Alegerea statisticii test si aflarea valorii critice a acesteia pentru un
α dat :  t  / 2, n  k

ˆ   0 ˆ r n2
4. Calcularea statisticii test tcalc   
 ˆ 1  ˆ 2 1 r 2
5. Criterii de decizie:
|tcalc|≤ tteoretic= tα/2, n-2 n H2 cu o probabilitate
 sig.≥α =>se acceptă/ nu se respinge 0

de 1-α
|tcalc| > tteoretic= tα/2, n-2  sig.<α =>se respinge H0 cu un risc asumat α.
II. Testarea raportului de corelaţie
1. Formularea ipotezelor H0: η=0 H1: η≠0 (->Test Unilateral deoarece
valorile lui η>0->Fα,ν1, ν2= Fα, k-1, n-k) NB:v1=k-1≤v2=n-k
2. Fixarea pragului de semnificaţie α (ex. α=0,05)

ˆ 2 n  k
3. Alegerea statisticii test F
1  ˆ 2 k  1
4. Calcularea statisticii test R2 n  k
F
5. Criterii de decizie: 1 R2 k 1
Fcalc≤ Fα, k-1, n-k => se acceptă H0 cu o probabilitate de 1-α  sig.≥α.
Fcalc> F α, k-1, n-k => se respinge H0 cu un risc asumat α  sig.<2α.
4. Testarea modelului de regresie - testul F
omnibus
1. Formularea ipotezelor
H0: β0= 0 și β1=0
H1: β0≠ 0 sau/si β1≠0
2. Fixarea pragului de semnificaţie α=0,05
VˆE n  k
3. Alegerea statisticii test F
VˆR k  1
ESS
4. Calcularea statisticii test
ESS n  k k  1  (b  b x  y)
0 1 i
2
nk
Fcalc    i
RSS k  1 RSS (y b b x )
i 0 1 i
2
k 1
nk i

5. Criterii de decizie:
Fcalc≤ Fα, k-1, n-k => se acceptă H0 cu o probabilitate de 1-α  sig.≥α.
Fcalc> F α, k-1, n-k => se respinge H0 cu un risc asumat α  sig.≥α.
Legatura dintre testarea lui R2 și testarea modelului

Dacă îl exprimăm pe R2 în funcție de SS vom obține:

 0 1
(b  b x  y ) 2
ESS RSS
2
R = i
  1
 i
(
i
y  y ) 2
TSS TSS

și înlocuind în expresia lui F obținem o expresie a lui F în


funcție de SS:
ESS n  k R2 n  k
F= 
TSS k  1 1  R 2 k  1
5. Probleme specifice analizei de corelație și regresie

Analiza de regresie si corelație în SPSS

Se consideră datele cu privire la Valoarea vânzărilor şi


Cheltuielile cu publicitatea pentru un eşantion de 4
firme.
Datele sunt prezentate în tabelul alăturat.

xi yi
10 2500
20 4100
50 5000
100 7500
180 19100
ECONOMETRIE

CURS 04
- note de curs -

IAŞI
- 2022-
Tematica C04

 Modelul iniar simplu


1. Regresia prin origine
2. Problema liniarității – exemple

2
Regresia prin origine
Situaţii în care am putea construi un model de regresie prin
origine:

1.Înurma testării parametrilor modelului, parametrul β0 are o


valoare nesemnificativă statistic, iar parametrul β1 este
semnificativ statistic;

2.Există suport teoretic care să impună estimarea unui model


care trece prin origine – lipsa influenţei variabilei independente
conduce la o medie zero pentru variabila dependentă (analiza de
cost, legătura dintre lungimea şi greutatea persoanelor).

3
Regresia prin origine -Aplicatie
Pentru un eşantion de 28 de studente de la FEEA anul II, se
studiază legătura dintre greutate si inaltime.

4
5
6
7
8
Regresia prin origine
În cazul modelului de regresie Y  1 X   aplicarea metodei celor
mai mici pătrate se simplifică.
Relația de minimizat este de forma:

̂1 este nedeplasat. Pentru statistica t utilizata pentru


Estimatorul
testarea parametrului β1 vom avea n-1 grade de libertate fata de n-2 in
modelul cu constanta.
9
Regresia prin origine
Probleme privind utilizarea modelelor prin origine
1. Suma erorilor nu mai este zero;
2. R2 poate fi negativ sau poate avea o valoare foarte mare, prin
urmare interpretarea acestuia nu mai are sens.
Ca alternativă se utilizează o variantă a lui R2, şi anume:

1.În practică se recomandă evitarea eliminării parametrului β0 chiar dacă


testul Student semnalează faptul că acesta nu este reprezentativ.
2.Există un model de regresie liniară prin origine pentru care probleme
modelului liniar prin origine dispar: Acesta este modelul de regresie
liniară cu variabile standardizate.
3.În acest caz, panta dreptei de regresie are aceeaşi valoare cu
coeficientul de corelaţie Pearson (bi=r).
10
11
Problema liniaritatii in econometrie
Deseori modelel liniare simple nu sunt satisfacatoaremotiv pentru care in
econometrie pot fi utilizate frecvent modele alternative fie mai coplexe, cu mai
multe variabile, fie de o alta forma, modele exponentiale, parabolice, inverse.
Cu toate acestea exista o categorie destul de mare de modele care desi sunt
de alta forma ele pot fi liniarizate prin aplicarea unei transformari sau a unei
schimbari de notatie, abordare care simplifica foarte mult utilizarea acestora.

Ex.:
Modelul reciproc (invers) cunoascut in economie si sub sub denumirea de
curba lui Philips:Y=β0+ β1*(1/X)+ε Y=β0+ β1*X’+ε
Model de crestere:Y=eβ0+ β1*X+εlnY= β0+ β1X+εY’= β0+ β1X+ε

1
REGRESIA LINIARĂ MULTIPLĂ

C5.
1. Prezentarea modelului liniar multiplu
2. Estimarea parametrilor modelului liniar multiplu
3. Testarea parametrilor modelului liniar multiplu
4. Testarea modelului de regresie liniara multipla

2
Modelul liniar multiplu
Forma generală a modelului liniar multiplu este dată prin relaţia:
Y  M Y / X1 ,...X i ,...., X p     0  1 X1  2 X 2  ...   p X p  
unde:
Y - variabila dependentă;
X1, X2,…,Xi,…,Xp - variabile independente (predictori);
ε - variabilă reziduu de modelare (variabila aleatoare);
βi - parametrii modelului de regresie
k - numărul de parametri din model, k=p+1.

Exemplu: Pentru un esantion de 50 de marci de cereale, se poate studia legatura


dintre ratingul acordat de consumatori (Y) unei mărci de cereale şi factorii de
influenta (nr. de calorii (X1), cantitatea (g/100g) de grăsimi (X2),
cantitatea
3
(g/100g) de zahăr (X3), cantitatea (g/100g) de fibre (X4), etc.)
Cei k parametri ai modelului liniar multiplu au urmatoarea
semnificatie:
β0 – valoarea medie a variabilei dependente Y, în
condiţiile în care influenţa variabilelor independente ar fi nula;
Y
i  , i  1, p
X i - variaţia absolută a variabilei
dependente la o variaţie absoluta cu o unitate a variabilei
independente Xi, în condiţiile în care influenţa celorlalte variabile
independente este menţinuta constanta. Arata influenţa parţiala a
fiecarei variabile independente asupra variabilei dependente.
4
Ipotezele modelului clasic de regresie (IIN):

variabilele independente sunt nestochastice

normalitatea erorilor, media zero :  i ~ N (0,  2 )

homoscedasticitate: V (  i )  M (  i2 )   2
necorelarea erorilor: cov(  i , j )  0
lipsa corelaţiei dintre variabilele independente şi variabila
eroare
lipsa coliniarităţii sau a unei legături liniare între variabilele
independente

5
Estimarea parametrilor modelului
multiplu liniar

6
Se consideră modelul de regresie liniară multiplă cu două
variabile independente:
y i   0   1 x1i   2 x 2 i   i

La nivelul unui eşantion, modelul devine:


yi  ˆ 0  ˆ 1 x1i  ˆ 2 x 2 i  ˆ i sau y i  yˆ i  ˆi

Rezultă ˆi  yi  yˆ i  yi  ˆ0  ˆ1 x1i  ˆ2 x2i


Estimarea parametrilor modelului prin metoda celor mai mici
pătrate presupune respectarea condiţiei:
n
 ̂ i  min im
i 1
2
, adică  ( y  ˆ i 0  ˆ x  ˆ x ) 2  minim
1 1i 2 2i
i

7
Estimarea punctuala
Pentru satisfacerea condiţiei MCMMP trebuie ca derivatele parţiale de ordin I
în raport cu coeficienţii modelului să se anuleze. Astfel se va obţine un sistem de
2+1=3 ecuaţii cu 3 necunoscute. La nivelul unui eşantion de date, sistemul de
ecuaţii devine:
 n n n

 nb 0  b 1  x 1i  b 2  x 2i   y i
 i 1 i 1 i 1

 n n n n

 b 0  x 1i  b 1  x 1i  b 2  x 1i x 2i   y i x 1i
2

 i 1 i 1 i 1 i 1
 n n n n
 b 0  x 2i  b 1  x 1i x 2i b 2  x 2i   y i x 2i
2

 i 1 i 1 i 1 i 1

Prin rezolvarea sistemului, se obţin relaţiile pentru estimaţiile parametrilor


modelului de regresie.
Exemplu:
8 Rating = 61.1 - 3.07 Grăsimi - 2.21 Zahăr+error
Estimarea parametrilor prin interval de încredere

Intervalele de încredere sunt de forma:

β i  [β̂ i  t α/2, n  k σ β̂ ]
i

La nivelul unui eşantion de date se obţine un interval de forma:


βi  bi  tα/2,nksβ̂ , bi  tα/2,nksβ̂
i i

9
Testarea individuală parametrilor modelului
liniar multiplu

10
Testarea parametrilor modelului multiplu liniar se face la fel ca în cazul
modelului simplu liniar:
1. Formularea ipotezelor i=0,p:
H : i  0
0

H1:  i  0
2. Alegerea pragului de semnificaţie α
De regulă, se asumă un risc α = 0,05.
β̂ i bi
3. Alegerea statisticii test si calculul acesteia t calc  σ  s
β̂ β̂
4. Valoarea critica/teoretică a statisticii test
i i

Pentru pragul de semnificaţie α ales şi υ=n-k grade de libertate, se citeşte


valoarea teoretică din tabela Student: tα/2; n-k
5. Regula de decizie/ conmpararea valorilor si interpretarea
rezultatelor:
tcalc  t / 2,n  k Sig t  
Dacă t  t  - se respinge H0 cu un risc asumat de α
11 calc  / 2,n  k Sig t  
Dacă  - se acceptă H0, cu o probablilitate de 1- α
Testarea modelului de regresie/ testarea
simultană a parametrilor modelului de regresie
multipla

12
Testarea modelului de regresie se realizează cu ajutorul testului F, după următorul
demers:
1. Formularea ipotezelor
H0: β0=β1=…=βp=0 (modelul nu este semnificativ)
H1: nu toţi coeficienţii sunt simultan zero

2. Alegerea pragului de semnificaţie α


3. Alegerea statisticii test si calculul acesteia:
VˆE n  k ESS n  k R2 n  k
Fcalc    
~F(α,k-1,( n-k) 2  )
ˆ
VR k  1 RSS k  1 1  R k  1

4. Determinarea valorii critice a statisticii test: F α, k-1, n-k


5. Regula de decizie, compararea valorilor si interpretarea rezultatului:
Dacă Fcalc  F , k 1,n  k  Sig F   => se RH0 , pentru risc asumat de α
Dacă
Fcalc  F ,k 1,n  kSig F  => se AH , cu o probabilitate de 1-α
0

13
EXEMPLU
Pentru un eşantion de mărci de cereale, se studiază legătura
dintre ratingul acordat de consumatori (Y) unei mărci de
cereale şi cantitatea de grăsimi (grame/100g) (X1), cantitatea
de zahăr (grame/100g) (X2) şi cantitatea de fibre
(grame/100g) (X3).

n=77->din tabelul ANOVA pentru dfT=76=n-1=>n=77


α=0.05=5%
k=3+1=4
t0.025;77-4=t0.025;73->z0.025=1.96 (deoarece υ=n-k=77-4=73>>30)

14
Y=b0+b1X1+b2X2+e
Model Summary
Y=61.089-3.066X1-2.213X2+e
Adjusted Std. Error of
Model R R Square R Square the Estimate
1 ,789a ,622 ,612 8,75456
a. Predictors: (Constant), sugars, fat
M(ΔY/X1=0; X2=0)=b0=61.089
M(ΔY/ ΔX1=1; ΔX2=0)=b1=-3.066
ANOVAb M(ΔY/ ΔX2=1; ΔX1=0)=b2=-2.213
Sum of
Model Squares df Mean Square F Sig.
1 Regression 9325,268 2 4662,634 60,836 ,000a
Residual 5671,533 74 76,642
Total 14996,800 76
a. Predictors: (Constant), sugars, fat
b. Dependent Variable: rating

ICβ0=b0+/- tα/2, n-k*sβ0=61.089+/-t0.025;77-4


a
*1.953=61.089+/-1.96*1.953
Coefficients

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 61,089 1,953 31,284 ,000
fat -3,066 1,036 -,220 -2,958 ,004
sugars -2,213 ,235 -,700 -9,428 ,000
15 a. Dependent Variable: rating
Model Summary Y=b0+b1X1+b2X2+b3X3+e
Adjusted Std. Error of
Model R R Square R Square the Estimate
1 ,930a ,865 ,859 5,35086
a. Predictors: (Constant), fat, fiber, sugars

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 12503,728 3 4167,909 145,570 ,000a
Residual 1946,958 68 28,632
Total 14450,686 71
a. Predictors: (Constant), fat, fiber, sugars
b. Dependent Variable: rating

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 53,673 1,389 38,637 ,000
fiber 2,938 ,261 ,507 11,265 ,000
sugars -1,992 ,150 -,622 -13,238 ,000
fat -3,347 ,656 -,238 -5,103 ,000
a. Dependent Variable: rating
16
REGRESIA LINIARĂ MULTIPLĂ
TEMATICA C6-C7

1. Estimarea indicatorilor de corelaţie


2. Raportul de determinație ajustat
3. Testarea indicatorilor de corelaţie
4. Testarea influenţei marginale a unei variabile->stop
5. Utilitatea modelului de regresie cu variabile standardizate
Exemple
7. Estimarea indicatorilor de corelatie
Pentru un model de regresie liniară multiplă, pot fi
determinati următorii coeficienţi de corelație:
- coeficienţi de corelaţie simplă - între variabila dependentă
şi fiecare variabilă independentă (coeficienţi bivariaţi rYX);
- coeficienţi de corelaţie parţială (rYX1.X2; rYX2.X1…)
- coeficientul de corelaţie multiplă (r) şi coeficientul de
determinaţie multiplă (R2) .
Coeficienţi de corelaţie bivariată (rYXi)
Pentru un model liniar de forma:
y i   0   1 x1i   2 x 2 i   i
există trei coeficienţi de corelaţie bivariată:

n x1i yi   x1i  yi
Cov ( y, x1 )
ry1   i i i
s y s x1 [n x1i  ( x1i ) ][n  yi2  ( yi ) 2 ]
2 2

i i i i

n  x2 i y i   x 2 i  y i
cov( y, x2 )
ry 2   i i i
s y s x2 [n x2i  ( x2i ) ][ n yi2  ( yi ) 2 ]
2 2

i i i i

n x1i x2i   x1i  x2i


cov( x1 , x2 )
r12   i i i
s x1 s x2 [n x1i  ( x1i ) ][n x22i  ( x2i ) 2 ]
2 2

i i i i
Coeficienţi de corelaţie parţială
… şi trei coeficienţi de corelaţie parţială calculaţi cu
ajutorul coeficienţilor de corelaţie bivariată:
ry1  ry 2 r12 r12  ry1ry 2 ry 2  ry1r12
ry1.2  r12. y  ry 2.1 
(1  r )(1  r )
2
y2
2
12 (1  ry21 )(1  ry22 ) (1  ry21 )(1  r122 )

Corelaţia parţială măsoară dependenţa dintre variabile


prin excluderea succesivă a influenţei celorlalţi factori,
considerând influenţa lor constantă si menţinând numai
influenţa factorului măsurat.
În funcţie de numărul variabilelor a căror influenţă se
elimină din calcul, coeficienţii de corelaţie parţială pot fi de
ordinul întâi (pentru o variabilă eliminată), de ordinul doi
(pentru două variabile) etc.
Coeficientul de corelaţie multiplă (r)
Coeficientul de corelaţie multiplă (r) se calculează numai
pentru modelele multiple liniare şi se exprimă cu ajutorul
coeficienţilor de corelaţie simplă dintre variabilele perechi.

Astfel, în cazul corelaţiei dintre o variabilă rezultativă Y şi


două variabile independente X 1 , X 2 ,la nivelul unui
eşantion, coeficientul de corelaţie multiplă, notat cu r, se
calculează după relaţia:
ry21  ry22  2ry1ry 2 r12
r  r  ry21  (1  ry21 )ry 2.1  r  ry22  (1  ry22 )ry1.2
1  r122
Raportul de determinaţie şi raportul de corelaţie multiplă

Parametri
 xi
( y  y ) 2
VE VR
 
2 i
  1  =>    2

 i
(
i
y  y ) 2
VT VT

Estimaţiile
ESS RSS
R2   1 => R  R 2
TSS TSS
Estimatorul ajustat a raportului de
determinatie
Adjusted R square

RSS
2
n  k RSS n  1 2 n 1
R  1  1  1  (1  R )
TSS TSS n  k nk
n 1

Se observă că R R
2 2
pentru k>1.

ESS RSS RSS


R 
2
 1   1 R2
TSS TSS TSS
8. Testarea indicatorilor de corelaţie
Raportul de determinaţie si raportul de corelatie se
testează cu testul F după algoritmul prezentat la modelul
liniar simplu, ţinând cont de faptul că k=p+1 reprezintă
numărul parametrilor din noul model (Fth= Fα, k-1, n-k)
II. Testarea raportului de corelaţie

1. Formularea ipotezelor H0: η=0 H1: η≠0 (->Test Unilateral


deoarece valorile lui η>0->Fα,ν1, ν2= Fα, k-1, n-k) NB:v1=k-1≤v2=n-k
2. Fixarea pragului de semnificaţie α (ex. α=0,05)

3. Alegerea statisticii test si identificarea a valorii critice F ,k 1,n  k

R2 n  k
4. Calcularea statisticii test F  1  R 2 k  1
5. Criterii de decizie:
Fcalc≤ Fα, k-1, n-k  sig.≥α. => se AH0 cu o probabilitate de 1-α
Fcalc> F α, k-1, n-k  sig.<α => se RH0 cu un risc asumat α.
Coeficienţii de corelaţie se testează cu ajutorul testului
t după algoritmul prezentat la modelul liniar simplu, ţinând
cont de faptul că k=p+1 reprezintă numărul parametrilor din
noul model (tth= tα/2, n-k)
3. Testarea indicatorilor de corelaţie

I. Testarea coeficientul de corelaţie (exemplu pentru coref de corel dintre


Y si X1)
1. Formularea ipotezelor H0: ρy1=0(->ρ0=0)
H1: ρy1≠0 (->Test Bilateral->tα/2, n-k =tth)
2. Fixarea pragului de semnificaţie α (ex. α=0,05)
3. Alegerea statisticii test si aflarea valorii critice a acesteia pentru un α
dat :
 y1  t / 2, n  k
ˆ y1   0 ˆ y1 ry1 n  2
t   
4. Calcularea statisticii test calc  ˆ 1  ˆ y1
2
1  ry1
2

5. Criterii de decizie: n2


|tcalc|≤ tteoretic= tα/2, n-k  sig.≥α =>se acceptă/ nu se respinge H0 cu o
probabilitate de 1-α
|tcalc| > tteoretic= tα/2, n-k  sig.<α =>se respinge H0 cu un risc asumat α.
Testarea influenţei marginale a unei variabile
independente asupra variabilei dependente
(Metoda ENTER/ STEPWISE)
ENTER/STEPWISE MEHOD
1. Formularea ipotezelor
H0: variabila independentă nou introdusă în model nu are o
influenţă semnificativă asupra variaţiei variabilei dependente
H1: variabila independentă nou introdusă în model are o influenţă
semnificativă asupra variaţiei variabilei dependente
2. Fixarea pragului de semnificaţie α=0,05
3. Alegerea statisticii test si stabilirea valorii critice a acesteia
Fα;k(new)-k(old);n-k(new)= Fα;k(change);n-k(new)
4. Calcularea statisticii test
2
metoda ESSnew  ESSold n  k new R 2 new  R 2 old n  k new R change n  k new
Fcalc intrarilor
     
RSS new k new  k old 1  R new
2
k new  k old 1  R new k change
2

5. Criterii de decizie:
Dacă Fcalc≤ Fα, k new-k old, n-k new  sig.≥α => se AH0 cu o probabilitate de 1-α.
Dacă Fcalc> F α, k new-k old, n-k new  sig.<α => se RH0 cu un risc asumat α.
ENTER/STEPWISE MEHOD
Model Summary
Change Statistics
Adjusted Std. Error
Model R R Square R Square Sig. F
R Square of the Estimate
Change F Change df1 df2 Change
1 .783a 0.61 0.60 14.76 0.61 69.59 1.00 44.00 0.00
2 .902b 0.81 0.80 10.38 0.20 45.96 1.00 43.00 0.00
3 .902c 0.81 0.80 10.50 0.00 0.02 1.00 42.00 0.88
a. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1)->Y=β0+β1*X1+ε
b. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1), Cons. de vin/pers (X2) ->Y=β0+β1*X1+β2*X2+ε
c. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1), Cons. de vin/pers (X2), Cons. de liqior/pers (X3) ->Y=β0+β1*X1+β2*X2+β3*X3+ε

ANOVAa
Model   Sum of Squares df Mean Square F Sig.
1 Regression 15157.97 1.00 15157.97 69.59 .000b
  Residual 9583.38 44.00 217.80    
  Total 24741.35 45.00      
2 Regression 20109.27 2.00 10054.64 93.34 .000c
  Residual 4632.08 43.00 107.72    
  Total 24741.35 45.00      
3 Regression 20112.00 3.00 6704.00 60.82 .000d
  Residual 4629.35 42.00 110.22    
  Total 24741.35 45.00      
a. Dependent Variable: Rata deces prin ciroza (Y)
b. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1)
c. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1), Cons. de vin/pers (X2)
d. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1), Cons. de vin/pers (X2), Cons. de liqior/pers (X3)
Coefficientsa
Unstdz. Stdz. 95.0% Confidence
Coefficients Coeff. Interval for B Correlations
Model t Sig.
Std. Lower Upper
  B Error Beta Bound Bound Zero-order Partial Part
1 (Constant) -44.57 13.13  -3.39 0.00 -71.04 -18.10     
  Copiii nascuti dupa 40 ani (X1) 2.61 0.31 0.78 8.34 0.00 1.98 3.23 0.78 0.78 0.78
2 (Constant) -16.00 10.15  -1.58 0.12 -36.48 4.47     
  Copiii nascuti dupa 40 ani (X1) 1.37 0.29 0.41 4.78 0.00 0.79 1.94 0.78 0.59 0.32
  Cons. de vin/pers (X2) 1.97 0.29 0.58 6.78 0.00 1.39 2.56 0.84 0.72 0.45
3 (Constant) -15.77 10.37  -1.52 0.14 -36.70 5.15     
  Copiii nascuti dupa 40 ani (X1) 1.34 0.32 0.40 4.15 0.00 0.69 2.00 0.78 0.54 0.28
  Cons. de vin/pers (X2) 1.95 0.32 0.58 6.00 0.00 1.30 2.61 0.84 0.68 0.40
  Cons. de liqior/pers (X3) 0.02 0.11 0.02 0.16 0.88 -0.20 0.23 0.68 0.02 0.01
Testarea influenţei marginale a unei
variabile independente asupra variabilei
dependente
(Metoda REMOVE/ BACKWARD)
REMOVE/ BACKWARD METHOD
1. Formularea ipotezelor
H0: variabila independentă exclusă din model nu are o influenţă
semnificativă asupra variaţiei variabilei dependente
H1: variabila independentă exclusă din model are o influenţă
semnificativă asupra variaţiei variabilei dependente
2. Fixarea pragului de semnificaţie α=0,05
3. Alegerea statisticii test si stabilirea valorii critice a
acesteia Fα;k(old)-k(new);n-k(old)= Fα;k(change);n-k(old)
4. metoda
Calcularea
ESS 
statisticii
ESS n  k
testR 2  R 2 n  k old R 2 change n  k old
old new
Fcalc 
iesirilor old

new old
   
RSSold k old  k new 1  R 2 old k old  k new 1  R old k change
2

5. Criterii de decizie:
Dacă Fcalc≤ Fα, k(old) –k(new), n-k(old)  sig.≥α => se AH0 cu o probabilitate de 1-α.
Dacă Fcalc > Fα, k(old) –k(new), n-k(old)  sig.<α => se RH0 cu un risc asumat α.
REMOVE/BACKWARD METHOD
Model Summary
R Adjusted R Std. Error of Change Statistics
Model R Square Square the Estimate R Square Change F Change df1 df2 Sig. F Change
1 .902a 0.813 0.800 10.4987 0.813 60.822 3 42 0.000
2 .858b 0.736 0.724 12.3228 -0.077 17.240 1 42 0.000
3 .845c 0.713 0.707 12.6954 -0.023 3.701 1 43 0.061
a. Predictors: (Constant), Cons. de liqior/pers (X3), Cons. de vin/pers (X2), Copiii nascuti dupa 40 ani (X1) ->Y=β0+β1*X1+β2*X2+β3*X3+ε
b. Predictors: (Constant), Cons. de liqior/pers (X3), Cons. de vin/pers (X2)->Y=β0+β2*X2+β3*X3+ε
c. Predictors: (Constant), Cons. de vin/pers (X2) ->Y=β0+β2*X2+ε
ANOVAa
Model   Sum of Squares df Mean Square F Sig.
1 Regression 20112.001 3 6704.000 60.822 .000b
  Residual 4629.347 42 110.223   
  Total 24741.348 45     
2 Regression 18211.749 2 9105.875 59.966 .000c
  Residual 6529.599 43 151.851   
  Total 24741.348 45     
3 Regression 17649.687 1 17649.687 109.507 .000d
  Residual 7091.661 44 161.174   
  Total 24741.348 45     
a. Dependent Variable: Rata deces prin ciroza (Y)
b. Predictors: (Constant), Cons. de liqior/pers (X3), Cons. de vin/pers (X2), Copiii nascuti dupa 40 ani (X1)
c. Predictors: (Constant), Cons. de liqior/pers (X3), Cons. de vin/pers (X2)
d. Predictors: (Constant), Cons. de vin/pers (X2)
Coefficientsa
95.0%
Unstandardized Stdz. Confidence
Coefficients Coeff. Interval for B Correlations
Std. Lower Upper Zero-
Model   B Error Beta t Sig. Bound Bound order Partial Part
1 (Constant) -15.775 10.370  -1.521 0.136 -36.703 5.153     
Copiii nascuti dupa 40 ani (X1) 1.343 0.323 0.403 4.152 0.000 0.690 1.995 0.783 0.539 0.277
Cons. de vin/pers (X2) 1.951 0.325 0.576 6.005 0.000 1.295 2.606 0.845 0.680 0.401
Cons. de liqior/pers (X3) 0.017 0.107 0.016 0.157 0.876 -0.200 0.233 0.682 0.024 0.011
2 (Constant) 23.308 5.109  4.562 0.000 13.005 33.611     
  Cons. de vin/pers (X2) 2.393 0.360 0.706 6.645 0.000 1.667 3.120 0.845 0.712 0.521
  Cons. de liqior/pers (X3) 0.217 0.113 0.205 1.924 0.061 -0.010 0.444 0.682 0.282 0.151
3 (Constant) 30.335 3.680  8.243 0.000 22.918 37.752     
  Cons. de vin/pers (X2) 2.862 0.273 0.845 10.465 0.000 2.311 3.413 0.845 0.845 0.845
a. Dependent Variable: Rata deces prin ciroza (Y)
Utilitatea modelului de regresie cu variabile
standardizate
Modelul liniar multiplu cu variabile standardizate permite
compararea coeficienților de regresie din model; fiecare
coeficient arătând impactul partial al variației cu o unitate a
variabilei independente standardizate asupra variabilei
dependente standardizate.

Aceasta este o modalitate de ierarhizare a variabilelor


dependente în funcție de importanța lor în model.
Correlations
Rata deces Copiii nascuti Cons. De
prin ciroza dupa 40 ani vin/pers
    (Y) (X1) (X2)
Rata deces prin ciroza (Y) 1.00 0.78 0.84
Pearson Copiii nascuti dupa 40 ani (X1) 0.78 1.00 0.64
Correlation
Cons. de vin/pers (X2) 0.84 0.64 1.00
Rata deces prin ciroza (Y)   0.00 0.00
Sig. (1-tailed) Copiii nascuti dupa 40 ani (X1) 0.00   0.00
Cons. de vin/pers (X2) 0.00 0.00  
Rata deces prin ciroza (Y) 46.00 46.00 46.00
N Copiii nascuti dupa 40 ani (X1) 46.00 46.00 46.00
Cons. de vin/pers (X2) 46.00 46.00 46.00

Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1.00 .902 a
0.81 0.80 10.38
a. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1), Cons. de vin/pers (X2)

ANOVAa
Mean
Model   Sum of Squares df Square F Sig.
Regression 20109.27 2.00 10054.64 93.34 .000b
1 Residual 4632.08 43.00 107.72   
Total 24741.35 45.00     
a. Dependent Variable: Rata deces prin ciroza (Y)
b. Predictors: (Constant), Copiii nascuti dupa 40 ani (X1), Cons. de vin/pers (X2)
Coefficientsa
Stndz. 95.0% Confid.
Unstdz. Coeff. Coeff. Int. for B Correlations
Model t Sig.
Std. Lower Upper
  B Error Beta Bound Bound Zero-order Partial Part
2 (Constant) -16.00 10.15  -1.58 0.12 -36.48 4.47     
  Copiii nascuti dupa 40 ani (X1) 1.37 0.29 0.41 4.78 0.00 0.79 1.94 0.78 0.59 0.32
  Cons. de vin/pers (X2) 1.97 0.29 0.58 6.78 0.00 1.39 2.56 0.84 0.72 0.45
EXEMPLUL 2

Y: Nota examen Econometrie


X1: Nota examen Matematica
X2: Nota examen Statistica
Model Summaryc
Change Statistics
R Adjusted Std. Error R Square F Sig. F
Model R Square R Square of the Estimate Change Change df1 df2 Change
1 .863a .745 .716 .8943 .745 26.241 1 9 .001
2 .898b .806 .757 .8276 .061 2.509 1 8 .152

ANOVAa
Sum of
Model Squares df Mean Square F Sig.
1 Regression 20.985 1 20.985 26.241 .001b
Residual 7.197 9 .800    
Total 28.182 10      
2 Regression 22.703 2 11.351 16.575 .001c
Residual 5.479 8 .685    
Total 28.182 10      
a. Dependent Variable: ECONOMETRIE
b. Predictors: (Constant), MATE
c. Predictors: (Constant), MATE, STAT
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients Correlations
Model B Std. Error Beta t Sig. Zero-order Partial Part
1 (Constant) 2.167 1.033  2.098 .065     
MATE .685 .134 .863 5.123 .001 .863 .863 .863
2 (Constant) 1.604 1.020  1.573 .154     
MATE .442 .197 .557 2.245 .055 .863 .622 .350
STAT .307 .194 .393 1.584 .152 .827 .489 .247
a. Dependent Variable: ECONOMETRIE

ry2.1
Correlations
ECONOM
  MATE (X1) STAT (X2) (Y)
MATE (X1) Pearson Correlation 1 .778** .863**
Sig. (2-tailed)   .005 .001
N 11 11 11
STAT (X2) Pearson Correlation .778 **
1 .827**
Sig. (2-tailed) .005  .002
N 11 11 11
ECONOMETRIE Pearson Correlation .863 **
.827** 1
(Y) Sig. (2-tailed) .001 .002 
N 11 11 11
**. Correlation is significant at the 0.01 level (2-tailed).
Curs Econometrie
- Regresia neliniara-
Partea I

-2021-
Tipuri de modele neliniare
Modelele neliniare studiate se pot împărți în două categorii:
1.Modele liniarizabile. În cazul modelelor neliniare dar
liniarizabile, în urma unor transformări: logaritmare sau
substituţii de variabile (ex. Z=1/X), se va ajunge la o expresie
liniară a modelului iniţial. Pentru estimarea parametrilor
modelului se vor utiliza relaţiile utilizate pentru modelele
liniare în care locul valorilor variabilelor X şi Y va fi luat de
variabilele obţinute în urma transformării/substituţiei de
variabile.
2.Modele polinomiale. Sunt modelele econometrice pentru
care media lui E(Y/X=xi) este exprimată printr-un model
polinomial de grad 2, 3, ... .

2
Modelul log-liniar simplu -> Modelul putere
- este un model de regresie neliniară
- atat variabila dependentă căt și variabila independentă sunt
logaritmate
- modelul poate fi liniarizat prin logaritmare
Estimarea parametrilor modelului
Considerăm modelul putere simplu de forma:
Y   0 X e sau y i   0 xi1 e  i
1 

Prin logaritmare, se obţine modelul (!!! β0>0; Y si X>0):


lnyi  lnβ 0  β1lnx i  ε i

3
Modelul log-linear simplu -> Modelul
putere
Modelul log-liniar poate fi transformat într-un model liniar făcând
următoarele notaţii:
y i*  ln y i
 0*  ln  0
 1*   1 y *i   0*   1* x*i   i*
x*i  ln xi
 i*   i
Interpretarea parametrilor modelului
- parametrul 0 : valoarea medie a variabilei dependente Y, când
variabila independentă X ia valoarea 1;
*
- parametrul 1 al modelului (*): β1  β1*  dY dlnY , exprimă
*

dX dlnX
variaţia medie relativă (%) a variabilei dependente Y la o variaţie
relativă (%) de 1% a variabilei independente X.
4
Modelul log-linear simplu -> Modelul
putere

Estimatorii parametrilor au următoarele relații:

n ln xi ln yi   ln xi  ln yi
b1 
n (ln xi ) 2  ( ln xi ) 2
1 1
lnb0   ln xi  b1  ln yi
n n

5
Modelul log-linear simplu -> Modelul putere
Elasticitatea
Elasticitatea unei variabile Y în raport cu o altă variabilă X
reprezintă modificarea relativă (%) a variabile Y la o modificare
relativă (%) dată a lui X, de obicei subunitară, cf. relației:
Y
100
% modif Y Y Y X
E  
 X
% modif X 100 X Y
X

Parametrul β1 pentru modelul putere reprezintă elasticitatea


variabilei dependente Y în raport cu variabila independentă X.

6
Model Putere
GDP [per Capita] – var. dep
Employment Rate – var. indep

7
Model Putere:
GDP [per Capita] – var. dep
Employment Rate – var. indep

ln y i  ln β 0  β1ln x i  ε i
ln GDP  3.668 10-44  26.186  ln xi  ei

8
Modelul log-liniar multiplu -> Funcţia de
producţie
Funcţia de producţie Cobb-Douglas
Este un model de regresie neliniar multiplu de tip log-liniar, de
forma:
y i  β 0  x  x  ...  x e
β1
1i
β2
2i
βk
ik
εi

Modelul de producţie cu doi factori, munca (L) şi capitalul (K),


are forma:
yi  β 0  Li  K i  e 
β1 β2 εi

lnyi  lnβ 0  β1ln(Li )  β 2 ln(Ki )  ε i

9
Modelul log-liniar multiplu (II) -> Funcţia de producţie
Interpretarea parametrilor
Parametrii modelului βi , i=1,k, poartă denumirea de elasticități
parțiale ale variabilei dependente în raport cu fiecare factor sau
variabilă independentă, Xi.
β0 - este nivelul mediu al producţiei pentru K=1 şi L=1;
β1 - este elasticitatea parţială a producţiei în raport cu munca;
β2 - este elasticitatea parţială a producţiei în raport cu capitalul;
β1+β2 - este elasticitatea totală a producţiei în raport cu cei doi
factori. Se numeşte randament de scară.

10
Modelul log-liniar multiplu-> Funcţia de producţie
Interpretarea elasticităţii totale
β1+β2 =1 - variaţie constantă a producţiei în raport cu factorii
de producţie;
β1+β2 <1 - variaţie cu o viteză mai redusă a producţiei în raport
cu variaţia factorilor;
β1+β2 >1- variaţie mai accelerată a producţiei în raport cu
variaţia factorilor.
Exemplu: În studiul legăturii dintre producţia agricolă (lei),
numărul mediu de salariaţi în agricultură (persoane) şi
suprafaţa agricolă (ha), se obţine următoarea ecuaţie estimată:
ln y i  6,758  0,143  ln x1i  0,471 ln x 2i
11
Model putere multiplu
Ln_gdp (Y)– variabila dependenta
Ln_empl_rate (X1), Ln_dir_invest (X2) – var. ind.
1. Datele sunt prezentate pentru a
putea fi testată și influența
marginală a variabilelor în model.
2. Pentru modelul putere multiplu
estimatia furnizată în tabelul
Coefficients în dreptul termenului
liber (Constant pentru modelul 2)
este de fapt (ln b0) astfel încât
estimația lui β0 va fi
e-73.125 pentru modelul (2). Aceeași
observație poate fi făcută și pentru
modelul (1).

12
13
Modele semi-logaritmice

1. Modele cu variabila independentă logaritmată


-Modelul Logarithmic
y=f(ln(x))+

2. Modele cu variabila dependentă logaritmată


- Modelele Compound, Growth și Exponential

ln (y)=f(x)+

Econometrie
Modele semi-logaritmice: GENERALITĂȚI
În acest tip de modele variabila independentă sau variabila
dependentă apar, în forma liniarizată a modelului, ca variabile
logaritmate.
Estimează variaţia relativă sau absolută a variabilei
dependente la o variaţie absolută respectiv relativă cu o unitate/
un procent a variabilei independente.
Modelul cu variabila independentă logaritmată pe care îl vom
studia este modelul Logarithmic.
Modelele cu variabila dependentă logaritmată pe care le vom
studia sunt: modelul Compound (Compus), Growth (Model de
creştere) şi Exponential

Econometrie
Modele semilogaritmice

1. Modele cu variabila independentă logaritmată au forma


generala:
y=f(ln(x))+
In aceasta categorie de modele se inscrie Modelul Logarithmic

Econometrie
Modelul Logarithmic
1. Forma generală a modelului: Y  β 0  β1  lnX , εX>0
- β0 este valoarea medie a lui Y pentru X=1.
-β1/100 arată variaţia medie absolută a lui Y la o variaţie
procentuală a lui X cu 1%.
Y
β1 
 (lnX)

Econometrie
Exemplu
Se consideră legătura dintre Puterea motorului şi Numărul de cilindri.
Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
ln(Number of Cylinders) 104.458 3.632 .822 28.761 .000
(Constant) -68.048 6.112 -11.134 .000

Ecuaţia estimată a legăturii dintre cele două variabile este:


Y  68,048  104,458  lnX  ε
Interpretare:
- când Numărul de cilindri este de 1, Puterea medie a motorului este
de -68,048 C.P.
- la o creştere a numărului de cilindri cu 1 %, puterea
motorului creşte, în medie, cu 1,04458 C.P. (104,458/100)
Econometrie
ECONOMETRIE

-Regresia Neliniara-
Partea a II-a

2015
2. Modele cu variabila dependentă logaritmată au
forma generala:
ln (y)=f(x)+
In aceasta categorie de modele se inscriu
modelele Compound, Growth și Exponential

Econometrie
Modelul Compound (Modelul Compus)
X
1. Forma generală a modelului: Y  β 0  β1  e ε
Ecuaţia se liniarizează prin logaritmare:
lnY  lnβ 0  X  lnβ1  ε
Y>0; β0 si β1 >0
Interpretarea parametrilor modelului:
- β0 este nivelul mediu a lui Y atunci când X=0. Variabila Y
are numai valori pozitive, deci β0 satisface condiţia β0 >0.
- lnβ1 arată variaţia medie procentuală a lui Y la o variaţie
absolută a lui X cu o unitate. Reprezintă rata de creştere/
reducere a variabilei Y în raport cu o variație absolută a lui
X cu o unitate.  ln Y
ln 1 
X
Econometrie
Observaţii:

Dacă lnβ1>0, adică β1>1, atunci legătura dintre cele două


variabile este directă.

Dacă lnβ1<0, adică 0<β1<1, atunci legătura dintre cele


două variabile este inversă.

Econometrie
2. Estimarea parametrilor modelului

Se face prin MCMMP:  i  minim


2
e
Sistemul de ecuaţii normale:
n ln b0 + ln b1  xi =  ln y i , i  1, n

ln b0  xi + ln b1  xi2 =  xi ln yi

n  x i lny i   x i  lnyi
lnb1  ;
n x   xi 
2 2
i

ln b0 
 i  i   x i  x i lnyi
lny x 2

n  x i2    x i 
2

Econometrie
3. Testarea semnificaţiei parametrilor
• Ipoteze
• Interpretare

4. Intensitatea legăturii dintre variabile


- raportul de determinaţie (R square)

Econometrie
5. Exemplu
În urma analizei legăturii dintre valoarea investiţiilor
(mii euro) şi valoarea producţiei (mil. euro) înregistrate pe
un eşantion de 5 firme, s-au obţinut următoarele rezultate:
Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
xi 1.769 .103 2.677 17.118 .000
(Constant) 1.322 .256 5.161 .014
The dependent variable is ln(yi).

Ecuaţia estimată a legăturii dintre cele două variabile este:


y x i  1,322 1,769
x i

Logaritmând ecuaţia de mai sus, se obţine:


ln yi=ln 1,322+xi ln 1,769 = 0,279+0,570 xi

Econometrie
Interpretare:
-valoarea parametrului β1 , estimata la 1,769, arată că, la o
creştere cu o mie de euro a valorii investiţiilor, valoarea
producţiei creşte, în medie, cu ln(1,769) = 0,57 adică cu
57%.
2. Testarea semnificaţiei parametrilor
3. Estimarea şi testarea intensităţii legăturii dintre variabile
Model Summary ANOVA

Adjusted Std. Error of Sum of


R R Square R Square the Estimate Squares df Mean Square F Sig.
.985 .969 .959 .185 Regression 3.253 1 3.253 95.333 .002
The independent variable is xi. Residual .102 3 .034
Total 3.356 4
The independent variable is xi.

Econometrie
Modelul Growth (Model de Creştere)
Forma generală a modelului: Y  eβ 0 β1X  ε
Ecuaţia se liniarizează prin logaritmare: lnY  β 0  β1  X , εY>0

Parametrii modelului:
- eβ0 este valoarea medie a lui Y pentru X=0.
- β1 arată variaţia medie procentuală a lui Y la o
variaţie absolută a lui X cu o unitate.

lnY
β1 
X

Econometrie
Exemplu
Se consideră legătura dintre Timpul de accelerare de la 0 la
60 mile/ora(exprim. Secunde) şi Puterea motorului (CP).
Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
Horsepower -.004 .000 -.726 -21.032 .000
(Constant) 3.092 .019 164.791 .000
The dependent variable is ln(Time to Accelerate from 0 to 60 mph (sec)).

Ecuaţia estimată a legăturii dintre cele două variabile este:


Y  e 3,0920,004X
Logaritmând ecuaţia de mai sus, se obţine:
ln Y=3,092 - 0.004 X

Econometrie
Interpretare:
-când Puterea motorului este de 0 C.P., Timpul de accelerare
este de e3,092=22 secunde.
-la o creştere a puterii motorului cu 1 C.P., avem o crestere
relativă ( sau variatie relativa) a timpului de acceleratie cu - 0,4%.

Econometrie
Modelul Exponential
Forma generală a modelului: Y  β 0  eβ X  e ε
1

Ecuaţia se liniarizează prin logaritmare: lnY  lnβ 0  β1  X  ε


Y>0; β0 >0
Parametrii modelului:
- β0 este valoarea medie a lui Y pentru X=0.
- β1 arată variaţia medie procentuală a lui Y la o variaţie
absolută a lui X cu o unitate.
lnY
β1 
X

Econometrie
Exemplu
Se consideră legătura dintre Puterea motorului (CP) şi
Numărul de cilindri (cilindri).
Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
Number of Cylinders .170 .005 .842 31.057 .000
(Constant) 38.911 1.221 31.877 .000
The dependent variable is ln(Horsepower).

Ecuaţia estimată a legăturii dintre cele două variabile este:


Y  38,911  e 0,170X
Logaritmând ecuaţia de mai sus, se obţine:
lnY = ln 38,911+ 0,17X
- când Numărul de cilindri este de 0, Puterea medie a motorului este
de 38,911 C.P.
- la o creştere a numărului de cilindri cu 1 cilindru, puterea motorului
creşte, în medie, cu 17%.
Econometrie
Modele polinomiale -> Modelul parabolic
a. Modelul parabolic (Quadratic): cel mai simplu model
polinomial
Y   0  1  X   2  X 2  
La nivelul eşantionului:
YX  b0  b1  X  b2  X 2
În economie, modelul polinomial este folosit pentru descrierea
relaţiei dintre costul unitar şi producţia realizată: costul unitar
scade concomitent cu creşterea producţiei până la un nivel
optim al producţiei, după care, dacă producţia continuă să
crească, începe să crească şi costul unitar.
Cost unitar

50.00 Xi - productia (sute buc.)


Observed
Quadratic

40.00
yi = 89,041 - 25,795 xi + 2,114
30.00
xi2

20.00 Coefficients

Unstandardized Standardized
Coefficients Coefficients
10.00 B Std. Error Beta t Sig.
Productia -25.795 3.895 -5.322 -6.623 .000
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00
Productia ** 2 2.114 .351 4.842 6.026 .001
Productia
(Constant) 89.041 9.231 9.646 .000
Interpretare:
β1<0, β2>0, deci legătura de tip parabolic admite un punct
de minim.

Coordonatele punctului de minim arată nivelul optim al


producţiei pentru care costul unitar este minim. Abscisa
acestui punct este:
-b1/2b2 = 25,79/4,22 = 6,11. Pentru o producţie de 611 bucăţi
din produsul A, costul este minim.
Modele polinomiale - Modelul cubic
b. Modelul cubic

Y   0  1  X   2  X 2   3  X 3  

În economie acest model este folosit pentru descrierea relaţiei


dintre costul total şi valoarea producţiei.
Pentru acest tip de legătură se poate determina punctul de
inflexiune al curbei, prin anularea derivatei de ordinul 2 in X. Se
obţine valoarea lui X de unde Y îşi modifică modul de variaţie.
Exemplu: Y - gradul de urbanizare (%)
X – Pib/Loc ($/loc)
Grad de urbanizare (%)
100 Coefficients

Unstandardized Standardized
80 Coefficients Coefficients
B Std. Error Beta t Sig.
PIB/loc .010 .002 2.557 4.950 .000
60
PIB/loc ** 2 -6.1E-007 .000 -3.206 -2.652 .009
PIB/loc** 3 1.21E-011 .000 1.255 . .
40 (Constant) 32.036 3.395 9.438 .000

20

0 5000 10000 15000 20000 25000

PIB / loc
Ecuaţia estimată este:

Y  32,036  0,010  X  6,1 10 7  X 2  1,21 10 11  X 3

Punctul de inflexiune este dat de:

-b2/ 3b3 = 6,1/ 0,000121= 25105

S-ar putea să vă placă și