Sunteți pe pagina 1din 185

ECONOMETRIE (C1)

-note de curs
conf. univ. dr. Ciprian I. TURTUREAN
IAI
-2015-2016-

Bibliografie selectiv
Andrei T., Bourbonnais, R., Econometrie, Economica, Bucureti, 2008
Berdot, J.P., conomtrie, CNED, Poitiers-Futurscope, 2001

Bourbonnais, R., conomtrie, Dunod, Paris, 2000


Greene, W.H., Econometric analysis, Mac Millan, 1993

Gujarati, D.N., Basic econometrics, McGraw-Hill, New York, 1995


Hamilton, J.D., Time series analysis, Princeton University Press, 1994
Jemna, D.V., Econometrie, Editura Sedcom Libris, Iai, 2012
Kmenta, J., Elements of Econometrics, MacMillan Publishing, 1986
Pecican, E.S., Econometria pentru economiti, Editura Economic,
Bucureti, 2003

Structura cursului de econometrie


CURS 1 - Introducere
CURS 2 - Regresia liniar simpl (1)
CURS 3 - Regresia liniar simpl (2)
CURS 4 - Regresia liniar simpla (3)
CURS 5 - Regresia liniar multipl (1)
CURS 6 - Regresia liniar multipl (2)
CURS 7 - Regresia liniar multipl (3)
CURS 8 - Regresia neliniar (1)
CURS 9 Test de Evaluare Parial - test clasic, din primele 7 cursuri
CURS 10 - Regresia neliniar (2)
CURS 11 - Verificarea ipotezelor modelului de regresie (1)
CURS 12 - Verificarea ipotezelor modelului de regresie (2)
CURS 13- Verificarea ipotezelor modelului de regresie (13
CURS 14 - Recapitulare

CURS 1 - Introducere

1 or de curs recapitulativ cu privire la:


inferena statistic
variabile aleatoare i repartiii
estimatori i proprieti

1 ora de curs despre natura i problemele cercetrii


econometrice:
exemplificare cu privire la ceea ce poate face econometria
model econometric
noiuni, termeni i notaii
demersul cercetrii

Mod de evaluare
1. Evaluare pe Parcurs - 60% din nota final
Seminar - 20% (participare, o tema de cas construirea de modele
de regresie cu date reale). Pentru a primi not la seminar, fiecare
student trebuie s fie prezent la minimum 7 seminarii
Test evaluare - 40% (test clasic). Testul de evaluare are valoare de
parial, materia din primele 7 cursuri nu se mai d la examenul final.
Testul se da la curs n sptmna a 9-a.
2. Examen n sesiune - 40% din nota final. Examenul se d din
modele neliniare si testarea ipotezelor clasice, teorie i probleme,
sub form de test gril.
Observaie
- aplicaiile se vor face n SPSS si Excel cu date reale

1. Definirea termenului de econometrie


Econometria reprezint analiza cantitativ a
fenomenelor

economice,

avnd

la

baz

teoria

economic* i date empirice**, utiliznd metode

specifice inferenei statistice***.


Samuelson, P.,Koopmans, T., & Stone, R.

ECONOMETRICS
=

ECONOmic + METRICS
6

Ce este ECONOMETRIA?

77

2. Obiectul de studiu al econometriei


Econometria construiete MODELE (expresii cantitative)

pentru realitile economice studiate care au un corespondent


n teoriile economice.
Econometria estimeaz, prin procedeele de inferen

statistic, parametrii MODELELOR i realizeaz predicii cu


privire la fenomenele studiate.
Aria de studiu a econometriei este realitatea economic
privit ca un ansamblu de relaii i intercondiionri abordate
n special sub aspect cantitativ.
studiaz

legturile dintre
economice i comportamentul acestora.
Econometria

fenomenele

3. Metoda de lucru a econometriei


Econometria studiaz realitile economice sub aspect
cantitativ, utiliznd metoda statisticii.
Econometria contribuie la cunoaterea realitii economice
cu ajutorul unui instrument specific: modelul econometric.

4. Scopul econometriei
Scopul econometriei este de a crea, estima i testa
modele econometrice, care surprind relaiile eseniale dintre
fenomenele economice reale i/ sau tendinele evoluiei
acestora.
Pe baza modelelor econometrice validate urmeaz a se
realiza predicii ale realitii economice.
Scopul econometriei este creearea unui suport empiric

utilizat att pentru formularea i verificarea teoriilor economice


ct i pentru elaborarea politicilor economice.

10
10

4. Precizri cu privire la modele econometrice


Modelul, n economie, are o conotaie explicativ, prin care
se ncearc descrierea realitii.
Modelul economic reprezint o prezentare schematic,

simplificat a realitii economice studiate, cu scopul de a


descrie/ explica modul n care aceasta funcioneaz.
Modelul econometric ia forma unei ecuaii/ sistem de ecuaii

dintre dou sau mai multe variabile statistice.


n construirea unui model econometric se formuleaz un set
obiective clare n concordan cu care se aleg factorii
explicativi ai modelului.

11

Exemplu: Modelul consumului Keynes

Y=0+1X
unde:
Y - consumul populaiei;
X venitul populaiei;
0- consumul autonom (parametru);
1- nclinaia marginal ctre consum (parametru).

OBS: - n modelul lui Keynes pot fi cuprinse i alte variabile dar


care trebuie s fie n concordan cu obiectivele modelrii !!!

12
12

Date pentru modelul lui Keynes

Macroregiuni si regiuni de dezvoltare


Regiunea NORD-VEST
Regiunea CENTRU
Regiunea NORD-EST
Regiunea SUD-EST
Regiunea BUCURESTI - ILFOV
Regiunea SUD-MUNTENIA
Regiunea SUD-VEST OLTENIA
Regiunea VEST

Veniturile
Cheltuielile
2104
2014
(Lei/pers)
(Lei/pers)
(X)
(Y)
967,21
879,3
934,06
843,18
791,72
757,17
816,48
733,72
1343,36
1142,31
896,02
821,82
860,65
773,3
976,3
919,68
Sursa: INSE

Veniturile totale medii lunare pe o persoana, pe categorii de gospodarii, pe macroregiuni si


regiuni de dezvoltare (X)
Rezultatele cautarii - ABF Cheltuielile totale medii lunare pe o persoana, pe categorii de
gospodarii, pe macroregiuni si regiuni de dezvoltare (Y)

13
13

Reprezentarea grafic modelului Keyns estimat pentru Romania (2014) pe


baza datelor nregistrate la nivel de regiune

Cheltuielile (Y)
1200
y = 0,7445x + 152,83
1100

1000
900
Cheltuielile (Y)

800

Linear (Cheltuielile (Y))

700
600

14
14

800

1000

1200

1400

Estimarea
i testarea modelului Keyns estimat pentru Romania (2014) pe
9
baza datelor nregistrate la nivel de regiune (EXCEL)
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.987
R Square
0.974
Adjusted R
Square
0.969
Standard Error
Observations

22.893
8.000

ANOVA
df
Regression
Residual
Total

Intercept
Veniturile (X)

15
15

1
6
7

SS
116255.540
3144.421
119399.962

Coefficients
152.831
0.745

Std. Err.
48.086
0.050

MS
116255.540
524.070

F
221.832

Sig. F
0.000

t Stat
P-value Lower 95% Upper 95%
3.178
0.019
35.168
270.494
14.894
0.000
0.622
0.867

5. Noiuni i notaii (1)

A. Variabilele statistice
n cercetarea econometric se utilizeaz variabile
statistice, (construite pentru populaii reale, finite) ntre care
exist relaii de interdependen. Acestea vor fi notate cu
majuscule ale alfabetului latin: X, Y, Z etc.
Valorile variabilelor vor fi notate cu aceleai litere ca i
variabilele dar, de data aceasta, vor fi scrise cu caractere
mici urmate de un indice care ne ofer informaii cu privire la
numrul de ordine al valorii variabilei respective: xi, yi, zi etc.
X: xi, i = 1, n

16

5. Noiuni i notaii (2)


Tipuri de variabile utilizate n modelul econometric:
-variabila dependent (Y), numit i variabil rezultativ, endogen,
efect;
- variabilele independente (Xi, i=
), numite
1, p i variabile explicative,
factoriale, exogene. Acestea determin un anumit efect asupra variabilei
dependente.
- variabila eroare (), variabila eroare de modelare/ rezidual. De regul,
aceast variabil apare n model ca sum a tuturor influenelor
necunoscute sau care nu apar explicit n model.
n modelarea econometric, variabila eroare trebuie s ndeplineasc un
set de condiii care vor fi testate pentru fiecare model n parte.
Ipotezele clasice cu privire la variabila eroare testate sunt: ipoteza de
normalitate, ipoteza de homoscedasticitate i ipoteza de independen a
variabilei eroare.
Pe baza analizei variabilei eroare se poate determina acurateea
modelului econometric.

17

5. Noiuni i notaii (3)


B. Parametri, Estimaie, Estimator
Parametrii modelului econometric, numii i coeficieni de
regresie, sunt mrimi reale, fixe i necunoscute care apar n
model n diferite expresii alturi de variabile.
Parametrii fac obiectul procesului de estimare i testare
statistic. Acetia se vor nota cu litere mici ale alfabetului grecesc:
i; i=0, p i vor fi n numr de k=p+1.
Estimatorii sunt variabile de selecie, convenabil construite n
procesul de estimare, cu distribuii de probabilitate cunoscute i cu
proprieti specifice n baza crora se realizeaz procesul de
estimare a parametrilor modelului econometric.
Acetia se vor nota cu aceleai litere mici ale alfabetului
grecesc dar de data aceasta nsoite de semnul ^, i .

Estimaiile sunt valori posibile ale estimatorilor calculate pe


18 baza unei selecii (set de date reale) observate n realitate.

6. Proprieti ale estimatorilor


n procesul de estimare, cele mai importante proprieti ale
estimatorilor sunt:
- nedeplasarea un estimator este nedeplasat dac media
matematic a acestuia este egal cu parametrul.
- convergena un estimator este convergent dac variana sa
tinde spre zero pentru un eantion cu volum suficient de mare.
- eficiena estimatorul este eficient dac are dispersia sau
variana cea mai mic dintre toi estimatorii posibili pentru
parametru .

19

7. Ipotezele i Testele statistice


7.1. Ipotezele statistice
n econometrie exist un set de ipoteze cu privire la variabilele
care intr n componena modelului econometric. Acestea poart
denumirea de ipotezele modelului clasic de regresie. Pe lng
acestea se regsesc i ipoteze cu privire la parametrii modelului
de regresie.

7.2. Testele statistice


- sunt procedee statistice pe baza crora se ia decizia de a se
accepta sau a respinge ipotezele statistice. La baza procesului
de testare se afl rezultatul comparrii dintre valoarea teoretic
a unei variabile aleatoare numite statistic cu valoarea aceleiai
statistici calculat/ estimat pe baza unei selecii.
Statisticile sunt variabile aleatoare care au legi de distribuie
cunoscute i complet specificate i sunt alese n concordan cu
ipoteze statistice testate.

20

8. Demersul metodologic

VALIDARE

1. Formularea unei teorii economice sau a unui set de


ipoteze;
2. Formalizarea problemei ntr-un model;
3. Obinerea datelor pentru modelare;

4. Specificarea modelului econometric;


5. Estimarea parametrilor modelului econometric;
6. Testarea ipotezelor cu privire la modelul
econometric;
7. Predicia fenomenului pe baza modelului econometric;
8. Utilizarea modelului n practica economic.

21

RECAPITULARE
Metodologia econometric tradiional const n
parcurgerea urmtoarelor etape [D. N. Gujarati, p.3]:
1. Formularea teoriei economice /ipotezelor de lucru
2. Specificarea modelului matematic asociat teoriei
economice
3. Specificarea teoretic a modelului econometric
4. Obinerea datelor
5. Estimarea parametrilor modelului econometric pe baza
datelor observate
6. Testarea parametrilor modelului econometric
7. Analiza statistic a erorii de modelare si testarea
ipotezelor corespunztoare acesteia
8. Validarea modelului econometric
9. Prognoza statistic pe baza modelului validat
10.Utilizarea modelului n scop decizional

Tipuri de date statistice utilizate

Serii de moment (de seciune transversal/ cross-section)


Serii de timp (longitudinale)
Serii de tip panel (simultan de seciune transversal i
longitudinl)

23
23

ECONOMETRIE

CURS 2
- note de curs IAI
- 2015-

C2. REGRESIA LINIAR

SIMPL

(1)

1. Prezentarea modelului liniar simplu


2. Estimarea punctual i prin interval de ncredere a
parametrilor

3. Testarea parametrilor modelului liniar


Probleme specifice utilizand SPSS

1.Scurt istoric al regresiei


1886 - Francis Galton,. Family Likeness in Stature,
Proceedings of Royal Society, London, vol. 40, 1886, pp.
42-72
1897 - G. U. Yule, "On the Theory of Correlation", Journal
of the Royal Statistical Society , pp. 812-54.

1903 - Karl Pearson, G. U. Yule, Norman Blanchard, and


Alice Lee, "The Law of Ancestral Heredity", Biometrika
1925 - R.A. Fisher, Statistical Methods for Research
Workers

2.

Noiuni (1)

Regresia este o legtur statistic ntre dou sau mai multe


variabile statistice.
n legturile statistice utilizm variabile aleatoare
(stohastice), ceea ce nseamn c variabilelor le corespund
distribuii de probabilitate (fig. 1).

y1 ... y j ... ym
) =>M(Yxi) = f(xi) => yi=f(xi)+i
xi Y: (
ni ... n j ... nm
X variabil independent - variabil nestohastic
Y variabil dependent variabil stohastic (prezint
distribuii pentru fiecare valoare a lui X)

2.

Noiuni (2) - Fig.1

n legturile de tip funcional unei valori i se asociaz o


alt valoare i nu o distribuie de probabilitate.
xi yi => f(xi)=yi

Analiza de regresie studiaz forma legturii dintre una sau


mai multe variabile => Model de regresie
Analiza de corelaie Studiaz intensitatea legturii dintre
una sau mai multe variabile puse n relaie printr-un model
de regresie.

Modele de regresie

Modele de
regresie
Liniare
Neliniare

Simple
C = 0 + 1P +

Multiple
C = 0 + 1 P + 2V +

C = 0 +1 ln(P) + C = 0 + 1 ln(P) + 2 ln(V) +

3. Modelul de regresie liniar simpl


i = yi - M(YX=xi)=> yi = M(YX=xi)+ i = 0+ 1xi + i
M(YX=xi) media condiionat, corespunztoare variabilei
stohastice Y, condiionat de X = xi
0= f(0) parametrul intersecia dreptei de regresie liniar cu
axa OY (engl. intercept)
1 parametrul panta a dreptei care reprezint variaia
absolut a variabilei Y atunci cnd variabila X crete cu o
unitate (1 =Y/ X):
- 1>0: legtur direct ntre variabile, Y variaz n acelai
sens cu X
- 1<0: legtur invers ntre variabile, Y nu variaz n
acelai sens cu X

3. Modalit i de scriere ale modelului


liniar simplu
Dac este scris pentru valorile variabilelor

yi = 0+ 1xi + i
Dac este scris pentru variabile n general

Y= 0+ 1X+

4. Componentele modelului de regresie

A.Componenta

determinist

aleatoare. Factori detreminani ai


componentei aleatoare: natura fenomenului studiat,
specificarea modelului i erorile de msurare
B.Componenta

5.

Ipoteze clasice ale modelului de regresie

Ipotezele modelului de regresie vizeaz variabila rezidual i


variabila independent.
Cele mai importante ipoteze cu privire la variabila
rezidual sunt:
- media erorilor de modelare este nul: M(i)=0
- normalitatea erorilor : i ~ N ( 0 , 2 ) , adic variabila rezidual
urmeaz o lege de repartiie normal de medie zero i varian
2;
2
2
- homoscedasticitate: V ( i ) M ( i ) ,adic variana erorii
este constant la nivelul distribuiilor condiionate de tipul Yi X xi
- necorelarea erorilor: cov( i , j ) 0, i j; i, j 1, n ,adic erorile
nu se influeneaz reciproc;
- lipsa corelaiei dintre variabila independent i variabila eroare:
cov( i , xi ) 0.

Ipoteze cu privire la variabilele independente:


- X este o variabil observabil, statistic (nestohastic);
- necoliniaritatea variabilelor independente (pentru cazul
regresiei multiple);
- variabila independent are o dispersie finit i posibil de
determinat.

6. Exemple de modele liniare simple


Funcia de consum
- cererea sau consumul populaiei n funcie de venit:
Ci 0 1Vi i ,unde parametrul 1 arat cu ct crete
consumul unui anumit produs ( Ci ) la o cretere cu o unitate
a venitului i este de regul pozitiv.
Legea cererii
- cererea populaiei pentru o gam de produse n funcie
de preul acestora:
Ci 0 1Pi i , unde parametrul 1 este de regul
negativ i arat cu ct scade cererea la o cretere a preului
cu o unitate.

7. Estimarea punctual parametrilor


modelului de regresie prin MCMMP
MCMMP (engl. Method of Ordinary Least Sqares - OLS)
Fie:
y i 0 1 xi - valorile estimate (teoretice ale lui Y)
i
yi 0 1 xi i - valorile reale, nregistrate
Estimatorul variabilei reziduu de modelare poate fi obinut prin
scderea relaiilor de mai sus:

i yi yi yi 0 1 xi yi 0 1 xi

Conform MCMMP estimatorii parametrilor modelului de


regresie verific condiiile
n

i yi yi yi (0 1xi ) yi 0 1 xi min .
2

i 1

i 1

i 1

i 1

Pentru a uura notaiile n procesul de estimare vom utiliza


notaiile direct pentru estimaii. Astfel relaia de mai sus se
va scrie:
n

ei yi yi yi (b0 b1xi ) yi b0 b1 xi min .


2

i 1

Notm

i 1

i 1

i 1

S e yi b0 b1 xi
i 1

2
i

i 1

Rezolvarea acestei probleme de minim presupune


ndeplinirea a dou condiii:
1. Anularea derivatelor pariale de ordinul I ale lui S n
raport b0 i b1:
n
n
n
S
b 2 yi b0 b1 xi 1 0 nb0 b1 xi yi
0
i 1
i 1
i 1

n
n
n
n
2
S 2 y b b x x 0 b

i
i
0
1 i
0 xi b1 xi yi xi
b1
i 1
i 1
i 1
i 1

b0

b0

2
y
x
i i xi xi yi

n xi2 xi

b1 n xi yi xi yi

b1
2

n xi2 xi

sau b 0 y b1 x

2. Matricea derivatelor pariale de ordinul doi s fie pozitiv


definit:
2S

2S
2 2n
2 xi
2n
2 xi
b0 b1
b0

0
det 2
0 det
2
2
2 xi 2 xi
S 2 xi S 2 xi2
2
b b

b
0
1
1

n
det
x
i

x
x
i

0
2
i

Este pozitiv definit deoarece

n x xi n 2 2 0
2
i

7. Propriet ile estimatorilor parametrilor


modelului de regresie
Estimatorii parametrilor modelului de regresie sunt
variabile de selecie care:

2
2

,
N

- urmeaz o distribuie normal: 0~


, 1~
1
0

- sunt nedeplasai: M 0 0 ,

M 1 1

- convergeni (in probabilitate): 0

nN

0 ,

- eficieni: dintre toi estimatorii posibili pentru


variana cea mai mic

1 nN

1 , 1 are

8. Estimarea prin interval de ncredere a


parametrilor modelului de regresie liniar

Att pentru 0 , ct i pentru 1 , intervalele de ncredere se


vor construi astfel:

0 [0 t / 2,nk ]

1 [1 t / 2,nk ]

La nivelul eantionului, relaiile de mai sus devin:

b t

0 b0 t / 2,nk s , b0 t / 2,nk s

/ 2, n k

s , b1 t / 2,nk s
1

unde k = numrul parametrilor estimai din model (pentru


modelul liniar k=2)

Estimaiile abaterile standard ale estimatorilor se determin


dup relaiile:

x
2
2 1
s s s
2
0
0
n
xi x

respectiv,
s s2
1

s2
n

2
(
x

x
)
i
i 1

unde

s2

este estimaia acestuia:

s2

2
i

n2

(y b

b1 xi ) 2

n2

5. Testarea parametrilor modelului


liniar
1. Formularea ipotezelor

pentru 0
pentru 1
H0: 0=0
H0: 1=0
H1: 0#0
H1: 1#0
2. Fixarea pragului de semnificaie
=0,05
3. Alegerea statisticii test
0 0 H 0 0
1 1 H 0 1
t

~ t / 2, n 2
t

~ t / 2 ,




0

n2

4. Calcularea statisticii test

tcalc

b0

tcalc

5. Criterii de decizie:

b1

|tcalc| tteoretic= t/2, n-2 => se accept H0 cu o probabilitate de 1-.


|tcalc| > tteoretic= t/2, n-2 => se respinge H0 cu un risc asumat .

EXEMPLU
Se consider datele cu privire la Valoarea
vnzrilor i Cheltuielile cu publicitatea pentru
un eantion de 4 firme. Datele sunt prezentate
n tabelul urmtor.

xi

yi

10
20
50
100

2500
4100
5000
2500

180

14100

OUTPUT SPSS
Model Summary
R

Adjusted R
Square
0.033
-0.450

R Square
0.183

Std. Error of the


Estimate
1492.173

a. Predictors: (Constant), Vanz_X

ANOVAb
Sum of Squares
Regression
Residual
Total

154336.735
4453163.265
4607500.000

df

Mean Square

1.000
2.000
3.000

154336.735 0.069
2226581.633

Sig.
0.817

a. Predictors: (Constant), Vanz_X


b. Dependent Variable: Chelt_Y

Coefficientsa
Unstandardized
Coefficients

Std. Error

(Constant)

3777.551

1215.243

Vanz_X

-5.612

21.317

a. Dependent Variable: Chelt_Y

Standardized
Coefficients Beta

95% Confidence
Interval for B
t

3.108
-0.183

Sig.

Lower
Bound

0.090 -1451.215

-0.263 0.817

-97.331

Upper
Bound
9006.31
8
86.106

OUTPUT EXCEL
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.183
R Square
0.033
Adjusted R Square
-0.450
Standard Error
1492.173
4.000

Observations
ANOVA
df
Regression
Residual

1.000
2.000

SS
MS
154336.735 154336.735
4453163.265 2226581.633

Total

3.000

4607500.000

Intercept
Vanz_X

Coefficients Standard Error


3777.551
1215.243
-5.612

21.317

F
0.069

Sig F
0.817

t Stat
P-value Lower 95% Upper 95%
3.108 0.090 -1451.215 9006.318
-0.263

0.817

-97.331

86.106

ECONOMETRIE

CURS 3
- note de curs -

IAI
- 2015-

C 3 - REGRESIALINIAR SIMPL

4. Estimarea indicatorilor de corelaie (coeficient,


raport)
Testarea
5. Testareaindicatorilordecorelaie

6. Testarea modelului liniar


Probleme specifice utiliz rii SPSS

Exemplu de regresie liniar simpl analizat cuajutorul


SPSS-ului

4. Estimarea indicatorilor de
corelaie

4.1. Coeficientul de corela ie


Coeficientul de corelaie se folosete doar pentru modelul liniar :
1.Coeficientuldecorela ie- parametrul ()
N

( X ,Y )

cov( X , Y )

( X ,Y )

x y

( x )( y
i

i 1

sau

N x y
n

i 1

i 1

i 1

N xi yi xi yi

,
[ N xi2 ( xi ) 2 ][ N yi2 ( yi ) 2 ]
n

i 1

i 1

i 1

i 1

-1+1

Interpretarea lui :
- pentru -10 > exist o legtur liniar negativ ntre X i Y;
- pentru 0+1 -> exist o legtur liniar pozitiv ntre X i Y;
- Pentru ||->0 => legtura este foarte slab i pentru||->0=> legtura
este foarte puternic.

2.Estima iacoeficientuluidecorela ie(r)


n

( x x)( y y)
i

i 1

ns x s y

i 1

i 1

i 1

n xi yi xi yi
n

[n x ( xi ) ][n y ( yi ) 2 ]
2
i

i 1

i 1

2
i

i 1

i 1

Interpretarea lui r este aceeai cu interpretarea lui .


Legtura dintre estima iacoeficientuluidecorela ie(r)
i estimaia coeficientuluideregresieliniar (b1) se
realizeaz prin relaia:

r b1

s x2
2
2
s
si
s
unde
reprezint estimaiile varianelor
x
y
2
sy

variabilelor X i Y.

4.2.Raportuldedeterminaie
1.Raportuluidedetermina ie- parametrul (2)
2

(
y

y
)
i

VR , cu 0<2<1
VE

1
2
VT
(yi y) VT
2

VE, VT i VR reprezint PARAMETRII: variaia explicat, variaia


total respectiv variaia rezidual.
Ei se mai noteaz E2 ,T2 i R2.

De obicei 2 este exprimat n valoare procentual, ia valori


de la 0% la 100%, i arat ct la % din variaia variabilei
dependente (Y) este explicat de variaia variabilei
independente (X) prin modelul liniar:
yxi= 0 +1 X
OBS: Pentru modelul liniar simplu se stabilete urmtoarea
relaie ntre 2 i :
2=2 sau ||=
relaie care se extinde i asupra etimaiilor acestora:
R2=r2 sau |r|=R

2.Estima iaraportuluidedetermina ie(R2)


2

R =

(
y
y
)

(yi y)

(b
b
x
y
)
0 1
i

(y
y
)
i

RSS
ESS

1
TSS
TSS

ESS, TSS i RSS reprezint ESTIMA IILE variaei


explicate, variaiei totale respectiv variaei reziduale.
Ele se mai noteaz sE2 ,sT2 isR2.
SS-este prescurtarea de la Sum of Sqare (Suma ptratelor
[abaterilor])->grafic tabl !!!

SS T ( yi - y) 2 ; SS E (y i - y) 2 ; SS R ( yi - y i ) 2 ;
i

df T n - 1;

df E k - 1;

df R n - k

Interpretarea estimaiei lui R2 este aceeai cu cea a


parametrului 2.

Date pentru modelul lui Keynes

Veniturile 2104 Cheltuielile 2014


(Lei/pers)
(Lei/pers)
Macroregiuni si regiuni de dezvoltare
(X)
(Y)
967,21
879,3
Regiunea NORD-VEST
934,06
843,18
Regiunea CENTRU
791,72
757,17
Regiunea NORD-EST
816,48
733,72
Regiunea SUD-EST
1343,36
1142,31
Regiunea BUCURESTI - ILFOV
896,02
821,82
Regiunea SUD-MUNTENIA
860,65
773,3
Regiunea SUD-VEST OLTENIA
976,3
919,68
Regiunea VEST
Sursa: INSE

Veniturile totale medii lunare pe o persoana, pe categorii de gospodarii, pe macroregiuni


si regiuni de dezvoltare (X)
Rezultatele cautarii - ABF Cheltuielile totale medii lunare pe o persoana, pe categorii de
gospodarii, pe macroregiuni si regiuni de dezvoltare (Y)

Reprezentarea grafic modelului Keyns estimat pentru Romania (2014) pe


baza datelor nregistrate la nivel de regiune

Cheltuielile (Y)
1200
y = 0,7445x + 152,83
1100

1000
900
Cheltuielile (Y)

800

Linear (Cheltuielile (Y))

700
600

800

1000

1200

1400

Estimarea itestareamodeluluiKeynsestimatpentruRomania
(2014) pe baza datelor nregistrate la nivel de regiune (EXCEL)

SUMMARY OUTPUT
Regression Statistics
Multiple R
0.987
R Square
0.974
Adjusted R
Square
0.969

Standard Error
Observations

22.893
8.000

ANOVA
df
Regression
Residual
Total

Intercept
Veniturile (X)

12

1
6
7

SS
116255.540
3144.421
119399.962

Coefficients
152.831
0.745

Std. Err.
48.086
0.050

MS
116255.540
524.070

F
221.832

Sig. F
0.000

t Stat
P-value Lower 95% Upper 95%
3.178
0.019
35.168
270.494
14.894
0.000
0.622
0.867

5. Testarea indicatorilor de
corelaie

6.1. Testarea coeficientuldecorelaie


H1: 0
1. Formularea ipotezelor H0: =0
2. Fixareapraguluidesemnificaie =0,05
3. Alegerea statisticii test

t / 2, nk

r n2

tcalc


1 2
1 r 2
n2
r n2
4. Calcularea statisticii test tcalc
1 r 2
5. Criterii de decizie:
|tcalc| tteoretic= t/2, n-2 => se accept H0 cu o probabilitate de 1-.
|tcalc| > tteoretic= t/2, n-2 => se respinge H0 cu un risc asumat .

6. 2.Testarea raportului de corelaie


1. Formularea ipotezelor
H0: =0
2. Fixareapraguluidesemnificaie =0,05
3. Alegerea statisticii test

H1: 0

2 n k
F
1 2 k 1

R2 n k
4. Calcularea statisticii test F
1 R2 k 1
5. Criterii de decizie:
|Fcalc| F, k-1, n-k => se accept H0 cu o probabilitate de 1-.
|Fcalc|> F , k-1, n-k => se respinge H0 cu un risc asumat .

Dac l exprimm pe R2 n funcie de SS vom obine:


2

2
b
b
x
y
(

)
0 1

R =

2
y
y
(

)
i

ESS
RSS

1
TSS
TSS

i nlocuind n expresia lui F obinem o expresie a lui F n


funcie de SS:
i

ESS n k
R2 n k
F=

TSS k 1 1 R 2 k 1

6. Testarea modelului de regresie


- testul F omnibus-

1. Formularea ipotezelor
H0: 0= 0 i 1=0
H1: 0 0 sau/si 10
2. Fixareapraguluidesemnificaie =0,05
3. Alegerea statisticii test

VE n k
F
VR k 1

4. Calcularea statisticii test

Fcalc

ESS
ESS n k k 1

RSS
RSS k 1
nk

(b b x y)
(y b b x )

1 i

1 i

nk
k 1

5. Criterii de decizie:
|Fcalc| F, k-1, n-k => se accept H0 cu o probabilitate de 1-.
|Fcalc|> F , k-1, n-k => se respinge H0 cu un risc asumat .

EXEMPLU

Se consider datele cu privire la Valoarea vnzrilor i


Cheltuielile cu publicitatea pentru un eantion de 4 firme.
Datele sunt prezentate n tabelul alturat.
xi

yi

10
20
50
100

2500
4100
5000
7500

180

19100

REGRESIA LINIAR MULTIPL


C4.
1. Regresia prin origine
2. Prezentarea modelului liniar multiplu
3. Estimarea parametrilor modelului liniar multiplu
4. Testarea parametrilor modelului liniar multiplu

Regresia prin origine


Situaii n care am putea construi un model de regresie prin
origine:
1.n urma testrii parametrilor modelului, parametrul 0 nu
areovaloaresemnificativ statistic, iar parametrul 1
este semnificativ statistic;
2. Exist suportteoreticcares impun estimarea
unui model care trece prin origine lipsa influenei
variabilei independente conduce la o medie zero pentru
variabila dependent (analiza de cost, legtura dintre
greutate i inlime).
2

Regresia prin origine -Aplicatie


Pentru un eantion de 28 de studenti de la FEEA anul II seria 2,
se studiaz legtura dintre greutate si inaltime.

Regresia prin origine


n cazul modelului de regresie Y 1 X aplicarea
metodei celor mai mici ptrate se simplific.
Problema de minim care trebuie rezolvat este de forma:

Regresia prin origine


Estimatorul 1 este nedeplasat
Avem n-1 grade de libertate
Probleme ale utilizrii n practic:
1. Suma erorilor nu mai este zero;
2. R2 poate fi negativ sau poate avea o valoare foarte mare,
prin urmare interpretarea acestuia nu mai are sens.
Ca alternativ se utilizeaz o variant a lui R2, i anume:

1. n practic se recomand evitarea eliminrii


parametrului 0 chiar dac testul Student semnaleaz faptul
c acesta nu este reprezentativ.
2. Exist un model de regresie liniar prin origine pentru
care probleme modelului liniar prin origine dispar: Acesta
este modelulderegresieliniar cuvariabile
standardizate.
n acest caz, panta dreptei de regresie are aceeai
valoare cu coeficientul de corelaie Pearson.

Modelul liniar multiplu


Forma general a modelului liniar multiplu este dat prin
relaia:

Y M Y / X1 ,... X i ,...., X p 0 1 X1 2 X 2 ... p X p

unde:
Y - variabila dependent;
X1, X2,,Xi,,Xp - variabile independente (predictori);
- variabil reziduu de modelare (variabila aleatoare);
i - parametrii modelului de regresie
k - numrul de parametri din model, k=p+1.

Exemplu: Pentru un eantion de 50 de mrci de cereale,


se poate studia legtura dintre ratingul acordat de
consumatori unei mrci de cereale i factorii de influen (nr.
de calorii, de grame de grsimi, de zahr, de fibre, etc.)
10

Cei k parametri ai modelului liniar multiplu au urmtoarea


semnificaie:
0 valoarea medie a variabilei dependente Y, n
condiiile n care influena variabilelor independente ar fi nul;

Y
i
, i 1, p
X i

- variaiaabsolut avariabilei

dependente la o variaie absolut cu o unitate a variabilei


independente Xi, n condiiile n care influena celorlalte
variabile independente este meninut constant. Arat
influenaparial a fiecrei variabile independente asupra
variabilei dependente.
11

Ipotezele modelului clasic de regresie (IIN):


- variabilele independente sunt nestochastice
2
- normalitatea erorilor : i ~ N (0, )

- homoscedasticitate: V ( i ) M ( i2 ) 2
- necorelarea erorilor: cov( i , j ) 0
- lipsacorelaieidintrevariabileleindependentei
variabila eroare
- lipsacoliniarit iisau a unei legturi liniare ntre
variabilele independentea
12

Estimarea parametrilor modelului


multiplu liniar

13

Se consider modelul de regresieliniar multipl cu


dou variabileindependente:

yi 0 1 x1i 2 x2i i

La nivelul unui eantion, modelul devine:

yi 0 1 x1i 2 x2i i sau yi y i i

Rezult

i yi yi yi 0 1 x1i 2 x2i

Estimarea parametrilor modelului prin metoda celor mai


mici ptrate presupune respectarea condiiei:
n

2
i min im, adic

i 1

x x ) 2 min im

(
y

i 0 1 1i 2 2i
i

14

Estimarea punctuala
Pentru satisfacerea condiiei MCMMP trebuie ca derivatele
pariale de ordin I n raport cu coeficienii modelului s se
anuleze. Astfel se va obine un sistem de 2+1=3 ecuaii cu 3
necunoscute.
n
n
n

n0 1 x1i 2 x2i yi
i 1

i 1

i 1

n
n
n
n
2

x1i 1 x1i 2 x1i x2i yi x1i


0
i 1

i 1

i 1

i 1

n
n
n
n
2

x2i 1 x1i x2i 2 x2i yi x2i


0
i 1

i 1

i 1

i 1

15

La nivelul unui eantion de date, sistemul de ecuaii devine:


n

i 1

i 1

i 1

nb0 b1 x1i b2 x2i yi


n

i 1

i 1

i 1

i 1

i 1

i 1

i 1

b0 x1i b1 x b2 x1i x2i yi x1i


2
1i

b0 x2i b1 x1i x2i b2 x yi x2i


2
2i

i 1

Prin rezolvarea sistemului, se obin relaiile pentru estimaiile


parametrilor modelului de regresie.
Exemplu: Rating = 61.1 - 3.07 Grsimi - 2.21 Zahr
16

Estimarea parametrilor prin interval de


ncredere
Intervalele de ncredere sunt de forma:

i [i t /2,n k ]
i

La nivelul unui eantion de date se obine un interval de


forma:

i bi t / 2,nk s , bi t / 2,nk s
i

17

Testarea individual parametrilor


modelului liniar multiplu

18

Testarea parametrilor modelului multiplu liniar se face la fel


ca n cazul modelului simplu liniar:

1. Formularea ipotezelor i=0,p:


H0: i 0
H1: i 0
2.Alegereapraguluidesemnificaie
De regul, se asum un risc = 0,05.
3. Alegerea statisticii test

i
t

i
19

4.Valoareateoretic astatisticiitest
Pentru pragul de semnificaie ales i v=n-k grade de libertate,
se citete valoarea teoretic din tabela Student: t/2; n-k
5.Valoareacalculat astatisticiitest
La nivelul eantionului se determin valoarea calculat a
bi
testului:

t calc

6. Regula de decizie
Dac t calc t / 2 - se respinge H0
Dac

t calc t / 2 - se accept H0, pentru risc asumat de 5%.

20

n SPSS, decizia se ia pe baza semnificaiei testului


(Sig.):
- dac Sig t , se respinge H0
-dac Sig t , se accept H0, pentru un nivel de
ncredere de 95%.

7. Compararea celor dou valori ale statisticii test i


luarea deciziei
8. Interpretarea rezultatului testrii
21

Testarea modelului de regresie/


testarea simultan a parametrilor
modelului de regresie multipla

22

Testarea modelului de regresie se realizeaz cu ajutorul


testului F, dup urmtorul demers:
1. Formularea ipotezelor
H0: 0=1==p=0 (modelul nu este semnificativ)
H1: nu toi coeficienii sunt simultan zero
2.Alegereapraguluidesemnificaie
3. Alegerea statisticii test

VE n k
2 n k
F

~F(k-1, n-k)
2

VR k 1 1 k 1
4. Valoareateoretic astatisticiitest: F , k-1, n-k

ESS n k
R2 n k
5. Valoareacalculat atestului: F

2
RSS k 1 1 R k 1
23

6. Regula de decizie
Dac Fcalc Fk 1,nk se respinge H0
Dac Fcalc Fk 1,nk se accept H0, pentru risc asumat de 5%.
n SPSS, decizia se ia pe baza semnificaiei testului (Sig.):
-dac Sig F , se respinge H0
--dac Sig F , se accept H0, pentru un nivel de ncredere
de 95%.
7.Comparareacelordou valorialestatisticiitestiluarea
deciziei
8.Interpretarearezultatuluitest rii

24

EXEMPLU

Pentru un eantion de mrci de cereale, se


studiaz legtura dintre ratingul acordat de
consumatori unei mrci de cereale i nr. de grame
de grsimi, de zahr i de fibre.

25

Model Summary
Model
1

R
R Square
a
,789
,622

Adjusted
R Square
,612

Std. Error of
the Estimate
8,75456

a. Predictors: (Constant), sugars, f at


ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
9325,268
5671,533
14996,800

df

Mean Square
4662,634
76,642

2
74
76

F
60,836

Sig.
,000a

a. Predictors: (Constant), sugars, f at


b. Dependent Variable: rating
Coeffici entsa

Model
1

(Constant)
f at
sugars

Unstandardized
Coef f icients
B
Std. Error
61,089
1,953
-3,066
1,036
-2,213
,235

Standardized
Coef f icients
Beta
-,220
-,700

t
31,284
-2,958
-9,428

Sig.
,000
,004
,000

a. Dependent Variable: rating


26

Model Summary
Model
1

R
,930a

R Square
,865

Adjusted
R Square
,859

Std. Error of
the Est imat e
5,35086

a. Predictors: (Constant), f at , f iber, sugars

ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
12503,728
1946,958
14450,686

df
3
68
71

Mean Square
4167,909
28,632

F
145,570

Sig.
,000a

a. Predictors: (Constant), f at , f iber, sugars


b. Dependent Variable: rating
Coeffici entsa

Model
1

(Constant)
f iber
sugars
f at

Unstandardized
Coef f icients
B
Std. Error
53,673
1,389
2,938
,261
-1,992
,150
-3,347
,656

a. Dependent Variable: rating

Standardized
Coef f icients
Beta
,507
-,622
-,238

t
38,637
11,265
-13,238
-5,103

Sig.
,000
,000
,000
,000
27

REGRESIA LINIAR MULTIPL


TEMATICA C5
3. Testarea parametrilor modelului liniar multiplu
4. Testarea modelului

5. Testarea influenei marginale a unei variabile


6. Raportul de determinaie ajustat
7. Utilitatea modelului de regresie cu variabile standardizate

Exemple

Testarea parametrilor MLM

Testarea parametrilor modelului multiplu liniar se face la


fel ca n cazul modelului simplu liniar:
1. Formularea ipotezelor:
H0: i=0, i 0, p
H1: i0, i 0, p
2.Alegereapraguluidesemnificaie
De regul, se asum un risc = 0,05.

3. Alegerea statisticii test: t i


4.Valoareateoretic astatisticiitest

Pentru pragul de semnificaie ales i v=n-k grade de


libertate, se citete valoarea teoretic din tabela Student:
t/2;n-k

5.Valoareacalculat astatisticiitest
La nivelul eantionului se determin valoarea calculat a
testului:
bi
t calc
s
i

6. Regula de decizie
Dac t calc t / 2 se respinge H0, cu risc asumat de 5%.
Dac t calc t / 2 se accept H0, cu un nivel de ncredere de
95%.
n SPSS, decizia se ia pe baza semnificaiei testului (Sig.):
Dac sig , se respinge H0 cu risc asumat de 5%
Dac sig , se accept H0, cu un nivel de ncredere de
95%.

Testarea modelului MLM

1. Formularea ipotezelor
H0: 0= = i== p=0

H1: Exist un i pentru care i 0, i 0, p

2.Fixareapraguluidesemnificaie =0,05
VE n k
3. Alegerea statisticii test F
VR k 1

4. Calcularea statisticii test


Fcalc

2
(
b

b
x

...

b
x

y
)
0 1 1i
p pi

ESS n k
nk
i
RSS k 1 ( yi b0 b1 x1i ... bp x pi ) 2 k 1
i

5. Criterii de decizie:
Dac Fcalc F, k-1, n-k => se accept H0 cu o probabilitate de 1-.
Dac Fcalc> F , k-1, n-k => se respinge H0 cu un risc asumat .

Testareainflueneimarginaleaunei
variabile independente asupra variabilei
dependente
(Metoda intrarilor)

1. Formularea ipotezelor
H0: variabila independent nou introdus n model nu are o
influen semnificativ asupra variaiei variabilei dependente
H1: variabila independent nou introdus n model are o
influen semnificativ asupra variaiei variabilei dependente
2.Fixareapraguluidesemnificaie =0,05
3. Alegerea statisticii test

V E new V E old n k new


2 new 2 old n k new
F

2
1 new k new k old
k new k old
V R new

4. Calcularea statisticii test

ESS new ESS old n k new


R 2 new R 2 old n k new

2
RSS new
k new k old
1 R new
k new k old

5. Criterii de decizie:
Dac Fcalc F, k new-k old, n-k new => se accept H0 cu o
probabilitate de 1-.
Dac Fcalc> F , k new-k old, n-k new => se respinge H0 cu un risc
asumat .

Estimatorul ajustat a raportului de


determinatie

Adjusted R square

RSS
2
RSS n 1
2 n 1
n

k
R 1
1
1 (1 R )
TSS
TSS n k
nk
n 1
Se observ c

R R
2

pentru k>1.

Utilitatea modelului de regresie cu variabile


standardizate

Modelul liniar multiplu cu variabile standardizate permite


compararea coeficienilor de regresie din model; fiecare
coeficient artnd impactul partial al variaiei cu o unitate a
variabilei independente standardizate asupra variabilei
dependente standardizate.
Aceasta este o modalitate de ierarhizare a variabilelor
dependente n funcie de importana lor n model.

EXEMPLUL 1:

Var. dependenta:
Salariul
Var. independente (predictori):
Nr. de ani de pregatire, Vechimea in munca

Model Summary
Change St atistic s
Model
1

R
R Square
,910a
,829

Adjust ed
R Square
,807

Std. Error of
the Estimate
285,65322

R Square
Change
,829

F Change
38, 718

df 1

df 2
2

a. Predic tors : (Const ant), N r. ani pregat ire, Vechime in munca (ani)

ANOVAb
Model
1

Regress ion
Res idual
Total

Sum of
Squares
6318646
1305564
7624211

df
2
16
18

Mean Square
3159323,188
81597,759

F
38,718

Sig.
,000a

a. Predic tors : (Constant), Nr. ani pregatire, Vechime in munca (ani)


b. Dependent Variable: Salariul (RON)Coeffici entsa

Model
1

(Constant)
Vechime in munca (ani)
Nr. ani pregatire

Uns tandardized
Coef f icients
B
Std. Error
-545,101
224,894
84, 315
25, 550
85, 298
20, 394

a. Dependent Variable: Salariul (RON)

Standardized
Coef f icients
Beta
,443
,562

t
-2,424
3, 300
4, 182

Sig.
,028
,005
,001

16

Sig. F C hange
,000

EXEMPLUL 2:

Var. dependenta:
Greutate(kg)
Var. independente:
Inaltime (cm), Consum zilnic paine(g)

TEMATICA C6
7. Estimarea indicatorilor de corelaie
8. Testarea indicatorilor de corelaie
9. Modelele cu restrictii
10. Exemple

Pentru un model de regresie liniar multipl, pot fi determinati


urmtorii coeficieni de corelaie:
- coeficieni de corelaie simpl ntre variabila dependent i
fiecare variabil independent (coeficieni bivariai);
- coeficieni de corelaie parial;
- coeficientul de corelaie multipl i coeficientul de
determinaie multipl.

7. Estimarea indicatorilor de corelatie

Coeficienidecorelaiebivariat
Pentru un model liniar de forma:
yi 0 1 x1i 2 x2i i
exist trei coeficieni de corelaie bivariat:
ry1

n x1i yi x1i yi
i

[n x12i ( x1i ) 2 ][n yi2 ( yi ) 2 ]


i

ry 2

n x2i yi x2i yi
i

[n x22i ( x2i ) 2 ][n yi2 ( yi ) 2 ]


i

r12

n x1i x2i x1i x2i


i

[n x12i ( x1i ) 2 ][n x22i ( x2i ) 2 ]


i

Coeficienidecorelaieparial
i trei coeficieni de corelaie parial calculai cu ajutorul
coeficienilor de corelaie bivariat:
ry 2 ry1r12
ry1 ry 2 r12
ry 2.1
ry1.2
2
2
2
2
(
1

r
)(
1

r
y1
12 )
(1 ry 2 )(1 r12 )
r12 ry1ry 2
r12. y
(1 ry21 )(1 ry22 )
Corelaia parial msoar dependena dintre variabile prin
excluderea succesiv a influenei celorlali factori,
considernd influena lor constant si meninnd numai
influena factorului msurat.
n funcie de numrul variabilelor a cror influen se elimin
din calcul, coeficienii de corelaie parial pot fi de ordinul
nti (pentru o variabil eliminat), de ordinul doi (pentru dou
variabile) etc.

Raportuldedeterminaiemultipl
multipl

iraportuldecorelaie

Parametri

2
(

)
y
y
xi

VE
VR
2

=>
2
VT
( yi y) VT
2

Estimatori

VE
VR
2
i


1
1
2 =>
y

y
(
)
VT
VT
i
2

Estimaiile
ei2

ESS
RSS
2
i
2
=>
1
1
R
R

R
2
TSS
TSS
y

y
(
)
i
i

Coeficientuldecorelaiemultipl
Coeficientul de corelaie multipl se calculeaz numai
pentru modelele multiple liniare i se exprim cu ajutorul
coeficienilor de corelaie simpl dintre variabilele perechi.
Astfel, n cazul corelaiei dintre o variabil rezultativ Y i
dou variabile independente X 1 , X 2 ,la nivelul unui
eantion, coeficientul de corelaie multipl, notat cu r, se
calculeaz dup relaia:
r

ry21 ry22 2ry1ry 2 r12


1 r122

r ry21 (1 ry21 )ry 2.1 r ry22 (1 ry22 )ry1.2

8.Testareaindicatorilordecorelaie

Raportul de determinaie si raportul de corelatie se


testeaz cu testul F dup algoritmul prezentat la modelul liniar
simplu, innd cont de faptul c k=p+1 reprezint numrul
parametrilor din noul model (Fth= F, k-1, n-k)

Coeficienii de corelaie se testeaz cu ajutorul testului t .


dup algoritmul prezentat la modelul liniar simplu, innd cont
de faptul c k=p+1 reprezint numrul parametrilor din noul
model (tth= t/2, n-k)

9. Modelele cu restrictii

Fie MLM descris prin relaia:

Y 0 1 X1 2 X 2 ... p X p
pp. c pentru acest model se impune o restricie de tipul 2=1
acest model va fi descris de relaia:

0 1 X 1 X 2 ... p X p

Y X 2 0 1 X 1 ...

pX p

0 1 X 1 ...

pX p

Y*

Ultima form a modelului cu restricii deriv din forma


original cu singura diferen c vom avea un numr mai mic
de parametri de estimat.

Exist restricii simple de tipul 2=1 sau restricii compuse de tipul


1+ 2 =1, acestea fiind alctuite din mai multi parametri.
Tetarea unui model cu restricii presupune estimarea n paralel a
modelului original i a modelului cu restricii urmat de parcurgerea
urmtoarelor estape:
1. Formularea ipotezelor:
H0: pp. indeplinirearestriciilorimpusedemodel(1+ 2 =1 sau 2=1)
H1: pp. respingerea restriciilorimpusedemodel(1+ 2 #1 sau 2#1 )
2. Fixarea pragului de semnificaie

RVR UVR n k
~ F (m, n k )
F

m
UVR

Alegerea testului:
unde RVR si UVR - estimatorulvarianeirezidualepentrumodelul
restricionatrespectivpentrumodelulnerestricionat
n, k i m reprezint volumul eantionului, numrul de parametri din
modelul original irespectivnumrul de restricii simple/ compuse
3.

valorii teoretice a statisticii test: Fth =F, m, n-k


5. Valoareacalculat atestului:
RRSS URSS n k
Fcalc

URSS
m
6. Regula de decizie:
Fcalc >Fth=> RH0 cu un risc asumat de
Fth >Ftalc => AH0 cu o probabilitate de (1- )
4. Identificarea

EXEMPLUL 1:

Var. dependenta:
Salariul
Var. independente (predictori):
Nr. de ani de pregatire, Vechimea in munca

Model Summary
Model
1

R
R Square
,910a
,829

Adjust ed
R Square
,807

Std. Error of
the Estimate
285,65322

a. Predic tors : (Const ant), N r. ani pregat ire, Vechime in


munca (ani)
ANOVAb
Model
1

Regress ion
Res idual
Tot al

Sum of
Squares
6318646
1305564
7624211

df
2
16
18

Mean Square
3159323,188
81597,759

F
38, 718

Sig.
,000a

a. Predic tors : (Const ant ), Nr. ani pregat ire, Vechime in munca (ani)
b. Dependent Variable: Salariul (RON)

Coefficientsa

Model
1

(Constant)
Vechime in munca (ani)
Nr. ani pregatire

Unstandardized
Coeff icients
B
Std. Error
-545,101
224,894
84,315
25,550
85,298
20,394

a. Dependent Variable: Salariul (R ON)

Standardized
Coeff icients
Beta
,443
,562

t
-2,424
3,300
4,182

Sig.
,028
,005
,001

Correlations
Zero-order
Partial
,801
,844

,636
,723

Part
,341
,433

Corelatiibivariateipartiale

Exemplul 2

Var. dependenta:
Valoarea vnzrilor unei firme
Var. independente:
Cheltuielile de publicitate, Cheltuielile
ocazionate de diferite promoii i Vnzrile
anuale realizate de principalul concurent

n studiul legturii dintre valoarea vnzrilor unei firme (Y) i


cheltuielile de publicitate (X1), cheltuielile ocazionate de diferite
promoii (X2) i vnzrile anuale realizate de principalul
concurent (X3), s-au obinut urmtoarele rezultate:
Model Summaryb
Model
1

R
R Square
a
,913
,833

Adjusted
R Square
,787

a. Predictors: (Constant), X3, X1, X2


b. Dependent Variable: Y

Std. Error of
the Est imat e
17,60029

DurbinWat son
1,879

ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
16997,537
3407,473
20405,009

df
3
11
14

Mean Square
5665,846
309,770

F
18,290

Sig.
,000a

a. Predictors: (Constant), X3, X1, X2


b. Dependent Variable: Y

Coeffici entsa

Model
1

(Constant)
X1
X2
X3

Unstandardized
Coef f icients
B
Std. Error
65,705
27,731
48,979
10,658
59,654
23,625
-1,838
,814

a. Dependent Variable: Y

Standardized
Coef f icients
Beta
,581
,359
-,324

t
2,369
4,596
2,525
-2,258

Sig.
,037
,001
,028
,045

EXEMPLUL 3:

Var. dependenta:
Greutate(kg)
Var. independente:
Inaltime (cm), Consum zilnic paine(g)

Econometrie curs 7
-2015-

Tipuri de modele neliniare


Modelele neliniare studiate se pot mpri n dou categorii:
1. Modele liniarizabile. n cazul modelelor neliniare dar liniarizabile, n
urma unor transformri prin logaritmare sau n urma unor substituii
de variabile (ex. Z=1/X), se va ajunge la o expresie liniar a
modelului iniial. Pentru estimarea parametrilor modelului se vor
utiliza relaiile prezentate n sistemul de mai sus n care locul
valorilor variabilelor X i Y va fi luat de variabilele obinute n urma
transformrii/ substituiei de variabile.
2. Modele polinomiale. Sunt modelele economice pentru care media lui
Y condiionat de X=xi este exprimat printr-un model polinomial de
grad 2, 3, ... .
2

Modelul log-liniar simplu (I) -> Modelul putere


- este un model de regresie neliniar
- variabilele modelului sunt logaritmate
- modelul poate fi liniarizat prin logaritmare
Estimarea parametrilor modelului
Considerm modelul simplu de forma:
1

Y 0 X e

sau

1 i

y i 0 xi e

Prin logaritmare, se obine modelul (!!! 0>0; Y si X>0):

ln yi ln 0 1 ln xi i

Modelul log-linear simplu (II) -> Modelul putere


Modelul log-liniar poate fi transformat ntr-un model liniar fcnd urmtoarele
notaii:
*
yi ln yi
0* ln 0
1* 1

yi* 0* 1* xi* i*

xi* ln xi

i* i

Interpretarea parametrilor modelului


- parametrul
: valoarea medie a variabilei dependente Y, cnd variabila

independent X ia 0valoarea 1;
*
dY
d ln Y
*

1
- parametrul 1 al modelului (*): 1
, exprim variaia medie
dX * d ln X
relativ (%) a variabilei dependente Y la o variaie relativ (%) de 1% a variabilei
independente X.
4

Modelul log-linear simplu (III)-> Modelul putere


Estimatorii parametrilor au urmtoarele relaii:

b1

n ln xi ln yi ln xi ln yi
n (ln xi ) 2 ( ln xi ) 2

1
1
lnb 0 ln xi b1 ln yi
n
n

Modelul log-linear simplu (III) -> Modelul putere


Elasticitatea
Elasticitatea unei variabile Y n raport cu o alt variabil X reprezint
modificarea relativ (%) a variabile Y la o modificare relativ (%) dat a lui X
de obicei subunitar cf. relaiei:

Y
100
% mod if . Y
Y X
Y
E

% mod if . X X 100 X Y
X

Parametrul 1 pentru modelul putere reprezint elasticitatea variabilei


dependente Y n raport cu variabila independent X.
6

Model POWER:

GDP [per Capita] var. dep


Employment Rate var. indep

Model POWER:

GDP [per Capita] var. dep


Employment Rate var. indep

Modelul log-liniar multiplu (I) -> Funcia de producie


Funcia de producie Cobb-Douglas
Este un model de regresie neliniar multiplu de tip log-liniar, de forma:
1

yi 0 x1i x2i ... xik e

Modelul de producie cu doi factori, munca (L) i capitalul (K), are forma:

yi 0 Li 1 K i 2 e i
9

Modelul log-liniar multiplu (II) -> Funcia de producie


Interpretarea parametrilor
Parametrii modelului i , i=1,k, poart denumirea de elasticiti pariale ale
variabilei dependente n raport cu fiecare factor sau variabil independent, Xi.

0 - este nivelul mediu al produciei pentru K=1 i L=1;


1 - este elasticitatea parial a produciei n raport cu munca;

2 - este elasticitatea parial a produciei n raport cu capitalul;


1+2 - este elasticitatea total a produciei n raport cu cei doi factori. Se
numete randament de scar.
10

Modelul log-liniar multiplu (III) -> Funcia de producie


Interpretarea elasticitii totale

1+2 =1 - variaie constant a produciei n raport cu factorii de producie;


1+2 <1 - variaie cu o vitez mai redus a produciei n raport cu variaia
factorilor;
1+2 >1: variaie mai accelerat a produciei n raport cu variaia factorilor.
Exemplu: n studiul legturii dintre producia agricol (lei), numrul mediu
de salariai n agricultur (persoane) i suprafaa agricol (ha), se obine
urmtoarea ecuaie estimat:

ln yi 6 ,758 0 ,143 ln x1i 0 ,471ln x2i

11

Model putere multiplu:


Ln_gdp (Y) variabila dependenta
Ln_empl_rate (X1), Ln_dir_invest (X2) varriabile independente
Date inregistrate pentru 2 tari nordice in intervalul 2004-2012 (atentie la constanta)

OBS: 1. Datele sunt prezentate


pentru a putea fi testat i influena
marginal a variabilelor n model.
2. Pentru modelul putere
multiplu estimatia furnizat n
tabelul
Coefficients
n
dreptul
termenului liber (Constant) este de
fapt (ln b0) astfel nct estimaia lui
0 va fi e-73.125 pentru modelul (2).
Aceeai observaie poate fi fut i
pentru modelul (1).
12

13

Modele polinomiale -> Modelul parabolic


a. Modelul parabolic: cel mai simplu model polinomial este modelul parabolic
(Quadratic).

Y 0 1 X 2 X 2
La nivelul eantionului:

YX b0 b1 X b2 X

n economie, modelul polinomial este folosit pentru descrierea relaiei dintre costul
unitar i producia realizat: costul unitar scade concomitent cu creterea produciei
pn la un nivel optim al produciei, dup care, dac producia continu s creasc,
ncepe s creasc i costul unitar.

Cost unitar

Observed

50.00

Quadratic

40.00

Ecuaia estimat este:


yi=89,041-25,795xi+2,114xi2

30.00

Coefficients
20.00

Productia
Productia ** 2
(Constant)

10.00
2.00

3.00

4.00

5.00

6.00

Productia

7.00

8.00

9.00

Unstandardized
Coeff icients
B
Std. Error
-25.795
3.895
2.114
.351
89.041
9.231

Standardized
Coeff icients
Beta
-5.322
4.842

t
-6.623
6.026
9.646

Sig.
.000
.001
.000

Interpretare:
1<0, 2>0, deci legtura de tip parabolic admite un punct de minim.
Coordonatele punctului de minim arat nivelul optim al produciei pentru
care costul unitar este minim. Abscisa acestui punct este:
-b1/2b2=25,79/4,22=6,11. Pentru o producie de 611 buci din produsul A,
costul este minim.

Modele polinomiale
Modelul cubic
b. Modelul cubic

Y 0 1 X 2 X 3 X
2

n economie acest model este folosit pentru descrierea relaiei dintre costul
total i valoarea produciei.
Pentru acest tip de legtur se poate determina punctul de inflexiune al
curbei, prin anularea derivatei de ordinul 2 in X. Se obine valoarea lui X de unde
Y i modific modul de variaie.

Grad de urbanizare (%)


100

80

60

40

20

0
0

5000

10000

15000

20000

25000

PIB / loc

Coeffici ents

PIB/loc
PIB/loc ** 2
PIB/loc** 3
(Constant)

Unstandardized
Coef f icients
B
Std. Error
.010
.002
-6.1E-007
.000
1.21E-011
.000
32.036
3.395

Standardized
Coef f icients
Beta
2.557
-3.206
1.255

t
4.950
-2.652
.
9.438

Sig.
.000
.009
.
.000

Ecuaia estimat este:

Y 32,036 0,010 X 6,1107 X 2 1,211011 X 3


Punctul de inflexiune este dat de:
-b2/ 3b3 = 6,1/ 0,000121= 25105

ECONOMETRIE
C8

2015

Tematica CURS 8 - REGRESIA NELINIAR (2)


1. Modele semi-logaritmice
1. Modele cu variabila dependent logaritmat
- Modelele Compound, Growth i Exponential

2.Modele cu variabila independent logaritmat


-Modelul Logarithmic

Modele semi-logaritmice: Generaliti


n acest tip de modele variabila independent sau
variabila dependent apar, n forma liniarizat a
modelului, ca variabile logaritmate.

Estimeaz variaia relativ sau absolut a variabilei


dependente la o variaie absolut sau relativ cu o unitate a
variabilei independente.
Modelele cu variabila dependent logaritmat pe care le
vom studia sunt: modelul Compound (Compus), Growth
(Model de cretere) i Exponential
Modelul cu variabila independent logaritmat pe care
l vom studia este modelul Logarithmic.

Modele semi-logaritmice:
Modelul Compound (Modelul Compus)
1. Forma general a modelului:

Y 0 1 e
X

Ecuaia se liniarizeaz prin logaritmare:

ln Y ln 0 X ln 1

Parametrii modelului:
- 0 este nivelul mediu a lui Y atunci cnd X=0. Variabila Y
are numai valori pozitive, deci 0 satisface condiia 0 >0.
- ln1 arat variaia medie procentual a lui Y la o variaie
absolut a lui X cu o unitate. Reprezint rata de cretere sau
reducere a variabilei Y n raport cu o variaie absolut a lui X
cu o unitate.

ln Y
ln 1
X

Observaii:
- Dac ln1>0, adic 1>1, atunci legtura dintre cele dou
variabile este direct.
- Dac ln1<0, adic 0<1<1, atunci legtura dintre cele
dou variabile este invers.

2. Estimarea parametrilor modelului


Se face prin MCMMP:
2
e
i min im

Sistemul de ecuaii normale:


n ln b0 + ln b1 xi = ln yi , i 1, n

ln b0 xi + ln b1 xi2 = xiln yi

ln b1

ln b0

n xi ln yi xi ln yi
n

xi2

xi

2
ln
y
x
i i xi xi ln yi

xi2

xi

3. Testarea semnificaiei parametrilor


Ipoteze
Interpretare
4. Intensitatea legturii dintre variabile
- raportul de determinaie (R square)

5. Exemplu

n urma analizei legturii dintre valoarea investiiilor (mii


euro) i valoarea produciei (mil. euro) nregistrate pe un
eantion de 5 firme, s-au obinut urmtoarele rezultate:

Coeffi ci ents

xi
(Constant)

Unstandardized
Coef f icients
B
St d. Error
1.769
.103
1.322
.256

St andardized
Coef f icients
Beta
2.677

t
17.118
5.161

Sig.
.000
.014

The dependent v ariable is ln(y i).

1. Ecuaia estimat a legturii dintre cele dou variabile este:

y xi 1,322 1,769 xi
Logaritmnd ecuaia de mai sus, se obine:
ln yi=ln 1,322+xi ln 1,769 = 0,279+0,570 xi

Interpretare:
- valoarea parametrului 1 arat c, la o cretere cu o mie
de euro a valorii investiiilor, valoarea produciei crete, n
medie, cu ln(1,769) = 0,57 adic cu 57%.
2. Testarea semnificaiei parametrilor
3. Estimarea i testarea intensitii legturii dintre
variabile

Model Summary
R
.985

R Square
.969

Adjusted
R Square
.959

St d. Error of
the Estimate
.185

The independent v ariable is xi.

ANOVA

Regression
Residual
Total

Sum of
Squares
3.253
.102
3.356

The independent v ariable is xi.

df
1
3
4

Mean Square
3.253
.034

F
95.333

Sig.
.002

Modele semi-logaritmice:
Modelul Growth (Model de Cretere)
1.

Forma general a modelului:

Y e

0 1 X

Ecuaia se liniarizeaz prin logaritmare:

ln Y 0 1 X

Parametrii modelului:
- e 0 este valoarea medie a lui Y pentru X=0.

- 1 arat variaia medie procentual a lui Y la o


variaie absolut a lui X cu o unitate.

ln Y
1
X

Exemplu
Se consider legtura dintre Timpul de accelerare de la 0 la 60
mile/ora(exprim. Secunde) i Puterea motorului (CP).

Coefficients

Horsepower
(Constant)

Unstandardized
Coef f icients
B
Std. Error
-.004
.000
3.092
.019

Standardized
Coef f icients
Beta
-.726

t
-21.032
164.791

Sig.
.000
.000

The dependent v ariable is ln(Time to Accelerate f rom 0 to 60 mph (sec)).

Ecuaia estimat a legturii dintre cele dou variabile este:

Y e

3, 0920, 004 X

Logaritmnd ecuaia de mai sus, se obine:


Ln Y=3,092 - 0.004 X

Interpretare:
cnd Puterea motorului este de 0 C.P., Timpul de accelerare
este de e3,092=22 secunde.
La o cretere a puterii motorului cu 1 C.P., timpul de
accelerare scade, n medie, cu o rat de 0,004 sau cu 0,4%.

Modele semi-logaritmice:
Modelul Exponential
1. Forma general a modelului:

Y 0 e

1 X

Ecuaia se liniarizeaz prin logaritmare:

ln Y ln 0 1 X

Parametrii modelului:
- 0 este valoarea medie a lui Y pentru X=0.
- 1 arat variaia medie procentual a lui Y la o variaie
absolut a lui X cu o unitate.

ln Y
1
X

Exemplu
Se consider legtura dintre Puterea motorului (CP) i
Numrul de cilindri (cilindri).

Coefficients

Number of Cy linders
(Constant)

Uns tandardized
Coef f icient s
B
Std. Error
.170
.005
38. 911
1. 221

Standardized
Coef f icient s
Beta
.842

t
31. 057
31. 877

Sig.
.000
.000

The dependent v ariable is ln(Horsepower).

Ecuaia estimat a legturii dintre cele dou variabile este:

Y 38,911 e0,170X
Logaritmnd ecuaia de mai sus, se obine:

lnY = ln 38,911+ 0,17X

Interpretare:
cnd Numrul de cilindri este de 0, Puterea medie a
motorului este de 38,911 C.P.
La o cretere a numrului de cilindri cu 1 cilindru, puterea
motorului crete, n medie, cu 17%.

Modele semi-logaritmice
Modelul Logarithmic
Forma general a modelului:

Y 0 1 ln X
- 0 este valoarea medie a lui Y pentru X=1.
- 1 /100 arat variaia medie absolut a lui Y la o variaie
procentual a lui X cu 1%.

Y
1
(ln X )

Exemplu
Se consider legtura dintre Puterea motorului i Numrul
de cilindri.

Coeffici ents

ln(Number of Cy linders)
(Constant)

Unstandardized
Coef f icients
B
Std. Error
104.458
3.632
-68.048
6.112

Standardized
Coef f icients
Beta
.822

t
28.761
-11.134

Sig.
.000
.000

Ecuaia estimat a legturii dintre cele dou variabile este:

Y 68 ,048 104 ,458 ln X

Interpretare:
cnd Numrul de cilindri este de 1, Puterea medie a
motorului este de -68,048 C.P.
La o cretere a numrului de cilindri cu 1 %, puterea
motorului crete, n medie, cu 1,04458 C.P. (104,458/100)

S-ar putea să vă placă și