Documente Academic
Documente Profesional
Documente Cultură
Facultatea de CSIE,
Specializarea Informatică Economică
Curs 2,3 – 12,19 octombrie 2009
Funcţia Efect
Cauze
Variabile f Variabila
independente dependentă
Y= f(x1,x2,...,xn)+
Exemplu – model de regresie
Etapa 1: Identificarea şi specificarea modelului
Legea psihologică fundamentală sau înclinatia spre consum a lui Keynes:
“psihologia colectivităţii este de aşa natură, încât atunci când se măreşte
venitul real global, consumul global creşte, dar nu cu aceeaşi mărime ca
venitul”
C
înclinaţia marginală spre consum este inclusă 0
în 1
V
intervalul (0,1):
Etapa 2: Obţinerea
datelor şi estimarea 500000
modelului 400000
(1990-2006)
Simple 200000
Agregate 100000
Estimarea parametrilor
0
modelului econometric 0 100000 200000 300000 400000 500000 600000
Analiza de regresie
-100000
PIB (milioane lei preţuri curente)
Testarea ipotezelor (1990-2006)
Etape în procesul de modelare
econometrică tradiţional - Exemplu
Etapa 3: Interpretări şi previziune
Dacă se aşteaptă ca PIB pe locuitor în anul 2007 să fie de 400000
mil lei preţuri curente consumul previzionat al populaţiei va fi de:
y=-6915,7+0,8222*400000=321964,3
Yi X i i
i = Eroarea
E(Y/Xi) X i
Valoarea Xi X
observată
Modelul liniar de regresie unifactorială
2
Homoscedasticitatea: σ (i)= constantă i
2
min
i
ˆi2 min
i
(Yi ˆ ˆX i ) 2
i
ˆi2 i
(Yi ˆ ˆX i ) 2
(
ˆi2 ) ˆi
i
ˆ
0 2(
y nˆ ( x )ˆ )
i i y
i nˆ ( x )ˆ
i
i i
i i
( ˆi2 ) 2(
xi yi ( xi )ˆ (
ˆ
xi2 ) ˆ ) i x y
i i ( x )ˆ ( x
i
2 ˆ
i )
i
0 i i i
ˆ i i i
Estimarea parametrilor modelului de
regresie clasic
Condiţiile de ordin 1:
y x
i
i
i
i
ˆ y b x
ˆ
x y x i i
2
i y x x x i
2
i i i yi
y
i i
i i i i
n
n xi
2
i
n xi2 xi
i
x y x y nx y
i
x i
i x i
2
i
i i
ˆ
xi i i i i
i i
i
y
n i
x x nx
n i
2
i
2
i
x x y x y x y
i i
x
n
i i i i i i i xi 2
ˆ i i
i i i
i
n x
2
i i
i
n xi2 xi
i
x x
i
i
i
2
i
i i
Estimarea parametrilor modelului de
regresie clasic
ˆi
Condiţia de ordin 2 2(
i
yi nˆ ( i
xi ) ˆ )
ˆi
2(
xi y i ( xi )ˆ ( xi2 ) ˆ )
i i i
2 ( ˆi2 ) 2
( ei2 )
ˆ
i
2 2
i
ˆˆ
2n
2 x i
i
2 ( ˆi2 )
2 ( ˆi2 )
2 xi 2 x 2
i
i i
i i
ˆˆ 2 ˆ 2
2 n 0
2 xi 0
2
Deci matricea este pozitiv definită
i
4n xi 4( xi ) 4n ( xi x) 0
2 2 2
i i i
Verificarea validităţii modelului
unifactorial de regresie liniară
( yˆi y )
Variaţia totală:
n
S y ( yi y ) 2
X i 1
Variaţia explicată de X:
Y
Variaţia neexplicată de X:
n n
S y / x ( yˆ i y ) 2
S e ( yi yˆi ) 2
i 1 i 1
I. Testarea validităţii modelului de
regresie folosind metoda analizei de
varianţă
2 Sy
Dispersia corectată totală: sy
n 1
Sy/ x
Dispersia corectată sistematică: s 2y / x
k
Se
Dispersia corectată reziduală: se2
n k 1
H1: s 2y / x / se2 1 (influenţa lui X este semnificativ mai mare decât cea
a factorilor aleatori)
s e2 k n k 1
Regula de decizie:
Dacă Fcalc≤ Fα,k,n-k-1, atunci se acceptă H0 şi deci modelul nu este semnificativ
statistic;
Dacă Fcalc> Fα,k,n-k-1, atunci se respinge H0, se acceptă H1, deci modelul este
semnificativ statistic (valid).
I. Testarea validităţii modelului de
regresie folosind metoda analizei de
varianţă
Datorată n Sy
S y / x ( yˆ i y ) 2
regresiei 2 k
(explicată de sy
model) i 1 n 1 s 2y / x
F
Reziduală n Se se2
(neexplicată de S e ( yi yˆi ) 2 n-k se2
model) n k 1
i 1
n Sy / x
s 2y / x –
Totală
S y ( yi y ) 2
n-1 k
i 1
II. Determinarea măsurii
calităţii ajustării
Raportul de corelaţie: R R 2
Daca R→1 legatura dintre X şi Y este puternică
Daca R →0 legatura dintre X şi Y este slabă
În cazul legăturilor liniare: R rxy
II. Determinarea măsurii calităţii
ajustării
Observaţii:
1. R2 poate fi interpretat ca procentul variaţiei lui y explicată de variaţia
variabilei x doar pentru cazul în care metoda celor mai mici pătrate este
aplicată modelului liniar de regresie și modelul are termen liber.
2. Pentru orice model coeficientul R2 poate fi calculat ca:
2
ei
R2 1 i unde S yy ( yi y ) 2
S yy i
Se Se y i yˆ i
2
se se2 i 1
n k 1 n2 n2
2 2
Distribuţiile de eşantionare ale estimatorilor “a”sşi s
“b” sunt normal
a b
distribuite,
cu mediile “” şi “β” nşi dispersiile: şi
2
2 xi
1 x
sa2 se2 n s2 i 1
n 2
e n
( xi x ) ( xi x ) 2
i 1 i 1 s2
y i ˆ
y i
2
e
1 n2
s s
2 2
x
b e 2
i x
III. Testarea parametrilor modelului
de regresie
Parametrul “β” (panta dreptei)
Testul bilateral:
H0: β = 0
H1: β ≠ 0
Test unilateral dreapta/stânga:
H0: β = 0
H1: β > 0 (H1: β < 0)
b b b 0 b
Testul t: t calc
sb sb sb
Reg. critică:
Pentru testul bilateral: dacă t calc t / 2 ,n 2 sau t calc t / 2,n 2 se respinge H0.
Pentru testul unilateral dreapta: t calc t ,n 2
Pentru testul unilateral stânga: t calc t ,n 2
Intervalul de încredere pentru “β”:
b t / 2 , n 2 s b b t / 2 , n 2 s b
III. Testarea parametrilor modelului
de regresie
Parametrul “”
Testul bilateral:
H0: = 0
H1: ≠ 0
Test unilateral dreapta/stânga:
H0: = 0
H1: > 0 (H1: < 0)
Dacă eşantionul este de volum mare:
a a a 0
Testul z: zcalc
sa sa
Regiunea critică:
Pentru testul bilateral: dacă z calc z / 2 sau z calc z / 2 se respinge H0.
Pentru testul unilateral dreapta: dacă zcalc z se respinge H0.
Pentru testul unilateral stanga: dacă zcalc z se respinge H0.
Intervalul de încredere pentru “”:
a z / 2 sa a z / 2 sa
III. Testarea parametrilor modelului
de regresie
Parametrul “”
t a 1,21 a nu e semnificativ
aˆ 1,57
Regression Statistics diferit de zero
Multiple R 0,816991 R2=66,7% bˆ 0,38 t b 4,48 b semnificativ diferit
R Square 0,667474 de zero
Adjusted R Square 0,634222
Standard Error 1,644507
Observations 12
ANOVA
Fcalc=20,07
df SS MS F Significance F
Regression 1 54,28514 54,28514 20,07288 0,001179
modelul este valid
Residual 10 27,04402 2,704402
Total 11 81,32917
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 1,571738 1,303008 1,206238 0,255488 -1,33155 4,475021 -1,33155 4,475021
Venit 0,377323 0,084219 4,480277 0,001179 0,189672 0,564974 0,189672 0,564974
EXEMPLU
INTERPRETĂRI