Documente Academic
Documente Profesional
Documente Cultură
URL: http://www.hertz.ase.ro
Activitatea de la seminar: (30% din nota finală);
Delimitarea ipotezelor din teoria economică ce urmează a fi testate
Teoria cererii si ofertei
Formularea matematică a ipotezelor economice
P=f(Q), unde f’(Q)<0
Specificarea modelului econometric
P=a+bQ+ε
Culegerea datelor
Estimarea parametrilor
Predicţia pe baza modelului
Concluzii şi recomandări: e.g. poate fi ales acel preţ care maximizează
profitul
Statistică vs Econometrie
Econometria pleacă de la un model economic, adică există
anumite relaţii a priori acceptate pe baza unui model
economic; aceste relaţii sînt testate folosind date reale.
Statistica, de cele mai multe ori, caută anumite corelaţii
între variabile, dar fără a avea la bază o teorie economică.
Modelul econometric
Modelul econometric: un model economic formulat astfel
încât parametrii să poată fi estimaţi dacă se face presupunerea
că modelul este corect.
Relaţiile statistice pe care se bazează modelul econometric:
relaţii de identitate sau deterministe: sunt formulări logice cu privire
la procesul economic descris (exemplu: VN=VB - I );
relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor,
înclinaţiilor (sub raportul satisfacţie/efort) (exemplu: C = a + bV );
relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-
urile (exemplu: funcţia Cobb Douglas: Q = I L1- , 0 1);
relaţii instituţionale: conform unor reglementări impuse de
lege (exemplu:amortizarea, impozitul pe venit etc.).
Variabile şi date statistice
Variabilele economice determină structura modelului econometric:
endogene: variabile determinate în cadrul sistemului;
exogene: variabile determinate în afara sistemului, despre care
modelul econometric nu are nimic de spus.
Tipuri de date: modalitatea de observare a fenomenelor şi proceselor
date de tip profil (cross-sectional data)
"tăieturi informaţionale" efectuate într-o populaţie la un moment dat, "tăieturi" care
sunt de tip transversal, în raport cu axa timpului.
starea pe care o au la un moment dat unităţile populaţiei statistice.
date de tip serii de timp (serii cronologice)
reprezintă "secţiuni informaţionale" de-a lungul axei timpului, de-a lungul evoluţiei;
adică sunt secţiuni longitudinale în raport cu axa timpului.
date de tip panel
sunt combinaţii, mixturi, ale datelor de tip profil şi datelor de tipul seriilor de timp.
"tăieturi informaţionale mixte" transversale şi logitudinale, în raport cu axa timpului.
Caracteristica esenţială a acestor date este simultaneitatea.
Modelarea economică
X S Y
Modelele deterministe: y = f(x) (de exemplu: Q = wL) se utilizează frecvent în
practica economică în analiza pe factori a variaţiei, în timp sau spaţiu, a
fenomenelor social economice.
Modelul econometric descrie legătura statistică sau stochastică dintre intrările
sistemului - factorii de influenţă X - şi ieşirile acestuia, variabilele rezultative
Y: Y = f(X)+U
Tipologia modelelor econometrice
bY b Y ... Y c X c X ... c X U
n1 1 n2 2 n n1 1 n2 2 nm m n
2
Modele
Modele deterministe
Modele probabiliste
3
Modele Modele probabiliste
deterministe Componenta
Exprimăo relaţie deterministă
exactă între Componenta aleatoare
variabile Eroarea de previziune
Teoretic, eroarea este nenulă
de previziune este Componenta aleatoare
nulă poate fi datorată
factorilor obiectivi, ce
Exemplu: nu sînt incluşi în model
Principiul al doilea al Exemplu: Volumul
mecanicii vînzărilor=10 *
newtoniene: Cheltuielile cu
publicitatea +
F = m.a
Componenta aleatoare
4
Tipuri de modele probabiliste
ProbabilisticModele
probabilisteModels
5
Regresia – metodă de modelare a legăturilor
dintre variabile
Y f ( X 1 , ..., X n )
Suma cheltuită pentru consum depinde de:
mărimea venitului pe de o parte
alte obiective în funcţie de circumstanţe (de
exemplu investiţiile)
alte nevoi subiective
„O persoană este dispusă de regulă şi în medie să îşi
crească consumul pe măsura creşterii venitului dar nu
în aceeaşi măsură”
d C
0 d V 1
7
Clasificarea modelelor de regresie
Simple Multiple
Non- Non-
Linear Linear
Linear Linear
8
Tipuri de modele de regresie
Legătură liniară directă Legătură neliniară
9
Modelul de regresie liniară simplă
10
Exemplu
practic
Există o legătură între
suprafaţa unor
apartamente din zona
centrală şi preţul de
închiriere a acestora?
Selectăm aleator 25 de
astfel de apartamente la
care urmărim valorile celor
două variabile X –
suprafaţa(m2) şi Y – chiria
lunară(RON).
11
Regresia folosind EXCEL
Accesăm meniul TOOLS>DATA ANALYSIS>REGRESSION
12
Regresia folosind EXCEL
Selectăm valorile variabilelor
13
14
Corelograma(Scatter plot)
Graficul punctelor de coordonate (Xi,Yi), i=1,n.
2500
2000
Chiria(RON)
1500
1000
500
0
0 50 100 150 200 250
Suprafata(m2)
15
Modelul de regresie liniară simplă
Pe baza corelogramei este rezonabil să presupunem că
media variabilei Y depinde de X printr-o relaţie liniară:
Atunci modelul de regresie liniară simplă este dat de
relaţia următoare:
Y intercept (termenul constant)
Variabila
de
Y X perturbaţie
i 0 1 i i
Variabila
Variabila independentă
dependentă
(răspuns) Panta dreptei de (explicativă) 16
regresie
Media şi dispersia variabilei dependente
17
• La nivelul populaţiei regresia se reduce la
exprimarea mediei condiţionate a lui Y:
Dreapta de regresie
Y
X
19
Modelul de regresie liniară la
nivelul populaţiei
Y Y X Valoarea
i 0 1 i i observată
i = Eroarea
X
YX 0 1 i
(E(Y))
X
Valoarea 20
observată
Modelul de regresie liniară la
nivelul eşantionului
ˆ ˆ ˆ
Y i 0 1 Xi
Yi = Valoarea estimată a lui Y pentru observaţia i
Xi = Valoarea lui X pentru observaţia i
ˆ = Estimatorul termenului liber 0
0
ˆ = Estimatorul pantei 1
21
1
Estimarea parametrilor modelului de regresie
Metoda celor mai mici pătrate(M.C.M.M.P.)
–Ordinary Least Squares(OLS sau LS)
Presupunem căavemnperechi de observaţii
^
1 ^3
Yi 01X i
X 23
Condiţiile de minim:
Simplificînd, obţinem sistemul de ecuaţii
normale
24
Estimatorii modelului de regresie
b1 cov( X ,Y )
s 2x
b 0 y b1 x
25
Notaţii
Valoarea estimată:
Valoarea reziduală(reziduul):
26
Estimatorul dispersiei modelului
27
Proprietăţile estimatorilor modelului de regresie
ˆ ˆ
şi sînt estimatori nedeplasaţi ai parametrilor şi
0 1 0 1
ˆ ˆ
E( ) şi E( )
0 0 1 1
V( )
ˆ 2
1 S
xx
Y Sample 1 Line
All Possible
Sample Slopes
Sample 2 Line
Sample 1: 2.5
Population Line
Sample 2: 1.6
X
Sample 3: 1.8
Sample 4: 2.1
Sampling Distribution
::
S^ Very large number of
1 sample slopes
^
29
1 1
Eroarea standard a estimatorilor
n
ei 2
Întrucît varianţa reziduală 2 se estimează prin i1
putem avea o estimare
2
n 2
ˆ a erorii standard a celor doi estimatori:
ˆ ˆ S
2
-SE( ) V( 1) xx ˆ2
1 S
df n 2 xx
2 1 x2
ˆ
ˆ V( 0 ) n S
xx 2 1 x2
-SE( 0 ) ˆ
S
df n 2 n xx
ˆ t 2 1 x2 ˆ 2 1 x2
0 / 2, n 2 ˆ S 0 0 t / 2, n 2 ˆ S
n xx
n xx
2 2
ˆ t 2 ˆ 2
1 / 2, n 2 ˆ x
1 1 t / 2, n 2 ˆ x
S S
xx xx
1
i1 i1 i1 i1 y
n n n i i
2 2 2 i1
(xi x) (xi x) (xi x)
i1 i1 i1
' n
qy n n n
q
Fie i i0 qi 1 qi x i i i un alt estimator liniar.
i1 i1 i1 i1
Rezultă ' n
qi i 1, deci varianţa sa este V( ' ) 2 n
qi2.
i1 i1
n 2 2 2 n 2 2 2 n 2
ˆ
2 ( i 2 i vi vi ) (i vi ) i V( 1).***QED 32
i1 i1 i1
Exemplu-chiria ca funcţie de suprafaţă
ˆ ˆ
(Yi - Y) (Yi - Y) (Yi - Yi )
2
Descompunerea variaţiei
Y
SSE = (Y - Y )2
i i
_
SST = (Y - Y)2
i
_
SSR = (Yi - Y)2 _
Y
X
X
X i
3
ANOVA pentru regresie
2 ˆ 2 ˆ 2
(Yi Y) (Yi Y) (Yi Yi )
SST = SSR + SSE
SST = Total Sum of Squares
_
Măsoară variaţia valorilor observate Yi în jurul mediei Y
SSR = Regression Sum of Squares
Măsoară variaţia explicată de modelul de regresie
5
2
Coeficientul de determinaţie R
Este o măsurăa proporţiei varianţei explicate de
model n n
(y
ˆ y)2 e
2
i i
R2 SSR i1 1 i1 0,1
SST ( yi y ) 2 ( yi y)2
i i
R
2 2 n1 n1
adj 1 (1 R ) 1 ,1
n k 1 n k 1
6
Exemplu-chiria ca funcţie de suprafaţă
Standard Error :
n
ei2
ˆ i1
n 2 7
Observaţii
2
R este adesea folosit pentru a alege cel
mai bun model din punctul de vedere al
varianţei explicate.
Comparaţiile de acest fel trebuie făcute
între modele de aceeaşi natură.
8
Foarte important!!
Pentru modele de regresie fărătermen liber, de tipul
yx
R2 nu mai are semnificaţia de proporţie a varianţei
explicate.
Exemplu: considerăm douăastfel de modele
y x
1 1 1 1 , unde y2 i y1işi x2 i x1i
y2 2 x2 2
Y R2 = 1, r = +1 Y R2 = 1,^ r = -1
Yi = b0 + b1Xi
^
i = b0 + b1Xi
X X
2 2
YR = .8, r = +0.9 Y R = 0, r = 0
^ ^
i = b 0 + b 1X i Yi = b0 + b1Xi
X X
10
Tabelul ANOVA
Regression SSR n
( yˆi y)2 k- 1 MSR= SSR MSR
i1 k 1 MSE
SSE
Error SSE n
( yi yˆi )2 n
ei 2 n- k MSE=
i1 i1 n k
2 SST
Total SST( yi y) n- 1
i n 1
este folosit la verificarea validităţ ii modelului. Un model este valid dacă proporţia
varianţ ei explicate prin model este semnificativă. Ipoteza nulă pentru testul F in cazul
acesta este cea de model nevalid.
11
Excel Output
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.85
R Square 0.72
Observations 25
ANOVA
df SS MS F Significance F
Total 24 3139726
12
Regresie şi corelaţie (3)
1
REGRESIA MULTIPLĂ
2
Regresie multipla
Coeficienti
de regresie
Variabila eroare
Variabila
Variabile Independente
Dependenta
3
Forma generală a modelului
x11
k
y1 x 1
x 1 1k 1
2
x
Y , X 2 , ,
k
y n x1n n
xk
Y=X +
5
Estimarea parametrilor prin MCMMP
6
Estimarea parametrilor prin MCMMP
ˆ
Derivînd în raport cu avem:
ˆ ˆ ˆ ˆ ˆ ˆ
S( ) [Y 'Y 2 ' X 'Y 'X'X ] [ 'X'X ]
ˆ ˆ ˆ ˆ
2X 'Y 2X 'Y 2X ' X 0.
Din ipoteza V matricea X’X este nesingulară, deci estimatorul vectorului parametrilor
modelului de regresie multiplă este:
ˆ 1
( X ' X ) X 'Y.
Cum
S( ˆ) ˆ S( ˆ )
ˆ 2X'Y 2X'X atunci 2ˆ ˆ ' 2X' X .
ˆ
Ultima expresie este pozitiv definită, deci soluţia este optimă.
*Pentru mai multe detalii vezi Green, Econometric Analysis, Cap.2 şi 6.
7
Interpretarea parametrilor
Pentru a interpreta semnificaţia parametrilor modelului de regresie considerăm
modelul:
ˆ ˆ ˆ
yi 1x1i 2 x2i ... k xki.
Atunci, dacă x2, … xk sunt constante se obţine următoarea egalitate:
ˆ
yi 1 x1i ,
Rezolvând ecuaţia de mai sus se obţine că estimatorul parametrului 1 este rata
marginală de substituţie a variabilei endogene în raport cu variabila exogenă X1:
yi
ˆ 1 x1i .
ˆ
Coeficientul 1 arată cu câte unităţi creşte sau se micşorează
caracteristica Y, dacă caracteristica X1 se modifică cu x1i unităţi,
în condiţiile în care celelalte caracteristici
X2, …, Xp rămân constante.
În cazul în care variabilele endogene sunt necorelate, atunci
semnul coeficientului fiecărei variabile din modelul multiplu de
regresie coincide cu semnul coeficientului din modelul simplu de
regresie de analiză al variabilei endogene funcţie de fiecare
8
variabilă exogenă în parte.
Exemplu: Stabilirea locatiei unui hotel (1)
Profitabilitatea Marja
Cunoaşterea
Competiţia Clienţii Comunitatea Elemente fizice
pieţei
Regression Statistics
Multiple R 0,724611
R Square 0,525062
Adjusted R 0,49442 Marja = 72.455 - 0.008*Camere -1.646*Apropiere
Standard E 14. 0.02*Birouri +0.212*G/Aerop
Observatio 0.413*Venit + 0.225*Dist_oraş
ANOVA
df SS MS F gnificanceF
Regressio 6 3123,832 520,6387 17,13581 3,03E-13
Residual 93 2825,626 30,38307
Total 99 5949,458
14
Exemplu (1)
Consideram ca pretul este determinat si
de culoarea masinii.
Consideram trei culori :
Alb
Argintiu
I = 1 daca culoarea este alba
1
Alte culori 0 pentru alta culoare
I = 1 daca culoarea este argintie
2
0 pentru alta culoare
15
Exemplu (2)
Folosim modelul
y = 0 + 1(Kilometraj) + 2I1 + 3I2 +
Regression Statistics
Multiple R 0.835482
R Square 0.69803
Adjusted R 0.688594
Standard E 142.271
Observatio 100
ANOVA
df SS MS F gnificance F
Regressio 3 4491749 1497250 73.97095 7.22E-25
Residual 96 1943141 20241.05
Total 99 6434890
În general modelele pot fi linearizate.
y=a+bx
y=a+bz, z=ex
y=a+br, r=1/x
y=a+bq, q=ln(x)
y= xβ ln(y)= + ln(x)
Forma generală: f(yi)= + g(xi)+ i
1
Contra exemplu: y nu poate fi
x
transformat în model liniar.
20
Modele ce pot fi linearizate
Y
1000
a b
1 a be x
x
800
600
a bx
400
200
a b ln x
0
-1 0 . 003 0 . 008 0 . 013 0 . 018 0 . 023 0 . 0 28 0 . 033 0 . 0 38 0 . 043 0 . 04 8 0 . 053 0 . 05 8 0 . 063 0 . 068
X
200
400
21
Modele particulare (1)
22
Modele particulare (2)
Între parametrii modelului iniţial de regresie şi cele doua
modele obţinute prin transformări de date există următoarele
relaţii mai importante:
j * j;
y
j **j.
xi
cov( y , x i ) n şi cov(xi , x j ) n .
Se obţin atunci următoarele egalităţi:
yt x jt n cov( y, xi )
t
xit x jt n cov( xi , x j ). 24
t
Modele particulare (4)
Luând în considerare relaţiile de mai sus vom scrie pentru modelul centrat matricile X´X şi X´y după cum urmează:
C(x1,x2,..
ˆ
.,xk) *
C(y,X)
Rezolvând sistemul de ecuaţii se obţine soluţia:
-1
ˆ C (x ,x ,...,x )C(y,X)
* 1 2k .
Testarea ipotezelor
statistice
Joi, 19 martie 2015
1
Concepte (1)
Ipoteză statistică = ipoteza care se face cu privire la
parametrul unei repartiţii sau la legea de repartiţie pe
care o urmează anumite variabile aleatoare.
Ipoteză nulă (H0) = ipoteza care se consideră a priori
adevărată.
Ipoteză alternativă (H1) = o ipoteză care contrazice
ipoteza nulă. Ea va fi acceptată doar când există
suficiente dovezi în favoarea acesteia.
Dacă ipoteza nulă constă în afirmaţia că parametrul θ al
unei distribuţii este egal cu o anumită valoare θ0:
ipotezăalternativăsimplă:θ=θ1
2
ipotezăalternativăcompusă: { 1 , 2 ,..., k }
Concepte (2)
Testul statistic este utilizat drept criteriu de acceptare
sau de respingere a ipotezei nule
Regiunea critică, Rc = valorile numerice ale testului
statistic pentru care ipoteza nulă va fi respinsă.
este astfel aleasă încât probabilitatea ca ea să conţină testul
statistic, când ipoteza nulă este adevărată să fie α, cu α mic
(α=0.01 etc).
Dacă valoarea calculată a testului statisticic se află în regiunea
critică Rc, ipoteza H0 se respinge
regiunea critică este delimitată de valoarea critică, C –
punctul de tăietură în stabilirea acesteia.
3
Concepte (3)
Eroare de genul întâi = eroarea pe care o facem eliminînd o ipoteză
nulă, deşi este adevărată.
Riscul de genul întâi (α) = probabilitatea comiterii unei erori de
genul întâi; se numeşte nivel sau prag de semnificaţie.
Nivelul de încredere al unui test statistic este (1-α) iar în expresie
procentuală, (1-α)100 reprezintă probabilitatea ca rezultatele să fie
adevărate.
Eroare de genul al doilea = eroarea pe cere o facem acceptînd o
ipoteză nulă, deşi este falsă.
Probabilitatea (riscul) comiterii unei erori de genul al doilea este β.
Puterea testului statistic este (1-β).
P-value=cel mai mic nivel de semnificaţie la care poate fi respinsă
ipoteza nulă.
4
Concepte (4)
Ipoteza alternativă poate avea una din trei forme (pe care le vom exemplifica
pentru testarea egalităţii parametrului „media colectivităţii generale“, μ cu
valoarea μ0)
test bilateral:
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
test unilateral dreapta:
H0: μ = μ0
H1: μ > μ0
test unilateral stânga:
H0: μ = μ0
H1: μ < μ0 5
Regiunea critică
α/2 α/2 α α
z μ z μ z z μ
/2 a) /2 b) c)
Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
6
Concepte (5)
μ C μ x
8
Etapele verificării ipotezelor statistice
Identificarea ipotezelor ce trebuie testate
Identificarea testului statistic
Specificarea nivelului de semnificaţie
Stabilirea regulii de decizie
Culegerea datelor şi realizarea calculelor
Luarea deciziei statistice
Aplicarea deciziei statistice în lumea concretă
9
Efectuarea testului statistic
Condiţia esenţială în verificarea ipotezelor statistice este
că variabila de interes urmează o repartiţie normală:
N( , 2)
Se extrage un eşantion aleator din respectiva
populaţie normală
x : ( x1 ,..., xn )
Pe baza eşantionului se calculează valoarea
estimatorului parametrului populaţiei de interes şi apoi
valoarea testului
Forma generală a testului statistic:
valoarea estimată - valoarea ipotetică
eroarea standard a estimatorului 10
Concepte (7)
Se fac presupuneri despre populaţia sau populaţiile ce
sunt eşantionate (normalitate etc.).
Se calculează apoi testul statistic şi se determină
valoarea sa numerică, pe baza datelor din eşantion.
Se desprind concluziile: ipoteza nulă este fie acceptată,
fie respinsă, astfel:
dacă valoarea numerică a testului statistic cade în regiunea
critică (Rc), respingem ipoteza nulă şi acceptăm ipoteza
alternativă. Această decizie este incorectă doar în 100 α %
din cazuri;
dacă valoarea numerică a testului nu se află în regiunea
critică (Rc), se acceptă ipoteza nulă H0. 11
Testarea semnificaţiei parametrilor modelului
liniar de regresie (1)
H0: i = 0
H1 : i 0.
Dacă notăm ii [(X'X)–1ii] termenul (i, i) din matricea (X’X)–1, atunci
dacă sunt satisfăcute ipotezele pe care se fundamentează modelul regresiei
multiple vom avea următoarele două rezultate:
1
ˆ , X'X
i N i
iar ii
ˆ
ii
zi N (0,1).
1
X'X ii
Cum în aplicaţiile practice nu cunoaştem , atunci această statistică nu
poate fi utilizată în inferenţele statistice asupra parametrilor modelului 12de
regresie.
Testarea semnificaţiei parametrilor modelului
liniar de regresie (2)
Pentru definirea unei statistici operabile ţinem seama de faptul că:
2 2 1
ˆ
ˆi e X'X ii .
ˆ
i i
ti 1
Atunci urmează o repartiţie Student cu n-k
e X ' X ii
grade de libertate.
Vom formula deci ipotezele:
H :ˆ = 0
o i
H:ˆ ≠0
1 i
Decizia:
Dacă tcalc>ttab se alege H1 . Altfel, acceptam H0
13
Exemplu (1)
Se cere să se construiască un model de
regresie care să analizeze modul în care
media de la examenul de Bacalaureat,
media anilor de liceu şi genul
candidatului au influenţat rezultatele la
admiterea ASE 2006.
În acest scop s-a realizat un eşantion
selectat aleator de 50 de candidaţi precum
şi punctajul maxim realizat de către
aceştia
14
Exemplu (2)
Modelul de regresie
15
Exemplu (3)
2,78 0,16 0,17 0,05
( X ' X ) 1 0,16 0,06 0,04 0,02 51, 64
0
0,17 0,04 0,05 0,02
1
0,05 0,02 0,02 0,11
ˆ 1 ( X ' X ) X 'Y 6, 78
5,57
2
3 4,19
2,78
S 2 174, 42* 0,06 Punctaj 51,64 6,78* Bac 5,57* Lic 4,19*Gen
0,05
(22,02) (3,12) (3,05) (4,34)
0,11 16
Exemplu (4) – Testarea semnificaţiei
parametrilor de regresie
Calculam valorile testului t
ˆ
ti i 0
calc
17
Exemplu (5) - Testarea semnificaţiei
parametrilor de regresie
19
Ipotezele MCMMP
1
Ipotezele modelului de regresie (1)
Y i X i
2
Ipotezele modelului de regresie (2)
Variabilele independente Xi nu sunt puternic
corelate (nu prezintă multicoliniaritate).
Cazul ideal este acela in care coeficientul de
corelaţie dintre oricare două variabile
independente să fie nul. Existenţa coliniarităţii
face ca matricea (X’X) să nu fie inversabilă.
Variabilele independente sunt
nestochastice şi în eventualitatea în care am
repeta sondajul s-ar obţine aproximativ aceleaşi
valori.
Modelul de regresie este corect specificat (s-a
ales o funcţie potrivită) şi a rezultat un grad de
determinaţie suficient de mare.
3
Ipotezele modelului de regresie (3)
Erorile sînt normal distribuite cu
medie zero E(εi)=0 i.
Homoscedasticitatea (dispersie constantă).
4
Multicolinearitatea
5
Indicatori pentru semnalarea
coliniarităţii (1)
Coeficienţii de corelaţie din matricea de
corelaţie a variabilelor independente
inregistrează valori foarte ridicate (peste
0,85-0,90)
Gradul de determinaţie se apropie de 1 în
condiţiile în care parametrii de regresie nu
trec testul t
Dacă determinantul matricii (X’X) este
extrem de mic (în cazul coliniarităţii perfecte
el este egal cu 0)
6
Indicatori pentru semnalarea
coliniarităţii (2)
Criteriul Klein
se determină raportul de corelaţie Ry2 şi
coeficienţii liniari de corelaţie a variabilelor
exogene rxi /xj , i j.
douăvariabile exogene Xişi Xjsunt coliniare dacă:
R2 r2
y xi /xj
9
Înlăturarea efectului de
multicoliniaritate (2)
10
Analiza variabilei reziduale în
modelarea econometrică
11
Ipoteza cămedia erorilor este zero:
E( i)=0 i, este naturală atâta timp cât este
văzută ca suma efectelor individuale, cu semne
diferite. Dacă media erorilor este diferită de zero, ea
poate fi considerată ca o parte sistematică a
regresiei: E( )= + x + = ( + ) + x + ( - )
media erorilor fiind acum nulă.
Ipoteza de homoscedasticitate:
Var( i)= 2 constantă i
Se consideră un model care descrie consumul unor
gospodării în funcţie de venitul acestora. În acest
caz, consumul gospodăriilor mari pot varia mult mai
mult faţă de consumul gospodăriilor cu venituri mici.
Deci ipoteza de homoscedasticitate nu este
respectată.
12
Exemplu de încălcare a ipotezei de
homoscedasticitate
Functia de consum
1200
1000
800
consum
600
400
200
0
200 300 400 500 600 700 800 900 1000
venit
13
Necorelarea erorilor: E( i j)=0 i j
Această ipoteză nu implică faptul că yi şi yj sunt
necorelate, ci faptul că deviaţiile observaţiilor de la
valorile lor aşteptate sunt necorelate.
Ipoteza de normalitate a erorilor i
N(0, 2)
Este o ipoteză de lucru, tehnică, ce permite
obţinerea unor estimatori “buni”.
Dacă ipotezele precedente sînt respectate,
vom obţine estimatori B.L.U.E. (Best
Linear Unbiased Estimators)
14
Variaţia erorilor în jurul dreptei de regresie
Y
X2
X1
X
Dreapta de regresie 15
Daca varianta este constanta avem
homoscedasticitate
+
^
y ++
Residual +
+ +
+ + + ++
++ + +
+
+ + +
+ + +
+ + +
+ + + + ^
y
+
+
+ +
+ + + + +
+
+ + + + ++
+ ++
+
++
16
Variabila reziduala are varianta constanta:
Homoscedasticitate/Heteroscedasticitate
Daca este incalcata conditia variantei
constante suntem in cazul heteroscedasticitatii.
+
^
y ++
Residual +
+
+ + +
+
++
+ + + + + + +
+ + ++ + + + ^ ++ +
+ ++ + + y +
+
+
+ + + ++
+ ++
+ + +
Imprastierea creste odata cu y
17
Testarea normalităţii (cu medie zero)
distribuţiei variabilei reziduale (1)
Evident că pentru ca E(εi)=0 suma erorilor la
puterea întâi trebuie să fie nulă
În ceea ce priveşte normalitatea distribuţiei o putem
testa cu ajutorul testului JB (Jarque şi Bera) care
presupune că în ipoteza că distribuţia este normală
valoarea calculată a testului urmează o repartiţie χ2
cu 2 grade de libertate
Cele două ipoteze sunt:
H0 – erorile sunt normal distribuite
H1 – erorile nu sunt normal distribuite
Un prag de semnificaţie acceptabil este unul mai mic
decât 0,3 sau 0,2
18
Testarea normalităţii (cu medie zero)
distribuţiei variabilei reziduale (1)
Decizia
Dacă valoarea testului JB calculată este inferioară valorii
vom accepta ipoteza H0; altfel alegem
2
tabelare,2
ipoteza H1
Valoarea statisticii JB se calculeazăcu formula:
2 2
JB n C as Cbolt 3
6 24
unde
19
Asimetria şi boltirea (recapitulare)
Coeficienţii lui Pearson
4
2 Cbolt 2
C 3
3 2
as 1
2
2
unde: unde:
2 i 2 4
i
2 4
n n
(momentul centrat de ordin 2)
(momentul centrat de ordinul 4)
3
i
3
n
(momentul centrat de ordin 3) În Excel =kurt(…)
În Excel =skew(…) 20
Exemplu (1)
La modelul prezentat la cursul anterior (în care era
studiată dependenţa dintre punctajul obţinut la admiterea
ASE şi media examenului de Bacalaureat, media anilor de
liceu precum şi genul candidaţilor distribuţia erorilor este
următoarea: 12
10
0 N = 50,00
-30,0 -20,0 -10,0 0,0 10,0 20,0
-25,0 -15,0 -5,0 5,0 15,0
21
VAR00001
Exemplu (2)
Valoarea statisticii JB :
2 2 2 2
JB n C as Cbolt 3 50 0,51 0,1446 3 22,7
6 24 6 24
22
Ipotezele MCMMP
1
Autocorelarea erorilor
2
Cauzele de apariţie a autocorelării
erorilor (1)
Absenţa uneia sau mai multor variabile
explicative importante
neincluderea uneia sau mai multor variabile
explicative importante poate genera
autocorelarea erorilor.
exemplu:yia bx1icx2i i
0.042 1.370
1.5
-0.322 -0.093
1.370 -0.240
1.0
-0.093 -0.249
-0.240 0.281 0.5
-0.249 0.532
0.281 0.035 0.0
0.532 0.873
-3 -2 -1 -0.5 0 1 2 3
0.035 -0.165
0.873 -0.182 -1.0
-0.165 -2.130
-0.182 0.962 -1.5
-2.130 -1.047
-2.0
0.962 0.086
-1.047 -0.121
-2.5
0.086 1.928
-0.121 1.130 -3.0
1.928 -2.308
1.130 1.559 6
Independenta erorilor in timp
Tipuri de variabila reziduala care indica existenta autocorelatiei erorilor
In timp.
Residual Residual
+
++ + +
++ + +
0 + + + 0 + +
+ Time Time
+ +
+ + ++
+ + +
+++
+
7
Autocorelatie de ordinul I pozitiva
Autocorelatie de ordinul I pozitiva
+ + Reziduri
+
+
0
Timp
+
+ +
n
ei 2
i1
Numărătorul statisticii va fi scris sub forma echivalentă:
n 2 n n n n n
2 2 2
e e e 2 eee 2 e 2 ee e2 e2
i i1 i ii1 i1 i i i 1 1n
i2 i2 i2 i2 i1 i2
d 2 1 ρ1 .
Testul Durbin-Watson (2)
d1 şi d2 extrase din tabela Durbin Watson
pentru , k şi n:
0 < DW < d1 autocorelare pozitivă a erorilor
d1 DW d2 indecizie, recomandată acceptarea
autocorelării pozitive
d2 < DW < 4-d2 erori independente
4-d2 DW 4-d 1 indecizie, recomandată
acceptarea autocorelării negative
4-d1< DW <4 autocorelare negativă a erorilor
10
Decizia in cazul testului Durbin-Watson
0 d1 d2 2 4-d2 4-d1 4
11
Testul Durbin Watson
Testul Durbin-Watson pentru α= 5 %.
n k=1 k=2 k=3 k=4 k=5
d1 d2 d1 d2 d1 d2 d1 d2 d1 d2
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
20 1,20 1,41 1,10 1,94 1,00 1,68 0,90 1,83 0,79 1,99
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
50 1,50 1,59 1,46 1, 63 1,42 1,67 1,38 1,72 1,34 1,77
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,37 1,78
12
Metode de estimare a parametrilor în
cazul autocorelării (1)
Erorile prezintă o autocorelare de un anumit ordin
estimatorii parametrilor sunt nedeplasaţi şi consistenţi, dar
nu sunt eficienţi.
1. Se estimează parametrii modelului de regresie: Y=X prin
metoda celor mai mici pătrate şi se obţine seria erorilor
(e )
i i=1,n
13
Metode de estimare a parametrilor în
cazul autocorelării (2)
p p
y x yi y (1 ) (x ji x )
3. i 0 j ji i i1 0 j ji 1 i i1
j1 j1
*
y yiyi
i 1 p
14
Homoscedasticitatea
u
Y=X
E( ) 0
w1 0 0
x
Var ( ) 2 0 w1 0
w
0 0 1
Problemele ce se pun în acest caz sunt:
Testele statistice utilizate pentru
depistarea heteroscedasticităţii
Metode de estimare a parametrilor în cazul
heteroscedasticităţii
15
Testele statistice utilizate pentru depistarea
heteroscedasticităţii - Testul White (1)
1. Se estimează parametrii modelului de regresie: Y=X
prin metoda celor mai mici pătrate şi se obţine seria
erorilor (ei)i=1,n
2. Se explicitează seria (ei2)i=1,n în raport cu una sau
mai multe variabile exogene şi se defineşte modelul
de regresie:
a) e 2k ajxj k
b j x 2j v
j 1 j 1
16
Testele statistice utilizate pentru depistarea
heteroscedasticităţii - Testul White (2)
Ipotezele testului:
H0: a1=...=ak=b1=...=bk=0 model homoscedastic
Observaţie:
o creştere a lui r conduce la diminuarea puterii testului
pentru un număr mare de variabile exogene se recomandă
modelul a)
pentru un număr moderat de variabile exogene se
recomandă modelul b)
17
Testele statistice utilizate pentru depistarea
heteroscedasticităţii – Testul GQ (Goldfeld-Quandt)
Ipotezele testului:
H0: model homoscedastic
H1: model heteroscedastic
2. Statistica testului: n
2 2
F
F
i1
calc n
2
;n/2-k; n/2-k
i n2 1
3. Decizia
18
Metode de estimare a parametrilor în
cazul heteroscedasticităţii (1)
În cazul în care avem un număr suficient de mare
de valori putem împărţi datele în două serii şi
realiza modele pentru fiecare dintre ele separat
În cazul în care heteroscedasticitatea este
indusă de o variabilă exogenă într-o manieră
multiplicativă: i2 2 x2ji ,
Fenomenul de heteroscedasticitate se elimină prin
transformarea modelului:
x
yi x pi
i
1i
1 ... p
x x x x 19
ji ji ji ji
Metode de estimare a parametrilor în
cazul heteroscedasticităţii (2)
Notând:
x
*
y i x* x1i
,...,
pi * i
y
i x i
x
ji
x
ji i x
ji ji
* **
Modelul devine: yi xii
După estimarea parametrilor acestui model
transformat se revine în modelul iniţial cu
estimatorii.
20
Prognoze cu ajutorul
modelelor de regresie
1
Predicţia folosind modelul de regresie
1. Tipuri de predicţii
Estimări punctuale
Estimări pe intervale de încredere
2. Care e obiectul predicţiei?
Media populaţiei E(Y) pentru o valoare
particulară a lui X
Valoarea individuală (Yi) pentru o
valoare particulară a lui X
2
Intervale de încredere pentru parametrii
modelului unifactorial
Pentru termenul liber(intercept)
ˆ
ˆ t SE (
ˆ ) ˆ t
SE( )
0 / 2, n 2 0 0 0 / 2, n 2 0
ˆt 2 1 x2 ˆ 2 1 x2
0 / 2, n 2 ˆ S 0 0 t / 2, n 2 ˆ S
n xx
n xx
2 2
ˆt 2 ˆ 2
1 / 2, n 2 ˆ x
1 1 t / 2, n 2 ˆ x
S S
xx xx
ˆ ˆ Sˆ
Y t Sˆ E (Y ) Y t
/ 2, n 2 Y / 2, n 2 Y
unde
n
2
x 2 e
i
Sˆ ˆ 1 p x şi ˆ 2 i1
Y
n
2
n xi x n 2
i1
4
Factori care afectează lungimea intervalului de încredere
Y
e
in
L
l
e
1
Dispersie
p
m
mai mare
_ S
a
decît la X1
Y S
ample 2 Li
ne
X
X
1X X2
6
Exemplu
Un analist de marketing stabileşte căvolumul
vînzărilordepinde liniar de cheltuielile cu reclama.
Estimează
un model de regresie şi obţine β0 = -0.1, β1 = 0.7 & ˆ =
0.60553.
Cheltuieli cu reclama $ Vînzări(bucăţi)
1 1
2 1
3 2
4 2
5 4
Cît vor fi vînzările medii dacăse cheltuiesc
4$pentrureclamă?
alfa=0.05
7
Soluţie
ˆ ˆ
Y t Sˆ E (Y ) Y t Sˆ
/ 2, n 2 Y / 2, n 2 Y
ˆ
Y 0.1 0.7 4 2.7 Valoarea particulară
pentru X
1 4 32
Sˆ 0.60553 0.3316
Y 5 10
2.7 3.1824 0.3316 E (Y ) 2.7 3.1824 0.3316
1.6445 E (Y ) 3.7553
8
Interval de predicţie pentru valori particulare
ˆ t S ˆ t S
/ 2, n 2 / 2, n 2
Y ˆ YP Y ˆ
Y Y Y Y
unde
n 2
2 ei
1 xP x 2
S Y Y
ˆ ˆ 1 n
şi ˆ i1
n xi x 2 n 2
i1
9
Predicţia
Y
Y we're trying to ^X
predict i
+ 1
^
^
Expected Y
=
0
(Mean) Y i
E(Y) = 0 + 1X
^
Prediction, Y
X
XP 10
Intervale de predicţie hiperbolice
Y
^X
+ 1
i
^
^
=
0
Y
_ X
X
X P
11
Intervale de încredere pentru
parametrii de regresie multifactorială
ˆ t ˆ ˆ t ˆ
i / 2; n k ˆi i i / 2;n k ˆi
ˆ
ˆ i e X'X ii
De obicei se construiesc intervale de încredere
pentru parametrii de regresie utilizând un prag de
semnificaţie =0.05
12
Exemplu rezultate calculate cu
ajutorul Excel (1)
Modelul de regresie
ˆ ˆ ˆ ˆ
Punctaj 0 1 * Bac 2 * Lic 3 *Gen
Avem n=50 observaţii (cazuri), k=4 parametri de
regresie.
13
Exemplu rezultate calculate cu
ajutorul Excel (2)
Intervalul de încredere pentru parametrul ßi
(coeficientul variabelei media examenului de
Bacalaureat)
Valoarea tabelară a distribuţiei
Student corespunzătoare este:
t 2, 013
0,05;50 4
yˆ t ˆ E ( yˆ ) yˆ t ˆ
/ 2; n k yˆ / 2;n k yˆ
1 ' 1 x
ˆ yˆ e x pi xi X'X pi xi
n
15
Exemplu (1)
Pentru modelul de
regresie:Punctajˆ0ˆ1*Bacˆ2*Licˆ3*Gensă se
estimeze un interval de încredere (cu un prag
de semnificaţie =0,05) pentru punctajul mediu al
candidaţilor de gen masculin care aveau la
Bacalaureat media 8,50 şi care aveau media anilor
de liceu 8,00.
x pi xi1 1 8,5 8, 2498 8 8,5506 1 0, 28
0 0, 25020,5506 0, 72
2, 78 0,16 0,17 0, 05
0 (X'X)1 0,16 0, 06 0, 04 0, 02
0,17 0, 04 0, 05 0, 02
' 0, 2502 0, 05 0, 02 0, 02 0,11
x pi xi 0,5506 16
0, 72
Exemplu (2)
Eroarea standard de predicţie:
1 ' 1
ˆ yˆ e
x
pi xi X'X x
pi xi
n
2, 78 0,16 0,17 0, 05 0
13, 2079 0, 02 0, 0215 0, 0195 0, 0234 0, 0617 0, 2502 13, 2079 0, 02 0, 0622 3, 7865
0,5506
0, 72
Intervalul de încredere pentru media punctajelor la
admitere ale candidaţilor este:
yˆ t / 2; n k ˆ yˆ E ( yˆ ) yˆ t / 2;n k ˆ yˆ 17
Exemplu (3)
unde t0,05;50 4 2,103
ˆ
iar y 51, 64 6, 78*8,5 5,57 *8 4,19*1 46,37
yˆ t ˆ E ( yˆ ) yˆ t ˆ
/ 2; n k yˆ / 2;n k yˆ
18
Interval de încredere pentru o valoare punctuală
a lui y pentru valori prestabilite ale variabilelor
independente
yˆ t ˆ y yˆ t ˆ
/ 2; n k yˆ y / 2;n k yˆ y
ˆ 1 ' 1 x
yˆ y e 1+ x pi xi X'X pi xi
n
19
Exemplu (4)
Să se estimeze punctual (cu un prag de
semnificaţie =0,05) punctajul pe care îl
va obţine un candidat de gen masculin,
cu media la Bacalaureat 8,5 şi media
anilor de liceu 8.
Eroarea standard a predicţiei punctuale va fi:
ˆ 1 ' 1 x
yˆ ye 1+ x pi xi X'X pi xi 13, 2079 1 0, 02 0, 0622 13, 739
n
Intervalul de încredere pentru predicţia
punctuală va fi:
yˆ t ˆ y yˆ t ˆ
/ 2; n k yˆ y / 2;n k yˆ y
46,37 2, 013 13, 739 y 46,37 2, 013 13,
739
2
0
1
Argumente
Timpul este o coordonată esenţială
a existenţei umane.
Realitatea economică şi socială se
localizează în timp şi spaţiu.
În general, fenomenele economice
nu au caracter static, manifestîndu-se
în cadrul unei evoluţii temporale.
2
Definiţie şi exemple
[0, T ] ,K,
Definiţia 1. Fie un orizont de timp, (
P) (X )
un spaţiu de probabilitate şi t t
un proces stochastic.
Vom numi serie de timp (serie cronologică –
time series) o realizare a procesului
(X )
stochastic t t .
( X )
Definţia 2. O serie de timp t t [0,T ]
4
Staţionaritate
Definiţia 4. O serie de timp este staţionară
în sens larg dacă:
(X )
– Media seriei t t 1,n este constantă pe orice
perioadă de timp;
– Matricea de corelaţie a vectorului aleator ( Xt1 ,
X ,..., X )
t2 tn nu depinde de .
5
Staţionaritate
6
Procedee de staţionarizare
Dacă seria este nestaţionară în medie, se
calculeză diferenţele de ordinul întîi.
Xt Xt Xt 1
Dacă seria este nestaţionară în dispersie, se
calculează seria logaritmată.
Yt log( Xt )
7
Yt 3 t t , t WN (0,50)
800
600
400
200
-200
-400
100 200 300 400 500
600
400
200
-200
-400
-600
100 200 300 400 500
DIF
100000
80000
60000
40000
20000
0
100 200 300 400 500
XT
10
Yt ln( Xt )t
12
11
10
4
100 200 300 400 500
LNXT
11
Clasificarea seriilor de timp
După natura intervalului de timp:
- de momente (serii de stoc)
- valoarea determinată prin însumarea termenilor nu
are semnificaţie concretă
- e.g. populaţia României măsurată la recensăminte
- de intervale(serii de flux)
- hibride
12
Clasificarea seriilor de timp
După proprietăţile mulţimii de valori:
Serii de timp exprimate sub forma
mărimilor absolute: e.g. PIB
300.00%
250.00%
200.00%
150.00%
100.00%
50.00%
0.00%
98
3 4 86
9
7 89
9 99
0 1 93
9
4 96
9 99
7 8 00
0
1
00
03
0 00
4 5
1 1 1 1 1 1 1 2 2 2 2
198 1985 198 1988 199 1992 199 1995 199 1999 2002 200 14
Indicatorii seriilor temporale
Utilizare – compararea a două sau
mai multe serii cronologice
Indicatori absoluti
Indicatori relativi
Indicatori medii
15
Indicatori medii
YT Y1
Modificarea medie absolută:
T 1
Y
Indicele mediu de dinamică: T
I T 1
Y1
Ritmul mediu al dinamicii:R I1
16
Nivelul mediu al seriei
17
Nivelul mediu al seriei
- se calculează pentru fiecare perioadă de timp, cuprinsă între două
momente succesive, nivelul mediu al caracteristicii;
– se determină apoi media aritmetică ponderată :
n Y t
i i
i=1
Y= n .
ti
i=1
Trendul
Componenta sezonieră
Componenta ciclică
Componenta aleatoare
19
Fazele unui ciclu economic
20
Componentele seriilor de timp
ˆ
Modelul aditiv: Yt Yt S t Ct t
- dacă amplitudinea oscilaţiilor este constantă de-a lungul
timpului
ˆ
Modelul multiplicativ: Yt Yt * S t * C t * t
- dacă amplitudinea oscilaţiilor este variabilă de-a lungul
timpului
21
Trendul
Metode mecanice
metoda modificării medii absolute
metoda indicelui mediu de dinamică
metoda mediilor mobile
Metode analitice
funcţie liniară de gradul I
funcţie parabolică
funcţie exponenţială
22
Metoda modificării medii absolute
Se foloseşte cînd diferenţele a oric ăror doi
termeni consecutivi sînt constante şi egale cu
Ecuaţia trendului:
Yt Y1 (t 1), t 1..T
Se determinăsuma pătratelor erorilor de ajustare
T
SSE (Yt Yt )2
t1
23
Exemplu
Volumul vînzărilor de apă minerală în România (mii cases)
14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
l00 0 l01 2 2 l02 0 l03 0 l04 0 l05 6
0 0
Ju an
J
Ju Ju Ju n Ju an
J
Ju
Apr00 Oct00 Apr01 Oct01Jan Apr0 Oct02Jan Apr03 Oct03Ja Apr04 Oct04 Apr05 Oct05Jan
Y Y ( I ) t 1, t 1..T
t 1
25
Trendul-funcţie liniară de timp
Modelul: Yt o1tt
Presupunem îndeplinite ipotezele modelului liniar
de regresie
Estimatorii parametrilor modelului se obţin prin
M.C.M.M.P. ca soluţii ale sistemului:
ˆ ˆ
0n 1 tYt 0
t t
ˆ ˆ
0 t 1 t 2Yt t
t t t
1
Y
t *t 2 Y t t *t
t t t t
nt 2 (t ) 2
t t
n Y t tt *Y t
t t t
nt 2 ( t)2
t t 26
Exemplu
Volumul vînzărilor de apă minerală în România (mii cases)
14,000
12,000
10,000
8,000
6,000
28
Metoda mediilor mobile
Se foloseşte pentru filtrarea componentei sezoniere
şi a componentei aleatoare k p
1
Media mobilă de ordinul p : Y p Yt , k 0,T p .
p
tk1
Date lunare p=12
Date trimestriale p=4
29
30
Media mobilă de ordinul 12
Volumul vînzărilor de apă minerală în România(mii cases) Actual
Forecast
14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
0 4 5 6
Jul Jul01 Jul02 Jul03 Jul04 Jul05 t05
Apr00 Oct00 Jan01Apr01 Oct01 Jan02Apr02 Oct02 Jan03Apr03 Oct03 Jan04Apr04 Oct0 Jan05Apr0 Oc Jan0
31
Stationaritatea seriilor de
timp si modelele AR(I)MA
21 mai 2015
1
Staţionaritatea unei serii de timp
Proprietăţile unei serii staţionare:
Are media constantă de-a lungul timpului(i.e. nu prezintă
trend)
Are dispersie constantă de-a lungul timpului
Corelaţia de-a lungul timpului depinde de legătura dintre
Yt şi Y la lagul k, (Yt-k) şi nu depinde de alte variabile
Cum recunoaştem o serie staţionară?
Analiza grafică
Evoluţia funcţiei de autocorelaţie(ACF) şi autocorelaţie
parţială(PACF)
Testul Dickey-Fuller
2
Funcţia de autocorelaţie-ACF
3
Seriile nestaţionare au ACF care
converge “încet” spre zero
În general, se consideră că dacă după 5 paşi
valoarea ACF este mai mare decît 0.7, atunci
seria este nestaţionară.
Seriile staţionare au ACF care converg
4
Funcţia de autocorelaţie parţială-PACF
Măsoară corelaţia între Yt şi Yt-k fără a ţine cont de
corelaţiile dintre Yt şi Yt-1, Yt-2....
De exemplu, există o corelaţie între Yt şi Yt-1 care
este măsurată prin ACF(1); de asemenea, există o
corelaţie între Yt-1 şi Yt-2 care este măsurată tot de
ACF(1). Dar corelaţia dintre Yt şi Yt-2, dincolo de
cea măsurată prin ACF(1) sau ACF(2) este dată de
PACF(2)
Coeficienţii de autocorelaţie parţială se obţin prin
modele de regresie
5
Ipoteza de rădăcină unitară-Unit Root
6
Testul Dickey-Fuller(Unit Root Test) (1)
Presupunem următorul model de serie temporală:
ˆˆ ˆ
Yt0 ˆYt 11tt
Dacă |ρ|=1, atunci seria nu este staţionară
Dacă ß1 este semnificativ diferit de zero (din punct de
vedere al testului t) atunci staţionaritatea se obţine eliminând
componenta trend
Dacă ß1 nu este semnificativ diferit de zero (din punct de
vedere al testului t) atunci staţionaritatea se obţine cu diferenţe
de ordinul 1 sau 2
7
Testul Dickey-Fuller(Unit Root Test) (2)
8
Modele Auto Regresive (AR)
9
Modele de medie mobilă (în engleză
Moving Average) (MA)
Sunt acele modele care presupun că nivelul
fenomenului urmează unei acţiuni compensatorii în
vederea contracărării unor “acţiuni” din afara
sistemului.
Se consideră că nivelul fenomenului din perioada t
depinde de erorile din trecut (erori în sensul abaterii
faţă de normal, sau faţă de medie) aşa încât
devierea (sau devierile) accidentală este urmată de
o redresare.
Eroarea sau componenta reziduală (ut) este
presupusă a fi un zgomot alb (“white noise”).
Zgomot alb – o componentă pur aleatoare de medie zero şi
dispersie finită dar diferită de zero
10
Modele de medie mobilă (MA)
Model de medie mobilăde ordinul 1: (MA1)
ˆ
Yt Y ˆ1ut 1 ut
Model de medie mobilăde ordinul 2: (MA2)
ˆ
Yt Y ˆ1ut 1 ˆ2 ut 2 ut
Model de medie mobilăde ordinul q: (MAq)
ˆ
Yt Y ˆ1ut 1 ˆ 2 ut 2 ... ˆq ut q ut
11
Modele ARMA (Auto Regressive
Moving Average)
Modelează fenomenele sau procesele când sunt
prezente ambele categorii de evoluţii (AR şi MA).
Pentru p=1 şi q =1 vom avea ARMA (1,1)
ˆ ˆ ˆ
Y ˆu ut
Yt0 1 t1 1 t 1
12
Modele ARIMA (Auto Regressive Integrated Moving
Average) ARIMA (p,d,q)
În al doilea caz vom avea ARIMA de ordinul 2
(integrate de ordinul 2 – sau calculat diferenţe de
2
ordinul 2).
Y Y Y
t t t1
13