Documente Academic
Documente Profesional
Documente Cultură
Prof.univ.dr.Liviu-Stelian BEGU
Departamentul de Statistica si Econometrie
Email:liviubegu@yahoo.co.uk
Curs obligatoriu – an III; sem.I; R.E.I.
Numar cursuri: 14
Numar seminarii: 7
Evaluare:
- test + prezenta: 40% (3pct.)
- examen final: 60% (7pct.)
PROIECT ECONOMETRIE AN III ZI, REI
Problema A.
Înregistrați pentru cel puțin 30 unitati, valorile specifice ale
unor caracteristici (X1, X2 si Y) intre care exista o legătura
logica. Datele prezentate sub forma tabelara fac parte din
lucrare. Se cer următoarele:
a) prezentarea problemei;
b) definirea modelului de regresie;
- forma, variabilele si parametrii modelului de regresie
-aproximarea grafica a modelului legăturii dintre variabile
PROIECT ECONOMETRIE AN III ZI, REI
Problema B.
Sa se identifice o serie cronologica de cel puțin 16 înregistrări
privind evoluția unui fenomen economic (luna, trimestru,
semestru, an).
a) Sa se analizeze aceasta serie din punct de vedere al
componentelor sale si sa efectueze previziunea pentru
următoarele doua perioade
b) Sa se analizeze stationaritatea seriei.
STRUCTURA CURSULUI
domeniul;
natura;
numarul variabilelor explicative;
gradul de detaliere;
forma functiei.
TIPOLOGIA MODELELOR ECONOMETRICE
Testele parametrice
presupun cunoasterea distributiei populatiei (legii de distributie)
considerate. Cel mai cunoscut este testul Student (testul t). De
asemenea, acesta este utilizat pentru testarea valorii unui
coeficient de regresie, precum si a valorii coeficientului de
corelatie.
In testarea ipotezelor statistice se
disting doua tipuri de teste:
Testele neparametrice presupun testarea ipotezelor statistice
fara a cere specificarea formei parametrice a distributiei
populatiilor comparate:
- testul Wilcoxon (utilizat pentru a verifica, pe baza de sondaj,
daca exista diferente semnificative intre doua populatii),
- testul Mann-Whitney (utilizat pentru verificarea existentei
egalitatii dintre doua populatii),
- testul Kolmogorov-Smirnov (testeaza identitatea a doua functii
de repartitie), etc.
Concepte
Se fac presupuneri despre populaţia sau populaţiile ce sunt
eşantionate (normalitate etc.).
Se calculează apoi testul statistic şi se determină valoarea sa
numerică, pe baza datelor din eşantion.
Se desprind concluziile: ipoteza nulă este fie acceptată, fie
respinsă, astfel:
dacă valoarea numerică a testului statistic cade în regiunea critică (Rc),
respingem ipoteza nulă şi concluzionăm că ipoteza alternativă este
adevărată. Această decizie este incorectă doar în 100 α % din cazuri;
dacă valoarea numerică a testului nu cade în regiunea critică (Rc), se
acceptă ipoteza nulă H0.
Concepte
Ipoteza alternativă poate avea una din trei forme (pe care le vom
exemplifica pentru testarea egalităţii parametrului „media
colectivităţii generale“, μ cu valoarea μ0)
test bilateral:
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
test unilateral dreapta:
H0: μ = μ0
H1: μ > μ0
test unilateral stânga:
H0: μ = μ0
H1: μ < μ0
Concepte
μ μ μ
a) b) c)
Regiunea critică pentru a) test bilateral; b) test unilateral stânga; c) test unilateral dreapta
Testarea ipotezei privind media
populaţiei generale (μ) pentru
eşantioane de volum mare
Utilizarea eşantioanelor de volum mare (n > 30) face posibilă
aplicarea teoremei limită centrală.
În cazul testului bilateral, ipotezele sunt:
H0: μ = μ0 (μ - μ0=0)
H1: μ ≠ μ0 (μ - μ0≠0) (adică μ < μ0 sau μ > μ0);
x 0 x 0 x 0
z
x x n sx n
t>t α,n-1
t<-t α,n-1
Exemplu
Conducerea unei companii apelează la 5 experţi pentru
a previziona profitul companiei în anul curent. Valorile
previzionate sunt 2,6; 3,32; 1,80; 3,43; 2,00 (miliarde lei).
Ştiind că profitul în anul anterior profitul a fost de 2,01 miliarde
lei, se poate concluziona cu o probabilitate de 95% că media
previziunilor experţilor este semnificativ mai mare decât cifra
anului anterior ?
Rezolvare:
E1: H 0 : μ = μ0
H 1 : μ > μ0
E2: Se alege nivelul de încredere al testului statistic
(1 ) 95% 0.05
E3:se stabileşte testul statistic utilizat drept criteriu de
acceptate sau respingere a ipotezei nule ( H0 ), în funcţie de
volumul eşantionului şi obiectivul urmărit
volum mic ( n 30 ) -> testul ”t”
H1:μ>μ0 - testul unilateral dreapta
E4: se calculează valoarea numerică a testului
statistic pe baza datelor din eşantion
2,6 3,32 1,8 3,43 2
x 2,63
5
S
2 i
( x x ) 2
2,203
0,5507 S x S x2 0,74
n 1
x
4
x 0 x 0 2,63 2,01
t 1,874
sx sx n 0,74 5
E5Se determină astfel:
Rc : t t ,n 1
t ,n 1 t0, 05; 4 2,132
Se caută în tabelul cu valorile repartiţiei Student în funcţie de
probabilitate P(t t ) şi numărul gradelor de libertate (f=n-
1)
Nivel de semnificaţie pentru testul bilateral
n 0,50 0,20 0,10 0,05 0,02 ...
1 1,000 3,078 6,314 12,706 31,821 ...
... ... ... ... ... ... ...
4 0,741 1,533 2,132 2,776 3,747 ...
... ... ... ... ... ... ...
n 0,25 0,10 0,05 0,25 0,01 ...
Nivel de semnificaţie pentru testul unilateral
E6:Se verifică dacă valoarea testului cade în regiunea critică
şi se ia decizia
Cum t 1,874 t0, 05; 4 2,132
acceptăm ipoteza nulăH 0 şi respingemH1
Exemplu:
Managerul unui lnaţ de magazine consideră în urma unei analize financiare că - pentru un
nou produs - comercializarea este profitabilă, dacă procentul cumpărătorilor care ar dori să
achiziţioneze produsul este mai mare de 12%. El selectează 400 de cumpărători potenţiali
şi află că 52 dintre aceştia vor achiziţiona produsul. Pentru o probabilitate de 99% sunt
suficiente dovezi care să convingă managerul să comercializeze produsul?
Ipotezele sunt:
H 0 : p 0,12
H1 : p 0,12 test unilateral dreapta).
Testul statistic este:
f 0,12 0,14 0,12 0,02
z 1,15
f (1 f ) / n 0,14 0,86 / 400 0,017
Cum z z 0.01 2,33 şi z z ,rezultă că nu ne aflăm în regiunea critică (Rc), nu avem
suficiente dovezi să respingem ipoteza nulă, deci procentul nu este mai mare de 12%.
TESTAREA IPOTEZEI PRIVIND
DIFERENŢA DINTRE DOUĂ MEDII
PENTRU EŞANTIOANE DE VOLUM REDUS
Se fac presupunerile:
ambele colectivităţi generale din care s-au extras eşantioanele sunt
normal sau aproximativ normal distribuite;
eşantioanele aleatoare sunt selectate independent unul de celălalt.
În condiţiile în care presupunem că cele două colectivităţi
generale au dispersii egale ( = = ), un estimator al
2 2 2
x1 x2 x
i x1 i x2
s 2 i 1 i 1
n1 n 2 2
c
sau s 2
n 1 1s 2x1 n 2 1s 2x 2 n 1 1s 2x1 n 2 1s 2x 2
c
n 1 1 n 2 1 n1 n 2 2
TESTAREA IPOTEZEI PRIVIND
DIFERENŢA DINTRE DOUĂ MEDII
PENTRU EŞANTIOANE DE VOLUM REDUS
Dacă dispersiile nu sunt egale (σx1 ≠ σx2), atunci testul sta-
tistic are forma:
(x 1 x 2 ) D
t
s 12 s 22
n1 n2
cu gradele de libertate:
s 2
1/n1 s 22 /n2
2
s c2
8 10,485 2 12 10,635 2
0,3379
8 12 2
Ipotezele statistice sunt:
H0: μ1 = μ2 (μ1- μ2 = 0),
H1: μ1 ≠ μ2 (μ1- μ2 ≠ 0) [μ1> μ2 sau μ1< μ2].
TESTAREA IPOTEZEI PRIVIND
DIFERENŢA DINTRE DOUĂ MEDII
PENTRU EŞANTIOANE DE VOLUM REDUS
Exemplu
Testul statistic este:
t
5,696 5,273 0 0,423
1,5943
1 1 0,2653
0,3379
8 12
Cum tα/2,n1+n2-2= t0,05;18 = 1,734, se observă că t < tα/2,n1+n2-2, aşadar nu ne aflăm în
regiunea critică.
Rezultă, deci, că nu există suficiente dovezi pentru a concluziona că sunt diferenţe
semnificative între cheltuielile de funcţionare ale celor două mărci de autoturisme.
ELEMENTE DE ANALIZĂ
DISPERSIONALĂ (ANOVA)
ELEMENTE DE ANALIZĂ
DISPERSIONALĂ (ANOVA)
Analiza dispersională (analiză de varianţă) (ANOVA), a fost introdusă de
statisticianul Irving Fisher.
Media y1 y2 ..... yr
Vol. grupă n1 n2 . . . .. nr
Analiză dispersională unifactorială
Presupunerile sub care se aplică testul F în analiza dispersională
unifactorială:
cele r grupe din eşantion sunt extrase aleator şi independent din cele r grupe
ale colectivităţii generale;
fiecare grupă din colectivitatea generală are o distribuţie normală, iar abaterile
medii pătratice sunt egale s1 = s2 = ..... = sr.
Testul statistic F pentru analiza dispersională unifactorială este raportul
indicatorilor de variabilitate pentru cele două surse de variaţie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.
Dacă ipoteza nulă este adevărată, mediile celor r populaţii ar trebui să fie,
toate, egale. Ne aşteptăm atunci ca mediile celor r eşantioane să fie
aproximativ egale.
Dacă ipoteza alternativă este adevărată, există diferenţe mari între unele
medii ale eşantioanelor.
Analiză dispersională
unifactorială
a) b)
a) medii de grupă egale; b) mediile de grupă inegale
Analiză dispersională unifactorială
pe baza datelor din eşantion calculăm:
ni
y
j 1
ij
yi , i 1, r
ni
r ni r
y
i 1 j 1
ij y n i i
y i 1
n n
r
n ni
i 1
Analiză dispersională unifactorială
Varianţa dintre grupe, dată de influenţa factorului cauzal, numită şi
varianţa factorială, este suma pătratelor abaterilor mediilor de grupă de
la media generală:
r
S1 y i y n i
2
i 1
Dacă y1 y 2 ... y r
atunci: S1 = 0.
varianţa din interiorul grupelor (varianţa reziduală), este suma
pătratelor abaterilor valorilor individuale de la mediile de grupă:
r ni
S2 y ij y i
2
i 1 j1
i 1 j1
Analiză dispersională unifactorială
Raţionamentul analizei dispersionale se bazează pe partiţionarea sumei
pătratelor abaterilor:
y y y y n y
r ni 2 r 2 r ni
2
ij i i ij y i
i 1 j1 i 1 i 1 j1
Obţinem astfel:
dispersia factorială corectată:
y
r 2
i y ni
S
s12 1 i 1
r 1 r 1
y
r ni 2
ij yi
S i 1 j1
s 22 2
nr nr
Analiză dispersională unifactorială
Statistica F pentru analiza dispersională unifactorială are forma:
s12 var iabilitate a dintre grupe
F 2
s 2 variabilit atea din interiorul grupelor
cu gradele de libertate (r – 1) la numărător şi (n – r) la numitor.
Regiunea critică este dată de :
acest lucru indică diferenţe mai mari între mediile grupelor decât cele
datorate întâmplării.
Analiză dispersională unifactorială
dacă valoarea F este mai mică decât valoarea critică Fα, atunci :
acceptăm ipoteza nulă, H0;
nu acceptăm ipoteza alternativă H1;
mediile grupelor nu sunt semnificativ diferite una faţă de alta;
diferenţele observate între mediile grupelor pot fi datorate doar întâmplării;
rezultatul nu este semnificativ statistic.
Dacă valoarea F este mai mare decât valoarea critică Fα, atunci:
acceptăm ipoteza alternativă, H1;
respingem ipoteza nulă, H0;
mediile grupelor sunt semnificativ diferite una faţă de alta;
diferenţele observate între mediile grupelor nu sunt datorate doar întâmplării;
rezultatul este semnificativ statistic.
Analiză dispersională unifactorială
Calculul statisticii F
pentru analiza dispersională unifactorială
Sursa Gradele de Varianţa Dispersia corectată Statistica
variaţiei libertate (suma pătratelor) (media pătratelor) F
0 1 2 3 4
I S s 12
Primul factor I–1 S1 JK x i.. x
2
s 1
2
F 2
I 1
1
i 1
s4
IK x x
J 2 S2 s 22
Al doilea factor J–1 S2 . j. s 22 F 2
j1 J 1 s4
s 32
I J
S 3 K x ij. x i.. x . j. x
Interacţiunea
2 S3
s
2
F 2
I 1J 1
(I-1)(J-1) 3
celor doi factori i 1 j 1
s4
S4
I J K
S 4 x ijk x ij. s 24
2
Reziduală IJ(K-1)
i 1 j1 k 1 IJ K 1
x
I J K 2
Totală IJK–1 S ijk
x
i 1 j1 k 1
Modelul de analiză dispersională
bifactorială
media celulei este:
K
x ijk
x ij . k 1
K
media grupei i ( i 1, I ) pentru primul factor este:
J K
x
j1 k 1
ijk
x i..
JK
media grupei j ( j 1, J ) pentru al doilea factor este:
I K
x ijk
x . j. i 1 k 1
IK
media totală este:
I J K J
x x
I
i 1 j1 k 1
ijk x i ..
j1
. j.
x i 1
IJK I J
Concluzii
38.97
F 1.42
27.27
F0.05;7;34 2.40
F F0.05;7;34 H 0
Modelul de regresie
clasic
Specificarea unui model de
regresie
Yi = Yi' + i
Specificarea unui model de
regresie
Dacă datele disponibile provin dintr-un eşantion avem la
dispoziţie n perechi de observaţii (x1, y1), (x2,y2), ... (xn, yn),
pe care le vom folosi pentru estimarea parametrilor ecuaţiei
de regresie liniară simplă, şi .
Modelul de regresie liniară în eşantion este:
yi = a + bxi + ei
cu componenta predictibilă:
ŷi a bx i
a şi b sunt estimatorii punctului de intercepţie () şi pantei liniei
drepte (), obţinuţi pe eşantion
ei este valoarea reziduală (pentru unitatea i) în eşantion:
ei = yi – (a + bxi)
Ipotezele modelului de regresie
liniară
Pentru a obţine proprietăţile dorite ale estimatorilor regresiei, se
fac, de obicei, cinci presupuneri (ipoteze) standard pentru modelul
din populaţia generală:
y=a+bz, z=ex a be x
1
a b
x
800
y=a+br, r=1/x
y=a+bq, q=ln(x)
600
a bx
400
Sau 200
a b ln x
y=Ax ln(y)=+ln(x) 0
-1 0. 003 0. 008 0. 013 0. 018 0. 023 0. 028 0. 033 0. 038 0. 043 0. 048 0. 053 0. 058 0. 063 0. 068
X
f(yi)= +g(xi)+i
1 -400
Contra exemplu: y
x
Modele ce pot fi linearizate
nu poate fi transformat în model liniar.
Erorile
Ipoteza de linearitate a modelului include şi aditivitatea
erorilor.
Forma modelului:
y = + x + ,
De exemplu modelul y Ax e se transformă prin
logaritmare în modelul liniar: ln(y)=ln(A)+ln(x)+ .
Însă modelul y Ax nu mai poate fi transformat în
model liniar.
Dacă ipoteza de linearitate este verificată, variabila
dependentă observată este suma a două elemente:
un termen nestochastic: +x
o variabilă aleatoare
Ipoteza 2: normalitatea erorilor
Se presupune că variabila aleatoare i este normal
distribuită :
1000
800
consum
600
400
200
0
200 300 400 500 600 700 800 900 1000
venit
Ipoteza 4 (de homoscedasticitate):
Var(i)= constantă i
2
a) b)
Dispersia reziduurilor a) constantă; b) variabilă
Discuţie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile firmelor
mici.
Variaţia cheltuielilor gospodăriilor în funcţie de venit sau de mărimea
lor poate fi
Ipoteza 5: Non autocorelarea
erorilor: μ(ij)=0 ij
Această ipoteză nu implică faptul că yi şi yj sunt necorelate,
ci faptul că deviaţiile observaţiilor de la valorile lor aşteptate
sunt necorelate.
Variabilele aleatoare i sunt statistic independente una de
alta, adică = 0, pentru i j.
i j
Acest lucru înseamnă că eroarea asociată cu o valoare a
variabilei Y nu are nici un efect asupra erorilor asociate cu
alte valori ale lui Y;
Nu există deci corelaţie între reziduuri;
OBSERVAŢIE: Este convenabil a considera că erorile sunt
independente şi normal distribuite cu medie zero şi
variaţie constantă pentru obţinerea de rezultate statistice
exacte.
Estimarea parametrilor
modelului de regresie clasic
Parametrii necunoscuţi ai reacţiei stochastice sunt cei ce trebuie estimaţi:
yi = + xi + i, i=1,n
Modelul estimat va fi scris:
y i a bxi , i 1, n
Eroarea asociată unui punct i este:
i = yi - - xi
Pentru orice valori estimate a şi b, erorile estimate vor fi:
ei = yi - a - bxi
Pentru estimarea parametrilor şi pe baza datelor observate, un
criteriu natural este cel de maximizare a potrivirii modelului cu datele
observate, deci de minimizare a erorilor observate:
min ei2 min ( yi a bxi ) 2
i i
Estimarea parametrilor
modelului de regresie clasic
Condiţiile de ordin 1 de minimizare a funcţiei sunt:
( ei2 )
i 0 yi na ( xi )b
a
i i
( ei2 ) 2
i 0 i i
x y ( i
x ) a ( i )b
x
b i i i
a y bx
n yi
i
xi xi yi xi yi n x y
i i
b n xi
i
2 2
i
xi n x
2 i
xi xi
i i
Estimarea parametrilor
modelului de regresie clasic
Rămâne de verificat dacă este verificată condiţia de ordin 2, adică soluţia găsită
este un punct de minim. Matricea derivatelor parţiale de ordin doi trebuie să fie
pozitiv definită:
2 ( ei2 ) 2 ( ei2 )
2 2
i i
2n 2 xi
a ab i
2 2 x
2 ( ei2 ) 2
( ei ) 2 xi2
i
i
i
i i
ba
2b 2
2 n 0
2
2 xi 0
i
2 2 2
4 n x i 4( xi ) 4 n ( xi x ) 0
i i i
Deci matricea este pozitiv definită.
Modele cu variabile dummy
Noţiuni
Exemplu:
- sexul persoanei: 1 -masculin şi 0 - feminin.
Modele ANOVA (modele de
analiză a variaţiei)
Sunt modelele în care variabilele independente sunt
variabile dummy.
a. Modele cu o variabilă dummy
Forma generală a modelului ANOVA cu variabile
dummy este:
Y= β0+ β1Di+ε
unde: Di este variabila dummy: D1=1 (de exemplu, în
cazul persoanelor de sex masculin) sau D2=0
(în cazul persoanelor de sex feminin);
β0 este nivelul mediu al variabilei Y pentru
categoria Di=0
β1 arată cu cât este mai mare valoarea medie a
variabilei Y pe cele două categorii (diferenţa dintre
nivelul mediu al variabilei Y pentru categoria 1 şi
nivelul mediu al variabilei Y pentru categoria 0).
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 10,600 ,592 17,917 ,000
sexul 6,600 ,837 ,941 7,889 ,000
a. Dependent Variable: salariu
Model Summary
Sum of
Model Squares df Mean Square F Sig.
1 Regres sion 108,900 1 108,900 62,229 ,000a
Residual 14,000 8 1,750
Total 122,900 9
a. Predic tors : (Constant), sex ul
b. Dependent Variable: s alariu
Interpretare:
Coeffi cientsa
b2 = – 4,612 este estimaţia diferenţei
Unstandardized St andardiz ed
dintre salariul mediu
al angajaţilor cu studii liceale
Coeffic ient s şi al celor
Coeffic ient scu studii superioare
Model B St d. E rror Beta t Si g.
1 (Const ant) 15,187 1,020 14,884 ,000
D1 -8, 453 1,285 -,907 -6, 580 ,000
D2 -4, 612 1,395 -,456 -3, 307 ,004
a. Dependent Variabl e: s alari u
2
Y= β0 + β1Di+ β2X+ε
unde:
Y este variabila dependentă numerică;
Di variabila independentă dummy;
X este variabila independentă numerică;
β0 valoarea lui Y când Di=0 şi X=0.
β1 arată diferenţa dintre valoarea medie a variabilei
Y pe cele două categorii (categoria 1 şi categoria 0).
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3,109 2,592 1,199 ,276
sexul 5,757 ,689 ,778 8,351 ,000
ani_scoala ,480 ,165 ,272 2,914 ,027
a. Dependent Variable: salariu
b0= 3,109 mil.lei/lună reprezintă nivelul mediu al
salariului persoanelor de sex feminin, în condiţiile
în care nivelul studiilor este X=0.
Forma modelului:
Y= β0+ β1Di1+ β2Di2+ β3X+ε
Interpretare:
1
Componentele unei serii cronologice
▪ Dacă datele statistice sunt transversale (dinamice), adică dacă
variabila este măsurată în timp, în ordine secvenţială, atunci, în urma
sistematizării, se obţine o serie cronologică de tipul:
1 2 ... t ... n t
, t 1, n
y1 y 2 ... yt ... y n y t
Componenta
Componenta Componenta Componenta
Denumire de lungă
sezonieră ciclică reziduală
durată
Tip Sistematică Sistematică Sistematică Nesistematică
Fluctuaţii Fluctuaţii Fluctuaţii
regulate ce aproximativ reziduale
apar în regulate ce (întâmplătoar
Tendinţa de
interiorul unei apar la e), care
Definiţie modificare pe
perioade de intervale de rămân după
termen lung
12 luni şi se timp mai mari evidenţierea
repetă an de de 1 an de celorlalte
an zile componente
Evenimente
Schimbări în neprevăzute
Condiţii Interacţiunea
populaţie, (greve,
climaterice, unor factori
tehnologie, inundaţii,
obiceiuri ce
educaţie, războaie etc.)
religioase, influenţează
Factori de nivel de trai sau variaţii
influenţă sociale etc. economia
etc. aleatoare ale
datelor
Un număr Mai mică sau Durată scurtă
De obicei 2-
Durată mare de egală cu 12 şi care nu se
10 ani
termeni luni repetă
3
Modelul general al unei serii cronologice poate fi exprimat ca:
▪ un model aditiv
▪ ca un model multiplicativ
• Metode mecanice:
1. metoda modificării medii absolute
2. metoda indicelui mediu de modificare
3. metoda mediilor mobile.
5
Estimarea componentei trend prin metoda mediilor mobile (MMM)
8
Anul Trimestrul Perioada (t) yt ytT(MM)
0 1 2 3 4
I 1 940 —
II 2 650 —
2003
III 3 1934 1222
IV 4 1360 1231
I 5 952 1255
II 6 706 1278
2004
III 7 2072 1289
IV 8 1406 1297
I 9 992 1303
II 10 734 1314
2005
III 11 2088 1327
IV 12 1478 1332
I 13 1026 1346
II 14 740 1360
2006
III 15 2190 —
IV 16 1492 —
9
▪ Prima medie mobilă centrată este:
y1 y5
y 2 y3 y 4
y 3TMM 2 2
4
940 952
650 1934 1360
y3TMM 2 2 1222
persoane.
4
▪ Cea de-a doua medie mobilă centrată este:
650 706
1934 1360 952
y4TMM 2 2 1231
persoane
4
ş.a.m.d.
10
Reprezentarea grafică ilustrează modul în care
mediile mobile permit determinarea tendinţei de lungă
durată, prin eliminarea oscilaţiilor sezoniere.
2500
2000
persoane
1500
1000
500
0
Tr. I Tr. II Tr. Tr. Tr. I Tr. II Tr. Tr. Tr. I Tr. II Tr. Tr. Tr. I Tr. II Tr. Tr.
'03 '03 III IV '04 '04 III IV '05 '05 III IV '06 '06 III IV
'03 '03 '04 '04 '05 '05 '06 '06
11
Estimarea componentei sezoniere
• Variaţiile sezoniere pot să apară în interiorul unui an sau
chiar al unui interval mai scurt de timp, cum ar fi luna,
săptămâna sau ziua.
• Deci, pentru studiul statistic al componentei sezoniere
este necesar să avem la dispoziţie date sistematizate pe
intervale de timp mai mici de un an de zile.
• Pentru a măsura efectul sezonier putem determina
devieri sezoniere sau indici de sezonalitate.
• Devierile sezoniere măsoară, în medie, abaterile
fiecărui sezon de la trend, iau valori pozitive şi negative,
astfel încât suma devierilor sezoniere, pentru toate
sezoanele, este egală cu zero.
• Indicii de sezonalitate măsoară, în medie, de câte ori
se abate variabila, în fiecare sezon, de la trend, iau
valori supraunitare sau subunitare, astfel încât produsul
lor este egal cu 1.
12
Determinarea devierilor sezoniere
Pentru determinarea devierilor sezoniere se parcurg următorii paşi:
yt-ytT=ytS+ytR.
14
Pentru fiecare sezon vom determina media abaterilor:
303 (311) (320)
– pentru trimestrul I: 311,3 ;
3
15
Cum suma acestor medii ale abaterilor este diferită de zero:
4
y
k 1
Sk (311,3) (590,7) 752 128 22
,
22
vom ajusta mediile calculate cu valoarea 4 5,5 , obţinând
devieri sezoniere, astfel:
16
• Devierile sezoniere în trimestrele I şi II sunt
negative (niveluri sub trend), iar trimestrele III şi
IV sunt pozitive (vârfuri de activitate)
17
Determinarea indicilor sezonieri
▪ Pentru determinarea indicilor de sezonalitate, metodologia
este similară, parcurgându-se paşii:
19
Pentru fiecare sezon determinăm media valorilor astfel obţinute:
20
▪ Cum produsul acestor medii (geometrice) este diferit de 1:
4
y
k 1
Sk 0,761 0,555 1,588 1,099 0,737 , vom ajusta mediile calculate cu media
yS1=0,761:0,9265=0,821
yS2=0,555:0,9265=0,599
yS3=1,588:0,9265=1,714
yS4=1,099:0,9265=1,186
4
Acum y
k 1
Sk 1
. 21
• Indicii de sezonalitate arată că, în medie, sosirile de turişti:
- în trimestrele III şi IV se află peste tendinţa de lungă durată cu
71,4%, respectiv cu 18,6%
- în trimestrele I şi II, sosirile de turişti se situează sub linia de trend
cu 17,9%, respectiv cu 40,1%.
• În previzionarea sosirilor de turişti va trebui să ţinem cont, pentru
fiecare trimestru, de influenţa factorului sezonier, influenţă
determinată sub forma devierilor sezoniere sau a indicilor de
sezonalitate.
• După ce am determinat devierile sezoniere ori indicii de
sezonalitate, vom desezonaliza seria cronologică ((yt-ySk) pentru
devieri şi yt/ySk pentru indici).
• Rezultatele astfel obţinute vor conţine doar componenta trend (ytT)
şi componenta reziduală (ytR).
• Putem acum să determinăm tendinţa de lungă durată, aplicând
o metodă mecanică ori analitică.
• Trebuie subliniat că in etapa de previzionare, va trebui să ţinem cont
şi de devierile sezoniere sau de indicii de sezonalitate.
22
Previzionarea fenomenelor afectate de sezonalitate
▪ În cazul fenomenelor afectate de sezonalitate, nivelurile
previzionate, pentru tendinţa pe termen lung pe sezoane, vor trebui
corectate cu factorul sezonier.
▪ Astfel, în cazul în care am determinat devieri sezoniere, paşii
pentru previzionare sunt:
y( n p ) y( n p )T ySk 23
Exemplu
25
▪ În cazul în care factorul sezonier a fost măsurat prin indici de
sezonalitate, atunci, pentru previzionare parcurgem paşii:
1. Pentru seria desezonalizată ( yt / ySk ytT ytR ) se determină trendul
( y tT ), folosind o metodă mecanică sau analitică.
2. Pentru perioada viitoare, se previzionează componenta de
trend y ( np )T .
3. Se corectează (prin înmulţire) valorile previzionate pe
sezoane, cu indicii de sezonalitate ( y Sk ) pentru a obţine previziunea
26
Exemplu
27
Previzionarea sosirilor trimestriale de turişti
28
Se cunosc următoarele date privind
evoluția exportului si importului unei
țări in perioada 2002-2015:
ANUL IMP (Y) EXP (X)
mld.euro mld.euro
2002 6.1 7.9
2003 6.4 9.1
2004 7.4 9.9
2005 7.4 10.5
2006 7.9 9.8
2007 11.2 13.1
2008 12.7 16.0
2009 14.6 17.4
2010 15.6 19.5
2011 18.9 24.2
2012 22.2 30.0
2013 25.8 37.6
2014 29.5 47.3
2015 33.6 51.8
Se cer următoarele:
a) Să se specifice modelul econometric care
descrie legătura dintre cele doua
variabile;
d) Să se verifice semnificațiile
estimatorilor și verosimilitatea
modelului;
unde:
valorile teoretice ale variabilei „y”
obținute numai in funcție de valorile
factorului „x” si de valorile estimatorilor
parametrilor „a” si „b”, respectiv „ ” si „ ”.
Se determina si :
= 2,2869
= 0,6158
(vezi Excel).
k= nr. parametrilor
(0,64577) (0,02494)
Pct.c)
(vezi Excel)
c2) variabila reziduala (aleatoare) este de
medie nula , iar dispersia ei, ,
este constanta si independenta de X – ipoteza
de homoscedasticitate, pe baza căreia se
poate admite ca legătura dintre X si Y este
relativ stabila.
Acceptarea se poate face folosind mai multe
metode:
Stiind ca:
c4) verificarea ipotezei de normalitate a
valorilor variabilei reziduale.
in exemplu:
Pe baza calculelor se observa faptul ca
ambii estimatori sunt semnificativ diferiți
de zero, cu un prag de semnificație
Pt. exemplu:
Pct.e.)
U
VAL.REZIDUALA u2
-1.05 1.107213769
-1.49 2.223893336
-0.98 0.968175593
-1.35 1.831892429
-0.42 0.178399203
0.85 0.714521682
0.56 0.312821369
1.60 2.550736533
1.30 1.699893958
1.71 2.921587311
1.44 2.065791546
0.36 0.127279135
-1.92 3.675137726
-0.59 0.346247348
20.72359094
dispersia u 1.726965911
Regression Statistics
Multiple R 0.99220311
R Square 0.98446701
Adjusted R Square 0.98252539
Standard Error 0.70763868
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 253.89798 253.89798 507.03287 1.60175E-08
Residual 8 4.00602004 0.500752505
Total 9 257.904
RESIDUAL OUTPUT
63.37911
507.0329
Lower 95,0%
Upper 95,0%
-0.53051 2.297757
1.066521 1.309889
x y
6.1 7.9
6.4 9.1
7.4 9.9
7.4 10.5
7.9 9.8
11.2 13.1
12.7 16.0
14.6 17.4
15.6 19.5
18.9 24.2
40.0
35.0
30.0
IMPORT
25.0
20.0
15.0
10.0
5.0
0.0
7.9 9.1 9.9 10.5 9.8 13.1 16.0 17.4
import 6.1 6.4 7.4 7.4 7.9 11.2 12.7 14.6
EXPORT
19.5 24.2 30.0 37.6 47.3 51.8
15.6 18.9 22.2 25.8 29.5 33.6
IMPORT (Y) EXPORT (X)
65.54910875
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.990296727
R Square 0.980687607
Adjusted R Square 0.979078241
Standard Error 1.31414075
Observations 14
ANOVA
df SS MS
Regression 1 1052.348552 1052.348552
Residual 12 20.72359094 1.726965911
Total 13 1073.072143
1.5
1.0
0.5
VALORI "U"
0.0
0.0 10.0 20.0 30.0
-0.5
-1.0
-1.5
-2.0
-2.5
VALORI "X"
40.0 50.0 60.0
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.900647848
R Square 0.811166547
Adjusted R Square 0.787562365
Standard Error 1008.176407
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 34929643 34929643 34.36537 0.00037753
Residual 8 8131357 1016420
Total 9 43061000
RESIDUAL OUTPUT
Upper 95,0%
2288.017
1370.596
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.903328823
R Square 0.816002962
Adjusted R Square 0.76343238
Standard Error 1063.894225
Observations 10
ANOVA
df SS MS F Significance F
Regression 2 35137904 17568952 15.52205 0.002672009
Residual 7 7923096 1131871
Total 9 43061000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Lower 95,0%
Intercept 11.92893401 1069.953 0.011149 0.991416 -2518.106727 2541.965 -2518.11
Nr.ani vechime 1007.614213 185.6697 5.426919 0.00098 568.5752109 1446.653 568.5752
Gen -308.8832487 720.0936 -0.42895 0.680852 -2011.634009 1393.868 -2011.63
RESIDUAL OUTPUT
Upper 95,0% 308,88 este diferența medie de venit dintre cele două genuri
2541.965
1446.653 1007,61 înseamnă creșterea venitului atunci când vechimea crește cu un an
1393.868
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.903919667
R Square 0.817070764
Adjusted R Square 0.725606146
Standard Error 1145.797818
Observations 10
ANOVA
df SS MS F Significance F
Regression 3 35183884 11727961 8.933189477 0.012435499
Residual 6 7877116 1312853
Total 9 43061000
RESIDUAL OUTPUT
Regression Statistics
Multiple R 0.204604725
R Square 0.041863093
Adjusted R Square
-0.07790402
Standard Error
2270.967121
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 1802667 1802667 0.349537 0.570698
Residual 8 41258333 5157292
Total 9 43061000
RESIDUAL OUTPUT
Observation
Predicted Venit net (lei)
Residuals
1 5050 -1550
2 5916.666667 -1216.67
3 5916.666667 -116.667
4 5916.666667 1283.333
5 5050 -2650
6 5050 2950
7 5050 1250
8 5916.666667 -516.667
9 5916.666667 3283.333
10 5916.666667 -2716.67
Venit=5050+866,67*Gen
Upper 95,0%
Regression Statistics
Multiple R 0.779072
R Square 0.606953
Adjusted R Square
0.557822
Standard Error
1454.519
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 26136000 26136000 12.3538 0.007906
Residual 8 16925000 2115625
Total 9 43061000
Coefficients
Standard Error t Stat P-value Lower 95% Upper 95%Lower 95,0%
Upper 95,0%
Intercept 4250 593.8048 7.157234 9.64E-05 2880.684 5619.316 2880.684 5619.316
Mediu 3300 938.8879 3.514797 0.007906 1134.921 5465.079 1134.921 5465.079
RESIDUAL OUTPUT
Observation
Predicted Venit netResiduals
(lei)
1 4250 -750
2 4250 450
3 7550 -1750
4 7550 -350
5 4250 -1850
6 7550 450
7 4250 2050
8 4250 1150
9 7550 1650
10 4250 -1050
Venit=4250+3300*Mediu
3300 diferenta de venit dintre persoanele din mediu urban si cele din rural
Regression Statistics
Multiple R 0.900648
R Square 0.811167
Adjusted R Square 0.787562
Standard Error 1008.176
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 34929643 34929643 34.36537 0.000378
Residual 8 8131357 1016420
Total 9 43061000
Coefficients
Standard Error t Stat P-value Lower 95% Upper 95%Lower 95,0%
Upper 95,0%
Intercept -36.8421 1008.176 -0.03654 0.971745 -2361.7 2288.017 -2361.7 2288.017
Nr.ani vechime 983.6565 167.7965 5.862199 0.000378 596.7171 1370.596 596.7171 1370.596
RESIDUAL OUTPUT
Observation
Predicted Venit netResiduals
(lei)
1 3897.784 -397.784
2 4881.44 -181.44
3 5865.097 -65.097
4 7832.41 -632.41
5 2914.127 -514.127
6 7832.41 167.59
7 4881.44 1418.56
8 3897.784 1502.216
9 8816.066 383.9335
10 4881.44 -1681.44
Upper 95,0%
Venit net (lei) Nr.ani vechime Gen Mediu
3500 4 0 0
4700 5 1 0
5800 6 1 1
7200 8 1 1
2400 3 0 0
8000 8 0 1
6300 5 0 0
5400 4 1 0
9200 9 1 1
3200 5 1 0