Documente Academic
Documente Profesional
Documente Cultură
APLICAŢIE ECONOMETRIE
- Bucuresti -
2011
DESCRIEREA PROBLEMEI
Veniturile oricărei gospodării sunt fracţionate pentru a satisface diferitele
necesităţi ale sale. Astfel, mai întâi sunt avute în vedere necesităţile primare: hrana,
îmbrăcămintea şi locuinţa, pentru a se asigura întreţinerea funcţiilor vitale, protecţie şi
adăpost pentru toţi membrii acesteia. Este evident faptul că prima cheltuială pe care o
face orice gospodărie este cea cu alimentele, hrana reprezentând o condiţie de prima
importanţă în asigurarea existenţei omului.
Din momentul în care venitul gospodăriei trece peste un anumit prag, cheltuielile
alimentare devin relativ stabile, fiind foarte puţin legate de puterea de cumpărare a
acestuia. Acest fenomen reflectă, de fapt, legea lui Engel: pe măsură ce venitul unei
gospodării creşte, partea din el consacrată cheltuielilor alimentare rămâne relativ stabilă
din punct de vedere absolut, dar sub aspect relativ prezintă o tendinţă de scădere.
Nivelul total al cheltuielilor gospodăriei depinde de volumul veniturilor obţinute.
În România, în ultimii ani, veniturile reale ale populaţiei au fost în continuă
scădere. În aceste condiţii, veniturile au fost folosite aproape în totalitate pentru
acoperirea nevoilor zilnice – cu preponderenţă a celor alimentare – şi a plăţilor
obligatorii (impozite, taxeetc.conform datelor furnizate de INSSE).
Variabilele selectate pentru acest studiu de caz sunt cheltuielile medii cu
procurarea marfurilor alimentare şi venitul mediu şi sunt exprimate în lei. Legatura dintre
aceste doua variabile se presupune a fi mare deoarece marfurile alimentare sunt bunuri
inferioare fără de care oamenii nu pot trăi. Numărul de observaţii este de 10,
reprezentând numărul de ani supuşi cercetării (1999-2008). Sursa datelor ce stau la
baza acestui proiect este site-ul Institutului Naţional de Statistică al României
(www.insse.ro).
Încercăm să stabilim dacă cheltuielile medii cu procurarea mărfurilor alimentare
sunt influenţate de venit prin construirea unui model econometric unifactorial de forma
y=f(x)+e.
Considerăm ecuaţia de regresie yi=a+b*xi+ei , i=1…n unde :
yi = variabila endogenă -> cheltuieli medii cu procurarea mărfurilor alimentare
(lei)
xi = variabila exogenă -> venituri totale ale gospodăriei
ei = variabila reziduală reprezentată de influenţa celorlalţi factori ai variabilei y,
nespecificaţi în model, consideraţi factori întamplători cu influene nesemnificative
asupra lui y
( de ex. preţul mărfurilor alimentare)
n = numărul de ani luaţi în calcul (numărul de observaţii)
i = , sunt estimatorii parametrilor a și b
ei = yi - i = yi - xi
Prezentarea datelor
Setul de date utilizat este introdus în tabelul următor:
Se înregistrează un eşantion de n=10 ani, cupluri de valori (xi, yi), cu privire la
efectul venitului unei familii (lei) asupra consumului cu alimentele(lei).
Tab.1
Y= α + βXi + ε
Din aplicaţia Excel, introducând datele din primul tabel şi apelând funcţia
Regression, se obţin datele din Tab.2.
Ecuaţia de regresie se scrie cu ajutorul coloanei Coefficient din tabelul de mai
∧
sus, unde prima linie corespunde estimatorului α , iar cea de-a doua linie corespunde
∧
estimatorului β .
- ;
∧
Valorile lui şi β le preluăm din coloana Coefficients al Tab.2.
- = 79,554;
∧
- β = 0.232;
Cum , > 0 rezultă că legatura dintre cele doua variabile este directă.
- 0,008;
yi = + ßxi + ei; i = ;
∧ ∧
y =
i + β xi;
P-value, reprezintă pragul de semnificaţie α, de la care valorile coeficienţilor
devin semnificativ diferite de 0. P-value a α şi ß sunt ambele subunitare, ceea ce va
permite respingerea ipotezei nule.
- p – value ( ) = 5,801E-06;
observate yi, de la valorile teoretice aflate pe dreapta de regresie, (în acest caz cu
±15,04). Aceasta valoare ridicata la puterea a 2-a reprezintă dispersia reziduurilor.
Eroarea standard a modelului este de 15,04%.
Observations (n), numărul de observaţii este 10, conform ultimei linii a tabelului
Regression Statitics şi este echivalent cu numărul de ani luaţi în considerare pentru
studiul fenomenului.
MSR
F= (F= )
MSE
În cadrul situaţiei de faţă k=1 (model liniar unifactorial), deci testul F este similar testului
t student întrucât va avea aceleaşi ipoteze.
În coloana Predicted Y sunt înscrise valorile ajustate ale lui y ( y ) pentru cele n
observaţii (pentru 10 ani).
Coloana Residuals conţine informaţii despre reziduurile (ri) aferente fiecărei
observaţii din cei 10 ani.
Coloana Standard Residuals conţine rezultatul raportului dintre reziduu şi eroarea
standard a modelului (ri/s), pentru fiecare observaţie i, cu i=1...n.
e.) Analiza graficelor
- graficul cu valori ajustate şi valori observate (corelogramă sau diagrama norului
de puncte)
În graficul de mai sus sunt prezentate cu roşu valorile yi observate pentru fiecare xi,
∧
În acest al treilea grafic sunt marcate toate cele trei elemente conţinute de
reprezentările anterioare: valorile observate, valorile ajustate (previzionate) şi linia de trend.
În concluzie, din graficele de mai sus se observă cum între variabila X şi variabila Y
există o corelaţie în sensul că, împreună cu creşterea lui X creşte şi Y-ul. Astfel între cele
două există o dependenţă crescătoare.
- graficul reziduurilor
În graficul de mai sus sunt reprezentate reziduurile, adică erorile făcute la fiecare din
cele 10 observaţii. După cum se observă acestea au valori atât valori pozitive cât şi
negative, ceea ce este bine, întrucât suma reziduurilor pentru cele 10 observaţii trebuie să
fie 0, conform proprietăţilor reziduurilor. De asemenea după forma norului de puncte
deducem că între erorile făcute şi valorile lui X nu exită dependenţă statistică.
ii.) Corelaţia dintre două serii de date este definită prin aşa-numitul coeficient de
corelaţie Pearson:
rX ,Y = C
S X SY ,
unde C reprezintă covarianţa dintre cele două serii de date, iar S X , respectiv
S Y sunt abaterile standard ale celor două serii de date. El ia valori în intervalul [0,1].
Coeficientul de corelaţie rxy=0.60995>0, dar mai apropiată de 1 decât de 0.
Valoarea acestui coeficient indică faptul că între erori există autocorelare pozitivă. Acest
coeficient a fost calculat în Excel cu ajutorul funcţie CORREL.
∑(r i −r i −1)
2
i =2
DW= n
∑r i
2
, unde ri – reziduurile aferente fiecarei observaţii i
i =2
i – ordinul observaţiei
n. numărul total de obsrvaţii, 10 în cazul de faţă
Înlocuind în formulă cu datele obţinute prin prelucrarea tableului de mai jos în
Excel, rezultă:
5.37820267 8
DW= = 0,83
6.46747
ri ri-1 ri 2
-1.591391867 0 0 0
-0.209144039 -1.59139 1.910609058 0.043741
-0.306383524 -0.20914 0.009455517 0.093871
0.288627038 -0.30638 0.354037569 0.083306
0.780197596 0.288627 0.241641613 0.608708
1.191791108 0.780198 0.169409219 1.420366
1.440121924 1.191791 0.061668194 2.073951
0.369421295 1.440122 1.146399836 0.136472
-0.781742361 0.369421 1.325177764 0.611121
-1.18149717 -0.78174 0.159803907 1.395936
Total 5.378202678 6.467472
Decizia se ia astfel:
σ
2
“Fiecare eroare are aceeaşi dispersie (împrăştiere) a valorilor notată .”
σ
2
Var (ei) = , i =1,…10
σi σ
2 2
H 1 : exista i, i =1,…10 astfel încât ≠
(Heteroschedasticitate)
∧ ∧ ∧
y=β +β e
1 xi1
+ i
0
∧
r = y − yi , i=1,…10
i i
∧ ∧ ∧
Se estimează parametrii acestui model ( β , β1 ). Pe baza lor găsim y :
0
∧ ∧ ∧
y=β +β
0 1 xi1
Se construieşte o regresie auxiliară care are următoarea formă:
ri ri 2 xi x i2
H1 : ∃ α j
≠ 0 , j=1,2 (corespunde heteroschedasticităţii)
Prin testele realizate mai sus am aratat că modelul econometric popus este valid
şi că într-adevăr veniturile unei gospodării influenţează mărimea cheltuielilor cu
produsele alimentare.
BIBLIOGRAFIE
www.inesse.ro –Sursa datelor folosite pentru analiză