Sunteți pe pagina 1din 15

Proiect Econometrie

Nume: Sima Eduard Catalin


Grupa: 1075
Profesor coordinator: Spataru Silvia

Facultatea de Cibernetica, Statistica si Informatica Economica, Academia de


Studii Economice Bucuresti
Modelul unifactorial de regresie liniara

In scopul evaluarii influentei venitului disponibil asupra cheltuielilor de productie-


cercetare si dezvoltare a fost luat ca exemplu cheltuielile medii ale unui singur membru din trupa
AC DC pentru producerea albumelor/cercetarea si dezvoltarea acestora in functie de veniturile
medii ale acestora. Ca serie de timp a fost urmarita o perioada de 20 de ani (1973-1993).
Astfel, se doreste verificarea legaturii intre numarul de albume vandute si pretul unui
album. Tabelul de mai jos reprezinta sursa de date ce urmeaza a fi studiate.
Yi=variabila dependenta->numarul de albume vandute
Xi=variabila independetna->pretul unui album
In primul rand, datele de observatie vor fi reprezentate grafic.
In scopul reprezentarii, s-a ales modelul Keynes privind consumul in functie de venit, iar
graficul de mai jos reprezinta graficul imprastierii datelor.

Din graficul de mai sus se observa ca intre variabilele X si Y exista o legatura dependent
si liniara. Astfel, se poate considera ca intre cele doua variabile exista o relatie de tipul:
y=β0+β1xi+εi , unde i=1->20.
In cele ce urmeaza se doreste estimarea modelului , pentru aceasta am realizat tabelul
Anova folosind Microsoft Excel.
Folosim statistica: F=SSR / [SSE/(n-2)] care urmează o distributie Fα ;1, n-2 .
Dacă Fcalculat > Fcritic respingem H0 si acceptăm H1 =>Modelul este valid statistic.
F calculat=37.46044 ;
F tabelat = Fcritic = Fα ;1, n−2=4.098172.
Cum F calculate > F critic => Respingem H0 si acceptam H1 => Modelul este valid statistic.
Astfel, se poate concluziona faptul ca presupunerea conform careia venitul disponibil
influenteaza in mod direct cheltuielile de dezvoltare, modelul fiind valid din punct de vedere
statistic.
Mai jos este prezentat output-ul modelului de regresie liniara unifactoriala, realizat in
Excel.

Testarea semnificatiei parametrului pantă β 1:

H0 : β1 = 0 , (parametrul pantă β1 nu este semnificativ statistic)


H1 : β1 ≠ 0 , (parametrul pantă β1 este semnificativ statistic).

Statistica t urmeaza o distrbutie Student cu (n-2) grade de libertate daca H0 este adevarata.
Regiunea critica este Rc : |t calc|> t a/2;n-2.
Se observa din tabelul Anova ca β1=0.124518 =>respingem ipoteza nula H0 si acceptam ipoteza
H1=> β1 este semnificativ statistic pentru modelul dat.
Β0=0.569051.
Din output se poate observa ca parametrul panta β1 apartine intervalului de incredere, cu
un nivel de incredere de 95% , in acest caz , daca s-ar face 100 incercari, in 95 dintre acestea
parametrul se va incadra in interval => parametrul panta este semnificativ statistic, la un nivel
de incredere de 5%.
In cele ce urmeaza, se vom prezenta seria rezidurilor rezultate in urma regresiei liniare
unifactoriale.
Dupa ce dreapta de regresie a fost estimata, este important sa se evalueze rezultatele, sa se
stie cat de bine ajusteaza sau aproximeaza aceasta dreaptă datele de selectie. Utilizarea MCMMP
asigura faptul ca valorile găsite pentru β0 si β1 sunt cele care aproximeaza cel mai bine datele de
observatie, in sensul specific de minimizare a sumei patratelor reziduurilor. Nu există nici o
garantie că β0 si β1 corespund exact cu parametrii necunoscuti si nici dacă dreapta de regresie,
determinata ca fiind cea mai buna sau cea mai potrivita, aproximeaza corect datele observate.
Un indicator ce poate descrie calitatea reprezentării, adică a liniei de regresie estimată, este
coeficientul de determinatie, notat R^2.
Pentru testarea semnificatiei dependentei dintre cele doua variabile se utilizeaza testul :
H0: ϼ = 0 (coeficientul de corelatie nu este semnificativ statistic, deci intre cele doua variabile nu
exista o dependent liniara semnificativa )
H1 : ϼ ≠ 0 (coeficientul de corelatie este semnificativ statistic, deci intre cele doua variabile exista
dependeta liniara )
Se poate ajunge astfel la concluzia urmatoare, urmarind datele din output-ul de regresie
obtinut: coeficientul de corelatie este semnificativ statistic, deci intre cele doua variabile nu exista
o dependent liniara semnificativa.

In scopul studierii legaturii liniare dintre cheltuielile pentru cercetare si dezvoltare si venit,
consideram modelul liniar: Cheltuieli de cercetare si dezvoltare = β0 + β1Venit +ε i .
Cheltuielile de cercetare si dezvoltare =Y iar venitul disponibil=X.
Se preconizeaza la o relatie pozitiva intre cele 2 variabile.
S-a realizat in EViews modelul liniar de regresie pentru studiul legaturii dintre cele 2
variabile.
Rezultatele regresiei sunt urmatoarele:
Ӯ=15.32254+0.504057Venit
Se=(8.722279) (0.035858)
R^2=0.91651
Din grafic se vede poate observa ca valoarea absoluta a rezidurilor creste pe masura ce
veniturile cresc, ceea ce sugereaza ca ipoteza de homoscedasticitate nu este indeplinită=>Exista
heteroscedasticitate.
Testul White solicita ca, dupa determinarea rezidurilor din regresia originala, sa se
calculeze o regresie auxiliara a patratelor rezidurilor in raport cu o constanta, variabilele
explicative ale modelului original, patratele lor si produsele lor incrucisate.
Regresia auxiliara este de forma :
ei = a + a xi + a xi + ui
Se estimeaza această regresie auxiliară prin MCMMP.
H0 : a1 = a2 = 0 (erorile aleatoare sunt homoscedastice)
H1 :Exista ai ≠ 0, i =1,2 (erorile aleatoare sunt heteroscedastice)
Observam că Prob. (F-statistic) = 0,0008 iar Prob. (Chi-square statistic) = 0,0035.
Deoarece P-value < a respingem H0 si acceptăm H1=>erorile aleatoare sunt
heteroscedastice.

Testul White in EViews


Considerăm modelul de regresie liniara simpla:
yt = β 0 + β 1 xt +ε t , t =1,...,20 .
β 1 arata cu cat se modifica, in medie, cheltuielile atunci cand venitul disponibil creste cu
o unitate.
Se poate observa output-ul din EViews pentru regresia necesara auto-corelarii erorilor
liniare.
Testarea distributiei normale a erorilor aleatoare (testul Jarque-Bera)

Interpretarea rezultatelor:
Statistica Jarque-Bera = 2.527007
Probability(JB) = 0,282662
Deoarece Probabilitatea asociata statisticii JB nu este < 0,05 respingem H1 si acceptam
H0-> Reziduurile au distributie normala.
Modelul Multifactoria de regresie

Pentru a exemplifica utilitatea modelului multifactorial de regresie liniara, s-a adaugat o noua
variabila xi2, si anume timpul, masurat pe o perioada de 20 de ani.

Matrici necesare modelului de regresie:


Regresia Excel

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.970577
R Square 0.942021
Adjusted R
Square 0.935199
Standard
Error 8.760879
Observatio
ns 20

ANOVA
Significan
df SS MS F ce F
21199.7 10599. 138.10
Regression 2 5 87 37 3.07E-11
1304.80 76.753
Residual 17 1 01
22504.5
Total 19 5

Coefficie Standar Lower Upper Lower Upper


nts d Error t Stat P-value 95% 95% 90.0% 90.0%
16.8305 3.3604 0.0037 92.06730 27.27951 85.836
Intercept 56.558 2 42 12 21.0487 12 07 49
-
X Variable 0.13404 1.0983 0.2873 0.430038 0.085962 0.3804
1 0.147226 6 19 78 -0.13559 68 2 14
X Variable 1.48104 2.7349 0.0141 7.175279 1.474115 6.6269
2 4.05055 4 29 06 0.92582 37 92 84
Regresie in EViews

Interpretarea parametrilor

β 0= parametrul de interceptare
β 1, β 2 = coeficienti de regresie partiali / coeficienti pantă.
β 1= coeficient de regresie partial pentru variabila independentă X1.
β 2= coeficient de regresie partial pentru variabila independentă X2.
Coeficientul de regresie partial j β arata cu cat creste sau scade, in medie, valoarea
variabilei Y, ca raspuns la cresterea variabilei j x cu o unitate, ceilalti factori ramanand constanti.
β 1 = 0.147226 este coeficient marginal si arata ca, in perioada analizata, mentinand
celelalte variabile constante, atunci cand venitul (X1) creste cu o unitate, cheltuielile cresc, in
medie, cu 0,147. Inclinatia marginala spre consum este estimată la 14,7 procente.
β 2= 4.050550 este coeficient panta si arata ca, in perioada analizata, mentinand celelalte
variabile constante, atunci cand timpul (X2) creste cu un an, cheltuielile cresc, in medie, cu 4.50.
β 0= 56.558 este parametru de interceptare si arata ca, daca cele două variabile explicative,
X1 si X2 au valoarea 0, valoarea medie a cheltuielilor este estimata la circa 56.5.
Se da vectorul t t x0 = (1, x10 , x20 )
Valoarea reală a lui y este y0 = ( y0 | x0 ) = x0t β + εi
Valoarea previzionată este yˆ0== x0t β
ty=x
Dorim să previzionăm = ( y0 | x0 ) = x0t β
Un estimator pentru y0 este si în acest caz este yˆ0== x0t β