Sunteți pe pagina 1din 20

Introducere

Pentru aplicaia acestei lucrri am studiat regresia liniar multipl parcurgnd etapele
necesare identificrii unui model econometric.Ca suport economic am studiat dependena
cheltuielilor pentru sntate de produsul intern brut,populaia cu vrsta de peste 65 de
ani,numrul de medici la 1000 de locuitori.
Sursa datelor utilizat a fost site-ul World Bank de unde am putut descrca datele.
Datele folosite se pot observa :
CAPITOLUL 1
Ecuaia modelului de regresie liniar multipl va arta n felul urmtor :
Y=0+1X1+2X2+ 3X3 n care:
Y Health expenditure;
X1 - GDP (PPP);
X2 Population above 65 % of total;
X3 - Numrul de medici la 1 000 de locuitori;
0 1 2 parametrii modelului de regresie;
e variabila eroare;
Dupa ce am determinat modelul i am adunat cte observaii despre datele panelasupra tuturor
rilor din Uniunea European, am trecut la estimarea parametrilor ecuaiei utiliznd MS Excel.
Cu ajutorul blocului Data Analisys am obinut urmtoarele rezultate :

Ca rezultat al aplicarii tehnicii OLS obtinem parametrii estimati ai modelului:


0 -2256,611
1 100,38
2 0.076
3 170,86
Y = -2256,611 + 100,38X1 + 0.076X2+170,86X3 cu erorile standard :
SE(0^)=182,45
SE(1^)=13,43
SE(2^)=0.001
SE(3^)=42,68
P-value a 0 1 2 3 snt toate subunitarie mai mici ca 0,1 ceea ce va permite
respingerea ipotezei nule i denot faptul c parametrii influeniaz cheltuielile cu
sntatea. Studiind tabelul ANOVA, celulele F (647,5087) i Sig.F.
(1.95356801352617E-176) am stabilit c modelul n ansamblu este destul de bun.
n tabelul Regression Statistics avem R2 = 0,786 i R2 ajustat = 0,785 ceea ce
explic c aprox. 78% din y sunt determinate de model. Nu este de ajuns doar s
estimm parametrii, dar i s elaborez nite ipoteze care ar permite s fac inferene

i previziuni pe baza modelului studiat. Pe baza unor proprieti ale variabilei


dependente y rezult urmtoarele caracteristici ale variabilei eroare :
0. Liniaritatea n parametrii modelului, adic y=X+e
1. Vectorul eroare are parametrul 0, adica E(e)=0
2. Erorile snt independente statistic i au aceeai varian, adic Var(e)=E(eeT )
=e I
3. E(e|X)=0, nici o informaie coninut n vectorul eroare nu este coninut n
vectorul X.
4. X este o matrice ne-aleatoare avnd rangul maxim, adic rang (X)= k+1
Apoi am efectuat prelucrarea datelor prin intermediul Eviews :
EQ1 ecuaia regresiei;
GDP-produs intern brut;
PHYSICIANS Numrul de medici la 1 000 locuitori ;
POPULATION_ABOVE_65-populaia cu vrsta de peste 65 de ani;
Evident se obin aceleai rezultate ca i cu ajutorul Excel. Utilizind funcia scat
health_expenditure gdp physicians population_above_65 am obinut graficul Y, X1,
X2,X3. Se observ o polarizare a valorilor:

Am aplicat testul de semnificaie t (Student) asupra coeficienilor modelului de


regresie. Am utilizat urmtoarele ipoteze :
H0: i=0
H1: i 0
Pe baza WiW i SE(WiW ), Eviews a calculat coefiecienii t satistica incadrndu-le
n coloana t-Statistic. Nivelul de semnificaie este fixat la 5%, astfel pentru ipoteza
bilateral regiunea critic este tcrt(>30) = (-; -2,042) (; 2,042). Reeind din t^
obtinui, concluzionez c 0^, 1^ sunt statistic diferii de 0, deci fiind n zona de
respingere a ipotezei nule, nsa 2 aparine zonei de indecizie, nu pot respinge H0 i
nici accepta H1.

Am parcurs i testul F (Snedecor - Fisher) pentru a analiza variana variabilei


independente y i dependenei liniare ntre Y i k variabile . Toate calculele snt
redate n tabelul ANOVA n Excel :

SST = (yi-yd) - variana total asociat valorilor y; SSE = (yi-yq) - variana


neexplicat de regresie; SSR = (yq-yd) - variana explicat pe baza regresiei; SST
= SSR + SSE (n-1) (k) n-(k+1) - grade de libertate. Sumelor SSR, SSE se asociaz
mediile lor n funcie de gradele de libertate MSR, MSE. Deci, am verificat
ipotezele aferente testului F: H0=0=1=2=0 H1=nu toi parametrii snt nuli. Din
tabel Fcrt=3.32 < F*(647.5087) deci pot respinge H0 acceptnd c exist o
dependen liniar ntre Y i k variabile independente. Significance F din ANOVA
semnific eroarea care o fac eliminnd ipoteza nul, deci n modelul analizat este
suficient de mic (52617E-176). Astfel coeficientul de determinaie multipl (R2 )
obinut prin raportul SSR/SST exprim partea de varian total explicat de model.
Se gasete n tabelul iniial n Excel i n datele generate de Eviews. Coeficientul ia
valori [0,1], 0 ar nsemna SSR=0 ceea ce semnific c X1, X2 nu influieniaz deloc
variabilele Y. Un coeficient mai aproape de 1 semnific o dependen total cu
reziduuri nule. n modelul studiat R2=0,78 ceea ce ar nsemna o dependen
relativ a variabilelor.

Ipotezele elaborate si testate n cazul parametrilor ecuaiei urmeaz de testat i n


cazul matricei variabileleor eroare:
0. Liniaritatea n parametrii modelului, adic y=X+e;
1. Vectorul eroare are parametrul 0, adic E(e)=0; 2. Erorile snt independente
statistic i au aceeai varian, adic Var(e)=E(eeT )=e I;
3. E(e|X)=0, nici o informaie coninut n vectorul eroare nu este coninut n
vectorul X;
4. X este o matrice ne-aleatoare avnd rangul maxim, adic rang(X)= k+1 <n;

5. Erorile snt repartizate normal


Parcurg pe rnd ipetezele enunate anterior :
Ipoteza precum E(e)=0 este adevrat oricnd dac folosim OLS.Ipoteza homoscedasticitatii
Var(e)=E(eeT)=eI

S-ar putea să vă placă și