Sunteți pe pagina 1din 8

ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI

Facultatea de Cibernetica, Statistica si Informatica Economica

PROIECT
Modelul multifactorial de regresie liniara

Data: Student:
11.05.2020 Bucur Maria- Teodora
Grupa 1037
Seria A
ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI
Facultatea de Cibernetica, Statistica si Informatica Economica

1. PREZENTAREA PROBLEMEI
Am decis sa fac un model multifactorial de regresie liniara, in care sa studiez legatura dintre
o variabila dependenta si doua variabile independente. Pentru acest studiu, am ales productia de
cereale (tone) la nivel mondial pentru anul 2014 (variabila dependenta) , iar terenurile
arabile (hectare) la nivel mondial pentru anul 2014 si precipitatiile (mm/ an) la nivel
mondial pentru 2014 cele doua variabile independente.
Din punct de vedere economic, exista o legatura stransa, directa intre cele 3 variabile
analizate, deoarece productia de cereale la nivel mondial este puternic influentata de numarul
terenurilor arabile destinate productiei si de precipitatiile la nivel mondial dintr-un an. Astfel, cu
cat terenurile sunt mai multe, iar precipitatiile mai dese, productiile de cereale trebuie sa fie mai
mari.
Sursele pentru aceste date sunt:
 https://data.worldbank.org/indicator/AG.PRD.CREL.MT
 https://data.worldbank.org/indicator/AG.LND.ARBL.HA
 https://data.worldbank.org/indicator/AG.LND.PRCP.MM

2. DEFINIREA MODELULUI DE REGRESIE

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.845689419
R Square 0.715190594
Adjusted R Square 0.711820068
Standard Error 32237526.7
Observations 172

ANOVA
df SS MS F Significance F
Regression 2 441039614212816000 220519807106408000 212.1896392 8.12533E-47
Residual 169 175634623570308000 1039258127634960
Total 171 616674237783124000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept -6055118.789 4561188.202 -1.327531012 0.18612354 -15059362.46 2949124.882 -15059362.46 2949124.882
Terenuri arabile 2.292822653 0.111643432 20.53701328 8.53395E-48 2.072427303 2.513218003 2.072427303 2.513218003
Precipitatii 3158.527303 3173.181354 0.995381906 0.320973604 -3105.651427 9422.706033 -3105.651427 9422.706033

Tabel 1: Modelul de regresie multifactorial


In analiza, am identificat 172 de observatii. Pentru acestea, am obtinut un model de regresie valid
( Significance F < 0.05). Dintre variabilele independente, terenurile arabile sunt semnificative
statistic ( P-value < 0.05), pe cand precipitatiile nu sunt semnificative statistic ( P-value > 0.05).

Page 2 of 8
ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI
Facultatea de Cibernetica, Statistica si Informatica Economica

Figură 1: Aproximarea grafica a legaturii dintre variabile


3. ANALIZA PRELIMINARA A DATELOR
PRDUCTIA DE CEREALE TERENURI ARABILE PRECIPITATII

Mean 16208134.15 Mean 8160578.558 Mean 1135.797688


Standard Error 4552734.465 Standard Error 1687504.56 Standard Error 59.55808207
Median 1900910 Median 1584000 Median 1026
Mode #N/A Mode 3800000 Mode 2200
Standard Deviation 59881872.57 Standard Deviation 22195657.09 Standard Deviation 783.3642635
Sample Variance 3.58584E+15 Sample Variance 4.92647E+14 Sample Variance 613659.5693
Kurtosis 55.57896898 Kurtosis 27.68752967 Kurtosis -0.209537269
Skewness 7.11959018 Skewness 5.03939276 Skewness 0.72646068
Range 557417284 Range 156461000 Range 3189
Minimum 16 Minimum 2000 Minimum 51
Maximum 557417300 Maximum 156463000 Maximum 3240
Sum 2804007208 Sum 1411780091 Sum 196493
Count 173 Count 173 Count 173

limita inferioara -163437484 limita inferioara -58426392.7 limita inferioara -1214.295103


limita superioara 195853751.8 limita superioara 74747549.84 limita superioara 3485.890478

Tabel 2: Statistici Descriptive


Datele inregistrate sunt corecte si nu sunt afectate de erori de masura, deoarece valorile de minim
si de maxim generate prin Statisticile Descriptive se incadreaza in limitele inferioare si
superioare calculate dupa Regula celor 3 Sigma (Mean- 3*Standard Deviation si Mean+
3*Standard Deviation).

Page 3 of 8
ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI
Facultatea de Cibernetica, Statistica si Informatica Economica

Ipoteza de multicoliniaritate

Figură 2: Graficul pentru ipoteza de multicoliniaritate dintre variabilele independente


Deoarece din graficul nu ne putem da seama daca exista sau nu multicoliniaritate, am efectuat un
test pentru a putea stabili. Astfel, am calculat coeficientul de corelatie Pearson dintre variabilele
independente (-0.12600539) si am comparat aceasta valoare cu R² (0.715190594). Coeficientul
de corelatie are o valoare mult mai mica decat R², ceea ce inseamna ca NU EXISTA
MULTICOLINIARITATE.

4. ESTIMAREA MODELULUI DE REGRESIE


Testarea parametrilor modelului de regresie
 PAS 1: Ipoteze
H0: b j = 0

H1: b j ≠ 0
 PAS 2: Testul T
t calc 0: -1.327531012
t calc 1: 20.53701328
t calc 2: 0.995381906

 PAS 3: Valoarea critica


t critic: 1.974100447
 PAS 4: Decizia

Page 4 of 8
ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI
Facultatea de Cibernetica, Statistica si Informatica Economica

|t calc| > t critic => b0 nu este semnificativ statistic


b1 este semnificativ statistic
b2 nu este semnificativ statistic

Testarea validitatii modelului


 PAS 1: Ipoteze
H0: modelul nu este valid
H1: modelul este valid
 PAS 2: Testul F
F calc= MSR/MSE= 212.1896392
 PAS 3: Valoarea critica
F critic= 3.049468448
 PAS 4: Decizia
|f calc| > f critic => Acceptam H1, respingem H0 => MODELUL ESTE VALID

Interpretarea coeficientului de determinatie


Modelul de regresie explica in proportie de 71.5% (> 50%) variatia productiei de cereale la nivel
mondial din anul 2014.

Page 5 of 8
ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI
Facultatea de Cibernetica, Statistica si Informatica Economica

5. TESTAREA IPOTEZELOR CLASICE ASUPRA MODELUL DE REGRESIE


Testarea normalității erorilor
Verificarea normalitatii:
 Procedeul grafic

Figură 3: Graficul rezidurilor

 Testul Jarque-Bera
 PAS 1: Ipoteze
H0 – erorile sunt normal distribuite
H1 – erorile nu sunt normal distribuite
 PAS 2: Valoarea statisticii JB dupa formula:

JB= 29452.34426
 PAS 3: Valoarea calculată a testului JB
Hi patrat= 5.991464547
 PAS 4: Decizia
JB > Hi patrat => Acceptam H1, respingem H0 => ERORILE NU SUNT NORMAL
DISTRIBUITE

Page 6 of 8
ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI
Facultatea de Cibernetica, Statistica si Informatica Economica

Testarea ipotezei de homoscedascititate


 Testul White
 PAS 1: Ipoteze
H0: exista homoscedasticitate
H1: exista heteroscedasticitate
 PAS 2: Valoarea calculata a statisticii W
W= 124.8139246
 PAS 3:
Hi patrat= 11.07049769
 PAS 4: Decizia
W > Hi patrat => Acceptam H1, respingem H0 => ERORILE SUNT
HETEROSCEDASTICE

Testarea ipotezei de autocorelare a erorilor


Testul Durbin-Watson
 PAS 1: Ipoteze
Ho: p = 0
H1: p ≠ 0
 PAS 2: Statistica testului

DW = 2.018476005
 PAS 3: Valorile critice
d1=dL= 1.706
d2=dU= 1.76
 PAS 4: Decizia

Page 7 of 8
ACADEMIA DE STUDII ECONOMICE DIN BUCURESTI
Facultatea de Cibernetica, Statistica si Informatica Economica

Decizia 0 d1 d2 2 4-d2 4-d1 4


0 1.706 1.76 2 2.24 2.294 4

DW apartine intervalului [2; 4-d1] => ERORILE SUNT INDEPENDENTE

6. CONCLUZII
In concluzie, in urma testelor efectuate, am stabilit ca modelul este valid, doar o singura variabila
independenta este semnificativa statistic, nu exista multicoliniaritate, erorile nu sunt distribuite
normal, sunt independente si heteroscedastice.

Page 8 of 8

S-ar putea să vă placă și