Sunteți pe pagina 1din 14

APLICAŢIE rezolvată - regresie liniară multiplă

Se cunosc următoarele date privind vânzările la produsul alimentar „A”, înregistrate în 10 unităţi comerciale:
Numărul curent al Vânzări Număr vânzători Suprafaţa
unităţii comerciale (bucăţi) (persoane) comercială (mp)
1 22 7 98
2 20 5 90
3 23 8 110
4 26 9 130
5 30 12 140
6 32 15 145
7 45 22 156
8 50 25 160
9 52 32 164
10 60 40 175
Se cere:
1. Să se stabilească modelul de regresie multifactorial interpretând estimatorii acestuia;
2. Să se verifice validitatea modelului de regresie (probabilitatea de garantare a rezultatelor de
95%);
3. Să se arate cum se stabilesc (să se determine) intervalele de încredere pentru parametrii modelului
liniar de regresie;
4. Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de semnificaţie 0,05;
5. Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie şi
raportul de corelaţie, testând semnificaţia acestora pentru un nivel de semnificaţie 0,05;
6. Care este proporția în care cei doi factori (număr vânzători și suprafașa comercială)
influențează variaţia vânzării?
7. Verificaţi dacă sunt îndeplinite ipotezele modelului de regresie liniară bifactorială:
7.1. Normalitatea erorilor;
7.2. Homoscedasticitatea erorilor;
7.3. Autocorelarea erorilor;
7.4. Multicoliniaritatea variabilelor exogene.
Rezolvare:
Notăm cu : Y - variabila “vânzări”.
X1 - variabila “numărul vânzătorilor”,
X2 - variabila “suprafaţa comercială”
yi = f ( x1i , x2i )
Vânzări = f ( număr vânzători, suprafaţă comercială )
y i  yˆ i  ei

Baza de date
Numărul curent al Vânzări Număr vânzători Suprafaţa
unităţii comerciale (bucăţi) (persoane) comercială (mp)
Yi X1i X2i
1 22 7 98
2 20 5 90
3 23 8 110
4 26 9 130
5 30 12 140
6 32 15 145
7 45 22 156
8 50 25 160

1
9 52 32 164
10 60 40 175

Se va folosi testu z nu testul t


Rezolvare folosind EXCEL:
1. Introduceţi datele din tabel începând din celula A1 (prima coloană cu vânzări: A1-A11; a doua coloană
cu număr vânzători: B1-B11; a treia coloană cu suprafața comrcială: C1-C11).
2. Apăsaţi Data - Data Analysis şi Regression.
3. La Input Y Range selectaţi toată coloana de la A1 la A11. La Input X Range selectaţi ambele coloane
simultan de la B1C1 la B11C11.
4. Selectaţi Labels.
5. Dacă doriţi să calculaţi valorile reziduale, selectaţi Residuals.
6. Apăsaţi OK.

Se obţin rezultatele:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,989430469
R Square 0,978972653
Adjusted R Square 0,97296484
Standard Error 2,377677944
Observations 10
ANOVA  df SS MS F Significance F
Regression 2 1842,426533 921,213 162,9499 1,34817E-06
Residual 7 39,57346682 5,65335
Total 9 1882      
  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 4,702902918 6,18676278 0,76016 0,4719829 -9,92646639 19,332272
Nr. vânzători (pers.) 0,974543752 0,151386668 6,43745 0,0003545 0,616571165 1,3325163
Suprafața com.(mp) 0,104112437 0,061427843 1,69487 0,133923 -0,04114133 0,2493662
RESIDUAL OUTPUT
Predicted

Vânzari y i Residuals
Observation (bucăți) ei
1 21,72772804 0,272271963
2 18,94574103 1,054258965
3 23,95162104 -0,951621037
4 27,00841353 -1,008413534
5 30,97316916 -0,973169163
6 34,41736261 -2,417362606
7 42,38440568 2,61559432
8 45,72448669 4,275513315
9 52,9627427 -0,962742698
10 61,90432952 -1,904329524

2
1 Să se stabilească modelul de regresie multifactorial interpretând estimatorii acestuia;

Modelul de regresie are în vedere stabilirea funcţiei de regresie : yˆ x1 , x2 ,i  b0  b1 x1i  b2 x 2i  ei

  Coefficients Coeficienţii
Intercept 4,702902918 b0 termen liber
Număr vânzători (persoane) 0,974543752 b1 coeficient de regresie (primul factor)
Suprafața comercială (mp) 0,104112437 b2 coeficient de regresie (al doilea factor)

yˆ x1 , x2 ,i  4,7029  0,9745 x1i  0,1041x 2 i

b0 termen liber – NU ARE INTERPRETARE ECONOMICĂ;


b1  0,9754 , ceea ce însemnă că o creştere a numărului de vânzători cu unul, determină o creștere a
vânzării cu 0,9745 bucăţi, în condiţiile menţinerii constante a variaţiei suprafeţei comerciale, pentru
o probabilitate de garantare a rezultatelor de 95%;
b2  0,1041 ne arată că, la o creştere cu 1 mp a suprafeţei comerciale, vânzarea va înregistra o creştere
cu 0,1041 bucăţi, în condiţiile menţinerii constante a variaţiei numărului de vânzători, pentru o
probabilitate de garantare a rezultatelor de 95%.

2 Să se verifice validitatea modelului de regresie (probabilitatea de garantare a rezultatelor de 95%).

ANOVA  df SS MS F Significance F
Regression 2 1842,426533 921,2133 162,94991 1,34817E-06
Residual 7 39,57346682 5,653352
Total 9 1882      

MS
df
Tabel 2 (grade de
SS (varianţa) (media pătratelor)
F(calculat) Significance F
ANOVA (suma pătratelor) (dispersia
libertate)
corectată)
Regression SSR
(variaţia df R  k SSR MSR  1,34817E-06
datorată 1842,426533 k este
2 Testul
regresiei) 921,2133 1,34817  10 6
Residual SSE MSR este
df E  n  k  1 SSE MSE  Fcalc  0,00000134817
(variaţia n  k 1
reziduală) 7 39,57346682 MSE <   0,05
5,653352 F=162,94991 (se respinge H –
Total df T  df R  df E 0

SST  SSR  SST Modelul este valid)


(variaţia df T  n  1 1882
totală) 9

3
H0: MSR  MSE modelul nu este valid (împrăştierea valorilor ŷ t datorate factorului timp nu
diferă semnificativ de împrăştierea aceloraşi valori datorate
întâmplării)
H1: MSR  MSE modelul este valid ,corect identificat din punct de vedere sattistic

Ştiind că pragul de semnificaţie este   0,05 şi k  2 (există doi factori de influenţă: număr
vânzători și suprafața comercială) se stabileşte:
 valoarea critică: Fcritic  F ; k ; n  k 1  F ; 2; n  2 1  F0 , 05; 2; 7  4,74
 regiunea de respingere: dacă Fc  F ; k ; n  k 1 , atunci H0 se respinge
MSR 921,2133
Determinarea statisticii testului ( Fcalculat ) are la bază relaţia: F  MSE  5,6533  162,9499
Decizia: deoarece Fcalculat (162,9499)  F ; k ; n k 1 (4,96)  H 0 se respinge, deci H 1 este
adevărată, prin urmare, modelul este valid.

3. Să se arate cum se stabilesc (să se determine) intervalele de încredere pentru parametrii


modelului liniar de regresie
Lower 95% Upper 95%
  (limita inferioară) (limita superioară)

Intercept -9,926466387 19,332272


b0  z / 2  s b 0 b0  z / 2  s b 0

Număr vânzători 0,616571165 1,3325163


(persoane) b1  t  / 2;n  k 1  s b1 b1  t  / 2; n  k 1  s b1

Suprafata -0,04114133 0,2493662


comercială (mp) b2  t  / 2; n  k 1  s b 2 b2  t / 2;n  k 1  s b 2

Lower    Upper
Interval de încredere pentru  0 :
b0  t / 2; n  k 1  s b 0   0  b0  t / 2; n  k 1  s b 0
b0  t ( B ); n 3  s b 0   0  b0  t ( B ); n 3  sb 0
b0  t 0 ,5( B ); 7  s b 0   0  b0  t 0,5( B ); 7  s b 0
4,702902918  2,365  6,18676278   0  4,702902918  2,365  6,18676278
 9,926466387   0  19,332272
Interval de încredere pentru  1 :
b1  t / 2; n  k 1  s b1   1  b1  t / 2; n  k 1  s b1
b1  t ( B ); n 3  sb1   1  b1  t ( B ); n 3  sb1
b1  t 0, 5( B ); 7  s b1   1  b1  t 0 ,5 ( B ); 7  sb1
0,9745 43752  2,365  0,151386668   1  0,974543752  2,365  0,151386668
0,616571165   1  1,3325163
Interval de încredere pentru  2 :
b2  t / 2; n  k 1  s b 2   2  b2  t / 2; n  k 1  s b 2
b2  t ( B ); n 3  s b 2   2  b2  t ( B ); n 3  s b 2
b2  t 0,5( B ); 7  s b 2   2  b2  t 0,5( B ); 7  s b 2
0,104112437  2,365  0,061427843   2  0,104112437  2,365  0,061427843
4
 0,04114133   2  0,2493662
4. Să se testeze semnificaţia parametrilor modelului de regresie (probabilitatea de garantare a
rezultatelor de 95%).

  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 4,702902918 6,18676278 0,760156 0,4719829 -9,926466387 19,332272
Număr vânzători
(persoane) 0,974543752 0,151386668 6,437448 0,0003545 0,616571165 1,3325163
Suprafața comercială
(mp) 0,104112437 0,061427843 1,694874 0,133923 -0,04114133 0,2493662

t Stat Lower 95% Upper 95%


Standard Error Statistica
Tabel 3 Coefficients (Abaterea medie
P-value Limita inferioară. a Limita suerioară. a
testului t ( Probabilitatea critică intervalului de intervalului de
pătratică) t calculat
) incredere incredere

b0
b0 t b0  0,4719829 > 0,05 b0  t / 2; n 3  sb0 b0  t / 2; n3  sb0
s b0 sb0
Intercept coeficientul b0
4,7029 6,18676278 0,760156 nu este semnificativ -9,926466387 19,332272

b1
t b1  0,0003545 < 0,05 b1  t / 2; n 3  sb1 b1  t / 2; n 3  sb1
Număr b1 s b1 sb1 coeficientul b1
vânzători 0,9745 0,151386668 este
6,437448 semnificativ 0,616571165 1,3325163

b2 b2  t / 2; n 3  sb2 b2  t / 2; n 3  sb2
tb2  0,133923 > 0,05
Suprafață b2 s b2 sb2 coeficientul b2
comercială 0,1041 0,06142784 -0,04114133 0,2493662
1,694874 nu este semnificativ

I. Testarea semnificaţiei parametrului  0 (termen liber):


Criteriul I - compararea statisticii testului cu valoarea testului critic
H0 :  0 = 0 (panta  0 este zero, adică  0 nu este semnificativ diferit de zero, deci
 0 nu este semnificativ statistic)
H1 :  0  0, (panta  0 nu este diferită de zero, adică  0 este semnificativ diferit de zero, deci
 0 este semnificativ statistic)
Deoarece n = 10  30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este   0,05 şi k  2 (există doi factori de influenţă) se stabileşte:
t critic  t   t  t 0 , 5( B );103  t 0, 5( B ); 7  2,365
 valoarea critică: 2
;n  k 1
2
;n 3

b0 4,702902918
Statistica testului este: t calc .  t b 0    0,760156
sb 0 6,186766278
Decizia:
Se observă că parametrul  0 nu este semnificativ statistic deoarece din compararea statisticii
testului cu valoarea testului critic rezultă că:  t critic   2,365  t b 0  0,7602  t critic  2,365 ;

Criteriul II - compararea probabilității critice cu pragul de semnificație (   0,05 )


În aplicație, P-valueb0 = 0,4719829 >   0,05 pragul de semnificaţie, deci  0 nu este
semnificativ statistic
Criteriul III – compararea semnelor limitelor intervalului de încredere
5
Decizia: deoarece limita inferioară a intervalului de încredere (lower 95% = - 9,926466387) este
cu semn contrar faţă de limita superioară a intervalului (upper 95% = + 19,332272), în contextul unui
interval de încredere  9,926466387   0  19,332272 , atunci parametrul  0 nu este semnificativ
statistic;

II. Testarea semnificaţiei parametrului  1 (coeficient de regresie):


Criteriul I - compararea statisticii testului cu valoarea testului critic
H0 :  1 = 0 (panta  1 este zero, adică  1 nu este semnificativ diferit de zero, deci
 1 nu este semnificativ statistic)
H1 :  1  0, (panta  1 nu este diferită de zero, adică  1 este semnificativ diferit de zero, deci
 1 este semnificativ statistic)
Deoarece n = 10  30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este   0,05 şi k  2 (există doi factori de influenţă) se stabileşte:
t critic  t   t  t 0 , 5( B );103  t 0, 5( B ); 7  2,365
 valoarea critică: ;n  k 1 ;n 3
2 2

 regiunea de respingere: dacă t calc  t  ;n 3 sau t b1  t  ;n 3 atunci H0 se respinge


2 2

b 0,974543752
Statistica testului este: t calc  t b1  1   6,437448
sb1 0,151386668
Decizia:
Se observă că parametrul  1 este semnificativ statistic deoarece, din compararea statisticii
testului cu valoarea testului critic rezultă că: t c  6,4374  t critic  2,365 ;

Criteriul II - compararea probabilității critice cu pragul de semnificație (   0,05 )


În aplicație, pragul critic P-value b0 = 0,0003545 <   0,05 pragul de semnificaţie, deci  1
este semnificativ statistic

Criteriul III – compararea semnelor limitelor intervalului de încredere


Decizia: deoarece limita inferioară a intervalului de încredere (lower 95% = + 0,616571165) este
cu acelaşi semn ca limita superioară a intervalului (upper 95% = + 1,3325163); intervalul de încredere
este  0,616571165  1   1,3325163 atunci  1 este semnificativ statistic

III. Testarea semnificaţiei parametrului  2 :


Criteriul I - compararea statisticii testului cu valoarea testului critic

H0 :  2 = 0 (  2 este zero, adică  2 nu este semnificativ diferit de zero, deci  2 nu este


semnificativ statistic)
H1 :  2  0, (  2 nu este diferit de zero, adică  2 este semnificativ diferit de zero, deci  2 este
semnificativ statistic)
Deoarece n = 10  30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este   0,05 şi k  2 (există doi factori de influenţă) se stabileşte:
t critic  t   t  t 0 , 5( B );103  t 0, 5( B ); 7  2,365
 valoarea critică: 2
;n  k 1
2
;n 3

b2 0,104112437
Statistica testului este: t calc  t b 2    1,694874
sb 2 0,061427843
Decizia:

6
Se observă că parametrul  2 nu este semnificativ statistic deoarece din compararea statisticii
testului cu valoarea testului critic (tabelar sau teoretic) rezultă că:
 t critic   2,365  t b 2 1,694874  t critic  2,365

Criteriul II - compararea probabilității critice cu pragul de semnificație (   0,05 )


În aplicație, pragul critic P-value b2 = 0,1339 >   0,05 pragul de semnificaţie, deci  2 nu
este semnificativ statistic

Criteriul III – compararea semnelor limitelor intervalului de încredere


Decizia: deoarece limita inferioară a intervalului de încredere (lower 95% = - 0,04114133) este cu
semn contrar faţă de limita superioară a intervalului (upper 95% = + 0,2493662); intervalul de încredere
este  0,04114133   2  0,2493662 atunci  2 nu este semnificativ statistic

5. Să se măsoare intensitatea legăturii dintre variabile folosind cu indicatorul adecvat, testând


semnificaţia acestora pentru un nivel de semnificaţie 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R (R) 0,989430469
R Square (R2) 0,978972653
Adjusted R Square 0,97296484
Standard Error 2,377677944

Observations 10
Din tabel avem Multiple R (Raportul de corelaţie): R  0,989430469   0,95;1
ceea ce
înseamnă că, legătura dintre vânzări, număr vânzători şi suprafaţă comercială este foarte puternică.

Testarea semnificaţiei raportului de corelaţie:


Ipoteza nulă H 0 : R *  0 (raportul de corelaţie al colectivităţii din care s-a extras eşantionul de 10
unităţi, nu diferă semnificativ de zero, deci nu este semnificativ statistic);
Ipoteza alternativă H 1 : R *  0 ( raportul de corelaţie al colectivităţii din care s-a extras eşantionul de
10 unităţi, diferă semnificativ de zero, deci este semnificativ statistic);

Ştiind că pragul de semnificaţie este   0,05 şi k  2 (există doi factori de influenţă) se stabileşte:
 valoarea critică: Ftabelar  F ; k ; n  k 1  F ; 2; n  2 1  F0 , 05; 2; 7  4,96
 regiunea de respingere: dacă Fc  F ; k ; n  k 1 , atunci H0 se respinge

Determinarea statisticii testului ( Fcalculat  Fc ) are la bază relaţia:


R2 n  k 1 0,989432 7 0,97897 7
Fc        162,93
1 R 2
k 1  0,998943 2 1  0,97897 2
2

Concluzie:
Deoarece Fc (162,93)  F0, 05; 1; 13  4,96  , atunci H 0 se respinge, deci H 1 se acceptă, ceea ce
înseamnă că raportul de corelaţie al colectivităţii din care s-a extras eşantionul de 10 unităţi, diferă
semnificativ de zero, deci este semnificativ statistic.
6. Care este proporția în care cei doi factori (număr vânzători și suprafața comercială)
influențează variaţia vânzării?

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,989430469
R Square 7 0,978972653
Adjusted R Square 0,97296484
Standard Error 2,377677944
Observations 10
Coeficientul de determinaţie (R SQUARE - R 2 ) ne indică ponderea de influenţă a factorului ( x
) în variaţia rezultatului ( y ), adică proporția în care factorii (număr vânzători şi suprafaţă) influențează
variația vânzării.
R SQUARE - R 2  0,978972653 ne arată că 97,897% reprezintă influenţa ambilor factori (număr
vânzători şi suprafaţă) asupra variaţiei vânzărilor.

f.1) Verificarea ipotezei de normalitate a erorilor


I. Procedeu grafic:

Graficul arată că punctele se dispuse aproximativ pe o linie, deci reziduurile sunt normal repartizate

II. Procedeu numeric -- Testul Jarque-Bera

H0: erorile sunt normal distribuite


H1: erorile nu sunt normal distribuite

Valoarea critică:   ;k 1   0, 05;3  7,81


2 2

n  2 K2 
Statistica testului: JB  S 
6  4 
Pentru obținerea coeficientului de asimetrie S-Skewness și a coeficientului de boltire/aplatizare K-
Kurtosis se utilizează funcția Descriptive Statistics (Data/Data Analysis/Descriptive Statistics) pe
rezultatele Residuals:

Residuals Din tabel se observă că:


Mean 0,00 S=Skewness = 1,09, iar Kurtosis = 0,55.
Standard Error 0,66
Median -0,96 n  2 K 2  10  0,55 2 
JB   S    1,09 2   2,1062  2,11
Mode #N/A 6 4  6  4 
Standard Deviation 2,10
Sample Variance 4,40 Decizia:
Deoarece JB (2,11)   0, 05;3 (7,81) rezultă că
2
Kurtosis 0,55
Skewness 1,09 H0 adevărată deci, erorile sunt normal distribuite
Range 6,69

8
Minimum -2,42
Maximum 4,28
Sum 0,00
Count 10,00
Confidence Level(95,0%) 1,50

f.2.) Verificarea ipotezei de homoscedasticitate a erorilor

I. Procedeu grafic:
- Se alcătuiesc 2 grafice:
 corelograma între variabilele X1 (Nr. vânzători) și Residuals
 corelograma între variabilele X2 (Suprafața comercială) și Residuals.
Observație: cele 2 corelograme sunt deja obținute dacă în fereastra Regression s-a bifat: Residual Plots.
În continuare se interpretează cele 2 corelograme, analizând legătura dintre X 1 și erori (din prima
corelograma) și dintre X2 si erori (din a doua corelograma).

Interpretare grafice: deoarece punctele la ambele grafice prezintă o distribuție oscilantă, se acceptă
ipoteza că cele două perechi de variabile ( x1i , ei ) și ( x2 i , ei ) sunt independente și nu corelate.

Nu se cere proiect
II. Procedee numerice -- Testul White pentru modelul bifactorial
 Ipoteze: H0:erorile sunt homoscedastice
H1:erorile sunt heteroscedastice

 estimarea parametrilor modelului iniţial şi calculul valorilor estimate ale variabilei reziduale, ei .

Vânzări (bucăţi)
Număr vânzători Suprafaţa comercială (mp)
(persoane)
22 7 98
20 5 90

9
23 8 110
26 9 130
30 12 140
32 15 145
45 22 156
50 25 160
52 32 164
60 40 175
Regression Statistics
Multiple R 0,9894
R Square 0,9790
Adjusted R Square 0,9730
Standard Error 2,3777
Observations 10
ANOVA  df SS MS F Significance F
Regression 2 1842,4265 921,213 162,950 1,34817E-06
Residual 7 39,5735 5,6534
Total 9 1882,0000
  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 4,7029 6,1868 0,7602 0,4720 -9,9265 19,3323
Nr vânzători (pers.) 0,9745 0,1514 6,4374 0,0004 0,6166 1,3325
Suprafaţa
0,1041 0,0614 1,6949 0,1339 -0,0411 0,2494
com.(mp)
RESIDUAL OUTPUT
Predicted Vânzări (bucăţi) Residuals
Observation ŷi ei  yi  yˆ i Standard Residuals

1 21,7277 0,2723 0,1298


2 18,9457 1,0543 0,5028
3 23,9516 -0,9516 -0,4538
4 27,0084 -1,0084 -0,4809
5 30,9732 -0,9732 -0,4641
6 34,4174 -2,4174 -1,1528
7 42,3844 2,6156 1,2474
8 45,7245 4,2755 2,0390
9 52,9627 -0,9627 -0,4591
10 61,9043 -1,9043 -0,9082

Funcția de regresie:
yˆ i  b0  b1 x1i  b2 x2i

yˆ i  4.70  0.97 x1i  0.10 x2 i

Erorile :
ei  yi  yˆ i  yi  b0  b1 xi (coloana Residuals)

10
 construirea unei regresii auxiliare, bazată pe prespunerea existenţei unei relaţii de dependenţă
între pătratul valorilor erorii, variabila exogenă inclusă în modelul iniţial şi pătratul valorilor acesteia:
 i2   e 0   e1 x1i   e 2 x2i   e3 x12i   e 4 x22i   e 5 x1i x2i  ui
ei2  be 0  be1 x1i  be 2 x2i  be 3 x12i  be 4 x22i  be 5 x1i x2i  ui

și calcularea coeficientului de determinație R2, corespunzător acestei regresii auxiliare.

X1i X1i ^ 2 X2 ^ 2 X1X2 ei^2


X2i ( x1i2 ) 2
( x2i )  x1i ; x2i  ( ei2 )
7 98 49 9604 686 0,0741
5 90 25 8100 450 1,1115
8 110 64 12100 880 0,9056
9 130 81 16900 1170 1,0169
12 140 144 19600 1680 0,9471
15 145 225 21025 2175 5,8436
22 156 484 24336 3432 6,8413
25 160 625 25600 4000 18,2800
32 164 1024 26896 5248 0,9269
40 175 1600 30625 7000 3,6265
Regression Statistics
Multiple R 0,89
R Square 0,78
Adjusted R Square 0,52
Standard Error 3,86
Observations 10
ANOVA  df SS MS F Significance F
Regression 5 217,03 43,41 2,92 0,16
Residual 4 59,48 14,87
Total 9 276,51      
Coefficient Standard Upper
  s Error t Stat P-value Lower 95% 95%
Intercept -157,73 167,80 -0,94 0,40 -623,61 308,15
X1i -24,73 13,66 -1,81 0,14 -62,66 13,20
X2i 4,44 3,80 1,17 0,31 -6,11 14,99
X1i ^ 2 -0,27 0,12 -2,16 0,10 -0,62 0,08
X2 ^ 2 -0,03 0,02 -1,30 0,26 -0,08 0,03
X1X2 0,23 0,12 1,88 0,13 -0,11 0,57
ei2  eˆi2  ui
ei2  be 0  be1 x1i  be 2 x2i  be 3 x12i  be 4 x22i  be 5 x1i x2i  ui

eˆi2  be 0  be1 x1i  be 2 x2i  be 3 x12i  be 4 x22i  be 5 x1i x2i

eˆi2  157,73  24,73x1i  4,44 x2i  0,27 x12i  0,03x22i  0,23x1i x2 i

R 2  0,78

11
 verificarea semnificaţiei parametrilor modelului nou construit în raport cu ipoteza nulă H0 (erorile sunt
homoscedastice); iar unul dintre aceştia este semnificativ diferit de zero, atunci ipoteza H 0 se
respinge (ipoteza de homoscedasticitate nu este adevărată) deci, se acceptă ipoteza de
heteroscedasticitate a erorilor.

De pus in proiect
Utilizarea testului LM:
Ipoteze: H0:erorile sunt homoscedastice
H1:erorile sunt heteroscedastice
LM  n  R 2 ~ 2 ,k
Deoarece LM  n  R 2  10  0,78  7,8 , iar  2 ;k 1   02, 05;3  7,81 , rezultă că LM (7,8)   02, 05;3 (7,81)
deci H0 este adevărat (se acceptă), prin urmare se verifică ipoteza de homoscedasticitate a erorilor.

f.3.) Verificarea ipotezei de non - autocorelare a erorilor

Se verifică autocorelarea de ordinul întâi a erorilor, adică între ei si ei-1


Se copiază valorile variabilei Residuals din foaia de calcul nr. 1 (Sheet 1) într-o nouă foaie de calcul
(Sheet 3) și se alcătuiește tabelul (în coloana 2 apar valorile din coloana 1 decalate cu un rând):

ei ei-1
0,2723
1,0543 0,2723
-0,9516 1,0543
-1,0084 -0,9516
-0,9732 -1,0084
-2,4174 -0,9732
2,6156 -2,4174
4,2755 2,6156
-0,9627 4,2755
-1,9043 -0,9627

I. Procedee grafice:
Pe baza valorilor din tabelul de mai sus se alcătuiește corelograma între ei și ei-1

12
Cum punctele sunt imprastiate, se poate deduce ca nu exista corelare intre ei si e(i-1)

II. Procedee numerice:


Testul Durbin Watson:
Se formuleaza ipotezele: Ho: =0 (erori non-autocorelate)
H1: 0 (erori autocorelate)
n


DWcalc  2 1  rei ;ei 1   (e i  ei 1 ) 2
DW  2 1  0,17   1,66
DWcalc  i 1
n

e
2
i
i 1
În funcție de n=10, pragul de semnificație de 0,05 și k=2 variabile exogene, se stabilesc limitele
d1=0,95 și d2=1,54 care corespund lui n=15 (cel mai apropiat de n=10)

0  DW  d1 d1  DW  d 2 d 2  DW  4  d 2 4  d 2  DW  4  d1 4  d1  DW  4
0  DW  0,95 0,95  DW  1,54 1,54  DW  2,46 2,46  DW  3,05 3,05  DW  4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,54  1,66  2,46

Rezultatul din tabel: 1,54  1,66  2,46 conduce la concluzia că, erorile sunt independente deci, nu sunt
autocorelate (H0 este adevărată)

f.4.) Verificarea ipotezei de multicoliniaritate a variabilelor exogene


(aplicată numai regresiei liniare multiple)

Se verifică dacă există coliniaritate între variabilele exogene X1 si X2.


Observație!!! - pentru obținerea unor estimatori de calitate ridicată nu trebuie să existe
coliniaritate între variabilele exogene.

Se alcătuiește matricea de corelație aplicând Data/Data Analysis/Correlation pe următoarele date:

13
Număr vânzători (persoane) Suprafaţa comercială (mp) Vânzări (bucăţi)
X1i X2i Yi

7 98 22
5 90 20
8 110 23
9 130 26
12 140 30
15 145 32
22 156 45
25 160 50
32 164 52
40 175 60

Se obțin rezultatele:

Număr vânzători Suprafaţa comercială Vânzări


  (persoane) (mp) (bucăţi)
Număr vânzători (persoane) 1
Suprafaţa comercială (mp) 0,896655059 1
Vânzări (bucăţi) 0,985060221 0,924385504 1

a. Criteriul Klein de verificare a multicoliniarității.

Din matricea de corelație de mai sus se reține coeficientul de corelație parțială între numărul
vânzătorilor ( X1 ) și suprafața comercială (X2) : r x1; x2   0,897 .
Se compară pătratul acestui coeficient r x1 ; x2   0,80 cu raportul de corelație al modelului inițial de
2

regresie (R Square = R2 = 0,979).


Dacă r x1 ; x2   R atunci există coliniaritate între variabilele exogene ale modelului de regresie.
2 2

În cazul aplicației: r 2 2 deci, variabilele exogene nu sunt coliniare.


 x1 ; x2   R

b. Criteriul factorului de inflație al dispersiei de verificare a multicoliniaritatii:

1
VIF 
1  r 2x1; x2 

1
VIF   5  10 deci, nu există multicoliniaritate în modelul utilizat
1  0,80
https://web.ma.utexas.edu/users/davis/375/popecol/tables/f005.html

14

S-ar putea să vă placă și