Sunteți pe pagina 1din 16

Regresia multipla cu Excel

In tabelul urmator se prezinta nivelul indicele bursier S&P 500,


rata somajului si rata inflatiei (%) pentru perioada ianuarie 2014-februarie 2016.
Rata Rata Rata Rata
Perioada S&P 500 somajului inflatiei Perioada S&P 500 somajului inflatiei
ian.14 1822,36 8,18 1,58 feb.15 2082,20 5,47 -0,03
feb.14 1817,03 7,83 1,13 mar.15 2079,99 5,43 -0,07
mar.14 1863,52 8,21 1,51 apr.15 2094,86 5,2 -0,2
apr.14 1864,26 8,25 1,95 mai.15 2111,94 5,46 -0,04
mai.14 1889,77 8,43 2,13 iun.15 2099,28 5,42 0,12
iun.14 1947,09 8,17 2,07 iul.15 2094,14 5,47 0,17
iul.14 1973,10 8,19 1,99 aug.15 2039,87 5,3 0,2
aug.14 1961,53 7,8 1,7 sept.15 1944,40 5,06 -0,04
sept.14 1993,23 7,56 1,66 oct.15 2024,81 5,17 0,17
oct.14 1937,27 7,46 1,66 nov.15 2080,62 5,5 0,5
nov.14 2044,57 7,12 1,32 dec.15 2054,08 5,73 0,73
dec.14 2054,27 6,36 0,76 ian.16 1918,60 6,27 1,37
ian.15 2028,18 5,61 -0,09 feb.16 1904,42 5,92 1,02
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,742268585
R Square 0,550962652
Adjusted R Square 0,511915926
Standard Error 64,02005519
Observations 26
Multiple R – coeficientul multiplu de corelaţie.
R Square – coeficientul de determinare (este egal cu pătratul coeficientului de corelaţie multiplă).
Poate fi gândit, exprimat procentual, drept proporţia din variaţia variabilei dependente explicată de
variaţia variabilelor independente: 60,7% din variaţia lui Y este explicată de variabilele X.
Adjusted R Square – valoarea corectată a coeficientului de determinare.
Este introdusă pentru a contracara (parţial) efectul creşterii mecanice a
lui R patrat o dată cu numărul variabilelor independente.
Standard Error – eroarea standard a estimaţiei. Se calculează ca abaterea standard a reziduurilor
(pentru numărul gradelor de libertate utilizat se va vedea tabloul ANOVA, în continuare)
şi este estimaţia abaterii standard a erorilor ε (în ipoteza normalităţii acestora).
Observations – numărul de observaţii din eşantion.
ANOVA

MS-Media sumelor Significance F -


de pătrate: S Probabilitatea
S împărţită la critică
numărul respectiv unilaterală.
de grade de Dacă valoarea
libertate. F afişată este mai
Valoarea de pe linia Valoarea mică
SS– sumele de pătrate a doua (Residual) statisticii decât pragul de
potrivit este estimaţia F semnificaţie
descompunerii dispersiei pentru pentru fixat,
Suma globală de repartiţia erorilor şi testul atunci se
pătrate = Suma de este pătratul erorii caracteri respinge ipoteza
Df pătrate datorată standard a zat de nulă în favoarea
Nr.grd.libertate regresiei + Suma de estimaţiei. H0 si H1 ipotezei
pătrate reziduală alternative.
14,1103
Regression 2 115664,3765 57832,18824 419 0,000100288
Residual 23 94267,05173 4098,567466
Total 25 209931,4282
Coefficients Standard Error t Stat P-value

Intercept 2308,909927 154,3553675 14,95840387 2,42476E-13

X Variable 1 -47,09097982 29,10202537 -1,618134106 0,119267087

X Variable 2 -11,77308472 45,02120091 -0,261500904 0,796033761


Liniile tabelului se referă la variabilele din model, incluzând şi termenul liber.
Coloanele tabelului sunt următoarele:
(prima coloană) – sunt afişate denumirile existente în tabloul de date sau create
automat pentru variabilele independente implicate. Intercept este denumirea pentru
termenul liber (constant) al modelului.
Coefficients – conţine valorile estimate ale coeficienţilor.
Standard Error – eroarea standard a coeficientului (abaterea standard a repartiţiei
coeficientului).
t Stat – statistica t pentru verificarea ipotezei H0 : αi = 0 contra ipotezei alternative
H1 : αi ≠ 0. În condiţiile ipotezei nule se demonstrează că raportul dintre coeficient şi
eroarea standard a coeficientului urmează o repartiţie Student cu (n – 2) grade de
libertate. Acest raport este tocmai valoarea raportată drept t Stat.
P-value – probabilitatea critică bilaterală a testului t cu ipotezele precizate la t Stat.
Lower 95% Upper 95%
Intercept 1989,601523 2628,218
X Variable 1 -107,2931057 13,11115
X Variable 2 -104,9065341 81,36036

Lower 95%, Upper 95% – limitele inferioară şi superioară ale intervalului de


încredere pentru parametrul respectiv. Limitele la pragul 0,05 sunt calculate
automat, indiferent de iniţializarea procedurii Regression.
Studiul reziduurilor se poate face pe baza datelor raportate în tabelul alocat
reziduurilor, tabel având structura următoare:
RESIDUAL OUTPUT

Observation Predicted Y Residuals


1 1905,104238 -82,7442385
2 1926,88397 -109,8539696
3 1904,515625 -40,99562503
4 1897,451829 -33,19182856
5 1886,856297 2,913703053
6 1899,806337 47,28366322
7 1899,806364 73,29363604
8 1921,586041 39,94395934
9 1933,358799 59,87120079
10 1938,067897 -0,797897191
11 1958,081679 86,48832087
12 2000,463751 53,80624876
13 2045,789108 -17,60910812
14 2051,67546 30,52453979
15 2054,030023 25,95997721
16 2066,391449 28,46855084
17 2052,264101 59,67589915
18 2052,264046 47,01595351
19 2049,320843 44,81915674
20 2056,973117 -17,10311729
21 2071,100493 -126,7004928
22 2063,448137 -38,63813721
23 2044,022996 36,59700409
24 2030,484261 23,59573893
25 1997,520358 -78,92035775
26 2018,12278 -113,7027803
Pentru fiecare observaţie (linie din tabelul de date iniţial) se afişează:

Observation – numărul de ordine al observaţiei.

Predicted y – valoarea y prognozată pentru observaţia respectivă; se obţine


înlocuind valorile X ale observaţiei în modelul estimat.

Residuals – valoarea erorii de predicţie (diferenţa dintre valoarea observată şi


valoarea prognozată).

Standard Reziduals – valoarea standardizată a erorii. Este obţinută prin


împărţirea reziduului la abaterea standard a reziduurilor (rezultatul nu este
susţinut absolut riguros de teorie).
Analiza calităţii modelului este facilitată şi de graficele construite automat de
procedura Regression.

Sunt produse două tipuri de diagrame:

– diagrame reziduuri vs. variabile independente şi

– diagrame variabila dependentă vs. variabile independente.

Graficele necesită, de obicei, prelucrări suplimentare pentru a fi interpretate


sau raportate.
X Variable 1 Residual Plot
100

50

0
Residuals

0 1 2 3 4 5 6 7 8 9

-50

-100

-150
X Variable 1
Formele de distribuire a reziduurilor duc la concluzii importante pentru adecvanţa
modelului în privinţa variabilei independente implicate:
X Variable 2 Residual Plot
100

50

0
Residuals

-0,5 0 0,5 1 1,5 2 2,5

-50

-100

-150
X Variable 2

S-ar putea să vă placă și