Documente Academic
Documente Profesional
Documente Cultură
45.0000
40.0000
35.0000
30.0000
25.0000
20.0000
15.0000
10.0000
5.0000
0.0000
0.0000 1.0000 2.0000 3.0000 4.0000 5.0000 6.0000 7.0000
Stabilirea legăturii dintre variabile
Corelograma sugerează că există legătură directă şi
liniară între cele două variabile. Există o funcţie f astfel
încât variabila x explică variabila y prin funcţia f, y=f(x), o
funcție liniară f=ax+b.
Modelul liniar de regresie este y= ax+b+ε.
Calculăm estimatorii â și
Nr. crt. x y
xt-xmediu yt-ymediu (xt-xmediu)(yt-ymediu) (xt-xmediu)^2
1 3,4000 26,2000 0,1200 -0,2133 -0,0256 0,0144
2 1,8000 17,8000 -1,4800 -8,6133 12,74773333 2,1904
3 4,6000 31,3000 1,3200 4,8867 6,4504 1,7424
4 2,3000 23,1000 -0,9800 -3,3133 3,247066667 0,9604
5 3,1000 27,5000 -0,1800 1,0867 -0,1956 0,0324
6 5,5000 36,0000 2,2200 9,5867 21,2824 4,9284
7 0,7000 14,1000 -2,5800 -12,3133 31,7684 6,6564
8 3,0000 22,3000 -0,2800 -4,1133 1,151733333 0,0784
9 2,6000 19,6000 -0,6800 -6,8133 4,633066667 0,4624
10 4,3000 31,3000 1,0200 4,8867 4,9844 1,0404
11 2,1000 24,0000 -1,1800 -2,4133 2,847733333 1,3924
12 1,1000 17,3000 -2,1800 -9,1133 19,86706667 4,7524
13 6,1000 43,2000 2,8200 16,7867 47,3384 7,9524
14 4,8000 36,4000 1,5200 9,9867 15,17973333 2,3104
15 3,8000 26,1000 0,5200 -0,3133 -0,162933333 0,2704
TOTAL 49,2000 396,2000 171,114 34,7840
MEDIE 3,2800 26,4133
Ecuația de regresie
Interpretare rezultate
Interpretarea valorilor coeficienţilor
a arată că valoarea prejudiciului creşte, in medie, cu 4,9193 mii euro dacă
distanţa dintre parcelă şi staţia de pompare creşte cu o unitate, adică 10 km (b
arata cu cat se modifica, in medie, nivelul variabilei dependente, daca nivelul
variabilei independente creste cu o unitate);
b arată că valoarea prejudiciului este, în medie, egală cu 10,2779 mii euro dacă
parcela ar fi lângă staţia de pompare (a arata nivelul mediu al variabilei
dependente, daca nivelul variabilei independente ar fi egal cu 0; a nu are
intotdeauna interpretare economică).
Validitatea modelului de regresie
Pentru testarea validităţii modelului se formulează cele
, două ipoteze:
H0: modelul de regresie nu este valid statistic, cu alternativa
H1: modelul de regresie este valid statistic.
SSR
MSR k
F ~ Fisherk ,n k 1
MSE SSE
n k 1
Validitatea modelului de regresie
Unde:
MSR=media pătratelor datorate regresiei
MSE=media pătratelor datorate reziduurilor
SSR=suma pătratelor datorate regresiei
SSE=suma pătratelor datorate reziduurilor
k=numărul de variabile explicative din modelul de regresie (în cazul nostru, k=1 deoarece avem
un model de regresie liniară unifactorială sau simplă, cu o singură variabilă explicativă)
n=numărul de observații
Validitatea modelului de regresie
Fie α nivelul sau pragul de semnificaţie al testului, iar 1-α este nivelul de încredere al testului.
Dacă nu se specifică, vom considera în general că α=0,05 (sau α·100=5%),
iar 1-α=0,95 (sau (1-α)·100=95%).
Pentru calculul statisticii folosim tabelul ANOVA:
F22';kMSR
SSE
SST
SSR
MSE
MSR
F SSR
,n k 22SSE
s
222
yey1//ey
x/ x
ssFecalcMSE nnk2k 1
y/ x n nsk 1 22 2
ekyˆyiii yyyˆ i
ii11
Fcritic
F0,05;1,13 4,667
x x y
i i y x y i i n x y
rxy i 1
i 1
n n
n
2 n
2
ix x 2
iy y 2
xi n x yi n y
2 2
i 1 i 1 i 1 i 1
n n n
n xi yi xi yi
i 1 i 1 i 1
n 2 n 2 n 2 n 2
n xi xi n yi yi
i 1 i 1 i 1 i 1
incendii este explicată de variaţia variabilei independente (distanţa între locul parcelei şi staţia de
pompare).
Intervalul de încredere
Intervalul de încredere (1-α)·100% = 95% pentru parametrul a al modelului linear de regresie
In cazul nostru, nivelul de semnificatie al testului este α=0,05, iar Significance F = 0,000000012, deci
Significance F <α, prin urmare respingem H0 si acceptam H1 ca modelul de regresie este valid sau semnificativ
statistic.
P value
P value, adica nivelul de semnificatie observat sau calculat, este cel mai mic nivel fixat de
semnificație al testului pentru care ipoteza nula H0 poate fi respinsă.
Daca α=0,05 este nivelul sau pragul de semnificatie al testului, atunci regula de decizie este:
• dacă P value >α, atunci nu există suficiente motive să respingen ipoteza nulă H0, adică
acceptam H0, rezultatul nu este semnificativ statistic, adică modelul de regresie nu este valid
statistic;
• dacă P value <α, atunci se repinge ipoteza nula H0 și, prin urmare, se acceptă ipoteza
alternativă H1, adică rezultatul este semnificativ statistic, ceea ce înseamnă că modelul de
regresie este valid statistic sau este corect specificat.
P value
Pentru parametrul a, P Value=0,000000012, deci este ma mic decât α, prin urmare respingen
ipoteza nula H0 și acceptam ipoteza alternativă H1 , adică parametrul b este semnificativ
statistic.
Pentru parametrul b, P Value= 0,000006586, deci este ma mic decât α, prin urmare respingen
ipoteza nula H0 și acceptam ipoteza alternativă H1 , adică parametrul b este semnificativ
statistic.
Studiul reziduurilor
RESIDUAL OUTPUT Pentru fiecare observaţie (linie din tabelul de date
Observation Predicted Y Residuals Standard Residuals iniţial) se afişează:
1 27,0037 -0,8037 -0,3600
2 19,1327 -1,3327 -0,5971 Observation – numărul de ordine al observaţiei.
3 32,9068 -1,6068 -0,7199
4 21,5924 1,5076 0,6754 Predicted y – valoarea y prognozată pentru
5 25,5279 1,9721 0,8835
6 37,3342 -1,3342 -0,5978
observaţia respectivă; se obţine înlocuind valorile X
7 13,7215 0,3785 0,1696 ale observaţiei în modelul estimat.
8 25,0359 -2,7359 -1,2257
9 23,0682 -3,4682 -1,5538 Residuals – valoarea erorii de predicţie (diferenţa
10 31,4311 -0,1311 -0,0587
11 20,6085 3,3915 1,5194
dintre valoarea observată şi valoarea prognozată).
12 15,6892 1,6108 0,7217
13 40,2858 2,9142 1,3056 Standard Reziduals – valoarea standardizată a erorii.
14 33,8907 2,5093 1,1242 Este obţinută prin împărţirea reziduului la abaterea
15 28,9714 -2,8714 -1,2864
0,0000
standard a reziduurilor (rezultatul nu este susţinut
absolut riguros de teorie).