Documente Academic
Documente Profesional
Documente Cultură
Problema 2 Rezolvata Regresie Simpla
Problema 2 Rezolvata Regresie Simpla
1. Un cercetător este interesat de relaţia existentă între venitul unei persoane şi vârsta acesteia.
Pentru aceasta selectează aleator un eşantion de 29 persoane si înregistrează valori pentru
variabilele venit lunar (sute lei) şi vârstă (ani). În urma prelucrării datelor cu modulul
Regression din EXCEL, in ipoteza unei dependenţe liniare, se obţin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,797764
R Square …
Adjusted R Square 0,623442
Standard Error 3,949
Observations 29
ANOVA
df SS MS F Significance F
Regression ………….. ………….. ………….. ………….. 0,000000130
Residual ………….. 421,3477 …………..
Total ………….. 1158,907
Rezolvare:
SSR se deduce din formula SSR+SSE=SST => SSR=SST-SSE= 1158,907- 421,3477= 737,5593
Gradele de libertate din coloana df sunt : k=1 pentru ca avem o singura variabila independentă,
vârsta.
n-k-1= 29-1-1= 27, n-1=28
MSR= SSR/k= 737,5593
MSE= SSE/(n-k-1)= 421,3477/27= 15,60
Statistică, Anul I, sem II, CSIE, 2020-2021
Intervalele de încredere:
Limita inferioară:
b0- sb0* t critic= 0,127095- 2,052*2,747=-5,50985
b1- sb1* t critic= 0,511964- 2,052*0,073137=0,361886
Limita superioară
b0+ sb0* t critic= 0,127095+ 2,052*2,747=5,6368
b1+ sb1* t critic= 0,511964+ 2,052*0,073137=0,66204
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,797764
R Square 0,6364
Adjusted R Square 0,623442
Standard Error 3,949
Observations 29
ANOVA
df SS MS F Significance F
Regression 1 737,5593 737,5593 47,279 0,000000130
Residual 27 421,3477 15,60
Total 28 1158,907
Nota: daca aveți valori mici in output, folosiți cel puțin 4 zecimale!
b) Significance F = 0,000000130< 5%, deci se accepta H1, modelul este semnificativ din punct
de vedere statistic pentru un prag de semnificație de 5%
sau Fcalculat> F critic (47,279> 4,21), deci se accepta H1, modelul este semnificativ din punct de
vedere statistic pentru o probabilitate de garantare a rezultatelor de 95%.
Statistică, Anul I, sem II, CSIE, 2020-2021
c) Calculele intervalului de încredere s-au efectuat la rezolvarea cerinței a). Pentru testarea
semnificației coeficienților avem 3 modalități, cu rezultate identice.
Cu testul t: pentru b0 |tcalculat| < tcritic (0,046266< 2,052) deci acceptăm H0 , coeficientul nu este
semnificativ dpdv statistic.
pentru b1 |tcalculat| > tcritic (7,1050> 2,052) deci acceptăm H1 , coeficientul este semnificativ
dpdv statistic
pentru b1, 0,00000013<0,05, deci acceptam H1 , coeficientul este semnificativ dpdv statistic
pentru b0, intervalul [-5,50985; 5,6368] conține valoarea 0, deci b0 nu este semnificativ dpdv
statistic pentru o probabilitate de garantare a rezultatelor de 95%
pentru b1 intervalul [0,361886; 0,66204] nu conține valoarea 0, deci b1 este semnificativ dpdv
statistic pentru o probabilitate de garantare a rezultatelor de 95%
Notă: dacă vi se cere rezolvarea cu o anumita metodă (de exemplu folosind intervalele de
încredere) puteți verifica rezultatul folosind celelalte metode. Rezultatele trebuie sa fie identice,
ca în exemplul de mai sus.
d) se folosesc valorile pentru R si b1. b1 este pozitiv, deci avem o legătură directă între vârsta și
venitul unei persoane. R=0,797764, deci intensitatea legăturii dintre variabile este medie spre
puternica. Valoarea coeficientului de corelație este deci de 0,797764, indicând o legătură directă,
medie spre puternică.