Sunteți pe pagina 1din 3

Statistică, Anul I, sem II, CSIE, 2020-2021

1. Un cercetător este interesat de relaţia existentă între venitul unei persoane şi vârsta acesteia.
Pentru aceasta selectează aleator un eşantion de 29 persoane si înregistrează valori pentru
variabilele venit lunar (sute lei) şi vârstă (ani). În urma prelucrării datelor cu modulul
Regression din EXCEL, in ipoteza unei dependenţe liniare, se obţin rezultatele:

SUMMARY OUTPUT

Regression Statistics
Multiple R 0,797764
R Square …
Adjusted R Square 0,623442
Standard Error 3,949
Observations 29

ANOVA
df SS MS F Significance F
Regression ………….. ………….. ………….. ………….. 0,000000130
Residual ………….. 421,3477 …………..
Total ………….. 1158,907

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 0,127095 ………….. 0,046266 0,9634266 ………….. …………..
varsta 0,511964 0,073137 ………. 0,00000013 ………….. …………..

a) Completați datele lipsă din tabel


b) testați semnificația modelului, pentru o probabilitate de garantare a rezultatelor de 95%
(Fcritic=4,21);
c) Testați semnificația parametrilor modelului de regresie, determinați intervalele de
încredere pentru aceștia. Interpretați rezultatele obținute (tcritic= 2,052).
d) Analizaţi sensul şi intensitatea legăturii dintre cele două variabile;

Rezolvare:

a) R2 se poate determina în 2 moduri


1) Pe baza raportului de corelație R , R2= (0,797764)2 = 0,6364
2) Pe baza raportului SSR/SST, cu valorile obținute din tabelul ANOVA
(737,5593/1158,907=0,636)

SSR se deduce din formula SSR+SSE=SST => SSR=SST-SSE= 1158,907- 421,3477= 737,5593

Gradele de libertate din coloana df sunt : k=1 pentru ca avem o singura variabila independentă,
vârsta.
n-k-1= 29-1-1= 27, n-1=28
MSR= SSR/k= 737,5593
MSE= SSE/(n-k-1)= 421,3477/27= 15,60
Statistică, Anul I, sem II, CSIE, 2020-2021

MSE se poate afla și că se2= (3,949)2= 15,60


F=MSR/MSE= 737,5593/ 15,60= 47,279

Pentru b1 (coeficientul vârstei), tcalculat= b1/sb1= 0,511964/0,073137 =7,0000

Pentru b0 (intercept) sb0= b0/tcalculat = 0,127095/0,046266=2,747

Intervalele de încredere:

Limita inferioară:
b0- sb0* t critic= 0,127095- 2,052*2,747=-5,50985
b1- sb1* t critic= 0,511964- 2,052*0,073137=0,361886

Limita superioară
b0+ sb0* t critic= 0,127095+ 2,052*2,747=5,6368
b1+ sb1* t critic= 0,511964+ 2,052*0,073137=0,66204

Outputul completat este:

SUMMARY OUTPUT

Regression Statistics
Multiple R 0,797764
R Square 0,6364
Adjusted R Square 0,623442
Standard Error 3,949
Observations 29

ANOVA
df SS MS F Significance F
Regression 1 737,5593 737,5593 47,279 0,000000130
Residual 27 421,3477 15,60
Total 28 1158,907

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 0,127095 2,74704 0,046266 0,9634266 -5,50985 5,6368
varsta 0,511964 0,073137 7,0000 0,00000013 0,361886 0,66204

Nota: daca aveți valori mici in output, folosiți cel puțin 4 zecimale!

b) Significance F = 0,000000130< 5%, deci se accepta H1, modelul este semnificativ din punct
de vedere statistic pentru un prag de semnificație de 5%
sau Fcalculat> F critic (47,279> 4,21), deci se accepta H1, modelul este semnificativ din punct de
vedere statistic pentru o probabilitate de garantare a rezultatelor de 95%.
Statistică, Anul I, sem II, CSIE, 2020-2021

Nota. Probabilitate de garantare a rezultatelor=(1-α)*100%, corespunde unui prag de


semnificație (sau nivel de semnificație) α

c) Calculele intervalului de încredere s-au efectuat la rezolvarea cerinței a). Pentru testarea
semnificației coeficienților avem 3 modalități, cu rezultate identice.

Cu testul t: pentru b0 |tcalculat| < tcritic (0,046266< 2,052) deci acceptăm H0 , coeficientul nu este
semnificativ dpdv statistic.

pentru b1 |tcalculat| > tcritic (7,1050> 2,052) deci acceptăm H1 , coeficientul este semnificativ
dpdv statistic

Folosind P-values : pentru b0, 0,9634266>0,05, deci acceptam H0 , coeficientul nu este


semnificativ dpdv statistic.

pentru b1, 0,00000013<0,05, deci acceptam H1 , coeficientul este semnificativ dpdv statistic

Folosind intervalele de încredere

pentru b0, intervalul [-5,50985; 5,6368] conține valoarea 0, deci b0 nu este semnificativ dpdv
statistic pentru o probabilitate de garantare a rezultatelor de 95%

pentru b1 intervalul [0,361886; 0,66204] nu conține valoarea 0, deci b1 este semnificativ dpdv
statistic pentru o probabilitate de garantare a rezultatelor de 95%

Notă: dacă vi se cere rezolvarea cu o anumita metodă (de exemplu folosind intervalele de
încredere) puteți verifica rezultatul folosind celelalte metode. Rezultatele trebuie sa fie identice,
ca în exemplul de mai sus.

d) se folosesc valorile pentru R si b1. b1 este pozitiv, deci avem o legătură directă între vârsta și
venitul unei persoane. R=0,797764, deci intensitatea legăturii dintre variabile este medie spre
puternica. Valoarea coeficientului de corelație este deci de 0,797764, indicând o legătură directă,
medie spre puternică.

S-ar putea să vă placă și