Documente Academic
Documente Profesional
Documente Cultură
Aplicație
Pentru o firmă se cunosc datele privind numărul absențelor şi salariul obţinut pentru 14 salariați:
Salariul (mii lei) 1 5 2 4 2 3 0 1 4 2 4 2 5 1
Număr absențe ( zile) 8 3 7 5 6 7 10 8 3 7 5 6 7 10
În ipoteza existenței unei legături liniare între cele două variabile, se cere:
a) Să se reprezinte grafic datele;
b) Să se determine modelul de regresie în eşantion;
c) Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de semnificaţie α=0,05
d) Să se verifice validitatea/semnificaţia modelului de regresie găsit la punctul b) folosind testul F, pentru un
nivel de semnificaţie α=0,05
e) Să se măsoare intensitatea legăturii dintre variabile folosind un indicator adecvat, testând semnificaţia
acestuia pentru un nivel de semnificaţie α=0,05.
f) Ce pondere din variaţia totală a profitului este explicată de influenţa vânzărilor de cămăşi?
g) Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie, testând
semnificaţia acestuia pentru un nivel de semnificaţie α=0,05.
h) Dacă modelul s-a dovedit semnificativ, să se previzioneze valoarea salariului dacă s-ar absenta 6 zile.
Rezolvare
yi f xi alti factori
Salariul = f ( Nr. absențe ) + alți factori (erori/reziduuri)
(mii lei) (zile)
1
d. Validitatea/semnificaţia modelului de regresie yi 9,31 1,06 xi ei
Tabel 2 - ANOVA df SS MS F Significance F
Regression 1 37,85 37,85 21,05 0,00062357
Residual 12 21,58 1,80
Total 13 59,43
Ipoteze
H0: MSR MSE modelul nu este valid statistic
H1: MSR MSE modelul este valid statistict
Valoarea critică:
vcrit. Fcrit. F ; dfR ; dfE F ; k ; nk 1 F0,05; 1; 1411 F0,05; 1; 12 4,75
Valoare calculată (Statistica testului) adică F Fcalculat Fc are la bază relaţia:
SSR SSR 37,85
MSR df R k 37,85
Fc 1 21,05
MSE SSE SSE 21,85 1,80
df E n k 1 12
Probabilitatea maximă pentru care putem susține că modelul este valid va fi:
100 Signifianc e F % 100 0,06 99,94% 95%
2
e. Măsurarea intensității legăturii folosind un indicator adecvat (Raportul de corelație =
Multiple R) și testarea semnificației acestuia (testul Fisher) se realizează pornind de la
rezultatele indicatorilor tabelului 1.
Tabel 1 - Regression Statistics
Multiple R (Raport de Corelație) R = 0,80
R Square (Coeficient de determinație) R2 = 0,64
Adjusted R Square 0,61
Standard Error 1,34
Observations (volum eșantion) n = 14
f. Ponderea din variaţia totală a salariului explicată de influenţa absențelor este stabilită
prin Coeficientul de Determinație = R Square
Tabel 1 - Regression Statistics
Multiple R (Raport de Corelație) R = 0,80
R Square (Coeficient de determinație) R2 = 0,64
Adjusted R Square 0,61
Standard Error 1,34
Observations (volum eșantion) n = 14
Coeficientul de Determinație R2 = (R)2 = (0,80)2 = 0,64 arată că, 64% din salariu este
explicat de influenţa absențelor (este explicat de model) care fiind mai mare de 50%, înseamnă că
este o influență semnificativă. Restul până la 100% ( de 36%) arată cât la sută din variația totală a
salariului este explicată de alți factori (nu este explicată de model).
3
g. Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie,
testând semnificaţia acestuia pentru un nivel de semnificaţie α=0,05.
Observație: Dacă legătura între două variabile este liniară (așa cum se precizează în enunț) atunci
R r
Măsurarea legăturii dintre salariu și numărul absențe cu ajutorul coeficientului de corelație are
la bază afirmația existenței unei legături liniare între variabile (vezi enunț), care se transpune prin
relația: R r . În acest context, având în vedere că legătura între variabile este indirectă liniară,
atunci coeficientul de corelație este negativ ( r 0 ), după cum se observă și din matricea de
corelație deci, r R 0,80 .
Valoarea coeficientului de corelație r 0,80 arată că legătura dintre salariu și nr. absențe
este indirectă ( r 0 ) puternică ( r 0,75; 0,95 ).
Matrice de corelație
Nr. Absențe (zile) x Salariu (mii lei) y
Nr. Absențe (zile) x 1
Salariu (mii lei) y -0,80 1
r 0,80
Statistica testului: tc tcalc n k 1 14 1 1 4,498
1 r2 1 (0,80) 2
Decizia:
Deoarece tc (4,498) tcrit (2.179) H 0 se respinge, deci H 1 este adevărată Coeficietul
de corelație este semnificativ statistic