Sunteți pe pagina 1din 4

MODEL DE REGRESIE LINIARĂ UNIFACTORIALĂ

(Legătură INDIRECTĂ – activitate seminar) – cerințe d, e, f, g, h

Aplicație
Pentru o firmă se cunosc datele privind numărul absențelor şi salariul obţinut pentru 14 salariați:
Salariul (mii lei) 1 5 2 4 2 3 0 1 4 2 4 2 5 1
Număr absențe ( zile) 8 3 7 5 6 7 10 8 3 7 5 6 7 10
În ipoteza existenței unei legături liniare între cele două variabile, se cere:
a) Să se reprezinte grafic datele;
b) Să se determine modelul de regresie în eşantion;
c) Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de semnificaţie α=0,05
d) Să se verifice validitatea/semnificaţia modelului de regresie găsit la punctul b) folosind testul F, pentru un
nivel de semnificaţie α=0,05
e) Să se măsoare intensitatea legăturii dintre variabile folosind un indicator adecvat, testând semnificaţia
acestuia pentru un nivel de semnificaţie α=0,05.
f) Ce pondere din variaţia totală a profitului este explicată de influenţa vânzărilor de cămăşi?
g) Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie, testând
semnificaţia acestuia pentru un nivel de semnificaţie α=0,05.
h) Dacă modelul s-a dovedit semnificativ, să se previzioneze valoarea salariului dacă s-ar absenta 6 zile.

Rezolvare

Volumul eșantionului: n = 14 salariați


yi = variabila rezultativă/dependentă = Salariul (mii lei)
xi = variabila factorială / independentă = Nr. absențe (zile)
k = 1 (numărul factorilor = 1 factor = o variabilă independentă = Nr. absențe)

yi  f  xi   alti factori
Salariul = f ( Nr. absențe ) + alți factori (erori/reziduuri)
(mii lei) (zile)

Ca urmare a aplicării funcției Regression din Excel rezultatele sunt:


Tabel 1 - Regression Statistics
Multiple R 0,80
R Square 0,64
Adjusted R Square 0,61
Standard Error 1,34
Observations 14
Tabel 2 - ANOVA df SS MS F Significance F
Regression 1 37,85 37,85 21,05 0,000624
Residual 12 21,58 1,80
Total 13 59,43
Tabel 3 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 9,31 0,70 13,38 1,43E-08 7,79 10,82
Nr. Absențe -1,06 0,23 -4,59 0,000624 -1,57 -0,56

1
d. Validitatea/semnificaţia modelului de regresie yi  9,31  1,06 xi  ei
Tabel 2 - ANOVA df SS MS F Significance F
Regression 1 37,85 37,85 21,05 0,00062357
Residual 12 21,58 1,80
Total 13 59,43

Tabelul ANOVA cu notațiile corespunzătoare:


Tabel 2 - ANOVA df SS MS F Sig. F*
37,85
1 37,85 SSR
Regression ( R ) df R  k SSR MSR 
df R
1,80 21,05
Residual - erori 12 21,58 SSE 0,0006
(E) df E  n  k  1 SSE MSE  MSR
df E Fc 
MSE
13 59,43
Total dfT  n  1 SST  SSR  SSE
dfT  df R  df E

Volumul eșantionului: n = 14 salariați


k = 1 (numărul factorilor = 1 factor = o variabilă independentă = Nr. absențe)

 Ipoteze
H0: MSR  MSE modelul nu este valid statistic
H1: MSR  MSE modelul este valid statistict
 Valoarea critică:
vcrit.  Fcrit.  F ; dfR ; dfE  F ; k ; nk 1  F0,05; 1; 1411  F0,05; 1; 12  4,75
 Valoare calculată (Statistica testului) adică F  Fcalculat  Fc are la bază relaţia:
SSR SSR 37,85
MSR df R k 37,85
Fc     1   21,05
MSE SSE SSE 21,85 1,80
df E n  k 1 12

 Decizia: Deoarece Fc (21,05)  Fcrit. (4,75)  H 0 se respinge, deci H 1 este adevărată 


modelul este valid.

TOTODATĂ, deoarece Signifianc e F (0,0006)   (0,05)  H 0 se respinge, deci H 1 este


adevărată  modelul este valid.

Probabilitatea maximă pentru care putem susține că modelul este valid va fi:
100  Signifianc e F %  100  0,06  99,94%  95%

2
e. Măsurarea intensității legăturii folosind un indicator adecvat (Raportul de corelație =
Multiple R) și testarea semnificației acestuia (testul Fisher) se realizează pornind de la
rezultatele indicatorilor tabelului 1.
Tabel 1 - Regression Statistics
Multiple R (Raport de Corelație) R = 0,80
R Square (Coeficient de determinație) R2 = 0,64
Adjusted R Square 0,61
Standard Error 1,34
Observations (volum eșantion) n = 14

Luând în considerare că, intensitatea legăturii se măsoară cu ajutorul Raportului de corelație


(R), valoarea de 0,80 ( R  R 2  0,64  0,80 ) arată că, între salariu și nr. absențe este o legătură
puternică (deoarece R  0,75; 0,95 )

Testarea semnificației Raportului de corelație


 Ipoteze H0: R  0 Raportul de corelație nu este semnificativ statistic (modelul nu e valid)
H1: R  0 Raportul de corelație este semnificativ statistic (modelul este valid)
 Valoarea critică:
vcrit.  Fcrit.  F ; dfR ; dfE  F ; k ; nk 1  F0,05; 1; 1411  F0,05; 1; 12  4,75
 Valoare calculată (Statistica testului) adică Fcalculat  Fcalc  Fc are la bază relaţia:
n  k 1 R2 12 0,80 2 12 0,64
Fc    .    21,3
k 1 R 2
1 1  0,80 2
1 1  0,64

 Decizia: deoarece Fc 21,3  Fcrit 4,75  H 0 se respinge, deci H 1 este adevărată 


Raportul de corelație este semnificativ statistic (modelul este valid).

f. Ponderea din variaţia totală a salariului explicată de influenţa absențelor este stabilită
prin Coeficientul de Determinație = R Square
Tabel 1 - Regression Statistics
Multiple R (Raport de Corelație) R = 0,80
R Square (Coeficient de determinație) R2 = 0,64
Adjusted R Square 0,61
Standard Error 1,34
Observations (volum eșantion) n = 14

Coeficientul de Determinație R2 = (R)2 = (0,80)2 = 0,64 arată că, 64% din salariu este
explicat de influenţa absențelor (este explicat de model) care fiind mai mare de 50%, înseamnă că
este o influență semnificativă. Restul până la 100% ( de 36%) arată cât la sută din variația totală a
salariului este explicată de alți factori (nu este explicată de model).
3
g. Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie,
testând semnificaţia acestuia pentru un nivel de semnificaţie α=0,05.

Observație: Dacă legătura între două variabile este liniară (așa cum se precizează în enunț) atunci
R r

Măsurarea legăturii dintre salariu și numărul absențe cu ajutorul coeficientului de corelație are
la bază afirmația existenței unei legături liniare între variabile (vezi enunț), care se transpune prin
relația: R  r . În acest context, având în vedere că legătura între variabile este indirectă liniară,
atunci coeficientul de corelație este negativ ( r  0 ), după cum se observă și din matricea de
corelație deci, r  R  0,80 .
Valoarea coeficientului de corelație r   0,80 arată că legătura dintre salariu și nr. absențe
este indirectă ( r  0 ) puternică ( r  0,75; 0,95 ).

Matrice de corelație
Nr. Absențe (zile) x Salariu (mii lei) y
Nr. Absențe (zile) x 1
Salariu (mii lei) y -0,80 1

Testarea semnificației coeficientului de corelație (Test STUDENT- bilateral) - aplicație


 Ipoteze H0:   0 Coeficientul de corelație  nu este semnificativ statistic
H1:   0 Coeficietul de corelație  este semnificativ statistic

 valoarea critică: vcrit.  tcrit.   t   t 0,05  tbilateral0,05;12  2,179


;nk 1 ;1411
2 2

r  0,80
 Statistica testului: tc  tcalc   n  k 1   14  1  1  4,498
1 r2 1  (0,80) 2

 Decizia:
Deoarece tc (4,498)  tcrit (2.179)  H 0 se respinge, deci H 1 este adevărată  Coeficietul
de corelație  este semnificativ statistic

h. Previzionare salariu dacă s-ar înregistra 6 absențe:

Luând în considerare modelul de regresie: yi  9,31  1,06 xi  ei , previzionarea profitului se


realizează înlocuind în funcția de regresie yˆ nv  9,31  1,06 xnv valoarea lui xnv cu 6 absențe:
yˆ nv  9,31  1,06 xnv  9,31  1,06  6  2,59 mii lei
Interpretare: dacă s-ar înregistra 6 absențe atunci, salariul ar fi de 2,59 mii lei.

S-ar putea să vă placă și