Sunteți pe pagina 1din 3

MODEL DE REGRESIE LINIARĂ UNIFACTORIALĂ

(Legătură INDIRECTĂ – activitate seminar) - cerințe a, b, c

Aplicație
Pentru o firmă se cunosc datele privind numărul absențelor şi salariul obţinut pentru 14 salariați:
Salariul (mii lei) 1 5 2 4 2 3 0 1 4 2 4 2 5 1
Număr absențe ( zile) 8 3 7 5 6 7 10 8 3 7 5 6 7 10
În ipoteza existenței unei legături liniare între cele două variabile, se cere:
a) Să se reprezinte grafic datele;
b) Să se determine modelul de regresie în eşantion;
c) Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de semnificaţie α=0,05
d) Să se verifice validitatea/semnificaţia modelului de regresie găsit la punctul b) folosind testul F, pentru un
nivel de semnificaţie α=0,05
e) Să se măsoare intensitatea legăturii dintre variabile folosind un indicator adecvat, testând semnificaţia
acestuia pentru un nivel de semnificaţie α=0,05.
f) Ce pondere din variaţia totală a profitului este explicată de influenţa vânzărilor de cămăşi?
g) Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie, testând
semnificaţia acestuia pentru un nivel de semnificaţie α=0,05.
h) Dacă modelul s-a dovedit semnificativ, să se previzioneze valoarea salariului dacă s-ar absenta 6 zile.

Rezolvare

Volumul eșantionului: n = 14 salariați


yi = variabila rezultativă/dependentă = Salariul (mii lei)
xi = variabila factorială / independentă = Nr. absențe (zile)
k = 1 (numărul factorilor = 1 factor = o variabilă independentă = Nr. absențe)

yi  f  xi   alti factori
Salariul = f ( Nr. absențe ) + alți factori (erori/reziduuri)
(mii lei) (zile)

Ca urmare a aplicării funcției Regression din Excel rezultatele sunt:


Tabel 1 - Regression Statistics
Multiple R 0,80
R Square 0,64
Adjusted R Square 0,61
Standard Error 1,34
Observations 14
Tabel 2 - ANOVA df SS MS F Significance F
Regression 1 37,85 37,85 21,05 0,000624
Residual 12 21,58 1,80
Total 13 59,43
Tabel 3 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 9,31 0,70 13,38 1,43E-08 7,79 10,82
Nr. Absențe -1,06 0,23 -4,59 0,000624 -1,57 -0,56

1
a. Reprezentarea grafică

Interpretare grafic aplicație:


Între numărul absențelor și salariu există o legătură indirectă (punctele sunt plasate pe direcția celei de a
doua bisectoare) cu tendință de liniaritate (punctele sunt pe direcția unei drepte).

b. Model de regresie
Modelul teoretic de regresie: yi  b0  b1xi  ei
Ecuația / funcția de regresie teoretică yˆi  b0  b1xi
Tabel 3 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept b0 9,31 0,70 13,38 1,43E-08 7,79 10,82
Nr. Absențe b1 -1,06 0,23 -4,59 0,000624 -1,57 -0,56

Ecuația/funcția/dreapta de regresie este: yˆi  9,31  1,06 xi pe baza căreia se obțin valorile
ajustate ale observațiilor având în vedere modelul de regresie: yi  9,31  1,06 xi  ei

OBSERVAȚIE!!!!
În grafic ecuația/funcția/dreapta de regresie yˆi  9,31  1,06 xi se prezintă sub forma yi  1,06 xi  9,31

Salariul = f ( Nr. absențe ) + alți factori (erori/reziduuri)


(mii lei) (zile)

Interpretare coeficienți model de regresie yi  9,31  1,06 xi  ei :


b0 = 9,31 este Intercept = punct de intersecție dintre axa OY și dreapta de regresie ŷi sau salariul
mediu de 9,31 mii lei în condițiile în care nu s-ar înregistra absențe (x=0)
b1 = -1,06 arată că între salariu și nr. absențe există o legătură indirectă ( b1  0 ), astfel încât
creșterea numărului absențelor cu o zi determină o scădere a salariului cu 1,06 mii lei.

2
c. Testarea semnificației parametrilor modelului de regresie (  0 și 1 )
Tabel 3 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
9,31 0,70 13,38 1,43E-08 7,79 10,82
Intercept b0 b0 0,0000000143 Lb0 U b0
sb0 t b0 
sb0 Pvb0 b0  tcrit.  sb0 b0  tcrit.  sb0
-1,06 0,23 -4,59 -1,57 -0,56
Nr absențe 0,00062
b1 b1 Lb1 U b1
(zile) sb1 t b1  Pvb1
s b1 b1  tcrit.  sb1 b1  tcrit.  sb1

Testarea semnificației
Parametrului  0 Parametrului 1
Ipoteze: Ipoteze:
H0 :  0 = 0, 0 nu este semnificativ statistic H0 : 1 = 0, 1 nu este semnificativ statistic
H1 :  0  0,  0 este semnificativ statistic H1 : 1  0, 1 este semnificativ statistic
Criteriul 1 – Test Student
 valoarea critică:  valoarea critică:
vcrit.  tcrit.   t   2,179 vcrit.  tcrit.   t  2,179
;nk 1 ;nk 1
2 2
 Statistica testului:  Statistica testului:
b 9,31 b1  1,06
tc  tcalc  tb0  0   13,38 tc  tcalc  tb1    4,59
sb0 0,70 sb1 0,23

 Decizia: Deoarece
tc. (13,38)  tcritic (2,179)  H 0 se respinge,  Decizia: Deoarece tc. (4,59)  tcritic (2,179) 

H1 se acceptă, deci parametrul  0 ESTE H 0 se respinge, deci H 1 este adevărată  parametrul 1


semnificativ statistic ESTE semnificativ statistic modelul ESTE valid

Criteriul 2 – Compararea lui P-value ( Pvb j ) cu pragul de semnificație 


Pvb0 (0,0000000143)   (0,05)  Pvb1 (0,00062)   (0,05) parametrul 1 ESTE
parametrul  0 ESTE semnificativ statistic semnificativ statistic  modelul ESTE valid
( H 0 se respinge, iar H1 este adevarata) ( H 0 se respinge, H 1 este adevărată)

Criteriul 3 – Compararea semnelor limitelor intervalului de încredere Lb j   j  U b j


Deoarece Lb0 (7,79)  0  U b0 (10,82)  Deoarece Lb1 (1,57)  1  U b1 (0,56)  parametrul
limitele intervalelor au același semn (+)  1 ESTE semnificativ statistic  modelul ESTE
parametrul  0 este semnificativ statistic valid ( H 0 se respinge, H 1 este adevărată)
Probabilitatea maximă pentru care parametrul Probabilitatea maximă pentru care putem susține că
 0 este semnificativ statistic: parametrul 1 este semnificativ statistic:
100  Pvb %  100  0,00000143  99,9999857%  95% 100  Pvb1 %  100  0,062  99,938%  95%
1

S-ar putea să vă placă și