Sunteți pe pagina 1din 5

MODEL DE REGRESIE LINIARĂ UNIFACTORIALĂ

(Legătură DIRECTĂ) – cerințe a, b, c

Aplicație
Pentru un magazin se cunosc vânzările de cămăşi bărbăteşti şi profitul obţinut pentru 8 zile consecutive:
Profit (unități monetare) 30 42 10 62 12 30 21 58
Număr de cămăși vândute ( zeci bucăți) 3 4 1 6 1 2 2 5
În ipoteza existenței unei legături liniare între cele două variabile, se cere:
a) Să se reprezinte grafic datele;
b) Să se determine modelul de regresie în eşantion;
c) Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de semnificaţie α=0,05
d) Să se verifice validitatea/semnificaţia modelului de regresie găsit la punctul b) folosind testul F, pentru un
nivel de semnificaţie α=0,05
e) Să se măsoare intensitatea legăturii dintre variabile folosind un indicator adecvat, testând semnificaţia
acestuia pentru un nivel de semnificaţie α=0,05.
f) Ce pondere din variaţia totală a profitului este explicată de influenţa vânzărilor de cămăşi?
g) Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie, testând
semnificaţia acestuia pentru un nivel de semnificaţie α=0,05.
h) Dacă modelul s-a dovedit semnificativ, să se previzioneze valoarea profitului dacă s-ar fi vândut 8 zeci
buc. de cămăşi.

Rezolvare

Volumul eșantionului: n = 8 zile


yi = variabila rezultativă/dependentă = Profitul (UM)
xi = variabila factorială / independentă = Nr. cămăși vândute (zeci buc.)
k = 1 (numărul factorilor = 1 factor = o variabilă independentă = Nr. cămăși vândute)

yi  f  xi   alti factori
Profit = f ( Nr. cămăși vândute ) + alți factori( erori/reziduuri)
(UM) (zeci buc.)

Ca urmare a aplicării funcției Regression din Excel rezultatele sunt:


Tabel 1 - Regression Statistics
Multiple R 0,98
R Square 0,96
Adjusted R Square 0,96
Standard Error 3,99
Observations 8
Tabel 2 - ANOVA df SS MS F Significance F
Regression 1 2583,38 2583,38 162,3 1,43515E-05
Residual 6 95,50 15,92
Total 7 2678,88
Standard Lower Upper
Tabel 3 Coefficients Error t Stat P-value 95% 95%
Intercept 2 2,82 0,71 0,504953 -4,90 8,90
Nr cămăși vândute
(zeci bucăți) 10,38 0,81 12,81 1,44E-05 8,38 12,37
a. Reprezentarea grafică

1
Interpretare grafic
TEORIE
Legătura dintre 2 variabile se reprezintă cu ajutorul diagramei norului de puncte (Scatter),
denumită şi corelogramă, care ne arată:
a.1 – direcția legăturii dintre cele două variabile;
Interpretarea se realizează după cum sunt repartizate punctele pe grafic:
 dacă punctele se plasează pe direcţia primei bisectoare, atunci legătura dintre cele două
variabile este directă
 plasarea punctelor pe direcţia celei de-a doua bisetoare, prezintă o legătură
indirectă/inversă
 cu cât punctele sunt mai concentrate în apropierea primei sau celei de-a doua bisectoare, cu
atât legătura este mai intensă
a.2 – forma legăturii
 dacă repartizarea punctelor se face pe direcţia unei drepte, atunci forma legăturii este
liniare, în caz contrar se vorbeşte despre o legătură neliniară (parabolică, exponenţială etc)

Interpretare grafic aplicație:


Între numărul cămășilor vândute și profit există o legătură directă (punctele sunt plasate pe direcția primei
bisectoare) cu tendință de liniaritate (punctele sunt pe direcția unei drepte).

b. Model de regresie
TEORIE Colectivitate Eșantion
Yi   0  1 xi   i yi  b0  b1 xi  ei
Model de regresie
Yi  Yˆ   i yi  yˆ i  ei
Ecuația / Funcția de regresie Yˆi   0  1 xi yˆi  b0  b1xi
 0 și  1 b0 și b1
sunt sunt
PARAMETRII ESTIMATORII
parametrilor  0 și  1
 0 = intercept/ termen liber b0 = intercept coefficient
 1 = panta dreptei de b1 = coeficient de regresie
regresie

2
Se pornește de la modelul teoretic de regresie: yi  b0  b1 xi  ei
Se stabilește ecuația / funcția de regresie/ dreapta de regresie teoretică yˆi  b0  b1xi pornind de
la rezultatele tabelului 3
Standard Lower Upper
Tabel 3 Coefficients Error t Stat P-value 95% 95%
Intercept b0 2 2,82 0,71 0,504953 -4,90 8,90
Nr cămăși vândute
(zeci bucăți) b1 10,38 0,81 12,81 1,44E-05 8,38 12,37

Ecuația/funcția/dreapta de regresie este: yˆi  2  10,38 xi pe baza căreia se obțin valorile ajustate
ale observațiilor având în vedere modelul de regresie: yi  2  10,38 xi  ei

OBSERVAȚIE!!!!
În grafic ecuația/funcția/dreapta de regresie yˆi  2  10,38 xi se prezintă sub forma yi  10,38 xi  2

Interpretarea valorilor coeficienților:


Teoria
b0 = Intercept = punct de intersecție dintre axa OY și dreapta de regresie ŷi sau Valoarea medie a
variabilei yi în condițiile în care factorul ar fi zero (x =0)
b1 coeficient de regresie care arată:
 direcţia legăturii:
 b1  0 , legătură directă (creşterea valorilor variabilei factoriale x determină o creştere a
valorilor ecuaţiilor de regresie şi invers).
 b1  0 , legătură inversă sau indirectă (creşterea valorilor variabilei factoriale x determină o
scădere a valorilor ecuaţiilor de regeresie şi invers).
 b1  0 , nu există legătură; variabilele sunt independente valoarea mediea a caracteristicii
factoriale x este egală cu cea a caracteristicii rezultative).
 că, în condiţiile modificării cu o unitate a factorului x , în medie, y variază (crește/scade)
cu valoarea lui b1

Interpretare coeficienți aplicație:


b0 = 2 este Intercept = punct de intersecție dintre axa OY și dreapta de regresie ŷi sau profitul
mediu de 2 UM în condițiile în care nu s-ar vinde cămăși (x=0)
b1 = +10,38 arată că între profit și Nr. cămășilor vândute există o legătură directă ( b1  0 ), astfel
încât creșterea numărului de cămăși vândute cu zece bucăți (o unitate) determină o creștere a
profitului cu 10,38 UM (cu valoarea lui b1 ).

3
c. Testarea semnificației parametrilor modelului de regresie (  0 și  1 )
Semnificaţia parametrilor modelului de regresie se stabilește pe baza tabelului 3:

TEORIA
Tabel 3 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
b0 Lb0 Ub0
Intercept b0 sb0 tb 0  Pvb0
sb0 b0  tcrit.  sb0 b0  tcrit.  sb0
b1 Lb1 U b1
Factorul X b1 sb1 tb1  Pvb1
sb1 b1  tcrit.  sb1 b1  tcrit.  sb1
Ipoteze:
H0 :  j = 0  j nu este semnificativ statistic
(panta  j este zero, adică  j nu este semnificativ diferit de zero)
H1 :  j  0,  j este semnificativ statistic
(panta  j nu este diferită de zero, adică  j este semnificativ diferit de zero, deci)
Criteriul 1 – Test Student (BILATERAL)
 valoarea critică: vcrit.  tcrit.   t
; n  k 1
2
bj
 Statistica testului: tc  tcalc  tb j 
sb j
 Decizia:
 Dacă tb j   tcrit. sau tcrit.  tb j  H 0 se respinge, deci H 1 este adevărată  parametrul  j
ESTE semnificativ statistic
 Dacă  tcrit.  tb j  tcrit.  H 0 se acceptă, deci parametrul  j NU este semnificativ statistic.

Criteriul 2 – Compararea lui P-value ( Pvb j ) cu pragul de semnificație 


 Dacă Pvb j   parametrul  j ESTE semnificativ statistic( H 0 se respinge, H 1 este adevărată)
 Dacă Pvb j    parametrul  j NU este semnificativ statistic ( H 0 se acceptă)
Criteriul 3 – Semnele limitelor intervalului de încredere Lb j   j  U b j
 Dacă Lb j ()   j  U b j () sau Lb j ()   j  U b j () (au același semn)  parametrul  j
ESTE semnificativ statistic ( H 0 se respinge, H 1 este adevărată)
 Dacă Lb j ()   j  U b j () (au semne contrare)  parametrul  j NU este semnificativ
statistic ( H 0 se acceptă)
Unde: Lb j  b j  tcrit.  sb j iar U b j  b j  tcrit.  sb j
Probabilitatea maximă pentru care putem susține că parametrul este semnificativ statistic se
stabilește având în vedere relația:
100  Pvb j %  (1   ) 100 ( probabilitatea de garantare a rezultatelor / nivel de încredere)

4
Standard Lower Upper
Tabel 3 Coefficients Error t Stat P-value 95% 95%
Intercept 2 2,82 0,71 0,504953 -4,90 8,90
Nr cămăși vândute 10,38 0,81 12,81 1,44E-05 8,38 12,37

Tabel 3 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
2 2,82 0,71 -4,90 8,90
0,504953
Intercept b0 b Lb0 Ub0
sb0 tb 0  0 Pvb0
sb0 b0  tcrit.  sb0 b0  tcrit.  sb0
10,38 12,81 1,44E-05 8,38 12,37
0,81 =
Nr Cămăși b1 Lb1 U b1
b1 tb1 
(zeci bucăți) sb1 sb1
0,0000144
b1  tcrit.  sb1 b1  tcrit.  sb1
Pvb1

Testarea semnificației
Parametrului  0 (Intercept) Parametrului  1 (panta dreptei se regresie)
Ipoteze: Ipoteze:
H0 :  0 = 0, 0 nu este semnificativ statistic H0 :  1 = 0,  1 nu este semnificativ statistic
H1 :  0  0,  0 este semnificativ statistic H1 :  1  0,  1 este semnificativ statistic
Criteriul 1 – Test Student
 valoarea critică:  valoarea critică:
vcrit.  tcrit.   t   t 0,05  tbilateral0,05;6 vcrit.  tcrit.   t   t 0,05  tbilateral0,05;6
;n k 1 ;811 ;n k 1 ;811
2 2 2 2

vcrit.  tcrit.   2,447 vcrit.  tcrit.   t  2,447


; n k 1
 Statistica testului: 2

b0 2  Statistica testului:
tc  tcalc  tb0    0,71 b 10,38
sb0 2,82 tc  tcalc  tb1  1   12,81
sb1 0,81

Decizia:Deoarece  Decizia: Deoarece tcrit. (2,447 )  tb1 (12,81)  H 0


 tcrit. (2,447 )  tc (0,71)  tcrit. (2,447 )
se respinge, deci H 1 este adevărată  parametrul  1
 H 0 se acceptă, deci parametrul  0 NU
ESTE semnificativ statistic  modelul este valid
este semnificativ statistic
Criteriul 2 – Compararea lui P-value ( Pvb j ) cu pragul de semnificație 
Pvb0 (0,50)   (0,05)  parametrul  0 NU Pvb1 (0,0000144 )   (0,05) parametrul  1 ESTE
este semnificativ statistic semnificativ statistic  modelul este valid
Criteriul 3 – Compararea semnelor limitelor intervalului de încredere Lb j   j  U b j
Deoarece Lb0 (4,9)  0  Ub0 (8,9)  Deoarece Lb1 (8,38)  1  Ub1 (12,37)  parametrul
parametrul  0 NU este semnificativ statistic  1 ESTE semnificativ statistic  modelul este valid
Probabilitatea maximă pentru care putem susține că
--------------------------------------- parametrul  1 este semnificativ statistic:
100  Pvb1 %  100  0,00144  99,9986 %  95%

S-ar putea să vă placă și