Sunteți pe pagina 1din 2

Problema rezolvată regresie liniara (1) Statistică: CSIE, an I, sem II, 2020-2021

Pentru un magazin de mobilă s-au cules date privind numărul de spoturi publicitare difuzate şi numărul
vizitatorilor (mii pers.).

Regression Statistics
Multiple R 0.879294
R Square 0.773158
Adjusted R Square 0.727789
Standard Error 5.686933
Observations 7
ANOVA
df SS MS F Significance F
Regression 1 551.1511 551.1511 17.04176 0.009101209
Residual 5 161.706 32.3412
Total 6 712.8571

Standard
Coefficients Error t Stat P-value
Intercept 1.493056 4.570233 0.326691 0.757134
Nr. spoturi publicitare 2.988426 0.723911 4.128167 0.009101
a) Scrieți ecuația de regresie folosind coeficienții din output-ul Excel;
b) Care este interpretarea economica a coeficienților obținuți?
c) Sunt coeficienții semnificativi din punct de vedere statistic?
d) În ce măsură numărul de vizitatori este determinat de numărul de spoturi publicitare difuzate?
e) Estimați profitul in condițiile in care s-ar difuza 50 de clipuri publicitare folosind coeficienții
obținuți.
f) Este modelul semnificativ din punct de vedere statistic?

Rezolvare:

a) Ecuația de regresie este 𝑦̂𝑖 =1,49 + 2,99⋅ 𝑥𝑖 (rotunjind valorile la a doua zecimală)

b) 𝑏0 = estimatorul parametrului „Intercept” al modelului de regresie liniară unifactorială;

Interpretare 𝑏0 : În absența difuzării spoturilor publicitare, numărul mediu al vizitatorilor ar fi


de 1,49 mii persoane;

𝑏1 = estimatorul parametrului „Pantă” al modelului de regresie liniară unifactorială.

Interpretare 𝑏1 :
semnul lui 𝑏1 : 𝑏1 > 0 ⇒ există o legătură directă între cele două variabile (valorile celor două
variabile se modifică în același sens: ambele cresc sau ambele scad);

valoarea lui 𝑏1 : la creșterea numărului de spoturi publicitare cu o unitate, se estimează că


numărul vizitatorilor va crește, în medie, cu 2,99 mii persoane.

Atenție: 𝑏0 nu are întotdeauna semnificație economică, deci atenție la interpretări!


Problema rezolvată regresie liniara (1) Statistică: CSIE, an I, sem II, 2020-2021

c) Dacă nu este specificat în problemă, se consideră 𝛼 = 5%.

Testarea semnificației parametrului ”β0”

H0: β0=0 (β0 nu e semnificativ statistic)


H1: β0≠0 (β0 e semnificativ statistic)

Folosim P-value. pentru nivelul de semnificație dat, cum valoarea lui P − value =
0,757134 > 𝛼 acceptăm ipoteza nulă 𝐻0 și concluzionăm β0 nu diferă semnificativ de valoarea
0 pentru un nivel de semnificație de 5%.

Testarea semnificației parametrului ”β1”


H0: β1=0 (β1 nu e semnificativ statistic)
H1: β1≠0 (β1 e semnificativ statistic)
Folosim P-value. pentru nivelul de semnificație dat, cum valoarea lui P − value =
0,009101 < 𝛼 acceptăm ipoteza alternativă 𝐻1 și concluzionăm β1 diferă semnificativ de
valoarea 0 pentru un nivel de semnificație de 5%.

d) Folosim coeficientul de determinație R2 (R square). R2 = 0,773158 arată că 77,31% din variația


numărului de vizitatori este explicată de variația nr. de spoturi publicitare difuzate, sau de
modelul de regresie.

e) Estimația punctuală folosește formula 𝑦̂𝑖 =1,49 + 2,99*𝑥𝑖 . Pentru 𝑥𝑖 = 50

𝑦̂𝑖 =1,49 + 2,99⋅ 𝑥𝑖 = 1,49+2,99⋅50= 150,99. Deci dacă s-ar difuza un număr de 50 de spoturi
publicitare, numărul de vizitatori estimat ar fi, în medie, de aproximativ 151 de mii.

f) Validitatea modelului
H0: modelul nu este valid (nu există deosebiri esențiale între împrăștierea valorilor lui y
datorate factorului x și împrăștierea valorilor lui y datorate erorii)

H1: modelul este valid (împrăștierea valorilor lui y diferă semnificativ de împrăștierea valorilor
lui y datorate erorii)

𝑀𝑆𝑅
Se folosește testul F: Fcalc=𝑀𝑆𝐸

Corespunzător valorii lui F calculat avem Significance F, (de fapt, valoarea P-value
corespunzătoare lui F calculat) care reprezintă pragul de semnificație calculat (probabilitatea
de a obține o valoare mai mare ca F calculat, sau, altfel spus reprezintă probabilitatea de a face
o eroare dacă respingem ipoteza nulă 𝐻0 ).

În absența furnizării unui prag de semnificație α, acesta se consideră a fi de 5% (0,05).

pentru nivelul de semnificație dat (𝛼 = 0,05), cum valoarea lui Significance F = 0.0091 < 𝛼
respingem ipoteza nulă 𝐻0 și concluzionăm ca modelul este valid. Cu alte cuvinte, variația
numărului de vizitatori este influențată în mod semnificativ de numărul de spoturi publicitate
difuzate, la un nivel de semnificație de 5%.

S-ar putea să vă placă și