Sunteți pe pagina 1din 9

Analiza de regresie

Cum să folosim analiza de regresie


1. Revizuirea literaturii de specialitate pentru
dezvoltarea modelului teoretic
2. Specificarea modelului: selectarea variabilelor
independente și a formei funcționale
3. Stabilirea semnelor așteptate, ale coeficienților
modelului
4. Colectarea datelor (analiza și curățarea datelor)
5. Estimarea și evaluarea ecuației
6. Documentarea rezultatelor

• Ex. pentru alegerea locației unui restaurant Woody`s


(cap. 3. ”Learning to Use Regression Analysis” – Using Economerics. A Practical Guide, A. H. Studenmund,.a 5-
a Editie, Person International Edition, 2006
Pașii
1. Revizuirea literaturii de specialitate pentru
dezvoltarea modelului teoretic
– Industria restaurantelor, lanțuri de restaurante,
experți despre caracteristicile locației: suburban,
retail, rezidențial
– Departamentul de planificare strategică: diferențele
de prețuri și de obiceiuri de consum sunt mai puțin
importante decât numărul de consumatori, pe care o
locație îi poate atrage!
Decizia, ca variabila dependentă = numărul de
consumatori serviți (număr de cecuri sau note de plată
completate) într-o locație dată, în cel mai recent an,
pentru care sunt disponibile datele complete)
Pașii (cont.)
2. Specificarea modelului: selectarea variabilelor
independente și a formei funcționale
– 3 factori determinanți ai vânzărilor (consumatorilor):
• Nr. de locuitori lângă locație - populația – P, pe o rază de ... 3 km,
• Nivelul general al veniturilor în acea locație - I, venitul mediu pe
gospodărie, din cadrul populației P,
• Numărul competitorilor lângă locație - N, pe o rază de ... 2 km.
– În plus ... :
• Nr de mașini care trec zilnic prin locație,
• Nr. de luni de la deschiderea restaurantului.
– Toate locațiile au fost deschise de suficient timp încât au deja o
clientelă stabilă (nu se consideră ultimele 2 variabile; nu sunt
date suficiente despre nr. mașini ...care trec prin toate locațiile)
Pașii (cont.)
3. Stabilirea semnelor așteptate, ale coeficienților
modelului
- + +
Yi = f(Ni, Pi, Ii) + εi = β0 + βN·Ni + βP·Pi + βI·Ii + εi

4. Colectarea datelor (analiza și curățarea datelor)


Se includ toate restaurantele din lanțul Woody’s
din 33 de locații. Calitatea datelor este asigurată de
modul unitar de măsurare a variabilelor, toate
informațiile sunt din același an.
Pașii (cont.)
5. Estimarea și evaluarea ecuației
𝑦𝑖 = 102,192 − 9075𝑁𝑖 + 0.355𝑃𝑖 + 1.288𝐼𝑖
(2053) (0.073) (0.543)
t= -4.42 4.88 2.37
N = 33 𝑅2 = 0.579
(x) – abaterea standard
- Estimatorii au semnele așteptate; ecuația satisface cerințele pe
termen scurt.

6. Documentarea rezultatelor
- Output Summary – Excel, Eviews
Ipotezele modelului clasic de regresie (OLS)
1. Modelul este liniar, este corect specificat și are termen de
eroare (aditiv)
2. Media erorilor este zero.
3. Variabilele explicative nu sunt corelate cu erorile (termen
de eroare).
4. Idependența erorilor, adică eroarile sunt necorelate între
ele – nu xistă corelația serială (de ord. 1) a erorilor.
5. Termenul erorilor are varianță constantă
(homoscedasticitate).
6. Nu există multicoliniaritate între variabilele explicative,
adică nici o variabilă explicativă nu este o funcție liniară a
celorlalte variabile explicative.
7. Erorile sunt normal distribuite (urmează o lege normală).
Testul t Student – verificarea
semnificației față de 0 a estimatorilor
𝑦𝑖 = 102,192 − 9075𝑁𝑖 + 0.355𝑃𝑖 + 1.288𝐼𝑖
𝛽𝑘 −0 𝛽𝑘
𝑡𝑘 = = (2053) (0.073) (0.543)
𝑠𝑒(𝛽𝑘 ) 𝑠𝑒(𝛽𝑘 )
t= -4.42 4.88 2.37
N = 33 𝑅2 = 0.579

H0: β𝑘 =0 H0: β𝑁 ≥0 H0: β𝑃 ≤0 H0: β𝐼 ≤0


H1: β𝑘 ≠0 H1: β𝑁 <0 H1: β𝑃 >0 H1: β𝐼 >0
Dacă ItkI > tc se acceptă H1; Dacă ItkI > tc se acceptă H1 și să aibă
altfel nu se resinge H0 semnul considerat de H1; altfel nu se
resinge H0
tc=2.045 cu funcția tc=1.699 cu funcția ”=TINV(0.1;29)”
”=TINV(0.05;29)”
test bilateral teste unilaterale
Semnificația testului bilateral
H0: β𝐼 = 0
H1: β𝐼 ≠ 0
Testarea semnificației față de 0, implică ipoteze conflictuale privind semnul
așteptat al coeficientului, de exemplu pentru β𝐼 .
• Impactul creșterii venitului mediu al populației din zona locației restaurantului
asupra numărului de consumatori ai restaurantului Woody’s poate fi ambiguu.
Consumatorii cu venituri mai mari ar putea prefera alte restaurante pentru a
servi cina. Un test bilateral al semnificației față de 0 ar arăta în ce direcție se
îndreapta potențialii consumatori.
• Astfel există 2 regiuni de respingere care mărginesc regiunea de acceptare:
una pozitivă și una negativă. Valoarea critică tc trebuie mărită pentru a asigura
nivelul de semnificație pentru un test bilateral, ce poate fi atins cu un test
unilateral.
• tc=2.045 cu funcția ”=TINV(0.05;29)” pentru testul bilateral.
• Regula de decizie: I2.37I > 2.045 – se respinge H0 2.37

-2.045 0 +2.045

S-ar putea să vă placă și