Sunteți pe pagina 1din 7

ACADEMIA DE STUDII ECONOMICE A MOLDOVEI FACULTATEA FINANȚE

CATEDRA MATEMATICĂ ȘI STATISTICĂ ECONOMICĂ

LUCRARE INDIVIDUALĂ NR.1


la disciplina „Econometrie”

Analiza modelului de regresie liniar unifactorial

Autor:
student gr. FB 163,
învățământ cu frecvență la zi
Arhirii Adrian

Conducător ştiinţific:
lect. univ., Natalia ENACHI

CHIŞINĂU – 2017
În baza anchetelor sociale sunt cunoscute următoarele informații privind încasările medii lunare pentru
anul precedent și suprafața comercială la 10 societăți comerciale care au același profil de activitate (vezi Tabelul
1).
După modificarea valorilor inițiale (unde N-23), obținem tabelul :
Tabelul 1.
Suprafața comercială 70.5
400.5 385.5 620.5 155.5 210.5 220.5 230.5 215.5 320.5
(m2)
Încasările medii lunare 52.8 60.8 74.8 20.8 25.8 34.8 49.8 38.8 45.8 12.8
(mii lei)

1.Variabilele modelului pentru exemplul considerat sunt :


1)bariabila dependentă (rezultativă, endogenă, efect, explicativă) notată prin y este : încasările medii lunare
(mii lei).
2)variabila independent (factorială, cauzală, exogenă, explicativă) , notată prin x este : suprafața comercială
(𝑚2 ).

2.

În baza corelogramei se observă că forma norului de puncta etalează o legătură liniară între suprafața
comercială și încasările medii lunare. Se aproximează un model de regresie liniară simplă.

Y=α+βx+ε
𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖
̅̅̅̅̅̅)
( i=1,10
unde 𝑦𝑖 sunt valorile observate (valorile reale/empirice) ale variabilei independente 𝑦𝑖 (încasările medii
lunare )
𝑥𝑖 –valorile observate ale variabilei independente suprafața comercială
𝛼 –parametrul modelului considerat ca ordonata la origine ce arată valoarea medie a variabilei y
atunci cînd x=0 (numit și termen liber)
𝛽 –parametrul modelului considerat ca panta dreptei ce arată variația medie a variabilei
dependente la o variație absolută cu o unitate a variabilei x
𝜀𝑖 –variabila aleatoare (perturbatoare) care însumează influența altor variabile în afară de
suprafața comercială asupra variabilei y, nespecificate în model ce sunt considerate a fi
factori întîmplători cu influențe nesemnificative asupra lui y ; eroare de specificare a modelului
3.Datele observate sunt considerate fără erori de măsurare dacă nu-s date aberante (ieșite din comun ).
Verificarea după regula 3σ :
∑𝑥 ∑𝑦
𝑥̅ = 𝑛 𝑖 𝑦̅ = 𝑛 𝑖
2730
𝑥̅ = =273 (m2)
10
Suprafața comercială medie constituie 273m2
378,2
𝑦̅ = 10 =37,82 (mii lei)
Încasările medii lunare constituie în mediu 37,82 mii lei.
∑(𝑥𝑖 −𝑥̅ )2 218512,5
𝜎𝑥𝑖 = √ 𝑛
=√ 10
≈147,82m2
În medie față de suprafața comercială medie din colectivitate se abate în medie 147,82 m2

∑(𝑦𝑖 −𝑦̅)2 2869,36


𝜎𝑦𝑖 = √ =√ ≈16,93 mii lei
𝑛 10

În medie față de încasările medii lunare medii din colectivitate se abat în medie 16,93 mii lei.
𝑥𝑖 ∈ [𝑥̅ ± 3σ] ⇒ (𝑥̅ − 3σ(𝑥𝑖 (𝑥̅ + 3σ) ⇒
⇒(273-3*147.82<𝑥𝑖 <273+3*147,82) ⇒ (-170,46<𝑥𝑖 <716,46)
𝑦𝑖 ∈ [𝑦̅ ± 3σ] ⇒ (𝑦̅ − 3σ(𝑦𝑖 (𝑦̅ + 3σ) ⇒
⇒(37,82-3*16,93<𝑦𝑖 <37,82+3*16,93) ⇒ (-12,97<𝑦𝑖 <88,61)

Aceste intervale cuprind 99,74 % din tottalul observațiilor. Se observă că valorile minime și maxime ale
acestor două variabile se includ în interval prin urmare nu avem observații aberante. Deci, rezultă că
valorile reale ale lui x și y nu sunt afectate de erori de observare.

4.Pornim de la modelul econometric presupus


𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖
Funcția de estimație se va prezenta astfel :
𝑦̂𝑖 = 𝑎̂ + 𝑏̂𝑥𝑖
𝑦̂𝑖 -valorile teoretice ale variabilelor y obținute numai în funcție de valorile factorului esențial x și de
valorile estimațiilor ale parametrilor 𝛼 și 𝛽 notate prin 𝑎̂ și 𝑏̂ .
Pentru estimarea parametrilor vom utiliza MCMMP ce constă în minimizarea sumei abaterilor la pătrat
dintre valorile empirice și teoretice.
∑(𝑦𝑖 − 𝑦̂𝑖 )2 →min⇒∑( 𝑒𝑖 ) 2 →min
∑(𝑦𝑖 − 𝑎̂ − 𝑏̂𝑥𝑖 )2 →min
Sistemul de ecuații normale :
𝑛𝑎̂ + 𝑏̂∑𝑥𝑖 = ∑𝑦𝑖
{
𝑎̂∑𝑥𝑖 + 𝑏̂∑𝑥𝑖 2 = ∑𝑦𝑖 𝑥𝑖

∑𝑦𝑖 ∑𝑥𝑖
| |
∆𝑎 ∑𝑦𝑖 𝑥𝑖 ∑𝑥𝑖 2 ∑𝑦𝑖 ∑𝑥𝑖 2 − ∑𝑥𝑖 ∑𝑦𝑖 𝑥𝑖 378,2 ∗ 1018505 − 2730 ∗ 157372
𝑎̂ = = = = =
∆ 𝑛 ∑𝑥𝑖 𝑛∑𝑥𝑖 2 − (∑𝑥𝑖 )2 10 ∗ 1018505 − (2730)2
| |
∑𝑥𝑖 ∑𝑥𝑖 2

44426966
= 2732150 =16,26
𝑛 ∑𝑦𝑖
∆𝑏 |∑𝑥𝑖 ∑𝑦𝑖 𝑥𝑖 | 𝑛∑𝑦𝑖 𝑥𝑖 − ∑𝑦𝑖 ∑𝑥𝑖 10 ∗ 157372 − 2730 ∗ 378,2
𝑏̂ = = = = =
∆ 𝑛 ∑𝑥𝑖 𝑛∑𝑥𝑖 2 − (∑𝑥𝑖 )2 10 ∗ 1018505 − (2730)2
| |
∑𝑥𝑖 ∑𝑥𝑖 2
541234
= =0,1980
2732150

atunci cînd x=0, în mediu y=37,82 (din punctul acesta pornește funcția)
𝑏̂ > 0 ⇒legătură directă
𝑏̂ ∶ la o creștere cu o unitate a variabilei x (suprafeței comerciale) cu 1𝑚2 , încasările medii lunare vor crește în
mediu cu 0,1980 mii lei , și invers.
Metoda centrării :
𝑐𝑜𝑣(𝑥𝑖 , 𝑦𝑖 ) ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑏̂ = =
𝑣𝑎𝑟(𝑥𝑖 ) ∑(𝑥𝑖 − 𝑥̅ )2
𝑐𝑜𝑣(𝑥𝑖 , 𝑦𝑖 ) se definește ca o medie aritmetică a produselor dintre abaterile variabilelor correlate față de media
lor.
∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑐𝑜𝑣(𝑥𝑖 , 𝑦𝑖 ) =
𝑛

∑(𝑥𝑖 − 𝑥̅ )2
𝑣𝑎𝑟(𝑥𝑖 ) =
𝑛
12284,93
𝑏̂ = = 0,056
218512,5
𝑎̂ se determină din prima ecuație a sistemului de ecuații normale împărțind la n.
1
𝑛𝑎̂ + 𝑏̂∑𝑥𝑖 = ∑𝑦𝑖 / *𝑛
∑𝑥 ∑𝑦
𝑎̂ + 𝑏̂ 𝑛 𝑖 = 𝑛 𝑖
𝑎̂ + 𝑏̂𝑥̅ = 𝑦̅
𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ =37,82-0,056*273=22,53

5.Eroarea standard a estimării (sau regresiei sau a valorilor de estimație sau a reziduurilor estimației), ce
măsoară abaterea standard a lui y atunci cînd valorile lui x sunt cunoscute.

𝑦̂𝑖 = 𝑎̂ + 𝑏̂𝑥𝑖
𝑦̂𝑖 = 22,53 + 0,056𝑥𝑖
𝑦̂𝑖1 = 22,53 + 0,056 ∗ 400,5 = 44,95
∑(𝑦𝑖 − 𝑦̂)2 ∑𝑒𝑖 2 1263,494
𝑆𝑒̂ = √ =√ =√ ≈ 12,56
𝑛−𝑘 𝑛−𝑘 8

eroarea standardă a estimării arată că valorile reale ale lui y se abat de valorile estimate în mediu cu 44,95 mii
lei.
Erorile standard a parametrilor estimați :
1 𝑥̅ 2 1 2732
𝑆𝑎̂ = 𝑆𝑒̂ √ + = 12,56 √ + = 5,53
𝑛 ∑(𝑥𝑖 − 𝑥̅ )2 10 218512,5

1 1
𝑆𝑏̂ = 𝑆𝑒̂ √ = 12,56√ = 0,018
∑(𝑥𝑖 − 𝑥̅ )2 218512,5
𝑆𝑎̂ : eroarea arată că valorile estimatorului 𝑎̂ se abate de la valorile reale ale parametrului 𝛼 în medie cu 5,53
unități.
𝑆𝑏̂ : eroarea arată că valorile estimatorului 𝑏̂ se abate de la valorile reale ale parametrului 𝛽 în medie cu 0,01857
unități.

6.Verificarea ipotezelor privind semnificația estimatorilor funcției de regresie la un prag de semnificație 𝛼 =


5% comport formularea a două ipoteze :
𝐻0 : 𝛼 = 0, (𝛽 = 0)(termenul liber sau coeficientul nu e semnificativ diferit de zero)
𝐻1 : 𝛼 ≠ 0, (𝛽 ≠ 0)(termenul liber sau coeficientul de regresie e semnificativ diferit de zero)

𝑎̂−0 𝑏̂−0
Pentru un n<30 de cazuri se folosește testul T aferent repartiției student 𝑡𝑎̂ = 𝑆𝑎̂
; 𝑡𝑏̂ = 𝑆𝑏̂
cu n-2 grade de libertate (-2 deoarece se pierde două grade delibertate prin calcularea celor doi coeficienți de
regresie a și b).
Calculăm valoarea specifică testul Student (valoarea empirică) :
|𝑎̂| 22,53
𝑡𝑎̂ = = = 4,07
𝑆𝑎̂ 5,53
|𝑏̂| 0,056
𝑡𝑏̂ = 𝑆𝑏̂
= 0,018 =3,11
Valoarea critică (valoarea teoretică/valoarea tabelară) a testului T Student cu (n-2) grade de libertate și cu
pragul de semnificație 𝛼 = 0,05 (𝛼 = 5%) pentru un test bilateral este :
𝑡𝛼;𝑛−2 = 𝑡 0,05 = 𝑡(0,025;8) = 2,306
2 ( ;10−2)
2
Dacă 𝑡𝑐𝑎𝑙𝑐 ≤ 𝑡𝑡𝑎𝑏 atunci rezultă că 𝐻0 se acceptă (𝐻1 se respinge ), prin urmare estimațiile ale lui 𝛼 și 𝛽 nu
diferă semnificativ de zero.
Dacă 𝑡𝑐𝑎𝑙𝑐 > 𝑡𝑡𝑎𝑏 atunci rezultă că 𝐻0 se respinge (𝐻1 se acceptă ), prin urmare estimațiile ale lui 𝛼 și 𝛽 sunt
semnificative de zero.
𝑡𝑎̂ > 𝑡(0,025;8) ⇒4,07>2,306
𝑡𝑏̂ > 𝑡(0,025;8) ⇒ 3,11>2,306

Concluzie : prin compararea valorii calculate și a valorii critice a testului studiat se atestă :
1. 𝛼 este semnificativ diferit de zero (adică factorii neincluși în model prezintă o influență semnificativă
asupra lui y)
2. 𝛽 nu este semnificativ diferit de zero ( adică variabila explicativă x contribuie nesemnificativ la explicarea
variabilei y, deci există o legătură nesemnificativă dintre x și y.
Testul principal de semnificație e acela al coeficientului de regresie.

7.Intervalele de încredere pentru parametrii modelului econometric :


𝑏̂−𝛽 𝑎̂−𝛼
Pornind de la relațiile 𝑡𝑏̂ = 𝑆𝑏̂
și 𝑡𝑎̂ = 𝑆𝑎̂
care urmează o lege Student cu (n-2) grade de libertate, obținem
următoarele intervale de încredere :
𝛽 ∈ [𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ ; 𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ ]
2 2
𝛽 ∈ [0,071804; 0,145596]
Coeficientul de regresie din populație cu o probabilitate de 95 % se va încadra în limitele
intervalului[0,071804; 0,145596]
𝛼 ∈ [𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ ; 𝑎̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ ]
2 2
𝛼 ∈ [15,115976; 39,578024]

Valoarea termenului liber din populație cu o probabilitate de 95 % se va încadra în limitele intervalului


[15,115976; 39,578024]

8.Covarianța dintre x și y :

∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 25598


𝑐𝑜𝑣(𝑥𝑖 , 𝑦𝑖 ) = = = 2559,8
𝑛 10
Covarianța pozitivă dintre x și y denotă o legătură directă.
Coeficientul de corelație liniară simplă :
𝑐𝑜𝑣(𝑥𝑖 , 𝑦𝑖 ) ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 𝑛∑𝑦𝑖 𝑥𝑖 − ∑𝑦𝑖 ∑𝑥𝑖
𝑟𝑦 = = =
𝑥 𝜎𝑥𝑖 ∗ 𝜎𝑦𝑖 𝑛 ∗ 𝜎𝑥𝑖 ∗ 𝜎𝑦𝑖
√[𝑛∑𝑥𝑖 2 − (∑𝑥𝑖 )2 ] ∗ [𝑛∑𝑦𝑖 − (∑𝑦𝑖 )2 ]
∑(𝑥𝑖 −𝑥̅ )2 218512,5
𝜎𝑥𝑖 = √ 𝑛
=√ 10
≈147,82 m2
∑(𝑦𝑖 −𝑦̅)2 2869,38
𝜎𝑦𝑖 = √ 𝑛
=√ 10
≈16,94 mii lei
𝑐𝑜𝑣(𝑥𝑖 , 𝑦𝑖 ) 2436,6
𝑟𝑦 = = = 0,973
𝑥 𝜎𝑥𝑖 ∗ 𝜎𝑦𝑖 147,82 ∗ 16,94
Raportul de corelație :
∑(𝑦𝑖 −𝑦̂𝑖 )2 ∑(𝑦̂ −𝑦̅)2 687,43
R=√1 − ∑(𝑦𝑖 −𝑦̅)2
= √∑(𝑦𝑖−𝑦̅)2=√1263,494=0,7376
𝑖
r măsoară intensitatea legăturii dintre două variabile x și y doar de tip liniar
R măsoară intensitatea legăturii dintre două variabile x și y atît de tip liniar cît și neliniar
Relația |𝑟| = 𝑅 se consideră a fi un criteriu de verificare a liniarității legăturii dintre x și y
Concluzie :
|𝑟| = 𝑅 <=> |0,7376| ≈ 0,902 ⇒între x și y există într-adevăr o legătură liniară.
Coeficientul de determnație:
𝑅 2=0,9017452 = 0,544
54,4 % din totalul variației variabilei dependente x și y se datorează variației variabilei independente x.
Testarea semnificației coeficientului de crelație liniară simplă.
Există dovezi pentru a afirma că între încasările medii lunare și suprafața comercială există o corelație
liniară.
1)ipotezele
𝐻0 : 𝑟 = 0, ( nu există o corelație liniară între x și y)
𝐻1 : 𝑟 ≠ 0,( există o corelație liniară între variabile)

2)t-statistic
|𝑟| |0,9632|
𝑡𝑐𝑎𝑙𝑐 = = =7,761
1−𝑟2 2
√ √1−0,9632
𝑛−2 10−2

3)t-critic
Pentru 𝛼 = 0,05 și df=n-2=10-2=8 avem 𝑡(0,025;8) = 2,306
Decizia testului : t=7,761>2,306 : respingem 𝐻0
Concluzie : cu încredere de 95 % putem afirma că între variabile există corelație liniară directă (r=0,9632
>0 ) foarte puternică (0,95<r=0.9632<1)

9.Validarea modelului econometric prin testul F, efectuîndu-se analiza dispersională pe baza tabelului
ANOVA :

Surse de variaţie Variaţia sumei Estimatori ai dispersiei


Grade de
sau pătratelor în raport cu gradele de
libertate
Sursa dispersiei (varianței) abaterilor libertate
Explicată de regresie SPE=687,43 𝜎̂𝑦2̂ = 687,43
1
(explicată prin model)
Reziduală (neexplicată) SPR=1263,494 8 𝜎̂𝑒2 = 157,93
Total SPT=2869,36 9 𝜎̂𝑦2 = 318,81
unde k – numărul parametrilor din model

𝐻0 : ”modelul nu e valid sau e neadecvat “ (nu există deosebiri esențiale între împrăștierea valorilor lui y
datorate factorului x și împrăștierea valorii lui y datorate erorii, 𝜎̂𝑦2̂ = 𝜎̂𝑒2 ) variabila x nu e semnificativă
pentru y.
𝐻1 : ”modelul e valid sau e adecvat “ ( împrăștierea valorilor lui y datorate factorului x diferă semnificativ
de împrăștierea valorii lui y datorate erorii, 𝜎̂𝑦2̂ ≠ 𝜎̂𝑒2 ) variabila x e semnificativă pentru y.

Valoarea calculată specifică testului Fischer-Snedecor :


2
̂ 𝑖 −𝑦
∑(𝑦 ̅)
𝑘−1 𝑆𝑃𝐸/1 687,43
𝐹𝑐𝑎𝑙𝑐 = 2 = 𝑆𝑃𝑅/(𝑛−2) = 19,74
=34,82
̂)
∑(𝑦𝑖 −𝑦
𝑛−𝑘
F calculat în funcție de coeficientul de determinație 𝑅 2:
𝑅2 0,9017452
𝐹𝑐𝑎𝑙𝑐 = = = 34,8
(1 − 𝑅 2 )/(𝑛 − 2) 1 − 0,9017452
10 − 2
𝐹𝑡𝑎𝑏 ≈ 𝐹𝑐𝑟𝑖𝑡𝑖𝑐 = 𝐹(𝛼;𝑘−1;𝑛−𝑘) = 𝐹(0.05;1;8) = 5,32
𝐹𝑐𝑎𝑙𝑐 >𝐹𝑡𝑎𝑏 ⇒ 𝐻0 se respinge, iar 𝐻1 se acceptă, rezultă că modelul e adecvat (validat), e corect specificat,
prin urmare variabila explicativă x e semnificativă ăentru y.

10.Prognoza punctuală (stabilind încasările medii lunare pentru o suprafață comercială 500 𝑚2 .

𝑦̂𝑖 = 22,53 + 0,056𝑥𝑖


𝑦̂𝑝 = 22,53 + 0,056 ∗ 500=50,53 mii lei

Prognoza pe intervale de încredere


1 ∑(𝑥𝑝 −𝑥̅ )2
𝑦𝑝 ∈ [𝑦 ̂𝑝 ± 𝑡(0,025;𝑛−2) ∗ 𝑆𝑒̂ √1 + 𝑛 +
̂𝑝 ± 𝑡(0,025;𝑛−2) ∗ 𝑆𝑦̂𝑝 ] sau 𝑦𝑝 ∈ [𝑦 ∑(𝑥𝑖 −𝑥̅ )
]
1 (𝑥 −𝑥̅ )2 1 (500−273)2
𝑆𝑦̂𝑝 = 𝑆𝑒̂ √1 + 𝑛 + ∑(𝑥𝑝 −𝑥̅ )2 =12,56√1 + 10 + 217512,5
=14,51
𝑖
𝑦𝑝 ∈ [81,697 − 2,306 ∗ 14,51; 81,697 + 2,306 ∗ 14,51 ]
𝑦𝑝 ∈ [48,23; 115,15]
Concluzia :
valoarea reală previzională a încasărilor medii lunare cu o suprafață de 500 𝑚2 cu o probabilitate de 95 %
se va încadra în limitele intervalului de confidență (de încredere ) între 61,96 mii lei și 101,44 mii lei.

S-ar putea să vă placă și