Sunteți pe pagina 1din 10

Lucrare 1 Model de regresie simpla

Se cere:

1. De verificat ipotezele fundamentele şi specificul modelului.


2. De determinat prin metoda Kramer, estimațiile α şi β.
3. De determinat estimațiile prin metoda centrării datelor.
4. De alcătuit ANOVA.
5. De calculat r şi de explicat 𝜎2 𝑆
6. De verificat ipoteza nulă pentru estimatorul α.
7. De verificat ipoteza nula pentru estimatorul β.
8. De estimat intervalele de încredere pentru α, β şi 𝜎2. 𝑆
9. Verificați validitatea modelului cu ajutorul testului F.
10. De estimat prognoza punctuală şi pe interval. Tabelul

Tabelul nr.1

1. Pentru a specifica modelul este nevoie să determinăm dacă există legătură între variabila
independentă ,,X” şi variabila dependentă ,,y” şi să detrminăm forma şi tipul de legătură statistică.
Pentru aceasta construim norul de puncte.

23

22.5

22

21.5
Y

21

20.5

20

19.5
10 10.5 11 11.5 12 12.5 13 13.5 14 14.5 15
X

Graficul 1.1: Norul de puncte


Lucrare 1 Model de regresie simpla
Concluzie: Conform graficului obţinut se observă că valorile tind spre o linie dreaptă, de unde
rezultă faptul că avem o legătură liniară directă. Adică la creşterea variabilei independente X, creşte
şi valoarea variabilei dependente Y.

2. Determinăm prin metoda Kramer estimatorii 𝑎̂ şi 𝑏̂ ai modelului: 𝑦̂ = 𝑎̂ + 𝑏̂𝑥

Calculăm valoarea estimatorului 𝑎̂ , conform formulei:

∑ 𝑦 ∗ ∑ 𝑥2 − ∑ 𝑥 ∗ ∑ 𝑥 ∗ 𝑦 𝑛 ∗ ∑ 𝑥2 − (∑ 𝑥)2
𝑎̂=

Calculăm valoarea estimatorului 𝑏̂, conform formulei:

Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1. În rezultat obţinem
ecuaţia: 𝑦̂ = 9,2 + 𝑥

Dependent Variable: Y
Method: Least Squares
Date: 09/22/19 Time: 15:47
Sample: 1 5
Included observations: 5

Variable Coefficient Std. Error t-Statistic Prob.

X 1.000000 0.152753 6.546537 0.0072


C 9.200000 2.181742 4.216813 0.0244

R-squared 0.934579 Mean dependent var 23.20000


Adjusted R-squared 0.912773 S.D. dependent var 3.271085
S.E. of regression 0.966092 Akaike info criterion 3.058059
Sum squared resid 2.800000 Schwarz criterion 2.901834
Log likelihood -5.645146 Hannan-Quinn criter. 2.638767
F-statistic 42.85714 Durbin-Watson stat 3.214286
Prob(F-statistic) 0.007246
Lucrare 1 Model de regresie simpla
3. Pentru a ne convinge de corectitudinea valorilor obţinute, calculăm estimatorii 𝑎̂ şi 𝑏̂, prin metoda
centrării datelor.
Calculăm valoarea estimatorului 𝑏̂:

𝑥 = 𝑋 − 𝑋̅, 𝑋̅ = 14

𝑦 = 𝑌 − 𝑌̅ , 𝑌̅=23,2

∑ 𝑥 ∗ 𝑦 40
𝑏̂ = ∑ 𝑥2 = 40 = 1

Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1, ceea ce denotă
corectitudinea calculelor noastre anterioare.

Calculăm valoarea estimatorului 𝑎, conform formulei:


𝑎̂= 𝑌̅ − 𝑏̂ ∗ 𝑋̅
Calculăm valoarea medie a lui 𝑥̅, 𝑦̅:
70
𝑋̅ = = 14m
5
116
𝑌̅ = = 23,2
5
Obţinem:
𝑎̂ = 23,2 − 1 ∗ 14 =
9,2

Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2

În rezultat obţinem aceeaşi ecuaţie: 𝑦̂ = 9,2 + 𝑥

Estimatorii obţinuţi sunt estimatori de maximă verosimilitate dacă pot fi acceptate următoarele
ipoteze:
 Variabilele observate nu sunt afectate de erori de măsură.
 Variabila aleatoare (reziduală) u este de medie nulă, iar dispersia ei este constantă
şi independentă de X.
 Valorile variabilei reziduale sunt independente, respectiv nu există fenomenul de
Lucrare 1 Model de regresie simpla
autocorelare.

Verificăm dacă variabilele observate nu sunt afectate de erori de măsură cu regula celor trei sigme, regula care
constă în verificarea următoarelor relaţii:
𝑥 𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥)
𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦)

Pe baza datelor obținem:

∑(𝑥𝑖 − 𝑥̅)2 40
𝜎𝑥 = √ =√ = 2,82
𝑛 5

∑(𝑦𝑖 − 𝑦̅ )2 23,04
𝜎𝑦 = √ =√ = 2,15
𝑛 5

𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥) ↔ 𝑥̅ − 3𝜎𝑥 < 𝑥𝑖 < 𝑥̅ + 3𝜎𝑥 ↔ 5,54 < 𝑥𝑖 < 22,46 ↔ 𝑥𝑖 ∈ (5,54; 22,46)

𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦) ↔ 𝑦̅ − 3𝜎𝑦 < 𝑦𝑖 < 𝑦̅ + 3𝜎𝑦 ↔ 16,76 < 𝑦𝑖 < 29,64 ↔ 𝑦𝑖 ∈ (16,76; 29,64)

Concluzie: Deoarece valorile acestor variabile aparțin intervalelor 𝑥𝑖 ∈ (5,54; 22,46) ș𝑖 𝑦𝑖 ∈ (16,76; 29,64),
ipoteza de mai sus poate fi acceptată fără rezerve

1. Alcătuim ANOVA, determinăm valorile, SPT, SPR, SPE. Calculăm valoarea sumei pătratelor totale
(SPT), conform formulei:
𝑆𝑃𝑇 = ∑(𝑦𝑖 − 𝑦̅ ) 2 = 42,8
Calculăm valoarea sumei pătratelor reziduale (SPR), conform formulei:
𝑆𝑃𝑅 = ∑(𝑦𝑖 − 𝑦̂)2 = 2,8
Calculăm valoarea Sumei pătratelor explicative(SPE), conform formulei:
𝑆𝑃𝐸 = ∑(𝑦̂ − 𝑦̅ ) 2 = 40
Alcătuim ANOVA:
𝑆𝑃𝑇 = 𝑆𝑃𝐸 + 𝑆𝑃𝑅 ↔ ∑(𝑦𝑖 − 𝑦̅ )2 = ∑(𝑦𝑖 − 𝑦̂)2 + ∑(𝑦̂ − 𝑦̅ )2 ↔ 42,8 = 40 + 2,8
Concluzie: Testul ANOVA, ne permite să mai verificăm odată veridicitatea calculelor noastre.
Lucrare 1 Model de regresie simpla
Lucrare 1 Model de regresie simpla

1. Calculăm valoarea coeficientului de determinație R2 , conform formulei:

𝑅2 = 1 − ∑(𝑦𝑖 − 𝑦̂𝑖 )2 −
∑(𝑦𝑖 𝑦̂)2
Concluzie: În urma calculelor am obținut valoarea coeficientului de determinare R^2=0,95, ceea ce
arată că 95% din variația variabilei dependente Y se datoarează variației independente X.

Calculăm valoarea variației reziduale (𝛿̂2𝑢), conform formulei:

𝛿̂2 = ∑ 𝑒
2
∑(𝑦𝑖 − 𝑛−
𝑢
= 2
𝑛−2 𝑦̂𝑖 )2

Concluzie: În urma calculelor am obținut valoarea variațiie reziduale pe seama factorilor aleatori,
𝛿𝑢2̂ ,
ceea ce semnifică faptul că factorii aleatori au o influență mică, eroarea este mică, rezultă o
exactitate mai mare a datelor.

6. Verificăm ipoteza nulă pentru estimatorul 𝑎̂


1) Formulăm ipotezele:
𝐻0 : 𝑎̂ = 0
𝐻0 : 𝑎̂ ≠ 0

2) Determinăm valoarea calculată, conform formulei:


𝑎̂
|𝑎̂ |
𝑡𝑐𝑎𝑙𝑐 =
√𝑣̂𝑎𝑟𝑎̂
𝑆2
𝑣̂𝑎𝑟𝑎̂ = 𝑆 2 𝑎̂ =
∑(𝑥𝑖 − 𝑥̅)2

3) Determinăm valoarea tabelară:


𝑡𝑎̂
𝛼:𝑛−2
4) Comparăm valorile:
𝑎̂
𝑡 > 𝑡𝑎̂
𝑐𝑎𝑙𝑐 𝛼:𝑛−2

7. Verificăm ipoteza nulă pentru estimatorul 𝑏̂, 𝑓𝑜𝑙𝑜𝑠𝑖𝑛𝑑 𝑡𝑒𝑠𝑡𝑢𝑙 𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡.


1) Formulăm ipotezele:

𝐻0 : 𝑏̂ = 0
𝐻0 : 𝑏̂ ≠ 0
2) Determinăm valoarea calculată, conform formulei:

𝑏̂
|𝑏̂|
𝑡𝑐𝑎𝑙𝑐 =
√𝑣̂𝑎𝑟𝑎̂
𝑣̂𝑎𝑟𝑏̂ = 𝑣̂𝑎𝑟𝑎̂
3) Comparăm
valorile: 𝑡𝑏̂ > 𝑡𝑎̂
Lucrare 1 Model de regresie simpla
𝑐𝑎𝑙𝑐 𝛼:𝑛−2
Concluzie: Pe baza calculelor de mai susu se observă faptul că ambii estimatorii sunt semnificativ
diferiți de zero, ipoteza nulă se respinge, cu un prag de semnificație 𝛼.

8. Calculăm intervalele de încredere pentru 𝑎̂ , 𝑏̂

Calculăm intervalul de încredere a estimatorului 𝑎̂ :

𝑃𝑟𝑜𝑏{𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ < 𝑎 < 𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂ } = 1 − 𝛼

Calculăm dispersia estimatorului 𝑎̂ :

𝑆𝑎̂ = √𝑉 (𝑎̂ )
𝛿 2̂ ∗ ∑ 𝑥2
𝑉 (𝑎̂ ) = 𝑢 𝑖
𝑛 ∗ ∑ 𝑥𝑖2

Cu ajutorul testului t-Student, calculăm valoarea tabelară, apoi calculăm intervalul de încredere
Lucrare 1 Model de regresie simpla

𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂

𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂

Concluzie: În urma calculelor am obținut intervalul de încredere , adică valorile parametrului a variază
pe un anumit interval. Deci valoarea pe care am obținut-o în urma calculelor se
încadrează în acest interval

Calculăm intervalul de încredere a estimatorului 𝑏̂, conform formulei:

𝑃𝑟𝑜𝑏{𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ < 𝑏 < 𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂} = 1 − 𝛼

Calculăm dispersia estimatorului 𝑏̂, în baza formulei:

𝑆𝑏̂ = √𝑉(𝑏̂)

Cu ajutorul testului t-Student, calculăm valoarea tabelară, iar apoi calculăm intervalul de încredere:

𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂
𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂

Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑏. Deci valoarea pe care am obținut-
o în urma calculelor se îmcadrează în acest interval :𝑏̂ = 1

9. Verificăm semnificația modelului cu ajutorul testului Fisher, pentru aceasta, parcurgem următorii pași:
1) Determinăm valoarea calculată, conform formulei:

𝑅2
𝐹𝑐𝑎𝑙𝑐 =
(1 − 𝑅2) ∗ (𝑛 − 2)
Lucrare 1 Model de regresie simpla
2) Determinăm valoarea tabelară:

𝐹𝛼;𝑘−𝑎;𝑛−𝑘

3) Comparăm valorile si concluzionam


Lucrare 1 Model de regresie simpla
În urma calculelor am obținut că valoarea tabelară este mai mare decât valoare calculată, ceea ce semnifică
că modelul este nesemnificativ.
10.Efectuăm prognoza punctuală și pe intervale.
În mod normal, în cazul modelului dat, nu se efectuază prognoz, deoarece modelul este
nesemnificativ, însă vom încerca un exemplu.
Efectuăm prognoza punctuală, pentru aceasta este nevoie de a cunoaște valorile lui X pentru anii
pe care dorim aă efectuăm prognoza.

Astfel putem efectua prognoza pe intervale și punctuală, doar în cazul când modelul este
semnificativ.

Concluzii generale:

În urma efectuării lucrării date, se pot trage următoarele concluzii:

- Avem un model cu o legătură liniară directă, adică la modificarea variabilei X, se modifică în același
sens și variabile Y, ceea ce rezultă și din rezultatul coeficientului de determinație, care arată că 94%
din variația lui Y se datorează variației lui X.

- Estimatorii obținuți sunt de maximă verosimilitate, fiind calculați prin 2 metode și verificaați prin
metoda celor 3 sigme. De asemenea, cu ajutorul testului t-Student am dterminat că ambii estimatori sunt
semnificaativ diferiți de zero.
- Valorile ambilor estimatori se încadrează în intervalul de încredere.
- În urma testului Fisher, am observat că modelul este nesemnificativ.

S-ar putea să vă placă și