Sunteți pe pagina 1din 9

Lucrare 1 Model de regresie simpla

Se cere:

1. De verificat ipotezele fundamentele şi specificul modelului.


2. De determinat prin metoda Kramer, estimațiile α şi β.
3. De determinat estimațiile prin metoda centrării datelor.
4. De alcătuit ANOVA.
5. De calculat r şi de explicat 𝜎𝑆2
6. De verificat ipoteza nulă pentru estimatorul α.
7. De verificat ipoteza nula pentru estimatorul β.
8. De estimat intervalele de încredere pentru α, β şi 𝜎𝑆2 .
9. Verificați validitatea modelului cu ajutorul testului F.
10. De estimat prognoza punctuală şi pe interval.

Tabeleul nr. 1

Nr. x y 𝑥2 𝑥∗𝑦 (𝑦̂𝑖 − 𝑦̅)2 𝑦̂ (𝑦𝑖 − 𝑦̂)2 (𝑦𝑖 − 𝑦̅)2 𝑦2


1 16 25 256 400 4 25,2 0,04 3,24 625
2 12 21 144 252 4 21,2 0,04 4,84 441
3 10 20 100 200 16 19,2 0,64 10,24 400
4 14 22 196 308 0 23,2 1,44 1,44 484
5 18 28 324 504 16 27,2 0,64 23,04 784
Total 70 116 1020 1664 40 116,0 2,80 42,80 2734

1. Pentru a specifica modelul este nevoie să determinăm dacă există legătură între variabila
independentă ,,X” şi variabila dependentă ,,y” şi să detrminăm forma şi tipul de legătură statistică.
Pentru aceasta construim norul de puncte.
30

25

20

15
y

10

0
0 5 10 15 20
x

Graficul 1.1: Norul de puncte


Lucrare 1 Model de regresie simpla
Concluzie: Comform graficului obţinut se observă că valorile tind spre o linie dreaptă, de unde
rezultă faptul că avem o legătură liniară directă. Adică la creşterea variabilei independente X, creşte
şi valoarea variabilei dependente Y.

2. Determinăm prin metoda Kramer estimatorii 𝑎̂ şi 𝑏̂ ai modelului: 𝑦̂ = 𝑎̂ + 𝑏̂𝑥

Calculăm valoarea estimatorului 𝑎̂, conform formulei:

∑ 𝑦 ∗ ∑ 𝑥 2 − ∑ 𝑥 ∗ ∑ 𝑥 ∗ 𝑦 116 ∗ 1020 − 70 ∗ 1664 1840


𝑎̂ = = = = 9,2
𝑛 ∗ ∑ 𝑥 2 − (∑ 𝑥)2 5 ∗ 1020 − 4900 200

Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2

Calculăm valoarea estimatorului 𝑏̂, conform formulei:

𝑛 ∗ ∑ 𝑥 ∗ 𝑦 − ∑ 𝑥 ∗ ∑ 𝑦 5 ∗ 1664 − 70 ∗ 116 200


𝑏̂ = = = =1
𝑛 ∗ ∑ 𝑥 2 − (∑ 𝑥)2 5 ∗ 1020 − 4900 200

Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1. În rezultat
obţinem ecuaţia: 𝑦̂ = 9,2 + 𝑥

Dependent Variable: Y
Method: Least Squares
Date: 09/22/19 Time: 15:47
Sample: 1 5
Included observations: 5

Variable Coefficient Std. Error t-Statistic Prob.

X 1.000000 0.152753 6.546537 0.0072


C 9.200000 2.181742 4.216813 0.0244

R-squared 0.934579 Mean dependent var 23.20000


Adjusted R-squared 0.912773 S.D. dependent var 3.271085
S.E. of regression 0.966092 Akaike info criterion 3.058059
Sum squared resid 2.800000 Schwarz criterion 2.901834
Log likelihood -5.645146 Hannan-Quinn criter. 2.638767
F-statistic 42.85714 Durbin-Watson stat 3.214286
Prob(F-statistic) 0.007246
Lucrare 1 Model de regresie simpla
3. Pentru a ne convinge de corectitudinea valorilor obţinute, calculăm estimatorii 𝑎̂ şi 𝑏̂, prin metoda
centrării datelor.
Calculăm valoarea estimatorului 𝑏̂:

𝑥 = 𝑋 − 𝑋̅, 𝑋̅ = 14

𝑦 = 𝑌 − 𝑌̅, 𝑌̅=23,2

Nr. 𝑥 𝑦 𝑥∗𝑦 𝑥2
1 2 1,8 3,6 4
2 -2 -2,2 4,4 4
3 -4 -3,2 12,8 16
4 0 -1,2 0 0
5 4 4,8 19,2 16
Total 0 0 40 40

∑ 𝑥 ∗ 𝑦 40
𝑏̂ = = =1
∑ 𝑥2 40

Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1, ceea ce denotă
corectitudinea calculelor noastre anterioare.

Calculăm valoarea estimatorului 𝑎, conform formulei:


𝑎̂ = 𝑌̅ − 𝑏̂ ∗ 𝑋̅
Calculăm valoarea medie a lui 𝑥̅ , 𝑦:
̅
70
𝑋̅ = = 14m
5
116
𝑌̅ = = 23,2
5
Obţinem:
𝑎̂ = 23,2 − 1 ∗ 14 = 9,2

Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2

În rezultat obţinem aceeaşi ecuaţie: 𝑦̂ = 9,2 + 𝑥

Estimatorii obţinuţi sunt estimatori de maximă verosimilitate dacă pot fi acceptate următoarele
ipoteze:
• Variabilele observate nu sunt afectate de erori de măsură.
• Variabila aleatoare (reziduală) u este de medie nulă, iar dispersia ei este constantă şi
independentă de X.
• Valorile variabilei reziduale sunt independente, respectiv nu există fenomenul de
autocorelare.

Verificăm dacă variabilele observate nu sunt afectate de erori de măsură cu regula celor trei
sigme, regula care constă în verificarea următoarelor relaţii:
Lucrare 1 Model de regresie simpla
𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥 )

𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦 )

Pe baza datelor obținem:

∑(𝑥𝑖 − 𝑥̅ )2 40
𝜎𝑥 = √ = √ = 2,82
𝑛 5

∑(𝑦𝑖 − 𝑦̅)2 23,04


𝜎𝑦 = √ =√ = 2,15
𝑛 5

𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥 ) ↔ 𝑥̅ − 3𝜎𝑥 < 𝑥𝑖 < 𝑥̅ + 3𝜎𝑥 ↔ 5,54 < 𝑥𝑖 < 22,46 ↔ 𝑥𝑖 ∈ (5,54; 22,46)

𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦 ) ↔ 𝑦̅ − 3𝜎𝑦 < 𝑦𝑖 < 𝑦̅ + 3𝜎𝑦 ↔ 16,76 < 𝑦𝑖 < 29,64 ↔ 𝑦𝑖 ∈ (16,76; 29,64)

Concluzie: Deoarece valorile acestor variabile aparțin intervalelor 𝑥𝑖 ∈ (5,54; 22,46) ș𝑖 𝑦𝑖 ∈ (16,76; 29,64),
ipoteza de mai sus poate fi acceptată fără rezerve

4. Alcătuim ANOVA, determinăm valorile, SPT, SPR, SPE. Calculăm valoarea sumei pătratelor totale
(SPT), conform formulei:
𝑆𝑃𝑇 = ∑(𝑦𝑖 − 𝑦̅)2 = 42,8
Calculăm valoarea sumei pătratelor reziduale (SPR), conform formulei:
𝑆𝑃𝑅 = ∑(𝑦𝑖 − 𝑦̂)2 = 2,8
Calculăm valoarea Sumei pătratelor explicative(SPE), conform formulei:
𝑆𝑃𝐸 = ∑(𝑦̂ − 𝑦̅)2 = 40
Alcătuim ANOVA:
𝑆𝑃𝑇 = 𝑆𝑃𝐸 + 𝑆𝑃𝑅 ↔ ∑(𝑦𝑖 − 𝑦̅)2 = ∑(𝑦𝑖 − 𝑦̂)2 + ∑(𝑦̂ − 𝑦̅)2 ↔ 42,8 = 40 + 2,8
Concluzie: Testul ANOVA, ne permite să mai verificăm odată veridicitatea calculelor noastre.

SUMMARY OUTPUT

Regression Statistics
Multiple R 0,966736
R Square 0,934579
Adjusted R
Square 0,912773
Standard Error 0,966092
Observations 5

ANOVA
Significance
df SS MS F F
Lucrare 1 Model de regresie simpla

Regression 1 40 40 42,85714 0,007246


Residual 3 2,8 0,933333
Total 4 42,8

Standard Upper Lower


Upper
Coefficients Error t Stat P-value Lower 95% 95% 95,0% 95,0%
Intercept 9,2 2,181742 4,216813 0,024373 2,256722 16,14328 2,256722 16,14328
X Variable 1 1 0,152753 6,546537 0,007246 0,513873 1,486127 0,513873 1,486127

RESIDUAL OUTPUT PROBABILITY OUTPUT

Standard
Observation Predicted Y Residuals Residuals Percentile Y
1 25,2 -0,2 -0,23905 10 20
2 21,2 -0,2 -0,23905 30 21
3 19,2 0,8 0,956183 50 22
4 23,2 -1,2 -1,43427 70 25
5 27,2 0,8 0,956183 90 28

5. Calculăm valoarea coeficientului de determinație R2 , conform formulei:


∑(𝑦𝑖 − 𝑦̂𝑖 )2 2,8
𝑅2 = 1 − 2
=1− = 0,94
∑(𝑦𝑖 − 𝑦̂) 42,8
Concluzie: În urma calculelor am obținut valoarea coeficientului de determinare R2=0,94, ceea ce
arată că 94% din variația variabilei dependente Y se datoarează variației independente X.

Calculăm valoarea variației reziduale (𝛿̂𝑢2 ), conform formulei:


∑ 𝑒2 ∑(𝑦𝑖 − 𝑦̂𝑖 )2 2,8
𝛿̂𝑢2 = = = = 0,93
𝑛−2 𝑛−2 3

Concluzie: În urma calculelor am obținut valoarea variațiie reziduale pe seama factorilor aleatori,
𝛿̂𝑢2
= 0,93, ceea ce semnifică faptul că factorii aleatori au o influență mică, eroarea este mică, rezultă o
exactitate mai mare a datelor.
Lucrare 1 Model de regresie simpla
6. Verificăm ipoteza nulă pentru estimatorul 𝑎̂
1) Formulăm ipotezele:
𝐻0 : 𝑎̂ = 0
𝐻0 : 𝑎̂ ≠ 0

2) Determinăm valoarea calculată, conform formulei:


𝑎̂
|𝑎̂| |9,2| 9,2
𝑡𝑐𝑎𝑙𝑐 = = = = 61,3
̂ 𝑎̂ √0,0225 0,15
√𝑣𝑎𝑟
2
𝑆2 0,9
𝑣𝑎𝑟
̂ 𝑎̂ = 𝑆 𝑎̂ = = = 0,0225
∑(𝑥𝑖 − 𝑥̅ )2 40
1 2,8
𝑆 2 = 𝛿̂ 2 = ∗ ∑(𝑦𝑖 − 𝑦̂)𝑖
2
= = 0,9
𝑛−2 3
3) Determinăm valoarea tabelară:
𝑎̂ 𝑎̂
𝑡𝛼:𝑛−2 ↔ 𝑡0,05:3−2 = 3,182
4) Comparăm valorile:
𝑎̂ 𝑎̂
𝑡𝑐𝑎𝑙𝑐 > 𝑡𝛼:𝑛−2 ↔ 61,3 > 3,182
7. Verificăm ipoteza nulă pentru estimatorul 𝑏̂, 𝑓𝑜𝑙𝑜𝑠𝑖𝑛𝑑 𝑡𝑒𝑠𝑡𝑢𝑙 𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡.
1) Formulăm ipotezele:
𝐻0 : 𝑏̂ = 0
𝐻0 : 𝑏̂ ≠ 0
2) Determinăm valoarea calculată, conform formulei:
𝑏̂ |𝑏̂| |1| 1
𝑡𝑐𝑎𝑙𝑐 = = = = 6,67
̂ 𝑎̂ √0,0225 0,15
√𝑣𝑎𝑟
̂ 𝑏̂ = 𝑣𝑎𝑟
𝑣𝑎𝑟 ̂ 𝑎̂ = 0,0225
3) Comparăm valorile:
𝑏̂ 𝑎̂
𝑡𝑐𝑎𝑙𝑐 > 𝑡𝛼:𝑛−2 ↔ 6,67 > 3,182
Concluzie: Pe baza calculelor de mai susu se observă faptul că ambii estimatorii sunt semnificativ
diferiți de zero, ipoteza nulă se respinge, cu un prag de semnificație 𝛼 = 0,05
8. Calculăm intervalele de încredere pentru 𝑎̂, 𝑏̂

Calculăm intervalul de încredere a estimatorului 𝑎̂:

𝑃𝑟𝑜𝑏{𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ < 𝑎 < 𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂ } = 1 − 𝛼

Calculăm dispersia estimatorului 𝑎̂ :

𝑆𝑎̂ = √𝑉(𝑎̂) = √0,186 = 0,43

𝛿̂𝑢2 ∗ ∑ 𝑥𝑖2 0,93 ∗ 1020


𝑉(𝑎̂) = = = 0,186
𝑛 ∗ ∑ 𝑥𝑖2 5 ∗ 1020

Cu ajutorul testului t-Student, calculăm valoarea tabelară:

𝑏̂ ̂
𝑏
𝑡𝑐𝑎𝑙𝑐 → 𝑡0,05:3 = 3,182
Lucrare 1 Model de regresie simpla
Calculăm intervalul de încredere:

𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ = 9,2 − 3,182 ∗ 0,43 = 7,83

𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂ = 9.2 + 3.182 ∗ 0.43 = 10.57

Obținem:

𝑎 ∈ (7,83; 10,57)

Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑎 ∈ (7,83; 10,57), adică valorile
parametrului a variază între 7,83 și 10,57. Deci valoarea pe care am obținut-o în urma calculelor se
îmcadrează în acest interval :𝑎̂ = 9,2

Calculăm intervalul de încredere a estimatorului 𝑏̂, conform formulei:

𝑃𝑟𝑜𝑏{𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ < 𝑏 < 𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ } = 1 − 𝛼

Calculăm dispersia estimatorului 𝑏̂, în baza formulei:

𝑆𝑏̂ = √𝑉(𝑏̂) = √0,00088 = 0,029

𝛿̂𝑢2 ∗ 0,93
𝑉(𝑏̂) = 2 = = 0,00088
∑ 𝑥𝑖 1020

Cu ajutorul testului t-Student, calculăm valoarea tabelară:

𝑏̂ 𝑏 ̂
𝑡𝑐𝑎𝑙𝑐 → 𝑡0,05:3 = 3,182

Calculăm intervalul de încredere:

𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ = 1 − 3,182 ∗ 0,029 = 0,9

𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ = 1 + +3.182 ∗ 0.029 = 1,1

Obținem:

𝑏 ∈ (0,9; 1,1)

Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑏 ∈ (0,9; 1,1), adică valorile
parametrului a variază între 0,9 și 1,1. Deci valoarea pe care am obținut-o în urma calculelor se îmcadrează
în acest interval :𝑏̂ = 1

9. Verificăm semnificația modelului cu ajutorul testului Fisher, pentru aceasta, parcurgem următorii
pași:
1) Determinăm valoarea calculată, conform formulei:

𝑅2 0,94
𝐹𝑐𝑎𝑙𝑐 = = =
(1 − 𝑅2 ) ∗ (𝑛 − 2) (1 − 0,94) ∗ 3
42.85714
Lucrare 1 Model de regresie simpla

2) Determinăm valoarea tabelară:

𝐹𝛼;𝑘−𝑎;𝑛−𝑘 = 𝐹0,05;1;3 = 10,128

3) Comparăm valorile:

𝐹𝑐𝑎𝑙𝑐 < 𝐹0,05;1;3 ↔


42.85714

< 10,128
Concluzie: În urma calculelor am obținut că valoarea tabelară este mai mare decât valoarea
calculată, ceea ce semnifică că modelul este nesemnificativ.
10. Efectuăm prognoza punctuală și pe intervale.
În mod normal, în cazul modelului dat, nu se efectuază prognoz, deoarece modelul este
nesemnificativ, însă vom încerca un exemplu.
Efectuăm prognoza punctuală, pentru aceasta este nevoie de a cunoaște valorile lui X pentru anii
pe care dorim aă efectuăm prognoza.
De exemplu:
Fie valoarea lui X=20, în următorum an obținem:
𝑌̂ = 9,2 + 1 ∗ 𝑋 = 9,2 + 20 = 29,2
Iar în cazul prognozel pe intervale avem:
𝑥𝑝 = 𝑋 − 𝑋̅ = 20 − 14 = 6
xp –valoarea lui X prognozată
Calculăm dispersia sumară:
2
1 (𝑥𝑝 ) 1 36
𝑆𝑦2̂ 2
=𝑆 ∗( + ) = 0,9 ∗ ( + ) = 1.035
𝑛 ∑ 𝑥𝑖2 5 1020

Calculăm limitele pentru intervalele de prognoză:

𝑦̂ ± 𝑡30,05 ∗ 𝑆𝑦̂ = 29,2 ± 3,182 ∗ √1.035

Obținem: 𝑦 ∈ (27,72; 30,68)

Concluzie: Astfel putem efectua prognoza pe intervale și punctuală, doar în cazul când modelul este
semnificativ.

Concluzii generale:

În urma efectuării lucrării date, se pot trage următoarele concluzii:

- Avem un model cu o legătură liniară directă, adică la modificarea variabilei X, se modifică în același
sens și variabile Y, ceea ce rezultă și din rezultatul coeficientului de determinație, care arată că 94%
din variația lui Y se datorează variației lui X.
Lucrare 1 Model de regresie simpla
- Estimatorii obținuți sunt de maximă verosimilitate, fiind calculați prin 2 metode și verificaați prin
metoda celor 3 sigme. De asemenea, cu ajutorul testului t-Student am dterminat că ambii
estimatori sunt semnificaativ diferiți de zero.
- Valorile ambilor estimatori se încadrează în intervalul de încredere.
- În urma testului Fisher, am observat că modelul este nesemnificativ

S-ar putea să vă placă și