APLICATIE Model 1

Lucrare 1 Model de regresie simpla
Se cere:
1. De verificat ipotezele fundamentele şi specificul modelului.

2. De determinat prin metoda Kramer, estimațiile α şi β.
3. De determinat estimațiile prin metoda centrării datelor.
4. De alcătuit ANOVA.
5. De calculat r şi de explicat 𝜎𝑆2
6. De verificat ipoteza nulă pentru estimatorul α.
7. De verificat ipoteza nula pentru estimatorul β.
8. De estimat intervalele de încredere pentru α, β şi 𝜎𝑆2 .
9. Verificați validitatea modelului cu ajutorul testului F.
10. De estimat prognoza punctuală şi pe interval.
Tabeleul nr. 1
Nr. x y 𝑥2 𝑥∗𝑦 (𝑦̂𝑖 − 𝑦̅)2 𝑦̂ (𝑦𝑖 − 𝑦̂)2 (𝑦𝑖 − 𝑦̅)2 𝑦2

1 16 25 256 400 4 25,2 0,04 3,24 625
2 12 21 144 252 4 21,2 0,04 4,84 441
3 10 20 100 200 16 19,2 0,64 10,24 400
4 14 22 196 308 0 23,2 1,44 1,44 484
5 18 28 324 504 16 27,2 0,64 23,04 784
Total 70 116 1020 1664 40 116,0 2,80 42,80 2734
1. Pentru a specifica modelul este nevoie să determinăm dacă există legătură între variabila
independentă ,,X” şi variabila dependentă ,,y” şi să detrminăm forma şi tipul de legătură statistică.
Pentru aceasta construim norul de puncte.
30
25
20
15
y
10
0
0 5 10 15 20
x
Graficul 1.1: Norul de puncte

Concluzie: Comform graficului obţinut se observă că valorile tind spre o linie dreaptă, de unde
rezultă faptul că avem o legătură liniară directă. Adică la creşterea variabilei independente X, creşte
şi valoarea variabilei dependente Y.
2. Determinăm prin metoda Kramer estimatorii 𝑎̂ şi 𝑏̂ ai modelului: 𝑦̂ = 𝑎̂ + 𝑏̂𝑥
Calculăm valoarea estimatorului 𝑎̂, conform formulei:
∑ 𝑦 ∗ ∑ 𝑥 2 − ∑ 𝑥 ∗ ∑ 𝑥 ∗ 𝑦 116 ∗ 1020 − 70 ∗ 1664 1840

𝑎̂ = = = = 9,2
𝑛 ∗ ∑ 𝑥 2 − (∑ 𝑥)2 5 ∗ 1020 − 4900 200
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2
Calculăm valoarea estimatorului 𝑏̂, conform formulei:
𝑛 ∗ ∑ 𝑥 ∗ 𝑦 − ∑ 𝑥 ∗ ∑ 𝑦 5 ∗ 1664 − 70 ∗ 116 200

𝑏̂ = = = =1
𝑛 ∗ ∑ 𝑥 2 − (∑ 𝑥)2 5 ∗ 1020 − 4900 200
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1. În rezultat
obţinem ecuaţia: 𝑦̂ = 9,2 + 𝑥
Dependent Variable: Y
Method: Least Squares
Date: 09/22/19 Time: 15:47
Sample: 1 5
Included observations: 5
Variable Coefficient Std. Error t-Statistic Prob.
X 1.000000 0.152753 6.546537 0.0072

C 9.200000 2.181742 4.216813 0.0244
R-squared 0.934579 Mean dependent var 23.20000

Adjusted R-squared 0.912773 S.D. dependent var 3.271085
S.E. of regression 0.966092 Akaike info criterion 3.058059
Sum squared resid 2.800000 Schwarz criterion 2.901834
Log likelihood -5.645146 Hannan-Quinn criter. 2.638767
F-statistic 42.85714 Durbin-Watson stat 3.214286
Prob(F-statistic) 0.007246
3. Pentru a ne convinge de corectitudinea valorilor obţinute, calculăm estimatorii 𝑎̂ şi 𝑏̂, prin metoda
centrării datelor.
Calculăm valoarea estimatorului 𝑏̂:
𝑥 = 𝑋 − 𝑋̅, 𝑋̅ = 14
𝑦 = 𝑌 − 𝑌̅, 𝑌̅=23,2
Nr. 𝑥 𝑦 𝑥∗𝑦 𝑥2
1 2 1,8 3,6 4
2 -2 -2,2 4,4 4
3 -4 -3,2 12,8 16
4 0 -1,2 0 0
5 4 4,8 19,2 16
Total 0 0 40 40
∑ 𝑥 ∗ 𝑦 40
𝑏̂ = = =1
∑ 𝑥2 40
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1, ceea ce denotă
corectitudinea calculelor noastre anterioare.
Calculăm valoarea estimatorului 𝑎, conform formulei:

𝑎̂ = 𝑌̅ − 𝑏̂ ∗ 𝑋̅
Calculăm valoarea medie a lui 𝑥̅ , 𝑦:
̅
70
𝑋̅ = = 14m
5
116
𝑌̅ = = 23,2
5
Obţinem:
𝑎̂ = 23,2 − 1 ∗ 14 = 9,2
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2
În rezultat obţinem aceeaşi ecuaţie: 𝑦̂ = 9,2 + 𝑥
Estimatorii obţinuţi sunt estimatori de maximă verosimilitate dacă pot fi acceptate următoarele
ipoteze:
• Variabilele observate nu sunt afectate de erori de măsură.
• Variabila aleatoare (reziduală) u este de medie nulă, iar dispersia ei este constantă şi
independentă de X.
• Valorile variabilei reziduale sunt independente, respectiv nu există fenomenul de
autocorelare.
Verificăm dacă variabilele observate nu sunt afectate de erori de măsură cu regula celor trei
sigme, regula care constă în verificarea următoarelor relaţii:
𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥 )
𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦 )
Pe baza datelor obținem:
∑(𝑥𝑖 − 𝑥̅ )2 40
𝜎𝑥 = √ = √ = 2,82
𝑛 5
∑(𝑦𝑖 − 𝑦̅)2 23,04

𝜎𝑦 = √ =√ = 2,15
𝑛 5
𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥 ) ↔ 𝑥̅ − 3𝜎𝑥 < 𝑥𝑖 < 𝑥̅ + 3𝜎𝑥 ↔ 5,54 < 𝑥𝑖 < 22,46 ↔ 𝑥𝑖 ∈ (5,54; 22,46)
𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦 ) ↔ 𝑦̅ − 3𝜎𝑦 < 𝑦𝑖 < 𝑦̅ + 3𝜎𝑦 ↔ 16,76 < 𝑦𝑖 < 29,64 ↔ 𝑦𝑖 ∈ (16,76; 29,64)
Concluzie: Deoarece valorile acestor variabile aparțin intervalelor 𝑥𝑖 ∈ (5,54; 22,46) ș𝑖 𝑦𝑖 ∈ (16,76; 29,64),
ipoteza de mai sus poate fi acceptată fără rezerve
4. Alcătuim ANOVA, determinăm valorile, SPT, SPR, SPE. Calculăm valoarea sumei pătratelor totale
(SPT), conform formulei:
𝑆𝑃𝑇 = ∑(𝑦𝑖 − 𝑦̅)2 = 42,8
Calculăm valoarea sumei pătratelor reziduale (SPR), conform formulei:
𝑆𝑃𝑅 = ∑(𝑦𝑖 − 𝑦̂)2 = 2,8
Calculăm valoarea Sumei pătratelor explicative(SPE), conform formulei:
𝑆𝑃𝐸 = ∑(𝑦̂ − 𝑦̅)2 = 40
Alcătuim ANOVA:
𝑆𝑃𝑇 = 𝑆𝑃𝐸 + 𝑆𝑃𝑅 ↔ ∑(𝑦𝑖 − 𝑦̅)2 = ∑(𝑦𝑖 − 𝑦̂)2 + ∑(𝑦̂ − 𝑦̅)2 ↔ 42,8 = 40 + 2,8
Concluzie: Testul ANOVA, ne permite să mai verificăm odată veridicitatea calculelor noastre.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,966736
R Square 0,934579
Adjusted R
Square 0,912773
Standard Error 0,966092
Observations 5
ANOVA
Significance
df SS MS F F
Regression 1 40 40 42,85714 0,007246

Residual 3 2,8 0,933333
Total 4 42,8
Standard Upper Lower

Upper
Coefficients Error t Stat P-value Lower 95% 95% 95,0% 95,0%
Intercept 9,2 2,181742 4,216813 0,024373 2,256722 16,14328 2,256722 16,14328
X Variable 1 1 0,152753 6,546537 0,007246 0,513873 1,486127 0,513873 1,486127
RESIDUAL OUTPUT PROBABILITY OUTPUT
Standard
Observation Predicted Y Residuals Residuals Percentile Y
1 25,2 -0,2 -0,23905 10 20
2 21,2 -0,2 -0,23905 30 21
3 19,2 0,8 0,956183 50 22
4 23,2 -1,2 -1,43427 70 25
5 27,2 0,8 0,956183 90 28
5. Calculăm valoarea coeficientului de determinație R2 , conform formulei:

∑(𝑦𝑖 − 𝑦̂𝑖 )2 2,8
𝑅2 = 1 − 2
=1− = 0,94
∑(𝑦𝑖 − 𝑦̂) 42,8
Concluzie: În urma calculelor am obținut valoarea coeficientului de determinare R2=0,94, ceea ce
arată că 94% din variația variabilei dependente Y se datoarează variației independente X.
Calculăm valoarea variației reziduale (𝛿̂𝑢2 ), conform formulei:

∑ 𝑒2 ∑(𝑦𝑖 − 𝑦̂𝑖 )2 2,8
𝛿̂𝑢2 = = = = 0,93
𝑛−2 𝑛−2 3
Concluzie: În urma calculelor am obținut valoarea variațiie reziduale pe seama factorilor aleatori,
𝛿̂𝑢2
= 0,93, ceea ce semnifică faptul că factorii aleatori au o influență mică, eroarea este mică, rezultă o
exactitate mai mare a datelor.
6. Verificăm ipoteza nulă pentru estimatorul 𝑎̂
1) Formulăm ipotezele:
𝐻0 : 𝑎̂ = 0
𝐻0 : 𝑎̂ ≠ 0
2) Determinăm valoarea calculată, conform formulei:

𝑎̂
|𝑎̂| |9,2| 9,2
𝑡𝑐𝑎𝑙𝑐 = = = = 61,3
̂ 𝑎̂ √0,0225 0,15
√𝑣𝑎𝑟
2
𝑆2 0,9
𝑣𝑎𝑟
̂ 𝑎̂ = 𝑆 𝑎̂ = = = 0,0225
∑(𝑥𝑖 − 𝑥̅ )2 40
1 2,8
𝑆 2 = 𝛿̂ 2 = ∗ ∑(𝑦𝑖 − 𝑦̂)𝑖
2
= = 0,9
𝑛−2 3
3) Determinăm valoarea tabelară:
𝑎̂ 𝑎̂
𝑡𝛼:𝑛−2 ↔ 𝑡0,05:3−2 = 3,182
4) Comparăm valorile:
𝑎̂ 𝑎̂
𝑡𝑐𝑎𝑙𝑐 > 𝑡𝛼:𝑛−2 ↔ 61,3 > 3,182
7. Verificăm ipoteza nulă pentru estimatorul 𝑏̂, 𝑓𝑜𝑙𝑜𝑠𝑖𝑛𝑑 𝑡𝑒𝑠𝑡𝑢𝑙 𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡.
1) Formulăm ipotezele:
𝐻0 : 𝑏̂ = 0
𝐻0 : 𝑏̂ ≠ 0
𝑏̂ |𝑏̂| |1| 1
𝑡𝑐𝑎𝑙𝑐 = = = = 6,67
̂ 𝑎̂ √0,0225 0,15
√𝑣𝑎𝑟
̂ 𝑏̂ = 𝑣𝑎𝑟
𝑣𝑎𝑟 ̂ 𝑎̂ = 0,0225
𝑏̂ 𝑎̂
𝑡𝑐𝑎𝑙𝑐 > 𝑡𝛼:𝑛−2 ↔ 6,67 > 3,182
Concluzie: Pe baza calculelor de mai susu se observă faptul că ambii estimatorii sunt semnificativ
diferiți de zero, ipoteza nulă se respinge, cu un prag de semnificație 𝛼 = 0,05
8. Calculăm intervalele de încredere pentru 𝑎̂, 𝑏̂
Calculăm intervalul de încredere a estimatorului 𝑎̂:
𝑃𝑟𝑜𝑏{𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ < 𝑎 < 𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂ } = 1 − 𝛼
Calculăm dispersia estimatorului 𝑎̂ :
𝑆𝑎̂ = √𝑉(𝑎̂) = √0,186 = 0,43
𝛿̂𝑢2 ∗ ∑ 𝑥𝑖2 0,93 ∗ 1020

𝑉(𝑎̂) = = = 0,186
𝑛 ∗ ∑ 𝑥𝑖2 5 ∗ 1020
Cu ajutorul testului t-Student, calculăm valoarea tabelară:
𝑏̂ ̂
𝑏
𝑡𝑐𝑎𝑙𝑐 → 𝑡0,05:3 = 3,182
Calculăm intervalul de încredere:
𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ = 9,2 − 3,182 ∗ 0,43 = 7,83
𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂ = 9.2 + 3.182 ∗ 0.43 = 10.57
Obținem:
𝑎 ∈ (7,83; 10,57)
Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑎 ∈ (7,83; 10,57), adică valorile
parametrului a variază între 7,83 și 10,57. Deci valoarea pe care am obținut-o în urma calculelor se
îmcadrează în acest interval :𝑎̂ = 9,2
Calculăm intervalul de încredere a estimatorului 𝑏̂, conform formulei:
𝑃𝑟𝑜𝑏{𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ < 𝑏 < 𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ } = 1 − 𝛼
Calculăm dispersia estimatorului 𝑏̂, în baza formulei:
𝑆𝑏̂ = √𝑉(𝑏̂) = √0,00088 = 0,029
𝛿̂𝑢2 ∗ 0,93
𝑉(𝑏̂) = 2 = = 0,00088
∑ 𝑥𝑖 1020
Cu ajutorul testului t-Student, calculăm valoarea tabelară:
𝑏̂ 𝑏 ̂
𝑡𝑐𝑎𝑙𝑐 → 𝑡0,05:3 = 3,182
Calculăm intervalul de încredere:
𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ = 1 − 3,182 ∗ 0,029 = 0,9
𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ = 1 + +3.182 ∗ 0.029 = 1,1
Obținem:
𝑏 ∈ (0,9; 1,1)
Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑏 ∈ (0,9; 1,1), adică valorile
parametrului a variază între 0,9 și 1,1. Deci valoarea pe care am obținut-o în urma calculelor se îmcadrează
în acest interval :𝑏̂ = 1
9. Verificăm semnificația modelului cu ajutorul testului Fisher, pentru aceasta, parcurgem următorii
pași:
𝑅2 0,94
𝐹𝑐𝑎𝑙𝑐 = = =
(1 − 𝑅2 ) ∗ (𝑛 − 2) (1 − 0,94) ∗ 3
42.85714
2) Determinăm valoarea tabelară:
𝐹𝛼;𝑘−𝑎;𝑛−𝑘 = 𝐹0,05;1;3 = 10,128
𝐹𝑐𝑎𝑙𝑐 < 𝐹0,05;1;3 ↔

42.85714
< 10,128
Concluzie: În urma calculelor am obținut că valoarea tabelară este mai mare decât valoarea
calculată, ceea ce semnifică că modelul este nesemnificativ.
10. Efectuăm prognoza punctuală și pe intervale.
În mod normal, în cazul modelului dat, nu se efectuază prognoz, deoarece modelul este
nesemnificativ, însă vom încerca un exemplu.
Efectuăm prognoza punctuală, pentru aceasta este nevoie de a cunoaște valorile lui X pentru anii
pe care dorim aă efectuăm prognoza.
De exemplu:
Fie valoarea lui X=20, în următorum an obținem:
𝑌̂ = 9,2 + 1 ∗ 𝑋 = 9,2 + 20 = 29,2
Iar în cazul prognozel pe intervale avem:
𝑥𝑝 = 𝑋 − 𝑋̅ = 20 − 14 = 6
xp –valoarea lui X prognozată
Calculăm dispersia sumară:
2
1 (𝑥𝑝 ) 1 36
𝑆𝑦2̂ 2
=𝑆 ∗( + ) = 0,9 ∗ ( + ) = 1.035
𝑛 ∑ 𝑥𝑖2 5 1020
Calculăm limitele pentru intervalele de prognoză:
𝑦̂ ± 𝑡30,05 ∗ 𝑆𝑦̂ = 29,2 ± 3,182 ∗ √1.035
Obținem: 𝑦 ∈ (27,72; 30,68)
Concluzie: Astfel putem efectua prognoza pe intervale și punctuală, doar în cazul când modelul este
semnificativ.
Concluzii generale:
În urma efectuării lucrării date, se pot trage următoarele concluzii:
- Avem un model cu o legătură liniară directă, adică la modificarea variabilei X, se modifică în același
sens și variabile Y, ceea ce rezultă și din rezultatul coeficientului de determinație, care arată că 94%
din variația lui Y se datorează variației lui X.
- Estimatorii obținuți sunt de maximă verosimilitate, fiind calculați prin 2 metode și verificaați prin
metoda celor 3 sigme. De asemenea, cu ajutorul testului t-Student am dterminat că ambii
estimatori sunt semnificaativ diferiți de zero.
- Valorile ambilor estimatori se încadrează în intervalul de încredere.
- În urma testului Fisher, am observat că modelul este nesemnificativ

APLICATIE Model 1

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

APLICATIE Model 1

Încărcat de

Drepturi de autor:

Formate disponibile

Lucrare 1 Model de regresie simpla

1. De verificat ipotezele fundamentele şi specificul modelului.

Nr. x y 𝑥2 𝑥∗𝑦 (𝑦̂𝑖 − 𝑦̅)2 𝑦̂ (𝑦𝑖 − 𝑦̂)2 (𝑦𝑖 − 𝑦̅)2 𝑦2

Graficul 1.1: Norul de puncte

2. Determinăm prin metoda Kramer estimatorii 𝑎̂ şi 𝑏̂ ai modelului: 𝑦̂ = 𝑎̂ + 𝑏̂𝑥

Calculăm valoarea estimatorului 𝑎̂, conform formulei:

∑ 𝑦 ∗ ∑ 𝑥 2 − ∑ 𝑥 ∗ ∑ 𝑥 ∗ 𝑦 116 ∗ 1020 − 70 ∗ 1664 1840

Calculăm valoarea estimatorului 𝑏̂, conform formulei:

𝑛 ∗ ∑ 𝑥 ∗ 𝑦 − ∑ 𝑥 ∗ ∑ 𝑦 5 ∗ 1664 − 70 ∗ 116 200

Variable Coefficient Std. Error t-Statistic Prob.

X 1.000000 0.152753 6.546537 0.0072

R-squared 0.934579 Mean dependent var 23.20000

Calculăm valoarea estimatorului 𝑎, conform formulei:

În rezultat obţinem aceeaşi ecuaţie: 𝑦̂ = 9,2 + 𝑥

Pe baza datelor obținem:

∑(𝑦𝑖 − 𝑦̅)2 23,04

Regression 1 40 40 42,85714 0,007246

Standard Upper Lower

RESIDUAL OUTPUT PROBABILITY OUTPUT

5. Calculăm valoarea coeficientului de determinație R2 , conform formulei:

Calculăm valoarea variației reziduale (𝛿̂𝑢2 ), conform formulei:

2) Determinăm valoarea calculată, conform formulei:

Calculăm intervalul de încredere a estimatorului 𝑎̂:

𝑃𝑟𝑜𝑏{𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ < 𝑎 < 𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂ } = 1 − 𝛼

Calculăm dispersia estimatorului 𝑎̂ :

𝑆𝑎̂ = √𝑉(𝑎̂) = √0,186 = 0,43

𝛿̂𝑢2 ∗ ∑ 𝑥𝑖2 0,93 ∗ 1020

Cu ajutorul testului t-Student, calculăm valoarea tabelară:

𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂ = 9,2 − 3,182 ∗ 0,43 = 7,83

𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂ = 9.2 + 3.182 ∗ 0.43 = 10.57

Calculăm intervalul de încredere a estimatorului 𝑏̂, conform formulei:

𝑃𝑟𝑜𝑏{𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ < 𝑏 < 𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ } = 1 − 𝛼

Calculăm dispersia estimatorului 𝑏̂, în baza formulei:

𝑆𝑏̂ = √𝑉(𝑏̂) = √0,00088 = 0,029

Cu ajutorul testului t-Student, calculăm valoarea tabelară:

Calculăm intervalul de încredere:

𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ = 1 − 3,182 ∗ 0,029 = 0,9

𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂ = 1 + +3.182 ∗ 0.029 = 1,1

2) Determinăm valoarea tabelară:

𝐹𝛼;𝑘−𝑎;𝑛−𝑘 = 𝐹0,05;1;3 = 10,128

𝐹𝑐𝑎𝑙𝑐 < 𝐹0,05;1;3 ↔

Calculăm limitele pentru intervalele de prognoză:

𝑦̂ ± 𝑡30,05 ∗ 𝑆𝑦̂ = 29,2 ± 3,182 ∗ √1.035

Obținem: 𝑦 ∈ (27,72; 30,68)

În urma efectuării lucrării date, se pot trage următoarele concluzii:

S-ar putea să vă placă și