Documente Academic
Documente Profesional
Documente Cultură
Se cere:
Tabeleul nr. 1
1. Pentru a specifica modelul este nevoie să determinăm dacă există legătură între variabila
independentă ,,X” şi variabila dependentă ,,y” şi să detrminăm forma şi tipul de legătură statistică.
Pentru aceasta construim norul de puncte.
30
25
20
15
y
10
0
0 5 10 15 20
x
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1. În rezultat
obţinem ecuaţia: 𝑦̂ = 9,2 + 𝑥
Dependent Variable: Y
Method: Least Squares
Date: 09/22/19 Time: 15:47
Sample: 1 5
Included observations: 5
𝑥 = 𝑋 − 𝑋̅, 𝑋̅ = 14
𝑦 = 𝑌 − 𝑌̅, 𝑌̅=23,2
Nr. 𝑥 𝑦 𝑥∗𝑦 𝑥2
1 2 1,8 3,6 4
2 -2 -2,2 4,4 4
3 -4 -3,2 12,8 16
4 0 -1,2 0 0
5 4 4,8 19,2 16
Total 0 0 40 40
∑ 𝑥 ∗ 𝑦 40
𝑏̂ = = =1
∑ 𝑥2 40
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1, ceea ce denotă
corectitudinea calculelor noastre anterioare.
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2
Estimatorii obţinuţi sunt estimatori de maximă verosimilitate dacă pot fi acceptate următoarele
ipoteze:
• Variabilele observate nu sunt afectate de erori de măsură.
• Variabila aleatoare (reziduală) u este de medie nulă, iar dispersia ei este constantă şi
independentă de X.
• Valorile variabilei reziduale sunt independente, respectiv nu există fenomenul de
autocorelare.
Verificăm dacă variabilele observate nu sunt afectate de erori de măsură cu regula celor trei
sigme, regula care constă în verificarea următoarelor relaţii:
Lucrare 1 Model de regresie simpla
𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥 )
𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦 )
∑(𝑥𝑖 − 𝑥̅ )2 40
𝜎𝑥 = √ = √ = 2,82
𝑛 5
𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥 ) ↔ 𝑥̅ − 3𝜎𝑥 < 𝑥𝑖 < 𝑥̅ + 3𝜎𝑥 ↔ 5,54 < 𝑥𝑖 < 22,46 ↔ 𝑥𝑖 ∈ (5,54; 22,46)
𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦 ) ↔ 𝑦̅ − 3𝜎𝑦 < 𝑦𝑖 < 𝑦̅ + 3𝜎𝑦 ↔ 16,76 < 𝑦𝑖 < 29,64 ↔ 𝑦𝑖 ∈ (16,76; 29,64)
Concluzie: Deoarece valorile acestor variabile aparțin intervalelor 𝑥𝑖 ∈ (5,54; 22,46) ș𝑖 𝑦𝑖 ∈ (16,76; 29,64),
ipoteza de mai sus poate fi acceptată fără rezerve
4. Alcătuim ANOVA, determinăm valorile, SPT, SPR, SPE. Calculăm valoarea sumei pătratelor totale
(SPT), conform formulei:
𝑆𝑃𝑇 = ∑(𝑦𝑖 − 𝑦̅)2 = 42,8
Calculăm valoarea sumei pătratelor reziduale (SPR), conform formulei:
𝑆𝑃𝑅 = ∑(𝑦𝑖 − 𝑦̂)2 = 2,8
Calculăm valoarea Sumei pătratelor explicative(SPE), conform formulei:
𝑆𝑃𝐸 = ∑(𝑦̂ − 𝑦̅)2 = 40
Alcătuim ANOVA:
𝑆𝑃𝑇 = 𝑆𝑃𝐸 + 𝑆𝑃𝑅 ↔ ∑(𝑦𝑖 − 𝑦̅)2 = ∑(𝑦𝑖 − 𝑦̂)2 + ∑(𝑦̂ − 𝑦̅)2 ↔ 42,8 = 40 + 2,8
Concluzie: Testul ANOVA, ne permite să mai verificăm odată veridicitatea calculelor noastre.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,966736
R Square 0,934579
Adjusted R
Square 0,912773
Standard Error 0,966092
Observations 5
ANOVA
Significance
df SS MS F F
Lucrare 1 Model de regresie simpla
Standard
Observation Predicted Y Residuals Residuals Percentile Y
1 25,2 -0,2 -0,23905 10 20
2 21,2 -0,2 -0,23905 30 21
3 19,2 0,8 0,956183 50 22
4 23,2 -1,2 -1,43427 70 25
5 27,2 0,8 0,956183 90 28
Concluzie: În urma calculelor am obținut valoarea variațiie reziduale pe seama factorilor aleatori,
𝛿̂𝑢2
= 0,93, ceea ce semnifică faptul că factorii aleatori au o influență mică, eroarea este mică, rezultă o
exactitate mai mare a datelor.
Lucrare 1 Model de regresie simpla
6. Verificăm ipoteza nulă pentru estimatorul 𝑎̂
1) Formulăm ipotezele:
𝐻0 : 𝑎̂ = 0
𝐻0 : 𝑎̂ ≠ 0
𝑏̂ ̂
𝑏
𝑡𝑐𝑎𝑙𝑐 → 𝑡0,05:3 = 3,182
Lucrare 1 Model de regresie simpla
Calculăm intervalul de încredere:
Obținem:
𝑎 ∈ (7,83; 10,57)
Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑎 ∈ (7,83; 10,57), adică valorile
parametrului a variază între 7,83 și 10,57. Deci valoarea pe care am obținut-o în urma calculelor se
îmcadrează în acest interval :𝑎̂ = 9,2
𝛿̂𝑢2 ∗ 0,93
𝑉(𝑏̂) = 2 = = 0,00088
∑ 𝑥𝑖 1020
𝑏̂ 𝑏 ̂
𝑡𝑐𝑎𝑙𝑐 → 𝑡0,05:3 = 3,182
Obținem:
𝑏 ∈ (0,9; 1,1)
Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑏 ∈ (0,9; 1,1), adică valorile
parametrului a variază între 0,9 și 1,1. Deci valoarea pe care am obținut-o în urma calculelor se îmcadrează
în acest interval :𝑏̂ = 1
9. Verificăm semnificația modelului cu ajutorul testului Fisher, pentru aceasta, parcurgem următorii
pași:
1) Determinăm valoarea calculată, conform formulei:
𝑅2 0,94
𝐹𝑐𝑎𝑙𝑐 = = =
(1 − 𝑅2 ) ∗ (𝑛 − 2) (1 − 0,94) ∗ 3
42.85714
Lucrare 1 Model de regresie simpla
3) Comparăm valorile:
< 10,128
Concluzie: În urma calculelor am obținut că valoarea tabelară este mai mare decât valoarea
calculată, ceea ce semnifică că modelul este nesemnificativ.
10. Efectuăm prognoza punctuală și pe intervale.
În mod normal, în cazul modelului dat, nu se efectuază prognoz, deoarece modelul este
nesemnificativ, însă vom încerca un exemplu.
Efectuăm prognoza punctuală, pentru aceasta este nevoie de a cunoaște valorile lui X pentru anii
pe care dorim aă efectuăm prognoza.
De exemplu:
Fie valoarea lui X=20, în următorum an obținem:
𝑌̂ = 9,2 + 1 ∗ 𝑋 = 9,2 + 20 = 29,2
Iar în cazul prognozel pe intervale avem:
𝑥𝑝 = 𝑋 − 𝑋̅ = 20 − 14 = 6
xp –valoarea lui X prognozată
Calculăm dispersia sumară:
2
1 (𝑥𝑝 ) 1 36
𝑆𝑦2̂ 2
=𝑆 ∗( + ) = 0,9 ∗ ( + ) = 1.035
𝑛 ∑ 𝑥𝑖2 5 1020
Concluzie: Astfel putem efectua prognoza pe intervale și punctuală, doar în cazul când modelul este
semnificativ.
Concluzii generale:
- Avem un model cu o legătură liniară directă, adică la modificarea variabilei X, se modifică în același
sens și variabile Y, ceea ce rezultă și din rezultatul coeficientului de determinație, care arată că 94%
din variația lui Y se datorează variației lui X.
Lucrare 1 Model de regresie simpla
- Estimatorii obținuți sunt de maximă verosimilitate, fiind calculați prin 2 metode și verificaați prin
metoda celor 3 sigme. De asemenea, cu ajutorul testului t-Student am dterminat că ambii
estimatori sunt semnificaativ diferiți de zero.
- Valorile ambilor estimatori se încadrează în intervalul de încredere.
- În urma testului Fisher, am observat că modelul este nesemnificativ