Se cere:
Tabelul nr.1
1. Pentru a specifica modelul este nevoie să determinăm dacă există legătură între variabila
independentă ,,X” şi variabila dependentă ,,y” şi să detrminăm forma şi tipul de legătură statistică.
Pentru aceasta construim norul de puncte.
23
22.5
22
21.5
Y
21
20.5
20
19.5
10 10.5 11 11.5 12 12.5 13 13.5 14 14.5 15
X
∑ 𝑦 ∗ ∑ 𝑥2 − ∑ 𝑥 ∗ ∑ 𝑥 ∗ 𝑦 𝑛 ∗ ∑ 𝑥2 − (∑ 𝑥)2
𝑎̂=
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1. În rezultat obţinem
ecuaţia: 𝑦̂ = 9,2 + 𝑥
Dependent Variable: Y
Method: Least Squares
Date: 09/22/19 Time: 15:47
Sample: 1 5
Included observations: 5
𝑥 = 𝑋 − 𝑋̅, 𝑋̅ = 14
𝑦 = 𝑌 − 𝑌̅ , 𝑌̅=23,2
∑ 𝑥 ∗ 𝑦 40
𝑏̂ = ∑ 𝑥2 = 40 = 1
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑏̂ care este egală cu 1, ceea ce denotă
corectitudinea calculelor noastre anterioare.
Concluzie: În urma calculelor am obţinut valoarea estimatorului 𝑎̂ care este egală cu 9,2
Estimatorii obţinuţi sunt estimatori de maximă verosimilitate dacă pot fi acceptate următoarele
ipoteze:
Variabilele observate nu sunt afectate de erori de măsură.
Variabila aleatoare (reziduală) u este de medie nulă, iar dispersia ei este constantă
şi independentă de X.
Valorile variabilei reziduale sunt independente, respectiv nu există fenomenul de
Lucrare 1 Model de regresie simpla
autocorelare.
Verificăm dacă variabilele observate nu sunt afectate de erori de măsură cu regula celor trei sigme, regula care
constă în verificarea următoarelor relaţii:
𝑥 𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥)
𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦)
∑(𝑥𝑖 − 𝑥̅)2 40
𝜎𝑥 = √ =√ = 2,82
𝑛 5
∑(𝑦𝑖 − 𝑦̅ )2 23,04
𝜎𝑦 = √ =√ = 2,15
𝑛 5
𝑥𝑖 ∈ (𝑥̅ ∓ 3𝜎𝑥) ↔ 𝑥̅ − 3𝜎𝑥 < 𝑥𝑖 < 𝑥̅ + 3𝜎𝑥 ↔ 5,54 < 𝑥𝑖 < 22,46 ↔ 𝑥𝑖 ∈ (5,54; 22,46)
𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦) ↔ 𝑦̅ − 3𝜎𝑦 < 𝑦𝑖 < 𝑦̅ + 3𝜎𝑦 ↔ 16,76 < 𝑦𝑖 < 29,64 ↔ 𝑦𝑖 ∈ (16,76; 29,64)
Concluzie: Deoarece valorile acestor variabile aparțin intervalelor 𝑥𝑖 ∈ (5,54; 22,46) ș𝑖 𝑦𝑖 ∈ (16,76; 29,64),
ipoteza de mai sus poate fi acceptată fără rezerve
1. Alcătuim ANOVA, determinăm valorile, SPT, SPR, SPE. Calculăm valoarea sumei pătratelor totale
(SPT), conform formulei:
𝑆𝑃𝑇 = ∑(𝑦𝑖 − 𝑦̅ ) 2 = 42,8
Calculăm valoarea sumei pătratelor reziduale (SPR), conform formulei:
𝑆𝑃𝑅 = ∑(𝑦𝑖 − 𝑦̂)2 = 2,8
Calculăm valoarea Sumei pătratelor explicative(SPE), conform formulei:
𝑆𝑃𝐸 = ∑(𝑦̂ − 𝑦̅ ) 2 = 40
Alcătuim ANOVA:
𝑆𝑃𝑇 = 𝑆𝑃𝐸 + 𝑆𝑃𝑅 ↔ ∑(𝑦𝑖 − 𝑦̅ )2 = ∑(𝑦𝑖 − 𝑦̂)2 + ∑(𝑦̂ − 𝑦̅ )2 ↔ 42,8 = 40 + 2,8
Concluzie: Testul ANOVA, ne permite să mai verificăm odată veridicitatea calculelor noastre.
Lucrare 1 Model de regresie simpla
Lucrare 1 Model de regresie simpla
𝑅2 = 1 − ∑(𝑦𝑖 − 𝑦̂𝑖 )2 −
∑(𝑦𝑖 𝑦̂)2
Concluzie: În urma calculelor am obținut valoarea coeficientului de determinare R^2=0,95, ceea ce
arată că 95% din variația variabilei dependente Y se datoarează variației independente X.
𝛿̂2 = ∑ 𝑒
2
∑(𝑦𝑖 − 𝑛−
𝑢
= 2
𝑛−2 𝑦̂𝑖 )2
Concluzie: În urma calculelor am obținut valoarea variațiie reziduale pe seama factorilor aleatori,
𝛿𝑢2̂ ,
ceea ce semnifică faptul că factorii aleatori au o influență mică, eroarea este mică, rezultă o
exactitate mai mare a datelor.
𝐻0 : 𝑏̂ = 0
𝐻0 : 𝑏̂ ≠ 0
2) Determinăm valoarea calculată, conform formulei:
𝑏̂
|𝑏̂|
𝑡𝑐𝑎𝑙𝑐 =
√𝑣̂𝑎𝑟𝑎̂
𝑣̂𝑎𝑟𝑏̂ = 𝑣̂𝑎𝑟𝑎̂
3) Comparăm
valorile: 𝑡𝑏̂ > 𝑡𝑎̂
Lucrare 1 Model de regresie simpla
𝑐𝑎𝑙𝑐 𝛼:𝑛−2
Concluzie: Pe baza calculelor de mai susu se observă faptul că ambii estimatorii sunt semnificativ
diferiți de zero, ipoteza nulă se respinge, cu un prag de semnificație 𝛼.
𝑆𝑎̂ = √𝑉 (𝑎̂ )
𝛿 2̂ ∗ ∑ 𝑥2
𝑉 (𝑎̂ ) = 𝑢 𝑖
𝑛 ∗ ∑ 𝑥𝑖2
Cu ajutorul testului t-Student, calculăm valoarea tabelară, apoi calculăm intervalul de încredere
Lucrare 1 Model de regresie simpla
𝑎̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑎̂
𝑎̂ + 𝑡𝛼 ∗ 𝑆𝑎̂
Concluzie: În urma calculelor am obținut intervalul de încredere , adică valorile parametrului a variază
pe un anumit interval. Deci valoarea pe care am obținut-o în urma calculelor se
încadrează în acest interval
𝑆𝑏̂ = √𝑉(𝑏̂)
Cu ajutorul testului t-Student, calculăm valoarea tabelară, iar apoi calculăm intervalul de încredere:
𝑏̂ − 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂
𝑏̂ + 𝑡𝛼;𝑛−2 ∗ 𝑆𝑏̂
Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑏. Deci valoarea pe care am obținut-
o în urma calculelor se îmcadrează în acest interval :𝑏̂ = 1
9. Verificăm semnificația modelului cu ajutorul testului Fisher, pentru aceasta, parcurgem următorii pași:
1) Determinăm valoarea calculată, conform formulei:
𝑅2
𝐹𝑐𝑎𝑙𝑐 =
(1 − 𝑅2) ∗ (𝑛 − 2)
Lucrare 1 Model de regresie simpla
2) Determinăm valoarea tabelară:
𝐹𝛼;𝑘−𝑎;𝑛−𝑘
Astfel putem efectua prognoza pe intervale și punctuală, doar în cazul când modelul este
semnificativ.
Concluzii generale:
- Avem un model cu o legătură liniară directă, adică la modificarea variabilei X, se modifică în același
sens și variabile Y, ceea ce rezultă și din rezultatul coeficientului de determinație, care arată că 94%
din variația lui Y se datorează variației lui X.
- Estimatorii obținuți sunt de maximă verosimilitate, fiind calculați prin 2 metode și verificaați prin
metoda celor 3 sigme. De asemenea, cu ajutorul testului t-Student am dterminat că ambii estimatori sunt
semnificaativ diferiți de zero.
- Valorile ambilor estimatori se încadrează în intervalul de încredere.
- În urma testului Fisher, am observat că modelul este nesemnificativ.