Sunteți pe pagina 1din 9

Lucrare 1 Model de regresie simpla

Se cere:

1.De verificat ipotezele fundamentale și specificul modelului.

2. De determinat prin metoda Kramer ,estimațiile α şi β.

3. De determinat estmațiile prin metoda centrării datelor.

4. De alcătuit ANOVA.

5.De calculate r și de explicat σ s .


2

6.De verificat ipoteza nulă pentru estimatorul α.

7. De verificat ipoteza nulă pentru estimatorul β.


2
8. De estimate intervalele de încredere pentru α,β și σ s .

9. Verificați validatetea modelului cu ajutorul testului F.

10.De estimate prognoza punctuală și pe interval.

Tabelul nr.1

Nr. x y x
2
y∗x ( ^y l− y )
2
^y ( y i− ^y )
2
( y i− y )
2
y
2

1 9,01 6,01 81,1801 54,1501 12,25 6,5175 0,25756 16 36,1201


2 10,01 9,01 100,2001 90 3,0625 8,2675 0,55131 1 81,1801
3 8,01 5,01 64,1601 40 27,5625 4,7675 0,05881 25 25,1001
4 12,01 11,01 144,2401 132 3,0625 11,767 0,57381 1 121,2201
5
5 16,01 19,01 256,3201 304 76,5625 18,767 0,05881 81 361,3801
5
Total 55,05 50,05 646,101 620,15 122,5 50,087 1,50028 124 625,0005
5

1.Pentru a specifica modelul este nevoie să determinăm dacă există legătură între variabila
independentă ,,X’’ și variabila dependentă ,,y’’ și să determinăm forma și tipul de legătură statistică.

Pentru aceasta construim norul de puncte .


20
18
16
14
12
10
y

8
6
4
2
0
7 8 9 10 11 12 13 14 15 16 17
x
Graficul 1.1:Norul de puncte

Lucrare 1 Model de regresie simplă

Concluzie: Conform graficul obținut se observă că valorile tind spre o linie dreaptă ,de unde rezulta
faptul că avem o legătură liniară directă.Adică la creșterea variabilei independente x ,crește și valoarea
varibilei dependente Y.

2. Determinăm prin metoda Kramer estimatorii a^ și b^ ai modelului : ^y = a^ + b^ x


Calculăm valoarea estimatorului a^ ,conform formulei :
2
∑ y∗∑ x −∑ x∗∑ x∗y 50,05∗646,101−55,05∗620,15
a^ =
n∗Σ x 2−( Σx )2
= 5∗646,101−3030,5025 =-9,2575
Concluzie :În urma calculelor am obținut valoarea estimatorului a^ care este egală cu -9,2575

Calculăm valoarea estimatorului b^ ,conform formulei

^ n∗Σx∗y−∑ x∗∑ y = 5∗620,15−55,05∗50,05 =1,75


b= 2
n∗∑ x −( Σx )
2
5∗646,101−30 30,5025

Concluzie:În urma calculelor am obținut valoarea estimatorului b^ care este egal cu 1,75. În rezultat
obținem ecuația ^y =−9,25+ x

3.Pentru a ne convinge de corectitudinea valorilor obținute ,calculăm estimatorii a^ și b^ , prin metoda


centrării datelor . Calculam valoarea estimatorul b^ .
x=x−x , x=11,01
y= y− y , y=10,01
Nr. x y x∗y x2
1 -2 -4 8 4
2 -1 -1 1 1
3 -3 -5 15 9
4 1 1 1 1
5 5 9 45 25
Total 0 0 70 40
^ ∑x∗y = 70 =1,75.
b=
Σx
2
40

Concluzie : În urma calculelor am obținut valoarea estimatorului b^ care este egală cu 1,75 , ceea ce
denotă corectitudinea calculelor noastre anterioare.

Calculăm valoarea estimatorului α conform formulei :


^
a^ = y− b∗x
Calculăm valoarea medie a lui x și ^y :

55 ,05 50,05
x= =11,01 y= =10,01
5 5
Obținem:

a^ =10,01-1,75*11,01=-9,2575
Estimatorii obținuți sunt estimatorii de maximă verosimilitate dacă pot fi acceptate următoarele ipoteze:

 Variabile observate nu sunt afectate de erori de măsură.


 Variabila aleatoare (reziduală) u este de medie nulă,iar dispersia ei este constantă și
independentă de X.
 Valorile variabilei reziduale sunt independente,respectiv nu exista fenomenul de autocorelare.

Verificăm dacă variabilele observate nu sunt afectate de erori de măsură cu regula celor trei
sigma ,regula care constă în verificarea următoarelor relații:

Pe baza datelor obținem:


2
∑ ( xi −x ) 122,5 =24 , 5
σ x= =
n 5


∑ ( yⅈ− y ) = 124 =24,8
2
σ y= 5
n
𝑥𝑖 ∈ (𝑥̅∓ 3𝜎𝑥 ) ↔ 𝑥̅− 3𝜎𝑥 < 𝑥𝑖 < 𝑥̅+ 3σ x ↔-62,45< x i<84,51↔ x i∈(-62,45;84,51)

𝑦𝑖 ∈ (𝑦̅ ∓ 3𝜎𝑦) ↔ 𝑦̅ − 3𝜎𝑦 < 𝑦𝑖 < 𝑦̅ + 3𝜎𝑦 ↔-64,35< 𝑦𝑖<84,45↔ 𝑦𝑖∈(-64,35;84,45)

Concluzie : Deoarece valorile acestor variabile aparțin intervalelor x i∈(-62,45;84,51) și


∈(-64,35;84,45).

4. Alcătuim ANOVA, determinăm valorile, SPT, SPR, SPE. Calculăm valoarea sumei pătratelor totale (SPT),
conform formulei:
2
𝑆𝑃𝑇 = ∑ ( y i− y ) =124

Calculăm valoarea sumei pătratelor reziduale (SPR), conform formulei:


2
𝑆𝑃𝑅 =∑ ( y i− ^y ) =1,5

Calculăm valoarea Sumei pătratelor explicative(SPE), conform formulei:

𝑆𝑃𝐸 =∑ ( ^y − y )2 =122,5
2 2
Alcătuim ANOVA: 𝑆𝑃𝑇 = 𝑆𝑃𝐸 + 𝑆𝑃𝑅 ↔ ∑ ( y i− y ) ==∑ ( y i− ^y ) +∑ ( ^y − y )2↔124=1,5+122,5

Concluzie: Testul ANOVA, ne permite să mai verificăm odată veridicitatea calculelor noastre.

SUMMARY OUTPUT

Regression Statistics
Regression 0,99393
StatisticsR 3
0,98790
R Square 3
Adjusted R 0,98387
Square 1
0,70710
Standard Error 7
Observations 5

ANOVA
Significanc
  df SS MS F e
Regressio
n 1 122,5 122,5 245 0,000567
Residual 3 1,5 0,5
Total 4 124      

t- P-
Коэффициент Стандартна статистик Значени Нижние Верхние
  ы я ошибка а е 95% 95%
Y- 0,00534
пересечение -9,2575 1,270925 -7,28406 1 -13,3022 -5,21285
Переменная 0,00056 1,39419 2,10580
X1 1,75 0,111803 15,65248 7 2
ВЫВОД ОСТАТКА

Наблюдени Предсказанн Остатк Стандартные


е ое Y и остатки
1 6,51 -0,5 -0,8165
2 8,26 0,75 1,224745
3 4,76 0,25 0,408248
4 11,76 -0,75 -1,22474
5 18,76 0,25 0,408248

ВЫВОД
ВЕРОЯТНОСТИ

Персенти
ль Y
10 5,01
30 6,01
50 9,01
11,0
70 1
19,0
90 1

5. Calculăm valoarea coeficientului de determinație R2 , conform formulei:

2
∑ ( y i−^y )2 1,5
R =1− = =0 , 98
∑ ( y i−^y )
2
124

Concluzie: În urma calculelor am obținut valoarea coeficientului de determinare R2=0,98, ceea ce arată
că 98% din variația variabilei dependente Y se datoarează variației independente X.

Calculăm valoarea variației reziduale (δ^ u), conform formulei:


2

2
2 ∑ⅇ
2
∑ ( y i−^y ) 1,5
δ^ u= = = =0,5
n−2 n−2 3
Concluzie: În urma calculelor am obținut valoarea variațiie reziduale pe seama factorilor aleatori, δ^ u=
2

0,5, ceea ce semnifică faptul că factorii aleatori au o influență mică, eroarea este mică, rezultă o
exactitate mai mare a datelor.

6. Verificăm ipoteza nulă pentru estimatorul 𝑎̂

1) Formulăm ipotezele:

: 𝑎̂ ≠ 0

2) Determinăm valoarea calculată, conform formulei:

^a |a^| ¿
t calc= =¿−9,2575∨ ¿ =108,3
√ var a √ 0,0073
2
s 0,9
2
ϑar a^ = s a^ = = =0,00 73
∑ ( x i−x ) 122,5
2

1 1,5
s = δ^ =
2 2 2
∗∑ ( x i−^y l ) = =0,5
n−2 3
3) Determinăm valoarea tabelară:

Deci de aici rezulta ca 108,3>3,182

7. Verificăm ipoteza nulă pentru estimatorul 𝑏̂, 𝑓𝑜𝑙𝑜𝑠𝑖𝑛𝑑 𝑡𝑒𝑠𝑡𝑢𝑙 𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡.

1) Formulăm ipotezele:

2. Determinăm valoarea calculată, conform formulei:

^
b̂ |b^̂ | ¿ 1,75∨ ¿ =20 , 48 ¿
t calc= =
√ var a √ 0,0073

𝑣𝑎𝑟 ̂ 𝑏̂ = ϑar a^ =0,0073

3) Comparăm valorile:

Deci rezulta ca 20,48>3,182


Concluzie: Pe baza calculelor de mai susu se observă faptul că ambii estimatorii sunt semnificativ diferiți
de zero, ipoteza nulă se respinge, cu un prag de semnificație 𝛼 =0,05

8. Calculăm intervalele de încredere pentru 𝑎̂, 𝑏̂

Calculăm intervalul de încredere a estimatorului 𝑎̂:

Calculăm dispersia estimatorului 𝑎̂ :

δ^ 2u∗∑ x 2i 0,5∗6 46,101


v (a^ ) = = =0,1
n∗∑ x 2
i
5∗646,101

sa^ =√ v ( a^ )=√ 0,1=0,3


Cu ajutorul testului t-Student, calculăm valoarea tabelară:

Calculăm intervalul de încredere:

Obținem:

Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑎 ∈ (), adică valorile parametrului a
variază între și. Deci valoarea pe care am obținut-o în urma calculelor se îmcadrează în acest interval :𝑎̂
=

Calculăm intervalul de încredere a estimatorului 𝑏̂, conform formulei:

δ^ u
2
0,5
𝑉(𝑏̂) = 2= =0,00077
∑x i
646,101

Cu ajutorul testului t-Student, calculăm valoarea tabelară:

Calculăm intervalul de încredere:

Obținem:

Concluzie: În urma calculelor am obținut intervalul de încredere a lui 𝑏 ∈ , adică valorile parametrului a
variază între . Deci valoarea pe care am obținut-o în urma calculelor se îmcadrează în acest interval :𝑏̂ =
9. Verificăm semnificația modelului cu ajutorul testului Fisher, pentru aceasta, parcurgem următorii pași:
1) Determinăm valoarea calculată, conform formulei:

0,98
F= =245.0000
(1−0,98)∗3

Concluzie: În urma calculelor am obținut că valoarea tabelară este mai mare decât valoarea calculată,
ceea ce semnifică că modelul este nesemnificativ.

10. Efectuăm prognoza punctuală și pe intervale.

În mod normal, în cazul modelului dat, nu se efectuază prognoz, deoarece modelul este nesemnificativ,
însă vom încerca un exemplu. Efectuăm prognoza punctuală, pentru aceasta este nevoie de a cunoaște
valorile lui X pentru anii pe care dorim aă efectuăm prognoza

De exemplu: Fie valoarea lui X=20, în următorum an obtinem :

^y =−9,25+ 1. x=−9,25+20=10,75
Iar în cazul prognozel pe intervale avem:

Xp=x- x =20-11,01=8,99

xp –valoarea lui X prognozată

Calculăm dispersia sumară:

2 1 80,8201
s ^y =0,5∗( + )=0 ,1 62
5 646,101
Concluzie: Astfel putem efectua prognoza pe intervale și punctuală, doar în cazul când modelul este
semnificativ.

Concluzii generale:

În urma efectuării lucrării date, se pot trage următoarele concluzii:

- Avem un model cu o legătură liniară directă, adică la modificarea variabilei X, se modifică în același
sens și variabile Y, ceea ce rezultă și din rezultatul coeficientului de determinație, care arată că 98% din
variația lui Y se datorează variației lui X.

- Estimatorii obținuți sunt de maximă verosimilitate, fiind calculați prin 2 metode și verificaați prin
metoda celor 3 sigme. De asemenea, cu ajutorul testului t-Student am dterminat că ambii estimatori
sunt semnificaativ diferiți de zero.

- Valorile ambilor estimatori se încadrează în intervalul de încredere.

- În urma testului Fisher, am observat că modelul este nesemnificativ

S-ar putea să vă placă și