Documente Academic
Documente Profesional
Documente Cultură
Pentru a evalua influenţa Venitului disponibil asupra Cheltuielilor de consum ale unei familii, au fost
înregistrate, pentru 10 familii, valorile următoarelor variabile: X si Y.
X 80 100 120 140 160 180 200 220 240 260
Y 70 65 90 95 110 115 120 140 155 150
X – Venitul disponibil al familiei, exprimat în mii lei (variabila independentă sau exogenă)
Y – Cheltuielile de Consum ale familiei, exprimate în mii lei (variabila dependentă sau endogenă)
1. Să se reprezinte grafic datele de observaţie şi să se comenteze legătura dintre cele două variabile.
2. Pe baza datelor din eşantion, estimaţi coeficienţii modelului de regresie adecvat analizei dependenţei
dintre cele două variabile şi interpretaţi valorile obţinute.
3. Să se testeze validitatea modelului de regresie liniară la un prag de semnificaţie de 5%
(nivel de semnificaţie =0,05; valoare tabelară 5,32).
4. Calculaţi coeficientul de determinaţie şi interpretaţi rezultatul obţinut.
5. Calculaţi raportul de corelaţie, testaţi semnificaţia acestuia şi interpretaţi rezultatul obţinut.
6. Să se testeze semnificaţia statistică a parametrilor modelului
(nivel de semnificaţie =0,05; valoare tabelară: 2,306).
7. Determinaţi şi interpretaţi intervalele de încredere 95% pentru parametrii modelului
8. Măsuraţi intensitatea legăturii dintre cele două variabile folosind coeficientul de corelaţie liniară
Pearson si testaţi semnificaţia statistică a acestuia.
9. Să se raporteze rezultatele analizei de regresie
10. Să se previzioneze cheltuielile de consum ale unei familii, în ipoteza că venitul disponibil
este de 280 mii lei.
11. Să se previzioneze cheltuielile medii de consum ale unei familii, în ipoteza că venitul disponibil
este de 280 mii lei.
1
3. Testarea validităţii modelului de regresie folosind metoda ANOVA
Să se verifice dacă modelul de regresie identificat este valid statistic
(valoare tabelară: 5,32 pentru un nivel de semnificaţie de 0,05).
Fie α nivelul (pragul) de semnificaţie al testului, iar 1-α este nivelul de încredere al testului. Dacă nu se
specifică, vom considera în general că =0,05 iar 1-=0,95 (sau 100α% = 5% iar 100(1-α)% = 95%).
Pentru testarea validităţii modelului de regresie construim tabelul ANOVA:
2
Pentru testarea validităţii modelului se formulează 2 ipoteze:
H0: modelul nu este valid statistic (MSR=MSE)
H1: modelul este valid statistic (MSR>MSE)
𝑆𝑆𝑅
𝑀𝑆𝑅 𝑘−1
Folosim statistica: 𝐹 = = 𝑆𝑆𝐸 care urmează o distribuţie 𝐹𝑖𝑠h𝑒𝑟 1,𝑛−2
𝑀𝑆𝐸
𝑛−𝑘
Regiunea critică: 𝑅𝑐 : 𝐹𝑐𝑎𝑙𝑐 > 𝐹𝛼;1,𝑛−2
Dacă 𝐹calculat > 𝐹𝛼;1,𝑛−2 respingem H0 şi acceptăm H1
𝐹calculat = 8552,73/42,159 = 202,87,
𝐹tabelat = 𝐹critic = 𝐹𝛼;1,𝑛−2 = 𝐹0,05;1,8 = 5,32 ( = 5,317655)
3
𝑅2
𝐹= (𝑛 − 2)~𝐹𝑖𝑠h𝑒𝑟1,𝑛−2
1 − 𝑅2
Se aplică regula de decizie: dacă 𝐹calc > 𝐹𝛼;1,𝑛−2 se respinge ipoteza nulă în favoarea ipotezei alternative.
Deoarece 𝐹calc ≈ 202 şi 𝐹𝛼;1,𝑛−2 = 5,32 respingem H0 şi acceptăm H1, modelul este corect specificat
⇒ Raportul de corelaţie este semnificativ statistic
⇒ variabila X are efect asupra variabilei Y.
𝑖 ∑ 𝑥2 1 𝑥̄ 2
𝑠𝛽̂0 = 𝑠𝑒 ⋅ √𝑛 ∑(𝑥 −𝑥̄ = 𝑠𝑒 ⋅ √𝑛 + ∑(𝑥 −𝑥̄ )2 = 6,4138
)2 𝑖 𝑖
4
𝑡critic = 𝑡tabela𝑡 = 𝑡0,025;8 =2,306
Dacă |𝑡calc | > 𝑡𝛼;𝑛−2 atunci respingem 𝐻0 şi acceptăm 𝐻1 la un nivel de semnificaţie de 𝛼%.
2
𝑏0 −0 24,4545
𝑡calc = = = 3,8128
𝑠𝑏0 6,4138
𝑡calc = 24,4545/6,4138 = 3,8128; 𝑡critic = 𝑡tabela𝑡 = 𝑡0,025;8 = 2,306
Deoarece 3,8128>2,306 𝑡𝑐𝑎𝑙𝑐 ∈ 𝑅𝑐 respingem H0 şi acceptăm H1 ⇒ 𝛽0 este semnificativ statistic.
5
Intervalul [9,6643; 39,2448] acoperă valoarea reală a parametrului 𝛽0 cu o probabilitate de 95%.
Intervalul construit nu conţine valoarea 0, deci suntem încrezători că 𝛽0 ≠ 0.
Important!
Pentru testarea semnificaţiei coeficienţilor avem 3 posibilităţi, cu rezultate identice:
• Folosim testul t
• Folosim P-value
• Folosim intervalele de încredere
6
10. Să se previzioneze (prognozeze) cheltuielile de consum ale unei familii, în ipoteza că
venitul disponibil este 𝑥𝑝 = 𝑥𝑛+1 =280 mii lei.
Putem obţine estimaţii punctuale sau prin intervale de încredere
Se doreşte predicţia unei valori individuale
𝑦̂𝑝 = 𝛽̂0 + 𝛽̂1 𝑥𝑝 = 24,4545 + 0,5091 ⋅ 280 = 167,0025 mii lei
este o estimaţie (predicţie) a valorii individuale 𝑦𝑝 = 𝛽0 + 𝛽1 𝑥𝑝 + 𝜀𝑝
11. Să se previzioneze (prognozeze) cheltuielile medii de consum ale unei familii, în ipoteza că
venitul disponibil este 𝑥𝑝 = 𝑥𝑛+1 =280 mii lei.
Suntem în situaţia de a prognoza 𝐸(𝑌|𝑋 = 𝑥𝑝 ) = 𝛽0 + 𝛽1 𝑥𝑝
Folosim ecuaţia de regresie estimată: 𝑦̂𝑖 = 𝛽̂0 + 𝛽̂1 𝑥𝑖 = 24,4545 + 0,5091 ⋅ 𝑥𝑖
𝑦̂𝑝 este un estimator (predictor) al mediei condiţionate 𝐸(𝑌|𝑋 = 𝑥𝑝 ).
O estimaţie punctuală a previziunii mediei este
𝑦̂𝑝 = 𝛽̂0 + 𝛽̂1 𝑥𝑝 = 24,4545 + 0,5091 ⋅ 280=167,0025 mii lei
Observaţie: Se obţine un interval de lungime mai mare pentru 𝑦𝑝 decât pentru 𝐸(𝑌|𝑥𝑝 ). Banda de
încredere este mai mică atunci când valoarea lui 𝑥𝑝 = 𝑥𝑛+1 se apropie de media de selecţie 𝑥̄ .