Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Unitatea de învăŃare : 8
REGRESIA UNIFACTORIALĂ - partea a III-a
Cuprins:
Cum să testăm validitatea unui model econometric prin ANOVA şi metoda testării
ipotezelor statistice.
Una dintre utilizările importante ale analizei regresiei simple liniare este să obŃinem
previzionări sau predicŃii ale variabilei dependente, condiŃionate de valorile variabilei
independente, adică să obŃinem previzionări condiŃionate.
Dacă presupunem că variabila independentă ia valoarea specificată Xn+1 şi legătura liniară
se menŃine, atunci valoarea corespunzătoare a variabilei dependente Yn+1 este:
cu media:
ecuaŃiile de mai sus sunt utilizate pentru estimarea mediei de răspuns şi pentru estimarea unui
răspuns individual. Pentru amândouă estimaŃiile putem obŃine estimaŃii punctuale sau pe
intervale de încredere.
Pentru a obŃine estimaŃii punctuale, folosim ecuaŃia de regresie liniară în eşantion:
yi = a + bxi + ei
ŷ n +1 = a + b⋅xn+1.
Ştim că:
(
ŷn+1 = y − bx + bxn+1 = y + b xn+1 − x , )
dacă xn+1 = x , atunci ŷ n +1 = y, iar estimatorul dispersiei pentru ŷ n +1 este
s e2
s 2
( ŷ n +1 ) = s (y ) =
2
.
n
se
ŷ n +1 ± t α / 2 , n − 2 ;
n
În acest caz:
ŷ n +1 = y + b( x n +1 − x ) ,
2 1 ( x − x) 2 .
s (2yˆ n +1 ) = s [y + b ( x − x ) ] = s e
2
+ n n +1
n
n +1
∑ (
xi − x
2
)
i =1
ŷ n +1 ± t α / 2 , n − 2 s e
1 (
x −x
+ n n +1
)
2
n
∑ xi − x
i =1
( ) 2 ;
1 ( xn +1 − x ) 2
yˆ n +1,i ± tα / 2 , n − 2 s e 1 + + n
n
∑ ( xi − x ) 2 . i =1
Exemplu
Proprietarul unui minihotel dezvoltă o analiză statistică pentru determinarea
cheltuielilor cu materialele de curăŃenie (y) în funcŃie de numărul camerelor ocupate (x). El
determină ecuaŃia de regresie pentru cheltuielile zilnice (pentru detergent, clor etc.) (zeci
mii u.m.), pe baza datelor înregistrate pentru n=14 zile:
yi = 10,8 + 3,7 xi
∑( x − x )
2
i = 26,86 x = 2,3
∑(y i
− yˆ ) 2 = 163,39
b) Proprietarul doreşte să estimeze cheltuielile medii pentru zilele în care are 6 camere
ocupate.
Dacă numărul camerelor ocupate este xn +1 = 6 , atunci:
t0,025;12 = 2,179
a) Intervalul de încredere pentru cheltuielile unei zile în care sunt 6 camere ocupate
este:
1 (6 − 2,3) 2
33 ± 2,179 ⋅ 3,69 1 + + ,
14 26.86
Interval de încredere
pentru valoarea
aşteptată a lui y, fiind
Y ∧
dat xi y
∧
y = b0+b1xi
1 (x i − x) 2
ŷ n +1 ± t n -2,α/2 s e + = 317.85 ± 37.12
n ∑ (x i − x) 2
DeterminaŃi un interval de încredere (p=95%) pentru pre ul unei case de 2000 pp:
1 (X i − X ) 2
ŷ n +1 ± t n -1,α/2s e 1 + + = 317.85 ± 102.28
n ∑ (X i − X ) 2
5,00000
Unstandardized Residual
2,50000
0,00000
Unstandardized Residual = 0,00 + -0,00 * Doza
R-Square = 0,00
-2,50000
-5,00000
10 15 20 25 30
Doza
100,00
0,00
che t_pub
Descriptive Statistics
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 153278,6 1 153278,583 277,936 ,000a
Residual 18750,639 34 551,489
Total 172029,2 35
a. Predictors: (Constant), chet_pub
b. Dependent Variable: Cifra_afaceri
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -17,043 6,635 -2,569 ,015
chet_pub 4,381 ,263 ,944 16,671 ,000
a. Dependent Variable: Cifra_afaceri
50,00000
Unsta ndardiz ed Residual
25,00000
0,00000
Residual =
Unstandardized 0,00 + -0,00 * chet_pub
R-Square = 0,00
-25,00000
-50,00000
che t_pub
One-Sample Kolmogorov-Smirnov Test
Standardized
Residual
N 36
Normal Parameters a,b Mean ,0000000
Std. Deviation ,98561076
Most Extreme Absolute ,156
Differences Positive ,156
Negative -,142
Kolmogorov-Smirnov Z ,937
Asymp. Sig. (2-tailed) ,344
a. Test distribution is Normal.
b. Calculated from data.
În cazul legăturii simple pe baza reprezentării grafice pot fi emise ipoteze privind
forma neliniară a dependenŃei rezultativei Y de factorul înregistrat X.
Testarea acestor ipoteze poate fi realizată, pe baza metodei celor mai mici pătrate.
♦ În cazul în care linia este apreciată ca o parabolă de gradul doi, vom avea:
Yx = a 0 + a1x + a 2 x 2 + ε
) ) )
∑ (y − a − a1x − a 2 x 2 ) = 0 , se va ajunge la sistemul de ecuaŃii
2
Plecând de la condiŃia 0
normale:
) ) ) )
na 0 + a 1 ∑ x + a 2 ∑ x 2 = ∑ y
) ) ) )
a 0 ∑ x + a 1 ∑ x + a 2 ∑ x = ∑ x y
2 3
) ) ) 2)
a 0 ∑ x + a 1 ∑ x + a 2 ∑ x = ∑ x y
2 3 4
1
na 0 + a 1 ∑ = ∑ y
x
1 1 1
a 0 ∑ + a1 ∑ =∑ y
x x2 x
♦ În cazul unei legături de tip logaritmic:
Yx = a 0 + a1 lg x,
trebuie estimaŃi cei doi parametri, prin rezolvarea sistemului de ecuaŃii normale:
na 0 + a 1 ∑ lg x = ∑ y
a 0 ∑ lg x + a 1 ∑ (lg x ) 2 = ∑ y ⋅ lg x
6. Test de autoevaluare
8. Lucrare de verificare
1. În urma modelării liniare a unei legături între numărul de familii, suprafaŃa comercială a
unui magazin (exprimată în mp.) din diferite cartiere şi cifra de afaceri (în RON) s-au obŃinut
rezultatele:
Regression Statistics
Multiple R 0,93
R Square
Standard Error 278,50
Observations 13 Fcritic=4,1
Standard P- Upper
Coefficients Error value Lower 95% 95%
Intercept 375,02 176,46 0,06 -18,16 768,20
Nr. De fam 14,96 5,53 0,02 2,63
Suprafat com 42,45 10,65 0,00
RăspundeŃi la următoarele întrebări:
1) În ce proporŃie explică modelul variaŃia cifrei de afaceri?
2) Modelul este valid? (explicaŃi folosind testul F).
3) Parametrii sunt semnificativ diferiti de 0? Motivati.
4) Construiti intervalul de incredere la P=0,95 pentru coeficientul variabilei
“Suprafata com”
5) Interpretati rezultatele modelării din punct de vedere economic.
2. Un agent al unei agenŃii imobiliare dintr-un cartier ar dori să poată previziona costul de
închiriere lunar bazându-se pe mărimea apartamentului de închiriat exprimată prin suprafaŃa
în mp. Un eşantion de 7 apartamente a fost selectat şi au fost extrase următoarele date: