Documente Academic
Documente Profesional
Documente Cultură
de regresie liniară
1
Exemplu. Număr-poliţe în funcţie de Timpul-mediu
Pentru 15 agenŃi de asigurări, angajaŃi ai unei companii de asigurări de
viaŃă, se cunosc datele privind timpul mediu (X) petrecut de un agent cu
un potenŃial client şi numărul de poliŃe (Y) încheiate de fiecare într-o
săptămână .
X: Timp mediu
25 23 30 25 20 33 18 21 22 30 26 26 27 29 20
(în minute)
Y: Nr. poliŃe 10 11 14 12 8 18 9 10 10 15 11 15 12 14 11
CerinŃe:
1. Să se testeze validitatea modelului de regresie pentru un nivel de
semnificaŃie α = 5% (valoare tabelară: 4,67);
2. Să se testeze semnificaŃia parametrilor modelului de regresie
( nivel de semnificaŃie α = 5%; valoare tabelară: 2,160);
3. Să se determine intervalele de încredere ale acestora;
4. Să se testeze semnificația raportului de corelație pentru un nivel de
semnificaŃie α = 5% (valoare tabelară: 2,160);
Exemplu. Estimarea modelului în Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.883621
R Square 0.780786
Adjusted R
0.763923
Square
Standard Error 1.311483
Observations 15.000000
ANOVA
df SS MS F Significance F
Regression 1.000000 79.640152 79.640152 46.302727 0.000013
Residual 13.000000 22.359848 1.719988
Total 14.000000 102.000000
Upper
Coefficients Standard Error t Stat P-value Lower 95%
95%
Intercept -1.731061 2.046120 -0.846021 0.412843 -6.151434 2.689313
Timpul mediu 0.549242 0.080716 6.804611 0.000013 0.374866 0.723619
Exemplu. Regression Statistics
Table 1.SUMMARY OUTPUT
Regression Statistics
SSR SSE
Multiple R
0.883621 R = = 1−
Raportul de corelatie (R) SST SST
Observations
15
Numărul observaŃiilor (n)
Exemplu. Interpretare R-Square
df
MS
SS (degree of
=SS / df F
Sursa variaŃiei (Sum of Squares) freedom) Significance F
(media pătratelor (testul F)
(suma pătratelor) (grade de
=dispersia corectată)
libertate)
( )
n
SSR = ∑ yˆi − y
2 SSR
MSR =
i =1 k=1 k
Regression (variaŃia
SSR=79,64 79,640152
datorată regresiei) Testul
n SSE
SSE = ∑( yi − yˆi ) MSR
2
MSE = 0,000013< 0,05
n-k-1=13 n − k −1 F=
i =1 MSE
Residual (resping H0 –
SSE= 22,36 1,719988 model valid)
(variaŃia reziduală)
( )
n F = 46,302727
SST = ∑ yi − y
2
i =1 n-1=14
Total (variaŃia SST= 102
totală) SST=SSR + SSE
Exemplu. Testarea validităţii modelului de regresie
9
I
Testarea semnificaţiei parametrilor modelului
β0 nu este semnificativ
diferit de zero
β1 este semnificativ diferit
de zero
R2=78.07%
Fcalc=46.30
10
Testarea semnificaţiei parametrilor modelului
Testăm ipotezele
a) H0: β0= 0 a − 1.73
tcalc = = = −0.846
sa 2.046
H1: β0 ≠ 0
tcritic = t0,025;13 = 2,160
b) H0: β1 = 0 b 0.549
tcalc = = = 6.804
sb 0.08
H1: β1≠ 0
Deoarece n = 15 < 30 avem eşantion de volum redus şi pentru testare vom
utiliza testul t.
11
Testarea semnificaţiei parametrilor modelului
Decizia pentru β1 :
12
Testarea semnificaţiei parametrilor folosind P-value
Despre P-value
13
Testarea semnificaţiei parametrilor folosind P-value
Pentru parametrul β0 :
Pentru parametrul β1 :
14
Intervale de încredere pentru parametrii
modelului
15
Coeficientul de corelaţie liniară
COV ( X , Y ) σ xy ∑(x i − µ X )( y i − µ Y )
ρ = = = i =1
σ xσ y σ xσ y N 2
N
2
∑
i =1
( x i − µ X ) ∑
i =1
( y i − µ Y )
Media estimatorului r este
E (r ) = ρ
Abaterea standard este
1− r2
sr =
n−2
16
Testarea semnificaţiei coeficientului de corelaţie
n ∑ xi − ∑ xi n ∑ yi − ∑ yi
i =1 i =1 i =1 i =1
H0 : ρ = 0
(ρ nu este semnificativ statistic)
H1 : ρ ≠ 0
( ρ este semnificativ statistic)
r n−2
t calc = t critic = tα / 2,n − 2
1− r 2
Decizia: tcalc > tα / 2,n − 2 se resp.Ho, se acc.H1, coeficientul de corelatie ρ este semnificativ statistic.
18
Realizarea de previziuni utilizând modelul de regresie
• Tipuri de previziuni
– Previziuni punctuale
– Previziuni pe intervale de încredere
19
Realizarea de previziuni utilizând modelul de regresie
20
Realizarea de previziuni utilizând modelul de regresie
21
Realizarea de previziuni utilizând modelul de regresie
22
Realizarea de previziuni utilizând modelul de regresie
)
y0 − y 0
Statistica t = ) are o distribuŃie Student cu (n − 2) grade de libertate.
se( y0 − y0 )
Un interval de încredere 100 (1 − α )% pentru y0 , este de forma:
) ) ) )
y0 − tα / 2, n−2 ⋅ se( y0 − y0 ) ≤ y0 ≤ y0 + tα / 2, n−2 ⋅ se( y0 − y0 )
23
Realizarea de previziuni utilizând modelul de regresie
A) Interval de încredere
pentru valoarea medie a Y
lui y , fiind dat x0
Yˆi
B) Intervalul de încredere
pentru predicŃia unei valori y0
fiind dat x0
24
Exemplu: Realizarea de previziuni
CerinŃă
6. Să se construiască un interval de încredere pentru numărul de poliŃe
dacă valoarea anticipată a timpului mediu petrecut de un agent cu un
potenŃial client este de 35 minute, dacă rezultatele se garantează cu o
probabilitate de 95%.
Realizarea de previziuni utilizând modelul de regresie
26
Realizarea de previziuni utilizând modelul de regresie
EstimaŃie
punctuală
Dacă timpul mediu este x0 = 35 , atunci
1 2
( x0 − x ) 1 (35 − 25) 2
2
se 1 + + n = 1.7191 + + = 2.484
n − 2 15 264
∑ i ( x x ) Rezultatele se
i =1
garantează cu
y 0 ∈ [17 .492 ± 2,53 ⋅1.576 ] = [13,5;21,5]
probabilitatea 95%
27