Documente Academic
Documente Profesional
Documente Cultură
1
4. Evaluarea validităţii modelului
a) Testarea validităţii modelului de regresie folosind metoda ANOVA
b) Determinarea şi testarea semnificaţiei raportului de corelaţie
2
c)Inferenţa statistică pentru parametrii modelului de regresie
1 n 2
S
2
e
n 2 i 1
ei
3
c)Inferenţa statistică pentru parametrii modelului de regresie
1. Testarea parametrului 1
4
Testarea parametrilor modelului de regresie
Testul bilateral:
H0: β1 = 0 (β1 nu difera semnificativ de zero)
H1: β1 ≠ 0 (β1 difera semnificativ de zero)
5
Testarea parametrilor modelului de regresie
6
Testarea parametrilor modelului de regresie
7
Testarea parametrilor modelului de regresie
Regiunea critică:
Pentru testul bilateral:
dacă t calc t / 2,n 2 sau t calc t / 2,n2 se respinge H0.
Pentru testul unilateral dreapta: t calc t ,n 2
Pentru testul unilateral stânga: t calc t ,n2
Intervalul de încredere pentru “β1”:
b1 t / 2,n 2 sb1 1 b1 t / 2,n 2 sb1
8
Testarea parametrilor modelului de regresie
Testul bilateral:
H0: β0 = 0
H1: β0 ≠ 0
9
Testarea parametrilor modelului de regresie
10
Testarea parametrilor modelului de regresie
unde:
sb1= deviaţia standard a estimatorului b1
1 se
sb1 s 2
e n
(x x)
n
i
2
i ( x x ) 2
i 1 i 1
1 x 2 x 2
i
sb 0 se n
se n
i 1
(x x) n ( xi x )2
n 2
i
i 1 i 1
11
Exemplu
O unitate de prestări servicii a măsurat, pe baza unui model liniar de
regresie, dependenta dintre dintre costul total -Y (mii lei) si numărul
clienţilor serviţi -X:
yˆ i 2272 51,66 xi
(costul total=costul fix+costul variabil)
Se cunosc:
n 18; x 32,5; s x 6,5552; y 3951,06mii lei;
s y 389,6131 mii lei; se 198,58mii lei.
Se determină:
198,58 198,58 1 32,52
sb1 7,14 sb 0 198,58 236,73
6,5552 18
2 27,81 18 6,5552 18
2
12
Exemplu
Testăm ipotezele
a) H0: β1 = 0 b1 b1 b1 0 b1 51,66
tcalc 7,235
H1: β1 ≠ 0 sb1 sb1 sb1 7,14
13
Exemplu
Intervalele de încredere:
b1 t0.025 ;16 sb1 1 b1 t0.025;16 sb1
51,66 2,12 7,14 1 51,66 2,12 7,14
14
MODELUL DE REGRESIE LINIAR
MULTIFACTORIAL
15
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
Exemple:
1. În medie ne-am aştepta ca la un nivel mai ridicat de educaţie, nivelul
venitului să crească:
venit = 0 + 1educaţie +
16
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
3. În analiza raportului dintre cererea şi oferta unui produs vom putea studia
cantitatea cerută pentru un anumit produs numai în funcţie de preţ,
stabilind astfel un model simplu de regresie:
qi = 0 + 1 pi + i
qi = 0 + 1 pi +2vi + i
17
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
18
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
Variaţia explicată
Variaţia explicată de X2
de X1 şi X2
X2
X1
X1 X2
20
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
Pentru fiecare unitate i vom avea seria de valori xi1, xi2, …, xik
y1
y
y 2
n
y
Modelul de regresie este:
y = β0+ 1x1 + 2x2 + … + kxk +
22
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
sau Y X BE
23
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
Estimarea parametrilor modelului se face cu MCMMP,adica se minimizeaza suma pătratelor abaterilor dintre
valorile reale, empirice (yi) şi valorile teoretice, ajustate, rezultate pe baza modelului ( ŷ i ), adică:
n
yi ˆ i 2 minim sau
y
i 1
n n n
S yi yˆi e yi b0 b1xi1 b2 xi 2 ... bk xik minim
2 2 2
i
i 1 i 1 i 1
24
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
S
În urma derivării şi anulării derivatelor parţiale în raport cu “bj” ( 0 , j 1, k ) se obţine un
bi
sistem de (k+1) ecuaţii normale cu (k+1) necunoscute, de forma:
i i i i i
i i i i i
................................................................................................
b0 xik b1 xi1 xik b2 xi 2 xik ... bk xik xik yi
2
i i i i i
25
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
Pentru fiecare din cele “n” unităţi de observare din eşantion, au loc egalităţile:
i=1 y1 b0 b1 x11 b2 x12 ... bk x1k e1
i=2 y 2 b0 b1 x 21 b2 x 22 ... bk x 2 k e2
..........................................................................................
i=n y n b0 b1 x n1 b2 x n 2 ... bk x nk en
26
1. Specificarea, definirea şi identificarea
modelului liniar multifactorial
27
3. Estimarea parametrilor modelului liniar
multifactorial
Y = XB + E
Estimatorii parametrilor se determină după relatia:
B ( X ' X ) 1 X ' Y
Valorile previzionate: Yˆ XB
Erorile: E Y Yˆ
28
4. Validitatea modelului
ANOVA
Sursa variaţiei Varianţa Gradele de Dispersia corectată Statistica F
(suma pătratelor) libertate (media pătratelor)
Datorată
regresiei k
(explicată de n
model) SSR ( yˆ i y ) 2 MSR
SSR
i 1 k MSR
Reziduală
n-k-1
Fcalc
(neexplicată de n MSE
model)
SSE ( yi yˆ i ) 2
SSE
i 1 MSE ( S e2 )
n k 1
Totală –
n n-1
SST ( yi y ) 2
SST
s y2
i 1
n 1
29
4. Validitatea modelului
Ipotezele: H 0 : i 0
sb21
H1 : i 0 sb2
sB2 2 se2 diag ( X ' X ) 1
...
bi i bi
unde sb2
Testul statistic: t k
sbi sbi
Regula de decizie:
tcalc t / 2,n k 1 se respinge H0, deci
tcalc t / 2,nk 1 parametrul i este
seminificativ 30
Observaţii
Coeficienţii de corelaţie parţială - caracterizează intensitatea
legăturii dintre două variabile, în ipoteza că celelalte variabile
rămân constante.
coeficientul de corelaţie parţială între Y şi X1, eliminând influenţa
variabilei X2 este:
ryx1 ryx2 rx1x2
ryx1 / x2
1 r 1 r
2
yx2
2
x1 x2
Interpretări:
R : legătura dintre Xi şi Y este puternică.
R2 : 85,6% din variaţia lui Y este determinată de
influenţa lui X1,X2 (este explicată de model)
33
Exemplu – rezultate Excel:
ANOVA
df SS MS F Significance F
Regression k=2 46033,02 23016,51 Fcalc = 29,67 0,00006234
Residual n-k-1 = 10 7756,21 775,62
Total n-1 = 12 53789,23
Interpretări:
Modelul de regresie este semnificativ statistic (valid) (adică se acceptă
H1) pentru o probabilitate de cel mult 100-0,0062=99,9938%>95%
34
Exemplu – rezultate Excel:
Interpretări:
Parametrul 0 nu este semnificativ, deoarece probabilitatea cu care se poate
accepta H1 (care susţine că este semnificativ) este de cel mult 100-
5,95=94,05%<95%.