Documente Academic
Documente Profesional
Documente Cultură
În regresia multiplă acuratețea estimației este cu atât mai mare cu cât dispersia
este mai mare.
Eroarea standard de estimare (eroarea rădăcinii pătrate medii) se calculează cu
relaţia:
Y Yˆ
2
s
n k 1
Y Y Y Yˆ
2 2
R 2
Y Y
2
R 2
Y Yˆ / n k 1
i i
2
Y Y /n 1
ajustat 2
ANALIZEI VARIANŢEI
SSR Yˆ Y 2
SSE Y Yˆ .
2
SSR
MSR
k
SSE
MSE
n k 1
Fiecare din aceste sume are asociat un anumit număr de grade de libertate:
SST are n-1 grade de libertate (n observaţii, dar s-a pierdut un grad de
libertate deoarece media sondajului este fixă),
SSR are k grade de libertate (are k variabile independente care explică
variaţia caracteristicii Y)
SSE are n-k-1 grade de libertate (cele n observaţii sunt folosite pentru a
estima k+1 constante).
Dacă valoarea SSE este mare, cea mai mare parte a variației variabilei
dependente Y a rămas neexplicată, ceea ce ne arată că nu a fost ales cel mai adecvat
model.
Dacă valorea SSR este suficient de mare faţă de SSE pentru a conduce la
concluzia că cel puţin unparametru i este diferit de zero se calculează raportul mediei
pătratelor, testul F.
TESTUL FISHER
Testul F din analiza varianței testează în același timp toți coeficienții i pentru
a stabili dacă cel puțin unul dintre ei nu este egal cu zero.
F = MSR/MSE
SSR / k
F
SSE / n k 1
O valoare mare a lui F arată că cea mai mare parte a variaţiei variabilei Y este
explicată prin variația variabilei X şi modelul este valid.
O valoare mică a lui F arată că cea mai mare parte a variabilei Y a rămas
neexplicată.
Aria de respingere permite să se stabilească dacă F este suficient de mare pentru
a justifica respingerea ipotezei Ho.
Aria de respingere a ipotezei H0 este dată de relația:
Dacă valoarea afișată este mai mică decât pragul de semnificație fixat, atunci se
respinge ipoteza nulă H0 în favoarea ipotezei alternative H1.
Dacă valoarea Significance F este mai mică decât nivelul de semnificație ales
atunci modelul de regresie construit este valid şi poate fi utilizat pentru analiza
dependenţei dintre cele două variabile.
EVALUAREA MODELELOR DE REGRESIE MULTIPLĂ
Tabelul nr. 2. Legătura dintre testul F, R 2 şi s .
SSE s R2 F Evaluarea
modelului
0 0 1 ∞ perfect
mică Mică aproape de 1 mare bun
mare Mare aproape de 0 mică slab
SSy 0 0 nu există
SS y
* corelație liniară
n k 1
Test t
În situația când este respinsă ipoteza nulă H0, se acceptă că ecuația de regresie
este semnificativă la nivel global, cu mențiunea că s-ar putea ca anumiți coeficienți să nu
fie semnificativi.
Pentru testarea fiecărui coeficient se utilizează un test t cu ipotezele:
H0: αi= 0
H1: αi ≠ 0.
Y A B1 X 1 B2 X 2 ... Bk X k
Y depinde de Xi dacă Bi 0
Y nu depinde de Xi dacă Bi 0 .
tc valoare „critică”
b
Raportul i valoare t „observată” sau „calculată” şi se notează cu t0
sbi
tc t0 tc
tc sau ttabelar reprezintă valoarea corespunzătoare a lui t, cu n-k-1 grade de libertate pentru
nivelul de semnificaţie al testului;
b
t o i reprezintă valoarea calculată a lui t (tcalc)
sbi
BIBLIOGRAFIE