Documente Academic
Documente Profesional
Documente Cultură
Proprietăţilorestimatorilorparametrilormodelului de regresie:
- estimatorii parametrilor sunt nedeplasaţi: ;
- estimatorii parametrilor urmează o lege de repartiţie normală: ;
1
A. Ipoteze cu privire la erori (variabila reziduală sau componenta aleatoare)
Aplicaţie:
În studiul legăturii dintre variabila dependentă, Salariul ($), şi variabila independentă,
Nivelul de educaţie (ani), înregistrate pentru un eşantion de 474 de persoane, s-au obţinut
următoarele rezultate:
Coeffi cientsa
Unstandardized St andardiz ed
Coeffic ient s Coeffic ient s
Model B St d. Error Beta t Sig.
1 (Cons tant) -18331,2 2821,912 -6, 496 ,000
Educational Level (years) 3909,907 204,547 ,661 19,115 ,000
a. Dependent Variable: Current Salary
Residuals Statisticsa
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
Unstandardized Residual 474 ,0000000 12819,96640 588,8406
Test Value = 0
95% Confidence
Int erval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
Unstandardized Residual ,000 473 1,000 ,00000000 -1157, 07 1157,067
2
One-Sample Kolmogorov-Smirnov Test
Unstandardized
Residual
N 474
Normal Parameters a,b Mean ,0000000
Std. Deviation 12819,96639730
Most Extreme Absolute ,110
Differences Positive ,110
Negative -,069
Kolmogorov-Smirnov Z 2,400
As ymp. Sig. (2-tailed) ,000
a. Test distribution is Normal.
b. Calculated from data.
Descriptive Statistics
Observaţie: Tabelele pe baza cărora se poate calcula valoarea statisticii test Student sau se poate
lua decizia cu privire la această ipoteză sunt: Residual Statistic, OneSampleStatistics, OneSample
Test, OneSampleKolmogorov-Smirnov Test.
3
(4) Citirea valorii teoretice a statisticii test:
4
2. Ipoteza de homoscedasticitate:
Erorile astfel definite sunt homoscedastice dacă varianţele acestora sunt egale şi
constante:
constantă.
Testarea ipotezei
2.1. Testul Glejser (cazul regresiei liniare simple): presupune testarea semnificaţiei
parametrului din modelul de regresieestimat construit pe baza variabilei reziduale în valoare
absolută ca variabilă dependentă şi variabila independentă :
Aplicaţie:
Se studiază legătura dintre variabila dependentă, Salariul ($), şi variabila independentă,
Nivelul de educaţie (ani), înregistrate pentru un eşantion de 474 de persoane. În vederea
verificării ipotezei de homoscedasticitate a erorilor, se aplică testul Glejser iar rezultatele obținute
sunt prezentate în tabelul de mai jos:
Coeffi cientsa
Unstandardized St andardiz ed
Coeffic ient s Coeffic ient s
Model B St d. Error Beta t Sig.
1 (Cons tant) -1773, 944 1865,129 -,951 ,342
Educational Level (years) 821,842 135,194 ,269 6,079 ,000
a. Dependent Variable: abs
5
Formularea ipotezelor intermediare:
- (parametrul nu este semnificativ, adică între erori şi
variabila independentă nu există o legătură liniară semnificativă sau
variabila independentă nu explică semnificativ liniar variabila reziduală)
- (parametrul este semnificativ, adică între erori şi variabila
independentă există o legătură liniară semnificativă sau variabila
independentă explică semnificativ liniar variabila reziduală)
6
- dacă se acceptă ipoteza , parametrul nu este semnificativ sau nu diferă
semnificativ de zero, ceea ce înseamnă că varianţa sau dispersia erorilor este constantă,
adică se îndeplineşte ipoteza de homoscedasticitate a erorilor.
- dacă se respinge ipoteza , parametrul este semnificativ, ceea ce înseamnă că
varianţa sau dispersia erorilor nu este constantă, adică nu se îndeplineşte ipoteza de
homoscedasticitate a erorilor; erorile sunt heteroscedastice.
Observaţie: Tabelul pe baza căruia se poate calcula testul sau se poate lua decizia cu
privire la această ipoteză este: Coefficients.
7
(4) Luarea deciziei:
- dacă se acceptă ipoteza , varianţa sau dispersia erorilor este constantă, adică se
îndeplineşte ipoteza de homoscedasticitate a erorilor.
- dacă se respinge ipoteza , nu se îndeplineşte ipoteza de homoscedasticitate a
erorilor; erorile sunt heteroscedastice.
Aplicaţie:
În vederea verificării ipotezei de homoscedasticitate a erorilor, pentru un esantion de
volum egal cu 30, se aplică testul Breusch-Pagan-Godfrey, iar rezultatele obținute sunt prezentate
în tabelul de mai jos:
8
3. Ipoteza de normalitate a erorilor:
Definirea ipotezei
Erorile urmează o lege normală de medie 0 şi varianţă :
Testarea ipotezei
3.1. Procedee grafice: histograma (curba frecvenţelor); Box-Plot; Q-Q Plot; P-P Plot.
Aplicaţie:
Se studiază legătura dintre variabila dependentă, Salariul ($), şi variabila independentă,
Nivelul de educaţie (ani), înregistrate pentru un eşantion de 474 de persoane. În vederea
9
verificării ipotezei de normalitate a erorilor, se aplică testul Kolmogorov-Smirnov, iar rezultatele
obținute sunt prezentate în tabelul de mai jos:
One-Sample Kolmogorov-Smirnov Test
Unstandardized
Residual
N 474
Normal Parameters a,b Mean ,0000000
Std. Deviation 12819,96639730
Most Extreme Absolute ,110
Differences Positive ,110
Negative -,069
Kolmogorov-Smirnov Z 2,400
As ymp. Sig. (2-tailed) ,000
a. Test distribution is Normal.
b. Calculated from data.
10
Cu o probabilitatea de 95%, se poate garanta că erorile nu urmează o lege de repartiţie
normală sau erorile nu sunt normal distribuite sau distribuţia erorilor diferă semnificativ
de distribuţia normală. Cu altecuvinte, ipoteza de normalitate a erorilor ( )nu
este îndeplinită.
Observaţie: Tabelul pe baza căruia se poate lua decizia cu privire la această ipoteză este: One
Sample Kolmogorov-Smirnov Test.
Aplicaţie:
Se studiază legătura dintre variabila dependentă, Salariul ($), şi variabila independentă,
Nivelul de educaţie (ani), înregistrate pentru un eşantion de 474 de persoane. În vederea
verificării ipotezei de normalitate a erorilor, se aplică testul Jarque-Bera, iar rezultatele obținute
sunt prezentate în tabelul de mai jos:
Descriptive Statistics
11
(4) Citirea valorii teoretice a statisticii test:
Observaţie: Tabelele pe baza cărora se poate calcula testul sunt: tabelul Descriptive
Statistics în care apar indicatorii Skewness şi Kurtosis.
12
4. Ipoteza de necorelare sau de independenţă a erorilor:
În condiţiile încălcării ipotezei, se poate considera că între erori există o relaţie de forma:
unde reprezintă o variabilă pur aleatoare care respectă ipotezele modelului
clasic de regresie.
13
Testarea ipotezei
14
- dacă , se respinge ipoteza nulă , erorile înregistrează
autocorelare pozitivă;
- dacă , se respinge ipoteza nulă ,erorile înregistrează
autocorelare negativă;
- şi sunt regiuni de
nedeterminare, nu se poate decide asupra existenţei autocorelării erorilor;
- dacă , se acceptă ipoteza nulă , erorile nu sunt
autocorelate sau nu există autocorelare a erorilor.
Observaţie: Tabelul pe baza căruia se poate lua decizia cu privire la această ipoteză este:
Model Summary – coloana Durbin-Watson.
Sinteză:
DW d
d 0, 4
Valorile teoretice ale statisticii Durbin Watson sunt calculate şi tabelate în funcţie de:
- pragul de semnificaţie (α)
15
- volumul eşantionului (n)
- numărul de parametri ai modelului (k)
Aplicaţie:
Model Summaryb
16
- dacă atunci se acceptă ipoteza nulă
- dacă , atunci se respinge ipoteza nulă
Observaţie: Tabelul pe baza căruia se poate lua decizia cu privire la această ipoteză este:
Runs Test
Aplicaţie:
Runs Test
Unstandardiz
ed Res idual
Test V aluea -2502,56250
Cases < Test V alue 237
Cases >= Test Value 237
Total Cases 474
Number of Runs 219
Z -1, 747
As ymp. Sig. (2-tailed) ,081
a. Median
17
B. Ipoteze cu privire la variabilele independente (componenta deterministă)
a.2. multicoliniaritateimperfectă
- poate fi definită ca o relaţie liniară puternică existentă între două sau mai multe
variabile independente:
18
- varianţa estimatorilor parametrilor modelului este infinită, ceea ce înseamnă că
parametrii pentru aceste variabile un pot fi estimaţi.
c. Testarea ipotezei:
- interpretarea lui :
- dacă legăturile dintre variabilele independente sunt puternice, atunci se apropie
de 1, iar raportul este infinit;
- dacă între variabilele independente nu există corelaţie , valoarea
raportului este egală cu 1.
- în practică, o valoare indică prezenţa coliniarităţii.
- tabelul în care găsim valorile pentru : Coefficients - coloana VIF
19
c.4. Factorul tolerenţa (TOL)
- relaţia de calcul pentru
- interpretarea lui
- dacă , există coliniaritate perfectă;
- dacă , variabilele independente induc fenomenul de coliniaritate;
- dacă , variabilele independente nu sunt coliniare sau nu există
coliniaritate.
- tabelul în care găsim valorile pentru : Coefficients - coloana TOL
- interpretarea lui : arată cât la sută din variaţia variabilei independente este explicată
de variaţia simultană a celorlalte variabile independente.
Aplicaţie:
_________________________
TOL 0
VIF coliniarit ate _ perfecta
R 2 1
20
VIF 10
TOL 0.1Coliniarit ate _ imperfecta
R 2 0.9
VIF 1
TOL 1 Necoliniar itate
R 2 0
21