Sunteți pe pagina 1din 47

Academia de Studii Economice din Bucureti

Facultatea de Management

Influena Ratei omajului i a Ratei


Infracionalitilor asupra Ratei
Criminalitii

Problema A
nregistrai pentru 41 de uniti (judee), valorile specifice ale unei perechi
de caracteristici (X i Y) ntre care exist o legtur logic. Datele prezentate sub
forma tabelar fac parte din lucrare.
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou
variabile, conform teoriei economice);
Se nregistreaz un eantion de n=41 orae, cupluri de valori (xi, yi) cu privire la efectul
ratei de omaj asupra criminalitii, pentru anul 2005.
Tabelul 1. Rata de omaj i criminalitatea, nregistrate pe un eantion de
41 de orae alese din Statistica Teritorial 2013, pentru anul 2005.

NR.
CRT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

Jude
Bihor
Bistria
Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giugiu
Ialomia
Prahova
Teleorman
BucuretiIlfov
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara
Severin
Hunedoara
Timi

Rata
Criminalitii
(Y)

Rata omaj ( X
1)
575
5.9
281
278
367
251
250
282
232
236
407
214
215
362
434
332
330
360
421
364
286
245
341
325
389
183
410
314
138
321
209
251

4.3
4.4
4.5
3.4
6.1
8.3
8.7
8.8
8.5
4.6
6
6.3
6.2
7.2
5.6
6
10.1
6.8
7.4
5.6
8.3
6
4
5.2
9
7.4
5.6
12.1
6.3
8.9

241
309
404
488
402
289
264

2.4
6.3
9.3
9.5
7.1
6.4
3.4

243
376
212

7.9
9.4
2.3

Din teoria i
practica
legtur
statistic
exprimat
printr-un model de
regresie simpl liniar.
Regresia liniar
simpl este un caz
particular al analizei de
regresie, deoarece ntrun astfel de model
variabila dependent ar
fi explicat numai de o
singur
variabil
independent.
Se nelege c, n
exemplul dat, rata
criminalitii
nu
depinde numai de rata
omajului, ci i de un
ansamblu
de
alte
variabile pe care le
exprimm sintetic printro variabil numit eroare
sau reziduu.

Definitie: Rata somajului masoara procentul muncitorilor someri n raport cu forta totala
de munca. Rata somajului este considerata unul dintre cei mai importanti indicatori ai
conditiilor macroeconomice dintr-o tara. Rata criminalitii reprezint numarul persoanelor
condamnate definitiv la
100000 locuitori.

Pentru a determina n ce msur variabila independenta contribuie la modificarea


variabilei dependente vom elabora un model de regresie liniar simpl, vom determina dac
acesta poate fi considerat valid, adic dac exist, sau nu, o legtur liniar ntre rata omajului i
rata criminalitii, iar dac acesta va fi valid, vom realiza o previziune a ratei criminalitatii pentru
o alta perioada, caracterizata de anumite valori ale ratei somajului.

2.

Definirea modelului de regresie simpl liniar


2.1- Forma, variabilele i parametrii modelului de regresie
Forma modelului de regresie liniar simpl este:
Y 0 1 X sau Y = a+ b X +

y= 221,143 + 13,864*X +

n modelul de regresie de mai sus, a-ul este coeficientul termenului liber; nu are
semnificaie din punct de vedere economic, reprezentnd valoarea Rata criminalit ii, n
cazul n care rata omaj este 0. Adic dac rata omaj este 0, Rata criminalitii crete cu
221,143.
b= 13,864 reprezint coeficientul de regresie sau panta dreptei de regresie. Daca valoarea
lui b este mai mare dect 0 rezulta ca legtura dintre cele doua variabile este directa. Totodat
daca va crete Rata criminalitii cu o unitate, rat omaj va creste cu 13,864.
Variabilele modelului, pentru exemplul considerat, sunt:
- variabila dependent (rezultativ):
Y rata criminalitii;
- variabila independent (factorial, predictor):
X rata omajului (%)
- variabila eroare (reziduu):

- variabila aleatoare, variabila care nsumeaz influena altor variabile asupra ratei,
dar care nu sunt specificate expres n model. Variabila exprim abaterile ntre valorile
observate i valorile estimate prin model.

Parametrii modelului de regresie simpl liniar, numii i coeficieni de regresie,


sunt:
0 - ordonata la origine - arat valoarea medie a variabilei Y cnd X 0 ;
1 - panta dreptei - arat variaia medie a variabilei dependente, Y, la o variaie absolut

cu o unitate a variabilei X, adic variaia variabilei Y este proporional cu variaia variabilei X:


1

dy
.
dx

Proprieti ale modelului de regresie liniar:


-

simplitate

capacitatea de aplicare direct pentru verificarea existenei unei relaii ntre


variabile

estimarea direct a parametrilor prin metoda celor mai mici ptrate.

2.2- Reprezentarea grafic a modelului legturii dintre variabile

In baza acestei reprezentri grafice se poate vedea clar o legatura liniar


direct ntre cele doua variabile astfel modelul devine un model unifactorial
liniar.

3.

Estimarea parametrilor modelului i interpretarea acestora


3.1 Estimarea punctual a parametrilor

Estimarea punctuala a parametrilor se va face plecnd de la ecuaia y i=a+bxi cu


ajutorul metodei celor mai mici ptrate.
M.C.M.M.P. const n a minimiza funcia

41

41

i 1

i 1

2
F a , b min y i y i min y i a bxi

Condiia de minim a acestei funcii rezult din:


F a 0 na b x i y i

F b 0 a x i b x i2 y i x i

y
y x
x
x
i

i
2
i

41
12831
271,5 97579,5

13,864080
41
271,5
271,5 1986,35

Estimarea parametrului a:
1
xi
na b x i y i * a b
n
n

x 271,5 6,62
41

a y bx

a 312,95 13,864080 * 6,62 221,14


yi 12831 312,95
y

n 41
3.2- Estimarea parametrilor prin interval de ncredere
a a Z critic s a a 221,14 1,96 42,88 134,403; 307,884

b b Z critic sb b 13,86 1,96 6,16 1,402; 26,236

Intervalele nu includ valoarea nula, deci parametrii sunt semnificativi statistic.


In Excel datele obinute sunt prezentate astfel:

4.

Testarea semnificaiei corelaiei i a parametrilor modelului de regresie


n urma folosirii programului EXCEL s-au obinut urmtoarele rezultate:

Ecuaie econometrica
n

y
i 1
n

R y,x

y
i 1

y
y

1
2

y
i 1
n

y
i 1

y y
n

2
x
2
0

2
u
2
0

V
V
R
1

V
V
2

i 1
n

Rc2 1
2

nk
1 R 2
n 1

y y
i 1

y i

su

2
u

n2

y
i 1

y i

n2

Intensitatea legturii dintre cele dou variabile se determin cu ajutorul coeficientului


de corelaie liniar (Multiple R):
Intensitatea dintre cele 2 variabile se msoar cu ajutorul a 3 indicatori:
Coeficientul de corelaie liniara
Raportul de corelaie
Coeficientul de determinare

10

Coeficientul de corelaie liniara:

Daca valoarea coeficientului de corelaie liniara este mai mare dect 0 rezult c
legtura dinte cele 2 variabile este una strns.
Raportul de corelaie:
Se regsete in Excel sub forma de Multiple R. n cazul de fa, pentru un model
liniar, coeficientul de corelaie este egal cu raportul de corelaie, respectiv 0.338995748
Coeficientul de determinare:
Este prezentat n Excel sub denumirea de R Square i exprim proporia n care
variabila x influeneaz variabila y. n cazul de fa rata omajului influeneaz n proporie de
11% rata criminalitii, restul de 89% reprezentnd influena altor factori.
Testarea semnificaiei raportului de corelaie se face cu ajutorul testului Fisher-Snedecor:
Fc n 2
Fc 39 *

R2
, R fiind semnificativ dac Fc F ;v1 ;v2
1 R2

0,11
39 * 0,123 4,797 F0.05;1;8
1 0,11

11

4.2- Testarea parametrilor unui model de regresie simplu


Testarea parametrului a:
H0: a=0 (a nu este semnificativ statistic)
H1: a0 (a este semnificat statistic)
Z critic= 1,96
Z calculat=
Z calculat > Z critic, => acceptam ipoteza H1 conform creia a este semnificativ din
punct de vedere statistic
Testarea parametrului b:
H0: b=0 (b nu este semnificativ statistic)
H1: b0 (b este semnificativ statistic)
Z critic= 1,96
Z calculat=

= 2,25

Z calculat > Z critic => acceptam ipoteza H1 conform creia b este semnificativ din punct de
vedere statistic.

5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de


regresie simplu i interpretarea rezultatelor
Verificarea verosimilitii modelului se face cu ajutorul analizei dispersionale (analiza
variaiei).

12

Sursa Variatiei

Grade de libertate

Datorata
regresiei
Datorata erorii

K=1

Suma Patratelor
SS
y/x

n-k-1

Totala

n-1

Dispersiile
corectate MS
Sy/x
36230.22
Se
7154,86

1) se stabilete ipoteza nul: H0: mprtierea valorilor y t datorate factorului nu difer


semnificativ de mprtierea acelorai valori datorate ntmplrii, deci modelul nu
este valid.
2) se stabilete ipoteza alternativ: H1: modelul este valid;
3) se calculeaz testul F: ( daca Signifiance F este mai mic de 0,05 atunci modelul este
valid, liniar)
s 2y x 36230.22
Fc 2
5,06
su
7154,86
s 2y

s
2
u

Ftab

y i

36230,22
36230,22
1

279039,7
7154,8641
n k 1
39
F ; v1 ;v 2 F ; k ; n k 1 F0, 05;1;39 4
i

Deoarece Fcalc = 5,06 > Ftab = 4 modelul este valid, se accepta ipoteza H1, se
respinge H0.

13

6.

Testarea ipotezelor clasice asupra modelului de regresie simpl

Estimarea prin metoda celor mai mici ptrate a parametrilor modelului de regresie are
sens numai dac sunt respectate anumite ipoteze.

6.1. Ipoteze statistice clasice asupra modelului de regresie simpl


Ipotezele statistice clasice asupra modelului de regresie sunt:
- Liniaritatea modelului. Relaia ntre Y i X este liniar. Aceast ipotez este necesar
pentru estimarea parametrilor modelului;
- Normalitatea erorilor. Variabila

este distribuit normal:

N (0, 2 ) ;

- Homoscedasticitatea. Varianele V( ) sunt constante, oricare ar fi valorile variabilei


X, adic, V ( ) 2 ;
-

Necorelarea erorilor. Erorile sunt necorelate ntre ele: cov( i , j ) 0 ;


Independena erorilor de valorile variabilei X. Valorile variabilei sunt
independente de valorile variabilei explicative X, adic cov( , x) 0 .
nclcarea ipotezelor poate afecta calitatea estimatorilor.

6.2. Testarea liniaritii modelului propus


Liniaritatea relaiei dintre variabila dependent i variabila independent este important
att pentru acurateea predictiv a modelului ct i pentru validitatea coeficienilor estimai.
Verificarea liniaritii se poate efectua grafic, folosind: scatterplots; diagrama
reziduurilor din regresie.

Diagrama reziduurilor din regresie


Diagrama reziduurilor din regresie se construiete lund pe ordonat variabila reziduu i
pe abscis variabila dependent . Dac reziduurile apar dispersate aleator, de o parte i de alta a
valorii zero , atunci relaia poate fi modelat cu ajutorul regresiei liniare.
Dac reziduurile apar dispersate n blocuri deasupra sau sub valoarea zero, atunci relaia
dintre variabilele considerate nu poate fi modelat cu ajutorul regresiei liniare.

14

15

Testarea ipotezei de autocorelare a erorilor


Verificarea ipotezei de independen a erorilor n cazul acestui model va fi realizat cu
ajutorul testului Durbin-Watson i const n calcularea termenului empiric:

u
i2

u i 1

u
i 1

2
i

452314,3
1,620
279039,7

Acceptarea sau respingerea ipotezei de independen


a erorilor se bazeaz pe o anumit regul, care const n:
- dac 0 d d 1 autocorelare pozitiv;
d 1 d d 2 indecizie, recomandndu-se
- dac
acceptarea autocorelrii pozitive;
16

- dac d 2 d 4 d 2 erorile sunt independente;


-dac 4 d 2 d 4 d 1 indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 d 1 d 4 autocorelare negativ.
Dac d11,45 d1,55 d 2 1,55 se accept autocorelarea
pozitiv

6.3Testarea normalitatii erorilor

Se tie c, dac erorile urmeaz legea normal de medie zero i de abatere medie
ptratic su (consecina ipotezelor c1, c2, c3), atunci are loc relaia:
P u i t su 1 .

Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului JarqueBerra, care este i el un test asimptotic (valabil n cazul unui eantion de volum mare), ce
urmeaz o distribuie hi ptrat cu un numr al gradelor de libertate egal cu 2, avnd
urmtoarea form:
0,15
S 2 K 3 2
2,75 3 2 0,91
2

~ ; 2 = 41
24
24
6
6

JB n

unde: n = numrul de observaii;


17

S= coeficientul de asimetrie (skewness), ce msoar simetria distribuiei erorilor


n jurul mediei acestora, care este egal cu zero, avnd urmtoarea relaie de
calcul:

1 n
yi y
n i 1
S
3

0,15

K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce msoar boltirea


distribuiei (ct de ascuit sau de aplatizat este distribuia comparativ cu
distribuia normal), avnd urmtoarea relaie de calcul:

1 n
yi y
n i 1
K
4

= 2,75

Utiliznd pachetul de programe EViews n vederea calculrii testului Jarque-Berra, se


constat c JB= 0,91, 0,05; 2 5,99 i c p(JB) = 0,87. Deoarece valoarea calculat a testului
2

JB este mai mica dect valoarea tabelat a lui ; 2 , iar testul JB a depit valoarea tabelat,
ipoteza de normalitate a erorilor se accept.

6.4 Testarea ipotezei de homoscedasticitate


Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii
parametrilor, respectiv:
H0: 0 1 2 0
Ipoteza de homoscedasticitate presupune faptul c variabila rezidual este de medie nul,
iar dispersia ei este constant i independept de x. Pe baza acestei afirmaii putem admite
faptul c legtura dintre y i x este relative stabil. Verificarea se face cu ajutorul testului
White.
Aplicarea testului White:

<=>

Mai departe de face verificarea semnificaiei parametrilor de regresie nou construit, iar
daca unul dintre acetia este nesemnificativ statistic, atunci ipoteza de heterodasticitate a

18

erorilor este acceptat. Aplicarea testului White se va face utiliznd testul Fisher-Snedecor
bazat pe ipoteza nulitii parametrilor.
H0:
H1:
Conform datelor obinute mai sus se accepta ipoteza H1, conform creia parametrii
modelului sunt semnificativi statistic.
F calculat=
F critic = 4
Datorit faptului c F calculate este mai mare dect F critic, se accept
heterodasticitatea modelului.
Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative (
Fc F ;k ;n k 1 ), este acceptat, atunci ipoteza de homoscedasticitate se verific.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare
modelului, n, i coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n
2

general, testul LM este asimptotic distribuit sub forma unui ;v , pentru care numrul
gradelor de libertate este egal cu: v k , unde k = numrul variabilelor exogene, respectiv:
2

LM n R 2 ~ ;k

Dac

LM

;k

, erorile sunt heteroscedastice, n caz contrar, sunt homoscedastice,

respectiv ipoteza nulitii parametrilor, 0 1 2 0 , este acceptat.

Aplicarea testului White s-a realizat utiliznd pachetul de programe EViews:

19

Analiznd

rezultatele

Fc 0,015 Fcritic 4

afiate

de

LM 0,033

programul
2
0 , 05; 2

5,99 ,

EViews
iar

se

estimatorii

constat

parametrilor

modelului sunt nesemnificativi pentru un prag de semnificaie 0,05 ( t 0, 05;10 1,96 ),


deci ipoteza de heteroscedasticitate se verific.

Concluzii :
Modelul de regresie liniar are un coeficient de determinare

= 0.1149, adic rata

criminalitii este explicata n msur de aproape 11% de ctre variabila independent inclus
n model.Valoarea testului F este suficient de mare pentru a determina validitatea global a
modelului pentru un prag de semnificaie de cel puin Significance F = 0.03014, cu mult
mai mic dect ales.

7.
Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de
ultima valoare nregistrat (inclusiv interval de ncredere) pentru toate
variantele cunoscute.
20

y i 221,14 13,86 xi

2,3( este ultima nregistrare n campul x1) * 1.1 (110%) = 2,53


y 0 x 0
0 = 221,14 + 13,862,53 = 256,185
y

Rezult astfel ca y 41 este mai mic dect ultima valoare nregistrat y 42, rezultnd
la o cretere cu 10% a lui x i o creste cu 10% a lui y (rata criminalitii).

1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre


cele dou variabile, conform teoriei economice);
Se nregistreaz un eantion de n=41 orae, cupluri de valori (xi, yi) cu privire
la efectul ratei infracionalitii asupra criminalitii, pentru anul 2005.

Tabelul 1. Rata infracionalitii i criminalitatea, nregistrate pe un eantion


de 41 de orae alese din Statistica Teritorial 2013, pentru anul 2005.
NR.
CRT
1
2
3
4
5
6
7
8
9
10
11

Jude
Bihor
Bistria
Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure

Rata
Criminalit Rata infracionaliti
ii ( Y )
(X2)
575
734
281
278
367
251
250
282
232
236
407
214

1011
945
851
1216
975
1167
915
1234
1356
976

21

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giugiu
Ialomia
Prahova
Teleorman
BucuretiIlfov
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara
Severin
Hunedoara
Timi

215
362
434
332
330
360
421
364
286
245
341
325
389
183
410
314
138
321
209
251

795
901
1177
839
1413
1152
1017
759
931
1028
1028
1061
1121
678
1248
1223
789
1059
761
812

241
309
404
488
402
289
264

922
876
1263
906
1012
542
933

243
376
212

914
1534
727

Definitie: Rata infracionalitii masoara procentul infraciunilor la 100000 de locuitori.


Rata infraionalitii este considerata unul dintre cei mai importanti indicatori ai conditiilor
macroeconomice i sociale dintr-o tara.
Rata criminalitii reprezint numarul persoanelor condamnate definitiv la 100000 locuitori.

2.

Definirea modelului de regresie simpl liniar


2.1- Forma, variabilele i parametrii modelului de regresie

22

Forma modelului de regresie liniar simpl este:


Y = a+ b X +

y= 192,45 + 0,121*X +
n modelul de regresie de mai sus, a-ul este coeficientul termenului liber; nu are
semnificaie din punct de vedere economic, reprezentnd valoarea Rata criminalit ii, n
cazul n care populaia din mediul urban este 0. Adic dac rata infracionalitatea din mediul
urban este 0, Rata criminalitii crete cu 192,45.
b= 0,121 reprezint coeficientul de regresie sau panta dreptei de regresie. Daca valoarea
lui b este mai mare dect 0 rezulta ca legtura dintre cele doua variabile este directa. Totodat
daca va crete Rata infracionalitate cu o unitate, Rata criminalitii va creste cu 0,121.

2.2- Reprezentarea grafic a modelului legturii dintre variabile

In baza acestei reprezentri grafice se poate vedea clar o legatura liniar direct ntre
cele doua variabile astfel modelul devine un model unifactorial liniar.

3.
Estimarea parametrilor modelului i interpretarea
acestora

23

3.1 Estimarea punctual a parametrilor


Estimarea punctuala a parametrilor se va face plecnd de la ecuaia y i=a+bxi cu
ajutorul metodei celor mai mici ptrate.
M.C.M.M.P. const n a minimiza funcia

41

41

i 1

i 1

2
F a , b min y i y i min y i a bxi

Condiia de minim a acestei funcii rezult din:


F a 0 na b x i y i

F b 0 a x i b x i2 y i x i

y
y x
x
x
i

i
2
i

41
12831
40801 12984460

192,45
41
40801
40801 42384703

Estimarea parametrului a:
1
xi
na b x i y i * a b
n
n

y
n

a y bx

x 40801 995,14
i

41

a 312,95 0,12108256 * 995,14 192,456

yi 12831 312,95
y

n 41

3.2- Estimarea parametrilor prin interval de ncredere


a a Z critic s a a 192,45 1,96 65,58 59,79; 325,11

b b Z critic sb b 0,12 1,96 0,06 - 0,009; 0,25

Intervalele includ valoarea nula, deci parametrii nu sunt semnificativi statistic.

24

In Excel datele obinute sunt prezentate astfel:

Tabel 2

25

26

4.
Testarea semnificaiei corelaiei i a parametrilor
modelului de regresie

n urma folosirii programului EXCEL s-au obinut urmtoarele


rezultate

Coeficientul de corelaie liniara:

27

Daca valoarea coeficientului de corelaie liniara este mai mare dect 0 rezult c
legtura dinte cele 2 variabile este una strns.
Raportul de corelaie:
Se regsete in Excel sub forma de Multiple R. n cazul de fa, pentru un model
liniar, coeficientul de corelaie este egal cu raportul de corelaie, respectiv 0.28
Coeficientul de determinare:
Este prezentat n Excel sub denumirea de R Square i exprim proporia n care
variabila x influeneaz variabila y. n cazul de fa rata infracionalitii influeneaz n
proporie de 8% rata criminalitii, restul de 92% reprezentnd influena altor factori.
Testarea semnificaiei raportului de corelaie se face cu ajutorul testului Fisher-Snedecor:
Fc n 2
Fc 39 *

R2
, R fiind semnificativ dac Fc F ; v1 ; v2
1 R2

0,8
39 * 4 F0.05;1;8 156
1 0,8

4.2- Testarea parametrilor unui model de regresie simplu


Testarea parametrului a:
H0: a=0 (a nu este semnificativ statistic)
H1: a0 (a este semnificat statistic)
Z critic= 1,96
Z calculat=
Z calculat > Z critic, => acceptam ipoteza H1 conform creia a este semnificativ din
punct de vedere statistic
Testarea parametrului b:
H0: b=0 (b nu este semnificativ statistic)
H1: b0 (b este semnificativ statistic)
Z critic= 1,96
Z calculat=

28

Z calculat > Z critic => acceptam ipoteza H1 conform creia b este semnificativ din punct de
vedere statistic.

5.
Aplicarea analizei de tip ANOVA pentru
validitatea modelului de regresie simplu i
interpretarea rezultatelor

Verificarea verosimilitii modelului se face cu ajutorul analizei dispersionale (analiza


variaiei).

Sursa
Variatiei

Grade de
libertate

Suma
Dispersiile
Patratelor SS corectate MS

Datorata
regresiei
Datorata
erorii
Totala

K=1

y/x

n-k-1

n-1

Sy/x
26188.023
Se
7414.048

2) se stabilete ipoteza nul: H0: mprtierea valorilor y t datorate factorului nu difer


semnificativ de mprtierea acelorai valori datorate ntmplrii, deci modelul nu
este valid.

2) se stabilete ipoteza alternativ: H1: modelul este valid;

3) se calculeaz testul F: ( daca Signifiance F este mai mic de 0,05 atunci modelul
este valid, liniar)

29

Fc

s y2 x
s

s 2y x

su2

2
u

26188,02
3,53
7414,04

y i

n k 1

220332867
220332867
1

221631898.9
5682869.203
39

Ftab F ; v1 ;v 2 F ; k ; n k 1 F0, 05;1;39 4

Deoarece Fcalc = 3.53 < Ftab = 4 modelul nu este valid, se respinge ipoteza H1,
se accepta H0.

6.
Testarea ipotezelor clasice asupra modelului de
regresie simpl

Estimarea prin metoda celor mai mici ptrate a parametrilor modelului de


regresie are sens numai dac sunt respectate anumite ipoteze.
Diagrama reziduurilor din regresie
Diagrama reziduurilor din regresie se construiete lund pe ordonat
variabila reziduu i pe abscis variabila dependent . Dac reziduurile apar
dispersate aleator, de o parte i de alta a valorii zero atunci relaia poate fi
modelat cu ajutorul regresiei liniare.
Dac reziduurile apar dispersate n blocuri deasupra sau sub valoarea zero,
atunci relaia dintre variabilele considerate nu poate fi modelat cu ajutorul
regresiei liniare.

30

Testarea ipotezei de autocorelare a erorilor

Verificarea ipotezei de independen a erorilor n cazul acestui model va fi


realizat cu ajutorul testului Durbin-Watson i const n calcularea termenului
empiric:

31

u
i2

2
ui 1

u
i 1

2
i

494834
1,71
289147,9

Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o


anumit regul, care const n:
- dac 0 d d 1 autocorelare pozitiv;
- dac d 1 d d 2 indecizie, recomandndu-se acceptarea autocorelrii
pozitive;
- dac d 2 d 4 d 2 erorile sunt independente;
-dac 4 d 2 d 4 d 1 indecizie, recomandndu-se acceptarea
autocorelrii negative;
- dac 4 d 1 d 4 autocorelare negativ.

32

33

34

6.3Testarea
normalitatii
erorilor

Skewness
(S)=coeficient
asimetrie
Kurtosis
(K)=coeficient
aplatizare

de
de

Testul JB pe bazeaz pe ipoteza c S=0, n cazul nostru 0,164 este apropiat de aceast
valoare, iar K=3.
Probabilitatea Jarque-Bera(p(JB))>0,05=> se accept ipoteza de normalitate a erorilor.

Testarea ipotezei de homoscedasticitate

35

Problema B
1. Definirea modelului de regresie multipl liniar
Acest proiect are scopul de a prezenta influenta ratei omajului i
a ratei infracionaltii asupra ratei criminaltii prin intermediul
modelului de regresie liniara multipla.
In cadrul proiectului voi folosi 41 de observatii , in anul 2005.
Datele au fost preluate din baza de date Statisctic Teritorial.

36

37

2.1- Forma, variabilele, parametrii modelului de regresie multipl


Din cele prezentate mai sus se observa faptul ca relatia dintre cele doua fenomene este una de
cauzalitate. Fenomenele cauza sau variabilele exogene (independente) sunt reprezentate de
rata omaj respectiv rata infracionalitii, iar fenomenul efect sau variabila endogena
(dependenta) este reprezentata de Rata Criminalitii.
Conform datelor din Tabelul nr. 1 putem construi un model econometric multifactorial de
forma unei functii Yt=0+1*X1t+2*X2t+t unde Yt reprezinta valorile variabilei
dependente Rata criminalitii si unde X1t;X2t reprezinta valorile variabilelor independente
rata omaj repectiv rata infracionalitii.
Ecuatia functiei de regresie ia forma:
y = + 0*x0 +1*x1 +i , adica Rata criminalitii = + 0*rata omaj +1*rata
infracionalitii +i

2.2 -Reprezentarea grafic a modelului legturii dintre variabile

Reprezentand grafic perechile observate (x1,x2),se constata ca intre variabile exista o legatura
constanta si liniara.
38

2.Estimarea parametrilor modelului i interpretarea acestora


Cu ajutorul programului Excel:

Ceea ce nseamn c:
=151,7164 arat c, dac cele dou variabile explicative, X1 i X2 au valoarea
0,valoarea medie Ratei criminalitii este estimat la circa 152 persoane.
1=11,37 arata, meninnd celelalte variabile constante, atunci cnd Rata
Criminalitii crete cu 1u.m., rata omajului crete, n medie, cu 11,37 %.
2=0,086 arata ca, meninnd celelalte variabile constante, rata infracionalitii
a crescut, n medie, cu aproximativ 0,086 persoane.
este numit parametru de interceptare,iar 1 si 2 coeficienti de regresie partiali.
Se msoar intensitatea legturii dintre variabile folosind indicatorul adecvat, testnd
semnificaia acestora pentru un nivel de semnificaie 0,05. Din tabelul generat de MS Excel
avem Multiple R (Raportul de corelaie):0,39 ceea ce nseamn c legtura dintre Rata
criminalitii,omaj i infracionalitate este una puternic.

39

Testarea semnificaiei raportului de corelaie:


Ipoteza nul (raportul de corelaie al colectivitii din care s-a extras eantionul de 41
uniti, nu difer semnificativ de zero, deci nu este semnificativ statistic);
Ipoteza alternativ ( raportul de corelaie al colectivitii din care s-a extras eantionul de
41 uniti, difer semnificativ de zero, deci este semnificativ statistic);
Testarea raportului de corelaie se face cu testul F:
Fcalc

R2
n k 1
0,15 2
39

0,80
2
2
k
1
1 R
1 0,15

Deoarece Fcalc 0,80 Fcritic 4 R nu este semnificativ diferit de zero, pentru un


prag de semnificaie =0,05.

Regresia multipl cu ajutorul programului Eviews:

Unde ser02: rata somaj si ser03: rata infractionalitate

40

Conform Figurii se observa faptul ca modelul nu este semnificativ diferit de 0, acest


lucru putand fi observat in urma estimarii, unde probabilitatea nu tinde catre 0 (Prob.
(C)<0.05; Prob.(rs)>0.05; Prob.(ri)>0.05).

Aplicarea analizei de tip ANOVA pentru validitatea modelului de


interpretarea rezultatelor

regresie multipl i

S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.

ANOVA
Regression
(variaia
datorat
regresiei)
Residual
(variaia
rezidual)
Total
(variaia
total)

Df
(grade de
libertate)

df 1 k
2

df1 n k 1
38

SS (variana)
(suma ptratelor)

2y / x

48345,49
2e

266924,40

df 1 df 1 df 2 2
y y/ x e
df 1 n 1
40

MS
(media patratelor)
(dispersia corectat)

2
y/x

F(calculat
)

Significance F

2y / x
k

24172,74
2e
se2
n k 1
7024,32

Testul
2
F= s y / x /

2
e

3,44

Este
0,04
< 0,05
(se respinge H0

Modelul este
valid)

315269,90

H0: modelul nu este valid statistic (mprtierea valorilor y t datorate factorului timp
nu difer semnificativ de mprtierea acelorai valori
datorate ntmplrii)
H1: modelul este valid statistic
41

tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se


stabilete:
valoarea critic: Ftabelar F ; k ; n k 1 F ; 2;n 2 1 F0, 05; 2; 38 4

regiunea de respingere: dac Fc F ; k ; n k 1 , atunci H0 se respinge


Determinarea

statisticii

s 2y / x
s

2
e

testului

Fcalculat

are

la

baz

relaia:

24172,74
3,44
7024.30

Deoarece Fcalculat (3,44) < F ; k ; n k 1 (4) H 1 se respinge, deci H 0 este adevrat,


prin urmare, modelul este invalid.

Testarea ipotezelor clasice asupra modelului de regresie multipl


Ipoteza de normalitate a erorilor

Din figura de mai sus observam ca este incalcata ipoteza de normalitate (JarqueBerra=17,615450), iar probabilitatea este egala cu 0.000150. Daca probabilitatea p(JB)

42

corespunzatoare valorii calculate a testului este suficient de scazuta atunci ipoteza de


normalitate a erorilor este respinsa.

Testarea ipotezei de homoscedasticitate

Conform graficului reziduurilor, ochiometric se pare ca ipoteza de


homoscedasticitate nu este incalcata intrucat graficul se incadreaza intr-o banda paralela
cu abscisa. Pentru a verifica acest lucru vom folosi testul White din programul E-views.

43

Conform Figurii se observa faptul ca estimatorii parametrilor modelului nu sunt


semnificativi diferiti de 0 fapt pentru care este acceptata ipoteza de homoscedasticitate, tinand
cont de faptul ca testul verifica heteroscedasticitatea (White heteroskedasticity test).

Testarea ipotezei de autocorelare a erorilor

Acceptarea
sau
respingerea
ipotezei
de
independen a erorilor se
bazeaz pe o anumit regul,
care const n:
0 d d1
dac
autocorelare pozitiv;
d1 d d 2
dac
indecizie,
recomandndu-se
acceptarea
autocorelrii
pozitive;
-dac d 2 d 4 d 2
erorile sunt independente;
-dac 4 d 2 d 4 d 1 in
decizie,
recomandndu-se
acceptarea
autocorelrii
negative;
-dac 4 d 1 d 4
autocorelare negativ.

Dac d 2 1,55 d1,66 4 d 2 1,55 erorile sunt independente

44

7. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa


de ultima valoare nregistrat

y = 151,71 + 11,37 x1i + 0,086 x2i


x1(42) = 1,1 * 2,3 = 2,53
x2(42) = 1,1 *727= 799,7
y= b0 + b1 * x1 (42) + b2 x2 (42)
y=151,71+28,76+68,77=249,24

Rezult c y= 249,24 este mai mare dect ultima valoare nregistrat y 41


(151,71), astfel la o cretere cu 10% a lui x1(rata omajului) i x2(rata
infracionalitii) va crete i y(rata criminalitii) cu 10%.

45

Problema C
Folosind datele Problemei A, s se testeze dac dispersiile (variaiile) celor dou
populaii (variabila exogen i variabila endogen) sunt egale; testai dac mediile celor
dou populaii sunt egale. Rezolvarea problemei C de exemplificat n Excel, cu
interpretarea rezultatelor i parcurgerea etapelor testrii ipotezelor statistice.

Avem urmtoarele variaii:


- Mean mediile eantioanelor
- Variance- dispersii
- Observations-volum eantion
- Df- grad de libertate
- F-statistic test f
-

P( F <= f)one tail probabilitatea critic unilateral adic probabilitatea ca o


variabil f repartizat fisher snedecor, cu un numr respectiv de grade de libertate
s depeasc valoarea calculat.

Ipoteza nul a egalitii dispersiilor poate fi respins dac valoarea lui P one tail este mai
mica sau egal cu nivelul de semnificaie respectiv 0,se respinge impoteza nul, astfel dispersiile
nu sunt egale.
- F critic one tail e valoarea critica a testului si determin regiunea critic a testului.
Dac F e mai mare dect valoarea critic nseamn c aparine regiunii de respingere i deci
se poate respinge ipoteza egalitii dispersiilor.
F < f critic ( 0,00059 < 0,59 ) deci nu se poate respinge ipoteza nul

46

Se va putea lua in considerare att ipoteza conform care dispersiile sunt sau nu egale, deci
practic n populaia din care provin aceste eantioane, variabila urmarita prezinta, si nu prezinta,
aceleasi grade de mprtiere.

47