Sunteți pe pagina 1din 12

1.

Introducere
In acest proiect vom analiza prin metoda regresiei liniare simple, influenta
pe care variablia independenta, numarul elevilor inscrisi, o are asupra variabilei
dependente, numarul de licee.
Studiile efectuate pe perioadele anterioare arat existenta unei legaturi
directe si puternice, de aceea dorim sa analizam in ce masura acest lucru se
verifica la nivelul tarii noastre, in anul 2015 (aceasta fiind ultimul an disponibil pe
site-ul insse cu informatii despre NUMARUL ELEVILOR INSCRISI pe judetele din
Romania).
In vederea realizarii prezentului proiect am utilizat aplicatia Excel din
Microsoft Office si formularea concluziilor care se pot determina pe baza
outputului din Excel. Pentru analiza modelului de regresie simpla, am folosit date
referitoare la numarul elevilor inscrisi si numarul de licee, prin extragerea unui
esantion de 30 judete din cele 42 ale Romaniei.
Pentru a determina in ce masura variabila independenta contribuie la modificarea variabilei
dependente vom elabora un model de regresie liniara simpla, vom determina daca acesta poate fi
considerat valid, adica daca exista, sau nu , o legatura liniara intre numarul elevilor inscrisi si numarul
de licee pe judetele din Romania in anul 2015.
Am sintetizat informatiile despre cele 30 de Judete, si cele 2 variabile
pentru anul 2015,in tabelul urmator:

Judetul

(X) NUMARUL
(Y) Numarul
ELEVILOR INSCRISI
de licee
Bihor
281090
76,2
Salaj
86517
78,3
Alba
195725
81,9
Brasov
393996
71,1
Covasna
98447
68,3
Harghita
131455
70,2
Sibiu
263297
76,4
Bacau
260483
58,7
Iasi
360761
56,4
Neamt
163717
70,6
Suceava
258233
62,4
Braila
191230
68,1
Buzau
167596
71,5
Constanta
466292
67,7
Galati
286268
60
Tulcea
96032
67,3
Vrancea
121000
72,1
Arges
275706
68,6
Calarasi
107723
55,2
Dambovita
145263
61,8
Giurgiu
80631
51,7
Dolj
335433
67,6
Gorj
149613
65,1
Mehedinti
118509
70,8
Olt
163416
66,1
Valcea
162142
77,5
Arad
235632
80,5
Caras-Severin
154021
66,9
Hunedoara
301092
74,1
Timis
424086
73,2
Tabel 1: Numarul elevilor inscrisi in licee si Numarul de licee pentru un esantion
de 30 judete ale Romaniei in anul 2015
Sursa: www.
insse.ro

Analiza grafica a modelului de regresie liniara simpla


Procedeul cel mai des folosit, in cazul unui model liniar simplu,il constituie reprezentarea
grafica a celor doua siruri de valori cu ajutorul corelogramei.
Corelograma care reprezinta legatura numarului elevilor inscrisi in licee si numarul de licee
este reprezentata in graficul de mai jos, in baza datelor din Tabelul 1.

CORELOGRAMA
80
70
60

f(x) = 0x + 3.06

50

Nr licee 40
30
20
10
0

5000

10000

15000

20000

25000

30000

Elevi inscrisi in invatamant liceal

Figura 1: Analiza grafica a existentei, sensului si formei legaturii dintre


numarul elevilor inscrisi si numarul de licee.
Analizand evolutia norului de puncta din grafic, concluzia este de legatura
directa intre cele doua variabile, ecuatia dreptei fiind cea care se
potriveste cel mai bine acestei legaturi.
Tot din grafic se poate trage o prima concluzie asupra intensitatii legaturii.
Dat fiind faptul ca punctele din graphic sunt sufficient de apropiate unele
de altele de-o parte si de alta a dreptei, putem afirma ca exista o legatura
stransa intre X si Y.

2. Modelul de regresie liniara simpla


Outputul in urma analizei datelor din Tabelul 1, in Excel , prin regresie si
corelatie, este:
SUMMARY OUTPUT
ANOVA
df
Regression
Residual
Total

SS
1
28
29

MS

4241,247
4241,247
89,38214
1328,62
47,45072
5569,867
Tabelul 2: Model Summary

Significa
nce F
3,27E-10

Regression Statistics
Multiple R
0,8726183
97
R Square
0,7614628
67
Adjusted R
0,7529436
Square
83
Standard Error 6,8884479
58
Observations
30
Tabelul 3: Procedeul Anova pentru regresie

Tabelul 4: Coeficientii de regresie


Coefficie
nts

Standar
d Error

t Stat

P-value

Upper
95%

0,414621

Lower
95%
4,5119
8

3,061776
709

3,697387

0,828092

0,002218
348

0,000235

9,454213

3,27E-10

0,0017
38

0,0026
99

Intercept
Numarul
elevilor
inscrisi

Tabelul 5: Coeficientul de corelare Pearson. Matricea corelatiilor


Elevi inscrisi
in
invatamantul
liceal
Elevi inscrisi in
invatamantul liceal
Nr licee

1
4
0,877727206

Nr licee
1

10,635
53

2.1.

Estimarea si testarea parametrilor modelului de regresie

Modelul clasic de regresie liniara


Modelul econometric atasat teoriei economice are forma Y=0+1X+, unde:
Y = variabila dependenta (numarul de licee)
X = variabila independenta (numarul elevilor inscrisi)

= actiunea celoralti factori care nu sunt luati in analia (variabila eroare de


modelare/reziduala)
Ecuatia estimata a modelului de regresie
Y = b0+b1X + e
Conform datelor din Tabelul 4, putem scrie ecuatia estimata a modelului de
regresie astfel:
y = 0,0022x + 3.061
Interpretarea estimatiilor punctuale ale parametrilor de regresie
b0 =3.061
,Pentru un POPULATIe URBANA de 0 numarul de licee este de 67,54%
b1 = 0.0022
La o crestere a NUMARUL ELEVILOR INSCRISI cu un elev , numarul de licee
creste, in medie cu 0,0022
Intervalele de incredere pentru parametrii modelului de regresie,
cu un risc de 5%

s
IC pt 1: [b1 t/2; n-2 *

] = [0,00222,048*0,0002] =

= [0,0001738; 0,0027]
t/2; n-2= t0,025; 28=2,048
Interpretare
5

Cu o incredere de 95% putem afirma ca parametrul 1 este acoperit de


intervalul

[0,0001738; 0,0027]

s
IC pt 0: [b0 t/2; n-2 *

] = [3,0612,048*3,697] = ,

= [-4,511 ; 10,653 ]
t/2; n-2= t0,025; 28=2,048
Interpretare
Cu o incredere de 95% putem afirma ca parametrul 0 este acoperit de
intervalul

= [-4,511 ; 10,653 ]

Testarea semnificatiei parametrului de regresie 0 considerand


un risc de 5%
Vom testa daca coeficientul de regresie 0 este semnificativ diferit de 0
(are o valoare semnificativa), adica daca numarul elevilor inscrisi are
influenta semnificativa asupra numarul de licee.
1. Formularea ipotezelor

H0: 0=0
H1: 00

2. Fixarea pragului de semnificatie

=0,05

3. Alegerea statisticii test


0

t= = t/2; n-2
4. Calcularea statisticii test
b0
3,061
tcalc = s = 3,697 = 0,828
5. Cristerii de decizie
|tcalc|tteoretic se accepta H0 cu o probabilitate de 1-
|tcalc|tteoretic se respinge H0 cu un risc asumat
6. Decizia si interpretarea

tteoretic= t/2; n-2=t0,025;28=2,048


|0,828|<2,048 se accepta H0 o probabilitate de 95%
Cu o probabilitate de 95%, putem afirma ca, coeficientul de regresie
0 nu
este considerat semnificativ diferit de 0, adica numarul
elevilor inscrisi nu are o influenta semnificativa asupra numarului de
licee.

Testarea semnificatiei parametrului de regresie 1 considerand


un risc de 5%
Vom testa daca coeficientul de regresie 1 este semnificativ diferit de 0
(are o valoare semnificativa), adica daca intre numarul elevilor inscrisi si
numarul de licee este o legatura de tip liniar.
1. Formularea ipotezelor

H0: 1=0
H1: 10

2. Fixarea pragului de semnificatie

=0,05

3. Alegerea statisticii test


1

t= = t/2; n-2
4. Calcularea statisticii test
b1
0,0022
tcalc = s = 0,000235 = 9,454
5. Cristerii de decizie
|tcalc|tteoretic se accepta H0 cu o probabilitate de 1-
|tcalc|tteoretic se respinge H0 cu un risc asumat
6. Decizia si interpretarea

tteoretic= t/2; n-2=t0,025;28=2,048


|9,454|>2,048 se respinge H0 cu un risv sumat de 95%
Cu o incredere de 95% putem afirma ca 1 este semnificativ diferit
de 0, adica intre numarul elevilor inscrisi si numarul de licee exista o
legatura de tip liniar

2.2.

Estimarea si testarea coeficientului de corelatie

Estimarea punctuala si interpretarea valorii coeficientului de


corelatie Pearson
Din Tabelul 4 reiese ca valoarea coeficientului de corelatie Pearson este:
r=0,877 Legatura dintre numarul elevilor inscrisi si numarul de licee
este pozitiva si si puternica.
Testarea semnificatiei coeficientului de corelatie Pearson
Vom testa daca coeficientul de corelatie este semnificativ diferit de
0 (are o valoare semnificativa), adica daca intre numarul elevilor inscrisi si
numarul de licee este o legatura semnificativa.
1. Formularea ipotezelor

H0: =0
H1: 0

2. Fixarea pragului de semnificatie

=0,05

3. Alegerea statisticii test

t calc

r n2


1 2
1 r2
n2

4. Calcularea statisticii test


0,877

r n2
2
1
tcalc = 1r2 =

0,877 302

= 9,454

5. Cristerii de decizie

|tcalc|tteoretic se accepta H0 cu o probabilitate de 1-


|tcalc|tteoretic se respinge H0 cu un risc asumat
8

6. Decizia si interpretarea

tteoretic= t/2; n-2=t0,025;28=2,048


|9,454|>2,048 se respinge H0 cu un risc sumat de 5%
Cu un risc asumat 5%, putem afirma ca , coeficientul de corelatie
Perason nu ste semnificativ diferit de 0, adica intre numarul elevilor
inscrisi si numarul de licee nu exista o legatura semnificativa.

2.3.
Estimarea si testarea raportului de corelatie si a
raportului de determinatie
Estimarea si interpretarea valorii raportului de corelatie

R=

ESS
TSS

4241.247
5569.867

= 0,872461

Intre numarul elevilor inscrisi si numarul de licee este o legatura


foarte puternica.
Estimarea si interpretarea valorii raportului de determinatie

R=
2

ESS
TSS

74242
5569,867

=0,761

[0,67% din numarul de licee este determinata de variatia numarului


elevilor inscrisi in licee.
Testarea semnificatiei raportului de corelatie
Vom testa daca raportul de corelatie este semnificativ diferit de 0
(are o valoare semnificativa), adica daca numarul elevilor inscrisi si
numarul de licee sunt corelate semnificativ.
1. Formularea ipotezelor

H0: =0
H1: 0

2. Fixarea pragului de semnificatie

=0,05

3. Alegerea statisticii test


9

2 n k
F
1 2 k 1
4. Calcularea statisticii test
2

R nk
F
1 R2 k 1

5. Cristerii de decizie

|Fcalc|Fteoretic se accepta H0 cu o probabilitate de 1-


|Fcalc|Fteoretic se respinge H0 cu un risc asumat
|sig|> se accepta H0 cu o probabilitate de 1-
|sig|< se respinge H0 cu un risc asumat
6. Decizia si interpretarea
Sig = 3,27E-10 |3,27E-10 |< 0,05 se respinge H0 cu un risc
asumat5%
cu un risc asumat de 5%%, putem afirma ca raportul de corelatie nu
este semnificativ diferit de 0, adica numarul elevilor inscrisi si
numarul de licee nu sunt corelate semnificativ.
2.4.

Testarea modelului de regresie Testul F omnibus

Vom testa semnificatia influentei numarului elevilor inscrisi in licee


asupra numarul de licee.
1. Formularea ipotezelor

H0: 0=0 si 1=0


H1: 00 sau/si 10

2. Fixarea pragului de semnificatie

=0,05

3. Alegerea statisticii test

VE n k
F
VR k 1
4. Calcularea statisticii test

10

Fcalc

F=

ESS
ESS n k k 1

RSS k 1 RSS
nk
4244,247
1328,62

28
1

(b b x y)
(y b b x )

1 i

1 i

nk
k 1

= 89,381

5. Cristerii de decizie

|Fcalc|Fteoretic se accepta H0 cu o probabilitate de 1-


|Fcalc|Fteoretic se respinge H0 cu un risc asumat
|sig|> se accepta H0 cu o probabilitate de 1-
|sig|< se respinge H0 cu un risc asumat
6. Decizia si interpretarea

Fteoretic= F; k-1;n-k=F0,05;1;28=4,196
|89,381|>4,196 se respinge H0 cu un risc asumat5%
Sig = 3,27E-10 |3,27E-10 |< 0,05 se respinge H0 cu un risc
asumat5%
Cu un risc asumat de 5%, putem afirma ca modelul nu explica
semnificativ (corect) legatura dintre numarul elevilor inscrisi si
numarul de licee.

3. Concluzii
In urma utilizarii tehnicilor de regresie puse la dispozitie de catre programul Microsoft
Office Excel, a fost specificat si estimat un model distinct de regresie.
Astfel, in urma realizarii unei regresii liniare simple intre NUMARUL ELEVILOR
INSCRISI-ul/locuitor si numarul de licee pe judetele din Romania in anul 2015, am
obtinut o legatura negativa, inversa si foarte slaba intre cele doua
variabile, valoarea coeficientului de corelatie Pearson fiind de 0,877.
La o crestere a NUMARUL ELEVILOR INSCRISI cu un elev, numarul de licee
creste, in medie cu 0,0022
Modelul estimat este valid din punct de vedere sintactic, nu are toti
parametrii diferiti de zero, si in urma aplicarii mai multor teste, s-a
demonstrat ca indeplineste toate ipotezele modelului clasic de regresie.

11

4. Bibliografie
www.insse.ro , Institutul National de Statistica
Danut Jemna, Econometrie, editia a doua revazuta si adaugita, Editura SedcomLibris,
Iasi 2012

12

S-ar putea să vă placă și