Sunteți pe pagina 1din 10

METODOLOGIA CERCETĂRII ȘTIINȚIFICE

Știința încearcă să identifice fenomene și entități, forțele care le cauzează, mecanismele prin
care ele exercită aceste forțe și sursele acelor forțe în sensul structurilor interne ale acestor fenomene
și entități. Etimologia cuvantului stiința provine din latinescul (scientia) si înseamnă cunoaștere.
Cercetarea științifică este un proces sistematic de colectare şi analiză a informaţiei
(rezultatelor) realizat cu scopul îmbunătăţirii înţelegerii noastre asupra unui aspect.În sens larg, prin
metodologie se înțelege ansamblul unor metode folosite în cercetarea științifică sau, pur si simplu,
știința efectuării cercetării. Scopul fundamental al metodologiei este acela de a ne ajuta sa înțelegem
nu atât produsele științei, cât procesul de cunoaștere însuși.
Metodologia cercetării ştiinţifice reprezintă:
 sistemul de metode, procedee, tehnici, reguli, principii şi instrumente precum şi
know-how-ul aferent ,toate angajate în procesul cunoaşterii ştiinţifice;
 totalitatea tehnicilor de a observa şi de a acumula cunoştinţe necesare întocmirii şi
prezentării unei lucrări ştiinţifice.

ETAPE GENERICE SPECIFICE UNEI CERCETĂRI ȘTIINȚIFICE

    În științele economice, cercetarea științei economice are ca obiect principal prezentarea,


explicarea și înțelegerea faptelor, proceselor și fenomenelor economice care s-au desfășurat și se
desfășoară în societate, precum și efectele, predicțiile lor viitoare și presupun:
a) stabilirea ariei tematice, alegerea temei de cercetare;
b) cunoașterea metodologiei de cercetare științifică;
c) documentarea;
d) cercetarea propriu-zisă, cu două subetape importante:
 formularea ipotezei (momentul creator) și
 verificarea ipotezei și a concluziilor științifice (momentul critic-valorizator);
e) redactarea și susținerea publică a rezultatului cercetării, publicarea lucrării de cercetare.

1
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
REGRESIA LINIARA

La fel ca în multe alte domenii de activitate şi în particular în domeniul economic, respectiv cel
al afacerilor se întâlnesc adesea situaţii care presupun luarea unor decizii,efectuarea deanalize micro
sau macroeconomice,bazate pe prognoze ,sau care pun în evidenţă nevoia de a cunoaşte modul în
care anumite mărimi importante la nivel de entitate depind unele de altele,este folosita cu success si
rezultate notabile ,modelul liniar de regresie.
Modelul linear de regresie simpla se bazează pe seriile de date pentru cele două caracteristici,
fiind reprezentate prin vectorii x (variabila factorială) şi y (variabila rezultativă) Determinarea
parametrilor modelului liniar se face, de regulă, prin utilizarea metodei celor mai mici pătratesau a
verosimilităţii maxime si presupune identificarea variabilelor pentru definirea modelului şi
precizarea variabilei reziduale; contextul în care este utilizat modelul de regresie. Pentru analiza
datelor seriilor cronologice (de timp) se utilizează o funcţie temporală care, în esenţă, este tot de
regresie,cu o variabilă de timp (t). Scopul folosirii modelului de regresie este acela de a obţine
parametrii ce corespund setului de variabile formulat, prin analiza dependenţei dintre variabile, în
cazul în care seriile de date sunt înregistrate la nivelul unităţilor statistice pentru o perioadă sau un
moment, precum şi pentru evidenţierea dependenţei dintre variabile într-un anumit orizont de timp.
Regresia liniară simplă este o procedură de predicţie, pe baza corelaţiei dintre două variabile
cantitative (X/Y).
Precizia predicţiei este dată de valoarea coeficientului de corelaţie Pearson dintre variabile. Cu
cât r este mai mare, cu atât predicţia valorilor unei variabile (numită criteriu) pornind de la valorile
celeilalte variabile (numită predictor) este mai bună. La limită, când r=1, predicţia este perfectă.
Modelul de regresie se exprimă grafic printr-o dreaptă, al cărui traseu prin norul de puncte
minimizează distanţele dintre punctele dreptei şi cele ale scatterplot-ului corelaţiei.
Ecuaţia de regresie, în termenii scorurilor brute este Y’=ayx+byx*X, unde Y’ reprezintă valorile
prezise, ayx reprezintă punctul de origine al liniei de regresie, byx înclinarea acesteia, iar X, valorile
variabilei predictor.
Functia de regresie poat fi :
 lineara
 nelineara
 sinusoidala
În definirea funcţiei de regresie liniară sunt considerate, cel mai frecvent, patru ipoteze:

2
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
 seriile de date nu sunt afectate de erori de înregistrare.
 pentru fiecare valoare fixată a caracteristicii factoriale, variabila reziduală este de
medie zero,
 lipsa corelării reziduurilor exprimă faptul că între termenii reziduali nu se
manifestă fenomenul de covarianţă
 ipoteza necorelării variabilei reziduale cu cea independentă,

STUDIU DE CAZ

Prin rezolvarea problemei se doreste sa se afle corelatia dintre dintre veniturile obţinute de 20 de
societati comerciale cu activitai diferite, selectate aleator şi taxele si impozitele plătite de către aceste
societati catre diferite organisme ale statului,conform tabelului 1.1.

Tabel 1.1.
Venitul Taxe si Impozite
Nr.c (mii lei) ( lei)
rt X Y
1 17,5 35,0
2 37,5 60,5
3 47,5 88,5
4 25,0 70,5
5 55,5 125,0
6 35,0 63,0
7 15,5 30,0
8 12,0 75,0
9 32,0 70,0
10 42,3 60,0
11 28,0 150,0
12 22,5 70,0
13 25.0 60,0
14 29.5 65,0
15 65,0 150,0
16 51,0 100,0
17 39,3 75,0
18 33,0 40,0
19 45,0 75,0
20 75,0 200,0

Se cere sa se afle :
 modelul ce descrie legătura dintre cele două variabile;
 estimarea parametrilor modelului;
 verificarea semnificaţiei parametrilor modelului de regresie pentru  = 0,1;
 testarea validitatii modelului de regresie;

3
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
 intensitatea legăturii dintre cele două variabile şi să se testeze semnificaţia
indicatorilor utilizaţi;

Rezolvare:
Se va reprezenta grafic legătura dintre nivelul taxelor şi venit pentru cele 20 de societati
comerciale prin corelogramă :

220
200
180
160
140
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80

1 cm OX = 10 mii euro ; 1 cm OY = 20 euro


Studiind graficul se observa că distribuţia punctelor (x i, yi) poate fi aproximată cu o dreaptă,
deci modelul care descrie legătura dintre cele două variabile este un model liniar:
y= α 0 + α 1 x +u
0, 1 – parametrii modelului;
1  0 (panta dreptei) deoarece legătura dintre cele două variabile este directă.
In vederea estimarii parametrii modelului de regresie liniara este utilizata metoda celor mai
mici pătrate,dupa cum urmeaza:
y i=a0 +a1 x i +u i=1 , 20

^y i=a0 +a1 x i
20 a0 +733 , 1 a1 =1557 ,5
∑ ( y i− ^y i )2 min
i
⇔ ∑ ( y i −a0−a1 xi )2 min
i
⇔ {a0⋅733 ,1+a1⋅31991 , 53=68864

a0 =−6 , 4201
{ a1 =2 ,2997

Deci, modelul este:

^y i=−6 , 4201+2 ,2997 x i

4
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
n ∑ yi |
| 20 1557 ,5
a1 =
∑ xi ∑ x i y i = |733 , 1 68864
|
=2 , 2997
|
n ∑ x i | |20 733 , 1
|
733 , 1 31991 ,53
∑ xi ∑ x 2i
a0 = y−a1⋅x=−6, 4201
Pentru a rezolva sistemul vom folosi următorul tabel în care sunt prezentate valorile
intermediare conform tabelului 1.2:
Tabelul 1.2.

xi   yi   2
xi yi   2  
xi   yi   ( yi− y )
2
2
( x i−x )
25 10 625 250 100 4 0
23 11 529 121 1 4
253
30 14 900 420 196 4 25
25 12 625 300 144 0 0
20 8 400 160 64 16 25
33 18 1089 594 324 36 64
18 9 324 162 81 9 49
21 10 441 210 100 4 16
22 10 484 220 100 4 9
30 15 900 450 225 9 25
26 11 676 286 121 1 1
26 15 676 390 225 9 1
27 12 729 324 144 0 4
29 14 841 406 196 4 16
20 11 400 220 121 1 25
       
∑ xi ∑ x 2i = ∑ x i y i= ∑ y2i =
=375 ∑ yi =180 9639 4645 2262 102 264

15 a 0 + a1⋅375=180 a0 =−1 , 73
{a0⋅375+a1⋅9639=4645

{ a1 =0 ,5492

Astfel:

^y i=−1, 73+0 , 5492⋅x i


Se calculeaza semnificaţia parametrilor modelului:
Ecuaţia de regresie la nivelul colectivităţii generale este:

y i=α 0 +α 1 x i +u i
iar la nivelul eşantionului este:

5
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
y i=a0 +a1 x i +ui
Testarea semnificaţiei parametrului 1:
Ipoteza nulă:
H0 : 1 = 0
Stabilirea ipotezei alternative:
H1 : 1  0, adică 1 este semnificativ diferit de zero, adică 1 este semnificativ statistic.
Calculul testului statistic:
deoarece n = 15  30 avem eşantion de volum redus şi pentru testare vom utiliza testul t:
a1 −α 1 a1−0 a1 0 ,5492
t= = = = =6,8
s a1 s a1 s a1 0 , 08

2 s 2u 1 ,7199
sa = 2
= =0, 0064
i
∑ ( x i−x ) 264
i

∑ ( y i− ^yi )2
i 22 , 35
s 2u = = =1, 7199
n−k −1 15−2
k – reprezintă numărul variabilelor factoriale (în cazul modelului unifactorial k = 1).
15
∑ xi
i=1 375
x= = =25
15 15
Pentru un prag de semnificaţie de 5% valoarea tabelată a testului este:
t0,05/2; 13 = t0,025; 13 = 1,35

Testarea semnificaţiei parametrului 0:


1) ipoteza nulă: H0: 0 = 0;
2) ipoteza alternativă: H1: 0  0;
3) se calculează testul statistic:
a0 −α 1 a0 −0 a0 −1 ,73
t= = = = =−0 , 84
s a0 sa0 s a0 2 , 096

1 x2 1 25
2
s a =s +
0
2
u
[
n ∑ ( x i−x ) 2
=1,71 + =4,186
15 264
i
] [ ]
6
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
t calc=−0 ,84>−t α /2; n−2 =−1 , 35  se acceptă ipoteza nulă, adică parametrul a0 nu este
semnificativ statistic.

c) Erorile reziduale sunt ui = y i− ^y i şi sunt prezentate în tabelul de mai jos:

ui -14,99 -27,57 -0,91 18,38 16,58 7,37 5,03


-20,62 9,90 27,22 -19,95 -17,48 -5,09 5,42 16,70

Se testeaza validititatea modelului de regresie:

1) se stabileşte ipoteza nulă: H0: împrăştierea valorilor ^y t datorate factorului nu diferă


semnificativ de împrăştierea aceloraşi valori datorate întâmplării, deci modelul nu este valid.
2) se stabileşte ipoteza alternativă: H1: modelul este valid;
3) se calculează testul F:
2
s 79 , 64
F= x2 = =46 ,3
s u 1 , 71

∑ ( ^y i − y )2
i 79 ,64
s 2x= = =79, 64
k 1

∑ ( y i− ^yi )2
i 22 , 35
s 2u = = =1, 71
n−k −1 15−2
15
∑ yi
i=1 180
y= = =12
15 15

F calc=F α ; n−k−1 =F0 ,05 ;1 , 13=4 ,67


Deoarece Fcalc  Ftab  modelul este valid.

e) Intensitatea legăturii dintre cele două variabile se face cu coeficientul de corelaţie liniară:
n ∑ x i y i −∑ x i⋅∑ y i
r= =
2 2
√[ n ∑ x 2i − ( ∑ x i ) ][ n ∑ y 2i − ( ∑ yi) ]
15⋅4645−375⋅180
= =0 , 88→1>0
√[ 15⋅9639−375 2] [15⋅2262−1802 ]
Rezultă că între cele două variabile există o legătură directă foarte puternică.
Testarea semnificaţiei coeficientului de corelaţie:
- se stabileşte ipoteza nulă: H0:  nu este semnificativ statistic;

7
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
- se stabileşte ipoteza alternativă: H1:  este semnificativ statistic;
- se calculează testul t:

r r √ n−2 0 ,88⋅√ 13
t= = = =6 ,75
s r √1−r 2 √ 1−0 ,882

t calc >t α ; n−k −1=t 0 , 05 ; 13=2, 16 


Coeficientul de corelaţie este semnificativ statistic.
Măsurarea intensităţii legăturii cu raportul de corelaţie R:

R=

√ ∑ ( ^y i − y )2
i=1
n
∑ ( yi− y )
i=1
2
=0 ,88

Deoarece R = r = 0,88, apreciem că există o legătură liniară, puternică şi directă între cele două
variabile.
Testarea raportului de corelaţie se face cu testul F:
2
R n−k−1 0 ,78 13
F= 2
⋅ = ⋅ =46 , 09
1−R k 1−0 , 78 1
Cum:
F calc >F0 ,05; 1 ; 13=4 ,67 R este semnificativ statistic.
Problema a fost rezolvata prin introducerea datelor in programul informatic EXCEL,fiind
obtinute următoarele rezultate:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.883621
R Square 0.780786
Adjusted R 0.763923
Square
Standard Error 1.311483
Observations 15.000000

ANOVA

8
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
df SS MS F Significance F
Regression 1.000000 79.640152 79.64015 46.30272 0.000013
2 7
Residual 13.000000 22.359848 1.719988
Total 14.000000 102.00000
0

Coefficient Standard t Stat P-value Lower Upper


s Error 95%
95%
Intercept -1.731061 2.046120-0.846021 0.412843-6.151434 2.68931
3
X Variable 1 0.549242 0.080716 6.804611 0.000013 0.374866 0.72361
9

RESIDUAL OUTPUT

Observation Predicted Residuals


Y
1.000000 12.000000 -2.000000
2.000000 10.901515 0.098485
3.000000 14.746212 -0.746212
4.000000 12.000000 0.000000
5.000000 9.253788 -1.253788
6.000000 16.393939 1.606061
7.000000 8.155303 0.844697
8.000000 9.803030 0.196970
9.000000 10.352273 -0.352273
10.000000 14.746212 0.253788
11.000000 12.549242 -1.549242
12.000000 12.549242 2.450758
13.000000 13.098485 -1.098485
14.000000 14.196970 -0.196970
15.000000 9.253788 1.746212

9
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Interpretare rezultate din tabelul SUMMARY OUTPUT:

 R= 0.883621 arată că între numărul de poliţe încheiate şi timpul mediu petrecut cu un potenţial
client există o legătură puternică.
 R2 =0.780786 arată că 78% din variaţia numărului de poliţe încheiate este explicată de timpul mediu
petrecut de un agent cu un potenţial client.
 Abaterea medie patratica a erorilor
s
u = 1.311483. În cazul în care acest indicator este zero
înseamnă că toate punctele sunt pe dreapta de regresie.

Interpretare rezultate din tabelul ANOVA:

În acest tabel este calculat testul F pentru validarea modelului de regresie. Întrucât F= 46.302727, iar
Significance F (pragul de semnificatie) este 0.000013 (valoare mai mica de 0.05) atunci modelul de regresie
construit este valid şi poate fi utilizat pentru analiza dependenţei dintre cele două variabile.

Interpretarea rezultatelor din tabelul 4:

 Intercept este termenul liber, deci coeficientul a0 este -1.731061. Termenul liber este punctul în care
variabila explicativă (factorială) este 0. Deci numărul de poliţe încheiate, dacă timpul petrecut este 0.
t
Deoarece a0 = -0.846021iar pragul de semnificaţie P-value este 0.412843>0,05 înseamnă că acest
coeficient este nesemnificativ. De altfel faptul că limita inferioară a intervalului de încredere
(-6.151434 ¿ α 0 ≤ 2.689313) pentru acest parametru este negativă, iar limita superioară este
pozitivă arată că parametrul din colectivitatea generală este aproximativ zero.
 Coeficientul a1 este 0.549242, ceea ce însemnă că la creşterea timpului petrecut cu un minut,
numărul de poliţe încheiate va creşte cu 0,549242. Deoarece a1 = 6.804611 iar pragul de t
semnificaţie P-value este 0.000013<0,05 înseamnă că acest coeficient este semnificativ. Intervalul de
încredere pentru acest parametru este 0.374866
¿ α 1 ≤ 0.723619.

10
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
1 Se poate vedea de exemplu Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
2 Pentru o tratare detaliată, se poate vedea Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003

S-ar putea să vă placă și