Sunteți pe pagina 1din 26

Econometrie

Suport de Curs-Învățamântul la distanță

Prof. univ. dr. Zaharia Marian

Asist. Univ. drd. Oprea Cristina

1

Unitatea de învăţare 11 MODELUL DE REGRESIE LINIARĂ UNIFACTORIALĂ

Unitatea de învăţare 11 Modelul de regresie liniară unifactorială Obiectivele Unităţii de Învăţare 11

2

11.1 Ipotezele modelului

2

11.2 Determinarea și validarea parametrilor modelului linear unifactorial

6

Lucrare de verificare 11A

22

Test de autoevaluare 11B

22

Rezumat

25

Bibliografie

26

Obiectivele Unităţii de Învăţare 11

După studiul acestei unităţi de învăţare cursanţii vor avea cunoştinţe despre:

ipotezele modelului regresie unifactorial;

determinarea și validarea modelului de regresie unifactorial;

11.1 Ipotezele modelului

Conceptul statistic de regresie 1 a fost utilizat pentru prima dată în 1886 de biologul englez Francis Golton (1822-1894). Utilizarea regresiei presupune aplicarea unei metode statistice care să vizeze depistarea, stabilirea şi comensurarea unei relaţii constituite între două sau mai multe variabile, în care una este rezultativă (dependentă), iar cealaltă sau celelalte sunt explicative (apar sub forma factorilor esenţiali de influenţă). Metoda regresiei este fundamentată pe măsurarea şi previzionarea influenţei pe care unul sau mai mulţi factori o poate avea asupra evoluţiei unui fenomen sau proces economic.

1 Termenul provine din latinescul „regresia” s-a conturat pe baza rezultatelor observării şi analizei orientate spre „întoarcerea spre medie”.

2

Deoarece, în cadrul metodei apar valori perechi de variabile utilizate şi parametri

corespunzători acestora sub forma mediilor, dispersiilor, abaterilor standard, etc, ea reprezintă

o componentă a metodelor parametrice de măsurare şi analiză a legăturilor formate în cadrul

derulării unor procese sau fenomene economice.

Elementul fundamental în cadrul metodei regresiei îl reprezintă funcţia de regresie.

Definiţia 6.1. Numim funcţie de regresie acea funcţie care sintetizează forma dependenţei

variabilei rezultative Y , de variabilele factoriale (

În acest context, funcţia de regresie este o funcţie de modulare sub forma ecuaţiei

medie de tendinţă, ca rezultat a utilizării unor ecuaţii de estimare.

Funcţia de regresie poate să apară sub forma unei reprezentări grafice şi poate fi

validată prin intermediul testului F (Fisher Snedecor) de analiză dispersională.

Activitatea practică impune să se acorde o atenţie deosebită în alegerea corectă a

funcţiei de regresie pentru că, în studierea legăturilor dintre fenomenele şi procese economice

este cea mai importantă şi exprimă foarte clar relaţia dintre variabilele studiate (rezultativă şi

factorială / factoriale).

Tipul funcţiei de regresie este stabilit în raport cu reprezentarea grafică a norului de

puncte, corespunzătoare distribuţiei studiate („scalter diagram”- diagrama împrăşterii

punctelor pe grafic).

Astfel, o analiză detaliată şi cât mai exactă a unui proces sau fenomen economic

impune o studiere clară a tipului funcţiei de regresie după o clasificare realizată în raport

cu variabilele şi parametrii incluşi în model, după cum urmează:

liniar în raport cu parametrii, în care atât variabilele modelului cât şi parametrii sunt

la puterea întâi. În cazul regresiei statistice, reprezentarea grefică a unui astfel de model

se rezumă la o linie dreaptă crescătoare sau descrescătoare care străbate mijlocul norului

, x

n

)

.

X

x

1

, x

2

,

K

de puncte urmând sensul alungirii acestuia; liniaritatea este dată de ecuaţia:

y ˆ =

a

0

+

a

1

x

în cazul unifactorial respectiv,

în cazul multifactorial.

yˆ = a

0

+

a x

1

1

+

+ a

K

x

K

neliniar cu următoarele variante:

(11.1)

(11.2)

neliniar în raport cu variabilele dar liniar în raport cu parametri–este acea

reprezentare în care cel puţin una dintre variabilele explicative este la o putere

diferită de putera întâi de forme precum:

3

ˆ

y = a

0

+ a

1

(1/

ˆ =

y

a

0

x

)

etc.

+

a x

1

+

a

2

2

x

; ˆ =

y

aX

a

Z

β

( a 1, β 1 ),

(11.3)

neliniar în raport cu parametrii dar liniar în raport cu variabilele, caz în care cel

puţin un parametru este la o putere diferită de puterea întâi, precum:

(11.4)

neliniar în raport cu variabilele şi cu parametrii - caz în care cel puţin o variabilă

y ˆ =

a

+

a

2

x ,

yˆ =

a x
a x

etc.

şi cel puţin un parametru sunt la o putere diferită de puterea întâi, cum ar fi:

(11.5)

Importanţa deosebită acordată funcţiei regresiei se transpune printr-o eficienţă

yˆ = a

2

x + a x

2

etc.

ridicată în utilizarea metodelor regresiei la nivelul multor domenii de activitate.

Conjunctura în care se aplică modelul unifactorial de regresie liniară vizează atingerea

unor ipoteze sintezate prin patru aspecte:

1.

Stabilirea soluţiilor – are în vedere ca date utilizate:

să fie obţinute fără erori simetrice de observare;

să fie în număr suficient de mare (mai mare decât numărul parametilor astimaţi).

2.

Variabila factorială (x)

este nestocastică;

are acelaşi valori în condiţiile repetării sondajului;

este evidenţiată datorită variabilităţii nivelurilor înregistrate în cadrul eşantionului

3.

(dispersia

σ

2

x

).

Modelul de regresie

este liniar în raport cu parametrii;

este corect stabilit prin:

alegerea potrivită a formei funcţionale:

- liniară

- neliniară transformată în liniară

cuprinderea celor mai importanţi factori verificată printr-o valoare destul de

2

mare a coeficienţilor de determinaţie ( R ).

4

y

M Y | X = X =α+βX ( ) i i erori erori x 1
M Y | X = X =α+βX
(
)
i
i
erori
erori
x 1 x
x
x
2
3
Figura 11.1 2 . Distribuţia de probabilitate pentru
ε
i

4. Variabila reziduală (

ε )

i

este de medie zero şi urmează o repartiţie normală (figura 6.1):

(

M ε

i

)= 0

, unde

ε

i

(

~ N 0, σ

2

)

cuprinde o împrăştiere egală (figura 6.1) pentru diferite segmente de valori

x

i

ceea ce reprezintă ipoteza de homoscedasticitate:

Var ( ε =σ ) 2 constantă (∀ i) i Y 0
Var
(
ε =σ
)
2 constantă (∀ i)
i
Y
0

X

Figura 11.2 Dispersie constantă a rezidurilor (homoscedasticitate)

nu este corelată cu variabila factorială ( x ), deci:

(

Cov ε

i

, )= 0

x

i

nu este autocorelată în sensul că, abaterile observaţiilor de la valorile presupuse

nu sunt corelate.

2 Voineagu V., Ţiţan E., Şerban R., Ghiţă S., Todose D., Boboc C., Pele D., “Teorie şi practică econometrică”, Editura Meteor Press, Bucureşti 2007, pag. 170

5

Cov ε ε )= 0

(

i

,

j

11.2 Determinarea și validarea parametrilor modelului linear unifactorial

Aplicabilitatea coeficientului de corelaţie în econometrie este strâns legată de regresia liniară 3 şi în principal, de parametrii ce formează funcţia de regresie liniară. În raport cu modul de stabilire a parametrilor ecuaţiei de regresie liniară, coeficientul de corelaţie poate fi determinat prin două variante:

Varianta 1:

relaţia:

Varianta 2:

Din relaţiile

r =

n n ∑ y i i = 1 n n ∑ x i x y
n
n
y
i
i = 1
n
n
x i x y
i
i
b
i =
1
i =
1
r =
=
∆⋅∆
n
n
y
n
x
n
y
i
i
i = 1
i = 1
n
n
n
n
2
2
x
x
y
y
i
i
i
i
i =
1
i =
1
i =
1
i =
1
n
n
n
n ∑
x y
∑ ∑
x
y
i
i
i
i
i =
1
i
=
1
i =
1
r =
2
2
n
n
 
n
n
2
2
x
− 
x
y
− 
y
i
i
i
i
i = 1
i
=
1
   
i
=
1
i
= 1
s xy
s xy
şi
b =
rezultă că:
2
s
⋅ s
s x
x
y
s
x
r = b ⋅
s
y

, care conduce la

(11.6)

(11.7)

Relaţia (6.37) evidenţiază mai bine legătura coeficientului de corelaţie ( r ) cu coeficientul de regresie ( b ), deci implicit cu metoda regresiei.

3 Vezi Capitolul VII “Modelul regresiei liniare”, subcapitolul 7.1.1. “Stabilirea şi aplicarea modelului unifactorial de regresie liniară”

6

Deoarece,

s

x

şi

s

y sunt întotdeauna pozitive, ambii coeficienţi vor avea acelaşi semn

care va indica direcţia legăturii (vor avea aceeaşi interpretare în ceea ce priveşte direcţia legăturii). Tendinţa de liniaritate a legăturii dintre o variabilă rezultativă şi alta explicativă, de tip factorial, este reflectată nu numai printr-o reprezentare grafică însoţită de aplicarea modelului de regresie liniar, dar şi prin egalitatea dintre raportul de corelaţie ( R ) şi coeficientul de corelaţie ( r ): R = r .

Regresia unifactorială liniară este reprezentată printr-un model în care:

asupra caracteristicii rezultative acţionează în principal un singur factor variabil (variabila explicativă sau independentă), deci:

la nivelul colectivităţii generale:

la nivelul eşantionului:

y =

f

(

x

i

Y =

)

f

(

X

i

)

restul factorilor sunt consideraţi neesenţiali şi au o acţiune constantă şi neglijabilă

rezumată într-o valoare medie ε

i pentru colectivitatea generală şi

e i pentru eşantion.

forma reprezentării grafice şi a funcţiei regresiei teoretice a distribuţiei în raport cu cele două variabile este de tip liniar, astfel:

pentru colectivitatea generală :

pentru eşantion:

ˆ

Y =α+β x

i

i

yˆ

i

= a + b x

i

Posibilităţile de aplicare practică a modelului de regresie unifactorială liniară are în vedere următoarea reprezentare grafică din figura 7.2.

y

3 0,5 β= 0,5 2 1 y =1+ 0,5⋅ x 1 α=1 x 1 2
3
0,5
β= 0,5
2
1
y =1+ 0,5⋅ x
1
α=1
x
1
2
3
4

7

Figura 7.2. Evidenţierea grafică a parametrilor funcţiei de regresie liniară unifactorială

Graficul (11.8) ne arată că, pe colectivitatea statistică generală, aplicarea modelului ce reflectă influenţa factorului x asupra rezultativei y presupune utilizarea ecuaţiei de

regresie liniară

(11.8)

Y i = α + β x + ε

i

i

 

ˆ

Notând

cu

Y

înfluenţa factorului determinist asupra variabilei rezultative Y , relaţia

(11.9) devine:

unde

ˆ

Y =α+β x

i

i

.

Y

i

Interpretarea parametrilor α

astfel:

ˆ

= Y +ε

i

i

(11.9)

şi β este dată de reprezentarea grafică (figura 11.8)

α – este punctul de intersecţie al dreptei de regresie cu axa OY

β – este pantă a dreptei de regresie; în analiză, β apare sub denumirea de coeficient de

regresie, care ne arată cu câte unităţi se modifică y sub influenţa variaţiei factorului x cu o

unitate.

De cele mai multe ori, în practică, modelul regresiei unifactoriale liniare se aplică pe

un eşantion γ cu n

, y

perechi de observare: (

x

1

1

)

,( x

2

2

)

,(

x , y

3

3

)

,

,(

x

n

, y

n

)

, astfel:

, y

y

i

= a + b x

i

+ e

i

care poate şi scrisă şi sub forma:

y

i

= yˆ

i

+ e

i

(11.10)

(11.11)

în care

Parametrii a şi b sunt estimatori ai punctului de intercepţie α , respectiv ai pantei liniei de regresie β .

Dacă se doreşte o analiză a elementului rezidual sub forma erorilor, atunci se poate stabili nivelul acestuia după cum urmează:

yˆ

i

= a + b x

i

pentru colectivitatea generală

ε

i

ˆ

= Y −Υ

i

i

(11.12)

pentru eşantion

8

(

e = y yˆ

i

i

i

(11.13)

În ambele situaţii, atât eroarea aleatoare ( ε ), cât şi estimatorul elementului rezidual

i

e ) ne indică diferenţele ce apar între valorile reale (empirice) şi cele rezultate prin observare

i

(

Modelul unifactorial de regresie liniară poate fi aplicat la nivelul unui eşantion numai dacă există posibilitatea estimării parametrilor incluşi în respectivul model.

Estimarea parametrilor (a, b) se poate realiza prin aplicarea unei metode statistico-

matematice, cum ar fi: metoda celor mai mici pătrate, metodele bayesiene, metoda verosimilităţii maxime. Alegerea metodei celei mai fidele şi adecvate situaţiei în care se prezintă procesul studiat, precum şi obţinerea unei calităţi ridicate a estimatorilor necesită respectarea următoarelor criterii 4 :

Υ

i

sau

y ).

i

să fie cât mai mare gradul de determinare ( R );

abaterile stabilite între valorile empirice ( y ) şi cele teoretice obţinute prin

2

i

ajustare (

yˆ ) să fie cât mai reduse, a.î.

i

i

(

y

i

y ˆ

i

)

2

=

minim;

estimările stabilite să reprezinte soluţii nedeplasate, consistente şi eficiente;

să fie minim costul necesar aplicării metodei de estimare.

În general practica a demonstrat că metoda cea mai fidelă şi utilizată este metoda celor mai mici pătrate. Denumirea metodei evidenţiază principalele ei caracteristici: suma

pătratelor abaterilor valorilor empirice de la cele teoretice să fie minimă.

min

n

i = 1

( y

i

ˆ

y )

i

2

=

min

n

i = 1

(

y

i

− −

a

bx

i

)

2 (11.14)

 ∂ S

 ∂ a

S

 ∂ b

=

=

Notând cu

S

=

0

0

2

2

n

i = 1

n

i = 1

n

i = 1

(

y

i

(

y

i

− −

a

a

− −

bx

i

(

y

bx

i i

a

− −

bx

i

)

2 , din condiţiile de optim de ordinul întâi:

)(

)(

1) =

0

x

i

)

=

0

4 Pecican E. Ş., “Econometrie pentru

economişti”, Editura economică, Bucureşti 2007, pag. 64.

9

n

2 (

2

i = 1

n

i = 1

(

a

+

bx

i

ax

i +

bx

2

i

y

i

)

=

0

x y

i

i

)

=

0

n

n

n

∑ ∑

a

+

i =

1

  x

n


a

i =

1

i

i

=

1

x

i

i =

n n

1

y

i

= 0

+ b

x

2

i

x y

i

i =

1

i =

1

i

= 0

obţinem sistemul de ecuaţii normale:

n

+

b

x

i

n n

i = 1

x

i

=

i

=

y

b

n

i

=

1

x

2

i

=

na

a   

i = 1

1

+

i

n

=

1

i

x y

i

i

(11.15)

Pentru determinarea expresiilor parametrilor a şi b din sistemul de ecuaţii normale

(11.16) aplicăm metoda determinanţilor astfel:

n n ∑ y ∑ x i i i = 1 i = 1 n
n
n
y
x
i
i
i
=
1
i
=
1
n
n
2
x y
x
i
i
i
i
= 1
i
= 1
, de unde rezultă:
n
n
x
i
i = 1
n
n
2
x
x
i
i
i = 1
i
= 1
n
n
n
n
2
y
x
∑ ∑
x
x y
i
i
i
i
i
i =
1
i
=
1
i
=
1
i =
1
a =
2
n
n
2
n
x
x
i
i
i =
1
i
= 1
n

a =

a

=

b

=

n

x

i

 

i

= 1

n

n

x i x y

i

i

i =

1

i

=

1

 

n

 

n

 

x

i

 

i

= 1

 

n

n

x

i

 

2

x

i

i = 1

i

= 1

 

n

b =

respectiv

b =

, de unde, pentru parametrul b rezultă:

n

x y

i

i

 

n

n

∑ ∑

x

i

y

i

i =

1

i

=

1

i =

1

 
 

− 

 

2

 

n

2

n

 

n

x

i

 

x

i

i =

1

i

= 1

10

(11.16)

(11.17)

Utilizarea modelului regresiei unifactoriale liniare nu permite numai stabilirea funcţiei de regresie şi determinarea cu ajutorul sistemului de ecuaţii normale a parametrilor acestuia, ci permite şi interpretarea estimatorilor determinaţi astfel:

Parametrul estimator a :

- este denumit şi termen liber;

- are caracter de mărime medie – indică valoarea variabilei rezultative y când toţi

factorii neesenţiali au o acţiune constantă (este nivelul mediu al variabilei y

determinată prin influenţa celorlalţi factori, în afara lui

x ).

i

- în reprezentarea grafică, indică punctul de întâlnire dintre axa OY şi panta dreptei de regresie.

- valoarea pozitivă ( a > 0 ) sau negativă ( a < 0) nu are nici o relevanţă în modelul regresiei. Parametrul estimator b :

- se numeşte coeficient de regresie;

- arată:

gradul de influenţă a variabilităţii factoriale x asupra rezultativei y (cu cât variază

în medie y în condiţiile modificării cu o unitate a factorului x ).

direcţia legăturii:

b > 0 , legătură directă (creşterea valorilor variabilei factoriale x determină o creştere a valorilor ecuaţiilor de regresie şi invers).

b < 0 , legătură inversă sau indirectă (creşterea valorilor variabilei factoriale x determină o scădere a valorilor ecuaţiilor de regeresie şi invers).

b 0 , nu există legătură; variabilele sunt independente valoarea medie a a

caracteristicii factoriale x este egală cu cea a caracteristicii rezultative).

- în reprezentarea grafică, parametrii exprimă panta dreptei de regresie.

Odată cu interpretatrea parametrilor estimatori a şi b

se încheie prima treaptă a

modelului regresiei unifactoriale liniare prin care s-a stabilit şi s-a aplicat metoda.

Verificarea validităţii modelului unifactorial de regresie liniară

11

A doua treaptă de analiză a modelului unifactorial de regresie liniară este reprezentată

de verificarea validităţii metodei, prin intermediul căreia se doreşte o confirmare a stabilirii şi

utilizării respectivului model.

Confirmarea de alegere şi utilizare corectă a modelului unifactorial de regresie liniară

este completă numai după parcurgerea următoarelor etape:

- testarea validităţii modelul unifactorial de regresie liniară utilizând metod ANOVA

- stabilirea şi testarea semnificaţiei raportului de corelaţie (R).

- testarea semnificaţiei parametrii modelului regresiei unifactoriale liniare şi estimarea lor pe interval de încredere.

Exemplul 11.1.

În cadrul unui proiect este inclusă o cercetare care necesită studierea unui

eşantion format din 15 supermarket-uri. Studiul care trebuie realizat vizează analiza legăturii

care se stabileşte între salariul mediu acordat salariaţilor şi profitul înregistrat de respectivele

supermarket-uri, pe baza datelor din tabelul 6.2.

Tabelul 6.2. Profitul şi salariul mediu la 15 supermarket-uri

Profit

                             

(mil. lei)

8

6

4

9

11

4

7

8

10

4

12

9

5

12

11

Salariul

                             

mediu

32

22

18

30

40

15

25

24

35

21

35

27

20

36

33

(mii lei)

Se cere:

1 Să se stabilească direcţia şi intensitatea legăturii dintre salariul mediu acordat salariaţilor

şi profitul înregistrat de respectivele supermarket-uri.

2 Testaţi semnificaţia coeficientului de corelaţie determinat

Rezolvare:

1. Stabilirea direcţiei şi intensităţii legăturii presupune determinarea coeficientul de corelaţie simplă liniară.

Se identifică cele două variabile:

x – variabila factorială = profitul (mil. lei) înregistrat pentru fiecare supermarket

i

y

i - variabila dependentă = salariul mediu pe salariat (mii lei) acordat la nivelul fiecărui

supermarket

12

Determinarea coeficientului de corelaţie presupune parcurgerea algoritmului din tabelul 11.3.

Înlocuind valorile sumelor din tabelul 11.3 în relaţia

r =

 

n

 

(

x

i

x

)(

y

i

y

)

i = 1

 
 

 

n

i = 1

(

 

)

2

 

n

(

 

)

2

 

x

x

 

y

y

i   i = 1   i 

i

 

i

= 1

 

i

coeficientul de corelaţie dintre salariul mediu acordat salariaţilor şi profitul înregistrat de

respectivele supermarket-uri este:

r =

279,53 118 763,49 ⋅
279,53
118 763,49

0,93

(11.18)

Valoarea coeficientului de corelaţie, r = + 0,93 ne arată că, între salariul mediu

acordat salariaţilor şi profitul înregistrat de respectivele supermarket-uri, există o legătură

directă puternică, deoarece r (0,75 ; 0,95).

Tabelul 11.3. Determinarea coeficientul de corelaţie liniară simplă

Profit

Salariul mediu

     

(mil.lei)

(mii lei)

(x

i

x)(y

i

y)

 

(

x

i

x

) 2

 

(

y

i

y

) 2

x

i

 

y

i

     
 

8

32

   

0

 

0

 

19,9809

 
 

6

22

   

11,06

   

4

 

30,5809

 
 

4

 

18

 

38,12

   

16

   

90,8209

 
 

9

30

   

2,47

   

1

 

6,1009

 

11

 

40

   

37,41

   

9

 

155,5009

 
 

4

 

15

 

50,12

   

16

   

157,0009

 
 

7

25

   

2,53

   

1

 

6,4009

 
 

8

24

   

0

 

0

 

12,4609

 

10

 

35

   

14,94

   

4

 

55,8009

 
 

4

21

   

26,12

   

16

   

42,6409

 

12

 

35

   

29,88

   

16

   

7,4700

 
 

9

27

   

- 0,53

   

1

 

0,2809

 
 

5

20

   

22,59

   

9

 

56,7009

 

12

 

36

   

33,88

   

16

   

71,7409

 

11

 

33

   

10,94

   

9

 

29,9209

 

15

15

n

(

x

 

)(

 

)

15

(

 

)

2

15

)

2

x

i

y

i

i

x

y

i

y

x

i

x

(

y

i

y

i= 1

i= 1

i = 1

i= 1

i= 1

= 120

= 413

 

= 279,53

   

= 118

 

= 763,49

 

2. Testarea semnificaţiei coeficientului de corelaţie

13

Varianta 1 – cu testul Student ( t ) Etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie sunt:

1. Ipoteza nulă

H

0

:

ρ =

0

(coeficientul de corelaţie al colectivităţii nu este semnificativ

statistic, deci nu diferă semnificativ de zero).

2. Ipoteza alternativă : 0

H

1

ρ >

(coeficientul de corelaţie al colectivităţii este semnificativ

statistic, deci mai mare semnificativ de zero).

3. Se utilizează testul t ( Student) - test unilateral dreapta

4. Se stabileşte limita de semnificaţie α = 0,05 , de unde testul t tabelar sau

,

teoretic

t

α n

;

2

= t

=

t

0,05;13

= 2,16

şi regiunea de respingere R : dacă

r

0,05;15

2

t

c

>

t α

;

n

2

atunci

zero.

H se respinge, deci coeficientul de corelaţie este semnificativ mai mare decât

o

5. Statistica testului:

t c

r 0,93 = ⋅ n − 2 = ⋅ 15 − 2 = 9,13 2
r
0,93
=
n
2 =
15
2
=
9,13
2
1 − r
2 1
− 0,93

6. Concluzia se stabileşte în funcţie de regiunea de respingere şi valoarea calculată

t

c ,

astfel: valoarea lui

t

c

=

9,13

cu valoarea

t α

;

n

2 =

2,16

şi se observă că

t

c

>

t α

;

n

2

, deci

H

o

se respinge, prin urmare coeficientul de corelaţie este semnificativ statistic (fiind semnificativ mai mare decât zero).

Varianta 2 – cu testul Fisher Snedecor ( F ) Etapele parcurse pentru testarea semnificaţiei coeficientului de corelaţie sunt:

1. Ipoteza nulă

H

0

:

ρ =

0

(coeficientul de corelaţie al colectivităţii nu este semnificativ

statistic, deci nu diferă semnificativ de zero).

2. Ipoteza alternativă : 0

H

1

ρ >

(coeficientul de corelaţie al colectivităţii este semnificativ

statistic, deci mai mare semnificativ de zero).

3. Se utilizează testul F (Fisher Snedecor) - test unilateral dreapta.

4. Se stabileşte limita de semnificaţie α = 0,05 , de unde testul F tabelar sau teoretic este

şi regiunea de respingere R : dacă

F

c

=

F

α

;

k

;

n

1

=

F

0,05;1;15

2

=

F

0,05;1;13

= 4,67

− −

k

r

F

c

>

F α

;1;

n

2

, atunci

mare decât zero.

5. Statistica testului:

H se respinge, deci coeficientul de corelaţie este semnificativ mai

o

14

6.

F

c

=

r

2

1 r

2

( n

2

)

=

0,93

2

1

0,93

2

(15 2) 83,23

=

Concluzia se stabileşte în funcţie de relaţia:

F >

c

F α

;1;

n

2

( 83,23 > 4,67 ), deci

H

o

se

respinge, prin urmare coeficientul de corelaţie este semnificativ statistic (fiind

semnificativ mai mare decât zero).

Exemplul 11.2.

Managerul unei structuri de primire turistică doreşte să stabilească, pe baza

unui model econometric, gradul de dependenţă a valorii încasărilor de numărul de turişti şi

durata medie a sejurului. Datele înregistrate de acesta sunt cele din tabelul (6.4).

Tabelul 11.4. Valoarea încasărilor pentru diverse durate ale sejurului şi numărul de turişti la nivelul unei pensiuni

Valoarea încasărilor

                       

(UM)

7,4

6,7

6,0

6,3

6,8

7,9

10,5

8,8

8,4

6,3

5,9

9,5

Număr turişti (mii)

5,0

2,4

1,8

1,7

1,2

1,6

4,7

3,9

3,0

1,1

2,0

5,1

Durata medie a sejurului

                       

(zile)

4,5

3,5

4,0

4,5

5,0

5,5

6,0

6,5

5,0

4,0

4,0

4,5

Se cere:

1. Să se stabilească direcţia şi intensitatea legăturilor dintre valoarea încasărilor,

numărul turiştilor şi durata medie a sejurului.

2. Testaţi semnificaţia coeficienţilor de corelaţie determinaţi

Rezolvare:

1.

Stabilirea direcţiei şi intensităţii legăturilor dintre valoarea încasărilor, numărul

turiştilor şi durata medie a sejurului.

Relaţia de dependenţă stabilită între caracteristici este:

Valoarea încasărilor = f (nr. turişti, durata medie a sejurului)

Notaţii :

y - valoarea încasărilor (caracteristică dependentă)

i

x 1

i - numărul turiştilor (caracteristică independentă)

- durata medie a sejurului (caracteristică independentă)

x

Se stabilește gradul de dependenţă al fiecărei caracteristici.

2

i

15

Coeficientul

de

corelaţie

dintre

valoarea

încasărilor

şi

numărul

de

turişti

se

determină cu valorile corespunzătoare din ultima linie a tabelului 11.5.

Tabelul 11.5. Tabelul cu algoritmul de calcul pentru coeficientul de corelaţie (

r y / x

)
1

Număr

Valoarea

     

turişti

(mii)

încasărilor

(UM)

 

x

1 i

y

i

 

x

1i

2

 

y

i

2

x

1

i

 

y

i

     

5,0

 

7,4

 

37,00

   

25,00

 

54,76

2,4

 

6,7

 

16,08

   

5,76

 

44,89

1,8

 

6,0

 

10,80

   

3,24

 

36,00

1,7

 

6,3

 

10,71

   

2,89

 

39,69

1,2

 

6,8

 

8,16

   

1,44

 

46,24

1,6

 

7,9

 

12,64

   

2,56

 

62,41

4,7

 

10,5

 

49,35

   

22,09

110,25

3,9

 

8,8

 

34,32

   

15,21

 

77,44

3,0

 

8,4

 

25,20

   

9,00

 

70,56

1,1

   

6,3

 

6,93

   

1,21

 

39,69

2,0

 

5,9

 

11,80

   

4,00

 

34,81

5,1

   

9,5

 

48,45

   

26,01

 

90,25

12

12

12

12

2

12

2

x 1 i

y

i

x

1 i

y

i

x 1 i

 

y

i

i= 1

i= 1

i= 1

i= 1

i= 1

= 33,5

=

90,5

 

=

271,44

 

= 118,41

=

706,99

 

n

n

n

r

y

r

y

/

/

x

1

x

1

=

=

 

n

i

y

i

x

1

i

y

i

i =

1

i

=

1

i =

1

   

 

2

 

 

 

2

 

n

 

n

n

   

n

   

i = 1

x

2

1 i

− 

i

=

1

x

1

i

12 271,44

 

i

=

1

y

2

i

33,5 90,5

− 

i

= 1

y

i

12 118,41 ⋅ −

12 118,41

33,5

2

⋅

12 706,93

90,5

2

= 0,76

rezultat care ne arată că, între

numărul turiştilor şi valoarea încasărilor există o legătură directă puternică, deoarece

r y

/

x

(0,75 ; 0,95)
1

.

16

Coeficientul de corelaţie dintre valoarea încasărilor şi durata medie a sejurului se

determină cu valorile corespunzătoare din ultima linie a tabelului 11.6:

Tabelul 11.6. Tabelul cu algoritmul de calcul pentru coeficientul de corelaţie (

r y / x

2

)

Durata

medie a

Valoarea

încasărilor

     

sejurului

(UM)

 

x

2

i

y

i

 

x

2i

2

 

y

i

2

(zile)

     
 

x

2

i

 

y

i

 

4,5

 

7,4

 

33,30

   

20,25

 

54,76

 

3,5

 

6,7

 

23,45

   

12,25

 

44,89

 

4,0

 

6,0

 

24,00

   

16,00

 

36,00

 

4,5

 

6,3

 

28,35

   

20,25

 

39,69

 

5,0

 

6,8

 

34,00

   

25,00

 

46,24

 

5,5

 

7,9

 

43,45

   

30,25

 

62,41

 

6,0

 

10,5

 

63,00

   

36,00

110,25

 

6,5

 

8,8

 

57,20

   

42,25

 

77,44

 

5,0

 

8,4

 

42,00

   

25,00

 

70,50

 

4,0

 

6,3

 

25,20

   

16,00

 

39,69

 

4,0

 

5,9

 

23,60

   

16,00

 

34,81

 

4,5

 

9,5

 

42,75

   

20,25

 

90,25

12

12

 

12

12

2

12

2

x

2 i

y

i

x

2

i

y

i

x

2 i

 

y

i

i= 1

i= 1

i= 1

i= 1

i= 1

= 57,00

=

90,50

 

=

440,30

 

=

279,50

=

706,93

 

n

n

n

n

x

2

i

y

i

x

2

i

y

i

 

r y