Sunteți pe pagina 1din 19

Statistică teoretică şi economică

CAPITOLUL 6

ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE VARIABILE

Cuvinte cheie:

- coeficientul de corelaţie;

- covarianţa;

- coeficientul de asociere propus de Yule;

- coeficientul de corelaţie a rangurilor Spearman;

- coeficientul de corelaţie a rangurilor Kendall

- indicele sau raportul de corelaţie.

- metoda regresiei

In realitatea economică majoritatea legaturilor dintre variabile sunt statistice pentru ca variabila rezultativă (y) reacţionează nu numai la influenţa lui x ci şi la influenţa concomitentă a altor variabile. Orice legatură dintre două variabile poate fi inclusă într-una din următoarele

situaţii:

legatură univocă, în sensul că x este variabilă factorială (cauzală, independentă, explicativă), iar y este variabilă rezultativă (efect, dependentă, explicată) şi influenţa este numai a lui x asupra lui y, fără să existe şi o influenţă a lui y asupra lui x;

legatură biunivocă în sensul că x este factor care determină variaţia lui y, dar în acelaşi timp, y este factor de influenţă al lui x, adică interdependentă;

evoluţia paralelă a două variabile fără ca între acestea să existe o legatură; evoluţia paralelă fiind cauzată de o altă variabilă comună;

simplu paralelism între două variabile între care există o potrivire numerică, dar nici o legatură logică.

6.1. Tipologia legăturilor statistice. Legăturile statistice se pot clasifica după mai multe criterii:

a) după numărul caracteristicilor luate în calcul:

legături simple (există o variabilă cauzală şi una rezultativă);

legături multiple (se consideră mai multe variabile cauzale şi efectul lor);

b)

după sensul legaturii:

legături directe (creşte x, creşte y);

legături inverse (creşte sau scade x, scade sau creşte y);

c)

în funcţie de forma analitică a legăturilor dintre variabile:

legături liniare;

legături curbilinii (parabolă, hiperbolă, exponenţială);

Statistică teoretică şi economică

d) în funcţie de timpul în care se realizează legătura:

legături sincrone (conconitente);

legături asincrone (cu decalaj);

 

e)

după natura variabilelor:

corelaţii statistice între variabile numerice;

asociaţii statistice când intervine o caracteristica nenumerică.

Identificarea legăturii poate fi făcută printr-o serie de metode elementare de organizare şi prezentare a informaţiilor statistice:

metoda seriilor paralele;

metoda grupării;

metoda tabelului cu dublă intrare;

metoda grafică.

6.2. Metoda regresiei. Metoda regresiei este folosită pentru a caracteriza forma şi sensul legăturii dintre variabile. Se consideră că între cele două variabile există o interdependenţă în sensul că Y i este influenţat de X i . Metoda regresiei trebuie să ne conducă la obţinerea unei expresii analitice a unei funcţii de regresie care sintetizeazp forma şi sensul variaţiei lui y sub influenţa factorului x (sau a factorilor luaţi în considerare). Dacă acceptam un singur factor, atunci vom avea o regresie simplă sau unifactorială, funcţia de regresie putând fi lianiară sau curbilinie. Dacă acceptam doi sau mai mulţi factori, atunci vom obtine o regresie multiplă sau multifactorială. Se recomandă să se selecteze factorii în funcţie de importanţa influenţei lor. Regresia liniară simplă. Dacă acceptăm că între variabilele X i şi Y i există o legatură directă de forma liniară, metoda regresiei ne permite să estimăm parametrii funcţiei:

y

i

= f

(

x

i

)

= a + b x

i

.

Estimarea parametrilor funcţiei de regresie se face cu metoda celor mai mici pătrate pe baza sistemului următor:

n


a

a

+

b

x

i

+

b

∑∑

y

x

i

=

x

2

i

=

i

x

i

y

i

.

Parametru “b” se numeşte coeficient de regresie şi exprimă sensul şi mărimea influenţei lui x asupra lui y. Dacă “b” este pozitiv arată o legătură directă; dacă “b” este negativ arată o legătură indirectă. Mărimea parametrului “b” arată cu cât se modifică variabila rezultativă la creşterea cu o unitate a factorului de influenţă.

Statistică teoretică şi economică

Regresia simplă curbilinie. Dintre funcţiile curbilinii în analiza economică şi socială se utilizează frecvent funcţia polinom de gradul 2:

y

i

= f

(

x

i

)

= a + b x

i

+ c x

2

i

.

Sistemul pentru determinarea parametrilor ecuaţiei este:

n

a

a


a

+

b

x

x

i

2

i

+

b

+

b

x

i

+

c

x

2

i

x

3

i

+

+

x

c

2

i

c

=

3

x

i

y

i

=

x

i

∑∑

x

4

i

=

x

2

i

y

i

y

i

.

Regresia multiplă. Regresia multiplă presupune luarea în considerare a influenţei concomitente a doi sau mai mulţi factori. De exemplu, cea mai simplă funcţie polinomială de gradul unu este:

y

x

1

,

x

2

,

x

k =

a

0

+

a

1

x

1

+

a

2

x

2

+

Parametrii se obţin din rezolvarea sistemului:

n


a

a

0

a

0

+

a

1

x

1

i +

+

a

1



0

∑∑

x

1

i

+

a

1

x

2

i

+

a

1

x

1

x

1

i

2 +

i

x

2

i

a x

0

ki

+

a

1

x

1

i

x

ki

x

+

+

a

1

+

1

i

+

+

a

k

a

1

x

1

i

x

x

1

i

2

i

+

+

a

1

x

1

i

+

x

1

i

x

ki

x

+

+

ki

a

+

+

a

k

x

k

.

=

a

y

x

i

=

k

1

i

x

ki

x

1

i

x

k

∑∑

x

2

i

x

ki

=

+

a

k

∑∑

x

2

ki

=

x

ki

y

2

i

i

y

y

i

.

i

Regresia în condiţiile unei repartiţii bidimensionale este utilizată în situaţile în care observarea statistică se organizează pe colectivităţi numeroase, informaţia culeasă fiind organizată pe intervale de variaţie ale variabilei factoriale (x) şi ale variabilei rezultative (y). Pentru estimarea parametrilor de regresie, în cazul ecuaţiei de gradul întâi, se va folosi următorul sistem:

n

a

a

+

b

x

i

n

x

x

+

i

b

n

=

x

x

2

i

y

n

i

x

n

=

y

∑∑

x

i

y

i

n

xy

.

Pentru caracterizarea functiei de regresie (calitatea functiei de regresie) se folosesc urmatorii indicatori:

Statistică teoretică şi economică

(abaterea medie pătratică a valorilor teoretice faţă de cele

reale) este folosită pentru a caracteriza funcţia de regresie sau calitatea funcţiei de

regresie:

Eroarea standard

2 ∑ ( y − Y ) i i = . S y / Y
2
∑ (
y
− Y
)
i
i
=
.
S y
/ Y
i
i
n

Coeficientul de eroare cuantifică intensitatea variaţiei în jurul funcţiei de regresie şi poate fi considerat tot un indicator care arată calitatea ecuaţiei de regresie:

S y / Y e = i i ⋅ 100 .
S y
/ Y
e =
i
i
⋅ 100
.

y

Coeficientul de determinaţie reprezintă o altă modalitate de a caracteriza calitatea funcţiei de regresie (de regulă se trece în dreapta funcţiei de regresie):

2  ∑ ( − Y )  y i 2 i D = 
2
(
− Y ) 
y i
2
i
D =
1
2
− ∑
(
y
)
i − y
⋅ 100 .

6.3. Metoda corelaţiei parametrice şi neparametrice.

Pentru a exprima intensitatea legăturii dintre variabile se utilizează la alegere

următorii indicatori:

covarianţa;

coeficientul de corelaţie;

indicele sau raportul de corelaţie.

Covarianţa este o mărime absolută a intensităţii legăturii dintre variabile şi se

stabileşte ca medie aritmetică a produselor (x − x)( y − y) : i i
stabileşte ca medie aritmetică a produselor (x
− x)( y
y)
:
i
i
1
cov( ,
x
y
)
=
(
x
x
)(
y
y
).
i
i
n

Dacă rezultatul este egal cu zero sau tinde către zero atunci între variabile nu există legătură statistică. Dacă rezultatul este pozitiv legătura dintre variabile este directă. Dacă rezultatul este negativ legătura dintre variabile este inversă. Valoarea maximă pe care o poate lua covarianţa a două variabile este egală cu produsul dintre abaterea medie pătratică a celor două variabile şi este întâlnită în cazul unei legături perfecte:

cov( ,

x

y

)

max

=σ σ

x

y

.

Coeficientul de corelaţie măsoară intensitatea legăturii dintre două variabile şi se calculează prin compararea covarianţei empirice, reale, cu valoarea maximă pe care o

Statistică teoretică şi economică

poate avea covarianţa. Coeficientul de corelaţie arată intensitatea şi sensul legăturii dintre variabile.

r xy

=

cov( x ,

y

)

=

(

x

i

x

)(

y

i

y

)

 

.

σ σ

x

y

n

σ σ

x

y

De asemenea, este folosită şi următoarea formulă dedusă din cea de mai sus:

În

practica

n ⋅ ∑ x ⋅ y − ∑ ∑ x ⋅ y i i i
n
∑ x
y
∑ ∑
x
y
i
i
i
i
r
=
.
xy
2
2
2
2
[ n
∑∑
x
(
x
)
][
n
∑∑
y
(
y
)
]
i
i
i
i
social-economică
se
utilizează
următoarele

coeficientului de corelaţie:

interpretări

ale

r xy
r
xy

(0;0,2) , fie că nu există legătură, fie că legătura este foarte slabă;

r xy
r
xy

(0,2;0,5) , legătura este slabă şi necesită aplicarea unui test de verificare

a semnificaţiei statistice a acestei legături (testul Student);

r xy
r
xy

(0,5;0,75) , legătura este de intensitate medie;

r xy
r
xy

(0,75;0,95) , legătura este puternică;

r xy
r
xy

(0,95;1) , legătura este foarte puternică, cvasifuncţională.

Pentru

legătura

=

 

dintre

 

variabile

pentru

 

repartiţia

 

de

frecvenţe,

 

n

∑∑

x

i

y

i

n

xy

x

i

n

x

y

i

n

y

[

n

∑∑

x

2

i

n

x

(

x

i

n

x

)

2

][

n

∑∑

y

2

i

n

y

(

y

i

n

y

)

2

]

.

următoarea relaţie:

r

xy

Testul Student (testul t):

t =

r xy ⋅ n − 2. 2 1 − r xy
r xy
⋅ n − 2.
2
1 − r
xy

vom

avea

Pentru a accepta ipoteza unei legături reale, valoarea calculată a lui “t” trebuie să fie mai mare decât valoarea tabelată pentru “n-2” grade de libertate.

Raportul de corelaţie are o aplicabilitate universală pentru măsurarea intensităţii legăturii dintre variabile indiferent de câte variabile luăm în calcul şi indiferent de forma relaţiei dintre variabile. Raportul de corelaţie nu arată şi sensul legăturii dintre variabile, ci numai intensitatea legăturii.

Statistică teoretică şi economică

R

xy

=

2 ∑ ( − Y ) y i i 1 − . 2 ∑ (
2
(
− Y
)
y i
i
1
.
2
(
y
i − y
)

Raportul de corelaţie are acelaşi domeniu şi subdomenii de definire ca şi coeficientul de corelaţie. Ori de câte ori una sau mai multe variabile luate în calcul sunt nenumerice (calitative, nominative) formulele corelaţiei parametrice devin înoperante. Nu numai aceste variabile se pot trata prin metode nemarametrice ci chiar şi variabilele numerice pot fi transformate în serii de ranguri (numere de ordine) sau în variabile alternative. Metodele neparametrice sunt:

coeficientul de asociere propus de Yule;

coeficientul de corelaţie a rangurilor Spearman;

coeficientul de corelaţie a rangurilor Kendall.

De exemplu, dintr-un total de 3890 persoane care au achizitionat produse în timpul unei săptămâni dintr-un magazin de cosmetice, 1350 sunt clienţi permananţi şi 2540 ocazionali. Din acelaşi total 2590 sunt femei şi 1300 barbaţi. Se pune întrebarea dacă între fidelitatea faţă de magazin şi clienţi se află o anumită legătură.

 

Barbaţi

Femei

Total

Clienţi permananţi Clienţi ocazionali

304

1046

1350

996

1544

2540

Total

1300

2590

3890

Coeficientul de asociere Yule se utilizează atunci când unităţile caracteristicii sunt separate în două grupe sau sunt de forma unei caracteristici alternative:

X

 

Y

 

Total

 

Y

1

Y

2

 

X

1

A

B

A+B

X

2

C

D

C+D

Total

A+C

B+D

A+B+C+D

Pentru exprimarea intensitatii celor doua variabile se utilizeaza un coefficient de asociere calculat astfel:

Q =

A

D

B

C

A

D

+

B

C

.

Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie. In cazul exemplului nostru rezultatul este Q = - 0,3788; rezultand o asociere inversa intre sex si tipul de client in sensul ca nu barbatii sunt clienti permanenti, ci femeile. Sau nu este adevarat ca fameile sunt cliente ocazionale.

Statistică teoretică şi economică

Coeficientul de corelaţie a rangurilor Spearman exprimă intensitatea şi sensul legăturii dintre rangurilor celor “n” unităţi:

r S =

1

6

d

2

i

n ( n

1)

.

Pătratul diferenţei dintre rangurile atribuite aceleaşi unităţi este notat cu Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie.

d

2

i

.

Coeficientul de corelaţie a rangurilor

intensităţii legăturii dintre rangurile celor n unităţi:

Kendall

este

destinat

tot

analizei

r K

2 S

= n n

(

1)

.

Suma dintre numărul de ranguri superioare fiecărui rang şi numărul de ranguri inferioare fiecărui rang se numeşte scor şi este notată cu S. Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie. Coeficientul de asociere al lui Yule, coeficientul de corelaţie a rangurilor Spearman şi coeficientul de corelaţie a rangurilor Kendall fac parte din analiza corelaţiei neparametrice.

Statistică teoretică şi economică

Probleme şi aplicaţii

6.1. Potrivit publicaţiilor OCDE, ţările membre s-au caracterizat în anul 1998 prin niveluri ale performanţei interne (exprimate prin indicatorul PNB/locuitor) şi, respectiv, ale performanţei externe (sintetizate sub forma exportului de bunuri şi servicii/locuitor) cuprinse în tabelul de mai jos:

mii USD

 

Ţara

PNB/locuitor

Export de bunuri şi servicii/locuitor

Australia

18,7

4,5

Austria

26,2

10,8

Belgia

24,4

17,4

Canada

19,1

8,2

R.

Cehă

5,4

2,9

R.

Coreea

6,4

3,7

Danemarca

32,9

11,6

Elveţia

36,9

14,4

Finlanda

24,5

9,3

Franţa

24.4

6,3

Germania

26,1

6,8

Grecia

11,4

1,8

Islanda

29,8

9,9

Irlanda

22,3

16,8

Italia

20,3

5,5

Japonia

30,0

3,7

Luxemburg

38,6

34,0

Marea Britanie

23,0

6,2

Mexic

4,4

1,3

Norvegia

32,9

14,4

Noua Zeelandă

13,8

4,9

Olanda

24,1

13,0

Polonia

3,9

0,9

Portugalia

10,6

3,2

Spania

14,1

3,8

S.U.A.

30,5

3,6

Suedia

25,9

11,3

Turcia

3,2

0,7

Ungaria

4,7

1,9

Sursa: OECD în Figures: Statistics on the Member Contries 1999 Edition, Paris,

1999

Se cere:

Să se precizeze rolul fiecărei variabile în analiza legăturii şi să se observe sensul şi forma legăturii între cele două variabile folosind metoda seriilor paralele şi metoda grafică.

Rezolvare

Potrivit teoriei economice a relaţiilor internaţionale, performanţa exterioară a unei ţări depinde, în bună măsură, de cum şi ce anume produce şi oferă spre export economia acelei ţări. Prin urmare, variabila PNB/locuitor se consideră a fi cauza sau variabila independentă (explicativă sau factorială), variantele ei notându-se cu x i , iar variabila export/locuitor este considerată efect sau variabilă dependentă (explicată sau rezultativă),

Statistică teoretică şi economică

variantele notându-se cu y i . Merită menţionat faptul că nivelul exportului/locuior realizat de fiecare ţară depinde, în afară de propriul PNB/locuitor, de mulţi alţi factori, cum ar fi politica comercială şi, în particular, acordurile şi înţelegerile economice la care este parte contractantă, mediul conjunctural specific al diferitelor sectoare etc. În aceste condiţii, mulţimea perechilor de valori (x i , y i ) reflectă o legătură statistică directă, ceea ce poate fi constatat atât grafic (pe măsură ce x i este mai mare, şi y i tinde să fie mai mare), cât şi prio metoda seriilor paralele (ordonând perrechile de valori x i , y i în sensul crescător al variantelor caracteristicii PNB/locuitor). Dispunerea celor 29 de puncte de coordonate x i , y i faţă de sistemul rectangular al axelor de referinţă permite avansarea ipotezei unei legături directe de forma dreptei:

f(x i ) = a +b x i .

Să se estimeze şi comenteze parametrii funcţiei liniare de regresie

Rezolvare Folosind datele din tabelul 66.1. se pot stabili următoarele sume: n = 29; x i =

588,5;

y i = 232,8; x i 2 = 15066,39; y i 2 = 3237,5; x i y i = 6192,56. Pentru estimarea parametrilor acelei drepte pentru care distanţa este minimă până la punctele de coordonate x i , y i , sistemul de ecuaţii normale:

se particularizează astfel:

n a

+

b

x

i

=

y

i



  a

29

a


588,5

∑ ∑∑

x

i

+

b

x

2

i

=

x y

i

i

+

588,5

a

+

b =

15066,39

232,8

b

=

6192,56

Prin rezolvarea sistemului se găseşte:

a = - 1,51 Acest parametru nu are semnificaţie economică. Din punct de vedere geometric este ordonata punctului în care dreapta de regresie intersectează axa Oy. b = + 0,47 Acest parametru se numeşte coeficient de regresie. Prin semn el exprimă, sensul influenţei PNB/locuitor asupra exportului pe locuitor (+ înseamnă influenţă directă), iar prin mărime, cunatumul influenţei (la fiecare creştere cu o unitate a cauzei, variabila efect tinde să se modifice în acelaşi sens cu 0,47 unităţi). Funcţia liniară de regresie:

f (x i ) = - 1,51 + 0,47 x i sintetizează pentru cele 29 de ţări membre ale OCDE tendinţa medie de variaţie a performanţei externe, exprimate prin export/locuitor în anul 1998 sub influenţa exclusivă a PNB/locuitor.

Să se măsoare intensitatea legăturii dintre cele două variabile.

Rezolvare

Întrucât s-a avansat ipoteza unei legături liniare, se poate folosi coeficientul de corelaţie:

Statistică teoretică şi economică

r =

n ∑ x y − ∑ ∑ x y i i i i [ n
n ∑
x y
∑ ∑
x
y
i
i
i
i
[ n
(
)][ 2
)] 2
2
2
x
(
x
n
y
y
i
i
i
i

Introducând datele de mai sus în această relaţie, rezultă r = + 0,7101, ceea ce înseamnă că între PNB/locuitor şi exportul/locuitor al celor 29 ţări există în anul 1998 o legătură directă de intensitate medie. Cum poate fi apreciată capacitatea funcţiei de regresie de a descrie variaţia exportului/locuitor?

Răspuns

De obicei, se procedează la aflarea valorilor teoretice Y i ale caracteristicii rezultative, înlocuind în funcţia identificată argumentul x i cu valorile succesive din tabelul 61.1. (coloana PNB/locuitor). Mulţimea diferenţelor (y i -Y i ) alcătuieşte un domeniu de dispersie în jurul funcţiei de regresie. Intensitatea împrăştierii se exprimă print-un coeficient de eroare a regresiei – formă particulară a coeficientului de variaţie întâlnit la analiza seriilor de repartiţie (vezi şi problemea nr. 67). Ţinând seama de faptul că la punctul anterior al problemei s-a aflat coeficientul de corelaţie r = 0,7191 şi că acest coeficient este cazul particular al indicatorului general de comensurare parametrică a intensităţii legăturii dintre variabile – raport de corelaţie, se ştie că prin ridicarea la pătrat şi înmulţirea cu 100 se află coeficientul de determinaţie

(D): D = r 2 100 = 0,7101 2 100 = 50,43% Coeficientul de determinaţie este o altă modalitate de apreciere a calităţii funcţiei de regresie. El arată că, funcţia sintetizează 50,43% din variaţia totală a exportului/locuitor al ţărilor membre ale OCDE în anul 1998. Cota ridicată a determinaţiei arată implicit faptul că PNB/locuitor este un factor important de influenţă, iar aprecierea liniară a acestei influenţe satisfăcătoare.

6.2. Studiul relaţiei dintre nivelul de calificare şi compartamentul profesional conduce la următoarele constatătri făcute pe un eşantion de 50 de salariaţi:

Comportament profesional Nivel de calificare
Comportament profesional
Nivel de calificare

Corespunzător

Necorespunzător

Calificat

18

7

Necalificat

9

16

Se

alternative.

cere:

să

se

estimeze

intensitatea

asocierii

între

cele

două

variabile

Rezolvare

Dacă se notează: a = 18; b = 7; c = 9; d = 16, atunci coeficientul Yulle de asociere este:

Q

 

ad bc

=

18

16

7

= ad + bc

 

18

16

+

7

9

9 =+ 0,641

Statistică teoretică şi economică

Rezultatatul exprimă o asociere directă de intensitate medie, (totuşi, nu foarte puternică) între nivelul de calificare şi calitatea comportamentului profesional. Există şi alţi factori (în afara nivelului de calificare), care influenţează comportamentul salariaţailor. Observaţie:

Aranjarea corectă a datelor în tabelul de asociere este esenţială: dacă varianta independentă (nivel de calificare începe cu varianta pozitivă (calificat), urmând, apoi varianta alternativă, atunci şi variabila dependentă (calitatea comportamentului profesional) trebuie să fie înregistrată mai întâi cu varianta pozitivă (corespunzător) şi, apoi, cu varianta (necorespunzător). Numai astfel mărimile a şi d exprimă asocierea directă, iar c şi d asocierea inversă.

6.3. O analiză psihologică avansează ipoteza potrivit căreia disponibilitatea cititorului de a se informa folosind concomitent ziare de orientare diferită scade pe măsură ce vârsta acestuia creşte.

În tabel sunt prezentate rezultatele unei anchete întreprinse în rândul populaţiei de

peste 20 de ani dintr-o metropolă europeană (date convenţionale). Printre întrebările anchetei s-au numărat:

-

vârsta persoanei – considerată în continuare ca variabilă factorială sau explicativă;

-

numărul de cotidiane diferite consultate, de obicei, pe parcursul unei săptămâni - variabilă rezultativă care – potrivit ipotezei – ar putea fi explicată, între alte cauze, şi de vârsta cititorului.

-

Număr ziare Vârsta (ani)
Număr ziare
Vârsta (ani)

0 - 2

3 – 5

6 şi peste

Total

20

– 40

7

956

5

712

1 682

15

350

40

– 60

7

548

4

703

1 025

13

276

peste 60

3

718

842

122

4 682

Total

19 222

11 257

2 829

33

308

Se cere:

Să se estimeze parametrii funcţiei liniare de regresie care exprimă influenţa vârstei asupra dorinţei de a utiliza surse diversificate de informare.

Rezolvare

Sistemul de ecuaţii normale pentru estimarea parametrilor unei drepte:

f (x i )

= a + b x i ,

atunci când analiza de regresie se face pe baza unei repartiţii bidimensionale de frecvenţe

se scrie astfel:

n a

b

x n

+

i

x

a

x n

i

x

=

+

b

x

2

i

n

y n

i

x

=

y

∑∑

x y n

i

i

xy

Elementele ajutătoare de calcul se determină folosind notaţiile din tabelul 65.2.

Statistică teoretică şi economică

În acest tabel, s-a notat cu x i centrele intervalelor de grupare după vârsta persoanelor chestionate şi cu y i centrele intervalelor de grupare după numărul ziarelor diferite, consultate într-o săptămână. Tot cu datele din acest tabel se află şi:

∑∑x i y i n xy = 3 509 890

y 1 4 7 Total (n x ) x x i i n x i
y
1
4
7
Total (n x )
x
x
i
i n x
i 2 n x
x
i
30
7
956
5
712
1 682
15
350
460
500
13
815 000
50
7
548
4
703
1 025
13
276
663
800
33
190 000
70
3
718
842
122
4 682
327
740
22
941 800
Total (n y )
19 222
11 257
2 829
33 308
1 452 040
69 946 800
y i n y
19
222
45 028
19 803
84
053
19
222
180 112
138 621
337 955
y i 2 n y

Rezolvarea sistemului de ecuaţii normale:

33308


a

+

1452 040

a

1452 040

b

=

+

69 946800

84 053

b

=

3509890

conduce la următoarele rezultate:

a = + 1,5111; b = 0,0232 iar f (x i ) = 1,5111 – 0 0232 x i În cazul anchetei studiate, se constată că la fiecare creştere cu un an a vârstei persoanei chestionate rezultă o tendinţă medie de reducere a interesului pentru surse diferite de informare cu 0,0232 ziare. Având în vedere amplitudinea mare a vârstei persoanelor, influenţa mică a lui X aszpra lui Y este doar aparentă: dacă la x i = 20 ani o persoană din metropola investigată citeşte în medie f (20) = 1,05 ziare, o persoană de 60 de ani, citeşte în medie doar f (60) = 0,2 ziare. Să se măsoare intensitatea legăturii dintre cele două variabile, folosind rezultatele anchetei.

Rezolvare Coeficientul de corelaţie poate fi obţinut prin utilizarea calculelor ajutătoare din tabelul 65.2 astfel:

n ∑∑ x y n − ∑ x n ⋅ ∑ y n i i
n ∑∑
x
y n
x n
y n
i
i
xy
i
x
i
y
r =
=− 0,1688
,
[
2
2
][
2
2
]
n
(
x
n
)
n
y
n
(
y n
)
i
x
i
y
i
y

ceea ce exprimă o legătură inversă slabă între cele două variabile. Observaţie: Prin ridicarea la pătrat şi înmulţirea cu 100 rezultă un coeficient de determinaţie de numai 2,8%. Interpretarea acestui rezultat: Dacă se consideră o influenţă liniară a lui X asupra lui Y, atunci vârsta diferită a persoanelor explică doar 2,8% din variaţia disparibilităţii cititorilor de a folosi concomitent surse (ziare) diferite pentru informarea lor. Este statistic consistentă o influenţă atât de redusă?

Statistică teoretică şi economică

Răspuns

Aplicarea testului Student (t):

r t = n − p = 31,2544 , 2 1 − r
r
t =
n
− p
= 31,2544
,
2
1 − r

unde: reste valoarea absolută a coeficientului de corelaţie, n este volumul colectivităţii cercetate, iar p = 2 (numărul de parametri ai funcţiei liniare de regresie), rezultă o valoare calculată t = 31,2544 mult mai mare decât valoarea critică tabelară pentru o eroare acceptată α = 0,05 (t = 1,96). Chiar şi pentru o eroare α = 0,0001 influenţa este semnificativă, t fiind tabelat cu 3,891.

6.4. Dintr-o analiză a compartimentului vânzării interne al unei societăţi comerciale specializate în producţia de frigidere rezultă creşterea vânzărilor de la 8200 unităţi

în 1999 la 8740 unităţi în anul 2000, în condiţiile unei ieftiniri reale a produsului cu

4,2%.

În aceeaşi perioadă, veniturile reale ale populaţiei ţării au crescut cu 6,8%. Să se analizeze elasticitatea cererii pentru frigidere atât în raport cu evoluţia preţului de vânzare, cât şi faţă de creşterea veniturilor populaţiei.

Rezolvare

Înainte de a calcula coeficienţii de elasticitate, este necesară determinarea ritmului de

creştere a vânzărilor ca expresie a dinamicii cererii de frigidere. Notând: y 0 = 8200 bucăţi şi y 1 = 8740 bucăţi, rezultă că:

R y

=

y

1

y

0

Y

0

100

= 6,6%

Elasticitatea cererii de frigidere în raport cu ieftinirea produsului se obţine comparând ritmul de creştere a cererii cu ritmul de ieftinire a produsului:

E 1 = R y : R x = 6,6 : 4,2 = 1,57 Cererea de frigidere este elastică faţă de ieftinirea produsului: la fiecare scădere cu !% a preţului, cererea a crescut în perioada 1999-2000 cu 1,57%.

6.5. Producţia şi importul de biciclete au cunoscut în perioada 1990-1996 următoarea evoluţie în România (mii bucăţi):

ANUL

1990

1191

1992

1993

1994

1995

1996

Producţia de biciclete

136

107

67

41

28

22

19

Importul de biciclete

13

18

22

31

28

40

63

Se cere:

Y

să se reprezinte grafic legătura dintre cele două variabile;

să se determine şi interpreteze parametrii funcţiei de regresie liniară;

ˆ

i

= 47,93 2,133 x

i

Răspuns:

Statistică teoretică şi economică

Să se determine valorile ajustate ale variabilei dependente Y; să se analizeze validitatea statistică şi economică a modelului liniar

Răspuns:

 

ˆ

8,90

17,23

28,71

36,17

39,90

41,62

42,48

 

Y

i

să se măsoare int