Sunteți pe pagina 1din 19

Statistică teoretică şi economică

CAPITOLUL 6
ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE
VARIABILE
Cuvinte cheie:
- coeficientul de corelaţie;
- covarianţa;
- coeficientul de asociere propus de Yule;
- coeficientul de corelaţie a rangurilor Spearman;
- coeficientul de corelaţie a rangurilor Kendall
- indicele sau raportul de corelaţie.
- metoda regresiei

In realitatea economică majoritatea legaturilor dintre variabile sunt statistice


pentru ca variabila rezultativă (y) reacţionează nu numai la influenţa lui x ci şi la
influenţa concomitentă a altor variabile.
Orice legatură dintre două variabile poate fi inclusă într-una din următoarele
situaţii:
• legatură univocă, în sensul că x este variabilă factorială (cauzală, independentă,
explicativă), iar y este variabilă rezultativă (efect, dependentă, explicată) şi
influenţa este numai a lui x asupra lui y, fără să existe şi o influenţă a lui y asupra
lui x;
• legatură biunivocă în sensul că x este factor care determină variaţia lui y, dar în
acelaşi timp, y este factor de influenţă al lui x, adică interdependentă;
• evoluţia paralelă a două variabile fără ca între acestea să existe o legatură;
evoluţia paralelă fiind cauzată de o altă variabilă comună;
• simplu paralelism între două variabile între care există o potrivire numerică, dar
nici o legatură logică.

6.1. Tipologia legăturilor statistice.


Legăturile statistice se pot clasifica după mai multe criterii:

a) după numărul caracteristicilor luate în calcul:


¾ legături simple (există o variabilă cauzală şi una rezultativă);
¾ legături multiple (se consideră mai multe variabile cauzale şi efectul lor);

b) după sensul legaturii:


¾ legături directe (creşte x, creşte y);
¾ legături inverse (creşte sau scade x, scade sau creşte y);

c) în funcţie de forma analitică a legăturilor dintre variabile:


¾ legături liniare;
¾ legături curbilinii (parabolă, hiperbolă, exponenţială);
Statistică teoretică şi economică

d) în funcţie de timpul în care se realizează legătura:


¾ legături sincrone (conconitente);
¾ legături asincrone (cu decalaj);

e) după natura variabilelor:


¾ corelaţii statistice între variabile numerice;
¾ asociaţii statistice când intervine o caracteristica nenumerică.

Identificarea legăturii poate fi făcută printr-o serie de metode elementare de


organizare şi prezentare a informaţiilor statistice:
• metoda seriilor paralele;
• metoda grupării;
• metoda tabelului cu dublă intrare;
• metoda grafică.

6.2. Metoda regresiei.


Metoda regresiei este folosită pentru a caracteriza forma şi sensul legăturii dintre
variabile.
Se consideră că între cele două variabile există o interdependenţă în sensul că Yi
este influenţat de Xi.
Metoda regresiei trebuie să ne conducă la obţinerea unei expresii analitice a unei
funcţii de regresie care sintetizeazp forma şi sensul variaţiei lui y sub influenţa factorului
x (sau a factorilor luaţi în considerare).
Dacă acceptam un singur factor, atunci vom avea o regresie simplă sau
unifactorială, funcţia de regresie putând fi lianiară sau curbilinie.
Dacă acceptam doi sau mai mulţi factori, atunci vom obtine o regresie multiplă
sau multifactorială.
Se recomandă să se selecteze factorii în funcţie de importanţa influenţei lor.
Regresia liniară simplă.
Dacă acceptăm că între variabilele Xi şi Yi există o legatură directă de forma
liniară, metoda regresiei ne permite să estimăm parametrii funcţiei:

y i = f ( xi ) = a + b ⋅ xi .

Estimarea parametrilor funcţiei de regresie se face cu metoda celor mai mici


pătrate pe baza sistemului următor:

n ⋅ a + b ⋅ ∑ xi = ∑ y i

a ⋅ ∑ xi + b ⋅ ∑ xi = ∑ xi ⋅ y i .
2

Parametru “b” se numeşte coeficient de regresie şi exprimă sensul şi mărimea


influenţei lui x asupra lui y. Dacă “b” este pozitiv arată o legătură directă; dacă “b” este
negativ arată o legătură indirectă. Mărimea parametrului “b” arată cu cât se modifică
variabila rezultativă la creşterea cu o unitate a factorului de influenţă.
Statistică teoretică şi economică

Regresia simplă curbilinie.


Dintre funcţiile curbilinii în analiza economică şi socială se utilizează frecvent
funcţia polinom de gradul 2:

y i = f ( xi ) = a + b ⋅ xi + c ⋅ xi2 .

Sistemul pentru determinarea parametrilor ecuaţiei este:

n ⋅ a + b ⋅ ∑ xi + c ∑ xi2 = ∑ y i

a ⋅ ∑ x i + b ⋅ ∑ x i + c ⋅ ∑ x i = ∑ x i ⋅ y i
2 3


a ⋅ ∑ xi + b ⋅ ∑ xi + c ⋅ ∑ xi = ∑ xi ⋅ y i .
2 3 4 2

Regresia multiplă.
Regresia multiplă presupune luarea în considerare a influenţei concomitente a doi
sau mai mulţi factori. De exemplu, cea mai simplă funcţie polinomială de gradul unu
este:
y x1 , x2 ,... xk = a 0 + a1 ⋅ x1 + a 2 ⋅ x 2 + ... + a k ⋅ x k .

Parametrii se obţin din rezolvarea sistemului:

n ⋅ a 0 + a1 ⋅ ∑ x1i + ... + a1 ⋅ ∑ x1i + ... + a k ⋅ ∑ x ki = ∑ y i



a 0 ⋅ ∑ x1i + a1 ⋅ ∑ x1i + ... + a1 ⋅ ∑ x1i ⋅ x1i + ... + a k ⋅ ∑ x1i ⋅ x ki = ∑ x1i ⋅ y i
2


a 0 ⋅ ∑ x 2i +a1 ⋅ ∑ x1i ⋅ x 2i + ... + a1 ⋅ ∑ x 2i ⋅ x1i + ...a k ⋅ ∑ x 2i ⋅ x ki = ∑ x 2i ⋅ y i

 ...........
a 0 ⋅ ∑ x ki + a1 ⋅ ∑ x1i ⋅ x ki + ... + a1 ⋅ ∑ x1i ⋅ x ki + ... + a k ⋅ ∑ x ki2 = ∑ x ki ⋅ y i .

Regresia în condiţiile unei repartiţii bidimensionale este utilizată în situaţile în


care observarea statistică se organizează pe colectivităţi numeroase, informaţia culeasă
fiind organizată pe intervale de variaţie ale variabilei factoriale (x) şi ale variabilei
rezultative (y). Pentru estimarea parametrilor de regresie, în cazul ecuaţiei de gradul întâi,
se va folosi următorul sistem:

n ⋅ a + b ⋅ ∑ xi ⋅ n x = ∑ y i ⋅ n y
 .
a ⋅ ∑ xi ⋅ n x + b ⋅ ∑ xi ⋅ n x = ∑∑ xi ⋅ y i ⋅ n xy
2

Pentru caracterizarea functiei de regresie (calitatea functiei de regresie) se


folosesc urmatorii indicatori:
Statistică teoretică şi economică

Eroarea standard (abaterea medie pătratică a valorilor teoretice faţă de cele


reale) este folosită pentru a caracteriza funcţia de regresie sau calitatea funcţiei de
regresie:

S yi / Yi =
∑(y i − Yi ) 2
.
n

Coeficientul de eroare cuantifică intensitatea variaţiei în jurul funcţiei de regresie şi


poate fi considerat tot un indicator care arată calitatea ecuaţiei de regresie:

S yi / Yi
e= ⋅ 100 .
y

Coeficientul de determinaţie reprezintă o altă modalitate de a caracteriza calitatea


funcţiei de regresie (de regulă se trece în dreapta funcţiei de regresie):

 ∑ ( y i − Yi ) 2 
D = 1 −
2
2 
⋅ 100 .
 ∑ ( y i − y ) 

6.3. Metoda corelaţiei parametrice şi neparametrice.


Pentru a exprima intensitatea legăturii dintre variabile se utilizează la alegere
următorii indicatori:
• covarianţa;
• coeficientul de corelaţie;
• indicele sau raportul de corelaţie.

Covarianţa este o mărime absolută a intensităţii legăturii dintre variabile şi se


stabileşte ca medie aritmetică a produselor ( xi − x )( y i − y ) :

1
cov( x, y ) =
n
∑ ( xi − x )( yi − y ).
Dacă rezultatul este egal cu zero sau tinde către zero atunci între variabile nu
există legătură statistică. Dacă rezultatul este pozitiv legătura dintre variabile este directă.
Dacă rezultatul este negativ legătura dintre variabile este inversă. Valoarea maximă pe
care o poate lua covarianţa a două variabile este egală cu produsul dintre abaterea medie
pătratică a celor două variabile şi este întâlnită în cazul unei legături perfecte:

cov( x, y ) max = σ x ⋅ σ y .

Coeficientul de corelaţie măsoară intensitatea legăturii dintre două variabile şi se


calculează prin compararea covarianţei empirice, reale, cu valoarea maximă pe care o
Statistică teoretică şi economică

poate avea covarianţa. Coeficientul de corelaţie arată intensitatea şi sensul legăturii


dintre variabile.

rxy =
cov( x, y )
=
∑ (x i − x )( y i − y )
.
σ x ⋅σ y n ⋅σ x ⋅σ y

De asemenea, este folosită şi următoarea formulă dedusă din cea de mai sus:
n ⋅ ∑ x i ⋅ y i − ∑ xi ⋅ ∑ y i
rxy = .
[n ⋅ ∑ xi2 − (∑ xi ) 2 ][n ⋅ ∑ y i2 − (∑ yi ) 2 ]

În practica social-economică se utilizează următoarele interpretări ale


coeficientului de corelaţie:
rxy ∈ (0;0,2) , fie că nu există legătură, fie că legătura este foarte slabă;
rxy ∈ (0,2;0,5) , legătura este slabă şi necesită aplicarea unui test de verificare
a semnificaţiei statistice a acestei legături (testul Student);
rxy ∈ (0,5;0,75) , legătura este de intensitate medie;
rxy ∈ (0,75;0,95) , legătura este puternică;
rxy ∈ (0,95;1) , legătura este foarte puternică, cvasifuncţională.

Pentru legătura dintre variabile pentru repartiţia de frecvenţe, vom avea


următoarea relaţie:

n ⋅ ∑∑ xi ⋅ y i ⋅ n xy − ∑ xi ⋅ n x ⋅ ∑ y i ⋅ n y
rxy = .
[n ⋅ ∑ xi2 ⋅ n x − (∑ xi ⋅ n x ) 2 ][n ⋅ ∑ y i2 ⋅ n y − (∑ y i ⋅ n y ) 2 ]

Testul Student (testul t):

rxy
t= ⋅ n − 2.
1 − rxy2

Pentru a accepta ipoteza unei legături reale, valoarea calculată a lui “t” trebuie să
fie mai mare decât valoarea tabelată pentru “n-2” grade de libertate.

Raportul de corelaţie are o aplicabilitate universală pentru măsurarea intensităţii


legăturii dintre variabile indiferent de câte variabile luăm în calcul şi indiferent de forma
relaţiei dintre variabile. Raportul de corelaţie nu arată şi sensul legăturii dintre variabile,
ci numai intensitatea legăturii.
Statistică teoretică şi economică

R xy = 1−
∑(y i − Yi ) 2
.
∑(y i − y) 2

Raportul de corelaţie are acelaşi domeniu şi subdomenii de definire ca şi


coeficientul de corelaţie.
Ori de câte ori una sau mai multe variabile luate în calcul sunt nenumerice
(calitative, nominative) formulele corelaţiei parametrice devin înoperante.
Nu numai aceste variabile se pot trata prin metode nemarametrice ci chiar şi
variabilele numerice pot fi transformate în serii de ranguri (numere de ordine) sau în
variabile alternative.
Metodele neparametrice sunt:
• coeficientul de asociere propus de Yule;
• coeficientul de corelaţie a rangurilor Spearman;
• coeficientul de corelaţie a rangurilor Kendall.

De exemplu, dintr-un total de 3890 persoane care au achizitionat produse în timpul


unei săptămâni dintr-un magazin de cosmetice, 1350 sunt clienţi permananţi şi 2540 ocazionali. Din
acelaşi total 2590 sunt femei şi 1300 barbaţi. Se pune întrebarea dacă între fidelitatea faţă de
magazin şi clienţi se află o anumită legătură.

Barbaţi Femei Total


Clienţi permananţi 304 1046 1350
Clienţi ocazionali 996 1544 2540
Total 1300 2590 3890

Coeficientul de asociere Yule se utilizează atunci când unităţile caracteristicii


sunt separate în două grupe sau sunt de forma unei caracteristici alternative:

X Y Total
Y1 Y2
X1 A B A+B
X2 C D C+D
Total A+C B+D A+B+C+D

Pentru exprimarea intensitatii celor doua variabile se utilizeaza un coefficient de


asociere calculat astfel:

A⋅ D − B ⋅C
Q= .
A⋅ D + B ⋅C

Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie.


In cazul exemplului nostru rezultatul este Q = - 0,3788; rezultand o asociere
inversa intre sex si tipul de client in sensul ca nu barbatii sunt clienti permanenti, ci
femeile. Sau nu este adevarat ca fameile sunt cliente ocazionale.
Statistică teoretică şi economică

Coeficientul de corelaţie a rangurilor Spearman exprimă intensitatea şi sensul


legăturii dintre rangurilor celor “n” unităţi:

6 ⋅ ∑ d i2
rS = 1 − .
n(n − 1)

Pătratul diferenţei dintre rangurile atribuite aceleaşi unităţi este notat cu d i2 .


Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie.

Coeficientul de corelaţie a rangurilor Kendall este destinat tot analizei


intensităţii legăturii dintre rangurile celor n unităţi:

2⋅S
rK = .
n(n − 1)

Suma dintre numărul de ranguri superioare fiecărui rang şi numărul de ranguri


inferioare fiecărui rang se numeşte scor şi este notată cu S. Interpretarea rezultatului este
identică cu cea de la coeficientul de corelaţie.
Coeficientul de asociere al lui Yule, coeficientul de corelaţie a rangurilor
Spearman şi coeficientul de corelaţie a rangurilor Kendall fac parte din analiza corelaţiei
neparametrice.
Statistică teoretică şi economică

Probleme şi aplicaţii
6.1. Potrivit publicaţiilor OCDE, ţările membre s-au caracterizat în anul 1998 prin
niveluri ale performanţei interne (exprimate prin indicatorul PNB/locuitor) şi,
respectiv, ale performanţei externe (sintetizate sub forma exportului de bunuri şi
servicii/locuitor) cuprinse în tabelul de mai jos:
mii USD
Ţara PNB/locuitor Export de bunuri şi
servicii/locuitor
Australia 18,7 4,5
Austria 26,2 10,8
Belgia 24,4 17,4
Canada 19,1 8,2
R. Cehă 5,4 2,9
R. Coreea 6,4 3,7
Danemarca 32,9 11,6
Elveţia 36,9 14,4
Finlanda 24,5 9,3
Franţa 24.4 6,3
Germania 26,1 6,8
Grecia 11,4 1,8
Islanda 29,8 9,9
Irlanda 22,3 16,8
Italia 20,3 5,5
Japonia 30,0 3,7
Luxemburg 38,6 34,0
Marea Britanie 23,0 6,2
Mexic 4,4 1,3
Norvegia 32,9 14,4
Noua Zeelandă 13,8 4,9
Olanda 24,1 13,0
Polonia 3,9 0,9
Portugalia 10,6 3,2
Spania 14,1 3,8
S.U.A. 30,5 3,6
Suedia 25,9 11,3
Turcia 3,2 0,7
Ungaria 4,7 1,9

Sursa: OECD în Figures: Statistics on the Member Contries 1999 Edition, Paris,
1999
Se cere:
Să se precizeze rolul fiecărei variabile în analiza legăturii şi să se observe sensul
şi forma legăturii între cele două variabile folosind metoda seriilor paralele şi metoda
grafică.
Rezolvare
Potrivit teoriei economice a relaţiilor internaţionale, performanţa exterioară a unei
ţări depinde, în bună măsură, de cum şi ce anume produce şi oferă spre export economia
acelei ţări. Prin urmare, variabila PNB/locuitor se consideră a fi cauza sau variabila
independentă (explicativă sau factorială), variantele ei notându-se cu xi, iar variabila
export/locuitor este considerată efect sau variabilă dependentă (explicată sau rezultativă),
Statistică teoretică şi economică

variantele notându-se cu yi . Merită menţionat faptul că nivelul exportului/locuior realizat


de fiecare ţară depinde, în afară de propriul PNB/locuitor, de mulţi alţi factori, cum ar fi
politica comercială şi, în particular, acordurile şi înţelegerile economice la care este parte
contractantă, mediul conjunctural specific al diferitelor sectoare etc. În aceste condiţii,
mulţimea perechilor de valori (xi , yi ) reflectă o legătură statistică directă, ceea ce poate fi
constatat atât grafic (pe măsură ce xi este mai mare, şi yi tinde să fie mai mare), cât şi prio
metoda seriilor paralele (ordonând perrechile de valori xi, yi în sensul crescător al
variantelor caracteristicii PNB/locuitor).
Dispunerea celor 29 de puncte de coordonate xi, yi faţă de sistemul rectangular al
axelor de referinţă permite avansarea ipotezei unei legături directe de forma dreptei:
f(xi) = a +b xi.
¾ Să se estimeze şi comenteze parametrii funcţiei liniare de regresie
Rezolvare
Folosind datele din tabelul 66.1. se pot stabili următoarele sume: n = 29; ∑xi =
588,5;
∑yi = 232,8; ∑xi2 = 15066,39; ∑yi2 = 3237,5; ∑xi yi = 6192,56.
Pentru estimarea parametrilor acelei drepte pentru care distanţa este minimă până
la punctele de coordonate xi, yi, sistemul de ecuaţii normale:

n a + b ∑ x i = ∑ y i

a ∑ x i + b∑ x i = ∑ x i y i
2

se particularizează astfel:

29 a + 588,5 b = 232,8



588,5 a + 15066,39 b = 6192,56

Prin rezolvarea sistemului se găseşte:


a = - 1,51 Acest parametru nu are semnificaţie economică. Din punct de vedere
geometric este ordonata punctului în care dreapta de regresie
intersectează axa Oy.
b = + 0,47 Acest parametru se numeşte coeficient de regresie. Prin semn el exprimă,
sensul influenţei PNB/locuitor asupra exportului pe locuitor (+ înseamnă influenţă
directă), iar prin mărime, cunatumul influenţei (la fiecare creştere cu o unitate a cauzei,
variabila efect tinde să se modifice în acelaşi sens cu 0,47 unităţi).
Funcţia liniară de regresie:
f (xi) = - 1,51 + 0,47 xi
sintetizează pentru cele 29 de ţări membre ale OCDE tendinţa medie de variaţie a
performanţei externe, exprimate prin export/locuitor în anul 1998 sub influenţa exclusivă
a PNB/locuitor.
¾ Să se măsoare intensitatea legăturii dintre cele două variabile.
Rezolvare
Întrucât s-a avansat ipoteza unei legături liniare, se poate folosi coeficientul de corelaţie:
Statistică teoretică şi economică

n∑ x i y i − ∑ x i ∑ y i
r=
[n∑ x 2
i
2
][
− (∑ x i ) n∑ y i2 − (∑ y i )
2
]
Introducând datele de mai sus în această relaţie, rezultă r = + 0,7101, ceea ce
înseamnă că între PNB/locuitor şi exportul/locuitor al celor 29 ţări există în anul 1998 o
legătură directă de intensitate medie.
¾ Cum poate fi apreciată capacitatea funcţiei de regresie de a descrie
variaţia exportului/locuitor?
Răspuns
De obicei, se procedează la aflarea valorilor teoretice Yi ale caracteristicii
rezultative, înlocuind în funcţia identificată argumentul xi cu valorile succesive din
tabelul 61.1. (coloana PNB/locuitor).
Mulţimea diferenţelor (yi-Yi) alcătuieşte un domeniu de dispersie în jurul funcţiei
de regresie. Intensitatea împrăştierii se exprimă print-un coeficient de eroare a regresiei –
formă particulară a coeficientului de variaţie întâlnit la analiza seriilor de repartiţie (vezi
şi problemea nr. 67).
Ţinând seama de faptul că la punctul anterior al problemei s-a aflat coeficientul de
corelaţie r = 0,7191 şi că acest coeficient este cazul particular al indicatorului general de
comensurare parametrică a intensităţii legăturii dintre variabile – raport de corelaţie, se
ştie că prin ridicarea la pătrat şi înmulţirea cu 100 se află coeficientul de determinaţie
(D):
D = r2 ⋅ 100 = 0,71012 ⋅100 = 50,43%
Coeficientul de determinaţie este o altă modalitate de apreciere a calităţii funcţiei
de regresie. El arată că, funcţia sintetizează 50,43% din variaţia totală a
exportului/locuitor al ţărilor membre ale OCDE în anul 1998. Cota ridicată a
determinaţiei arată implicit faptul că PNB/locuitor este un factor important de influenţă,
iar aprecierea liniară a acestei influenţe satisfăcătoare.

6.2. Studiul relaţiei dintre nivelul de calificare şi compartamentul profesional


conduce la următoarele constatătri făcute pe un eşantion de 50 de salariaţi:

Comportament profesional Corespunzător Necorespunzător

Nivel de calificare
Calificat 18 7
Necalificat 9 16

¾ Se cere: să se estimeze intensitatea asocierii între cele două variabile


alternative.
Rezolvare
Dacă se notează: a = 18; b = 7; c = 9; d = 16, atunci coeficientul Yulle de asociere este:

ad − bc 18 ⋅ 16 − 7 ⋅ 9
Q= = = +0,641
ad + bc 18 ⋅ 16 + 7 ⋅ 9
Statistică teoretică şi economică

Rezultatatul exprimă o asociere directă de intensitate medie, (totuşi, nu foarte


puternică) între nivelul de calificare şi calitatea comportamentului profesional. Există şi
alţi factori (în afara nivelului de calificare), care influenţează comportamentul
salariaţailor.
Observaţie:
Aranjarea corectă a datelor în tabelul de asociere este esenţială: dacă varianta
independentă (nivel de calificare începe cu varianta pozitivă (calificat), urmând, apoi
varianta alternativă, atunci şi variabila dependentă (calitatea comportamentului
profesional) trebuie să fie înregistrată mai întâi cu varianta pozitivă (corespunzător) şi,
apoi, cu varianta (necorespunzător). Numai astfel mărimile a şi d exprimă asocierea
directă, iar c şi d asocierea inversă.

6.3. O analiză psihologică avansează ipoteza potrivit căreia disponibilitatea


cititorului de a se informa folosind concomitent ziare de orientare diferită scade pe
măsură ce vârsta acestuia creşte.
În tabel sunt prezentate rezultatele unei anchete întreprinse în rândul populaţiei de
peste 20 de ani dintr-o metropolă europeană (date convenţionale).
Printre întrebările anchetei s-au numărat:
- vârsta persoanei – considerată în continuare ca variabilă factorială sau
explicativă;
- numărul de cotidiane diferite consultate, de obicei, pe parcursul unei
săptămâni - variabilă rezultativă care – potrivit ipotezei – ar putea fi
explicată, între alte cauze, şi de vârsta cititorului.
-
Număr ziare 0-2 3–5 6 şi peste Total

Vârsta (ani)
20 – 40 7 956 5 712 1 682 15 350
40 – 60 7 548 4 703 1 025 13 276
peste 60 3 718 842 122 4 682
Total 19 222 11 257 2 829 33 308
Se cere:
¾ Să se estimeze parametrii funcţiei liniare de regresie care exprimă influenţa
vârstei asupra dorinţei de a utiliza surse diversificate de informare.
Rezolvare
Sistemul de ecuaţii normale pentru estimarea parametrilor unei drepte:
f (xi) = a + b xi ,
atunci când analiza de regresie se face pe baza unei repartiţii bidimensionale de frecvenţe
se scrie astfel:

n a + b∑ x i n x = ∑ y i n y

a ∑ x i n x + b∑ x i n x = ∑ ∑ x i y i n xy
2

Elementele ajutătoare de calcul se determină folosind notaţiile din tabelul 65.2.


Statistică teoretică şi economică

În acest tabel, s-a notat cu xi centrele intervalelor de grupare după vârsta


persoanelor chestionate şi cu yi centrele intervalelor de grupare după numărul ziarelor
diferite, consultate într-o săptămână.
Tot cu datele din acest tabel se află şi:
∑∑xiyinxy = 3 509 890

yi 1 4 7 Total (nx) xinx xi2nx


xi
30 7 956 5 712 1 682 15 350 460 500 13 815 000
50 7 548 4 703 1 025 13 276 663 800 33 190 000
70 3 718 842 122 4 682 327 740 22 941 800
Total (ny) 19 222 11 257 2 829 33 308 1 452 040 69 946 800
yi ny 19 222 45 028 19 803 84 053
yi2ny 19 222 180 112 138 621 337 955

Rezolvarea sistemului de ecuaţii normale:


33 308 a + 1 452 040 b = 84 053

1 452 040 a + 69 946 800 b = 3 509 890

conduce la următoarele rezultate:


a = + 1,5111; b = 0,0232
iar f (xi) = 1,5111 – 0 0232 xi
În cazul anchetei studiate, se constată că la fiecare creştere cu un an a vârstei
persoanei chestionate rezultă o tendinţă medie de reducere a interesului pentru surse
diferite de informare cu 0,0232 ziare. Având în vedere amplitudinea mare a vârstei
persoanelor, influenţa mică a lui X aszpra lui Y este doar aparentă: dacă la xi = 20 ani o
persoană din metropola investigată citeşte în medie f (20) = 1,05 ziare, o persoană de 60
de ani, citeşte în medie doar f (60) = 0,2 ziare.
¾ Să se măsoare intensitatea legăturii dintre cele două variabile, folosind rezultatele
anchetei.
Rezolvare
Coeficientul de corelaţie poate fi obţinut prin utilizarea calculelor ajutătoare
din tabelul 65.2 astfel:

n∑ ∑ x i y i n xy − ∑ x i n x ⋅ ∑ y i n y
r= = −0,1688 ,
[n∑ ( x n ) ][n∑ y
2
i x
2 2
i n y − (∑ y i n y ) 2 ]
ceea ce exprimă o legătură inversă slabă între cele două variabile.
Observaţie: Prin ridicarea la pătrat şi înmulţirea cu 100 rezultă un coeficient de
determinaţie de numai 2,8%. Interpretarea acestui rezultat: Dacă se consideră o influenţă
liniară a lui X asupra lui Y, atunci vârsta diferită a persoanelor explică doar 2,8% din
variaţia disparibilităţii cititorilor de a folosi concomitent surse (ziare) diferite pentru
informarea lor.
¾ Este statistic consistentă o influenţă atât de redusă?
Statistică teoretică şi economică

Răspuns
Aplicarea testului Student (t):

r
t= n − p = 31,2544 ,
1− r2

unde: r este valoarea absolută a coeficientului de corelaţie, n este volumul


colectivităţii cercetate, iar p = 2 (numărul de parametri ai funcţiei liniare de regresie),
rezultă o valoare calculată t = 31,2544 mult mai mare decât valoarea critică tabelară
pentru o eroare acceptată α = 0,05 (t = 1,96). Chiar şi pentru o eroare α = 0,0001
influenţa este semnificativă, t fiind tabelat cu 3,891.

6.4. Dintr-o analiză a compartimentului vânzării interne al unei societăţi comerciale


specializate în producţia de frigidere rezultă creşterea vânzărilor de la 8200 unităţi
în 1999 la 8740 unităţi în anul 2000, în condiţiile unei ieftiniri reale a produsului cu
4,2%.
În aceeaşi perioadă, veniturile reale ale populaţiei ţării au crescut cu 6,8%.
¾ Să se analizeze elasticitatea cererii pentru frigidere atât în raport cu evoluţia
preţului de vânzare, cât şi faţă de creşterea veniturilor populaţiei.
Rezolvare
Înainte de a calcula coeficienţii de elasticitate, este necesară determinarea ritmului de
creştere a vânzărilor ca expresie a dinamicii cererii
de frigidere.
Notând: y0 = 8200 bucăţi şi y1 = 8740 bucăţi, rezultă că:

y1 − y 0
Ry = ⋅ 100 = 6,6%
Y0

Elasticitatea cererii de frigidere în raport cu ieftinirea produsului se obţine


comparând ritmul de creştere a cererii cu ritmul de ieftinire a produsului:
E1 = Ry : Rx = 6,6 : 4,2 = 1,57
Cererea de frigidere este elastică faţă de ieftinirea produsului: la fiecare scădere
cu !% a preţului, cererea a crescut în perioada 1999-2000 cu 1,57%.

6.5. Producţia şi importul de biciclete au cunoscut în perioada 1990-1996


următoarea evoluţie în România (mii bucăţi):

ANUL 1990 1191 1992 1993 1994 1995 1996


Producţia de biciclete 136 107 67 41 28 22 19
Importul de biciclete 13 18 22 31 28 40 63

Se cere:
¾ să se reprezinte grafic legătura dintre cele două variabile;
¾ să se determine şi interpreteze parametrii funcţiei de regresie liniară;
Răspuns: Yˆi = 47,93 − 2,133 ⋅ x i
Statistică teoretică şi economică

¾ Să se determine valorile ajustate ale variabilei dependente Y; să se analizeze


validitatea statistică şi economică a modelului liniar
Răspuns:
Yˆi
8,90 17,23 28,71 36,17 39,90 41,62 42,48

¾ să se măsoare intensitatea legăturii dintre cele două variabile cu ajutorul


coeficientului de corelaţie şi a raportului de corelaţie;
Răspuns: r = - 0,78; R = 0,78

6.6. Comerţul exterior al României cu Danemarca a evoluat în perioada 1991-1998


astfel (mil USD):

ANUL 1991 1992 1993 1994 1995 1996 1997 1998


Export 2 4 6 9 15 14 16 23
Import 9 21 48 46 55 87 50 70

Se cere:
¾ să se reprezinte grafic relaţia export-import;
¾ să se determine şi comenteze parametrii funcţiei liniare de regresie;
Răspuns: a = 0,35; b = 0,2233
Notă: Ecuaţia liniară se consideră de forma yi = a + b ⋅ xi
¾ să se caracterizeze intensitatea legăturii dintre export şi import
Răspuns: R = 0,78

6.7. Este cunoscut faptul că există o legătură inversă între dinamica producţiei
industriale şi rata şomajului, astfel încât, atunci când rata şomajului scade,
producţia industrială creşte şi invers. Să se verifice această ipoteză folosind
următoarele date:

Ţara Producţia industrială Rata şomajului


(% de modificare) (%)
Australia 6,2 7,4
Belgia 0,7 10,9
Canada 5,4 7,7
Germania 2,3 8,9
Olanda 0,1 14,0
Italia 7,8 15,7
Japonia 12,8 2,6
Elveţia 5,6 20,1
Marea Britanie 3,3 9,0
S.U.A. 5,7 5,4

Se cere:
¾ Să se determine şi interpreteze coeficientul de corelaţie;
Statistică teoretică şi economică

Răspuns: r = - 0,36
¾ Să se testeze semnificaţia statistică a coeficientului obţinut, admiţând o eroare
α = 0,05
Răspuns: tcalc = 1,091, faţă de nivelul critic tabelat de 2,306 pentru α = 0,05 şi k = 8
grade de libertate
¾ Să se determine coeficienţii de corelaţie neparametrică Spearman şi Kendall .
Răspuns: CSpearman = - 0,36; CKendall = - 0,16
¾ Să se estimeze şi interpreteze parametrii funcţiei liniare de regresie.
Răspuns: a = 7.59; b = -0.256

6.8. Dintr-o anchetă statistică efectuată de o firmă asupra unor aspecte cu caracter
social şi economic, au rezultate următoarele aprecieri:

Aspecte social-economice Ranguri Ranguri


stabilite de stabilite de
salariaţi patroni
Aprecierea muncii bine făcute 1 8
Sentimentul de implicare la 2 10
realizarea producţiei
Problemele personale 3 9
Securitata muncii 4 2
Salarii 5 1
Interesul faţă de muncă 6 5
Organizara muncii 7 3
Localitatea angajaţilor 8 6
Condiţii de lucru 9 4
Disciplina 10 7

Se cere:
¾ Să se stabilească intensitata asocierii dintre cele două feluri de aprecieri
folosind de coeficienţii de corelaţie neparametrică (Spearman şi Kendall) între
cele două opţiuni;
Răspuns: CSpearman = -0,36; CKendall = - 0,16.

6.9. Cercetând relaţia dintre numărul investitorilor străini provenind dintr-o ţară şi
volumul capitalului investit de aceştia în România, este logic să se avanseze ipoteza
unei asocieri directe între cele două variabile. Această ipoteză se studiază folosind
datele referitoare la primele 40 de ţări care au efectuat investiţii în România în anul
″t″.
În tabelul de mai jos, cele două variabile numerice ″număr investitoi″ şi ″capital
investit″ au fost comprimate sub forma a două variabile alternative ţinând cont de
numărul mediu al investitorilor din fiecare ţară şi respectiv de volumul mediu al
capitalului provenit din fiecare ţară.

Capital investit Peste medie Sub medie


Număr investitori
Peste medie 5 5
Sub medie 9 21
Statistică teoretică şi economică

Să se determine şi comenteze intensitatea asocierii dintre cele două variabile.


Răspuns: + 0,4. O asociere directă destul de modestă din punct de vedere al intensităţii

6.10. Un analist de marketing urmăreşte în cinci luni efectul acţiunilor de publicitate


(x) veniturilor obţinute din vânzări (y). El înregistrează în acest sens cheltuieli de
productivitate milioane lei şi încasări din vânzări sute de milioane lei. În urma
prelucrării datelor a obţinut:

Σxi = 15;
Σyi = 10;
Σxi2 = 55; şi
Σxiyi = 37 (i = 1,5 ).

Analistul a stabilit pe baza unor teste specifice că dependenţa dintre variabile


situate este liniară. Ecuaţia dreptei de regresie este:

a) ŷ = 0,7x;
b) ŷ = 0,7 – 0,1x;
c) ŷ = 0,1 – 0,7x;
d) ŷ = 2 – 0,7x;
e) ŷ = 3,7 – 5,5x;

6.11. Legătura dintre raportul de corelaţie (R) şi raportul F utilizat în testarea


validităţii modelului liniar de regresie este exprimată prin relaţia:
6.12.
1− R2
a) F = (n − 2) ;
R2
R2
b) F= ;
1− R2
R2
c) F = ;
(1 − R 2 )(n − 2)
R2
d) F = (n − 2) ;
1− R2
R2 +1
e) F = (n − 2) ;
1− R2

6.13. Să se analizeze evoluţia pieţei televiziunii prin cablu din România, folosind
datele referitoare la perioada 1990-1999 preluate din revista ″Capital″ nr.
47/23 noiembrie 2000:

ANUL 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Tarif mediu 0,01 0,03 0,40 0,80 1,30 1,80 2,30 2,70 3,00 3,20
lunar (USD)
Statistică teoretică şi economică

Nr. abonaţi 0,70 0,90 1,00 1,50 2,00 2,50 3,30 3,20 3,10 3,10
(milioane)

Recomandare
Se va elabora o diagramă de corelaţie. Pe baza acestei diagrame se alege forma
funcţiei de regresie. Pentru aprecierea intensităţii legăturii, se va folosi raportul de
corelaţie. Se pot folosi şi coeficienţi de elasticitate a evoluţiei, numărului de abonaţi faţă
de mişcarea tarifului mediu lunar, în diferitele intervale ale perioadei analizate.

6.13. Cum apreciaţi elasticitatea vânzărilor în raport cu creşterea veniturilor


populaţiei
a) elastică;
b) elasticitate unitară;
c) inelastică;
dacă într-o perioadă de trei ani vânzările au sporit cu 8,7%, iar veniturile cu
4,6%.
Justificaţi opţiunea făcută.

6.14. Este cunoscut faptul că există o legătură inversă între producţia industrială şi
rata şomajului, astfel încât atunci când rata şomajului scade, producţia industrială
creşte. În acest sens se cunosc următoarele date:

(date convenţionale)
Ţara Producţia industrială Rata şomajului
(% de modificare) (%)
Australia 6,2 7,4
Belgia 0,7 10,9
Canada 5,4 7,7
Germania 2,3 8,9
Olanda 0,1 14,0
Italia 7,8 15,7
Japonia 12,8 2,6
Elveţia 5,6 20,1
Marea Britanie 3,3 9,0
S.U.A. 5,7 5,4

Se cere:
1. să se determine ecuaţia de regresie dintre cele două variabile;
2. să se calculeze coeficentul de corelaţie;
3. să se calculeze coeficientul rangurilor Spearman şi Kendall şi să se compare cu
rezultatul obţinut la punctul anterior.

6.15. Datele următoare arată numărul de bacterii existente pe o lamelă la sfârşitul


fiecărei ore pe o perioadă de şase ore:
(date convenţionale)
Ora 1 2 3 4 5 6
Număr de bacterii 10 50 200 765 3070 12280
Statistică teoretică şi economică

Se cere:
1. utilizând metoda celor mai mici pătrate şi cunoscând că cele două fenomene evoluează
exponenţial să se determine ecuaţia de regresie;
2. să se calculeze, pe baza ecuaţiei de regresie obţinută la punctul anterior, numărul de
bacterii după şapte ore.

6.16. Preţul pe bucată în mii lei este dat de variabila “x” şi numărul de produse
vândute pe lună timp de 8 luni “y” sunt reprezentate în tabelul următor:

(date convenţionale)
X 12 13 14 12 14 15 17 19
Y 28 20 20 25 16 12 10 7

Se cere:
1. găsiţi ecuaţia de regresie liniară;
2. estimaţi numărul de produse vândute atunci când preţul pe unitate este 18.

6.17. Se cunoaşte că decizia managerială în ceea ce priveşte creşterea vânzărilor la


un magazin de încălţăminte se ia şi funcţie de mărimea suprafeţei destinate vânzării.
Astfel, magazinul prezintă următoarea situaţie:

(date convenţionale)
Suprafaţa comercială (mp) Valoarea vânzărilor (mil.lei)
50 8
120 14
180 20
210 24
250 30
300 42

Se cere:
1. să se stabilească parametrii ecuaţiei de regresie dintre cele două variabile;
2. să se determine coeficientul de corelaţie dintre variabile;
3. dacă managerul magazinului doreşte să mărească suprafaţa destinată vânzării la 350
mp., să se determine valoarea scontată a vânzărilor având la bază legătura liniară dintre
variabile.

6.18. Comerţul exterior al României cu câteva ţări europene prezintă următoarea


situaţie în 1996 (mil.$):
Ţara Export Import
Austria 169 349
Belgia 124 185
Danemarca 14 87
Germania 1486 2008
Grecia 177 186
Olanda 343 266
Spania 95 102
Suedia 44 77
Regatul Unit 248 330
Statistică teoretică şi economică

Sursa: Anuarul de comerţ exterior al României, 1997, C.N.S., pag.17.

Se cere:
1. considerând relaţia dintre export şi import de formă liniară, să se determine şi să se
interpreteze parametrii funcţiei de regresie;
2. să se măsoare şi să se comenteze intensitatea legăturii dintre cele două variabile
folosind o metodă parametrică şi una neparametrică.

S-ar putea să vă placă și