Sunteți pe pagina 1din 50

Capitolul 6

SERIILE INTERDEPENDENTE

Statistica studiază legăturile cauzale dintre fenomenele şi


procesele economice. Datorită caracterului complex al fenomenelor şi
datorită multitudinii de factori esenţiali şi întâmplători care intervin,
aceste legături se manifestă sub formă de tendinţă; ele pot fi identificate în
condiţiile acţiunii legii numerelor mari, în colectivităţile de volum ridicat.
O problemă importantă în cadrul analizei seriilor interdependente
o reprezintă identificarea legăturilor cu adevărat semnificative şi stabile.
În cazul în care s-a stabilit că între două variabile există un raport de
dependenţă, se ridică o altă problemă, mult mai dificilă: găsirea unei
măsuri a acestei legături, prin intermediul unui indicator sintetic de
corelaţie.
Există însă şi situaţii înşelătoare, în care variaţiile (creşterea sau
scăderea) celor două fenomene aparent interdependente sunt similare, dar
nu există nici o legătură logică între ele. De exemplu, în ultimii ani în
România cresc simultan atât rata sărăciei, cât şi înzestrarea populaţiei cu
telefoane mobile. Alteori explicaţia tendinţei de asociere a celor două
variabile este dată de existenţa unei cauze comune. De exemplu, creşterea
simultană şi semnificativă a vânzărilor la pulovere de lână şi la
medicamente antigripale are aceeaşi cauză: venirea iernii. Analiza
calitativă a datelor statistice rezolvă probleme de acest tip.

6.1 TIPURI DE LEGĂTURI

Analiza seriilor interdependente urmăreşte verificarea existenţei şi


măsurarea intensităţii legăturilor dintre fenomene.
Cu cât fenomenele sunt mai complexe, cu atât numărul factorilor
care le influenţează este mai mare, ceea ce face legăturile cauzale dificil
de evidenţiat. Analiza dependenţelor se complică atunci când factorii de
influenţă intercondiţionează determinând apariţia de cauzalităţi în lanţ.
Pentru a putea determina intensitatea relaţiilor de corelaţie, este
necesar să se analizeze, în primul rând, conţinutul şi forma acestor relaţii.
STATISTICA

În cele ce urmează vom nota cu y fenomenul a cărui variaţie este


influenţată (variabilă dependentă sau rezultativă) şi cu x factorul de
influenţă (variabila independentă sau factorială).

• După natura legăturilor de interdependenţă deosebim două


categorii de relaţii: funcţionale (deterministe) şi stohastice
(statistice).
a) Funcţionale: y = f (x).
Fenomenul cauză x determină în mod univoc fenomenul efect y,
astfel încât unei valori a variabilei x îi corespunde o valoare unică a
variabilei y. De exemplu, valoarea investiţiilor finalizate într-o perioadă
determină direct valoarea sporului de capital fix.
Frecvente în domeniul tehnic, legăturile funcţionale sunt rareori
întâlnite în economie.
b) Stohastice: y = f (x1 , x2 ,..., xn).
Fenomenul efect este influenţat de o multitudine de factori,
esenţiali şi întâmplători. Unei valori a fenomenului cauză xi îi pot
corespunde mai multe valori diferite ale fenomenului efect y, în funcţie de
acţiunea combinată a celorlalţi factori de influenţă. De exemplu, mărimea
profitului depinde de cantitatea produsă, preţurile unitare ale produselor,
costul unitar, impozitul pe profit etc.; cheltuielile de consum ale unei
persoane depind de venituri, vârstă, sex, situaţia familială, starea de sănă-
tate etc.
Fiecare caracteristică xi determină numai o parte a variaţiei
fenomenului y, restul variaţiei fiind explicat prin alte caracteristici, care
din punct de vedere al legăturii xi -y sunt întâmplătoare.
Variaţia fenomenului y poate fi analizată în funcţie de unul sau
mai mulţi factori de influenţă (x1, x2,... , xn), dar întotdeauna va rămâne o
variaţie neexplicată, determinată de factorii neînregistraţi.
În cazul în care se identifică şi se analizează factorii de influenţă
esenţiali, componenta aleatoare, care sintetizează acţiunea factorilor
întâmplători, va avea o pondere redusă şi nu va influenţa semnificativ
veridicitatea rezultatelor.
Legăturile stohastice sunt specifice fenomenelor din societate şi
economie.
Extrema diversitate a legăturilor stohastice impune sistematizarea
lor după mai multe criterii.
Seriile interdependente

• După numărul caracteristicilor analizate, legăturile stohastice


pot fi simple sau multiple.
a) Legături simple - se alege o singură caracteristică determinantă
pentru variaţia fenomenului y, toate celelalte caracteristici care îl
influenţează, fie că sunt esenţiale sau întâmplătoare, fiind considerate cu
acţiune constantă.
De exemplu, analiza legăturii dintre salariu şi productivitate,
dintre producţie şi numărul muncitorilor, dintre recolta totală şi suprafaţa
cultivată.
b) Legături multiple - se analizează variaţia fenomenului y în
funcţie de mai multe caracteristici esenţiale x1, x2,..., xn. Rămâne şi în
acest caz o componentă aleatoare, care sintetizează acţiunea, presupusă
constantă, a celorlalţi factori de influenţă.
De exemplu, analiza variaţiei salariului într-o colectivitate în
funcţie de productivitate, vechime şi calificare.
• După natura caracteristicii pot exista legături stohastice de
asociere sau de corelaţie.
a) Asocierea statistică se referă la raporturile de interdependenţă
dintre caracteristicile calitative, sau dintre o caracteristică numerică şi una
calitativă. De exemplu, legătura dintre locul de muncă şi studii, calificare
şi productivitate, între ramurile economice şi salariul mediu, între
domeniul de activitate şi dimensiunile întreprinderii, între zona geografică
şi clasa de fertilitate a terenurilor agricole etc.
Analiza statistică a raporturilor de asociere este posibilă doar dacă
se găseşte o modalitate de exprimare numerică a variantelor. De exemplu,
clasele de calitate ale produselor pot fi codificate şi ierarhizate: 0 - produs
inferior, 1 - produs mediu, 2 - produs superior.
b) Corelaţia statistică exprimă raporturile de cauzalitate dintre
două sau mai multe caracteristici exprimate cantitativ. De exemplu,
analiza cifrei de afaceri în funcţie de numărul salariaţilor şi valoarea
capitalului fix.
• După sensul relaţiei de cauzalitate, legăturile stohastice pot fi
directe sau inverse.
a) Legături directe există atunci când modificarea într-un anumit
sens (creştere sau scădere) a fenomenului cauză x determină modificarea
în acelaşi sens a fenomenului efect y.
STATISTICA

De exemplu, legătura dintre numărul salariaţilor şi volumul


producţiei, dintre mărimea creditului şi masa dobânzii, dintre costul unitar
şi costul total etc.
b) Legăturile inverse există atunci când modificarea într-un
anumit sens a lui x determină o modificare în sens contrar a lui y.
De exemplu, legătura dintre profitul unitar şi costul unitar de
producţie, dintre impozitul pe profit şi profitul net, dintre mărimea
dividentelor şi profitul reinvestit etc.
• După forma matematică a legăturilor, acestea pot fi liniare sau
neliniare.
a) Liniare: legătura se realizează după ecuaţia dreptei.
b) Neliniare: exponenţiale, hiperbolice, parabolice, logistice.
Forma legăturii este, de regulă, vizibilă pe grafic. Atunci când
legătura grafică nu este clară, se poate continua analiza pe variantele
sugerate de grafic folosind metode analitice şi folosind anumite criterii
pentru a alege varianta cea mai bună.
• După momentul producerii lor deosebim legături sincrone şi
asincrone.
a) Sincrone - modificarea lui x determină modificarea imediată a
lui y. De exemplu, creşterea veniturilor populaţiei determină mărirea
imediată a cererii de consum, creşterea producţiei se obţine concomitent
cu creşterea cheltuielilor etc.
b) Asincrone - fenomenul x determină variaţia fenomenului efect y
după o perioadă de timp. De exemplu, legătura dintre investiţii şi
creşterea producţiei sau legătura dintre rata dobânzii şi volumul masei
monetare.

6.2 METODE ELEMENTARE DE VERIFICARE


A EXISTENŢEI LEGĂTURILOR

Studierea legăturilor dintre fenomenele economice presupune


parcurgerea mai multor etape:
• depistarea factorilor care influenţează variaţia fenomenului
analizat şi ierarhizarea acestora;
• alegerea factorului sau factorilor esenţiali a căror influenţă
asupra fenomenului dependent urmează să fie analizată;
Seriile interdependente

• culegerea şi sistematizarea datelor referitoare la variabilele


studiate; verificarea gradului de cuprindere a datelor
înregistrate (dacă datele provin dintr-un sondaj interpretarea
rezultatelor se va face în sens probabilistic);
• verificarea existenţei şi formei legăturii dintre caracteristicile
corelate în vederea alegerii corecte a procedeelor statistico-
matematice de măsurare a dependenţei statistice;
• măsurarea intensităţii legăturii cu ajutorul indicatorilor de
corelaţie selectaţi în funcţie de forma de legătură şi de natura
informaţiilor de care dispunem;
• testarea semnificaţiei indicatorilor de corelaţie calculaţi când
datele au provenit dintr-un sondaj.
În analiza legăturilor statistice dintre fenomenele economice se
folosesc metode de verificare a existenţei legăturilor şi metode de
apreciere a formei şi intensităţii legăturilor.
Verificarea existenţei legăturilor se poate face cu ajutorul unor
metode simple:
• metoda seriilor paralele interdependente;
• metoda grupărilor;
• metoda tabelului de corelaţie;
• metoda grafică;
• analiza dispersională.
Metodele elementare evidenţiază direcţia legăturii, iar unele dintre
ele pot indica şi forma acesteia. Aplicarea acestor metode trebuie
completată cu o analiză calitativă a fenomenelor, bazată pe conţinutul lor
economic, pe legătura logică dintre ele.

• Metoda seriilor paralele interdependente


Se ordonează, crescător sau descrescător, datele referitoare la
factorul de influenţă x (caracteristica factorială) şi se înscriu pe o coloană
paralelă valorile corespunzătoare ale fenomenului dependent y
(caracteristica dependentă). Din comparaţia celor două şiruri de date se
apreciază dacă variaţia lui x este însoţită de o variaţie corespunzătoare,
într-un sens bine definit, a lui y.
STATISTICA

Se constată astfel dacă există sau nu o legătură între x şi y şi sensul


acestei legături (directă sau inversă). În situaţia afirmativă, datele vor fi
supuse în continuare unor prelucrări analitice pentru determinarea
intensităţii legăturii.
Metoda este uşor de aplicat şi poate folosi date deja existente în
publicaţii statistice sau economice (vezi tabelul 6.2.1). De exemplu, datele
din tabelul următor indică tendinţa unei legături directe între exportul şi
importul României în/din ţările Uniunii Europene.

Exportul şi importul României în/din ţările Uniunii Europene


în luna ianuarie 2002
Tabelul 6.2.1
mil.USD
Ţara Export Import
Luxemburg 0,1 0,3
Finlanda 0,3 2,4
Irlanda 1,4 6,3
Danemarca 1,8 3,3
Portugalia 2,9 3,0
Suedia 5,1 10,8
Spania 10,8 16,9
Belgia 13,2 15,5
Austria 30,3 37,1
Olanda 31,6 20,4
Grecia 36,7 20,5
Marea Britanie 43,0 44,7
Franţa 86,8 74,8
Germania 151,2 177,1
Italia 244,1 256,2
Sursa: Buletin statistic lunar, nr.1,2002,INS.

• Metoda grupărilor
Întrucât metoda precedentă este aplicabilă doar în cazul
colectivităţilor de volum mic, o variantă a ei o reprezintă gruparea
prealabilă a unităţilor colectivităţii după caracteristica factorială x.
Pentru fiecare grupă astfel formată, se calculează media
caracteristicii dependente y. Se înscriu, în coloane paralele, grupările
ordonate ale caracteristicii x şi mediile corespunzătoare ale lui y.
Seriile interdependente

Compararea variaţiei celor două caracteristici, x şi y, permite formularea


unor concluzii privind existenţa, sensul şi intensitatea legăturii dintre ele.
În cazul corelaţiei multiple, se înregistrează pe grupe valorile
caracteristicilor factoriale, înscriindu-se valorile respective în coloane
distincte, în ordinea importanţei lor pentru caracteristica rezultativă.
Pentru caracteristica rezultativă se calculează valori medii condiţionate pe
grupe.
Utilizarea acestei metode este sensibil influenţată de aplicarea cu
discernământ a metodei grupărilor. Utilitatea metodei este dată în primul
rând de faptul că sistematizează datele statistice referitoare la variabilele
implicate, pregătind astfel aplicarea unor metode avansate de studiu al
corelaţiei.
În tabelul 6.2.2. este prezentat un exemplu de aplicare a metodei
grupărilor. Populaţia feminină a fost împărţită pe grupe de vârstă şi s-au
calculat valori medii condiţionate de variaţia vârstei pentru variabila
dependentă - rata fertilităţii. Exceptând prima grupă de vârstă, se observă
o corelaţie inversă foarte puternică între grupa de vârstă (factor de
influenţă) şi rata fertilităţii (caracteristica dependentă).
Ratele de fertilitate pe grupe de vârstă în anul 2000
Tabelul 6.2.2
Grupa de vârstă Număr femei Rata medie de fertilitate
(ani) (mii persoane) (născuţi vii la 1000 femei)
15 - 19 814,3 39,0
20 - 24 957,0 90,2
25 - 29 888,0 78,5
30 - 34 904,6 38,7
35 - 39 638,3 13,4
40 - 44 802,2 3,1
45 - 49 808,9 0,2
Sursa: Anuarul statistic al României, anul 2000,p.52 şi 68.

• Tabelul de corelaţie
Această metodă presupune gruparea ambelor caracteristici, x şi y
într-un tabel cu dublă intrare.
Tabelul de corelaţie este un tabel cu dublă intrare în care pe
coloane se trec grupele formate după variaţia caracteristicii factoriale x,
ordonate crescător, iar pe linii se înscriu grupele referitoare la variaţia
caracteristicii dependente y, de preferinţă ordonate descrescător.
STATISTICA

Se recomandă să se utilizeze intervale egale de grupare, un număr


suficient de grupe şi acelaşi număr de grupe pentru ambele caracteristici
(atunci când este posibil).
Fiecare rubrică a tabelului se află la întretăierea unei anumite
grupe după x, cu o altă grupă după y; în rubrica respectivă se trece
numărul unităţilor care se înscriu simultan în cele două grupe considerate
(după variaţia lui x şi după variaţia lui y).
Atunci când frecvenţele din tabel tind să se concentreze în jurul
unei diagonale, între cele două caracteristici reprezentate există legătură
de corelaţie. În caz contrar (frecvenţe distribuite neuniform în tot tabelul)
variabilele x şi y sunt independente.
Tabelul de corelaţie arată atât existenţa, cât şi sensul legăturii;
dacă majoritatea frecvenţelor sunt localizate pe diagonala principală ( / ),
legătura este directă, iar când se situează pe diagonala secundară ( \ ),
legătura este inversă.
Prin această interpretare a concentrării frecvenţelor, valabilă în
cazul ordonării descrescătoare a grupelor referitoare la variaţia
caracteristicii dependente y, tabelul de corelaţie se apropie de metoda
grafică. În situaţia ordonării crescătoare a valorilor lui y (tabelul 6.2.3),
interpretarea sensului legăturii este opusă.
Tabelul cu dublă intrare nr. 6.2.3 permite interpretarea corelaţiei
dintre rangul născutului viu (caracteristică dependentă) şi grupa de vârstă
a mamei (caracteristica factorială). Datele indică o corelaţie directă destul
de puternică.
Născuţii vii după rangul născutului-viu şi grupa de vârstă a mamei
în anul 2000
Tabelul 6.2.3
Rangul Grupa de vârstă a mamei (ani)
născutului sub 14 15-19 20-24 25-29 30-34 35-39 40-44 45-49
I 508 25777 52749 30050 10123 1421 263 11
II 21 5236 24336 24852 12450 1717 245 6
III - 689 6481 7849 5021 1287 306 13
IV - 60 2072 3674 2797 959 324 11
V - 2 518 1828 1802 792 264 13
VI - - 99 898 1207 690 269 16
VII - - 28 377 761 508 183 14
VIII şi peste - - 2 219 871 1205 589 47
Sursa: Anuarul statistic al României, anul 2000, p.67.
Seriile interdependente

• Metoda grafică
Este un procedeu simplu şi sugestiv de vizualizare a relaţiilor de
dependenţă dintre două variabile.
Toate unităţile colectivităţii analizate se reprezintă grafic prin
puncte în sistemul de coordonate rectangulare. Valorile caracteristicii
factoriale x se trec pe abscisă, iar valorile caracteristicii dependente y se
înscriu pe ordonată. Unităţile colectivităţii se situează la intersecţia celor
două axe de coordonate care corespund valorilor pe care le iau după
caracteristica x, respectiv y. Scara de reprezentare influenţează
interpretarea rezultatelor.
Atunci când punctele de pe grafic tind să se concentreze sub forma
unei linii drepte sau a unei curbe (fig. 6.1.), cele două variabile, x şi y,
sunt în relaţii de dependenţă. Atunci când punctele sunt împrăştiate pe
grafic, fără nici o regularitate (fig. 6.2.), cele două variabile sunt
independente.

y y

.
. .
. . . .
.. . .
.. . . . .
. . .
. . . . .
. .
. .
.
x
x
Fig. 6.2.1 Legătură liniară Fig. 6.2.2 Variabile
directă independente

Graficul permite aprecierea existenţei, formei şi sensului legăturii


statistice dintre variabile.
Fiind o metodă simplă apreciere a formei după care se realizează
legătura dintre variabile, metoda grafică are o mare importanţă pentru
alegerea metodelor analitice de studiu al corelaţiei.
Pe lângă aceste metode simple, care evidenţiază legăturile de
corelaţie, dar nu le pot măsura intensitatea, există şi metode analitice, mai
elaborate.
STATISTICA

• Analiza dispersională
Această metodă poate fi considerată ca un caz particular de
regresie. Este folosită în studiul modalităţilor în care unul sau mai mulţi
factori influenţează asupra unei caracteristici rezultative.
Analiza dispersională arată mărimea şi frecvenţa cu care valorile
reale ale unei caracteristici statistice se abat de la valorile teoretice calcu-
late (indicatorii sintetici care caracterizează colectivitatea în ansamblu) şi
măsura în care aceste abateri depind de factorul de grupare.
Analiza dispersională poate înregistra variaţia unei caracteristici în
funcţie de unul sau mai mulţi factori de grupare.
Atunci când caracteristica dependentă y este influenţată de un
singur factor de grupare x, prin analiza dispersională se determină cât din
variaţia totală a lui y este produsă de factorul de grupare, restul
reprezentând rezultatul acţiunii factorilor reziduali (neînregistraţi).
Atunci când y este dependent de mai mulţi factori de grupare,
variaţia explicată a lui y se repartizează pe factorii de influenţă
(x1, x2,... , xn), iar variaţia neexplicată este considerată variaţie reziduală,
produsă de factori neînregistraţi.
Analiza dispersională unifactorială poate fi utilizată pentru a
verifica dependenţa unei variabile de factorul de grupare. Ea permite
verificarea gradului şi formei de variaţie a caracteristicii dependente în
funcţie de factorul de grupare.
Pentru aceasta, unităţile statistice ale colectivităţii analizate se
împart după un factor de grupare, considerat factor de influenţă şi se
analizează dispersia termenilor în cadrul fiecărei grupe şi între grupele
astfel formate.
Cu cât factorul de grupare are un rol mai important în variaţia
caracteristicii dependente y, cu atât dispersia în interiorul grupelor este
mai mică, iar dispersia dintre grupe este mai mare.
Analiza dispersională presupune calcularea următorilor indicatori:
varianţa dintre grupe şi din interiorul grupelor, coeficienţii de
determinaţie şi de nedeterminaţie şi coeficientul raportului dintre
dispersii.
Se porneşte de la împărţirea colectivităţii în r grupe, fiecare grupă
i conţinând ni valori (yi1 , yi2 ,... , yini).
Se calculează media valorilor din fiecare grupă ( yi ) şi media
generală ( y0 ).
Seriile interdependente

Varianţa totală se calculează ca sumă a pătratelor abaterilor


tuturor unităţilor colectivităţii de la media lor generală, conform relaţiei:
n
S y2 = ∑ (y j − y0 )2 ,
j =1

unde: S y2 - varianţa totală a variabilei dependente y;


yj - valorile variabilei dependente, j = 1 , 2 ,... , n;
y0 - media tuturor termenilor din colectivitatea generală.
Varianţa totală exprimă în mărime absolută gradul de împrăştiere a
tuturor valorilor individuale ale colectivităţii înregistrate.
Varianţa pe seama factorului de grupare x se calculează ca
sumă a pătratelor abaterilor mediilor de grupă de la media generală,
conform relaţiei:
r
S y2 / x = ∑ ( yi − y 0 ) 2 ni ,
i =1

unde: S y2 / x - varianţa produsă de factorul de grupare x;


yi - media aritmetică a valorilor individuale din fiecare grupă
(medie condiţionată de factorul de grupare x), i = 1, 2,... , r;
ni - numărul termenilor din fiecare grupă;
Varianţa pe seama factorilor reziduali (neînregistraţi) se calcu-
lează ca sumă a pătratelor abaterilor termenilor individuali de la mediile
lor de grupă, conform relaţiei:
r ni
S y2 / z = ∑ ∑ ( y j − yi ) 2 ,
i =1 j =1

unde: yj -toate valorile individuale ale caracteristicii y, j=1, 2,..., ni;


y i -mediile parţiale (de grupă), i =1, 2,..., r;
ni -numărul termenilor din fiecare grupă;
r - numărul de grupe.
Între cele trei varianţe există următoarea relaţie: varianţa totală
este suma dintre varianţa pe seama factorului de grupare şi varianţa pe
seama factorilor reziduali.
STATISTICA

S2y = S2y / x + S2y / z .

Coeficientul de determinaţie ( η x2 ) a factorului de grupare x arată


cât din variaţia totală a unei caracteristici dependente y este produsă de
factorul de grupare x, conform relaţiei:
S y2 / x
η x2 =
S y2

Coeficientul de nedeterminaţie ( η2z ) arată cât din variaţia totală


a caracteristicii dependente y este rezultatul acţiunii unor factori reziduali,
întâmplători. Se calculează cu formula:
S y2 / z
η z2 = .
S y2

Cei doi indicatori sunt complementari:


η x2 + η z2 = 1 .
Cu cât coeficientul de determinaţie are o valoare mai mare, cu atât
acţiunea factorului de grupare x asupra variabilei dependente Y este mai
puternică şi acţiunea factorilor întâmplători mai slabă.
Coeficientul raportului dintre dispersii (coeficientul Fisher)
reprezintă o măsură a gradului de semnificaţie a factorului de grupare. Se
calculează ca raport între varianţele corectate cu numărul gradelor de
libertate (numărul de elemente independente al colectivităţii):
S y2 / x S y2 / z
Fcalc = : .
r −1 n−r
Se selectează din tabele statistice (vezi anexa nr.1) valoarea
teoretică a coeficientului Fisher, în funcţie de nivelul de semnificaţie α
ales şi de numărul gradelor de libertate pentru cele două variabile:
f1 = r - 1;

f2 = n - r.
Seriile interdependente

Aceasta arată nivelul de la care începe să fie semnificativă


legătura dintre cele două variabile: x şi y. Aşadar, dacă Fcalc > Ftab ,
factorul de grupare x este cu adevărat determinant pentru variaţia
caracteristicii dependente y. În caz contrar, variaţia lui y este efectul
acţiunii altor factori, care au rol predominant.

6.3 METODE PARAMETRICE DE MĂSURARE


A LEGĂTURILOR

Metodele analitice (parametrice) de studiere a corelaţiei permit o


mai bună cunoaştere a dependenţei dintre fenomene prin exprimarea ei
într-o ecuaţie matematică. Metodele parametrice sunt: regresia, metoda
coeficientului şi raportului de corelaţie.

METODA REGRESIEI
Regresia este o metodă analitică de studiere a legăturilor dintre
două sau mai multe variabile cu ajutorul unor funcţii matematice care
exprimă forma legăturii dintre variabile.
Funcţia de regresie are forma generală:
Y =f (x1 , x2 ,..., xn)+ε,
unde: Y- variabila dependentă, fenomenul efect;
x1 , x2 ,..., xn - variabilele independente, factorii de influenţă;
n - numărul variabilelor independente;
ε - constantă care sintetizează influenţa factorilor neînregistraţi.

Regresia poate fi unifactorială sau multifactorială, în funcţie de


numărul factorilor de influenţă înregistraţi.

6.3.1 Regresie unifactorială

Atunci când se studiază variaţia unei caracteristici y în funcţie de


un singur factor x, toţi ceilalţi factori fiind consideraţi neglijabili şi cu
acţiune constantă, regresia este unifactorială sau simplă:
Yx = f(x) + ε
Funcţia de regresie simplă poate fi liniară, exponenţială,
parabolică, hiperbolică, logaritmică etc., alegerea ei făcându-se pe baza
STATISTICA

unui grafic de corelaţie.Cel mai frecvent utilizat model, datorită


simplităţii sale relative, este cel liniar, având forma
Yxi = a + bxi ,

unde: Yxi - valorile teoretice, calculate, în funcţie de x ale variabilei


dependente y;
x - variabila independentă, factorială;
a - parametrul care reflectă influenţa factorilor neînregistraţi (cu
acţiune constantă asupra lui y);
b - parametru denumit coeficient de regresie; arată cu cât se
modifică în medie caracteristica dependentă y atunci când x se modifică
cu o unitate.
Coeficientul de regresie b arată şi sensul legăturii dintre x şi y:
când b > 0, legătura este directă, iar când b < 0, legătura este inversă.
Dacă b=0, variabila Yx = a, deci nu depinde de x, ci de ceilalţi factori
cuantificaţi prin constanta a. Parametrii a şi b au caracter de mărimi
medii.
Parametrii a şi b pot fi analizaţi şi din punct de vedere geometric.
Astfel, constanta a este punctul în care dreapta care exprimă ecuaţia de
regresie întâlneşte axa ordonatelor Oy (figura 6.3.1). În funcţie de direcţia
şi panta dreptei, a poate fi pozitiv sau negativ. Atunci când a=0,
fenomenul y depinde univoc de factorul x, deci legătura este funcţională.
y

x
Fig. 6.3.1 - Funcţia liniară (legătura inversă)

Parametrul b are semnificaţia geometrică de pantă a dreptei de


regresie.
Pentru determinarea mărimilor concrete ale parametrilor a şi b,
pornind de la valorile înregistrate de caracteristicile analizate x şi y, se
utilizează metoda celor mai mici pătrate. Conform acestei metode, pentru
Seriile interdependente

ca funcţia de regresie aleasă să fie cu adevărat semnificativă, trebuie să


îndeplinească următoarea condiţie:
n
∑ ( yi − Yxi )2 = min,
i =1

unde: n - numărul unităţilor statistice observate.


Aşadar, suma pătratelor abaterilor valorilor reale (yi) de la valorile
exprimate prin ecuaţia de regresie ( Yxi ) trebuie să fie minimă.
În cazul modelului liniar, condiţia devine:
n

∑[ y
i =1
i − ( a + bx i )] 2 = min .

Această condiţie se verifică atunci când derivatele parţiale, în


raport cu a şi în raport cu b ale funcţiei precedente se anulează. Aşadar:
n
∑ 2 ⋅ ( yi − a − bxi ) = 0 şi
i =1

n
∑ 2 ⋅ xi ⋅ ( yi − a − bxi ) = 0.
i =1

Ţinând seama de faptul că a şi b sunt constante, sistemul precedent


se poate rescrie sub forma:
na + b∑ xi = ∑ yi

a ∑ xi + b ∑ xi2 = ∑ xi yi
Soluţia sistemului este:
 n ∑ xi y i − ∑ xi ⋅ ∑ y i
b =
 n ⋅ ∑ xi2 − (∑ xi )2
 2
a = ∑ y i ⋅ ∑ x i − ∑ x i ⋅ ∑ x i y i .
 n ⋅ ∑ xi2 − (∑ xi )2

Pentru parametrul a se mai poate scrie relaţia: a = y − bx .
STATISTICA

În continuare, se calculează valorile teoretice ajustate ale variabilei


y, pe baza ecuaţiei de regresie:
Yxi = a + bxi

Pentru verificarea calculului parametrilor funcţiei de regresie


n n
folosim relaţia: ∑ yi = ∑ Yxi , ceea ce arată că prin ajustare nu se face
i =1 i =1
decât o redistribuire a influenţei factorilor.
Sistematizarea calculelor necesare pentru determinarea valorilor
teoretice ale caracteristicii y:

xi yi xi2 xi yi yi2 Yxi = a + bxi


2 2
x1 y1 x1 x1 y1 y1 Yx1 = a + b ⋅ x1
Μ Μ Μ Μ Μ
Μ
xi yi xi2 xi yi yi2
Yxi = a + b ⋅ xi
Μ Μ Μ Μ Μ
xn yn xn2 xn yn yn2 Μ
Yxn = a + b ⋅ x n
∑ xi ∑ yi ∑ xi2 ∑ xi ⋅ y i ∑ yi ∑ Yxi

Relaţiile anterioare de calcul se utilizează în cazul datelor negrupate,


sistematizate sub forma unor serii paralele interdependente. Se poate lucra
cu date negrupate atunci când numărul observaţiilor este mic. Dacă se
dispune de un mare număr de valori ale caracteristicilor x şi y se poate
realiza gruparea acestora, simplu sau combinat.
Atunci când se utilizează gruparea simplă, perechile de valori xi şi
yi au frecvenţe comune ni. Algoritmul de calcul al parametrilor a şi b prin
metoda celor mai mici pătrate se aplică identic. Diferenţa constă în
utilizarea frecvenţelor ni la toate sumele existente.
Sistemul de ecuaţii normale devine:
a ⋅ ∑ ni + b ⋅ ∑ xi ni = ∑ yi ni

a ⋅ ∑ xi ni + b ⋅ ∑ xi2 ni = ∑ xi yi n i
Seriile interdependente

cu soluţia:

a=
∑ yi ni ⋅ ∑ xi2 ni − ∑ xi ni ⋅ ∑ xi yi ni
n ⋅ ∑ xi2 ni − (∑ xi ni )2

n ⋅ ∑ x i y i ni − ∑ x i ni ⋅ ∑ y i ni
b=
n ⋅ ∑ xi2 ni − (∑ xi ni )2

În continuare, folosind parametrii a şi b astfel determinaţi se


calculează valorile ajustate ale variabilei y:
Yxi = a + b ⋅ xi

Calculele necesare pot fi organizate într-un tabel asemănător celui


precedent, cu deosebirea că apar în plus frecvenţele ni.
Modelul de calcul se complică şi mai mult atunci când se
utilizează gruparea combinată. În acest caz, sistemul de ecuaţii normale
devine:

a ⋅ ∑∑ n i + b ⋅ ∑ x i ⋅ n i. = ∑ y j ⋅ n . j
 i j i j

a ⋅ ∑ x i ⋅ n i. + b ⋅ ∑ x i ⋅ n i. = ∑∑ x i ⋅ y j ⋅ n i
2

 i i i j
STATISTICA

Calculele necesare pot fi sistematizate în următorul tabel:

yj y1 ... yj ... yn ni. xini. xi2ni. xi ∑ y j nij Yxi = a + bxi


xi j
x1 n11 ... n1j ... n1n n1. x1n1. x12n1. x1 ∑ y j n1 j Yx1
Μ Μ Μ Μ Μ j
xi ni1 ... nij ... nin ni. xini. xi2ni. xi ∑ y j nij Yxi
Μ Μ Μ Μ Μ j
2
xr nr1 ... nrj ... nrn nr. xrnr. xr nr. x r ∑ y j nrj
j Yxr
n.j n.1... n.j ... n.n ∑ ∑ nij ∑ xi ni . ∑ xi2 ni . ∑ ∑ xi y j nij ∑ Y xi
i j i i i j i

yjn.j y1n.1... yjn.j... ynn.n ∑ y j n. j


j

y2j n. j y12 n.1 ... y 2j n. j ... y n2 .n ∑ y 2j n. j


j

Atunci când legătura dintre x şi y are forma unei funcţii


exponenţiale (fig. 6.4.), ecuaţia de regresie este:
Yxi = a ⋅ b xi , unde a şi b sunt parametrii funcţiei.

Fig. 6.3.2 - Exponenţiala

Modelul exponenţial poate fi uşor transformat într-unul liniar prin


logaritmare:
lg yi = lg a + xi ⋅ lg b
Seriile interdependente

În continuare, se procedează ca la modelul liniar pentru a


determina parametrii a şi b ai funcţiei exponenţiale. Se obţine un sistem
de ecuaţii normale de forma:
n ⋅ lg a + lg b ⋅ ∑ xi =∑ lg yi

lg a ⋅ ∑ xi + lg b ⋅ ∑ xi2 = ∑ xi ⋅ lg yi
Atunci când se utilizează parabola de gradul doi (fig. 6.3.3)
pentru a reflecta legătura dintre x şi Y, forma ecuaţiei de regresie este:
Yxi = a + b ⋅ xi + c ⋅ xi2 ,

unde a, b, c sunt parametri.


y y

x x

Fig. 6.3.3 - Tipuri de parabole de gradul doi

Conform metodei celor mai mici pătrate, se pune condiţia:


n
∑ ( yi − a − b ⋅ xi − c ⋅ xi2 )2 = minim.
i =1

Anulând cele trei derivate parţiale, în raport cu a, b şi c, se obţine


sistemul de ecuaţii normale a cărui rezolvare oferă valorile celor trei
parametri.
n ⋅ a + b ⋅ ∑ xi + c ⋅ ∑ xi2 = ∑ yi

2 3
a ⋅ ∑ x i + b ⋅ ∑ x i + c ⋅ ∑ x i = ∑ x i ⋅ y i

a ⋅ ∑ xi2 + b ⋅ ∑ xi3 + c ⋅ ∑ xi4 = ∑ xi2 ⋅ yi
Odată determinaţi parametrii ecuaţiei de regresie, se pot calcula
valorile ajustate ale variabilei y.
STATISTICA

Funcţia logaritmică se exprimă prin relaţia:


Yxi = a + b ⋅ lg xi .
Procedând ca la modelul liniar, obţinem sistemul de ecuaţii
normale:
n ⋅ a + b ⋅ ∑ lg xi = ∑ yi

a ⋅ ∑ lg xi + b ⋅ ∑ (lg xi )2 = ∑ yi ⋅ lg xi
Funcţia hiperbolică (fig. 6.3.4) este:
1
Yxi = a + ⋅b .
xi

x
Fig. 6.3.4 - Hiperbola

Folosind metoda celor mai mici pătrate, în cazul modelului hiper-


bolei, sistemul de ecuaţii normale pentru calcularea parametrilor a şi b
este:
 1
n ⋅ a + b ⋅ ∑ x = ∑ y i
 i

a ⋅ ∑ + b ⋅ ∑ 1 = ∑ 1 ⋅ y i
1
 xi xi2 xi

Parametrii acestor două funcţii se estimează tot prin metoda celor


mai mici pătrate, aşa cum s-a explicitat pentru modelul liniar.
Seriile interdependente

6.3.2 Regresia multifactorială

Modelul regresiei unifactoriale reprezintă o simplificare extremă a


vieţii economice reale, care înregistrează influenţe multiple chiar şi asupra
celor mai simple fenomene şi procese. Mai apropiat de realitate este
modelul regresiei multiple (multifactoriale), de tipul:
Yxi=f (x1 , x2 ,... , xn) + ε.
În acest caz, fenomenul efect y este supus influenţei unei
multitudini de factori: x1, x2 ,... , xn.
Dată fiind complexitatea abordării multifactoriale, modelul cel
mai accesibil (şi, în consecinţă, cel mai des utilizat) este cel liniar:
y x i = a 0 + a 1 x 1i + a 2 x 2i + Λ + a n x ni ,

unde: Yxi - valorile teoretice ajustate ale variabilei dependente y;


x1 , x2 ,... , xn - factorii de influenţă înregistraţi;
a0 - parametru care exprimă influenţa factorilor neînregistraţi;
a1 , a2 ,... , an - parametri, coeficienţi de regresie care arată cu cât se
modifică Yx atunci când x1 , x2 ,... , xn se modifică cu o unitate.

Parametrii funcţiei liniare se determină prin metoda celor mai mici


pătrate. Pornind de la condiţia:
n
∑ ( yi − a0 − a1 x1i − a 2 x2i − ... − a n xni )2 = min . ,
i =1

se anulează derivatele parţiale în raport cu a0 , a1 , a2 ,... , an şi se rezolvă


sistemul de ecuaţii normale obţinut. Dacă variabila y este condiţionată
numai de doi factori x1 şi x2, sistemul de ecuaţii normale utilizat pentru
determinarea parametrilor a0, a1 şi a2 este:
na 0 + a1 ∑ x1i + a 2 ∑ x 2i = ∑ yi
 2
a 0 ∑ x1i + a1 ∑ x1i + a 2 ∑ x1i x 2i = ∑ x1i yi
 2
a 0 ∑ x 2i + a1 ∑ x1i x 2i + a 2 ∑ x 2i = ∑ x 2i yi
În acest fel se determină forma concretă a ecuaţiei de regresie, pe
baza căreia se pot calcula în continuare valorile ajustate ale variabilei
dependente y:
STATISTICA

Yx = a0 + a1 ⋅ x1i + a 2 ⋅ x 2i
i

O problemă legată de aplicarea regresiei multifactoriale este


posibilitatea existenţei unor interdependenţe între factorii de influenţă
(multicoliniaritate). Efectele acesteia influenţează concluziile analizei.

6.3.3 Metoda corelaţiei

Comparativ cu metodele precedente, metoda corelaţiei prezintă


avantajul că oferă o măsură sintetică a legăturilor dintre variabilele
statistice.
Indicatorii calculaţi sunt: covarianţa, coeficientul de corelaţie şi
raportul de corelaţie.
Covarianţa se calculează sub forma mediei aritmetice simple a
produselor abaterilor celor două variabile corelate, x şi y, de la mediile lor
aritmetice x şi y , conform relaţiei:

1 n
cov( x , y ) = ∑ ( xi − x ) ⋅ ( y i − y ).
n i =1
Indicatorul ia valori pozitive dacă legătura dintre variabile este
directă şi valori negative în caz contrar. Valori apropiate de zero
semnifică lipsa oricărei legături între x şi y; valori ridicate ale
indicatorului arată o legătură puternică.
Coeficientul de corelaţie simplă măsoară intensitatea legăturilor
liniare dintre două variabile.
Fenomenele care se află în relaţii strânse de interdependenţă
prezintă o poziţie similară a valorilor individuale ale fiecărui fenomen în
parte (xi, yi) faţă de media corespunzătoare ( x , respectiv y ). Rezultă de
xi − x yi − y
aici că şi abaterile normale normate , respectiv au mărimi
σx σy
apropiate pentru valorile perechi xi, yi. Pentru a obţine o mărime sintetică
a abaterilor normale normate la nivelul întregii colectivităţi se calculează
Seriile interdependente

coeficientul de corelaţie, sub forma mediei produselor acestor abateri:


 xi − x   y i − y 
∑   ⋅
σ  
 x   σy 
ry / x = sau
n

ry / x =
∑ (xi − x )⋅ (yi − y )
n ⋅σ x ⋅σ y

Indicatorul are mai multe forme echivalente de calcul, dintre care


cea mai uşor de utilizat este următoarea:
n ∑ xi y i − ∑ x i ∑ y i
ry / x = .
[ n∑ xi2 − (∑ xi ) ] ⋅ [ n ∑
2
yi2 − (∑ yi ) ]
2

Coeficientul de corelaţie are valori cuprinse între -1 şi 1. Semnul


indicatorului arată sensul legăturii: pozitiv - legătură directă, negativ
- legătură inversă. Atunci când coeficientul ia valoarea zero, cele două
variabile nu sunt corelate liniar. La celălalt capăt al plajei de variaţie,
valori apropiate de ±1 arată o legătură extrem de puternică între x şi y
apropiată de legăturile de tip funcţional. Valorile intermediare ale
indicatorului (între 0 şi ±1) corespund unor intensităţi diferite ale
corelaţiei, mergând de la o legătură slabă (sub 0,5) până la o legătură
puternică (peste 0,75).
Formula anterioară se utilizează pentru calcularea intensităţii
legăturilor dintre variabile pentru care se cunoaşte un număr redus de
valori individuale. Pentru observaţii mai ample, datele statistice sunt
sistematizate prin grupare simplă sau combinată.
În cazul în care s-a utilizat o grupare simplă, variabilele xi şi yi au
frecvenţe comune ni şi formula de calcul a coeficientului de corelaţie
simplă devine:
∑ ni ∑ xi yi ni − ∑ xi ni ⋅ ∑ yi ni
i i
ry / x =
[ ∑ ni ∑ xi ni − (∑ xi ni )2 ] ⋅ [ ∑ ni ∑ yi2 ni − (∑ yi ni )2 ]
2
STATISTICA

În varianta unei distribuţii bidimensionale, variabilele xi şi yi au


atât frecvenţe distincte (ni., respectiv n.j), cât şi frecvenţe comune nij.
Formula de calcul a coeficientului de corelaţie liniară simplă va fi în acest
caz:
∑ ∑ nij ∑ ∑ xi y j nij − ∑ xi ni . ⋅ ∑ y j n. j
i j i j i j
ry / x =
2 
 
2
    
∑ ni . ∑ xi ni . −  ∑ xi ni .   ∑ n. j ∑ y j n. j − ∑ y j n. j 
2 2  
i  i    j  j  
 i

j   

Pentru a verifica semnificaţia coeficientului de corelaţie liniară


simplă se utilizează testul "t". Valoarea calculată a mărimii t se determină
cu relaţia:
ry / x
t calc = n−2 ,
2
1 − ry / x

unde: r y / x - coeficientul de corelaţie liniară simplă;


n - numărul observaţiilor;
n-2 - numărul gradelor de libertate.
Valoarea rezultată din calcul se compară cu valoarea teoretică din
tabelul valorilor repartiţiei Student (anexa 3.) în funcţie de nivelul de
semnificaţie α ales (complementul probabilităţii cu care se garantează
rezultatul) şi de numărul gradelor de libertate (f = n - 2). Pentru a
considera semnificativ coeficientul de corelaţie dat, trebuie îndeplinită
condiţia: tcalc ≥ ttab. În caz contrar, influenţa caracteristicii factoriale x
asupra caracteristicii dependente y nu este reală.
În situaţia unei corelaţii liniare multiple, se calculează coeficienţi
de corelaţie liniară simplă luând pe rând câte un factor xi pentru a măsura
intensitatea legăturii sale cu variabila dependentă y. Se obţine câte un
coeficient de corelaţie liniară simplă pentru fiecare caracteristică
factorială înregistrată: ry / x1 , ry / x2 ,... ry / xn .

Raportul de corelaţie măsoară intensitatea legăturilor dintre


variabile. Se determină după ce s-a aplicat metoda regresiei, întrucât
calculul său utilizează valorile teoretice ale caracteristicii dependente y.
Seriile interdependente

Modelul de calcul al raportului de corelaţie porneşte de la faptul că


variaţia totală a caracteristicii y are două părţi: o parte determinantă
explicată prin influenţa caracteristicii factoriale x (componentă esenţială)
şi o parte supusă influenţei factorilor neînregistraţi aleatori (componenta
reziduală).
Rezultă că apar trei feluri de abateri:
( )
• abaterea valorilor empirice de la medie y i − y , sintetizată la
nivelul întregii serii în dispersia totală σ 2y ; reflectă influenţa
tuturor factorilor întâmplători şi esenţiali;
• abaterea valorilor teoretice de la valorile empirice de la
( )
y i − Y xi exprimată pe total prin dispersia reziduală σ y / r ,
care măsoară influenţa factorilor aleatori;
• abaterea valorilor teoretice de la medie Yxi − y ( ) reprezentată
la nivelul întregii serii de către dispersia sistematică σ 2y / x , ce
arată influenţa variabilei înregistrate x, considerată factor
determinant al variaţiei lui y.

La nivelul fiecărei valori individuale yi există relaţia:


(
y i − y = y i − Y xi + Y xi − y . ) ( )
Pe total, aceasta se transformă într-o relaţie între dispersii:
σ 2y = σ 2y / r + σ 2y / x
unde:

( yi − y ) ∑ (y i − Y xi ) ∑ (Y xi − y )
2 2 2

σ =2∑ 2
; σ y/r = ; σ y2 / x = .
y
n n n
Împărţind relaţia anterioară la σ 2y , se obţine:

σ y2 / r σ y2 / x
1= + .
σ y2 σ 2y
STATISTICA

Primul termen al sumei este coeficientul de nedeterminaţie:


σ 2y / r
N y2 / x = ,
σ 2y
care arată ponderea factorilor aleatori în variaţia totală a fenomenului y.
Al doilea termen reprezintă coeficientul de determinaţie
σ 2y / x
R y2 / x =
σ 2y
care arată în ce proporţie variaţia totală este explicată prin influenţa
factorului înregistrat x.
Pe baza relaţiei de complementaritate dintre cei doi coeficienţi se
poate scrie:
σ 2y / r
R y2 / x = 1− N y2 / r = 1− .
σ 2y
Raportul de corelaţie se obţine ca rădăcină pătrată a coeficientului
de determinaţie, conform relaţiei:

∑ ( yi − Yxi )2
σ y2 / r n ∑( yi − Yxi )2
Ry / x = 1− = 1− = 1−
σ y2 ∑ (yi − y ) ∑ (y i − y )
2 2

n
Valorile indicatorului sunt cuprinse între 0 şi 1. Raportul de
corelaţie este nul în cazul variabilelor independente şi 1 în cazul varia-
bilelor foarte puternic corelate.
Pentru legăturile liniare, raportul de corelaţie este egal cu
coeficientul de corelaţie.
Formula anterioară se utilizează în cazul unui volum mic de date
negrupate.
Seriile interdependente

În cazul unei grupări simple, în care variabilele x şi y au frecvenţe


egale, raportul de corelaţie se calculează cu formula:

∑( y i − Yx i ) 2 ⋅ n i
R y/x = 1− i
.
∑ (y )2
i − y ⋅ ni
i

Pentru distribuţiile bidimensionale, formula de calcul devine:

∑∑ ( y
i j
j − Yx i ) 2 ⋅ n ij
R y/x = 1− .
∑ (y )
2
j − y ⋅ n.j
j

Calcularea raportului de corelaţie în ultima variantă presupune


utilizarea unui tabel special în care se înscriu valorile empirice yj, valorile
teoretice Yxi (calculate prin aplicarea metodei regresiei) şi frecvenţele
comune nij:
Tabelul 6.3.1
∑ (y j − Y xi ) nij
yj y1 ... yj ... ym 2
Yxi j
Yx1 (y1 − Yx )2 n11 (y j − Yx )2 n1 j
1 1
(ym −Yx )2 n1m ∑(y j − Yx )2 n1 j
1 1
j
n11 n1j n1m
Μ Μ
Yxi (y1 − Yx ) ni1 (y j − Yx )
i
2
i
2
nij (y m − Yx ) nim ∑ (y j − Yx )2 nij
i
2
i
j
ni1 nij nim
Μ Μ
Yxr (y − Y ) n
1 xr
2
r1 ( y j − Yx ) n r r
2
j
(ym − Yx ) nrm
r
2
∑ (y j − Yx ) nrj
j
2
r

nr1 nrj nrm

∑∑(y j − Yxi )
Total: 2
nij
i j
STATISTICA

Raportul de corelaţie este egal cu coeficientul de corelaţie în cazul


legăturilor liniare. Dacă, în urma calculării celor doi indicatori, se
constată egalitatea lor, aceasta este o confirmare a liniarităţii legăturii.
Atunci când se analizează modificarea unei variabile independente
y în funcţie de variaţia mai multor factori de influenţă x1 , x2 ,... , xn ,
intensitatea legăturii se măsoară cu ajutorul raportului de corelaţie
multiplă:

∑ (y i − Yx1x 2 ...x n ) 2
R = 1− i =1
n
.
∑ (y
i =1
i − y) 2

În situaţia în care au fost calculaţi anterior coeficienţi de corelaţie


liniară simplă în funcţie de fenomenul dependent y şi fiecare caracteristică
factorială x1, x2,... , xn luată separat, determinarea raportului de corelaţie
liniară multiplă se poate face pe baza rezultatelor. Întâlnim două situaţii:
factorii de influenţă sunt independenţi unul de altul sau interdependenţi.
Considerând cazul a doi factori independenţi, raportul de corelaţie
liniară multiplă se poate calcula pe baza coeficienţilor de corelaţie liniară
simplă ry / x1 şi ry / x2 , astfel:

R y / x1x2 = ry2/ x1 + ry2/ x2

Dacă cei doi factori de influenţă asupra lui y sunt interdependenţi,


formula de calcul a raportului de corelaţie liniară multiplă devine:

ry2/ x1 + ry2/ x2 − 2 ⋅ ry / x1 ⋅ ry / x2 ⋅ rx1x2


R y / x1x2 =
1 − rx21x2

Se poate observa că pentru rx1x2 = 0 (caracteristici factoriale


independente) cele două formule sunt identice.
Dacă se calculează coeficienţii de corelaţie simplă între fiecare
caracteristică factorială xi şi caracteristica dependentă y, luaţi în valoare
absolută, se observă că valoarea coeficientului de corelaţie multiplă este
Seriile interdependente

întotdeauna superioară. Acest indicator exprimă efectul combinat al


tuturor caracteristicilor factoriale asupra celei rezultative, dependente.
Testarea raportului de corelaţie calculat se poate face cu ajutorul
testului "F" de analiză dispersională. Mărimea Fcalc se determină cu
ajutorul formulei următoare:

∑ (Y ) 2
x −y
F calc = r −1 ,
∑ (y i − Yx )
2

n−r
unde: n - numărul unităţilor statistice;
r - numărul grupelor.
Valoarea calculată se compară cu valoarea tabelată Ftab identificată
în funcţie de nivelul de semnificaţie α ales şi de numărul gradelor de
libertate f1 = r - 1, f2 = n - r (vezi anexa 1).
Valoarea tabelată arată nivelul de la care începe să fie semnificativ
raportul de corelaţie. Aşadar, pentru Fcalc ≥ Ftab, raportul de corelaţie este
acceptat, iar pentru Fcalc < Ftab este respins.
Aplicaţia 1
Numărul mediu de angajaţi şi profitul anual înregistrat de 10 firme
dintr-o subramură industrială se prezintă astfel:
Tabelul 6.3.2
Nr. Număr mediu de
Profit anual (mil. lei)
crt. angajaţi (persoane)
0 1 2
1 13 115
2 4 45
3 12 100
4 5 50
5 6 55
6 8 85
7 3 40
8 4 50
9 5 45
10 7 70
Total 67 655
STATISTICA

Se cere:
1. să se analizeze existenţa, direcţia şi forma legăturii;
2. să se determine parametrii funcţiei de regresie;
3. să se calculeze valorile funcţiei de regresie;
4. să se măsoare intensitatea corelaţiei dintre cele două variabile
folosind coeficientul şi raportul de corelaţie.

Rezolvare

1. În relaţia dintre cele două variabile factorul de influenţa este


numărul mediu de angajaţi ( xi ) , iar variabila rezultativă este mărimea
profitului ( y i ) .
Dintre metodele simple de evidenţiere a corelaţiei dintre două
variabile am ales metoda grafică, aceasta oferind cele mai multe
informaţii.
Din figura 6.2. reiese că între numărul de angajaţi şi mărimea
profitului există o legătură directă, de tip liniar.

yi (mil. lei) 140

120

100

80

60

40

20

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
xi (pers.)

Figura 6.2 Legătura dintre numărul mediu de angajaţi ( xi ) şi valoarea


profitului ( y i )
Seriile interdependente

2. Sistemul de ecuaţii normale necesar pentru aflarea parametrilor


a şi b ai funcţiei liniare este:

n a + b∑ xi = ∑ yi

a ∑ xi + b∑ xi2 = ∑ xi yi

Folosind rezultatele calculelor intermediare prezentate în tabelul


6.3.3 (coloanele 1 - 4), se obţine sistemul:

10 a + 67b = 655


 ,
67 a + 553b = 5170
cu soluţiile:
a = 15,2017
b = 7 ,5072
3. Valorile teoretice ale profitului ( Yxi ) se vor calcula înlocuind
fiecare valoare a variabilei factoriale xi în funcţia de regresie:

Yxi = 15,2017 + 7 ,5072 xi


Rezultatele calculelor efectuate sunt prezentate în tabelul nr. 6.3.3,
coloana 5.
Tabelul 6.3.3
xi yi xi y i xi2 y i2 Yxi (y i − Yxi )
2

1 2 4 3 5 6 7
13 115 1.495 169 13.225 112,80 4,86
4 45 180 16 2.025 45,23 0,05
12 100 1.200 144 10.000 105,29 27,96
5 50 250 25 2.500 52,74 7,50
6 55 330 36 3.025 60,24 27,51
8 85 680 64 7.225 75,26 94,88
3 40 120 9 1.600 37,72 5,18
4 50 200 16 2.500 45,23 22,75
5 45 225 25 2.025 52,74 59,87
7 70 490 49 4.900 67,75 5,05
67 655 5.170 553 49.025 655,00 225,62
STATISTICA

4. Rezultatele calculelor efectuate pentru determinarea


parametrilor a şi b ai funcţiei liniare de regresie pot fi utilizate şi pentru
aplicarea formulei de calcul simplificat a coeficientului de corelaţie:

n ∑ xi y i − ∑ xi ∑ y i
ry = =
x
[n ∑ x 2
i ][
− (∑ xi )2 n ∑ yi2 − (∑ yi )2 ]
10 ⋅ 5170 − 67 ⋅ 655
= = 0 ,9789
[10 ⋅ 553 − 67 ][10 ⋅ 49025 − 655 ]
2 2

Această valoare apropiată de 1 indică o legătură foarte puternică


între cele două variabile.
Raportul de corelaţie se determină cu formula:
∑ (yi − Yxi )
2
Ry = 1− ,
∑ (yi − y )
x 2

unde y=
∑ yi
655
=
= 65,5
n 10
Utilizând datele din tabelul 6.3.3., calculăm:
255,62
Ry x = 1− = 0 ,9789
6122,50
Coeficientul şi raportul de corelaţie au valori egale, ceea ce
confirmă liniaritatea legăturii.
Seriile interdependente

Aplicaţia 2
Într-o subramură industrială s-au înregistrat într-o lună
următoarele informaţii privind cheltuielile de producţie şi producţia
obţinută:
Tabelul 6.3.4
Cheltuieli de producţie (mil. lei)
Producţie
120 şi
(mii buc.) sub 30 30-60 60-90 90-120 Total
peste
0 1 2 3 4 5 6
31-36 1 - 3 3 - 7
26-31 1 6 4 1 2 14
21-26 1 3 4 - - 8
16-21 5 2 - - - 7
11-16 2 2 - - - 4
Total: 10 13 11 4 2 40

Pe baza acestor date se cere să se determine funcţia de regresie


care exprimă legătura dintre cele două variabile şi să se măsoare
intensitatea legăturii.
Rezolvare
Distribuţia frecvenţelor în tabel indică o tendinţă de corelaţie
liniară. În cazul distribuţiei bidimensionale de frecvenţe, sistemul de
ecuaţii normale are forma:

n a + b∑ xi ni . = ∑ yi n. j
 i j
 2
a ∑ xi ni . +b∑ xi ni . = ∑ ∑ xi y j ni j
 i i i j

Calculul elementelor necesare pentru aflarea parametrilor


sistemului de ecuaţii este sistematizat în tabelul nr. 6.3.5. Pentru uşurinţă,
în tabel se trec direct centrele de interval pentru cele două variabile.
STATISTICA

Tabelul 6.3.5
y j
15 45 75 105 135 ni . x i n i . x i2 n i . xi ∑ y j ni j
j
xi
0 1 2 3 4 5 6 7 8 9
33,5 1 - 3 3 - 7 234,5 7855,75 18592,5
28,5 1 6 4 1 2 14 399,0 11371,50 27360,0
23,5 1 3 4 - - 8 188,0 4418,00 10575,0
18,5 5 2 - - - 7 129,5 2395,75 3052,5
13,5 2 2 - - - 4 54,0 729,00 1620,0

nj 10 13 11 4 2 40 1005,0 26770,00 61200,0

y j n. j 150 585 825 420 270 2250

y 2j n. j 2250 26325 61875 44100 36450 171000

Y xi 20,5255 35,8905 51,255 66,6205 81,9855 -

Cu elementele calculate în tabelul 6.3.5., obţinem sistemul de două


ecuaţii:

40 a + 1005 b = 2250



1005 a + 26770 b = 61200

Rezolvând sistemul, obţinem: a = −20 , 96 şi b = 3 , 073 .


Rezultă că dreapta de regresie va avea ecuaţia:

Yxi = −20 ,96 + 3,073 xi

Înlocuind în această relaţie pe fiecare xi cu centrul de interval


corespunzător, am obţinut valorile numerice ale ecuaţiilor de regresie
(vezi tabelul 6.3.6.).
Fiind o repartiţie de frecvenţe pentru măsurarea gradului de
corelaţie, calculăm raportul de corelaţie utilizând formula de calcul
Seriile interdependente

prezentată în continuare:

∑ ∑ ( y j − Yxi ) ni j
2
∑ y j n. j
i j j
Ry = 1− , unde y =
∑ ( y j − y ) n. j
x 2
∑ n. j
j j

Pentru aplicarea acestei formule vom folosi datele conform


calculelor efectuate în tabelul 6.3.6. Se observă, că pentru determinarea
raportului de corelaţie este necesar să calculăm în prealabil media şi
dispersia pe total (56,25 mii buc. şi 1110,937).
Tabelul 6.3.6
Y xi y j ni j ( y j −Yx )
i
2
ni j
15 2 61,062
20,5255
45 2 1198,002
15 5 2182,065
35,8905
45 2 165,966
15 1 1314,425
51,255 45 3 117,375
75 4 2255,300
15 1 2664,676
45 6 2804,676
66,6205 75 4 280,864
105 1 1472,986
135 2 9351,512
15 1 4487,057
81,9855 75 3 146,392
105 3 1589,002
Total 30091,36

30091,360
R y x= 1− = 0 ,568
44437 ,499

Valoarea raportului de corelaţie indică o legătură de intensitate


medie între cele două variabile luate în studiu. Pentru verificarea
liniarităţii funcţiei care estimează legătura dintre cele două variabile se
calculează coeficientul de corelaţie utilizând în acest scop datele din
tabelul 6.3.5.
STATISTICA

  
n∑ ∑ xi y j n i j −  ∑ xi ni .   ∑ y j n. j 
i j i   j 

ry x = =
 2    
2
 
n ∑ xi2ni. −  ∑ xi ni.   n ∑ y 2j n. j −  ∑ y j n. j  
 i i   j  j  
    
40⋅ 61200− 2250⋅1005
= = 0,57
(40⋅ 26770−1005 )(40⋅171000− 2250 )
2 2

În exemplul luat, egalitatea dintre cei doi indicatori sintetici de


corelaţie ne permite să afirmăm că legătura este liniară. Efectuând deci
calculul şi comparând rezultatele, se poate accepta că legătura este liniară
dacă: R y x = r y x , iar în caz contrar se respinge ipoteza şi, în această
situaţie, se recurge la o altă funcţie de ajustare care să verifice forma de
legătură dintre cele două variabile. Pentru verificarea obiectivităţii
funcţiei de regresie se pot folosi şi rezultatele analizei dispersionale.

6.4 METODE NEPARAMETRICE


DE MĂSURARE A LEGĂTURILOR

Atunci când nu se cunoaşte forma legăturii de corelaţie între două


variabile, precum şi în situaţia în care caracteristicile analizate au caracter
calitativ şi nu se pot exprima numeric dar este posibilă ierarhizarea lor, se
recomandă utilizarea metodelor neparametrice de măsurare a intensităţii
legăturilor statistice. Se mai folosesc în cazul distribuţiilor asimetrice şi
atunci când dispunem de un număr mic de observaţii.
Cei mai utilizaţi indicatori din această categorie sunt coeficientul
de asociere şi coeficienţii de corelaţie a rangurilor Spearman şi Kendall.

Metoda tabelului de asociere şi a coeficientului de asociere se


utilizează în cazul caracteristicilor alternative (care admit numai două
forme de manifestare sau valori). Practic, orice caracteristică statistică
poate fi transformată într-o caracteristică alternativă. De exemplu, pentru
caracteristicile numerice se calculează media, după care se poate împărţi
Seriile interdependente

colectivitatea în două grupe alternative, una cuprinzând unităţile statistice


cu valori sub medie, iar cealaltă valorile superioare mediei.
Tabelul de asociere este o formă particulară a tabelului cu dublă
intrare. În subiectul tabelului se înscrie variaţia caracteristicii factoriale x
iar în predicat variaţia caracteristicii dependente y (tabelul 6.4.1).
Rubricile tabelului conţin frecvenţele cu care unităţile colectivităţii se
înscriu în cele patru grupe formate prin intersecţia variaţiei
caracteristicilor x şi y.

Tabelul de asociere
Tabelul 6.4.1
y y1 y2 Total
x
x1 a b a+b
x2 c d c+d
Total a+c b+d n=a+b+c+d

Intensitatea legăturilor dintre x şi y se măsoară cu ajutorul


coeficientului de asociere propus de Yulle:

ad − bc
Q= .
ad + bc

Valorile indicatorului sunt cuprinse între -1 şi 1. Semnul indicato-


rului arată sensul asocierii: directă, atunci când Q > 0 şi inversă, atunci
când Q < 0. Dacă indicatorul are valoare nulă, nu există legătură de
asociere între x şi y. Dacă Q tinde către ± 1 , legătura este foarte puternică
(apropiată de o legătură de tip funcţional). Asocierea completă (Q = ± 1 )
se produce atunci când una din frecvenţe (a, b, c sau d) este nulă.

Metoda corelaţiei rangurilor


Această metodă constă în înlocuirea valorilor observate ale celor
două caracteristici x şi y, cu numere de ordine care indică poziţia fiecărei
valori în şir (rangul). Dacă există concordanţă între rangurile
caracteristicii factoriale x şi rangurile caracteristicii dependente y
STATISTICA

înseamnă că cele două caracteristici sunt corelate. O măsură sintetică a


corela’iei dintre cele două şiruri de ranguri, după x şi după y, o oferă
coeficientul de corelaţie a rangurilor Spearman:
n

6⋅ ∑d
2
i

rs = 1 − i =1
,
n (n − 1)
2

unde: rs - coeficientul Spearman de corelaţie a rangurilor;


di - diferenţa de rang între caracteristicile x şi y pentru aceeaşi
unitate de observare i;
n - umărul unităţilor statistice din colectivitatea înregistrată
(perechile de valori corelate).
Indicatorul ia valori cuprinse între -1 şi 1; interpretarea rezultatului
este similară celei efectuate pentru coeficientul de asociere.
Un alt indicator care se poate calcula în cadrul metodei corelaţiei
rangurilor este coeficientul lui Kendall, dat de formula:
2⋅S
rK = ,
n ⋅( n −1)
unde: rK - coeficientul Kendall de corelaţie a rangurilor;
n - numărul unităţilor statistice observate.
n n n
S = ∑ S i = ∑ Pi − ∑ Qi ,
i =1 i =1 i =1

unde: Pi - numărul rangurilor următoare (de la termenul i până la sfârşitul


seriei) care sunt mai mari decât rangul termenului i;
Qi - numărul rangurilor următoare (până la sfârşitul seriei) care sunt
mai mici decât rangul termenului i.
Mărimile Pi şi Qi se determină numai pentru caracteristica y,
aranjată în funcţie de caracteristica x ordonată crescător.
Valorile coeficientului Kendall sunt cuprinse între -1 şi 1,
interpretarea lor fiind similară indicatorilor precedenţi. De regulă, coefi-
cientul Kendall înregistrează valori inferioare coeficientului Spearman (în
valoare absolută).
Coeficienţii de corelaţie a rangurilor se folosesc frecvent pentru
analiza legăturilor dintre două caracteristici calitative sau între o
Seriile interdependente

caracteristică de tip calitativ şi una cantitativă, dacă este posibilă


ierarhizarea variantelor caracteristicii calitative.
Un exemplu de calcul a coeficienţilor de corelaţie a rangurilor este
prezentat în tabelele 6.4.2 şi 6.4.3.

Calcularea coeficientului de corelaţie a rangurilor Spearman


privind legătura dintre exportul şi importul României
în/din tările Uniunii Europene în ianuarie 2002
Tabelul nr. 6.4.2
Rang după:
Ţara Export Import export (x ) import Diferenţa de
(mil.USD) (mil.USD) (y) rang (di)
Austria 30,3 37,1 9 11 -2
Belgia 13,2 15,5 8 7 1
Danemarca 1,8 3,3 4 4 0
Franţa 86,8 74,8 13 13 0
Finlanda 0,3 2,4 2 2 0
Germania 151,2 177,1 14 14 0
Grecia 36,7 20,5 11 10 1
Irlanda 1,4 6,3 3 5 -2
Italia 244,1 256,2 15 15 0
Luxemburg 0,1 0,3 1 1 0
Olanda 31,6 20,4 10 9 1
Portugalia 2,9 3,0 5 3 2
Spania 10,8 16,9 7 8 -1
Suedia 5,1 10,8 6 6 0
Marea 43,0 44,7 12 12 0
Britanie
Total 659,3 689,3 - - -
Sursa: Buletin statistic lunar, nr.1/2002, INS,p.20

Coeficientul de corelaţie a rangurilor Spearman este:

6 ⋅ ∑ di
2

6 ⋅ [(−2) 2 + 12 + 12 + (−2) 2 + 12 + (2) 2 + (−1) 2 ]


rs = 1 − i
=1− =
n (n − 1)
2
15 ⋅ (225 − 1)
96
=1− = 0,97
3360
STATISTICA

Pentru calcularea coeficientului Kendall (tabelul 6.4.3) se


ordonează crescător ţările Uniunii Europene după variabila x (export)
înscriind în coloana alăturată rangurile corespunzătoare după import. Se
determină apoi pentru fiecare ţară, pe baza rangurilor la import:
Pi - numărul de ţări (de la rândul i până la sfârşitul seriei) având la
import ranguri superioare rangului ţării i;
Qi - numărul de ţări (de la rândul i până la sfârşitul seriei) având la
import ranguri inferioare rangului ţării i.

Calcularea coeficientului de corelaţie a rangurilor Kendall


privind legătura dintre exportul şi importul României
în/din tările Uniunii Europene în ianuarie 2002
Tabelul nr. 6.4.3
Rang după:
Ţara Export Import export import Pi Qi Si
(mil.USD) (mil.USD) (x ) (y)
Luxemburg 0,1 0,3 1 1 14 0 14
Finlanda 0,3 2,4 2 2 13 0 13
Irlanda 1,4 6,3 3 5 10 2 8
Danemarca 1,8 3,3 4 4 10 1 9
Portugalia 2,9 3,0 5 3 10 0 10
Suedia 5,1 10,8 6 6 9 0 9
Spania 10,8 16,9 7 8 7 1 6
Belgia 13,2 15,5 8 7 7 0 7
Austria 30,3 37,1 9 11 4 2 2
Olanda 31,6 20,4 10 9 5 0 5
Grecia 36,7 20,5 11 10 4 0 4
Marea Britanie 43,0 44,7 12 12 3 0 3
Franţa 86,8 74,8 13 13 2 0 2
Germania 151,2 177,1 14 14 1 0 1
Italia 244,1 256,2 15 15 0 0 0
Total 659,3 689,3 - - 99 6 93
Sursa: Buletin statistic lunar, nr.1/2002, INS, p.20
Se determină apoi, pentru fiecare ţară diferenţa:
Si = Pi - Qi.
Pe total:
S = ∑ Pi − ∑ Qi = 99 − 6 = 93 .
Seriile interdependente

Coeficientul Kendall este:


2⋅S 2 ⋅ 93
rK = = = 0,886 ,
n ⋅ (n − 1) 15 ⋅ (15 − 1)
unde:
S = ∑ Si .
i

Valorile celor doi coeficienţi de corelaţie a rangurilor arată o


legătură directă foarte puternică între exportul şi importul României în/din
ţările Uniunii Europene.

6.5 ÎNTREBĂRI ŞI TESTE-GRILĂ

6.5.1 Întrebări recapitulative

1. Prin ce se caracterizează legăturile statistice?


2. Prin ce se deosebesc legăturile statistice de alte tipuri de
legături?
3. Ce înţelegeţi prin legătură simplă? Exemplificaţi.
4. Ce înţelegeţi prin legătură multiplă? Exemplificaţi.
5. Ce înţelegeţi prin legătură directă? Exemplificaţi.
6. Ce înţelegeţi prin legătură inversă? Exemplificaţi.
7. Ce înţelegeţi prin asociere statistică? Exemplificaţi.
8. Ce înţelegeţi prin corelaţie statistică? Exemplificaţi.
9. Ce metode simple se pot utiliza pentru verificarea existenţei
legăturii?
10. Ce metode simple se pot utiliza în cazul în care dispunem de un
număr mic de perechi de valori pentru care nu este necesară, în
prealabil, sistematizarea datelor prin grupare?
11. Ce metode simple se pot utiliza în cazul în care dispunem de un
număr mare de perechi de valori pentru care este necesară, în
prealabil, sistematizarea datelor prin grupare?
12. Prin ce se reprezintă grafic legătura dintre două variabile
statistice?
13. Ce se poate evidenţia cu ajutorul metodei grafice cu privire la
legăturile statistice?
STATISTICA

14. Ce este un tabel de corelaţie?


15. Ce condiţii trebuie să îndeplinească un tabel de corelaţie pentru
a permite analiza legăturii între două variabile statistice?
16. Ce este un tabel de asociere?
17. Pentru ce se poate utiliza un tabel de asociere?
18. Pentru ce se utilizează metoda regresiei?
19. Care este semnificaţia statistică a parametrilor modelului liniar
de regresie?
20. Care este semnificaţia geometrică a parametrilor modelului
liniar de regresie?
21. Ce arată semnul coeficientului de regresie?
22. Prin ce se măsoară intensitatea legăturii în cazul legăturii
liniare?
23. Prin ce se măsoară intensitatea legăturii în cazul legăturii
neliniare?
24. Ce semnificaţie are valoarea coeficientului de corelaţie?
25. Între ce limite ia valori coeficientul de corelaţie?
26. Ce semnificaţie are valoarea raportului de corelaţie?
27. Cum se poate verifica ipoteza privind liniaritatea legăturii?
28. Între ce limite ia valori raportul de corelaţie?
29. Ce indicator se poate calcula pe baza raportului de corelaţie?
30. Când se utilizează metodele parametrice pentru analiza
legăturilor dintre variabilele statistice?
31. Când se utilizează metodele neparametrice pentru analiza
legăturilor dintre variabilele statistice?
32. Care sunt cele mai utilizate metode neparametrice pentru
analiza legăturilor dintre variabilele statistice?
33. Când se utilizează coeficientul de asociere propus de Yule?
34. Ce înţelegeţi prin ranguri şi care sunt cei mai utilizaţi indicatori
calculaţi pe baza acestora?
35. Ce relaţie este între coeficienţii de asociere a rangurilor propuşi
de Spearman şi Kendall?
Seriile interdependente

6.5.2 Teste-grilă
1. După natura relaţiei de cauzalitate, legăturile dintre fenomene
pot fi :
a) asociere sau corelaţie ;
b) simple sau multiple ;
c) funcţionale sau statistice ;
d) directe sau inverse.
2. După numărul de caracteristici luate în consideraţie, legăturile
statistice dintre fenomene pot fi :
a) directe sau inverse ;
b) simple sau multiple ;
c) asociere sau corelaţie ;
d) liniare sau neliniare.
3. După modul de exprimare a caracteristicilor analizate,
legăturile statistice dintre fenomene pot fi :
a) asociere sau corelaţie ;
b) liniare sau neliniare ;
c) sincrone sau asincrone;
d) directe sau inverse.
4. După direcţia de realizare, legăturile statistice dintre fenomene
pot fi :
a) simple sau multiple ;
b) liniare sau neliniare ;
c) funcţionale sau statistice ;
d) directe sau inverse.
5. După forma de realizare, legăturile statistice dintre fenomene
pot fi :
a) liniare ;
b) parabolice ;
c) hiperbolice ;
d) exponenţiale ;
e) oricare din formele anterioare.
STATISTICA

6. După momentul realizării, legăturile statistice pot fi:


a) concomitente sau cu decalaj;
b) sincrone sau asincrone;
c) directe sau inverse;
d) asociere sau corelaţie;
e) “a” sau “b”.
7. Dependenţa vânzărilor de mărfuri de suprafaţa comercială
reprezintă o legătură :
a) simplă ;
b) asincronă ;
c) indirectă ;
d) de corelaţie ;
e) directă.
Alegeţi combinaţia corectă: A(a,b,c,d,e); B(a,b,e); C(a,d,e); D(c,d).
8. Creşterea producţiei datorată procesului investiţional reprezintă
o legătură :
a) simplă ;
b) asincronă ;
c) indirectă ;
d) de corelaţie ;
e) directă.
Alegeţi combinaţia corectă: A(a,b,c,d,e); B(a,b,e); C(a,d,e);
D(a,b,d,e).
9. Legătura dintre ramura de activitate şi salariul mediu reprezintă
o legătură :
a) funcţională şi directă ;
b) liniară şi inversă ;
c) de asociere şi simplă ;
d) de corelaţie şi sincronă.
10. Dependenţa profitului de cifra de afaceri şi cheltuielile de
producţie reprezintă o legătură statistică :
a) de asociere ;
b) asincronă ;
c) inversă ;
d) multiplă.
Seriile interdependente

11. Atunci când unei anumite valori a fenomenului cauză îi


corespunde o singură valoare a fenomenului efect, legătura
este :
a) funcţională;
b) stochastică;
c) directă;
d) sincronă.
12. Atunci când fenomenul efect depinde de mai multe fenomene
cauză, legătura este :
a) multiplă ;
b) statistică ;
c) indirectă ;
d) de corelaţie.
13. Atunci când efectul se transformă în cauză prin intermediul
unor relaţii de cauzalitate în lanţ, legăturile sunt :
a) reciproce ;
b) inverse ;
c) de asociere ;
d) multiple.
14. Legătura de asociere relevă raportul de cauzalitate dintre :
a) două sau mai multe caracteristici exprimate numeric ;
b) o caracteristică exprimată numeric şi o caracteristică
exprimată prin cuvinte ;
c) două sau mai multe caracteristici exprimate prin cuvinte ;
d) “a” sau “b” ;
e) “b” sau “c”.

15. Atunci când modificarea nivelului de dezvoltare a caracteristicii


factoriale determină modificarea în acelaşi sens a nivelului
caracteristicii rezultative, legătura este :
a) inversă;
b) sincronă;
c) directă;
d) multiplă;
e) liniară.
STATISTICA

16. Metodele simple (elementare) de analiză a legăturilor dintre


fenomenele economico-sociale permit evidenţierea:
a) existenţei sau lipsei legăturii;
b) direcţiei de realizare a legăturii;
c) formei de realizare a legăturii;
d) intensităţii acesteia;
e) a,b,c şi d.
17. Dintre metodele de stabilire a existenţei şi formei de legătură
dintre fenomenele economico-sociale nu face parte :
a) metoda regresiei;
b) metoda grupărilor;
c) metoda analizei dispersionale;
d) metoda grafică ;
e) metoda tabelului de corelaţie.
18. Metoda seriilor paralele interdependente oferă posibilitatea de a
cunoaşte :
a) existenţa legăturii;
b) direcţia de realizare a legăturii;
c) forma aproximativă a legăturii;
d) intensitatea legăturii.
Alegeţi combinaţia corectă: A(a); B(a,b); C(a,b,c);
D(a,b,c,d); E(b.d).
19. În funcţie de modul de repartizare a frecvenţelor în tabelul de
corelaţie se poate aprecia :
a) direcţia legăturii;
b) intensitatea legăturii;
c) existenţa legăturii;
d) forma legăturii.
Alegeţi afirmaţia incorectă.

20. Graficul de corelaţie :


a) se mai numeşte şi corelogramă ;
b) are aspectul unui nor de puncte ;
c) indică existenţa legăturii ;
d) arată forma şi direcţia legăturii ;
Seriile interdependente

e) fiecare valoare a caracteristicii rezultative şi a celei factoriale


se reprezintă pe grafic prin câte un punct.
Alegeţi afirmaţia incorectă.
21. Alegerea funcţiei de regresie se face cu ajutorul :
a) corelogramei;
b) seriilor paralele independente;
c) metodei grupării ;
d) tabelului de corelaţie.
22. În sens economic, parametrul “b” al funcţiei liniare de regresie
arată :
a) cu cât se schimbă în medie variabila dependentă Y atunci
când variabila X se modifică cu o unitate ;
b) nivelul mediu al variabilei Y determinat de variabila
factorială X ;
c) nivelul mediu al variabilei Y determinat de alţi factori decât
variabila X ;
d) gradul de influenţă a variabilei factoriale X şi a factorilor cu
acţiune constantă asupra variabilei rezultative Y.
23. Indicatorii sintetici ai corelaţiei :
a) măsoară variaţia caracteristicii dependente ;
b) măsoară la nivelul întregii colectivităţi intensitatea
legăturilor de tip statistic dintre două sau mai multe
variabile ;
c) se determină cu analiza dispersională ;
d) sunt : covarianţa, coeficientul de corelaţie şi raportul de
corelaţie.
Alegeţi combinaţia corectă: A(a,b); B(b,c); C(c,d); D(b,d).
24. Covarianţa:
a) se calculează ca medie aritmetică a produselor abaterilor
variabilelor faţă de medie;
b) este nulă dacă variabilele sunt independente;
c) nu are limită superioară;
d) creşte odată cu intensitatea corelaţiei;
e) scade odată cu intensitatea corelaţiei.
Alegeţi afirmaţia incorectă.
STATISTICA

25. Coeficientul de corelaţie :


a) este un indicator sintetic al intensităţii legăturii dintre două
variabile ;
b) se calculează ca o medie a produselor abaterilor normale
normate ;
c) ia valori în intervalul [-1,1] ;
d) este egal cu raportul de corelaţie în cazul legăturilor liniare ;
e) este semnificativ în cazul legăturilor neliniare.
Alegeţi afirmaţia incorectă.
26. Legătura dintre două variabile este foarte slabă sau inexistentă
dacă valoarea coeficientului de corelaţie se situează în
intervalul:
a) [0-0,2);
b) [0,2-0,5);
c) (-0,2-0);
d) (0,75-1).
Alegeţi combinaţia corectă: A(a); B(a,b); C(d); D(a,c).
27. Atunci când coeficientul de corelaţie ia valoarea 1:
a) legătura este de tip funcţional;
b) variabilele sunt independente;
c) corelaţia este puternică;
d) legătura este liniară.
28. Coeficientul de corelaţie calculat pentru o legătură liniară
inversă poate lua valori în mulţimea:
a) (-1; 0);
b) (0; 1);
c) mulţimea numerelor întregi pozitive;
d) mulţimea numerelor reale pozitive.
29. Coeficientul şi raportul de corelaţie au valori egale atunci când:
a) legătura dintre variabile este liniară;
b) legătura dintre variabile este directă;
c) legătura dintre variabile este inversă;
d) colectivitatea este omogenă
.
Seriile interdependente

30. Intervalul de variaţie a raportului de corelaţie este:


a) (0; 1);
b) (0; 1];
c) [0; 1];
d) [-1; 1];
e) (-1; 1).
31. Raportul de corelaţie:
a) este un indicator sintetic al intensităţii legăturilor dintre
variabilele statistice;
b) se calculează ca rădăcină pătrată din coeficientul de
determinaţie;
c) are valori între 0 şi 1;
d) are valori între -1 şi 1;
e) măsoară intensitatea legăturii indiferent de forma acesteia;
Alegeţi combinaţia corectă: A(a,b); B(a,b,c,e);
C(a,b,d); D(a,c,e).
32. Determinaţi ecuaţia dreptei de regresie având coeficientul
unghiular –9 şi ordonata la origine 16.
a) Y= -9 +16x;
b) Y= 16 - 9x;
c) Y= 9 +16x;
d) nu se poate determina.
33. Legătura dintre vechime şi productivitatea muncii
(buc./muncitor) este exprimată prin ecuaţia de regresie:
Y=20+0,2x .
Productivitatea unui muncitor cu vechime de 10 ani va fi:
a) 22;
b) 20,2;
c) 24;
d) nu se poate calcula.
34. Într-o unitate economică a fost analizată legătura dintre
cheltuielile de producţie şi profit obţinându-se un coeficient de
corelaţie de –0,9. Profitul depinde de cheltuielile de producţie
în proporţie de:
a) 81%;
STATISTICA

b) 9%;
c) 90%;
d) 0,81%.
35. Se cunosc următoarele date privind producţia şi costurile unitare
înregistrate într-o unitate economică:
Producţie (buc.) 2 3 4 5 6 7 8 9 10
Cost unitar (mii lei/buc.) 32 30 27 23 22 25 29 30 31
Legătura dintre variabile este exprimată printr-o:
a) funcţie liniară;
b) exponenţială;
c) parabolă;
d) hiperbolă;
e) nu se poate preciza.
36. În cazul legăturilor liniare inverse, mulţimea valorilor raportului
de corelaţie este:
a) (-1,1); b) (0,1]; c) (-1,0); d) mulţimea numerelor reale.
37. Intensitatea legăturii dintre două variabile a fost măsurată prin
intermediul coeficientului şi raportului de corelaţie, obţinându-
se în ambele cazuri valoarea 0,9. Legătura nu este:
a) directă;
b) foarte puternică,
c) liniară;
d) curbilinie.
38. Legătura dintre două variabile se exprimă printr-o funcţie
exponenţială. Intensitatea legăturii dintre cele două variabile se
va măsura cu:
a) coeficientul de corelaţie;
b) raportul de corelaţie;
c) coeficientul de regresie;
d) coeficientul de variaţie.
Soluţii:
1.c; 2.b; 3.a; 4.d; 5.e; 6.e; 7.C; 8.D; 9.c; 10.d; 11.a; 12.b; 13.a;
14.e; 15.c; 16.e; 17.a; 18.B; 19.d; 20.e; 21.a; 22.a; 23.D; 24.e; 25.e; 26.D;
27.a; 28.a; 29.a; 30.c; 31.B; 32.b; 33.a; 34.a; 35.c; 36.b; 37.d; 38.b.