Documente Academic
Documente Profesional
Documente Cultură
SERIILE INTERDEPENDENTE
• Metoda grupărilor
Întrucât metoda precedentă este aplicabilă doar în cazul
colectivităţilor de volum mic, o variantă a ei o reprezintă gruparea
prealabilă a unităţilor colectivităţii după caracteristica factorială x.
Pentru fiecare grupă astfel formată, se calculează media
caracteristicii dependente y. Se înscriu, în coloane paralele, grupările
ordonate ale caracteristicii x şi mediile corespunzătoare ale lui y.
Seriile interdependente
• Tabelul de corelaţie
Această metodă presupune gruparea ambelor caracteristici, x şi y
într-un tabel cu dublă intrare.
Tabelul de corelaţie este un tabel cu dublă intrare în care pe
coloane se trec grupele formate după variaţia caracteristicii factoriale x,
ordonate crescător, iar pe linii se înscriu grupele referitoare la variaţia
caracteristicii dependente y, de preferinţă ordonate descrescător.
STATISTICA
• Metoda grafică
Este un procedeu simplu şi sugestiv de vizualizare a relaţiilor de
dependenţă dintre două variabile.
Toate unităţile colectivităţii analizate se reprezintă grafic prin
puncte în sistemul de coordonate rectangulare. Valorile caracteristicii
factoriale x se trec pe abscisă, iar valorile caracteristicii dependente y se
înscriu pe ordonată. Unităţile colectivităţii se situează la intersecţia celor
două axe de coordonate care corespund valorilor pe care le iau după
caracteristica x, respectiv y. Scara de reprezentare influenţează
interpretarea rezultatelor.
Atunci când punctele de pe grafic tind să se concentreze sub forma
unei linii drepte sau a unei curbe (fig. 6.1.), cele două variabile, x şi y,
sunt în relaţii de dependenţă. Atunci când punctele sunt împrăştiate pe
grafic, fără nici o regularitate (fig. 6.2.), cele două variabile sunt
independente.
y y
.
. .
. . . .
.. . .
.. . . . .
. . .
. . . . .
. .
. .
.
x
x
Fig. 6.2.1 Legătură liniară Fig. 6.2.2 Variabile
directă independente
• Analiza dispersională
Această metodă poate fi considerată ca un caz particular de
regresie. Este folosită în studiul modalităţilor în care unul sau mai mulţi
factori influenţează asupra unei caracteristici rezultative.
Analiza dispersională arată mărimea şi frecvenţa cu care valorile
reale ale unei caracteristici statistice se abat de la valorile teoretice calcu-
late (indicatorii sintetici care caracterizează colectivitatea în ansamblu) şi
măsura în care aceste abateri depind de factorul de grupare.
Analiza dispersională poate înregistra variaţia unei caracteristici în
funcţie de unul sau mai mulţi factori de grupare.
Atunci când caracteristica dependentă y este influenţată de un
singur factor de grupare x, prin analiza dispersională se determină cât din
variaţia totală a lui y este produsă de factorul de grupare, restul
reprezentând rezultatul acţiunii factorilor reziduali (neînregistraţi).
Atunci când y este dependent de mai mulţi factori de grupare,
variaţia explicată a lui y se repartizează pe factorii de influenţă
(x1, x2,... , xn), iar variaţia neexplicată este considerată variaţie reziduală,
produsă de factori neînregistraţi.
Analiza dispersională unifactorială poate fi utilizată pentru a
verifica dependenţa unei variabile de factorul de grupare. Ea permite
verificarea gradului şi formei de variaţie a caracteristicii dependente în
funcţie de factorul de grupare.
Pentru aceasta, unităţile statistice ale colectivităţii analizate se
împart după un factor de grupare, considerat factor de influenţă şi se
analizează dispersia termenilor în cadrul fiecărei grupe şi între grupele
astfel formate.
Cu cât factorul de grupare are un rol mai important în variaţia
caracteristicii dependente y, cu atât dispersia în interiorul grupelor este
mai mică, iar dispersia dintre grupe este mai mare.
Analiza dispersională presupune calcularea următorilor indicatori:
varianţa dintre grupe şi din interiorul grupelor, coeficienţii de
determinaţie şi de nedeterminaţie şi coeficientul raportului dintre
dispersii.
Se porneşte de la împărţirea colectivităţii în r grupe, fiecare grupă
i conţinând ni valori (yi1 , yi2 ,... , yini).
Se calculează media valorilor din fiecare grupă ( yi ) şi media
generală ( y0 ).
Seriile interdependente
f2 = n - r.
Seriile interdependente
METODA REGRESIEI
Regresia este o metodă analitică de studiere a legăturilor dintre
două sau mai multe variabile cu ajutorul unor funcţii matematice care
exprimă forma legăturii dintre variabile.
Funcţia de regresie are forma generală:
Y =f (x1 , x2 ,..., xn)+ε,
unde: Y- variabila dependentă, fenomenul efect;
x1 , x2 ,..., xn - variabilele independente, factorii de influenţă;
n - numărul variabilelor independente;
ε - constantă care sintetizează influenţa factorilor neînregistraţi.
x
Fig. 6.3.1 - Funcţia liniară (legătura inversă)
∑[ y
i =1
i − ( a + bx i )] 2 = min .
n
∑ 2 ⋅ xi ⋅ ( yi − a − bxi ) = 0.
i =1
cu soluţia:
a=
∑ yi ni ⋅ ∑ xi2 ni − ∑ xi ni ⋅ ∑ xi yi ni
n ⋅ ∑ xi2 ni − (∑ xi ni )2
n ⋅ ∑ x i y i ni − ∑ x i ni ⋅ ∑ y i ni
b=
n ⋅ ∑ xi2 ni − (∑ xi ni )2
a ⋅ ∑∑ n i + b ⋅ ∑ x i ⋅ n i. = ∑ y j ⋅ n . j
i j i j
a ⋅ ∑ x i ⋅ n i. + b ⋅ ∑ x i ⋅ n i. = ∑∑ x i ⋅ y j ⋅ n i
2
i i i j
STATISTICA
x x
x
Fig. 6.3.4 - Hiperbola
Yx = a0 + a1 ⋅ x1i + a 2 ⋅ x 2i
i
1 n
cov( x , y ) = ∑ ( xi − x ) ⋅ ( y i − y ).
n i =1
Indicatorul ia valori pozitive dacă legătura dintre variabile este
directă şi valori negative în caz contrar. Valori apropiate de zero
semnifică lipsa oricărei legături între x şi y; valori ridicate ale
indicatorului arată o legătură puternică.
Coeficientul de corelaţie simplă măsoară intensitatea legăturilor
liniare dintre două variabile.
Fenomenele care se află în relaţii strânse de interdependenţă
prezintă o poziţie similară a valorilor individuale ale fiecărui fenomen în
parte (xi, yi) faţă de media corespunzătoare ( x , respectiv y ). Rezultă de
xi − x yi − y
aici că şi abaterile normale normate , respectiv au mărimi
σx σy
apropiate pentru valorile perechi xi, yi. Pentru a obţine o mărime sintetică
a abaterilor normale normate la nivelul întregii colectivităţi se calculează
Seriile interdependente
ry / x =
∑ (xi − x )⋅ (yi − y )
n ⋅σ x ⋅σ y
( yi − y ) ∑ (y i − Y xi ) ∑ (Y xi − y )
2 2 2
σ =2∑ 2
; σ y/r = ; σ y2 / x = .
y
n n n
Împărţind relaţia anterioară la σ 2y , se obţine:
σ y2 / r σ y2 / x
1= + .
σ y2 σ 2y
STATISTICA
∑ ( yi − Yxi )2
σ y2 / r n ∑( yi − Yxi )2
Ry / x = 1− = 1− = 1−
σ y2 ∑ (yi − y ) ∑ (y i − y )
2 2
n
Valorile indicatorului sunt cuprinse între 0 şi 1. Raportul de
corelaţie este nul în cazul variabilelor independente şi 1 în cazul varia-
bilelor foarte puternic corelate.
Pentru legăturile liniare, raportul de corelaţie este egal cu
coeficientul de corelaţie.
Formula anterioară se utilizează în cazul unui volum mic de date
negrupate.
Seriile interdependente
∑( y i − Yx i ) 2 ⋅ n i
R y/x = 1− i
.
∑ (y )2
i − y ⋅ ni
i
∑∑ ( y
i j
j − Yx i ) 2 ⋅ n ij
R y/x = 1− .
∑ (y )
2
j − y ⋅ n.j
j
∑∑(y j − Yxi )
Total: 2
nij
i j
STATISTICA
∑ (y i − Yx1x 2 ...x n ) 2
R = 1− i =1
n
.
∑ (y
i =1
i − y) 2
∑ (Y ) 2
x −y
F calc = r −1 ,
∑ (y i − Yx )
2
n−r
unde: n - numărul unităţilor statistice;
r - numărul grupelor.
Valoarea calculată se compară cu valoarea tabelată Ftab identificată
în funcţie de nivelul de semnificaţie α ales şi de numărul gradelor de
libertate f1 = r - 1, f2 = n - r (vezi anexa 1).
Valoarea tabelată arată nivelul de la care începe să fie semnificativ
raportul de corelaţie. Aşadar, pentru Fcalc ≥ Ftab, raportul de corelaţie este
acceptat, iar pentru Fcalc < Ftab este respins.
Aplicaţia 1
Numărul mediu de angajaţi şi profitul anual înregistrat de 10 firme
dintr-o subramură industrială se prezintă astfel:
Tabelul 6.3.2
Nr. Număr mediu de
Profit anual (mil. lei)
crt. angajaţi (persoane)
0 1 2
1 13 115
2 4 45
3 12 100
4 5 50
5 6 55
6 8 85
7 3 40
8 4 50
9 5 45
10 7 70
Total 67 655
STATISTICA
Se cere:
1. să se analizeze existenţa, direcţia şi forma legăturii;
2. să se determine parametrii funcţiei de regresie;
3. să se calculeze valorile funcţiei de regresie;
4. să se măsoare intensitatea corelaţiei dintre cele două variabile
folosind coeficientul şi raportul de corelaţie.
Rezolvare
120
100
80
60
40
20
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
xi (pers.)
n a + b∑ xi = ∑ yi
a ∑ xi + b∑ xi2 = ∑ xi yi
1 2 4 3 5 6 7
13 115 1.495 169 13.225 112,80 4,86
4 45 180 16 2.025 45,23 0,05
12 100 1.200 144 10.000 105,29 27,96
5 50 250 25 2.500 52,74 7,50
6 55 330 36 3.025 60,24 27,51
8 85 680 64 7.225 75,26 94,88
3 40 120 9 1.600 37,72 5,18
4 50 200 16 2.500 45,23 22,75
5 45 225 25 2.025 52,74 59,87
7 70 490 49 4.900 67,75 5,05
67 655 5.170 553 49.025 655,00 225,62
STATISTICA
n ∑ xi y i − ∑ xi ∑ y i
ry = =
x
[n ∑ x 2
i ][
− (∑ xi )2 n ∑ yi2 − (∑ yi )2 ]
10 ⋅ 5170 − 67 ⋅ 655
= = 0 ,9789
[10 ⋅ 553 − 67 ][10 ⋅ 49025 − 655 ]
2 2
unde y=
∑ yi
655
=
= 65,5
n 10
Utilizând datele din tabelul 6.3.3., calculăm:
255,62
Ry x = 1− = 0 ,9789
6122,50
Coeficientul şi raportul de corelaţie au valori egale, ceea ce
confirmă liniaritatea legăturii.
Seriile interdependente
Aplicaţia 2
Într-o subramură industrială s-au înregistrat într-o lună
următoarele informaţii privind cheltuielile de producţie şi producţia
obţinută:
Tabelul 6.3.4
Cheltuieli de producţie (mil. lei)
Producţie
120 şi
(mii buc.) sub 30 30-60 60-90 90-120 Total
peste
0 1 2 3 4 5 6
31-36 1 - 3 3 - 7
26-31 1 6 4 1 2 14
21-26 1 3 4 - - 8
16-21 5 2 - - - 7
11-16 2 2 - - - 4
Total: 10 13 11 4 2 40
n a + b∑ xi ni . = ∑ yi n. j
i j
2
a ∑ xi ni . +b∑ xi ni . = ∑ ∑ xi y j ni j
i i i j
Tabelul 6.3.5
y j
15 45 75 105 135 ni . x i n i . x i2 n i . xi ∑ y j ni j
j
xi
0 1 2 3 4 5 6 7 8 9
33,5 1 - 3 3 - 7 234,5 7855,75 18592,5
28,5 1 6 4 1 2 14 399,0 11371,50 27360,0
23,5 1 3 4 - - 8 188,0 4418,00 10575,0
18,5 5 2 - - - 7 129,5 2395,75 3052,5
13,5 2 2 - - - 4 54,0 729,00 1620,0
prezentată în continuare:
∑ ∑ ( y j − Yxi ) ni j
2
∑ y j n. j
i j j
Ry = 1− , unde y =
∑ ( y j − y ) n. j
x 2
∑ n. j
j j
30091,360
R y x= 1− = 0 ,568
44437 ,499
n∑ ∑ xi y j n i j − ∑ xi ni . ∑ y j n. j
i j i j
ry x = =
2
2
n ∑ xi2ni. − ∑ xi ni. n ∑ y 2j n. j − ∑ y j n. j
i i j j
40⋅ 61200− 2250⋅1005
= = 0,57
(40⋅ 26770−1005 )(40⋅171000− 2250 )
2 2
Tabelul de asociere
Tabelul 6.4.1
y y1 y2 Total
x
x1 a b a+b
x2 c d c+d
Total a+c b+d n=a+b+c+d
ad − bc
Q= .
ad + bc
6⋅ ∑d
2
i
rs = 1 − i =1
,
n (n − 1)
2
6 ⋅ ∑ di
2
6.5.2 Teste-grilă
1. După natura relaţiei de cauzalitate, legăturile dintre fenomene
pot fi :
a) asociere sau corelaţie ;
b) simple sau multiple ;
c) funcţionale sau statistice ;
d) directe sau inverse.
2. După numărul de caracteristici luate în consideraţie, legăturile
statistice dintre fenomene pot fi :
a) directe sau inverse ;
b) simple sau multiple ;
c) asociere sau corelaţie ;
d) liniare sau neliniare.
3. După modul de exprimare a caracteristicilor analizate,
legăturile statistice dintre fenomene pot fi :
a) asociere sau corelaţie ;
b) liniare sau neliniare ;
c) sincrone sau asincrone;
d) directe sau inverse.
4. După direcţia de realizare, legăturile statistice dintre fenomene
pot fi :
a) simple sau multiple ;
b) liniare sau neliniare ;
c) funcţionale sau statistice ;
d) directe sau inverse.
5. După forma de realizare, legăturile statistice dintre fenomene
pot fi :
a) liniare ;
b) parabolice ;
c) hiperbolice ;
d) exponenţiale ;
e) oricare din formele anterioare.
STATISTICA
b) 9%;
c) 90%;
d) 0,81%.
35. Se cunosc următoarele date privind producţia şi costurile unitare
înregistrate într-o unitate economică:
Producţie (buc.) 2 3 4 5 6 7 8 9 10
Cost unitar (mii lei/buc.) 32 30 27 23 22 25 29 30 31
Legătura dintre variabile este exprimată printr-o:
a) funcţie liniară;
b) exponenţială;
c) parabolă;
d) hiperbolă;
e) nu se poate preciza.
36. În cazul legăturilor liniare inverse, mulţimea valorilor raportului
de corelaţie este:
a) (-1,1); b) (0,1]; c) (-1,0); d) mulţimea numerelor reale.
37. Intensitatea legăturii dintre două variabile a fost măsurată prin
intermediul coeficientului şi raportului de corelaţie, obţinându-
se în ambele cazuri valoarea 0,9. Legătura nu este:
a) directă;
b) foarte puternică,
c) liniară;
d) curbilinie.
38. Legătura dintre două variabile se exprimă printr-o funcţie
exponenţială. Intensitatea legăturii dintre cele două variabile se
va măsura cu:
a) coeficientul de corelaţie;
b) raportul de corelaţie;
c) coeficientul de regresie;
d) coeficientul de variaţie.
Soluţii:
1.c; 2.b; 3.a; 4.d; 5.e; 6.e; 7.C; 8.D; 9.c; 10.d; 11.a; 12.b; 13.a;
14.e; 15.c; 16.e; 17.a; 18.B; 19.d; 20.e; 21.a; 22.a; 23.D; 24.e; 25.e; 26.D;
27.a; 28.a; 29.a; 30.c; 31.B; 32.b; 33.a; 34.a; 35.c; 36.b; 37.d; 38.b.