Documente Academic
Documente Profesional
Documente Cultură
Regresia,
exprim o legtur de tip statistic i anume regresia n
medie cu privire la comportamentul unor variabile.
Corelaia,
exprim raporturi reciproce ntre anumite caracteristici.
Covariaia,
exprim variaia simultan a dou variabile ntre care
exist dependen. Se msoar cu ajutorul covarianei.
Analiza de regresie,
este metoda statistic care permite studierea i msurarea,
relaiei dintre dou sau mai multe variabile, adic permite
estimarea valorilor unei variabile n funcie de o alt variabil
sau de mai multe.
Analiza de corelaie,
este metoda statistic prin care se msoar intensitatea
legturii dintre variabile, adic se evideniaz gradul de
influen a variabilei sau variabilelor factoriale asupra
variabilei rezultative.
Variabila factorial,
se mai numete independent, cauz, exogen, explicativ
se noteaz prin x
explic variaia altei variabile, celei rezultative.
Variabila rezultativ,
se mai numete dependent, efect, endogen, explicat
se noteaz prin y
Variabila reziduu,
sau eroarea de modelare, sintetizeaz influena tuturor
factorilor neinclui n model.
se noteaz prin e
Model de regresie,
este expresia matematic care exprim legtura dintre
variabile i care n forma cea mai general poate fi scris:
y = f ( x1, x2, x3, xn ) + e
Metode elementare
x x1 x2 . xi . xn
y y1 y2 . yi . yn
Exemple:
Se cunosc urmtoarele date cu privire la cheltuielile cu
publicitatea i nivelul vnzrilor unei firme n ultimele luni
de activitate.
Tabelul nr.49
Cheltuieli cu
publicitatea 6 10 14 12 13,6 16
(mil.lei)
Nivelul
vnzrilor 10 50 140 90 120 180
(mld.lei)
7 8 9 13 14,8 15,6 17
24 30 54 110 150 160 190
Tabelul nr.50
13,6
14,8
15,6
10
12
13
14
16
17
x
110
120
140
150
160
180
190
10
24
30
54
50
90
y
Tabelul nr.51
Nr.
alcoolici 14 19 27 34 41 47 51
(x)
Nr.
accidente
8 10 13 15 16 21 37
rutiere
(y)
Tabelul nr.52
K(mil) 3 7 12 17 19 21 2
P (mii) 23 1 19 13 21 20 5
2. Metoda gruprilor
const n gruparea valorilor variabilei factoriale x pe
intervale de variaie (cresctor sau descresctor) i
calcularea valorilor medii corespunztoare ale variabilei y.
Se urmrete variaia perechii de valori ( xi , y i ).
se aplic n cazul cnd cele dou variabile corelate
prezint un numr mare de variante.
metoda se aplic aeznd datele dup urmtorul model:
Tabelul nr.53
Valoarea
Variabila x grupat medie a
Frecvenele pe
pe intervale de variabilei y
grupe de variaie
variaie pe grupe
dup x
x0 - x1 f1
y1
xi-1 - xi fi
yi
xn-1 - xn fn
yn
Total
f
i
i y
Exemplu:
Printr-o sistematizare a datelor primare dintr-o firm s-a
obinut urmtoarea situaie cu privire la productivitatea
muncii i salariul celor 50 de angajai ai firmei.
Tabelul nr.54
Salariul mediu
Grupe de salariai Numr al angajailor
dup producia de pe grupe dup
realizat (buc) angajai prod. realizat
(mii lei)
9 14 3 731
14 19 9 810
19 24 12 1.100
24 29 11 1.370
29 34 9 1.530
34 - 39 6 1.717
Total 50 1.390
Concluzie: ntre cele dou variabile exist legtur direct.
Productivitatea muncii unui angajat influeneaz direct
salariul primit de acesta.
Tabelul nr.55
Grupe Total uniti
Grupe dup y pe grupe
y1.. yj .. ym
dup x (fi)
x1 f11.. f1j.. f1m f1
. . .
xi fi1.. fij .. fim fi
. . .
xn fn1.. fnj.. fnm fn
Total uniti pe n m
subgrupe (fj)
f1 fj fm f
i =1 j =1
ij
4. Metoda grafic
const n reprezentarea grafic a perechilor de valori ale
variabilelor ntr-un sistem de axe de coordonate rezultnd un
grafic de corelaie numit corelogram sau nor de puncte.
prin aceast metod se stabilete existena, sensul, forma
i intensitatea legturii.
cele mai frecvente tipuri de corelogram sunt prezentate
n Figura nr.20.
Metode analitice
permit exprimarea matematic a formei legturii i
msurarea numeric a intensitii acesteia.
Se folosesc:
- metode neparamerice de apreciere i msurare a
intensitii legturilor dintre variabile (corelaia
neparametric).
- regresia i corelaia parametric.
Corelaia neparametric
c =
2
( f ij f ij* )
2
i j f ij*
Unde:
fij = frecvenele observate (din datele primare)
fij* = frecvenele calculate (dup modelul teoretic)
Se pornete de la presupunerea
H 0 : f ij = f ij* (ipoteza nul)
sau H 1 : f ij f ij* (ipoteza complementar)
Valoarea Hi-ptrat astfel calculat se compar cu valoarea
tabelar a lui Hi-ptrat pentru o anumit probabilitate de eroare
() i numrul gradelor de libertate corespunztoare (g).
Cum definim gradele de libertate?
Folosim testul 2 .
Emitem ipoteza nul H0 conform creia aprecierea total
(favorabil+nefaforabil) are aceleai proporii n cadrul
fiecrei subgrupe de vrst. n acest caz frecvenele n
fiecare subgrup ar trebui s fie urmtoarele:
Tabelul nr.57
Grupe de vrst (ani)
Aprecieri Total
Sub 30 30 50 Peste 50
199 222 143 564
Favorabil
(47%42 (47%47 (47%30 (47%
e
3) 3) 4) )
224 251 161 636
Nefavora
(53%42 (53%47 (53%30 (53%
bile
3) 3) 4) )
1.200
423 473 304
100
Total ( 100% ) ( 100% ) ( 100% )
%
Coeficientul Pearson
2
Se calculeaz dup formula C Pearson =
n+ 2
i ia valori ntre 0 i 1.
Apropierea de zero nseamn legtur slab.
Apropierea de 1 nseamn legtur puternic.
Pentru exemplul de mai sus
1 ,401
C Pearson = = 0 ,0012
1200 + 1 ,401
confirm faptul c ntre vrst i aprecierea persoanelor
privind produsul nu exist legtur.
Coeficientul Spearman
Exemplu:
Se cunosc urmtoarele date cu privire la capitalul utilizat i
volumul vnzrilor dintr-o lun, pentru zece firme,
principale productoare ale unei game de produse:
Tabelul nr.58
Capitalul utilizat Vnzri
Firma
(mil.lei) (mil.lei)
F1 20,46 75,6
F2 13,36 35,7
F3 25,31 104,9
F4 33,73 129,6
F5 25,40 71,8
F6 35,82 179,7
F7 13,35 53,7
F8 22,76 65,3
F9 21,23 74,3
F10 19,28 55,3
Not: date convenionale
Tabelul nr.59
Firma Rangul dup P-Q
x y d d2 P Q
F6 1 1 0 0 9 0 9
F4 2 2 0 0 8 0 8
F5 3 6 -3 9 4 3 1
F3 4 3 1 1 6 0 5
F8 5 7 -2 4 3 2 1
F9 6 5 1 1 3 1 2
F1 7 4 3 9 3 0 3
F10 8 8 0 0 2 0 2
F2 9 10 -1 1 0 1 -1
F7 10 9 1 1 0 0 0
Total - - 0 26 37 7 30
Coeficientul Kendall,
2( P Q ) 2 30
k= = = 0 ,67 sau 67%
n( n 1 ) 10( 10 1 )
Coeficientul Spearman,
6 d 2 6 26
c = 1 = = 0 ,84 sau 84%
n( n 1 ) 10( 100 1 )
2
Tabelul nr.60
Nr Vechimea n Salariul negociat
crt. munc
1 5 600
2 6 500
3 8 900
4 10 1,300
5 13 1,200
6 15 1,400
7 17 1,600
8 18 1,800
9 19 2,000
10 20 1,900
Tabelul nr.62
Nr crt. Vechimea n Salariul C
munc negociat xi yi sau
D
1 5 600 -9,1 -720 +6552
2 6 500 -8,1 -820 +6642
3 8 900 -6,1 -420 +2562
4 10 1,300 -4,1 +20 +82
5 13 1,200 -1,1 -120 +132
6 15 1,400 +0,9 +80 +72
7 17 1,600 +2,9 +280 +812
8 18 1,800 +3,9 +480 +1872
9 19 2,000 +4,9 +680 +3332
10 20 1,900 +5,9 +580 +3422
Total D=0
C=25480
x = 14,1 i y = 1320
f = 100%
!!! Se observ diferena de nivel nregistrat de cele dou
variante ale indicatorului. Aceasta diferen se explic prin
faptul c n prima variant se ine seama numai de numrul de
valori perechi concordante sau discordante i nu si de diferena
efectiv care definete concordana sau discordana.
Coeficientul de asociere
Permite msurarea rapid a legturii dintre dou variabile
numerice dar i nenumerice.
Se utilizeaz atunci cnd populaia statistic este grupat sau
se poate grupa dup o caracteristic alternativ.
Se calculeaz pe baza tabelului de asociere de forma:
Tabelul nr.63
y Y1 Y2 Total
x
X1 a b a+b
X2 c d c+d
Total a+c b+d a+b+c+d
ad bc
q=
ad + bc
Exemple:
Se cunosc urmtoarele date cu privire la structura a 50
uniti de alimentaie public dup procentul de cretere a
numrului de sortimente i procentul de cretere a ncasrilor
acestora.
Tabelul nr.64
Grupe dupa cresterea
incasarilor
Sub Peste
Total
7% 7%
Grupe dupa cresterea
nr. de sortimente
Sub 7% 23 3 26
Peste 7% 7 17 24
Total 30 20 50
Tabelul nr.65
Grupe dupa
nota la examen
7 i
Sub
peste Total
Grupe dupa nota 7
n cursul anului
Sub 7 1 1 2
7 i peste 5 16 21
Total 6 17 23
Exist legtur ntre pregtirea n cursul anului i nota la
examen la aceast disciplin? Ce fel de legtur i de ce
intensitate?
( 1 16 ) ( 5 1 ) 11
q= = = 0 ,52 sau 52%
( 1 16 ) + ( 5 1 ) 21
Apreciem c exist o legtur direct de intensitate medie.
Dac Francisc Galton n anii 1890 a gsit corelaie n
domeniul ereditii (ntre nlimea medie a prinilor i cea
a copiilor) punnd bazele teoriei corelaiei i a regresiei,
trebuie amintit faptul c mai trziu G.U.Yule introduce
980
960
salariul net (mii lei)
940
920
900
880
860
840
0 10 20 30 40
vechime (ani)
a=
y x x y x
i
2
i i i i
n x ( x ) 2 2
i i
n x y x y
i i i i
b=
n x ( x ) 2 2
i i
Tabelul nr.67
Nr
Y=811,15
.cr xi yi xi2 xiyi yi2
+5,624x
t.
1 6 850 36 5.100 722.500 844,892
2 9 870 81 7.830 756.900 861,763
3 11 870 121 9.570 756.900 873,010
4 16 910 256 14.560 828.100 901,127
5 16 860 256 13.760 739.600 901,127
6 18 910 324 16.380 828.100 912,374
7 20 950 400 19.000 902.500 923,621
8 22 930 484 20.460 864.900 934,868
9 27 970 729 26.190 940.900 962,986
10 29 970 841 28.130 940.900 974,233
To
174 9.090 3.528 160.980 8.281.300 9090,001
tal
1 6 850
2 9 870
3 11 870 a (INTERCEPT) 811,151079
4 16 910 b (SLOPE) 5,6235012
5 16 860
6 18 910 CORREL 0,92511769
7 20 950
8 22 930 TTEST 8,409E-14
9 27 970 TDIST 6,3503E-10
10 29 970
Total 174 9.090
Raportul de corelaie
Este indicatorul care msoar intensitatea legturii
curbilinii.
Formula de calcul, forma general este:
(y y )
2
i c
Ry / x = 1
(y y )
2
i
1 6 850
2 9 870 1000 0,0062x
3 11 870 980 y = 815,56e
.A
ntr-o expoziie au fost expuse zece variante dintr-un produs
nou. n cadrul expoziiei s-a realizat un sondaj cu privire la
preferinele pentru aceste variante de produs. Urmare
prelucrrii datelor sondajului s-au stabilit urmtoarele:
Tabelul nr.68
Produsul Locul ocupat n funcie de
pre preferine
P1 1 8
P2 2 5
P3 3 10
P4 4 6
P5 5 4
P6 6 2
P7 7 3
P8 8 7
P9 9 1
P10 10 9
Structura eantionului
pe sexe Pe grupe de vrst (ani)
M F Sub20 20-35 35-50 Peste50
Consum 269 291 107 146 174 132
curent
Consum 221 219 93 96 116 136
ocazional
Total 490 510 200 242 290 268
C
Folosind datele din Tabelul nr.93 calculai coeficienii de
corelaie statistic i stabilii dac exist legtur ntre
PNB/locuitor i volumul exporturilor pe locuitor, ce fel de
legtur i de ce intensitate?
Tabelul nr.70
-n mii dolar SUA
ara PNB/loc Export/loc
Australia 17.260 2,544
Austria 22.380 5.638
Belgia 20.880 11.845
Brazilia 2.770 0.229
Canada 20.710 4.892
Danemara 26.000 7.689
Elveia 36.080 9.534
Finlanda 21.970 4.669
Frana 22.260 4.043
Germania 23.030 5.340
Grecia 7.290 0.921
India 0.310 0.021
Italia 20.460 3.143
Japonia 28.190 2.738
Norvegia 25.820 8.193
Olanda 20.480 9.220
Regatul 17.790 3.293
Unit
Spania 13.970 1.646
SUA 23.240 1.757
Suedia 27.010 6.454
Sursa:Anuarul Statistic al Romniei.
D
Analizai corelaia ntre variabilele populaie i producie
industrial pentru apte judee folosind metoda Fechner i
coeficienii de corelaie a rangurilor Kendall i Spearman.
Comentai comparativ rezultatele.
Tabelul nr.71
Judeul Populaia Prod.ind.
(mii loc.) (mld.lei)
A 387 1895
B 308 1665
C 435 2055
D 178 1495
E 241 1397
F 363 1970
G 960 3070
E
Tabelul nr.72
Zile
L M Mr. J V Total
Operatoare
A B C D F
O1 59
(12) (11) (12) (15) (9)
B C D F A
O2 59
(10) (12) (13) (10) (14)
C D F A B
O3 60
(11) (13) (10) (12) (14)
D F A B C
O4 70
(13) (11) (12) (18) (16)
F A B C D
O5 66
(10) (14) (17) (13) (12)
Total 56 61 64 68 65 314
140 160
100 - 120
120 - 140
160 - 180
180 - 200
200 - 220
80 - 100
60 - 80
Total
Ch.
4-6 3 1 - - - - - - 4
6-8 3 - 1 - - - - - 4
8 - 10 2 2 1 - - - - - 5
10 - 12 - 3 2 - - - - - 5
12 14 - 3 1 3 3 - - - 10
14 16 - - 1 4 2 2 - - 9
16 18 - - - 1 1 3 2 1 8
18 - 20 - - - - - - 2 3 5
Total 8 9 6 8 6 5 4 4 50
Se cere:
Caracterizai variaia volumului vnzrilor n funcie de
nivelul cheltuielilor publicitare.
Verificai dac exist legtur ntre cele dou variabile.
Dac da, stabilii forma legturii.
Ajustai volumul vnzrilor n funcie de nivelul
cheltuielilor publicitare folosind funcia de regresie
adecvat.
Testai semnificaia corelaiei i a funciei de regresie.
BIBLIOGRAFIE