Documente Academic
Documente Profesional
Documente Cultură
REGRESIE SI CORELATIE
Legturile care exist ntre dou variabile statistice pot fi studiate folosind dou
tehnici: regresia i corelaia. Corelaia va arta ct de puternic este legtura, dependena
dintre variabile, n timp ce regresia va ajuta n explicarea i previzionarea unui factor pe
baza valorii altuia (altora), ceea ce, evident, va reduce incertitudinea privitoare la fenomene
importante, dar aleatoare. n sens statistic, termenul regresie i aparine statisticianului
englez F. Galton (1822-1911).
Exist trei scopuri principale, atunci cnd analizm legturile dintre variabile statistice:
s descriem i s nelegem relaiile de dependen;
s prognozm o nou valoare a variabilei efect;
s ajustm i s controlm o variabila efect, prin intervenia asupra variabilei
cauz sau variabilelor factoriale multiple.
RECAPITULARE
I. Breviar teoretic
a) Media aritmetic
Media aritmetic sintetizeaz ntr-o singur valoare, toate valorile individuale
observate.
n
xi
simpl x i 1
n
xini
ponderat x i 1
ni
i 1
xi x
x
100 ;
dmax(%) =
x max x
x
100
dmin(%) =
x min x
x
100
VQ
a
Variaia quartilic relativ VQ r
Q2
a
Variaia decilic relativ: VD r
D5
Msoar cu ct se abate n medie fiecare variant din cele 80% uniti de la valoarea
central (D5 sau Me)
xi x
xi x ni
ni
2.2 Dispersia
Dispersia reprezint media ptratic simpl sau ponderat a abaterilor variantelor
caracteristicii de la media lor.
x i x
x x ni
Pentru o serie de distribuie: 2 i
ni
x i x
x i x
ni
ni
100 ;
CV
d
x
100
n cazul n care punctele sunt dispersate la ntmplare rezult c ntre cei doi indicatori nu
exist o legtur semnificativ. Aceast situaie este prezentat n figura 1. Linia tras prin
mijlocul norului de puncte este, n general, paralel cu axa absciselor.
dac punctele se disperseaz n direcia unei anumite linii care nu este paralel cu axa
ox, rezult c cele dou caracteristici sunt corelate. n cazul n care linia n jurul creia se
concentreaz punctele este o linie dreapt rezult c legtura dintre cele dou caracteristici
este rectilinie. Dac ntre cele dou caracteristici exist o legtur curbilinie aceast linie este
o curb (parabol, hiperbol, exponenial etc).
2
a x b x xy
f 2 y a bx x 0
b
Se calculeaz parametrii a i b:
3.2 Regresia simpl curbilinie
Regresia simpl curbiline poate fi ntlnit sub urmtoarele forme:
Parabol Yx = a+bx+cx2
Hiperbol Yx a
b
x
Exponenial Yx = abx
x x y y
n
Dac legtura este direct atunci indicatorul are valoare pozitiv iar dac legtura este de tip
invers, atunci indicatorul are valoare negativ. Covariana este nul dac variabilele sunt
independente.
2 Coeficientul de corelaie
Coeficientul de corelaie simpl msoar intensitatea legturii dintre dou variabile xi i yi.
ry
x x y y
n x y
n x
n xy x y
2
x n y 2 y
2
Coeficientul de corelaie poate lua valori cuprinse ntre 1 i +1, adic satisface inegalitatea:
1 ry x 1 .
Cnd ry x 0 legtura este apreciat ca slab
Cnd ry x 1 legtura este apreciat ca puternic
y i Yxi 2
2
y i y
y i2 a y i b x i y i
y i 2
2
y
i
n
yt
100
y1
y
Indici de cretere cu baz n lan: I t t 1 t 100 ;
y t 1
t=2,3, , n
t=2,3, , n
2.2. Ritmul de dinamic exprim sub form de mrimi relative sporul sau scderea
realizat n fiecare perioad fa de nivelul considerat baz de raportare.
n raport cu baza de raportare, ritmul dinamicii poate fi determinat cu baza fix sau cu
baza n lan.
Rt 1
t 1
y1
y t y1
100 ; sau
y1
considerat.
y t y1 y t
1
y1
y1
R t 1 It 1 1
yt
y1
Rt 1
It 1
t 1
t 1
y t 1
100
y t y t 1
100 ; sau
y t 1
y t y t 1
y
t 1
y t 1
y t 1
Rt
y
I t t 1 t
y t 1
I t t 1 100 100
Rt
sau R t t 1
t 1
t 1
It
t 1
yt
n
n
t t 1
y 2 y1 y 3 y 2 y n y n 1 t 2
n 1
n 1
sau
t 1
n 1
y n y1
n 1
- indicele mediu I
Indicele mediu de cretere sau scdere (I) exprim proporia medie pe care o
reprezint, pentru perioada succesiv, nivelul variabilei analizate.
I n 1 I t
t 1
n 1
y 2 y3
y
y
n n 1 n
y1 y 2 y n 1
y1
Suma sporurilor medii se transform ntr-un produs de medii, iar relaia dintre primul
termen i sporurile medii devine:
xn x0 n
Dac se consider variaia de timp (t) dup care se manifest termenii seriei dintre
primul termen i sporurile medii devine:
X n x 0 t ; t=0,1,2,3.n
Tabelul 1
Timp
Nivelul
Variaia de
timp (t)
T0
x0
Xn x0 t
X0 x0 0
T1
x1
X1 x 0 1
T2
.
Tn
x2
.
xn
2
.
n
X2 x0 2
.
Xn x0 n
x n x 0 I I I
x n x 0 In
Tabelul 2
Timp
Nivelul
Variaia de
timp (t)
T0
x0
X0 x0 I
T1
x1
X1 x 0 I
T2
x2
X2 x0 I
0
1
Tn
xn
.
Xn x0 I
y t i ab t i
Ecuaia de estimare a unei parabole de gradul 2 exprimat n funcie de timp este:
y t i a bt i ct i 2
pentru aflarea parametrilor funciei de regresie necesar ajutrii seriei se aplic metoda celor
mai mici ptrate, adic:
y i y t i 2 min y i a b t i 2 min
Se determin valorile parametrilor a i b.
na b t y
2
a t b t ty
t i 0 condiie
na y
yi
n
b t ty
y ;
n
ty
t2
n cazul cnd seria este format dintr-un numr impar de termeni originea valorilor de
timp va fi chiar termenul central i variaia de timp se va msura n intervale
ntregi: 0; 1; 2
n cazul unei serii dinamice formate dintr-un numr par de termeni, originea valorilor
de timp va cdea ntre cei doi termeni centrali i variaia de timp se va msura n jumti de
intervale de timp: 0; 1; 3; 5
Prin ajustare s-au redistribuit influenele factoriale astfel: toi factorii au fost
considerai cu influen constat pe toat perioada i variabil a fost numai timpul.
APLICATII RECAPITULATIVE
I.Se cunosc urmtoarele date privind ncasrile medii lunare i suprafaa comercial a
10 societi comerciale avnd acelai profil de activitate:
Tabelul 3
Suprafaa
comercial
(mp)
ncasrile
medii lunare
(mil. lei)
20
30
50
60
80
90
100 110
1,6
120 150
1,8
2,1
Se cere:
1. S se calculeze suprafaa medie comercial i ncasrile medii lunare pentru cele 10
societi comerciale;
2. S se calculeze abaterea societilor comerciale fa de valoarea medie;
3. S se stabileasc tipul de legtur dintre suprafaa comercial i ncasrile medii
lunare;
4. S se calculeze valorile ajustate ale ncasrilor fa de suprafaa comercial;
5. S se msoare intensitatea legturii dintre suprafaa comercial i ncasrile medii
lunare;
xi x
yi y
xi x 2 yi y2
X2
xy
Yx =
0.258+0.012xi
10
11
1
2
3
4
5
6
7
8
9
10
Total
20
30
50
60
80
90
100
110
120
150
810
0,5
0,7
0,8
1,0
1,1
1,3
1,4
1,6
1,8
2,1
12,3
-61
-51
-31
-21
-1
9
19
29
39
69
0
-0,73
-0,53
-0,43
-0,23
-0,13
0,07
0,17
0,37
0,57
0,87
0
61
51
31
21
1
9
19
29
39
69
330
0,73
0,53
0,43
0,23
0,13
0,07
0,17
0,37
0,57
0,87
4,1
3721
2601
961
441
1
81
361
841
1521
4761
15290
0,5329
0,2809
0,1849
0,0529
0,0169
0,0049
0,0289
0,1369
0,3249
0,7569
2,321
400
900
2500
3600
6400
8100
10000
12100
14400
22500
80900
10
21
40
60
88
117
140
176
216
315
1183
0,498
0,618
0,858
0,978
1,218
1,338
1,458
1,578
1,698
2,058
12,3
II.
Tabel nr.5
Pentru variabilele de mai jos, grupate dou cate dou determinai aceleai 5 aspecte ale aplicatiei I
III.
Pentru variabilele de mai jos, grupate dou cate dou determinai aceleai 5 aspecte ale aplicatiei I
Tabel nr.6
IV.
Tabel nr.7
Pentru variabilele de mai jos, grupate dou cate dou determinai aceleai 5 aspecte ale aplicatiei I