Sunteți pe pagina 1din 12

Aplicatie recapitulativ

REGRESIE SI CORELATIE
Legturile care exist ntre dou variabile statistice pot fi studiate folosind dou
tehnici: regresia i corelaia. Corelaia va arta ct de puternic este legtura, dependena
dintre variabile, n timp ce regresia va ajuta n explicarea i previzionarea unui factor pe
baza valorii altuia (altora), ceea ce, evident, va reduce incertitudinea privitoare la fenomene
importante, dar aleatoare. n sens statistic, termenul regresie i aparine statisticianului
englez F. Galton (1822-1911).
Exist trei scopuri principale, atunci cnd analizm legturile dintre variabile statistice:
s descriem i s nelegem relaiile de dependen;
s prognozm o nou valoare a variabilei efect;
s ajustm i s controlm o variabila efect, prin intervenia asupra variabilei
cauz sau variabilelor factoriale multiple.

RECAPITULARE
I. Breviar teoretic
a) Media aritmetic
Media aritmetic sintetizeaz ntr-o singur valoare, toate valorile individuale
observate.
n

xi

simpl x i 1
n

xini

ponderat x i 1

ni

i 1

b) Indicatori statistici ai mprtierii


1. Indicatori simpli ai variaiei
Prin intermediul indicatorilor simpli ai variaiei se caracterizeaz mprtierea
elementelor seriei de repartiie studiate fa de medie, sau fa de un anumit element al seriei.
Indicatorii simpli ai variaiei sunt: amplitudinea i abaterile elementelor seriei fa de
media lor.
1.1 Amplitudinea
Amplitudinea (A) exprim, n mrimi absolute mrimea intervalului n care sunt
distribuite elementele seriei de repartiie. Amplitudinea absolut se calculeaz ca diferen
ntre cel mai mare i cel mai mic element al seriei.
A=xmax-xmin

Dac seriile de distribuie se repartizeaz pe intervale egale sau neegale, amplitudinea


(A) se calculeaz ca diferen ntre limita superioar a ultimului interval i limita inferioar a
primului interval.
1.2 Abaterea individual
Abaterea elementelor seriei fa de media lor se obine n cifre absolute, ca diferen
ntre fiecare element al seriei (xi) i media acestora ( x ), astfel:
di = xi - x
Abateri maxime: dmax = xmax - x
Abateri minime: dmin = xmin - x
di(%) =

xi x
x

100 ;

dmax(%) =

x max x
x

100

dmin(%) =

x min x
x

100

1.3 Variaia quartilic


Variaia quartilic absolut VQa = Q3 Q1
Evideniaz cmpul de mprtiere a 50% din unitile populaiei

VQ

a
Variaia quartilic relativ VQ r
Q2

1.4 Variaia decilic


Variaia decilic absolut: VDa = D9 D1
Evideniaz cmpul de mprtiere a 80% din unitile populaiei
VD

a
Variaia decilic relativ: VD r
D5
Msoar cu ct se abate n medie fiecare variant din cele 80% uniti de la valoarea
central (D5 sau Me)

2. Indicatori sintetici ai variaiei


Indicatorii sintetici sunt mrimi medii calculate din abaterile variantelor caracteristicii
de la nivelul mediu al acesteia.
2.1 Abaterea medie liniar
Abaterea medie liniar ( d ) se calculeaz ca medie aritmetic, simpl sau ponderat, n
funcie de felul seriei, din valorile absolute ale abaterilor variantelor caracteristicii de la media
lor.

xi x

Pentru o serie simpl: d

Pentru o serie de distribuie: d

xi x ni
ni

2.2 Dispersia
Dispersia reprezint media ptratic simpl sau ponderat a abaterilor variantelor
caracteristicii de la media lor.

x i x

Pentru o serie simpl: 2

x x ni
Pentru o serie de distribuie: 2 i

ni

2.3 Abaterea medie ptratic

x i x

Pentru o serie simpl:

x i x
ni

Pentru o serie de distribuie:

ni

2.4 Coeficientul de variaie


Coeficientul de variaie este indicatorul folosit pentru comparaia unor caracteristici
diferite i analiza variaiei aceleiai caracteristici n dou colectiviti n care variantele
caracteristicii au ordine de mrime diferit.
CV

100 ;

CV

d
x

100

Coeficientul de variaie ia valori de la 0 la 100%


Dac CV = 0, nseamn lips de variaie, valorile sunt egale ntre ele i egale cu media lor;
Dac CV 0 variaia caracteristicii este mic;
Dac CV 100% variaia caracteristicii este mare.
Intervalul de variaie al lui CV se poate mpri astfel:
0< CV 35% variaie mic care se caracterizeaz prin:
- media este semnificativ, deoarece abaterile elementelor seriei de la medie sunt mici;
- colectivitatea este omogen
35% < CV 50% variaie relativ mare
50%< CV 100% variaie foarte mare ceea ce nseamn c:
- media calculat nu este semnificativ
- colectivitatea este eterogen
- se va reface gruparea unitilor.

c) Metode statistice de analiz a legturilor dintre fenomene


Analiza legturilor dintre fenomenele i procesele social-economice are ca punct de
plecare punerea n eviden a existenei legturilor. Dintre cele mai importante metode de
evideniere a existenei i formei legturilor, prezentm: metoda seriilor paralele de date
interdependente, metoda gruprilor, metoda analizei dispersionale, metoda grafic, metoda
funciei de regresie.
1 Metoda seriilor paralele de date interdependente
Metoda seriilor paralele de date interdependente const n prezentarea paralel a
datelor referitoare la mai multe caracteristici. Prin compararea irurilor de date se constat
dac schimbarea valorilor unei caracteristici este determinat n mod sistematic de schimbri
n variaia altei caracteristici. Aceast metod se folosete numai cnd avem un numr mic de
uniti observate.
2 Metoda grafic
Metoda grafic pune n eviden cel mai bine sensul i forma legturii dintre
indicatorii a cror dependen se studiaz din punct de vedere statistic.
n cazul reprezentrii grafice se ntlnesc urmtoarele situaii:

n cazul n care punctele sunt dispersate la ntmplare rezult c ntre cei doi indicatori nu
exist o legtur semnificativ. Aceast situaie este prezentat n figura 1. Linia tras prin
mijlocul norului de puncte este, n general, paralel cu axa absciselor.

Fig. 1 Legtur nesemnificativ

dac punctele se disperseaz n direcia unei anumite linii care nu este paralel cu axa
ox, rezult c cele dou caracteristici sunt corelate. n cazul n care linia n jurul creia se
concentreaz punctele este o linie dreapt rezult c legtura dintre cele dou caracteristici
este rectilinie. Dac ntre cele dou caracteristici exist o legtur curbilinie aceast linie este
o curb (parabol, hiperbol, exponenial etc).

Fig. 2 Legtur direct

Fig. 3 Legtur invers

3 Metoda funciilor de regresie


Metoda funciilor de regresie exprim sub form algoritmic modul n care modificarea
caracteristicii rezultative (y) este determinat de modificarea caracteristicii factoriale (x).
y = f(x1, x2, , xn)
3.1 Regresie simpl liniar
Regresia simpl liniar apreciaz forma dependenei caracteristicii rezultative (y) de
variaia caracteristicii factoriale (x), adic: Yx = a+bx
unde: x valorile empirice ale caracteristicii factoriale
b indic panta liniei. n corelaia invers acest parametru are o valoare
negativ, iar n cazul corelaiei directe, o valoare pozitiv.
Estimarea parametrilor se realizeaz prin metoda celor mai mici ptrate.
f y i y x 2 min f y i a bx 2 min
Se deriveaz relaia de mai sus n funcie de parametrul a i parametrul b:
f
na b x y
a 2 y a bx 1 0

2
a x b x xy
f 2 y a bx x 0
b

Se calculeaz parametrii a i b:
3.2 Regresia simpl curbilinie
Regresia simpl curbiline poate fi ntlnit sub urmtoarele forme:
Parabol Yx = a+bx+cx2
Hiperbol Yx a

b
x

Exponenial Yx = abx

Msurarea intensitii legturilor statistice


Msurarea intensitii legturii dintre indicatorii economici, a gradului de determinaie
dintre dou sau mai multe caracteristici, poate ajuta la ierarhizarea unor factori ce influeneaz
rezultatele economice, participnd, alturi de alte procedee i tehnici de analiz cantitativ a
fenomenelor, la fundamentarea unor decizii economice.
Indicatorii folosii pentru a msura intensitatea legturii sunt: covariana; coeficientul
de corelaie; raportul de corelaie.
1 Covariana
Covariana este indicatorul cu ajutorul cruia se calculeaz legtura dintre o caracteristic
factorial (x) i o caracteristic rezultativ (y).
covx , y

x x y y
n

Dac legtura este direct atunci indicatorul are valoare pozitiv iar dac legtura este de tip
invers, atunci indicatorul are valoare negativ. Covariana este nul dac variabilele sunt
independente.
2 Coeficientul de corelaie
Coeficientul de corelaie simpl msoar intensitatea legturii dintre dou variabile xi i yi.
ry

x x y y
n x y

n x

n xy x y
2

x n y 2 y
2

Coeficientul de corelaie poate lua valori cuprinse ntre 1 i +1, adic satisface inegalitatea:
1 ry x 1 .
Cnd ry x 0 legtura este apreciat ca slab
Cnd ry x 1 legtura este apreciat ca puternic

Dac ia valori pozitive ry x 0 legtura este direct, dac ia valori negative ry x 0


legtura este invers.
Valoarea coeficientului de corelaie depinde de forma liniei de regresie, deci n cazul
legturilor neliniare este puin semnificativ, pentru aceasta se folosete raportul de corelaie.
3 Raportul de corelaie
Raportul de corelaie msoar intensitatea legturii dintre dou variabile x i i yi.
Ry

y i Yxi 2
2
y i y

y i2 a y i b x i y i
y i 2
2
y

i
n

Raportul de corelaie ia valori cuprinse ntre 0 i 1, adic satisface inegalitatea: 0 R y x 1 .


Semnul raportului de corelaie este dat de semnul coeficientului de regresie (b) din cadrul
funciei de regresie.

Raportul de corelaie msoar intensitatea legturilor indiferent de forma de legtur.


d) Serii cronologice
Pentru ca seriile cronologice s i poat ndeplini funcia de a caracteriza ct mai exact
variaia fenomenelor n timp, se folosesc indicatori absolui, relativi i medii.
Indicatorii seriilor cronologice
1. Indicatorii absolui ai seriilor cronologice
Ei redau starea fenomenului ntr-o anumit perioad sau modificrile de nivel survenite n
decursul timpului. Se deosebesc dou grupe de indicatori:
- indicatori de nivel (yt) care exprim mrimea, cuantumul nregistrat de fenomenul analizat
n unitatea de timp t.
- indicatori ai modificrii absolute () redau n mrimi absolute cuantumul modificrii n
timp a nivelului caracteristicii
Indicatorii modificrii absolute pot fi determinai astfel:
- modificarea cu baz fix: t 1 y t y1 ,
unde: t=2, 3, , n iar y1 reprezint nivelul perioadei de referin
- modificarea cu baz n lan: t t 1 y t y t 1 ;
t=2, 3, , n
2. Indicatori relativi ai seriilor cronologice
Aceti indicatori redau proporia nivelului, respectiv proporia decalajului realizat ntro anumit perioad fa de nivelul baz de raportare.
2.1 Indicii de modificare
-

yt
100
y1
y
Indici de cretere cu baz n lan: I t t 1 t 100 ;
y t 1

Indici de cretere cu baz fix: I t 1

t=2,3, , n
t=2,3, , n

2.2. Ritmul de dinamic exprim sub form de mrimi relative sporul sau scderea
realizat n fiecare perioad fa de nivelul considerat baz de raportare.
n raport cu baza de raportare, ritmul dinamicii poate fi determinat cu baza fix sau cu
baza n lan.

Ritmul dinamicii cu baz fix, se obine cu relaia: R t 1

Rt 1

t 1
y1

y t y1
100 ; sau
y1

100 i arat cu ct la sut a crescut nivelul variabilei analizate n intervalul de timp

considerat.
y t y1 y t

1
y1
y1
R t 1 It 1 1
yt

y1

Rt 1
It 1

Ritmul dinamicii cu baz n lan, se obine cu relaia: R t t 1


Rt

t 1

t 1

y t 1

100

y t y t 1
100 ; sau
y t 1

y t y t 1
y

t 1
y t 1
y t 1
Rt
y

I t t 1 t

y t 1
I t t 1 100 100
Rt

sau R t t 1

t 1

t 1

It

t 1

3 Indicatorii medii ai seriilor cronologice


Aceti indicatori redau fie nivelul central al caracteristicii, fie creterea medie
nregistrat de fenomenul analizat n decursul timpului.
Determinarea nivelului mediu pentru o serie construit din indicatori de nivel:

yt

nivelul mediu al variabilei y

modificarea medie absolut (sporul )

n
n

t t 1

y 2 y1 y 3 y 2 y n y n 1 t 2

n 1

n 1

sau

t 1
n 1

y n y1
n 1

pentru baza fix

- indicele mediu I
Indicele mediu de cretere sau scdere (I) exprim proporia medie pe care o
reprezint, pentru perioada succesiv, nivelul variabilei analizate.
I n 1 I t

t 1

n 1

y 2 y3
y
y
n n 1 n
y1 y 2 y n 1
y1

unde n este numrul de termeni n ir.


Dac:
I < 100% indicele mediu semnalizeaz scderea sau reducerea fenomenului analizat;
I > 100% indicele mediu semnalizeaz creterea fenomenului analizat
I =100% indicele mediu arat c fenomenul cercetat nu prezint evoluie, ci staioneaz.
- ritmul mediu de cretere sau scdere ( R )
Ritmul mediu de cretere sau scdere ( R ) arat cu ct crete sau scade n medie
variabila yt n perioada analizat.
R I 100

Metode de determinare i analiz a trendului (ajustarea seriilor


cronologice)
Pentru ajustarea seriilor cronologice se folosesc mai multe procedee: ajustarea pe baza
mediilor mobile, ajustarea prin metoda grafic, ajustarea pe baza sporului mediu, ajustarea
indicelui mediu, ajustarea prin metode analitice.
1. Ajustarea prin metoda grafic
Se construiete un grafic n care se prezint seria iniial de date, dup care se unesc
printr-o linie dreapt termenii extremi ai seriei n aa fel nct linia dreapt s nregistreze
abateri minime fa de termenii reali, dispui n grafic.

Ajustarea seriilor cronologice ne ofer mai clar tendina de evoluie n timp a


fenomenelor i proceselor economice.
2. Ajustarea pe baza modificrii medii absolute mediu
Se folosete cnd termenii seriei au tendin de cretere sub forma unei progresii
aritmetice.
ntre primul termen al seriei cronologice iniiale sporurile cu baz n lan i ultimul
termen exist urmtoarea relaie:
xn= x0+1/0+2/1+3/2++n/n-1
Considernd c sporurile cu baza n lan nregistreaz o valoare mic fa de sporul
mediu i se pot compensa reciproc, atunci relaia de mai sus devine:
x n x 0 ....

Suma sporurilor medii se transform ntr-un produs de medii, iar relaia dintre primul
termen i sporurile medii devine:
xn x0 n

Dac se consider variaia de timp (t) dup care se manifest termenii seriei dintre
primul termen i sporurile medii devine:
X n x 0 t ; t=0,1,2,3.n
Tabelul 1
Timp

Nivelul

Variaia de
timp (t)

Valoarea teoretic (ajustat) pe baza sporului mediu

T0

x0

Xn x0 t
X0 x0 0

T1

x1

X1 x 0 1

T2
.
Tn

x2
.
xn

2
.
n

X2 x0 2

.
Xn x0 n

3. Ajustarea pe baza metodei indicelui mediu


Se folosete cnd termenii seriei se manifest sub forma unei progresii geometrice, iar
raia este considerat indicele mediu I .
ntre ultimul termen al seriei, indicii cu baza n lan n primul termen exist relaia: x n
= x0I1/0I2/1I3/2In/n-1
n situaia n care indicii cu baz n lan au valori apropiate ntre ei, pot fi nlocuite cu
indicele mediu I ;

x n x 0 I I I

x n x 0 In

unde n - numrul unitilor de timp corespunztoare poziiei fa de termenul de baz.


Formula de calcul a unui termen ajutat poate devine:
Xn x0 I

Tabelul 2
Timp

Nivelul

Variaia de
timp (t)

Valoarea teoretic (ajustat) pe baza indicelui


mediu X n x 0 I

T0

x0

X0 x0 I

T1

x1

X1 x 0 I

T2

x2

X2 x0 I

0
1

Tn

xn

.
Xn x0 I

4. Ajustarea prin metode analitice


Seriile cronologice sunt prezentate prin, n termeni care ealonai succesiv dup o
caracteristic de timp descriu evoluia empiric a fenomenului respectiv.
n obinerea configuraiei noilor serii cronologice un rol deosebit l au primul i ultimul
termen ai seriilor iniiale.
Pentru valorificarea influenei termenilor intermediari ai seriei cronologice care nregistreaz
abateri i pot influena modificarea sistematic fa de evoluia fenomenelor, se folosesc
metode analitice.
Considernd seria cronologic o variabil de timp ce se formeaz ca o funcie liniar,
exponenial sau hiperbolic relaiile de calcul se pot sintetiza prin:
y f t i
unde t timpul (valori independente)
y fenomenele prezentate n serie.
Funcia liniar va fi utilizat atunci cnd graficul prin care se prezint seria empiric indic o
tendin de cretere absolut prin sporuri cu baza n lan, apropiate ntre ele.
y t i a bt i
unde: y t i - valorile teoretice ale caracteristicii ce trebuie ajutat
a parametrul cu sens de mrime medie
b parametrul care indic influena caracteristicii factoriale (t) i indic panta liniei
t i - valorile caracteristicii factoriale.
Funcia exponenial se folosete cnd graficul arat o tendin de cretere relativ,
constant, respectiv creterii absolute din ce n ce mai mari, verificat i prin obinerea unor
valori apropiate ale indicilor cu baza n lan.

y t i ab t i
Ecuaia de estimare a unei parabole de gradul 2 exprimat n funcie de timp este:
y t i a bt i ct i 2

pentru aflarea parametrilor funciei de regresie necesar ajutrii seriei se aplic metoda celor
mai mici ptrate, adic:
y i y t i 2 min y i a b t i 2 min
Se determin valorile parametrilor a i b.
na b t y

2
a t b t ty

t i 0 condiie
na y

pentru t i 0 sistemul devine:


a

yi
n

b t ty

y ;
n

ty
t2

n cazul cnd seria este format dintr-un numr impar de termeni originea valorilor de
timp va fi chiar termenul central i variaia de timp se va msura n intervale
ntregi: 0; 1; 2
n cazul unei serii dinamice formate dintr-un numr par de termeni, originea valorilor
de timp va cdea ntre cei doi termeni centrali i variaia de timp se va msura n jumti de
intervale de timp: 0; 1; 3; 5
Prin ajustare s-au redistribuit influenele factoriale astfel: toi factorii au fost
considerai cu influen constat pe toat perioada i variabil a fost numai timpul.

APLICATII RECAPITULATIVE

I.Se cunosc urmtoarele date privind ncasrile medii lunare i suprafaa comercial a
10 societi comerciale avnd acelai profil de activitate:
Tabelul 3

Suprafaa
comercial
(mp)
ncasrile
medii lunare
(mil. lei)

20

30

50

60

80

90

100 110

0,5 0,7 0,8 1,0 1,1 1,3 1,4

1,6

120 150

1,8

2,1

Se cere:
1. S se calculeze suprafaa medie comercial i ncasrile medii lunare pentru cele 10
societi comerciale;
2. S se calculeze abaterea societilor comerciale fa de valoarea medie;
3. S se stabileasc tipul de legtur dintre suprafaa comercial i ncasrile medii
lunare;
4. S se calculeze valorile ajustate ale ncasrilor fa de suprafaa comercial;
5. S se msoare intensitatea legturii dintre suprafaa comercial i ncasrile medii
lunare;

Valorificati tabelul si verificati rezultatele obtinute de catre dvs.


Tabel nr.4
Abaterea
Suprafaa
ncasri
Nr.
individual
comercial medii lunare
crt.
(mp) - xi (mil. lei) - yi xi - x yi - y

xi x

yi y

xi x 2 yi y2

X2

xy

Yx =
0.258+0.012xi

10

11

1
2
3
4
5
6
7
8
9
10
Total

20
30
50
60
80
90
100
110
120
150
810

0,5
0,7
0,8
1,0
1,1
1,3
1,4
1,6
1,8
2,1
12,3

-61
-51
-31
-21
-1
9
19
29
39
69
0

-0,73
-0,53
-0,43
-0,23
-0,13
0,07
0,17
0,37
0,57
0,87
0

61
51
31
21
1
9
19
29
39
69
330

0,73
0,53
0,43
0,23
0,13
0,07
0,17
0,37
0,57
0,87
4,1

3721
2601
961
441
1
81
361
841
1521
4761
15290

0,5329
0,2809
0,1849
0,0529
0,0169
0,0049
0,0289
0,1369
0,3249
0,7569
2,321

400
900
2500
3600
6400
8100
10000
12100
14400
22500
80900

10
21
40
60
88
117
140
176
216
315
1183

0,498
0,618
0,858
0,978
1,218
1,338
1,458
1,578
1,698
2,058
12,3

II.
Tabel nr.5

Pentru variabilele de mai jos, grupate dou cate dou determinai aceleai 5 aspecte ale aplicatiei I

III.

Pentru variabilele de mai jos, grupate dou cate dou determinai aceleai 5 aspecte ale aplicatiei I

Tabel nr.6

IV.
Tabel nr.7

Pentru variabilele de mai jos, grupate dou cate dou determinai aceleai 5 aspecte ale aplicatiei I