Documente Academic
Documente Profesional
Documente Cultură
Legăturile care există între două variabile statistice pot fi studiate folosind două
tehnici: regresia şi corelaţia. Corelaţia va arăta cât de puternică este legătura, dependenţa
dintre variabile, în timp ce regresia va ajuta în explicarea şi previzionarea unui factor pe
baza valorii altuia (altora), ceea ce, evident, va reduce incertitudinea privitoare la fenomene
importante, dar aleatoare. În sens statistic, termenul regresie îi aparţine statisticianului
englez F. Galton (1822-1911).
Există trei scopuri principale, atunci când analizăm legăturile dintre variabile statistice:
RECAPITULARE
I. Breviar teoretic
a) Media aritmetică
Media aritmetică sintetizează într-o singură valoare, toate valorile individuale
observate.
n
∑xi
- simplă
x = i =1
n
k
∑ xini
i =1
- ponderată x = k
∑ni
i =1
1.1 Amplitudinea
Amplitudinea (A) exprimă, în mărimi absolute mărimea intervalului în care sunt
distribuite elementele seriei de repartiţie. Amplitudinea absolută se calculează ca diferenţă
între cel mai mare şi cel mai mic element al seriei.
A=xmax-xmin
Dacă seriile de distribuţie se repartizează pe intervale egale sau neegale, amplitudinea
(A) se calculează ca diferenţă între limita superioară a ultimului interval şi limita inferioară a
primului interval.
2.2 Dispersia
Dispersia reprezintă media pătratică simplă sau ponderată a abaterilor variantelor
caracteristicii de la media lor.
• (
Pentru o serie simplă: σ 2 = ∑ x i − x )2
n
∑ (x i − x )
2
ni
• Pentru o serie de distribuţie: σ2 =
∑ ni
∑ (x i − x )
2
ni
• Pentru o serie de distribuţie: σ =
∑ni
2.4 Coeficientul de variaţie
Coeficientul de variaţie este indicatorul folosit pentru comparaţia unor caracteristici
diferite şi analiza variaţiei aceleiaşi caracteristici în două colectivităţi în care variantele
caracteristicii au ordine de mărime diferită.
σ d
CV = ⋅ 100 ; CV = ⋅100
x x
Coeficientul de variaţie ia valori de la 0 la 100%
• Dacă CV = 0, înseamnă lipsă de variaţie, valorile sunt egale între ele şi egale cu media lor;
• Dacă CV →0 variaţia caracteristicii este mică;
• Dacă CV → 100% variaţia caracteristicii este mare.
2 Metoda grafică
Metoda grafică pune în evidenţă cel mai bine sensul şi forma legăturii dintre
indicatorii a căror dependenţă se studiază din punct de vedere statistic.
În cazul reprezentării grafice se întâlnesc următoarele situaţii:
în cazul în care punctele sunt dispersate la întâmplare rezultă că între cei doi indicatori nu
există o legătură semnificativă. Această situaţie este prezentată în figura 1. Linia trasă prin
mijlocul norului de puncte este, în general,
paralelă cu axa absciselor.
Fig. 1 Legătură nesemnificativă
dacă punctele se dispersează în direcţia unei anumite linii care nu este paralelă cu axa
„ox”, rezultă că cele două caracteristici sunt corelate. În cazul în care linia în jurul căreia se
concentrează punctele este o linie dreaptă rezultă că legătura dintre cele două caracteristici
este rectilinie. Dacă între cele două caracteristici există o legătură curbilinie această linie este
o curbă (parabolă, hiperbolă, exponenţială etc).
Fig. 2
1 Covarianţa
Covarianţa este indicatorul cu ajutorul căruia se calculează legătura dintre o caracteristică
factorială (x) şi o caracteristică rezultativă (y).
cov ( x , y ) =
∑(x − x )( y − y )
n
Dacă legătura este directă atunci indicatorul are valoare pozitivă iar dacă legătura este de tip
invers, atunci indicatorul are valoare negativă. Covarianţa este nulă dacă variabilele sunt
independente.
2 Coeficientul de corelaţie
Coeficientul de corelaţie simplă măsoară intensitatea legăturii dintre două variabile xi şi yi.
=
∑ ( x − x )( y − y ) = n ⋅ ∑ xy − ∑ x ⋅ ∑ y
[n ⋅ ∑ x ][n ⋅ ∑ y ]
ry x
nσ x σ y − (∑ x ) − (∑ y)
2 2 2 2
Coeficientul de corelaţie poate lua valori cuprinse între – 1 şi +1, adică satisface inegalitatea:
−1 ≤ ry x ≤1 .
3 Raportul de corelaţie
Raportul de corelaţie măsoară intensitatea legăturii dintre două variabile xi şi yi.
∑ ( y i − Yxi ) 2 ∑ y i2 − a ∑ y i − b∑ x i y i
Ry = 1− = 1−
∑ ( y i − y) (∑ yi ) 2
x 2
∑ yi − n
2
d) Serii cronologice
Pentru ca seriile cronologice să îşi poată îndeplini funcţia de a caracteriza cât mai exact
variaţia fenomenelor în timp, se folosesc indicatori absoluţi, relativi şi medii.
Ei redau starea fenomenului într-o anumită perioadă sau modificările de nivel survenite în
decursul timpului. Se deosebesc două grupe de indicatori:
- indicatori de nivel (yt) care exprimă mărimea, cuantumul înregistrat de fenomenul analizat
în unitatea de timp t.
- indicatori ai modificării absolute (∆ ) redau în mărimi absolute cuantumul modificării în
timp a nivelului caracteristicii
Indicatorii modificării absolute pot fi determinaţi astfel:
- modificarea cu bază fixă: ∆t 1 = y t − y1 ,
unde: t=2, 3, …, n iar y1 reprezintă nivelul perioadei de referinţă
- modificarea cu bază în lanţ: ∆t t −1 = y t − y t −1 ; t=2, 3, …, n
Aceşti indicatori redau proporţia nivelului, respectiv proporţia decalajului realizat într-
o anumită perioadă faţă de nivelul bază de raportare.
2.2. Ritmul de dinamică exprimă sub formă de mărimi relative sporul sau scăderea
realizată în fiecare perioadă faţă de nivelul considerat bază de raportare.
În raport cu baza de raportare, ritmul dinamicii poate fi determinat cu baza fixă sau cu
baza în lanţ.
y t − y1
- Ritmul dinamicii cu bază fixă, se obţine cu relaţia: R t 1 = ⋅ 100 ; sau
y1
∆t 1
Rt 1 = ⋅100 şi arată cu cât la sută a crescut nivelul variabilei analizate în intervalul de
y1
timp considerat.
y t − y1 y t
Rt 1 = = −1
y1 y1
⇒ R t 1 = It 1 − 1
yt
It 1 =
y1
y t − y t −1
- Ritmul dinamicii cu bază în lanţ, se obţine cu relaţia: R t t −1 = ⋅ 100 ; sau
y t −1
∆t t −1
Rt t −1 = ⋅100
y t −1
y t − y t− 1 y t
R t t− 1 = = − 1
y t− 1 y t− 1
⇒ R t t− 1 = I t t− 1 − 1
yt
It t− 1 =
y t− 1
sau Rt t −1 = It t −1 ⋅100 −100
Aceşti indicatori redau fie nivelul central al caracteristicii, fie creşterea medie
înregistrată de fenomenul analizat în decursul timpului.
Determinarea nivelului mediu pentru o serie construită din indicatori de nivel:
- nivelul mediu al variabilei y = ∑ t
y
n
- modificarea medie absolută (sporul ∆)
n
( ∑ ∆ t t −1
y 2 − y1 ) + ( y 3 − y 2 ) + + ( y n − y n −1 ) t =2
∆= =
n −1 n −1
sau
∆t 1 y n − y1
∆= = pentru baza fixă
n −1 n −1
- indicele mediu I
Indicele mediu de creştere sau scădere (I) exprimă proporţia medie pe care o
reprezintă, pentru perioada succesivă, nivelul variabilei analizate.
y 2 y3 y y
I = n −1 ∏ I t t −1 = n −1 ⋅ n = n −1 n
y1 y 2 y n −1 y1
unde n este numărul de termeni în şir.
Dacă:
I < 100% indicele mediu semnalizează scăderea sau reducerea fenomenului analizat;
I > 100% indicele mediu semnalizează creşterea fenomenului analizat
I =100% indicele mediu arată că fenomenul cercetat nu prezintă evoluţie, ci staţionează.
Se construieşte un grafic în care se prezintă seria iniţială de date, după care se unesc
printr-o linie dreaptă termenii extremi ai seriei în aşa fel încât linia dreaptă să înregistreze
abateri minime faţă de termenii reali, dispuşi în grafic.
Ajustarea seriilor cronologice ne oferă mai clar tendinţa de evoluţie în timp a
fenomenelor şi proceselor economice.
Se foloseşte când termenii seriei au tendinţă de creştere sub forma unei progresii
aritmetice.
Între primul termen al seriei cronologice iniţiale sporurile cu bază în lanţ şi ultimul
termen există următoarea relaţie:
xn= x0+∆ 1/0+∆ 2/1+∆ 3/2+…+∆ n/n-1
Considerând că sporurile cu baza în lanţ înregistrează o valoare mică faţă de sporul
mediu şi se pot compensa reciproc, atunci relaţia de mai sus devine:
x n = x 0 + ∆ + ∆ + .... ∆
Suma sporurilor medii se transformă într-un produs de medii, iar relaţia dintre primul
termen şi sporurile medii devine:
xn = x0 + n ⋅∆
Dacă se consideră variaţia de timp (t) după care se manifestă termenii seriei dintre
primul termen şi sporurile medii devine:
Xn = x0 + t ⋅∆ ; t=0,1,2,3….n
Tabelul 1
Timp Nivelul Variaţia de Valoarea teoretică (ajustată) pe baza sporului mediu
timp (t) Xn = x0 + t ⋅ ∆
T0 x0 0 X0 = x0 + 0 ⋅ ∆
T1 x1 1 X1 = x 0 +1 ⋅ ∆
T2 x2 2 X2 = x0 + 2 ⋅ ∆
…. …. …. ….
Tn xn n Xn = x0 + n ⋅ ∆
Se foloseşte când termenii seriei se manifestă sub forma unei progresii geometrice, iar
raţia este considerată indicele mediu (I ) .
Între ultimul termen al seriei, indicii cu baza în lanţ în primul termen există relaţia: x n
= x0·I1/0·I2/1·I3/2…In/n-1
În situaţia în care indicii cu bază în lanţ au valori apropiate între ei, pot fi înlocuite cu
indicele mediu (I ) ;
x n = x 0 ⋅ I ⋅ I I ⇒ x n = x0 ⋅ In
unde n - numărul unităţilor de timp corespunzătoare poziţiei faţă de termenul de bază.
Formula de calcul a unui termen ajutat poate devine:
±t
Xn = x0 ⋅I
Tabelul 2
Timp Nivelul Variaţia de Valoarea teoretică (ajustată) pe baza indicelui
timp (t) ±t
mediu X n = x 0 ⋅ I
±0
T0 x0 0 X0 = x 0 ⋅I
±1
T1 x1 1 X1 = x 0 ⋅ I
±2
T2 x2 2 X2 = x0 ⋅I
…. …. …. ….
±t
Tn xn n Xn = x0 ⋅I
Seriile cronologice sunt prezentate prin, n termeni care eşalonaţi succesiv după o
caracteristică de timp descriu evoluţia empirică a fenomenului respectiv.
În obţinerea configuraţiei noilor serii cronologice un rol deosebit îl au primul şi ultimul
termen ai seriilor iniţiale.
Pentru valorificarea influenţei termenilor intermediari ai seriei cronologice care înregistrează
abateri şi pot influenţa modificarea sistematică faţă de evoluţia fenomenelor, se folosesc
metode analitice.
Considerând seria cronologică o variabilă de timp ce se formează ca o funcţie liniară,
exponenţială sau hiperbolică relaţiile de calcul se pot sintetiza prin:
y = f ( ti )
unde t – timpul (valori independente)
y – fenomenele prezentate în serie.
Funcţia liniară va fi utilizată atunci când graficul prin care se prezintă seria empirică indică o
tendinţă de creştere absolută prin sporuri cu baza în lanţ, apropiate între ele.
y t i = a + bt i
unde: y t i - valorile teoretice ale caracteristicii ce trebuie ajutată
a – parametrul cu sens de mărime medie
b – parametrul care indică influenţa caracteristicii factoriale (t) şi indică panta liniei
t i - valorile caracteristicii factoriale.
Funcţia exponenţială se foloseşte când graficul arată o tendinţă de creştere relativ,
constantă, respectiv creşterii absolute din ce în ce mai mari, verificată şi prin obţinerea unor
valori apropiate ale indicilor cu baza în lanţ.
y t i = ab t i
Ecuaţia de estimare a unei parabole de gradul 2 exprimată în funcţie de timp este:
y t i = a + bt i + ct i 2
pentru aflarea parametrilor funcţiei de regresie necesară ajutării seriei se aplică metoda celor
mai mici pătrate, adică:
∑( )
y i − y t i 2 = m in ⇒ ∑ [( (
y i − a + b t i 2 = m in ))]
Se determină valorile parametrilor a şi b.
n a+ b∑ t = ∑ y
∑ t i = 0 → condiţie
a ∑ t + b∑ t = ∑ t y
2
n = ∑a y ∑ y
2 ⇒ a= ; b=
∑ty
pentru Σt i = 0 sistemul devine:
b∑ t = ∑ t y n
∑t 2
a=
∑ yi =x
n
În cazul când seria este formată dintr-un număr impar de termeni originea valorilor de
timp va fi chiar termenul central şi variaţia de timp se va măsura în intervale întregi:
0; ±1; ±2
În cazul unei serii dinamice formate dintr-un număr par de termeni, originea valorilor
de timp va cădea între cei doi termeni centrali şi variaţia de timp se va măsura în jumătăţi de
intervale de timp: 0; ±1; ±3; ±5
Prin ajustare s-au redistribuit influenţele factoriale astfel: toţi factorii au fost
consideraţi cu influenţă constată pe toată perioada şi variabil a fost numai timpul.
APLICATII RECAPITULATIVE
Tabelul 3
Suprafaţa
comercială 20 30 50 60 80 90 10 110 12 150
(mp) 0 0
Încasările
medii lunare 0,5 0,7 0,8 1, 1, 1, 1,4 1,6 1,8 2,1
(mil. lei) 0 1 3
Se cere:
1. Să se calculeze suprafaţa medie comercială şi încasările medii lunare pentru cele 10
societăţi comerciale;
2. Să se calculeze abaterea societăţilor comerciale faţă de valoarea medie;
3. Să se stabilească tipul de legătură dintre suprafaţa comercială şi încasările medii
lunare;
4. Să se calculeze valorile ajustate ale încasărilor faţă de suprafaţa comercială;
5. Să se măsoare intensitatea legăturii dintre suprafaţa comercială şi încasările medii
lunare;
Tabelul 4
Suprafaţa Încasări Abaterea
Nr.
crt.
comercială medii lunare individuală x i −x yi −y (x i − x )2 (yi − y )2 X2 xy
Yx =
0.258+0.012xi
(mp) - xi (mil. lei) - yi xi - x yi - y
0 1 2 3 4 5 6 7 8 9 10 11
1 20 0,5 -61 -0,73 61 0,73 3721 0,5329 400 10 0,498
2 30 0,7 -51 -0,53 51 0,53 2601 0,2809 900 21 0,618
3 50 0,8 -31 -0,43 31 0,43 961 0,1849 2500 40 0,858
4 60 1,0 -21 -0,23 21 0,23 441 0,0529 3600 60 0,978
5 80 1,1 -1 -0,13 1 0,13 1 0,0169 6400 88 1,218
6 90 1,3 9 0,07 9 0,07 81 0,0049 8100 117 1,338
7 100 1,4 19 0,17 19 0,17 361 0,0289 10000 140 1,458
8 110 1,6 29 0,37 29 0,37 841 0,1369 12100 176 1,578
9 120 1,8 39 0,57 39 0,57 1521 0,3249 14400 216 1,698
10 150 2,1 69 0,87 69 0,87 4761 0,7569 22500 315 2,058
Total 810 12,3 0 0 330 4,1 15290 2,321 80900 1183 12,3