Documente Academic
Documente Profesional
Documente Cultură
Curs 30h
Sem. 30h
harbued@ase.md
Bibliografie
1. Andrei, T.; Stancu, S.: Statistică. Teorie şi aplicaţii. Editura ALL,
Bucureşti, 1995
2. Baron, T.; Biji, E.: Statistică teoretică şi economică. Editura
Didactică şi Pedagogică, Bucureşti, 1996
3. Isaic-Maniu, Al.; Grădinaru, A.; Voineagu, V.; Mitruţ, C.:
Statistică teoretică şi economică. Editura Tehnică, Chişinău,
1994
4. Isaic-Maniu, Al.; Voineagu, V.; Mitruţ, C.: Statistica pentru
managementul afacerilor. Ediţia a II-a. Editura Economică,
Bucureşti, 1999
5. Jaba, E.: Statistică. Editura Economică, Bucureşti, 1998, 2000,
2002
6. Pecican, E. S.: Econometrie.Editura ALL, Bucureşti, 1994
7. Trebici, V.(Coord.):Mică enciclopedie de statistică. Editura
Ştiinţifică şi Enciclopedică, Bucureşti, 1985
1. Obiectul de studiu şi metoda
1.1. Locul şi particularităţile statisticii ca
obiect şi metodă în sistemul
ştiinţelor sociale şi economice.
statistica practică
statistica descriptivă
aritmetica politică şi calculul
probabilităţilor
Statistica practică
înregistrări sistematice sau izolate, ce pot fi
asociate unor observări statistice utilizate şi
astăzi
5000 – 2000 î.e.n. – lista de persoane şi bunuri pe
tăbliţe de argilă,
“inventarierea” aurului în Egipt prin anii 2650-2190
î.e.n.,
recensământul populaţiei la romani - 550 î.e.n.,
diverse forme de înregistrare sunt aduse în Biblie şi
Talmud
Statistica descriptivă
ca disciplină de învăţământ şi de concepte a statisticii practice
necesară conducerii de stat
Printre primele descrieri sistematice se numără:
lucrarea lui Francesco Sansovino (1521-1586)
despre guvernare şi administraţie, ceea ce avea în
vedere descrierea statului, cu bogăţiile sale.
În România lucrarea lui Dmitrie Cantemir
“Descriptio Moldaviae” 1714 - 1716
În Rusia lucrarea lui Kirilov “ Situaţia înfloritoare a
statului rus”, anii 20 ai sec. XVIII
Aritmetica politică şi calculul
probabilităţilor
ca fundamentare conceptuală şi mod de interpretare a
fenomenelor în statistica modernă.
Numele acesta provine de la lucrarea lui William
Petty (1623-1687) “Aritmetica politică” (1690) , în
care utilizează aşa noţiuni ca medie, proporţie,
repetabilitate, cauzalitate etc.
Prin mijlocul secolului XVIII-lea şi secolul XIX-lea este
specifică folosirea tot mai frecventă a metodelor
matematice şi în special calculul probabilităţilor în
investigarea şi interpretarea rezultatelor privind
fenomenele şi procesele din societate. Aici se poate
sublinia aportul adus de aşa savanţi ca: Fisher, Yule,
Pearson, Cebâşev, Liaponov, Marcov şi alţii.
Etimologia noţiunii statistică
status - cea ce are sensul de stare politică
statistica a fost pentru prima dată utilizată de
Gottfried Achenwall în 1746 pentru a
desemna o “ştiinţă a descrierii statului”
folosită pentru evaluarea într-o formă
sistemică a unor variabile, ca de exemplu -
producţia sau consumul de produse agricole.
Prin statistică se subînţelege:
totalitatea datelor despre anumite fenomene -
statistica natalităţii, statistica muncii, statistica
suprafeţelor agricole, etc.;
însuşi procesul de colectare a datelor cu
prelucrarea lor ulterioară, sau cu alte cuvinte
activitate practică a organelor de statistică;
ştiinţa despre procedeele de investigaţie
statistică şi de formare a indicilor statistici cu
aplicare la cele mai variate fenomene sociale,
ansamblul metodelor şi procedeelor de culegere,
prelucrare şi analiză a datelor înregistrate, modul de
cercetare a fenomenelor de masă;
disciplină ştiinţifică şi de învăţământ.
Obiectul de studiu al statisticii poate
fi definit astfel:
colectivitatea statistică;
unităţile statistice;
caracteristicile statistice;
datele statistice;
informaţiile statistice;
indicatorii statistici.
Colectivitatea sau populaţia statistică
Simple Complexe
Variabila statistică
(caracteristică)
− caracteristici calitative
− caracteristici cantitative
După natura variaţiei, caracteristicile numerice pot fi
cu variaţie continuă
cu variaţie discontinuă (discretă)
Variabila statistică (caracteristică)
primare
derivate
Variabila statistică (caracteristică)
variabile independente
variabile dependente
Date statistice
Reprezintă observațiile rezultate dintr-o
cercetare statistică, sau ansamblul valorilor
colectate în urma unei cercetări statistice
Conţinutul, esenţa datelor statistice formează informaţia
statistică.
Nu putem afirma:
• cu câte grade Celsius diferă temperatura „scăzută” de cea „normală”
• cu câte kilograme este mai grea o persoană din categoria „peste greutatea normală” decât
una din categoria „cu greutatea normală”
Scale de măsurare a datelor statistice (II)
Scala de interval (cardinală)
Caracteristici:
este prima scală numerică (se aplică variabilelor numerice);
permite, pe lângă stabilirea unei relaţii de ordine între variantele
numerice ale acestei scale şi determinarea şi interpretarea diferenţelor
dintre acestea;
valorile numerice acordate pe această scală au semnificaţie cantitativă,
de aceea este permisă însumarea sau scăderea lor;
fixarea punctului de origine (zero) poate fi făcută arbitrar (originea nu
este fixă);
unitatea de măsură poate fi aleasă arbitrar.
40
35 cronogramă
(historiogramă)
30
25
20
15
10
apr.06 mai.06 iun.06 iul.06 aug.06 sep.06 oct.06 nov.06 dec.06 ian.07 feb.07 mar.07
40
35 diagramă prin
30 coloane
25
diagramă în coordonate 20
polare 15
10
apr.06 mai.06 iun.06 iul.06 aug.06 sep.06 oct.06 nov.06 dec.06 ian.07 feb.07 mar.07
Indicatorii seriilor cronologice (1)
t /1 yt y1 t 2, n
t / t 1 yt yt 1 t 2, n
k
Proprietăţi
t 2
t /t 1 k /1 k /1 k 1/1 k / k 1
Indicatorii relativi (1)
a) Indicii cu bază fixă
Se calculează prin raport între valoarea corespunzătoare perioadei t şi
valoarea corespunzătoare unei perioade imobile, considerată bază de
comparaţie. De obicei baza de comparaţie este primul termen al seriei.
yt
I t /1 t 2, n
y1
Rt / t 1 I t / t 1 1[00] t 2, n
Indicatorii medii (1)
a) Nivelul mediu al seriei
Reprezintă valoarea medie a indicatorului sau fenomenului corespunzătoare
întregului orizont de timp analizat.
y
y t
y
y2 y3 ... yn 2 yn 1 y2n
y1
2
n n 1
t /t 1
n /1 yn y1
t 2
n 1 n 1 n 1
Indicatorii medii (2)
c) Indicele mediu de dinamică
n
yn
I n 1 I t / t 1 n 1 I n /1 n 1
t 2 y1
d) Ritmul mediu
Reprezintă rata (ritmul) asociat indicelui mediu de dinamică.
R I 1[00]
Componentele seriei cronologice
70
65
yt yˆ t C S yt yˆ t C S
Metode de estimare a trendului (ajustarea SC)
Metode mecanice
a) Metoda sporului/ reducerii medii
b) Metoda indicelui mediu
c) Metoda mediilor mobile (MMM)
Metode analitice
Presupun aplicarea metodei regresiei în cazul SC. yt f (t )
•liniar
•polinomiale
•logistic
•autoregresive etc.
Metoda sporului/ reducerii medii
Formula de ajustare:
yˆ t y1 (t 1), t 1, n
Metoda indicelui mediu
Formula de ajustare:
t 1
yˆ t y1 I , t 1, n
Sondajul statistic
Terminologie (1)
Unitatea statistică reprezintă
elementul de bază supus analizei
statistice. Există unităţi simple (de ex.:
persoane, obiecte etc.) şi unităţi
complexe (de ex.: gospodăria).
Populaţia statistică este compusă
dintr-o mulţime finită de unităţi
statistice.
Variabila (caracteristica) statistică
este o aplicaţie definită pe populaţia
studiată şi cu valori într-o anumită
mulţime.
Terminologie (2)
Parametrul statistic este o ilustrare
(de obicei cantitativă) a stării variabile
statistice
Estimatorul este o funcţie statistică
utilizată pentru aproximarea unui
parametru necunoscut la nivelul unei
populaţii statistice
Eşantionul statistic o mulţime de
dimensiuni reduse a unităţilor statistice
dintr-o populaţie
Terminologie (3)
Motivaţii
• Sondajele probabiliste
- sunt definite prin aceea că alocă fiecărei unităţi din populaţie o probabilitate
egală şi nenulă de a aparţine eşantionului
- au avantajul că permit studierea şi calcularea preciziei estimatorilor şi au un
caracter ştiinţific riguros
Volumul
colectivităţii Volumul eşantionului (n)
generale (N)
r r
N N i n ni
i 1 i 1
Indicatori pereche de analiză
statistică (2)
Media
În eşantion
În colectivitatea
generală:
n
N
xi x i
i 1 x i 1
N n
r
n
x N i i xn i i
i 1 x i 1
N i n i
Indicatori pereche de analiză
statistică (2)
Dispersia
n 30
x x
n 2
x
2 i
i s2
2
n
În colectivitatea
x x n
N
În eşantion:
2
generală: xi N i
2
2
i i
s2
N i n i
Indicatori pereche de analiză
statistică (3)
Procedee de formare a
eşantioanelor
În cercetarea statistică prin sondaj, pentru a obţine
eşantioane reprezentative, se utilizează procedee aleatoare,
procedee dirijate şi procedee mixte.
Selecţia aleatoare se caracterizează prin faptul că
acordă fiecarei unităţi din populaţia originară o anumită şansă
de a fi inclusă în eşantion.
Includerea în eşantion se realizează obiectiv indiferent de cel
care realizează eşantionarea.
Principalele tipuri de selecţie aleatoare sunt:
Selecţie aleatoare simplă:
-procedeul loteriei
-procedeul tabelului cu numere aleatoare,
-procedeul pasului mechanic.
Selecţie aleatoare stratificată;
Selecţie aleatoare în cuiburi (cluster).
Erori în cercetarea statistică prin
sondaj (1)
Când apelăm la o cercetare statistică prin sondaj ne confruntăm cu
următoarele tipuri de erori:
a) Erori de observare, de calcul, modelare , specifice oricărei cercetări
statistice.
b) Erori de reprezentativitate, pot fi:
Erori sistematice : se întâlnesc în cazul în care voit ori nu, nu se respectă
metodologia selecţiei aleatoare; unităţile sunt selectate dirijat,
pseudoaleator ,”la
nimereala”. Pot fi eliminate printr-o construire riguroasă a bazei de sondaj şi
prin
respectarea procedeelor de selecţie.
Întâmplătoare : nu pot fi eliminate, deoarece ţin de esenţa sondajului.
Acestea ar fi
nule dacă eşantionul ar imita perfect structura colectivităţii generale dpdv al
caracteristicilor studiate. Teoria statistică demonstrează că dacă se lucrează
cu
eşantioane n>30, atuncimediile posibile de sondaj urmează la limită o
distribuţie normală
faţă de media colectivităţii generale, indiferent de distribuţia variabilei x.
Spunem că
media de sondaj este un estimator nedeplasat al mediei colectivităţii generale.
Ea poate fi,
repetând eşantionarea mai mare/mai mică decât ,dar nu este sistematic
Erori în cercetarea statistică prin sondaj
(2)
Ex. N=3, n=2 ; 5,6,7
Eşantioane posibile:
(5,5);(5,6); (5,7); (6,5);(6,6);(6,7);(7,5);(7,6);(7,7)
5 ; 5,5 ; 6 ; 5,5; 6 ; 6,5 ; 6 ; 6,5; 7
Distribuţia de frecvenţe:
x
x i ni
ni
s2
xi
2
x ni
n i
s2 s
sx
n n
Ax
s
4
SISTEMATIZAREA ŞI
PREZENTAREA INFORMAŢIEI
STATISTICE
Se cere
Să se grupeze cele 60 societăţi comerciale pe 6 intervale egale de variaţie a numărului de
salariaţi
1.se stabileşte amplitudinea variaţiei A cu relaţia:
A x max x min 346 165 181 persoane Intervale de variaţie a Număr de societăţi
numărului de salariaţi comerciale
1. Seriile statistice.
2. Tabele statistice.
3. Reprezentarea grafică a datelor statistice
Seriile statistice
diferenta
Indicatori derivati
raport
Functia de analiza
■ Indicatorii primari
■ Indicatorii derivati
Indicatorii primari
Ei exprima:
relatii cantitative dintre diferitele caracteristici statistice, dintre diferitele parti ale unei
colectivitati sau dintre fenomenele ce se gasesc intr-un anumit grad de
interdependenta;
valorile tipice care se formeaza in mod obiectiv in cadrul aceleiasi perioade de timp
sau in dinamica;
gradul si forma de variatie a caracteristicilor cercetate;
legaturile de interdependenta dintre fenomene;
tendinta obiectiva de manifestare a fenomenelor;
rolul si contributia diferitilor factori la formarea si modificarea marimii unui
fenomene complex etc.
INDICATORI STATISTICI CALCULATI
CA MARIMI RELATIVE
Mediile de calcul
Media aritmetică
caz particular (media variabilei de tip binar)
Media pătratică
Media geometrică
Media armonică
Media cronologică (se va discuta despre ea la capitolul Serii
cronologice)
Indicatorii centrali de poziţie
Mediana
Valoarea modală
Media aritmetică
■ Se poate calcula doar pentru variabile cantitative
■ Se mai numeşte momentul de ordin 1
– pentru un şir simplu de valori
x
x i
x
xni i
n i
Media armonică
■ Se mai numeşte momentul de ordin -1
n
– pentru un şir simplu de valori xh
1
xi
xh
n i
1
x n i
i
Media geometrică
x g xi
ni ni
xp
x n 2
i i
n i
Media variabilei de tip binar
xh x g x x p
INDICATORII TENDINŢEI
CENTRALE (II)
1.Introducere în mărimile medii
2.Mărimile medii de calcul
3.Indicatorii centrali de poziţie
Mediana (Me) (1)
1
locMe ( ni ) 1
2
3. În funcţie de forma datelor disponibile vom
avea:
Mediana (Me) (2)
50 Nota ni
45 1 5
40
35 2 7
30 3 12
Studenti
25
20
4 20
15 5 38
10
6 46
5
0 7 37
1 2 3 4 5 6 7 8 9 10
8 20
Nota 9 10
10 5
Mo Total 200
Valoarea modală (Mo) (3)
45 Nota ni
40 1 5
35
2 13
30
Studenti
25 3 22
20 4 35
15
5 14
10
5
6 7
0 7 25
1 2 3 4 5 6 7 8 9 10 8 41
Nota
9 27
Mo1 Mo2 10 11
Total 200
Valoarea modală (Mo)
(4)
■ Pentru o serie de date grupate pe intervale:
1. Se alege intervalul modal ca fiind intervalul cu
frecvenţa maximă
2. În interiorul intervalului modal, valoarea
modală se determină cu ajutorul formulei:
1
Mo x0 k
1 2
Valoarea modală (Mo) (5)
Starea civilă ni
Casătorit 70
Necăsătorit 55
Valoarea modală este varianta:
Divorţat 12 “căsătorit”
Văduv 13
Total 150
Relaţia de ordine între x , Me şi Mo
x Mo 3( x Me )
INDICATORII VARIAŢIEI
(ÎMPRĂŞTIERII)
Indicatorii sintetici ai variaţiei (1)
2
2
i i
n n i
4
d
5
Abaterea medie pătratică are ca unitate de măsură, unitatea de măsură
a variabilei analizate.
Indicatorii sintetici ai variaţiei (4)
(1 p ) 2
N ( 0 p ) 2
M 2 N 2 M
2 q
p
N M N M N M
q p p q pq( p q ) pq p (1 p )
2 2
Asimetria
38 43
43
33 38
38
28
Studenti
33 33
23
28
Studenti
28
Studenti
18
23 23
13
18 18
8
13 13
3
8 8
2 3 4 5 6 7 8 9 10
3 3
Nota
2 3 4 5 6 7 8 9 10 2 3 4 5 6 7 8 9 10
Nota Nota
Asimetria (2)
38
33
28
Studenti 23
18
13
3
2 3 4 5 Mo
6 7 8 9 10
Me Nota
x
Asimetria (3)
38
33
28
Studenti
23
18
13
8
3
2 3 4 5 6 7 8 9 10
Mo Me x
Nota
Asimetria (4)
38
33
28
Studenti
23
18
13
3
2 3 4 5 6 x 7 Me 8 Mo
9 10
Nota
Asimetria (5)
2) Metode analitice de
abordare
C as
x Mo 3x Me
C as
Proprietăţi şi interpretare: Proprietăţi şi interpretare:
• interval de valori [-1;+1 ] • interval de valori [-3;+3 ]
• semnul arată direcţia asimetriei • semnul arată direcţia asimetriei
• valori mici (apropiate de 0) • valori mici (apropiate de 0)
indică o asimetrie de mică indică o asimetrie de mică
intensitate intensitate
• valori mari (apropiate de ±1) • valori mari (apropiate de ±3)
indică o asimetrie cu intensitate indică o asimetrie cu intensitate
Asimetria (6)
32 Cas
q3 q2 q2 q1
Cas 1 3 q3 q2 q2 q1
2
unde: Proprietăţi şi interpretare:
x x n
i
2
i • interval de valori [-1;+1 ]
2 2
n i
• semnul arată direcţia asimetriei
• valori mici (apropiate de 0)
(momentul centrat de ordin 2)
indică o asimetrie de mică
intensitate
x x n
3
i i
3 • valori mari (apropiate de ±1)
n i
indică o asimetrie cu intensitate
(momentul centrat de ordin 3) foarte mare
Boltirea (1)
50 1) Metoda vizuală
45
40
35
serie
30
mezocurtică serie leptocurtică serie platicurtică
Studenti
25
20
15
50
10
45
50
5 40
45
0 35
40
1 2 3 4 5 6 7 8 9 10 30
Studenti
35
25
30
Nota
Studenti
20
25 15
20 10
15 5
10 0
5 1 2 3 4 5 6 7 8 9 10
0 Nota
1 2 3 4 5 6 7 8 9 10
Nota
2
Boltirea (2)
2) Metoda
analitică
CAPITOLUL 9.
INDICII STATISTICI
Cuvinte cheie:
- indice cronologic
- indice individual
- indice de grup
- indice agregat
- indice al factorului cantitativ
- indice al factorului calitativ (intensiv)
y1 x1 ⋅ f 1
i1y/ 0 = = ;
y 0 x0 ⋅ f 0
f1
i1f/ 0 = ;
f0
x1
i1x/ 0 = .
x0
iy = ix ⋅ if
• indici de grup sau sintetici, care exprimă nivelul relativ al întregului ansamblu de
elemente şi se notează cu ″I″; de exemplu:
- indicele de grup al volumului valoric (Iy);
- indicele de grup al volumului fizic (Iq);
- indicele de grup al preţului (Ip);
De asemenea indicii de grup verifică sistemul Iy = Iq ⋅ Ip.
c) Din punctul de vedere al naturii elementelor colectivităţii (indicii se
diferenţiază ca metodă de calcul):
- în cazul unei colectivităţi eterogene, indicii pot fi calculaţi ca:
• indicii agregaţi, care recurg la o combinaţie teoretică ca mijloc de izolare a
influenţei fiecărui factor explicativ;
• indicii medii, care se formează ca medii aritmetice sau armonice ale indicilor
individuali;
Statistică teoretică şi economică
I Lf =
∑f 1 ⋅ x0
I Lx =
∑f 0 ⋅ x1
I y ≠ I Lf ⋅ I Lx ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x0
I pf =
∑f 1 ⋅ x1
I px =
∑f 1 ⋅ x1
I y ≠ I pf ⋅ I px ;
∑f 0 ⋅ x1 ∑f 1 ⋅ x0
If =
∑f 1 ⋅ x0
Ix =
∑f 1 ⋅ x1
I y = If ⋅Ix;
f 0 ⋅ x0 ∑f 1 ⋅ x0
I Ff =
∑f 1 ⋅ x0
⋅
∑f 1 ⋅ x1
= I Lf ⋅ I pf ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x1
I Fx =
∑f 0 ⋅ x1
⋅
∑f 1 ⋅ x1
= I Lx ⋅ I px I y = I Ff ⋅ I Fx
∑f 0 ⋅ x0 ∑f 1 ⋅ x0
1
Etiene Laspeyres (1834 -1913), economist şi statistician german, profesor la universităţile din Basel,
Riga, Karlsruhe şi altele. În statistica preţurilor a formulat, în 1864, un indice care îi poartă numele.
Principalele sale lucrări sunt: HamburgerWarenpreise, 1851-1863 und die californischaustralischen
Goldetfeckungen seit 1848; Die Berechnung einer mitttleren Warenpreissteigerung.
2
Herman Paasche (1851-1925), economist şi statistician german, agent de bursă la Hamburg în perioada
formulării variantei de indice de preţuri cu pondere curentă. Principalele lucrări: Ulber die
Preisentwicklung der letzten Jahre nach den Hamburger Preisnoteierungen (1874); Studien uber die Natur
der Gerdwertung und ihre praktische Bedeutung in den lotzten Jahrzehnten auf Grund statistischen
Detaillmaterials entnommen der Stadt Halle a/S (1878).
3
Irving Fisher (1867-1947), economist şi statistician din S.U.A., a descoperit nu mai puţin de 352 de
variante, formulând şi varianta: ″indicele geometric″, care este cunoscut sub denumirea de ″indicele 353″
sau ″indicele ideal″, pentru că satisface toate testele de verificare, consemnate, de altfel, de acelaşi autor.
Lucrările principale: Mathematical Investigation in the Theoryof Value and Prices (1922); The Marking of
Index Numbers (1922); The Best From of Index Number (1921).
Statistică teoretică şi economică
1
ib / a =
ia / b
Reversibilitatea trebuie să o întâlnim la toţi indicii. Deci, între cele două tipuri de
indici există relaţia:
ib / a ⋅ i a / b = 1
I 1y/(0x ) =
∑x
1 ⋅ f1
devine I 1y/(0x ) =
∑f 1 ⋅ x1
∑x 0 ⋅ f1 ∑f 0 ⋅ x1
şi respectiv:
I 1y/(0f ) =
∑x 0 ⋅ f1
devine I 1y/(0x ) =
∑f 0 ⋅ x1
∑x
0 ⋅ f0 ∑f 0 ⋅ x0
Statistică teoretică şi economică
Produsul noilor indici factoriali obţinuţi este egal cu indicele general al variaţiei
fenomenului complex;
- tranzitivitatea: presupune obţinerea indicelui cu bază fixă prin înmulţirea unui
şir de indici cu bază mobilă pentru peroada analizată.
Fie:
y1 y 2 y 3 y 4 y 5
i1 / 0 ⋅ i 2 / 1 ⋅ i3 / 2 ⋅i 4 / 3 ⋅i5 / 4 = ⋅ ⋅ ⋅ ⋅ = i5 / 0 ;
y 0 y1 y 2 y 3 y 4
ib / a ⋅ i c / n = i c / a
În acest caz:
ib / a ⋅ i c / b ⋅ i a / c = 1
I 1q/ 0 =
∑ q1 ⋅ p 0 şi I 1p/ 0 =
∑q 0 ⋅ p1
∑ q0 ⋅ p0 ∑q 0 ⋅ p0
Se observă că, în cazul primului indice, cel al cantităţii (variabila cantitativă), s-a
utilizat ponderea (preţul) din perioada de bază, iar în cazul celui de-al doilea indice, cel al
preţului (variabila calitativă), s-a utilizat ponderea (cantitatea) din perioada de bază.
Acest tip de indice se mai numeşte şi cu pondere constantă sau fixă.
În 1874, economistul german Hermann Paasche a produs un indice, folosind
ponderile perioadei curente:
I 1q/ 0 =
∑q 1 ⋅ p1
şi I 1p/ 0 =
∑q 1 ⋅ p1
∑q 0 ⋅ p1 ∑q 1 ⋅ p0
I 1q/ 0 =
∑ p ⋅q ⋅ ∑ p
0 1 1 ⋅ q1
şi I 1p/ 0 =
∑p 1 ⋅ q0
⋅
∑q 1 ⋅ p1
∑p q ∑p
0 0 1 ⋅ q0 ∑p 0 ⋅ q0 ∑q 1 ⋅ p0
Statistică teoretică şi economică
v
I p = I Fq ⋅ I Fp
Indicele Fischer se foloseşte la calcul indicilor teritoriali, în situaţia comparării
mai multor ţări: de exemplu, indicele consumului populaţiei, unde preţurile luate ca
ponderi se referă la ţările comparate.
Indicele prezintă însă un dezavantaj destul mare, şi anume, necesită cunoaşterea
separată a tuturor elementelor de calcul, precum şi combinarea tuturor variabilelor
posibile, mai ales în cazul în care sfera de cuprindere a colectivităţii la care se referă
indicii este foarte mare. Bineînţeles, indicii calculaţi după aceste trei variante de
ponderare nu dau aceleaşi rezultate. Având în vedere aceste neajunsuri, cercetările cu
continuat pentru găsirea unui indice mai bun însă până în prezent nu s-au găsit decât noi
formule de compromis.
Astfel, Y.F. Edgenworth4 a propus următorul indice:
I 1p/ 0 =
∑p 1 ⋅ (q1 + q 0 )
∑p 0 ⋅ (q1 + q 0 )
Indicele cumulează cantităţile din perioada de bază cu cele din perioada curentă,
cumul folosit la studiul variaţiei preţului, adică variaţiei calitative. Însă, indicele are un
dezavantaj, el nu poate fi utilizat decât pentru studiul variaţiei variabilei calitative,
deoarece ponderea (variabila calitativă) poate fi cumulată; în schimb, la studiul variabilei
cantitative nu se poate aplica, deoarece factorii calitativi nu au sens să fie cumulaţi de la o
perioadă la alta.
O altă formulă de compromis a fost propusă de statisticianul polonez Jean
Wisniewski, în sensul unui indice mediu, elaborat cu ajutorul calculului integral.
Unii statisticiani au propus un procedeu simplu şi rapid, prin calcularea indicelui
pe baza medianei.
De asemenea, un alt procedeu de ponderare este şi cel propus de matematicianul
şi filosoful german Mortiz Wilhelm Drobisch:
I=
∑ p ⋅q :∑ p ⋅q
1 1 0 0
∑q ∑p 1 0
4
Francis Ysidor Edgeworth (1845-1926), statistician, matematician şi economist englez. Profesor în
economie la Oxford (1891) şi la Londra. A fost influenţat de concepţia bayesiană. A avut o importantă
contribuţie la teoria indicilor şi la aplicarea statisticii matematice în economie; autor al unor lucrări
fundamentale de teoria statisticii. Lucrări principale: On the Method of Ascertaining a Change in the Value
of Gold (1883); Defence of Index-Numbers (1896); Metretica sau metodica de măsurare a probabilităţii şi
unităţii (1887); Despre metodele statisticii (1885).
Statistică teoretică şi economică
p1
∑p ⋅ q1
I= 0
∑q 1
I 1y/ 0 =
∑x
1 ⋅ f1
,
∑x
0 ⋅ f0
unde ″x″ este factorul calitativ şi ″f″ este factorul cantitativ. Corespunzător,
descompunerea analitică va fi:
∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0
I 1y/(0x ) =
∑x 1 ⋅ f1
sau I 1y/(0x ) =
∑x 1 ⋅ f0
;
∑x 0 ⋅ f1 ∑x 0 ⋅ f0
I 1y/(0f ) =
∑x 1 ⋅ f1
sau I 1y/(0f ) =
∑x 0 ⋅ f1
∑x 1 ⋅ f0 ∑x 0 ⋅ f0
I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0x ) =
∑x 1 ⋅ f1
; ∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 ;
∑x 0 ⋅ f1
I 1y/(0f ) =
∑x 0 ⋅ f1
; ∆ y1(/ x0) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
- varianta b:
I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
Statistică teoretică şi economică
I 1y/(0x ) =
∑x 1 ⋅ f0
; ∆1y/(0x ) = ∑ x1 ⋅ f 0 − ∑ x0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0f ) =
∑x 1 ⋅ f1
; ∆ y1(/ 0f ) = ∑ x1 ⋅ f 1−∑ x1 ⋅ f 0 .
∑x 1 ⋅ f0
∆ y1 / 0 = y1 − y 0 ; ∆x1 / 0 = x1 − x 0 ; ∆ 1f / 0 = f 1 − f 0 .
Prin urmare, sporul variabilei complexe ″y″ în funcţie de factorul ″x″ va fi:
- pentru varianta a:
- pentru varianta b:
iar sporul variabilei complexe ″y″ în funcţie de factrul cantitativ ″f″ va fi:
∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 = ∑ x 0 ( f 1 − f 0 ) = ∑ x 0 ⋅ ∆ 1f / 0 ;
- pentru varianta b:
∆ y1(/ 0f ) = ∑ x1 ⋅ f 1 − ∑ x1 ⋅ f 0 = ∑ x1 ⋅ ( f 1 − f 0 ) = ∑ x1 ⋅ ∆ 1f / 0 .
Însă, din inegalitatea f1>f0 rezultă că sporul factorului ″x″ în prima variantă este
mai mare decât în cea de-a doua variantă cu produsul diferenţei dintre ponderi şi creşterea
variabilei calitative.
Dacă analizăm cel de-al doilea factor, sporul variaţiei complexe ″y″ în funcţie de
factorul cantitativ ″f″, rezultă că influenţa este mai mare cu aceeaşi valoare, deoarece
ponderea folosită x1 > x0 se multiplică pentru toată creşterea factorului ″f″. Cei mai mulţi
statisticieni şi economişti atribuie această diferenţă inlfuenţei factorului calitativ,
considerând faptul că modificarea acestuia este condiţionată de modificararea factorului
cantitativ şi deci este justificată folosirea ponderii din perioada curentă.
În general, dacă substiuirea începe cu factorul calitativ, atunci, pe măsură ce am
luat în considerare un factor, el rămâne în perioada de bază ca pondere, factorii neluaţi în
calcul însă vor fi stabiliţi în perioada curentă.
Statistică teoretică şi economică
I 1y/ 0 =
∑ x ⋅ f ⋅t
1 1 1
∆ y1 / 0 = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 ;
∑ x ⋅ f ⋅t
0 0 0
I 1y/(0x ) =
∑ x ⋅ f ⋅t1 1 1
∆ y1(/ x0) = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 1 ⋅ t1 ;
∑ x ⋅ f ⋅t0 1 1
I 1y/(0f ) =
∑x 0 ⋅ f 1 ⋅ t1
∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t1 ;
∑x 0 ⋅ f 0 ⋅ t1
I 1y/(0f ) =
∑x 0 ⋅ f 0 ⋅ t1
∆ y1(/t0) = ∑ x 0 ⋅ f 0 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 .
∑x 0 ⋅ f 0 ⋅ t0
I 1y/ 0 =
∑x 1 ⋅ f1
, respectiv ∆ 1 / 0 y = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0f ) =
∑x 0 ⋅ f1
, respectiv ∆ y ( f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0x ) =
∑x 1 ⋅ f0
, respectiv ∆ y ( x ) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
- restul nedescompus:
Statistică teoretică şi economică
I 1y/(0x ∩ f ) =
∑x 1 ⋅ f1
:
∑x 1 ⋅ f0
, respectiv
∑x 0 ⋅ f1 ∑x 0 ⋅ f0
∆ y ( x∩ f ) = ∑ x1 ⋅ f1 − ∑ x0 ⋅ f 1 − ∑ x1 ⋅ f 0 + ∑ x0 ⋅ f 0
Restul nedescompus este necesar să fie repartizat pe cei doi factori de influemţă.
De regulă, repartizarea se face în funcţie de ponderea influenţei izolate a fiecărui factor în
totalul celor două influenţe izolate. Deci, se vor calcula coeficienţii de realizare:
∆y ( f ) ∆y ( x)
k = y( f )
f
şi k = y( f )
x
,
∆ + ∆y ( x) ∆ + ∆y ( x)
rezultând:
- influenţa totală a factorului cantitativ:
∆ y ( f ) = ∆y ( f ) + k f ⋅ ∆y ( x ∩ f ) ;
∆ y ( x ) = ∆y ( x) + k x ⋅ ∆y ( x ∩ f )
Metoda influenţelor izolate oferă rezultate mai exacte decât metoda substituirilor
în lanţ, care atribuie întreg sporul nedescompus factorului calitativ. MSL se utilizează
numai în cazul în care factorul cantitativ se modifică nesemnificativ şi dacă ponderea sa
în restul nedescompus este foarte mică.
I 1f/ 0 =
∑x 0 ⋅ f1
if =
f1
⇒ f1 = i f ⋅ f 0 ;
∑x 0 ⋅ f0 f0
deci:
I f
=
∑i ⋅ x ⋅ f
f
0 0
;
∑x ⋅ f
1/ 0
0 0
I 1x/ 0 =
∑x 1 ⋅ f0
ix =
x1
⇒ x1 = i x ⋅ x 0 ,
∑x 0 ⋅ f0 x0
deci:
I 1x/ 0 =
∑i x ⋅ f x
0 0
∑x ⋅ f 0 0
f
I1/ 0 =
∑x 1 ⋅ f1
if =
f1
⇒ f0 =
1
⋅ f1 ,
∑x 1 ⋅ f0 f0 if
deci:
I1/ 0 =
f ∑x ⋅ f 1 1
1
∑i ⋅x ⋅ f f 1 1
I 1x/ 0 =
∑x 1 ⋅ f1
ix =
x1
x0 =
1
⋅ x1 ,
∑x 0 ⋅ f1 x0 ix
deci:
Statistică teoretică şi economică
I 1x/ 0 =
∑x ⋅ f 1 1
1
∑i ⋅x ⋅ f
x 1 1
∑x ⋅ f = x
∑
1 1
x= ⋅ g if ,
∑f
1
1
fi
g if =
∑f i
x ( x)
I SF =
∑x ⋅ f :∑x ⋅ f
1 1 0 1
.
∑f ∑f 1 1
∑x ⋅ f ∑x ⋅ f = x
∑ ⋅ g 1f − ∑ x 0 ⋅ g 1f ;
1 1 0 1
∆xSF( x ) = −
∑f ∑f
0
1 1
x ( x)
I SV =
∑x ⋅ f :∑x ⋅ f 1 1 0 0
.
∑f ∑f 1 0
∆xSV( x , f ) =
∑x ⋅ f1 1
−
∑x ⋅ f 0 0
= ∑ x1 ⋅ g 1f − ∑ x 0 ⋅ g 0f
∑f 1 ∑f 0
I VSx ( f ) =
∑x ⋅ f :∑x ⋅ f
0 1 0 0
.
∑f ∑f 1 0
∆xVS( f ) =
∑x ⋅ f0 1
−
∑x ⋅ f 0 0
= ∑ x 0 g 1f − ∑ x 0 ⋅ g 0f .
∑f 1 ∑f 0
I SV = I SF ⋅ I VS ;
∆ SV = ∆ SF ⋅ ∆ VS .
Statistică teoretică şi economică
XA XB
i Ax / B = sau i Bx / A = ;
XB XA
fA fB
i Af / B = sau i Bf / A = ;
fB fA
yA X A f A yB X B ⋅ f B
i Ay / B = = sau i By / A = = .
yB X B f B yA X A ⋅ f A
i Ax / B ⋅ i Bx / A = 1
i af / B ⋅ i Bf / A = 1
i Ay / B ⋅ i By / A = 1
I Ay / B =
∑y A
=
∑X A ⋅ fA
sau I By / A =
∑y B
=
∑X B ⋅ fB
.
∑y B ∑X B ⋅ fB ∑y A X A ⋅ fA
Statistică teoretică şi economică
I Ax / B =
∑X A ⋅ fA
; I Ax / B =
∑X A ⋅ fB
∑X B ⋅ fA ∑X B ⋅ fB
sau
I Bx / A =
∑X B ⋅ fB
; I Bx / A =
∑X B ⋅ fA
.
∑X A ⋅ fB ∑X A ⋅ fA
I Af / B =
∑X A ⋅ fA
; I Af / B =
∑X B ⋅ fA
∑X A ⋅ fB ∑X B ⋅ fB
sau
I Bf / A =
∑X B ⋅ fB
; I Bf / A =
∑X A ⋅ fB
.
∑X B ⋅ fA ∑X A ⋅ fA
Pentru a compara cele două ţări, de fapt cele două pieţe, se va considera ca bază
de raportare piaţa ţării ″B″. Comparaţia se poate face din următoarele puncte de vedere:
- din punctul de vedere al cantităţilor vândute:
I Af / B =
∑f A
=
145
= 1,16 sau 116%
∑f B 125
Statistică teoretică şi economică
Acest rezultat arată că pe piaţa ″A″ s-au vândut cu 16% mai multe tone de marfă
decât pe piaţa ″B″:
- din punct de vedere al preţurilor:
I Ax / B =
xA
=
∑Q : ∑Q
A B
= 0,8473 sau 84,73%
xB ∑f ∑f
A B
Rezultatul arată că preţul mediu pe piaţa ″A″ a fost cu 15,27% mai mic decât
preţul mediu pe piaţa ″B″.
- din punctul de vedere al încasărilor:
I AQ/ B =
∑ Q A = 10100 = 0,9829 sau 98,29%
∑ QB 10275
Volumul valoric al tranzacţiilor pe piaţa ″A″ a fost cu 1,71% mai mic decât
volumul valoric al tranzacţiilor pe piaţa ″B″.
De remarcat, că şi în această situaţie se verifică relaţia:
I AQ/ B = I Af / B ⋅ I Ax / B
Probleme şi aplicaţii:
9.1. În exportul a trei produse se cunosc următoarele date comparative ale două
trimestre ale anului 1997:
(date convenţionale)
Denumire produs Indicii de preţuri Volumul valoric (mild.lei)
Trim III Trim IV
A 140 4 8
B 130 4 6
C 180 1 4
Se cere:
1. să se calculeze indicii individuali ai volumului valoric şi ai volumului fizic;
2. să calculeze indicii de grup care caracterizează evoluţia exportului celor trei produse;
3. să se măsoare influenţa factorilor posibili asupra evoluţiei volumului valoric al
exportului la nivelul firmei.
Se cere:
1. să se facă analiza comparativă a indicilor de preţ calculaţi după relaţiile Laspeyres,
Paasche şi Fisher;
2. să se decompună pe factori de influenţă creşterea volumului valoric al vânzărilor de
produse lactate.
Se cere:
1. să se calculeze indicele de grup al preţului ca medie artimetică ponderată;
2. să se calculeze indicele de grup al preţului ca medie armonică ponderată.
Statistică teoretică şi economică
CAPITOLUL 7.
SERII CRONOLOGICE
Cuvinte cheie:
- ajustarea seriilor cronologice
- ciclicitatea
- indicii de dinamică cu bază fixă
- indicii de dinamică cu bază în lanţ
- modificarea absolută cu bază fixă
- modificarea absolută cu bază în lanţ
- ritm cu bază fixă
- ritm cu bază în lanţ
- serie cronologică
- sezonalitatea
- trend
- valoarea absolută a unui procent de creşterecu bază fixă
- valoarea absolută a unui procent de creşterecu bază în lanţ
- variaţia reziduală
Orice proces sau fenomen al activităţii umane poate fi studiat atât în timp, cât şi în
spaţiu. Analiza presupune, în principal, o cercetare în timp cu ajutorul unor indicatori
statistici specifici de-a lungul diferitelor perioade de timp. De exemplu, putem înregistra
volumul vânzărilor zilnice dintr-un magazin electrocasnic, evoluţia lunară a producţiei de
cărbune, evoluţia zilnică a ratei dobânzii sau a ratei de schimb.
este formată din două şiruri de date paralele, un şir arătând variaţia caracteristicii
de timp, iar cel de-al doilea – variaţia fenomenului sau a caracteristicii de la o perioadă la
alta. Seriile cronologice se mai numesc şi serii de timp sau serii dinamice. Deci, se poate
spune că seriile cronologice apar ca rezultat al unor măsurători ce se efectuează la
anumite momente sau intervale de timp, care pot fi egale sau neegale, asupra unei
colectivităţi în ansamblul său sau a unei părţi dintr-o colectivitate.
La construirea şi la analiza seriilor cronologice trebuie avute în vedere
proprietăţile acestora:
- variabilitatea termenilor;
- omogenizarea termenilor;
- periodicitatea termenilor;
- interdependenţa termenilor.
Să încercăm să explicăm fiecare dintre aceste proprităţi:
Variabilitatea termenilor unei serii cronologice rezultă din faptul că fiecare
termen este obţinut prin centralizarea unor date individuale. Acest lucru face să existe
anumite diferenţieri între termenii seriei, fie ca urmare a acţiunii factorilor aleatori, fie ca
urmare a faptului că în viaţa economică-socială legile se manifestă ca tendinţă generală,
imprimând fenomenelor şi proceselor diferite forme de variaţie.
Omogenitatea termenilor este înţeleasă în sensul că o anumită în sensul că o
anumită serie nu cuprinde decât fenomene şi procese de acelaşi gen, care sunt efecte ale
aceluiaşi tip de cauze. Pentru a asigura omogenitatea termenilor trebuie utilizată aceeaşi
Statistică teoretică şi economică
Y = T + S + C + R;
b) modelul multiplicativ, adică reprezentarea cantitativă a raportului dintr valorile
seriei cronologice şi componentele sale, presupunând o relaţie de proporţionalitate a
factorilor:
Y = T ⋅ S ⋅ C ⋅ R.
∆ t / 1 = y t − y1 .
Statistică teoretică şi economică
∆t / t −1 = yt − y t −1 .
∑∆ t / t −1 = ∆t / 1
Indicatorii relativi sunt utilizaţi pentru a arăta de câte ori nivelul dintr-o anumită
perioadă se modifică faţă de nivelul atins de perioada de bază, sau pentru a determina
acelaşi lucru în procente.
Indicii de dinamică arată de câte ori s-a modificat un proces sau un fenomen de-a
lungul timpului.
Indicii se pot calcula:
- cu bază fixă, determinaţi după relaţia:
yt
I t /1 = ⋅ 100 ;
y1
yt
I t / t −1 = ⋅ 100 .
y t −1
∏I t / t −1 = I t /1
y y − y1 ∆
Rt / 1 = ( I t / 1 − 1) ⋅ 100 = t − 1 ⋅ 100 = t ⋅ 100 = t / 1 ⋅ 100 ;
y1 y1 y1
y y − y t −1 ∆
Rt / t −1 = (I t / t −1 − 1) ⋅ 100 = t − 1 ⋅ 100 = t ⋅ 100 = t / t −1 ⋅ 100
y t −1 y t −1 y t −1
Statistică teoretică şi economică
Trecerea de ritmuri cu bază în lanţ la ritmuri cu bază fixă sau invers se face numai
prin transformarea acestora în indici de dinamică, fapt ce ne conduce la concluzia că în
cazul ritmurilor există inegalitatea:
∏R t / t −1 ≠ Rn / 1
Valoarea absolută a unui procent de creştere exprimă câte unităţi din sporul
înregistrat într-o perioadă revin la fiecare procent al ritmului. Acest indicator face
legătura între indicatorii absoluţi şi cei relativi.
Valoarea absolutã a unui procent se poate calcula:
- cu bază fixă,determinată pe baza relaţiei:
∆ y t − y1 y
At / 1 = t%/ 1 = = 1
R t / 1 y t − y1 100
⋅ 100
y1
y=
∑y t
∆=
∑∆ t / t −1
=
y t − y1
n −1 n −1
yn
I = n −1 ∏ I t / t −1 = n −1
y1
Statistică teoretică şi economică
R = (I ⋅ 100) − 100
y1 + y 2 y 2 + y 3 y + yn
+ ... + n −1
y cr = 2 2 2
n −1
Sunt (n-1) termeni la numitor, deoarece, faţă de numărul termenilor seriei, se pot
calcula (n-1) medii parţiale, pe fiecare interval.
După efectuarea calculelor obţinem:
y1 y
+ y 2 + y 3...+ y n −1 + n
y cr = 2 2
n −1
t1 t1 + t 2 t 2 + t 3 t n −1
; ; ...
2 2 2 2
t t t t
y1 1 + y 2 1 + 2 + ... y n n −1
2 2 2 2
y cr =
t 1 t1 t 2 t
+ + + ... n −1
2 2 2 2
sau:
t t +t t
y1 1 + y 2 1 2 + ... y n n −1
2 2 2
y cr = n −1
∑t
i =1
i
y1 + y 2 + y 3
y1 = ;
3
y + y3 + y 4
y2 = 2
3
y3 + y 4 + y5
y3 =
3
În cazul calcului dintr-un număr impar de termeni, fiecare medie mobilă se va
plasa în dreptul unui termen ce corespunde cu poziţia termenului central, numărul
acestora fiind egal cu: n-(n'+1)
unde: n reprezintă numărul termenilor seriei ce urmează a fi ajustată;
n' numărul termenilor din care se calculează media.
În cazul când ajustarea se face pe baza mediilor mobile calculate dintr-un număr
par de termeni, mediile mobile se obţin în două trepte: în primul rând, se determină
mediile provizorii, care se plasează între termenii seriei, şi în al doilea rând, se determină
mediile mobile definitive sau centrate, care se plasează, în dreptul termenilor seriei şi cu
care se face ajustarea termenilor seriei iniţiale.
Considerând o serie in 8 termeni, se pot calcula 5 medii provizorii:
y + y 2 + y3 + y4
Yˆ1 = 1 ;
4
y + y3 + y 4 + y5
Yˆ2 = 2 ;
4
y + y4 + y6
Yˆ3 = 3 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 4 ;
4
y + y 6 + y 7 + y8
Yˆ5 = 5 .
4
Ajustarea prin metoda sporului mediu se foloses atunci când, prelucrând seria de
date, se obţin sporuri cu bază în lanţ relativ asemănătoare ca valoare unele cu altele.
Statistică teoretică şi economică
Aceasta corespunde unei creşteri a nivelurilor cracteristicii studiate sub forma unei
progresii aritmetice cu raţia egală cu modificarea mediei absolute şi se bazează pe relaţia
care există între primul termen, modificările absolute cu bază în lanţ şi ultimul termen.
Astfel, putem considera că ultimul termen se determină după relaţia:
y n = y 0 + ∆ + ∆ + ∆....∆ ,
adică:
y n = y 0 + n∆
Relaţia care stă la baza ajustării prin procedeul modificării medii absolute va fi:
Yti = y1 + t i ∆ ,
y n = y 0 ⋅ I ⋅ I ⋅ ...I ,
adică:
yˆ n = y1 ⋅ I n
Yˆti = y1 ⋅ (I ) i
t
Yt = a + b ⋅ t ,
în care:
Yt – sunt valorile ajustate calculate în funcţie de valorile caracteristicii factoriale
(t);
a – reprezintă parametrul care are sens de mărime medie şi arată nivelul atins de
"y", dacă influenţa tuturor factorilor – cu excepţia celui înregistrat – ar fi fost constantă
pe toată perioada. Din punctul de vedere al interpretării parametrului, acesta nu are o
semnificaţie economică;
b – reprezintă parametrul care sintetizează numai influenţa caracteristicii
factoriale (t) şi arată cu cât se modifică rezultanta la modificarea cu o unitate a factorului
de influenţă. Dacă b > 0, rezultă o relaţie directă (pozitivă); în cazul b < 0, rezultă o
relaţie inversă (negativă) între cele două fenomene;
t – reprezintă valorile caracteristicii factoriale care, în cazul seriilor cronologice,
este timpul.
Dacă graficul are o tendinţă de creştere exponenţială, atunci se poate aprecia că
fenomenul are forma unei funcţii exponenţiale a cărei ecuaţie de estimare este:
Yt = a ⋅ b t
Când pe grafic se obţine o curbă care are fie un punct de maxim, fie un punct de
minim, atunci se apreciază că fenomenul studiat se modifică în timp sub forma unei
parabole de gradul doi.
Ecuaţia de estimare a unei parabole de gradul doi exprimată în funcţie de timp
este:
Y1 = a + b ⋅ t + c ⋅ t 2
∆(tt /) t −1 = y t − y t −1
∆(t2/)t −1 = k 2 ,
min ∑ ( y t − y t )
2
t = 1, 2, …,n.
na + b∑ t i = ∑ y i
a ∑ t i + b∑ t i = ∑ t i y1
2
de unde rezultă:
a=
∑ yi ; b = ∑ ti ⋅ yi
n ∑ t i2
Se observă că valoarea lui "a" este egală cu media seriei:
a=
∑y i
=y
n
Statistică teoretică şi economică
Seria t1 t2 t3 t4 t5 t6
var. I -5 -3 -1 1 3 5
var. II -2,5 -1,5 -0,5 0,5 1,5 2,5
na + c ∑ t i2 = ∑ y1
b∑ t i = ∑ t i y i
2
a ∑ t i + c∑ t i = ∑ t i ⋅ y i
2 4 2
Din sistemul de mai sus se determină parametrii a, b şi c. Dacă b > 0, atunci are
loc o creştere accelerată de-a lungul perioadei, iar în cazul când c < 0, creşterea se
încetineşte.
Verificarea calculării ecuaţiilor de regresie se face pe baza relaţiei:
∑Y yi = ∑ yi
∑y t − Yt = min ;
d y (t )
v y (t ) = ⋅ 100
y
Statistică teoretică şi economică
d y (t ) =
∑y t − yt
n
Alegerea se face după valoarea coeficientului de variaţie. Valoarea cea mai mică
arată metoda de ajustare cea mai bună.
Pentru aprecierea calităţii sau capacităţii de exprimare a funcţiei de ajustare
analitică, se utilizează următorii doi indicatori:
- abarerea standard sau eroarea standard a valorilor teoretice faţă de valorile
reale:
S yt / Yt =
∑ (y t − Yt )
2
- coeficientul de eroare:
S yt / Yt
e= ⋅ 100
y
Cu cât aceşti indicatori au valori mai mici, cu atât mai bună este funcţia de
ajustare aleasă.
7. 5. Calculul sezonalităţii.
Determinarea cantitativă sau statistică a sezonalităţii este necesară în procesul
decizional atât la nivel microeconomic, cât şi la nivel macroeconomic. În practica
internaţională se utilizează coeficientul de sezonalitate, stabilit ca raport între trimestrul
sau luna calendaristică cu activitatea maximă şi trimestrul sau respectiva lună
calendaristică cu activitatea minimă.
Pentru caracterizarea sezonalităţii se utilizează indici de sezonalitate, stabiliţi în
felul următor, pe o serie de date lunare sau trimestriale, complete, pentru o perioadă de 3-
5 ani consecutivi, se calculează pentru fiecare lună sau trimestru câte o medie yi. De
asemenea, se stabileşte o medie generală lunară sau trimestrială y0 pentru întreaga
perioadă. Comparând fiecare medie lunară sau trimestrială cu media generală, rezultă un
indice de sezonalitate; acest indice exprimă cât la sută reprezintă media lunii sau
trimestrului faţă de media generală:
yi =
∑y ij
y0 =
∑⋅ ∑ y ij
IS % =
yi
⋅ 100
n n⋅m y0
unde:
n este numărul anilor;
m - numărul subperioadelor.
Această metodă de determinare prin medii aritmetice a indicelui de sezonalitate
este acceptată în cazul seriilor cronologice care nu sunt foarte dinamice.
Statistică teoretică şi economică
Probleme si aplicatii:
7.1.Comerţul exterior al României a evoluat în perioada 1991-1996 conform cu
datele de mai jos:
Se cere:
1. să se analizeze evoluţia exportului României în perioada 1991-1996 cu ajutorul
indicatorilor absoluţi, relativi şi medii;
2. să se reprezinte grafic evoluţia importului României în perioada analizată;
3. să se ajusteze seria de date referitoare la comerţul exterior al României
(export+import) în perioada analizată prin metode simple (elementare sau mecanice).
7.2. Evoluţia numărului populaţiei din mediul urban în perioada 1989-1995 a fost:
Se cere:
1 să se ajusteze seria de date utilizând metode elementare şi analitice de ajustare;
2. să se arate care din metodele folosite este cea mai potrivită;
3. să se efectueze extrapolarea seriei pentru următorii doi ani folosind metoda rezultată de
la punctul anterior.
7.3. În tabelul de mai jos sunt prezentate modificările absolute cu bază mobilă ale
dinamicii populaţiei ocupate în perioada 1991-1995 în România:
Se cere:
1. să se reconstituie seria cunoscând că nivelul atins de populaţia ocupată în 1990 a fost
de 10840 mii persoane;
2. să se ajusteze seria de date cu ajutorul ecuaţiei liniare de ajustare.
Statistică teoretică şi economică
Se cere:
1. să se reconstituie seria cunoscând numărul de studenţi înscrişi în 1991/1992;
2. să reprezinte grafic seria cronologică reconstituită;
3. să se ajusteze seria cronologică prin metoda mediilor mobile şi să se determine
calitatea acestei metode de ajustare comparativ cu metoda indicelui mediu.
Se cere:
1. să se determine indicatorii medii care caracterizează seria coronologică prezentată;
2. să se extrapoleze seria pentru anul 1996 utilizând cea mai bună metodă de ajustare.
7.6. Numărul de născuţi-vii după luna naşterii în perioada 1991-1995 este prezentat
în tabelul următor:
Se cere:
1. să se caracterizeze şi să se măsoare sezonalitatea folosind metoda mediilor mobile;
2. să se măsoare sezonalitatea folosind cea mai bună metodă analitică;
3. să se determine şi interpreteze componenta reziduală.
TEMA 8. ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE VARIABILELE ECONOMICE
1. Conceptul de legătură statistică
2. Tipuri de legături între variabilele economice
3. Metode elementare de caracterizare a legăturilor dintre variabile
4. Metoda regresiei
5. Indicatorii sintetici ai corelaţiei
1
- legături între variabilele statistice exprimate numeric (cantitativ) ca, de
exemplu, între valoarea încasărilor realizate la un hotel (y) şi numărul
locurilor de cazare ale acestuia (x);
- legături între variabilele statistice exprimate prin cuvinte ca, de exemplu,
legătura între studii şi ocupaţie.
Legăturile dintre caracteristicile numerice se mai numesc şi corelaţii statistice, iar cele între
caracteristici calitative – asocieri statistice..
După direcţia legăturilor:
- legături directe, cînd la creşterea (sau descreşterea) valorilor caracteristicii
factoriale corespunde creşterea (sau descreşterea) valorii caracteristicii
rezultative.
- legături inverse, cînd creşterii valorii unei caracteristici factoriale îi
corespunde descreşterea celeilalte caracteristici.
După expresia analitică a legăturilor deosebim:
- legături liniare, cînd se exprimă prin ecuaţia liniei drepte;
- legături neliniare sau curbilinii, cînd se exprimă prin ecuaţia unei curbe
(parabolă, hiperbolă, funcţie exponenţială etc.)
După timpul cînd se produce legătura pot fi:
- legături concomitente sau sincrone, la care, pe măsură ce se modifică
variabila funcţională, în acelaşi timp se modifică şi variabila rezultativă;
- legături asincrone sau cu decalaj, la care variaţia caracteristicii rezultative se
produc după scurgerea unei perioade de timp de la modificarea variabilei
factoriale.
2
Valorile caracteristicii factoriale se trec în ordine crescătoare în capetele coloanelor, iar
valorile caracteristicii rezultative în ordine descrescătoare în capetele rîndurilor. În rubricile
formate la întretăierea acestora se înscriu frecvenţele cu care cele două caracteristici se
încadrează în intervalele respective. Se recomadă ca numărul grupelor formate după cele două
caracteristici să fie aproximativ egal, iar intervalele de grupare să fie egale.
În funcţie de modul de repartizare a frecvenţelor în tabelul de corelaţie se poate aprecia
direcţia legăturii şi intensitatea ei. În unele cazuri direcţia legăturii este dată de poziţia diagonalei
în jurul căreia se grupează frecvenţele; cînd diagonala leagă unghiul stîng de jos al tabelului cu
ungiul drept de sus legătura este directă, iar cînd uneşte ungiul stîng de sus cu ungiul drept de
jos se apreciază că între cele două caracteristici există legătură în sens invers. Modul de aşezare
a frecvenţelor în jurul diagonalei ne dă posibilitatea să apreciem intensitatea legăturii:
concentrarea intensă a frecvenţelor în jurul diagonalei indică existenţa unei legături strînse între
caracteristici. Dacă frecvenţele se repartizează pe întregul tabel fără nici o regularitate, atunci
sau nu există legătură, sau aceasta este foarte slabă.
Metoda grafică constă în construirea graficului de corelaţie – denumit şi corelogramă, ce
foloseşte sistemul axelor rectangulare, respectiv priml lor cadran. Procedura este următoarea:
valorile caracteristicii factoriale (x) sau intervalele acesteia se trec pe abscisă, iar pe ordonată,
valorile caracteristiciirezultative (y) sau intervalele respective. Fiecare unitate observată
purtătoare a celor două caracteristici corelate se reprezintă pe grafic printr-un punct. Se stabileşte
amplitudinea variaţiei caracteristicii factoriale şi, pe baza ei, scara de reprezentare pe abscisă.
Se recomandă ca şi pentru variabila rezultativă să se folosească pe cît posibil acelaţi număr de
diviziuni ale scării.
Reprezentarea grafică a legăturii în cîmpul de corelaţie are aspectul unui nor de puncte, de
aceea metoda grafică se mai numeşte „metoda norilor de puncte”. Metoda grafică este utilizată
cu bune rezultate pentru alegerea funcţiei analitice care se studiază (în cazul regresiei şi
corelaţiei).
4. Metoda regresiei
Pentru a înlătura neajunsurile utilizării metodelor elementare în studiul legăturilor dintre
fenomenele economice, statistica foloseşte o serie de metode analitice: metoda regresiei şi
metoda indicatorilor sintetic ai corelaţei.
Metoda regresiei constituie o metodă statistică de cercetare a legăturii dintre variabile cu
ajutorul unor funcţii, denumite funcţii de regresie. Notînd cu „y” variabila dependentă şi cu „x1, x2
...” variabilele independente, obţinem ecuaţia de regresie: y = f(x1, x2, ... , xn)
Datorită caracterului aleator al fenomenelor şi proceselor social-economice, modelul
teoretic se înlocuieşte cu modelul de dependenţă statistică:
Y = f(x1, x2, ... , xn) +, în care reprezintă o eroare aleatoare (o variabilă reziduu), cu
dispersia constantă şi media nulă.
În funcţie de numărul factorilor (x1, x2, ... , xn) care influenţează caracteristică rezultativă (z),
deosebim:
- regresie unifactorială sau simplă, dacă funcţia include un factor;
- regresie multifactorială sau multiplă, dacă funcţa include mai mulţi factori
Regresia unifactorială descrie legătura dintre două variabile (y şi x), considerînd că ceilalţi
factori au o acţiune constantă asupra caracteristicii dependente y. Ecuaţia de regresie este: Y=
f(x)
Cele mai cunoscute modele de regresie unifactorială sunt:
a) Modelul liniar, cînd legătura dintre „y” şi „x” este liniară şi cînd aceste caracteristici
variază în progresie aritmetică:
yi = + xi +
Acest model teoretic se estimează printr-o ecuaţie medie de tendinţă care se poate scrie
astfel: Y = a + bxi +, în care „a” şi „b” sunt coeficienţii (parametrii) ce urmează să fie calculaţi,
iar Y se citeşte „y ajustat cu x”.
Parametrii „a” şi „b” se estimează cu ajutorul unor metode specifice oferite de statistică, ca
de exemplu: metoda verosimilităţii maxime, metoda celor mai mici pătrate etc. În practică,
frecvent, se foloseşte MMMP, care presupune ca suma pătratelor abaterilor dintre valorile
empirice (reale) „y” şi valorile teoretice (ajustate) „Y” să fie minimă, adică: (yi - Y)2 = minim
3
Înlocuin pe Y cu valoare sa obţinem: (yi – a - bxi)2 = minim
Derivînd această sumă în raport cu derivatele parametrilor „a” şi „b”, anulînd derivatele
parţiale, se obţine sistemul de ecuaţii normale:
na + bxi = yi
axi + bxi2 = yixi
a
y x x y x
i
2
i i i i
b
n xi y i xi y i
n x x n xi2 xi
2 2 2
i i
Coeficientul „a” poate lua atît valori pozitive cît şi negative, reprezintă ordonata la origine,
respectiv, este valoarea lui „y” cînd „x” este egal cu zero.
Coeficientul „b” denumit coeficient de regresie – arată măsura în care se modifică
caracteristica dependentă în cazul în care caracteristica independentă se modifică cu o unitate.
În funcţie de semnul coeficientului de regresie putem aprecia tipul de legătură: în cazul corelaţiei
directe b0, în cazul corelaţiei inverse b0 şi în cazul în care b=0 se apreciază că cele două
variabile sunt independente.
În graficul de corelaţie coeficientul „b” indică panta liniei drepte.
Cu ajutorul coeficienţilor „a” şi „b” se calculează apoi valoarea ecuaţiei de regresie pentru
fiecare mărime a caracteristicii „x”. Aceste valori ale ecuaţiilor de regresie se numesc valori
teoretice ale caracteristicii „y” în funcţie de „x”, iar operaţia de înlocuire a termenilor reali „y” cu
valorile ecuaţiei de regresie (valori teoretice) se numeşte ajustare.
b) Modelul exponenţial, cînd legătura dintre cele două variabile este de formă
exponenţială şi cînd variabila dependentă creşte în progresie aritmetică, iar variabila
independentă creşte în progresie geometrică:
yi = x +
Cei doi parametri se estimează folosind modelul (funcţia de estimaţie):
Y = abx +
Prin logaritmare, modelul se poate transforma în tr-un model liniar de forma:
Log Y = log a + x * log b
Sistemul de ecuaţii normale este:
nlog a + log bxi = log yi
log axi +log bx i2= (xilog yi )
cei doi parametri „a” şi „b”, cu ajutorul cărora se ajustează seria empirică, se obţin prin
antilogaritmare.
d) Modelul hiperbolic, cînd are loc o dependenţă inversă dintre cele două variabile (x –
scade, y – creşte şi invers): yi = + 1/xi *+
Funcţia de estimaţie este: Y = a + 1/x *b+ , iar cei doi parametri rezultă din rezolvarea
sistemului de ecuaţii normale:
na + b1/xi = yi
4
a1/xi + b1/xi2 = yi *1/xi
Coeficienţii de regresie pot avea fie semn pozitiv, fie semn negativ şi arată tipul de legătură
(directă sau inversă) dintre variabila factorială „xi” şi variabila rezultativă „y”.
Un alt model de regresie multifactorială este modelul exponenţial de forma:
Y a0 x1a1 * x2a2 * ... * x p p
a
Prin logaritmare, modelul exponenţial de mai sus se opate transforma în tr+un model liniar.
etc.
Notă: Pentru a verifica care model este cel mai potrivit, se calculează suma pătratelor
abaterilor dintre valorile reale şi valorile ajustate (după modelele propuse). Se consideră ca cel
mai adecvat modelul pentru care suma pătratelor abaterilor este cea mai mică. Precizarea este
valabilă atît pentru modelele de regresie unifactorială cît şi pentru modelele de regresie
multifactorială.
5
n xi y i xi y i
r
n x 2
i
2
xi n yi2 yi
2
Coeficientul de corelaţie liniară simplă poate lua valori cuprinse între –1 şi +1, adică
satisface inegalităţile: 1 r 1 . Semnul semnifică tipul de legătură: semnul minus indică
legătura inversă, semnul plus indică legătura directă.
Cu cît Coeficientul de corelaţie liniară simplă are valori mai apropiate de 1 sau –1, cu atît
corelaţia rectilinie dintre variabilele „x” şi „y” este mai puternică. Pe măsură ce coeficientul de
corelaţie se apropie de zero, scade şi intensitatea legăturii dintre cele două variabile. În cazul în
care r = 0, variabilele sunt independente sau necorelate liniar, iar pentru r = 1 rezultă dependenţă
funcţională între cele două variabile.
În practică se consideră că, dacă:
0 r 0,2 , nu există o legătură semnificativă;
0,2 r 0,5 , există o legătură slabă;
0,5 r 0,75 , există o legătură de intensitate medie;
0,75 r 0,95 , există o legătură puternică;
0,95 r 1 , putem vorbi de o legătură relativ deterministă (funcţională)
1
y Y i i
2
y y i
2
Raportul de corelaţie poate lua valori între 0 şi 1. Cu cît valoarea raportului este mai
apropiată de 1, cu atît legătura de corelaţie este mai puternică şi invers.
Notă: În cazul corelaţiei liniare, raportul de corelaţie este egal cu coeficientul de corelaţie
liniară simplă luat în valoare absolută şi poate fi considerată această relaţie, ca un test de
verificare a liniarităţii legăturii: r
R y , x1 , x2 ,..., x p 1
y Y i x1 , x2 ,..., x p
2
y y i
2
Coeficientul de corelaţie multiplă are întotdeauna valoare pozitivă şi este mai mare decît
oricare coeficient de corelaţie simplă dintre variabilelele factoriale şi cea rezultativă, luat în valoare
absolută.
Pătratul coeficientului de corelaţie multiplă este cunoscut în literatura de specialitate sub
denumirea de coeficient de determinaţie multiplă (R2). El exprimă ponderea cu care influenţează
concomitent caracteristicile factoriale, incluse în model, asupra caracteristicii rezultative. Evident,
ponderea cu care influenţează asupra caracteristicii rezultative ceilalţi factori, necuprinşi în model,
se obţine ca diferenţă între unitate şi R2. Se obţine astfel coeficientul de nedeterminaţie multiplă
(1-R2).
Rezultă relaţia: R2 + (1-R2) = 1
Chestionar de control
1. Ce înseamnă o legătură statistică
2. Care sunt tipurile de legături statistice între variabilele economice
3. Care sunt metode elementare de caracterizare a legăturilor dintre variabile
4. În ce constă metoda regresiei
5. Care sunt indicatorii sintetici ai corelaţiei
6. Caracterizarea coeficientului de corelaţie liniară simplă
7. Caracterizarea raportului de corelaţie
8. Caracterizarea coeficientului de corelaţie multiplă
6
Statistică teoretică şi economică
CAPITOLUL 5.
CERCETAREA SELECTIVĂ
Cuvinte cheie:
- cercetarea selectivă
- sondajul
- selecţia simplă repetată (urna cu bilă revenită).
- selecţia simplă nerepetată (urna cu bilă nerevenită),
- reprezentativitatea eşantionului
- eroare de reprezentativitate
- eroare medie de reprezentativitate
- eroarea limită admisă
colectivitate eşantion
generală
N (volumul) n (volumul)
x 0 (media) x (media)
σ2 (dispersia)
σ 02 (dispersia)
p2 = M/N (pt. car. w = m/n
alternativ) σ w2 (1 − w)
σ (1 − p)
2
p
5.1.Procedee de selecţie
Se recomandă alegerea procedeului de selecţie în funcţie de mărimea (N) a
colectivităţii generale şi în funcţie de omogenitatea sau eterogenitatea acesteia.
Dacă colectivitatea generală este omogenă putem folosi:
• procedeul loteriei
• procedeul tabelului cu numere întâmplătoare sau un program pe calculator de
generare de numere întâmplătoare;
• procedeul mecanic sau al pasului de numărare.
Dacă colectivitatea generală este eterogenă se recomandă folosirea selectţiei
dirijate pentru a asigura reprezentativitatea eşantionului (procedeul selecţiei stratificate,
selecţie tipică).
Dacă colectivitatea generală este alcătuită din unităţi complexe numite şi serii (de
ex. populaţia alcătuită pe familii, locurile de mărfuri grupate pe paleţi etc.) se recomandă
procedeul selecţiei de serie.
Procedeul loteriei.
Se aplică în cazul colectivităţii generale de volum mic, relativ omogenă.
Aplicablitatea constă în numerotarea de la 1 la N a tuturor elementelor din colectivitatea
generală (ceea ce uneori este incomod) confecţionând jetoane sau bile absolut de aceleaşi
dimensiuni, care se introduc într-o urnă şi se amestecă înainte de fiecare extragere.
Extragerea poate fi efectuată în două variante:
¾ selecţia simplă repetată (urna cu bilă revenită).
În acest caz, la fiecare extragere există o aplicabilitate de 1/N de a intra în
alcătuirea eşantionului. Folosind această variantă se pot forma foarte multe eşantioane
diferite având acelaşi volum, dar posibilitatea includerii a unui acelaşi element face ca
reprezentativitatea includerii a unui acelaşi element face ca reprezentativitatea
eşantionului să fie redusă.
¾ selecţia simplă nerepetată (urna cu bilă nerevenită), prin care probabilitatea
includerii în eşantion creşte, treptat pe măsura extragerii elementelor. La extragerea I,
probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii este de
1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/[N – (n+1)].
Aceste eşantioane se bucură de o mai mare reprezentativitate, iar numărul lor este
CnN (mult mai mic decât la selecţia repetată Nn).
Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere
întâmplătoare, fie un program de calculator care să genereze numere întâmplătoare.
Procedeul mecanic sau al pasului de numărare.
Acest procedeu este foarte operativ dar nu asigură o selecţie strict aleatoare, doar
primul element din eşantion se extrage la întâmplare, restul intrând în componenţa
eşantionului ca urmare a poziţiei ocupate.
Ştiind că există N elemente în colectivitatea generală şi că eşenationul trebuie să
fie de n elemente, se calculează k; k = N/n, adică pasul de numărare.
Din primele k elemente se extrage, la întâmplare, unul, acesta devenind primul
element al eşantionului. Numărul de ordine al celorlate elemente se află adunând succesiv
k.
Dacă elementele colectivităţii generale sunt eterogene, constatându-se o anumită
stratificare a colectivităţii generale se recomandă să fie folosită o selecţie dirijată
Statistică teoretică şi economică
(nealeatoare) pentru a asigura pătrunderea în eşantion a unor elemente din toate straturile
tipice. O asemenea selecţie dirijată este selecţia stratificată sau selecţia tipică: după
stabilirea volumului n al eşantionului se stabileşte componenţa pe straturi (număr de
elemente din fiecare strat), astfel încât structura eşantionului să corespundă structurii
colectivităţii generale. Pentru extragerea separată din fiecare strat a numărului
corespunzător de elemente, se utilizează unul din procedeele aleatoare de mai sus.
Selecţia de serii (sau de unităţi complexe) reprezintă un alt procedeu de selecţie.
Pentru colectivitatea organizată pe unităţi complexe (populaţia organizată pe familii) se
recomandă să nu distrugem aceste structuri pentru a extrage unităţi simple, ci să preferăm
extragerea de unităţi complexe sau extragerea de serii.
5.2.Reprezentativitatea eşantionului.
Reprezentativitatea eşantionului inseamna capacitatea acestuia de a reda
trăsăturile esenţiale ale colectivităţii generale din care s-a extras chiar dacă volumul
eşenationului este mult mai mic decât volumul colectivităţii din cade s-a extras.
Dintre metodele de exprimare a reprezentativităţii eşantionului cele mai frecvente
se referă la compararea structurii eşantionului cu structura colectivităţii generale sau la
compararea mediei eşantionului x cu media colectivităţii generale x 0, la una sau mai
multe caracteristici cunoscute, înregistrarea atât pe eşantion cât şi la colectivitatea
generală. De exemplu compararea mediei de vârstă a eşantionului cu media de vârstă a
întregii ţări.
Se întâmplă, în unele cazuri, să nu se cunoască nimic despre colectivitatea
generală. În acest caz când nu este posibilă compararea cu parametrii colectivităţii
generale, se recomandă extragerea a cel puţin două eşantioane diferite din aceeaşi
colectivitate generală şi compararea mediilor sau structurilor acestor eşantioane. Dacă ele
nu diferă semnificativ, atunci oricare dintre eşantioane poate fi folosit pentru a estima
parametrii colectivităţii generale.
µx =
∑ (x − x
i
2
0 ⋅ fi
∑f i
σ 02 = µ x2 ⋅ n
σ 02
ceea ce înseamnă că µ x = , adică eroarea medie de reprezentativitate este direct
n
proporţională cu dispersia colevtivităţii generale şi invers proporţională cu volumul
eşantionului.
Dacă nu se cunoaşte σ20 se acceptă că dispersia unicului eşantion cunoscut σ2
oferă o marjă satisfăcătoare a împrăştierii elementelor colectivităţii dacă eşantionul este
convenabil de mare. Totuşi se face o corecţie cu 1, adică:
σ2
µx = .
n −1
Dacă se foloseşte o variabilă alternativă, eroarea medie de reprezentativitate se
stabileşte potrivit aceloraşi relaţii, adică atunci când se cunoaşte dispersia colectivităţii
generale:
p (1 − p )
µw =
n
w(1 − w)
µw =
n −1
σ 02 n σ 02 n
µx = 1 − µx = 1 −
n −1 N n N
Statistică teoretică şi economică
∆x = z ⋅ µx
∆w = z ⋅ µw
Există tabele ale repartiţiei normale care ne arată relaţia dintre coeficientul de
multiplicare z sau t sau probabilitatea φ (z) sau φ (t) corespunzătoare.
Eroarea limită arată diferenţa maximă în plus sau în minus care poate surveni la o
anumită probabilitate φ (z), z fiind utilizat în calculul erorii limită.
Necunoscând parametrii colectivităţii generale, rezultă că pentru o variabilă
( )
numerică x 0 ∈ x ± ± ∆ x , iar pentru o variabilă alternativă avem p ∈ (w ± ∆ w ) cu
probabilitatea corespunzătoare.
φ (z) = funcţia de probabilitate cu care se generează rezultatele
z = coeficientul funcţiei de probabilitate.
Eroarea limită se poate mări sau micşora fie prin modificarea volumului
eşantionului (n), fie prin modificarea probabilităţii cu care se garantează rezultatele,
deoarece dispersia colectivităţii totale rămâne aceeaşi.
După modul în care se combină sistemul de organizare, felul unităţilor de selecţie
şi procedeul de selecţie folosit, în cercetarea activităţii economice şi sociale, se disting
următoarele tipuri de selecţie:
- selecţie întâmplătoare simplă;
- selecţie mecanică;
- selecţie tipică (stratificată);
- selecţia de serii.
Pentru fiecare tip de selecţie se calculează trei indicatori: eroarea de medie de
reprezentativitate, eroarea limită şi volumul eşantionului.
Selecţia întâmplătoare simplă este utilizată în special pentru colectivităţi formate
dintr-un număr de unităţi simple şi care se caracterizează printr-un anumit grad de
omogenitate. Erorile de reprezentativitate sunt mari în raport cu alte tipuri de selecţie,
Statistică teoretică şi economică
deoarece dispersia folosită măsoară variaţia totală a caracteristicii datorată cauzelor care
influenţează.
Deoarece, în practică, se lucrează cu o eroare limitată, calculul volumului
eşantionului (n) se face flosind formula erorii limită.
- selecţia întâmplătoare simplă repetată:
σ 02
∆x = z ⋅ µx = z ⋅
n
σ 2
z ⋅ σ 02 z 2 ⋅ σ i2
2
∆ =z ⋅
2
x
2 0
⇒ n= ≈
n ∆2x ∆2x
σ 02 n z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x = z ⋅ µx = z ⋅ 1 − ⇒ n = ≈
n N z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x +
2
∆2x +
N N
x − ∆ x < x0 < x + ∆ x
n
salariaţilor direct operativi ⋅ 100 = 2,5% s-a făcut prin luarea în considerare a
N
vârstei, precum şi a structurii socio-profesionale a întregului personal operativ.
În cadrul programului de observare selectivă, între alte caracteristici urmărite, se
înregistrează vârsta salariaţilor (exprimată în ani de viaţă împliniţi), precum şi interesul
(disponibilitatea) acestora de a participa la un program de formare profesională continuă.
În tabelul de mai jos se prezintă rezultatul grupării în funcţie de vârstă a celor 100
de persoane din eşantionul extras aleator şi nerepetat.
Repartiţia personalului cuprins în eşantion în funcţie de vârstă
Grupe de vârstă Număr personal
(ani împliniţi)
Sub 25*) 17
25 – 35 30
35 – 45 25
45 – 55 18
peste 55 10
Total 100
*)
Limita superioară nu este cuprinsă în interval.
x=
∑ xi ni = 3740 = 37,4 ani,
∑ ni 100
iar dispersia în jurul mediei eşantionului este:
∑ (x − x ) n
2
14924
σ
i i
2
= = = 149,24 .
∑n i 100
Observaţii:
1) Eşantionul este destul de omogen (v = 32,7%) pentru a putea considera că media
de 37,4 ani caracterizează corect vârsta tuturor celor 100 de persoane înregistrate.
2) Dacă media nu este reprezentativă la nivelul eşantionului (v>>35%), nu are sens să
se mai continue cercetarea printr-o eventuală tentativă de extindere a acestui indicator
(deja nereprezentativ la nivel restrâns) asupra colectivităţii generale.
∆x = z ⋅ µx [5.7]
∆w = z ⋅ µw [5.8]
Există tabele ale repartiţiei normale care exprimă relaţia dintre argumentul z sau t şi
funcţia de probabilitatea φ(z) sau φ(t) corespunzătoare.
În exemplul considerat, eroarea limită pentru o probabilitate Φ(z) = 0,95 (z = 1,96)
este:
y pentru caracteristica numerică, de aproximativ 2,4 ani:
∆ x = z ⋅ µ x = 1,96 ⋅ 1,21 = 2,37 ani ≅ 2,4 ani,
Statistică teoretică şi economică
Observaţii:
1. Un tabel cu valorile funcţiei Gauss – Laplace corespunzând diferitelor valori ale lui z
se găseşte în volumul Bazele statisticii pentru economişti. Aplicaţii. Bucureşti, Editura
Tribuna Economică, 2002, p. 259-260.
2. Dacă s-ar fi folosit extragerea mecanică, sau extragerea repetată, eroarea limită era
ceva mai mare: ∆x = 2,41 ani (faţă de 2,37 ani); ∆w = 7,6% (faţă de 7,4%).
Coeficientul de corecţie aplicat în cazul sondajului nerepetat este întotdeauna o
mărime subunitară care restrânge mărimea erorii medii de reprezentativitate şi,
respectiv, a erorii limită, oferind o estimare mai exactă a parametrilor colectivităţii
generale.
3. Nu este obligatoriu ca probabilitatea cu care se estimează diverşi parametrii ai
colectivităţii generale să fie aceeaşi la toate variabilele cerectate.
Statistică teoretică şi economică
Probleme şi aplicaţii.
5.1. Un echipament de ambalare este astfel reglat încât să împacheteze câte 20 de
bomboane cu o toleranţă de ±1 bucată.
Pentru a aprecia calitatea reglajului, din producţia unei zile s-a prelevat prin
extragere mecanică un eşantion de 150 pachete care conţineau în total 3015
bomboane în loc de 3000 bomboane. Din cercetarea eşantionului rezultă că în jurul
mediei de 20,1 bomboane/pachet, intensitatea împrăştierii era de 7,2%, în condiţiile
în care 129 pachete conţineau exact 20 bomboane, 12 pachete aveau 21 sau mai
multe bomboane, iar 9 pachete erau cu 19 sau mai puţine bomboane.
Se cere:
Să se estimeze cu o probabilitate Φ(z) = 0,9973 (z = 3) numărul total de
bomboane ambalate în lotul de N = 3000 pachete realizate în cursul zilei şi să se observe
dacă echipamentul se încadrează în toleranţa admisă.
Rezolvare:
Din enunţul problemei rezultă că eşantionul se caracterizează prin:
• Volumul n = 150 pachete;
• Media x = 20,1 bomboane/pachet;
• Abaterea standard σ = 1,4472 bomboane/pachet (din relaţia coeficientului de
σ
variaţie v = ⋅ 100 = 7,2% )
x
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, ştiind
că în cazul extragerii mecanice se aplică relaţia de la sondajul simplu, aleator, repetat:
σ2 2,0944
µx = = = 0,118 bucati
n 150
Întrucât intervalul de estimare (59.250, 61.350) este mult mai mic decât toleranţa
admisă (57.000, 63.000), rezultă că reglajul este corespunzător.
Răspuns: Numărul total de bomboane ambalate este situat, cu Φ(z) = 0,9973 între
59.250 şi 61.350 bucăţi. Echipamentul se încadrează în tolerenţa admisă.
Cât de mare ar trebui să fie un eşantion, dacă numărul mediu de bomboane/pachet
ar trebui estimat cu Φ(z) = 0,9545 (z = 2) în limitele unui interval de ±0,5 bucăţi?
Rezolvare:
z 2 ⋅ σ 2 4 ⋅ 2,0944
n= = = 33,5104 ≅ 34 pachete .
∆2x 0,52
m 21
w= = = 0,14 , ceea ce înseamnă că 14% din eşantion nu corespunde
n 150
standardului de ambalare.
σ w2 0,1204
µw = = = 0,0283 sau 2,83%
n 150
5.2. Dintr-o comandă de 1000 piese, se prelevă un eşantion de 65 piese prin extragere
aleatoare, simplă, nerepetată. Potrivit comenzii, fiecare piesă ar trebui să cântărească
85 grame. După examinarea eşantionului, se constată că greutatea medie a pieselor
este de 87,2g, dispersia eşantionului fiind de 70,6746, abaterea standard de 8,4g,
coeficientul de variaţie 9,6%. Între piesele eşantionului se află 26 piese cu greutatea
mai mare decât cea prevăzută de comandă.
Se cere:
Estimarea cu Φ(z) = 0,9545 (z = 2) limitele intervalului în care se înscrie
greutatea medie a celor 1000 piese din lot.
Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului aleator, simplu, nerepetat,
se estimează astfel:
σ2 n 70,6746 65
µx = 1 − = 1 − = 1,0083 g
n N 65 1000
Statistică teoretică şi economică
Eroarea limită:
σ w2 n
µw = 1 − , unde σ w = w(1 − w) = 0,4 ⋅ 0,6 = 0,24
2
n N
Răspuns:
z 2 ⋅ σ w2 4 ⋅ 0,24
n= = = 974,62 ≅ 975 piese
z ⋅ σ w 0,05 + 0,00096
2 2 2
∆w +
2
Vânzări
medii (mil lei)
Până la 3 3 --- --- 2 5
3–5 5 3 12 8 28
5–7 2 5 12 10 29
7 şi peste --- 12 6 --- 18
Total 10 20 30 20 80
Se cere:
Să se caracterizeze acest eşantion.
Rezolvare:
Vânzarea medie săptămânală realizată de cele 80 persoane este x = 5,5 mil lei.
Amplitudinea variaţiei este de 6 mil lei, adică 109,09% faţă de medie. Acest indicator
permite aprecierea că cele 80 de elemente ale eşantionului prezintă o împrăştiere relativ
mare (peste 100%).
Dispersia eşantionului: σ 2 = 3,05 .
Abaterea standard: σ = 1,7464 mil lei.
Coeficientul de variaţie: v = 31,75%.
În pofida întinderii relativ mari a împrăştierii, colectivitatea este destul de
omogenă (intensitatea împrăştierii este sub 35%).
Analiza variaţiei vânzărilor medii săptămânale în cadrul celor 4 grupe constituite
după felul mărfurilor comercializate şi elementele de calcul pentru verificarea regulii de
adunare a dispersiilor sunt prezentate în tabelul 53.2. Pe baza acestei identităţi se
stabileşte în ce măsură influenţează felul mărfurilor variaţiei volumului vânzărilor
săptămânale.
Raionul j nj xj σ 2j xj − x ( x j − x)2 ⋅ n j σ 2j ⋅ n j
Anticariat 1 10 3,8 1,96 -1,7 28,9 19,6
Jucării 2 20 6,9 2,19 +1,4 39,2 43,8
Librărie 3 30 5,6 2,24 +0,1 0,3 67,2
Papetărie 4 20 4,8 1,76 -0,7 9,8 35,2
Total --- 80 --- --- --- 78,2 165,8
Σσ 2 ⋅ n j 165,8
Dispersia reziduală: σ = 2
= = 2,0725
Σn j 80
Statistică teoretică şi economică
δ2 0,9775
D= ⋅ 100 = ⋅ 100 = 32%
σ 2
3,05
σ2 n 2,0725 80
µx = 1 − = 1 − = 0,15 mil lei
n N 80 760
Eroarea limită:
z2 ⋅σ 2 4 ⋅ 2,0725
n= = = 31,74 ≅ 32 persoane
z ⋅σ
2 2
8,28
∆2 + 0,5 +
2
N 760
N j ⋅ σ 2j
nj = n⋅
ΣN j ⋅ σ 2j
Mai sus s-au arătat valorile Nj, iar în tabelul 53.2, coloana a cincea, se află σ 2j . Cu
aceste date, pentru aflarea numărului de persoane care urmează să intre în alcătuirea
eşantionului din rândul celor care se ocupă de anticariat este:
72 ⋅ 1,96
n1 = 32 ⋅ = 2,88 ≅ 3 persoane.
1568,6
Statistică teoretică şi economică
Se cere:
1. să se reprezinte grafic repartiţia;
2. se consideră că cele 100 de persoane constituie un eşantion extras aleator, simplu,
nerepetat dintr-o colectivitate generală de 1000 persoane; să se determine intervalele de
vârstă între care se situează vârsta medie a celor 1000 persoane considerându-se
Φ( z ) = 0,9545; z = 2.
5.7. În tabelul următor sunt prezentaţi numărul de enoriaşi ai unei biserici ortodoxe
pe grupe de vârstă:
Se cere:
1. dacă se efectuează o selecţie stratificată de volum n=100, să se determine numărul de
enoriaşi care trebuie să facă parte din fiecare strat;
2. aceeaşi cerinţă în cazul în care se cunosc abaterile standard ale celor trei straturi:
σ 1 = 1,2; σ 2 = 4,8; σ 3 = 2,3.
Statistică teoretică şi economică
5.8. Care este valoarea erorii standard a mediei unui eşantion de volum n=100,
selectat simplu, aleator repetat, dacă dispersia este egală cu 25?
CAPITOLUL 3
Consideraţii preliminare
Cel mai adesea, urmărim să caracterizăm prin indicatori statistici —
măsuri cantitative — datele statistice pe care le avem la dispoziţie. Scopul
capitolului următor este să prezinte indicatorii statistici, primari şi derivaţi,
simpli şi sintetici, ce se folosesc în mod frecvent pentru caracterizarea
statistică a seriilor statistice.
Vom putea, astfel, să analizăm tendinţa centrală, dar şi variabilitatea
datelor, forma distribuţiilor şi concentrarea datelor.
Să notăm şi faptul că, datorită particularităţilor lor, indicatorii
statistici ai seriilor cronologice vor fi trataţi într-un capitol distinct.
Termeni cheie
abatere individuală indicator
abatere intercuartilică indicatori de poziţie
abatere medie liniară indicatori derivaţi
abatere medie pătratică indicatori primari
abatere semiintercuartilică mărime medie
amplitudine mărimi relative
aplatizare. mediană
asimetrie medie aritmetică
boltire medie armonică
coeficient de determinaţie medie geometrică
coeficient de variaţie medie pătratică
cuantile mod
cuartile percentile
decile regula de adunare a dispersiilor
diagramă Box- Plot variabilitate
dispersie
STATISTICĂ ECONOMICĂ
Noţiuni teoretice
3.1. INTRODUCERE
5 6 7 8
X =6,6 ani
Fig. 3.1. Balansarea valorilor individuale prin calculul mediei
STATISTICĂ ECONOMICĂ
0 5 10 15 20
X =6,6 ani
Fig. 3.2. Balansarea valorilor individuale prin calculul mediei
r
¦ xini
i =1 11490
x= r
= = 57,45 minute
200
¦ ni
i =1
EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75,
h=30 şi atunci:
STATISTICĂ ECONOMICĂ
Tabelul 3.2
Timp (min.) Frecvenţe ni xi xi – a x i’ ⋅ n i
x i’ =
h
< 30 47 15 -2 - 94
30-60 51 45 -1 - 51
60-90 76 60 0 0
90-120 24 105 1 24
120 şi peste 2 135 2 4
Total 200 – – -117
r
’
¦ xini
i =1 − 117
x= r
⋅h +a = ⋅ 30 + 75 = 57,45 minute
200
¦ ni
i =1
© i =1 ¹
ni ni
frecvenţele sunt chiar frecvenţele relative n *i = , i = 1, r şi rezultă,
c n
deci:
r
*
¦ xi ⋅ ni
i =1
x= (3.5)
1
sau, dacă frecvenţele relative au fost exprimate în procente:
r
*%
¦ xi ⋅ ni
i =1
x= (3.6)
100
xy = x ⋅ y (3.9)
2
¦ xini
i =1 1 ⋅ m + 0(n − m ) m
x= = = =f (3.10)
n n n
Modul (M0) reprezintă valoarea cel mai des întâlnită într-o serie
statistică sau cea care are cea mai mare frecvenţă de apariţie.
În cazul seriilor de distribuţie de frecvenţe pe intervale de variaţie,
determinarea modului presupune mai întâi, identificarea intervalului cu frec-
venţă maximă (int M0). Apoi, modul se poate determina conform relaţiei:
§ d1 ·
M 0 = x inf M 0 + ¨¨ ¸¸ h M 0 (3.11)
© d1 + d 2 ¹
unde: xinfMo reprezintă limita inferioară a intervalului modal;
h M0 reprezintă mărimea intervalului modal;
d1 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
precedent;
d2 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
următor.
EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modală este:
M 0 = 60 +
(76 − 51) ⋅ 30 = 69,74 minute
(76 − 51) + (76 − 24)
O distribuţie cu un singur mod se numeşte unimodală (fig. 3.3a),
o distribuţie este bimodală dacă are două valori dominante (moduri) (fig.
3.3b) şi multimodală dacă are mai mult de două moduri (fig. 3.3c).
CAPITOLUL 3
y y y
Frecvenþe
Frecvenþe
Frecvenþe
M0 x o M01 M02 x o M01 M02 M03 x
o
a) b) c)
3.3.3.2 Mediana
Mediana (Me) este un indicator mediu de poziţie care face parte din
categoria cuantilelor. Ea reprezintă valoarea/varianta din mijlocul unei serii
de date, serie în care observaţiile au fost ordonate crescător (sau descrescă-
tor).
Dacă datele au fost sistematizate într-o serie de distribuţie de frec-
venţe pe variante, pentru determinarea medianei vom calcula, mai întâi,
frecvenţele cumulate (Fci). Prima frecvenţă cumulată mai mare decât
(n+1)/2, adică mai mare decât locul medianei, ne indică varianta mediană.
interval cu frecvenţa cumulată mai mare decât locul (rangul, poziţia) media-
nei.
1§ r ·
¨ ¦ n i + 1¸ − FC( Me−1)
2 © i=1 ¹
Me = x inf Me + h Me (3.12)
n Me
unde:
x inf Me reprezintă limita inferioară a intervalului median;
h Me reprezintă mărimea intervalului median;
1§ r · n +1
¨ ¦ n i + 1¸ = reprezintă locul medianei în serie;
2 © i =1 ¹ 2
FC(Me - 1) reprezintă frecvenţa cumulată a intervalului anterior celui
median;
nMe reprezintă frecvenţa absolută a intervalului median.
(
M 0 − x ≈ 3 Me − x ) (3.13)
CAPITOLUL 3
y y y
o x=Me=Mo x o Mo Me x x o x Me Mo x
3.3.3.4. Cuantilele
y Astfel,
cuartilele (cuantile
Frecvenþe relative
( )
Media armonică x h este o medie de calcul cu aplicaţii speciale,
care se determină, pentru o serie de date cantitative, ca valoarea inversă a
STATISTICĂ ECONOMICĂ
¦ vi ¦ vi 450000 + 480000
p= = = = 103333,3 lei/litru
¦ qi ¦ v1 1 1
i ⋅ 450000 + ⋅ 480000
pi 90000 120000
r
2
¦ xi ni
i =1
xp = r
(3.19)
¦ ni
i =1
r
2 *
¦ xi ni
i =1
xp = (3.20)
1
r
2 *%
¦ xi ni
i =1
xp = (3.21)
100
( )
Media geometrică x g se calculează ca rădăcina de ordinul n din
produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care
înlocuind termenii seriei nu modifică produsul lor:
n
xg = n ∏ xi (3.22)
i =1
Pentru o serie de distribuţie de frecvenţe, media geometrică se
calculează ca:
r
¦ ni r
x g = i =1 ∏ x in i (3.23)
i =1
y y y
o a) x o x o x
b) c)
Fig. 3.6 - a) Distribuţii cu tendinţă centrală diferită; b) Distribuţii cu variabilitate
diferită; c) Distribuţii cu tendinţă centrală şi variabilitate diferite
x max − x min
A%
x = 100 (3.26)
x
A Q = Q 3 − Q1 (3.27)
CAPITOLUL 3
Q 3 − Q1
A ’Q = (3.28)
2
di = xi − x (3.29)
xi − x
d i% = (3.30)
x
3.4.2.2. Dispersia
( )
Dispersia s 2x se calculează ca media aritmetică a pătratelor
abaterilor individuale ale valorilor de la tendinţa centrală (uzual de la
medie). Pentru o serie simplă, formula dispersiei este:
CAPITOLUL 3
∑ (x i − x )
n 2
i =1
s 2x = (3.36)
n
iar pentru o serie de distribuţie de frecvenţe:
¦ (x i − x ) n i
r 2
i =1
s 2x = (3.37)
r
¦ ni
i =1
sau, pe baza frecvenţelor relative:
∑ (x i − x ) n *i%
r 2
i=1
s 2x = (3.38)
100
¦ (x i − x ) n i
r 2
i =1 182299,5
s 2x = = = 911,4975
r 200
¦ ni
i =1
Se cuvine să facem şi asupra dispersiei câteva observaţii şi să
remarcăm câteva din proprietăţile sale:
a) Pentru un şir de valori constante, dispersia este nulă;
( )
b) Dispersia calculată faţă de medie s 2x este mai mică decât orice
altă dispersie calculată faţă de o valoare “a”, cu pătratul distanţei dintre
medie şi constanta a:
s 2x = s a2 − (x − a )
2
(3.39)
c) Dacă valorile variabilei statistice studiate sunt modificate
(micşorate sau mărite) cu constanta „a“, dispersia seriei rămâne
neschimbată;
STATISTICĂ ECONOMICĂ
2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 = 200
271
⋅ 30 2 − (57,45 − 75)2 = 911,4975
¦ ni
i =1
e) Dispersia se poate calcula şi pe baza relaţiei:
CAPITOLUL 3
2
n n n
∑ x i2 ∑ x i2 ∑ xi
i =1 2 i =1
s 2x = −x = − i=1 (3.43)
n n n
iar pentru o serie de distribuţie de frecvenţe:
2
r r § r ·
¦ x i2 n i ¦ x i2 n i ¨ ¦ xini ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.44)
r r r
¦ ni ¦ ni ¨ ¦ ni ¸
¨ ¸
i =1 i =1 © i=1 ¹
2
r r § r ·
¦ x i2 n *i% ¦ x i2 n *i% ¨ ¦ x i n *i% ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.45)
100 100 100
¨ ¸
¨ ¸
© ¹
f) Dacă o serie este compusă din m serii componente (grupuri),
fiecare serie componentă fiind de volum nj, j = 1, m , atunci se pot calcula
mediile seriilor componente, x j , j = 1, m şi dispersiile seriilor componente:
¦ (x i − x j )
nj
2
i =1
s 2x = , j = 1, m (3.46)
j nj
Dispersia generală a colectivităţii poate să fie scrisă în funcţie de dis-
persiile seriilor componente (grupurilor):
¦ (x j − x ) n j
m m 2
¦ s 2x j n j
j=1 j=1
s 2x = + (3.47)
m m
¦n j ¦nj
j=1 j=1
m
¦ s 2x j n j
j=1
Expresia: m
se numeşte media dispersiilor parţiale
¦nj
j=1
m
¦ s 2x j n j
2 j=1
sx =
m
(3.48)
¦nj
j=1
¦ (x j − x ) n j
m 2
j=1
Expresia: m
sintetizează împrăştierea valorilor de la
¦nj
j=1
media generală, doar ca urmare a acţiunii factorului după care s-au alcătuit
grupurile, seriile componente. Această expresie se numeşte dispersia dintre
( )
grupe d 2x :
¦ (x j − x ) n j
m 2
j=1
d 2x = (3.49)
m
¦n j
j=1
( )
Putem spune că d 2x explică măsura în care factorul de grupare
determină variaţia variabilei studiate şi să calculăm coeficientul de
determinaţie:
d 2x
R2 = (3.51)
s 2x
d 2x =
(x L − x )2 n L + (x M − x )2 n M = (400 − 320)2 30 + (200 − 320)2 20 =
nL + nM 50
480000
= = 9600
50
2
s 2x = s x + d 2x = 2140 + 9600 = 11740
Aşadar
2 d 2x 9600
R% = 100 = 100 = 81,77%
s 2x 11740
s f2 = f (1 − f ) (3.55)
¦ (x i − x )
n 2
s x = s 2x = i =1 (3.56)
n
pentru o serie simplă, iar pentru o serie de distribuţie de frecvenţe:
¦ (x i − x ) n i
r 2
i =1
sx =
r
(3.57)
¦ ni
i =1
¦ (x i − x ) n *i%
r 2
sx = i =1 (3.58)
100
4
dx ≈ sx (3.59)
5
s
v = x 100 (3.61)
x
Cu cât valoarea coeficientului de variaţie este mai mică, cu atât acest
lucru semnifică o omogenitate crescută a datelor.
≈34%
≈13,5%
≈13,5%
o ≈2,5% ≈2,5%
x-3σ x-2σ x-σ x x+σ x+2σ x+3σ x
Amplitudine
AS = x − M 0 (3.62)
sau
(
A S1 = 3 x − Me ) (3.63)
x − M0
C as = (3.64)
sx
C as1 =
(
3 x − Me ) (3.65)
sx
C as1 =
( =
)
3 x − Me 57,45 − 61
= −0,118
sx 30,19
ceea ce semnifică o asimetrie negativă moderată (coada mai lungă a distri-
buţiei înspre valorile mici).
¦ (x i − x )
n 3
m 3 = i =1 (3.66)
n
sau, utilizând frecvenţe:
¦ (x i − x ) n i ¦ (x i − x ) n *i%
r 3 r 3
m 3 = i =1 = i =1 (3.67)
r 100
¦ ni
i =1
Coeficientul de asimetrie (Fisher) este:
m3 m 32
γ1 = = (3.68)
s 3x m 32
Coeficientul γ 1 va avea valoare mai mare decât zero în cazul
asimetriei pozitive, valoare mai mică decât zero în cazul asimetriei negative
şi va fi egal cu zero în cazul seriei perfect simetrice.
ASQ=Q3+Q1-2Me (3.69)
X m in Q1 Me Q3 X m ax
25% 25% 25% 25%
x k
z= 10 (3.71)
y
unde: z reprezintă indicatorul relativ;
x reprezintă indicatorul comparat;
y reprezintă indicatorul bază de comparaţie;
CAPITOLUL 3
xi
g ix % = n
100 (3.73)
¦ xi
i =1
ni
¦ x ij
j=1
g ix = (3.74)
r ni
¦ ¦ x ij
i =1 j=1
ni
¦ x ij
j=1
g ix % = 100 (3.75)
r ni
¦ ¦ x ij
i =1 j=1
STATISTICĂ ECONOMICĂ
EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules şi
sistematizat date privind producţia zilnică realizată de muncitori (Tabelul
3.8)
Tabelul 3.8
Judeţul/Filiala Număr de muncitori Producţia individuală (buc.)
0 1 2
Alba/A 4 120;130;120;90
Bacău/B 3 80;120;100;
Constanţa/C 6 140;70;90;100;110;120
Tabelul 3.9
Filiala Producţia pe Structura producţiei pe Structura
filială (buc.) filiale (%) colectivităţii de
muncitori (%)
0 1 2 3
Rezultatul ne arată de câte ori este mai mare (dacă rezultatul este
supraunitar), sau mai mic (dacă rezultatul este subunitar) nivelul variabilei
în unitatea (grupa, colectivitatea) i faţă de nivelul variabilei în unitatea
(grupa, colectivitatea) j.
A 1,33 1,53
B 1,00 1,00
C 2,00 2,10
Pe baza datelor din Tabelul 3.8, col.1 şi Tabelul 3.9, col.1, putem
calcula producţia obţinută de un muncitor (bucăţi pe muncitor) (Tabelul
3.11):
Tabelul 3.11
Filiala Productivitatea muncii (buc./muncitor)
0 1
A 115
B 100
C 105
Total 106,92
STATISTICĂ ECONOMICĂ
x pi
i px 0i = (3.83)
x 0i
CAPITOLUL 3
x pi
i px %0i = 100 (3.84)
x 0i
x 1i
i 1x pi = (3.85)
x pi
x 1i
i 1x %pi = 100 (3.86)
x pi
Se observa ca:
x pi x 1i x 1i
i px %0i ⋅ i 1x %
pi = ⋅ = = i 1x 0i (3.87)
x 0i x pi x 0i
Întrebări recapitulative
CAPITOLUL 2
SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE
Consideraţii preliminare
În acest capitol, vom lua în consideraţie primul pas în prelucrarea
datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o
manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea,
astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale
fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare.
Termeni cheie
Noţiuni teoretice
2.1. INTRODUCERE
date: unul priveşte variabila şi modul cum a fost sistematizată, iar al doilea
frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir.
Tabelul 2.1.
Distribuţie de frecvenţe pe intervale de variaţie
Intervale de variaţie a variabilei (X) Numărul de unităţi statistice (frecvenţe)
x1inf – x1sup n1
x2inf – x2sup n2
. .
xinf – xisup ni
. .
. .
xrinf – xrsup nr
r
Total n = ∑ ni
i =1
OBSERVAŢII:
• dacă intervalele sunt cu variaţie discontinuă, atunci:
x(i+1)inf = xisup + ∆ (2.4)
unde ∆ este o unitate de discretizare
• dacă intervalele sunt cu variaţie continuă, adică:
x(i+1)inf = xisup (2.5)
atunci trebuie stabilit în ce interval se cuprinde valoarea de graniţă;
• mărimea intervalului de grupare se calculează:
hi = xisup – xiinf , i = i,r (2.6)
dacă intervalele sunt cu variaţie continuă, sau:
hi = x(i+1)inf – xi inf, i = i,r (2.7)
sau
hi = xisup – x(i–1)sup, i = 2,r (2.8)
indiferent dacă intervalele sunt cu variaţie continuă sau discontinuă.
STATISTICĂ ECONOMICĂ
Tabelul 2.2.
Serie de distribuţie de frecvenţe relative
Intervale de variaţie a variabilei Frecvenţe relative
X1inf – x1sup n 1*
x2inf – x2sup
. n *2
. .
. .
xi inf – xi sup n *i
.
.
.
.
xrinf – xrsup *
nr
r
Total 1,00 = ∑ n *i
i =1
CAPITOLUL 2
Tabelul 2.3.
Distribuţia salariaţilor după salariul net
Număr de Frecvenţe Frecvenţe
Salariul net Frecvenţe
salariaţi absolute relative
(mii lei) relative n *i cumulate (Fci)
(ni) cumulate ( Fci* )
1,4 – 1,6 5 0,10 5 0,10
1,6 – 1,8 8 0,16 13 0,26
1,8 – 2,0 4 0,08 17 0,34
2,0 – 2,2 17 0,34 34 0,68
2,2 – 2,4 8 0,16 42 0,84
2,4 – 2,6 3 0,06 45 0,90
2,6 – 2,8 2 0,04 47 0,94
2,8 – 3,0 2 0,04 49 0,98
3,0 – 3,2 1 0,02 50 1,00
Total 50 1,00 — —
hi
l= (2.16)
h et
ni
n icor = (2.17)
l
unde hi reprezintă mărimea intervalului i, i = 1, r
het reprezintă mărimea intervalului etalon (de regulă mărimea celui
mai mic interval de grupare).
Tabelul 2.4.
Distribuţia divorţurilor după numărul de copii minori
rămaşi prin desfacerea căsătoriei, în România, anul 2000
Număr de Număr de Frecvenţe Frecvenţe Frecvenţe
copii minori divorţuri *
relative ( n i ) absolute relative
(ni) cumulate cumulate
(Fci) ( Fci* )
0 1 2 3 4
0 18.614 0,465 18.614 0,465
1 14.518 0,363 33.132 0,828
2 5.351 0,134 38.483 0,962
3 1.062 0,027 39.545 0,989
4 317 0,008 39.862 0,997
5 şi peste 5 123 0,003 39.985 1,000
Total 39.985 1,000 — —
Tabelul 2.5
Distribuţia contractelor de asigurare pe viaţă în România, anul 1999, pe
principalele companii
Procent din numărul total de
Compania
contracte încheiate (%)
Nederlanden 45,70
ASIROM S.A. 27,41
SARA MERKUR 12,16
UNITA 8,30
AIG Life 1,93
Garanta 1,35
Omniasig 0,96
METROPOL S.A. 0,92
Interamerican 0,57
ARDAF 0,25
Altele 0,45
Total 100,0
Tabelul 2.6
Distribuţia de frecvenţe bidimensională
Intervale/variante
pentru Y
y1 y2 ... yj ... ym Total
Intervale/
Variante pentru X
x1 n11 n12 ... n1j ... n1m n1.
x2 n21 n22 ... n2j ... n2m n2.
. ................... ...
.
xi ni1 ni2 ... nij ... nim ni.
. .................... ...
.
xr nr1 nr2 ... nrj .... nrm nr.
Total n.1 n.2 .... n.j ... n.m n..
Tabelul 2.7
Tabel de asociere
Clasele lui X Clasele lui Y Total
Y(y1) non Y(y2)
X(x1) n11 n12 n1. = n11 + n12
non X(x2) n21 n22 n2. = n21 + n22
Total n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22
alcătuită din două şiruri de date: unul cu privire la unităţile de timp, care pot
fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvenţa
de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp.
Dacă unităţile de timp sunt momente, atunci seria cronologică se numeşte
de stoc (de momente), iar dacă unităţile de timp sunt intervale (perioade),
seria cronologică se numeşte de flux (de intervale). O serie cronologică se
notează:
1 2 ... t ... n t
sau , t = 1, n.
y1 y 2 ... y t ... y n y t
EXEMPLUL 2.4. Evoluţia vânzărilor cotidianului naţional Libertatea
pentru perioada ianuarie 2001 – februarie 2002 (Tabelul 2.8).
Tabelul 2.8
Evoluţia vânzărilor cotidianului naţional Libertatea
Vânzările
Anul
(mii exemplare)
ianuarie 2001 104,0
februarie 2001 103,8
martie 2001 104,5
aprilie 2001 99,2
mai 2001 124,0
iunie 2001 127,8
iulie 2001 108,7
august 2001 110,0
septembrie 2001 116,7
octombrie 2001 123,8
noiembrie 2001 148,0
decembrie 2001 133,0
ianuarie 2002 139,0
februarie 2001 143,0
yi M
M
r
α
o xi x o x
a) b)
1
D. Haşigan, I. Marinescu - Grafice şi elemente de calcul grafic, Ed. Ştiinţifică, Bucu-
reşti, 1968.
STATISTICĂ ECONOMICĂ
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)
25
20
15
10 Scara de reprezentare
5 Ox: 0,8 cm = 0,2 mil. lei
0 Oy: 0,5 cm = 2 persoane
≈
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)
CAPITOLUL 2
y
40
35
30
Frecvenþe
25
20
15
10 Scara de reprezentare
5
Ox: 0,8 cm = 0,2 mil. lei
0
≈
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x Oy: 0,5 cm = 2 persoane
Salariul (mil. lei)
y
Frecvenþe relative (%)
40
35
30
25
20
15
10
5 Scara de reprezentare
0 Ox: 0,8 cm = 0,2 mil. lei
≈
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Oy: 0,6 cm = 2 persoane
Salariul (mil. lei)
14
12
10
Frecvente
0
10 20 30 40 50 60 70 80 90
Intervale
35
30
25
Frecvente
20
15
10
0
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46
Intervale
y y y
o x o x o x
y y y
o x o x o x
d) distribuţie în formă de J e) distribuţie în formă de J f) distribuţie în formă de U
Tabelul 2.10
Distribuţia elevilor după nota obţinută la o lucrare de control
Nota (xi) Număr de elevi (ni)
2 1
3 2
4 2
5 6
6 7
8 15
9 5
10 2
Total 40
16
14
12
10
Frecvente
8
6
2
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Nota
60
50
Frecvente cumulate
40
30
20
10
≈
0
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2
Salariu (mil. lei)
EXEMPLUL 2.11: Pe baza datelor din tabelul 2.3 col. 4, se poate con-
strui curba frecvenţelor relative cumulate crescător. (fig. 2.10).
STATISTICĂ ECONOMICĂ
1,2
1
Frecvente relative cumulate
0,8
0,6
0,4
0,2
0
1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2
Salariu (m il. lei)
Tabelul 2.11
Distribuţia de frecvenţe cumulate a elevilor după nota obţinută la o lucrare de
control
Nota (xi) Frecvenţe absolute cumulate
crescător (Fci)
2 1
3 3
4 5
5 11
6 18
8 33
9 38
10 40
35
30
25
20
15
10
o 1 2 3 4 5 6 7 8 9 10 x (nota)
50
45.7
45
Frecvenţe relative (%)
40
35
30 27.41
25
20
15 12.16
10 8.3
fe
ta
le
A
ig
AF
A
po
am
de
IT
te
as
O
Li
an
ro
D
SA
N
IR
Al
n
er
ni
G
ar
AR
et
la
t
AS
m
AI
In
er
M
O
ed
N
Compania
Nederl. 45.7
ASIROM 27.41
SARA 12.16
UNITA 2.3
Companie
0 10 20 30 40 50
Frecvenţe relative (%)
Altele
ARDAF
Interam.
Metropol
Omniasig
Garanta
AIG Lif e
UNITA
SARA
ASIROM
Nederl.
a.
STATISTICĂ ECONOMICĂ
Nederl.
ASIROM
SARA
100 UNITA
80 AIG Life
Garanta
60
% Omniasig
40
Metropol
20 Interam.
0 ARDAF
b. Altele
Nederl.
100
A SIROM
90
80 SA RA
70 UNITA
60 A IG Lif e
% 50 Garanta
40 Omnias ig
30 Metropol
20 Interam.
10
A RDA F
0
c. A ltele
Nederl.
ASIROM
SARA
100% UNITA
80% AIG Life
60% Garanta
% Omniasig
40%
Metropol
20%
Interam.
0% ARDAF
d. Altele
Cantitãþi vândute
din produsul X
(mii bucãþi) 250
**
**
200 ***
***
150 * * ***
* ***
100 * * **
***
* *** *
50 **
***
***
10
20 30 40 50 60 Cheltuieli cu
reclama (mld. lei)
2.5.6. Cronograma
0.00
20.00
40.00
60.00
80.00
100.00
120.00
140.00
160.00
ie
90.00
100.00
110.00
120.00
130.00
140.00
150.00
fe 20
br 01
ua
rie
20
m 01
ar
tie
20
ap 01
ril
ie
20
01
m
ai
20
iu 01
ni
e2
00
iu 1
lie
a)
b)
au 200
gu 1
se st
Lunile
pt
em 200
b 1
luni
oc rie 2
to 00
m 1
br
no ie
ie 20
m 01
br
de ie
ce 20
m
STATISTICĂ ECONOMICĂ
01
br
ie
ia 20
nu 01
ar
ie
fe 20
br 02
ua
rie
20
01
Ian
30
Dec. Feb.
20
Nov. 10 Mar.
0
Oct. -10 Apr.
Sept. Mai
Aug. Iun.
Iul.
Legendă:
Africa
America de Nord
America de Sud
Asia
Europa
CAPITOLUL 1
Consideraţii preliminare
În acest capitol vom face primii paşi în înţelegerea statisticii ca
ştiinţă şi disciplină de studiu. Cele mai multe întrebări din domeniul
afacerilor, din domeniul economic ori social nu au răspunsuri simple; ele
necesită clarificare şi discuţii, fundamentări ale deciziilor. Vom vedea cum
statistica poate fi folositoare în luarea deciziilor, în acceptarea sau
respingerea unor soluţii posibile.
Statistica vine, astfel, să aducă un plus de rigoare ştiinţifică, să po-
tenţeze abilitatea de a lua decizii, să suplimenteze calităţile unui bun
manager: experienţă, intuiţie etc.
Pentru a înţelege statistica este, însă, mai întâi, nevoie să ne
familiarizăm cu limbajul statistic, să cunoaştem conceptele de bază, etapele
cercetării statistice şi rolul statisticii în procesul decizional.
În măsura în care am înţeles că statistica este ştiinţa culegerii şi
prelucrării, analizei datelor, este potrivit să continuăm cu studierea
diferitelor tipuri de date ce pot fi culese şi a celor mai des utilizate metode
de colectare a datelor statistice.
Termeni cheie
caracteristică (variabilă statistică) legea stabilităţii frecvenţelor
caracteristică nenumerică observări parţiale
caracteristică numerică observări totale
colectivitate generală parametru
colectivitate parţială (eşantion) scală de interval
control statistic scală de raport
date bivariate scală nominală
date continue scală ordinală
STATISTICĂ ECONOMICĂ
Noţiuni teoretice
Datele multivariate sunt cele care se referă la trei sau mai multe va-
riabile statistice, obţinând deci câte trei sau mai multe informaţii pentru
fiecare unitate statistică din colectivitatea studiată. Deşi sunt multivariate,
datele pot fi analizate separat (pentru fiecare variabilă), sau în interdepen-
denţă unele cu altele.
Putem observa că există două tipuri de bază de variabile aleatoare
(caracteristici) care pot fi studiate ca oferind niveluri observate sau date
statistice: caracteristici nenumerice (calitative), care oferă răspunsuri
categoriale şi caracteristici numerice (cantitative), care oferă răspunsuri
sub formă de valori numerice.
Datele discrete sunt răspunsuri numerice care apar în urma unui
proces de numărare, în timp ce datele continue sunt răspunsuri numerice
care apar în urma unui proces de măsurare.
Aşadar. caracteristicile statistice se pot clasifica după mai multe
criterii, astfel:
a) în funcţie de modul de exprimare, în:
— caracteristici calitative (nominative), exprimate în cuvinte:
profesie, culoarea părului, localitatea de domiciliu etc.;
— caracteristici cantitative (numerice), exprimate în cifre: salariu,
înălţime, greutate, cifră de afaceri etc. Sunt caracteristici măsurabile.
Forma cea mai elementară este scala nominală (de clasificare sau
scala denumirilor), când numerele sunt atribuite observaţiilor pentru a face
doar judecăţi despre identităţi sau diferenţieri de categorie. Cu ajutorul
scalei nominale numerele repartizate unor observaţii servesc drept numele
lor. Numerele sunt atribuite fiecărei categorii doar pentru a identifica unităţi
similare din interiorul unei categorii şi pentru a diferenţia aceste unităţi
similare de elementele unei alte categorii diferite.
Se face, astfel, o diferenţiere de specie, dar nu şi de grad.