Documente Academic
Documente Profesional
Documente Cultură
A. Qutelet, regularitile deduse ca urmare a unei observri de mas deriv din legi care sunt urmate
de om att n ordinea fizic ct i n cea moral. Lui A. Qutelet i se atribuie, pentru prima oar, o
teorie sintetic a statisticii bazat pe principii, tehnici i procedee statistice. Acesta imprim statisticii
noi direcii de cercetare: cercetarea variaiei i a relaiilor cazuale n masa fenomenelor, sesizarea
regularitilor, abordarea cu prioritate a fenomenelor vieii umane etc. Conform teoriilor lui A.
Qutelet, statistica deine metode unice necesare studierii fenomenelor bazate pe calculul
probabilitilor.
Considerat ca unul din fondatorii economiei matematice, A. Cournot considera statistica ca o
disciplin de baz n abordarea fenomenelor i desprinderea cauzelor regulate ale acestora n
contextul aciunii cauzelor ntmpltoare.
n secolul al 19-lea se ntlnesc diverse preocupri n domeniul statisticii teoretice i practice.
Unele dintre acestea admiteau includerea n sfera statisticii a tuturor fenomenelor cuantificabile
numeric, abstracie fcnd natura lor, n timp ce alii considerau de domeniul statisticii doar studierea
fenomenelor sociale. Mai exista un grup restrns, care restriciona cmpul de aplicare al statisticii la
fenomenele vieii umane.
Contribuii de seam la progresul statisticii i consolidrii acesteia ca fiin au adus i alte coli
de statistic, n decursul sectorului al 19-lea.
Merit, cu prisosin, s fie amintii reprezentanii colii statistice ruse care s-au impus n
domeniul statisticii sociale, dar mai ales n aportul adus n dezvoltarea teoriei probabilitilor. n
concepia lui D.P. Juravski statistica trebuie s aib ca obiect de studiu viaa social cu multitudinea de
fenomene care i aparine, considernd statistica ca o tiin metodologic. P.L. Cebev i A.A.
Markov i-au adus un aport substanial la dezvoltarea teoriei probabilitilor. Cebev demonstreaz
printre altele, teorema central a teoriei probabilitilor i a legii numerelor mari, iar Markov a pus
bazele teoriei moderne a proceselor stochastice i a lanurilor care-i poart numele.
n secolul trecut se contureaz o nou etap n evoluia statisticii, cunoscut ca etapa
constituirii statisticii moderne. n aceasta nou etap statistica depete stadiul descriptiv, de
prezentare simplist a fenomenelor, insistndu-se pe interpretarea analitic a fenomenelor i deducerea
de concluzii inductive avnd la baz datele din observri. Acest lucru nu era posibil dect printr-o
ntreptrundere a statisticii cu matematica pentru a permite gsirea celor mai corespunztoare metode
n atingerea obiectivelor.
F. Galton i K. Pearson reprezentani ai colii statistice anglo-saxone, au elaborat o mare parte
din metodele i procedeele specifice analizei statistice moderne, continuate apoi de R.A. Fisher i alii.
K. Pearson transpune n limbaj matematic ideea de variaie legat a lui Galton, constituindu-se ntr-o
teorie, teoria corelaiei statistice, permind stabilirea diverselor forme de legtur n aplicaii practice
din domeniul vieii sociale.
Prelungirea statisticii la rezolvarea urmtoarelor categorii de probleme: probleme de
specificaie, probleme de observaie i probleme de distribuie se datoreaz lui R.A. Fisher. n noua
concepie despre statistic se pornete de la ipoteze statistice cu privire la fenomenul de observat,
deduciile logice desprinse urmnd a se compara cu datele avute la ndemn. Dac acestea sunt n
concordan, ipotezele avansate se consider valide, cel puin pn la noi observaii mai riguroase. Se
prefigureaz tot mai frecvent ideea, conform creia, preocuprile de a trage concluzii de o valoare
general trebuie s se bazeze pe datele observate din eantion. Cercetarea prin sondaj ncepe s devin
o aplicaie curent, observarea total practicndu-se din ce n ce mai rar i numai n cazuri absolut
necesare. Caracterizarea unei populaii pornind de la datele de observare pe baz de eantion,
presupune o anumit incertitudine, pe care specialistul caut s o reduc ct mai mult. Una din
problemele importante ale statisticii o constituie tocmai msurarea gradului de incertitudine care
privesc concluziile inductive. n concordan cu noile probleme ale vieii sociale i economice,
statistica se implic n mod direct n determinarea riscurilor de eroare i a pierderilor implicate de
deciziile ntemeiate pe o informaie care, prin natura sa, nu poate fi exhaustiv.
n aceast perioad, prin preocuprile mai ales de ordin teoretic, statistica se contureaz ca o
disciplin tiinific. Statistica nregistreaz progrese remarcabile ndeosebi n domeniul teoriei
matematice, conducnd la descoperirea de metode noi de investigare mai elaborate i mai eficiente.
Din punct de vedere pragmatic, statistica pune stpnire pe noi domenii de aplicaie, rezultatele
obinute constituind un imbold privind implicarea statisticii n cele mai variate sectoare ale lumii
sociale i economice.
n multitudinea de definiii care s-au dat i se mai dau statisticii, se pot deosebi dou curente:
unul din acestea consider statistica drept tiin, iar cellalt o admite ca metod. Indiferent crui
curent aparinem, statistica modern prezint dou aspecte diferite, dar complementare: aspectul
descriptiv, nglobat n aa numita statistic descriptiv, care permite fixarea informaiilor aa cum au
rezultat din prelucrarea datelor din observare i aspectul inductiv, nglobat n statistica inferenial,
care ne permite o tratare teoretic a datelor n vederea deducerii de concluzii logice, asociate
observaiilor efectuate. n cadrul unui demers statistic, cele dou aspecte trebuie privite ca dou
momente care aparin unuia i aceluiai proces de cunoatere.
Statistica se dovedete de nenlocuit, n studiul cunoaterii fenomenelor social-economice,
generate de cauze multiple i complexe. Aceste fenomene domin aproape ntreaga activitate social i
economic. Complexitatea acestora ridic mari dificulti n stabilirea legturii fenomen-cauz supus
analizei statistice. Pornind de la date de observare, pe baza calculelor statistice, se pot desprinde legi
statistice, care descriu relaii cauzale de natur statistic. Aceste legi sunt legi cu statut propriu, care
sunt la fel de obiective ca i legile dinamice. Legile statistice sunt caracteristice numai fenomenelor
urmrite printr-un numr mare de cazuri, acolo unde ntregul se manifest prin intermediul unitii
sistemelor componente i nu prin fiecare parte component luat separat. Legea statistic acioneaz ca
o tendin de ansamblu, dedus pe baza unui volum mare de observaii statistice. Legea statistic se
poate pune n eviden numai dac se consider un numr suficient de mare de uniti statistice
elementare ale populaiei de studiat supuse observrii.
Legea numerelor mari, care constituie o expresie a legturii dintre necesitate i ntmplare, se
verific n colectiviti relativ mari i cuprinztoare. n conformitate cu aceast lege, aciunea
conjugat a unui numr mare de factori aleatori, n condiii bine determinate, conduce la rezultate
aproape independente de ntmplare, dnd astfel posibilitatea ca necesitatea s se realizeze. Referindune la prima lege statistic descoperit tim c la natere numrul bieilor ntrece pe cel al fetelor,
raportul iniial admis era de biei 107; fete 100. Particulariznd aceast lege statistic la distribuia pe
sexe a nscuilor n snul fiecrei familii n parte, ar fi imposibil s indicm ce fel de raport exist,
date fiind variaiile sale destul de numeroase i n acelai timp importante pentru diferite familii. O
cercetare statistic care s prezinte rezultate semnificative n acest sens, trebuie ntreprins pe mase
ndeajuns de mari de nateri. nsui J. Bernoulli care a dat acestei legi o form matematic, a inut s
menioneze la vremea sa, c sporirea numrului observaiilor n scopul mrimii gradului de siguran a
deciziei nu constituie ceva nou i neobinuit, deoarece omul indiferent de pregtirea sa tie c sursa de
reuit referitor la o aciune a sa este cu att mai mare, cu ct mai multe observaii sunt luate n
considerare.
1.2.1. Scurt istoric privind evoluia statisticii n Romnia
Despre un nceput de organizare statistic n rile romneti nu poate fi vorba dect din
secolul al. XVIII-lea ncoace. Prima scriere sau recensmnt al locuitorilor pare s fi fost fcut de
Constantin Mavrocordat, cu ocazia reformelor sale n Muntenia i Moldova. Regulamentul organic
(1831) introduce catagrafia sau recensmntul sistematic i periodic. Din 7 n 7 ani trebuia s se fac
categrafia populaiei, dup norme bine stabilite, pentru a servi la aezarea birului i la hotrrea
veniturilor rii.
La 28 aprilie 1859, domnitorul Al. I. Cuza aprob nfiinarea unui birou de statistic n ara
Romneasc, numind ef pe Dionisie Pop Marian, iar la 1 iulie 1859 aprob nfiinarea Direciei de
Statistic din Moldova, sub conducerea lui Ion Ionescu de la Brad.
La 4 august 1862 cele dou organe de statistic se reunesc sub denumirea Oficiului Statistic
pentru Principatele Unite sub conducerea lui Dionisie Pop Marian.
Gndirea statistic romneasc s-a aliniat n contextul amplu al curentelor statistice existente n
Europa. Reprezentanii statisticii romneti au pstrat un contact permanent cu preocuprile statistice
din rile Europei, aducndu-i contribuii de seam att la promovarea statisticii teoretic i practice,
ct i al organizrii ei instituionale. Cei mai de seam reprezentai ai statisticii romneti din acea
perioad au fost Ion Ionescu de la Brad i Dionisie Pop Marian. Primul i-a prezentat punctul de
vedere despre statistic n lucrarea ntitulat Povuri pentru catagrafia Moldovei (1859). Statistica,
n viziunea lui I. I. de la Brad trebuie s cuprind dou pri: o prim parte care s presupun culegerea
datelor de observare, iar a doua parte s implice aparatul matematic. Se regsete n aceste abordri
metodologice, n linii mari, nsui demersul statistic modern, format din dou etape: una descriptiv,
alta inductiv, inferenial..
n concepia lui D. P. Marian statistica trebuie s studieze fenomenele naturale i sociale,
avnd drept scop descoperirea legilor care le guverneaz. Se evideniaz apartenena sa la curentul de
larg circulaie conform cruia obiectul de cercetare al statisticii trebuie s depeasc graniele sferei
fenomenelor sociale.
n spiritul statisticii descriptive europene i la noi n ar s-au scris lucrri statistice, statistica
figurnd ca obiect de studiu n nvmntul romnesc. Un curs de statistic a fost introdus n 1856 la
Facultatea Juridic de la Academia Mihilean din Iai de ctre Al. Papiu Ilarian, care avea drept
obiect descrierea statelor componente ale Europei sub aspect economic i social.
n 1860 apar Analele Statistice pentru cunoaterea Romniei, n care se public lunar date
privind statistica agricol, statistica vmilor, a micrii populaiei precum i studii cu caracter
economic.
n 1918 este creat Institutul Social Romn, form instituionalizat de cercetare sociologic.
Rezultatele au fost publicate sistematic n Arhivele pentru tiin i reform social, aprnd primele
cercetri statistice sub form de monografii. [ Bogdan, V., 1995].
Un recensmnt general al populaiei, cldirilor, ntreprinderilor industriale i comerciale are
loc n 1930. Debutul Anchetei Bugetelor de Familie are loc n 1950, care va deveni cercetare
permanent ntre 1950-1994.
n 1964 are loc o reuniune tiinific cu tema Anchetele selective, cnd pentru prima dat n
Romnia sunt formulate principiile proiectrii i utilizrii unui eantion matre.
ntre 1972-1989 are loc o ntrerupere dureroas a aplicrii sondajelor n studierea fenomenelor
economice datorit sistemului politic din acea vreme.
n prezent se organizeaz o multitudine de anchete, toate funcionnd pe principiile eantionrii
aleatoare.
Cu att mai mult astzi, cnd viaa social i cea economic este stpnit de fenomene i
procese dintre cele mai complexe, statistica vine n sprijinul cercettorului pentru a face lumin.
Descoperirea interdependenelor dintre diverse caracteristici care se ntlnesc n abordri de natur
social-economic constituie premiza consolidrii poziiei omului n raport cu lumea nconjurtoare.
Statistica, prin multitudinea de metode i procedee pe care le pune la dispoziia cercettorului,
permite o abordare tiinific a diverselor probleme care ne stau n fa. Nu ar fi posibile incursiunile
n viitor, prin elaborarea de previziuni i strategii de dezvoltare, fr aportul statisticii. Aceasta ne
ndreptete, pe bun dreptate, s-i acordm atenia cuvenit i n studiul economiei.
1.3. Concepte de baz
1.3.1. Populaia statistic
Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai natur,
care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i populaiei privit ca un
tot unitar. [Florea I.,1998]
O populaie este finit dac include un numr determinat de elemente, dar ea poate fi
considerat drept reprezentativ a unei populaii teoretice infinite. Ca urmare apare necesitatea de a
delimita o populaie n: coninut, spaiu i timp. Se mai denumete i populaia univers.
Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate, zon
etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea consumatorilor unui
produs, mulimea societilor productoare sau concurente ale unui produs, mulimea societilor
distribuitoare, angajaii unei societi etc.
Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc.
Exemple de variabile statistice relativ la populaia format din mulimea consumatorilor unui produs:
- vrsta: variabil atributiv, cantitativ, continu
X = { x1 = [15-20) [20-30) ... }
- frecvena de cumprare: variabil atributiv calitativ
Y = { y1 - foarte rar; y2 rar, ... }
- numr de sortimente cumprate relativ la produsul analizat: variabil atributiv, cantitativ,
discret:
Z = { z1 = 1; z2 = 2, ... }
- localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ
S = { s1 cartierul M sau s2 strada P1, ... }
- data ultimei cumprri a produsului analizat: variabil de timp, cantitativ
T = { t1 = 27.01.2002; t2 = 24.02.2002, ... }
Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi finite
sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei, numit lege de
probabilitate.
Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret sau
continu.
n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic constituie
o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare sunt probabile i n
strns legtur cu un anumit experiment. Strile unei variabile statistice nu sunt probabile, ele
cuantific o trstur proprie fiecrei uniti din populaie.
1.3.3. Observarea statistic
Observarea statistic const n identificarea unitilor populaiei i nregistrarea strilor
variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate prin observare se
numesc statistici.
Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou feluri:
total i parial.
Observarea total este acel tip de observare statistic n care are loc nregistrarea tuturor
unitilor care fac parte din populaie statistic supus studiului. Recensmntul populaiei Romniei
este un exemplu de observare total.
Observarea parial presupune observarea i nregistrarea unui anumit numr de uniti din
populaie, alese dup criterii bine definite.
n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie statistice exhaustive
rezultate prin observarea populaiei univers , fie statisticile rezultate din observarea parial a unui
eantion A, n ambele cazuri scopul final fiind acelai obinerea de informaii la nivelul
populaiei univers A.
1.3.4. Seria statistic
Seria statistic este o construcie care red fie distribuia unei populaii n raport cu una sau mai
multe variabile, fie variaia unei mrimi n timp, n spaiu sau de la o categorie la alta.
Seriile statistice se clasific n raport cu mai multe criterii, astfel:
1. n raport cu numrul variabilelor
Serii statistice unidimensionale, au la baz o singur variabil;
Serii statistice multidimensionale, care au la baz dou sau mai multe variabile.
2. Dup natura variabilelor deosebim:
Serii atributive, care au la baz variabile atributive;
Serii cronologice (de timp sau istorice), care au la baz variabile de timp;
Serii de spaiu sau teritoriale, care au la baz o variabil de spaiu.
(1.1)
X : 1
N 1 N 2 ... N i ... N R
Ni este frecven a absolut a clasei i, i = 1, R i reprezint numrul de unit i ale populaiei din clasa
pentru care variabila X a nregistrat valoarea Xi ,
N1 + N2 + ... + NR = N.
Clasa (grupa) de uniti n raport cu o variabil reunete acele uniti din cadrul populaiei care
nregistreaz aceeai stare a variabilei sau strile variabilei aparinnd unui anumit interval de varia ie.
Ca urmare, n raport cu o variabil statistic populaia poate fi structurat ntr-un anumit numr
de clase.
Exemplu
Fie A populaia statistic reprezentnd unitile de cazare turistic din Romnia, n anul 1999
i X categoria de confort (este o variabil statistic atributiv, cantitativ discret). Distribu ia
acestor uniti n raport cu variabila X este urmtoarea (conform A.S. al Romniei, 2000):
1
2
3
4 5
0
X :
666 1108 1090 290 91 5
- 0 neclasificate;
- 1090 ne arat numrul unitilor de cazare turistice avnd categoria de 2 stele;
De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X, poate fi
format cu frecvene relative, frecvene cumulate absolute sau relative.
Fie seria X format cu frecvene relative:
x x 2 ... xi ... x R
(1.2.)
X : 1
f 1 f 2 ... f i ... f R
fi - ne arat ponderea unitilor din populaie care au nregistrat pentru variabila X starea
xi:
N
fi = i
i = 1, R
N
sau
fi =
Ni
.100
N
i = 1, R
=1
(100 %)
i =1
Exemplu:
1
2
3
4
5
0
X :
0,205 0,341 0,3355 0,089 0,028 0,0015
sau
1
2
3
4
5
0
X :
20,5% 34,1% 33,55% 8,9% 2,8% 0,15%
X: 1
N(x1 ) N(x 2 ) ... N(x i ) ... N(x R )
(1.3)
unde: N(xi) reprezint numrul de uniti din populaia studiat pentru care variabila nregistreaz
valori ce nu depesc valoarea xi.
N(x1) = N1
N(x2) = N1 + N2
.........................
N(xi) = N1 + N2 + ... + Ni
.........................
N(xR) = N1 + N2 + ... + NR = N
Exemplu.
1
2
3
4
5
0
X :
666 1774 2864 3154 3245 3250
2864 - ne arat numrul unitilor de cazare turistic avnd cel mult dou stele.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative
cumulate, respectiv:
x2
...
xi
...
xR
x1
X :
FN ( x1 ) FN ( x 2 ) ... FN ( xi ) ... FN ( x R )
(1.4)
unde: FN(xi) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat valori ce
nu depesc valoarea x i.
sau
FN(xi) = f1 + f2 + ... + fi
FN ( x i ) =
N ( xi )
N
(.100)
i = 1, R
Exemplu:
1
2
3
4
5
0
X :
20,5% 54,6% 88,15% 97,05% 99,85% 100%
88,15 % - reprezint ponderea unitilor de cazare turistice avnd cel mult 2 stele.
Aa cum se poate constata din definiia celor dou mrimi de frecvene cumulate, acestea se
pot calcula i are sens elaborarea unor serii statistice doar n cazul n care la baza seriei se gsete o
variabil cantitativ.
Relativ la aceeai populaie statistic studiat A mulime unitilor de cazare turistic din
Romnia n anul 1999, din A.S. al Romniei /2000, se pot extrage alte serii statistice de repartiie, ca
de exemplu:
- distribuia unitilor de cazare n raport cu forma de proprietate (cf. A.S. al Romniei/2000, pg.518).
majoritar de stat majoritar privat
Y :
1290
1960
Aceasta este o serie statistic de repartiie unidimensional avnd la baz o variabil atributiv,
calitativ i format cu frecvene absolute. n aceast situaie se poate elabora seria statistic format
cu frecvene relative, respectiv:
majoritar de stat majoritar privat
Y :
39,69%
60,31%
- distribuia unitilor de cazare n raport cu tipul destinaiei turistice (cf. A.S. al Romniei/2000,
pag.519)
litoral
Z :
729
balnear
montan
Delta
Dunarii
435
691
69
orase resedinta
de judet
inclusiv
Bucuresti
418
alte
localitati
908
x1
x2
...
xj
...
xJ
Total
y1
y2
.
.
yi
N11
N21
-
N12
N22
-
...
...
-
N1j
N2j
-
...
...
-
N1J
N2J
-
N1.
N2.
-
Ni1
N i2
...
Nij
...
NiJ
Ni.
.
.
yI
NI1
NI2
...
NIj
...
NIJ
NI.
Total
N.1
N.2
...
N.j
...
N.J
(1.5)
- Nij - reprezint numrul de uniti pentru care, variabila X nregistreaz starea xj i variabila Y
nregistreaz starea yi ;
- Ni. - numrul de uniti pentru care Y = yi, indiferent de nivelul nregistrat de variabila X;
- N.j - numrul de uniti pentru care X = xj, indiferent de nivelul nregistrat de variabila Y;
- N - numrul total de uniti analizate.
Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare:
x 2 ... x j ... x J
x1
X :
N
N
...
N
...
N
.
1
.
2
.
j
.
J
y
Y : 1
N 1.
y2
N 2.
... y i
... N i.
... y I
... N I .
... y i
... N ij
y2
N2 j
... y I
... N Ij
x2
...
N i .2
... N ij
xj
...
xJ
... N iJ
j = 1, J
cu
condiionat
de
cu
condiionat
de
i = 1, I
De asemenea se poate elabora sau deduce seria de repartiie bidimensional format cu frecvene
relative, respectiv:
x1
...
xj
...
xJ
Total
f11
-
...
-
f1j
-
...
-
f1J
-
f1.
-
fi1
-
...
-
fij
-
...
-
fiJ
-
fi.
-
fI1
f.1
...
...
fIj
f.j
...
...
fIJ
f.J
fI.
1
Y
Y1
.
.
yi
.
.
yI
Total
f ij =
N ij
N
f i. =
N i.
N
f. j =
N. j
i = 1, I
(1.6)
j = 1, J
Exemple:
Relativ la populaia statistic A studiat, din A. S. al Romniei/2000, se poate extrage o serie de
repartiie bidimensional, avnd la baz variabilele:
X - categoria de confort (numr de stele)
Y tipul unitii de cazare turistic
de forma urmtoare:
X
Y
Hoteluri
Moteluri
Hanuri turistice
Cabane turistice
Campinguri
Vile turistice i bungalouri
Tabere colare
Pensiuni turistice
Sate de vacan
Pensiuni agroturistice
Spaii de cazare pe
nave
Total
0
(neclasificate)
57
12
22
83
56
257
176
3
-
Total
259
50
59
69
482
77
110
2
388
53
19
15
212
191
1
210
1
91
5
4
2
122
44
21
1
14
69
7
1
2
3
-
811
120
22
165
142
1145
176
322
1
341
5
666
1108
1090
290
91
3250
Total
0,018
0,004
0,007
0,026
0,017
0,079
0,08
0,015
0,018
0,021
0,148
0,119
0,016
0,006
0,005
0,065
0,028
0,002
0,001
0,0006
0,038
0,004
0,021
0,0006
0,0009
0,25
0,037
0,007
0,051
0,044
0,352
0,054
0,0009
0,024
0,059
0,014
0,002
0,054
0,099
0,034
0,0003
0,065
0,006
0,0003
0,105
0,0006
0,0003
0,0003
0,0003
0,002
0,205
0,341
0,335
0,089
0,028
0,002
0,6% - reprezint ponderea pensiunilor agroturistice avnd categoria de confort de 3 stele, din totalul
unit ilor de cazare turistic.
De asemenea se pot extrage seriile unidimensionale marginale n raport cu X i Y i cele
condiionate, de exemplu:
1
2
3
4 5
0
X :
666 1108 1090 290 91 5
y 2 y3 y 4
y5
y6
y7
y8 y9
y
Y : 1
811 120 22 165 142 1145 176 322 1
y10 y11
341 5
2
3 4 5
0 1
X / Y = pensiuni tustice :
3 77 191 44 7
y y2
Y / X = 3 : 1
91 5
y3
y4
4
y5 y6
2 122
y7
y8
44
y9
y10
21
y11
Conform definiiei seria de variaie red variaia unei mrimi, n timp, n spaiu sau de la o
categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o variabil de
timp), serii de spaiu i serii categoriale (au la baz variabile atributive). Cele mai des ntlnite sunt
seriile cronologice i seriile de spaiu.
Seriile de variaie au la baz mrimi absolute i relative. Dup unii autori din cadrul mrimilor
absolute fac parte indicatorul de nivel i diferena absolut a unei mrimi, iar din cadrul mrimilor
relative fac parte: indicatorul relativ de intensitate, indicele statistic i diferena relativ a unei mrimi.
Indicatorul de nivel (Y) este o mrime ce reflect nivelul unui fenomen analizat. De exemplu:
producia diferitelor produse, veniturile populaiei, suprafaa cultivat cu principalele culturi,
transportul, exportul, importul etc.
Diferena absolut a unei mrimi ( Y ) exprim diferena dintre nivelul cercetat i nivelul
baz de comparaie al mrimii analizate. Se exprim n aceeai unitate de msur n care este
cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la altul.
Indicele statistic al unei mrimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul baz de
comparaie al mrimii analizate. Ne arat de cte ori se modific acea mrime, de la un nivel la altul.
Diferena relativ a unei mrimi ( RY ) exprim raportul dintre diferena absolut a mrimii
respective i nivelul baz de comparaie al acesteia. Ne arat cu ct la sut se modific mrimea de la
un nivel la altul.
Indicatorul relativ de intensitate (d) se definete ca raport ntre doi indicatori de nivel de
natur diferit i arat gradul de rspndire a fenomenului cuantificat de indicatorul de la numrtor n
raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producia diferitelor culturi
/ ha, densitatea populaiei, producia principalelor produse / locuitor, rata omajului etc.
Greutatea specific (g) reflect structura fenomenului analizat n raport cu strile variabile X,
de la baza seriei.
Seriile cronologice
Seria cronologic reflect evoluia n timp a unei mrimi.
Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s se refere
la un interval de timp.
Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd stocuri
[Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci, instituii, fonduri
fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii de activitate, unitile de
cazare turistic etc.ntr-o astfel de serie nsumarea mrimii analizate nu are sens din punct de vedere al
coninutului, aceasta fiind permis din considerente de calcul, ajustri etc.
Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd fluxuri. De
exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau produse, venituri,
cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel de serie are sens
nsumarea mrimii analizate.
Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a nivelului unei
mrimi Y,
0 1 2 ... t ... T
(1.7)
Y :
y 0 y1 y 2 ... yt ... yT
Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i
diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai sus se
pot calcula cu baz fix (t/t0) (baza de comparaie rmne aceeai) sau cu baz n lan (t/t-1) (baza de
comparaie se schimb, fiind considerat cea precedent nivelului comparat).
Fie seriile cronologice formate cu:
- diferene absolute cu baz fix:
2 ... t
... T
0 1
ty/ t0 :
(1.8)
1/ 0
2/0
t/0
... y ... Ty/ 0
0 y y
t y/ 0 = y (t ) y (0)
2
2 /1
y
t y/ t 1 = y (t ) y (t 1)
...
t
t / t 1
y
...
...
T
T / T 1
y
...
(1.9)
ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii de
legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd diferenele
absolute cu baza n lan se obin diferenele absolute cu baza fix.
t y/ 0 = 1y/ 0 + 2y/ 1 + 3y/ 2 + ... + t y/ t 1
2
I
2/0
y
... t
... I yt / 0
... T
... I Ty / 0
(1.10)
y (t )
(100%)
y (0 )
I yt / t 1 =
2
I
2 /1
y
...
... I
t
t / t 1
y
...
... I
T
T / T 1
y
(1.11)
y (t )
(100%)
y (t 1)
2
R
2/0
y
...
... R
t /0
y
...
... R Ty / 0
(1.12)
t /0
y
t y/ 0
y (0)
y (t ) y(0) y (t )
=
1 = I ty / 0 1
y(0)
y(0)
sau
R ty / 0 = I yt / 0 /1 100% 100 %
t / t 1
y
ty/ t 1
y(t 1)
2
R
2 /1
y
...
... R
t / t 1
y
...
... R
T
T / T 1
y
(1.13)
= I ty / t 1 1
sau
R ty / t 1 = I yt / t 1 100% 100%
Diferena relativ ne arat cu ct la sut se modific fenomenul de la un moment la altul.
Aceast mrime la fel ca i indicele statistice, se folosete frecvent n caracterizarea fenomenelor din
economie.
Dac seria cronologic analizat, de forma (1.7) este de intervale, se poate deduce seria
format cu greutatea specific:
0
g y :
g0
g (t ) =
1
g1
2
g2
... t
... g t
... T
... g T
(1.14)
y (t )
T
y (t )
t =1
Exemple:
1. Fie seria cronologic de intervale ce reflect numrul de absolveni de nvmnt superior din
Romnia n perioada (89/90 96/97), astfel:
89 / 90(0) 90 / 91(1) 91/ 92(2) 92 / 93(3) 93 / 94(4) 94 / 95(5) 95 / 96(6) 96 / 97(7)
Y :
25927
29901
33366
34240
47837
57360
80991
28113
ty/ t0 :
0 2186 1788 5253 6127 19724 29947 52878
5253 ne arat cu ct au fost mai muli absolveni n anul universitar 92/93 fa de anul universitar
89/90.
1
2
3
4
5
6
7
0
ty/ t 1 :
2186 3974 3465 874 13597 9523 23631
3465 ne arat cu ct au fost mai muli absolveni n anul universitar 92/93 fa de anul universitar
91/92.
1
2
3
4
5
6
7
0
I yt / t0 :
1 0,922 1,064 1,187 1,218 1,702 2,04 2,88
1,187 ne arat de cte ori a crescut numrul de absolveni de nvmnt superior din anul 92/93 fa
de anul 89/90.
1
2
3
4
5
6
7
0
I yt / t 1 :
0,922 1,153 1,116 1,026 1,397 1,199 1,412
1,116 ne arat de cte ori a crescut numrul de absolveni de nvmnt superior din anul 92/93 fa
de anul 91/92.
1
2
3
4
5
6
7
0
R ty / t0 :
0 7,78% 6,4% 18,7% 21,8% 70,2% 104% 188%
18,7% - ne arat cu ct la sut a crescut numrul de absolveni de nvmnt superior n anul 92/93
fa de anul 89/90.
1
2
3
4
5
6
7
0
R ty / t 1 :
7,78% 15,3% 11,6% 2,6% 39,7% 19,9% 41,2%
11,6 % - ne arat cu ct la sut a crescut numrul de absolven i de nvmnt superior n anul 92/93
fa de anul 91/92.
1
2
3
4
5
6
7
0
g y :
8,32% 7,68% 8,85% 9,88% 10,14% 14,16% 16,98% 23,98%
9,88 ne arat ponderea absolvenilor din anul universitar 92/93 din totalul absolvenilor perioadei
89/90 96/97.
Considerm seria cronologic ce reflect variaia numrului de studeni /10.000 locuitori (cf.
2.
A.S. al Romniei/2000, pg. 203).
94 / 95 95 / 96 96 / 97 97 / 98 98 / 99 99 / 2000
X :
148
157
160
181
202
112
Aceasta este o serie cronologic de moment avnd la baz indicatorul relativ de intensitate. n mod
asemntor cu exemplul precedent se pot deduce seriile formate cu: X , I X , R X , cu baz fix i cu
baz n lan.
Alte exemple de serii cronologice avnd la baz indicatorul relativ de intensitate:
- rata omajului:
X 1 :
6,7
6,0
6,3
6,8
8,0
X 2 :
2535 3082 1760 2964 2561 2776
- rata general de fertilitate:
1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
X :
66,3 56,2 48,7 46,6 44,3 43,3 41,1 39,9 40,6 40,6
Seria statistic de spaiu (teritorial)
Seria statistic de spaiu este o construcie statistic ce reflect variaia n spaiu a unei mrimi.
Seria de spaiu prezint o importan din ce n ce mai mare, datorit dezvoltrii sistemului
informaional, a necesitii comparaiilor internaionale i a comparaiilor ntre regiunile unei ri.
n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic teritorial i
Statistic internaional. n capitolul de Statistic teritorial sunt cuprinse informaii privind:
populaia, fora de munc, condiii de munc, veniturile populaiei, cheltuielile i consumul populaiei,
locuine, asisten social, sntate, nvmnt, cultur, sport, conturi naionale, rezultate i
performane ale ntreprinderilor, agricultur, silvicultur, industrie, transporturi, po t, telecomunicaii,
turism, finane, justiie i starea infracional, pe cele 7 regiuni i Bucureti.
La baza seriei de spaiu se gsesc att mrimi absolute (indicator de nivel, diferena absolut),
ct i mrimi relative (indicator relativ de intensitate, indicele statistic, diferena relativ).
Fie seria statistic Z, de forma urmtoare:
s1
s 2 ... s i ... s R
s
Z : 0
Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R)
(1.15)
unde:
i = 1, R ;
si este o stare a variabilei ce exprim spaiul,
Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate).
Z (i )
(100%)
Z (0 )
...
si
si / s0
... I Z
... s R
... I ZsR / s0
(1.17)
I Zsi / s0 =
s1
s2
s1 / s0
Z
s2 / s0
Z
...
si
... RZsi / s0
...
sR
(1.18)
... RZsR / s0
sZi / s0
= I Zsi / s0 100%
Z (0)
Se deduc seriile formate cu mrimi absolute i relative calculate doar cu baz fix (se poate alege orice
stare a variabile ce exprim spaiu).
Exemple:
1.
Fie seria de spaiu ce reflect varia ia pe regiuni a Produsului intern brut regional / locuitor
(mil. lei), n anul 1998, cf. A.S. al Romniei, pg. 718.
Bucuresti
Z : (s )
0
26,897
Est
Est
Vest
Vest
(s1 )
(s2 ) (s3 )
(s4 )
(s5 )
(s6 )
(s7 )
sZ/ s0 : 0
0 -14,333 -10,342 -12,697 -12,096 - 9,602 -11,267 - 9,128
- 11,267, ne arat cu ct este mai mic PIBR/locuitor n regiunea Nord-Vest fa de Bucureti.
s
sZ/ s0 : 0
1
s3
s4
s5
s6
s7
s1
s2
0,581 ne arat de cte ori este mai mic PIBR/locuitor n regiunea Nord-Vest fa de Bucureti.
(s1 )
(s 2 )
(s3 )
(s 4 )
(s5 )
(s6 )
(s7 )
(s )
RZs / s0 : 0
0 - 53,3% - 38,5% - 47,2% - 45% - 35,7% - 41,9% - 33,9%
-41,9 % - ne arat cu ct la sut este mai mic PIBR/locuitor n regiunea Nord-Vest fa de
Bucureti.
3.
Romnia Ungaria
3,0
4,6
76
66
66
Austria Belgia
X 3 :
12,4
7,2
Probleme rezolvate
Problema 1.
Produsul intern brut (PIB) al unei ri a crescut n 2006 fa de 2005 cu 12% i a sczut n 2007 fa de
2006 cu 12%. Cu ct s-a modificat procentual PIB n 2007 fa de 2005?
06 / 05
RPIB
= 12%
06 / 05
I PIB
= 1,12
07 / 06
RPIB
= 12%
07 / 06
I PIB
= 0,88
07 / 05
06 / 05
07 / 06
I PIB
= I PIB
I PIB
= 1,12 0,88 = 0,9856
07 / 05
07 / 05
RPIB
= I PIB
1 100% = (0,9856 1) 100% = 1,44%
Problema 2.
Produsul intern brut pe locuitor (PIB/loc) este de 32640$ n Frana i de 26380$ n Spania.
Determinai:
a) cu ct la sut este mai mare PIB/loc n Frana fa de Spania?
b) cu ct la sut este mai mic PIB/loc n Spania dect n Frana?
a)
32640$
F/S
F /S
RPIB
1 100% = 23,73%
/ loc = I PIB / loc 1 100% =
26380$
b)
26380$
S/F
S/F
RPIB
1 100% = 19,18%
/ loc = I PIB / loc 1 100% =
32640$
Problema 3.
Salariul lui Vasile este de 1530 lei, cu 38,4% mai mic dect salariul lui Ilie. Care este salariul lui Ilie?
Vas / Ilie
Rsal
= 38,4%
Vas / Ilie
Vas / Ilie
Rsal
= (I sal
1) 100%
Vas / Ilie
sal
Vas / Ilie
Rsal
38,4%
=
+1 =
+ 1 = 0,384 + 1 = 0,616
100%
100%
salar (Vasile )
= 0,616
salar ( Ilie)
dar
Vas / Ilie
I sal
=
salar ( Ilie) =
Capitolul 2
OBSERVAREA, SISTEMATIZAREA I
PREZENTAREA SERIILOR STATISTICE
2.1. Observarea statistic
Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale, economice
sau de alt natur, etap n care se culeg datele statistice despre fenomenul supus cercetrii. Cercetarea
fenomenelor respective presupune cunoaterea populaiei statistice n vederea surprinderii aciunii
legilor care acioneaz la nivelul acesteia. De calitatea acestei etape, ntr-un proces de cercetare
statistic, depinde i calitatea rezultatelor obinute n celelalte faze.
Observarea statistic presupune identificarea, urmrirea i nregistrarea, dup reguli unitare i
precise, a nivelului atins de variabilele statistice studiate la unitile din care este format populaia
luat n studiu[Florea I., 1998].
Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun cteva
precizri. n primul rnd, observarea statistic presupune urmrirea i nregistrarea unui numr mare
de uniti statistice, ceea ce implic un volum mare de munc. n al doilea rnd, pentru ca cercetarea
populaiei s-i ating scopul, trebuie precizate care sunt variabilele n raport cu care este studiat
populaia. Variabilele statistice ce urmeaz s fie urmrite i nregistrate la nivelul fiecrei uniti din
populaie, trebuie s fie eseniale i s prezinte interes din punct de vedere al studiului ntreprins. n al
treilea rnd, trebuie stabilite criterii exacte pentru delimitarea corect a unitilor statistice care
alctuiesc populaia. i nu n ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai
multe persoane este necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura
corectitudinea necesar datelor rezultate.
Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune: specificarea
unit ilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor statistice care
caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit, nregistrarea strilor
variabilelor statistice considerate.
Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme care s
asigure o pregtire tiinific a observrii statistice:
- delimitarea populaiei supuse observrii;
- definirea unitilor statistice de observat;
- timpul i locul unde va avea loc observarea;
- programul observrii;
- alegerea purttorilor de informaie;
- pregtirea persoanelor ce urmeaz s fac observarea.
Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc fiecare dintre
ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia depinde corectitudinea
celorlalte etape a cercetrii statistice.
Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta se afl
n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce caracterizeaz populaia
supus studiului. n condiiile n care se impune cercetarea doar a unei pri din populaie, atunci
trebuie precizat care anume vor fi unitile ce vor fi supuse observrii, dup ce criterii se selecteaz
acestea din populaia iniial, astfel nct rezultatele cercetri s poat fi extinse la nivelul ntregii
populaii.
Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da loc
confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce trebuie
nregistrate n raport cu variabilele de studiat.
Stabilirea timpului i a locului unde va avea loc observarea are importan din punct de vedere
a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are n statistic dou
accepiuni:
- momentul sau perioada la care se refer datele nregistrate (timpul de referin);
- durata observrii.
Momentul sau perioada la care se refer datele nregistrate trebuie s fie n concordan cu
natura fenomenelor cercetate . n cazul n care observarea presupune nregistrarea unui fenomen n
mod static trebuie precizat un moment critic. Stabilirea momentului critic are n vedere posibilele
repetri sau omisiuni n nregistrarea unitilor datorate evoluiei populaiei n timp. Dac fenomenul
de studiat presupune o nregistrare continu, atunci trebuie precizat perioada de timp n care are loc
observarea. De exemplu, recensmntul populaiei Romniei din anul 2002 a avut ca moment critic
ora zero dintre 17 i 18 aprilie, iar timpul nregistrrii a fost de 7 zile. n cazul indicatorilor care
cuantific activitatea de producie, timpul la care se refer datele nregistrate poate fi luna, trimestrul
sau anul. Observarea statistic trebuie fcut ntr-un timp optim. Recensmntul populaiei ar trebui s
se realizeze de obicei iarna cnd micarea populaiei este redus n comparaie cu celelalte sezoane.
Alegerea momentului critic sau a perioadei de timp la care se refer datele obinute prin
nregistrarea unitilor, trebuie fcut de aa manier nct populaia s fie surprins n starea ei tipic
i natural.
Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus cercetrii
(incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o reprezint familiile
etc.).
n cadrul programului observrii statistice trebuie stabilite variabilele statistice care urmeaz s
fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice trebuie s fie n
consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse. Variabilele statistice care fac
parte din programul cercetrii trebuie s surprind aspectele eseniale, s expliciteze fenomenul sau
procesul studiat, s permit prelucrarea i generalizarea acestora la nivelul ntregii populaii.
Programul observrii trebuie s cuprind un numr optim de variabile. Alegerea unui numr de
variabile prea mare sau prea mic poate duna calitii cercetrii statistice efectuate asupra populaiei n
cauz. Stabilirea programului observrii presupune o consultare reciproc a statisticienilor, care
ntreprind cercetarea i a specialitilor din domeniul considerat.
Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a fi
nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz datele din
observarea unitilor statistice.
Problema selectrii i pregtirii persoanelor care urmeaz s fie angrenate n etapa de
observare, se pune mai ales n cazul n care fenomenul sau procesul de studiat este de mare amploare.
Un asemenea fenomen l constituie recensmntul, care constituie o observare la scar na ional cu un
mare consum de mijloace materiale i financiare.
Observarea statistic se poate desfura n diverse forme n raport cu: natura proceselor socialeconomice de studiat, obiectivul cercetrii, formele de organizare ct i posibilitile practice de
urmrire i nregistrare a unitilor statistice din populaie.
Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem: observarea
total i observarea parial. Observarea total permite nregistrarea, n raport cu variabilele statistice
a tuturor unitilor statistice din populaie, implicnd un volum mare de munc, antreneaz, de obicei,
un numr de persoane i dureaz mult timp. Ca urmare se creaz condiii pentru apariia de erori de
observare, ceea ce va conduce la micorarea eficienei observrii. Forma cea mai frecvent de
observare total o constituie recensmntul populaiei. Avnd n vedere anvergura unei asemenea
observri totale, recensmntul presupune o pregtire prealabil din punct de vedere uman, material i
financiar de reuita creia depinde n mare msur eficacitatea lui. Cu prilejul fiecrui recensmnt se
Chestionarul este o list de ntrebri de diferite forme care sunt puse oral sau n scris n vederea
culegerii de informaii relativ la un subiect [Chirouze Y., 1985]. Redactarea chestionarului este o
problem dificil mai ales n cazul studiilor de pia, pentru c nu exist o formul unic de elaborare
care s conduc la stabilirea unu chestionar foarte bun. De fapt un chestionar este bun, atunci cnd
furnizeaz rspunsuri precise, adevrate i utilizabile. Conceperea unui chestionar se bazeaz foarte
mult pe experien.
Problemele care intervin n elaborarea unui chestionar sunt numeroase i complexe. Acestea nu
vor fi prezentate detaliat n acest studiu, ci vor fi abordate doar n linii mari. Pentru detalii se poate
consulta bibliografia aferent [Javeau C., 1992; Lejeune M., 1994; Vracem P.V., 1989].
Elaborarea chestionarului depinde de obiectivul anchetei. ntrebrile i eventualele probleme
ce intervin n elaborarea lor sunt legate de obiectivele urmrite. Astfel dac informaiile privesc
anumite fapte, evenimente petrecute, atunci ntrebrile sunt relativ uor de formulat. Ceea ce ar putea
mpiedica obinerea de informaii ar fi refuzul celor ntrebai de a da un rspuns exact la unele
ntrebri, datorat unor motive personale sau imposibilitii furnizrii unui rspuns total sau parial
aferent unor evenimente mai ndeprtate. Este evident c lungimea perioadei analizate depinde de
natura faptelor. Dac evenimentele se produc curent atunci perioada este mai scurt, iar dac
evenimentele sunt rare, perioada analizat este mai lung.
n schimb n cazul anchetelor asupra opiniilor, motivaiilor, inteniilor, elaborarea
chestionarului este mai dificil, ntrebrile vor fi formulate i studiate cu o foarte mai atenie. Ca de
exemplu n cazul anchetelor asupra opiniilor, ntrebrile privind exprimarea acestora sunt uor de
formulat, n cea mai mare parte se primesc rspunsuri (fiecare i exprim opinia). Ceea ce este dificil
n culegerea informaiilor privind opiniile l reprezint msurarea intensitii de manifestare a acestora
[Fournis, 1985].
n situaii ca cele formulate mai sus trebuie s se evite ntrebrile care ar conduce la apariia de
erori n rspunsuri. Aceste erori pot s fie provocate voluntar, de ctre repondeni, datorit mascrii
unei atitudini, opinii etc., sau pot fi involuntare datorate nenelegerii clare a problemei n cauz.
Pentru evitarea acestor inconveniente ntrebrile puse trebuie s rspund la o serie de
caracteristici bine definite [Helfer, 1985]. Astfel ele trebuie s fie:
uor de neles, adic s nu conin cuvinte ce nu pot fi nelese de orice repondent;
stimulatoare, adic ntrebrile puse trebuie s incite la rspuns;
precise, s antreneze rspunsuri uoare i s permit o bun prelucrare a datelor culese.
nainte de a vedea n ce manier se prezint chestionarul trebuie rezolvate problemele legate de
coninutul ntrebrilor, ca de exemplu: tipul i forma ntrebrilor, succesiunea lor i codificarea.
Tipuri de ntrebri
Pentru redactarea chestionarului este nevoie s se aleag ntre diferitele tipuri de ntrebri.
Alegerea nu este indiferent, ci fiecare tip corespunde nevoilor specifice anchetei.
Mai muli autori printre care sunt i M. Lejeune, C. Javeau, clasific ntrebrile n:
ntrebri nchise;
ntrebri deschise;
ntrebri semi-deschise.
ntrebrile nchise sunt acele ntrebri pentru care rspunsurile sunt fixate dinainte i
repondenii trebuie s-i aleag din variantele de rspunsuri propuse. Acest tip necesit o precodificare
a rspunsurilor, ceea ce va permite prelucrarea imediat a acestor ntrebri.
ntrebrile nchise sunt uor de exploatat, aceasta determinnd utilizarea frecvent a lor. Acest
tip de ntrebare este eficient atunci cnd ancheta se desfoar asupra faptelor, deoarece variantele de
rspuns pot fi uor delimitate. n schimb n cazul anchetelor asupra opiniilor, motivaiilor, atitudinilor,
este dificil s se asigure pertinena, exclusivitatea i exhaustivitatea prin variantele de rspuns
propuse.
ntrebrile nchise sunt de mai multe tipuri [Chirouze Y., 1985]:
- cu rspuns unic, unde repondentul trebuie s aleag doar o variant de rspuns. Acestea sunt
cel mai uor de prelucrat din punct de vedere statistic.
- cu rspunsuri multiple, unde repondentul poate s aleag mai multe variante de rspuns. Dac
acest numr nu este limitat atunci codificarea i prelucrarea datelor necesit o perioad mai lung,
motiv pentru care se recomand limitarea numrului de rspunsuri.
precodificate rspunsurile stabilite, care acoper cea mai mare parte din aria rspunsurilor, rmnnd
ca un numr destul de mic de rspunsuri, obinute pe parcursul anchetei, s fie codificat ulterior.
Aceste ntrebri au urmtoarele caracteristici:
ele contribuie la uurarea prelucrrii deoarece un numr mare de rspunsuri sunt prevzute,
acestea fiind codificate;
ele risc s influeneze reacia repondenilor prin sugerarea posibilelor rspunsuri;
variantele de rspuns sugerate n prima parte a ntrebrii trebuie s fie stabilite foarte
riguros, n general acestea se bazeaz pe o cercetare prealabil, astfel nct s fie evitat
situaia ca cele mai importante i cele mai multe rspunsuri s fie concentrate n partea
deschis a ntrebrii. ntr-o astfel de situaie ntrebrile mixte nu mai sunt avantajoase.
Redactarea chestionarului
Dup ce a fost definit coninutul chestionarului, respectiv diversele domenii ce trebuie regsite
n ntrebri, este necesar s se rezolve problemele legate de forma i de structura chestionarului i
anume acestea depind de urmtoarele aspecte [Javeau C., 1992]:
modul de administrare a chestionarului, care influeneaz lungimea chestionarului, nivelul
de aplicare al ntrebrilor;
tipul de ntrebri ce vor fi utilizate, acesta determinnd modul de prelucrare, termenul
anchetei, mijloacele financiare;
ce limbaj va fi utilizat, acesta depinznd de specificul anchetei, de pregtirea celor ancheta i;
modul de prelucrare ce va fi folosit, adic manual, sau pe calculator;
cum pot fi evitate erorile involuntare realizate de repondeni prin intermediul rspunsurilor
date. Aceste erori pot fi provocate de frica de a nu fi judecat prost, de dorina de a se
conforma normei sociale, de reacia la ntrebrile prea delicate sau personale, de
sugestibilitatea coninutului ntrebrilor.
C. Javeau n Lenquette par questionnaire propune anumite principii de redactare ale unui
chestionar legate de:
a) Ordinea n care sunt puse ntrebrile
Ordinea de succesiune a ntrebrilor depinde de tipul anchetei, de modul de administrare a
chestionarului, de lungimea sa, dar este dificil de propus un model adecvat pentru orice situaie.
b) Textele de introducere i de legtur
Oricare ar fi modul de administrare a chestionarului este necesar s existe texte de introducere
i texte de legtur ntre diferitele pri i mai ales ntre diferitele teme abordate.
c) Prezentarea material i tipografic, prezentarea material a chestionarului trebuie realizat
cu foarte mare atenie, mai ales n cazul administrrii directe.
n concluzie, redactarea unui chestionar presupune munca n echip, necesit mult atenie i
mai ales mult experien deoarece chestionarul este suportul de culegere a datelor iar dac acesta este
ntocmit superficial, chiar dac metodologia de sondaj i tehnicile de prelucrare a datelor sunt foarte
avansate i complexe, rezultatele obinute nu vor fi chiar cele mai bune.
Testarea chestionarului
Oricare ar fi experiena celor care redacteaz chestionarul sunt foarte rare situaiile cnd acesta
se prezint ntr-o form perfect, care s nu necesite mbuntiri. De aceea este nevoie de testarea
chestionarului, respectiv verificarea modului de nelegere, de interpretare i de acceptabilitate a
ntrebrilor.
Testarea chestionarului este absolut necesar n orice situaie i la orice tip de sondaj. Dac cei
anchetai sunt consumatorii, n general marele public, se tie c exist diferen ntre nivelul de cultur
al celor ce redacteaz chestionarul, care sunt specialiti n domeniul respectiv, i repondenii care nu
dispun de limbajul tehnic de specialitate. Astfel n ntrebri s-ar putea regsi cuvinte sau fraze strict de
specialitate i care s nu fie nelese de majoritatea celor anchetai.
Pentru colectarea datelor exist mai multe modaliti, dar nu toate au aceleai avantaje i nu pot
fi utilizate cu indiferen. Alegerea uneia sau alteia depinde de o serie de factori.
Culegerea datelor se poate realiza cu ajutorul urmtoarelor tehnici [Antoine, 1981; Chirouze,
1985; Helfer, 1995]:
ancheta prin interviu direct;
ancheta prin coresponden;
ancheta prin telefon.
1) Ancheta prin interviu direct se caracterizeaz prin aceea c administrarea chestionarului se
face direct la domiciliu, la locul de munc, n strad, la diferite puncte de vnzare, la expoziii , etc.
Astfel, n cazul anchetei la domiciliu sau la locul de munc se pot administra chestionare cu
multe ntrebri i se pot obine numeroase informaii. Calitatea rspunsurilor este asigurat datorit
prezenei anchetatorului al crui rol este i acela de a crea o atmosfer favorabil, de a explica sau
reformula anumite ntrebri care nu sunt foarte explicite, de a prezenta fotografii (mai ales n cazul
testrii inteniilor privind produsele noi), chiar i mostre de produse. Uneori anchetatorul poate oferi
produse celor anchetai, el urmnd s treac dup un timp si s preia chestionarul cu rspunsurile
completate privind calitile produselor testate.
Ancheta la domiciliu are i unele inconveniente. Primul inconvenient este cel legat de prezena
anchetatorului, care poate fi o surs de erori, provenite din transcrierea unor rspunsuri sau din
formularea unor ntrebri. De asemenea de multe ori prezena anchetatorului l determin pe cel
anchetat s se comporte altfel dect dac ar fi singur, aceasta conduce la deformarea rspunsurilor, ele
nu mai sunt sincere, sunt date pentru a impresiona pe anchetator.
Un alt aspect ce trebuie adugat la inconveniente este acela c persoanele din mediul urban
permit destul de greu ptrunderea persoanelor strine n cas, astfel rata non-rspunsurilor provenite
din mediul urban este mult mai mare dect din mediul rural.
Ancheta n strad sau la expoziii, trguri, magazine, are avantajul c se poate realiza un
numr mare de interviuri, ntr-un timp scurt i cu cheltuieli mici. Ancheta la magazine, trguri permite
culegerea de impresii la timp, recente, referitoare la produse, publicitate, promovare etc.
Anchetele n strad au un cmp de aciune limitat i pot fi folosite doar atunci cnd se dorete
obinerea unor informaii ieftine i rapide, calitatea i complexitatea lor neinteresnd foarte mult.
2) Ancheta prin coresponden. Aceast tehnic presupune trimiterea chestionarului, prin
intermediul potei sau a unor anchetatori, la destinatar. De regul destinatarul este ales folosind un
procedeu aleator. n general chestionarul se trimite ntr-un plic care conine i o scrisoare explicativ
prin care repondentul s neleag importana sondajului, a rspunsurilor pe care este rugat s le dea.
De asemenea se trimite i un plic pentru rspuns, iar uneori se specific c n cazul furnizrii
rspunsului repondentul va primi un mic cadou.
Aceast modalitate de administrare a chestionarului poate fi aplicat pentru orice populaie
studiat. Ca o diversificare a acestei modaliti a aprut administrarea chestionarului prin intermediul
faxului. Aceasta fiind folosit n cazul sondajelor n rndul ntreprinderilor i a diferitelor instituii.
Avantajele anchetei prin coresponden sunt legate de cheltuielile potale care sunt cu mult mai
mici dect cheltuielile ocazionate de ancheta la domiciliu. De asemenea dispersia geografic a
corespondenilor poate fi mare fr a afecta costul anchetei. n plus aceast tehnic ofer
repondentului un sentiment de libertate i de anonimat, deoarece el nu vine n contact cu anchetatorul.
Acest anonimat este asigurat atta timp ct nu trebuie s-i scrie adresa pe plicul ce conine rspunsul.
Deoarece ancheta nu se desfoar ntr-un timp foarte limitat, chestionarul poate fi relativ lung.
Un inconvenient al acestei anchete l reprezint rata non-rspunsurilor care este destul de
ridicat, aceasta impunnd trimiterea de noi chestionare altor persoane i deci creterea cheltuielilor
anchetei.
Ceea ce propunem este mbinarea anchetei la domiciliu cu cea prin coresponden, astfel s-ar
mbunti calitatea datelor culese. Respectiv anchetatorul ar avea rolul de a duce chestionarul la
repondent, de a-i da cteva explicaii i de a reveni dup un anumit timp bine specificat pentru a prelua
rspunsurile. Repondentul va trebui s completeze singur chestionarul, asigurndu-se astfel condiiile
ca rspunsurile s nu fie afectate de erori datorate anchetatorului. Rata rspunsurilor ar fi cu mult mai
mare dect n cazul anchetei prin coresponden, dar n acelai timp i cheltuielile vor fi mai mari, n
special cele de deplasare.
Acest tip de administrare este eficient n cazul populaiilor statistice puin dispersate din punct
de vedere geografic.
3) Ancheta prin telefon. Anchetatorul pune o serie de ntrebri persoanelor din eantion, prin
intermediul telefonului. Aceast modalitate de culegere a datelor permite obinerea de informaii rapid,
numerele de telefon fiind extrase din cartea de telefon, iar durata unei convorbiri este de 10-15 minute.
Aceast tehnic este mai economic dect ancheta la domiciliu, cheltuielile cuprind doar tarifele
telefonice. Ca o consecin a cheltuielilor reduse, este faptul c ancheta este eficient atunci cnd
eantionul este dispersat geografic.
Printre avantajele anchetei prin telefon este i acela c tele-anchetatorul poate telefona la
diferite ore din zi i de mai multe ori, pentru a contacta persoanele ce fac parte din eantion. Astfel rata
rspunsurilor este destul de mare.
Deoarece durata convorbirii telefonice este limitat, chestionarul este relativ scurt, ntrebrile
vor fi simple, ceea ce arat c aceast modalitate de culegere a datelor se aplic n cazul temelor mai
simple i care sunt supuse schimbrii ntr-un timp scurt.
Principalul inconvenient este acela c eantionul de cele mai multe ori nu este reprezentativ.
Acesta pentru c nu toat populaia dispune de telefon, iar populaia din mediul rural este foarte greu
de contactat telefonic.
n concluzie alegerea unei tehnici sau a alteia depinde de obiectivele studiului, de
complexitatea informaiilor culese, de volumul eantionului i de dispersia geografic a acestuia, de
bugetul alocat i de timpul acordat pentru sondaj.
Ceea ce se contureaz n momentul de fa este apariia de noi modaliti de culegere a datelor,
mult mai eficiente dect cele aplicate n trecut, cum ar fi folosirea internetului.
2.1.3. Erori de observare
n cele mai multe cazuri observarea statistic presupune i manipularea unui volum mare de
date. Ca atare intervin diferite tipuri de erori:
- eroare de eantionare (de reprezentativitate);
- erori de observare;
- erori datorate non-rspunsurilor.
Eroarea de eantionare exist n toate anchetele prin sondaj, dar ea este nul n cazul observrii
totale (nu constituie obiectul acestei lucrri).
Erorile de observare in de faptul c valoarea nregistrat poate fi o valoare yi* diferit de
valoarea adevrat yi corespunztoare unitii i.
Din categoria erorilor de observare fac parte urmtoarele:
a) Erori datorate dificultilor de vocabular, cum ar fi:
utilizarea unui limbaj savant, prea tehnicist, cnd de regul ntr-un chestionar nu trebuie s
fie folosite dect cuvinte uor de neles;
folosirea unor cuvinte a cror sens este variabil de la un mediu la altul, sau de la un individ
la altul;
folosirea unor cuvinte a crui sens este vag sau sunt prea abstracte.
b) Erori datorate nenelegerii corecte a sensului ntrebrilor, ca de exemplu:
persoanele intervievate declar o alt situaie dect cea normal, cum ar fi cazul declarrii
venitului (cnd cel n cauz declar venitul salarial i nu venitul total realizat), declararea
unei vechi profesii n loc de cea actual etc.;
persoanele intervievate comit erori fie datorate nedefinirii perioadei de referin (o perioad
pentru care se solicit informaii) sau datorate lungimii prea mari, solicitndu-se prea mult
memoria celor anchetai;
nedefinirea exact a unitilor de observat, pentru c sunt ntrebri ce se refer la o persoan,
iar altele la un grup, mai ales n cazul anchetelor organizate n gospodrii;
nenelegerea ntrebrilor foarte lungi, foarte complexe i care conin mai multe ideii n
acelai timp;
folosirea unor ntrebri vagi, abstracte, a cror implicaii nu sunt bine nelese;
dificultatea alegerii unuia sau a mai multor rspunsuri dintr-o list. Este important s se tie
dac rspunsurile se exclud sau nu, dac poi alege doar unul sau mai multe. n general se
prefer o list cu rspunsuri ct mai complet, dar s nu fie prea lung.
c) Erori datorate solicitrii memoriei, i anume:
erori cauzate de uitarea unor evenimente sau reinerea lor parial;
erori cauzate de lungimea perioadei de referin, mai ales atunci cnd ea este mare.
d) Erori datorate lipsei sinceritii n furnizarea informaiilor. Astfel de erori sunt mai
frecvente n cazul rilor unde persoanele nu sunt obinuite cu sondajele. n cadrul acestei categorii sar include:
erori datorate fricii de a declara o situaie aa cum este ea, de exemplu n cazul venitului,
persoanele declar n general salariul, pensia sau ajutorul primit, veniturile suplimentare nu
sunt declarate mai ales de frica impozitelor fiscale;
erori cauzate de dorina impresionrii anchetatorului, de exemplu subestimnd consumul de
alcool, supraestimnd activitile culturale etc.
e) Erori cauzate de anchetatori, i anume:
prin interpretarea unor ntrebri sau suflarea unor rspunsuri, la cei intervievai;
n cazul organizrii de sondaje probabiliste, atunci cnd o unitate este nlocuit cu alta, care
nu este trecut pe lista eantionului, situaie ntlnit mai ales atunci cnd nu se obin
informaii de la unitile ce trebuie supuse observrii.
Pentru reducerea acestor erori este necesar o selecie riguroas a anchetatorilor, o bun
pregtire a acestora, i o testare prealabil a chestionarelor. De asemenea se recomand efectuarea de
controale a anchetatorilor. Depistarea erorilor se poate realiza i n faza de prelucrare a datelor, iar n
funcie de natura lor se pot lua diferite msuri pentru eliminarea efectului acestora.
n concluzie, aa cum spunea J. Desabie atunci cnd o anchet eueaz, cel mai frecvent se
datoreaz erorilor de observare dect erorii de eantionare. De aceea este iraional s consacri mari
eforturi pentru reducerea erorii de eantionare atunci cnd erorile de observare sunt consistente. Dar n
general erorile de observare sunt mult mai mici n cazul anchetelor prin sondaje dect n cazul
recensmintelor, datorate faptului c anchetatorii au o pregtire mult mai bun dect agenii recenzori.
Erorile datorate non-rspunsurilor provin din absena total sau parial a datelor privind
unit ile supuse observrii.
2.2. Sistematizarea i prezentarea datelor statistice
populaia considerat. Deoarece, datele rezultate din observare se prezint sub form dezorganizat nu
permit o caracterizare a populaiei n ansamblu.
n vederea atingerii scopului cercetrii statistice ntreprinse i anume acela de a da o
caracterizare de ansamblu a populaiei considerate este necesar ca datele rezultate din observare s fie
supuse unor operaii de sistematizare i prezentare n vederea deducerii a ceea ce este esen ial, tipic i
general n legtur cu populaia.
Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate sub
forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie s fie n
strns dependen cu scopul cercetrii i cu natura fenomenului cercetat.
n raport cu una sau mai multe variabile din programul observrii, se poate construi o serie
statistic, permind astfel diverse ordonri (grupri) a datelor nregistrate. Orice cercetare statistic se
face cu un anumit scop bine precizat. n urma efecturii observrii statistice, indiferent de numrul
variabilelor prevzut n programul cercetrii, prelucrarea datelor rezultate se face n raport cu acelea
care sunt strns legate de scopul final.
Odat precizate variabilele de la baza seriei, se tie care va fi coninutul primului ir de date i
ca urmare este elucidat criteriul n raport cu care informaiile rezultate din observare vor fi ordonate,
necunoscndu-se ns cum se face propriu-zis ordonarea i cum se completeaz primul ir al seriei.
Completarea primului ir de date al unei serii statistice nu presupune doar o simpl aranjare n
ordine cresctoare sau descresctoare a variabilelor numerice sau n ordine alfabetic a strilor
variabilelor calitative. Definirea unei serii, referitor la primul ir de date se realizeaz n raport cu toate
strile variabilei stabilite.
n cazul unei variabile calitative sau cantitative discrete (i care nregistreaz un numr redus
de stri) ce st la baza construirii unei serii, procedeul cel mai simplu de completare a primului ir l
constituie ordonarea sau aranjarea strilor variabilei respective ntr-o anumit ordine. Dac variabila
care st la baza seriei este de variaie continu sau dei discret nregistreaz un numr prea mare de
valori n cadrul populaiei de studiat, ordonarea valorilor acestei variabile va conduce la o frmiare
prea mare a populaiei, ceea ce nu permite evidenierea principalelor aspecte ale acesteia. Pentru
asemenea cazuri, completarea primului ir presupune n primul rnd reunirea n clase distincte a acelor
unit i din populaie pentru care variabila nu prezint variaii esen iale. Ca urmare, n vederea
definitivrii primului ir de date al unei serii, se grupeaz datele n mod corespunztor, fiind necesar n
primul rnd stabilirea claselor.
Operaia de stabilire a claselor presupune mprirea unitilor unei populaii n clase distincte
n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit ordine. n urma
unei asemenea operaii, fiecare unitate trebuie s se gseasc n una i numai una din clasele rezultate.
Aceast operaie nu trebuie s conduc la pierderi de uniti, regsindu-se ns ntr-o alt ordine dect
cea dup care s-a realizat observarea.
De modul cum se face operaia de grupare a unitilor populaiei depinde n mare msur
sesizarea principalelor aspecte calitative care se pot contura n cadrul unei populaii ct i calitatea
informaiilor rezultate n urma prelucrrii datelor respective.
Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se spune c o
clas este omogen dac, pentru unitile care fac parte din ea, variabila de grupare nregistreaz
varia ii nesemnificative.
n cazul seriilor care au la baz o variabil de grupare calitativ sau cantitativ discret,
problema omogenitii nu se ridic deoarece, toate unitile pentru care variabila a nregistrat aceeai
stare constituie o clas.
n cele ce urmeaz se va prezenta operaia de stabilire a claselor n cazul unei serii
unidimensionale.
Dac la baza seriei avem o variabil calitativ, atunci clasele se stabilesc n raport cu strile
acesteia. Pentru fiecare stare a variabilei se va construi o clas. Ca urmare, n acest caz, ntr-o clas vor
intra toate unitile care au nregistrat aceeai stare n timpul observrii n raport cu variabila
considerat.
Pentru o variabil cantitativ, care st la baza construirii unei serii, stabilirea claselor se
realizeaz n mod diferit pentru o variabil discret i pentru o variabil continu.
n cazul unei serii care are la baz o variabil cantitativ discret (numrul strilor nu este
prea mare), clasele se stabilesc n mod asemntor ca i la variabilele calitative, respectiv:
x2 ... xR
x
X : 1
N1 N 2 ,... N R
n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la baz o
variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia considerat
nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul strilor variabilei.
Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu ajutorul intervalelor de
grupare (variaie), fiecare interval cuprinznd un numr oarecare de valori ale variabilei. Ca urmare,
pentru o serie continu, clasele se definesc cu ajutorul intervalelor de grupare.
Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil cantitativ
continu:
determinarea lungimii intervalelor de variaie;
stabilirea formei de scriere a intervalelor de variaie.
Determinarea lungimii intervalelor de variaie conduce la dou situaii:
serii construire cu intervale de lungime egal;
serii construite cu intervale de lungime diferite.
Alegerea unuia din cazurile de mai sus (intervalele de lungime egal sau diferit) trebuie
precedat de o analiz atent a modului de variaie a variabilei n cadrul populaiei. Stabilirea
numrului de intervale de variaie trebuie s asigure satisfacerea urmtoarelor condiii:
- informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar populaia s
nu fie prea frmiat n raport cu variabilele de grupare;
- media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai aproape
de centrul intervalului de variaie respectiv;
- s nu existe grupe vide;
- reprezentarea grafic a seriei rezultate s permit conturarea unei regularit i a fenomenului
de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu este posibil nici n cazul
unui numr mic de intervale deoarece se pierd prea multe date, nici n cazul unui numr
prea mare de intervale, populaia frmindu-se prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport cu
variabila X este normal, urmtoarea expresie:
lx =
xmax xmin
1 + 3,322 lg N
(2.1)
(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul fiind
orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n cazul n care
acestea vor fi de lungime egal. Se elaboreaz seria de intervale de lungime egal dup cum urmeaz:
[x ; (x + l )) ... [xmin + (k 1)lx ; (xmin + klx )) ... [xmin + (R 1)lx ; (xmin + R lx ))
X : min min x
N1
Nk
NR
dac se presupune c au rezultat R intervale, unde Nk, k = 1, R reprezint volumele claselor n care s-a
structurat populaia.
Nu ntotdeauna mprirea domeniului de variaie a variabile n intervale de lungime egal este
relevant din punct de vedere al scopului urmrit n ceea ce privete desprinderea tipurilor calitative
din cadrul populaiei cercetate. Numeroase sunt cazurile practice n care studiul unei populaii n
raport cu o variabil sau mai multe presupune mprirea domeniilor de variaie ale acestora n
intervale de lungime neegal. n asemenea cazuri nu exist o relaie de calcul n acest sens. Stabilirea
intervalelor de variaie se face n direct legtur cu variaia variabilelor i distribuirea unitilor n
raport cu acestea.
Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative atunci
clasele se stabilesc n raport cu fiecare din variabilele considerate prin strile acestora (vezi seria 1.5,
cap. 1).
Nu este recomandat ca numrul variabilelor n raport cu care se studiaz populaia s fie prea
mare, deoarece aceasta duce la o divizare exagerat a populaiei pierzndu-se din vedere aspectele
principale.
Dup ce clasele au fost definite, are loc repartizarea unitilor populaiei n clasele respective,
folosind n acest scop un algoritm adecvat.
Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe statistice
cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical
Analysis System), STATGRAPHICS, etc.
2 - 10 ani
2 - 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
sub 6 luni
2 - 10 ani
peste 10 ani
sub 6 luni
peste 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
2 - 10 ani
6 luni - 2 ani
2 - 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
2 - 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
peste 10 ani
2 - 10 ani
2 - 10 ani
peste 10 ani
6 luni - 2 ani
2 - 10 ani
peste 10 ani
peste 10 ani
peste 10 ani
6 luni - 2 ani
peste 10 ani
2 - 10 ani
2 - 10 ani
2 - 10 ani
Mobifon
Mobifon
Nici una
Nici una
Orange
Orange
Nici una
Orange
Orange
Orange
Orange
Mobifon
Nici una
Nici una
Mobifon
Mobifon
Nici una
Orange
Nici una
Mobifon
Orange
Nici una
Orange
Orange
Nici una
Nici una
Nici una
Orange
Nici una
Mobifon
Orange
Nici una
Nici una
Nici una
Orange
Mobifon
Nici una
Orange
Nici una
Nici una
Nici una
Mobifon
Nici una
Mobifon
Orange
Nici una
Mobifon
Orange
Orange
Mobifon
Orange
Mobifon
Orange
Nici una
Orange
Orange
Mobifon
Orange
Nici una
Nici una
Nici una
Orange
Mobifon
Nici una
Mobifon
Mobifon
Orange
Orange
Orange
Orange
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Abonament social
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 0 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Abonament social
Cu 0 impulsuri
Cu 0 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 100 impulsuri
Cu 50 impulsuri
Cu 100 impulsuri
50000 - 290000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
290001 - 530000
1490001 - 1730000
50000 - 290000
peste 2000000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
530001 - 770000
1490001 - 1730000
770001 - 1010000
530001 - 770000
50000 - 290000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
50000 - 290000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
530001-770000
290001 - 530000
1010001 - 1250000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
290001 - 530000
290001 - 530000
50000 - 290000
290001 - 530000
50000 - 290000
50000 - 290000
290001 - 530000
290001 - 530000
530001 - 770000
1010001 - 1250000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
50000 - 290000
530001 - 770000
290001 - 530000
530001 - 770000
530001 - 770000
50000 - 290000
50000 - 290000
50000 - 290000
1730001 - 2000000
770001 - 1010000
50000 - 290000
50000 - 290000
50000 - 290000
530001 - 770000
530001 - 770000
50000 - 290000
770001 - 1010000
50000 - 290000
770001 - 1010000
50000 - 290000
770001 - 1010000 .
290001 - 530000
2
3
2
4
4
4
2
1
1
5
5
3
4
2
1
2
5
3
3
1
5
5
5
1
3
3
5
1
2
3
4
5
5
3
3
3
5
4
3
3
1
3
2
4
3
4
4
4
3
3
2
2
2
5
3
2
1
2
1
1
4
1
3
2
2
3
4
4
nesatisfacatoare
satisfacatoare
slaba
foarte buna
satisfacatoare
satisfacatoare
buna
buna
buna
foarte buna
foarte buna
satisfacatoare
buna
buna
foarte buna
buna
foarte buna
satisfacatoare
buna
nesatisfacatoare
foarte buna
foarte buna
buna
buna
buna
satisfacatoare
satisfacatoare
slaba
satisfacatoare
satisfacatoare
buna
foarte buna
slaba
foarte buna
buna
buna
foarte buna
foarte buna
satisfacatoare
satisfacatoare
buna
buna
satisfacatoare
satisfacatoare
nesatisfacatoare
buna
buna
satisfacatoare
nesatisfacatoare
satisfacatoare
satisfacatoare
satisfacatoare
satisfacatoare
foarte buna
satisfacatoare
satisfacatoare
slaba
satisfacatoare
buna
buna
nesatisfacatoare
satisfacatoare
buna
satisfacatoare
satisfacatoare
satisfacatoare
buna
buna
satisfacatoare
5 buna
nu stiu
da
da
da
da
da
nu stiu
nu stiu
nu
da
da
da
da
da
nu stiu
nu stiu
da
nu stiu
nu stiu
nu stiu
nu stiu
da
da
nu stiu
da
da
da
nu
nu stiu
nu
nu stiu
da
nu stiu
da
da
da
da
nu stiu
nu stiu
nu stiu
da
nu stiu
da
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu stiu
nu
nu stiu
da
da
da
nu
nu stiu
da
da
nu stiu
nu
nu stiu
nu stiu
da
nu stiu
nu stiu
da
nu stiu
da
31 si 40 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
sub 20 ani
sub 20 ani
31 si 40 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
41 si 50 ani
31 si 40 ani
peste 60ani
21 si 30 ani
51 si 60 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
sub 20 ani
51 si 60 ani
41 si 50 ani
51 si 60 ani
31 si 40 ani
21 si 30 ani
peste 60ani
21 si 30 ani
peste 60ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
31 si 40 ani
21 si 30 ani
peste 60ani
51 si 60 ani
21 si 30 ani
sub 20 ani
21 si 30 ani
.
sub 20 ani
sub 20 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
51 si 60 ani
31 si 40 ani
21 si 30 ani
peste 60ani
peste 60ani
31 si 40 ani
31 si 40 ani
sub 20 ani
21 si 30 ani
21 si 30 ani
31 si 40 ani
31 si 40 ani
31 si 40 ani
peste 60ani
21 si 30 ani
m
m
f
f
f
f
f
f
m
f
f
m
f
f
f
f
m
f
f
f
f
m
m
f
f
m
m
f
f
m
f
m
m
f
f
m
f
f
m
m
f
f
m
f
m
f
f
f
f
f
m
m
f
m
f
m
f
f
f
f
m
f
f
f
f
f
m
f
m
f
Exemple
Se consider populaia statistic format cu mulimea clienilor unei firme X, datele privind variabilele
statistice obsevate sunt redate n tabelul de mai sus.
Elaborarea seriilor statistice unidimensionale.
De ct timp suntei client?
sub 6 luni
6 luni 2 ani
2 - 10 ani
peste 10 ani
Total
Frecventa Frecventa
abso luta relativa
2
2.9
10
14.3
19
27.1
39
55.7
70
100.0
Frecventa
validata
2.9
14.3
27.1
55.7
100.0
Frecventa
relativa cumulata
2.9
17.1
44.3
100.0
Frecventa
abso luta
17
27
26
70
Frecventa
relativa
24.3
38.6
37.1
100.0
Frecventa
validata
24.3
38.6
37.1
100.0
Frecventa
Relative cumulata
24.3
62.9
100.0
Frecventa
abso luta
8
Frecventa
relativa
11.4
Frecventa
Frecventa
validata relativa cumulata
11.4
11.4
11.4
11.4
22.9
52
74.3
74.3
97.1
2.9
2.9
100.0
70
100.0
100.0
Frecventa
relativa
15.7
20.0
27.1
18.6
17.1
98.6
1.4
100.0
Frecventa
validata
15.9
20.3
27.5
18.8
17.4
100.0
Frecventa
relativa cumulate
15.9
36.2
63.8
82.6
100.0
Frecventa
relativa
51.4
17.1
15.7
7.1
2.9
2.9
1.4
1.4
100.0
Frecventa
Frecventa
Validate relativa cumulata
51.4
51.4
17.1
68.6
15.7
84.3
7.1
91.4
2.9
94.3
2.9
97.1
1.4
98.6
1.4
100.0
100.0
Frecventa
relativa
5.7
7.1
37.1
32.9
17.1
100.0
Frecventa
validata
5.7
7.1
37.1
32.9
17.1
100.0
Frecventa
relativa cumulata
5.7
12.9
50.0
82.9
100.0
Frecventa
abso luta
31
6
33
70
Frecventa
relativa
44.3
8.6
47.1
100.0
Frecventa
validata
44.3
8.6
47.1
100.0
Frecventa
relativa cumulata
44.3
52.9
100.0
Frecventa
abso luta
7
27
21
2
5
7
69
1
70
Frecventa
relativa
10.0
38.6
30.0
2.9
7.1
10.0
98.6
1.4
100.0
Frecventa
Frecventa
validata relativa cumulata
10.1
10.1
39.1
49.3
30.4
79.7
2.9
82.6
7.2
89.9
10.1
100.0
100.0
Frecventa
abso luta
46
24
70
Frecventa
relativa
65.7
34.3
100.0
Frecventa
Frecventa
validata relativa cumulata
65.7
65.7
34.3
100.0
100.0
Vrsta
sub 20 ani
21 si 30 ani
31 si 40 ani
41 si 50 ani
51 si 60 ani
peste 60ani
Total
Nu raspund
Total
Sexul
f
m
Total
La care companie de
telefonie mobila
sunteti abonat?
Total
Mobifon
Orange
Nici una
da
4
10
17
31
nu
3
3
6
nu stiu
10
14
9
33
Total
17
27
26
70
sub 20 ani
21 si 30 ani
31 si 40 ani
41 si 50 ani
51 si 60 ani
peste 60ani
Total
2
1
1
nesatisfacatoare satisfacatoare
4
2
13
2
4
buna
3
7
9
3
2
26
Total
foarte buna
7
27
21
2
5
7
69
3
5
1
2
2
23
3
12
Care a fost valoarea ultimei facturi telefonice RTC achitate de dvs.? * Ce tip de abonament RTC
folositi?
50 - 290
290 - 530
530 - 770
770 - 1010
1010 - 1250
1490 - 1730
1730 - 2000
peste 2000
Total
Total
Cu 0
Cu 50
Cu 100 Abonament
impulsuri impulsuri impulsuri
social
2
4
29
1
2
10
2
9
1
2
2
2
1
1
1
1
36
12
11
5
2
2
1
1
52
70
Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spaiu) cu privire la
forma static sau evoluia dinamic a fenomenului cuantificat de seria respectiv.
Graficul asociat unei serii constituie o imagine spaial a fenomenului de cercetat, permind
eviden ierea rapid a structurii, dinamicii i tendinei de dezvoltare a acestuia. Reprezentrile grafice
sunt folosite att n scopul cunoaterii populaiei n cauz, ct i pentru popularizarea unor rezultate
din diverse domenii de activitate.
Elaborarea complet i corect n acelai timp a unui grafic presupune elucidarea urmtoarelor
elemente: titlul graficului, scara de reprezentare, reeaua graficului, semnele convenionale i notele.
Titlul graficului trebuie s fie scurt, clar i semnificativ pentru coninutul fenomenului reliefat
prin seria considerat.
n cele mai frecvente cazuri un grafic se traseaz ntr-un sistem de axe rectangulare xOy. Pe
fiecare din cele dou axe se reprezint valorile variabilelor X, respectiv Y. Un astfel de punct marcat se
mai numete punct cotat. Scara de reprezentare reunete mulimea tuturor punctelor cotate. n cazul n
care variabila nregistreaz valori mici, gradarea scrii ncepe n principiu de la zero, dac variabila
nregistreaz valori mari se consider o alt origine stabilit cu aproximaie. Pentru a nu ncrca prea
mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un anumit interval
convenabil ales. Distanele dintre dou puncte cotate consecutive se numete intervalul graficului.
Cnd intervalele sunt egale atunci avem scri uniforme, n caz contrar avem scri neuniforme.
Scara aritmetic este o scar uniform n timp ce scara logaritmic sau cea binomial constituie
exemple de scri neuniforme.
Reeaua graficului permite identificarea cu uurin n plan sau n spaiu a punctelor
corespunztoare valorilor nregistrate de variabilele n cauz. Sistemul axelor rectangulare (n plan sau
spaiu) constituie cele mai uzuale reele n reprezentarea grafic a seriilor statistice.
Semnele convenionale se pot materializa ntr-o reprezentare grafic prin inscripii, fie printr-o
legend.
Inscripia trebuie s fie scurt i semnificativ i plasat ct mai bine n raport cu elementul
din grafic pe care l expliciteaz.
Legenda se folosete pentru a explicita folosirea semnelor, culorilor sau diverselor hauri
folosite n graficul n cauz. Legenda se plaseaz nafara graficului, n colul din stnga sau dreapta
jos.
n cazul graficelor complexe, pentru o nelegere mai bun, sunt necesare unele explicaii, care
se dau sub form de note. Notele generale privesc n ansamblu graficul i se plaseaz chiar sub titlul
graficului. Notele speciale privesc poriuni din grafic i sunt legate de acestea prin diverse semne de
trimitere. Notele se plaseaz n partea de jos a diagramei, n colul din stnga sub reea.
n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n
reprezentarea seriilor statistice ce descriu fenomenele social-economice.
Histograma
Graficul specific seriilor care au la baz o variabil continu (de intervale) este histograma.
Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe abscis se trec
intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara frecvenelor se construiete
n conformitate cu respectarea principiului proporionalitii ntre frecvene i segmentele delimitate pe
scara ordonatelor. Pentru fiecare interval de variaie a seriei (xi-1 xi) se construiete un dreptunghi a
crui baz este chiar lungimea intervalului, iar cealalt latur se determin din condiia
proporionalitii ariei dreptunghiului cu mrimea indicatorului n clasa respectiv.
Latura necunoscut a dreptunghiului, notat cu Li se determin din urmtoarea relaie:
Li . li = k . Ni
(2.2)
unde:
li = latura cunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
Li = latura necunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
Ni = frecvena absolut a clasei i;
k = un coeficient de proporionalitate care se alege n raport cu scara de reprezentare.
Din relaia (2.2) se deduce Li:
N
Li = k i ,
i = 1, R
li
unde: li = xi - xi-1, adic diferena dintre limita superioar i cea inferioar a intervalului de variaie.
Mulimea tuturor dreptunghiurilor astfel determinate, formeaz histograma ataat seriei.
Poligonul frecvenelor
Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv cantitativ
continu i format cu frecvene absolute sau relative, simple sau cumulate. Trasarea acesteia
presupune realizarea n prealabil a histogramei. Poligonul frecvenelor se obine unind prin segmente
de dreapt mijloacele laturilor superioare ale dreptunghiurilor, din care este alctuit histograma.
Poligonul frecvenelor poate fi construit i direct, fr intermediul histogramei. Aceasta
presupune ridicarea de perpendiculare din mijlocul fiecrui interval de variaie, a cror
lungimi(inaltimi) sunt proporionale cu frecvenele intervalelor corespondente. Unind prin segmente
de dreapt vrfurile acestor perpendiculare, se obine graficul dorit. Graficul produce o imagine a
funciei densitate de probabilitate empirice (n cazul utilizrii frecvenelor simple), sau a funciei de
repartiie empiric (n cazul utilizrii frecvenelor cumulate). Poligonul frecvenelor este un grafic
important pentru aproximarea formei distribuiei populaiei studiate, ct i pentru compararea a dou
distribuii pe aceeai diagram.
Exemplu i figura
Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de repartiie reprezentnd populaia
Romniei sub 40 de ani pe grupe de vrst.
Grupa
de vrst (ani)
04
59
10 14
15 19
20 24
25 29
30 34
35 39
Populaia
1147065
1330733
1737153
1701881
1978835
1792822
1698268
1335039
populatia
04
59
10 14
15 19
20 24
25 29
30 34
35 39
Diagramele de structur
Punerea n eviden sub form grafic a structurii unei populaii statistice este posibil apelnd
la diagramele de structur. n acest sens se prezint: dreptunghiul, ptratul, cercul i semicercul de
structur. Aceste tipuri de grafice permit reprezentarea grafic a seriilor unidimensionale construite cu
mrimi de structur( frecvene relative, greutate specific). Cel mai des folosit este cercul de structur
denumit i diagrama sectorial (piechart).
Cercul de structur
i = f i (%).
360o
100%
(2.3)
Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd distribuia
voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie 1996:
Formaiunea
Politic
Voturi
Obinute (%)
CDR
PDSR
USD
UDMR
PRM
PUNR
37,0
28,7
16,1
7,7
5,6
4,9
5,60%
4,90%
7,70%
37%
CDR
PDSR
USD
UDMR
PRM
PUNR
16,10%
28,70%
Semicercul de structur
Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribuia unei populaii n
raport cu o variabil cantitativ discret sau calitativ. Benzile au aceeai lime (baz), iar lungimea
(nlimea) lor este direct proporional cu frecvena clasei reprezentate. Numrul benzilor este egal cu
numrul claselor n care este mprit populaia studiat. De asemenea se pot lua n considerare o
variabil sau dou. n reprezentri se utilizeaz benzi simple sau benzi grupate. Poziia benzilor poate
fi orizontal sau vertical.
Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd nivelul PNB/loc
n $ calculat pe baza puterii de cumprare n Romnia i alte ri est-europene, n 1998
ara
PNB/loc ($)
Bulgaria
4683
Cehia
12197
Polonia
7543
Romnia
6153
Slovacia
9624
Ungaria
9832
9624
9832
Slovacia
Ungaria
7543
8000
6153
6000
4683
4000
2000
0
Bulgaria
Cehia
Polonia
Romnia
Cronograma (historiograma)
Y :
y0 y1 y2 ... yt ... yT
unde: t = 0,T , reprezint momentele (sau perioadele) de timp care se reprezint pe axa absciselor, iar
mrimile yt se reprezint pe axa ordonatelor. Fiecrei perechi de valori (t, yt), t = 0,T i corespunde un
punct n planul axelor rectangulare. Unind prin segmente de dreapt punctele consecutive, astfel
determinate, se obine ceea ce se numete cronogram. La construirea cronogramei trebuie avut n
vedere dac seria cronologic este de momente sau de intervale. Cnd se reprezint o serie cronologic
de momente, caz n care indicatorii seriei nu se pot nsuma, momentul t se trece n dreptul gradaiei
respective. n cazul reprezentrii unei serii cronologice de intervale, unde indicatorii se pot nsuma,
perioadele se trec n dreptul segmentelor ce reprezint perioada respectiv.
n acelai sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care pot fi
exprimate n aceeai unitate de msur sau n uniti de msur diferite. n cazul n care indicatorii cu
care sunt construite seriile sunt exprimai n aceeai unitate de msur, atunci pe axa ordonatelor se
construiete o singur scar, iar dac indicatorii seriilor sunt exprimai n uniti de msur diferite,
atunci se construiesc scri de reprezentare corespunztoare pe axa ordonatelor. Cronogramele asociate
unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii i sesizarea
perioadelor critice n evoluia acestora.
Exemplu: Din Anuarul Statistic al Romniei (2000) am extras seria care urmeaz, rednd numrul
total de autoturisme nscrise n circulaie la sfritul anului n Romnia n perioada 1994-1999.
Anul
Autoturisme
nmatriculate
1994
2020017
1995
2197477
1996
2391869
1997
2605465
1998
2822254
1999
2980014
3500000
3000000
2500000
2000000
1500000
1000000
500000
0
1993
1994
1995
1996
1997
1998
1999
2000
anul
Cartograma i cartodiagrama
Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor statistice de
spaiu. Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaiului (sub form
de hart) n interiorul cruia se manifest fenomenul care este cuantificat de seria de reprezentat. n
interiorul hrii astfel realizat, prin diverse culori sau nuane ale aceleiai culori, prin hauri sau prin
diferite diagrame, este evideniat intensitatea dezvoltrii fenomenului cercetat precum i mrimea
indicatorilor seriei.
Cartograma n culori sau nuane ale aceleiai culori se utilizeaz pentru redarea intensitii
manifestrii unui fenomen. Acest tip de grafic este recomandat n special atunci cnd intensitatea
fenomenului surprins de seria de spaiu nu prezint o variaie prea mare pentru a nu apela la prea multe
culori sau nuane ale acestora, care s ngreuneze citirea graficului.
Cnd realizarea unei cartograme n culori este prea costisitoare sau culorile i nuanele sunt
greu de reprodus este utilizat cartograma prin hauri. i n acest caz densitatea haurilor trebuie s
redea diferene de intensitate a fenomenului n spaiu surprins de seria de reprezentat. Dup ce harta a
fost desenat i mprit n conformitate cu strile variabilei de spaiu ce st la baza seriei, n
interiorul fiecrei subdiviziuni se utilizeaz hauri a cror intensitate s fie proporional cu
intensitatea fenomenului cuantificat de indicatorul cu care s-a construit seria.
Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spaiu, realizndu-se
ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi,
cerc, ptrat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de spaiu ce exprim volumul
investi iilor strine pe judee, la noi n ar, se procedeaz astfel: n primul rnd se deseneaz harta
Romniei, delimitndu-se judeele; n cadrul fiecrui jude se deseneaz o figur geometric oarecare
convenabil aleas, a crei arie sau mrime s fie direct proporional cu volumul investiiilor strine
din judeul respectiv.
i acest tip de reprezentare grafic i are o larg aplicabilitate n special n urmrirea acelor
fenomene de natur economic sau social care sunt urmrite n spaiu.
Norul statistic
Nr. crt.
Cerere (C)
1
2
3
4
5
6
7
8
9
10
11
12
13
Pre (P)
15,4
3,2
4,9
10,5
8,0
5,1
7,6
11,3
14,0
6,4
13,2
8,8
12,1
Venit (V)
1,4
5,1
2,5
1,7
1,8
3,4
2,1
1,6
3,6
3,5
1,9
1,8
1,9
620
530
490
800
630
410
670
920
990
320
520
700
730
cerere
12
10
8
6
4
2
0
0
3
pret
CAPITOLUL 3
PARAMETRII REPARTIIILOR
EMPIRICE UNIDIMENSIONALE
Organizarea datelor rezultate din observarea statistic sub form de serie de frecvene,
constituie o prim etap a prelucrrii acestora. O serie statistic red sub form rezumativ (sintetic)
o prim imagine asupra populaiei de studiat n raport cu variabila de la baza seriei.
Pornind de la repartiia statistic, ca form sintetic de prezentare a rezultatelor observrii, se
pot deduce o serie de caracteristici specifice populaiei considerate, cum ar fi:
- nivelul mediu al variabilei;
- structura populaiei n raport cu variabila considerat;
- variaia variabilei n raport cu nivelul mediu al acesteia;
- forma dup care se dispun unitile populaiei n jurul valorii medii.
Caracterizarea numeric a acestor aspecte poate fi realizat prin urmtorii parametri
(caracteristici):
- parametrii tendinei centrale;
- parametrii de structur;
- parametrii variaiei;
- parametrii concentrrii;
- parametrii formei.
Se prezint, n cele ce urmeaz, aspecte legate de definirea, semnificaia i modaliti de calcul
pentru fiecare parametru.
3.1. Parametrii tendinei centrale
Parametrii din aceast grup au menirea de a eviden ia poziia n jurul creia se grupeaz
ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat printr-un numr se
numete poziie central. Ea poate fi evideniat prin:
- valoarea medie X ;
- valoarea median (M e ( X )) ;
- valoarea modal (M o ( X )) .
( )
A. Valoarea medie
Valoarea medie reprezint principalul parametru care caracterizeaz tendina central a unei
repartiii statistice.
n vederea definirii parametrului valoarea medie se consider o populaie statistic studiat n
raport cu variabila cantitativ X i o func ie G(x1,x2,,xR) unde xi, i = 1, R , reprezint strile variabilei
X. Funcia G exprim o anumit nsuire esenial, un atribut al populaiei n raport cu variabila X.
Aceast funcie se numete funcie determinant.
Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant funcia
determinant, adic:
(3.0)
G ( x1 , x 2 ,..., x R ) = G X , X ,..., X .
G (x1 , x2 ,..., x R ) = xi N i
i =1
semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de copii pe
familie se particularizeaz relaia (3.0) dup cum urmeaz:
R
x N = X N
i
i =1
i =1
de unde rezult:
R
x
X =
Ni
i =1
R
i =1
La acelai rezultat se putea ajunge pornind de la faptul c numrul mediu de copii pe familie se poate
exprima ca un raport ntre numrul total de copii i numrul de familii din localitatea respectiv, adic:
Cunoaterea naturii parametrului valoare medie, conduce la o definiie mai complet i plin
de semnificaie.
Pentru a nelege semnifica ia valorii medii X , trebuie subliniat faptul c, n general, variaia
unui fenomen, de orice natur, i n particular variaia unei variabile X n raport cu care este cercetat o
populaie, este determinat de aciunea simultan a dou categorii de factori: factori eseniali i factori
neeseniali.
n categoria factorilor eseniali intr acei factori care acioneaz asupra tuturor unitilor
populaiei n mod continuu i n acelai sens, determinnd, n principal, nivelul de dezvoltare a
variabilei pentru fiecare unitate component din populaie.
Factorii eseniali se conjug n aciunea lor cu factorii neeseniali, care, n general, au un
caracter aleator, sunt numeroi i neuniform rspndii printre unitile populaiei.
Fiecare din factorii considerai neeseniali acioneaz numai asupra unui anumit numr de
unit i din populaie. Ca urmare, acetia pot contribui fie la creterea nivelului variabilei (pentru unele
unit i din populaie), fie la scderea nivelului variabilei (pentru alte uniti din populaie).
La rndul lor factorii eseniali nu acioneaz cu aceeai intensitate asupra tuturor unitilor din
cadrul populaie considerate, determinnd, n acest fel, variaia neuniform a variabilei respective n
cadrul populaiei.
n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a unei serii
statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea nregistra variabila n
cadrul populaiei cercetate n condiiile n care factorii neeseniali nu s-ar fi manifestat, iar factorii
eseniali ar fi acionat asupra unitilor din populaie cu aceeai intensitate.
Parametrul valoarea medie, calculat pentru o serie statistic, pune n eviden ceea ce este
comun, general i esenial sub aspectul nivelului de dezvoltare al variabilei, n raport cu care este
studiat o populaie.
n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a indicatorilor
cu care aceasta este construit, exist mai multe posibiliti de calcul a valorii medii.
Funcia determinat G, sub forma sa cea mai general, are urmtoarea expresie analitic:
1
R K
K
G( x1 , x 2 ,..., x R ) = xi f i
i =1
(3.2)
de unde rezult:
xi
X :
f i i =.1, R
(3.5)
Avnd n vedere respectarea relaiei (3.0) se gsesc urmtoarele expresii de calcul pentru media
aritmetic:
- n cazul seriilor de forma (3.4) se obine:
i =1
i =1
xi N i = X N i
de unde rezult:
R
Ni
i =1
X =
(3.6)
i =1
fi = X fi
i =1
i =1
de unde rezult, prin definiie, media aritmetic ponderat, exprimat cu ajutorul frecvenelor
relative, respectiv:
R
x
X=
fi
i =1
R
= xi f i
(3.7)
i =1
i
i =1
Expresia (3.6) reprezint, prin definiie, expresia de calcul a mediei aritmetice ponderate pentru o serie
discret, unde ponderile sunt nsi frecvenele absolute N1, N2,NR.
Pentru cazul particular n care frecvenele absolute sunt egale ntre ele, adic:
N1 = N2 = = NR = C
Relaia de calcul (3.6) devine:
R
xi C
X =
i =1
R
C xi
=
i =1
CR
x
=
i =1
(3.8)
i =1
X :
f i i =.1, R
(3.9)
Dac s-ar cunoate densitatea f(x) a variabilei X, atunci, prin definiie, media aritmetic teoretic
(sperana matematic) a acesteia, notat cu E(X), ar fi:
+
E ( X ) = xf ( x)dx
(3.9)
f1
f2
fR
,
,....,
x1 x 0 x 2 x1
x R x R 1
Aplicnd relaia de calcul (3.9) se deduce expresia de calcul a mediei aritmetice, dup cum urmeaz:
XR
E( X ) = M ( X ) = X1 = X =
R
i =1
xi
xf ( x)dx
X0
i =1 xi 1
fi
dx =
xi xi 1
i
R
R
fi
fi
x2
fi
x 2 xi21
x dx =
/ xxii 1 =
i
=
xi xi 1 xi 1
2
2
i =1 xi xi 1
i =1 xi xi 1
R
fi
x + xi 1
(xi + xi 1 ) = i
fi
2
i =1 2
i =1
x +x
Folosind notaiile: i i 1 = xi' , X 1 = M ( X ) = E ( X )
2
'
unde x i reprezint mijlocul intervalului i, ob inem relaia:
X = xi' f i
(3.10)
i =1
Relaia (3.10) ne arat c media aritmetic a unei serii de intervale se reduce la media aritmetic a unei
serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de variaie.
Pentru cazul particular de serie care are la baz o variabil alternativ de forma:
1
0
X :
N1 N 2
calculnd media aritmetic, obinem:
R
x
X =
Ni
i =1
0 N 1 + 1 N 2 N 2
=
= f2
N1 + N 2
N
(3.11)
i =1
Ca urmare, media aritmetic a unei serii care are la baz o variabil alternativ coincide cu frecvena
relativ a strii notat cu 1.
n vederea nelegerii mai profunde a celor prezentate mai sus, se consider, n cele ce urmeaz,
dou exemple concludente n acest sens.
Exemplu
Angajaii unei societi comerciale se distribuie dup salariul lunar cuvenit conform urmtoarei serii
de reparaie continu :
1,6 2,0 2,0 2,4 2,4 2,8 2,8 3,2 3,2 3,6 3,6 4,0
X :
13
18
6
4
2
7
unde variabila X este exprimat n milioane lei. Pentru determinarea salariului mediu pe angajat, se
recurge la transformarea seriei de intervale ntr-o serie discret, dup cum urmeaz:
X :
7 13 18 6 4 2
Salariul mediu se determin astfel:
6
x N
X =
'
i
i =1
i =1
Presupunem
c
este
necesar
determinarea
ponderii
agenilor
economici,
dintr-un anumit jude care au nregistrat pierderi n anul calendaristic ncheiat. Datele nregistrate de la
institu iile competente se aranjeaz ntr-o serie alternativ de forma:
1
0
.
X :
850 150
unde starea 1 pentru variabila X corespunde acelor ageni care au nregistrat pierderi n anul
considerat. Media (ponderea) agenilor cu capital de stat care au nregistrat pierderi se determin
astfel:
6
x N
X =
'
i
i =1
i =1
n judeul considerat, 15% din agenii economici cu capital de stat au nregistrat pierderi n anul
calendaristic considerat.
Proprieti ale mediei aritmetice
Prezentarea celor mai reprezentative proprieti ale mediei aritmetice prezint importan din punct de
vedere al aplicaiilor practice, ilustrnd, n acest fel, i posibilitile de calcul simplificat al acestui
indicator. n acest sens, prezentm urmtoarele proprieti:
1 Media aritmetic a unei constante este egal cu constanta respectiv, adic, dac la baza
unei serii se afl o variabil care a nregistrat o singur stare, X = C, atunci aplicnd relaia de calcul a
valorii medii se obine:
M ( X ) = M (C ) = C = C
(3.12)
2 Media produsului dintre o variabil X i o constant k este egal cu produsul dintre media
variabilei X i constanta respectiv:
R
i =1
i =1
M ( k X ) = k xi fi = k xi f i = k X = k M ( X )
(3.13)
unde, am considerat o serie discret format cu frecvene relative. n acelai mod se procedeaz i
n cazul unei serii de frecvene absolute.
3 Media aritmetic a sumei a dou sau mai multe variabile este egal cu suma mediilor acestora:
M(X1 + X2 + + Xr) = M(X1) + M(X2) + + M(Xr)
(3.14)
Pentru a nu ngreuna scrierea i pentru a nelege mai bine, se demonstreaz aceast proprietate pentru
cazul a dou variabile X, Y. Se consider o populaie cercetat n raport cu cele dou variabile X i Y
pentru care se cunoate X i Y i se intenioneaz calcularea mediei M(X + Y). Rezultatele cercetrii
se dau sub forma tabelului 1:
Tabelul.1
X
Y
ym
x1
x2
xi
xn
TOTAL
N1m
N2m
Nim
Nnm
N.m
-----------------------------------------------
.
yj
.
N1j
N2j
Nij
Nnj
N.j
.
-----------------------------------------------
y2
N12
N22
Ni2
Nn2
N.2
y1
N11
N21
Ni1
Nn1
N.1
TOTAL
N1.
N2.
Ni.
Nn.
xi Ni.
M (X ) =
i =1
x N
i
i =1
i.
i.
i =1
y
M (Y ) =
j =1
N
j =1
N. j
.j
j =1
N. j
(x
M (X +Y ) =
j =1
j =1
j =1
n
ij
i =1 j =1
m
m
m
n
n
n
1
= x1 N ij + ... +xi N ij + ... +xn N nj + ... + y1 N i1 + ... + y j N ij + ... + ym N im =
N
j =1
j =1
j =1
i =1
i =1
i =1
1
(x1 N1. + ... + xi Ni. + ... + xn N n. + ... + y1 N.1 + ... + y j N. j + ... + ym N.m ) =
N
= M(X) + M(Y)
4 Media produsului a r variabile dou cte dou independente este egal cu produsul mediilor
acestora:
M(X1 X2 XR) = M(X1) M(X2) M(Xr)
(3.16)
Din aceleai motive ca i n cazul propriettii anterioare, se va demonstra aceast proprietate pentru
cazul particular, cnd r = 2. Vom nota cele dou variabile cu X i Y. Pornind de la seria
bidimensional dat sub form tabelar (vezi tabelul nr.1), rezult:
n
x
M (X Y ) =
y j N ij
i =1 j =1
n
(3.17)
ij
i =1 j =1
(3.18)
xi y j Ni. N. j
i =1 j =1
n
M (X Y ) =
Nj
i =1 j =1
i =1
j =1
m
i.
i =1
j =1
m
N N
i.
i =1
=
.j
j =1
xi Ni.
=
xi Ni. y j N. j
N. j
i =1
= M ( X ) M (Y ).
.j
j =1
Pornind de la cele patru proprieti ale mediei aritmetice se pot deduce o serie de consecine ale
acestora, frecvent ntlnite n calcule statistice privind media. Prezentm n acest sens urmtoarele
consecine:
a) Fcnd media sumei dintre o variabil X i o constant C se obine suma dintre media variabilei
i constanta respectiv:
M(X + C) = M(X) + C
(3.19)
(3.20)
Aceast ultim relaie, 3.20, conduce la concluzia conform creia, dac strile unei variabile
cantitative cresc sau descresc cu o constant C, atunci i media noii variabile obinute crete sau
descrete cu acea constant.
b) Dac valorile unei variabile X sunt simplificate cu o constant, atunci media variabilei X
descrete de acel numr de ori.
Dac n proprietatea 2, constanta este de forma 1/k, atunci, relaia (3.13) devine:
X 1
M = M (X )
k k
de unde rezult:
X
M (X ) = k M
k
(3.21)
Z=
X C
k
(3.22)
(3.23)
Aceast ultim relaie (3.23), constituie formula de calcul simplificat a mediei aritmetice.
Avantajul maxim privind aplicarea acestei relaii se obine alegnd pentru constanta C starea de
mijloc a seriei care are la baz variabila X, iar pentru k valoarea care reprezinta cel mai mare
divizor comun al tuturor diferenelor X-C.
Formula (3.23) se particularizeaz dup cum seria, care are la baz variabila X, este o serie
construit cu frecvene absolute sau cu frecvene relative:
- n cazul unei serii construit cu frecvene absolute, de forma:
x
X : i
N i i =1, R
se ob ine:
R xi C
k N i
k + C
X = i =1 R
Ni
i =1
(3.24)
(3.25)
Formulele (3.24) i (3.25) se aplic n mod frecvent, sub denumirea de formula de calcul
simplificat, pentru determinarea mediei aritmetice, n cazul seriilor construite cu indicatorii
frecven absolut i relativ.
C1
C2
CP
TOTAL
N1R
N2R
NPR
N.R
-------------------------------
x2
N12
N22
NP2
N.2
x1
N11
N21
NP1
N.1
TOTAL
N1.
N2.
NP.
1 R
x i N .i
N i =1
1 R
xi N1i
N1. i =1
X2 =
1 R
xi N 2i
N 2. i =1
................................
XP =
1 R
xi N Pi .
N P. i =1
1 P
1
X i Ni. = N X 1 N1. + X 2 N 2. + .... + X P N P. =
N i =1
1
[(x1 N11 + x2 N12 + ... + xR N1R + ) + ( x1 N 21 + x2 N 22 + ... + xR N 2 R + ) +
N
+ ... + ( x1 N P1 + x 2 N P 2 + ... + x R N PR )] =
1
[ x1 ( N11 + N 21 + ... + N P1 ) + ... + x2 ( N12 + N 22 + ... + N P 2 ) + ... + xR (N1R + N 2 R + ... + N PR )] =
N
1
1 R
= (x1 N.1 + x2 N.2 + ... + xR N. R ) = xi N.i = X .
N
N i =1
=
X = X / C.
Urmtoarele trei proprieti ale mediei aritmetice nu sunt lipsite de importan att pentru uurina
calculelor ct i pentru capitolele care urmeaz.
5 Dac frecvenele absolute cu care s-a construit o serie, se simplific cu o constant, atunci media
aritmetic a seriei respective nu se modific.
Se consider seria de forma:
xi
X :
N i i =1, R
Ni
, unde d reprezint o valoare cu care se divid toate frecvenele absolute. Se
d
formeaz o nou serie cu aceste frecvene:
Se noteaz cu N i' =
x
X ' : i '
N i =1, R
a crei medie aritmetic este:
R
'
X =
xi N i'
xi
i =1
i =1
'
i
i =1
i =1
Ni
d
Ni
d
x
=
Ni
i =1
=X
i =1
Pentru a se obine un maxim de eficien din punct de vedere a volumului calculelor mediei
aritmetice, este nevoie ca d s fie ales drept cel mai mare divizor comun a tuturor frecvenelor
absolute cu care a fost construit seria.
6 Media aritmetic a unei serii este cuprins ntre valoarea minim i valoarea maxim pe care o
nregistrez variabila X, care st la baza seriei.
x min X x max
Aceast dubl inegalitate rezult din urmtorul ir de inegaliti:
R
x min =
x min N i
xi N i
i =1
i =1
i =1
N
i =1
=X
N
i =1
max
Ni
= x max .
i =1
7 Suma abaterilor liniare ale valorilor unei variabile de la media aritmetic este nul.
Pornind de la o serie, care are la baz o variabil cantitativ X, de forma:
x
X : i
f i i =1, R
printr-o transformare adecvat rezult urmtoarea serie:
(X X ): x
f i i =1, R
(3.26)
M X X = x i X f i = x i X f 1 + x 2 X f 2 + ... + x R X f R =
i =1
= x1 f 1 + x 2 f 2 + ... + x R f R X ( f 1 + f 2 + ... + f R ) = X X = 0
tocmai ceea ce s-a afirmat n enunul acestei proprieti.
8 Proprietatea de minim a mediei aritmetice, se formuleaz astfel:
M ( X X ) 2 M ( X x0 ) 2
unde x0 este un numr real oarecare.
ntr-adevr, din:
(x 0 ) = M ( X x 0 ) 2
rezult:
' ( x 0 ) = 2 M ( X x 0 ) = 0
de unde:
x0 = M(X) c.c.t.d.
Deci, valoarea medie a unei serii calculat cu media aritmetic, n sensul metricii folosite, e cea mai
apropiat de ansamblul valorilor variabilei X.
Exemplu
X :
13
18
6
4
2
7
unde valorile variabilei X sunt exprimate n milioane lei.
Aplicnd relaia de calcul simplificat (3.24), unde C=260, iar k=40, se obine:
R xi C
k N i
k +C =
X = i =1 R
Ni
i =1
1,80 2,60
2,20 2,60
2,60 2,60
3,00 2,60
3,40 2,60
7 +
13 +
18 +
6 +
4
40
40
40
40
40
=
40 +
50
3,80 2,60
2
40
40 + 2,60 = 0,14 0,13 + 0,06 + 0,08 + 0,06 40 + 2,60 = 0,28 + 2,60 =
+
50
50
5
= 2,544 .. mil.lei
2. Media armonic
(3.27)
n cazul unei serii discrete de forma (3.27), media armonic notat cu X 1 se definete prin:
R
N
X 1 =
i =1
(3.28)
1
Ni
i =1 x i
R
N
X 1 =
i =1
R
i =1
1
N*
xi
i =1
(3.29)
1
xi
x x
X : i 1 i
N i i =1, R
procednd ca la media aritmetic, pentru media armonic rezult:
R
N
X 1 =
i =1
1
Ni
'
i =1 x i
R
(3.30)
X 1 =
R
R
i =1
1
x i'
(3.31)
1 Media armonic este cuprins ntre cea mai mic i cea mai mare valoare a variabilei X,
nregistrat n populaia cercetat
x min X 1 x max
Dubla inegalitate este rezultat din:
R
x min =
Ni
Ni
i =1
i =1
X 1 =
i =1
min
Ni
1
Ni
i =1 x i
i =1
x
i =1
= x max
Ni
max
2 Dac valoarea medie a unei serii avnd la baz variabila X, a fost calculat cu indicatorul media
armonic, atunci, trebuie s fie verificat urmtoarea rela ie:
R
x
i =1
i =1
X 1
Ni =
Ni
3 Media armonic a unei serii nu se modific dac ponderile ce intervin n calculul acestui
indicator se simplific cu aceeai constant. Efectul maxim privind simplificarea volumului de
calcule, se ob ine dac se alege cel mai mare divizor comun al tuturor ponderilor, cu care urmeaz a
se simplifica acestea.
4 Pentru dou serii, care au la baz aceeai variabil X de forma:
x
X : i
N i i =1, R
x
X : i
mi i =1, R
(3.32)
X 1 =
mi
k xi N i
i =1
i =1
i =1
i =1
1
mi
xi
1
k xi N i
i =1 x i
R
Ni
=X
i =1
Ca urmare, dac ntre cele dou sisteme de ponderi mi i Ni exist o relaie de forma (3.32), media
armonic este identic cu media aritmetic.
Exemplu
Se consider o ntreprindere industrial format din 5 secii unde se cunosc productivitile medii n
fiecare secie la nivel de muncitor ct i a realizrilor totale la nivelul fiecrei secii. Datele din
tabelul 3 redau acest lucru:
Tabelul nr.3
Secia
TOTAL REALIZRI
300
300.000
400
450.000
350
400.000
380
420.000
420
500.000
m
X 1 =
i =1
i =1
1
mi
xi
Ungaria
Romnia
Austria
Cehia
Slovacia
di
107
93
97
129
110
Ni 9.981.334 22.303.522 8.150.835 10.241.138 5.414.937
unde: di densitatea medie a populaiei rii i (loc/km2);
Ni numrul locuitorilor din ara i (loc).
S se calculeze densitatea medie a populaiei pe ansamblul rilor supuse observrii.
Dac considerm densitatea medie a grupului de ri ca o medie aritmetic ponderat, ponderile fiind
numrul de locuitori ai rii respective, obinem:
i d i N i
d =
= 104 loc/km2
N
i
i
La punctele a) i b) se obin rezultate diferite. Se pune problema care dintre cele dou relaii de calcul
este corect.
Conform criteriului raportului, valoarea medie trebuie s fie un raport just, logic, ntre dou mrimi. n
cazul nostru densitatea medie este egal cu numrul de locuitori pe ansamblul arilor considerate
raportat la suma suprafeelor rilor respective. Ob inem astfel n cele dou cazuri:
a) Dac avem la dispoziie date cu privire la di i Ni :
d=
N total
=
S totala
N
S
d=
N total
=
S totala
d
i
N
S
Ni
d S
S
i
Ca urmare, calculul densitii medii ca o medie aritmetic ponderat, ponderile fiind numrul de
locuitori ai rilor respective este incorect. Dac vrem s folosim numrul de locuitori ca ponderi,
vom putea doar printr-o medie armonic ponderat.
3. Media geometric
Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media geometric
notat cu X g (sau X o ) este definit prin expresia:
(3.33)
Din (3.33), pentru media geometric ponderat exprimat cu frecvene relative se deduce:
1/ N
Xg =
N1
N2
NR
x 2 ... x R
R N
= x i i
i =1
Ni / N
= xi
i =1
= xi i
(3.34)
i =1
Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru
diversele variante de medie geometric, rmn variabile cu singura modificare c valorile xi,
i = 1, R , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei:
xi' =
xi 1 + xi
,
2
i = 1, R
(3.35)
n practica statistic, privind calculul valorii medii a unei serii atributive unidimensionale, cei mai
frecvent utilizai indicatori sunt media aritmetic i media armonic. Exist totui situaii cnd seria
statistic are la baz o variabil ale crei stri sunt puteri superioare lui 1 (xik ) . Valoarea medie, a
unor astfel de serii, se determin cu ajutorul momentului de ordin corespunztor la care sunt
ridicate strile variabilei. Indicatorul media ptratic, notat cu X 2 , corespunde cazului particular
cnd valorile variabilei X sunt la puterea 2, (k=2). Relaia de calcul pentru media ptratic este
urmtoarea:
R
2
i
Ni
i =1
X2 =
(3.36)
i =1
Formula de calcul (3.36) corespunde cazului cnd seria are la baz o variabil X i este construit
cu frecvene absolute. n cazul n care seria este construit cu frecvene relative, relaia de calcul
pentru media ptratic este:
R
X2 =
2
i
(3.37)
fi
i =1
x
Xk = k
k
i
Ni
(3.38)
i =1
R
i =1
Xk = k
k
i
fi
(3.39)
i =1
Indicatorul media de ordinul k constituie forma cea mai general, de la ea putndu-se ajunge la
ceilal i indicatori de calcul pentru diferite valori particulare date lui k. Pornind de la relaia (3.39),
pentru diverse valori ale lui k se obine:
k = -1
X 1 = x i1 f i
i =1
k=1
X 1 = xi fi
- media armonic
- media aritmetic
i =1
k=2
X 2 = x i2 f i
i =1
k=3
X 3 = x i3 f i
i =1
1/ 2
- media ptratic
1/3
- media cubic
B. Valoarea median
Valoarea median, notat cu M e este acea valoare a variabilei cantitative X care mparte repartiia n
dou pri egale, respectiv:
FN (Me ) = 1 / 2 sau N (M e ) =
N
2
(3.41)
Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau
continu.
Pentru o repartiie discret, calculul medianei nu implic probleme deosebite i nici un volum
mare de calcule.
(3.42)
n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:
a) volumul N al populaiei este un numr impar;
b) volumul N al populaiei este un numr par.
n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului medianei,
notat cu rM e , conform urmtoarei rela ii:
rM e =
1 R
Ni = N (M e )
2 i =1
(3.43)
a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a crui
N
parte ntreag indic numrul de uniti din populaie pentru care variabila X a nregistrat
2
valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat urmtoare celei de rang
N
2 adic:
M e = x N
+1
2
(3.44)
b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca urmare la
mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci se gsesc dou
valori, mediana calculndu-se n acest caz ca media aritmetic a acestora. Relaia de calcul a
medianei, n acest caz, este:
x N + x N
Me =
2 +1
(3.45)
Pentru o repartiie continu, calculul valorii mediane presupune verificarea egalitii (3.41) i ca
urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic un volum
mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat. Acest lucru va
conduce la o expresie aproximativ de calcul a valorii mediane, care necesit un volum redus de
calcule.
(3.46)
unde intervalele xi-1-xi, i = 1, R pot fi de lungime egal sau neegal. Calcularea rangului medianei
va permite stabilirea intervalului n care se afl valoarea median, interval numit i interval median.
Se cumuleaz frecvenele absolute din aproape n aproape pn ce este ndeplinit inegalitatea:
N 1 + N 2 + ... + N i
1
N
2
M e = xi 1 + x
unde x este distana de la limita inferioar a intervalului median (xi-1) pn la median. Pentru
determinarea medianei mai trebuie cunoscut aceast distan x .
Determinarea distanei x , de la limita inferioar a intervalului median pn la median se poate
face n ipoteza c n intervalul median frecvena absolut se distribuie proporional cu lungimea
intervalului, de unde rezult:
N ( M e ) N ( xi 1 )
Ni
=
x
xi xi 1
(3.48)
unde:
N ( M e ) - reprezint frecvena absolut cumulat pn la median (rangul medianei);
N ( x i 1 ) - reprezint frecvena absolut cumulat pn la limita inferioar a intervalului median care
se mai numete i suma frecvenelor intervalelor premergtoare intervalului median.
N ( M e ) N ( xi 1 )
( xi xi 1 )
Ni
N ( M e ) N ( xi 1 )
( xi xi 1 ) (3.49)
Ni
Ni = N M e
xi xi 1 = lM e
N ( M e ) N ( xM e )
NM e
lM e
(3.50)
Aceeai expresie de calcul a medianei este folosit i n cazul n care seria continu este format din
frecvenele relative, cu urmtoarele precizri:
rM e = FN (M e ) =
1 R
1
fi =
2 i 1
2
FN ( M e ) FN ( xM e )
FM e
lM e
Pe lng procedeul expus anterior, mai exist i un procedeu grafic de calcul a valorii medianei.
Acest procedeu poate conduce la rezultate cel puin la fel de bune, mai ales n cazul seriilor care au
la baz o variabil continu, deoarece, nu mai este necesar persupunerea repartizrii proporionale
a frecvenei n intervalul median, cu condiia ca reprezentarea grafic a seriei s se fac ct mai
exact posibil. n acest sens, se construiete poligonul cumulativ cresctor al seriei i se duce o
paralel la axa Ox prin punctul de ordonat 1/2N. Abscisa punctului de intersecie a acestei paralele
cu poligonul cumulativ cresctor va fi valoarea median a seriei respective.
Exemplu
Urmtorul exemplu, privind calculul medianei unei serii, va permite evidenierea tehnicii de calcul
a acestui parametru ct i semnificaia lui. Repartiia angaja ilor ntr-o societate comercial, n
raport cu salariul lunar, este caracterizat prin urmtoarea serie:
160 200 200 240 240 280 280 320 320 360 360 400
X :
7
13
18
6
4
2
Prima etap n calculul medianei l constituie calculul rangului, dup cum urmeaz:
rM e =
1 R
1
50
N i = (7 + 13 + 18 + 6 + 4 + 2 ) =
= 25
2 i =1
2
2
nsumnd frecvenele succesiv pn ce valoarea obinut depete rangul, rezult c intervalul care
va conine mediana este [240-280). Fiind vorba de o serie care are la baz o variabil continu,
mediana se determin conform relaiei(3.50).
M e = xM e +
N ( M e ) N ( xM e )
NM e
lM e = 240 +
25 20
100
40 = 240 +
= 251,111$
18
9
Ca urmare, jumtate din angaja ii societii respective ctig cel mult 251,111$ i cealalt jumtate
ctig cel puin 251,111$ n perioada n care s-a fcut observarea. Relevant, n acest sens, pare a
fi urmtoarea serie construit, avnd n vedere mediana:
160,000 251,111 521,111 400,000
50%
50%
care constituie repartiia celor dou jumti din populaia angajailor societii respective.
C. Valoare modal
Valoarea modal Mo(X) a unei repartiii reprezint aceea valoare a variabilei X creia n corespunde
frecvena cea mai mare. Acest parametru se mai numete modul, valoare dominant, sau mod i se
noteaz cu Mo.
Mod de calcul:
(3.51)
valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de calcul. n
cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru care frecvena
este cea mai mare.
b) Pentru serii de repartiie continue, respectiv:
x x1 x1 x 2 ... x i 2 x i 1 x i 1 x i
X : 0
f2
...
f i 1
fi
f1
x i x i +1 ... x R 1 x R
f i +1
...
fR
(3.52)
modala nu poate fi determinat direct. Intervalul cruia i corespunde frecvena cea mai mare, se
numete intervalul modal i va conine modala. S presupunem c intervalul modal este xi-1-xi.
Se vor prezenta dou modaliti de calcul a modalei, una care se bazeaz pe aproximarea densitii
de probabilitate f(x) de-a lungul a trei intervale de variaie (intervalul modal i cele dou intervale
cu care se nvecineaz), iar cealalt metod permite gsirea unei formule de calcul aproximativ, a
crei deducie se bazeaz pe principiul repartizrii uniforme a frecvenei de-a lungul intervalului
modal.
Prima metod de calcul a modalei presupune estimat densitatea de probabilitate f(x). Odat gsit
f(x), valoarea modal va fi acea valoare a lui x pentru care f(x) nregistreaz valoarea maxim.
Aceast metod se bazeaz pe posibilitatea aproximrii densitii f(x) de-a lungul celor 3 intervale
precizate cu un arc de parabol de forma:
f(x) = ax2 + bx + c
unde, a, b, c sunt trei parametri ce trebuie determinai. Se reprezint grafic seria, doar pentru cele
trei intervale, (printr-o histogram) dup cum urmeaz:
Estimarea celor trei parametrii a,b i c se face utiliznd metoda ariilor, conform creia suprafaa
mrginit de acrcul de parabol, axa Ox i cele dou perpendiculare ridicate n punctele de abcis xi2 i xi+1 i suprafaa celor trei dreptunghiuri care formeaz histograma seriei de-a lungul celor trei
intervale, s fie egale. Respectarea acestei condiii conduce la urmtorul sistem de ecuaii:
x i 1 2
ax + bx + c dx = f i 1
xi 2
xi
2
ax + bx + c dx = f i
x i 1
x i +1 2
ax + bx + c dx = f i +1
xi
(3.53)
dac seria este de intervale egale. Un calcul elementar de integrale definite printr-o funcie
polinomial, transform egalitile (3.53) ntr-un sistem liniar de ecuaii n necunoscutele a, b, c.
Rezolvnd acest sistem, se afl estimaiile pentru cei trei parametri [5].
Determinarea modalei implic gsirea punctului pentru care f(x) i atinge maximul. Acest punct va
fi chiar modala i se calculeaz din condiia:
(3.54)
f(x) = 0
Rezolvnd ecuaia (3.54), soluia acesteia x = Mo reprezint valoarea modal dac mai are loc i
urmtoarea condiie:
(3.55)
f(Mo) < 0
A doua metod de calcul a modalei se bazeaz pe repartizarea uniform a frecvenei de-a lungul
intervalului modal. Presupunnd c intervalul xi-1-xi este intervalul modal, urmtoarea schem
grafic:
x
xi-1
Mo
xi
ne permite s scriem:
(3.56)
Mo = xi-1 + x
f i f i +1
(x i x i 1 ) x
(3.57)
care semnific repartizarea uniform a frecvenelor de-a lungul intervalului modal. Pentru
simplitatea expresiilor se introduc urmtoarele notaii:
f i f i 1 = 1
f i f i +1 = 1
x i x i 1 = l M o
(3.58)
Printr-un calcul simplu, din (3.58), rezult urmtoarea expresie de calcul pentru x :
x =
1
lMo
1 + 1
1
lMo
1 + 1
(3.59)
1
lMo
1 + 1
(3.60)
unde:
Mo - reprezint valoarea modal;
xMo - reprezint limita inferioar a intervalului modal;
O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o serie
are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal evideniaz faptul
c populaia n cauz este neomogen. Calculul valorii modale, n asemenea cazuri, presupune o
delimitare mai riguroas a obiectului observrii ct i a populaiei care urmeaz s fie studiat. O
alt cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a dou cte
dou sau trei cte trei intervale etc., pn se ajunge la o serie unimodal.
n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana. Pentru serii
uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri:
Mo = X 3 X Me
Exemplu:
Reconsiderm exemplul privind distribuia angajailor unei societi comerciale n raport cu salariul
lunar:
160 200 200 240 240 280 280 320 320 360 360 400
X :
7
13
18
6
4
2
unde variabila X este exprimat n dolari. Calculul valorii modale presupune n primul rnd gsirea
intervalului modal. Frecvena cea mai mare este 18 i ca urmare, intervalul modal este 240-280.
Intervalul modal fiind gsit, se poate aplica relaia (3.60) de calcul a valorii modale:
M o = xM o +
1
5
200
l M o = 240 +
40 = 240 +
= 251,764$
1 + 1
5 + 12
17
n concluzie, putem afirma c cei mai muli anagajai ai societii comerciale respective au un salar
lunar n jur de 251,764 $.
3.2. Parametrii de structur
Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o variabil
sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea structurii unei
populaii poart denumirea de valori quantile. Valorile quantile ale unei serii de repartiie
unidimensionale sunt acele mrimi nregistrate de variabila X, care mpart seria n n pri egale (mai
precis mparte populaia n n pri egale). n acest caz se vor calcula p quantile (p = n-1 ). Pentru o
serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea egalitate este
satisfcut de cele p quantile:
q1
q2
xR
x1
q1
q n 1
f ( x)dx =
1
n
(3.61)
q2
f = f
i
x1
xR
= ... = f i =
q1
q n 1
1
n
(3.62)
q2
xR
x1
q1
q n 1
N i = N i = ... = N i =
N
n
(3.63)
unde fiecare nsumare din relaiile (3.62) i (3.63) reprezint cumularea absolut sau relativ a
unitilor statistice cuprinse ntre limitele de nsumare.
Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel:
FN (q p ) = p
1
N
sau N ( q p ) = p , p = 1, n - 1
n
n
x x2 ... xi ... xR
.
X : 1
N1 N 2 ... N i ... N R
(3.64)
Pentru calculul valorii quantile de ordinul p ( p = 1, n 1) , n prima etap trebuie determinat rangul
acesteia:
rq p = N ( q p ) = p
N
n
(3.65)
x rq p + x ( rq p +1)
(3.66)
b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei X
corespunztoare pari ntregi a rangului majorat cu o unitate:
q p = x [ rq
+1]
(3.67)
n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1 quantile trebuie
s satisfac relaia (3.61). Determinarea quantilelor din asemenea egaliti ar presupune cunoaterea
densitii de probabilitate f(x). Ori n activitatea practic f(x) se aproximeaz prin diverse procedee,
implicnd un volum exagerat de calcule. n vederea gsirii unor formule aproximative de calcul a
quantilei de ordin p ( p = 1, n 1) se consider o serie de variaie continu, ale crei intervale de
variaie nu trebuie s fie neaprat egale ca lungime:
x x1 x1 x 2 ... x i 1 x i ... x R 1 x R
.
X : 0
...
...
N2
Ni
N R
N1
(3.68)
(3.69)
Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i
intervalul quantilei de ordinul p ( p = 1, n 1) . Cumulnd frecvenele pe clase pn la egalarea s-au
depirea rangului, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p N i
n i =1
(3.69)
q p = x i 1 + x
unde am presupus intervalul xi-1-xi ca intervalul quantilei de ordinul p, iar x reprezint distana,
necunoscut nc, ntre limita inferioar a intervalului quantilei de ordinul p i valoarea din acest
interval cu care coincide quantila de ordin p.
Distana necunoscut x se poate obine folosind principiul repartizrii proporionale a frecvenei
pe toat lungimea intervalului quantilei, n conformitate cu urmtoarea egalitate de rapoarte:
N (q p ) N ( x i 1 )
de unde se deduce x,
Ni
x i x i 1
x =
N (q p ) N ( x i 1 )
Ni
( x i x i 1 )
q p = x i 1 +
N (q p ) N ( x i 1 )
Ni
( x i x i 1 )
(3.71)
la formula de calcul:
q p = xqp +
N (q p ) N ( x q p )
Nq p
lqp
(3.72)
pentru p = 1, n 1 .
Procedeul de determinare a quantilei de ordinul p = 1, n 1 este acelai i n cazul n care seria
(3.68) este format din frecvene relative. Caracterizarea structurii unei serii se poate face utiliznd
diverse cazuri particulare de valori quantile.
Valoarea median (Me) este i un parametru de structur obinndu-se ca un caz particular de
quantil, cnd n=2. Dac pentru o serie se cunoate Me (quantila de ordinul 2), atunci structura
populaiei poate fi redat astfel:
X Me
X : min
50%
M e xmax
50%
(3.73)
semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X valori
cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a nregistrat
pentru X valori cuprinse ntre median i valoarea maxim a lui X. Formula de calcul a Me se poate
gsi ca un caz particular, n=2, a relaiei (3.72).
Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4. Cele trei
quartile, care se obin, notate: Q1, Q2 i Q3 sunt acei parametri de structur care mpart populaia n
patru pri egale.
n raport cu mediana, quartila nti Q1, se numete quantila mic (inferioar), quartila a doua Q2
coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q3 se numete quartila
mare (superioar). Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n
raport cu variabila X:
x Q1
X : min
25%
Q1 Q 2
25%
Q 2 Q3
25%
Q3 X max
25%
(3.74)
ceea ce semnific o structurare a populaiei supus studiului n patru pari egale. Aceasta nseamn
c 25% din unitile popupaiei nregistreaz valori pentru variabila X mai mici dect quartila mic,
25% din unitile populaiei nregistreaz valori, n raport cu aceeai variabil X, cuprinse ntre
quartila mic i cea mijlocie, 25% vor avea valori cuprinse ntre quartila mijlocie i quartila mare,
iar restul 25% din unitile populaiei vor avea valorile pentru variabila X cuprinse ntre quartila
mare i valoarea maxim a lui X.
Relaiile de calcul pentru quartile sunt cazuri particulare ale relaiilor de calcul pentru quantilele de
ordin p ( p = 1, n 1 . Etapele sunt aceleai, presupunndu-se mai nti calculul rangurilor celor 3
quartile, apoi determinarea efectiv a acestora. Valorile efective pentru cele 3 quartile se determin
n mod diferit, dup cum seria este discret sau continu. n continuare se va detalia modul de
calcul al quartilelor n mod separat pentru fiecare tip de serie n parte. Pentru cazul seriilor discrete
calculul rangurilor pentru cele trei quartile se face conform formulelor:
1 R
1 R
rq1 = 1 N i = N i
4 i 1
4 i =1
(3.75)
1 R
1 R
rq 2 = 2 N i = N i
4 i =1
2 i =1
(3.76)
1 R
rq 3 = 3 N i
4 i =1
(3.77)
Expresiile de calcul pentru cele trei quartile sunt diferite, dup cum valorile rangurilor
corespunztoare lor sunt ntregi sau nu. Determinarea quartilelor presupune stabilirea acelor valori
pentru variabila X care corespund rangurilor acestora i valorilor lui X corespunztoare rangurilor
majorate cu o unitate. n cazul n care rangurile sunt valori ntregi, quartilele se calculeaz ca media
aritmetic simpl a valorilor lui X corespunztoare rangului i rangului majorat cu o unitate.
R
x rQ + x ( rQ
Q1 =
Q2 =
+1)
x rQ + x ( rQ
2
(3.78)
+1)
(3.79)
Q3 =
x rQ + x ( rQ
3
+1)
(3.80)
iar dac p N i , ( p = 1,3) , nu se divide cu 4 atunci relaiile de calcul pentru quartile sunt:
i =1
Q1 = x [ rQ1 +1]
(3.81)
Q2 = x[ rQ
+1]
(3.82)
+1]
(3.83)
Q3 = x[ rQ
n cazul seriilor de variaie continu etapele privind determinarea celor 3 quartile sunt aceleai. Mai
nti se calculeaz rangul corespunztor pentru fiecare din cele trei quartile, urmnd ca pe baza
acestora s se calculeze efectiv quartilele. Rangul quartilei nti se determin conform relaiei:
rQ1 =
1 R
Ni
4 i =1
(3.84)
N i + N 2 + ... + N i
1 R
Ni
4 i =1
va reprezenta intervalul quartilei mici. Acest interval fiind gsit, quartila mic se determin
conform relaiei:
Q1 = x Q1 +
N (Q1 ) N ( x Q1 )
N Q1
l Q1
(3.85)
Pentru quartila mijlocie, Q2, calculele se pot face n conformitate cu procedeul dat pentru median.
n cazul quartilei mari, Q3, rangul se calculeaz astfel:
1 R
rQ3 = 3 N i
4 i =1
(3.86)
va constitui intervalul quantilei mari. Calculul efectiv al quartilei mari se face conform relaiei:
Q3 = x Q3 +
N (Q3 ) N ( x Q3 )
N Q3
l Q3
(3.87)
Semnificaia simbolurilor folosite n relaiile de calcul pentru cale 3 quantile deriv imediat din
cazul general prezentat pentru quantile.
Valorile decile constituie acel caz particular al valorilor quantile pentru care n=10. Valorile decile
reprezint acei indicatori de structur care mpart populaia supus studiului n 10 pri egale.
Urmnd acelai procedeu, relaiile de calcul pentru valorile decile se deduc din cazul general ca i
pentru cazul medianei i al quartilelor. Pentru cazul seriilor de variaie discret n prima faz se
calculeaz rangurile n conformitate cu urmtoarea formul de calcul:
rD p = p
10
N ;
i
p = 1,9
(3.88)
i =1
i =1
sunt:
Dp =
x rD p + x (rD p +1)
p = 1,9
(3.89)
i =1
decile sunt:
D p = x[ rD p +1] ;
p = 1,9
(3.90)
10
N ;
i
i =1
p = 1,9
Pentru fiecare decil Dp, p = 1,9 , se determin intervalul decil corespunztor, conform inegalitii:
N1 + N 2 + ... + N i p
1 R
N i ; p = 1,9
10 i =1
N (D p ) N ( x Dp )
N Dp
l Dp
Pentru cazul particular, n=100, quantilele de ordinul p = 1,99 se numesc procentile i reprezint
acele valori ale variabilei X care mpart seria respectiv n 100 de pri egale.
3.3. Parametrii variaiei
Studiul unor populaii statistice prezint importan numai din punct de vedere al unor mrimi care
variaz de la o unitatea la alta sau de la un grup de uniti la altul. Valorile nregistrate de o
variabil cantitativ, n raport cu care este studiat o populaie, de datoresc aciunii diferiilor factori
eseniali i neeseniali. Intensitatea diferit cu care se pot manifesta factorii eseniali ct i sensul
contrar cu care pot aciona factorii neeseniali n raport cu fiecare unitate, provoac nivele diferite
nregistrate de variabile n raport cu care este studiat populaia. Problema msurrii variaiei unei
variabile cantitative este important pentru a vedea n ce msur valoarea medie a acesteia poate
reprezenta ntrega populaie. Dac abaterile de la valoarea medie sunt neeseniale atunci se poate
afirma c populaia este omogen i c acest parametru poate reprezenta tendina central, iar dac
aceste abateri sunt mari atunci populaia este eterogen i valoarea medie nu are capacitatea de a
reprezenta populaia. Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri,
parametrul valoarea median poate s-i ia locul. Aceeai problem se pune i n acest caz, de a
vedea n ce msur valoarea median este sau nu reprezentativ pentru populaia n cauz. O alt
problem care nu se poate rezolva fr a studia i msura variaia nregistrat de o variabil n
raport cu care este studiat o populaie, o constituie verificarea de ipoteze. n activitatea practic, de
multe ori pornind de la valorile unor parametrii calculai pe baza datelor culese relativ la un numr
mic de uniti, este necesar a fi extini la nivelul ntregii populaii sau de a se verifica anumite
ipoteze statistice. Parametrii variaiei se pot calcula att sub form absolut ct i relativ, i
msoar mprtierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea
median.
Ca urmare, n funcie de elementul de referin folosit n msurarea variaiei, deosebim:
- parametrii variaiei n raport cu valoarea medie;
- parametrii variaiei n raport cu valoarea median.
3.3.1. Parametrii variaiei n raport ca valoarea medie
Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii medii
ct i n scopul estimrii unor parametri necunoscui. Abaterea medie ptratic, notat cu x , se
definete ca fiind media ptratic a abaterilor valorilor variabilei X, de la valoarea medie X , adic:
x = M (X X )2
(3.97)
x2 = M ( X X ) 2 = V ( X )
(3.98)
V(x) reprezint o alt notaie pentru varian, pe lng 2x . Variana fiind un calcul intermediar n
aflarea abaterii medii ptratice, n cele ce urmeaz se va prezenta modul de calcul al acesteia.
Relaia de calcul a varianei (3.98) se particularizeaz n raport cu tipul seriei. n cazul unei
serii care are la baz o variabil X discret, conform definiiei, variana are expresia:
R
(x
x2 =
X )2 Ni
i =1
(3.99)
i =1
x2 = ( x i X ) 2 f i
(3.100)
i =1
2
x
(x
X )2
i =1
X :
p q
x2 = ( xi X ) 2 f i = (1 p )2 p + (0 p )2 q = q 2 p + p 2 q =
i =1
= pq (q + p ) = pq = p (1 p )
Dac variana seriei alternative de mai sus este vzut ca o funcie de variabila p, adic:
x2 ( p ) = p (1 p )
atunci se poate gsi p astfel nct x2 ( p ) s fie maxim. Punnd condiia ( x2 ( p ) ) = 0 rezult:
'
2
x
'
( p ) = 1 (1 p ) + p ( 1) = 0
1
2
1 2 p = 0 p =
1
2
1 1
2 2
x2 = =
1
= 0, 25
4
1
, atunci variana maxim a unei serii alternative de medie p este 0,25,
2
rezultat utilizat n estimarea unor parametrii necunoscui cu privire la studierea diferitelor populaii.
Ca urmare, dac p =
n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform
urmtoarei relaii:
xR
2
x
(x X )
f ( x) dx
(3.101)
x1
a crei aplicare presupune cunoaterea densitii de repartiie f(x). Aproximnd densitatea f(x) cu
densitatea empiric, dup cum urmeaz:
f ( x)
fi
; x [ x i 1 , x i ); i = 1, R
x i x i 1
se ajunge la aceleai relaii de calcul (3.99) i (3.100) unde n loc de xi se pune x i' reprezentnd
mijlocul intervalului i calculat conform relaiei:
x i' =
x i 1 + x i
, i = 1, R .
2
Pentru o serie dat, variana calculat nu are interpretare, dar dac se extrage rdcina ptrat din
acesta se obine un numr care se exprim n aceleai uniti de msur ca i variabila de la baza
seriei. Acest numr (valoare) reprezint abaterea medie ptratic, simboliznd cu ct se abate n
medie n plus sau minus orice valoare xi a variabilei X de la valoarea medie X .
Parametrul abaterea medie ptratic se poate exprima i sub form relativ, caz n care se numete
coeficientul de variaie a lui Pearson, i se noteaz cu Vx. Expresia de calcul este:
Vx =
x
X
100%
(3.102)
i arat cu cte procente se abat n medie valorile variabilei fa de medie. Coeficientul de variaie a
lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit n aprecieri comparative
privind gradul de reprezentativitate a valorii medii calculate. Deoarece gradul de reprezentativitate
a valorii medii este n raport invers cu mrimea coeficientului de variaie a lui Pearson, se poate
afirma, n cazul mai multor serii, c este mai reprezentativ valoarea medie a acelei serii pentru care
Vx este mai mic. n concluzie, trebuie reinut c parametrul abaterea medie ptratic sub form
absolut x i sub form relativ Vx sunt indicatori fundamentali utilizai n msurarea variaiei unei
variabile.
Att abaterea medie liniar, ct i abaterea medie ptratic constituie o msur a variaiei medii,
primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x x ) .
Deoarece calcularea abaterii medii ptratice i implicit a varianei necesit un volum mare de
calcule, prezentarea unor proprieti ale varianei n vederea reducerii volumului de munc este
inevitabil. dispersia este media aritmetica a patratelor abaterilor individuale fata de media
(3.103)
V(X) = V(Y)
innd cont de definiia varianei avem:
V (Y ) = M (Y Y ) 2 = M [( X x 0 ) M ( X x 0 )] 2 =
= M ( X x0 X + x0 ) 2 = M ( X X ) 2 = V ( X )
ceea ce demonstreaz afirma ia mai sus enunat. Aceast proprietate i gsete aplicate n calculul
varianei pentru acele serii a cror variabile nregistreaz valori mari. n scopul reducerii volumului
de calcule se vor micora toate valorile variabilei cu o constant x0, convenabil aleas, nct noua
serie obinut s nregistreze valori mici pentru variabil.
Dac ntre dou variabile Y i X exist urmtoarea relaie liniar:
Y = aX+b
atunci are loc urmtoarea egalitate:
V(Y) = a2 V(X)
Conform definiiei varianei, se poate scrie:
V (Y ) = M (Y Y ) 2
(3.104)
V (Y ) = M Y Y
= M (a X + b a M ( x) b ) =
= M ( a ( x M ( x)) 2 = a 2 M ( X X ) 2 = a 2 V ( X )
4. Variana unei variabile, fiind un moment centrat de ordinul doi, se poate exprima cu ajutorul
diferenei dinter momentul de ordinul doi i ptratul momentului de ordinul nti al variabilei,
adic:
V ( X ) = M (X 2 ) (M ( X ))
(3.105)
V (X ) = M X X
= M (X 2 2X X + X ) = M (X 2) 2 X M (X ) + X
2
= M ( X 2 ) 2 X + X = M ( X 2 ) X = M ( X 2 ) ( M ( X ))2
Pornind de la relaia (3.105) se poate deduce o nou formul de calcul pentru varian, dup cum
urmeaz:
R
( )
x i2 N i
V ( X ) = M X 2 (M ( X )) =
i =1
R
i =1
R
xi N i
i =1 R
Ni
i =1
xi N i
2
R
R
R
i =1
x i2 N i x i N i
x i2 N i
N
= i =1
= i =1
i =1
N
N
N
V ( X ) = x f i xi f i
i =1
i =1
2
i
(3.106)
5. Variana sumei a dou variabile X i Y este egal cu suma varianelor acestor variabile, dac cele
dou variabile sunt independente.
Conform relaiei 4. Avem:
2
V ( X + Y ) = M ( X + Y ) (M ( X + Y )) = M X 2 + 2 XY + Y 2
2
(M ( X ) + M (Y )) = M ( X ) + 2 M ( X Y ) + M (Y ) (M ( X ))
2
( )
2 M ( X ) M (Y ) (M (Y )) = M ( X ) + (M ( X )) + M Y 2
(3.107)
(M (Y ))2 + +2M ( X ) M (Y ) 2M ( X ) M (Y ) = V ( X ) + V (Y )
Aceast proprietate se poate generaliza cu uurin, pentru n variabile independente dou cte dou:
V ( X 1 + X 2 + ... + X n ) = V ( X 1 ) + V ( X 2 ) + ... + V ( X n )
(3.108)
6. Variana unei variabile X fa de o constant x0 este mai mare dect variana acestei variabile fa
de media sa cu p tratul diferenei dintre valoarea medie i constanta respectiv. Demonstrarea
acestei proprieti se bazeaz pe urmtorul calcul:
(( ) ( )) =
= M (X X ) + 2(X X )(X x ) + (X x ) =
= M (X X ) + 2(X x ) M (X X ) + (X x ) = M (X X ) + (X x )
2
M ( X x0 ) = M X X + X x0
( )
( X ) = M (X X ) = M ( X x ) (X x )
(3.109)
Demonstraia acestei proprieti constituie un caz particular al proprietii 3., unde se ia b=0.
8. Variana diferenei dintre dou variabile independente este egal cu suma varianelor
acelor variabile:
V ( X Y ) = V ( X ) + V (Y )
(3.110)
Aceast proprietate rezult imediat fcnd un calcul simplu pornind de la defini ia varianei, innd
cont i de proprietatea 7.
9. Variana sumei a dou variabile dependente este egal cu suma varianelor celor dou variabile
plus covariana dintre cele dou variabile:
((
)(
V ( X + Y ) = V ( X ) + V (Y ) + 2 M X X Y Y
))
(3.111)
V ( X + Y ) = M (( X + Y ) M ( X + Y )) = M X + Y X Y
2
2
= M X 2 + Y 2 + X + Y + 2 XY 2 X X 2 X Y 2Y X 2Y Y + 2 X Y =
( ) ( )
= M (X ) (X ) + M (Y )
= M X 2 + M Y 2 + X + Y + 2 M X Y X Y Y X + X Y 2 X 2Y
(( )( ))
= V ( X ) + V (Y ) + 2 M ((X X )(Y Y ))
Media M ((X X )(Y Y )) se numete covarian sau variana legat i este util n studiul
2
Y + 2M X X Y Y =
1
, k fiind un numr real mai mare dect 1, se ob ine:
k
1
1
V X = 2 V ( X )
k
k
de unde:
1
V ( X ) = k 2 V X
k
(3.112)
Potrivit relaiei (3.112) se poate afirma c dac strile unei variabile cantitative de la baza unei serii
se simplific cu k, atunci variana acelei variabile se micoreaz de k2 ori. Pornind de la relaia:
2
V (X ) = M (X x0 ) X x 0
care constituie nsi proprietatea 6., innd cont de egalitatea (3.112) se poate scrie:
X x0 2 2
V ( X ) = M
k X x0
k
(3.113)
xi x0
Ni
k
i =1
R
V (X ) =
k 2 X x0
(3.114)
i =1
iar dac seria este format cu frecvene relative relaia amintit devine:
R xi x0 2
V ( X ) =
f i k 2 X x0
i =1 k
(3.115)
n cazul seriilor continue, calculul simplificat al varianei se efectueaz tot dup una din cele dou
rela ii de mai sus cu deosebirea c n loc de xi se iau n calcul xi, adic mijloacele intervalelor de
variaie.
10. Variana mediei aritmetice a n variabile independente care urmeaz aceeai lege de distribu ie
este egal cu variana uneia dintre variabile mprit la numrul variabilelor considerate. Fie X1,
X2, , Xn cele n variabile pentru care:
V ( X i ) = V ( X ),
i = 1, n
n
i notnd:
n
X
X =
i =1
rezult:
( )
V X =
V (X )
n
(3.116)
n mod analog pentru n variabile independente, abaterea medie ptratic se exprim astfel:
X =
X2
n
(3.117)
expresie care mai poart denumirea de eroarea mediei de selecie, numai dac X1, X2, , Xn sunt
variabile de eantionare.
11. Variana unor variabile normate este unu, iar media este zero. Pentru o variabil X oarecare,
variabila normat ataat este:
Z=
X X
de medie:
XX
M (Z ) = M
X
1
=
M (X X ) = 0
X
i varian:
XX
= M
X
2
Z
1
= 2 mXX
X
X2
=1
X2
12. Regula de adunare a varianelor. Se consider o serie de repartiie, care are la baz variabila X,
iar populaia respectiv de volum N este mprit n R clase n raport cu un criteriu C. Se
demonstreaz c varina n ntrega populaie, care msoar variaia total n raport cu X, este egal
cu suma a dou variane din care una msoar variaia n cadrul grupelor, iar cealalt variaia dintre
grupe. Pentru demonstrarea acestei proprieti se consider o serie de urmtoarea form:
x , x ,..., x1N1
X : 11 12
N1
...
{x , x
i1
...
i2
,..., xiN i
Ni
...
...
{x
R1
, xR 2 ,..., xRN R
NR
unde s-a notat cu {xi1, xi2, ,xiNi} mulimea valorilor nregistrate de uniile din clasa i, aceasta
fiind ntotdeauna posibil avnd n vedere numrul finit de elemente care pot aparine unei clase.
Variaia lui X n cadrul populaiei cercetate se compune din variaia n cadrul celor R
grupe datorat aciunii factorilor neeseniali i variaia de la o grup la alta datorat aciunii
factorilor eseniali care nu acioneaz cu aceeai intensitate asupra unitilor din populaie.
Notnd cu:
factori neeseniali;
x2 - media varianelor grupelor, care msoar variaia medie n cadrul celor R grupe;
i
x2 = X2 + X2
i
(3.118)
Demonstrarea egalit ii (3.118) pornete de la expresia varianei totale care pentru seria de mai sus
poate fi scris astfel:
Ni
(x
ij
ij
i =1 j =1
x2 =
N
Ni
((x
=
ij
i =1 j =1
) (
))
i =1 j =1
Ni
ij
Xi + Xi X
ij
Ni
i =1 j =1
R
Xi + Xi X
i =1 j =1
Ni
Ni
) (x
ij
i =1 j =1
Ni
(x
ij
i =1 j =1
Ni
) + (X
Ni
) +2 (x
2
ij
i =1 j =1
)(
X Xi X
i =1 j =1
Ni
ij
i =1 j =1
Ni
(x
ij
) (X
i =1 j =1
Ni
Ni
Ni
ij
ij
i =1
(X
i =1
i =1
) N
i =1
x2 Ni
=
X
Ni
i =1 j =1
ij
X Ni
(x
i =1 j =1
i =1 j =1
i =1 j =1
(X
Ni
X Ni
i =1
R
i =1
= x2i + X2
i =1
deoarece:
R
Ni
)(
2 xij X i X i X
i =1 j =1
R
N
i =1 j =1
ij
= 2
Ni
ij
Ni
(x
R
X i xij X X i2 + X i X
i =1 j =1
Ni
ij
i =1 j =1
R Ni
R Ni
R Ni
R Ni
xij X i xij X X i2 + X i X
i =1 j =1
i =1 j =1
i =1 j =1
= 2 i =1 j =1
R
Ni
i
=
1
Ni
Ni
R
x
xij
ij
R
R
R
j =1
j =1
2
X i N Ni X N Ni X i Ni + X X i Ni
i =1
i =1
i =1
i
i
=
= 2 i =1
R
Ni
i =1
R
R
R
R
X i2 N i X X i N i X i2 Ni + X X i Ni
i =1
i =1
i =1
=0
= 2 i =1
R
Ni
i =1
Prin urmare, dac o populaie este mp rit n R clase n raport cu un criteriu C, atunci variaia
variabilei X n cadrul fiercrei clase poate fi consecina aciunii unor factori neeseniali. Calculnd
valoarea medie X i n fircare clas se elimin cota parte din nivelul atins de variabil n clasa i ca
urmare a aciunii factorilor reziduali, iar variana n clasa i msoar mprtierea n interiorul
clasei provocat de aceti factori.
Componenta de dispersie x2i , reprezentnd media dispersiilor claselor, msoar variaia
medie la nivel de populaie, cauzat de factorii reziduali. n general, factorii eseniali se manifest
cu o intensitate diferit de la o unitate la alta ct i de la o clas la alta conducnd la diferene ntre
mediile claselor i media n populaia considerat. Aceste abateri sunt msurate de componenta de
dispersie X2 , numit varian a dintre grupe.
i
X2
2
x
100% +
X2
100%
x2
i
rela ie care ne arat procentual cota parte din variaia unei variabile provocat de aciunea factorilor
eseniali i respectiv de aciunea factorilor neeseniali.
Regula de adunare a variantelor, permite evaluarea influenei fiecrei categorii de factori
(eseniali sau neeseniali) asupra variaiei totale a unei variabile n raport cu care este studiat
populaia.
Cunoscnd variana unei variabile, extrgndu-se rd cina ptrat se obine abaterea
medie ptrat, parametru de baz utilizat n msurarea variaiei medii a unei variabile X:
X = X2
(3.119)
Mrimea parametrului abaterea medie p tratic permite, printre altele, o apreciere cu privire
la gradul de reprezentativitate a valorii medii. Aceasta deoarece exist serii pentru care, n raport cu
variabila considerat, dei x nregistreaz valori mici este posibil ca unele dintre valorile lui X s se
abat n realitate foarte mult de la valoarea medie.
Exemplu:
Urmtorul exemplu constituie un model de calcul al varianei i abaterii medii ptratice utiliznd
att definiia ct i relaia de calcul simplificat. n acest sens se consider distribuia agenilor
economici care au realizat profit la sfritul anului trecut. Se consider populaia agenilor
economici n cauz care i desfoar activitatea ntr-o anumit zon geografic. Seria de repartiie
a celor 1160 de ageni economici, care au realizat profit este:
0 50 50 100 100 150 150 200 200 250
X :
250
350
260
130
170
unde variabila profit X are valorile exprimate n milioane lei.
Profitul mediu X este:
X =
X2 =
(x
'
i
) N
2
i =1
i =1
2
2
2
(
25 121,55) 17 + (75 121,55) 25 + (125 121,55) 35
=
+
116
(175 121.55) .26 + (225 121.55) 2 .13
+
=
116
2
2
2
2
2
(
96,55) 17 + (46,55) 25 + (3,45) 35 + (53,45) 26 + (103,45) 13
=
=
116
426.465,68
=
= 3676,428
116
2
de unde:
xi' x0
Ni
k
2
i
=
1
X2 = 5
k 2 X x0 =
Ni
5
i =1
2
2
2
25 1252
75 125
175125
225125
17 +
25 +
26 +
13 +
50
50
50
50
116
116
11,903 = 3685,34511,903 = 3673,442
de unde x = 60,61 mil. lei. n relaia de calcul simplificat s-a luat x0 = 125, adic mijlocul seriei,
iar k = 50, fiind cel mai mare divizor al tuturor diferenelor xi' x0 , i = 1,5 .
Abaterea medie p tratic exprimat sub form relativ, prin intermediul coeficientului de
variaie Pearson este:
VX =
X
X
100% =
60,61
100% 49,86%
121,55
reprezentnd abaterea medie n procente a profiturilor nregistrate de cei 1160 de ageni economici
de la profitul mediu.
parametrii asimetriei;
parametrii boltirii.
) (
f X = f X +
valorile lui X.
O serie este asimetric n raport cu valoarea sa medie dac exist cel pu in o pereche de valori ale
variabilei X egal deprtate de X pentru care frecvenele corespunztoare s nu fie egale, adic:
) (
f X f X +
3 =
M XX
(3.128)
X3
3 =
( )
M (X X )
M X X
Calculnd valoarea acestui parametru, n funcie de semnul ei, avem urmtoarele cazuri:
' =
(Q3 M e ) (M e Q1 )
(Q3 M e ) + (M e Q1 )
(3.129)
care reprezint raportul dintre diferena abaterilor quantile i suma lor. este un coeficient numeric
cuprins ntre 1 i +1. Dac = 0 se spune c seria este simetric, dac > 0 seria prezint o
asimetrie pozitiv, iar dac < 0 seria prezint o asimetrie negativ.
i acest parametru ofer o imagine mai puin semnificativ asupra gradului de asimetrie al unei
serii.
M X X
(3.130)
X4
Pentru a nelege semnificaia boltirii unei serii, se consider dou serii statistice care au la baz
variabilele X i Y, iar
X = Y; X = Y
Mai presupunem, n plus, c cele dou distribu ii au form de clopot pentru care 3X = 3Y , adic
ambele sunt simetrice. Dei s-ar prea c cele dou serii nu au nimic care s le deosebeasc, totui
reprezentndu-le grafic rezult dou curbe de forma:
X =Y
X = Y
unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou serii
nu sunt caracterizate de aceeai boltire. Boltirea unei serii este util pentru a da o caracetrizare mai
exact reprezentativitii valorii medii. n cazul exemplului prezentat mai sus, att mediile ct i
abaterile medii p tratice sunt egale i ca urmare, coeficientul de variaie al lui Pearson este acelai
pentru cele dou serii. Deci rezult c ambele valori medii prezint acelai grad de
reprezentativitate. Cu toate acestea, graficele celor dou serii contrazic concluzia dedus n urma
comparrii celor doi coeficieni de variaie. Valoarea medie cea mai reprezentativ n seria n care
cele mai multe uniti ale populaiei cercetate au nregistrat valori, mai apropiate de valoarea medie.
Pentru o astfel de serie, mprtierea fa de valoarea medie fiind mic, graficul are o form mai
ascu it n cazul seriei X i mai plat n cazul seriei Y.
Nivelul boltirii pentru o serie oarecare dat se msoar cu ajutorul parametrului B4, a crui
expresie de calcul este dat de relaia (3.130). Valoarea lui B4 pentru o distribu ie normal este
egal cu 3. Pentru orice alt curb corespunztoare unei serii date i aproximat cu un clopot,
raportul ntre momentul centrat de ordinul patru i ptratul momentului centrat de ordinul al doilea,
este un numr diferit de 3, curba respectiv fiind mai ascuit sau mai plat dect curba normal a
lui Gauss.
Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui
Gauss, Fisher a stabilit urmtoarea expresie de calcul al coeficientului boltirii, notat cu B4:
'
4
B =
M X X
X4
(3.131)
sau:
B4 = B4-3
expresie cunoscut n literatura de specialitate sub denumirea de exces al seriei.
Urmtoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dac B4 =0 (adic B4 = 3) atunci seria n cauz prezint aceeai boltire cu a curbei normale (excesul
este nul);
- dac B4 > 0 (adic B4 > 3) atunci boltirea corespunztoare curbei respective este mai nalt i mai
ascuit dect curba normal (serie leptokurtic);
- dac B4 < 0 (adic B4 < 3) atunci boltirea corespunztoare curbei respective este mai plat (mai
joas i mai larg) dect curba normal (serie platikurtic).
Asimetria i boltirea joac un rol nsemnat n caracterizarea formei unei serii atributive de
repartiie. Cu ajutorul parametrilor prezentai poate fi format o imagine mai clar asupra unei serii
deja construite, asupra msurii n care seria respectiv poate fi reprezentat de valoarea sa medie.
3.6. Probleme
Problema 1
Avnd n vedere populaia societilor comerciale supus observrii concretizat n tabelul urmtor:
Nr
Marc
Jud. unde
i are
sediul
Ramura
unde i
Capital
social
Cifra de
afaceri
%
profit
desf. activ.
1.
994
Cluj
industrie
8.083.365
2.309.871
49 %
2.
1006
Cluj
industrie
9.611.744
10.761.787
419.175
49 %
3.
3588
Bucureti
industrie
10.116.125
7.694.483
467.496
49 %
4.
3685
Bucureti
industrie
8.053.025
11.561.823
969
49 %
5.
2994
Timi
industrie
2.121.925
2.317.951
80.880
60 %
6.
928
Cluj
agricultur
4.678.625
271.610
60 %
7.
929
Cluj
agricultur
888.490
159.351
60 %
8.
932
Cluj
agricultur
1.566.623
5.747.524
1.097
60 %
9.
3382
Bucureti
servicii
1.076.050
5.377.189
17.363
60 %
10.
12
Alba
transporturi
2.152.325
4.400.044
8.681
60 %
11.
25
Alba
transporturi
2.990.126
871.025
60 %
12.
53
Alba
servicii
510.285
773.886
38.935
60 %
13.
991
Cluj
transporturi
507.277
330.839
60 %
14.
1004
Cluj
transporturi
4.845.214
5.359.855
12.436
60 %
15.
3096
Timi
transporturi
5.963.750
9.931.327
90.223
60 %
16.
3043
Timi
transporturi
3.410.000
5.387.876
13.238
60 %
17.
47
Alba
construcii
6.270.418
541.334
49 %
18.
32
Alba
construcii
2.007.911
91.896
976
60 %
19.
3322
Vlcea
construcii
3.354.625
6.855.127
145.649
60 %
20.
966
Cluj
construcii
7.546.425
9.345.803
225.865
60 %
21.
972
Cluj
construcii
4.116.425
3.720.863
375.052
60 %
22.
1005
Cluj
construcii
4.629.025
8.000.906
400.575
60 %
23.
Alba
agricultur
6.848.825
176.728
1.960
60 %
24.
26
Alba
agricultur
9.709.000
3.864.087
1.087
49 %
25.
2956
Timi
agricultur
520.686
542.748
60 %
26.
2959
Timi
agricultur
2.086.534
37.793
60 %
27.
3264
Vlcea
agricultur
1.891.958
988.769
62.668
60 %
28.
3290
Vlcea
agricultur
3.114.550
2.812.349
78.300
60 %
29.
3296
Vlcea
servicii
5.389.225
12.456.122
390.659
49 %
30.
964
Cluj
servicii
5.874.950
6.240.445
23.583
60 %
X4 cifra de afaceri;
X5 profitul;
X6 procent din capitalul social care se vinde cu titlul gratuit.
Se cere:
1. s caracterizai seria ce red repartiia unitilor din populaie dup variabilele X3 sau X4;
2. determinai i interpretai parametrii tendinei centrale pentru aceast serie: valoarea medie,
valoarea modal i cea median;
3. analiza statistic a reprezentativitii valorii medii (sub forma absolut i relativ);
4. analiza statistic a reprezentativitii valorii mediane (sub forma absolut i relativ);
5. analiza statistic a structurii populaiei, n raport cu aceeai variabil (utiliznd valoarea median,
valorile quartile i un grafic de structur);
6. analiza comparativ a gradului de concentrare a unitilor din populaie, n raport cu cele dou
variabile alese de noi;
7. analiza statistic a asimetriei i boltirii repartiiei;
8. calculul valorii medii, respectiv a dispersiei, utiliznd formule de calcul simplificat.
1.
[0,5 2,1)
X 3 :
9
[2,1 3,7) [3,7 5,3) [5,3 6,9) [6,9 8,5) [8,5 10,1)
6
Aceast serie unidimensional, ce red repartiia unitilor din populaie dup variabila X3 capital
social, este o serie atributiv cantitativ continu i are la baz indicatorul frecven absolut.
2. Parametrii tendinei centrale:
Valoarea medie:
capitalul social total 1,3 9 + 2,9 6 + 4,5 4 + 6,1 5 + 7,7 3 + 9,3 3
=
=
volumul populatiei
30
= 4,286 mld.lei
X3 =
Deci, dac toate societile comerciale din eantion ar avea acest capital social mediu, suma
capitalurilor sociale ce aparin celor 30 de societi comerciale ar rmne neschimbat.
Valoarea median:
n = 30 (numr par)
Calculm rangul medianei:
n
rM e = = 15 M e [2,1 3,7 ) intervalul median
2
Me = 2,1 +
Presupunem c frecvena unitilor care nregistreaz variante ntr-un interval este proporional cu
lungimea intervalului.
1,6 mld. lei .. 6 soc. com. = 1,6 mld. Lei
Me = 2,1 + 1,6 = 3,7 mld. lei.
Deci, jumtate din societile comerciale au capital social mai mic de 3,7 mld. lei i cealalt jumtate
din aceste societ i l au mai mare de 3,7 mld. lei.
[0,5 3,7 )
X 3 :
50%
[3,7 10,1)
50%
Valoarea modal:
Calculm rapoartele
ni
xi xi 1
n1
9
=
= 5,6
x1 x0 2,1 0,5
n4
5
=
= 3,1
x4 x3 6,9 5,3
n2
6
=
= 3,8
x2 x1 3,7 2,1
n5
3
=
= 1,9
x5 x4 8,5 6,9
n3
4
=
= 2,5
x3 x2 5,3 3,7
n6
3
=
= 1,9
x6 x5 10,1 8,5
M 0 = xM 0 +
Deci, cele mai multe societi comerciale au capital social n jur de 1,7 mld.lei (dar nu mai mult de
9 sociati).
3. Analiza statistic a reprezentativitii valorii medii
Indicatori:
variana:
6
X2 =
(x X ) n
2
'
i
i =1
unde:
xi' =
xi + xi 1
2
9 (1,3 4,3) + 6 (2,9 4,3) + 4 (4,5 4,3) + 5 (6,1 4,3) + 3 (7,7 4,3)
+
3
30
2
3 (9,3 4,3)
+
= 7,293mld.lei
30
Deoarece dispersia este destul de mare, nsemn c valoarea medie nu este prea reprezentativ
(adic nu foarte multe variante sunt apropiate de ea).
X2 =
Capitalul social al fiecrei societti comerciale se abate n medie de la capitalul social mediu de
4,3 mld.lei cu 2,7 mld.lei.
-absolut:
Me = 3,7 mld.lei
Calculm cuartilele Q1 i Q3:
Q1 = ?
1 1
rQ1 = n = 30 = 7 Q1 [0,5 2,1)
4 4
N (Q1 ) N xQ1
Q1 = xQ1 +
lQ1
N Q1
( )
unde:
xQ1 - marginea inferioar a intervalului n care se afl Q1;
N (Q1 ) - frecvena cumulat pn la Q1;
Q3 = ?
3 3
rQ3 = n = 30 = 22
4 4
Q3 = xQ3 +
Q3 = 5,3 +
Q3 [5,3 6,9)
( )l
N (Q3 ) N xQ3
N Q3
Q3
22,5 19
1,6 = 6,42 mld.lei
5
Q3 Q1 6,42 1,83
= 2,3 mld .lei
2 =
2
Q Q
1
3
100 62%
2 M e
Abaterea variantelor pentru capitalul social dintre Q1 i Q3 de la valoarea median, deci pentru 50%
din populaie, este de 2,3 mld.lei. Mediana nu este prea reprezentativ.
Pentru msurarea abaterii de la valoarea median pentru 80% din populaie, vom folosi abaterile
interdicile:
D D1
-absolut: 9
=?
2
D D1
-relativ: 9
=?
2 Me
Me = 3,7 mld.lei
Calculm cuartilele D1 i D9:
D1 = ?
1 1
D1 = xD1 +
( )l
N ( D1 ) N xD1
ND
D1
30
1,6 1 mld.lei
9
10% din populaie are capitalul social 1 mld.lei
iar 90% din populaie are capitalul social >1 mld.lei
D1 = 0,5 +
D9 = ?
rD9 = xD9 +
N ( D9 ) N ( xD9 )
N D9
l D9
27 24
1,6 = 8,5 mld.lei
3
90% din societile comerciale cu capitalul social 8,5 mld.lei
iar 10% din societile comerciale cu capitalul social >8,5 mld.lei
D9 = 6,9 +
D9 D1 8,5 1
=
= 3,75 mld .lei
2
2
D D
8,5 1
1
9
100 =
100 101,4%
2 M e
2 3,7
Abaterea variantelor pentru capitalul social dintre D1 i D9 de la valoarea median, deci pentru 80%
din populaie, este de 3,75 mld.lei (mediana nu este prea reprezentativ pentru ele).
5. Analiza statistic a structurii populaiei
graficul de structur : vom construi seria statistic ce are la baz indicatorul frecven relativ:
[0,5 2,1) [2,1 3,7 ) [3,7 5,3) [5,3 6,9 ) [6,9 8,5)
X 3 :
20%
13%
17%
10%
30%
360 .. 100 %
a1 .. 30%
a1 = 108
360 .. 100 %
a2 .. 20%
a2 = 72
360 .. 100 %
a3 .. 13%
a3 = 46,8
360 .. 100 %
a4 .. 17%
a4 = 61,2
360 .. 100 %
a5 .. 10%
a5 = 36
360 .. 100 %
a6 .. 10%
a6 = 36
[8,5 10,1)
10%
10%
10%
1-[0,5-2,1)
30%
2-[2,1-3,7)
3-[3,7-5,3)
4-[5,3-6,9)
17%
5-[6,9-8,5)
6-[8,5-10,1)
20%
13%
mediana:
X :
50%
50%
cuartilele: Q1 = 1,83 mld.lei
Q2 = Me = 3,7 mld.lei
Q3 = 6,42 mld. Lei
Me = 3,7 mld.lei
25%
6. Parametrii concentrrii:
X 2 :
9
4
6
6
5
5
Energia informaional: E X 2 = f i 2 ;
i =1
1
E X 2 ;1
5
25 + 81 + 16 + 36 + 36
0,22 (concentrare destul de mic)
900
1
E
k
E0 =
1
1
k
1
EX 2
5 = 0,22 0,2 = 0,025 (concentrare mic)
EoX 2 =
1
0,8
1
5
EX 2 =
[0,5 2,1)
X3 :
9
[2,1 3,7) [3,7 5,3) [5,3 6,9) [6,9 8,5) [8,5 10,1)
6
1
E X 3 ;1
6
81 + 36 + 16 + 25 + 9 + 9
0,195 (concentrare destul de mic)
900
1
EX 3
6 = 0,195 0,16 = 0,042 (concentrare mic)
=
1
0,84
1
6
EX 3 =
EoX 3
Populaia prezint o concentrare mai mare n raport cu variabilele X3 (capital social), fa de variabila
X2 (ramura de activitate).
7. Asimetria:
3 =
M X3 X3
X 3 = 2,7 mld.lei
X 3 = 4,3 mld.lei
(X
3 ( 3)
3 X3 :
9
M X3 X3 =
3 =
( 1,4)3
53
8,76
8,76
=
= 0,45 repartiia este asimetric pozitiv fa de valoarea medie deoarece 3>0.
3
2,7
19,683
Boltirea:
3 =
(X
M X3 X3
X4
( 3)
X ) :
9
M X3 X 3 =
( 1,4)4
6
0,2 4 1,84
4
5
3,4 4
3
54
102,65
102,65
3 =
3 = 1,93 3, = 1,07 repartiia aceasta este mai puin boltit dect
4
2,7
53,14
repartiia de la legea normal, deoarece 4 < 0.
4 =
X 3 :
6
4
5
3
3
9
alegem c = 6,1 i d = 1,61 Y =
Y=
Y =
Y3 c
d
X 3 6,1 3 2 1 0 1 2
:
6
4 5 3 3
1,6
9
3 9 2 6 4 + 3 + 6 27 12 4 + 9
= 1,133
=
30
30
Problema 2
Un numr de 32 de cadre didactice au efectuat ntr-o lun, fiecare cel mult dou norme. Distribu ia
acestora n raport cu salarul de ncadrare i numrul normelor efectuate este:
N
Total
S
6,2 - 6,6
5,8 - 6,2
5,4 - 5,8
5 - 5,4
Total
4
4
4
4
16
4
4
4
4
16
8
8
8
8
32
S-a notat cu N numrul normelor i S salarul exprimat n milioane lei. Folosind proprietatea
media produsului a dou variabile este egal cu produsul mediilor s se calculeze venitul mediu
obinut de un cadru didactic n luna respectiv. Pentru a folosi proprietatea mai sus enunat este
necesar ca cele dou variabile implicate S i N s fie independente. Acesta rezult imediat din
distribuia bidimensional dat.
Trebuie artat c: M(S) M(N) = M(SN)
16 1 + 16 2
= 1,5
32
5,2 8 + 5,6 8 + 6 8 + 6,4 8 185,6
M (S ) =
=
= 5,8
32
32
4 (5,2 + 5,6 + 6 + 6,4) + 8 (5,2 + 5,6 + 6 + 6,4 ) 4 23,2 + 8 23,2
M (S N ) =
=
=
32
32
278,4
=
= 8,7 mil.lei
32
M(S) M(N) = 1,5 5,8 = 8,7 mil.lei.
M (N ) =
Problema 3
Cunoatem urmtoarea distribu ie a 52 de societi comerciale cu acelai profil de activitate, n
raport cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnzrilor (mil. lei).
X
Y
( 60 ; 80 ]
( 40 ; 60 ]
[ 20 ; 40 ]
Total
[3;5]
(5;7]
(7;9]
Total
2
3
14
19
7
10
2
19
8
5
1
14
17
18
17
52
Se cere:
1) S se verifice regula de adunare a varianelor
2) n ce proporie volumul vnzrilor depinde de cheltuielile cu publicitatea ?
Rezolvare:
1) Y =
30 17 + 50 18 + 70 17 2600
=
= 50
17 + 18 + 17
52
VTOT = Y2 =
Y
Y
Y
52
30 14 + 50 3 + 70 2 710
=
= 37,37
14 + 3 + 2
19
X (5;7]
30 2 + 50 10 + 70 7 1050
=
= 55,26
2 + 10 + 7
19
X (7;9]
30 1 + 50 5 + 70 8 840
=
= 60
1+ 5 + 8
14
X [3;5]
(37,37 Y )
VEXP =
19 + (55,26 Y ) 19 + (60 Y ) 14
=
19 + 19 + 14
2
2
2
2
(
37,37 50) 19 + (55,26 50 ) 19 + (60 50) 14
=
= 95,32
52
Y2
Y2
Y2
X [3;5 ]
X (5; 7 ]
X ( 7 ;9 ]
14 + 3 + 2
2 + 10 + 7
1+ 5 + 8
VREZ = Y2 =
Y2
X [3; 5 ]
19 + Y2
X ( 5;7 ]
19 + Y2
19 + 19 + 14
X ( 7 ;9 ]
14
=
Se observ c:
Y2 Y2 / X + Y2 / X
261,54 95,32 + 166,19
Y
VEXP
95,32
2)
100% = 2X 100% =
100% = 36,4%
VTOT
261,54
Y
Volumul vnzrilor depinde n proporie de 36,4% de cheltuielile cu publicitatea i n proporie de
63,6% de ali factori.
Problema 4
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee produsul a fost propus la preuri diferite
(P), veniturile consumatorilor (V) fiind i ele diferite. Pe fiecare pia s-a nregistrat un anumit nivel al
cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
Cerere (C)
15,4
3,2
4,9
10,5
8,0
5,1
7,6
11,3
14,0
6,4
13,2
8,8
12,1
Pre (P)
1,4
5,1
2,5
1,7
1,8
3,4
2,1
1,6
3,6
3,5
1,9
1,8
1,9
Venit (V)
620
530
490
800
630
410
670
920
990
320
520
700
730
Determinai:
a) cererea medie;
b) variana pentru variabila cerere;
c) cu ct se abate n medie cererea de la o pia la alta;
d) cu ct la sut se abate n medie cererea de la o pia la alta.
Obs. Rezolvarea decurge n mod analog pentru celelalte variabile.
a) Cererea medie C este:
15,4 + 3,2 + 4,9 + ... + 8,8 + 12,1 120,5
C =
=
= 9,27 u.m.
13
13
b) Variana C2 se calculeaz conform definiiei:
13
(x
C2 =
X ) Ni
2
i =1
13
i =1
ntruct seria prezint frecvene absolute egale N i = 1, i = 1,13 , se utilizeaz urmtoarea expresie de
calcul a varianei:
13
C2
c) C =
i =1
13
2
C
13
175,2277
= 13,48
13
d) Abaterea medie ptratic exprimat sub form relativ, prin intermediul coeficientului de variaie
Pearson este:
3,67
CV (C ) = C 100% =
100% = 39,59%
C
9,27
cererea se abate n medie cu 39,59% de la o pia la alta
Problema 5
Repartiia angajailor ntr-o societate comercial, n raport cu salariul lunar (exprimat n lei), este
caracterizat prin urmtoarea serie:
196
68
43
25
S se determine:
a) valoarea median;
b) valoarea modal;
c) valorile quartile, valorile decile (vom calcula ca exemplu D1, D3, D7) i valorile centile (vom calcula
ca exemplu C58, C76).
Rezolvare:
a) Prima etap n calculul medianei o constituie calculul rangului, dup cum urmeaz:
1 R
1
550
rMe = N i = (75 + 143 + 196 + 68 + 43 + 25) =
= 275
2 i =1
2
2
Urmtoarea etap const n determinarea intervalului median. nsumnd frecvenele succesiv, pn ce
valoarea obinut depete rangul, rezult c intervalul care va conine mediana este [840-980).
N 1 + N 2 + ... + N i > rM e
( )
( )
275 218
(980 840) = 880,71 lei
196
Aadar, jumtate dintre angajaii societii respective ctig cel mult 880,71 lei, iar cealalt jumtate
ctig cel puin 880,71 lei n perioada n care s-a fcut observarea.
Relevant n acest sens este urmtoarea serie, construit avnd n vedere mediana, i care
constituie repartiia celor dou jumti din populaia angajailor:
M e = 840 +
Y :
50%
50%
b) Calculul valorii modale presupune n primul rnd gsirea intervalului modal (a intervalului cruia i
corespunde frecvena cea mai mare). Frecvena cea mai mare este 196 i ca urmare, intervalul modal
este [840-980).
n continuare se aplic relaia de calcul a valorii modale:
1
M o = xM o +
l , unde
1 + 1 M o
x M o - limita inferioar a intervalului modal;
1 - diferena dintre frecvena intervalului modal i frecvena intervalului precedent;
1 - diferena dintre frecvena intervalului modal i frecvena intervalului urmtor;
l M o - lungimea intervalului modal.
196 143
53
(980 840) = 840 +
140 881 lei
(196 143) + (196 68)
53 + 128
Putem afirma c cei mai muli angajai ai societii comerciale respective au un salar lunar n jur de
881 lei.
M o = 840 +
c) Pentru calculul valorilor quartile se determin mai nti rangul fiecrei quartile.
1 R
N
550
rQ1 = 1 N i =
rQ1 =
= 137,5
4 i =1
4
4
1 R
N
550
rQ2 = 2 N i = 2
rQ2 = 2
= 275
4 i =1
4
4
1 R
N
550
rQ3 = 3 N i = 3
rQ3 = 3
= 412,5
4 i =1
4
4
n continuare se determin intervalele quartile:
1 R
N i este [700-840) i reprezint
4 i=1
( )
( )
137,5 75
(840 700) = 761,19 lei, ceea ce nseamn c 25% dintre angajaii
143
societii ctig cel mult 761,19 lei
275 218
(980 840) = 880,71 lei
Q2 = 840 +
196
25% dintre angajaii societii au un salar cuprins ntre 761,19 lei i 880,71 lei
Q1 = 700 +
412,5 218
(980 840) = 978,93 lei
196
25% dintre angajaii societii au un salar cuprins ntre 880,71 lei i 978,93 lei. Mai putem
spune i c 25% dintre angajaii societii ctig cel puin 978,93 lei.
Relevant n acest sens este urmtoarea serie, construit avnd n vedere valorile quartile:
Q3 = 840 +
Z :
25%
25%
25%
25%
Calculul decilelor:
ntr-o prim faz se calculeaz rangul conform relaiei:
1 R
N
rD p = p N i = p , p = 1,9
10 i =1
10
550
550
550
Obinem:
rD1 = 1
= 55 ;
rD3 = 3
= 165 ; rD7 = 7
= 385
10
10
10
Pentru fiecare decil Dp, p = 1,9 , se determin intervalul decil corespunztor, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p N i , p = 1,9
10 i =1
75 > 55
D1 [560 700)
D3 [700 840)
( )
( )
D1 = 560 +
Calculul centilelor:
Se calculeaz rangul dup relaia:
1 R
N
rC p = p
Ni = p
, p = 1,99
100 i=1
100
550
550
Obinem:
= 319 ;
= 418
rC58 = 58
rC76 = 76
100
100
Se determin intervalul corespunztor, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p
N i , p = 1,99
100 i =1
75 + 143 + 196 = 414 > 319
C58 [840 980)
C 76 [980 1120)
75 + 143 + 196 + 68 = 482 > 418
n final se calculeaz centila corespunztoare, dup relaia:
N (C p ) N xC p
C p = xC p +
l C p , p = 1,99
N Cp
( )
319 218
(980 840) = 912,14 lei
196
58% dintre angajaii societii ctig cel mult 912,14 lei, respectiv 42% dintre angajai ctig
cel puin 912,14 lei
C 58 = 840 +
C 76 = 980 +
418 414
(1120 980) = 988, 24 lei
68
76% dintre angajaii societii ctig cel mult 988,24 lei, respectiv 24% dintre angajai ctig
cel puin 988,24 lei.
Probleme propuse:
1. n vederea studierii situaiei actuale pe piaa aciunilor, s-a format un eantion reprezentativ de
volum 40, a crui repartiie n raport cu preul (n mii lei) este:
10 16 16 22 22 28 28 34 34 40
X :
5
15
10
6
4
Se cere:
a)
b)
c)
d)
e)
f)
preul mediu;
preul nregistrat de cele mai multe aciuni din eantion;
acel pre care divide eantionul n dou pri egale;
reprezentativitatea preului mediu;
s se calculeze cu ct se abate n mediu preul unei aciuni din eantion de la preul mediu;
folosind valorile cuartile s se studieze structura aciunilor n raport cu preul.
2. ntr-o firm s-au realizat 40 de produse n cadrul unui trimestru. Acestea au fost propuse
prelucrrii n mod secvenial n dou secii de producie. Repartiia produselor realizate n raport
cu costurile (mii lei) din cele dou secii a fost:
C2
C1
62 66
58 62
54 58
50 58
100 - 108
108 - 116
116 - 124
124 - 132
3
1
1
2
5
10
3
1
3
5
1
1
1
3
Folosind proprietatea conform creia media sumei a dou variabile este egal cu suma mediilor
acestora, calculai costul mediu pe produs.
3. Distribuia a 100 de angajai din trei ramuri de activitate diferite, n raport cu salarul primit este:
R
S
8,0 8,5
7,5 8,0
7,0 7,5
6,5 7,0
6 6,5
Total
R1
R2
R3
6
6
7
11
10
40
8
7
10
5
7
8
5
30
10
30
Capitolul 4
ANALIZA LEGTURILOR DINTRE VARIABILELE
UNEI REPARTIII MULTIDIMENSIONALE
n capitolul precedent au fost prezentate metode statistice de analiz ale seriilor
unidimensionale. n capitolul de fa ne propunem abordarea unor metode statistice caracteristice
studiului seriilor multidimensionale. Scopul acestora este de a identifica i utiliza eventualele legturi
care se pot manifesta ntre dou sau mai multe variabile. Ne pot interesa: existena legturii,
intensitatea acesteia, forma funcional a legturii, parametrii i reprezentativitatea ei privind
fenomenul cercetat. Problematica legturilor dintre variabile este foarte curent ntlnit n economie.
Spunem c salariul unui angajat este n funcie de productivitatea muncii sale, vechimea n munc,
responsabilitatea activitii sale, etc ; sau cererea dintr-un produs este n funcie de preul produsului,
venitul consumatorilor, etc. De fiecare dat, att n teoria economic, ct i n aplica ii se ntlnete
expresia fie funcia cererii. n realitatea economic ns, aceast funcie nu se d, nu se cunoate,
ci trebuie estimat pornind de la o baz de date. Aceast problem de estimare a unei funcii i alte
probleme colaterale ei fac obiectul acestui capitol.
Pentru a putea aborda studiul legturilor dintre variabile trebuie s tim n primul rnd dac
exist sau nu o legtur ntre variabilele studiate (sau ntre fenomenele pe care acestea le reprezint) i
care este natura acestora. Putem clasifica legturile dinte variabile astfel :
1. Leg tura nul. Semnific lipsa oricrei legturi ntre dou sau mai multe fenomene sau
variabile care cuantific fenomenele. De exemplu, o legtur nul se manifest ntre nlimea unui
angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta primului ministru. Din
punct de vedere statistic, spunem c ntre dou variabile X i Y exist o legtur nul, sau nu exist
legtur, dac cov( x, y ) = 0 .
2. Legtura determinist . Spunem c ntre variabilele X i Y exist o legtur determinist
dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de legturi se ntlnesc n special
n fizic, unde de exemplu viteza este egal cu distana mprit la timp: v = d / t , sau fora este egal
cu masa nmulit cu acceleraia: F = m a . Astfel de exemple exist i n economie, unde rata
profitului este egal cu profitul mprit la cifra de afaceri: r = / C . A. 100% . Legtura este
determinist pentru c variabila r este perfect determinat de celelalte dou: i C.A. Adic pentru
o anumit valoare a profitului i o anumit valoare a cifrei de afaceri nu putem avea dect o singur
valoare a ratei profitului.
3. Leg tura statistic. Se mai numete i stocastic sau probabilist. Este tipul de legtur cel
mai des ntlnit n tiinele sociale, deci i n economie. Fiecrei valori xi a variabilei X i corespunde
o distribuie de valori ale variabilei Y. Matematic, o astfel de legtur se exprim sub forma
y = f ( x) + , unde am notat prin componenta aleatoare rezidual, datorat aciunii asupra lui Y a
celorlal i factori dect X. Dei s-ar putea spune c prin luarea n considerare a tuturor factorilor care
influeneaz variabila Y, legtura este intrinsec determinist, n tiinele economice vom ntlni
aproape ntotdeauna un numr foarte mare de factori, care nu pot fi identifica i i cuantificai n
totalitatea lor. Asfel, funcia care l expliciteaz pe Y are dou componente: una determnist,
f ( x1 , x2 ,..., xn ) , cuprinznd variabilele cuantificabile de care depinde Y, i una aleatoare, ,
cuprinznd variabilele ce nu au putut fi cuantificate.
Sudiul legturilor dintre variabile s-a dezvoltat ntr-o disciplin aparte, numit econometrie. n
capitolul de fa nu ne propunem deci dect o introducere n aceast problematic, fr a aborda
elemente de inferen statistic specifice acestor legturi. n cele ce urmeaz vom prezenta cteva
aspecte legate de variabile i fenomenele reprezentate de acestea, probleme att de natura aparatului
statistic utilizat, ct i de aplicabilitatea lui n contextul economic.
1. Natura probabilist a legturilor. Aceast natur are ca urmare un anume grad de
nedeterminare ceea ce duce la o dificil identificare a corelaiilor dintre variabile. Nedeterminarea
parial se datoreaz multitudinii factorilor care determin un anumit fenomen. Mecanismul proceselor
economice este adeseori deosebit de complex, presupunnd existena unui numr foarte mare de
factori de luat n considerare. Structurile cauzale se pot dovedi a fi complicate, cauza unui fenomen
depinznd la rndul ei de o alt cauz. De asemenea legturile pot fi att univoce ct i biunivoce,
dou variabile putnd fi n acelai timp cauz i efect. De multe ori chiar teoria economic poate
clarifica situaia, mecanismul formrii cererii de exemplu fiind explicat prin pre i venit. n alte cazuri
ns, din lipsa unei teorii pertinente ntr-un anumit domeniu se poate ncepe prin instrumentul statistic,
iar dac anumite ipoteze formulate se adeveresc prin efectuarea observaiilor, se ncearc o justificare
economic a rezultatului gsit. Aceast din urm cale poate fi totui periculoas dac explicaia
economic nu este gsit, deoarece din punt de vedere statistic se poate identifica o corelaie puternic
ntre dou variabile aparent fr nici o legtur ntre ele, deoarece se realizeaz prin intermediul unei a
treia variabile, care poate fi cauza comun a celorlalte dou.
Toat aceast argumentaie mai sus expus nu este fcut cu scopul de a ncurca i mai mult
cititorul, ci pentru a atrage atenia att asupra coplexit ii problematicii acestui capitol, ct i a
modului de utilizare a aparatului statistic ce urmeaz a fi expus, nu ntr-un mod mecanic, dup o
anumit reet, ci n strns legtur cu teoria economic.
2. Variabilele endogene, exogene i reziduale. n studiul legturilor dintre fenomene intervin
mai multe tipuri de variabile, dup rolul jucat de ele n funcia care expliciteaz legtura. Variabila
efect, cea pe care dorim s o explicm prin intermediul altor factori se numete variabil endogen
(sau explicat sau dependent ) i obinium s o notm cu Y. Factorii de influen (cei cuantificabili),
variabilele prin care explicitm fenomenul, se numesc variabile exogene (sau explicative sau
factoriale). Obinuim s le notm cu X 1 , X 2 ,..., X n . Variabilele care au influen asupra fenomenului
cercetata, a variabilei endogene, dar care nu pot fi identificate sau cuantificate, se grupeaz sub forma
unei variabile reziduale, notat cu .
Identificarea variabilelor explicative n scopul studierii influenei lor asupra celei dependente
se bazeaz pe cunotinele i experiena specialistului n domeniul cercetat, dar i pe metode statistice
specifice. n economie majoritatea legturilor ntre variabile sunt cunoscute pornind de la teoria
economic. Totui, fiecare situaie economic concret poate presupune o alt intensitatea a legturii,
o alt influen a fiecrui factor asupra variabilei enndogene. n alte cazuri ns, dependenele teoretice
nu se cunosc, ci trebuie identificate pe baza observrii fenomenelor studiate. Aceste fenomene vor
trebui ns urmrite n timp pentru a verifica dac legtura este una conjunctural sau ine de un
anumit mecanism economic.
n funcie de situaia concret n fiecare domeniu sau caz, n alegerea variabilelor explicative se
poate proceda n dou moduri:
a) Introducerea succesiv a variabilelor n model (funcie). Pentru nceput se aleg variabilele
presupuse a fi cele mai semnificative. Dac fenomenul cercetat nu este suficient de bine
explicat de acestea, se mai introduc variabile pn la obinerea unei funcii satisfctoare.
b) Eliminarea succesiv a variabilelor din model. Dac funcia care conine toate variabilele
explicative (sau potenial explicative) este prea ncrcat, se poate renuna la o parte din
ele, care se dovedesc neeseniale, adic explic o prea mic parte din fenomenul cercetat.
Alegerea uneia sau alteia din metode poate depinde i de scopul cercetrii. Scopul studiului trebuie
s ne indice precis variabila de explicat i ne poate sugera unele variabile explicative. Alegerea
acestora ns, poate s fie condiionat de bugetul alocat care s nu permit o extindere prea mare a
numrului lor. n acelai timp un numr mare de variabile explicative explic mai bine un
fenomen, dar face modelul mai complicat, mai dificil de neles i utilizat. Scopul este deci
identificarea unui model ct mai simplu, dar care s cuantifice ct mai mult variaia explicit.
3. Multicoliniaritatea. Aa cum am mai precizat, un model cuprinde o variabil de explicat Y
i cteva variabile explicative X 1 , X 2 ,..., X n . Acestea din urm trebuie s fie independente ntre
ele, dar corelate cu variabila dependent. n cazul n care condiia nu este ndeplinit, apare
fenomenul de multicoliniaritate. Neluarea n considerare a acestuia duce la erori de estimare i
dificulti de utilizare a modelului. De exemplu, nu putem ti cum se modific Y la o modificare a
unei variabile factoriale oarecare X i , n condiiile n care celelalte rmn constante. Corelaia
dintre ele nu permite modificarea uneia fr modificarea celorlalte. n acest fel, nu putem simula
prin funcie o anumit situaie prin modificarea valorilor variabilelor factoriale i studiul
impactului acestor modificri asupra celei endogene.
Eliminarea multicoliniaritii se face prin renunarea la unele variabile ntre care exist
corelaii. Putem proceda astfel, deoarece nu se pierde toat informaia coninut n ele, ea existnd
de asemenea n mare parte n variabilele rmase. Nu trebuie exagerat totui eliminarea, deoarece
duce la o mai proast specificare a varianei explicate.
4. M surarea variabilelor. Variabilele din model trebuie exprimate n aa fel nct s
permit o ct mai uoar i corect prelucrare, estimare i utilizare. Este vorba att de unitatea de
msur, ct i de indicatorul n care sunt exprimate. Nu sunt rare situaiile n care este preferat
utilizarea diferenelor relative i absolute, a indicilor, logaritmilor, exponenilor, etc.
5. Modelul matematic. Este o etap care urmeaz n mod firesc dup stabilirea variabilelor
din model. Si aici n majoritatea cazurilor teoria economic este cea care ne furnizeaz i forma
legturii. n multe situaii ni se pare normal ca relaia dintre factori trebuie s fie aditiv,
multiplicativ, exponenial, etc, sau dup o funcie compus. Enumerm aici cu titlu de exemplu
funciile Cob-Douglas, Tornquist, Philips. n cazul n care tipul relaiei matematice nu este
precizat, acest rol revine instrumentului statistic. Cea mai simpl metod o constituie utilizarea
unui grafic adecvat punerii n eviden a formei legturii. Totui, concluziile obinute pe baza
metodelor statistico-matematice trebuie corelate cu teoria economoc, pentru c putem trage
adeseori concluzii pripite, datorate unor valori conjuncturale ale variabilelor, cu un rol foarte mare
al factorilor reziduali.
6. Calitatea datelor. Datele ce se afl la dispoziia utilizatorului au de asemenea o mare
importan. Calitatea proast a acestora poate deteriora rezultatele modelului, chiar n urma
parcurgerii reuite a etapelor construirii acestuia.
Un aspect al calitii datelor l reprezint numrul de observaii, acurateea i corectitudinea
culegerii i nregistrrii lor. O funcie va fi cu att mai bun cu ct se bazeaz pe o baz de date
mai important. Ne putem uor imagina ce concluzii eronate am putea s trgem dintr-o funcie care
explic inteniile de vot pentru un candidat sau partid n funcie de diverse variabile proprii
electorului ca vrsta, profesia, venitul, etc, dac studiul are loc pe folosind date cu privire la trei
persoane.
Un alt aspect l reprezint omogenitatea populaiei supuse studiului. Cu ct populaia este
mai omogen, cu att se mrete ponderea varianei explicate pe baza acelorai variabile. Pentru
populaii foarte eterogene se poate dovedi benefic o mprire a acestora n clase i construirea
unui model n fiecare clas.
n cazul (i este cel mai des ntlnit) n care datele provin dintr-un eantion este necesar
urmrirea reprezentativitii eantionului pentru populaia din care a fost extras. Altfel, rezultatele
modelului nu pot fi extinse pentru ntreaga populaie. Lund acelai exemplu de mai sus, ne putem
imagina ce concluzii am putea trage la nivelul ntregului electorat dac datele disponibile s-ar
referi numai la un singur segment de vrst sau venit.
Analiza legturii dintre variabilele unei repartiii multidimensionale presupune abordarea
urmtoarelor probleme, care se pot constitui i n etape ce trebuie parcurse n demersul statistic
necesar:
1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu variabilele
cercetate
2. Analiza statistic a existenei legturii
3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate
4. Formularea unor ipoteze cu privire la forma matematic a legturii
5. Estimarea parametrilor funciei de regresie
6. Analiza reprezentativitii funciei de regresie
Aceste etape pot fi parcurse integral sau parial, n funcie de natura variabilelor. Pentru variabilele
calitative nu vor fi parcurse (n statistica descriptiv) dect primele trei, deoarece posibilitile de
prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi parcurse n cazul variabilelor
cantitative.
4.1. Organizarea rezultatelor observ rii populaiei sau eantionului n raport cu variabilele
cercetate
n scopul utilizrii facile a informaiei culese la nivelul populaiei sau eantionului, rezultatele
observrii vor fi sistematizate ntr-o form convenabil prelucrrii lor. Se prefer de obicei o form
tabelar a prezentrii, care poate sugera unele idei de lucru pentru etapele urmtoare, prin unele
remarci cu privire la valorile pe care le-au nregistrat variabilele.
Tabelul 4.1
Nr. crt.
X1
X2
Xn
y1
x11
x21
xn1
y2
yN
x12
...
...
x1N
x22
....
...
x2 N
xn 2
...
xnN
...
Aceast form de prezentare este una primar. Evident, dac necesitile oricreia din etapele
urmtoare o cer, datele pot fi prezentate i sub alte forme tabelare sau grafice convenabil alese.
x1
x2
xi
xI
Total
yJ
N1 J
.
N2J
.
N iJ
.
N IJ
.
N J
.
yj
N1 j
N2 j
N ij
N Ij
N j
y2
.
N12
.
N 22
.
.
.
N i2
.
.
.
NI2
.
N 2
y1
N11
N 21
N i1
N I1
N 1
N1
N 2
N i
N I
Total
O prim ipotez asupra existenei sau inexistenei legturii ne este furnizat de metode pur
descriptive, ca studiul tabelului de corelaie sau a norului de puncte asociat. Urmrim dac
frecvenele absolute N ij iau valori apropiate n tot tabelul, caz n care nu exist legtur ntre
variabilele X i Y, iar norul de puncte asociat prezint o repartizare omogen a punctelor pe
domeniul de valori al variabilelor. Dac frecvenele se repartizeaz dup una din diagonale sau o
curb oarecare sugernd existena unei legturi, norul de puncte asociat prezint o grupare a
punctelor dup o anumit form (o dreapt sau o curb). Cu ct norul de puncte este mai grupat, cu
att ne putem atepta mai mult la existena unei legturi.
Metodele descriptive amintite anterior sunt imediate i uor de utilizat, dar nu pot stabili clar
existena sau inexistena unei legturi. Pentru aceasta, ne vom folosi de metode cantitative, din
care cea mai utilizat este 2 . Dup cum vom vedea, aceasta utilizeaz doar frecvenele ca
informaie numeric. Evident, pentru variabilele cantitative, existena strilor numerice permite
folosirea unor metode care s in cont de acestea.
Metoda const n esen n a compara frecvenele absolute observate cu cele teoretice
corespunztoare cazului n care nu exist legtur. Frecvenele teoretice se vor calcula fcnd apel
la teoria probabilitilor. Asociem tabelului o urn cu N bile, reproducnd structura populaiei n
raport cu variabilele X i Y. Considerm N ij bile cu inscripia (i, j ) . Dac evenimentele X = xi i
Y = y i sunt independente, putem scrie:
N i N j
= Pij
N N
notnd cu Pij produsul probabilitilor celor dou evenimente. Putem astfel calcula toate
P( X = xi ; Y = yi ) = P( X = xi ) P(Y = yi ) =
frecvenele teoretice. Suma lor fiind egal cu 1, ele vor fi comparabile cu frecvenele relative
empirice. Pentru a le putea compara cu frecvenele absolute, le vom nmuli cu N. Astfel:
N i N j
N N j
N ij = Pij N = i
N =
N N
N
unde N ij sunt frecvene absolute teoretice. Obinem deci dou tabele, unul cu frecvenele absolute
reale, observate i altul cu frecvenele absolute teoretice corespunztoare cazului n care nu exist
legtur ntre variabile. Dac ntre acestea nu exist nici o diferen, concluzionm c nu exist
legtur ntre variabile. Va trebui ns s ne bazm n aprecieri pe o msur global a distanei
dintre cele dou tabele, respectiv ale frecvenelor teoretice i empirice. Aceast msur o definim
astfel:
I
J ( N N )2
2 = ij ij
N ij
i =1 j =1
Observm c dac N ij = N ij , i = 1,..., I j = 1,..., J nu exist legtur, iar 2 = 0 . Dimpotriv, cu
ct frecvenele empirice difer mai mult de cele teoretice, cu att 2 ia valori mai mari.
Ca o concluzie, distingem cele dou cazuri:
1) Dac 2 = 0 nu exist legtur ntre variabile
2) Dac 2 >> 0 exist legtur ntre variabile
n statistica descriptiv ne limitm doar la a judeca egalitatea sau nonegalitatea cu zero. n
realitate ns, pentru a garanta cu o anumit probabilitate existena legturii, 2 trebuie s
depeasc un anumit prag. Acesta ne este dat de statistica inferenial prin legea de probabilitate
2 . Astfel,
I
J ( N N )2
2
= ij ij
N ij
i =1 j =1
este o variabil 2 cu v = ( I 1)( J 1) grade de libertate. Vom compara deci valoarea calculat a
lui 2 cu valorile tabelate.
2
Dac 2 > tab
( v , p ) putem afirma cu un risc de eroare p c exist legtur ntre variabilele X i
Y. Valoarea tabelat o privim ca pe un prag peste care trebuie s treac valoarea calculat a lui 2
pentru a accepta cu o anumit probabilitate existena legturii. Cu ct riscul de eroare dorit este
2
mai mic, cu att pragul va fi mai exigent, adic tab
( v , p ) va avea o valoare mai mare.
Procedeul prezentat anterior ne permite identificarea existenei legturii dintre dou variabile,
dar nu i a intensitii acesteia. Totui, pornind de la el se pot construi coeficieni care s ne
permit i aprecierea intensitii legturii, aa cum se va vedea n seciunile urmtoare.
Exemplu
Dintre societile comerciale cotate la Bursa de Balori Bucureti am extras un eantion de 34 societi.
S se studieze existena i intensitatea legturii dintre variabilele n raport cu care s-a fcut observarea:
X domeniul de activitate al firmei i Y riscul aciunilor societii.
X
Y
Mic
Mediu
Mare
Total
Industrie
3
10
2
15
FinanciarBancar
1
2
5
8
Alte
Domenii
7
4
11
Total
11
16
7
34
Avem astfel distribuia empiric (observat) a societ ilor n raport cu cele dou variabile. Indicatorul
de la baza seriei este frecvena absolut:
N 11 = 3
N12 = 1
N13 = 7
N 21 = 10
N 31 = 2
N 22 = 2
N 32 = 5
N 23 = 4
N 33 = 0
Deducem frecvenele absolute teoretice, corespunztoare cazului n care nu exist legtur ntre
variabile:
11 15
= 4,85
34
16 15
*
= 7,06
N 21
=
34
7 15
*
N 31
=
= 3,09
34
N 11* =
11 8
= 2,59
34
16 8
= 3,76
=
34
78
=
= 1,54
34
N12* =
*
N 22
*
N 32
11 11
= 3,56
34
16 11
*
= 5,18
N 23
=
34
7 11
*
N 33
=
2,26
34
N 13* =
Industrie
Y
Mic
Mediu
Mare
Total
4,85
7,06
3,09
15
FinanciarBancar
2,59
3,76
1,65
8
Alte
Domenii
3,56
5,18
2,26
11
Total
10
16
7
34
=
2
i =1 j =1
2 =
( N ij N ij ) 2
N ij
Pentru a verifica dac legtura exist i la nivel de populaie, facem apel la valorile tabelate ale
distribuiei de probabilitate 2 .
I = 3 , J = 3 , v = (3 1)(3 1) = 4
2
pentru p = 5% , tab
= 9,49
2
2 > tab
deci cu un risc de eroare de 5% acceptm existena legturii ntre cele dou
variabile
2
pentru p = 1% , tab
= 13,28
2
deci cu un risc de eroare de 1% acceptm existena legturii ntre cele dou
2 > tab
variabile
4.3. Analiza statistic a intensitii leg turii sau a gradului de asociere dintre variabilele
observate
Ca i n cazul existenei legturii, o prim apreciere a intensitii se poate face pe baza tabelului de
corelaie i a norului de puncte. Cu ct frecvenele mai mari sunt mai grupate n jurul uneia din
diagonalele tabelului de exemplu sau punctele norului sunt mai grupate n jurul unei linii, cu att
legtura este mai intens. n ceea ce privete metodele cantitative de apreciere, ele sunt mult mai
precise i ne pot oferi valori numerice ale intensitii sau gradului de asociere. Aceste metode sunt
ns diferite n funcie de tipul variabilelor i de aceea le vom aborda separat.
2
N + 2
unde N este volumul populaiei. Ne intereseaz care sunt limitele acestui coeficient, pentru a-i
putea aprecia valorile numerice pe care le ia. Reamintim c 2 este o msur global a distanei
dintre dou repartiii: cea observat i cea teoretic corespunztoare cazului n care nu exist
legtur ntre variabile.
dac 2 = 0 atunci C = 0
- dac 2 atunci C 1
Ca urmare, 2 [ 0 ; 1 )
Interpretarea gradului de asociere (intensitii legturii) pe baza coeficientului este urmtoarea:
- dac C = 0 legtura este nul (lipsa legturii)
- dac C ( 0 ; 0,3 ) legtura este de intensitate slab
- dac C [ 0,3 ; 0,7 ) legtura este de intensitate medie
- dac C [ 0,7 ; 1 ) legtura este de intensitate puternic
Desigur aceste limite nu trebuie interpretate ntr-o manier foarte rigid. O legtur este tot medie
att la 0,35 ct i la 0,68. Prezint mai mult interes compararea intensitii legturii dintre aceleai
dou variabile pentru aceeai populaie n momente de timp diferite sau pentru populaii similare.
-
Exemplu
Utilizm acelai exemplu de la existena legturii.
Intensitatea legturii:
coeficientul de asociere al lui Pearson
C=
16,77
= 0,57
34 + 16,77
legtura dintre cele dou variabile este de intensitate medie
coeficientul de asociere al lui Ciuprov
C=
2
N +2
T=
2
2
=
max 2
N ( I 1)( J 1)
16,77
= 0,50
34 (3 1)(3 1)
conform i acestui coeficient legtura dintre domeniul de activitate i riscul aciunilor este de
intensitate medie.
T=
A1
A2
Ai
An
r11
r12
r1i
r1n
X2
r21
r22
r2i
r2 n
Xj
r j1
rj 2
r ji
r jn
Xm
rm1
rm 2
rmi
rmn
Vom numi rang al unitii statistice Ai n raport cu variabila X j numrul natural r ji care indic
locul ocupat de valoarea variabilei X j nregistrat la unitatea Ai n irul ordonat al valorilor
variabilei X j nregistrate la cele n uniti considerate. Astfel, pentru fiecare variabil, rangurile
vor fi primele n numere naturale.
Legtura dintre cele m variabile va fi considerat de intensitate maxim dac dac o unitate
oarecare Ai are acelai rang n raport cu toate variabilele. O astfel de situaie este redat n tabelul
urmtor.
Tabelul 4.4
unitatea
stat.
A1
A2
Ai
An
X2
Xj
Xm
Variabila
X1
Cu ct situaia real se va apropia mai mult de situaia prezentat n tabel, respectiv rangurile se
vor dispune cam n aceeai ordine, cu att legtura va fi mai intens i invers, cu ct rangurile vor
diferi mai mult n raport cu diversele variabile, cu att legtura va fi mai slab.
Vom ncepe prezentarea corelaiei simple, ntre dou variabile X i Y. Legtura va fi direct i de
intensitate maxim dac tabelul construit pe seama rangurilor arat astfel:
Tabelul 4.5
unitatea
stat.
variabila
X
Y
A1
A2
Ai
An
1
1
2
2
i
i
n
n
n situaia contrar, n care legtura este invers i de intensitate maxim tabelul va arta astfel:
Tabelul 4.6
unitatea
stat.
variabila
X
Y
A1
A2
Ai
An
1
n
2
n-1
i
n-I+1
n
1
A1
A2
Ai
An
1
r1
2
r2
I
ri
N
rn
Exemplu
Vom lua ca exemplu 10 firme dintr-un anumit domeniu n raport cu variabilele X=renumele firmei
(ct este de cunoscut n rndul consumatorilor) i Y=ncrederea n produsele firmei. Rezult dup
observare urmtorul tabel al rangurilor:
Tabelul 4.8
unitatea
stat.
Variabila
X
Y
A1
A2
A3
A4
A5
A6
A7
A8
A9
A10
1
2
2
3
3
1
4
5
5
6
6
4
7
7
8
9
9
8
10
10
P Q 40 5
=
= 0,78
P + Q 40 + 5
deci ntre renumele firmei i ncrederea n produsele sale exist o legtur direct foarte puternic.
Exemplu
Ca exemplu, lum aceleai 10 fime, dar pe lng variabilele X=renumele firmei (ct este de
cunoscut n rndul consumatorilor) i Y=ncrederea n produsele firmei vom lua n calcul i
Z=performanele economice (poate fi cifra de afaceri, profitul, mrimea dividendelor, etc).
Tabelul 4.9
unitatea
stat.
Variabila
X
Y
Z
S
A1
A2
A3
A4
A5
A6
A7
A8
1
2
2
2
3
4
3
1
1
4
5
5
5
6
3
6
4
7
7
7
8
8
9
6
14
14
17
22
23
A9
9
8
10
27
A10
10
10
9
29
5 + 9 + 5 + 14 + 14 + 17 + 22 + 23 + 27 + 29
= 16,5
10
52 + 9 2 + 5 2 + 14 2 + 14 2 + 17 2 + 222 + 232 + 27 2 + 292
M (S 2 ) =
= 339,5
10
S2 (efectiva ) = M (S 2 ) [M ( S )]2 = 339,5 16,52 = 67,25
M (S ) =
m 2 (n 2 1) 32 (102 1)
=
= 74,25
12
12
2 (efectiva ) 67,25
k = S2
=
= 0,91
S (maxima) 74,25
Exist deci o legtur de intensitate foarte mare ntre renumele firmei, ncrederea n produsele ei i
performanele sale economice.
S2 (maxima) =
6 d i2
= 1
i =1
n(n 2 1)
Vom lua ca exemplu numeric aceeai populaie i variabile ca i n cazul coeficientului similar al
lui Kendall. Limitele celor doi coeficieni sunt aceleai, la fel i interpretrile valorilor numerice.
Tabelul 4.10
unitatea
stat.
variabila
X
Y
di
A1
A2
A3
A4
A5
A6
A7
A8
A9
A10
1
2
-1
2
3
-1
3
1
2
4
5
-1
5
6
-1
6
4
2
7
7
0
8
9
-1
9
8
1
10
10
0
6(1 + 1 + 4 + 1 + 1 + 4 + 0 + 1 + 1 + 0)
= 0,92
10(10 2 1)
Exist deci o legtur puternic ntre cele dou variabile. Valoarea numeric este diferit fa de
cea a coeficientului lui Kendall. Nu trebuie privite ns ntr-un mod foarte rigid valorile obinute.
= 1
Nu este important alegerea unuia sau altuia din coeficien i, ci folosirea aceluiai coeficient pentru
aceeai populaie la momente diferite de timp sau populaii perechi.
Exemplu
Coeficientul de corelaie a rangurilor al lui Spearman cazul n care dou sau mai multe ranguri sunt
identice. Se consider 10 mrci de automobile n raport cu variabilele X gradul de apreciere i de
ncredere al utilizatorilor i Y nivelul de siguran (poate fi reprezentat de punctajul obinut la testele
de specialitate sau de elementele de siguran activ i pasiv din dotare). Se cere s se caracterizeze
legtura dintre cele dou variabile, dac aceasta exist.
Avem urmtorul tabel al rangurilor:
unit. statistic A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
variabila
X
1
2
3
4
5
6
7
8
9
10
Y
2
1
2
4
7
5
8
6
8
10
di
-1
1
1
0
-2
1
-1
2
1
0
Se poate observa c n cazul variabilei Y exist uniti statistice care au acelai rang (deci au aceeai
valoare a variabilei), i anume: A1 i A3 au rangul 2, respectiv A7 i A9 au ambele rangul 8. Alte
asemenea situaii sunt frecvent ntlnite n ntrecerile sportive (fotbal, gimnastic, etc.), n analiza
competiional (care vizeaz alctuirea topului firmelor de pe o anumit pia), dar i n alte domenii.
Coeficientul de corelaie a rangurilor al lui Spearman are expresia:
n
6 d i2
= 1
i =1
2
n n 1
6 (1 + 1 + 1 + 0 + 4 + 1 + 1 + 4 + 1 + 0 )
6 14
84
= 1
= 1
= 0,92
Deci: = 1
2
10 99
990
10 (10 1)
Exist deci o legtur direct foarte puternic ntre cele dou variabile considerate.
Raportul de corelaie
Folosind regula de adunare a varianelor descompunem variana total a variabilei de explicat Y ca
sum a varianelor datorate variabilei explicative X i respectiv celorlali factori, adic:
Y2 = Y2 / X + Y2 / X
Variana explicit Y2 / X este cu att mai mare cu ct mediile condiionate Y / X sunt mai diferite
ntre ele. Ceea ce le face s difere este numai influena lui X, deoarece am mprit populaia n
grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim variana explicit ca o
mrime absolut a intensitii legturii dintre X i Y i ponderea varianei explicite n variana
total ca o mrime relativ. Raportul de corelaie are expresia:
Vexp
V
RYX =
= 1 rez
Vtot
Vtot
sau sub forma ei matematic:
RYX =
Y2 / X
Y2 / X
=
1
Y2
Y2
dac nu exist legtur ntre X i Y, mediile condiionate Y / X sunt egale ntre ele, deci
Y2 / X = 0 i RYX = 0
dac legtura este de intensitate maxim, nu exist influene ale altor factori dect X asupra
lui Y, nu exist variaie n cadrul grupelor, deci Y2 / X = 0 i RYX = 1 .
Exemplu
Cunoatem urmtoarea distribuie a 52 de societi comerciale cu acelai profil de activitate, n raport
cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnzrilor (mil. lei).
X
[3 ;5 ]
(5 ;7 ]
(7 ;9 ]
Total
Y
( 60 ; 80 ]
2
7
8
17
( 40 ; 60 ]
3
10
5
18
[ 20 ; 40 ]
14
2
1
17
Total
19
19
14
52
S se aprecieze intensitatea legturii dintre cheltuielile cu publicitatea i volumul vnzrilor.
Folosim raportul de corelaie:
R XY
Y2 X
V EXP
=
=
VTOT
Y2
95,32
= 0,3645
261,54
= 0,604
RXY =
R XY
Legtura dintre cele dou variabile este de intensitate medie. Din dispunera frecvenelor n tabelul de
corelaie i calculul mediilor condiionate ne d m seama c legtura este direct.
Y / x4
Y / x3
Y / x2
Y / x1
x1
x2
x3
x4
2) Funcie parabolic: Y = Y ( X ) + = a + bX + cX 2 +
Y
1
3) Funcie hiperbolic: Y = Y ( X ) + = a + b +
X
Y
X
X
4) Funcie exponenial: Y = Y ( X ) + = a b +
Y
Am prezentat doar cteva din formele uzuale ale funciilor de regresie, dar mai pot exista i altele, sau
combinaii ale lor (funcii complexe). Pentru regresia multipl, forma cea mai simpl o constituie
regresia liniar multipl care arat astfel:
Y = Y ( X 1 , X 2 ,..., X n ) + = a0 + a1 X 1 + ... + a n X n +
Pentru un astfel de model, reprezentarea grafic nu mai este posibil, deoarece nu mai este
vorba de o curb n plan, ci de o hipersuprafa ntr-un hiperspaiu cu n+1 dimensiuni.
Y (X )
Condiiile de minim constau n anularea celor (n+1) derivate pariale ale funciei G (a0 , a1 ,.., a n ) n
raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la urmtorul sistem de ecuaii:
G (a0 , a1 ,..., a n )
= 2M [Y (a0 + a1 X 1 + ... + a n X n )] = 0
a0
a j
j = 1, n
sau ntr-o form echivalent:
M (a0 + a1 X 1 + ... + a n X n ) = M (Y )
M (a0 + a1 X 1 + ... + a n X n ) X n = M (Y ) X j
j = 1, n
de unde rezult:
a0 + a1M ( X 1 ) + ... + a n M ( X n ) = M (Y )
j = 1, n
Prin rezolvarea acestui sistem liniar de ecuaii n raport cu necunoscutele a0 , a1 ,..., a n , se obin
valorile parametrilor ecuaiei de regresie. Astfel, legtura statistic dintre Y i X 1 , X 2 ,..., X n este
modelat prin aproximare cu o legtur funcional. Pentru cazul cu doi factori X 1 i X 2 , ecuaia de
regresie se scrie:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2
iar sistemul de ecuaii devine:
a0 + a1 M ( X 1 ) + a 2 M ( X 2 ) = M (Y )
2
a0 M ( X 1 ) + a1M ( X 1 ) + a 2 M ( X 1 X 2 ) = M (YX 1 )
2
a0 M ( X 2 ) + a1M ( X 1 X 2 ) + a2 M ( X 2 ) = M (YX 2 )
Prin substituia lui a 0 din prima ecuaie i nlocuirea lui n celelalte, obinem:
m10
m11
m20
m21
(X 2 M ( X 2 )) = 0
( 3)
M = m10 m11 m12
m
20 m21 m22
i notnd complementul algebric al elementului m0 j cu M oj( 3) , j = 0,1,2 ecuaia de regresie devine:
( 3)
(Y ( X 1 , X 2 ) M (Y ) ) + M 01(3) ( X 1 M ( X 1 ) ) + M 02(3) ( X 2 M ( X 2 ) ) = 0
M 00
Pentru cazul mai general al legturii liniare dintre Y i X 1 , X 2 ,..., X n , matricea de variaie i covariaie
este:
m00 m01 ... m0n
m
...
m
n0
n1
nn
iar ecuaia de regresie se poate scrie:
( n+1)
M 00
(Y ( X1, X 2 ) M (Y )) + M01(n+1) (X1 M ( X1 )) + ...+ M 0(nn+1) ( X n M ( X n )) = 0
Matricea de variaie i covariaie M ( n+1) este simetric n raport cu prima diagonal. Elementele mii
de pe diagonala principal sunt varianele variabilelor Y , X 1 , X 2 ,..., X n , iar elementele mij , i j
reprezint covarianele dintre variabilele corespunztoare.
M ( 2 ) = 00
m10 m11
iar ecuaia de regresie devine:
m11 (Y ( X ) M (Y )) m10 ( X 1 M ( X 1 ) ) = 0
de unde l putem exprima pe Y ( X ) ca:
m
m
Y ( X ) = 10 X 1 + M (Y ) 10 M ( X 1 )
m11
m11
de unde rezult coeficien ii:
a 0 = M (Y )
a1 =
m10
X1
m11
m10
M ( X1)
m11
Regresia parabolic
n economie sunt numeroase exemplele n care legtura dintre fenomene i deci variabilele
care le cuantific nu este liniar. Dac Y reprezint recolta la hectar dintr-un produs agricol, iar X
cantitatea de ngrminte, ne vom da seama chiar i intuitiv c o anumit cretere a lui X nu provoac
aceeai cretere a lui Y pe tot intervalul de variaie al celor dou variabile. La valori mari ale cantitii
de ngrminte, acestea provoac saturaie sau chiar nocivitate, ducnd la o stagnare, respectiv
diminuare a produciei. Alte exemple pot fi: legtura dintre vechimea n munc i mrimea salariului,
dintre cheltuielile cu publicitatea i volumul vnzrilor, etc.
Determinarea parametrilor funciei parabolice de regresie se poate face fie aplicnd direct
funciei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat anterior. n ambele
cazuri vom exemplifica pentru parabola de ordinul doi.
a)
2
2 M (Y (a 0 + a1 X + a 2 X ) )X = 0
2
2
2 M (Y (a 0 + a1 X + a 2 X ) )X = 0
[
[
[
2
3
a0 M ( X ) + a1M ( X ) + a 2 M ( X ) = M (YX )
2
3
4
2
a0 M ( X ) + a1M ( X ) + a 2 M ( X ) = M (YX )
Rezolvnd acest sistem n necunoscutele a0 , a1 , a2 , rezult parametrii ecuaiei de regresie parabolice.
n mod asemntor se poate proceda pentru orice regresie neliniar.
facem substituiile:
X = X1
X 2 = X2
dup care ecuaia devine:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2
care reprezint un model liniar cu doi factori. Elementele matricei de variaie i covariaie vor arta
astfel:
m00 = M (Y 2 ) ( M (Y )) 2 = Y2
m01 = m10 = M (YX ) M (Y ) M ( X ) = cov(Y , X )
m02 = m20 = M (YX 2 ) M (Y )M ( X 2 ) = cov(Y , X 2 )
m11 = M ( X 2 ) ( M ( X )) 2 = X2
m12 = M ( X 3 ) M ( X ) M ( X 2 ) = cov( X , X 2 )
m22 = M ( X 4 ) (M ( X 2 )) 2 = X2 2
Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o problem de
regresie liniar, care se rezolv conform cazului liniar. n cazul mai general, dac ecuaia de regresie
este un polinom de gradul n:
Y ( X ) = a0 + a1 X + a 2 X 2 + ... + an X n
efectund substitu iile:
X = X 1 ; X 2 = X 2 ; ... ; X n = X n
obinem cazul liniar n raport cu (n+1) variabile.
Regresia exponenial
Dac ecuaia de regresie are form exponenial:
Y (X ) = a bX
se ncearc aducerea la forma liniar. Mai nti se logaritmeaz ecuaia:
lg Y ( X ) = lg a + X lg b
iar apoi se fac substitu iile:
Z ( X ) = lg Y ( X )
a0 = lg a
a1 = lg b
Regresia hiperbolic
Dac ecuaia de regresie are form hiperbolic:
Y (X ) = a + b
1
X
se face substituia:
1
X1 =
X
de unde rezult modelul liniar:
Y ( X 1 ) = a + bX 1
n matricea de variaie i covariaie elementele vor fi:
m00 = M (Y 2 ) ( M (Y )) 2 = Y2
1
1
1
m01 = m10 = M Y M (Y ) M = cov Y ,
X
X
X
1 1
m11 = M 2 M
X X
2
= 1 / X
M ( 2) =
m10 m11
rYX = 1
=
m m m01 m10
det M
= 1 00 11
=
m00 M 00
m00 m11
m01
m00 m11
M ( XY ) M ( X ) M (Y )
Y X
m01 m10
=
m00 m11
4.8. Probleme
Problema 1
Se cunoate urmtoarea distribu ie a 52 de societi comerciale cu acelai profil de activitate, n raport
cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y volumul vnzrilor (mil. lei).
Y
X
[ 3 ; 5 ] ( 5 ; 7 ] ( 7 ; 9 ] Total
( 60 ; 80 ]
2
7
8
17
( 40 ; 60 ]
3
10
5
18
[ 20 ; 40 ]
14
2
1
17
Total
19
19
14
52
Se cere:
1) pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a funciei de regresie;
2) n ipoteza unei forme liniare a dependenei dintre Y i X, s se calculeze parametrii funciei de
regresie;
3) s se studieze reprezentativitatea funciei de regresie pentru modelarea legturii dintre cele
dou variabile;
4) care este valoarea medie a volumului vnzrilor pentru un nivel al cheltuielilor cu publicitatea
de 5,5 milioane lei?;
5) aceleai cerine de la punctele 2), 3) i 4) pentru o form parabolic a dependenei dintre Y i
X.
1)
Y 80
70
60
50
40
30
20
3
9
X
Pe baza graficului reprezentnd mediile condiionate ale lui Y n raport cu X, reinem ca posibile
funcii de regresie:
- funcia liniar:
Y = a + b X +
- funcia parabolic: Y = a + b X + c X 2 +
2)
( )
M (X Y ) =
1
( 4 30 14 + 6 30 2 + 8 30 1 +
52
+ 4 50 3 + 6 50 10 + 8 50 5 +
+ 4 70 2 + 6 70 7 + 8 70 8) = 305
305 5,81 50
14,5
=
= 5,86
2
2,4739
36,23 5,81
a = 50 5,86 5,81 = 15,95
Putem astfel scrie funcia de regresie liniar:
Y = 15,95 + 5,86 X +
b=
Y ( X ) = 15,95 + 5,86 X
3)
Y2 =
52
Y = 16,17
X2 =
X = 1,58
305 5,81 50
= 0,567
16,17 1,58
Funcia liniar are o reprezentativitate medie pentru modelarea legturii dintre Y i X.
rYX =
4)
Y ( X ) = 15,95 + 5,86 X
M X 2 Y =
( )
( )
M X3 =
4 3 19 + 6 3 19 + 8 3 14
= 240,15
19 + 19 + 14
( )
( )
4 19 + 6 19 + 8 14
M (X ) =
= 1669,85
19 + 19 + 14
= M (X ) M (X ) M (X ) = 1669,85 36,23 36,23 = 357,24
m22
(3 )
M = 14,5
2,5
29,65
167,73 29,65 357,24
14,5
29,65
= 206,78
167,73 357,24
1+ 3
14,5
2,5
= 10,6
167,73 29,65
M 01 = ( 1)
M 02 = ( 1)
( )
M 2 = M Y Y X, X 2
))
min
a + b M ( X ) + c M (X 2 ) = M (Y )
a M ( X ) + b M (X 2 ) + c M ( X 3 ) = M ( X Y )
a M ( X 2 ) + b M (X 3 ) + c M (X 4 ) = M (X 2 Y )
( )]
M 00 [Y ( X ) M (Y )] + M 01 [X M ( X )] + M 02 X 2 M X 2 = 0
M
M
M
M
Y ( X ) = M (Y ) + 01 M ( X ) + 02 M (X 2 ) 01 X 02 X 2
M 00
M
M 00
M 00
14444
442444004443 123
123
a
Astfel:
a = 50
206,78
10,6
5,81 +
36,23 = 8,46
13,98
13,98
206,78
b =
= 14,79
13,98
10,6
c =
= 0,76
13,98
Putem scrie deci funcia de regresie parabolic:
Y = 8,46 + 14,79 X 0,76 X 2 +
sau
det M (3 )
m00 M 00
rYXX 2 = 1
2435,224
= 0,578
261,54 13,98
det M (3 ) = 261,54 2,5 357,24 + 14,5 29,65 167,73 + 14,5 29,65 167,73
167,73 2,5 167,73 14,5 14,5 357,24 29,65 29,65 261,54 =
= 2435,224
Aadar, funcia parabolic are o reprezentativitate medie pentru modelarea legturii dintre Y i X,
fiind mai reprezentativ, dar nu semnificativ, dect dreapta de regresie.
Y ( X ) = 8,46 + 14,79 X 0,76 X 2
Y (5,5) = 8,46 + 14,79 5,5 0,76 5,5 2 = 49,9
Prin urmare, pentru o valoare a cheltuielilor cu publicitatea de 5,5 milioane lei, se obine un volum
mediu al vnzrilor de 49,9 milioane lei.
Problema 2
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la preuri diferite
(P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a nregistrat un anumit
nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
Nr.
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
Cerere (C)
15,4
3,2
4,9
10,5
8,0
5,1
7,6
11,3
14,0
6,4
13,2
8,8
12,1
Pre (P)
1,4
5,1
2,5
1,7
1,8
3,4
2,1
1,6
3,6
3,5
1,9
1,8
1,9
Venit (V)
620
530
490
800
630
410
670
920
990
320
520
700
730
1) S se formuleze ipoteze cu privire la forma legturii dintre cerere (C) i pre (P). Pentru formele
funciilor de regresie reinute ca fiind posibile, s se calculeze parametrii funciilor i
reprezentativitatea acestora.
2) Similar pentru legtura dintre cerere i venit.
3) S se calculeze parametrii funciei care modeleaz legtura liniar multipl dintre cerere i factorii
si e influen. Analizai reprezentativitatea acestei funcii n raport cu reprezentativitatea funciilor de
regresie simple. Care va fi valoarea estimat a cererii pe o pia unde preul de vnzare va fi 3,2 iar
venitul mediu al consumatorilor de 550 ?
1) Construim norul de puncte n raport cu P i C:
18
16
14
cerere
12
10
8
6
4
2
0
0
pret
C2 =
C = 3,671
rC , P =
C
15,4
3,2
4,9
10,5
8,0
Z
0,714
0,196
0,400
0,588
0,556
Nr.
6
7
8
9
10
5,1
7,6
11,3
14,0
6,4
Z
0,294
0,476
0,625
0,278
0,286
Nr.
11
12
13
13,2
8,8
12,1
Z
0,526
0,556
0,526
Z = 0,1519
C = 3,671
rC ,Z =
Drepta de regresie are o reprezentativitate medie, dar este mai reprezentativ dect dreapta.
consum
14
12
10
8
6
4
2
0
0
200
400
600
800
1000
1200
venit
C = 3,671
M (CV ) M (C ) M (V ) 6340,7 9,269 640,8
rC ,V =
=
= 0,59
C V
3,671 184,8
Drepta de regresie are o reprezentativitate medie.
3) Pentru funcia de regresie liniar multipl C = a4 + b4 P + c4 V + , calculm elementele matricii
de variaie i covariaie:
m00 = C2 = 13,479
m01 = M (CP) M (C ) M ( P) = 20,81 9,269 2,485 = 2,223
m02 = M (CV ) M (C )M (V ) = 6340,7 9,269 640,8 = 401,12
m11 = P2 = 1,1
(3 )
M = 2,223
1,1
62,99
401,12 62,99 34146
2,223 62,99
= 50640
401,12 34146
M 02 = (1)1+3
1,1
2,223
= 301,2
401,12 62,99
b4 = 1,507
c4 = 0,00897
Putem scrie deci funcia de regresie liniar multipl:
sau
det M ( 3)
m00 M 00
rCPV = 1
219406
13,479 33593
rCPV = 0,72
Funcia liniar multipl este foarte reprezentativ pentru modelarea legturii dintre consum (C) i
factorii si de influen: preul produsului (P) i venitul consumatorilor. Observm c funcia multipl
are un coeficient de corelaie mai mare dect ceilali coeficieni, ai funciilor de regresie cu cte un
singur factor. Se confirm astfel teoria conform creia o variabil este cu att mai bine explicat, cu
ct numrul de variabile explicative este mai mare.
Pe o pia unde produsul se va vinde la un pre de 3,2 iar venitul mediu al consumatorilor este 550, ne
ateptm la o valoare cea mai probabil a consumului de 7,4.
Problema 3
Din diverse surse de statistic internaional, cunoatem cu privire la 16 state ale lumii valorile
variabilelor X = P.I.B./locuitor (mii $) i Y = cheltuielile pentru activiti de turism pe locuitor (mii $):
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
X (mii $)
9.8
15.3
12.8
30.1
22.0
18.1
13.4
28.1
29.0
11.6
25.3
10.9
19.4
21.7
18.2
27.7
Y (mii $)
0.97
1.23
1.59
6.69
3.4
1.82
1.71
5.11
6.02
1.42
3.84
1.36
2.01
3.29
2.42
5.03
1) Folosind un grafic adecvat i elemente din teoria economic, s se formuleze ipoteze cu privire la
forma posibil a funciei de regresie.
2) Pentru una din formele funcionale selectate, s se estimeze parametrii i s se scrie funcia.
3) Decidei care funcie este mai bun, att pe baza coeficienilor de corelaie, ct i pe baza valorilor
previzionate pe baza funciilor.
1) Construim norul de puncte n raport cu cele dou variabile:
10
15
20
25
30
35
30
35
10
15
20
P.I.B. / loc. (mii $)
25
La o prim vedere, ambele funcii par adaptate pentru modelarea legturii, punctele norului nefiind
prea ndepartate de ele. Dac judecm pu in din punct de vedere economic, cererea de servicii turistice
este cresctoare n raport cu P.I.B./loc., ceea ce este valabil pentru ambele funcii. Trebuie s inem
cont ns c serviciile turistice sunt ntr-o msur important un bun de lux, deci cu o elasticitate
supraunitar a cererii n raport cu venitul. Mai potrivit pare deci funcia exponenial.
2) Funcia exponenial dintre cele dou variabile, sub forma ei determinist se scrie:
Y = a bX
care prin logaritmare devine:
ln Y = ln a + ln b X
iar sub forma aleatoare:
ln Y = ln a + ln b X +
Facem urmtoarele schimbri de variabil:
ln Y = Z
ln a = A
ln b = B
Funcia devine :
Z = A+ B X +
care este o funcie liniar. Datele numerice pentru estimarea parametrilor le prezentm n tabelul
urmtor:
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
X (mii $)
9.8
15.3
12.8
30.1
22.0
18.1
13.4
28.1
29.0
11.6
25.3
10.9
19.4
21.7
18.2
27.7
Z=lnY
-0.030
0.207
0.464
1.901
1.224
0.599
0.536
1.631
1.795
0.351
1.345
0.307
0.698
1.191
0.884
1.615
A + B M ( X ) = M (Z )
2
A M ( X ) + B M ( X ) = M ( XZ )
M ( X ) = 19,59
M ( X 2 ) = 428,81
M (Z ) = 0,9199
M ( XZ ) = 21,91
b = e 0,08634 = 1,0902
a = e 0,7715 = 0,4623
Capitolul 5
INDICII STATISTICI
Pentru studierea fenomenelor economice i sociale este adesea nevoie s descriem i s studiem
varia ia unor mrimi. Indicele statistic este o funcie ale crei valori numerice exprim variaia relativ
total sau parial a unei mrimi ntre dou situaii (dou perioade, dou spaii diferite, dou categorii).
Fie Z o mrime a crei variaie constituie obiectivul de studia i un parametru de care
depinde mrimea Z, respectiv Z = Z(). Relativ la parametrul , acesta poate exprima timpul, spaiul
sau anumite categorii economice sau sociale. Considernd dou stri oarecare ale parametrului ,
respectiv = j cu Z() = Z(j) i = k cu Z() = Z(k), atunci, n sens clasic, indicele mrimii Z este:
Z( k )
I Yk / j =
Z( j )
Dup numrul de uniti la care se refer mrimea Z, indicii sunt:
- indici elementari sau individuali, ce msoar variaia unei mrimi relativ la o singur unitate
statistic a populaiei. De exemplu, pentru mrimea Z = x.y, avem:
x( k )
y( k )
Z ( k ) x( k ) y( k )
I xk / j =
, I ky / j =
i
=
x( j )
y( j )
Z ( j ) x( j ) y( j )
- indici sintetici sau de grup, ce msoar variaia unei mrimi relativ la dou sau mai multe
unit i ale populaiei.
Frecvent, n domeniul economic, prezint interes studiul unei mrimi de tip valoare Z = V = pi qi ,
i =1
=
= I zk / j .
Z ( j ) Z ( h ) Z( j )
V = pi qi
i =1
unde pi sunt preuri iar qi cantiti. Indicele factorial al preurilor, de tip Laspeyres se determin
conform relaiei:
r
pi ( k )qi ( j )
j =1
k/ j
I V / p ( L ) =
r
p i ( j )qi ( j )
i =1
unde:
pi(j) preul din perioada de baz;
pi(k) - preurile din perioada curent;
qi(j) cantitile din perioada de baz;
qi(k) cantitile din perioada curent.
Asemntor se poate scrie expresia indicelui volumului fizic (a cantitii):
r
p ( j)q (k )
i
k/ j
V /q
( L) =
j =1
p ( j )q ( j )
i
i =1
Avnd n vedere expresiile celor doi indici, n Florea (1986) se deduce o regul general pentru
elaborarea indicilor factoriali de tip Laspeyres: partea din variaia unei mrimi determinat de un
factor se ob ine meninnd ceilali factori la nivelul baz de comparaie. Astfel, n cazul mrimii Z
depinznd de m factori, adic Z = f(X1, X2, ..., Xm), avem:
f ( x1 ( k ), x 2 ( j ),..., xi ( j ),..., x m ( j ))
I Zk // xj ( L...L...L ) =
1
f ( x1( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))
f ( x1 ( j ), x2 ( j ),..., xi (k ),..., xm ( j ))
I Zk // xji ( L L... ...L) =
f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))
I Zk // xj m ( L L...L...) =
f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm (k ))
.
f ( x1 ( j ), x2 ( j ),..., xi ( j ),..., xm ( j ))
Exemplu 1.
Relativ la sortimentele importate, dintr-o anumit grup de mrfuri, dispunem de urmtoarele
informaii:
Sortiment
an j
an k
Cantitate
Pre unitar de
Cantitate
Pre unitar de
importat
import
importat
import
S1
18
10
15
18
S2
15
6
25
12
S3
25
14
30
20
Se cere:
a) indicele valorii importului pentru aceast grup de mrfuri;
b) indicele preului de import respectiv indicele cantitii importate (a volumului importului),
ambii de tip Laspeyres.
Rezolvare
a) Valoarea importului, din aceast grup de mrfuri (format din trei sortimente), se determin astfel:
3
V = pi q i
i =1
unde:
pi preul unitar de import al sortimentului i;
qi cantitatea importat din sortimentul i.
Indicele exprimnd variaia integral a valorii importului este:
V ( j ) 15 18 + 25 12 + 30 20 1170
IVk / j =
=
=
= 1,890
V (k ) 18 10 + 15 6 + 25 14
620
IVk / j = 1.890 indic o cretere a valorii importului, n anul k fa de anul j, de 1.89 ori.
k/ j
V/p
(L ) =
p (k )q ( j )
i
i =1
3
p ( j )q ( j )
i
18 18 + 12 15 + 20 25 1004
=
= 1,619
18 10 + 15 6 + 25 14
620
i =1
3
k/ j
V /q
(L ) =
p ( j )q (k )
i
i =1
3
p ( j )q ( j )
i
10 15 + 6 25 + 14 30 720
=
= 1,162
18 10 + 15 6 + 25 14 620
i =1
Urmare a creterii preurilor unitare, valoarea importului a crescut, n anul k fa de anul j, de 1,619
ori. Privind acest indice factorial ca un indice sintetic al preurilor, rezultatul obinut arat cci per
ansamblu celor trei sortimente preurile unitare au crescut de 1,619 ori.
Modificarea cantitilor importate a determinat o cretere a valorii importului, n anul k fa de
anul j, de 1,162 ori, sau cantitile importate au crescut per ansamblu de 1,162 ori.
p ( k ) q (k )
i
k/ j
V/p
( P) =
j =1
r
p ( j)q (k )
i
i =1
p (k )q (k )
i
k/ j
V /q
( P) =
j =1
r
p ( k )q ( j )
i
i =1
i n acest caz, n Florea (1986) autorul deduce o regul general pentru elaborarea indicilor
factoriali de tip Paasche: partea din variaia unei mrimi determinat de un factor se ob ine
meninnd ceilali factori la nivelul curent. Pentru mrimea Z, depinznd ce m factori, indicii
factoriali de tip Paasche sunt:
f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( k ))
I Zk // xj ( P...P...P ) =
1
f ( X 1 ( j ), X 2 ( k ),..., X i ( j ),..., X m ( k ))
.........
f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( k ))
k/ j
I Z / x ( P P... ...P ) =
i
f ( X 1( k ), X 2 ( k ),..., X i ( j ),..., X m ( k ))
.........
f
(
X
1( j ), X 2 ( j ),..., X i ( j ),..., X m ( k )) .
I Zk // xj ( P P...P... ) =
m
f ( X 1( k ), X 2 ( k ),..., X i ( k ),..., X m ( j ))
Spre exemplu n cazul n care mrimea Y depinde de doi factori, respectiv Z = f(X1, X2), indicii
factoriali se exprim astfel:
f ( X1( k ),X 2( j )) f ( X1( k ),X 2( k ))
I zk // xj ( F ) = I zk // xj ( L ) I zk // xj ( P ) =
1
1
1
f ( X1( j ), X 2( j )) f ( X1( j ), X 2( k ))
k/ j
k/ j
k/ j
I z / x ( F ) = I z / x ( L ) I z / x ( P ) =
2
2
2
Dac mrimea Z depinde de 3 factori, respectiv Z = f(X1, X2, X3), avnd 6 succesiuni de analiz a
factorilor, indicii factoriali au urmtoarele expresii:
2
2
I zk // xj ( F ) = 6 I zk // xj ( L L ) I zk // xj ( L P ) I zk // xj ( P L ) I zk // xj ( P P )
1
1
1
1
1
2
2
I zk // xj ( F ) = 6 I zk // xj ( L L ) I zk // xj ( L P ) I zk // xj ( P L ) I zk // xj ( P P )
2
2
2
2
2
2
2
I zk // xj ( F ) = 6 I zk // xj ( L L ) I zk // xj ( L P ) I zk // xj ( P L ) I zk // xj ( P P )
3
3
3
3
1
Succesiunea
X1
I z / x1 (L L)
(X1, X2 X3)
I z / x1 ( L L )
I z / x1 ( P L )
I z / x1 ( P P )
I z / x1 ( L P )
I z / x1 ( P P )
X2
X3
I z / x2 ( P P )
I z / x2 ( P L )
I z / x 3 ( P L )
I z / x2 ( L L )
I z / x2 ( L L )
I z / x 3 ( P P )
I z / x2 ( P P )
I z / x2 ( L P )
I z / x 3 ( L L )
I z / x 3 ( P P )
I z / x 3 ( L P )
I z / x 3 ( L L )
1
I zj // xk
c) Circularitatea (tranzitivitatea), respectiv produsul indicilor cu baz n lan trebuie s fie egal
cu indicele cu baz fix. Considernd trei stri succesive j, h, k, atunci:
h/ j
k/ j
I z / x I zk // xh = I z / x
d) Reversibilitatea factorilor (completitudinea), respectiv produsului indicilor factoriali este
egal cu indicele varia iei integrale a mrimii analizate.
I zk // xj I zk // xj ...I zk // xj = I zk / j
1
2
m
e) Proporionalitatea indicelui, adic, dac indicii individuali sunt egali cu A, indicele sintetic
trebuie s fie egal i el cu A.
f) Cerina de determinare a indicelui. Indicele sintetic nu trebuie s devin nul, nedefinit sau
nedeterminat, dac unul din indicii pariali devine nul, nedefinit sau nedeterminat.
g) Omogenitatea (comensurabilitatea) indicelui. Valoarea indicelui trebuie s fie independent de
schimb rile unitilor de msur.
h) Cerina schimbrii bazei indicelui. Rezultatul mpririi a doi indici din dou perioade diferite,
calculai cu aceeai metod i avnd aceeai baz trebuie s fie independent de alegerea bazei.
Se rein primele patru cerin e ca fiind mai importante.
b) n general, indicii Laspeyres i Paasche nu sunt simetrici, n schimb indicii Fisher sunt
simetrici.
De exemplu, n cazul indicilor Laspeyres avem:
I zk // xj ( L... ...L ) I zj // xk ( L... ...L ) =
i
1
f ( X 1 ( j ),...X i ( j ),..., X m ( j )) f ( X 1 ( k ),...X i ( k ),..., X m ( k ))
Un calcul similar arat c indicii Fisher sunt simetrici.
c) Nici unul dintre indicii factoriali prezentai pn aici nu sunt tranzitivi.
De exemplu, n cazul indicilor Laspeyres avem:
=
h/ j
f ( X 1 ( j ),...X i ( k ),..., X m ( j ))
= I zk // xj
i
f ( X 1( j ),...X i ( j ),..., X m ( j ))
d) Dintre indicii factoriali prezentai, numai indicii Fisher verific condiia de completitudine a
testului. Astfel, de exemplu, n cazul n care mrimea Z depinde de doi factori, Z = f(X1, X2), avem:
I zk // xj I zk // xj ( F ) =
1
2
f ( X 1 ( k ), X 2 ( j )) f ( X 1 ( k ), X 2 ( k ))
f ( X 1 ( j ), X 2 ( j )) f ( X 1( j ), X 2 ( k ))
f ( X 1 ( J ), X 2 ( K )) f ( X 1( k ), X 2 ( k )) f ( X 1( k ), X 2 ( k ))
=
= I zk / j
f ( X 1 ( j ), X 2 ( j )) f ( X 1( k ), X 2 ( j )) f ( X 1( j ), X 2 ( j ))
Observm c indicii factoriali de tip Fisher satisfac cele mai multe axiome, fiind reflexivi,
simetrici respectiv verific condiia de completitudine a testului Fisher.
Aprilie 2004
Pre mediu
3400
890
Cantitate
2 (kg)
10 (buc)
Mai 2004
Pre mediu
3550
1100
cantitate
3 (kg)
8 (buc)
C = p i qi
i =1
unde:
pi preul mediu unitar al produsului i;
qi cantitatea cumprat din produsul i;
n cazul analizat avem n=2.
Notm cu: 0 - luna aprilie
1 - luna mai.
Indicele exprimnd variaia total a mrimii C se determin astfel:
C (1) 19450
1/ 0
IC
=
=
= 1,2388
C (0 ) 15700
2
1/ 0
C
I = 1,2388 arat o cretere a cheltuielilor cu consumul celor dou produse, n luna aprilie fa de
luna mai, de 1,238 ori.
b) Indicii factoriali
b1) Indicii factoriali Laspeyres
2
pi (1)qi (0 )
pi (0 )qi (1)
1/ 0
i =1
IC
/ q ( L ) = 2
pi (0 )qi (0 )
i =1
1,1528 ne arat de cte ori ar fi crescut cheltuielile C, dat s-ar fi modificat numai preurile, cantitile
rmnnd constante la nivelul lunii aprilie.
1,1032 arat de cte ori ar fi crescut cheltuielile C dac s-ar fi modificat numai cantitile cumprate,
iar preurile ar fi rmas constante la nivelul lunii aprilie.
Verificm cerina de completitudine a testului Fisher, astfel:
1/ 0
1/ 0
1/ 0
IC
/ p ( L )I C / q ( L ) = 1,1528 1,1032 = 1,27177 I C
pi (1)qi (1)
19450
1/ 0
I C / q ( P ) = i
=
= 1,0746
pi (1)qi (1) 18100
i
1,12298 ne arat de cte ori ar fi crescut cheltuielile C dac s-ar fi modificat numai preurile,
cantit ile rmnnd constante la nivelul lunii mai.
1,0746 ne arat de cte ori ar fi crescut cheltuielile C dac s-ar fi modificat numai cantitile
cump rate, preurile rmnnd constante la nivelul lunii mai.
Cerina de completitudine a testului Fischer, respectiv:
1/ 0
1/ 0
1/ 0
IC
/ p ( P )I C / q (P ) = 1,12298 1,0746 = 1,20675 I C
nu este verificat.
Astfel,
1,1378 ne arat de cte ori cresc cheltuielile C pe seama modificrii preurilor de cumprare.
1,0888 ne arat de cte ori cresc cheltuielile C pe seama modificrii cantit ilor cump rate.
c) facultativ
d) Exprimarea indicilor sintetici n funcie de indicii elementari
n
integrale este:
1/ 0
IC
C i (1)
C (1)
=
= i
C (0 ) C i (0 )
i
C (1)
1/ 0
1/ 0
Notnd prin I C
rezult c Ci (1) = I C
Ci (0 ) .
= i
i
i
C i (0 )
1/ 0
1/ 0
nlocuind pe Ci(1) cu expresia I C
, avem:
C i (0 ) , n I C
i
1/ 0
Ci (1)
C i (1)
i
1/ 0
i
i
=
IC =
Ci (0 )
Ci (0 )
i
i
IC
deci indicele exprimnd variaia integral a mrimii C se poate determina ca o medie aritmetic
ponderat a indicilor elementari (ICi).
Astfel:
C (1) 10650
1/ 0
IC
= 1 =
= 1,566
1
C1 (0) 6800
C (1) 8800
1/ 0
IC
= 2 =
= 0.9887
2
C 2 (0 ) 8900
1,566 6800 + 0,9887 8900
= 1,2388
I C1 / 0 =
15700
La fel se pot exprima i indicii factoriali n funcie de indicii elementari ai factorilor respectivi.
Ca atare, avnd indicele Laspeyres:
pi (1) qi (0 )
1/ 0
I C / p ( L ) = i
pi (0 ) qi (0 )
i
pi (1)
pi (0 )
1/ 0
nlocuind p i(1) cu pi (1) = I 1p/ 0 pi (0 ) , n expresia indicelui I C
/ p ( L ) , rezult:
i
1/ 0
Ip
1/ 0
i
IC
/ p ( L ) =
pi (0 ) q i (0 )
pi (0 ) qi (0 )
i
Deci, indicele factorial de tip Laspeyres se exprim ca o medie aritmetic ponderat a indicilor
elementari.
1/ 0
i
IC
/ p ( L ) =
pi (0 )qi (0 )
i
pi (1)
pi (0 )
1
1/ 0
nlocuind pe pi(0) cu expresia pi (1)
n expresia indicelui I C
, rezult:
/ p ( P )
1/ 0
Ip
i
1/ 0
IC
/ p ( P ) =
pi (1)qi (1)
i
1
1 / 0 pi (1)qi (1)
i I
p
i
Deci, indicele factorial de tip Paasche se determin ca o medie armonic ponderat a indicilor
elementari.
Numeric rezult:
3550
I 1p/ 0 =
= 1,044
1
3400
iar
1/ 0
Ip
1/ 0
( ) i
IC
/ p L =
I 1p/ 0 =
2
pi (0 ) qi (0 )
pi (0 ) qi (0 )
1100
= 1,236
890
i
1/ 0
IC
/ p ( P ) =
pi (1) q i (1)
i
1 / 0 p i (1) qi (1)
i I
p
19450
1
1
10650 +
8800
1,044
1,236
= 1,112298
Z = p i qi
i =1
unde qi reprezint cantitile cump rate iar pi preurile respectiv tarifele la care au fost cump rate
mrfurile i serviciile.
Se tie c indicele preurilor de tip Laspeyres se poate exprima ca i o medie aritmetic ponderat
a indicilor individuali ai preurilor:
n
k/ j
Z/p
( L ) =
qi ( j ) pi (k )
i =1
n
q ( j) p ( j)
i
q ( j ) p ( j ) p (k ) / p ( j )
i
i =1
n
q ( j) p ( j)
i =1
i =1
i =1
i =1
= k i ( j ) p i (k ) / p i ( j ) = I pki/ j k i ( j )
unde k i ( j ) =
qi ( j) pi ( j)
n
q ( j) p ( j)
i
i =1
de baz, i se numete coeficient bugetar al produsului i. Aceti coeficieni redau structura de consum
a populaiei.
Indicele preurilor de consum se calculeaz n baza acestei forme de exprimare a indicelui
Laspeyres, ca i medie aritmetic ponderat a indicilor individuali ai preurilor:
n
I Zk // pj ( L ) = I pki/ j k i ( j ) .
i =1
(pentru
Indicii individuali ai preurilor calculai pentru fiecare sortiment se agreg la nivel de post de
cheltuieli, grupe respectiv la nivel de indice general, prin utilizarea ponderilor constante (n prezent
cele din 1997). Utilizarea ponderilor constante permite comparaii ale evoluiei preurilor n timp.
b) Indicii individuali ai preurilor I pki/ j , pentru fiecare sortiment, se determin n baza datelor
culese ntr-un eantion al punctelor de vnzare. Sondajul se realizeaz n mai multe faze, n prima faz
fiind stabilit un eantion al localitilor (42) avnd n vedere criterii precum volumul vnzrilor de
mrfuri i servicii, numrul populaiei .a.. Din aceste localiti sunt selectate centre de cercetare (68).
Punctele de vnzare supuse observrii sunt magazine i uniti prestatoare de sevicii din centrele de
cercetare, volumul eantionului fiind de aproximativ 6000 puncte de vnzare.
Preurile unitare ale mrfurilor i serviciilor din co ul consumatorului sunt observate sptmnal
n aceste puncte de vnzare. Media lunar a preului fiecrui produs sau serviciu notat p(k) se
compar cu preurile n perioada de baz p(j) obinndu-se indicele individual al preului.
c) Determinarea coeficienilor de ponderare k i ( j ) se realizeaz n baza datelor ob inute prin
Ancheta Integrat n Gospod rii. Aceasta este o cercetare statistic parial, fiind reprezentate n
eantion familii de salariai, patroni, rani, omeri, pensionari. ntr-un caiet special pus la dispoziia
fiecrei familii din eantion se completeaz zilnic toate intrrile de bani i toate ieirile b neti din
gospod rie, precizndu-se totodat sursele, respectiv destinaia acestora. Prin centralizarea lunar a
acestor bugete de familie se obin o serie de informaii, cum ar fi ponderarea cheltuielilor cu fiecare
bun sau serviciu n totalul cheltuielilor, consumurile medii din diferite produse etc. Practic, coeficienii
bugetari k i ( j ) utilizai n calculul indicelui preurilor se actualizeaz doar la intervale de civa ani,
atunci cnd se contat c mutaiile intervenite n structura cheltuielilor efectuate de populaie sunt
semnificative. O analiz a acestor mutaii n ara noastr relev o tendin de cretere, n ultimii ani, a
ponderii serviciilor n consum.
Utilizri ale indicelui preurilor
Indicele preurilor de consum (IPC) este utilizat n principal pentru:
a) Calculul ratei inflaiei (RI):
RI = ( IPC 1) 100% .
n pactica statistic, mrimea inflaiei se cuantific de regul pe baza indicelui preurilor de consum.
Astfel calculat, rata inflaiei indic ritmul de cretere al preurilor mrfurilor i al tarifelor seviciilor
din consumul populaiei. O alt msur a inflaiei propus n literatur este deflatorul PIB.
Rata inflaiei este unul din cei mai cunoscu i indicatori macroeconomici. Deciziile luate la nivel
macroeconomic respectiv microeconomic in seama n general de evolu ia acestui indice. Este
deasemenea indicatorul cel mai prezent n mass media.
b) Determinarea indicatorilor reali
Exprimarea n preuri constante sau comparabile a unui indicator permite evidenierea evolu iei
reale a acestuia, eliminndu-se astfel influena creterii preurilor.
In general, pentru a ob ine evoluia real a unei marimi economice se va imp ri nivelul
(nominal) al acesteia la indicele preurilor cu baz fix. Este indicat a se utiliza un indice al preurilor
adecvat indicatorului analizat, n msura n care acesta este disponibil.
Indicele general al preurilor este utilizat pentru deflaionarea consumului privat, st la baza
calculrii veniturilor reale ale populaiei, a salariului respectiv a pensiei reale etc. Este utilizat de
asemenea ca punct de plecare n indexarea salariilor i a pensiilor.
unde k i ( j ) =
qi ( j ) pi ( j )
n
q ( j) p ( j)
i
i =1
unde:
si salariul mediu al personalului din activitatea i;
ni numrul de persoane din activitatea i.
n
I Zk // sj (L ) =
n ( j )s ( j ) n ( j ) s ( j ) s (k ) / s ( j )
i
i =1
n
n ( j )s ( j )
i
i =1
i =1
n
n ( j)s ( j )
i
i =1
i =1
i =1
= vi ( j ) s i (k ) / si ( j ) = I ski / j vi ( j )
unde vi ponderea fondului de salarii a personalului din activitatea i n total fond de salarii.
CB = ci ni
i =1
unde:
ci reprezint cursul (preul) titlului i;
ni numrul de titluri de tipul i tranzacionate (volumul) ;
m numrul de titluri considerate n calculul indicelui (n co ul indicelui).
Indicele bursier de tip Laspeyres este un indice factorial al preului, cu baz fix:
m
t/0
CB / c
(L ) =
n (0 )c (t )
i
i =1
m
n (0 )c (0 )
i
i =1
Periodic, baza indicelui este ajustat, pentru a se nltura unele neajunsuri legate de meninerea
constant a ponderilor.
Principalii indici bursieri din lumea fianciar sunt calculai n acest mod. Amintim aici urmtorii
indici:
- S&P 500, calculat pentru 500 de aciuni, cele mai reprezentative de pe piaa american. A
fost lansat n 1943, baza sa fiind de 10 puncte;
- Topix ia in calcul titlurile (1250) din prima categorie cotate pe piaa japonez. Baza sa este
de 100 puncte, iar data lansrii 04.01 1968;
- Nikkei 300 cuprinde 300 de titluri din prima categorie a pieei din Tokyo. A fost lansat n
1993;
- CAC 40 este principalul indice francez. A fost lansat n anul 1997, baza sa fiind de 1000
puncte;
- FTSE 100 este principalul indice britanic, fiind lansat n 1983, cu baza 1000 de puncte.
Indicele cuprinde 100 de titluri din domenii diferite (69 industriale, 21 financiare, 5
petroliere, 2 de investiii, 2 miniere, 1 firm de comer internaional).
In ara noastr , indicele oficial al pieei bursiere este indicele BET (Bucharest Exchange
Trading), calculat pentru un eantion de 10 societi, cele mai reprezentative. A fost lansat la
19.09.1997, baza sa fiind de 1000 puncte. Se calculeaz deasemenea ca i un indice factorial
Laspeyres, cu baz fix. Indicele BET constituie suport al tranzaciilor la termen, la Bursa Monetar
Financiar i de Mrfuri Sibiu. Se mai calculeaz i se public indicele BET Composite, care ia n
calcul toate aciunile cotate la Bursa de Valori Bucureti.
b) Indicele de tipul mediei aritmetice
Indicele bursier se calculeaz n acest caz dup formula :
m
c (t )
I t / 0 = B0 i
i =1 c i (0)
unde :
- B0 reprezint valoarea indicelui la momentul lansrii;
- ci cursul (preul) titlului i;
- m este numrul de titluri considerate n calculul indicelui (n co ul indicelui).
Intervin aici indicii elementari, cu baz fix, ai cursurilor celor n titluri. Acest mod de calcul nu ine
seama de capitalizarea bursier, respectiv de importana diferitelor titluri pe pia.
Cel mai important indice calculat dup aceast relaie este indicele Dow-Jones Industrial Average
(DJIA). Prima modalitate de calcul a unui indice bursier este de acest tip i dateaz din 1884, autorii ei
fiind Charles Dow i Eduard Jones. n practic, indicele Dow-Jones se calculeaz astfel: unul pentru
industrie (Dow-Jones Industiral) pe baza indicilor individuali a 30 titluri emise de cele mai importante
societi industriale din SUA, al doilea este un indice Dow-Jones pentru transporturi, cuprinznd 20
titluri a celor mai importante firme din domeniu, al treilea indice Dow-Jones se calculeaz pentru
servicii publice i cuprinde titluri emise de 15 societi. Cei trei indici sunt reunii ntr-un indice global
Dow-Jones, caracteriznd una din pieele bursiere ale SUA NYSE (New-York Stock Exchange).
O variant a indicelui Dow-Jones o constituie indicele bursier japonez Nikkey Dow Jones,
instituit n 1950 i calculat pe baza cursurilor a 225 aciuni cotate la bursa oficial (Tokio Stock
Exchange).
c) Indicele geometric
Indicele bursier se calculeaz n acest caz ca i o medie geometric a indicilor individuali ai
cursurilor titlurilor din co ul indicelui:
I ct / 0 = m I ct1/ 0 I c2t / 0 L I cmt / 0 .
Cel mai cunoscut indice calculat dup aceast relaie este indicele bursier FT-30 (Financial Times
Industrial Ordinary).
Indicele de tip medie aritmetic respectiv indicele geometric nu au o fundamentare economic i
nici statistic, pentru c n primul rnd nici o expresie nu are n vedere structura titlurilor. Indicele
unui grup mai restrns sau mai larg de titluri trebuie s exprime efectul schimbrii cursurilor asupra
capitalizrii bursiere, deci este indicat s fie un indice factorial.
Denumirea
mrfurilor/serviciilor
Mrfuri alimentare, din care:
- produse de morrit i panificaie
- legume i conserve din legume
- fructe i conserve din fructe
- ulei, slnin, grsimi
- carne, preparate din carne i
conserve din carne
- pete i conserve din pete
- lapte i produse lactate
- ou
- zahr, produse zaharoase i
miere de albine
- cacao i cafea
- buturi alcoolice
- alte produse alimentare
Mrfuri nealimentare
Servicii
Coeficien i de
ponderare
Indicele
preurilor
(noiembrie fa
de octombrie)
4692
883
474
255
261
1319
108,0
108,0
111,1
102,7
100,5
62
470
161
276
101,5
105,8
115,6
107,8
163
255
113
4054
1254
102,4
101,5
102,8
104,2
104,9
Rezolvare
a) Considerm mrimea C = pi qi unde:
i
Indicele preurilor de consum, calculat n practica statistic de la noi din ar, este un indice de tip
Laspeyres:
I Ck // pj (L ) = I kpi/ j k i ( j )
i
101,6 883 + 108 474 + 111,1 255 + 102,7 261+ 100,5 1319 + 101,5 62
+
4692
105,8 470 + 115,6 161+ 107,8 276 + 102,4 163 + 101,5 255 + 102,8 113
= 103,8
4692
Preurile produselor alimentare au crescut per ansamblu, n luna noiembrie fa de octombrie, de 1.038
ori sau n proporie de 103.8%.
+
k/ j
C/ p
(L ) =
Exemplul 4. Deflaionarea
Vnzrile trimestriale ale unei societi avnd ca obiect de activitate desfacerea laptelui de
consum, sunt urmtoarele:
trim.I trim.II trim.III trim.IV
mld.lei
Y :
1560
1880
1000 1280
/ II
I III
= 1,03
p
/ III
I IV
= 1,06
p
Pentru a corecta vnzrile, avem nevoie de indicele preului calculat cu baz fix, respectiv fa de
trim.I. Pentru calcularea indicilor cu baz fix ne folosim de proprietatea de circularitate a indicilor,
respectiv:
/I
/I
I III
= I II
I pIII / II
p
p
/I
/ II
/ III
I IV
= I pII / I I III
I IV
p
p
p
Astfel,
n acest caz evoluia vnzrilor reale trimestriale ale societii (exprimate n preuri constante, ale
trimestrului I), obinute din cele iniiale prin mprire la indicele preului cu baz fix, sunt:
trim.I trim.II trim.III trim.IV
.
Y :
1000 1230,8 1456,3 1655,6
Antibotice Iai
Azo Mure
Oltchim
Perioada de baz
19.09.1997
n0
c0
65533
7400
25609
2850
450982
4300
Perioada curent
20.09.2004
nt
482170
40676
418344
ct
3800
3370
1840
Perioad baz de comparaie este considerat aici data la care a fost lansat indicele BET. Prin n s-a
notat numrul de aciuni tranzacionate (volumul) iar c reprezint cursul aciunii.
Se cere:
a) calculai i interpretai indicii individuali de modificare a cursului;
b) calculai i interpretai indicele bursier, de tip Laspeyres;
c) dac indicele bursier la cotaia precedent a fost de 560 puncte, determinai i interpretai rata
rentabilitii pieei (faa de cotaia precedent).
Rezolvare
a) Indicii individuali ai cursului aciunilor sunt:
c (t ) 3800
I ct1/ 0 = 1 =
= 0.513
c1 (0) 7400
c (t ) 3370
I ct2/ 0 = 2 =
= 1.182
c 2 (0 ) 2850
c (t ) 1840
I ct3/ 0 = 3 =
= 0.428
c3 (0 ) 4300
Cursul aciunii Antibiotice Iai a sczut, la 20.09.2004 fa de 19.09.1997, la 51.3%.
CB = ci ni
i =1
unde:
ci reprezint cursul (preul) aciunii i;
ni numrul de aciuni de tipul i tranzacionate (volumul).
Indicele bursier de tip Laspeyres nregistreaz valoarea:
n (0)c (t )
i
(L ) =
t/0
CB / c
i =1
3
n (0)c (0)
i
i =1
c) Rata rentabilitii pieei bursiere (fa de cotaia precedent) se determin din relaia
urmtoare:
I t / 0/ c ( L )
R t / t 1 = CB
1.
t 1 / 0
I CB
/ c (L )
Astfel,
0.467
R t / t 1 =
1 = 0.166
0.560
ceea ce indic o scdere a rentabilittii pieei cu 1.66%.
Exemplul 6. Cazul n care factorii se compun dup un model matematic de tip sum de produse
O firm a achizi ionat de la un furnizor, n decursul a doi ani, trei produse. Modul n care s-a
modificat preul acestora, precum i cantitile achiziionate din cele trei produse n perioadele
considerate este ilustrat n tabelul urmtor:
2003
2004
p
q
p
q
1 23
5
28
7
2 29
6
34
4
3 12 15
9
18
S se studieze evoluia valorii acestor produse n funcie de indicele variaiei integrale i indicii
varia iilor factoriale.
Rezolvare
Suntem n cazul:
V = pi qi
i
p (04) q (04)
i
04 / 03
V
i =1
3
p (03) q (03)
i
28 7 + 34 4 + 9 18 494
=
= 1,053
23 5 + 29 6 + 12 15 469
i =1
I V04/ /p03 (L ) =
p (04) q (03)
i
i =1
3
p (03) q (03)
i
28 5 + 34 6 + 9 15 479
=
= 1,021
23 5 + 29 6 + 12 15 469
i =1
valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,021 ori datorit variaiei
preului
p (03) q (04)
i
04 / 03
V /q
(L ) =
i =1
3
p (03) q (03)
i
23 7 + 29 4 + 12 18 493
=
= 1,051
23 5 + 29 6 + 12 15 469
i =1
valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,051 ori datorit variaiei
cantit ii
b) Indicii Paasche
3
04 / 03
V/p
(P ) =
p (04) q (04)
i
i =1
3
p (03) q (04)
i
28 7 + 34 4 + 9 18 494
=
= 1,002
23 7 + 29 4 + 12 18 493
i =1
valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,002 ori datorit variaiei
preului
3
p (04) q (04)
i
I V04/ /q03 (P ) =
i =1
3
p (04) q (03)
i
28 7 + 34 4 + 9 18 494
=
= 1,031
28 5 + 34 6 + 9 15 479
i =1
valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,031 ori datorit variaiei
cantit ii
c) Indicii Fisher
valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,011 ori datorit variaiei
preului
valoarea produselor achizi ionate a crescut n 2004 fa de 2003 de 1,041 ori datorit variaiei
cantit ii
Exemplul 7. Cazul n care factorii se compun dup un model matematic de tip produs
Se consider o firm pentru care se cunosc urmtoarele date aferente perioadei 2005-2006:
2005 2006
W
0,62
0,78
L
210
272
unde:
W productivitatea/angajat;
L numrul de angajai.
S se studieze pe baza indicelui variaiei integrale i a indicilor variaiei factoriale evolu ia produciei
firmei n perioada 2005-2006.
Rezolvare
Suntem n cazul:
Q =W L
producia firmei a crescut n 2006 fa de 2005 de 1,295 ori datorit variaiei numrului de
angajai
b) Indicii Paasche
producia firmei a crescut n 2006 fa de 2005 de 1,295 ori datorit variaiei numrului de
angajai
I Q06/ W/ 05 (P ) =
c) Indicii Fisher
producia firmei a crescut n 2006 fa de 2005 de 1,295 ori datorit variaiei numrului de
angajai
Exemplul 8. Cazul n care factorii se compun dup un model matematic de tip sum
O firm productoare de obiecte sanitare deine trei magazine de desfacere pentru care se
cunoate cifra de afaceri (n mii euro) n perioada 2004-2005:
2004 2005
CA1
28
35
CA2
26
20
CA3
51
70
S se studieze evoluia cifrei de afaceri pe baza indicilor variaiei integrale i factoriale.
Rezolvare
Suntem n cazul:
cifra de afaceri a crescut n 2005 fa de 2004 de 1,067 ori datorit variaiei cifrei de afaceri a
magazinului 1
CA104 + CA205 + CA304 28 + 20 + 51 99
05 / 04
I CA
(
L
)
=
=
=
= 0,943
/ CA2
CA104 + CA204 + CA304 28 + 26 + 51 105
cifra de afaceri s-a modificat n 2005 fa de 2004 de 0,943 ori datorit varia iei cifrei de
afaceri a magazinului 2
CA104 + CA204 + CA305 28 + 26 + 70 124
05 / 04
I CA
(
L
)
=
=
=
= 1,181
/ CA3
CA104 + CA204 + CA304 28 + 26 + 51 105
cifra de afaceri a crescut n 2005 fa de 2004 de 1,181 ori datorit variaiei cifrei de afaceri a
magazinului 3
b) Indicii Paasche
cifra de afaceri a crescut n 2005 fa de 2004 de 1,059 ori datorit variaiei cifrei de afaceri a
magazinului 1
CA105 + CA205 + CA305 35 + 20 + 70 125
05 / 04
I CA
(
P
)
=
=
=
= 0,954
/ CA2
CA105 + CA204 + CA305 35 + 26 + 70 131
cifra de afaceri s-a modificat n 2005 fa de 2004 de 0,954 ori datorit varia iei cifrei de
afaceri a magazinului 2
CA105 + CA205 + CA305 35 + 20 + 70 125
05 / 04
I CA
(
P
)
=
=
=
= 1,179
/ CA3
CA105 + CA205 + CA304 35 + 20 + 51 106
cifra de afaceri a crescut n 2005 fa de 2004 de 1,179 ori datorit variaiei cifrei de afaceri a
magazinului 3
05 / 04
I CA
/ CA1 ( P ) =
c) Indicii Fisher
05 / 04
05 / 04
05 / 04
I CA
I CA
/ CA1 (F ) =
/ CA1 (L ) I CA / CA1 ( P ) = 1,067 1,059 = 1,063
cifra de afaceri a crescut n 2005 fa de 2004 de 1,063 ori datorit variaiei cifrei de afaceri a
magazinului 1
05 / 04
05 / 04
05 / 04
I CA
I CA
0,943 0,954 = 0,948
/ CA2 (F ) =
/ CA2 (L ) I CA / CA2 (P ) =
cifra de afaceri s-a modificat n 2005 fa de 2004 de 0,948 ori datorit varia iei cifrei de
afaceri a magazinului 2
05 / 04
05 / 04
05 / 04
I CA
I CA
/ CA3 (F ) =
/ CA3 (L ) I CA / CA3 (P ) = 1,181 1,179 = 1,180
cifra de afaceri a crescut n 2005 fa de 2004 de 1,180 ori datorit variaiei cifrei de
afaceri a magazinului 3
Capitolul 6
ANALIZA I PREVIZIUNEA SERIILOR CROLOLOGICE
6.1. Baza de date statistice
n derularea activitii lor, frecvent agenii economici sunt pui n situaia de a anticipa viitorul, iar
apoi de a lua decizii n consecin. Oamenii de afaceri sunt nevoii s previzioneze anual cifra de
afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt interesai de profitul
viitor degajat de investiie, respectiv guvernele de previziunea consumului sau a cheltuielilor
guvernamentale etc.. Ob inerea rapid de previziuni utiliznd modele cantitative de previziune este la
ndemna analitilor, urmare i a softurile de statistic accesibile i uor de exploatat.
Anticiparea, previziunea evoluiei viitoare a fenomenelor economice presupune n primul rnd
cunoaterea istoriei acestora, punerea n eviden a unor legit i privind comportamentul lor trecut.
Baza de date pe care se fundamenteaz analiza evolu iei fenomenelor n timp este constituit din serii
cronologice.
O serie cronologic este o secven de observaii asupra unei variabile, ordonate dup
parametrul timp. Frecvent, msurtorile asupra variabilei sunt efectuate la intervale egale de timp,
seria cronologic fiind prezentat sub forma:
1 2 ... t ... n
Y :
y1 y 2 ... yt ... y n
Din punct de vedere statistic, n contextul modelrii i previziunii, seria cronologic cu datele
observate y1 , y 2 ,...., y n constituie o realizare a secvenei de variabile aleatoare Y1 , Y2 ,...., Yn , adic a
unui proces stochastic de tip discret (Tertico .a., 1985).
n analiza seriilor cronologice este necesar ca lungimea perioadei observate s fie suficient de
lung pentru a face posibil estimarea unui model adecvat calitativ, care s surprind mecanismul real
de generare al fenomenului, respectiv s permit identificarea unor componente ale evolu iei pe
termen lung. De regul se impune utilizarea unor serii cronologice cu cel pu in 15 termeni, respectiv
pentru serii sezoniere este de dorit ca perioada observat s acopere cel puin cinci cicluri sezoniere.
n acelai timp datele trebuie s rmn comparabile n timp. Condiiile n care evolueaz
fenomenul este necesar s rmn n esen aceleai. Astfel, nu este indicat a se utiliza n elaborarea de
modele, serii cronologice ce acoper perioade de schimbri economice sau politice majore, rzboi, sau
alte evenimente excepionale; n analiza evolu iei majoritii indicatorilor economici pentru ara
noastr este indicat ca datele s nceap dup 1989. nainte de aplicarea tehnicilor specifice de analiz
i previziune, dac este necesar, unii indicatori vor fi exprimai n preuri comparabile. Cnd se
analizeaz spre exemplu evolu ia cifrei de afaceri sau a indicatorilor macroeconomici de rezultate i ne
intereseaz evoluia datelor neafectate de schimb rile de pre, este indicat a se exprima datele n
preurile anului baz de comparaie, prin mprirea acestora la un indice adecvat al preurilor. De
asemenea, creterea n timp a unor variabile din economie se datoreaz n principal creterii populaiei,
astfel c n aceste situaii este mai util a se analiza evoluia variabilei per cap de locuitor.
Atunci cnd cronograma indic prezena unor valori aberante, corespunztoare unor greve,
calamiti naturale sau altor evenimente punctuale, acestea vor fi nlocuite cu valorile medii ce ar fi
fost nregistrate n circumstane normale. De asemenea, dac graficul indic puncte de schimbare
brusc a sensului evoluiei, de tipul o tendin cresctoare ce se schimb brusc ntr-una descresctoare,
se vor elabora modele diferite pentru cele doua p ri ale seriei.
Frecvena msurtorilor este condiionat i de practic. Spre exemplu, vnzrile unui magazin
pot fi nregistrate zilnic, profitul poate fi observat lunar i / sau anual respectiv indicele bursier la
ncheierea zilei de cotaie. n general, acolo unde sunt disponibile, poate fi util utilizarea unor date ct
mai frecvente. Datele anuale nu fac posibil observarea caracterului sezonier specific anumitor
indicatori respectiv modelarea unor dependene n care timpul de reacie al variabilei efect este scurt.
Scopul final al tehnicilor de analiz a seriilor cronologice este previziunea. Informaiile ob inute
respectiv modelele elaborate sunt valabile, strict vorbind, doar pentru perioada observat. Atunci cnd
se fac previziuni pornim de la presupunerea c fenomenul va continua s aib acelai comportament
ca i n trecut. Este important ca analistul s se ntrebe n ce msur aceast presupunere este realist,
respectiv s in seama de atept rile sale. Se spune pe bun dreptate c previziunea rmne n
acelai timp tiin i art. Previziunea fenomenelor economice este o sarcin relativ dificil, urmare
a complexitii mediului economic. Abord rile tradiionale sunt uneori subiective i prea
simplificatoare, n timp ce metodele moderne sunt mai riguros fundamentate teoretic dar sunt i mai
complexe, necesitnd experien i o intervenie activ a analistului.
y3 = y 2 I y = y1 ( I y ) 2
y n = y n 1 I y = y1 ( I y ) n1
Din ultima relaie rezult:
yn
y1
expresie de calcul adecvat pentru indicatori ce evolueaz aproximativ exponenial.
I y = n1
yt = I y Tt 1 + t .
Exemplu 2. Determinarea indicelui mediu respectiv a ritmului mediu
Se cunoate populaia judeului Cluj la ultimele dou recensminte:
Recens.
5 ian 1977
7 ian 1992
Nr. pop. (mii loc.)
715.7
736.3
n ipoteza unei evolu ii aproximativ exponeniale a populaiei pe perioada 1977-1992, indicele mediu
anual se determin astfel:
736.3
= 1,002
715.7
n perioada 1977-1992, populaia acestui jude a crescut n medie anual de 1,002 ori sau cu 0,2 %.
I y = 15
Dac acest ritm de cretere s-ar fi meninut i dup 1992, n anul 1995 numrul populaiei ar fi fost de:
736.3 ( I y ) 3 = 740.7 mii loc.
Populaia judeului Cluj n anul 1995 a fost de 727.6 mii loc.
2
t
t =1
(y
y =
yt 1 )
t =2
n 1
t / t 1
y
t=2
n 1
sau echivalent:
y n y1
.
n 1
Acest mod de calcul conduce la rezultate satisfctoare n condiiile n care indicatorul evolueaz,
pe perioada considerat, aproximativ liniar.
y =
1991
7659
1992
7683
1993
7710
1994
7749
1995
7782
1996
7811
1997
7837
1998
7860
1999
7883
2000
7907
Evoluia majoritii indicatorilor din economie este dominat de tendin, ceea ce justific importana
acordat acestei componente. Pentru modelarea i previziunea tendinei se au n vedere funciile
elementare lent variabile n timp.
Vom considera n acest paragraf c seria prezint doar tendin i component aleatoare,
modelul de descompunere fiind aditiv respectiv multiplicativ:
yt = Tt + t , respectiv y t = Tt t .
De asemenea, n acest context presupunem ca tendina poate fi modelat suficient de bine prin
funcii elementare.
Forma liniarizat
ty/ t 1 = y t y t 1
Tt = a + bt
parabol
Tt = a + bt + ct
hiperbol
1
Tt = a + b
t
exponenial
Tt = a b
putere
Tt = a t b
logaritmic
Tt = a + b ln t
T = a + bt + cX
( 2)
t / t 1
= ty/ t 1 ty1 / t 2
Unde X = t
T = a + bX
tty/ t 1 = ty t (t 1) y t 1
1
t
Z = A + Bt
Unde X
unde
tln/ ty1 = ln yt ln y t 1
Z t = ln Tt ; A = ln a; B = ln b
Z = A + bX
Unde
Z t = ln Tt ; A = ln a; X = ln t
T = a + bX
unde
X = ln t
curba logistic
Tt =
a
, a, c > 0
1 + e b ct
(t t )( y
b=
Y)
t =1
n
(t t )
,
2
t =1
a = Y bt ,
sau echivalent
b=
M (tY ) M (t ) M (Y )
,
M (t 2 ) [M (t )]2
a = Y bt .
Seria prezint o tendin de cretere atunci cnd b > 0 respectiv de descretere dac b < 0.
Precizm c variabila timp se msoar cu ajutorul scalei de interval, astfel c originea scalei
respectiv unitatea de msur se pot stabili n mod arbitrar. Uneori, pentru u urarea calculelor sunt
stabilite astfel nct t = 0 , variantele variabilei t rezultnd n consecin. Astfel:
- daca n este impar t = ...,3, 2, 1, 0,1, 2, 3,...
- daca n este par t = ...,2,5; 1,5; 0,5; 0,5;1,5; 2,5;...
sau t = ....,5, 3, 1,1, 3, 5,....
Cu excepia curbei logistice, celelalte funcii neliniare din tabelul 6.1. pot fi aduse la o form
liniarizat prin anumite substituii, respectiv prin aplicarea operaiei de logaritmare n cazul funciei
exponeniale i a funciei putere.
Spre exemplu n cazul tendinei exponeniale
Tt = a b t ,
considernd un model de descompunere multiplicativ yt = Tt t , operaia de logaritmare a ambilor
membri conduce la:
ln yt = ln a + t ln b + ln t .
Prin substituiile A = ln a, B = ln b, t = ln t se ob ine forma liniarizat:
ln yt = A + Bt + t .
Aplicnd metoda celor mai mici ptrate, se determin A, B:
M (tX ) M (t )M ( X )
B=
2
M (t 2 ) [M (t )]
A = M ( X ) bM (t )
unde s-a notat X = ln Y , variantele variabilei X fiind deci xt = ln yt , t = 1, 2, ...,K n .
Odat calculai A respectiv B se pot determina parametrii tendinei exponeniale a = e A , b = e B .
n cazul tendinei parabolice:
yt = a + bt + cX + t
unde X = t , pentru estimarea parametrilor a, b, c se utilizeaz relatiile de calcul deduse n cadrul
regresiei liniare multiple, lucrnd eventual cu variante pentru variabila t astfel nct t = 0 (scopul fiind
u urarea calculelor).
Estimarea parametrilor curbei logistice necesit utilizarea unor metode specifice de tipul
procedurilor numerice iterative pentru modele neliniare sau a metodei celor trei puncte (Melard,
1990), metode integrate n softurile pentru statistic.
1
3.7
2
3.8
3
4.1
4
4.3
5
4.5
6
4.8
7
4.9
8
5.1
9
5.3
10
5.5
11
5.6
12
5.8
13
6.0
14
6.2
15
6.3
16
6.5
17
6.6
Cronograma seriei sugereaz prezena unei tendine liniare, peste care se suprapune o component
aleatoare de amplitudine redus:
18
7.0
yt = a + bt + t , t = 1, 2,...,18.
Parametrii tendinei se determin din relaiile:
M (tY ) M (t ) M (Y )
b=
2
M (t 2 ) [M (t )]
a = M (Y ) bM (t ).
rezultnd
55.72 9.5 5.33
= 0.19,
117.2 (9.5) 2
a = 5.33 0.19 9.5 = 3.55.
Tendina seriei se estimeaz prin funcia de gradul nti:
Tt = 3.55 + 0.19t ,
al crei grafic este redat n figura 6.6..
b=
F
20
M
32
A
40
M
47
I
52
I
60
A
62
S
63
O
65
N
67
M (t 2Y ) M (Y ) M (t 2 )
M (t 4 ) M (t 2 )
a = M (Y ) cM (t 2 ).
Calcule intermediare:
t
yt
t2
tYt
t4
t 2 Yt
-9
20
81
-7
32
49
-5
40
25
-3
47
9
-1
52
1
1
60
1
3
62
9
5
63
25
7
65
49
9
67
81
Media
50.8
33
-180
-224
-200
-141
-52
60
186
315
455
603
82.2
6561
2401
625
81
81
625
2401
6561
1933.8
1620
1568
1000
423
52
60
558
1575
3185
5427
1546.8
a = 55.86,
se estimeaz parametrii dreptei Tt = 50.8 + 2.5t , apoi se determin suma ptratelor reziduurilor
An
Nr.
populaiei
(mil. loc.)
1981
22.35
1982
22.48
1983
22.55
1984
22.62
1985
22.72
1986
22.82
1987
22.94
1988
23.15
X1 =
ln y t
22.20
-
22.35
0.15
22.48
0.13
22.55
0.07
22.62
0.07
22.72
0.1
22.82
0.1
22.94
0.12
23.15
0.21
3.100
3.107
3.109
3.116
3.119
3.123
3.128
3.133
3.142
0.007
0.002
0.007
0.003
0.004
0.005
0.005
0.009
X 2 = tln/ tY1
X1 =
12
X1
respectiv
= 0.388
v2 =
22
X2
= 0.384
min(v1 , v 2 ) = 0.384.
Valorile celor doi coeficieni de variaie sunt destul de apropiate, totui diferenele datelor logaritmate
prezint un grad mai mic de dispersie, exponeniala fiind deci mai indicat dect dreapta n modelarea
tendinei.
2. Estimarea tendinei exponentiale
Modelm tendina printr-o funcie exponenial, n modelul multiplicativ:
yt = a b t t
Logaritmarea ambilor membrii conduce la liniarizarea tendinei:
ln yt = ln a + t ln b + ln t ,
respectiv
z t = A + Bt + t ,
unde z t = ln yt , A = ln a, B = ln b, t = ln t .
t
z t = ln y t
1
3.100
2
3.107
3
3.109
4
3.116
5
3.119
6
3.123
7
3.128
8
3.133
9
3.142
B=
M (tZ ) M (t ) M (Z )
2
M (t 2 ) [M (t )]
A = M ( Z ) BM (t ).
Cronograma celor dou serii este redat n figura 6.8. respectiv 6.9..
n general, este adecvat un model aditiv atunci cnd amplitudinea oscilaiilor este aproximativ
constant (vezi figura 6.8.) respectiv multiplicativ dac amplitudinea crete (figura 6.9.) sau scade n
timp. Frecvent n practic este mai adecvat modelul multiplicativ.
Perioada componentei sezoniere, notat cu p, reprezint numrul unitilor de timp din cadrul
unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata unui ciclu de un
an, p fiind egal cu 4 n cazul datelor trimestriale respectiv 12 n cazul datelor lunare. Prin extensie pot
fi studiate i fenomene cu durata unui ciclu mai mic de un an. Exemple n acest sens sunt prezentate
n tabelul 6.3.
Perioada
p
4
12
Exemple
o sptmn
Zilnice
o zi
din or n or
Cronograma seriei respectiv coninutul variabilei analizate sugereaz perioada p. Pentru descoperirea
unor oscilaii ascunse se apeleaz la metode specifice analizei spectrale (Tertico .a., 1985).
Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplic datelor o medie mobil de
ordin p egal cu perioada componentei sezoniere. n general, mediile mobile sunt transformri liniare f
utilizate n scopul desezonalizrii seriei respectiv al atenurii amplitudinii fluctuaiilor aleatoare:
eliminarea componentei sezoniere f ( St ) 0 ,
eliminarea componentei aleatoare f ( t ) 0 respectiv
conservarea tendinei i a componentei ciclice f (Tt ) Tt .
Mediile mobile de ordin p, notate n continuare MM(p), sunt definite de urmtoare relaii:
daca p este impar p = 2k + 1 , mediile mobile de ordin p sunt
y + y t k 1 + ... + yt + ... + yt + k
yt = t k
; t = k + 1, k + 2,..., n k ;
p
daca p este par p = 2k se definesc analog
y t k + 0,5 + yt k +1,5 + ... + yt 0,5 + y t + 0,5 + .... + y t + k + 0,5
yt =
,
p
t = k + 0,5; k + 1,5; ... ; n k + 0,5.
n cazul p impar se realizeaz o coresponden ntre valorile observate i cele netezite (transformate),
astfel:
y1
-
y2
-
...
...
yk
-
yk+1
...
...
y k +1
yt
yt
...
...
yn-k
yn-k-1
-
y nk
...
...
yn
-
y2
-
...
...
yk
-
yk+1
y k + 0.5
...
...
yt
yt+1
y t + 0 .5
...
...
yn-k
y n k + 0.5
yn-k-1
-
...
...
yn
-
astfel c valorile netezite sunt atribuite unui t intermediar, mijlocul intervalului dintre dou observaii
succesive. n scopul efecturii unor comparaii ntre valorile observate i cele netezite este indicat
existent unei corespondene ntre acestea, motiv pentru care, n cazul p par, se introduc mediile
mobile centrate de ordin p definite prin:
y t 0,5 + y t +0,5 0,5 y t k + yt k +1 + ... + y t + ... + yt + k 1 + 0,5 y t + k
.
yt =
=
2
p
Astfel, y t corespunde valorii observate yt pentru t = k + 1, k + 2, .... n k . n continuare prin medie
mobil n cazul p par se va nelege medie mobil centrat.
n cazul particular p = 4, caz ntlnit frecvent n practic, mediile mobile centrate sunt date de relaiile:
0,5 y1 + y 2 + y3 + y 4 + 0,5 y 5
y3 =
,
4
0,5 y 2 + y3 + y 4 + y 5 + 0,5 y 6
y4 =
,
4
L
0,5 y n 4 + y n3 + y n 2 + y n 1 + 0,5 y n
y n 2 =
.
4
Proprieti ale mediilor mobile
atunci prin aplicarea unei medii mobile de ordin p egal cu perioada, oscilaiile se elimin din
date, valorile netezite fiind constante y t = y t +1 . Astfel, pentru eliminarea unei componente
sezoniere de ordin p se va aplica seriei o medie mobil de ordin p.
Mediile mobile de tipul mediilor aritmetice, prezentate aici, las nedeviat funcia de gradul
nti yt = a + bt . Astfel, tendina liniar se conserv prin aplicarea acestor medii mobile. Teoria
permite construirea unor medii mobile ponderate ce conserv i polinoame de grad superior
[10].
Valorii observate yt i corespunde o valoare netezit y t calculat ca o medie aritmetic a
valorilor adiacente.
Seria valorilor netezite are mai puin cu p 1 respectiv cu p termeni dect seria ini ial, dup
cum p este impar sau par. Acest aspect constituie un dezavantaj al metodei.
184
178
176
167
175
157
193
188
183
220
230
220
202
213
189
252
272
332
325
330
315
296
279
276
220
225
209
196
198
186
174
187
164
253
247
243
Graficul seriei din figura 6.10. sugereaz o component sezonier predominant, de perioad p = 12,
conform ateptrilor traficul fiind mai intens n lunile de var respectiv n perioada srbtorilor de
iarn. Pentru eliminarea sezonalitii aplicm datelor o medie mobil de ordin 12, egal cu perioada
componentei sezoniere. Graficul valorilor desezonalizate este prezentat n figura 6.10.
Mediile mobile de ordin p = 12 sunt calculate conform relaiei de definiie a mediilor mobile
centrate. Astfel, spre exemplu:
0.5 y1 + y 2 + y 3 + y 4 + y 5 + y 6 + y 7 + y 8 + y 9 + y10 + y11 + y12 + 0.5 y13
=
12
0.5 184 + 167 + 193 + 220 + 202 + 252 + 325 + 296 + 220 + 196 + 174 + 253 + 0.5 178 ...
=
=
12
= 223.3
0.5 y 24 + y 25 + y 26 + y 27 + y 28 + y 29 + y 30 + y 31 + y 32 + y 33 + y 34 + y 35 + 0.5 y 36
y 30 =
=
12
0.5 247 + 176 + 157 + 183 + 220 + 189 + 332 + 315 + 276 + 209 + 186 + 164 + 0.5 243
=
=
12
= 221.0
y7 =
Datele observate au fost indexate aici n ordine cronologic y1, y2, ..., y36 .
Tabelul 6.4 indic valorile mediilor mobile. Seria mediilor mobile prezentat grafic n figura 6.10.
indic absena componentei de tendin n evoluia traficului de cltori pe perioada considerat.
Tabelul 6.4. Mediile mobile de ordin 12
t
MM(12)
MM(12)
MM(12)
1
2
3
4
5
6
7
8
9
10
11
12
223.3
223.3
223.5
223.7
224.5
225.8
13
14
15
16
17
18
19
20
21
22
23
24
226.9
226.4
225.9
226.2
226.8
227.1
226.7
225.9
224.9
224.3
222.9
224.4
25
26
27
28
29
30
31
32
33
34
35
36
226.3
225.5
224.7
223.6
222.1
221.0
-
nu conine component sezonier, estimarea tendinei realizndu-se aici n baza celor prezentate n
paragraful 6.4.
6.5.4. Estimarea componentei sezoniere
Vom expune aici modalitatea de estimare a componentei sezoniere prin intermediul coeficienilor
sezonalitii. Alte alternative de estimare a componentei sezoniere sunt:
introducerea ei ntr-un model de regresie multipl prin intermediul unor variabile
alternative(Gourieroux & all, 1990);
modelarea componentei prin intermediul funciilor trigonometrice (Tertico .a., 1985).
Se consider, n acest context, c seria prezint component de tendin respectiv ciclic, dar nu
se emite o ipotez privind forma acestora. Componenta evoluiei pe termen lung tendin - ciclu este
privit ca o medie curent a seriei TC t = M (Yt ) , estimat prin mediile mobile y ij .
n cazul modelului multiplicativ
yij = Tij S j ij ,
metoda se ntlnete n literatur i sub denumire de metoda raport rii la mediile mobile i const n
urmtoarele:
calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere;
determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaiilor precedente:
1 n1
Ij =
Sij ; j = 1, 2,..., p ,
n 1 i =1
aceasta justificndu-se prin necesitatea eliminrii efectului aleator din S ij . Pentru a nu fi
afectai de valorile extreme, uneori nainte de calculul mediei, aceste valori se elimin, sau n
loc de medie se consider valoarea median a estimaiilor S ij ;
determinarea componentei sezoniere S j , etap ce const ntr-o corecie adus indicilor medii
I j astfel nct media lor s fie 1:
1 p
S j = I j / I i j = 1, 2,..., p .
p i =1
Aceast cerin impus indicilor sezonalitii este natural, variaiile sezoniere se compenseaz
n medie pe parcursul unui an.
determinarea componentei sezoniere decurge analog, dar avnd n vedere forma aditiv de
descompunere, coeficienii ce intervin se determin astfel:
S ij = y ij y ij
1 n 1
S ij
n 1 i =1
iar ajustarea coeficienilor medii C j , pentru a obine componenta sezonier S j sau coeficienii
sezonalitii se face astfel nct media lor s fie zero:
1 p
C j = 0.
p j =1
Cj =
0.5 y 2 + y3 + y4 + y5 + 0.5 y6
=
4
0.5 263.2 + 252.4 + 124.5 + 130.1 + 0.5 280.2
=
= 194.7
4
L
y4 =
Datele observate au fost numerotate aici n ordine cronologic y1, y2, ..., y24.
MM(4)
MM(4)
1
2
3
4
5
6
7
8
9
10
11
12
191.8
194.7
197.8
202.2
208.9
214.9
229.2
245.0
250.8
257.1
13
14
15
16
17
18
19
20
21
22
23
24
261.7
259.4
258.3
267.7
284.5
299.7
309.8
310.2
308.4
306.0
-
1
191.8
2
194.7
b=
3
197.8
...
...
19
308.4
M (tZ ) M (t ) M ( Z )
2
M (t 2 ) [M (t ) ]
a = M ( Z ) bM (t ).
20
306.0
Calcule intermediare:
M (t ) = 10.5, M ( Z ) = 252.9, M (t 2 ) = 143.5, M (tZ ) = 2884.9,
b = 6.9, a = 180.44.
Tendina produciei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin:
Tt = 180.44 + 6.9 t .
exemplu y13 = y1996;III = 252.4 sau y34 = y1998;IV = 185 .0 . Mediile mobile din tabelul 6.6
transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim.
1996
1997
1998
1999
2000
2001
Rapoartele S ij =
y ij
y ij
I
197.8
229.2
261.7
284.5
308.4
II
202.2
245.0
259.4
299.7
306.0
III
191.8
208.9
250.8
258.3
309.8
-
vor fi
IV
194.7
214.9
257.1
267.7
310.2
-
100 , respectiv mediile acestora pentru fiecare sezon sunt indicate n tabelul 6.7..
Ij
I
65.8
68.7
64.8
62.4
65.8
65.5
II
138.6
122.9
131.1
136.0
125.9
130.9
III
131.6
124.7
140.9
135.8
134.7
133.5
IV
63.9
70.3
71.9
63.0
72.7
68.4
Media
99.6
Sj
65.6
131.4
134.0
68.8
Media
100
1996
191.05
1997
205.5
1998
249.25
1999
257.32
2000
306.6
2001
302.6
t
yt
1
191.05
2
205.5
3
249.25
4
257.32
5
306.6
6
302.6
II
III
IV
1996
1997
1998
1999
2000
174.7
203.1
231.5
259.9
288.3
181.8
210.2
238.6
267.0
295.4
188.9
217.3
245.7
274.1
302.5
196.0
224.4
252.8
281.2
309.6
Y = T + C + S respectiv Y = T C S .
previziunea realizat la momentul n, utiliznd datele y1 , y 2 ,...., y n , pentru un orizont de timp h.
Notm cu y n + h
Previziunea componentelor deterministe se realizeaz astfel:
tendina: se extrapoleaz tendina estimat printr-o funcie elementar. Spre exemplu n cazul tendinei liniare:
Tn+ h = a + b(n + h)
Se are n vedere aici i modul de definire a variantelor variabilei t;
componenta sezonier: se utilizeaz coeficientul sezonalitii aferent sezonului corespunztor momentului n+h,
sau o alt metod de modelare a acestei componente;
componenta ciclic: innd seama de seria indicilor de ciclicitate respectiv de opinia experilor privind punctele de
ntoarcere previzibile.
Spre exemplu, n cazul absenei ciclicitii, valoarea previzionat este:
y n+ h = Tn + h + S s respectiv y n+ h = Tn + h S s ,
dup cum modelul este aditiv sau multiplicativ.
Extrapolarea tendinei respectiv a celorlalte componente deterministe, conduc la previziuni adecvate n condiiile
n care:
- modelele estimate reuesc s surprind ceea ce este esenial, repetabil, n comportamentul trecut al fenomenului
respectiv
- comportamentul factorilor ce determin schimbrile n timp n nivelul nregistrat de variabila Y rmne i pe
viitor aproximativ acelai.
Extrapolarea este adecvat n principal pentru obinerea de previziuni pe termen scurt, elaborndu-se de regul dou
sau mai multe scenarii de evoluie.
Trim.
Tendin
Sezonalitate
Previziune
Producie
Eroare
III
IV
I
325.34
332.24
339.14
1.34
0.688
0.656
435.95
228.58
217.9
425.6
196.6
203.2
-10.35
-31.98
-14.7
Prezentm modul de obinere a rezultatelor anterioare pentru trim. III an 2001. Valorile tendinei respectiv a componentei
sezoniere sunt:
)
)
T (21) = 180.44 + 6.9 21 = 325.34 respectiv S 3 = 1.34.
Modelul de descompunere considerat a fost cel multiplicativ, astfel c valoarea previzionat este:
)
y = 325.34 1.34 = 435.95
iar eroarea de previziune aferent:
)
e = 425.6 435.95 = 10.35
Luna
Indice y
)
Previziune y
Eroare e
I
7.40
7.16
0.24
A
7.66
7.35
0.31
S
7.96
7.54
0.42
O
8.26
7.73
0.53
N
8.47
7.92
0.55
D
8.65
8.11
0.54
Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinei conducnd la:
)
)
y19 = T19 =3.55 + 0.19 19 = 7.16
)
)
e19 = y19 - y19 = 0.24.
Tt = 22.11 (1.005)t
O extrapolare a acestei tendine ( fr a se ine seama de condiiile n care previziunea prin extrapolare
conduce la valori adecvate) ar indica o populaie previzibil pentru anul 2000 de:
T20 = 22.11 (1.005)21 = 24.36 mil. locuitori,
valoarea real fiind de 22.43 mil. locuitori. Dup 1989 tendina s-a schimbat brusc ntr-una
descresctoare, mediul economic i social, cu influen direct asupra evoluiei populaiei unei ri,
schimbndu-se substanial fa de cel din perioada 1980 1988 (perioad utilizat n estimarea
tendinei).
2. M surarea acurateii previziunilor
Dac modelul elaborat conduce la previziunile y1 , y 2 ,..., y p corespunztoare datelor y1 , y 2 ,..., y p ,
pentru a msura calitatea acestuia de a genera previziuni adecvate se utilizeaz o serie de indicatori
sintetici ai erorilor de previziune, cei mai frecvent ntlnii fiind:
1 p
2
- eroarea medie ptratic:
MSE = ( y h y h )
p h =1
MAE =
1 p
y h y h
p h =1
1 p y h y h
y
p h=1
h
Frecvent, n practic se utilizeaz doar o parte din date n estimarea modelului, cele rmase (cele
mai recente), urmnd a fi comparate cu previziunile corespunztoare generate de model. Dintre mai
multe modele alternative de previziune este selectat cel ce conduce la erori medii de previziune mai
mici. Dup alegerea modelului, acesta poate fi reestimat lund n considerare toate datele disponibile.
O alt variant de lucru const n compararea previziunilor obinute din model cu cele generate
naiv. Conform modelului naiv de previziune (mers aleator) valoarea nregistrat de variabil n
urmtoarea perioad va fi cea nregistrat n prezent.
6.8. Descompunerea seriei pe componente
Trim.
1996
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
1997
1998
1999
2000
2001
Producie
Y
124.1
263.2
252.4
124.5
130.1
280.2
260.6
151.1
157.5
301.2
353.3
185.0
169.7
340.0
350.9
168.7
177.5
407.6
417.2
224.1
209.9
385.3
425.6
196.6
MM(4)
191.8
194.7
197.8
202.2
208.9
214.9
229.2
245.0
250.8
257.1
261.7
259.4
258.3
267.7
284.5
299.7
309.8
310.2
308.4
306.0
-
Tendin
T
187.34
194.24
201.14
208.40
214.94
221.84
228.74
235.64
242.54
249.44
256.34
263.24
270.14
277.04
283.94
290.84
297.74
304.64
311.54
318.44
325.34
332.24
Comp.
sezonier S
1.340
0.668
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688
0.656
1.314
1.340
0.688
Reziduu
1.005
0.959
0.986
1.023
0.905
1.020
1.049
0.973
1.087
1.078
1.009
0.983
0.969
0.885
0.953
1.066
1.046
1.069
1.027
0.856
0.976
0.860
*2 1
= .
p
Astfel, cu ct ordinul mediei mobile este mai mare cu att seria mediilor mobile este mai neted.
Exemplul 11. Reducerea amplitudinii componentei aleatoare utiliznd medii mobile
Evoluia cursului unei aciuni este dominat n principal de fluctuaii aleatoare. Evidenierea i
estimarea unor componente deterministe, n scopul efecturii de previziuni este uneori imposibil, cea
mai adecvat previziune pentru cursul din cotaia urmtoare fiind chiar cursul prezent (model de tip
mers aleator).
Pentru 16 zile succesive de cotaie redm grafic n figura 6.12. evoluia cursului unei aciuni. In
scopul evidenierii tendinei s-au utilizat mediile mobile de ordin p = 3, respectiv p = 7, rezultatele
fiind redate n tabelul de mai jos, iar grafic n figura 6.7:
Zi (t)
Curs (yt)
MM(3)
1
29.9
-
2
29.8
29.9
3
30.1
30.4
4
31.2
31.1
5
31.9
31.1
6
30.1
30.2
7
28.6
30.1
8
31.5
30.4
9
31.2
31.1
10
30.7
31.0
11
31.2
30.8
12
30.4
30.9
13
31.0
30.6
14
30.4
31.0
15
31.5
31.5
16
32.7
-
S t = c (1 c) j y t j ; t = 2, 3,..., n ,
j =0
arat c valoarea netezit calculat la momentul t depinde de trecutul fenomenului yt , y t 1 ,..., y1 , dar
ponderea fiecrei observaii descrete. Viteza cu care se realizeaz aceasta depinde de constanta de
netezire c. Cnd c este apropiat de 1 atunci coeficientul (1 c) j descrete rapid spre zero, astfel ca
valoarea netezit S t depinde n mare msur de observaiile recente.
Alegerea unei valori optime pentru c depinde de caracteristicile seriei. Pentru serii fluctuante se va
utiliza o valoare mai apropiat de zero, iar acolo unde evoluia seriei este stabil se va considera o
valoare pentru c apropiat de unu. Un criteriu mai obiectiv de determinare a constantei poate fi studiat
n (Gourieroux & all, 1990).
Utilizat n scopul eliminrii componentei aleatoare, tehnica netezirii exponentiale simple
conduce n general la rezultate mai bune dect cele obinute utiliznd mediile mobile.
Exemplul 12. Reducerea amplitudinii componentei aleatoare prin tehnica netezirii exponeniale
Relum datele din exemplul referitor la evoluia cursului unei aciuni. Graficul 6.9. red seria
valorilor netezite obinute prin tehnica netezirii exponeniale simple pentru dou valori ale constantei
de netezire c = 0.1 respectiv c = 0.5.
Figura 6.9. -- Cursul aciunii; - - Valori netezite c = 0.5; ----- Valori netezite c = 0.1
Valorile netezite respectiv modul de calcul al acestora pentru c = 0.1 este redat n cele ce urmeaz:
T
yt
St
1
29.9
-
2
29.8
29.9
3
30.1
29.9
4
31.2
30.0
5
31.9
30.2
6
30.1
30.2
7
28.6
30.1
8
31.5
30.2
9
31.2
30.3
10
30.7
30.3
11
31.2
30.4
12
30.4
30.4
13
31.0
30.5
14
30.4
30.5
15
31.5
30.6
16
32.7
30.8
Astfel,
Capitolul 7
APLICAII
Problema 1
X :
330 420 370 480 520 550 600 580 630 635
- populaia activ
2
3
4
5
6
7
8
9
10
1
Y :
3882 4827 4302 5485 5843 6189 6593 6304 6702 6738
redai seria cronologic aferent ratei lunare a omajului;
3. Rata de omaj medie lunar;
4. De cte ori au crescut n medie de la o lun la alta numrul de omeri;
5. Exprimarea, calcularea i interpretarea urmtorilor indici:
I Z5 //1x ( F ) ; I Z5 //1y ( F ) ; I Z5 / 1 .
1) Z (rata omajului) este influenat de numrul de omeri direct proporional i de numrul
populaiei active invers proporional.
Z=
S
X
100 = 100
Pa
Y
2
3
4
5
6
7
8
9
10
1
2) Z :
8,5 8,7 8,6 8,75 8,90 8,90 9,1 9,2 9,4 9,42
3) Seria cronologic fiind de momente, nivelul mediu se determin dup urmtoarea relaie:
1
1
Z 1 + Z 2 + Z 3 + Z 4 + Z 5 + Z 6 + Z 7 + Z 8 + Z 9 + Z 10
2
Z= 2
=
10 1
1
1
8,5 + 8,7 + 8,6 + 8,75 + 8,90 + 8,90 + 9,1 + 9,2 + 9,4 + 9,42
2
2 = 8,945
=
9
Rata de omaj medie lunar din perioada analizat este de 8,945.
X (t 1) X (t ) =
4) I X =
[X (t 1)]2
=
330 420+ 420 370+ 370 480+ 480 520+ 520 550+ 550 600+ 600 580+ 580 630+ 630 635
3302 + 4202 + 3702 + 4802 + 5202 + 5502 + 6002 + 5802 + 6302
Z 5 8,9
=
= 1,047 , rata omajului a crescut de 1,047 n luna a 5-a fa de luna 1.
I 1 8,5
= 1,576
x1 3882 330
y1
x5
y
I Z5 //1x (P ) = 5 = 1,576
x1
y5
- rata omajului ar fi crescut de 1,576 datorit modificrii numrului de omeri, populaia activ
rmnnd constant;
- rata omajului ar fi sczut de 0,664 datorit modificrii populaiei active, numrul de omeri
rmnnd constant;
I Z5 //1x I Z5 //1y = 1,57 0,66 = 1,0465 = I Z5 / 1
Problema 2
Din mulimea autoturismelor vndute prin licitaie s-a constituit un eantion de 30 de uniti,
rezultatele observrii n raport cu variabilele X vechimea autoturismelor exprimat n ani i y
preul la care s-au vndut (n milioana lei) sunt prezentate n tabelul urmtor:
Nr . crt.
1
2
3
4
5
6
7
8
9
10
X
4
1
9
13
15
8
13
19
6
0
Y
30
40
20
17
17
28
20
13
33
41
Nr. crt.
11
12
13
14
15
16
17
18
19
20
X
6
5
11
13
2
8
12
20
5
14
Y
32
33
24
19
38
22
20
10
35
17
Nr . crt.
21
22
23
24
25
26
27
28
29
30
X
7
10
5
8
10
12
3
9
14
7
Y
30
25
36
23
27
22
35
29
19
30
Se cere:
1. Elaborarea repartiiei bidimensionale tiind c numrul de intervale pentru variabila X = 4, iar
lungimea unui interval pentru Y, ly = 8 intervalele fiind egale.
2. Parametrii tendinei centrale n raport cu preul de vnzare i interpretarea acestora;
3. Studierea reprezentativitii funciilor de regresie, liniar i hiperbolic i alegerea celei mai
reprezentative;
X max X min
20 0
=
=5
numar intervale
4
10
[10;18) [18;26)
Y :
10
5
[26;34) [34;42)
9
6
X
Y
[10;18)
[18;26)
[26;34)
[34;42)
TOTAL
[0;5)
[5;10)
[10;15)
[15;20)
TOTAL
1
4
5
3
7
2
12
2
7
1
10
3
3
5
10
9
6
30
2) Media:
R
'
Ni
14 5 + 22 10 + 30 9 + 37,5 6 785
=
= 26,26
N
30
30
- preul mediu de vnzare al mainilor este de 26,26 mii lei
1
30
Mediana:
rMe = N =
= 15
2
2
5 + 10 = rMe = 15 Me [18;26 )
15 5
8 = 26
Me = 18 +
10
- jumtate din maini se vnd cu un pre mai mic de 26.000 mii lei, iar cealalt jumtate cu un pre mai
mare de 26.000.000 lei.
Y=
i =1
[10 26)
15
[26;41)
15
Modala:
max(5, 10, 9, 6) = 10 Mo [18;26)
Cele mai multe autoturisme se vnd cu un pre cuprins ntre 18.000 i 26.000 mii lei.
10 5
5
Mo = 18 +
8 = 18 +
8 = 24,66
(10 5) + (10 9)
5 +1
- cea mai mare parte a autoturismelor se vnd la un pre n jur de 24.666,666 mii lei.
3) Din tabelul de corelaie se observ c frecvenele diferite de zero sunt grupate, rezult c ntre cele
dou variabile exist legtur, ce poate fi modelat cu ajutorul funciei de regresie.
a. Dac funcia de regresie este o drept
Y ( X ) = a + bx
1
b. Dac funcia de regresie este o hiperbol Y ( X ) = a + b
x
Mai reprezentativ este funcia care are coeficientul de regresie mai mare. Ca urmare trebuie calculat
acest coeficient pentru cele dou cazuri.
M ( XY ) M ( X ) M (Y )
a. RYX =
X Y
M (Y ) = 26,26
2,5 5 + 7,5 12 + 12,5 10 + 17,5 3
M (X ) =
= 9,33
30
1
2
2
2
2
Y2 = (14 26,26) 5 + (22 26,26) 10+ (30 26,26) 9 + (38 26,26) 6 = 62,86
30
1
2
2
2
2
X2 = (2,5 9,33) 5 + (7,5 9,33) 12+ (12,5 9,33) 10+ (17,5 9,33) 3 =19,1389
30
1
M ( XY ) =
[2,5 30 1 + 2,5 38 4 + ... + 17,5 14 3] = 216
30
216 9,33 26,26
RYX =
= 0,836
62,86 19,1389
1
M Y M M (Y )
X
X
=
1 Y
b. RYX '
1 1
M = (0,4 5 + 0,13312+ 0,0810+ 0,057 3) = 0,152
X 30
1 1
2
2
2
2
(0,4 0,152) 5 + (0,133,0152) 12+ (0,08 0,152) 10+ (0,057 0,152) 3 =
X 30
= 0,013
2 =
1 1
M Y = [0,4 301+ 0,4 38 4 +...+ 0,05714 3] = 4,632
X 30
4,632 0,152 26,26
RYX ' =
= 0,7218
0,013 62,86
RYX > RYX ' , rezult c dreapta de regresie este mai reprezentativ.
4) Y ( X ) = a + bX
2
aM ( X ) + bM ( X ) = M ( XY )
a = M (Y ) bM ( X )
M ( XY ) M ( X ) M (Y ) M ( XY ) M ( X ) M (Y )
b=
=
2
X2
M ( X 2 ) [M ( X )]
M (X 2) =
1
(2,52 5 + 7,52 12 + 12,52 10 + 17,5 2 3) = 106,25
30
b=
Y ( X ) = 40,40 1,516 X
Problema 3
Preul unui produs a fost observat n 30 puncte de vnzare la un moment t dat. Valorile nregistrate
sunt urmtoarele: 21; 24; 26; 30; 25,9; 26; 20; 24,2; 27; 29; 25,6; 26,3; 27; 22; 24,5; 28; 25; 27,5;
22,5; 24,7; 26,6; 23,2; 25,1; 27,5; 23; 24,8; 23,7; 25; 22,8; 23.
Se cere:
1. elaborarea distribuiei statistice a punctelor de vnzare n raport cu preul;
2. analiza reprezentativitii preului mediu;
3. reprezentarea grafic a structurii repartiiei;
4. avnd seria cronologic ce red variaia preului produsului studiat n 6 luni consecutive ca fiind
urmtoarea:
2
3
4
5
6
1
Y :
25 25,7 26 26,5 26,8 28
Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.
10
(X
V (X ) =
2
X
(X ) =
CV ( X ) =
2
X
'
i
Ni
i =1
N
= V (X )
X
100
X
X2 =
(21 25,2)2 2 + (23 25,2)2 7 + (25 25,2)2 10+ (27 25,2)2 8 + (29 25,2)2 3 = 4,63
30
- preul se abate n medie de la valoarea medie cu 2,15.
X = X2 = 4,63 = 2,15
CV ( X ) =
X
X
100 =
2,15
100 = 0,0853 100 = 8,53% < 30% media este reprezentativ.
25,2
Ni
100 frecvena relativ
N
2
100 = 0,0667 100 = 6,67%
30
7
=
100 = 0,2333 100 = 23,33%
30
10
=
100 = 0,3333 100 = 33,33%
30
8
=
100 = 0,2667 100 = 62,67%
30
8
=
100 = 0,1 100 = 10%
30
f1 =
f2
f3
f4
f5
i = f i 360 o
1 = 24,01o
2 = 83,99o
3 = 119,99o
4 = 96,01o
5 = 36 o
Titlu: Stuctura punctelor de vnzare n raport cu preul
10%
6,67%
23,33%
26,67%
1
2
3
4
5
33,33%
Legend:
1. 6,67% din punctele de vnzare au preuri cuprinse ntre 20 i 22;
2 . 23,33% din punctele de vnzare au preuri cuprinse n intervalul [22 - 24);
3 . 33,33% din punctele de vnzare au preuri cuprinse n intervalul [24 - 26);
4 . 26,67% din punctele de vnzare au preuri cuprinse n intervalul [26 - 28);
5 . 10% din punctele de vnzare au preuri cuprinse n intervalul [28 - 30);
2
3
4
5
6
1
4) Y :
25 25,7 26 26,5 26,8 28
Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.
1
1
+ 25,7 + 26 + 26,5 + 26,8 + 28
2
2 = 26,33
a) Y / luna =
5
- preul mediu lunar este de 26,33
25
b) R Y = I Y 1 = I Y 100% 100%
25,7 25+ 26 25,7 + 26,5 26 + 26,8 26,5 + 28 26,5
=
252 + 25,72 + 262 + 26,52 + 26,82
642,5 + 668,2 + 689+ 710,2 + 750,4
=
=
R Y = I Y 1 100 = 0,0231 100 = 2,31%
625+ 660,49 + 676+ 702,25+ 718,24
3460,3
=
=1,0231
3381,98
- preul a crescut n medie de la o lun la alta cu 2,31%.
IY =
Problema 4
TOTAL
0,25
0,5
1
1,5
TOTAL
5
5
10
30
5
35
5
15
5
25
10
20
30
5
40
30
25
100
Se cere:
1. cantitatea medie, median i modal de pine consumat zilnic de o gospodrie (calcul i
interpretare);
2. n ce proporie cantitatea de pine depinde de numrul de membrii;
3. analiza numeric i caracterizarea intensitii legturii ntre cele dou variabile.
1)
Y :
40 30 25
5
Y - Media
0,25 5 + 0,5 40 + 1 30 + 1,5 25 1,25 + 20 + 30 + 37,5 88,75
Y=
=
= 0,89[kg ]
=
100
100
100
- 0,89 este cantitatea medie de pine consumat zilnic de o gospodrie.
Me Mediana
- variabila discret N=100
N
= 50
2
Y N + Y N
Y50 + Y51 1 + 1
=
=1
2
2
2
- jumtate din gospodrii consum zilnic pine ntre 0,25 i 1 kg, iar cealalt jumtate ntre 1 i 1,5 kg
de pine pe zi.
Me =
2 +1
Mo Modala
- variabila discret NMo = max(N1, N2, N3, N4) NMo = 40 Mo = 0,5
- cele mai multe gospodrii consum zilnic n jur de 0,5 kg de pine.
2) Se calculeaz: rxy2 =
VTOT (Y ) =
V EXP
VTOT
(Y
VTOT =
Y N i.
i =1
N
J
(Y / x
VEXP =
N. j
j =1
VEXP(Y ) =
=
V EXP
[0;1]
VTOT
2
rXY = rXY
= 0,66 = 0,81 1 legtura intens ntre cele dou variabile.
Problema 5
Cunoscnd seriile cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu
studii medii (Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive,
respectiv:
mii persoane
Luna
X
Y
W
10
22,2
3
3,86
0,39
6
22,2
4
3,87
0,39
5
22,3
4
3,98
0,41
9
23,2
1
4,52
0,43
7
24,7
26,8
5
4,53
0,40
6
28,7
29,1
28,3
28,3
4,91
0,45
5
5,28
0,48
7
6,18
0,5
6,2
0,5
4,1
0,35
7
Se cere:
1. Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y, W;
2. Seria cronologic avnd la baz numrul total de omeri din judeul Cluj;
3. Numrul mediu lunar de omeri;
4. Indicele mediu i ritmul mediu al numrului total de omeri;
5. Diferena medie absolut a numrului total de omeri;
6. Primii 4 indici exprimnd variaia integral a numrului total de omeri, calculai cu baz fix;
7. Indicii factoriali de tip Paasche afereni fiecrui factor care influeneaz numrul total de omeri n
luna 4 fa de luna 1.
t = 1, 10
2.
Luna
z(t)
10
26,4
86
26,2
05
27,7
39
28,1
67
29,1
54
31,7
86
34,0
65
34,8
67
34,9
80
35,0
00
z (t ) z(t 1)
Iz =
i =1
10
[ z(t 1)]
=
2
i =1
z(10) z(1)
= 0,945
9
Numrul total de omeri a crescut n medie cu 0,954 mii persoane de la un an la altul.
5. z =
6. I 2z / 1 =
z(2) 26,505
=
= 1,007
z(1) 26,486
Numrul total de omeri din judeul Cluj a crescut de 1,007 ori n luna a doua fa de prima.
z(3) 26,739
=
= 1,0095
z(1) 26,486
z(4 ) 28,167
=
=
= 1,063
z(1) 26,486
z(5) 29,154
=
=
= 1,1
z(1) 26,486
I 3z / 1 =
I z4 / 1
I 5z / 1
I z4 // 1y (P ) =
Numrul total de omeri ar fi crescut de 1,023 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri cu studii medii.
I z4 // 1w (P ) =
Numrul total de omeri ar fi crescut de 1,0014 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri cu studii superioare.
Problema 6
Evoluia numrului de contracte de vnzare ncheiate de o societate n zilele lucrtoare ntr-o
anumit perioad a fost urmtoarea:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23
Se cere:
1. Tendina mrimii analizate (dac se constat prezena factorilor sezonieri desezonalizai serie).
2. Previziunea mrimii pe urmtoarele 5 zile.
Rezolvare:
1. Pentru a determina tendina, trebuie s reprezentm cronograma n vederea stabilirii prezenei
factorilor sezonieri:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23
30
24
25
21
20
22
20
21
21
23
23
22
19
15
25 24
22
24
23
10
5
0
1
9 10 11 12 13 14 15
Dup cum se observ din grafic, exist factori sezonieri, tendina fiind cresctoare. Deci, variaia
numrului de contracte este de forma:
y(t) = T(t) + S(t) + (t)
unde: T(t) tendina
S(t) componenta sezonier
(t) factori neeseniali
Ne organizm datele astfel:
Ziua
II
III
IV
20
21
23
21
22
24
22
24
25
21
23
24
19
22
23
Spt.
1
2
3
Y33' =
Ziua
II
III
IV
21,4
23,4
21,8
23,6
20,6
22,4
23,8
20,8
22,8
-
21
23,2
-
II
III
IV
0,98
0,98
0,98
1,01
1,02
1,015
1,07
1,07
1,05
1,063
1,01
1,01
1,01
0,90
0,95
0,925
Spt.
1
2
3
KV =
Yts
Yts'
K 2 I + K 3I
2
.
.
.
.
K 1V + K 2V
2
2
3
4
5
6
7
8
9
10
11
1
Y('t ) :
20,6 20,8 21 21,4 21,8 22,4 22,8 23,2 23,4 23,6 23,8
25
24
23
22,8
22
23,6 23,8
22,4
21
20
23,2
23,4
21,4
20,6
21,8
20,8
19
1
10
Din grafic se observ c tendina cea mai probabil este o dreapt. Deci:
T(t) = a + bt
2
M [ y (t ) t ] M [ y (t )] M (t )
2
2
aM (t ) + bM (t ) = M [ y (t ) t ]
b =
M (t 2 ) [M (t )]
1 + 2 + ... + 11
=6
11
1 2 + 2 2 + ...112
M (t 2 ) =
= 4,61
11
20,6 + 20,8 + ... + 23,8
M ( y(t )) =
= 22,25
11
1 20,6 + 2 20,8 + ... + 11 23,8
M ( y(t ) t ) =
= 137,07
11
137,07 22,25 6
b=
= 0,357
46,1 36
a = 22,25 0,357 6 = 20,108
M (t ) =
Problema 7
O agenie imobiliar dorete s dispun de o funcie cu ajutorul creia s poat evalua rapid valoarea
de pia a apartamentelor. Pentru aceasta, are la dispoziie o baz de date cuprinznd 30 de
apartamente observate n raport cu variabilele:
Y = preul de vnzare n mii euro
X 1 = suprafaa n metri ptrai
X 2 = numrul de camere
X 3 = finisaj*nr.camere. Se calculeaz prin nmulirea gradului de finisare (0 pentru nefinisat, 1
pentru semifinisat i 2 pentru finisat) cu numrul de camere.
Nr.crt.
X1
X2
X3
15,3
22
42,0
74
13,0
21
20,0
32
25,8
52
4
5
6
46,6
88
24,7
48
18,9
35
41,5
78
10
47,5
80
24,0
45
22,3
39
33,5
68
11
12
13
14
20,7
42
15
49,5
92
16
26,6
50
17
16,0
26
32,7
60
38,1
64
15,1
28
15,6
30
22
39,8
83
23
27,0
44
24
35,0
71
17,3
28
25,5
49
25,0
46
14,5
22
29
39,5
65
30
41,5
69
18
19
20
21
25
26
27
28
Se cere:
1) Studiai grafic existena i forma legturii dintre pre i fiecare din variabilele dependente.
2) Calculai parametrii funciei liniare multiple dintre pre i toate variabilele explicative.
3) Este reprezentativ aceast funcie ?
4) S se fac cteva simulri ale valorii de pia a apartamentelor pentru diferite valori ale
variabilelor explicative.
5) Comparai reprezentativitatea funciei obinute cu a funciilor de regresie simple.
Rezolvare
1) Graficul care ne poate indica existena sau forma legturii este diferit n funcie de natura variabilei
explicative: discret sau continu .
a) Legtura dintre pre i suprafa. Deoarece suprafaa este o variabil continu , putem construi norul
de puncte.
50
45
40
35
30
25
20
15
10
5
0
0
20
40
60
suprafata (mp)
80
100
50
45
40
35
30
25
20
15
10
5
0
0
2
numar camere
Dac forma legturii nu pare evident prin norul de puncte se poate utiliza i un grafic care folosete
mediile condiionate, din grupe.
Procednd analog i pentru variabila rmas, concluzionm c putem modela legturile dintre
pre i fiecare din variabile prin funcii liniare.
2) Funcia de regresie liniar multipl se scrie :
Y = a1 X 1 + a 2 X 2 + a 3 X 3 +
Prin aplicarea metodei celor mai mici patrate ajungem la ecuaia scris sub form implicit :
M 00 [Y M (Y )] + M 01 [X 1 M ( X 1 )] + M 02 [ X 2 M ( X 2 )] +
+ M 03 [X 3 M ( X 3 )] = 0
Scriem matricea de variaie i covariaie :
M ( 4)
m00
m01
m11
m02
m12
m22
m03
m13
m23
m33
m00 = Y2 = 121,55
m01 = M (YX 1 ) M (Y ) M ( X 1 ) = 227
m02 = M (YX 2 ) M (Y ) M ( X 2 ) = 11,196
m03 = M (YX 3 ) M (Y ) M ( X 3 ) = 16,229
m11 = X2 1 = 443
m12 = M ( X 1 X 2 ) M ( X 1 )M ( X 2 ) = 21,39
m13 = M ( X 1 X 3 ) M ( X 1 )M ( X 3 ) = 23,19
m22 = X2 2 = 1,143
m23 = M ( X 2 X 3 ) M ( X 2 ) M ( X 3 ) = 1,2767
m33 = X2 3 = 5,41
M (4)
=
1,143 1,2767
5,41
RY , X1X 2 X 3 = 1
det M ( 4)
131,75
= 1
= 0,997
m00 M 00
121,55 193,92
X2 = 3
X3 = 3