Documente Academic
Documente Profesional
Documente Cultură
Concepte de baz
Rezultate ateptate
Cunoaterea i stpnirea noiunilor statistice de baz, cunoaterea tehnicilor de culegere,
grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenierii
variaiei unei mrimi sau a structurii populaiei supuse studiului.
Sinteza
1. Concepte de baz
1.1. Populaia statistic
Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai
natur, care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i
populaiei privit ca un tot unitar. [Florea I.,1998]
O populaie este finit dac include un numr determinat de elemente, dar ea poate fi
considerat drept reprezentativ pentru o populaie teoretic infinit. Ca urmare apare
necesitatea de a delimita o populaie n: coninut, spaiu i timp. Se mai denumete i
populaia univers.
Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate,
zon etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea
consumatorilor unui produs, mulimea societilor productoare sau concurente ale unui
produs, mulimea societilor distribuitoare, angajaii unei societi, etc.
Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc.
Unitatea statistic constituie elementul component, al populaiei statistice, asupra
cruia se va efectua nemijlocit observarea.
Variabil calitativ este variabila ale crei stri se exprim prin cuvinte sau
coduri. Se mai numete variabil nominal (strile se exprim prin cuvinte) sau
variabil ordinal (strile se exprim prin coduri).
c) Dup modul de variaie variabila cantitativ poate fi:
Variabil discret este acea variabil care, n intervalul su de definiie
nregistreaz cel mult valori raionale, variaia are loc n salturi.
Variabil continu este acea variabil care poate lua orice valoare real din
intervalul su de variaie.
Exemple de variabile statistice relativ la populaia format din mulimea
consumatorilor unui produs:
- vrsta: variabil atributiv, cantitativ, continu
X = { x1 = [15-20) [20-30) ... }
- frecvena de cumprare: variabil atributiv calitativ
Y = { y1 - foarte rar; y2 rar, ... }
- numr de sortimente cumprate relativ la produsul analizat: variabil atributiv,
cantitativ, discret:
Z = { z1 = 1; z2 = 2, ... }
- localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ
S = { s1 cartierul M sau s2 strada P1, ... }
- data ultimei cumprri a produsului analizat: variabil de timp, cantitativ
T = { t1 = 27.01.2002; t2 = 24.02.2002, ... }
Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi
finite sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei,
numit lege de probabilitate.
Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret
sau continu.
n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic
constituie o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare
sunt probabile i n strns legtur cu un anumit experiment. Strile unei variabile statistice
nu sunt probabile, ele cuantific o trstur proprie fiecrei uniti din populaie.
1.3. Observarea statistic
Observarea statistic const n identificarea unitilor populaiei i nregistrarea
strilor variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate
prin observare se numesc statistici.
Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou
feluri: total i parial.
Observarea total este acel tip de observare statistic n care are loc nregistrarea
tuturor unitilor care fac parte din populaie statistic supus studiului. Recensmntul
populaiei Romniei este un exemplu de observare total.
Observarea parial presupune observarea i nregistrarea unui anumit numr de
uniti din populaie, alese dup criterii bine definite.
n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie
statistice exhaustive rezultate prin observarea populaiei univers , fie statisticile rezultate din
observarea parial a unui eantion A, n ambele cazuri scopul final fiind acelai,
respectiv obinerea de informaii la nivelul populaiei univers A.
populaiei
Xi
x2
N2
... xi
... N i
... x R
... N R
(1.1)
Clasa (grupa) de uniti n raport cu o variabil reunete acele uniti din cadrul
populaiei care nregistreaz aceeai stare a variabilei sau strile variabilei aparinnd unui
anumit interval de variaie .
Ca urmare, n raport cu o variabil statistic populaia poate fi structurat ntr-un
anumit numr de clase.
X : 1
(1.2.)
f1 f 2 ... f i ... f R
-
X:
(1.3)
N(x1 ) N(x 2 ) ... N(x i ) ... N(x R )
unde: N(xi) reprezint numrul de uniti din populaia studiat pentru care variabila
nregistreaz valori ce nu depesc valoarea xi.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative
cumulate, respectiv:
x1
x2
...
xi
...
xR
X :
(1.4)
FN ( x1 ) FN ( x 2 ) ... FN ( xi ) ... FN ( x R )
unde: FN(xi) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat
valori ce nu depesc valoarea xi.
FN(xi) = f1 + f2 + ... + fi
N ( xi )
FN ( x i )
(.100)
i 1, R
Sau
N
Seria statistic de repartiie bidimensional este o construcie ce red distribuia unei
populaii n raport cu dou variabile.
Astfel, fie populaia statistic A studiat n raport cu variabilele X i Y, rezultatele
observrii se pot grupa ntr-un tabel de forma urmtoare:
X
x1
x2
...
xj
...
xJ
Total
y1
y2
.
.
yi
.
.
yI
N11
N21
-
N12
N22
-
...
...
-
N1j
N2j
-
...
...
-
N1J
N2J
-
N1.
N2.
-
Ni1
-
Ni2
-
...
-
Nij
-
...
-
NiJ
-
Ni.
-
NI1
NI2
...
NIj
...
NIJ
NI.
Total
N.1
N.2
...
N.j
...
N.J
unde:
(1.5)
- Nij - reprezint numrul de uniti pentru care, variabila X nregistreaz starea xj i variabila
Y nregistreaz starea yi ;
- Ni. - numrul de uniti pentru care Y = yi, indiferent de nivelul nregistrat de variabila X;
- N.j - numrul de uniti pentru care X = xj, indiferent de nivelul nregistrat de variabila Y;
- N - numrul total de uniti analizate.
Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare:
x1
X :
N .1
x2
...
xj
...
N .2
...
N. j
...
xJ
N . J
y
Y : 1
N 1.
y2
N 2.
...
...
yi
N i.
...
...
yI
N I .
y2
...
N2j
yi
... N ij
yI
... N Ij
...
j 1, J
x2
N i .2
...
xj
... N ij
xJ
... N iJ
...
i 1, I
N ij
N
f i.
N i.
N
f. j
N. j
N
i 1, I
j 1, J
Seriile cronologice
Seria cronologic reflect evoluia n timp a unei mrimi.
Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s
se refere la un interval de timp.
Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd
stocuri [Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci,
instituii, fonduri fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii
de activitate, unitile de cazare turistic etc. ntr-o astfel de serie nsumarea mrimii analizate
nu are sens din punct de vedere al coninutului, aceasta fiind permis din considerente de
calcul, ajustri etc.
Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd
fluxuri. De exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau
produse, venituri, cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel
de serie are sens nsumarea mrimii analizate.
Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a
nivelului unei mrimi Y,
0
Y :
y0
1
y1
2
y2
...
...
t
yt
...
...
T
yT
(1.6)
Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i
diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai
sus se pot calcula cu baz fix (t / t0) (baza de comparaie rmne aceeai) sau cu baz n lan
(t / t-1) (baza de comparaie se schimb, fiind considerat cea precedent nivelului comparat).
Fie seriile cronologice formate cu:
- diferene absolute cu baz fix:
0
t y/ t0 :
0
1/ 0
y
2/0
y
...
... Ty/ 0
...
...
t/0
y
(1.7)
t y/ 0 y (t ) y (0)
1
1y/ 0
2
2y/ 1
...
...
t
t / t 1
y
...
...
T
T / T 1
y
(1.8)
t y/ t 1 y (t ) y (t 1)
ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii
de legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd
diferenele absolute cu baza n lan se obin diferenele absolute cu baza fix.
t y/ 0 1y/ 0 2y/ 1 3y/ 2 ... t y/ t 1
1/ 0
y
2/0
y
...
t
t/0
... I y
... T
... I Ty / 0
(1.9)
y (t )
( x100)
y (0)
...
...
T
I
T / T 1
y
(1.10)
y (t )
( x100)
y (t 1)
y (1) y (2)
y (t )
y (t )
.
. ... .
I yt / 0
y (0) y (1)
y (t 1)
y (0)
mprind doi indici succesivi cu baz fix se obine un indice cu baz n lan:
I yt / 0 : I yt 1 / 0
y (t ) y (t 1)
y (t )
:
I yt / t 1
y ( 0)
y ( 0)
y (t 1)
Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este mrimea cel
mai des folosit n caracterizarea evoluiei fenomenelor din economie.
Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii
formate cu:
- diferene relative cu baz fix
0
R yt / t0 :
0
1
R 1y / 0
t y/ 0
R yt / 0
y (0)
2
R
2/0
y
...
T
... R Ty / 0
...
t
... R yt / 0
(1.11)
y (t ) y (0)
y (t )
1 I yt / 0 1
y (0)
y (0)
1
R 1y / 0
R yt / t 1 :
t y/ t 1
R yt / t 1
y (t 1)
2
R y2 / 1
...
...
t
R
I yt / t 1 1
t / t 1
y
sau
...
...
T
R
T / T 1
y
(1.12)
I yt / t 1 .100 100
g (t )
...
...
g1
g2
...
gt
...
g T
(1.13)
y (t )
T
y (t )
t 1
s0
Z (1)
Z :
s1
Z ( 2)
s2
...
Z (3) ...
si
...
Z (i ) ...
sR
(1.14)
Z ( R )
unde:
i 1, R ;
si este o stare a variabilei ce exprim spaiul,
Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate).
Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu:
- diferene absolute cu baz fix:
s1
s2
... si
... s R
s
(1.15)
sZ/ s0 : 0
s1 / s0
s2 / s0
si / s0
s R / s0
0
...
...
Z
Z
Z
Z
si
sR
...
... I Zsi / s0
(1.16)
... I ZsR / s0
Z (i )
.(100)
Z ( 0)
...
...
si
... RZsi / s0
...
sR
... RZsR / s0
(1.17)
sZi / s0
I Zsi / s0 100
Z (0)
n raport cu care este studiat populaia. Variabilele statistice ce urmeaz s fie urmrite i
nregistrate la nivelul fiecrei uniti din populaie, trebuie s fie eseniale i s prezinte
interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii
exacte pentru delimitarea corect a unitilor statistice care alctuiesc populaia. i nu n
ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai multe persoane este
necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea
necesar datelor rezultate.
Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune:
specificarea unitilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor
statistice care caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit,
nregistrarea strilor variabilelor statistice considerate.
Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme
care s asigure o pregtire tiinific a observrii statistice:
- delimitarea populaiei supuse observrii;
- definirea unitilor statistice de observat;
- timpul i locul unde va avea loc observarea;
- programul observrii;
- alegerea purttorilor de informaie;
- pregtirea persoanelor ce urmeaz s fac observarea.
Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc
fiecare dintre ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia
depinde corectitudinea celorlalte etape a cercetrii statistice.
Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta
se afl n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce
caracterizeaz populaia supus studiului.
Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da
loc confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce
trebuie nregistrate n raport cu variabilele de studiat.
Stabilirea timpului i a locului unde va avea loc observarea are importan din punct
de vedere a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are
n statistic dou accepiuni:
- momentul sau perioada la care se refer datele nregistrate (timpul de referin);
- durata observrii.
Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus
cercetrii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o
reprezint familiile etc.).
n cadrul programului observrii statistice trebuie stabilite variabilele statistice care
urmeaz s fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice
trebuie s fie n consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse.
Variabilele statistice care fac parte din programul cercetrii trebuie s surprind aspectele
eseniale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i
generalizarea acestora la nivelul ntregii populaii.
Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a
fi nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz
datele din observarea unitilor statistice.
Observarea statistic se poate desfura n diverse forme n raport cu: natura
proceselor social-economice de studiat, obiectivul cercetrii, formele de organizare ct i
posibilitile practice de urmrire i nregistrare a unitilor statistice din populaie.
Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem:
observarea total i observarea parial. Observarea total permite nregistrarea, n raport cu
11
variabilele statistice a tuturor unitilor statistice din populaie, implicnd un volum mare de
munc, antreneaz, de obicei, un numr de persoane i dureaz mult timp. Ca urmare se
creaz condiii pentru apariia de erori de observare, ceea ce va conduce la micorarea
eficienei observrii. Forma cea mai frecvent de observare total o constituie recensmntul
populaieiObservarea total se practic i n domeniul controlului tehnice de calitate, n cazul
produselor de nalt tehnicitate , aa cum ar fi: televizoare, maini de splat, frigidere,
automobile etc. Este necesar o observare total n acest caz, deoarece constatarea
defeciunilor de ctre cumprtori ar implica cheltuieli mult mai mari cu remedierea acestora
n comparaie cu organizarea unei observri totale a loturilor de produse ce urmeaz a fi
scoase pe pia.
n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt
nesemnificative, este suficient realizarea unor observri pariale prin care s se asigure c
rebuturile nu depesc un anumit procent admis. O astfel de observare, care include doar o
parte din unitile populaiei supuse studiului corespunde observrii pariale. Observarea
parial constituie o alternativ la observarea total n cazul populaiilor infinite sau chiar dac
sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observrii
pariale se pot evalua rezervele de iei, crbune sau alte minerale, se poate evalua masa de
material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea
parial se recomand n toate cazurile n care se consider mai avantajoas dect observarea
total.
Eantionul, ca rezultat al observrii pariale, presupune respectarea cu strictee a
principiului reprezentativitii, n conformitate cu care fiecare unitate statistic din populaie
general s aib aceeai ans de a face parte din eantion. Asigurarea respectrii principiului
reprezentativitii n formarea eantionului de observat permite acestora o structur foarte
apropiat cu cea a populaiilor din care sunt formate. Aceasta ne asigur, cu o anumit
probabilitate dinainte fixat, c rezultatele obinute la nivelul eantionului pot fi extinse la
nivelul ntregii populaii. n raport cu legea de probabilitate urmat de variabilele urmrite n
populaia general sunt dou tipuri de eantioane: eantioane de volum mare i eantioane de
volum redus.
Observarea statistic n raport cu procedeul folosit este de dou feluri:
- observarea direct;
- observarea indirect.
Observarea direct presupune o observare nemijlocit a unitilor din populaie, care
sunt prevzute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct
cu unitile statistice, fie prin msurare, fie prin interogare, dac unitile sunt persoane. Acest
procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n
vederea msurrii nivelelor nregistrate de variabilele considerate.
Observarea indirect presupune un intermediar ntre unitile care urmeaz s fie
supuse observrii i observator. Intermediarul poate fi un document special conceput n
vederea observrii i atunci observarea este pe baz de document sau intermediarul poate fi o
alt persoan dect observatorul, caz n care avem observare prin interogare.
Suportul pentru culegerea datelor l reprezint chestionarul.
2.2. Sistematizarea i prezentarea datelor statistice
Sistematizarea constituie o etap n cadrul prelucrrii datelor statistice n vederea
prezentrii acestora sub form de serie statistic (tabele statistice).
Datele obinute ca urmare a procesului de observare statistic, n forma lor brut,
permit o caracterizare amnunit a fiecrei uniti din populaia considerat. Deoarece, datele
12
X :
N 1 N 2 ... N R
n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la
baz o variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia
considerat nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul
strilor variabilei. Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu
ajutorul intervalelor de grupare (variaie), fiecare interval cuprinznd un numr oarecare de
valori ale variabilei. Ca urmare, pentru o serie continu, clasele se definesc cu ajutorul
intervalelor de grupare.
Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil
cantitativ continu:
determinarea lungimii intervalelor de variaie;
stabilirea formei de scriere a intervalelor de variaie.
Determinarea lungimii intervalelor de variaie conduce la dou situaii:
serii construire cu intervale de lungime egal;
serii construite cu intervale de lungime diferite.
Stabilirea numrului de intervale de variaie trebuie s asigure satisfacerea
urmtoarelor condiii:
13
informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar
populaia s nu fie prea frmiat n raport cu variabilele de grupare;
- media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai
aproape de centrul intervalului de variaie respectiv;
- s nu existe grupe vide;
- reprezentarea grafic a seriei rezultate s permit conturarea unei regulariti a
fenomenului de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu
este posibil nici n cazul unui numr mic de intervale deoarece se pierd prea multe
date, nici n cazul unui numr prea mare de intervale, populaia frmindu-se
prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport
cu variabila X este normal, urmtoarea expresie:
lx
xmax xmin
1 3,322 lg N
(2.1)
(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul
fiind orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n
cazul n care acestea vor fi de lungime egal. n expresia de calcul a lungimii intervalelor
intervine valoarea maxim i cea minim a variabilei, ct i volumul populaiei. n urma
stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum
urmeaz:
x min ; ( x min l x ) ...
N1
X :
...
14
Histograma
Graficul specific seriilor care au la baz o variabil continu (de intervale) este
histograma. Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe
abscis se trec intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara
frecvenelor se construiete n conformitate cu respectarea principiului proporionalitii ntre
frecvene i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de variaie a
seriei (xi-1 xi) se construiete un dreptunghi a crui baz este chiar lungimea intervalului, iar
cealalt latur se determin din condiia proporionalitii ariei dreptunghiului cu mrimea
indicatorului n clasa respectiv.
Latura necunoscut a dreptunghiului, notat cu Li se determin din urmtoarea relaie:
Li . li = k . Ni
(2.2)
unde:
li = latura cunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
Li = latura necunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
15
Populaia
1147065
1330733
1737153
1701881
1978835
1792822
1698268
1335039
16
populatia
04
59
10 14
15 19
20 24
25 29
30 34
35 39
360o
100
(2.3)
Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd
distribuia voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie
1996:
Formaiunea
Politic
Voturi
Obinute (%)
CDR
PDSR
USD
UDMR
PRM
PUNR
37,0
28,7
16,1
7,7
5,6
4,9
17
5,60%
4,90%
7,70%
37%
CDR
PDSR
USD
UDMR
PRM
PUNR
16,10%
28,70%
Bulgaria
4683
Cehia
12197
Polonia
7543
18
Romnia
6153
Slovacia
9624
Ungaria
9832
9624
9832
Slovacia
Ungaria
7543
8000
6153
6000
4683
4000
2000
0
Bulgaria
Cehia
Polonia
Romnia
1
y1
2
y2
...
...
t
yt
yT
...
...
1994
2020017
1995
2197477
1996
2391869
19
1997
2605465
1998
2822254
1999
2980014
1994
1995
1996
1997
1998
1999
2000
anul
Cerere
(C)
15,4
3,2
4,9
10,5
8,0
5,1
8
7,6
20
11,3
10
14,0
6,4
11
13,2
12
8,8
13
12,1
Pre
(P)
1,4
5,1
2,5
1,7
1,8
3,4
2,1
1,6
3,6
3,5
1,9
1,8
1,9
18
16
14
cerere
12
10
8
6
4
2
0
0
pret
Probleme propuse
P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare
populaie selectat precizai:
- denumirea populaiei, a unitii statistice i volumul acesteia;
- scopul cercetrii statistice;
- variabilele statistice n raport cu care s-ar face observarea statistic a populaiei.
P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic
bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive,
relativ la care se cere:
1. denumirea populaiei ce a fost supus observrii i volumul acesteia;
2. unitatea statistic;
3. caracterizarea variabilelor statistice n raport cu care a fost studiat populaia;
4. caracterizarea seriei statistice n raport cu toate criteriile cunoscute;
21
Bibliografie:
1. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2001;
2. Buiga, A., Drago C., Lazr D., Parpucea I., Todea A., Statistic I, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2003;
3. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental,
Cluj-Napoca, 1998.
MODULUL 2
PARAMETRII REPARTIIILOR EMPIRICE UNIDIMENSIONALE
Obiective
22
Concepte de baz
Rezultate ateptate
Cunoaterea modului de calcul i a semnificaiei parametrilor tendinei centrale, a gradului
de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaii i
formularea unei concluzii privind forma distribuiei unei populaii.
Sinteza
2.1. Parametrii tendinei centrale
Parametrii din aceast grup au menirea de a evidenia poziia n jurul creia se
grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat
printr-un numr se numete poziie central. Ea poate fi evideniat prin:
- valoarea medie X ;
- valoarea median M e X ;
- valoarea modal M o X .
A. Valoarea medie
Valoarea medie reprezint principalul parametru care caracterizeaz tendina central a
unei repartiii statistice.
n vederea definirii parametrului valoarea medie se consider o populaie statistic
studiat n raport cu variabila cantitativ X i o funcie G(x1,x2,,xR) unde xi, i 1, R , reprezint
strile variabilei X. Funcia G exprim o anumit nsuire esenial, un atribut al populaiei n
raport cu variabila X. Aceast funcie se numete funcie determinant.
Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant
funcia determinant, adic:
G x1 , x 2 ,..., x R G X , X ,..., X
(2.0)
23
(indicatorul)
de
calcul
Determinarea,
pe
valorii
medii
valorii
medii
, este destul de anevoioas.
X
Utilizarea acesteia presupune stabilirea coninutului (semnificaiei) i a formei analitice a
funciei determinante G, pentru fiecare caz n parte. Dar, valoarea medie
aceast
cale,
xi
X :
Ni
i .1, R
G x1, x2 ,. ., xR xi Ni
i1
semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de
copii pe familie se particularizeaz relaia (2.0) dup cum urmeaz
R
x N X N
i 1
i 1
de unde rezult:
R
x
i 1
Ni
i 1
(2.1)
24
n categoria factorilor eseniali intr acei factori care acioneaz asupra tuturor
unitilor populaiei n mod continuu i n acelai sens, determinnd, n principal, nivelul de
dezvoltare a variabilei pentru fiecare unitate component din populaie.
Factorii eseniali se conjug n aciunea lor cu factorii neeseniali, care, n general, au
un caracter aleator, sunt numeroi i neuniform rspndii printre unitile populaiei.
Fiecare din factorii considerai neeseniali acioneaz numai asupra unui anumit numr
de uniti din populaie. Ca urmare, acetia pot contribiu fie la creterea nivelului variabilei
(pentru unele uniti din populaie), fie la scderea nivelului variabilei (pentru alte uniti din
populaie).
La rndul lor factorii eseniali nu acioneaz cu aceeai intensitate asupra tuturor
unitilor din cadrul populaie considerate, determinnd, n acest fel, variaia neuniform a
variabilei respective n cadrul populaiei.
n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a
unei serii statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea
nregistra variabila n cadrul populaiei cercetate n condiiile n care factorii neeseniali nu sar fi manifestat, iar factorii eseniali ar fi acionat asupra unitilor din populaie cu aceeai
intensitate.
Parametrul valoarea medie, calculat pentru o serie statistic, pune n eviden ceea ce
este comun, general i esenial sub aspectul nivelului de dezvoltare al variabilei, n raport cu
care este studiat o populaie.
n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a
indicatorilor cu care aceasta este construit, exist mai multe posibiliti de calcul a valorii
medii.
Funcia determinat G, sub forma sa cea mai general, are urmtoarea expresie
analitic:
x
(2.2)
G x1 , x2 ,. ., x R
i 1
1
K K
i i
Ni
X :
(2.3)
i .1, R
25
xi
fi
X :
(2.4)
i .1, R
xi N i
;
N j
X xi f i
xi1 xi
X :
fi i.1,R
xi xi 1
xi'
2
'
x
unde i reprezint mijlocul intervalului i, obinem relaia:
Folosind notaiile:
X xi' fi
i 1
2. Media armonic
Se consider o serie de forma:
x
X : i
Ni
(2.5)
i 1, R
n cazul unei serii discrete de forma (2.5), media armonic notat cu X 1 se definete prin:
26
N
i 1
X 1
(2.6)
1
Ni
i 1 x i
X 1
i 1
1
N*
x
i 1 i
(2.7)
i 1 x i
N i
X :
i 1, R
X 1
N
i 1
(2.8)
1
Ni
'
i 1 x i
i 1, R .
i n acest caz, dac ponderile sunt egale, se obine relaia de calcul a mediei armonice simple,
de forma:
X 1
R
R
x
i 1
'
i
3. Media geometric
Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media
geometric notat cu X g (sau X o ) este definit prin expresia:
X g N x1N1 x2N 2 ...xRN R
(2.9)
Din (2.9), pentru media geometric ponderat exprimat cu frecvene relative se deduce:
Xg
N1
N2
NR
x 2 ... x R
x
i 1
1/ N
Ni
i
xi
i 1
Ni / N
xi i
f
(2.10)
i 1
Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru
diversele variante de medie geometric, rmn variabile cu singura modificare c valorile xi,
i 1, R , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei:
27
xi'
xi 1 xi
,
2
i 1, R
(2.11)
B. Valoarea median
Valoarea median, notat cu M e este acea valoare a variabilei cantitative X care mparte
repartiia n dou pri egale, respectiv:
FN (M e ) 1 / 2 sau N ( M e )
N
2
(2.12)
Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau
continu.
Pentru o repartiie discret, calculul medianei nu implic probleme deosebite i nici un volum
mare de calcule.
Se consider o repartiie cu frecvene absolute:
x1 x2 . xi . xR
.
X :
N 1 N2 . Ni . NR
(2.13)
n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:
a) volumul N al populaiei este un numr impar;
b) volumul N al populaiei este un numr par.
n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului
medianei, notat cu rM e , conform urmtoarei relaii:
rM e
1 R
N i N (M e )
2 i 1
(2.14)
a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a
N
crui parte ntreag indic numrul de uniti din populaie pentru care variabila X a
2
nregistrat valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat
N
28
M e x
N
1
2
(2.15)
b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca
urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci
se gsesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora.
Relaia de calcul a medianei, n acest caz, este:
x
Me
N
2
2 1
(2.16)
Pentru o repartiie continu, calculul valorii mediane presupune verificarea egalitii (2.12) i
ca urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic
un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat.
Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit
un volum redus de calcule.
Pentru acesta se consider o repartiie continu n raport cu variabila X, i anume:
x0 x1 x1 x2 . xi1 xi . xR1 xR
.
X :
N1 N 2 . N i . N R
(2.17)
unde intervalele xi-1-xi, i 1, R pot fi de lungime egal sau neegal. Calcularea rangului
medianei va permite stabilirea intervalului n care se afl valoarea median, interval numit i
interval median. Se cumuleaz frecvenele absolute din aproape n aproape pn ce este
ndeplinit inegalitatea:
N 1 N 2 ... N i
1
N
2
M e xi 1
N ( M e ) N ( xi 1 )
xi xi 1
Ni
xi 1 xM e
Ni N M e
29
(2.18)
C. Valoare modal
Valoarea modal Mo(X) a unei repartiii reprezint aceea valoare a variabilei X creia i
corespunde frecvena cea mai mare.
Acest parametru se mai numete modul, valoare dominant, sau mod se noteaz cu Mo.
Mod de calcul:
a)
x1 x2 . xi . xR
.
X :
f 1 f2 . fi . fR
(2.19)
valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de
calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru
care frecvena este cea mai mare.
b) Pentru serii de repartiie continue, respectiv:
X :
f 1 f2 . fi1 fi fi1 . fR
Modala nu poate fi determinat direct.
30
(2.20)
Intervalul cruia i corespunde frecvena cea mai mare, se numete intervalul modal i va
conine modala. S presupunem c intervalul modal este xi-1-xi.
Formula de calcul a modalei:
M o x x M o
1
lMo
1 1
(2.21)
unde:
Mo
xMo
intervalului
O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o
serie are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal
evideniaz faptul c populaia n cauz este neomogen. Calculul valorii modale, n
asemenea cazuri, presupune o delimitare mai riguroas a obiectului observrii ct i a
populaiei care urmeaz s fie studiat. O alt cale, care poate duce la eliminarea unui
asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc.,
pn se ajunge la o serie unimodal.
n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana.
Pentru serii uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri:
Mo X 3 X Me
Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o
variabil sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea
structurii unei populaii poart denumirea de valori quantile.
Valorile quantile ale unei serii de repartiie unidimensionale sunt acele mrimi nregistrate de
variabila X, care mpart seria n n pri egale (mai precis mparte populaia n n pri egale). n
acest caz se vor calcula p quantile (p = n-1).
Pentru o serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea
egalitate este satisfcut de cele p quantile:
q1
q2
xR
x1
q1
q n 1
f ( x)dx
1
n
(2.22)
q2
f f
i
x1
q1
xR
... f i
q n 1
1
n
(2.23)
1
N
sau N (q p ) p , p 1, n - 1
n
n
x1 x2 . xi . xR
.
X :
N1 N 2 . N i . N R
Pentru calculul valorii quantile de ordinul
rangul acesteia:
rq p N (q p ) p
p ( p 1, n 1) ,
N
n
(2.24)
qp
x rq x ( rq
p
1)
(2.26)
b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei
X corespunztoare pari ntregi a rangului majorat cu 1:
q p x[ rq
(2.27)
1]
n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1
quantile trebuie s satisfac relaia (2.22). Determinarea quantilelor din asemenea egaliti ar
presupune cunoaterea densitii de probabilitate f(x). Ori n activitatea practic f(x) se
aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule.
n vederea gsirii unor formule aproximative de calcul a quantilei de ordin
se consider o serie de variaie continu, ale crei intervale de variaie nu
trebuie s fie neaprat egale ca lungime:
p ( p 1, n 1)
x0 x1 x1 x2 . xi1 xi . xR1 xR
.
X :
N 1 N2 . Ni . NR
(2.28)
p ( p 1, n 1)
conform
(2.29)
Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i
intervalul quantilei de ordinul p( p 1, n 1) . Cumulnd frecvenele pe clase pn la
egalarea s-au depirea rangului, conform inegalitii:
1 R
N 1 N 2 ... N i p N i
n i 1
(2.29)
N (q p ) N ( x i 1 )
Ni
( x i x i 1 )
33
p ( p 1, n 1) .
(2.30)
Prin
p 1, n 1
Caracterizarea structurii unei serii se poate face utiliznd diverse cazuri particulare de
valori quantile.
Valoarea median (Me) este i un parametru de structur obinndu-se ca un caz
particular de quantil, cnd n=2. Dac pentru o serie se cunoate M e (quantila de ordinul 2),
atunci structura populaiei poate fi redat astfel:
X min M e
50%
X :
M e xmax
50%
(2.31)
semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X
valori cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a
nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X.
Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4.
Cele trei quartile, care se obin, notate: Q1, Q2 i Q3 sunt acei parametri de structur care
mpart populaia n patru pri egale.
n raport cu mediana, quartila nti Q 1, se numete quartila mic (inferioar), quartila
a doua Q2 coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q3 se
numete quartila mare (superioar).
Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n raport cu
variabila X:
xmin Q1
25%
X :
Q1 Q2
Q2 Q3
Q3 X max
25%
25%
25%
(2.32)
34
dx M X X
dx
x
i 1
X Ni
(2.34)
N
i 1
Dac seria are la baz o variabil continu i se cunoate f(x), atunci abaterea medie liniar se
calculeaz astfel:
35
dx
xR
x X f ( x)dx
(2.35)
x1
dx
x
i 1
'
i
X Ni
R
N
i 1
sau d x x 'i X f i
(2.36)
i 1
dup cum seria n cauz este format cu frecvene absolute sau relative, unde:
x i'
x i 1 x i
, i 1, R
2
dx
X
100
(2.37)
Coeficientul simplu de variaie (Vx) arat cu ct se abate n medie orice valoare a variabilei X
de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate
aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea
valoare medie pentru care coeficientul simplu de variaie este mai mic.
Parametrul abaterea medie liniar, n forma absolut sau relativ, prezint unele deficiene
deoarece nu este suficient de sensibil la abaterile mici, adugndu-se i unele inconveniente
de natur teoretic, generate de exprimarea abaterilor n valoarea absolut.
nlturarea acestor deficiene se poate realiza apelnd la un nou parametru privind msurarea
variaiei, numit abatarea medie ptratic.
36
(2.38)
M (X X )2
(2.39)
x2
(x
i 1
X )2 Ni
(2.40)
N
i 1
n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform
urmtoarei relaii:
2
x
x X
xR
f ( x) dx
(2.41)
x1
x
X
100
(2.42)
37
2
2
(2.43)
i arat cu ct se abat n medie, n plus sau n minus, de la median, cele 50% din valorile
variabilei cuprinse ntre Q1 i Q3.
Forma relativ a acestui indicator notat cu Qr:
Qr
Q
Q Q1
100 3
100
Me
2 Me
(2.44)
qn 1 M e M e q1 qn 1 q1
2
2
(2.45)
q
q q
100 n 1 1 100
Me
2 Me
(2.46)
Cu ct abaterea interquantilic (relativ sau absolut) este mai mic, cu att valoarea median
este mai reprezentativ.
2.4. Parametrii concentrrii
Energia informaional
Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiie:
R
E fi 2
i 1
38
unde s-a notat cu E energia informaional. Este un parametru utilizat n cazul n care seria are
la baz o variant nenumeric.
n cazul unei populaii caracterizat de un grad de concentrare maxim, va exista o
clas care va avea frecvena relativ egal cu 1, iar celelalte vor avea frecvenele relative 0 i
ca urmare: Emax = 1.
Dac populaia este caracterizat de o concentrare minim, atunci:
x2 ... xR
x
X : 1
1 / R 1 / R ... 1 / R
iar
Emin R
1
1
2
R
R
Se observ c:
1
E 1
R
1
E
R
Er
1
1
R
1
R
i 1
1
R
de unde:
0 Er 1
Referitor la populaia dat, studiat n raport cu o variabil X, se calculeaz Er, iar dac:
- Er se apropie de 1, atunci populaia respectiv este caracterizat de un grad nalt de
concentrare;
- Er se apropie de 0, populaia n cauz se caracterizeaz printr-o concentrare minim.
2.5. Parametrii formei
Din aplicaiile practice, precum i din alte surse, s-au constatat c graficele pot avea diverse
forme, dintre care: form de coplot, form de U, J, L sau alte forme. Ceea ce prezint
importan, nefiind surprins de nici un parametru prezentat, l constituie modul de repartizare
a valorilor variabilei de o parte i de alta a valorii medii, considerat i centrul de greutate a
seriei. Acest lucru nu nseamn altceva dect evidenierea acelei curbe care aproximeaz cel
mai bine conturul poligonal al seriei respective i n acelai timp o imagine mai clar asupra
gradului de reprezentativitate a valorii medii.
n marea majoritate a cazurilor, distribuia unitilor unei populaii se face dup un clopot
(dup legea normal a lui Gauss). Dar unittile nu se distribuie uniform n jurul valorii medii,
ceea ce poate conduce la nclinaii ntr-o direcie sau alta a valorii medii. Aceast distribuire
neuniform poate conduce la cazul cnd diferite serii (diferit distribuite n jurul valorii medii)
s aib aceeai medie, acelai i totui o curb s fie mai aplatizat dect cealalt, simetric
sau mai puin simetric. Evidenierea acestor diferene poate fi realizat cu ajutorul
parametrilor formei.
39
Parametrii formei unei serii de repartiie, dup coninut, se clasific n dou grupe:
-
parametrii asimetriei;
parametrii boltirii.
f X f X
M XX
3
X3
(2.47)
M X X
M X X
3
3
Calculnd valoarea acestui parametru, n funcie de semnul ei, avem urmtoarele cazuri:
1. 3 = 0, ceea ce nseamn c M X X = 0, adic suma tuturor abaterilor cu semnul
minus este egal cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca
urmare n acest caz se poate spune c seria este simetric.
3
40
Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a valorii
medii ct i pentru compararea reprezentativitii a dou sau mai multe valori medii ce
reprezint serii diferite.
Parametrul M X X d o caracterizare numeric sub form absolut a gradului de boltire a
unei serii. Sub form relativ, gradul de boltire se msoar cu parametrul:
4
M X X
B4
X4
(2.48)
Pentru a nelege semnificaia boltirii unei serii, se consider dou serii statistice care au la
baz variabilele X i Y, iar
X Y; X Y
Mai presupunem, n plus, c cele dou distribuii au form de clopot pentru care 3X = 3Y ,
adic ambele sunt simetrice. Dei s-ar prea c cele dou serii nu au nimic care s le
deosebeasc, totui reprezentndu-le grafic rezult dou curbe de forma:
X Y
X Y
unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou
serii nu sunt caracterizate de aceeai boltire.
Boltirea unei serii este util pentru a da o caracetrizare mai exact reprezentativitii valorii
medii.
n cazul exemplului prezentat mai sus, att mediile ct i abaterile medii ptratice sunt egale i
ca urmare, coeficientul de variaie al lui Pearson este acelai pentru cele dou serii. Deci
rezult c ambele valori medii prezint acelai grad de reprezentativitate. Cu toate acestea,
graficele celor dou serii contrazic concluzia dedus n urma comparrii celor doi coeficieni
de variaie.
Valoarea medie cea mai reprezentativ n seria n care cele mai multe uniti ale populaiei
cercetate au nregistrat valori, mai apropiate de valoarea medie. Pentru o astfel de serie,
mprtierea fa de valoarea medie fiind mic, graficul are o form mai ascuit n cazul
seriei X i mai plat n cazul seriei Y.
Nivelul boltirii pentru o serie oarecare dat se msoar cu ajutorul parametrului B4, a crui
expresie de calcul este dat de relaia (2.48). Valoarea lui B4 pentru o distribuie normal este
egal cu 3. Pentru orice alt curb corespunztoare unei serii date i aproximat cu un clopot,
41
raportul ntre momentul centrat de ordinul patru i ptratul momentului centrat de ordinul al
doilea, este un numr diferit de 3, curba respectiv fiind mai ascuit sau mai plat dect curba
normal a lui Gauss.
Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui Gauss,
Fisher a stabilit urmtoarea expresie de calcul al coeficientului boltirii, notat cu B4:
M X X
B
X4
'
4
sau:
B4 = B4-3
MODULUL 3
ANALIZA LEGTURILOR DINTRE VARIABILELE
42
Concepte de baz
Rezultate ateptate
Dup parcurgerea acestui modul se cere studentului s stpneasc noiunile de corelaie i
regresie, s poat identifica existena unei eventuale legturi ntre dou mrimi. De asemenea
s tie msura intensitatea legturii dintre variabile, fie ele cantitative sau calitative. Se
urmrete i cunoaterea metodelor de modelare funcional a legturilor.
Sinteza
Ne propunem abordarea unor metode statistice caracteristice studiului seriilor
multidimensionale. Scopul acestora este de a identifica i utiliza eventualele legturi care se
pot manifesta ntre dou sau mai multe variabile. Prezinta interes: existena legturii,
intensitatea acesteia, forma funcional a legturii, parametrii i reprezentativitatea ei privind
fenomenul cercetat. Problematica legturilor dintre variabile este foarte curent ntlnit n
economie. Spunem c salariul unui angajat este n funcie de productivitatea muncii sale,
vechimea n munc, responsabilitatea activitii sale, etc ; sau cererea dintr-un produs este n
funcie de preul produsului, venitul consumatorilor, etc. De fiecare dat, att n teoria
economic, ct i n aplicaii se ntlnete expresia fie funcia cererii. n realitatea
economic ns, aceast funcie nu se d, nu se cunoate, ci trebuie estimat pornind de la o
baz de date. Aceast problem de estimare a unei funcii i alte probleme colaterale ei fac
obiectul acestui capitol.
Pentru a putea aborda studiul legturilor dintre variabile trebuie s tim n primul rnd
dac exist sau nu o legtur ntre variabilele studiate (sau ntre fenomenele pe care acestea le
reprezint) i care este natura acestora. Putem clasifica legturile dinte variabile astfel :
1. Legtura nul. Semnific lipsa oricrei legturi ntre dou sau mai multe fenomene
sau variabile care cuantific fenomenele. De exemplu, o legtur nul se manifest ntre
nlimea unui angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta
primului ministru. Din punct de vedere statistic, spunem c ntre dou variabile X i Y exist o
legtur nul, sau nu exist legtur, dac cov( x, y ) 0 .
2. Legtura determinist. Spunem c ntre variabilele X i Y exist o legtur
determinist dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de legturi
se ntlnesc n special n fizic, unde de exemplu viteza este egal cu distana mprit la
timp: v d / t , sau fora este egal cu masa nmulit cu acceleraia: F m a . Astfel de
exemple exist i n economie, unde rata profitului este egal cu profitul mprit la cifra de
43
44
deoarece posibilitile de prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi
parcurse n cazul variabilelor cantitative.
n studiul analizei existenei legturii vom folosi att elemente de statistic deja
abordate n capitolele anterioare, cum ar fi tabelele i graficele, ct i parametri
(coeficieni) specifici acestui capitol. Deoarece prezint particulariti distincte, vom
aborda separat problematica subcapitolului n funcie de tipul variabilelor.
45
i 1 j 1
( N ij N ij ) 2
N ij
Dac nu exist legtur, adic X nu are nici o influen asupra lui Y, mediile condiionate
Y /X
46
2
2) Dac Y / X 0 exist legtur ntre variabile
3.3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate
2
N 2
Pentru a putea utiliza acest indicator toate unitile populaiei trebuie s poat fi
ordonate n raport cu variabilele pentru care cercetm intensitatea legturii. Presupunem o
populaie de volum n observat n raport cu m variabile.
Pentru a putea construi coeficientul, vom defini mai nti indicatorul de
concordan (P) i respectiv indicatorul de discordan (Q). Pe baza indicatorilor de
concordan i discordan construim coeficientul de corelaie simpl a rangurilor al lui
Kendall, definit astfel:
P Q
P Q
P Q n(n 1)
2
n cazul unei legturi directe de intensitate maxim, P va lua valoare sa maxim, iar
n( n 1)
iar Q 0 , deci 1 .
2
n cazul unei legturi inverse de intensitate maxim, P va lua valoare sa minim, iar
n(n 1)
deci 1 .
2
48
, respectiv [-1 ; 1] .
6 d i2
i 1
2
n(n 1)
Limitele celor doi coeficieni sunt aceleai, la fel i interpretrile valorilor numerice.
Raportul de corelaie
49
diferite ntre ele. Ceea ce le face s difere este numai influena lui X, deoarece am mprit
populaia n grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim variana
explicit ca o mrime absolut a intensitii legturii dintre X i Y i ponderea varianei
explicite n variana total ca o mrime relativ. Raportul de corelaie are expresia:
RYX
Vexp
Vtot
Vrez
Vtot
RYX
Y2 / X
Y2 / X
1 2
Y2
Y
dac nu exist legtur ntre X i Y, mediile condiionate Y / X sunt egale ntre ele,
deci Y2 / X 0 i RYX 0
- dac legtura este de intensitate maxim, nu exist influene ale altor factori dect
X asupra lui Y, nu exist variaie n cadrul grupelor, deci Y2 / X 0 i RYX 1 .
n consecin, raportul de corelaie aparine intervalului RYX [0 ; 1] . Interpretarea
intensitii legturii pe baza acestui coeficient se va face astfel:
-
dac
dac
dac
dac
RYX
RYX
RYX
RYX
50
Y / x4
Y / x3
Y / x2
Y / x1
x1
x3
x2
x4
unde f ( X 1 , X 2 ,..., X n ) reprezint funcia de regresie care aproximeaz cel mai bine
forma legturii, iar o variabil aleatoare numit rezidual, care nsumeaz efectul altor
factori dect cei luai n calcul.
3.5. Estimarea parametrilor funciei de regresie
Este o etap care se succede firesc alegerii formei funciei. n estimarea
parametrilor va trebui s inem cont de abaterea punctelor norului fa de modelul
matematic ales Y ( X 1 , X 2 ,..., X n ) , datorat altor factori dect X 1 , X 2 ,..., X n , considerai
neeseniali, cuantificai prin variabila rezidual .
Principiul de la care se pornete n estimarea parametrilor este cel al patratelor
minime. Minimizm suma patratelor abaterilor valorilor observate ale lui Y de la nivelul
51
Condiiile de minim constau n anularea celor (n+1) derivate pariale ale funciei
G (a0 , a1 ,.., an ) n raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la urmtorul
sistem de ecuaii:
G (a0 , a1 ,..., an )
2M Y (a0 a1 X 1 ... an X n ) 0
a0
a j
j 1, n
M a0 a1 X 1 ... an X n M (Y )
M a0 a1 X 1 ... an X n X n M (Y ) X j
de unde rezult:
52
j 1, n
a0 a1M ( X 1 ) ... an M ( X n ) M (Y )
j 1, n
a0 a1M ( X 1 ) a2 M ( X 2 ) M (Y )
2
a0 M ( X 1 ) a1M ( X 1 ) a2 M ( X 1 X 2 ) M (YX 1 )
2
a0 M ( X 2 ) a1M ( X 1 X 2 ) a2 M ( X 2 ) M (YX 2 )
Prin substituia lui a0 din prima ecuaie i nlocuirea lui n celelalte, obinem:
a1 M ( X 12 ) [M ( X 1 )]2 a2 M ( X 1 X 2 ) M ( X 1 )M ( X 2 ) M (YX1 ) M (Y )M ( X 1 )
a1 M ( X 1 X 2 ) M ( X 1 )M ( X 2 ) a2 M ( X 22 ) [M ( X 2 )]2 M (YX 2 ) M (Y )M ( X 2 )
Dac pentru a aduce la o form mai simpl notm cu:
mij M [ X i M ( X i )] [ X j M ( X j )] M ( X i X j ) M ( X i ) M ( X j )
53
a1
a2
m12
m21
m22
Y ( X 1 , X 2 ) M (Y )
m10
m11
m20
m21
m10
m12
m20
m22
X 1 M ( X 1 )
X 2 M ( X 2 ) 0
( 3)
m00
m10
m
20
m01
m02
m11
m21
m12
m22
( 3)
i notnd complementul algebric al elementului m0 j cu M oj , j 0,1,2 ecuaia de
regresie devine:
M ( n1)
m00
m10
...
m
n0
m01
m11
...
mn1
... m0 n
... m1n
... ...
... mnn
m01
m11
Y (X )
Y (X )
ca:
m10
m
X 1 M (Y ) 10 M ( X 1 )
m11
m11
a0 M (Y )
a1
m10
M ( X1)
m11
m10
X1
m11
Regresia parabolic
n economie sunt numeroase exemplele n care legtura dintre fenomene i deci
variabilele care le cuantific nu este liniar. Dac Y reprezint recolta la hectar dintr-un
produs agricol, iar X cantitatea de ngrminte, ne vom da seama chiar i intuitiv c o
anumit cretere a lui X nu provoac aceeai cretere a lui Y pe tot intervalul de variaie al
celor dou variabile. La valori mari ale cantitii de ngrminte, acestea provoac
saturaie sau chiar nocivitate, ducnd la o stagnare, respectiv diminuare a produciei. Alte
55
exemple pot fi: legtura dintre vechimea n munc i mrimea salariului, dintre cheltuielile
cu publicitatea i volumul vnzrilor, etc.
Determinarea parametrilor funciei parabolice de regresie se poate face fie aplicnd
direct funciei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat
anterior. n ambele cazuri vom exemplifica pentru parabola de ordinul doi.
a) Estimarea parametrilor prin aplicarea direct a metodei patratelor minime
Ecuaia de regresie a modelului se scrie:
Y ( X ) a0 a1 X a2 X 2
2 M Y ( a a X a X ) X 0
2 M Y ( a a X a X ) X 0
2M Y (a0 a1 X a2 X 2 ) 0
2
56
a0 a1M ( X ) a2 M ( X 2 ) M (Y )
2
3
a0 M ( X ) a1M ( X ) a2 M ( X ) M (YX )
2
3
4
2
a0 M ( X ) a1M ( X ) a2 M ( X ) M (YX )
facem substituiile:
X X1
X 2 X2
care reprezint un model liniar cu doi factori. Elementele matricei de variaie i covariaie
vor arta astfel:
m00 M (Y 2 ) ( M (Y )) 2 Y2
m01 m10 M (YX ) M (Y ) M ( X ) cov(Y , X )
m11 M ( X 2 ) ( M ( X )) 2 X2
m12 M ( X 3 ) M ( X ) M ( X 2 ) cov( X , X 2 )
m22 M ( X 4 ) ( M ( X 2 )) 2 X2 2
57
Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o
problem de regresie liniar, care se rezolv conform cazului liniar. n cazul mai general,
dac ecuaia de regresie este un polinom de gradul n:
Y ( X ) a0 a1 X a2 X 2 ... an X n
efectund substituiile:
X X 1 ; X 2 X 2 ; ... ; X n X n
Regresia exponenial
Dac ecuaia de regresie are form exponenial:
Y (X ) a bX
Regresia hiperbolic
Dac ecuaia de regresie are form hiperbolic:
58
Y (X ) a b
1
X
se face substituia:
X1
1
X
m01 m10 M Y M (Y ) M
cov Y ,
X
X
1
1
M
2
X
X
m11 M
12/ X
59
Z ( X 1 , X 2 ,..., X n ) lg Y ( X 1 , X 2 ,..., X n )
X i ' lg X i ,
i 1, n
det M
m00 M 00
rYX [0 ; 1]
Interpretarea acestui coeficient n funcie de valorile pe care le poate lua este urmtoarea:
- dac rYX [0 ; 0,3] funcia nu este reprezentativ pentru modelarea legturii dintre
variabile
- dac rYX (0,3 ; 0,7] funcia are o reprezentativitate medie pentru modelarea
legturii dintre variabile
- dac rYX (0,7 ; 1] funcia este foarte reprezentativ pentru modelarea legturii
dintre variabile
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienilor este bine s fie
comparate cu ale altor coeficieni, ai altor funcii. Pentru aceeai repartiie de exemplu, pentru
funciile de regresie alese ca fiind posibilecalculm coeficienii de corelaie i l reinem pe cel
mai mare, considernd acea funcie ca fiind cea mai reprezentativ.
n cazul regresiei liniare simple, formula coeficientului poate fi adus la o form
echivalent mai simpl:
m00
M ( 2 )
m10
rYX 1
m01
m11
m m m01 m10
det M
1 00 11
m00 M 00
m00 m11
m01
m00 m11
m01 m10
m00 m11
M ( XY ) M ( X ) M (Y )
Y X
rYX1 X 2
rYX1 rYX 2 rX 1 X 2
1 r 1 r
2
YX 2
2
X1 X 2
rYX 2 X1
rYX 2 rYX1 rX 1 X 2
1 r 1 r
2
YX1
2
X1 X 2
rYX1 X 2 X 3
rYX1 X 2 rYX 3 X 2 rX 1 X 3 X 2
1 r
2
YX 3 X 2
1 r
2
X1 X 3 X 2
rYX 2 X 1 X 3
rYX 2 X 1 rYX 3 X 1 rX 1 X 3 X 2
1 r
2
YX 3 X 1
1 r
2
X 2 X 3 X1
rYX 3 X 1 X 2
rYX 3 X 1 rYX 2 X 1 rX 2 X 3 X 1
1 r
2
YX 2 X 1
1 r
2
X 2 X 3 X1
Aceste formule ale coeficienilor de corelaie parial se pot generaliza i pentru cazul a k
variabile independente.
Probleme propuse
Problema 1
[ 30 ; 50 ]
( 50 ; 70 ]
( 70 ; 90 ]
Total
2
3
7
10
8
5
17
18
61
[ 200 ; 400 ]
Total
14
19
2
19
1
14
17
52
Se cere:
1)
Pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a funciei de
regresie.
2)
n ipoteza unei forme liniare a dependenei dintre Y i X, s se calculeze parametrii
funciei de regresie.
3)
S se studieze reprezentativitatea funciei de regresie pentru modelarea legturii dintre
cele dou variabile.
4)
Care este valoarea medie a volumului vnzrilor pentru un nivel al cheltuielilor cu
publicitatea de 55 milioane lei ?
5)
Aceleai cerine de la punctele 2, 3 i 4 pentru o form parabolic a dependenei dintre
Y i X.
Problema 2
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la
preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat sa nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
Nr.
crt.
Cerere (C)
Pre (P)
Venit (V)
15,4
1,4
620
3,2
5,1
530
4,9
2,5
490
10,5
1,7
800
8,0
1,8
630
5,1
3,4
410
7,6
2,1
670
11,3
1,6
920
14,0
3,6
990
10
6,4
3,5
320
11
13,2
1,9
520
12
8,8
1,8
700
13
12,1
1,9
730
Se cere:
62
1) S se formuleze ipoteze cu privire la forma legturii dintre cerere (C) i pre (P). Pentru
formele funciilor de regresie reinute ca fiind posibile, s se calculeze parametrii funciilor i
reprezentativitatea acestora.
2) Similar pentru legtura dintre cerere i venit.
3) S se calculeze parametrii funciei care modeleaz legtura liniar multipl dintre cerere i
factorii si e influen. Analizai reprezentativitatea acestei funcii n raport cu
reprezentativitatea funciilor de regresie simple. Care va fi valoarea estimat a cererii pe o
pia unde preul de vnzare va fi 3,2 iar venitul mediu al consumatorilor de 550 ?
Bibliografie:
63
MODULUL 4
ANALIZA SI PREVIZIUNEA SERIILOR DE TIMP
Obiective
Concepte de baza
Rezultate asteptate
Studentul intelege notiunile de indice factorial, nivel mediu, indice mediu, ritm mediu si
stapaneste modalitatile de calcul a acestora. Utilizeaza metode cantitative in previziune; in
acest sens, identifica componentele prezente intr-o serie de timp, modeleaza si extrapoleaza
tendinta, utilizeaza adecvat o medie mobila, modeleaza componenta sezoniera si ciclica,
utilizeaza metoda netezirii exponentiale in netezire si previziune.
Sinteza
4.1. INDICII STATISTICI
4.1.1. Indicii statistici: definiii i tipologii
Studiul fenomenelor economice i sociale presupune n marea majoritate a cazurilor i
msurarea variaiei unor mrimi. Aceast variaie poate fi urmrit n timp, spaiu sau relativ
la nite categorii. Se va folosi termenul generic de stare, notndu-se cu j starea luat ca baz
de comparaie i cu k cea cercetat n raport cu aceasta. Se va nota cu Z mrimea care
constituie obiectul de studiu, variaia acesteia putnd fi exprimat att sub form absolut, ct
i relativ.
64
Dintre exprimrile sub form relativ un loc deosebit de important l ocup indicele
statistic. n practic variaia total a variabilei Z este datorat variaiei unor alte variabile a
cror evoluie ntre dou stri j i k influeneaz evoluia lui Z. Avem de a face, aadar, cu
Z de forma Z f ( X 1 , X 2 , , X m ) . Un astfel de model este un model de tip determinist n
care cei m factori determin n totalitate nivelul lui Z . In cazul unui astfel de model se pot
distinge trei categorii de indici:
1) indicele variaiei totale (integrale) a mrimii Z :
I Zk / j
Z (k ) f X 1 (k ), X 2 ( k ), , X m (k )
Z ( j ) f X 1 ( j ), X 2 ( j ), , X m ( j )
X i (k )
X i ( j)
k/ j
3) indici ai variaiei partiale ale lui Z sau indici factoriali: I Z / X i - ne arat de cte ori s-a
modificat Z n starea k fa de starea j sub influena exclusiv a factorului X i .
i
i
i 1 p i ( j )
k/ j
i 1
I Z / p (L) r
r
p
(
j
)
q
(
j
)
i i
pi ( j )qi ( j )
i 1
i 1
k/ j
Z /q
( L)
p ( j )q (k )
i 1
r
p ( j )q ( j )
i 1
65
k/ j
Z/p
p (k ) q ( k )
(P)
i 1
r
p ( j )q (k )
i 1
k/ j
Z /q
( P)
p (k )q (k )
i 1
r
p (k )q ( j )
i 1
I Zk // pj (L) I Zk // pj (P)
I Zk // qj ( L) I Zk // qj ( P)
Indicii factoriali generai prin Metoda Drumului Factorilor (MDF). Indicele factorial al
unei variabile Z f X 1 , , X m , n raport cu factorul X i , obinut prin MDF este dat de
relaia (Florea, 1989):
f ' X i X 1 , , X m
I Zk // Xj i exp
dX i
Pj , Pk f X 1 , , X m
unde Pj , Pk reprezint poriunea arcului din drumul factorilor cuprins ntre punctele
Pj X 1 ( j ), , X m ( j ) i Pj X 1 ( k ), , X m (k ) , acest drum fiind descris de ecuaiile
parametrice X 1 X 1 ( ), , X m X m ( ) , fiind n general un parametru legat de timp.
Exemple. Indicii factoriali calculati prin metoda Laspeyres.
1. O societate hotelier dispune de 3 tipuri de locuri de cazare: camere cu un singur
pat(single), camere cu dou paturi(double) i apartamente. Numrul de camere nchiriate (X)
i tariful practicat (Y) n dou luni consecutive sunt date n tabelul urmtor:
Tipul
camerei
Single
Double
Apartament
Luna j
X
Y()
80
50
20
30
40
50
Luna k
X
Y()
110
60
25
35
40
45
Volumul valoric al ncasrilor din nchirierea camerelor (Z) se va calcula dup relaia:
3
k/ j
Z/X
(L)
X (k )Y ( j )
i 1
3
X ( j )Y ( j )
i 1
110 30 60 40 25 50
1,287 volumul valoric al ncasrilor
80 30 50 40 20 50
66
camere nchiriate. I
k/ j
Z/X
X ( j )Y (k )
( L)
i 1
3
X ( j )Y ( j )
i
i 1
80 35 50 40 20 45
1,055 volumul
80 30 50 40 20 50
valoric al ncasrilor a crescut n luna k fa de luna j de 1,055 ori sub influena modificrii
tarifului practicat.
2. Se consider mrimea Z ca fiind profitul brut al unei societi i factorii X veniturile totale respectiv Y - cheltuielile totale ale aceleai societi. Modelul care leag cele
trei mrimi va fi de forma: Z X Y . In doi ani consecutivi variabilele X i Y au
nregistrat valorile:
Anul
Variabila
t
t 1
10
12
X (mld lei)
8
9
Y (mld.
Lei)
X (t ) Y (t 1)
12 8
X (t 1) Y (t )
10 9
t/0
Z/p
(L)
p (t )q (0)
i 1
n
pi (0)qi (0)
i 1
unde:
pi (0)qi (0)
i 1
p (0)q (0)
i 1
n
pi (t )
k i (0) I tp/i 0
pi (0) i 1
n consumul populaiei;
p i (0) i pi (t ) sunt preurile nregistrate de marfa sau produsul i n
perioada de baz i perioada curent;
Ponderile k i (0) sunt obinute prin Ancheta Integrat n Gospodrii i rezult din
structura cheltuielilor medii lunare efectuate de o gospodrie pentru cumprarea mrfurilor i
plata serviciilor necesare satisfacerii nevoilor de trai; aceste ponderi se actualizeaz la
intervale de civa ani. Preurile corespunztoare celor n mrfuri i servicii din coul
67
indicelui se culeg lunar, n urma unei cercetri selective organizate de Institutul National de
Statistic.
Indicele produciei industriale msoar evoluia de ansamblu a preurilor produselor i
serviciilor industriale fabricate i livrate de productorii interni n perioada curent fa de
perioada de baz, n primul stadiu de comercializare a produselor sau serviciilor. ndicele
utlizat este tot un indice de tip Laspeyres.
Indicele salariilor msoar evoluia salariilor n perioada curent fa de perioada de
baz. Alturi de indicele preurilor de consum este folosit n evaluarea nivelului de trai. Se
utilizeaz, de asemenea, un indice de tip Laspeyres, care msoar variaia fondului de salarii
total Z sub influena modificrii salariilor medii S i corespunztoare ramurii i .
Indicii bursieri. Principalii indici bursieri se difereniaz prin mai multe elemente:
eantionarea, respectiv alegerea titlurilor din coul indicelui, reprezentativitate, modul de
calcul utilizat i natura variabilelor luate n calcul. Cei mai cunoscui i urmrii indici
bursieri, cu excepia familiei de indici Dow Jones se calculeaza ca si indici Laspeyres.
4.2. PREVIZIUNEA SERIILOR DE TIMP
n derularea activitii lor, frecvent agenii economici sunt pui n situaia de a anticipa
viitorul, iar apoi de a lua decizii n consecin. Oamenii de afaceri sunt nevoii s previzioneze
anual cifra de afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt
interesai de profitul viitor degajat de investiie, respectiv guvernele de previziunea
consumului sau a cheltuielilor guvernamentale etc.. Obinerea rapid de previziuni utiliznd
modele cantitative de previziune este la ndemna analitilor, urmare i a softurile de statistic
accesibile i uor de exploatat.
Anticiparea, previziunea evoluiei viitoare a fenomenelor economice presupune n primul
rnd cunoaterea istoriei acestora, punerea n eviden a unor legiti privind comportamentul
lor trecut. Baza de date pe care se fundamenteaz analiza evoluiei fenomenelor n timp este
constituit din serii cronologice.
4.2.1. Indicatori medii specifici seriilor cronologice
a) Nivelul mediu (valoarea medie). Nivelul mediu reprezint nivelul teoretic atins de
indicator n condiiile n care evoluia sa ar fi constant n timp, factorii ce-i determin
evoluia ar aciona cu aceeai intensitate pe ntreaga perioad de timp analizat.
Modul de determinare a volumului fenomenului difer dup cum seria este de intervale
respectiv de momente.
Pentru serii cronologice de intervale nivelul mediu este:
y y 2 ... y n
Y 1
n
Pentru serii cronologice de momente nivelul mediu este definit de urmtoarea relaie:
tn
t1
y (t )dt
tn
t1
dt
y1
T Tn 1
T
T1
T T2
y2 1
... y n 1 n 2
y n n 1
2
2
2
2
T1 T2 ... Tn 1
68
y t 1 t ,
t 2, 3,..., n
Iy
y
t 2
t 1
y
t 2
Iy
se obine
yt
2
t 1
yn
y1
yt yt 1 ty/ t 1
t 2
n 1
sau echivalent:
t 2
n 1
y n y1
.
n 1
2 ... t ... n
y 2 ... y t ... y n
T a bt cX
parabol
Tt a bt ct
T a bX
hiperbol
Tt a b
X t
unde
1
t
unde X
1
t
exponenial
Z A Bt
Tt a b
unde
( 2)
t / t 1
t y/ t 1 t y1 / t 2
tty/ t 1 ty t (t 1) y t 1
tln/ t y1 ln y t ln y t 1
Z t ln Tt ;
A ln a; B ln b
Z A bX
putere
Tt a t
unde
Z t ln Tt ;
A ln a; X ln t
logaritmic
Tt a b ln t
T a bX
unde X ln t
curba logistic
a
,
1 e b ct
a, c 0
Tt
70
cea mai adecvat funcie pentru modelarea tendinei poate fi considerat aceea pentru
care se realizeaz minimul sumei ptratelor reziduurilor min y t Tt ;
2
este adecvat tendina liniar atunci cnd diferenele absolute cu baza n lan
t y/ t 1 y t y t 1 sunt aproximativ constante. De asemenea, precizri specifice n
acest sens pentru parabol, exponenial respectiv hiperbol gsim n tabelul 1.
se utilizeaz metoda celor mai mici ptrate, expresiile de calcul a parametrilor a, b sunt deci
urmtoarele:
n
(t t )( y
t 1
Y)
(t t )
,
2
t 1
a Y bt ,
sau echivalent
b
M (tY ) M (t ) M (Y )
,
M (t 2 ) [ M (t )] 2
a Y bt.
Seria prezint o tendin de cretere atunci cnd b > 0 respectiv de descretere dac b < 0.
Cu excepia curbei logistice, celelalte funcii neliniare din tabelul1 pot fi aduse la o form
liniarizat prin anumite substituii, respectiv prin aplicarea operaiei de logaritmare n cazul
funciei exponeniale i a funciei putere.
Exemplu. Estimarea tendinei liniare
Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie
1999 iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare:
Luna
(t)
Indic
e (yt)
10
11
12
13
14
15
16
17
18
3.7
3.8
4.1
4.3
4.5
4.8
4.9
5.1
5.3
5.5
5.6
5.8
6.0
6.2
6.3
6.5
6.6
7.0
Cronograma seriei sugereaz prezena unei tendine liniare, peste care se suprapune o
component aleatoare de amplitudine redus:
y t a bt t ,
t 1, 2,..., 18.
71
1 2 18
9.5
18
3.7 3.8 7.0
M (Y )
5.33
18
(1 3.7) (2 3.8) (18 7.0)
M (tY )
55.72
18
12 2 2 18 2
M (t 2 )
117 ,2
18
M (t )
rezultnd
72
y t k y t k 1 ... y t ... y t k
; t k 1, k 2,..., n k ;
p
y t k 0, 5 y t k 1, 5 ... y t 0 , 5 y t 0, 5 .... y t k 0 ,5
p
t k 0,5; k 1,5; ... ; n k 0,5.
y t 0,5 y t 0,5
2
yij TC ij S j ij
73
1 p
S j I j / I i j 1, 2,..., p .
p i 1
n cazul modelului aditiv
y ij TC ij S ij ij
I
124.1
130.1
157.5
169.7
177.5
II
263.2
280.2
301.2
340.0
407.6
III
252.4
260.6
353.3
350.9
417.2
IV
124.5
151.1
185.0
168.7
224.1
4
0.5 124.1 263.2 252.4 124.5 0.5 130.1
191.8
4
0.5 y 2 y3 y4 y5 0.5 y6
y4
4
0.5 263.2 252.4 124.5 130.1 0.5 280.2
194.7
4
74
0.5 y 20 y 21 y 22 y 23 0.5 y 24
4
0.5 224.1 202.9 385.3 425.6 0.5 196.6
306.0.
4
y 22
Datele observate au fost numerotate aici n ordine cronologic y1, y2, ..., y24.
Mediile mobile de ordinul 4
t
MM(4)
t
MM(4)
1
2
3
4
5
6
7
8
9
10
11
12
191.8
194.7
197.8
202.2
208.9
214.9
229.2
245.0
250.8
257.1
13
14
15
16
17
18
19
20
21
22
23
24
261.7
259.4
258.3
267.7
284.5
299.7
309.8
310.2
308.4
306.0
-
1
2
3
191.8 194.7 197.8
M (tZ ) M (t ) M ( Z )
b
,
2
M (t 2 ) M (t )
a M ( Z ) bM (t ).
...
...
19
308.4
20
306.0
Calcule intermediare:
M (t ) 10.5, M ( Z ) 252.9, M (t 2 ) 143.5, M (tZ ) 2884.9,
b 6.9,
a 180.44.
Tendina produciei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin:
Tt 180.44 6.9 t .
c) Estimarea componentei sezoniere prin metoda raportrii la mediile mobile
Cum amplitudinea oscilaiilor crete uor n timp, cronograma seriei sugereaz luarea n
considerare a unui model multiplicativ:
yij Tij S j ij ; i 1, 2,..., 6 iar j 1, 2, 3, 4 .
Datele sunt disponibile pentru 6 ani i sunt prezente aici 4 sezoane. innd seama de
notaiile specifice, yij reprezint nivelul produciei de bere n anul i trimestrul j. Astfel, spre
exemplu y13 y1996;III 252.4 sau y34 y1998;IV 185.0 . Mediile mobile din tabelul
anterior vor fi transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim.
1996
1997
1998
1999
I
197.8
229.2
261.7
II
202.2
245.0
259.4
75
III
191.8
208.9
250.8
258.3
IV
194.7
214.9
257.1
267.7
2000
2001
Rapoartele S ij
y ij
y ij
284.5
308.4
299.7
306.0
309.8
-
310.2
-
tabelul urmator
Calculul indicilor sezonalitii
II
III
INVE
STI(I
E
An/Trim.
1996
1997
1998
1999
2000
2001
65.8
68.7
64.8
62.4
65.8
65.5
65.6
Sj
138.6
122.9
131.1
136.0
125.9
130.9
131.4
131.6
124.7
140.9
135.8
134.7
133.5
134.0
63.9
70.3
71.9
63.0
72.7
68.4
68.8
Media
Media
99.6
100
se elimin componenta sezonier din datele observate, iar apoi se utilizeaz medii
mobile n scopul eliminrii i a componentei aleatoare rezultnd valorile netezite y t
(astfel y t T C );
se calculeaz indicii de ciclicitate Ct prin raportare la tendin:
Ct
yt
Tt
b) Componenta aleatoare:
ij
y ij
Tij C ij S j
MAPE
1 p y h y h
y
p h 1
h
Trim.
Tendin
Sezonalitate
Previziune
Producie
Eroare
III
IV
I
325.34
332.24
339.14
1.34
0.688
0.656
435.95
228.58
217.9
425.6
196.6
203.2
-10.35
-31.98
-14.7
Prezentm modul de obinere a rezultatelor anterioare pentru trim. III an 2001. Valorile
tendinei respectiv a componentei sezoniere sunt:
77
e 425.6 435.95 10.35
Eroare e
I
7.40
7.16
A
7.66
7.35
S
7.96
7.54
O
8.26
7.73
N
8.47
7.92
D
8.65
8.11
0.24
0.31
0.42
0.53
0.55
0.54
Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinei conduce la:
y n (h) c (1 c) j y n j , c 0,1
j 0
1
3.7
10
2
3.8
11
3
4.1
12
4
4.3
13
5
4.5
14
6
4.8
15
78
7
4.9
16
8
5.1
17
9
5.3
18
1980
22.20
1981
22.35
1982
22.48
1983
22.55
1984
22.62
1985
22.72
1986
22.82
1987
22.94
1988
23.15
1991
269
1992
267
1993
256
1994
250
1995
255
1996
289
1997
283
1998
231
1999
203
2000
192
1991
7659
1992
7683
1993
7710
1994
7749
1995
7782
1996
7811
1997
7837
1998
7860
1999
7883
2000
7907
Produs 1
Produs 2
Produs 3
Luna k
q
p
10 kg
35
18 buc
67
5 litri
45
Se cere: indicii factoriali ai pretului respectiv ai cantitatii prin toate metodele cunoscute.
Comparati rezultatele obtinute.
Problema 6. Indicele variatiei integrale si indicii variatiilor factoriale Cunoscnd seriile
cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu studii
medii (Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive,
respectiv:
mii persoane
luna
X
Y
W
10
22,23
3,86
0,396
22,24
3,87
0,395
22,34
3,98
0,419
23,21
4,52
0,437
24,7
4,1
0,357
26,85
4,53
0,406
28,7
4,91
0,455
29,1
5,28
0,487
28,3
6,18
0,5
28,3
6,2
0,5
Se cere: a) Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y,
W
b) indicii exprimnd variaia integral a numrului total de omeri, calculai cu baz fix;
c) indicii factoriali de tip Laspeyres, Paasche, Fisher afereni fiecrui factor care influeneaz
numrul total de omeri, n ultima luna fa de prima luna.
Bibliografie
1. Buiga A., Dragos C., Lazar D., Parpucea I., Statistica I, Presa Universitara Clujeana, 2003.
2. Florea I., Parpucea I., Buiga A., [1998] , Statistic descriptiv. Teorie i aplicaii, Editura
Continental, Alba Iulia, 1998.
3. Florea I., Parpucea I., Buiga A., Lazar D., [2000] , Statistic inferenial, Presa
Universitar Clujean, Cluj Napoca, 2000.
4. Melard G., Methodes des prevision a court terme, Ed. de Universite de Bruxelles, 1990.
80
81