Documente Academic
Documente Profesional
Documente Cultură
SUPORT DE CURS
ANUL II
Semestrul 1
Cluj Napoca
2011
I. Informaii generale
1.1. Date de identificare a cursului
Date de contact ale titularilor de curs:
1. Nume: Conf. univ.dr. Anua Buiga
Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: anuta.buiga@econ.ubbcluj.ro
2. Nume: Conf.univ.dr. Drago Cristian
Birou: Birou 231 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: cristian.dragos@econ.ubbcluj.ro
3. Nume: Conf.univ.dr. Dorina Lazr
Birou: Birou 527 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: dorina.lazar@econ.ubbcluj.ro
4. Nume: Lect.univ.dr. Cristian Litan
Birou: Birou 231 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: cristian.litan@econ.ubbcluj.ro
5. Nume: Lect.univ.dr. Codruta Mare
Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: codruta.mare@econ.ubbcluj.ro
MODULUL 1
Concepte de baz. Obiectul statisticii.
Observarea, sistematizarea i prezentarea seriilor statistice.
Obiective
Concepte de baz
Rezultate ateptate
Cunoaterea i stpnirea noiunilor statistice de baz, cunoaterea tehnicilor de culegere,
grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenierii
variaiei unei mrimi sau a structurii populaiei supuse studiului.
Sinteza
1. Concepte de baz
1.1. Populaia statistic
Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai
natur, care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i
populaiei privit ca un tot unitar. [Florea I.,1998]
O populaie este finit dac include un numr determinat de elemente, dar ea poate fi
considerat drept reprezentativ pentru o populaie teoretic infinit. Ca urmare apare
necesitatea de a delimita o populaie n: coninut, spaiu i timp. Se mai denumete i
populaia univers.
Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate,
zon etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea
consumatorilor unui produs, mulimea societilor productoare sau concurente ale unui
produs, mulimea societilor distribuitoare, angajaii unei societi, etc.
Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc.
Unitatea statistic constituie elementul component, al populaiei statistice, asupra
cruia se va efectua nemijlocit observarea.
Variabil calitativ este variabila ale crei stri se exprim prin cuvinte sau
coduri. Se mai numete variabil nominal (strile se exprim prin cuvinte) sau
variabil ordinal (strile se exprim prin coduri).
c) Dup modul de variaie variabila cantitativ poate fi:
Variabil discret este acea variabil care, n intervalul su de definiie
nregistreaz cel mult valori raionale, variaia are loc n salturi.
Variabil continu este acea variabil care poate lua orice valoare real din
intervalul su de variaie.
Exemple de variabile statistice relativ la populaia format din mulimea
consumatorilor unui produs:
- vrsta: variabil atributiv, cantitativ, continu
X = { x1 = [15-20) [20-30) ... }
- frecvena de cumprare: variabil atributiv calitativ
Y = { y1 - foarte rar; y2 rar, ... }
- numr de sortimente cumprate relativ la produsul analizat: variabil atributiv,
cantitativ, discret:
Z = { z1 = 1; z2 = 2, ... }
- localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ
S = { s1 cartierul M sau s2 strada P1, ... }
- data ultimei cumprri a produsului analizat: variabil de timp, cantitativ
T = { t1 = 27.01.2002; t2 = 24.02.2002, ... }
Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi
finite sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei,
numit lege de probabilitate.
Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret
sau continu.
n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic
constituie o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare
sunt probabile i n strns legtur cu un anumit experiment. Strile unei variabile statistice
nu sunt probabile, ele cuantific o trstur proprie fiecrei uniti din populaie.
1.3. Observarea statistic
Observarea statistic const n identificarea unitilor populaiei i nregistrarea
strilor variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate
prin observare se numesc statistici.
Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou
feluri: total i parial.
Observarea total este acel tip de observare statistic n care are loc nregistrarea
tuturor unitilor care fac parte din populaie statistic supus studiului. Recensmntul
populaiei Romniei este un exemplu de observare total.
Observarea parial presupune observarea i nregistrarea unui anumit numr de
uniti din populaie, alese dup criterii bine definite.
n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie
statistice exhaustive rezultate prin observarea populaiei univers , fie statisticile rezultate din
observarea parial a unui eantion A, n ambele cazuri scopul final fiind acelai,
respectiv obinerea de informaii la nivelul populaiei univers A.
x
X : 1
N1
x2
N2
... xi
... N i
... x R
... N R
(1.1)
x
X : 1
f1
-
x2
f2
... xi
... f i
... x R
... f R
(1.2.)
X: 1
(1.3)
N(x1 ) N(x 2 ) ... N(x i ) ... N(x R )
unde: N(xi) reprezint numrul de uniti din populaia studiat pentru care variabila
nregistreaz valori ce nu depesc valoarea xi.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative
cumulate, respectiv:
x2
...
xi
...
xR
x1
X :
(1.4)
FN ( x1 ) FN ( x 2 ) ... FN ( xi ) ... FN ( x R )
unde: FN(xi) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat
valori ce nu depesc valoarea xi.
FN(xi) = f1 + f2 + ... + fi
N ( xi )
(.100)
i = 1, R
Sau
FN ( x i ) =
N
x1
x2
...
xj
...
xJ
Total
y1
y2
.
.
yi
.
.
yI
N11
N21
-
N12
N22
-
...
...
-
N1j
N2j
-
...
...
-
N1J
N2J
-
N1.
N2.
-
Ni1
-
Ni2
-
...
-
Nij
-
...
-
NiJ
-
Ni .
-
NI1
NI2
...
NIj
...
NIJ
NI.
Total
N.1
N.2
...
N.j
...
N.J
(1.5)
unde:
- Nij - reprezint numrul de uniti pentru care, variabila X nregistreaz starea xj i variabila
Y nregistreaz starea yi ;
- Ni. - numrul de uniti pentru care Y = yi, indiferent de nivelul nregistrat de variabila X;
- N.j - numrul de uniti pentru care X = xj, indiferent de nivelul nregistrat de variabila Y;
- N - numrul total de uniti analizate.
Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare:
x1
X :
N .1
x2
N .2
y
Y : 1
N 1.
y 2 ... y i ... y I
N 2. ... N i. ... N I .
... x j
... N . j
... x J
... N . J
y1
Y / X = x j :
N1 j
y2
N2 j
... y i
... N ij
... y I
... N Ij
j = 1, J
x1
X / Y = yi :
N i1
x2
N i .2
... x j
... N ij
... x J
... N iJ
i = 1, I
Indicele statistic al unei mrimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul
baz de comparaie al mrimii analizate. Ne arat de cte ori se modific acea mrime, de la
un nivel la altul.
Diferena relativ a unei mrimi ( RY ) exprim raportul dintre diferena absolut a
mrimii respective i nivelul baz de comparaie al acesteia. Ne arat cu ct la sut se
modific mrimea de la un nivel la altul.
Indicatorul relativ de intensitate (d) se definete ca raport ntre doi indicatori de nivel
de natur diferit i arat gradul de rspndire a fenomenului cuantificat de indicatorul de la
numrtor n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu:
producia diferitelor culturi / ha, densitatea populaiei, producia principalelor produse /
locuitor, rata omajului etc.
Greutatea specific (g) reflect structura fenomenului analizat n raport cu strile
variabile X, de la baza seriei.
Seriile cronologice
Seria cronologic reflect evoluia n timp a unei mrimi.
Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s
se refere la un interval de timp.
Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd
stocuri [Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci,
instituii, fonduri fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii
de activitate, unitile de cazare turistic etc. ntr-o astfel de serie nsumarea mrimii analizate
nu are sens din punct de vedere al coninutului, aceasta fiind permis din considerente de
calcul, ajustri etc.
Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd
fluxuri. De exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau
produse, venituri, cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel
de serie are sens nsumarea mrimii analizate.
Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a
nivelului unei mrimi Y,
0 1 2 ... t ... T
Y :
(1.6)
y 0 y1 y 2 ... y t ... yT
Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i
diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai
sus se pot calcula cu baz fix (t / t0) (baza de comparaie rmne aceeai) sau cu baz n lan
(t / t-1) (baza de comparaie se schimb, fiind considerat cea precedent nivelului comparat).
Fie seriile cronologice formate cu:
- diferene absolute cu baz fix:
0 1
ty/ t0 :
1/ 0
0 y
2/ 0
y
... T
... Ty / 0
... t
... t y/ 0
t y/ 0 = y (t ) y (0)
- diferene absolute cu baz n lan
(1.7)
0 1
t y/ t 1 :
1/ 0
y
2 ...
t
...
T
(1.8)
ty/ t 1 = y (t ) y (t 1)
ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii
de legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd
diferenele absolute cu baza n lan se obin diferenele absolute cu baza fix.
ty/ 0 = 1y/ 0 + 2y/ 1 + 3y/ 2 + ... + ty/ t 1
Scznd diferenele succesive cu baz fix se obin diferenele cu baz n lan.
... T
... I Ty / 0
y (t )
( x100)
y ( 0)
I yt / t 1 :
1/ 0
2 /1
t / t 1
T / T 1
I
I
...
I
...
I
y
y
y
y
I yt / t 1 =
(1.9)
(1.10)
y (t )
( x100)
y (t 1)
10
Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este mrimea cel
mai des folosit n caracterizarea evoluiei fenomenelor din economie.
Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii
formate cu:
- diferene relative cu baz fix
1
0
R yt / t0 :
1/ 0
0 Ry
t/0
y
ty/ 0
y (0)
2
R
2/0
y
...
t
... R yt / 0
... T
... R Ty / 0
(1.11)
y (t ) y (0) y (t )
=
1 = I yt / 0 1
y (0)
y (0)
1
0
R yt / t 1 :
1/ 0
Ry
t / t 1
y
ty/ t 1
y (t 1)
2 ...
t
...
T
2 /1
t / t 1
T / T 1
Ry
... R y
... R y
= I yt / t 1 1
sau
(1.12)
I yt / t 1 .100 100
0
g y :
g0
g (t ) =
1
g1
2
g2
... t
... g t
... T
... g T
(1.13)
y (t )
T
y(t )
t =1
11
Z : 0
Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R)
(1.14)
unde:
si este o stare a variabilei ce exprim spaiul,
i = 1, R ;
Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate).
Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu:
- diferene absolute cu baz fix:
s1
s2
...
si
...
sR
s
(1.15)
sZ/ s0 : 0
s1 / s0
s2 / s0
si / s 0
s R / s0
Z
... Z
... Z
0 Z
sZi / s0 = Z (i ) Z (0)
- indicii statistici cu baz fix
s1
s2
s
I Zs / s0 : 0
s1 / s0
s2 / s0
IZ
0 IZ
...
si
si / s 0
... I Z
Z (i )
.(100)
Z ( 0)
- diferene relative cu baz fix
s1
s2
...
si
s
RZs / s0 : 0
s1 / s0
s 2 / s0
si / s 0
RZ
... RZ
0 RZ
si / s 0
... s R
... I Zs R / s0
(1.16)
I Zsi / s0 =
...
sR
(1.17)
... RZsR / s0
12
n raport cu care este studiat populaia. Variabilele statistice ce urmeaz s fie urmrite i
nregistrate la nivelul fiecrei uniti din populaie, trebuie s fie eseniale i s prezinte
interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii
exacte pentru delimitarea corect a unitilor statistice care alctuiesc populaia. i nu n
ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai multe persoane este
necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea
necesar datelor rezultate.
Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune:
specificarea unitilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor
statistice care caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit,
nregistrarea strilor variabilelor statistice considerate.
Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme
care s asigure o pregtire tiinific a observrii statistice:
- delimitarea populaiei supuse observrii;
- definirea unitilor statistice de observat;
- timpul i locul unde va avea loc observarea;
- programul observrii;
- alegerea purttorilor de informaie;
- pregtirea persoanelor ce urmeaz s fac observarea.
Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc
fiecare dintre ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia
depinde corectitudinea celorlalte etape a cercetrii statistice.
Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta
se afl n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce
caracterizeaz populaia supus studiului.
Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da
loc confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce
trebuie nregistrate n raport cu variabilele de studiat.
Stabilirea timpului i a locului unde va avea loc observarea are importan din punct
de vedere a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are
n statistic dou accepiuni:
- momentul sau perioada la care se refer datele nregistrate (timpul de referin);
- durata observrii.
Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus
cercetrii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o
reprezint familiile etc.).
n cadrul programului observrii statistice trebuie stabilite variabilele statistice care
urmeaz s fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice
trebuie s fie n consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse.
Variabilele statistice care fac parte din programul cercetrii trebuie s surprind aspectele
eseniale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i
generalizarea acestora la nivelul ntregii populaii.
Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a
fi nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz
datele din observarea unitilor statistice.
Observarea statistic se poate desfura n diverse forme n raport cu: natura
proceselor social-economice de studiat, obiectivul cercetrii, formele de organizare ct i
posibilitile practice de urmrire i nregistrare a unitilor statistice din populaie.
Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem:
observarea total i observarea parial. Observarea total permite nregistrarea, n raport cu
13
variabilele statistice a tuturor unitilor statistice din populaie, implicnd un volum mare de
munc, antreneaz, de obicei, un numr de persoane i dureaz mult timp. Ca urmare se
creaz condiii pentru apariia de erori de observare, ceea ce va conduce la micorarea
eficienei observrii. Forma cea mai frecvent de observare total o constituie recensmntul
populaieiObservarea total se practic i n domeniul controlului tehnice de calitate, n cazul
produselor de nalt tehnicitate , aa cum ar fi: televizoare, maini de splat, frigidere,
automobile etc. Este necesar o observare total n acest caz, deoarece constatarea
defeciunilor de ctre cumprtori ar implica cheltuieli mult mai mari cu remedierea acestora
n comparaie cu organizarea unei observri totale a loturilor de produse ce urmeaz a fi
scoase pe pia.
n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt
nesemnificative, este suficient realizarea unor observri pariale prin care s se asigure c
rebuturile nu depesc un anumit procent admis. O astfel de observare, care include doar o
parte din unitile populaiei supuse studiului corespunde observrii pariale. Observarea
parial constituie o alternativ la observarea total n cazul populaiilor infinite sau chiar dac
sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observrii
pariale se pot evalua rezervele de iei, crbune sau alte minerale, se poate evalua masa de
material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea
parial se recomand n toate cazurile n care se consider mai avantajoas dect observarea
total.
Eantionul, ca rezultat al observrii pariale, presupune respectarea cu strictee a
principiului reprezentativitii, n conformitate cu care fiecare unitate statistic din populaie
general s aib aceeai ans de a face parte din eantion. Asigurarea respectrii principiului
reprezentativitii n formarea eantionului de observat permite acestora o structur foarte
apropiat cu cea a populaiilor din care sunt formate. Aceasta ne asigur, cu o anumit
probabilitate dinainte fixat, c rezultatele obinute la nivelul eantionului pot fi extinse la
nivelul ntregii populaii. n raport cu legea de probabilitate urmat de variabilele urmrite n
populaia general sunt dou tipuri de eantioane: eantioane de volum mare i eantioane de
volum redus.
Observarea statistic n raport cu procedeul folosit este de dou feluri:
- observarea direct;
- observarea indirect.
Observarea direct presupune o observare nemijlocit a unitilor din populaie, care
sunt prevzute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct
cu unitile statistice, fie prin msurare, fie prin interogare, dac unitile sunt persoane. Acest
procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n
vederea msurrii nivelelor nregistrate de variabilele considerate.
Observarea indirect presupune un intermediar ntre unitile care urmeaz s fie
supuse observrii i observator. Intermediarul poate fi un document special conceput n
vederea observrii i atunci observarea este pe baz de document sau intermediarul poate fi o
alt persoan dect observatorul, caz n care avem observare prin interogare.
Suportul pentru culegerea datelor l reprezint chestionarul.
2.2. Sistematizarea i prezentarea datelor statistice
Sistematizarea constituie o etap n cadrul prelucrrii datelor statistice n vederea
prezentrii acestora sub form de serie statistic (tabele statistice).
Datele obinute ca urmare a procesului de observare statistic, n forma lor brut,
permit o caracterizare amnunit a fiecrei uniti din populaia considerat. Deoarece, datele
14
X : 1
N 1 N 2 ... N R
n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la
baz o variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia
considerat nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul
strilor variabilei. Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu
ajutorul intervalelor de grupare (variaie), fiecare interval cuprinznd un numr oarecare de
valori ale variabilei. Ca urmare, pentru o serie continu, clasele se definesc cu ajutorul
intervalelor de grupare.
Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil
cantitativ continu:
determinarea lungimii intervalelor de variaie;
stabilirea formei de scriere a intervalelor de variaie.
Determinarea lungimii intervalelor de variaie conduce la dou situaii:
serii construire cu intervale de lungime egal;
serii construite cu intervale de lungime diferite.
Stabilirea numrului de intervale de variaie trebuie s asigure satisfacerea
urmtoarelor condiii:
15
informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar
populaia s nu fie prea frmiat n raport cu variabilele de grupare;
- media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai
aproape de centrul intervalului de variaie respectiv;
- s nu existe grupe vide;
- reprezentarea grafic a seriei rezultate s permit conturarea unei regulariti a
fenomenului de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu
este posibil nici n cazul unui numr mic de intervale deoarece se pierd prea multe
date, nici n cazul unui numr prea mare de intervale, populaia frmindu-se
prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport
cu variabila X este normal, urmtoarea expresie:
lx =
xmax xmin
1 + 3,322 lg N
(2.1)
(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul
fiind orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n
cazul n care acestea vor fi de lungime egal. n expresia de calcul a lungimii intervalelor
intervine valoarea maxim i cea minim a variabilei, ct i volumul populaiei. n urma
stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum
urmeaz:
X : min min x
N1
Nk
NR
16
Histograma
Graficul specific seriilor care au la baz o variabil continu (de intervale) este
histograma. Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe
abscis se trec intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara
frecvenelor se construiete n conformitate cu respectarea principiului proporionalitii ntre
frecvene i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de variaie a
seriei (xi-1 xi) se construiete un dreptunghi a crui baz este chiar lungimea intervalului, iar
cealalt latur se determin din condiia proporionalitii ariei dreptunghiului cu mrimea
indicatorului n clasa respectiv.
Latura necunoscut a dreptunghiului, notat cu Li se determin din urmtoarea relaie:
Li . li = k . Ni
(2.2)
unde:
li = latura cunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
Li = latura necunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
17
Grupa
de vrst (ani)
04
59
10 14
15 19
20 24
25 29
30 34
35 39
Populaia
1147065
1330733
1737153
1701881
1978835
1792822
1698268
1335039
18
populatia
04
59
10 14
15 19
20 24
25 29
30 34
35 39
CDR
PDSR
USD
UDMR
PRM
PUNR
37,0
28,7
16,1
7,7
5,6
4,9
19
5,60%
4,90%
7,70%
37%
CDR
PDSR
USD
UDMR
PRM
PUNR
16,10%
28,70%
Bulgaria
4683
Cehia
12197
Polonia
7543
20
Romnia
6153
Slovacia
9624
Ungaria
9832
9624
9832
Slovacia
Ungaria
7543
8000
6153
6000
4683
4000
2000
0
Bulgaria
Cehia
Polonia
Romnia
Cronograma (historiograma)
O categorie foarte important de serii o constituie seriile cronologice, a cror
reprezentare grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz
ntr-un sistem de axe rectangulare.
Se consider seria cronologic de forma (1.7):
0
Y :
y0
1
y1
2 ... t
y2 ... yt
... T
... yT
21
Anul
Autoturisme
nmatriculate
1994
2020017
1995
2197477
1996
2391869
1997
2605465
1998
2822254
1999
2980014
3500000
3000000
2500000
2000000
1500000
1000000
500000
0
1993
1994
1995
1996
1997
1998
1999
2000
anul
22
Nr.
Crt.
Cerere
(C)
15,4
3,2
4,9
10,5
8,0
5,1
1,4
5,1
2,5
1,7
1,8
3,4
Pre
(P)
10
11
12
13
7,6
11,3
14,0
6,4
13,2
8,8
12,1
2,1
1,6
3,6
3,5
1,9
1,8
1,9
18
16
14
cerere
12
10
8
6
4
2
0
0
pret
Probleme propuse
P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare
populaie selectat precizai:
- denumirea populaiei, a unitii statistice i volumul acesteia;
- scopul cercetrii statistice;
- variabilele statistice n raport cu care s-ar face observarea statistic a populaiei.
P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic
bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive,
relativ la care se cere:
23
Bibliografie:
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira,
Cluj-Napoca, 2010;
2. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2001;
3. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental,
Cluj-Napoca, 1998.
24
MODULUL 2
PARAMETRII REPARTIIILOR EMPIRICE UNIDIMENSIONALE
Obiective
Concepte de baz
Rezultate ateptate
Cunoaterea modului de calcul i a semnificaiei parametrilor tendinei centrale, a gradului
de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaii i
formularea unei concluzii privind forma distribuiei unei populaii.
Sinteza
2.1. Parametrii tendinei centrale
Parametrii din aceast grup au menirea de a evidenia poziia n jurul creia se
grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat
printr-un numr se numete poziie central. Ea poate fi evideniat prin:
- valoarea medie X ;
- valoarea median (M e ( X )) ;
( )
- valoarea modal (M o ( X )) .
A. Valoarea medie
25
Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant
funcia determinant, adic:
G ( x1 , x 2 ,..., x R ) = G X , X ,..., X .
(2.0)
G ( x1 , x 2 ,..., x R ) = xi N i
i =1
semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de
copii pe familie se particularizeaz relaia (2.0) dup cum urmeaz
R
i =1
i =1
xi Ni = X Ni
de unde rezult:
R
X =
x
i =1
Ni
N
i =1
X =
(2.1)
26
R K
K
G ( x1 , x 2 ,..., x R ) = xi f i
i =1
(2.2)
27
1. Media aritmetic
Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii
statistice, aa cum rezult din practica statistic.
Se consider acum dou serii statistice de repartiie, una format din frecvene absolute, iar
cealalt din frecvene relative:
xi
X :
N i i =.1, R
(2.3)
xi
X :
f i i =.1, R
(2.4)
x'i .N i
Nj
Fie o serie de repartiie, care are la baz o variabil continu X, respectiv,
X=
xi 1 xi
X :
f i i =.1, R
xi + xi 1
= xi'
2
unde x i' reprezint mijlocul intervalului i, obinem relaia:
Folosind notaiile:
X = xi' fi
i =1
2. Media armonic
Se consider o serie de forma:
28
x
X : i
N i i =1, R
(2.5)
n cazul unei serii discrete de forma (2.5), media armonic notat cu X 1 se definete prin:
R
X 1 =
N
i =1
(2.6)
1
Ni
xi
i =1
X 1 =
i =1
i =1
1
N*
xi
R
R
i =1
(2.7)
1
xi
X 1 =
N
i =1
i =1
(2.8)
1
Ni
x i'
R
R
x
i =1
'
i
3. Media geometric
Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media
geometric notat cu X g (sau X o ) este definit prin expresia:
(2.9)
Din (2.9), pentru media geometric ponderat exprimat cu frecvene relative se deduce:
29
1/ N
Xg =
N1
x 2 ... x R
N2
NR
R N
= xi i
i =1
= xi
i =1
Ni / N
= xi i
f
(2.10)
i =1
Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru
diversele variante de medie geometric, rmn variabile cu singura modificare c valorile xi,
i = 1, R , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei:
xi' =
xi 1 + xi
,
2
i = 1, R
(2.11)
B. Valoarea median
Valoarea median, notat cu M e este acea valoare a variabilei cantitative X care mparte
repartiia n dou pri egale, respectiv:
FN (M e ) = 1 / 2 sau N ( M e ) =
N
2
(2.12)
Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau
continu.
Pentru o repartiie discret, calculul medianei nu implic probleme deosebite i nici un
volum mare de calcule.
Se consider o repartiie cu frecvene absolute:
x x2 ... xi ... xR
.
X : 1
N1 N 2 ... N i ... N R
(2.13)
n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:
a) volumul N al populaiei este un numr impar;
b) volumul N al populaiei este un numr par.
n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului
medianei, notat cu rM e , conform urmtoarei relaii:
1 R
rM e = N i = N ( M e )
2 i =1
(2.14)
a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a
N
crui parte ntreag indic numrul de uniti din populaie pentru care variabila X a
2
nregistrat valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat
N
urmtoare celei de rang adic:
2
M e = x N
+1
2
30
(2.15)
b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca
urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci
se gsesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora.
Relaia de calcul a medianei, n acest caz, este:
x N + x N
Me =
+1
2
(2.16)
Pentru o repartiie continu, calculul valorii mediane presupune verificarea egalitii (2.12) i
ca urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic
un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat.
Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit
un volum redus de calcule.
Pentru acesta se consider o repartiie continu n raport cu variabila X, i anume:
x x1 x1 x 2 ... x i 1 x i ... x R 1 x R
.
X : 0
N2
Ni
N R
...
...
N1
(2.17)
unde intervalele xi-1-xi, i = 1, R pot fi de lungime egal sau neegal. Calcularea rangului
medianei va permite stabilirea intervalului n care se afl valoarea median, interval numit i
interval median. Se cumuleaz frecvenele absolute din aproape n aproape pn ce este
ndeplinit inegalitatea:
N 1 + N 2 + ... + N i
1
N
2
M e = xi 1 +
N ( M e ) N ( xi 1 )
( xi xi 1 )
Ni
xi 1 = xM e
Ni = N M e
(2.18)
C. Valoare modal
Valoarea modal Mo(X) a unei repartiii reprezint aceea valoare a variabilei X creia i
corespunde frecvena cea mai mare.
Acest parametru se mai numete modul, valoare dominant, sau mod se noteaz cu Mo.
Mod de calcul:
31
a)
(2.19)
valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de
calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru
care frecvena este cea mai mare.
b) Pentru serii de repartiie continue, respectiv:
x x1 x1 x 2 ... x i 2 x i 1 x i 1 x i
X : 0
f2
f i 1
fi
...
f1
x i x i +1 ... x R 1 x R
f i +1
fR
...
(2.20)
M o (x ) = x M o +
1
lMo
1 + 1
(2.21)
unde:
Mo
xMo
1
- reprezint diferena dintre frecvena intervalului modal i frecvena intervalului
precedent;
1 - reprezint diferena dintre frecvena intervalului modal i frecvena
urmtor;
lMo
intervalului
O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o
serie are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal
evideniaz faptul c populaia n cauz este neomogen. Calculul valorii modale, n
asemenea cazuri, presupune o delimitare mai riguroas a obiectului observrii ct i a
populaiei care urmeaz s fie studiat. O alt cale, care poate duce la eliminarea unui
asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc.,
pn se ajunge la o serie unimodal.
n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana.
Pentru serii uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri:
Mo = X 3 X Me
Calculul valorii modale reprezint un deosebit interes pentru activitatea practic. Avnd n
vedere c semnificaia acestui parametru indic acea valoare a variabilei nregistrat de cele
mai multe uniti din populaie se poate afla: ora la care sunt solicitate cele mai multe
convorbiri telefonice, ora de vrf privind transportul n comun, mrimea cea mai solicitat la
nclminte etc.
Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea
medie se bucur de o mai mare reprezentativitate.
Dac, n plus, avem M e = M o = X , innd seama c valoarea median nu este influenat de
valorile extreme ale variabilei, se poate afirma c mediana reprezint un grad de
reprezentativitate mai mare dect valoarea medie.
2.2. Parametrii de structur
Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o
variabil sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea
structurii unei populaii poart denumirea de valori quantile.
Valorile quantile ale unei serii de repartiie unidimensionale sunt acele mrimi nregistrate de
variabila X, care mpart seria n n pri egale (mai precis mparte populaia n n pri egale). n
acest caz se vor calcula p quantile (p = n-1).
Pentru o serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea
egalitate este satisfcut de cele p quantile:
q1
f ( x)dx =
x1
q2
f ( x)dx = ... =
q1
xR
f ( x)dx =
q n 1
1
n
(2.22)
q2
f = f
i
x1
q1
xR
= ... = f i =
q n 1
1
n
(2.23)
1
N
sau N (q p ) = p , p = 1, n - 1
n
n
x x2 ... xi ... xR
.
X : 1
N1 N 2 ... N i ... N R
(2.24)
33
rq p = N (q p ) = p
N
n
(2.25)
qp =
x rq p + x ( rq p +1)
(2.26)
b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei
X corespunztoare pari ntregi a rangului majorat cu 1:
q p = x[ rq
(2.27)
+1]
n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1
quantile trebuie s satisfac relaia (2.22). Determinarea quantilelor din asemenea egaliti ar
presupune cunoaterea densitii de probabilitate f(x). Ori n activitatea practic f(x) se
aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule.
x x1 x1 x 2 ... x i 1 x i ... x R 1 x R
.
X : 0
N2
Ni
N R
...
...
N1
(2.28)
1 R
rq p = N (q p ) = p N i
n i =1
(2.29)
Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i
intervalul quantilei de ordinul p( p = 1, n 1) . Cumulnd frecvenele pe clase pn la egalarea
s-au depirea rangului, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p N i
n i =1
(2.29)
N (q p ) N ( x i 1 )
Ni
( x i x i 1 )
34
(2.30)
M e xmax
50%
(2.31)
semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X
valori cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a
nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X.
Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4.
Cele trei quartile, care se obin, notate: Q1, Q2 i Q3 sunt acei parametri de structur care
mpart populaia n patru pri egale.
n raport cu mediana, quartila nti Q1, se numete quartila mic (inferioar), quartila
a doua Q2 coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q3 se
numete quartila mare (superioar).
Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n raport cu
variabila X:
x Q1 Q1 Q2
X : min
25%
25%
Q2 Q3
25%
Q3 X max
25%
(2.32)
35
(2.33)
x
dx =
i =1
X Ni
(2.34)
N
i =1
Dac seria are la baz o variabil continu i se cunoate f(x), atunci abaterea medie liniar se
calculeaz astfel:
36
dx =
xR
x X f ( x)dx
(2.35)
x1
dx =
x
i =1
'
i
X Ni
R
N
i =1
sau
d x = x 'i X f i
(2.36)
i =1
dup cum seria n cauz este format cu frecvene absolute sau relative, unde:
x i' =
x i 1 + x i
, i = 1, R
2
Vx =
dx
X
100
(2.37)
Coeficientul simplu de variaie (Vx) arat cu ct se abate n medie orice valoare a variabilei X
de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate
aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea
valoare medie pentru care coeficientul simplu de variaie este mai mic.
Parametrul abaterea medie liniar, n forma absolut sau relativ, prezint unele deficiene
deoarece nu este suficient de sensibil la abaterile mici, adugndu-se i unele inconveniente
de natur teoretic, generate de exprimarea abaterilor n valoarea absolut.
nlturarea acestor deficiene se poate realiza apelnd la un nou parametru privind msurarea
variaiei, numit abatarea medie ptratic.
x = M (X X )2
(2.38)
37
x2 = M ( X X ) 2 = D 2 ( X )
(2.39)
x2 =
(x
i =1
X )2 Ni
(2.40)
N
i =1
n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform
urmtoarei relaii:
=
2
x
(x X )
xR
f ( x) dx
(2.41)
x1
x
X
100
(2.42)
38
Q=
(2.43)
i arat cu ct se abat n medie, n plus sau n minus, de la median, cele 50% din valorile
variabilei cuprinse ntre Q1 i Q3.
Forma relativ a acestui indicator notat cu Qr:
Qr =
Q
Q Q1
100 = 3
100
Me
2 Me
(2.44)
Abaterea interquantil
Pentru acest parametru, sub form absolut, avem:
q=
qn 1 M e + M e q1 qn 1 q1
=
2
2
(2.45)
q
q q
100 = n 1 1 100
Me
2 Me
(2.46)
Cu ct abaterea interquantilic (relativ sau absolut) este mai mic, cu att valoarea median
este mai reprezentativ.
E = fi 2
i =1
unde s-a notat cu E energia informaional. Este un parametru utilizat n cazul n care seria are
la baz o variant nenumeric.
39
X : 1
1 / R 1 / R ... 1 / R
iar
Emin = R
1
1
=
2
R
R
Se observ c:
1
E 1
R
Forma relativ a acestui parametru, notat cu Er, se deduce astfel:
1
R =
Er =
1
1
R
E
1
R
i =1
1
R
de unde:
0 Er 1
Referitor la populaia dat, studiat n raport cu o variabil X, se calculeaz Er, iar dac:
- Er se apropie de 1, atunci populaia respectiv este caracterizat de un grad nalt de
concentrare;
- Er se apropie de 0, populaia n cauz se caracterizeaz printr-o concentrare minim.
40
parametrii asimetriei;
parametrii boltirii.
) (
f X = f X +
3 =
M XX
X3
(2.47)
3 =
( )
M (X X )
M XX
2 3
Calculnd valoarea acestui parametru, n funcie de semnul ei, avem urmtoarele cazuri:
Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a valorii
medii ct i pentru compararea reprezentativitii a dou sau mai multe valori medii ce
reprezint serii diferite.
M XX
X4
(2.48)
Pentru a nelege semnificaia boltirii unei serii, se consider dou serii statistice care au la
baz variabilele X i Y, iar
X = Y ; X = Y
Mai presupunem, n plus, c cele dou distribuii au form de clopot pentru care 3X = 3Y ,
adic ambele sunt simetrice. Dei s-ar prea c cele dou serii nu au nimic care s le
deosebeasc, totui reprezentndu-le grafic rezult dou curbe de forma:
X =Y
X = Y
unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou
serii nu sunt caracterizate de aceeai boltire.
Boltirea unei serii este util pentru a da o caracetrizare mai exact reprezentativitii valorii
medii.
n cazul exemplului prezentat mai sus, att mediile ct i abaterile medii ptratice sunt egale i
ca urmare, coeficientul de variaie al lui Pearson este acelai pentru cele dou serii. Deci
rezult c ambele valori medii prezint acelai grad de reprezentativitate. Cu toate acestea,
graficele celor dou serii contrazic concluzia dedus n urma comparrii celor doi coeficieni
de variaie.
Valoarea medie cea mai reprezentativ n seria n care cele mai multe uniti ale populaiei
cercetate au nregistrat valori, mai apropiate de valoarea medie. Pentru o astfel de serie,
mprtierea fa de valoarea medie fiind mic, graficul are o form mai ascuit n cazul
seriei X i mai plat n cazul seriei Y.
42
Nivelul boltirii pentru o serie oarecare dat se msoar cu ajutorul parametrului B4, a crui
expresie de calcul este dat de relaia (2.48). Valoarea lui B4 pentru o distribuie normal este
egal cu 3. Pentru orice alt curb corespunztoare unei serii date i aproximat cu un clopot,
raportul ntre momentul centrat de ordinul patru i ptratul momentului centrat de ordinul al
doilea, este un numr diferit de 3, curba respectiv fiind mai ascuit sau mai plat dect curba
normal a lui Gauss.
Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui Gauss,
Fisher a stabilit urmtoarea expresie de calcul al coeficientului boltirii, notat cu B4:
B =
'
4
M XX
4
X
sau:
B4 = B4-3
43
MODULUL 3
ANALIZA LEGTURILOR DINTRE VARIABILELE
UNEI REPARTIII MULTIDIMENSIONALE
Obiective
Concepte de baz
Rezultate ateptate
Dup parcurgerea acestui modul se cere studentului s stpneasc noiunile de corelaie i
regresie, s poat identifica existena unei eventuale legturi ntre dou mrimi. De asemenea
s tie msura intensitatea legturii dintre variabile, fie ele cantitative sau calitative. Se
urmrete i cunoaterea metodelor de modelare funcional a legturilor.
Sinteza
Ne propunem abordarea unor metode statistice caracteristice studiului seriilor
multidimensionale. Scopul acestora este de a identifica i utiliza eventualele legturi care se
pot manifesta ntre dou sau mai multe variabile. Prezinta interes: existena legturii,
intensitatea acesteia, forma funcional a legturii, parametrii i reprezentativitatea ei privind
fenomenul cercetat. Problematica legturilor dintre variabile este foarte curent ntlnit n
economie. Spunem c salariul unui angajat este n funcie de productivitatea muncii sale,
vechimea n munc, responsabilitatea activitii sale, etc ; sau cererea dintr-un produs este n
funcie de preul produsului, venitul consumatorilor, etc. De fiecare dat, att n teoria
economic, ct i n aplicaii se ntlnete expresia fie funcia cererii. n realitatea
economic ns, aceast funcie nu se d, nu se cunoate, ci trebuie estimat pornind de la o
baz de date. Aceast problem de estimare a unei funcii i alte probleme colaterale ei fac
obiectul acestui capitol.
Pentru a putea aborda studiul legturilor dintre variabile trebuie s tim n primul rnd
dac exist sau nu o legtur ntre variabilele studiate (sau ntre fenomenele pe care acestea le
reprezint) i care este natura acestora. Putem clasifica legturile dinte variabile astfel :
1. Legtura nul. Semnific lipsa oricrei legturi ntre dou sau mai multe fenomene
sau variabile care cuantific fenomenele. De exemplu, o legtur nul se manifest ntre
nlimea unui angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta
primului ministru. Din punct de vedere statistic, spunem c ntre dou variabile X i Y exist o
legtur nul, sau nu exist legtur, dac cov( x, y ) = 0 .
2. Legtura determinist. Spunem c ntre variabilele X i Y exist o legtur
determinist dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de legturi
44
se ntlnesc n special n fizic, unde de exemplu viteza este egal cu distana mprit la
timp: v = d / t , sau fora este egal cu masa nmulit cu acceleraia: F = m a . Astfel de
exemple exist i n economie, unde rata profitului este egal cu profitul mprit la cifra de
afaceri: r = / C. A. 100% . Legtura este determinist pentru c variabila r este perfect
determinat de celelalte dou: i C.A. Adic pentru o anumit valoare a profitului i o
anumit valoare a cifrei de afaceri nu putem avea dect o singur valoare a ratei profitului.
3. Legtura statistic. Se mai numete i stocastic sau probabilist. Este tipul de
legtur cel mai des ntlnit n tiinele sociale, deci i n economie. Fiecrei valori xi a
variabilei X i corespunde o distribuie de valori ale variabilei Y. Matematic, o astfel de
legtur se exprim sub forma y = f (x) + , unde am notat prin componenta aleatoare
rezidual, datorat aciunii asupra lui Y a celorlali factori dect X. Dei s-ar putea spune c
prin luarea n considerare a tuturor factorilor care influeneaz variabila Y, legtura este
intrinsec determinist, n tiinele economice vom ntlni aproape ntotdeauna un numr foarte
mare de factori, care nu pot fi identificai i cuantificai n totalitatea lor. Asfel, funcia care l
expliciteaz pe Y are dou componente: una determnist, f ( x1 , x2 ,..., xn ) , cuprinznd
variabilele cuantificabile de care depinde Y, i una aleatoare, , cuprinznd variabilele ce nu
au putut fi cuantificate.
Sudiul legturilor dintre variabile s-a dezvoltat ntr-o disciplin aparte, numit
econometrie. n capitolul de fa nu ne propunem deci dect o introducere n aceast
problematic, fr a aborda elemente de inferen statistic specifice acestor legturi. n
cele ce urmeaz vom prezenta cteva aspecte legate de variabile i fenomenele
reprezentate de acestea, probleme att de natura aparatului statistic utilizat, ct i de
aplicabilitatea lui n contextul economic.
deoarece posibilitile de prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi
parcurse n cazul variabilelor cantitative.
n studiul analizei existenei legturii vom folosi att elemente de statistic deja
abordate n capitolele anterioare, cum ar fi tabelele i graficele, ct i parametri
(coeficieni) specifici acestui capitol. Deoarece prezint particulariti distincte, vom
aborda separat problematica subcapitolului n funcie de tipul variabilelor.
3.2.1. Analiza statistic a existenei legturii pentru variabile calitative
Un prim instrument ce ne st la ndemn este tabelul de corelaie, un tabel cu dou
intrri, reprezentnd o repartiie bidimensional. Modul de construcie al unui astfel de
tabel se cunoate de la seriile statistice.
46
=
2
i =1 j =1
( N ij N ij ) 2
N ij
Y2 = Y2 / X + Y2 / X
Dac nu exist legtur, adic X nu are nici o influen asupra lui Y, mediile condiionate
Y / X vor fi identice, iar dispersia lor va fi nul: Y2 / X = 0 .
3.3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate
47
C=
2
N + 2
dac
dac
dac
dac
48
Pentru a putea utiliza acest indicator toate unitile populaiei trebuie s poat fi
ordonate n raport cu variabilele pentru care cercetm intensitatea legturii. Presupunem o
populaie de volum n observat n raport cu m variabile.
Pentru a putea construi coeficientul, vom defini mai nti indicatorul de
concordan (P) i respectiv indicatorul de discordan (Q). Pe baza indicatorilor de
concordan i discordan construim coeficientul de corelaie simpl a rangurilor al lui
Kendall, definit astfel:
P Q
P Q
=
P + Q n(n 1)
2
n( n 1)
iar Q = 0 , deci = 1 .
2
n( n 1)
deci = 1 .
2
dac
dac
dac
dac
49
=1
6 d i2
i =1
2
n(n 1)
Limitele celor doi coeficieni sunt aceleai, la fel i interpretrile valorilor numerice.
Raportul de corelaie
Y2 = Y2 / X + Y2 / X
Variana explicit Y2 / X este cu att mai mare cu ct mediile condiionate Y / X sunt mai
diferite ntre ele. Ceea ce le face s difere este numai influena lui X, deoarece am mprit
populaia n grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim variana
explicit ca o mrime absolut a intensitii legturii dintre X i Y i ponderea varianei
explicite n variana total ca o mrime relativ. Raportul de corelaie are expresia:
50
RYX =
Vexp
Vtot
= 1
Vrez
Vtot
RYX
Y2 / X
Y2 / X
=
= 1 2
Y2
Y
dac nu exist legtur ntre X i Y, mediile condiionate Y / X sunt egale ntre ele,
deci Y2 / X = 0 i RYX = 0
dac legtura este de intensitate maxim, nu exist influene ale altor factori dect
X asupra lui Y, nu exist variaie n cadrul grupelor, deci Y2 / X = 0 i RYX = 1 .
dac
dac
dac
dac
RYX
RYX
RYX
RYX
Y
Y / x4
Y / x3
Y / x2
Y / x1
51
X
52
Condiiile de minim constau n anularea celor (n+1) derivate pariale ale funciei
G (a0 , a1 ,.., an ) n raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la urmtorul sistem
de ecuaii:
G (a0 , a1 ,..., an )
= 2 M [Y (a0 + a1 X 1 + ... + an X n )] = 0
a0
a j
j = 1, n
M (a0 + a1 X 1 + ... + an X n ) = M (Y )
M (a0 + a1 X 1 + ... + an X n ) X n = M (Y ) X j
j = 1, n
de unde rezult:
a0 + a1M ( X 1 ) + ... + an M ( X n ) = M (Y )
j = 1, n
2
a0 M ( X 1 ) + a1 M ( X 1 ) + a 2 M ( X 1 X 2 ) = M (YX 1 )
2
a0 M ( X 2 ) + a1 M ( X 1 X 2 ) + a 2 M ( X 2 ) = M (YX 2 )
Prin substituia lui a 0 din prima ecuaie i nlocuirea lui n celelalte, obinem:
53
mij = M [ X i M ( X i )] [ X j M ( X j )] = M ( X i X j ) M ( X i )M ( X j )
a1 =
a2 =
m12
m21
m22
(Y ( X 1 , X 2 ) M (Y ) )
m10
m11
m20
m21
m10
m12
m20
m22
( X 1 M ( X 1 )) +
( X 2 M ( X 2 )) = 0
( 3)
m00
= m10
m
20
m01
m11
m21
m02
m12
m22
54
Pentru cazul mai general al legturii liniare dintre Y i X 1 , X 2 ,..., X n , matricea de variaie
i covariaie este:
M ( n+1)
m00
m
= 10
...
m
n0
m01 ... m0 n
m
M ( 2) = 00
m10
m01
m11
Y (X ) =
m10
m
X 1 + M (Y ) 10 M ( X 1 )
m11
m11
55
a0 = M (Y )
a1 =
m10
M ( X1)
m11
m10
X1
m11
Regresia parabolic
n economie sunt numeroase exemplele n care legtura dintre fenomene i deci
variabilele care le cuantific nu este liniar. Dac Y reprezint recolta la hectar dintr-un
produs agricol, iar X cantitatea de ngrminte, ne vom da seama chiar i intuitiv c o
anumit cretere a lui X nu provoac aceeai cretere a lui Y pe tot intervalul de variaie al
celor dou variabile. La valori mari ale cantitii de ngrminte, acestea provoac
saturaie sau chiar nocivitate, ducnd la o stagnare, respectiv diminuare a produciei. Alte
exemple pot fi: legtura dintre vechimea n munc i mrimea salariului, dintre cheltuielile
cu publicitatea i volumul vnzrilor, etc.
Determinarea parametrilor funciei parabolice de regresie se poate face fie aplicnd
direct funciei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat
anterior. n ambele cazuri vom exemplifica pentru parabola de ordinul doi.
G (a0 , a1 , a2 ) = M [Y Y ( X )]
G (a0 , a1 , a2 )
=0
a0
G (a0 , a1 , a2 )
=0
a1
G (a0 , a1 , a2 )
=0
a 2
56
[
[(
[(
]
) ]
) ]
2M Y (a0 + a1 X + a2 X 2 ) = 0
2
2M Y (a0 + a1 X + a2 X ) X = 0
2
2
2M Y (a0 + a1 X + a2 X ) X = 0
a0 + a1M ( X ) + a2 M ( X 2 ) = M (Y )
2
3
a0 M ( X ) + a1M ( X ) + a2 M ( X ) = M (YX )
2
3
4
2
a0 M ( X ) + a1M ( X ) + a2 M ( X ) = M (YX )
facem substituiile:
X = X1
X 2 = X2
dup care ecuaia devine:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2
care reprezint un model liniar cu doi factori. Elementele matricei de variaie i covariaie
vor arta astfel:
m00 = M (Y 2 ) ( M (Y )) 2 = Y2
57
m11 = M ( X 2 ) ( M ( X )) 2 = X2
m12 = M ( X 3 ) M ( X ) M ( X 2 ) = cov( X , X 2 )
m22 = M ( X 4 ) ( M ( X 2 )) 2 = X2 2
Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o
problem de regresie liniar, care se rezolv conform cazului liniar. n cazul mai general,
dac ecuaia de regresie este un polinom de gradul n:
Y ( X ) = a0 + a1 X + a2 X 2 + ... + an X n
efectund substituiile:
X = X 1 ; X 2 = X 2 ; ... ; X n = X n
58
Z ( X ) = a0 + a1 X
Regresia hiperbolic
Dac ecuaia de regresie are form hiperbolic:
Y (X ) = a + b
1
X
se face substituia:
X1 =
1
X
1
m01 = m10 = M Y M (Y ) M
X
X
1 1
m11 = M 2 M
X X
1
= cov Y ,
2
= 1 / X
Printr-o astfel de funcie se definete o legtur ntre nivelul produciei Y i factorii de care
aceasta depinde: productivitatea muncii, calificarea forei de munc, gradul de nzestrare
59
cu capital fix, etc. Determinarea parametrilor se face prin reducere la cazul liniar prin
logaritmare:
lg Y ( X 1 , X 2 ,..., X n ) = lg a + m1 lg X 1 + ... + mn lg X n
Z ( X 1 , X 2 ,..., X n ) = lg Y ( X 1 , X 2 ,..., X n )
X i ' = lg X i , i = 1, n
reducem ecuaia la una liniar multipl.
4.6. Analiza reprezentativitii funciei de regresie
Coeficientul de corelaie
Construcia lui este similar cu a raportului de corelaie, cu deosebirea c variana n
fiecare grup este calculat folosind suma patratelor abaterilor fa de valorile ajustate prin
funcia de regresie i nu fa de media grupei. Ca urmare, coeficientul de corelaie va fi
specific fiecrei funcii n parte. Expresia lui de calcul (admis aici fr demonstraie) este:
det M
rYX = 1
m00 M 00
rYX [0 ; 1]
Interpretarea acestui coeficient n funcie de valorile pe care le poate lua este urmtoarea:
- dac rYX [0 ; 0,3] funcia nu este reprezentativ pentru modelarea legturii dintre
variabile
- dac rYX (0,3 ; 0,7] funcia are o reprezentativitate medie pentru modelarea
legturii dintre variabile
- dac rYX (0,7 ; 1] funcia este foarte reprezentativ pentru modelarea legturii
dintre variabile
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienilor este bine s fie
comparate cu ale altor coeficieni, ai altor funcii. Pentru aceeai repartiie de exemplu, pentru
funciile de regresie alese ca fiind posibilecalculm coeficienii de corelaie i l reinem pe cel
mai mare, considernd acea funcie ca fiind cea mai reprezentativ.
n cazul regresiei liniare simple, formula coeficientului poate fi adus la o form
echivalent mai simpl:
m
M ( 2) = 00
m10
m01
m11
60
rYX = 1
=
m m m01 m10
det M
= 1 00 11
=
m00 M 00
m00 m11
m01
m00 m11
m01 m10
=
m00 m11
M ( XY ) M ( X ) M (Y )
Y X
rYX1 X 2 =
rYX1 rYX 2 rX 1 X 2
(1 r ) (1 r )
2
YX 2
2
X1 X 2
rYX 2 X 1 =
rYX 2 rYX 1 rX 1 X 2
(1 r ) (1 r )
2
YX 1
2
X1 X 2
rYX1 X 2 X 3 =
(1 r
2
YX 3 X 2
) (1 r
2
X1 X 3 X 2
rYX 2 X 1 X 3 =
rYX 2 X 1 rYX 3 X 1 rX 1 X 3 X 2
(1 r
2
YX 3 X 1
) (1 r
2
X 2 X 3 X1
rYX 3 X 1 X 2 =
rYX 3 X 1 rYX 2 X 1 rX 2 X 3 X 1
(1 r
2
YX 2 X 1
) (1 r
2
X 2 X 3 X1
Aceste formule ale coeficienilor de corelaie parial se pot generaliza i pentru cazul a k
variabile independente.
Probleme propuse
61
Problema 1
[ 30 ; 50 ]
( 50 ; 70 ]
( 70 ; 90 ]
Total
2
3
14
19
7
10
2
19
8
5
1
14
17
18
17
52
Se cere:
1)
Pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a funciei de
regresie.
2)
n ipoteza unei forme liniare a dependenei dintre Y i X, s se calculeze parametrii
funciei de regresie.
3)
S se studieze reprezentativitatea funciei de regresie pentru modelarea legturii dintre
cele dou variabile.
4)
Care este valoarea medie a volumului vnzrilor pentru un nivel al cheltuielilor cu
publicitatea de 55 milioane lei ?
5)
Aceleai cerine de la punctele 2, 3 i 4 pentru o form parabolic a dependenei dintre
Y i X.
Problema 2
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la
preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat sa nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
Nr.
crt.
Cerere (C)
Pre (P)
Venit (V)
15,4
1,4
620
3,2
5,1
530
4,9
2,5
490
10,5
1,7
800
8,0
1,8
630
5,1
3,4
410
62
7,6
2,1
670
11,3
1,6
920
14,0
3,6
990
10
6,4
3,5
320
11
13,2
1,9
520
12
8,8
1,8
700
13
12,1
1,9
730
Se cere:
1) S se formuleze ipoteze cu privire la forma legturii dintre cerere (C) i pre (P). Pentru
formele funciilor de regresie reinute ca fiind posibile, s se calculeze parametrii funciilor i
reprezentativitatea acestora.
2) Similar pentru legtura dintre cerere i venit.
3) S se calculeze parametrii funciei care modeleaz legtura liniar multipl dintre cerere i
factorii si e influen. Analizai reprezentativitatea acestei funcii n raport cu
reprezentativitatea funciilor de regresie simple. Care va fi valoarea estimat a cererii pe o
pia unde preul de vnzare va fi 3,2 iar venitul mediu al consumatorilor de 550 ?
63
Bibliografie:
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira,
Cluj-Napoca, 2010;
2. DROSBEKE J. J., lments de statistiques , Ed. Ellipses , Bruxelles , 1988
3. BUIGA A., DRAGOS C., LAZAR D., PARPUCEA I., TODEA A., "Statistica I", Ed.
PUC, 2003
4. GOLDFARB B. , PARDOUX C. , Introduction la mthode statistique , Ed.
Dunod , Paris , 1995
5. PY B. , Statistique descriptive , Ed. Economica , 1990
6. ROGER P. , Statistique pour la gestion , Ed. Management et socit , Caen , 2000
7. TASSI P. , Mthodes Statistiques , Ed. Economica , Paris , 1991
8. WONNACOTT T.H. , WONNACOTT R.J. , Statistique. conomie-GestionSciences-Mdecine , Ed. Economica , Paris , 1991
64
MODULUL 4
ANALIZA SI PREVIZIUNEA SERIILOR DE TIMP
Obiective
Concepte de baza
Rezultate asteptate
Studentul intelege notiunile de indice factorial, nivel mediu, indice mediu, ritm mediu si
stapaneste modalitatile de calcul a acestora. Utilizeaza metode cantitative in previziune; in
acest sens, identifica componentele prezente intr-o serie de timp, modeleaza si extrapoleaza
tendinta, utilizeaza adecvat o medie mobila, modeleaza componenta sezoniera si ciclica,
utilizeaza metoda netezirii exponentiale in netezire si previziune.
Sinteza
4.1. INDICII STATISTICI
4.1.1. Indicii statistici: definiii i tipologii
Studiul fenomenelor economice i sociale presupune n marea majoritate a cazurilor i
msurarea variaiei unor mrimi. Aceast variaie poate fi urmrit n timp, spaiu sau relativ
la nite categorii. Se va folosi termenul generic de stare, notndu-se cu j starea luat ca baz
de comparaie i cu k cea cercetat n raport cu aceasta. Se va nota cu Z mrimea care
constituie obiectul de studiu, variaia acesteia putnd fi exprimat att sub form absolut, ct
i relativ.
Dintre exprimrile sub form relativ un loc deosebit de important l ocup indicele
statistic. n practic variaia total a variabilei Z este datorat variaiei unor alte variabile a
cror evoluie ntre dou stri j i k influeneaz evoluia lui Z. Avem de a face, aadar, cu Z
de forma Z = f ( X 1 , X 2 , K , X m ) . Un astfel de model este un model de tip determinist n care
cei m factori determin n totalitate nivelul lui Z . In cazul unui astfel de model se pot
distinge trei categorii de indici:
1) indicele variaiei totale (integrale) a mrimii Z :
Z (k ) f ( X 1 (k ), X 2 (k ),K, X m (k ) )
=
Z ( j ) f ( X 1 ( j ), X 2 ( j ),K, X m ( j ) )
2) indici ai factorilor X i (individuali sau elementari):
I Zk / j =
65
I Xk i/ j =
X i (k )
X i ( j)
3) indici ai variaiei partiale ale lui Z sau indici factoriali: I Zk // Xj i - ne arat de cte ori s-a
modificat Z n starea k fa de starea j sub influena exclusiv a factorului X i .
4.1.2. Indicii factoriali
Indicii factoriali de tip Laspeyres. Acest indice este cel mai cunoscut i utilizat n practica
economic. Mai poart i denumirea de indicele preurilor. Dac se consider un co de r
r
i
i
i =1 p i ( j )
k/ j
i =1
I Z / p (L) = r
=
r
pi ( j ) q i ( j )
pi ( j )q i ( j )
i =1
i =1
k/ j
Z /q
( L) =
p ( j ) q (k )
i =1
r
p ( j )q ( j )
i =1
k/ j
Z/p
(P ) =
p ( k )q ( k )
i =1
r
p ( j )q (k )
i =1
k/ j
Z /q
( P) =
p (k )q (k )
i =1
r
p (k )q ( j )
i =1
66
Indicii factoriali de tip Fisher. In 1922, I. Fisher propune o nou expresie de calcul a
indicelui preurilor. Acesta se va obine ca o medie geometric a indicilor de pre de tip
Laspeyres i Paasche, astfel:
I Zk // pj ( F ) = I Zk // pj (L) I Zk // pj (P)
De aceeai manier se obine i indicele de volum:
I Zk // qj ( F ) = I Zk // qj ( L) I Zk // qj ( P)
Indicii factoriali generai prin Metoda Drumului Factorilor (MDF). Indicele factorial al
unei variabile Z = f ( X 1 , K , X m ) , n raport cu factorul X i , obinut prin MDF este dat de
relaia (Florea, 1989):
f ' X i ( X 1 , K, X m )
I Zk // Xj i = exp
dX i
(Pj , Pk ) f ( X 1 , K , X m )
unde
(P , P )
j
Pj ( X 1 ( j ), K , X m ( j ) ) i
80
50
20
30
40
50
110
60
25
35
40
45
Volumul valoric al ncasrilor din nchirierea camerelor (Z) se va calcula dup relaia:
3
k/ j
Z/X
(L) =
(k )Yi ( j )
( j )Yi ( j )
i =1
3
i =1
110 30 + 60 40 + 25 50
= 1,287 volumul valoric al
80 30 + 50 40 + 20 50
ncasrilor a crescut n luna k fa de luna j de 1,287 ori sub influena modificrii numrului
3
de camere nchiriate. I
k/ j
Z/X
( L) =
( j )Yi (k )
( j )Yi ( j )
i =1
3
i =1
80 35 + 50 40 + 20 45
= 1,055 volumul
80 30 + 50 40 + 20 50
valoric al ncasrilor a crescut n luna k fa de luna j de 1,055 ori sub influena modificrii
tarifului practicat.
67
Anul
t 1
Variabila
X (mld lei)
Y (mld. Lei)
10
8
12
9
4.1.3. Indicii factoriali de tip Laspeyres, Paasche i Fisher prin prisma abordrii
axiomatice
Abordarea axiomatic se bazeaz pe stabilirea unor seturi de proprieti pe care un indice
statistic trebuie s le verifice (Buiga & all, 2003).
4.1.4. Principalii indici utilizai n economie
Indicele preurilor de consum este un indice de tip Laspeyres cu bazfixa:
n
t/0
Z/p
(L) =
p (t )q (0)
i =1
n
p ( 0) q ( 0)
i =1
p i ( 0) q i ( 0)
i =1
p ( 0) q ( 0)
i =1
n
p i (t )
= k i (0) I tpi/ 0
pi (0) i =1
68
calcul utilizat i natura variabilelor luate n calcul. Cei mai cunoscui i urmrii indici
bursieri, cu excepia familiei de indici Dow Jones se calculeaza ca si indici Laspeyres.
4.2. PREVIZIUNEA SERIILOR DE TIMP
n derularea activitii lor, frecvent agenii economici sunt pui n situaia de a anticipa
viitorul, iar apoi de a lua decizii n consecin. Oamenii de afaceri sunt nevoii s previzioneze
anual cifra de afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt
interesai de profitul viitor degajat de investiie, respectiv guvernele de previziunea
consumului sau a cheltuielilor guvernamentale etc.. Obinerea rapid de previziuni utiliznd
modele cantitative de previziune este la ndemna analitilor, urmare i a softurile de statistic
accesibile i uor de exploatat.
Anticiparea, previziunea evoluiei viitoare a fenomenelor economice presupune n primul
rnd cunoaterea istoriei acestora, punerea n eviden a unor legiti privind comportamentul
lor trecut. Baza de date pe care se fundamenteaz analiza evoluiei fenomenelor n timp este
constituit din serii cronologice.
4.2.1. Indicatori medii specifici seriilor cronologice
a) Nivelul mediu (valoarea medie). Nivelul mediu reprezint nivelul teoretic atins de
indicator n condiiile n care evoluia sa ar fi constant n timp, factorii ce-i determin
evoluia ar aciona cu aceeai intensitate pe ntreaga perioad de timp analizat.
Modul de determinare a volumului fenomenului difer dup cum seria este de intervale
respectiv de momente.
Pentru serii cronologice de intervale nivelul mediu este:
y + y 2 + ... + y n
Y= 1
n
Pentru serii cronologice de momente nivelul mediu este definit de urmtoarea relaie:
Y=
tn
t1
y (t )dt
tn
t1
.
dt
T + Tn 1
T
T1
T + T2
+ y2 1
+ ... + y n 1 n 2
+ y n n 1
2
2
2
2
Y=
T1 + T2 + ... + Tn 1
relaie numit medie cronologic ponderat.
Daca nivelul indicatorului se nregistreaz la momente echidistante ( T1 = T2 = .... = Tn 1 ),
atunci relaia anterioar devine:
y1
y
+ y 2 + .... + y n 1 + n
2
Y= 2
n 1
i reprezint media cronologic simpl.
y1
69
Iy =
y
t =2
t 1
se obine
yt
y
t =2
2
t 1
I y = n 1
yn
y1
y =
( yt yt 1 ) ty/ t 1
t =2
n 1
t =2
n 1
sau echivalent:
y =
y n y1
.
n 1
Y :
y1 y 2 ... y t ... y n
n abordarea tradiional, fluctuaiile din seriile cronologice sunt privite ca o rezultant a
suprapunerii urmtoarelor componente: tendina T, componenta ciclic C, sezonier S
respectiv rezidual E. Primele trei componente sunt considerate deterministe, sistematice,
determinate de factori cu aciune continu asupra fenomenului, n timp ce componenta
rezidual are caracter aleator fiind efectul aciunii unor factori imprevizibili, accidentali.
Modelul clasic de descompunere a seriilor cronologice este de regul:
aditiv: Y = T + C + S + E sau
multiplicativ: Y = T C S E respectiv
o combinaie mixt a componentelor seriei.
Tehnicile de analiz, in acest context, au ca obiective:
- separarea fiecrei componente i modelarea comportamentului su, respectiv
70
1
t
exponenial
Tt = a b t
putere
Tt = a t b
logaritmic
Tt = a + b ln t
T = a + bX
tty/ t 1 = ty t (t 1) y t 1
1
t
Z = A + Bt
unde
Z t = ln Tt ;
tln/ ty1 = ln y t ln y t 1
unde X =
A = ln a; B = ln b
Z = A + bX
unde
Z t = ln Tt ;
A = ln a; X = ln t
T = a + bX
unde X = ln t
curba logistic
a
Tt =
,
1 + e b ct
a, c > 0
este adecvat tendina liniar atunci cnd diferenele absolute cu baza n lan
ty/ t 1 = y t y t 1 sunt aproximativ constante. De asemenea, precizri specifice n acest
sens pentru parabol, exponenial respectiv hiperbol gsim n tabelul 1.
71
b=
(t t )( y
t =1
Y)
,
(t t )
t =1
a = Y bt ,
sau echivalent
b=
M (tY ) M (t ) M (Y )
,
M (t 2 ) [ M (t )]2
a = Y bt .
Seria prezint o tendin de cretere atunci cnd b > 0 respectiv de descretere dac b < 0.
Cu excepia curbei logistice, celelalte funcii neliniare din tabelul1 pot fi aduse la o form
liniarizat prin anumite substituii, respectiv prin aplicarea operaiei de logaritmare n cazul
funciei exponeniale i a funciei putere.
10
11
12
13
14
15
16
17
18
3.7
3.8
4.1
4.3
4.5
4.8
4.9
5.1
5.3
5.5
5.6
5.8
6.0
6.2
6.3
6.5
6.6
7.0
Cronograma seriei sugereaz prezena unei tendine liniare, peste care se suprapune o
component aleatoare de amplitudine redus:
yt = a + bt + t , t = 1, 2,...,18.
Parametrii tendinei se determin din relaiile:
M (tY ) M (t ) M (Y )
b=
2
M (t 2 ) [M (t )]
a = M (Y ) bM (t ).
72
73
1 p
S j = I j / I i j = 1, 2,..., p .
p i =1
n cazul modelului aditiv
yij = TC ij + S ij + ij
determinarea componentei sezoniere decurge analog.
Exemplu. Estimarea componentelor deterministe n cazul seriilor sezoniere.
Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n
perioada 1996-2001 sunt indicate mai jos
74
An/Trim.
1996
1997
1998
1999
2000
I
124.1
130.1
157.5
169.7
177.5
II
263.2
280.2
301.2
340.0
407.6
III
252.4
260.6
353.3
350.9
417.2
IV
124.5
151.1
185.0
168.7
224.1
1
2
3
4
5
6
191.8
194.7
197.8
202.2
13
14
15
16
17
18
261.7
259.4
258.3
267.7
284.5
299.7
75
7
8
9
10
11
12
208.9
214.9
229.2
245.0
250.8
257.1
19
20
21
22
23
24
309.8
310.2
308.4
306.0
-
1
2
3
191.8 194.7 197.8
M (tZ ) M (t ) M ( Z )
b=
,
2
M (t 2 ) [M (t )]
a = M ( Z ) bM (t ).
...
...
19
308.4
20
306.0
Calcule intermediare:
M (t ) = 10.5, M ( Z ) = 252.9, M (t 2 ) = 143.5, M (tZ ) = 2884.9,
b = 6.9, a = 180.44.
Tendina produciei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin:
Tt = 180.44 + 6.9 t .
c) Estimarea componentei sezoniere prin metoda raportrii la mediile mobile
Cum amplitudinea oscilaiilor crete uor n timp, cronograma seriei sugereaz luarea n
considerare a unui model multiplicativ:
yij = Tij S j ij ; i = 1, 2,..., 6 iar j = 1, 2, 3, 4 .
Datele sunt disponibile pentru 6 ani i sunt prezente aici 4 sezoane. innd seama de
notaiile specifice, yij reprezint nivelul produciei de bere n anul i trimestrul j. Astfel, spre
exemplu y13 = y1996;III = 252.4 sau y34 = y1998;IV = 185.0 . Mediile mobile din tabelul anterior
vor fi transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim.
1996
1997
1998
1999
2000
2001
Rapoartele S ij =
y ij
y ij
I
197.8
229.2
261.7
284.5
308.4
II
202.2
245.0
259.4
299.7
306.0
III
191.8
208.9
250.8
258.3
309.8
-
tabelul urmator
An/Trim.
1996
1997
IV
194.7
214.9
257.1
267.7
310.2
-
138.6
131.6
124.7
76
63.9
70.3
1998
1999
2000
2001
Ij
68.7
64.8
62.4
65.8
65.5
122.9
131.1
136.0
125.9
130.9
140.9
135.8
134.7
133.5
71.9
63.0
72.7
68.4
Media
99.6
Sj
65.6
131.4
134.0
68.8
Media
100
77
ij =
y ij
Tij C ij S j
1 p
y h y h
p h =1
MAE =
MAPE =
1 p y h y h
p h =1 y h
Trim.
Tendin
Sezonalitate
Previziune
Producie
Eroare
III
IV
I
325.34
332.24
339.14
1.34
0.688
0.656
435.95
228.58
217.9
425.6
196.6
203.2
-10.35
-31.98
-14.7
Prezentm modul de obinere a rezultatelor anterioare pentru trim. III an 2001. Valorile
tendinei respectiv a componentei sezoniere sunt:
)
)
T (21) = 180.44 + 6.9 21 = 325.34 respectiv S 3 = 1.34.
Modelul de descompunere considerat a fost cel multiplicativ, astfel c valoarea
previzionat este:
)
y = 325.34 1.34 = 435.95
iar eroarea de previziune aferent:
)
e = 425.6 435.95 = 10.35
78
previziunile respectiv erorile de previziune pentru perioada Iulie - Decembrie 2000 sunt
indicate mai jos:
Luna
Indice y
Previziune
)
y
)
Eroare e
I
7.40
7.16
A
7.66
7.35
S
7.96
7.54
O
8.26
7.73
N
8.47
7.92
D
8.65
8.11
0.24
0.31
0.42
0.53
0.55
0.54
Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinei conduce la:
)
)
y19 = T19 =3.55 + 0.19 19 = 7.16
)
)
e19 = y19 - y19 = 0.24.
y n (h) = c (1 c) j y n j , c [0,1]
j =0
1
3.7
2
3.8
3
4.1
4
4.3
5
4.5
6
4.8
7
4.9
8
5.1
9
5.3
Luna (t)
10
11
12
13
14
15
16
17
18
Indice (yt) 5.5
5.6
5.8
6.0
6.2
6.3
6.5
6.6
7.0
Se cere: a) estimarea parametrilor tendintei liniare
b) previziunea indicelui lunar al preului produciei industriale pentru urmatoarele doua luni.
1.2. Datele de mai jos redau evoluia vnzrilor dintr-un produs pe o perioad de 10 luni
consecutive:
79
Luna
F
M
A
M
I
I
A
S
O
N
Vnzri 20 32 40 47 52 60 62 63 65 67
Se cere: estimarea parametrilor parabolei de tendinta.
1.3. Populaia Romniei a crescut n perioada 1980-1988 ntr-un ritm destul de accelerat, dup
cum arat i datele de mai jos:
An
Nr. pop.
(mil. Loc.)
1980
22.20
1981
22.35
1982
22.48
1983
22.55
1984
22.62
1985
22.72
1986
22.82
1987
22.94
1988
23.15
1991
269
1992
267
1993
256
1994
250
1995
255
1996
289
1997
283
1998
231
1999
203
2000
192
80
1991
7659
1992
7683
1993
7710
1994
7749
1995
7782
1996
7811
1997
7837
1998
7860
1999
7883
2000
7907
Produs 1
Produs 2
Produs 3
Luna k
q
p
10 kg
35
18 buc
67
5 litri
45
Se cere: indicii factoriali ai pretului respectiv ai cantitatii prin toate metodele cunoscute.
Comparati rezultatele obtinute.
Problema 6. Indicele variatiei integrale si indicii variatiilor factoriale Cunoscnd seriile
cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu studii medii
(Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive,
respectiv:
mii persoane
1
10
22,23
3,86
0,396
22,24
3,87
0,395
22,34
3,98
0,419
23,21
4,52
0,437
24,7
4,1
0,357
26,85
4,53
0,406
28,7
4,91
0,455
29,1
5,28
0,487
28,3
6,18
0,5
28,3
6,2
0,5
luna
X
Y
W
Se cere: a) Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y,
W
b) indicii exprimnd variaia integral a numrului total de omeri, calculai cu baz fix;
c) indicii factoriali de tip Laspeyres, Paasche, Fisher afereni fiecrui factor care influeneaz
numrul total de omeri, n ultima luna fa de prima luna.
Bibliografie
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira, ClujNapoca, 2010;
2. Buiga A., Dragos C., Lazar D., Parpucea I., Statistica I, Presa Universitara Clujeana, 2003.
2. Florea I., Parpucea I., Buiga A., [1998] , Statistic descriptiv. Teorie i aplicaii, Editura
Continental, Alba Iulia, 1998.
3. Florea I., Parpucea I., Buiga A., Lazar D., [2000] , Statistic inferenial, Presa
Universitar Clujean, Cluj Napoca, 2000.
4. Melard G., Methodes des prevision a court terme, Ed. de Universite de Bruxelles, 1990.
81
APLICAII
Problema 1
Considernd rata omajului ca mrime analizat notat cu Z se cere:
1. Expresia de calcul a mrimii Z n funcie de factorii de influen;
2. Avnd seriile cronologice relativ la numrul de omeri X i populaia activ notat cu Y
n 10 luni consecutive respectiv:
- numrul de omeri
2
3
4
5
6
7
8
9
10
1
X :
330 420 370 480 520 550 600 580 630 635
- populaia activ
2
3
4
5
6
7
8
9
10
1
Y :
3882 4827 4302 5485 5843 6189 6593 6304 6702 6738
redai seria cronologic aferent ratei lunare a omajului;
3. Rata de omaj medie lunar;
4. De cte ori au crescut n medie de la o lun la alta numrul de omeri;
5. Exprimarea, calcularea i interpretarea urmtorilor indici:
I Z5 //1x ( F ) ; I Z5 //1y ( F ) ; I Z5 / 1 .
1) Z (rata omajului) este influenat de numrul de omeri direct proporional i de numrul
populaiei active invers proporional.
Z=
S
X
100 = 100
Pa
Y
2
3
4
5
6
7
8
9
10
1
2) Z :
8,5 8,7 8,6 8,75 8,90 8,90 9,1 9,2 9,4 9,42
3) Seria cronologic fiind de momente, nivelul mediu se determin dup urmtoarea relaie:
1
1
Z 1 + Z 2 + Z 3 + Z 4 + Z 5 + Z 6 + Z 7 + Z 8 + Z 9 + Z 10
2
Z= 2
=
10 1
1
1
8,5 + 8,7 + 8,6 + 8,75 + 8,90 + 8,90 + 9,1 + 9,2 + 9,4 + 9,42
2
2 = 8,945
=
9
Rata de omaj medie lunar din perioada analizat este de 8,945.
4)
IX =
X (t 1) X (t ) =
[X (t 1)]
2
82
330 420+ 420 370+ 370 480+ 480 520+ 520 550+ 550 600+ 600 580+ 580 630+ 630 635
3302 + 4202 + 3702 + 4802 + 5202 + 5502 + 6002 + 5802 + 6302
5) I Z5 / 1 =
Z 5 8,9
=
= 1,047 , rata omajului a crescut de 1,047 n luna a 5-a fa de luna 1.
I 1 8,5
= 1,576
x1 3882 330
y1
x5
y
I Z5 //1x (P ) = 5 = 1,576
x1
y5
- rata omajului ar fi crescut de 1,576 datorit modificrii numrului de omeri, populaia
activ rmnnd constant;
83
Problema 2
Din mulimea autoturismelor vndute prin licitaie s-a constituit un eantion de 30 de uniti,
rezultatele observrii n raport cu variabilele X vechimea autoturismelor exprimat n ani i
y preul la care s-au vndut (n milioana lei) sunt prezentate n tabelul urmtor:
Nr. crt. X
Nr. crt.
Nr. crt. X
30
11
32
21
30
40
12
33
22
10 25
20
13
11 24
23
36
13 17
14
13 19
24
23
15 17
15
38
25
10 27
28
16
22
26
12 22
13 20
17
12
20
27
35
19 13
18
20 10
28
29
33
19
35
29
14 19
10
41
20
14 17
30
30
Se cere:
1. Elaborarea repartiiei bidimensionale tiind c numrul de intervale pentru variabila X =
4, iar lungimea unui interval pentru Y,ly = 8 intervalele fiind egale.
2. Parametrii tendinei centrale n raport cu preul de vnzare i interpretarea acestora;
3. Studierea reprezentativitii funciilor de regresie, liniar i hiperbolic i alegerea celei
mai reprezentative;
4. Pentru funcia aleas la punctul precedent calculai parametrii.
1) lungime interval =
[0;5)
X :
5
X max X min
20 0
=
=5
numar intervale
4
[10;18)
Y :
5
10
Y
[10;18)
[18;26)
[26;34)
[34;42)
TOTAL
[0;5)
[5;10)
[10;15)
[15;20)
TOTAL
1
4
5
3
7
2
12
2
7
1
10
3
3
5
10
9
6
30
84
2) Media:
R
'
Ni
14 5 + 22 10 + 30 9 + 37,5 6 785
=
= 26,26
N
30
30
- preul mediu de vnzare al mainilor este de 26,26 mii lei
1
30
rMe = N =
= 15
Mediana:
2
2
5 + 10 = rMe = 15 Me [18;26 )
15 5
8 = 26
Me = 18 +
10
jumtate din maini se vnd cu un pre mai mic de 26.000 mii lei, iar cealalt jumtate
cu un pre mai mare de 26.000.000 lei.
Y=
Y
i =1
[10 26 )
15
[26;41)
15
Modala:
max(5, 10, 9, 6) = 10 Mo [18;26)
Cele mai multe autoturisme se vnd cu un pre cuprins ntre 18.000 i 26.000 mii lei.
10 5
5
Mo = 18 +
8 = 18 +
8 = 24,66
(10 5) + (10 9)
5 +1
- cea mai mare parte a autoturismelor se vnd la un pre n jur de 24.666,666 mii lei.
3) Din tabelul de corelaie se observ c frecvenele diferite de zero sunt grupate, rezult c
ntre cele dou variabile exist legtur, ce poate fi modelat cu ajutorul funciei de regresie.
Y ( X ) = a + bx
a. Dac funcia de regresie este o drept
1
b. Dac funcia de regresie este o hiperbol Y ( X ) = a + b
x
Mai reprezentativ este funcia care are coeficientul de regresie mai mare. Ca urmare trebuie
calculat acest coeficient pentru cele dou cazuri.
M ( XY ) M ( X ) M (Y )
a. RYX =
X Y
M (Y ) = 26,26
M (X ) =
X2
[
[
1
[2,5 30 1 + 2,5 38 4 + ... + 17,5 14 3] = 216
30
216 9,33 26,26
=
= 0,836
62,86 19,1389
M ( XY ) =
RYX
]
]
1
2
2
2
2
(14 26,26 ) 5 + (22 26,26 ) 10 + (30 26,26 ) 9 + (38 26,26 ) 6 = 62,86
30
1
2
2
2
2
=
(2,5 9,33) 5 + (7,5 9,33) 12 + (12,5 9,33) 10 + (17,5 9,33) 3 = 19,1389
30
Y2 =
85
1
M Y M M (Y )
X
X
=
1 Y
b. RYX '
1 1
M = (0,4 5 + 0,13312+ 0,0810+ 0,057 3) = 0,152
X 30
1 1
2
2
2
2
(0,4 0,152) 5 + (0,133,0152) 12+ (0,08 0,152) 10+ (0,057 0,152) 3 =
X 30
= 0,013
2 =
1 1
M Y = [0,4 301+ 0,4 38 4 +...+ 0,05714 3] = 4,632
X 30
4,632 0,152 26,26
RYX ' =
= 0,7218
0,013 62,86
RYX > RYX ' , rezult c dreapta de regresie este mai reprezentativ.
4) Y ( X ) = a + bX
a + bM ( X ) = M (Y )
2
aM ( X ) + bM ( X ) = M ( XY )
a = M (Y ) bM ( X )
b=
M (X 2) =
M ( XY ) M ( X ) M (Y ) M ( XY ) M ( X ) M (Y )
=
2
X2
M ( X 2 ) [M ( X )]
1
2,52 5 + 7,52 12 + 12,52 10 + 17,52 3 = 106,25
30
b=
Y ( X ) = 40,40 1,516 X
86
Problema 3
Preul unui produs a fost observat n 30 puncte de vnzare la un moment t dat. Valorile
nregistrate sunt urmtoarele: 21; 24; 26; 30; 25,9; 26; 20; 24,2; 27; 29; 25,6; 26,3; 27; 22;
24,5; 28; 25; 27,5; 22,5; 24,7; 26,6; 23,2; 25,1; 27,5; 23; 24,8; 23,7; 25; 22,8; 23.
Se cere:
1.
2.
3.
4.
Y :
25 25,7 26 26,5 26,8 28
Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.
10
(X
R
V (X ) =
2
X
i =1
'
i
Ni
( X ) = X2 = V ( X )
87
CV ( X ) =
X
X
100
X2 =
(21 25,2)2 2 + (23 25,2)2 7 + (25 25,2)2 10+ (27 25,2)2 8 + (29 25,2)2 3 = 4,63
30
- preul se abate n medie de la valoarea medie cu 2,15.
X = X2 = 4,63 = 2,15
CV ( X ) =
X
X
100 =
2,15
100 = 0,0853 100 = 8,53% < 30% media este reprezentativ.
25,2
Ni
100 frecvena relativ
N
2
100 = 0,0667 100 = 6,67%
30
7
=
100 = 0,2333 100 = 23,33%
30
10
=
100 = 0,3333 100 = 33,33%
30
8
=
100 = 0,2667 100 = 62,67%
30
8
=
100 = 0,1 100 = 10%
30
f1 =
f2
f3
f4
f5
i = f i 360 o
1 = 24,01o
2 = 83,99 o
3 = 119,99 o
4 = 96,01o
5 = 36 o
Titlu: Stuctura punctelor de vnzare n raport cu preul
10%
6,67%
1
23,33%
26,67%
2
3
4
5
33,33%
88
Legend:
1. 6,67% din punctele de vnzare au preuri cuprinse ntre 20 i 22;
2 . 23,33% din punctele de vnzare au preuri cuprinse n intervalul [22 - 24);
3 . 33,33% din punctele de vnzare au preuri cuprinse n intervalul [24 - 26);
4 . 26,67% din punctele de vnzare au preuri cuprinse n intervalul [26 - 28);
5 . 10% din punctele de vnzare au preuri cuprinse n intervalul [28 - 30);
2
3
4
5
6
1
4) Y :
25
25
,
7
26
26
,
5
26
,
8
28
Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.
1
1
+ 25,7 + 26 + 26,5 + 26,8 + 28
2
2 = 26,33
a) Y / luna =
5
- preul mediu lunar este de 26,33
25
b) R Y = I Y 1 = I Y 100% 100%
Problema 4
Se consider un eantion de 100 gospodrii i variabilele X-numr de membrii i Y-cantitatea
de pine consumat zilnic de o gospodrie (Kg), rezultatele fiind prezentate n tabelul
urmtor:
X
TOTAL
0,25
0,5
1
1,5
TOTAL
5
5
10
30
5
35
5
15
5
25
10
20
30
5
40
30
25
100
89
Se cere:
1. cantitatea medie, median i modal de pine consumat zilnic de o gospodrie (calcul i
interpretare);
2. n ce proporie cantitatea de pine depinde de numrul de membrii;
3. analiza numeric i caracterizarea intensitii legturii ntre cele dou variabile.
1)
Y :
40 30 25
5
Y - Media
0,25 5 + 0,5 40 + 1 30 + 1,5 25 1,25 + 20 + 30 + 37,5 88,75
Y=
=
= 0,89[kg ]
=
100
100
100
Me Mediana
- variabila discret N=100
Y N + Y N
Me =
2 +1
N
= 50
2
- jumtate din gospodrii consum zilnic pine ntre 0,25 i 0,75 kg, iar cealalt jumtate ntre
0,75 i 1,5 kg de pine pe zi.
Mo Modala
- variabila discret NMo = max(N1, N2, N3, N4) NMo = 40 Mo = 0,5
- cele mai multe gospodrii consum zilnic n jur de 0,5 kg de pine.
2) Se calculeaz: rxy2 =
VTOT (Y ) =
VEXP
VTOT
(Y
r
VTOT =
i =1
100
N i.
(Y / x
J
V EXP =
j =1
N. j
90
0,25 5 + 0,5 5
= 0,35
10
0,5 30 + 1 5
Y 2 = Y / x2 =
= 0,57
35
0,5 5 + 1 15 + 1,5 5
Y 3 = Y / x3 =
=1
25
1 10 + 1,5 20
Y 4 = Y / x4 =
= 1,33
30
Y 1 = Y / x1 =
VEXP (Y ) =
V EXP
[0;1]
VTOT
2
rXY = r XY
= 0,66 = 0,81 1 legtura intens ntre cele dou variabile.
Problema 5
Cunoscnd seriile cronologice cu privire la: numrul de omeri muncitori (X), numrul de
omeri cu studii medii (Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10
luni consecutive, respectiv:
Lun
a
X
Y
W
mii persoane
10
22,2
3
3,86
0,39
6
22,2
4
3,87
0,39
5
22,3
4
3,98
0,41
9
23,2
1
4,52
0,43
7
24,7
26,8
5
4,53
0,40
6
28,7
29,1
28,3
28,3
4,91
0,45
5
5,28
0,48
7
6,18
0,5
6,2
0,5
4,1
0,35
7
91
Se cere:
1. Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y, W;
2. Seria cronologic avnd la baz numrul total de omeri din judeul Cluj;
3. Numrul mediu lunar de omeri;
4. Indicele mediu i ritmul mediu al numrului total de omeri;
5. Diferena medie absolut a numrului total de omeri;
6. Primii 4 indici exprimnd variaia integral a numrului total de omeri, calculai cu baz
fix;
7. Indicii factoriali de tip Paasche afereni fiecrui factor care influeneaz numrul total de
omeri n luna 4 fa de luna 1.
t = 1, 10
2.
Lun
a
z(t)
10
26,4
86
26,2
05
27,7
39
28,1
67
29,1
54
31,7
86
34,0
65
34,8
67
34,9
80
35,0
00
Iz =
z (t ) z(t 1)
i =1
10
[ z (t 1)]
i =1
n primele 10 luni, numrul de omeri a crescut n medie de 1,03 ori de la o lun la alta.
R z = I z 1 = 1,03 1 = 0,03 = 3%
Numrul total de omeri a crescut n medie cu 3% de la o lun la alta.
z(10) z(1)
= 0,945
9
Numrul total de omeri a crescut n medie cu 0,954 mii persoane de la un an la altul.
5. z =
92
6. I z2 / 1 =
z(2 ) 26,505
=
= 1,007
z(1) 26,486
Numrul total de omeri din judeul Cluj a crescut de 1,007 ori n luna a doua fa de prima.
z(3) 26,739
=
= 1,0095
z(1) 26,486
z(4 ) 28,167
=
=
= 1,063
z(1) 26,486
z(5) 29,154
=
=
= 1,1
z(1) 26,486
I 3z / 1 =
I 4z / 1
I 5z / 1
I z4 // 1y (P ) =
x (4 ) + y(4 ) + w (4 )
= 1,023
x (4 ) + y(1) + w (4 )
Numrul total de omeri ar fi crescut de 1,023 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri cu studii medii.
I z4 // 1w (P ) =
x (4 ) + y(4 ) + w (4 )
= 1,0014
x (1) + y(4 ) + w (1)
Problema 6
Evoluia numrului de contracte de vnzare ncheiate de o societate n zilele lucrtoare
ntr-o anumit perioad a fost urmtoarea:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23
Se cere:
1. Tendina mrimii analizate (dac se constat prezena factorilor sezonieri desezonalizai
serie).
2. Previziunea mrimii pe urmtoarele 5 zile.
93
Rezolvare:
1. Pentru a determina tendina, trebuie s reprezentm cronograma n vederea stabilirii
prezenei factorilor sezonieri:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23
30
24
25
21
21
21
23
20
22
20
22
19
15
25 24
22
23
24
23
10
5
0
1
9 10 11 12 13 14 15
Dup cum se observ din grafic, exist factori sezonieri, tendina fiind cresctoare. Deci,
variaia numrului de contracte este de forma:
y(t) = T(t) + S(t) + (t)
unde: T(t) tendina
S(t) componenta sezonier
(t) factori neeseniali
Ne organizm datele astfel:
Ziua
Spt.
II
III
IV
21
22
24
22
24
25
21
23
24
19
22
23
I
1
2
3
20
21
23
94
Ziua
Spt.
II
III
IV
21,8
23,6
20,6
22,4
23,8
20,8
22,8
-
21
23,2
-
II
III
IV
1,01
1,02
1,015
1,07
1,07
1,05
1,063
1,01
1,01
1,01
0,90
0,95
0,925
I
1
2
3
21,4
23,4
Ziua
Spt.
I
1
2
3
K
K ts =
KI =
0,98
0,98
0,98
Yts
Yts'
K 2 I + K 3I
KV =
2
.
.
.
.
K 1V + K 2V
2
3
4
5
6
7
8
9
10
11
1
Y('t ) :
20,6 20,8 21 21,4 21,8 22,4 22,8 23,2 23,4 23,6 23,8
95
25
24
23
22,8
22
23,6 23,8
22,4
21
20
23,2
23,4
21,4
20,6
21,8
20,8
19
1
10
Din grafic se observ c tendina cea mai probabil este o dreapt. Deci: T(t) = a + bt
Punnd condiia ca: M[Y(t ) T (t )] =minim, obinem:
2
a = M [ y (t ] bM (t )
a + bM (t ) = M [ y (t )]
M [ y (t ) t ] M [ y (t )] M (t )
2
2
aM (t ) + bM (t ) = M [ y (t ) t ]
b =
M (t 2 ) [M (t )]
1 + 2 + ... + 11
=6
11
12 + 2 2 + ...112
M (t 2 ) =
= 4,61
11
20,6 + 20,8 + ... + 23,8
= 22,25
M ( y (t )) =
11
1 20,6 + 2 20,8 + ... + 11 23,8
M ( y (t ) t ) =
= 137,07
11
137,07 22,25 6
b=
= 0,357
46,1 36
a = 22,25 0,357 6 = 20,108
M (t ) =
96
Problema 7
O agenie imobiliar dorete s dispun de o funcie cu ajutorul creia s poat evalua rapid
valoarea de pia a apartamentelor. Pentru aceasta, are la dispoziie o baz de date cuprinznd
30 de apartamente observate n raport cu variabilele:
Y = preul de vnzare n mii euro
X 1 = suprafaa n metri ptrai
X 2 = numrul de camere
X 3 = finisaj*nr.camere. Se calculeaz prin nmulirea gradului de finisare (0 pentru
nefinisat, 1 pentru semifinisat i 2 pentru finisat) cu numrul de camere.
97
Nr.crt.
1
2
3
4
5
6
7
8
9
10
11
X1
X2
X3
15,3
22
42,0
74
13,0
21
20,0
32
25,8
52
46,6
88
24,7
48
18,9
35
41,5
78
47,5
80
24,0
45
12
22,3
39
13
33,5
68
14
20,7
42
15
49,5
92
16
26,6
50
17
16,0
26
18
32,7
60
19
38,1
64
20
15,1
28
15,6
30
39,8
83
27,0
44
35,0
71
17,3
28
25,5
49
25,0
46
14,5
22
39,5
65
41,5
69
21
22
23
24
25
26
27
28
29
30
Se cere:
98
1) Studiai grafic existena i forma legturii dintre pre i fiecare din variabilele
dependente.
2) Calculai parametrii funciei liniare multiple dintre pre i toate variabilele explicative.
3) Este reprezentativ aceast funcie ?
4) S se fac cteva simulri ale valorii de pia a apartamentelor pentru diferite valori
ale variabilelor explicative.
5) Comparai reprezentativitatea funciei obinute cu a funciilor de regresie simple.
Rezolvare
1) Graficul care ne poate indica existena sau forma legturii este diferit n funcie de natura
variabilei explicative: discret sau continu.
a) Legtura dintre pre i suprafa. Deoarece suprafaa este o variabil continu, putem
construi norul de puncte.
50
45
40
35
30
25
20
15
10
5
0
0
20
40
60
suprafata (mp)
80
100
99
50
45
40
35
30
25
20
15
10
5
0
0
numar camere
Dac forma legturii nu pare evident prin norul de puncte se poate utiliza i un grafic care
folosete mediile condiionate, din grupe.
Procednd analog i pentru variabila rmas, concluzionm c putem modela
legturile dintre pre i fiecare din variabile prin funcii liniare.
2) Funcia de regresie liniar multipl se scrie :
Y = a1 X 1 + a 2 X 2 + a 3 X 3 +
Prin aplicarea metodei celor mai mici patrate ajungem la ecuaia scris sub form implicit :
M 00 [Y M (Y )] + M 01 [ X 1 M ( X 1 )] + M 02 [X 2 M ( X 2 )] +
+ M 03 [X 3 M ( X 3 )] = 0
M ( 4)
m00
m01
m11
m02
m12
m22
m03
m13
m23
m33
m00 = Y2 = 121,55
m01 = M (YX 1 ) M (Y ) M ( X 1 ) = 227
m02 = M (YX 2 ) M (Y ) M ( X 2 ) = 11,196
m03 = M (YX 3 ) M (Y ) M ( X 3 ) = 16,229
100
m11 = X2 1 = 443
m12 = M ( X 1 X 2 ) M ( X 1 ) M ( X 2 ) = 21,39
m13 = M ( X 1 X 3 ) M ( X 1 ) M ( X 3 ) = 23,19
m22 = X2 2 = 1,143
m23 = M ( X 2 X 3 ) M ( X 2 ) M ( X 3 ) = 1,2767
m33 = X2 3 = 5,41
M (4)
=
1,143 1,2767
5
,
41
101
RY , X1 X 2 X 3 = 1
det M ( 4)
131,75
= 1
= 0,997
m00 M 00
121,55 193,92
X 1 = 66
X2 = 3
X3 = 3
102
LUCRRI PRACTICE
LUCRAREA 1
P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare
populaie selectat precizai:
1. denumirea populaiei, a unitii statistice i volumul acesteia;
2. scopul cercetrii statistice;
3. variabilele statistice n raport cu care s-ar face observarea statistic a populaiei.
P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic
bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive,
relativ la care se cere:
8. denumirea populaiei ce a fost supus observrii i volumul acesteia;
9. unitatea statistic;
10. caracterizarea variabilelor statistice n raport cu care a fost studiat populaia;
11. caracterizarea seriei statistice n raport cu toate criteriile cunoscute;
12. elaborarea seriei bidimensionale format cu frecvene relative, interpretare;
13. extragerea repartiiilor unidimensionale marginale i a celor condiionate;
14.
pornind de la o repartiie marginal deducei celelalte serii statistice posibile,
interpretare.
P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie,
avnd la baz o variabil de spaiu, relativ la care se cere:
6. denumirea populaiei statistice i volumului ei;
7. unitatea statistic;
8. caracterizarea seriei dup toate criteriile cunoscute;
9. deducerea seriei format cu frecvene relative;
10. interpretare.
P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd
la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate
cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan
(interpretri).
P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate.
P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu
indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu
diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare.
P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul
economic.
LUCRAREA 2
Lund ca exemplu o populaie statistic studiat n raport cu un anumit numr de variabile
(stabilite n raport cu obiectivul studiului), se cere:
P1. Elaborarea tuturor seriilor statistice de repartiie unidimensionale
P2. Elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou
variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una are
la baz dou variabile cantitative)
P3. Reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur,
diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.
LUCRAREA 3
103
Considerm o populaie statistic din lucrrile anterioare observat n raport cu mai multe
variabile. Se cere:
1. Alegei dou variabile (una cantitativ, cealalt calitativ) i construii repartiia
populaiei n raport cu fiecare din ele;
2. Calculai i interpretai corespunztor parametrii tendinei centrale (valoarea medie,
median, modal) pentru seria care are la baz variabila cantitativ;
3. Analizai reprezentativitatea parametrilor tendinei centrale (sub form absolut i
relativ)
4. Folosind parametrii de structur analizai structura populaiei n raport cu variabila
cantitativ;
5. Analizai gradul de dispersare a unitilor populaiei n raport cu variabila cantitativ;
6. Caracterizai sintetic concentrarea unitilor din populaie folosind variabila
nenumeric;
7. Analiza statistic a asimetriei repartiiei de la punctul 1;
8. Analizai comparativ rezultatele obinute la punctele 5 i 6.
LUCRAREA 4
P1. Pentru o distribuie n raport cu dou variabile calitative ntre care se presupune c ar
putea exista vreo legtur, se cere :
1. Verificarea existenei legturii dintre cele dou variabile.
2. Dac legtura exist, ct de intens este aceasta ?
P2. Pentru o populaie observat n raport cu dou variabile cantitative ntre care ar putea
exista o legtur, se cere :
1. Aprecierea existenei i a intensitii legturii dintre variabile ;
2. S se formuleze pe baza unui grafic adecvat ipoteze cu privire la forma posibil a
funciei de regresie dintre ele ;
3. Pentru funciile reinute ca fiind posibile, s se calculeze parametrii ;
4. Care din aceste funcii este mai reprezentativa ?
5. Pentru funcia aleas s se fac cteva simulri ale valorilor previzionate prin
aceasta.
P3. Pentru o populaie observat n raport cu mai multe variabile, n care presupunem c una
din ele depinde de celelalte se cere :
1. Pe baza unui tip de grafic adecvat, s se stabileasc dac ar putea exista legtur
ntre variabila dependent i fiecare din celelalte variabile;
2. n ipoteza unei legturi liniare multiple, s se calculeze parametrii funciei;
3. S se stabileasc reprezentativitatea acestei funcii i s se compare cu
reprezentativitatea fiecreia dintre funciile liniare simple.
LUCRAREA 5
P1. Pentru trei produse, n dou luni consecutive se cunosc preul de vnzare i respectiv
cantitile vndute. Se cere :
1. Indicele variaiei integrale ;
2. Indicii factoriali ai preurilor i respectiv cantitilor vndute, prin metodele L, P,
F. Este verificat sau nu condiia de completitudine ?
P2. Din Anuarul Statistic al Romniei, extragei structura de consum a populaiei pentru trei
grupe de produse :
104
- mrfuri alimentare
- mrfuri nealimentare
- servicii
pentru dou luni consecutive. Se cere :
1. Indicii preurilor pe cele trei grupe ;
2. Calculai indicele preului (pe total) de tip L i P.
P3. Dac pentru un co bursier format din trei aciuni se cunoate :
- cursul fiecrei aciuni
- numrul de aciuni tranzacionate
s se calculeze indicele bursier.
Lucrarea 6
P1. Alegnd o serie cronologic din lucrarea 1, care manifest component de tendin, se
cere :
1. Diferena medie absolut, indicele mediu, ritmul mediu ;
2. Emiterea unor ipoteze privind forma tendinei ;
3. Estimarea parametrilor tendinei ;
4. Previziunea pentru urmtoarele trei perioade.
P2. Pentru o serie cronologic ce prezint component sezonier, se cere :
1. Cronograma i precizarea componentelor prezente ;
2. Calculul mediilor mobile de ordin p (p=perioada componentei sezoniere) ;
3. Calculul i interpretarea coeficienilor sezonalitii ;
4. Estimarea parametrilor tendinei ;
5. Previziuni pentru urmtoarele 4 perioade de timp.
105