Sunteți pe pagina 1din 105

UNIVERSITATEA BABE-BOLYAI, CLUJ-NAPOCA Centrul de Formare Continu i nvmnt la Distan Facultatea de tiine Economice i Gestiunea Afacerilor Specializarea: Trunchi

Comun Disciplina: Statistic Descriptiv

SUPORT DE CURS
ANUL II Semestrul 1

Cluj Napoca 2011

I. Informaii generale 1.1. Date de identificare a cursului Date de contact ale titularilor de curs: 1. Nume: Conf. univ.dr. Anua Buiga Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: anuta.buiga@econ.ubbcluj.ro 2. Nume: Conf.univ.dr. Drago Cristian Birou: Birou 231 sediul Fac. de tiine Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: cristian.dragos@econ.ubbcluj.ro 3. Nume: Conf.univ.dr. Dorina Lazr Birou: Birou 527 sediul Fac. de tiine Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: dorina.lazar@econ.ubbcluj.ro 4. Nume: Lect.univ.dr. Cristian Litan Birou: Birou 231 sediul Fac. de tiine Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: cristian.litan@econ.ubbcluj.ro 5. Nume: Lect.univ.dr. Codruta Mare Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: codruta.mare@econ.ubbcluj.ro

MODULUL 1
Concepte de baz. Obiectul statisticii. Observarea, sistematizarea i prezentarea seriilor statistice. Obiective
y y y y y y definirea unei populaii statistice, a variabilelor statistice obinerea de informaii cu privire la fenomenul supus cercetarii organizarea datelor i prezentarea acestora sub form de serii statistice evidenierea structurii populaiei n raport cu variabilele observate evidenierea evoluiei unui fenomen n timp sau spaiu reprezentarea grafic a datelor

Concepte de baz
y y y populaie statistic, unitate statistic, volum, eantion, variabil statistic, observare statistic, indicator statistic, serie statistic observare statistic, serii statistice unidimensionale i bidimensionale reprezentarea grafic a datelor relativ la o variabil cantitativ, la o variabil calitativ i la dou variabile

Rezultate ateptate
Cunoaterea i stpnirea noiunilor statistice de baz, cunoaterea tehnicilor de culegere, grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenierii variaiei unei mrimi sau a structurii populaiei supuse studiului.

Sinteza
1. Concepte de baz 1.1. Populaia statistic Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai natur, care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i populaiei privit ca un tot unitar. [Florea I.,1998] O populaie este finit dac include un numr determinat de elemente, dar ea poate fi considerat drept reprezentativ pentru o populaie teoretic infinit. Ca urmare apare necesitatea de a delimita o populaie n: coninut, spaiu i timp. Se mai denumete i populaia univers. Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate, zon etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea consumatorilor unui produs, mulimea societilor productoare sau concurente ale unui produs, mulimea societilor distribuitoare, angajaii unei societi, etc. Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc. Unitatea statistic constituie elementul component, al populaiei statistice, asupra cruia se va efectua nemijlocit observarea. 3

Unitatea statistic este purttorul originar de informaie sau subiectul logic al informaiei statistice. Datorit varietii aspectelor sub care se poate prezenta n fapt, unitatea statistic comport o definiie precis, care s exclud prin posibilitate de interpretare diferit de ctre observatori i astfel orice eroare ce poate prejudicia valoarea investigaiei. n exemplele citate mai sus, unitile statistice sunt: persoana, gospodria, consumatorul, societatea productoare sau concurent, societatea distribuitoare, angajatul etc. Se noteaz cu minusculele corespunztoare majusculei ce simbolizeaz populaia statistic, respectiv ai, bi etc.. Volumul populaiei reprezint numrul unitilor statistice care alctuiesc populaia statistic, Acesta poate fi finit sau infinit, n funcie de tipul populaiei care poate fi la fel finit sau infinit. Se noteaz cu N, iar pentru o populaie A, avem: A : {a1, a2, ..., aN} Eantion reprezint o submulime a unei populaii statistice, constituit dup criterii bine stabilite. n raport cu procedeul de formare a eantionului avem eantioane aleatoare i eantioane dirijate. Eantionul aleator este format din unitile statistice care rezult printr-un procedeu aleator: procedeul tragerii la sori, tabelul cu numere ntmpltoare, procedeul extragerilor sistematice. Eantionul dirijat este constituit pe baza unor informaii auxiliare existente la nivelul populaiei studiate sau lsnd liber pe anchetator s aleag unitile respectnd doar realizarea structurii eantionului n funcie de criteriile stabilite. Se noteaz cu n. Majoritatea studiilor au ca suport datele provenite de la nivel de eantion, de aici importana constituirii acestuia i implicit, apelarea la inferena statistic, pentru a estima parametrii la nivelul populaiei univers. 1.2. Variabila statistic Variabila statistic reprezint o nsuire sau o trstur comun tuturor unitilor unei populaii. Nivelul nregistrat de o variabil statistic la o unitate oarecare al populaiei se numete realizare sau starea variabile. [Florea I., 1998]. n general se noteaz cu majusculele de la sfritul alfabetului, X, Y, Z etc. Dac se noteaz cu X o variabil statistic oarecare, atunci cu x1, x2, ..., xN se vor nota strile variabilei respective. Variabilele statistice se clasific n raport cu natura, modul de exprimare i modul de variaie. a) Dup natura lor variabilele statistice pot fi atributive, de timp i de spaiu. y Variabila atributiv exprim un atribut sau nsuire esenial (alta, dect timpul sau spaiul) unitilor populaiei; y Variabila de timp ne arat timpul n care au luat fiin unitile populaiei sau perioada de timp n care au existat (exista); y Variabila de spaiu ne arat spaiul n care exist sau au luat natere unitile populaiei. b) Dup modul de exprimare a strilor deosebim: y Variabil cantitativ este variabila ale crei stri se exprim prin valori numerice. Se mai numete i variabil metric.

Variabil calitativ este variabila ale crei stri se exprim prin cuvinte sau coduri. Se mai numete variabil nominal (strile se exprim prin cuvinte) sau variabil ordinal (strile se exprim prin coduri). c) Dup modul de variaie variabila cantitativ poate fi: y Variabil discret este acea variabil care, n intervalul su de definiie nregistreaz cel mult valori raionale, variaia are loc n salturi. y Variabil continu este acea variabil care poate lua orice valoare real din intervalul su de variaie. Exemple de variabile statistice relativ la populaia format din mulimea consumatorilor unui produs: - vrsta: variabil atributiv, cantitativ, continu X = { x1 = [15-20) [20-30) ... } - frecvena de cumprare: variabil atributiv calitativ Y = { y1 - foarte rar; y2 rar, ... } - numr de sortimente cumprate relativ la produsul analizat: variabil atributiv, cantitativ, discret: Z = { z1 = 1; z2 = 2, ... } - localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ S = { s1 cartierul M sau s2 strada P1, ... } - data ultimei cumprri a produsului analizat: variabil de timp, cantitativ T = { t1 = 27.01.2002; t2 = 24.02.2002, ... } Variabila aleatoare Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi finite sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei, numit lege de probabilitate. Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret sau continu. n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic constituie o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare sunt probabile i n strns legtur cu un anumit experiment. Strile unei variabile statistice nu sunt probabile, ele cuantific o trstur proprie fiecrei uniti din populaie. 1.3. Observarea statistic Observarea statistic const n identificarea unitilor populaiei i nregistrarea strilor variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate prin observare se numesc statistici. Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou feluri: total i parial. Observarea total este acel tip de observare statistic n care are loc nregistrarea tuturor unitilor care fac parte din populaie statistic supus studiului. Recensmntul populaiei Romniei este un exemplu de observare total. Observarea parial presupune observarea i nregistrarea unui anumit numr de uniti din populaie, alese dup criterii bine definite. n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie statistice exhaustive rezultate prin observarea populaiei univers , fie statisticile rezultate din observarea parial a unui eantion A, n ambele cazuri scopul final fiind acelai, respectiv obinerea de informaii la nivelul populaiei univers A.

1.4. Seria statistic


Seria statistic este o construcie care red fie distribuia unei populaii n raport cu una sau mai multe variabile, fie variaia unei mrimi n timp, n spaiu sau de la o categorie la alta. Seriile statistice se clasific n raport cu mai multe criterii, astfel: 1. n raport cu numrul variabilelor y Serii statistice unidimensionale, au la baz o singur variabil; y Serii statistice multidimensionale, care au la baz dou sau mai multe variabile. 2. Dup natura variabilelor deosebim: y Serii atributi ve, care au la baz variabile atributive; y Serii cronologice (de timp sau istorice), care au la baz variabile de timp; y Serii de spaiu sau teritoriale, care au la baz o variabil de spaiu. 3. Dup modul de exprimare a strilor variabilei deosebim: y Serii calitative, care au la baz variabile calitative; y Serii cantitati ve, care au la baz variabile cantitative i care dup modul de variaie a variabilei pot fi: discrete (cnd variabila este discret) i continue (cnd variabila este continu). 4. n raport cu natura indicatorului din care este alctuit seria, avem: y Serii de frecven sau serii de distribuie (repartiie); y Serii de variaie. Seria statistic rednd distribuia populaiei n raport cu una sau mai multe variabile constituie o descompunere a acesteia ntr-un numr R de clase. O astfel de serie este format n exclusivitate din frecvene (absolute cumulate sau necumulate, relative cumulate sau necumulate) i de aceea se numesc serie de frecven, de distribuie sau de repartiie. Prescurtat se mai folosete i denumirea de repartiie statistic sau distribuie statistic. Seria statistic ce red variaia unei mrimi n timp, n spaiu sau de la o categorie la alta se numete serie de variaie. 1.4.1. Seria statistic de repartiie Conform definiiei de mai sus, prin aceast serie se distribuie unitile unei populaii statistice n raport cu una sau mai multe variabile. Fie o serie statistic unidimensional avnd la baz variabila X, respectiv: x1 X : N 1 x2 N2 ... xi ... xR ... N R (1.1)

... N i

Ni este frecvena absolut a clasei i, i ! 1, R i reprezint numrul de uniti ale populaiei din clasa pentru care variabila X a nregistrat valoarea Xi N1 + N2 + ... + NR = N. Clasa (grupa) de uniti n raport cu o variabil reunete acele uniti din cadrul populaiei care nregistreaz aceeai stare a variabilei sau strile variabilei aparinnd unui anumit interval de variaie . Ca urmare, n raport cu o variabil statistic populaia poate fi structurat ntr-un anumit numr de clase. De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X, poate fi format cu frecvene relative, frecvene cumulate absolute sau relative. Fie seria X format cu frecvene relative:

x1 X : f 1 -

x2 f2

... xi ... fi

... x R ... f R

(1.2.)

fi - ne arat ponderea unitilor din populaie care au nregistrat pentru variabila X starea xi: N fi ! i i ! 1, R N

Pornind de la seria (1.1) se poate deduce seria format cu frecvene absolute cumulate, respectiv: x2 ... xi ... xR x1 (1.3) X: N(x ) N(x ) ... N(x ) ... N(x ) 1 2 i R unde: N(xi) reprezint numrul de uniti din populaia studiat pentru care variabila nregistreaz valori ce nu depesc valoarea xi. Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative cumulate, respectiv: x2 ... xi ... xR x1 (1.4) X : F ( x ) F ( x ) ... F ( x ) ... F ( x ) N 1 N 2 N i N R unde: FN(xi) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat valori ce nu depesc valoarea xi. FN(xi) = f1 + f2 + ... + fi N ( xi ) Sau FN ( xi ) ! (.100) i ! 1, R N Seria statistic de repartiie bidimensional este o construcie ce red distribuia unei populaii n raport cu dou variabile. Astfel, fie populaia statistic A studiat n raport cu variabilele X i Y, rezultatele observrii se pot grupa ntr-un tabel de forma urmtoare: X Y y1 y2 . . yi . . yI Total unde: - Nij - reprezint numrul de uniti pentru care, variabila X nregistreaz starea xj i variabila Y nregistreaz starea yi ; - Ni. - numrul de uniti pentru care Y = yi, indiferent de nivelul nregistrat de variabila X; 7 x1 N11 N21 Ni1 NI1 N.1 x2 N12 N22 Ni2 NI2 N.2 ... ... ... ... ... ... xj N1j N2j Nij NIj N.j ... ... ... ... ... ... xJ N1J N2J NiJ NIJ N.J Total N1. N2. Ni. NI. N

(1.5)

- N.j - numrul de uniti pentru care X = xj, indiferent de nivelul nregistrat de variabila Y; - N - numrul total de uniti analizate. Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare: x1 X : N .1 y1 Y : N 1. x2 N .2 y2 ... xj ... xJ ... N . J ... yI ... N I .

... N . j ... yi

N 2. ... N i.

denumite i serii de repartiie marginale, n raport cu X i Y ... ...

y1 Y / X ! xj : N 1j

y2 N2j

yi

... N ij

yI ... N Ij

j ! 1, J Y condiionat de

denumit serie de repartiie unidimensional n raport cu X = xj, numrul acestora fiind egal cu numrul de stri a variabilei X. x1 X / Y ! yi : N i1 x2 N i .2 ... x j ... N ij ... x J ... N iJ i ! 1, I

denumit serie de repartiie unidimensional n raport cu X condiionat de Y = yi, numrul acestora fiind egal cu numrul de stri a variabilei Y. De asemenea se poate elabora sau deduce seria de repartiie bidimensional format cu frecvene relative, unde: N ij N. j N f ij ! f i. ! i. f. j ! i ! 1, I j ! 1, J N N N 1.4.2. Seria statistic de variaie Conform definiiei seria de variaie red variaia unei mrimi, n timp, n spaiu sau de la o categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o variabil de timp), serii de spaiu (au la baz o variabil de spaiu) i serii categoriale (au la baz variabile atributive). Cele mai des ntlnite sunt seriile cronologice i seriile de spaiu. Seriile de variaie au la baz mrimi absolute i relative. Dup unii autori din cadrul mrimilor absolute fac parte indicatorul de nivel i diferena absolut a unei mrimi, iar din cadrul mrimilor relative fac parte: indicatorul relativ de intensitate, indicele statistic i diferena relativ a unei mrimi. Indicatorul de nivel (Y) este o mrime ce reflect nivelul unui fenomen analizat. De exemplu: producia diferitelor produse, veniturile populaiei, suprafaa cultivat cu principalele culturi, transportul, exportul, importul etc. Diferena absolut a unei mrimi ( ( Y ) exprim diferena dintre nivelul cercetat i nivelul baz de comparaie al mrimii analizate. Se exprim n aceeai unitate de msur n care este cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la altul. 8

Indicele statistic al unei mrimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul baz de comparaie al mrimii analizate. Ne arat de cte ori se modific acea mrime, de la un nivel la altul. Diferena relativ a unei mrimi ( RY ) exprim raportul dintre diferena absolut a mrimii respective i nivelul baz de comparaie al acesteia. Ne arat cu ct la sut se modific mrimea de la un nivel la altul. Indicatorul relativ de intensitate (d) se definete ca raport ntre doi indicatori de nivel de natur diferit i arat gradul de rspndire a fenomenului cuantificat de indicatorul de la numrtor n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producia diferitelor culturi / ha, densitatea populaiei, producia principalelor produse / locuitor, rata omajului etc. Greutatea specific (g) reflect structura fenomenului analizat n raport cu strile variabile X, de la baza seriei.

Seriile cronologice
Seria cronologic reflect evoluia n timp a unei mrimi. Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s se refere la un interval de timp. Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd stocuri [Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci, instituii, fonduri fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii de activitate, unitile de cazare turistic etc. ntr-o astfel de serie nsumarea mrimii analizate nu are sens din punct de vedere al coninutului, aceasta fiind permis din considerente de calcul, ajustri etc. Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd fluxuri. De exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau produse, venituri, cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel de serie are sens nsumarea mrimii analizate. Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a nivelului unei mrimi Y, 0 1 2 ... t ... T (1.6) Y : y 0 y1 y 2 ... y t ... yT Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai sus se pot calcula cu baz fix (t / t0) (baza de comparaie rmne aceeai) sau cu baz n lan (t / t-1) (baza de comparaie se schimb, fiind considerat cea precedent nivelului comparat). Fie seriile cronologice formate cu: - diferene absolute cu baz fix: 0 1 (t y/ t 0 : 0 (1 / 0 y 2 (
2/0 y

...

t
t/0 y

...

... (

T ... (Ty/ 0

(1.7)

(t y/ 0 ! y (t )  y(0) - diferene absolute cu baz n lan

1 0 (t y/ t 1 :  (1 / 0 y

2 (
2 /1 y

... ... (

t
t / t 1 y

... ... (

T
T / T 1 y

(1.8)

(t y/ t 1 ! y (t )  y(t  1) ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii de legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd diferenele absolute cu baza n lan se obin diferenele absolute cu baza fix. (t y/ 0 ! (1y/ 0  (2y/ 1  (3y/ 2  ...  (t y/ t 1 Scznd diferenele succesive cu baz fix se obin diferenele cu baz n lan.
1 / 0 (t y/ 0  (t y ! y (t )  y (0)  y (t  1)  y (0) ! y (t )  y (t  1) ! (t y/ t 1

Diferena absolut ne arat cu ct se modific mrimea analizat de la un moment la altul. Se exprim n aceeai unitate de msur n care este cuantificat fenomenul studiat. Dac fenomenul analizat se exprim valoric, atunci diferena absolut nu reflect prea bine modificrile ce intervin, impunndu-se utilizarea mrimilor relative respective, indicele statistic i diferena relativ. Fie seriile cronologice formate cu: - indici statistici cu baz fix 2 ... t 0 1 I ty / t0 : t/0 1 / 0 2 1 I I y / 0 ... I y y
t/0 Iy !

... T /0 ... I T y

(1.9)

y (t ) ( x100) y (0)

- indici statistici cu baz n lan 0 1 2 ... ... t T t / t 1 : Iy 1 / 0 2 / 1 /  1 t t T  I ... I y ... I y / T 1 Iy y I ty / t 1 ! y (t ) ( x100) y (t  1)

(1.10)

ntre cele dou tipuri de indici exist urmtoarele relaii de legtur: y Fcnd produsul indicilor cu baz n lan pn la o anumit stare a variabilei t, se obine indicele cu baz fix al clasei respective. y(1) y(2) y (t ) y (t ) / 0 2 /1 t / t 1 t/0 . . ... . I1 ! ! ! Iy y .I y . ... .I y y(0) y (1) y (t  1) y (0) y mprind doi indici succesivi cu baz fix se obine un indice cu baz n lan: y(t ) y(t  1) y (t ) t 1 / 0 I ty / 0 : I y ! : ! ! I ty / t 1 y(0) y (0) y (t  1)

10

Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este mrimea cel mai des folosit n caracterizarea evoluiei fenomenelor din economie. Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii formate cu: - diferene relative cu baz fix 0 1 t / t0 Ry : 0 R1 / 0 y R ty / 0 ! (t y/ 0 y (0 ) ! 2 R
2/0 y

t ... t /0 ... R y

... T /0 ... R T y

(1.11)

y (t )  y (0) y (t ) t/0 ! 1 ! I y 1 y (0 ) y (0)

- diferene relative cu baz n lan 0 1 t / t 1 : Ry  R1 / 0 y R


t / t 1 y

2 R
2 /1 y

... ... R

t
t / t 1 y

... ... R

T
T / T 1 y

(1.12)

(t y/ t 1 y (t  1)

! I ty / t 1  1

sau

t / t 1 Iy .100  100

Aceast mrime la fel ca i indicele statistice, se folosete frecvent n caracterizarea fenomenelor din economie. Dac seria cronologic analizat este de intervale, se poate deduce seria format cu greutatea specific: 0 g y : g 0 g (t ) !
T

1 g1 y (t )

2 g2

...

... g t

T ... g T ...

(1.13)

y (t )
t !1

Seria statistic de spaiu (teritorial) Seria statistic de spaiu este o construcie statistic ce reflect variaia n spaiu a unei mrimi. Seria de spaiu prezint o importan din ce n ce mai mare, datorit dezvoltrii sistemului informaional, a necesitii comparaiilor internaionale i a comparaiilor ntre regiunile unei ri. n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic teritorial i Statistic internaional. n capitolul de Statistic teritorial sunt cuprinse informaii privind: populaia, fora de munc, condiii de munc, veniturile populaiei, cheltuielile i consumul populaiei, locuine, asisten social, sntate, nvmnt, cultur, sport, conturi naionale, rezultate i performane ale ntreprinderilor, agricultur, silvicultur,

11

industrie, transporturi, pot, telecomunicaii, turism, finane, justiie i starea infracional, pe cele 7 regiuni i Bucureti. La baza seriei de spaiu se gsesc att mrimi absolute (indicator de nivel, diferena absolut), ct i mrimi relative (indicator relativ de intensitate, indicele statistic, diferena relativ). Fie seria statistic Z, de forma urmtoare: s1 s 2 ... s i ... s R s0 Z : Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R) (1.14)

unde: si este o stare a variabilei ce exprim spaiul, i ! 1, R ; Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate). Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu: - diferene absolute cu baz fix: ... ... s1 s2 si sR s0 (sZ/ s0 : (1.15) 0 (s1 / s0 (s2 / s0 ... (si / s0 ... (s R / s0 Z Z Z Z
i / s0 (sZ ! Z (i )  Z (0) - indicii statistici cu baz fix ... ... s1 s2 si sR s / s0 s 0 (1.16) : IZ 0 I s1 / s0 I s2 / s0 ... I si / s0 ... I s R / s0 Z Z Z Z Z (i ) si / s0 .(100) IZ ! Z (0) - diferene relative cu baz fix s1 s2 si sR ... ... s / s0 s 0 RZ : (1.17) 0 R s1 / s0 R s2 / s0 ... R si / s0 ... R sR / s0 Z Z Z Z

si / s0 IZ !

i / s0 (sZ si / s0 ! IZ  100 Z (0 )

2. Observarea, sistematizarea i prezentarea seriilor statistice 2.1. Observarea statistic Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale, economice sau de alt natur, etap n care se culeg datele statistice despre fenomenul supus cercetrii. Cercetarea fenomenelor respective presupune cunoaterea populaiei statistice n vederea surprinderii aciunii legilor care acioneaz la nivelul acesteia. De calitatea acestei etape, ntr-un proces de cercetare statistic, depinde i calitatea rezultatelor obinute n celelalte faze. Observarea statistic presupune identificarea, urmrirea i nregistrarea, dup reguli unitare i precise, a nivelului atins de variabilele statistice studiate la unitile din care este format populaia luat n studiu[Florea I., 1998]. Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun cteva precizri. n primul rnd, observarea statistic presupune urmrirea i nregistrarea unui numr mare de uniti statistice, ceea ce implic un volum mare de munc. n al doilea rnd, pentru ca cercetarea populaiei s-i ating scopul, trebuie precizate care sunt variabilele 12

n raport cu care este studiat populaia. Variabilele statistice ce urmeaz s fie urmrite i nregistrate la nivelul fiecrei uniti din populaie, trebuie s fie eseniale i s prezinte interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii exacte pentru delimitarea corect a unitilor statistice care alctuiesc populaia. i nu n ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai multe persoane este necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea necesar datelor rezultate. Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune: specificarea unitilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor statistice care caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit, nregistrarea strilor variabilelor statistice considerate. Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme care s asigure o pregtire tiinific a observrii statistice: - delimitarea populaiei supuse observrii; - definirea unitilor statistice de observat; - timpul i locul unde va avea loc observarea; - programul observrii; - alegerea purttorilor de informaie; - pregtirea persoanelor ce urmeaz s fac observarea. Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc fiecare dintre ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia depinde corectitudinea celorlalte etape a cercetrii statistice. Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta se afl n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce caracterizeaz populaia supus studiului. Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da loc confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce trebuie nregistrate n raport cu variabilele de studiat. Stabilirea timpului i a locului unde va avea loc observarea are importan din punct de vedere a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are n statistic dou accepiuni: - momentul sau perioada la care se refer datele nregistrate (timpul de referin); - durata observrii. Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus cercetrii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o reprezint familiile etc.). n cadrul programului observrii statistice trebuie stabilite variabilele statistice care urmeaz s fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice trebuie s fie n consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse. Variabilele statistice care fac parte din programul cercetrii trebuie s surprind aspectele eseniale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i generalizarea acestora la nivelul ntregii populaii. Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a fi nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz datele din observarea unitilor statistice. Observarea statistic se poate desfura n diverse forme n raport cu: natura proceselor social-economice de studiat, obiectivul cercetrii, formele de organizare ct i posibilitile practice de urmrire i nregistrare a unitilor statistice din populaie. Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem: observarea total i observarea parial. Observarea total permite nregistrarea, n raport cu

13

variabilele statistice a tuturor unitilor statistice din populaie, implicnd un volum mare de munc, antreneaz, de obicei, un numr de persoane i dureaz mult timp. Ca urmare se creaz condiii pentru apariia de erori de observare, ceea ce va conduce la micorarea eficienei observrii. Forma cea mai frecvent de observare total o constituie recensmntul populaieiObservarea total se practic i n domeniul controlului tehnice de calitate, n cazul produselor de nalt tehnicitate , aa cum ar fi: televizoare, maini de splat, frigidere, automobile etc. Este necesar o observare total n acest caz, deoarece constatarea defeciunilor de ctre cumprtori ar implica cheltuieli mult mai mari cu remedierea acestora n comparaie cu organizarea unei observri totale a loturilor de produse ce urmeaz a fi scoase pe pia. n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative, este suficient realizarea unor observri pariale prin care s se asigure c rebuturile nu depesc un anumit procent admis. O astfel de observare, care include doar o parte din unitile populaiei supuse studiului corespunde observrii pariale. Observarea parial constituie o alternativ la observarea total n cazul populaiilor infinite sau chiar dac sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observrii pariale se pot evalua rezervele de iei, crbune sau alte minerale, se poate evalua masa de material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea parial se recomand n toate cazurile n care se consider mai avantajoas dect observarea total. Eantionul, ca rezultat al observrii pariale, presupune respectarea cu strictee a principiului reprezentativitii, n conformitate cu care fiecare unitate statistic din populaie general s aib aceeai ans de a face parte din eantion. Asigurarea respectrii principiului reprezentativitii n formarea eantionului de observat permite acestora o structur foarte apropiat cu cea a populaiilor din care sunt formate. Aceasta ne asigur, cu o anumit probabilitate dinainte fixat, c rezultatele obinute la nivelul eantionului pot fi extinse la nivelul ntregii populaii. n raport cu legea de probabilitate urmat de variabilele urmrite n populaia general sunt dou tipuri de eantioane: eantioane de volum mare i eantioane de volum redus. Observarea statistic n raport cu procedeul folosit este de dou feluri: - observarea direct; - observarea indirect. Observarea direct presupune o observare nemijlocit a unitilor din populaie, care sunt prevzute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct cu unitile statistice, fie prin msurare, fie prin interogare, dac unitile sunt persoane. Acest procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n vederea msurrii nivelelor nregistrate de variabilele considerate. Observarea indirect presupune un intermediar ntre unitile care urmeaz s fie supuse observrii i observator. Intermediarul poate fi un document special conceput n vederea observrii i atunci observarea este pe baz de document sau intermediarul poate fi o alt persoan dect observatorul, caz n care avem observare prin interogare. Suportul pentru culegerea datelor l reprezint chestionarul. 2.2. Sistematizarea i prezentarea datelor statistice Sistematizarea constituie o etap n cadrul prelucrrii datelor statistice n vederea prezentrii acestora sub form de serie statistic (tabele statistice). Datele obinute ca urmare a procesului de observare statistic, n forma lor brut, permit o caracterizare amnunit a fiecrei uniti din populaia considerat. Deoarece, datele

14

rezultate din observare se prezint sub form dezorganizat nu permit o caracterizare a populaiei n ansamblu. n vederea atingerii scopului cercetrii statistice ntreprinse i anume acela de a da o caracterizare de ansamblu a populaiei considerate este necesar ca datele rezultate din observare s fie supuse unor operaii de sistematizare i prezentare n vederea deducerii a ceea ce este esenial, tipic i general n legtur cu populaia. Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate sub forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie s fie n strns dependen cu scopul cercetrii i cu natura fenomenului cercetat. Odat precizate variabilele de la baza seriei, se tie care va fi coninutul primului ir de date i ca urmare este elucidat criteriul n raport cu care informaiile rezultate din observare vor fi ordonate, necunoscndu-se ns cum se face propriu-zis ordonarea i cum se completeaz primul ir al seriei. Operaia de stabilire a claselor presupune mprirea unitilor unei populaii n clase distincte n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit ordine. n urma unei asemenea operaii, fiecare unitate trebuie s se gseasc n una i numai una din clasele rezultate. Aceast operaie nu trebuie s conduc la pierderi de uniti, regsindu-se ns ntr-o alt ordine dect cea dup care s-a realizat observarea. Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se spune c o clas este omogen dac, pentru unitile care fac parte din ea, variabila de grupare nregistreaz variaii nesemnificative. n cele ce urmeaz se va prezenta operaia de stabilire a claselor n cazul unei serii unidimensionale. Dac la baza seriei avem o variabil calitati v, atunci clasele se stabilesc n raport cu strile acesteia. Pentru fiecare stare a variabilei se va construi o clas. Ca urmare, n acest caz, ntr-o clas vor intra toate unitile care au nregistrat aceeai stare n timpul observrii n raport cu variabila considerat. n cazul unei serii care are la baz o variabil cantitativ discret (numrul strilor nu este prea mare), clasele se stabilesc n mod asemntor ca i la variabilele calitative, respectiv: x1 x 2 ... x R X : N N ... N 1 2 R n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la baz o variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia considerat nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul strilor variabilei. Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu ajutorul intervalelor de grupare (variaie), fiecare interval cuprinznd un numr oarecare de valori ale variabilei. Ca urmare, pentru o serie continu, clasele se definesc cu ajutorul intervalelor de grupare. Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil cantitativ continu: y determinarea lungimii intervalelor de variaie; y stabilirea formei de scriere a intervalelor de variaie. Determinarea lungimii intervalelor de variaie conduce la dou situaii: y serii construire cu intervale de lungime egal; y serii construite cu intervale de lungime diferite. Stabilirea numrului de intervale de variaie trebuie s asigure satisfacerea urmtoarelor condiii:

15

informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar populaia s nu fie prea frmiat n raport cu variabilele de grupare; - media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai aproape de centrul intervalului de variaie respectiv; - s nu existe grupe vide; - reprezentarea grafic a seriei rezultate s permit conturarea unei regulariti a fenomenului de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu este posibil nici n cazul unui numr mic de intervale deoarece se pierd prea multe date, nici n cazul unui numr prea mare de intervale, populaia frmindu-se prea tare. Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport cu variabila X este normal, urmtoarea expresie: lx ! xmax  xmin 1  3,322 lg N (2.1)

(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul fiind orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n cazul n care acestea vor fi de lungime egal. n expresia de calcul a lungimii intervalelor intervine valoarea maxim i cea minim a variabilei, ct i volumul populaiei. n urma stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum urmeaz: ?xmin ; ( x min  l x ) ... ?xmin  (k  1)l x ; ( x min  kl x ) ... ?x min  ( R  1)l x ; ( xmin  R l x ) X : N1 Nk NR dac se presupune c au rezultat R intervale, unde Nk, k ! 1, R reprezint volumele claselor n care s-a structurat populaia. Numeroase sunt cazurile practice n care studiul unei populaii n raport cu o variabil sau mai multe presupune mprirea domeniilor de variaie ale acestora n intervale de lungime neegal. n asemenea cazuri nu exist o relaie de calcul n acest sens. Stabilirea intervalelor de variaie se face n direct legtur cu variaia variabilelor i distribuirea unitilor n raport cu acestea. Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative atunci clasele se stabilesc n raport cu fiecare din variabilele considerate prin strile acestora (vezi seria 1.5), avem serii bidimensionale sau multidimensionale. Nu este recomandat ca numrul variabilelor n raport cu care se studiaz populaia s fie prea mare, deoarece aceasta duce la o divizare exagerat a populaiei pierzndu-se din vedere aspectele principale. Dup ce clasele au fost definite, are loc repartizarea unitilor populaiei n clasele respective, folosind n acest scop un algoritm adecvat. Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical Analysis System), STATGRAPHICS, etc. 2.3. Reprezentri grafice Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spaiu) cu privire la forma static sau evoluia dinamic a fenomenului cuantificat de seria respectiv. 16

Graficul asociat unei serii constituie o imagine spaial a fenomenului de cercetat, permind evidenierea rapid a structurii, dinamicii i tendinei de dezvoltare a acestuia. Reprezentrile grafice sunt folosite att n scopul cunoaterii populaiei n cauz, ct i pentru popularizarea unor rezultate din diverse domenii de activitate. Elaborarea complet i corect n acelai timp a unui grafic presupune elucidarea urmtoarelor elemente: titlul graficului, scara de reprezentare, reeaua graficului, semnele convenionale i notele. Titlul graficului trebuie s fie scurt, clar i semnificativ pentru coninutul fenomenului reliefat prin seria considerat. Scara de reprezentare reunete mulimea tuturor punctelor cotate. n cazul n care variabila nregistreaz valori mici, gradarea scrii ncepe n principiu de la zero, dac variabila nregistreaz valori mari se consider o alt origine stabilit cu aproximaie. Pentru a nu ncrca prea mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un anumit interval convenabil ales. Distanele dintre dou puncte cotate consecutive se numete intervalul graficului. Cnd intervalele sunt egale atunci avem scri uniforme, n caz contrar avem scri neuniforme. Reeaua graficului permite identificarea cu uurin n plan sau n spaiu a punctelor corespunztoare valorilor nregistrate de variabilele n cauz. Sistemul axelor rectangulare (n plan sau spaiu) constituie cele mai uzuale reele n reprezentarea grafic a seriilor statistice. Semnele convenionale se pot materializa ntr-o reprezentare grafic prin inscripii, fie printr-o legend. Inscripia trebuie s fie scurt i semnificativ i plasat ct mai bine n raport cu elementul din grafic pe care l expliciteaz. Legenda se folosete pentru a explicita folosirea semnelor, culorilor sau diverselor hauri folosite n graficul n cauz. Legenda se plaseaz nafara graficului, n colul din stnga sau dreapta jos. n cazul graficelor complexe, pentru o nelegere mai bun, sunt necesare unele explicaii, care se dau sub form de note. Notele generale privesc n ansamblu graficul i se plaseaz chiar sub titlul graficului. Notele speciale privesc poriuni din grafic i sunt legate de acestea prin diverse semne de trimitere. Notele se plaseaz n partea de jos a diagramei, n colul din stnga sub reea. n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n reprezentarea seriilor statistice ce descriu fenomenele social-economice.

Histograma Graficul specific seriilor care au la baz o variabil continu (de intervale) este istograma. Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe abscis se trec intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara frecvenelor se construiete n conformitate cu respectarea principiului proporionalitii ntre frecvene i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de variaie a seriei (xi-1 xi) se construiete un dreptunghi a crui baz este chiar lungimea intervalului, iar cealalt latur se determin din condiia proporionalitii ariei dreptunghiului cu mrimea indicatorului n clasa respectiv. Latura necunoscut a dreptunghiului, notat cu Li se determin din urmtoarea relaie: Li . li = k . Ni (2.2) unde: li = latura cunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi); Li = latura necunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);

17

Ni = frecvena absolut a clasei i; k = un coeficient de proporionalitate care se alege n raport cu scara de reprezentare. Din relaia (2.2) se deduce Li: N Li ! k i , i ! 1, R li unde: li = xi - xi-1, adic diferena dintre limita superioar i cea inferioar a intervalului de variaie. Mulimea tuturor dreptunghiurilor astfel determinate, formeaz histograma ataat seriei. Poligonul frecvenelor Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv cantitativ continu i format cu frecvene absolute sau relative, simple sau cumulate. Trasarea acesteia presupune realizarea n prealabil a histogramei. Poligonul frecvenelor se obine unind prin segmente de dreapt mijloacele laturilor superioare ale dreptunghiurilor, din care este alctuit histograma. Poligonul frecvenelor este un grafic important pentru aproximarea formei distribuiei populaiei studiate, ct i pentru compararea a dou distribuii pe aceeai diagram. Exemplu Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de repartiie reprezentnd populaia Romniei sub 40 de ani pe grupe de vrst .
Grupa de vrst (ani) 04 59 10 14 15 19 20 24 25 29 30 34 35 39 Populaia 1147065 1330733 1737153 1701881 1978835 1792822 1698268 1335039

18

Distributia populatiei Romaniei sub 40 ani pe grupe de varsta

populatia
04

59

10 14

15 19

20 24

25 29

30 34

35 39

grupa de varsta (ani)

Figura 2.1 Histograma si poligonul frecventelor Diagramele de structur Punerea n eviden sub form grafic a structurii unei populaii statistice este posibil apelnd la diagramele de structur. n acest sens se prezint: dreptunghiul, ptratul, cercul i semicercul de structur. Aceste tipuri de grafice permit reprezentarea grafic a seriilor unidimensionale construite cu mrimi de structur( frecvene relative, greutate specific). Cel mai des folosit este cercul de structur denumit i diagrama sectorial (piechart). Cercul de structur Se construiete un cerc de raz oarecare a crei suprafa se consider c reprezint volumul ntregii populaii n cauz (exprimat n frecvene absolute sau relative). Fiecare clas n care este divizat populaia supus studiului este reprezentat printr-un sector de cerc de arie direct proporional cu volumul clasei. Trasarea sectorului de cerc presupune determinarea msurii n grade a unghiurilor la centru a fiecrui sector. Unghiul la centru de 360o corespunde volumului ntregii populaii. Unghiurile sectoarelor de cerc care reprezint clase din populaie trebuie s fie proporionale cu volumul acestora (exprimat n frecvene absolute sau relative). Unui procent i corespunde 3,6o cu procentul corespunztor clasei respective. 360 o Qi ! f i (%). (2.3) 100 Exemplu Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd distribuia voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie 1996:
Formaiunea Politic Voturi Obinute (%) CDR 37,0 PDSR 28,7 USD 16,1 UDMR 7,7 PRM 5,6 PUNR 4,9

19

Rezultatele alegerilor parlamentare pentru Senat din 3 nov 1996

5,60% 7,70%

4,90%

37%

16,10%

CDR PDSR USD UDMR PRM PUNR

28,70%

Figura 2.2 Cercul de structura Diagramele prin benzi (barchart) Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribuia unei populaii n raport cu o variabil cantitativ discret sau calitativ. Benzile au aceeai lime (baz), iar lungimea (nlimea) lor este direct proporional cu frecvena clasei reprezentate. Numrul benzilor este egal cu numrul claselor n care este mprit populaia studiat. De asemenea se pot lua n considerare o variabil sau dou. n reprezentri se utilizeaz benzi simple sau benzi grupate. Poziia benzilor poate fi orizontal sau vertical. Exemplu Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd nivelul PNB/loc n $ calculat pe baza puterii de cumprare n Romnia i alte ri esteuropene, n 1998
ara PNB/loc ($) Bulgaria 4683 Cehia 12197 Polonia 7543 Romnia 6153 Slovacia 9624 Ungaria 9832

20

PNB/loc ($) in 1998


14000 12197 12000 10000 8000 6000 4683 4000 2000 0 7543 6153 9624 9832

Bulgaria

Cehia

Polonia

Romnia

Slovacia

Ungaria

Figura 2.3 Diagram prin benzi simple Cronograma (historiograma) O categorie foarte important de serii o constituie seriile cronologice, a cror reprezentare grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz ntr-un sistem de axe rectangulare. Se consider seria cronologic de forma (1.7): 0 Y : y 0 1 y1 2 ... t T ... yT ...

y2 ... yt

unde: t ! 0,T , reprezint momentele (sau perioadele) de timp care se reprezint pe axa absciselor, iar mrimile yt se reprezint pe axa ordonatelor. Fiecrei perechi de valori (t, yt), t ! 0,T i corespunde un punct n planul axelor rectangulare. Unind prin segmente de dreapt punctele consecutive, astfel determinate, se obine ceea ce se numete cronogram. n acelai sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care pot fi exprimate n aceeai unitate de msur sau n uniti de msur diferite. Cronogramele asociate unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii i sesizarea perioadelor critice n evoluia acestora. Exemplu. Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd numrul total ta autoturisme nscrise n circulaie la sfritul anului n Romnia n perioada 1994-1999.

21

Anul Autoturisme nmatriculate

1994 2020017

1995 2197477

1996 2391869

1997 2605465

1998 2822254

1999 2980014

Evolutia numarului de autoturisme inscrise in circulatie in perioada 1994-1999


3500000 numar autoturisme in circulatie 3000000 2500000 2000000 1500000 1000000 500000 0 1993

1994

1995

1996 anul

1997

1998

1999

2000

Figura 2.4 Cronograma Norul statistic Norul statistic constituie o modalitate de reprezentare grafic a seriilor atributive de repartiie bidimensionale. Se consider o serie bidimensional de repartiie n raport cu variabilele discrete X i Y. n sistemul de axe rectangulare xOy se marcheaz toate punctele de coordonate (xj, yi ); i ! 1, I; j ! 1, J pentru care frecvenele Nij { 0. Mrimea acestor frecvene se poate marca pe grafic n dou moduri: - dac frecvenele sunt mici, atunci pentru fiecare punct de pe grafic (xj, yi ); i ! 1, I; j ! 1, J pentru care Nij { 0, se marcheaz attea puncte de cte ori se repet perechea respectiv. - dac ns frecvenele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame areale prin cercuri ale cror arii trebuie s fie proporionale cu rdcina ptrat a frecvenelor pe care le reprezint. n cazul n care cele dou variabile X i Y sunt continue, ntruct la intersecia a dou intervale se formeaz o rubric (csu), frecvenele diferite de zero se reprezint n interiorul acestei rubrici, fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele dou moduri de elaborare mai sus amintite. Exemplu Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:

22

Nr. Crt. Cerere (C) Pre (P)

1 15,4 1,4

2 3,2 5,1

3 4,9 2,5

4 10,5 1,7

5 8,0 1,8

6 5,1 3,4

7 7,6 2,1

8 11,3 1,6

9 14,0 3,6

10 6,4 3,5

11 13,2 1,9

12 8,8 1,8

13 12,1 1,9

18 16 14 12 cerere 10 8 6 4 2 0 0 1 2 3 pret 4 5 6

Figura 2.5 Norul de puncte n raport cu Pret i Cerere Cartograma i cartodiagrama Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor statistice de spaiu. Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaiului (sub form de hart) n interiorul cruia se manifest fenomenul care este cuantificat de seria de reprezentat. n interiorul hrii astfel realizat, prin diverse culori sau nuane ale aceleiai culori, prin hauri sau prin diferite diagrame, este evideniat intensitatea dezvoltrii fenomenului cercetat precum i mrimea indicatorilor seriei. Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spaiu, realizndu-se ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi, cerc, ptrat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de spaiu ce exprim volumul investiiilor strine pe judee, la noi n ar, se procedeaz astfel: n primul rnd se deseneaz harta Romniei, delimitndu-se judeele; n cadrul fiecrui jude se deseneaz o figur geometric oarecare convenabil aleas, a crei arie sau mrime s fie direct proporional cu volumul investiiilor strine din judeul respectiv.

Probleme propuse
P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare populaie selectat precizai: - denumirea populaiei, a unitii statistice i volumul acesteia; - scopul cercetrii statistice; - variabilele statistice n raport cu care s-ar face observarea statistic a populaiei. P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive, relativ la care se cere: 23

denumirea populaiei ce a fost supus observrii i volumul acesteia; unitatea statistic; caracterizarea variabilelor statistice n raport cu care a fost studiat populaia; caracterizarea seriei statistice n raport cu toate criteriile cunoscute; elaborarea seriei bidimensionale format cu frecvene relative, interpretare; extragerea repartiiilor unidimensionale marginale i a celor condiionate; pornind de la o repartiie marginal deducei celelalte serii statistice posibile, interpretare. P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie, avnd la baz o variabil de spaiu, relativ la care se cere: 1. denumirea populaiei statistice i volumului ei; 2. unitatea statistic; 3. caracterizarea seriei dup toate criteriile cunoscute; 4. deducerea seriei format cu frecvene relative; 5. interpretare. P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan (interpretri). P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate. P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare. P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul economic. P8. Luand ca exemplu o populaie statistic studiat n raport cu un anumit numr de variabile (stabilite n raport cu obiectivul studiului), se cere: 1. elaborarea tuturor seriilor statistice de repartiie unidimensionale 2. elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una are la baz dou variabile cantitative) 3. reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur, diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.

1. 2. 3. 4. 5. 6. 7.

Bibliografie:
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira, Cluj-Napoca, 2010; 2. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa Universitar Clujean, Cluj-Napoca, 2001; 3. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental, Cluj-Napoca, 1998.

24

MODULUL 2
PARAMETRII REPARTIIILOR EMPIRICE UNIDIMENSIONALE Obiective
y y y cunoaterea i nelegerea modului de calcul precum i a semnificaiei parametrilor statistici. ilustrarea trsturilor eseniale care caracterizeaz fenomenele social - economice cunoaterea i msurarea variaiei unei mrimi n raport cu nivelul mediu al acesteia

Concepte de baz
y y y y y valoare medie, median, modal parametrii de structur variaie, abatere medie, dispersie parametrii concentrrii asimetrie i boltire

Rezultate ateptate
Cunoaterea modului de calcul i a semnificaiei parametrilor tendinei centrale, a gradului de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaii i formularea unei concluzii privind forma distribuiei unei populaii.

Sinteza
2.1. Parametrii tendinei centrale Parametrii din aceast grup au menirea de a evidenia poziia n jurul creia se grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat printr-un numr se numete poziie central. Ea poate fi evideniat prin: - valoarea medie X ; - valoarea median M e X ; - valoarea modal M o X .

A. Valoarea medie Valoarea medie reprezint principalul parametru care caracterizeaz tendina central a unei repartiii statistice. n vederea definirii parametrului valoarea medie se consider o populaie statistic studiat n raport cu variabila cantitativ X i o funcie G(x1,x2,,xR) unde xi, i ! 1, R , reprezint strile variabilei X. Funcia G exprim o anumit nsuire esenial, un atribut al populaiei n raport cu variabila X. Aceast funcie se numete funcie determinant .

25

Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant funcia determinant, adic: G x1 , x 2 ,..., x R ! G X , X ,..., X .

(2.0)

Aceast egalitate se ntlnete sub denumirea de relaia lui BOIARSKI-KISINI. n funcie de forma analitic a funciei G, din relaia (2.0) se deduce expresia analitic (indicatorul) de calcul a valorii medii X . Determinarea, pe aceast cale, a valorii medii X , este destul de anevoioas. Utilizarea acesteia presupune stabilirea coninutului (semnificaiei) i a formei analitice a funciei determinante G, pentru fiecare caz n parte. Dar, valoarea medie X poate fi definit ca un raport a dou mrimi din care se deduce aceeai expresie pentru X ca i din (2.0). Exist, aadar, dou modaliti echivalente de definire a valorii medii, criteriul relaiei determinante a lui Boiarski-Kisini i criteriul raportului, ultima fiind mai accesibil. Criteriul raportului presupune raportarea volumului fenomenului cercetat la volumul populaiei. Acesta presupune cuantificarea volumului fenomenului n funcie de natura lui. Pentru a exemplifica cele prezentate mai sus, se consider populaia familiilor dintr-o localitate, cercetat n raport cu numrul de copii. Datele rezultate din observare se prezint ca o serie de repartiie de forma: xi X : N i i !.1, R n acest caz, funcia determinant are urmtoarea form: G x1 , x2 ,..., x R ! xi N i
i !1 R

semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de copii pe familie se particularizeaz relaia (2.0) dup cum urmeaz

xi N i ! X Ni
i !1 i !1

de unde rezult: X !

x
i !1 R i !1

Ni
i

La acelai rezultat se putea ajunge pornind de la faptul c numrul mediu de copii pe familie se poate exprima ca un raport ntre numrul total de copii i numrul de familii din localitatea respectiv, adic: X ! Nr. total de copii Nr. de familii (2.1)

n acest exemplu, fenomenul fiind de natur demografic, volumul acestuia se cuantific prin numrul total de copii la nivelul populaiei statistice considerate. Aceasta este

26

n direct concordan cu natura i semnificaia variabilei n raport cu care se face cercetarea statistic. Cunoaterea naturii parametrului valoare medie, conduce la o definiie mai complet i plin de semnificaie. Pentru a nelege semnificaia valorii medii X , trebuie subliniat faptul c, n general, variaia unui fenomen, de orice natur, i n particular variaia unei variabile X n raport cu care este cercetat o populaie, este determinat de aciunea simultan a dou categorii de factori: factori eseniali i factori neeseniali. n categoria factorilor eseniali intr acei factori care acioneaz asupra tuturor unitilor populaiei n mod continuu i n acelai sens, determinnd, n principal, nivelul de dezvoltare a variabilei pentru fiecare unitate component din populaie. Factorii eseniali se conjug n aciunea lor cu factorii neeseniali, care, n general, au un caracter aleator, sunt numeroi i neuniform rspndii printre unitile populaiei. Fiecare din factorii considerai neeseniali acioneaz numai asupra unui anumit numr de uniti din populaie. Ca urmare, acetia pot contribiu fie la creterea nivelului variabilei (pentru unele uniti din populaie), fie la scderea nivelului variabilei (pentru alte uniti din populaie). La rndul lor factorii eseniali nu acioneaz cu aceeai intensitate asupra tuturor unitilor din cadrul populaie considerate, determinnd, n acest fel, variaia neuniform a variabilei respective n cadrul populaiei. n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a unei serii statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea nregistra variabila n cadrul populaiei cercetate n condiiile n care factorii neeseniali nu sar fi manifestat, iar factorii eseniali ar fi acionat asupra unitilor din populaie cu aceeai intensitate. Parametrul valoarea medie, calculat pentru o serie statistic, pune n eviden ceea ce este comun, general i esenial sub aspectul nivelului de dezvoltare al variabilei, n raport cu care este studiat o populaie. n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a indicatorilor cu care aceasta este construit, exist mai multe posibiliti de calcul a valorii medii. Funcia determinat G, sub forma sa cea mai general, are urmtoarea expresie analitic:
1

R K K G x1 , x 2 ,..., x R ! xi f i i !1

(2.2)

Pentru diverse valori ale lui k, n strict concordan cu coninutul i semnificaia funciei G, se ntlnesc mai multe tipuri de medii: - media armonic (k = -1); - media aritmetic (k = 1); - media ptratic (k = 2); - media cubic (k = 3); - media de ordinul k n general. n caz concret, valoarea medie real X este aceea care se obine prin indicatorul (mediu) rezultat fie prin aplicarea criteriului relaiei determinante, fie criteriului raportului. Modaliti de calcul a valorii medii

27

1. Media aritmetic Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii statistice, aa cum rezult din practica statistic. Se consider acum dou serii statistice de repartiie, una format din frecvene absolute, iar cealalt din frecvene relative: xi X : N i i !.1, R xi X : f i i !.1, R

(2.3)

(2.4)

Media aritmetic pt cele dou serii se calculeaz astfel: xi N i ; X ! xi f i Nj Dac seria este de intevale, construit cu frecvene absolute avem:
X!

xi .N i N j Fie o serie de repartiie, care are la baz o variabil continu X, respectiv,


X!

'

xi 1  xi X : f i i !.1, R xi  xi 1 ! xi' 2 unde x i' reprezint mijlocul intervalului i, obinem relaia: Folosind notaiile: X ! xi' f i
i !1 R

Relaia ne arat c media aritmetic a unei serii de intervale se reduce la media aritmetic a unei serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de variaie.

2. Media armonic Se consider o serie de forma: 28

xi X : N i i !1, R

(2.5)

n cazul unei serii discrete de forma (2.5), media armonic notat cu X 1 se definete prin:

X 1 !

N
i !1

i !1

1 Ni xi

(2.6)

numit i formula mediei armonice ponderate. Dac ponderile sunt egale ntre ele, adic N1=N2==NR=N*, atunci relaia (2.6) devine:
R

X 1 !

N
i !1 R

1 N* x i !1 i

i !1

1 xi

(2.7)

care reprezint formula mediei armonice simple. n cazul unei serii care are la baz o variabil continu X, respectiv, xi 1  xi X : N i i !1, R procednd ca la media aritmetic, pentru media armonic rezult:

X 1 !

N
i !1 R

1 Ni ' i !1 x i

(2.8)

unde xi reprezint mijlocul intervalului i, i ! 1, R . i n acest caz, dac ponderile sunt egale, se obine relaia de calcul a mediei armonice simple, de forma: X 1 ! R

x
i !1

1
' i

3. Media geometric Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media geometric notat cu X g (sau X o ) este definit prin expresia:
N2 NR X g ! N x1N1 x2 ...xR

(2.9)

Din (2.9), pentru media geometric ponderat exprimat cu frecvene relative se deduce:

29

Xg !

N1

x 2 ... x R

N2

NR

R Ni ! xi i !1

1/ N

! xi
i !1

Ni / N

! xi i
f i !1

(2.10)

Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru diversele variante de medie geometric, rmn variabile cu singura modificare c valorile xi, i ! 1, R , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei: xi' ! xi 1  xi , 2 i ! 1, R (2.11)

B. Valoarea median Valoarea median, notat cu M e este acea valoare a variabilei cantitative X care mparte repartiia n dou pri egale, respectiv: FN (M e ) ! 1 / 2 sau N (M e ) ! N 2 (2.12)

Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau continu. Pentru o repartiie discret , calculul medianei nu implic probleme deosebite i nici un volum mare de calcule. Se consider o repartiie cu frecvene absolute: x1 x2 ... xi ... xR X : . N N ... N ... N 2 1 i R a) volumul N al populaiei este un numr impar; b) volumul N al populaiei este un numr par. n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului medianei, notat cu rM e , conform urmtoarei relaii: rM e ! 1 R N i ! N (M e ) 2 i !1 (2.14) (2.13)

n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:

a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a N crui parte ntreag indic numrul de uniti din populaie pentru care variabila X a 2 nregistrat valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat N urmtoare celei de rang adic: 2 M e ! x N
1 2

(2.15)

30

b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci se gsesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora. Relaia de calcul a medianei, n acest caz, este: x N  x N Me !
2 2 1

(2.16)

Pentru o repartiie conti nu, calculul valorii mediane presupune verificarea egalitii (2.12) i ca urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat. Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit un volum redus de calcule. Pentru acesta se consider o repartiie continu n raport cu variabila X, i anume: x 0  x1 x1  x 2 ... x i 1  x i ... x R 1  x R . X : N ... ... N2 Ni NR 1 (2.17)

unde intervalele xi-1-xi, i ! 1, R pot fi de lungime egal sau neegal. Calcularea rangului medianei va permite stabilirea intervalului n care se afl valoarea median, interval numit i interval median. Se cumuleaz frecvenele absolute din aproape n aproape pn ce este ndeplinit inegalitatea: N 1  N 2  ...  N i u 1 N 2

Ultima frecven Ni cumulat, ne permite s indicm intervalul median ?x i 1  x i . Formula aproximativ de calcul a medianei: N (M e )  N ( xi 1 ) xi  xi 1 Ni

M e ! xi 1 

(2.18)

xi 1 ! xM e Ni ! N M e

- limita inferioar a intervalului median; - frecvena absolut a intervalului median;

xi  xi 1 ! lM e - lungimea intervalului median, C. Valoare modal Valoarea modal Mo (X) a unei repartiii reprezint aceea valoare a variabilei X creia i corespunde frecvena cea mai mare. Acest parametru se mai numete modul, valoare dominant, sau mod se noteaz cu Mo. Mod de calcul: 31

a)

Pentru o serie de repartiie discret, dat sub forma x1 x 2 ... x i ... x R X : . f f ... f ... f 1 2 i R

(2.19)

valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru care frecvena este cea mai mare. b) Pentru serii de repartiie continue, respectiv:
x 0  x1 x1  x 2 ... x i  2  x i 1 x i 1  x i X : f f2 f i 1 fi ... 1 x i  x i 1 ... x R 1  x R f i 1 fR ...
(2.20)

Modala nu poate fi determinat direct. Intervalul cruia i corespunde frecvena cea mai mare, se numete intervalul modal i va conine modala. S presupunem c intervalul modal este xi-1-xi. Formula de calcul a modalei: M o x ! x M o  unde: Mo xMo - reprezint valoarea modal; - reprezint limita inferioar a intervalului modal; ( 1 lMo ( 1  ( 1 (2.21)

- reprezint diferena dintre frecvena intervalului modal i frecvena intervalului ( 1 precedent; ( 1 - reprezint diferena dintre frecvena intervalului modal i frecvena urmtor; lMo - reprezint lungimea intervalului modal. intervalului

O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o serie are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal evideniaz faptul c populaia n cauz este neomogen. Calculul valorii modale, n asemenea cazuri, presupune o delimitare mai riguroas a obiectului observrii ct i a populaiei care urmeaz s fie studiat. O alt cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc., pn se ajunge la o serie unimodal. n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana. Pentru serii uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri: Mo ! X  3 X  Me

unde X este media aritmetic a variabilei X. 32

Calculul valorii modale reprezint un deosebit interes pentru activitatea practic. Avnd n vedere c semnificaia acestui parametru indic acea valoare a variabilei nregistrat de cele mai multe uniti din populaie se poate afla: ora la care sunt solicitate cele mai multe convorbiri telefonice, ora de vrf privind transportul n comun, mrimea cea mai solicitat la nclminte etc. Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea medie se bucur de o mai mare reprezentativitate. Dac, n plus, avem M e ! M o ! X , innd seama c valoarea median nu este influenat de valorile extreme ale variabilei, se poate afirma c mediana reprezint un grad de reprezentativitate mai mare dect valoarea medie. 2.2. Parametrii de structur Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o variabil sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea structurii unei populaii poart denumirea de valori quantile. Valorile quantile ale unei serii de repartiie unidimensionale sunt acele mrimi nregistrate de variabila X, care mpart seria n n pri egale (mai precis mparte populaia n n pri egale). n acest caz se vor calcula p quantile (p = n-1). Pentru o serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea egalitate este satisfcut de cele p quantile:
q1

x1

f ( x)dx ! f ( x)dx ! ... !


q1

q2

xR

f ( x)dx !

q n 1

1 n

(2.22)

unde cele n-1 quantile s-au notat cu q1, q2, , qn-1. Relaia (2.22) se particularizeaz pentru cazul seriilor discrete, cnd seria este construit cu frecvene relative:

f ! f
i x1 q1

q1

q2

! ... ! f i !
q n 1

xR

1 n

(2.23)

Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel: FN q p ! p N 1 sau N (q p ) ! p ,  p ! 1, n - 1 n n

Modul de calcul a valorilor quantile difer n raport cu tipul seriei. Fie o serie de repartiie, care are la baz o vari abil X discret, de urmtoarea form: x1 x2 ... xi ... xR X : . N N ... N ... N 2 1 i R (2.24)

Pentru calculul valorii quantile de ordinul p ( p ! 1, n  1) , n prima etap trebuie determinat rangul acesteia:

33

rq p ! N (q p ) ! p Se disting dou cazuri:

N n

(2.25)

a) dac pN se divide cu n atunci quantila de ordin p se calculeaz ca o medie aritmetic simpl a valorilor variabilei X, de ordinul rangului i al rangului majorat cu o unitate, dup cum urmeaz: qp ! x rq p  x ( rq p 1) 2 (2.26)

b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei X corespunztoare pari ntregi a rangului majorat cu 1: q p ! x[ rq (2.27)

1]

n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1 quantile trebuie s satisfac relaia (2.22). Determinarea quantilelor din asemenea egaliti ar presupune cunoaterea densitii de probabilitate f(x). Ori n activitatea practic f(x) se aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule. n vederea gsirii unor formule aproximative de calcul a quantilei de ordin p ( p ! 1, n  1) se consider o serie de variaie continu, ale crei intervale de variaie nu trebuie s fie neaprat egale ca lungime: x 0  x1 x1  x 2 ... x i 1  x i ... x R 1  x R . X : N ... ... N2 Ni NR 1 (2.28)

n prima etap se determin rangul quantilei de ordinul p ( p ! 1, n  1) conform urmtoarei relaii: 1 R rq p ! N (q p ) ! p N i n i !1 (2.29)

Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i intervalul quantilei de ordinul p ( p ! 1, n  1) . Cumulnd frecvenele pe clase pn la egalarea s-au depirea rangului, conform inegalitii: 1 R N 1  N 2  ...  N i u p N i n i !1 (2.29)

ultima frecven adunat va corespunde intervalului quantilei de ordinul p ( p ! 1, n  1) . Prin urmare, quantila de ordinul p, qp, se calculeaz conform relaiei: q p ! x i 1  N (q p )  N ( x i 1 ) Ni ( x i  x i 1 ) (2.30)

34

x q p ! x i 1 - reprezentnd limita inferioar a intervalului quantilei de ordinul p; l q p ! x i  x i 1 - reprezint lungimea intervalului quantilei de ordinul p; N q p ! N i - reprezint frecvena absolut a intervalului quantilei qp,

Procedeul de determinare a quantilei de ordinul p ! 1, n  1 este acelai i n cazul n care seria (2.28) este format din frecvene relative. Caracterizarea structurii unei serii se poate face utiliznd diverse cazuri particulare de valori quantile. Valoarea medi an (Me) este i un parametru de structur obinndu-se ca un caz particular de quantil, cnd n=2. Dac pentru o serie se cunoate Me (quantila de ordinul 2), atunci structura populaiei poate fi redat astfel: X min  M e X : 50% M e  xmax 50% (2.31)

semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X valori cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X. Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4. Cele trei quartile, care se obin, notate: Q1, Q2 i Q3 sunt acei parametri de structur care mpart populaia n patru pri egale. n raport cu mediana, quartila nti Q1, se numete quartila mic (inferioar), quartila a doua Q2 coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q3 se numete quartila mare (superioar). Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n raport cu variabila X: xmin  Q1 X : 25% Q1  Q2 25% Q2  Q3 25% Q3  X max 25% (2.32)

ceea ce semnific o structurare a populaiei supus studiului n patru pari egale. Aceasta nseamn c 25% din unitile popupaiei nregistreaz valori pentru variabila X mai mici dect quartila mic, 25% din unitile populaiei nregistreaz valori, n raport cu aceeai variabil X, cuprinse ntre quartila mic i cea mijlocie, 25% vor avea valori cuprinse ntre quartila mijlocie i quartila mare, iar restul 25% din unitile populaiei vor avea valorile pentru variabila X cuprinse ntre quartila mare i valoarea maxim a lui X.

2.3. Parametrii variaiei Studiul unor populaii statistice prezint importan numai din punct de vedere al unor mrimi care variaz de la o unitatea la alta sau de la un grup de uniti la altul.

35

Valorile nregistrate de o variabil cantitativ, n raport cu care este studiat o populaie, se datoresc aciunii diferiilor factori eseniali i neeseniali. Intensitatea diferit cu care se pot manifesta factorii eseniali ct i sensul contrar cu care pot aciona factorii neeseniali n raport cu fiecare unitate, provoac nivele diferite nregistrate de variabile n raport cu care este studiat populaia. Problema msurrii variaiei unei variabile cantitative este important pentru a vedea n ce msur valoarea medie a acesteia poate reprezenta ntrega populaie. Dac abaterile de la valoarea medie sunt neeseniale atunci se poate afirma c populaia este omogen i c acest parametru poate reprezenta tendina central, iar dac aceste abateri sunt mari atunci populaia este eterogen i valoarea medie nu are capacitatea de a reprezenta populaia. Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri, parametrul valoarea median poate s-i ia locul. Aceeai problem se pune i n acest caz, de a vedea n ce msur valoarea median este sau nu reprezentativ pentru populaia n cauz. O alt problem care nu se poate rezolva fr a studia i msura variaia nregistrat de o variabil n raport cu care este studiat o populaie, o constituie verificarea de ipoteze. n activitatea practic, de multe ori pornind de la valorile unor parametrii calculai pe baza datelor culese relativ la un numr mic de uniti, este necesar a fi extini la nivelul ntregii populaii sau de a se verifica anumite ipoteze statistice. Parametrii variaiei se pot calcula att sub form absolut ct i relativ, i msoar mprtierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea median. Ca urmare, n funcie de elementul de referin folosit n msurarea variaiei, deosebim: parametrii variaiei n raport cu valoarea medie; parametrii variaiei n raport cu valoarea median.

2.3.1. Parametrii variaiei n raport cu valoarea medie Abaterea medie liniar Abaterea medie liniar, notat cu d x , reprezint media aritmetic a abaterilor variabilei X de la valoarea medie a acesteia, luate n valoare absolut: dx ! M X  X Relaia (2.33) se particularizeaz n : (2.33)

dx !

x
i !1

i R

 X Ni (2.34)
i

N
i !1

Dac seria are la baz o variabil continu i se cunoate f(x), atunci abaterea medie liniar se calculeaz astfel:

36

xR

dx !

x1

x  X f ( x)dx

(2.35)

Densitatea de probabilitate f(x) se poate aproxima cu densitatea empiric i atunci pentru abaterea medie liniar se pot obine relaii de calcul aproximativ, frecvent utilizate n activitatea practic, de forma:

dx !

x
i !1

'
i

 X Ni
R

Ni
i !1

sau

d x ! x 'i  X fi
i !1

(2.36)

dup cum seria n cauz este format cu frecvene absolute sau relative, unde: x i' ! x i 1  x i , i ! 1, R 2

este mijlocul intervalului i. Acest parametru servete caracterizrii sintetice a gradului de reprezentativitate a valorii medii, artnd cu ct se abate n medie orice valoare a variabilei X de la valoarea medie X , ntr-un sens sau altul. Sub forma relativ, acest indicator poart denumirea de coeficient simplu de variaie i se calculeaz conform relaiei: Vx ! dx X 100 (2.37)

Coeficientul simplu de variaie (Vx) arat cu ct se abate n medie orice valoare a variabilei X de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea valoare medie pentru care coeficientul simplu de variaie este mai mic. Parametrul abaterea medie liniar, n forma absolut sau relativ, prezint unele deficiene deoarece nu este suficient de sensibil la abaterile mici, adugndu-se i unele inconveniente de natur teoretic, generate de exprimarea abaterilor n valoarea absolut. nlturarea acestor deficiene se poate realiza apelnd la un nou parametru privind msurarea variaiei, numit abatarea medi e ptratic. Abaterea medie ptratic Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii medii ct i n scopul estimrii unor parametri necunoscui. Abaterea medie ptratic, notat cu x , se definete ca fiind media ptratic a abaterilor valorilor variabilei X, de la valoarea medie X , adic: W x ! M (X  X )2 (2.38)

Un calcul intermediar n aflarea acestui parametru, l constituie calcularea ptratului abaterii medii ptratice, care se numete dispersie sau varian i are urmtoarea expresie de calcul: 37

2 Wx ! M (X  X )2 ! D 2 (X )

(2.39)

V(x) reprezint o alt notaie pentru varian, pe lng 2x . Variana fiind un calcul intermediar n aflarea abaterii medii ptratice, n cele ce urmeaz se va prezenta modul de calcul al acesteia. Relaia de calcul a varianei se particularizeaz n raport cu tipul seriei. n cazul unei serii care are la baz o variabil X discret, conform definiiei, variana are expresia:

2 Wx !

(x
i !1

 X )2 Ni
R

(2.40)
i

N
i !1

n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform urmtoarei relaii:
xR 2 Wx !

x1

x  X f ( x) dx
2

(2.41)

a crei aplicare presupune cunoaterea densitii de repartiie f(x). Pentru o serie dat, variana calculat nu are interpretare, dar dac se extrage rdcina ptrat din acesta se obine un numr care se exprim n aceleai uniti de msur ca i variabila de la baza seriei. Acest numr (valoare) reprezint abaterea medie ptratic, simboliznd cu ct se abate n medie n plus sau minus orice valoare xi a variabilei X de la valoarea medie X . Parametrul abaterea medie ptratic se poate exprima i sub form relativ, caz n care se numete coeficientul de variaie a lui Pearson, i se noteaz cu Vx. Expresia de calcul este: Vx ! Wx X 100 (2.42)

i reprezint abaterea medie a orcrei valori a variabilei X de la valoarea medie, considerat egal cu 1 sau 100. Coeficientul de variaie a lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit n aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate. Deoarece gradul de reprezentativitate a valorii medii este n raport invers cu mrimea coeficientului de variaie a lui Pearson, se poate afirma, n cazul mai multor serii, c este mai reprezentativ valoarea medie a acelei serii pentru care Vx este mai mic. n concluzie, trebuie reinut c parametrul abaterea medie ptratic sub form absolut x i sub form relativ Vx sunt indicatori fundamentali utilizai n msurarea variaiei unei variabile. Att abaterea medie liniar, ct i abaterea medie ptratic constituie o msur a variaiei medii, primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x e W x ) . 2.3.2. Parametrii variaiei n raport cu valoarea median Abaterea interquartil

38

Abaterea interquartil, prin definiie, este media aritmetic simpl a segmentelor Me Q1 i Q3 Me, respectiv: Q! M e  Q1  Q3  M e Q3  Q1 ! 2 2 (2.43)

i arat cu ct se abat n medie, n plus sau n minus, de la median, cele 50% din valorile variabilei cuprinse ntre Q1 i Q3. Forma relativ a acestui indicator notat cu Qr : Qr ! Q Q  Q1 100 ! 3 100 Me 2 Me (2.44)

se numete coeficient de variaie i nterquartilic i arat cu ct se abat n medie de la median (considerat egal cu 100), valorile variabilei nregistrate pentru cele 50% din unitile populaiei cuprinse ntre Q1 i Q3. Ca atare, se apreciaz c mprtierea unitilor n cadrul populaiei studiate este cu att mai mare, n raport cu variabila de studiat, cu ct abaterea interquartil n valoarea absolut (2.43) sau relativ (2.44) este mai mare. Abaterea interquantil Pentru acest parametru, sub form absolut, avem: q! qn 1  M e  M e  q1 qn 1  q1 ! 2 2 q q q 100 ! n 1 1 100 Me 2 Me (2.45)

iar sub form relativ denumit i coeficient de variaie interquantilic este: qr ! (2.46)

Cu ct abaterea interquantilic (relativ sau absolut) este mai mic, cu att valoarea median este mai reprezentativ. 2.4. Parametrii concentrrii Energia informaional Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiie: E ! fi2
i !1 R

unde s-a notat cu E energia informaional. Este un parametru utilizat n cazul n care seria are la baz o variant nenumeric.

39

n cazul unei populaii caracterizat de un grad de concentrare maxim, va exista o clas care va avea frecvena relativ egal cu 1, iar celelalte vor avea frecvenele relative 0 i ca urmare: Emax = 1. Dac populaia este caracterizat de o concentrare minim, atunci: x2 ... xR x1 X : 1 / R 1 / R ... 1 / R iar Emin ! R Se observ c: 1 e E e1 R Forma relativ a acestui parametru, notat cu Er, se deduce astfel: 1 E R ! Er ! 1 1 R de unde: 0 e Er e 1 Referitor la populaia dat, studiat n raport cu o variabil X, se calculeaz Er, iar dac: - Er se apropie de 1, atunci populaia respectiv este caracterizat de un grad nalt de concentrare; - Er se apropie de 0, populaia n cauz se caracterizeaz printr-o concentrare minim. 2.5. Parametrii formei Din aplicaiile practice, precum i din alte surse, s-au constatat c graficele pot avea diverse forme, dintre care: form de coplot, form de U, J, L sau alte forme. Ceea ce prezint importan, nefiind surprins de nici un parametru prezentat, l constituie modul de repartizare a valorilor variabilei de o parte i de alta a valorii medii, considerat i centrul de greutate a seriei. Acest lucru nu nseamn altceva dect evidenierea acelei curbe care aproximeaz cel mai bine conturul poligonal al seriei respective i n acelai timp o imagine mai clar asupra gradului de reprezentativitate a valorii medii. n marea majoritate a cazurilor, distribuia unitilor unei populaii se face dup un clopot (dup legea normal a lui Gauss). Dar unittile nu se distribuie uniform n jurul valorii medii, ceea ce poate conduce la nclinaii ntr-o direcie sau alta a valorii medii. Aceast distribuire neuniform poate conduce la cazul cnd diferite serii (diferit distribuite n jurul valorii medii) s aib aceeai medie, acelai i totui o curb s fie mai aplatizat dect cealalt, simetric sau mai puin simetric. Evidenierea acestor diferene poate fi realizat cu ajutorul parametrilor formei. Parametrii formei unei serii de repartiie, dup coninut, se clasific n dou grupe:
R

1 1 ! 2 R R

f
i !1

2 i

 1 R

1 R

1

40

parametrii asimetriei; parametrii boltirii.

2.5.1. Parametrii asimetriei Asimetria unei serii se definete n raport cu dispunerea unitilor ntr-o parte sau alta a valorii medii. n acest sens, o serie de repartiie este simetric n raport cu media sa dac frecvenele valorilor variabilei X egal deprtate de valoarea medie sunt egale ntre ele, adic: f X H ! f X H

oricare ar fi astfel nct X  H i X  H s se afle printre valorile lui X. Coeficientul de asimetrie al lui Fisher Acest parametru se noteaz cu 3, iar expresia sa de calcul este:

M XX E3 ! 3 WX sau ntr-o form echivalent: E3 !

(2.47)

X  X M
M XX
3 2

Calculnd valoarea acestui parametru, n funcie de semnul ei, avem urmtoarele cazuri: 1. 3 = 0, ceea ce nseamn c M X  X = 0, adic suma tuturor abaterilor cu semnul minus este egal cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare n acest caz se poate spune c seria este simetric. 2. 3 > 0, ceea ce nseamn c M X  X > 0. Aceasta este echivalent cu faptul c pe total suma abaterilor cu semnul plus de la valoarea medie este mai mare dect suma abaterilor cu semnul minus i ca urmare seria prezint o asimetrie pozitiv. 3. 3 < 0, deci M X  X < 0. Aceasta nseamn c pe total, suma abaterilor cu semnul minus este mai mare dect suma abaterilor cu semnul plus de la valoarea medie. O astfel de serie se spune c reprezint o asimetrie negativ.

2.5.2. Parametrii boltirii 41

Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a valorii medii ct i pentru compararea reprezentativitii a dou sau mai multe valori medii ce reprezint serii diferite. Parametrul M X  X d o caracterizare numeric sub form absolut a gradului de boltire a unei serii. Sub form relativ, gradul de boltire se msoar cu parametrul: M X X B4 ! 4 WX

(2.48)

Pentru a nelege semnificaia boltirii unei serii, se consider dou serii statistice care au la baz variabilele X i Y, iar X ! Y; W X ! WY Mai presupunem, n plus, c cele dou distribuii au form de clopot pentru care 3X = 3Y , adic ambele sunt simetrice. Dei s-ar prea c cele dou serii nu au nimic care s le deosebeasc, totui reprezentndu-le grafic rezult dou curbe de forma:

X !Y

W X ! WY

unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou serii nu sunt caracterizate de aceeai boltire. Boltirea unei serii este util pentru a da o caracetrizare mai exact reprezentativitii valorii medii. n cazul exemplului prezentat mai sus, att mediile ct i abaterile medii ptratice sunt egale i ca urmare, coeficientul de variaie al lui Pearson este acelai pentru cele dou serii. Deci rezult c ambele valori medii prezint acelai grad de reprezentativitate. Cu toate acestea, graficele celor dou serii contrazic concluzia dedus n urma comparrii celor doi coeficieni de variaie. Valoarea medie cea mai reprezentativ n seria n care cele mai multe uniti ale populaiei cercetate au nregistrat valori, mai apropiate de valoarea medie. Pentru o astfel de serie, mprtierea fa de valoarea medie fiind mic, graficul are o form mai ascuit n cazul seriei X i mai plat n cazul seriei Y.

42

Nivelul boltirii pentru o serie oarecare dat se msoar cu ajutorul parametrului B4, a crui expresie de calcul este dat de relaia (2.48). Valoarea lui B4 pentru o distribuie normal este egal cu 3. Pentru orice alt curb corespunztoare unei serii date i aproximat cu un clopot, raportul ntre momentul centrat de ordinul patru i ptratul momentului centrat de ordinul al doilea, este un numr diferit de 3, curba respectiv fiind mai ascuit sau mai plat dect curba normal a lui Gauss. Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui Gauss, Fisher a stabilit urmtoarea expresie de calcul al coeficientului boltirii, notat cu B4: M XX B ! 4 WX
' 4

3
4

sau:

B4 = B4-3

expresie cunoscut n literatura de specialitate sub denumirea de exces al seriei. Urmtoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii: - dac B4 =0 (adic B4 = 3) atunci seria n cauz prezint aceeai boltire cu a curbei normale (excesul este nul); - dac B4 > 0 (adic B4 > 3) atunci boltirea corespunztoare curbei respective este mai nalt i mai ascuit dect curba normal (serie leptokurtic); - dac B4 < 0 (adic B4 < 3) atunci boltirea corespunztoare curbei respective este mai plat (mai joas i mai larg) dect curba normal (serie platikurtic). Asimetria i boltirea joac un rol nsemnat n caracterizarea formei unei serii atributive de repartiie. Cu ajutorul parametrilor prezentai poate fi format o imagine mai clar asupra unei serii deja construite, asupra msurii n care seria respectiv poate fi reprezentat de valoarea sa medie. Bibliografie: 1.Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira, ClujNapoca, 2010; 2.Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pi a, Ed. Presa Universitar Clujean, Cluj-Napoca, 2001;

3.Florea I., Parpucea I., Buiga A., Napoca, 1998

Statistic descriptiv, Ed. Continental, Cluj-

43

MODULUL 3
ANALIZA LEGTURILOR DINTRE VARIABILELE UNEI REPARTIII MULTIDIMENSIONALE Obiective
y y y nsuirea conceptelor de corelaie si regresie si utilizarea lor n economie Cunoaterea posibilitilor de cuantificare a intensitii legturii dintre diversele mrimi economice nsuirea metodelor de stabilire a unei legturi funcionale ntre variabile

Concepte de baz
y y y y Corelaia dintre variabile, coeficieni de asociere, coeficient de corelaie Corelaia rangurilor, coeficienii lui Kendall si Spearman Metoda celor mai mici ptrate, regresia liniar simpl Regresia liniar multipl, regresii neliniare: hiperbolic, parabolic, exponenial

Rezultate ateptate
Dup parcurgerea acestui modul se cere studentului s stpneasc noiunile de corelaie i regresie, s poat identifica existena unei eventuale legturi ntre dou mrimi. De asemenea s tie msura intensitatea legturii dintre variabile, fie ele cantitative sau calitative. Se urmrete i cunoaterea metodelor de modelare funcional a legturilor.

Sinteza
Ne propunem abordarea unor metode statistice caracteristice studiului seriilor multidimensionale. Scopul acestora este de a identifica i utiliza eventualele legturi care se pot manifesta ntre dou sau mai multe variabile. Prezinta interes: existena legturii, intensitatea acesteia, forma funcional a legturii, parametrii i reprezentativitatea ei privind fenomenul cercetat. Problematica legturilor dintre variabile este foarte curent ntlnit n economie. Spunem c salariul unui angajat este n funcie de productivitatea muncii sale, vechimea n munc, responsabilitatea activitii sale, etc ; sau cererea dintr-un produs este n funcie de preul produsului, venitul consumatorilor, etc. De fiecare dat, att n teoria economic, ct i n aplicaii se ntlnete expresia fie funcia cererii. n realitatea economic ns, aceast funcie nu se d, nu se cunoate, ci trebuie estimat pornind de la o baz de date. Aceast problem de estimare a unei funcii i alte probleme colaterale ei fac obiectul acestui capitol. Pentru a putea aborda studiul legturilor dintre variabile trebuie s tim n primul rnd dac exist sau nu o legtur ntre variabilele studiate (sau ntre fenomenele pe care acestea le reprezint) i care este natura acestora. Putem clasifica legturile dinte variabile astfel : 1. Legtura nul. Semnific lipsa oricrei legturi ntre dou sau mai multe fenomene sau variabile care cuantific fenomenele. De exemplu, o legtur nul se manifest ntre nlimea unui angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta primului ministru. Din punct de vedere statistic, spunem c ntre dou variabile X i Y exist o legtur nul, sau nu exist legtur, dac cov( x, y ) ! 0 . 2. Legtura determinist. Spunem c ntre variabilele X i Y exist o legtur determinist dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de legturi 44

se ntlnesc n special n fizic, unde de exemplu viteza este egal cu distana mprit la timp: v ! d / t , sau fora este egal cu masa nmulit cu acceleraia: F ! m a . Astfel de exemple exist i n economie, unde rata profitului este egal cu profitul mprit la cifra de afaceri: rT ! T / C . A. 100% . Legtura este determinist pentru c variabila rT este perfect determinat de celelalte dou: T i C. A. Adic pentru o anumit valoare a profitului i o anumit valoare a cifrei de afaceri nu putem avea dect o singur valoare a ratei profitului. 3. Legtura statistic. Se mai numete i stocastic sau probabilist. Este tipul de legtur cel mai des ntlnit n tiinele sociale, deci i n economie. Fiecrei valori xi a variabilei X i corespunde o distribuie de valori ale variabilei Y. Matematic, o astfel de legtur se exprim sub forma y ! f ( x)  I , unde am notat prin I componenta aleatoare rezidual, datorat aciunii asupra lui Y a celorlali factori dect X. Dei s-ar putea spune c prin luarea n considerare a tuturor factorilor care influeneaz variabila Y, legtura este intrinsec determinist, n tiinele economice vom ntlni aproape ntotdeauna un numr foarte mare de factori, care nu pot fi identificai i cuantificai n totalitatea lor. Asfel, funcia care l expliciteaz pe Y are dou componente: una determnist, f ( x1 , x2 ,..., xn ) , cuprinznd variabilele cuantificabile de care depinde Y, i una aleatoare, I , cuprinznd variabilele ce nu au putut fi cuantificate. Sudiul legturilor dintre variabile s-a dezvoltat ntr-o disciplin aparte, numit econometrie. n capitolul de fa nu ne propunem deci dect o introducere n aceast problematic, fr a aborda elemente de inferen statistic specifice acestor legturi. n cele ce urmeaz vom prezenta cteva aspecte legate de variabile i fenomenele reprezentate de acestea, probleme att de natura aparatului statistic utilizat, ct i de aplicabilitatea lui n contextul economic.

Analiza legturii dintre variabilele unei repartiii multidimensionale presupune abordarea urmtoarelor probleme, care se pot constitui i n etape ce trebuie parcurse n demersul statistic necesar: 1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu variabilele cercetate 2. Analiza statistic a existenei legturii 3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele observate 4. Formularea unor ipoteze cu privire la forma matematic a legturii 5. Estimarea parametrilor funciei de regresie 6. Analiza reprezentativitii funciei de regresie Aceste etape pot fi parcurse integral sau parial, n funcie de natura variabilelor. Pentru variabilele calitative nu vor fi parcurse (n statistica descriptiv) dect primele trei, 45

deoarece posibilitile de prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi parcurse n cazul variabilelor cantitative.

3.1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu variabilele cercetate

n scopul utilizrii facile a informaiei culese la nivelul populaiei sau eantionului, rezultatele observrii vor fi sistematizate ntr-o form convenabil prelucrrii lor. Se prefer de obicei o form tabelar a prezentrii, care poate sugera unele idei de lucru pentru etapele urmtoare, prin unele remarci cu privire la valorile pe care le-au nregistrat variabilele.

3.2. Analiza statistic a existenei legturii

n studiul analizei existenei legturii vom folosi att elemente de statistic deja abordate n capitolele anterioare, cum ar fi tabelele i graficele, ct i parametri (coeficieni) specifici acestui capitol. Deoarece prezint particulariti distincte, vom aborda separat problematica subcapitolului n funcie de tipul variabilelor. 3.2.1. Analiza statistic a existenei legturii pentru variabile calitative Un prim instrument ce ne st la ndemn este tabelul de corelaie, un tabel cu dou intrri, reprezentnd o repartiie bidimensional. Modul de construcie al unui astfel de tabel se cunoate de la seriile statistice.

46

G !
2 i !1 j !1

( N ij  N ij ) 2 N ij

Ca o concluzie, distingem cele dou cazuri: 1) Dac G 2 ! 0 nu exist legtur ntre variabile 2) Dac G 2 "" 0 exist legtur ntre variabile Procedeul prezentat anterior ne permite identificarea existenei legturii dintre dou variabile, dar nu i a intensitii acesteia. Totui, pornind de la el se pot construi coeficieni care s ne permit i aprecierea intensitii legturii, aa cum se va vedea n seciunile urmtoare.

3.2.2. Analiza statistic a existenei legturii pentru variabile cantitative Aa cum s-a vzut n capitolul anterior, dac dispunem de o repartiie bidimensional, putem descompune variana total a variabilei de explicat Y ca sum a varianelor datorate variabilei explicative X i respectiv celorlali factori, adic:
2 2 2 WY !WY WY /X /X

Dac nu exist legtur, adic X nu are nici o influen asupra lui Y, mediile condiionate
2 Y / X vor fi identice, iar dispersia lor va fi nul: W Y ! 0. /X

Putem reine deci ca regul de decizie n statistica descriptiv:


2 ! 0 nu exist legtur ntre variabile 1) Dac W Y /X 2 2) Dac W Y "" 0 exist legtur ntre variabile /X

3.3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele observate

47

Ca i n cazul existenei legturii, o prim apreciere a intensitii se poate face pe baza tabelului de corelaie i a norului de puncte. Cu ct frecvenele mai mari sunt mai grupate n jurul uneia din diagonalele tabelului de exemplu sau punctele norului sunt mai grupate n jurul unei linii, cu att legtura este mai intens. n ceea ce privete metodele cantitative de apreciere, ele sunt mult mai precise i ne pot oferi valori numerice ale intensitii sau gradului de asociere. Aceste metode sunt ns diferite n funcie de tipul variabilelor i de aceea le vom aborda separat.

3.3.1. Gradul de asociere sau intensitatea legturii dintre variabilele calitative Coeficientul de asociere (contingen) al lui Pearson Relaia de calcul a coeficientului este: G2 N G2

C!

unde N este volumul populaiei. dac G 2 ! 0 legtura este nul (lipsa legturii) dac G 2 ( 0 ; 0,3 ) legtura este de intensitate slab dac G 2 [ 0,3 ; 0,7 ) legtura este de intensitate medie dac G 2 [ 0,7 ; 1 ) legtura este de intensitate puternic

3.3.2. Gradul de asociere sau intensitatea legturii dintre variabilele ordinale

Coeficientul de corelaie a rangurilor al lui Kendall

48

Pentru a putea utiliza acest indicator toate unitile populaiei trebuie s poat fi ordonate n raport cu variabilele pentru care cercetm intensitatea legturii. Presupunem o populaie de volum n observat n raport cu m variabile. Pentru a putea construi coeficientul, vom defini mai nti indicatorul de concordan (P) i respectiv indicat orul de discordan (Q). Pe baza indicatorilor de concordan i discordan construim coeficientul de corelaie simpl a rangurilor al lui Kendall, definit astfel: X! PQ P Q ! P  Q n(n  1) 2

n cazul unei legturi directe de intensitate maxim, P va lua valoare sa maxim, iar Q pe cea minim, adic: P !
n(n  1) iar Q ! 0 , deci X ! 1 . 2

n cazul unei legturi inverse de intensitate maxim, P va lua valoare sa minim, iar Q pe cea maxim, adic: P ! 0 iar, Q !
n (n  1) deci X ! 1 . 2

n cazul lipsei legturii, P ! Q , iar X ! 0 . Putem determina astfel intervalul n care va fi cuprins X , respectiv X [-1 ; 1] . Interpretarea intensitii legturii pe baza acestui coeficient se va face astfel: dac dac dac dac

X " 0 legtura este direct X ! 0 legtura este nul X 0 legtura este invers X [0 ; 0,3) legtura este de intensitate slab

dac X [0,3 ; 0,7) legtura este de intensitate medie dac X [0,7 ; 1] legtura este de intensitate puternic

Coeficientul de corelaie a rangurilor al lui Spearman

49

Ca i coeficientul similar propus de Kendall, i acesta se calculeaz pornind de la tabelul de concordan a rangurilor. Ne vom folosi de diferenele d i dintre ranguri pentru aceeai unitate a populaiei relativ la cele dou variabile. Coeficientul are urmtoarea expresie: 6 d i2
i !1 n

L ! 1

n (n 2  1)

Limitele celor doi coeficieni sunt aceleai, la fel i interpretrile valorilor numerice.

3.3.3. Intensitatea legturii dintre variabilele cantitative

Raportul de corelaie

Folosind regula de adunare a varianelor descompunem variana total a variabilei de explicat Y ca sum a varianelor datorate variabilei explicative X i respectiv celorlali factori, adic:
2 2 2 WY !WY WY /X /X

2 Variana explicit W Y este cu att mai mare cu ct mediile condiionate Y / X sunt mai /X

diferite ntre ele. Ceea ce le face s difere este numai influena lui X, deoarece am mprit populaia n grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim variana explicit ca o mrime absolut a intensitii legturii dintre X i Y i ponderea varianei explicite n variana total ca o mrime relativ. Raportul de corelaie are expresia:

50

RYX !

Vexp Vtot

! 1

Vrez Vtot

sau sub forma ei matematic:


2 WY /X 2 WY 2 WY /X 2 WY

RYX !

! 1

Pentru a-i gsi limitele ne raportm la cele dou situaii extreme: dac nu exist legtur ntre X i Y, mediile condiionate Y / X sunt egale ntre ele, 2 deci W Y ! 0 i RYX ! 0 /X dac legtura este de intensitate maxim, nu exist influene ale altor factori dect 2 X asupra lui Y, nu exist variaie n cadrul grupelor, deci W Y / X ! 0 i RYX ! 1 .

n consecin, raportul de corelaie aparine intervalului RYX [0 ; 1] . Interpretarea intensitii legturii pe baza acestui coeficient se va face astfel: dac dac dac dac

RYX ! 0 legtura este nul RYX [0 ; 0,3) legtura este de intensitate slab RYX [0,3 ; 0,7) legtura este de intensitate medie RYX [0,7 ; 1] legtura este de intensitate puternic.

3.4. Formularea unor ipoteze cu privire la forma matematic a legturii Dac ntre dou variabile (ambele cantitative !) se constat existena unei legturi de o anumit intensitate, ne punem problema posibilitii modelrii legturii printr-un model matematic. O prim etap n acest demers este formularea unei ipoteze ct mai verosimile cu privire la forma legturii. n acest scop, pe baza tabelului de corelaie construim norul statistic i linia poligonal a mediilor condiionate ale variabilei dependente.

Y Y / x4

Y / x3

Y / x2 Y / x1 51 X

n funcie de forma liniei frnte obinute i a poziiei punctelor norului fa de ea se formuleaz o ipotez cu privire la forma funciei de regresie. Dac dorim s studiem o legtur multipl, respectiv dependena lui Y fa de variabilele factoriale X 1 , X 2 ,..., X n atunci pentru fiecare pereche (Y , X 1 ) , (Y , X 2 ) , (Y , X n ) desenm cte un nor statistic. Forma general a variabilei Y n funcie de variabilele factoriale X 1 , X 2 ,..., X n se scrie: Y ! f ( X 1 , X 2 ,..., X n )  I unde f ( X 1 , X 2 ,..., X n ) reprezint funcia de regresie care aproximeaz cel mai bine forma legturii, iar I o variabil aleatoare numit rezidual, care nsumeaz efectul altor factori dect cei luai n calcul. 3.5. Estimarea parametrilor funciei de regresie Este o etap care se succede firesc alegerii formei funciei. n estimarea parametrilor va trebui s inem cont de abaterea punctelor norului fa de modelul matematic ales Y ( X 1 , X 2 ,..., X n ) , datorat altor factori dect X 1 , X 2 ,..., X n , considerai neeseniali, cuantificai prin variabila rezidual I . Principiul de la care se pornete n estimarea parametrilor este cel al patratelor minime. Minimizm suma patratelor abaterilor valorilor observate ale lui Y de la nivelul calculat prin Y ( X 1 , X 2 ,..., X n ) . Condiia de minim a sumei este echivalent cu condiia de minim a mediei: M? Y  Y ( X 1 , X 2 ,..., X n )A ! M (I 2 ) minim
2

Ecuaia Y ( X 1 , X 2 ,..., X n ) care descrie legtura dintre Y i factorii de influen X 1 , X 2 ,..., X n se numete ecuaia de regresie. Metoda regresiei const n modelarea legturilor statistice prin ecuaia de regresie. Deoarece problema de minim se poate rezolva doar cunoscnd forma particular a funciei, vom aborda estimarea parametrilor seprat, pe tipuri de funcii. Regresia liniar n ipoteza n care legtura dintre Y i factorii si de influen X 1 , X 2 ,..., X n este liniar, ecuaia de regresie va fi de forma:
Y ( X 1 , X 2 ,..., X n ) ! a0  a1 X 1  a 2 X 2  a n X n

52

Coeficienii a0 , a1 , a 2 ,..., an se numesc parametrii modelului i vor rezulta din minimizarea urmtoarei funcii cu (n+1) necunoscute: G (a0 , a1 ,..., an ) ! M ? Y  (a0  a1 X 1  ...  a n X n )A
2

Condiiile de minim constau n anularea celor (n+1) derivate pariale ale funciei G (a0 , a1 ,.., a n ) n raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la urmtorul sistem de ecuaii: xG (a0 , a1 ,..., an ) ! 2 M ? Y  (a0  a1 X 1  ...  an X n )A! 0 xa0 xG (a0 , a1 ,..., an ) ! 2 M ? Y  (a0  a1 X 1  ...  an X n )A X j ! 0 xa j
j ! 1, n

sau ntr-o form echivalent: M a0  a1 X 1  ...  a n X n ! M (Y ) M a0  a1 X 1  ...  a n X n X n ! M (Y ) X j de unde rezult: a0  a1 M ( X 1 )  ...  a n M ( X n ) ! M (Y ) a0  a1 M ( X 1 X j )  ...  a n M ( X n X j ) ! M (YX j )

j ! 1, n

j ! 1, n

Prin rezolvarea acestui sistem liniar de ecuaii n raport cu necunoscutele a0 , a1 ,..., a n , se obin valorile parametrilor ecuaiei de regresie. Astfel, legtura statistic dintre Y i X 1 , X 2 ,..., X n este modelat prin aproximare cu o legtur funcional. Pentru cazul cu doi factori X 1 i X 2 , ecuaia de regresie se scrie: Y ( X 1 , X 2 ) ! a0  a1 X 1  a 2 X 2 iar sistemul de ecuaii devine: a0  a1 M ( X 1 )  a 2 M ( X 2 ) ! M (Y ) 2 a0 M ( X 1 )  a1 M ( X 1 )  a 2 M ( X 1 X 2 ) ! M (YX 1 ) 2 ) ! M (YX 2 ) a0 M ( X 2 )  a1 M ( X 1 X 2 )  a 2 M ( X 2 Prin substituia lui a 0 din prima ecuaie i nlocuirea lui n celelalte, obinem:

53

a1 M ( X 12 )  [ M ( X 1 )]2  a2 ?M ( X 1 X 2 )  M ( X 1 ) M ( X 2 )A! M (YX 1 )  M (Y ) M ( X 1 ) a1 ?M ( X 1 X 2 )  M ( X 1 )M ( X 2 )A a2 M ( X 22 )  [ M ( X 2 )]2 ! M (YX 2 )  M (Y )M ( X 2 )

Dac pentru a aduce la o form mai simpl notm cu:

mij ! M [ X i  M ( X i )] [ X j  M ( X j )] ! M ( X i X j )  M ( X i ) M ( X j )
care reprezint covariaia dintre variabilele X i i X j , obinem:

a1 m11  a 2 m12 ! m01 a1 m12  a 2 m22 ! m02 de unde putem obine valorile parametrilor: m01m22  m12 m02 2 m11m22  m12 m11m02  m12 m01 2 m11m22  m12

a1 ! a2 !

De aici l vom deduce i pe a0 , care a fost substituit n prima ecuaie. Astfel, a0 , a1 , a 2 sunt valorile parametrilor modelului liniar cu trei variabile. nlocuind valorile parametrilor n ecuaia de regresie se obine: m11 m21  m10 m20 m m12 Y ( X 1 , X 2 )  M (Y )  10 m20 m22 m11 X 2  M ( X 2 ) ! 0 m21 m12 m22 X 1  M ( X 1 ) 

Pentru a face relaia mai accesibil, introducem matricea de variaie i covariaie: M


( 3)

m00 ! m10 m 20

m01 m11 m21

m02 m12 m22

( 3) i notnd complementul algebric al elementului m0 j cu M o j , j ! 0,1, 2 ecuaia de regresie devine:

54

(3 ) ( 3) ( 3) Y ( X 1 , X 2 )  M (Y )  M 01 X 1  M ( X 1 )  M 02 X 2  M ( X 2 ) ! 0 M 00

Pentru cazul mai general al legturii liniare dintre Y i X 1 , X 2 ,..., X n , matricea de variaie i covariaie este: m00 m10 ! ... m n0 m01 ... m0 n m11 ... m1n ... ... ... mn1 ... mnn

M ( n 1)

iar ecuaia de regresie se poate scrie:


( n 1) ( n 1) 1) M 00 Y ( X 1 , X 2 )  M (Y )  M 01 X 1  M ( X 1 )  ...  M 0( n n X n  M ( X n ) ! 0

Matricea de variaie i covariaie M ( n 1) este simetric n raport cu prima diagonal. Elementele mii de pe diagonala principal sunt varianele variabilelor Y , X 1 , X 2 ,..., X n , iar elementele mij , i { j reprezint covarianele dintre variabilele corespunztoare. Regresia liniar simpl n cazul regresiei liniare simple, cu variabila endogen Y i factorul X 1 , matricea de variaie i covariaie este: m00 M (2) ! m 10 m01 m11

iar ecuaia de regresie devine:


m11 Y ( X )  M (Y )  m10 X 1  M ( X 1 ) ! 0

de unde l putem exprima pe Y ( X ) ca:

Y (X ) !

m m10 X 1  M (Y )  10 M ( X 1 ) m11 m11

de unde rezult coeficienii:

55

a 0 ! M (Y )  a1 ! m10 X1 m11

m10 M ( X1 ) m11

Regresia parabolic n economie sunt numeroase exemplele n care legtura dintre fenomene i deci variabilele care le cuantific nu este liniar. Dac Y reprezint recolta la hectar dintr-un produs agricol, iar X cantitatea de ngrminte, ne vom da seama chiar i intuitiv c o anumit cretere a lui X nu provoac aceeai cretere a lui Y pe tot intervalul de variaie al celor dou variabile. La valori mari ale cantitii de ngrminte, acestea provoac saturaie sau chiar nocivitate, ducnd la o stagnare, respectiv diminuare a produciei. Alte exemple pot fi: legtura dintre vechimea n munc i mrimea salariului, dintre cheltuielile cu publicitatea i volumul vnzrilor, etc. Determinarea parametrilor funciei parabolice de regresie se poate face fie aplicnd direct funciei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat anterior. n ambele cazuri vom exemplifica pentru parabola de ordinul doi. a) Estimarea parametrilor prin aplicarea direct a metodei patratelor minime Ecuaia de regresie a modelului se scrie:
Y ( X ) ! a0  a1 X  a2 X 2

Din condiia de minimizare a expresiei: G (a0 , a1 , a2 ) ! M ? Y  Y ( X )A avem urmtoarele egaliti: xG (a0 , a1 , a 2 ) !0 xa 0 xG (a0 , a1 , a 2 ) !0 xa1 xG (a0 , a1 , a 2 ) !0 xa 2
2

56

din care rezult sistemul de ecuaii:  2 M Y  (a0  a1 X  a 2 X 2 ) ! 0 2  2 M Y  (a0  a1 X  a 2 X ) X ! 0  2 M Y  (a0  a1 X  a 2 X 2 ) X 2 ! 0 care este echivalent cu: a0  a1 M ( X )  a 2 M ( X 2 ) ! M (Y ) 2 3 a0 M ( X )  a1 M ( X )  a2 M ( X ) ! M (YX ) a0 M ( X 2 )  a1 M ( X 3 )  a2 M ( X 4 ) ! M (YX 2 ) Rezolvnd acest sistem n necunoscutele a0 , a1 , a2 , rezult parametrii ecuaiei de regresie parabolice. n mod asemntor se poate proceda pentru orice regresie neliniar.

? ? ?

A A A

b) Estimarea parametrilor prin reducerea la cazul liniar


Avnd modelul parabolic de ecuaie:
Y ( X ) ! a0  a1 X  a 2 X 2

facem substituiile:

X ! X1
X 2 ! X2 dup care ecuaia devine: Y ( X 1 , X 2 ) ! a0  a1 X 1  a 2 X 2 care reprezint un model liniar cu doi factori. Elementele matricei de variaie i covariaie vor arta astfel:
2 m00 ! M (Y 2 )  ( M (Y )) 2 ! W Y

57

m01 ! m10 ! M (YX )  M (Y ) M ( X ) ! cov(Y , X ) m02 ! m20 ! M (YX 2 )  M (Y )M ( X 2 ) ! cov(Y , X 2 )


2 m11 ! M ( X 2 )  ( M ( X )) 2 ! W X

m12 ! M ( X 3 )  M ( X ) M ( X 2 ) ! cov( X , X 2 )
2 m22 ! M ( X 4 )  ( M ( X 2 )) 2 ! W X 2

Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o problem de regresie liniar, care se rezolv conform cazului liniar. n cazul mai general, dac ecuaia de regresie este un polinom de gradul n:
Y ( X ) ! a0  a1 X  a 2 X 2  ...  an X n

efectund substituiile:
X ! X 1 ; X 2 ! X 2 ; ... ; X n ! X n

obinem cazul liniar n raport cu (n+1) variabile. Regresia exponenial Dac ecuaia de regresie are form exponenial: Y (X ) ! a bX se ncearc aducerea la forma liniar. Mai nti se logaritmeaz ecuaia: lg Y ( X ) ! lg a  X lg b iar apoi se fac substitiiile: Z ( X ) ! lg Y ( X ) a0 ! lg a a1 ! lg b Rezult astfel modelul liniar simplu:

58

Z ( X ) ! a0  a1 X

Regresia hiperbolic Dac ecuaia de regresie are form hiperbolic: 1 X

Y (X ) ! a  b

se face substituia:
1 X

X1 !

de unde rezult modelul liniar: Y ( X 1 ) ! a  bX 1 n matricea de variaie i covariaie elementele vor fi:
2 m00 ! M (Y 2 )  ( M (Y )) 2 ! W Y

1 1 1 m01 ! m10 ! M Y  M (Y ) M ! cov Y , X X X 1 1 m11 ! M 2  M X X Alte tipuri de regresie n practica economic se ntlnesc frecvent i alte tipuri de funcii (unele chiar funcii compuse). Principiul de lucru pentru estimarea parametrilor va rmne ns ntotdeauna acelai: ncercarea de a aduce funcia la o form liniar. Foarte des ntlnite sunt funciile de producie. Forma general a acestora este:
m2 mn Y ( X 1 , X 2 ,..., X n ) ! a X 1m1 X 2 ... X n

2 ! W 1/ X

Printr-o astfel de funcie se definete o legtur ntre nivelul produciei Y i factorii de care aceasta depinde: productivitatea muncii, calificarea forei de munc, gradul de nzestrare 59

cu capital fix, etc. Determinarea parametrilor se face prin reducere la cazul liniar prin logaritmare:
lg Y ( X 1 , X 2 ,..., X n ) ! lg a  m1 lg X 1  ...  mn lg X n

Dac n aceast nou ecuaie facem substituiile: Z ( X 1 , X 2 ,..., X n ) ! lg Y ( X 1 , X 2 ,..., X n ) X i ' ! lg X i , i ! 1, n reducem ecuaia la una liniar multipl. 4.6. Analiza reprezentativitii funciei de regresie Coeficientul de corelaie Construcia lui este similar cu a raportului de corelaie, cu deosebirea c variana n fiecare grup este calculat folosind suma patratelor abaterilor fa de valorile ajustate prin funcia de regresie i nu fa de media grupei. Ca urmare, coeficientul de corelaie va fi specific fiecrei funcii n parte. Expresia lui de calcul (admis aici fr demonstraie) este: det M rYX ! 1  m00 M 00 rYX [0 ; 1] Interpretarea acestui coeficient n funcie de valorile pe care le poate lua este urmtoarea: - dac rYX [0 ; 0,3] funcia nu este reprezentativ pentru modelarea legturii dintre variabile - dac rYX (0,3 ; 0,7] funcia are o reprezentativitate medie pentru modelarea legturii dintre variabile - dac rYX (0,7 ; 1] funcia este foarte reprezentativ pentru modelarea legturii dintre variabile Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienilor este bine s fie comparate cu ale altor coeficieni, ai altor funcii. Pentru aceeai repartiie de exemplu, pentru funciile de regresie alese ca fiind posibilecalculm coeficienii de corelaie i l reinem pe cel mai mare, considernd acea funcie ca fiind cea mai reprezentativ. n cazul regresiei liniare simple, formula coeficientului poate fi adus la o form echivalent mai simpl: m00 M ( 2) ! m 10 m01 m11

60

rYX ! 1  !

m m  m01 m10 det M ! 1  00 11 ! m00 M 00 m00 m11 m01 ! M ( XY )  M ( X )M (Y ) W Y W X

m01 m10 ! m00 m11

m00 m11

4.7. Corelaia parial Prin corelaie simpl am studiat legtura liniar dintre doi factori neglijnd influena celorlali factori, care acioneaz n acelai timp asupra variabilei endogene. n corelaia multipl am msurat influena simultan a dou sau mai multe variabile exogene asupra celei endogene. Ne punem ns problema de a msura influena unei variabile independente asupra celei dependente, presupunnd celelalte variabile la un nivel constant. Fr a recurge la demonstraii, vom da modul de calcul al coeficienilor de corelaie parial pentru dou cazuri: a) Cazul unei variabile dependente Y i dou variabile independente X1 i X2: - corelaia dintre Y i X1, neglijnd influena lui X2 : rYX 1 X 2 ! rYX 1  rYX 2 rX 1 X 2
2 YX 2

1  r 1 r
2 X1X 2

- corelaia dintre Y i X2, neglijnd influena lui X1 : rYX 2 X 1 ! 1  r 1 r


2 YX 1 2 X1X 2

rYX 2  rYX 1 rX 1 X 2

b) Cazul unei variabile dependente Y i trei variabile independente X1, X2 i X3 : - corelaia dintre Y i X1, neglijnd influena lui X2 i X3 : rYX 1 X 2 X 3 ! rYX1 X 2  rYX 3 X 2 rX 1 X 3 X 2 1 r
2 YX 3 X 2

1 r

2 X1 X 3 X 2

- corelaia dintre Y i X2, neglijnd influena lui X1 i X3 : rYX 2 X 1 X 3 ! rYX 2 X 1  rYX 3 X 1 rX 1 X 3 X 2 1 r


2 YX 3 X 1

1 r

2 X 2 X 3 X1

- corelaia dintre Y i X3, neglijnd influena lui X1 i X2 : rYX 3 X 1 X 2 ! rYX 3 X 1  rYX 2 X 1 rX 2 X 3 X 1

1 r

2 YX 2 X 1

1 r

2 X 2 X 3 X1

Aceste formule ale coeficienilor de corelaie parial se pot generaliza i pentru cazul a k variabile independente.

Probleme propuse
61

Problema 1

Cunoatem urmtoarea distribuie a 52 de societi comerciale cu acelai profil de activitate, n raport cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnzrilor (mil. lei). X Y ( 600 ; 800 ] ( 400 ; 600 ] [ 200 ; 400 ] Total [ 30 ; 50 ] 2 3 14 19 ( 50 ; 70 ] 7 10 2 19 ( 70 ; 90 ] 8 5 1 14 Total 17 18 17 52

Se cere: 1) Pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a funciei de regresie. 2) n ipoteza unei forme liniare a dependenei dintre Y i X, s se calculeze parametrii funciei de regresie. 3) S se studieze reprezentativitatea funciei de regresie pentru modelarea legturii dintre cele dou variabile. 4) Care este valoarea medie a volumului vnzrilor pentru un nivel al cheltuielilor cu publicitatea de 55 milioane lei ? 5) Aceleai cerine de la punctele 2, 3 i 4 pentru o form parabolic a dependenei dintre Y i X. Problema 2

Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat sa nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor: Nr. crt. 1 2 3 4 5 6 Cerere (C) 15,4 3,2 4,9 10,5 8,0 5,1 Pre (P) 1,4 5,1 2,5 1,7 1,8 3,4 Venit (V) 620 530 490 800 630 410

62

7 8 9 10 11 12 13 Se cere:

7,6 11,3 14,0 6,4 13,2 8,8 12,1

2,1 1,6 3,6 3,5 1,9 1,8 1,9

670 920 990 320 520 700 730

1) S se formuleze ipoteze cu privire la forma legturii dintre cerere (C) i pre (P). Pentru formele funciilor de regresie reinute ca fiind posibile, s se calculeze parametrii funciilor i reprezentativitatea acestora. 2) Similar pentru legtura dintre cerere i venit. 3) S se calculeze parametrii funciei care modeleaz legtura liniar multipl dintre cerere i factorii si e influen. Analizai reprezentativitatea acestei funcii n raport cu reprezentativitatea funciilor de regresie simple. Care va fi valoarea estimat a cererii pe o pia unde preul de vnzare va fi 3,2 iar venitul mediu al consumatorilor de 550 ?

63

Bibliografie:
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira, Cluj-Napoca, 2010; 2. DROSBEKE J. J., lments de statistiques , Ed. Ellipses , Bruxelles , 1988 3. BUIGA A., DRAGOS C., LAZAR D., PARPUCEA I., TODEA A., "Statistica I", Ed. PUC, 2003 4. GOLDFARB B. , PARDOUX C. , Introduction la mthode st atisti que , Ed. Dunod , Paris , 1995 5. PY B. , Statistique descriptive , Ed. Economica , 1990 6. ROGER P. , Statistique pour la gestion , Ed. Management et socit , Caen , 2000 7. TASSI P. , Mthodes Statistiques , Ed. Economica , Paris , 1991 8. WONNACOTT T.H. , WONNACOTT R.J. , Statistique. conomie-GestionSciences-Mdecine , Ed. Economica , Paris , 1991

64

MODULUL 4
ANALIZA SI PREVIZIUNEA SERIILOR DE TIMP Obiective
Intelegerea si aplicarea metodelor de calcul a indicilor factoriali in analiza dinamicii indicatorilor economici; y Cuantificarea dinamicii medii a unui indicator; y Cunoasterea si utilizarea metodelor cantitative de previziune. Metoda clasica de descompunere a unei serii de timp. y

Concepte de baza
y y y y Indice al variatiei integrale, indice factorial, indice al pretului; Nivel mediu al unei serii de timp, indice mediu, ritm mediu, diferenta medie absoluta; Serie de timp, model dinamic, functii de tendinta, coeficientii sezonalitatii, ciclicitate Medii mobile, previziune, erori de previziune, netezire exponentiala.

Rezultate asteptate
Studentul intelege notiunile de indice factorial, nivel mediu, indice mediu, ritm mediu si stapaneste modalitatile de calcul a acestora. Utilizeaza metode cantitative in previziune; in acest sens, identifica componentele prezente intr-o serie de timp, modeleaza si extrapoleaza tendinta, utilizeaza adecvat o medie mobila, modeleaza componenta sezoniera si ciclica, utilizeaza metoda netezirii exponentiale in netezire si previziune.

Sinteza
4.1. INDICII STATISTICI 4.1.1. Indicii statistici: definiii i tipologii Studiul fenomenelor economice i sociale presupune n marea majoritate a cazurilor i msurarea variaiei unor mrimi. Aceast variaie poate fi urmrit n timp, spaiu sau relativ la nite categorii. Se va folosi termenul generic de stare, notndu-se cu j starea luat ca baz de comparaie i cu k cea cercetat n raport cu aceasta. Se va nota cu Z mrimea care constituie obiectul de studiu, variaia acesteia putnd fi exprimat att sub form absolut, ct i relativ. Dintre exprimrile sub form relativ un loc deosebit de important l ocup indicele statistic. n practic variaia total a variabilei Z este datorat variaiei unor alte variabile a cror evoluie ntre dou stri j i k influeneaz evoluia lui Z. Avem de a face, aadar, cu Z de forma Z ! f ( X 1 , X 2 ,- , X m ) . Un astfel de model este un model de tip determinist n care cei m factori determin n totalitate nivelul lui Z . In cazul unui astfel de model se pot distinge trei categorii de indici: 1) indicele variaiei totale (integrale) a mrimii Z : Z (k ) f X 1 (k ), X 2 (k ),- , X m (k ) ! Z ( j ) f X 1 ( j ), X 2 ( j ), - , X m ( j ) 2) indici ai factorilor X i (individuali sau elementari):
k/ j IZ !

65

k/ j IX ! i

X i (k ) X i ( j)

k/ j 3) indici ai variaiei partiale ale lui Z sau indici factoriali: I Z / X i - ne arat de cte ori s-a

modificat Z n starea k fa de starea j sub influena exclusiv a factorului X i . 4.1.2. Indicii factoriali Indicii factoriali de tip Laspeyres. Acest indice este cel mai cunoscut i utilizat n practica economic. Mai poart i denumirea de indicele preurilor. Dac se consider un co de r produse sau bunuri, volumul valoric al acestora Z se va calcula dup relaia: Z ! p i q i .
i !1 r

Indicele factorial al preurilor calculat prin metoda Laspeyres va avea expresia: r r p (k ) pi ( j ) qi ( j ) p i (k ) q i ( j ) i i !1 pi ( j ) k/ j i !1 I Z / p (L ) ! r ! r ( ) ( ) p j q j i i pi ( j ) qi ( j )


i !1 i !1

iar indicele factorial al cantitilor (volumului fizic), expresia:


k/ j IZ / q ( L) !

p ( j )q (k )
i i

p ( j )q ( j )
i i i !1

i !1 r

unde p i ( j ) i p i (k ) sunt preurile din perioada de baz i perioada curent, q i ( j ) sunt cantitile din perioada de baz, iar k i msoar importana1 produsului sau bunului i n coul indicelui la momentul baz de comparaie. Pentru cazul general, cnd Z depinde de m factori de influen, iar forma funciei f este oarecare, Florea (1986) deduce o regul pentru elaborarea indicilor factoriali de tip Laspeyres. Indicii factoriali de ti p Paasche. Acest indice a aprut tot ca un indice al preurilor, indicele factorial de pre de tip Paasche avand expresia:
k/ j IZ / p (P ) !

p (k )q (k )
i i

p ( j ) q (k )
i i i !1 r

i !1 r

iar cel factorial al cantitilor (volumului fizic), expresia:


k/ j IZ / q ( P) !

p (k )q (k )
i i

p (k )q ( j )
i i i !1

i !1 r

Pentru o funcie oarecare f , n care mrimea Z depinde de m factori, in Florea(1986) este prezentata o generalizare.

66

Indicii fact oriali de tip Fisher. In 1922, I. Fisher propune o nou expresie de calcul a indicelui preurilor. Acesta se va obine ca o medie geometric a indicilor de pre de tip Laspeyres i Paasche, astfel:
k/ j k/ j k/ j IZ IZ / p (F ) ! / p (L ) I Z / p ( P )

De aceeai manier se obine i indicele de volum:


k/ j k/ j k/ j IZ IZ / q (F ) ! / q ( L) I Z / q ( P)

Indicii factoriali generai prin Metoda Drumului Factorilor (MDF). Indicele factorial al unei variabile Z ! f X 1 ,- , X m , n raport cu factorul X i , obinut prin MDF este dat de relaia (Florea, 1989): f ' X i X 1 ,- , X m k/ j IZ dX i / X i ! exp Pj ,Pk f X 1 ,- , X m unde

P , P
j k

reprezint poriunea arcului din drumul factorilor cuprins ntre punctele Pj X 1 (k ), - , X m (k ) , acest drum fiind descris de ecuaiile

Pj X 1 ( j ), - , X m ( j ) i

parametrice X 1 ! X 1 (P ), - , X m ! X m (P ) , P fiind n general un parametru legat de timp. Exemple. Indicii factoriali calculati prin metoda Laspeyres. 1. O societate hotelier dispune de 3 tipuri de locuri de cazare: camere cu un singur pat(single), camere cu dou paturi(double) i apartamente. Numrul de camere nchiriate (X) i tariful practicat (Y) n dou luni consecutive sunt date n tabelul urmtor: Luna j Luna k X Y() X Y() Tipul camerei
Single Double Apartament
3

80 50 20

30 40 50

110 60 25

35 40 45

Volumul valoric al ncasrilor din nchirierea camerelor (Z) se va calcula dup relaia: Z ! X i Yi . Indicii factoriali de tip Laspeyres vor fi:
i !1

k/ j Z/X

(L) !

X X
i !1 i !1 3

(k )Yi ( j ) ! ( j )Yi ( j )

110 30  60 40  25 50 ! 1,287 p volumul valoric al 80 30  50 40  20 50

ncasrilor a crescut n luna k fa de luna j de 1,287 ori sub influena modificrii numrului de camere nchiriate. I
k/ j Z/X

( L) !

X
i !1 3 i !1

( j )Yi (k ) !
i

X ( j)Y ( j )
i

80 35  50 40  20 45 ! 1,055 p volumul 80 30  50 40  20 50

valoric al ncasrilor a crescut n luna k fa de luna j de 1,055 ori sub influena modificrii tarifului practicat. 2. Se consider mrimea Z ca fiind profitul brut al unei societi i factorii X - veniturile totale respectiv Y - cheltuielile totale ale aceleai societi. Modelul care leag cele trei mrimi va fi de forma: Z ! X  Y . In doi ani consecutivi variabilele X i Y au nregistrat valorile:

67

Variabila X (mld lei) Y (mld. Lei)

Anul
t 1
10 8

t
12 9

Expresiile i valorile indicilor factoriali de tip Laspeyres sunt: X (t )  Y (t  1) 12  8 t / t 1 ! - IZ ! 2 p profitul brut a crescut n anul t fa de / X (L ) ! X (t  1)  Y (t  1) 10  8 anul t  1 de 2 ori sub influena modificrii veniturilor totale; X (t  1)  Y (t ) 10  9 t / t 1 - IZ ! ! 0,5 p profitul brut a sczut n anul t fa / Y ( L) ! X (t  1)  Y (t  1) 10  8 de anul t  1 de 0,5 ori sub influena modificrii cheltuielilor totale. 4.1.3. Indicii factoriali de tip Laspeyres, Paasche i Fisher prin prisma abordrii axiomatice Abordarea axiomatic se bazeaz pe stabilirea unor seturi de proprieti pe care un indice statistic trebuie s le verifice (Buiga & all, 2003). 4.1.4. Principalii indici utilizai n economie Indicele preurilor de consum este un indice de tip Laspeyres cu bazfixa: I
t/0 Z/p

(L) !

p (t )q (0)
i i

p (0)q (0)
i i i !1

i !1 n

!
i !1

p i (0)qi (0)

p (0)q (0)
i i i !1

n p i (t ) ! k i (0) I tpi/ 0 p i (0) i !1

unde: n - reprezint numrul de mrfuri i servicii din coul indicelui; k i (0) - reprezint structura de consum, fiind ponderea mrfii sau serviciului i n consumul populaiei; p i (0) i p i (t ) sunt preurile nregistrate de marfa sau produsul i n perioada de baz i perioada curent; Ponderile k i (0) sunt obinute prin Ancheta Integrat n Gospodrii i rezult din structura cheltuielilor medii lunare efectuate de o gospodrie pentru cumprarea mrfurilor i plata serviciilor necesare satisfacerii nevoilor de trai; aceste ponderi se actualizeaz la intervale de civa ani. Preurile corespunztoare celor n mrfuri i servicii din coul indicelui se culeg lunar, n urma unei cercetri selective organizate de Institutul National de Statistic. Indicele produciei industriale msoar evoluia de ansamblu a preurilor produselor i serviciilor industriale fabricate i livrate de productorii interni n perioada curent fa de perioada de baz, n primul stadiu de comercializare a produselor sau serviciilor. ndicele utlizat este tot un indice de tip Laspeyres. Indicele salariilor msoar evoluia salariilor n perioada curent fa de perioada de baz. Alturi de indicele preurilor de consum este folosit n evaluarea nivelului de trai. Se utilizeaz, de asemenea, un indice de tip Laspeyres, care msoar variaia fondului de salarii total Z sub influena modificrii salariilor medii S i corespunztoare ramurii i . Indicii bursieri. Principalii indici bursieri se difereniaz prin mai multe elemente: eantionarea, respectiv alegerea titlurilor din coul indicelui, reprezentativitate, modul d e 68

calcul utilizat i natura variabilelor luate n calcul. Cei mai cunoscui i urmrii indici bursieri, cu excepia familiei de indici Dow Jones se calculeaza ca si indici Laspeyres. 4.2. PREVIZIUNEA SERIILOR DE TIMP n derularea activitii lor, frecvent agenii economici sunt pui n situaia de a anticipa viitorul, iar apoi de a lua decizii n consecin. Oamenii de afaceri sunt nevoii s previzioneze anual cifra de afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt interesai de profitul viitor degajat de investiie, respectiv guvernele de previziunea consumului sau a cheltuielilor guvernamentale etc.. Obinerea rapid de previziuni utiliznd modele cantitati ve de previziune este la ndemna analitilor, urmare i a softurile de statistic accesibile i uor de exploatat. Anticiparea, previziunea evoluiei viitoare a fenomenelor economice presupune n primul rnd cunoaterea istoriei acestora, punerea n eviden a unor legiti privind comportamentul lor trecut. Baza de date pe care se fundamenteaz analiza evoluiei fenomenelor n timp este constituit din serii cronologice. 4.2.1. Indicatori medii specifici seriilor cronologice a) Nivelul mediu (valoarea medi e). Nivelul mediu reprezint nivelul teoretic atins de indicator n condiiile n care evoluia sa ar fi constant n timp, factorii ce-i determin evoluia ar aciona cu aceeai intensitate pe ntreaga perioad de timp analizat. Modul de determinare a volumului fenomenului difer dup cum seria este de intervale respectiv de momente. Pentru serii cronologice de intervale nivelul mediu este: y  y 2  ...  y n Y! 1 n Pentru serii cronologice de momente nivelul mediu este definit de urmtoarea relaie:

Y!

tn

t1

y(t )dt
tn

. dt

t1

Daca se aproximeaz evoluia indicatorului y (t ) ca fiind liniar ntre dou momente consecutive de timp, rezulta: T  Tn 1 T T1 T  T2  y2 1  ...  y n 1 n  2  y n n 1 2 2 2 2 Y! T1  T2  ...  Tn 1 relaie numit medie cronologic ponderat. Daca nivelul indicatorului se nregistreaz la momente echidistante ( T1 ! T2 ! .... ! Tn 1 ), atunci relaia anterioar devine: y1 y  y 2  ....  y n 1  n 2 Y! 2 n 1 i reprezint media cronologic simpl. y1 b) Indicele mediu. Ritmul mediu Pentru calculul acestui indicator se ntlnesc n literatur mai multe abordri. Indicele mediu este parametrul modelului autoregresiv: yt ! I y yt 1  I t , t ! 2, 3,..., n

69

Utiliznd metoda celor mai mici ptrate pentru estimarea parametrului I y , urmtoarea expresie de calcul a indicelui mediu: Iy !

se obine

y
t !2 n t!2

t 1

yt

2 t 1

Metoda este ntlnit n practic sub denumirea de metoda aut oregresi v. O alta expresie de calcul, adecvat pentru indicatori ce evolueaz aproximativ exponenial este urmatoarea: I y ! n 1 yn y1

Ritmul mediu R y se determin pornind de la indicele mediu: R y ! I y  1 sau R y (%) ! I y 100  100 . c) Diferena medie absolut Expresia de calcul a diferenei medii absolute: (y ! sau echivalent:

y
t !2

 yt 1

n 1 (y !

(
t !2

t / t 1 y

n 1

y n  y1 . n 1

4.2.2. Componentele unei serii cronologice. Modelul clasic de descompunere O serie cronologic este o secven de observaii asupra unei variabile, ordonate dup parametrul timp. Frecvent, msurtorile asupra variabilei sunt efectuate la intervale egale de timp, seria cronologic fiind prezentat sub forma: 1 2 ... t ... n Y : y y ... y ... y 1 t n 2 n abordarea tradiional, fluctuaiile din seriile cronologice sunt privite ca o rezultant a suprapunerii urmtoarelor componente: tendina T, componenta ciclic C, sezonier S respectiv rezidual E. Primele trei componente sunt considerate deterministe, sistematice, determinate de factori cu aciune continu asupra fenomenului, n timp ce componenta rezidual are caracter aleator fiind efectul aciunii unor factori imprevizibili, accidentali. Modelul clasic de descompunere a seriilor cronologice este de regul: y aditiv: Y ! T  C  S  E sau y multiplicativ: Y ! T C S E respectiv y o combinaie mixt a componentelor seriei. Tehnicile de analiz, in acest context, au ca obiective: - separarea fiecrei componente i modelarea comportamentului su, respectiv

70

- previziunea evoluiei fiecrei componente, iar apoi compunerea acestora n scopul obinerii de previziuni privind evoluia fenomenului Y. Principiul de la baza acestei tehnici este descompune pentru a modela iar apoi recompune. 4.2.3. Estimarea componentei de tendin Funcii elementare utilizate n modelarea tendinei Cele mai uzuale funcii utilizate pentru modelarea tendinei indicatorilor din economie sunt redate n tabelul 1.. Tabelul 1. Funcii elementare utilizate n modelarea tendinei Tendin Forma liniarizat Diferene aprox. Constante liniar (t y/ t 1 ! y t  yt 1 Tt ! a  bt t / t 1 (2) 1 / t  2 parabol T ! a  bt  cX (y ! (t y/ t 1  (t y 2 Tt ! a  bt  ct unde X ! t hiperbol Tt ! a  b 1 t T ! a  bX unde X ! 1 t Z ! A  Bt unde Z t ! ln Tt ;
/ t 1 (tty ! ty t  (t  1) y t 1

exponenial Tt ! a b t

/ t 1 (tln y ! ln y t  ln y t 1

putere Tt ! a t b

A ! ln a; B ! ln b Z ! A  bX unde Z t ! ln Tt ; A ! ln a; X ! ln t T ! a  bX unde X ! ln t

logaritmic Tt ! a  b ln t curba logistic a , Tt ! 1  e b ct a, c " 0

Stabilirea fu nciei adecvate pentru modelarea tendinei n acest scop sunt utile urmtoarele precizri: y cronograma seriei iniiale sau a valorilor netezite sugereaz funciile candidate, numite i linii posibile de tendina; y cea mai adecvat funcie pentru modelarea tendinei poate fi considerat aceea pentru 2 care se realizeaz minimul sumei ptratelor reziduurilor min y t  Tt ;
t

este adecvat tendina liniar atunci cnd diferenele absolute cu baza n lan (t y/ t 1 ! yt  yt 1 sunt aproximativ constante. De asemenea, precizri specifice n acest sens pentru parabol, exponenial respectiv hiperbol gsim n tabelul 1.

71

Estimarea parametrilor tendinei. Pentru estimarea parametrilor tendinei liniare Tt ! a  bt se utilizeaz metoda celor mai mici ptrate, expresiile de calcul a parametrilor a, b sunt deci urmtoarele: b!

(t  t )( y
t !1 n t !1

Y) ,
2

(t  t )
sau echivalent b!

a ! Y  bt , M (tY )  M (t ) M (Y ) , M (t 2 )  [M (t )] 2

a ! Y  bt . Seria prezint o tendin de cretere atunci cnd b > 0 respectiv de descretere dac b < 0. Cu excepia curbei logistice, celelalte funcii neliniare din tabelul1 pot fi aduse la o form liniarizat prin anumite substituii, respectiv prin aplicarea operaiei de logaritmare n cazul funciei exponeniale i a funciei putere. Exemplu. Estimarea tendinei liniare Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie 1999 iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare:
Luna (t) Indice (yt) 1 3.7 2 3.8 3 4.1 4 4.3 5 4.5 6 4.8 7 4.9 8 5.1 9 5.3 10 5.5 11 5.6 12 5.8 13 6.0 14 6.2 15 6.3 16 6.5 17 6.6 18 7.0

Cronograma seriei sugereaz prezena unei tendine liniare, peste care se suprapune o component aleatoare de amplitudine redus: yt ! a  bt  I t , t ! 1, 2,...,18. Parametrii tendinei se determin din relaiile: M (tY )  M (t ) M (Y ) b! 2 M (t 2 )  ?M (t )A a ! M (Y )  bM (t ).

Figura 1. --S-- Indice pre productie industrial; ------ Tendina

72

Exemplificm din calculele intermediare: 1  2  .  18 M (t ) ! ! 9 .5 18 3.7  3.8  .  7.0 M (Y ) ! ! 5.33 18 (1 v 3.7)  (2 v 3.8)  .  (18 v 7.0) M (tY ) ! ! 55.72 18 12  2 2  .  18 2 M (t 2 ) ! ! 117,2 18 rezultnd 55.72  9.5 v 5.33 b! ! 0.19, 117.2  (9.5) 2 a ! 5.33  0.19 v 9.5 ! 3.55. Tendina seriei se estimeaz prin funcia de gradul nti: Tt ! 3.55  0.19t , al crei grafic este redat n figura 1. 4.2.4. Estimarea componentelor deterministe n cazul seriilor sezoniere Presupunem n acest paragraf c seria cronologic prezint tendin, sezonalitate i o component aleatoare. Vom prezenta modul de estimare a tendinei respectiv a componentei sezoniere. 4.2.4.1. Modelul de descompunere. Perioada componentei sezoni ere Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei. n general, este adecvat un model aditiv atunci cnd amplitudinea oscilaiilor est e aproximativ constant respectiv multiplicativ dac amplitudinea crete sau scade n timp. Frecvent n practic este mai adecvat modelul multiplicativ. Perioada componentei sezoni ere, notat cu p, reprezint numrul unitilor de timp din cadrul unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata unui ciclu de un an, p fiind egal cu 4 n cazul datelor trimestriale respectiv 12 n cazul datelor lunare. Prin extensie pot fi studiate i fenomene cu durata unui ciclu mai mic de un an.

4.2.4.2. Mediile mobile Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplic datelor o medie mobil de ordin p egal cu perioada componentei sezoniere. Mediile mobile de ordin p, notate n continuare MM(p), sunt definite de urmtoare relaii: y daca p este impar p ! 2k  1 , mediile mobile de ordin p sunt y  yt  k 1  ...  y t  ...  y t  k yt ! t k ; t ! k  1, k  2,..., n  k ; p y daca p este par p ! 2k se definesc analog y t  k 0 ,5  yt k 1,5  ...  y t  0,5  yt 0 ,5  ....  y t  k  0 ,5 yt ! , p t ! k  0,5; k  1,5; ... ; n  k  0,5.

73

In cazul p par, se introduc mediile mobile centrate de ordin p definite prin: y t 0 ,5  y t  0 ,5 0,5 yt k  y t  k 1  ...  y t  ...  y t  k 1  0,5 y t  k ! yt ! . 2 p 4.2.4.3. Estimarea tendinei n cazul seriilor cu component sezonier n cazul seriilor sezoniere se ntlnesc preponderent n literatur doua modaliti de estimare a tendinei: y desezonalizarea seriei iar apoi estimarea tendinei pornind de la valorile desezonalizate (vezi 4.2.3.); y modelarea tendinei pornind de la mediile anuale. 4.2.4.4. Estimarea componentei sezoniere Notaii: t indice pentru an (n general pentru un ciclu sezonier), variind de la 1 la n; s indice pentru sezon, variind de la 1 la p. Modelul de descompunere a seriei are forma: yij ! TC ij  S j  I ij respectiv yij ! TC ij S j I ij Metoda comparrii cu mediile mobile n cazul modelului multiplicativ yij ! TC ij S j I ij metoda se ntlnete n literatur i sub denumire de metoda raportrii la mediile mobile i const n urmtoarele: y calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere; y calculul rapoartelor Sij ! yij / y ij ce cuantific abaterea datelor observate de la tendin - ciclu. Dac fixm indicele j (ne situm n sezonul j), aceste diferene constituie estimaii pentru S j ; y determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaiilor precedente: 1 n 1 Ij ! S ij ; j ! 1, 2,..., p , n  1 i !1 aceasta justificndu-se prin necesitatea eliminrii efectului aleator din S ij . Pentru a nu fi afectai de valorile extreme, uneori nainte de calculul mediei, aceste valori se elimin, sau n loc de medie se ia valoarea median a estimaiilor S ij ; y determinarea componentei sezoniere S j , etap ce const ntr-o corecie adus indicilor medii I j astfel nct media lor s fie 1: 1 p S j ! I j / p Ii j ! 1, 2,..., p . i !1 n cazul modelului aditiv y ij ! TC ij  S ij  I ij determinarea componentei sezoniere decurge analog. Exemplu. Estimarea componentelor deterministe n cazul seriilor sezoniere. Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n perioada 1996-2001 sunt indicate mai jos

74

An/Trim. 1996 1997 1998 1999 2000

I 124.1 130.1 157.5 169.7 177.5

II 263.2 280.2 301.2 340.0 407.6

III 252.4 260.6 353.3 350.9 417.2

IV 124.5 151.1 185.0 168.7 224.1

Figura 2. --S-- Produci a de bere; -- -- MM(4); ---- Tendina a) Calculul mediilor mobile de ordi n p=4 Graficul seriei indic prezena unei componente sezoniere predominante, de perioad p = 4. Mediile mobile de ordin p = 4 sunt calculate conform relaiei de definiie a mediilor mobile centrate. Astfel, spre exemplu: 0.5 v y1  y2  y3  y4  0.5 v y5 y3 ! ! 4 0.5 v 124.1  263.2  252.4  124.5  0.5 v 130.1 ! ! 191.8 4 0.5 v y2  y3  y 4  y5  0.5 v y6 y4 ! ! 4 0.5 v 263.2  252.4  124.5  130.1  0.5 v 280.2 ! ! 194.7 4 .
0.5 v y 20  y21  y22  y 23  0.5 v y24 ! 4 0.5 v 224.1  202.9  385.3  425.6  0.5 v 196.6 ! ! 306.0. 4 Datele observate au fost numerotate aici n ordine cronologic y1, y2, ..., y24. Mediile mobile de ordinul 4 t MM(4) t MM(4) y 22 !
1 2 3 4 5 6 191.8 194.7 197.8 202.2 13 14 15 16 17 18 261.7 259.4 258.3 267.7 284.5 299.7

75

7 8 9 10 11 12

208.9 214.9 229.2 245.0 250.8 257.1

19 20 21 22 23 24

309.8 310.2 308.4 306.0 -

b) Estimarea tendinei pornind de la valorile desezonalizate Seria mediilor mobile prezentat grafic relev o uoar tendin de cretere a produciei de bere. Vom considera tendina liniar: Tt ! a  bt  I t , originea de msurare a timpului trimestrul II al anului 1996, unitatea de msur un trimestru. Astfel, pentru trimestrul III 1996 avem t = 1 .a.m.d: t Valori desezonalizate (Z) 1 2 3 191.8 194.7 197.8 M (tZ )  M (t ) M ( Z ) b! , 2 M (t 2 )  ?M (t )A a ! M (Z )  bM (t ). ... ... 19 308.4 20 306.0

Calcule intermediare: M (t ) ! 10.5, M ( Z ) ! 252.9, M (t 2 ) ! 143.5, M (tZ ) ! 2884.9, b ! 6.9, a ! 180.44. Tendina produciei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin: Tt ! 180.44  6.9 v t . c) Estimarea componentei sezoniere prin metoda raportrii la mediile mobile Cum amplitudinea oscilaiilor crete uor n timp, cronograma seriei sugereaz luarea n considerare a unui model multiplicativ: yij ! Tij S j I ij ; i ! 1, 2,..., 6 iar j ! 1, 2, 3, 4 . Datele sunt disponibile pentru 6 ani i sunt prezente aici 4 sezoane. innd seama de notaiile specifice, yij reprezint nivelul produciei de bere n anul i trimestrul j. Astfel, spre exemplu y13 ! y1996; III ! 252.4 sau y34 ! y1998;IV ! 185.0 . Mediile mobile din tabelul anterior vor fi transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim. 1996 1997 1998 1999 2000 2001 I 197.8 229.2 261.7 284.5 308.4 II 202.2 245.0 259.4 299.7 306.0 III 191.8 208.9 250.8 258.3 309.8 IV 194.7 214.9 257.1 267.7 310.2 -

Rapoartele S ij ! tabelul urmator

yij yij

100 , respectiv mediile acestora pentru fiecare sezon sunt indicate n Calculul indicilor sezonalitii I II III INVE STI(I E
65.8 138.6 131.6 124.7 63.9 70.3

An/Trim.

1996 1997

76

1998 1999 2000 2001

Ij Sj

68.7 64.8 62.4 65.8 65.5 65.6

122.9 131.1 136.0 125.9 130.9 131.4

140.9 135.8 134.7 133.5 134.0

71.9 63.0 72.7 68.4 68.8

Media Media

99.6 100

Explicaii privind calculele: y y 252.4 124.5 S13 ! 13 100 ! 100 ! 131.6 , S14 ! 14 100 ! 100 ! 63.9 , y13 191.8 y14 194.7 y 130.1 100 ! 65.8 , .a.m.d. S 21 ! 21 100 ! 197.8 y 21 Cum era de ateptat, aceste rapoarte ntre datele observate i mediile mobile sunt mai mici dect 1 pentru trimestrele I i IV, cnd nivelul produciei a fost sistematic mai mic (sub tendin). S  S 31  S 41  S 51 I1 ! 21 ! 65.5, I 2 ! 130.9, 4 S  S 23  S 33  S 43 I 3 ! 13 ! 133.5, I 4 ! 68.4. 4 Valoarea medie a acestor indici este 99.6, astfel c este necesar o corecie astfel nct media s fie 100: I 65.5 S1 ! 1 100 ! 100 ! 65.6, S 2 ! 131.4, S 3 ! 134.0, S 4 ! 68.8 . 99.6 99.6 Urmare a caracterului sezonier specific produciei de bere, n trimestrul I producia a fost mai mic n medie cu 34.4% dect valorile corespunztoare de pe tendin. n trimestrul II producia a fost n medie mai mare de 1.314 ori dect valorile de pe tendin. Analog se interpreteaz S3 i S4. Componenta sezonier este dat de vectorul format cu indicii sezonalitii: S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688). 4.2.5. Componenta ciclic. Componenta aleatoare a) Componenta ciclic Pentru separarea componentei ciclice se poate utiliza metoda comparrii cu tendina. Spre exemplu n cazul modelului multiplicativ: Y ! T S C E , metoda const n calculul indicilor de ciclicitate. Astfel: y se estimeaz tendina printr-o funcie elementar. Dac seria prezint sezonalitate se pornete de la datele desezonalizate sau de la mediile anuale; y se elimin componenta sezonier din datele observate, iar apoi se utilizeaz medii mobile n scopul eliminrii i a componentei aleatoare rezultnd valorile netezite y t (astfel y t ! T C ); y se calculeaz indicii de ciclicitate Ct prin raportare la tendin: y Ct ! t Tt b) Componenta aleatoare:

77

I ij !

y ij Tij C ij S j

n cazul modelului multiplicativ, respectiv

I ij ! y ij  (Tij  C ij  S j ) n caz aditiv. 4.2.6. Previziuni utiliznd modelul de descompunere. Msurarea acurateii previziunilor a) Previziuni utiliznd modelul de descompunere se obin prin compunerea previziunilor realizate pentru fiecare component prezent n serie, innd seama de forma modelului: S respectiv Y S . !T C !T C Y b) Msurarea acurateii previziunilor. Dac modelul elaborat conduce la previziunile p corespunztoare datelor y1 , y 2 ,..., y p , pentru a msura calitatea acestuia de a y1 , y 2 ,..., y genera previziuni adecvate se utilizeaz o serie de indicatori sintetici ai erorilor de previziune, cei mai frecvent ntlnii fiind: 1 p h 2 - eroarea medie ptratic: MSE ! y h  y p h !1 - eroarea medie absolut: MAE ! 1 p h yh  y p h !1 MAPE ! h 1 p yh  y h p h !1 y

- eroarea medie absolut exprimat procentual:

Exemplu (continuare). Previziunea produciei de bere Tabelul urmtor conine previziunile, datele reale respectiv erorile de previziune privind nivelul produciei de bere.
An 2001 2002 Trim. III IV I Tendin 325.34 332.24 339.14 Sezonalitate 1.34 0.688 0.656 Previziune 435.95 228.58 217.9 Producie 425.6 196.6 203.2 Eroare -10.35 -31.98 -14.7

Prezentm modul de obinere a rezultatelor anterioare pentru trim. III an 2001. Valorile tendinei respectiv a componentei sezoniere sunt: T (21) = 180.44 + 6.9 v 21 = 325.34 respectiv S 3 = 1.34. Modelul de descompunere considerat a fost cel multiplicativ, astfel c valoarea previzionat este: y ! 325.34 v 1.34 ! 435.95 iar eroarea de previziune aferent: e ! 425.6  435.95 ! 10.35 Exemplu (continuare). Previziunea indicelui lunar al preului produci ei industriale. Avnd n vedere tendina estimat privind evoluia acestui indicator: Tt = 3.55 + 0.19t 78

previziunile respectiv erorile de previziune pentru perioada Iulie - Decembrie 2000 sunt indicate mai jos: Luna Indice y Previziune y Eroare e I 7.40 7.16 0.24 A 7.66 7.35 0.31 S 7.96 7.54 0.42 O 8.26 7.73 0.53 N 8.47 7.92 0.55 D 8.65 8.11 0.54

Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinei conduce la: y19 = T19 =3.55 + 0.19 v 19 = 7.16 e19 = y19 - y19 = 0.24. 4.2.7. Alte metode de previziune a) Previzi uni utiliznd modele de regresie. Odat estimat i validat, un model de regresie poate fi utilizat pentru previziunea variabilei dependente. b) Netezirea seriei respectiv previziuni utiliznd modele de netezire exponeni al Varianta simpl a acestei tehnici, n care previziunile sunt obinute ca o medie ponderat a datelor reprezentnd trecutul: n (h) ! c (1  c) j y n  j , c ? 0,1A y
j !0 n 1

este adecvat previziunii seriilor staionare. Metoda generalizat n varianta Holt-Winters este adecvat pentru serii cu tendin i sezonalitate, model multiplicativ. Previziunile sunt date de o funcie de previziune local liniar, valorile de pe tendina liniar fiind corectate cu un indice sezonier aferent sezonului pentru care se realizeaz previziunea. Atunci cnd cronograma seriei nu ofer indicii foarte clare privind prezena respectiv forma tendinei, este indicat a se utiliza n prealabil o tehnic de netezire ce atenueaz amplitudinea fluctuaiilor aleatoare din serie, scopul fiind evideni erea tendinei. Tehnicile de netezire general utilizate sunt mediile mobile sau tehnicii netezirii exponeniale.

Teme de control. Probleme propuse


Problema 1. Estimarea si extrapolarea tendintei 1.1. Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie 1999 iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare: Luna (t) Indice (yt ) 1 3.7 2 3.8 3 4.1 4 4.3 5 4.5 6 4.8 7 4.9 8 5.1 9 5.3

Luna (t) 10 11 12 13 14 15 16 17 18 Indice (yt ) 5.5 5.6 5.8 6.0 6.2 6.3 6.5 6.6 7.0 Se cere: a) estimarea parametrilor tendintei liniare b) previziunea indicelui lunar al preului produciei industriale pentru urmatoarele doua luni. 1.2. Datele de mai jos redau evoluia vnzrilor dintr-un produs pe o perioad de 10 luni consecutive:

79

Luna F M A M I I A S O N Vnzri 20 32 40 47 52 60 62 63 65 67 Se cere: estimarea parametrilor parabolei de tendinta. 1.3. Populaia Romniei a crescut n perioada 1980-1988 ntr-un ritm destul de accelerat, dup cum arat i datele de mai jos:
An Nr. pop. (mil. Loc.) 1980 22.20 1981 22.35 1982 22.48 1983 22.55 1984 22.62 1985 22.72 1986 22.82 1987 22.94 1988 23.15

Se cere: a) datele confirm ipoteza modelrii tendinei printr-o funcie exponenial? b) estimarea parametrilor tendintei exponentiale; c) previziunea populaiei Romniei pentru urmatorii cinci ani. Comparatii cu valorile reale. Problema 2. Descompunerea si previziunea seriilor sezoniere Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n perioada 1996-2001 sunt indicate in tabelul urmtor: An/Trim. I II III IV 1996 124.1 263.2 252.4 124.5 1997 130.1 280.2 260.6 151.1 1998 157.5 301.2 353.3 185.0 1999 169.7 340.0 350.9 168.7 2000 177.5 407.6 417.2 224.1 2001 202.9 385.3 425.6 196.6 Se cere: a) Estimarea tendinei pornind de la valorile desezonalizate; b) estimarea componentei sezoniere; c)determinarea componentei ciclice respectiv aleatoare. Descompunerea seriei pe componente; d) previziunea produciei de bere pentru urmatoarele patru trimestre. Problema 3. Determinarea nivelului mediu 3.1. Populaia judeului Cluj la principalele recensminte a fost: An 1930 1948 1956 1966 1977 1992 Nr. pop. (mii loc.) 475.5 520 580.3 629.7 715.7 736.3 Se cere: calculul populaiei medii anuale, pe perioada 1930 1992. 3.2. Numrul navelor utilizate n transportul mrfurilor n perioada 1991-2000 a nregistrat urmtoarea evoluie:
An Nr. nave 1991 269 1992 267 1993 256 1994 250 1995 255 1996 289 1997 283 1998 231 1999 203 2000 192

Se cere: calculul numrului mediu anual de nave utilizate in transportul marfurilor, in perioada considerata. Problema 4. Determinarea indicelui mediu, ritmului mediu respectiv a diferentei medii 4.1. Se cunoate populaia judeului Cluj la ultimele dou recensminte: Recens. 5 ian 1977 7 ian 1992 Nr. pop. (mii loc.) 715.7 736.3 Se cere: indicele mediu anual. Interpretare 4.2. Producia de biciclete n Romnia a sczut dup 1989: An 1990 1991 1992 1993 1994 1995 Prod. (mii buc.) 136 107 67 42 28 22

80

Se cere: a) calculul indicelui mediu prin metoda autoregresiv b) ritmul mediu anual. Interpretare. 4.3. Fondul de locuine din ara noastr a nregistrat o cretere lent dup 1990:
An Fond de loc. (mii) 1991 7659 1992 7683 1993 7710 1994 7749 1995 7782 1996 7811 1997 7837 1998 7860 1999 7883 2000 7907

Se cere: calculul si interpretarea diferenei medii absolute. Problema 5. Cantitatile cumparate q respectiv preturile unitare de cumparare (mii lei) p, pentru 3 produse aflate in consumul populatiei, in doua luni consecutive, au fost:
Luna k-1 q p 8 kg 30 20 buc 70 4 litri 50 Luna q 10 kg 18 buc 5 litri

k
p 35 67 45

Produs 1 Produs 2 Produs 3

Se cere: indicii factoriali ai pretului respectiv ai cantitatii prin toate metodele cunoscute. Comparati rezultatele obtinute. Problema 6. Indicele variatiei integrale si indicii variatiilor factoriale Cunoscnd seriile cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu studii medii (Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive, respectiv: mii persoane
1 luna X Y W 22,23 3,86 0,396 22,24 3,87 0,395 22,34 3,98 0,419 23,21 4,52 0,437 24,7 4,1 0,357 26,85 4,53 0,406 28,7 4,91 0,455 29,1 5,28 0,487 28,3 6,18 0,5 28,3 6,2 0,5 2 3 4 5 6 7 8 9 10

Se cere: a) Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y, W b) indicii exprimnd variaia integral a numrului total de omeri, calculai cu baz fix; c) indicii factoriali de tip Laspeyres, Paasche, Fisher afereni fiecrui factor care influeneaz numrul total de omeri, n ultima luna fa de prima luna.

Bibliografie
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira, ClujNapoca, 2010; 2. Buiga A., Dragos C., Lazar D., Parpucea I., Statistica I, Presa Universitara Clujeana, 2003. 2. Florea I., Parpucea I., Buiga A., [1998] , Statistic descriptiv. Teorie i aplicaii, Editura Continental, Alba Iulia, 1998. 3. Florea I., Parpucea I., Buiga A., Lazar D., [2000] , Statistic inferenial, Presa Universitar Clujean, Cluj Napoca, 2000. 4. Melard G., Methodes des prevision a court terme, Ed. de Universite de Bruxelles, 1990.

81

APLICAII
Problema 1 Considernd rata omajului ca mrime analizat notat cu Z se cere: 1. Expresia de calcul a mrimii Z n funcie de factorii de influen; 2. Avnd seriile cronologice relativ la numrul de omeri X i populaia activ notat cu Y n 10 luni consecutive respectiv: - numrul de omeri 2 3 4 5 6 7 8 9 10 1 X : 330 420 370 480 520 550 600 580 630 635 - populaia activ 2 3 4 5 6 7 8 9 10 1 Y : 3882 4827 4302 5485 5843 6189 6593 6304 6702 6738 redai seria cronologic aferent ratei lunare a omajului; 3. Rata de omaj medie lunar; 4. De cte ori au crescut n medie de la o lun la alta numrul de omeri; 5. Exprimarea, calcularea i interpretarea urmtorilor indici: 5 /1 5 /1 5/1 IZ / x (F ) ; I Z / y (F ) ; I Z . 1) Z (rata omajului) este influenat de numrul de omeri direct proporional i de numrul populaiei active invers proporional. Z! S X 100 ! 100 Pa Y

2 3 4 5 6 7 8 9 10 1 2) Z : 8,5 8,7 8,6 8,75 8,90 8,90 9,1 9,2 9,4 9,42 3) Seria cronologic fiind de momente, nivelul mediu se determin dup urmtoarea relaie: 1 1 Z 1  Z 2  Z 3  Z 4  Z 5  Z 6  Z 7  Z 8  Z 9  Z10 2 Z! 2 ! 10  1 1 1 8,5  8,7  8,6  8,75  8,90  8,90  9,1  9,2  9,4  9,42 2 ! 8,945 2 ! 9 Rata de omaj medie lunar din perioada analizat este de 8,945. 4) IX !

X t  1 X t ! ?X t  1 A
2

82

330 420  420 370  370 480  480 520  520 550  550 600  600 580  580 630  630 635 330 2  420 2  370 2  480 2  520 2  550 2  600 2  580 2  630 2 1386  1554  1776  2496  2860  3300  3490  3654  40005 ! 1,056 1089  1764  1369  2304  2704  3025  3600  3364  3969

Numrul de omeri au crescut n medie de 1,056 ori de la o lun la alta. Z 5 8,9 ! ! 1,047 , rata omajului a crescut de 1,047 n luna a 5-a fa de luna 1. I1 8,5

5 /1 5) I Z !

5 /1 5 /1 5 /1 IZ IZ / x F ! / x L I Z / x P ! 1,57 1,57 ! 1,576

x5 y1 520 3882 5 /1 ! ! 1,576 IZ / x L ! x1 3882 330 y1 x5 y5 5 /1 ! 1,576 IZ / x P ! x1 y5 - rata omajului ar fi crescut de 1,576 datorit modificrii numrului de omeri, populaia activ rmnnd constant;
5 /1 5 /1 5/1 IZ IZ / y F ! / y L I Z / y P ! 0,664

x1 y5 y 3882 5 /1 ! 1 ! ! 0,664 IZ / y L ! x1 y 5 5843 y1 x5 y5 y 5 /1 ! 1 ! 0,664 IZ / y P ! x5 y5 y1 - rata omajului ar fi sczut de 0,664 datorit modificrii populaiei active, numrul de omeri rmnnd constant; 5 /1 5/1 5 /1 IZ / x I Z / y ! 1,57 0,66 ! 1,0465 ! I Z

83

Problema 2 Din mulimea autoturismelor vndute prin licitaie s-a constituit un eantion de 30 de uniti, rezultatele observrii n raport cu variabilele X vechimea autoturismelor exprimat n ani i y preul la care s-au vndut (n milioana lei) sunt prezentate n tabelul urmtor: Nr. crt. X 1 4 2 3 4 5 6 7 8 9 10 1 9 Y 30 40 20 Nr. crt. 11 12 13 14 15 16 17 18 19 20 X 6 Y 32 Nr. crt. X 21 7 22 23 24 25 26 27 28 29 30 Y 30

5 33 11 24 13 19 2 38 8 22 12 20 20 10 5 35 14 17

10 25 5 36 8 23 10 27 12 22 3 9 35 29

13 17 15 17 8 28 13 20 19 13 6 0 33 41

14 19 7 30

Se cere: 1. Elaborarea repartiiei bidimensionale tiind c numrul de intervale pentru variabila X = 4, iar lungimea unui interval pentru Y,ly = 8 intervalele fiind egale. 2. Parametrii tendinei centrale n raport cu preul de vnzare i interpretarea acestora; 3. Studierea reprezentativitii funciilor de regresie, liniar i hiperbolic i alegerea celei mai reprezentative; 4. Pentru funcia aleas la punctul precedent calculai parametrii. X max  X min 20  0 ! !5 numar intervale 4

1) lungime interval =

10;15 ? 15;20 ?0;5 ?5;10 ? X : 5 12 10 3 10;18 ? 18;26 ?26;34 ?34;42 ? Y : 5 10 9 6 X Y [10;18) [18;26) [26;34) [34;42) TOTAL [0;5) 1 4 5 [5;10) 3 7 2 12 [10;15) 2 7 1 10 [15;20) 3 3 TOTAL 5 10 9 6 30

84

2) Media: 14 5  22 10  30 9  37,5 6 785 ! ! 26,26 N 30 30 - preul mediu de vnzare al mainilor este de 26,26 mii lei 1 30 Mediana: rMe ! N ! ! 15 2 2 5  10 ! rMe ! 15 Me ? 18;26 15  5 Me ! 18  8 ! 26 10 jumtate din maini se vnd cu un pre mai mic de 26.000 mii lei, iar cealalt jumtate cu un pre mai mare de 26.000.000 lei.
i

Y!

Y
i !1

'

Ni

10  26 ?26;41 ? 15 15 Modala: max(5, 10, 9, 6) = 10 Mo [18;26) Cele mai multe autoturisme se vnd cu un pre cuprins ntre 18.000 i 26.000 mii lei. 10  5 5 Mo ! 18  8 ! 18  8 ! 24,66 10  5  10  9 5 1 - cea mai mare parte a autoturismelor se vnd la un pre n jur de 24.666,666 mii lei. 3) Din tabelul de corelaie se observ c frecvenele diferite de zero sunt grupate, rezult c ntre cele dou variabile exist legtur, ce poate fi modelat cu ajutorul funciei de regresie. a. Dac funcia de regresie este o drept Y ( X ) ! a  bx 1 b. Dac funcia de regresie este o hiperbol Y ( X ) ! a  b x Mai reprezentativ este funcia care are coeficientul de regresie mai mare. Ca urmare trebuie calculat acest coeficient pentru cele dou cazuri. M XY  M X M Y a. RYX ! W X W Y M Y ! 26,26 2,5 5  7,5 12  12,5 10  17,5 3 M X ! ! 9,33 30 1 2 2 2 2 2 14  26,26 5  22  26,26 10  30  26,26 9  38  26,26 6 ! 62,86 WY ! 30 1 2 2 2 2 2 WX ! 2,5  9,33 5  7,5  9,33 12  12,5  9,33 10  17,5  9,33 3 ! 19,1389 30

? ?

A A

M XY ! RYX

1 ?2,5 30 1  2,5 38 4  ...  17,5 14 3A! 216 30 216  9,33 26,26 ! ! 0,836 62,86 19,1389

85

b. RYX '

1 1 M Y  M M Y X X ! W 1 W Y
X

1 1 M ! 0,4 5  0,133 12  0,08 10  0,057 3 ! 0,152 X 30 1 1 2 2 2 2 W 2 ! 0,4  0,152 5  0,133,0152 12  0,08  0,152 10  0,057  0,152 3 ! X 30 ! 0,013 1 1 M Y ! ?0, 4 30 1  0,4 38 4  ...  0,057 14 3A! 4,632 X 30 4,632  0,152 26,26 RYX ' ! ! 0,7218 0,013 62,86 RYX > RYX ' , rezult c dreapta de regresie este mai reprezentativ. 4) Y X ! a  bX

Folosind metoda celor mai mici ptrate, unde M Y  Y X - min, rezult:


2

a  bM ( X ) ! M (Y ) aM ( X )  bM ( X 2 ) ! M ( XY ) a ! M (Y )  bM ( X ) b! M ( XY )  M ( X ) M (Y ) M ( XY )  M ( X ) M (Y ) ! 2 2 WX M ( X 2 )  ?M ( X )A

M (X 2) !

1 2,52 5  7,52 12  12,52 10  17,52 3 ! 106,25 30

b!

216  9,33 26,26 ! 1,516 19,1389 a ! 26,26  1,516 9,33 ! 40,40

Y ( X ) ! 40,40  1,516 X

86

Problema 3 Preul unui produs a fost observat n 30 puncte de vnzare la un moment t dat. Valorile nregistrate sunt urmtoarele: 21; 24; 26; 30; 25,9; 26; 20; 24,2; 27; 29; 25,6; 26,3; 27; 22; 24,5; 28; 25; 27,5; 22,5; 24,7; 26,6; 23,2; 25,1; 27,5; 23; 24,8; 23,7; 25; 22,8; 23. Se cere: 1. 2. 3. 4. elaborarea distribuiei statistice a punctelor de vnzare n raport cu preul; analiza reprezentativitii preului mediu; reprezentarea grafic a structurii repartiiei; avnd seria cronologic ce red variaia preului produsului studiat n 6 luni consecutive ca fiind urmtoarea: 2 3 4 5 6 1 Y : 25 25,7 26 26,5 26,8 28 Calculai i interpretai: a) preul mediu lunar; b) ritmul mediu lunar.

1) elaborarea distribuiei statistice a punctelor de vnzare n raport cu preul: 30  20 10 - calculm lungimea intervalului: l X ! ! !2 5 5 ?20  22 ?22  24 ?24  26 X : 2 7 10

?26  28 ?28  30
8 3

- serie de repartiie unidimensional, avnd la baz o variabil atributiv, cantitativ continu i frecvena absolut. 2) Analiza reprezentativitii preului mediu: 21 2  23 7  25 10  27 8  29 3 42  161  250  216  87 756 25,2 ! ! 30 30 30 - preul mediu este 25,2; X ! p analizm reprezentativitatea mediei cu ajutorul varianei i a coeficientului de variaie a lui Pearson:
2 ! V (X ) ! W X

X
R i !1

' i

X N

N
2

W (X ) ! W

2 X

! V (X )

87

CV ( X ) !

WX X

100

- dac CV(X) u 50% - media este nereprezentativ


2 WX !

30 - preul se abate n medie de la valoarea medie cu 2,15.


2 WX ! WX ! 4,63 ! 2,15

21  25,2 2 2  23  25,2 2 7  25  25,2 2 10  27  25,2 2 8  29  25,2 2 3 ! 4,63

CV ( X ) !

WX X

100 !

2,15 100 ! 0,0853 100 ! 8,53% 25,2

30% media este reprezentativ.

3) Reprezentarea grafic a structurii repartiiei: - reprezentarea grafic a structurii unei repartiii se face cu ajutorul diagramelor de structur; fi ! f1 ! f2 f3 f4 f5 Ni 100 p frecvena relativ N

2 100 ! 0,0667 100 ! 6,67% 30 7 ! 100 ! 0,2333 100 ! 23,33% 30 10 ! 100 ! 0,3333 100 ! 33,33% 30 8 ! 100 ! 0,2667 100 ! 62,67% 30 8 ! 100 ! 0,1 100 ! 10% 30 Q i ! f i 360 Q Q1 ! 24,01Q Q 2 ! 83,99 Q Q 3 ! 119,99 Q Q 4 ! 96,01Q Q 5 ! 36 Q

Titlu: Stuctura punctelor de vnzare n raport cu preul

10%

6,67% 1 23,33% 2 3 4 5 33,33%

26,67%

88

Legend: 1. 6,67% din punctele de vnzare au preuri cuprinse ntre 20 i 22; 2 . 23,33% din punctele de vnzare au preuri cuprinse n intervalul [22 - 24); 3 . 33,33% din punctele de vnzare au preuri cuprinse n intervalul [24 - 26); 4 . 26,67% din punctele de vnzare au preuri cuprinse n intervalul [26 - 28); 5 . 10% din punctele de vnzare au preuri cuprinse n intervalul [28 - 30); 2 3 4 5 6 1 4) Y : 25 25,7 26 26,5 26,8 28 Calculai i interpretai: a) preul mediu lunar; b) ritmul mediu lunar. 1 1  25,7  26  26,5  26,8  28 2 2 ! 26,33 a) Y / luna ! 5 - preul mediu lunar este de 26,33 25

b) R Y ! I Y  1 ! I Y 100%  100% 25,7 25  26 25,7  26,5 26  26,8 26,5  28 26,5 ! 25 2  25,7 2  26 2  26,5 2  26,8 2 642,5  668,2  689  710,2  750,4 ! ! 625  660,49  676  702,25  718,24 3460,3 ! ! 1,0231 3381,98 IY ! R Y ! I Y  1 100 ! 0,0231 100 ! 2,31% - preul a crescut n medie de la o lun la alta cu 2,31%. Problema 4 Se consider un eantion de 100 gospodrii i variabilele X-numr de membrii i Y-cantitatea de pine consumat zilnic de o gospodrie (Kg), rezultatele fiind prezentate n tabelul urmtor: X Y 0,25 0,5 1 1,5 TOTAL 5 5 10 30 5 35 5 15 5 25 89 10 20 30 5 40 30 25 100 1 2 3 4 TOTAL

Se cere: 1. cantitatea medie, median i modal de pine consumat zilnic de o gospodrie (calcul i interpretare); 2. n ce proporie cantitatea de pine depinde de numrul de membrii; 3. analiza numeric i caracterizarea intensitii legturii ntre cele dou variabile. 1) 0,25 0,5 1 1,5 Y : 5 40 30 25 Y - Media 0,25 5  0,5 40  1 30  1,5 25 1,25  20  30  37,5 88,75 Y! ! ! ! 0,89[kg ] 100 100 100

- 0,89 este cantitatea medie de pine consumat zilnic de o gospodrie. Me Mediana - variabila discret N=100 Y N  Y N Me !
2

N ! 50 2 Y50  Y51 0,5  1 ! ! 0,75 2 2

2 1

- jumtate din gospodrii consum zilnic pine ntre 0,25 i 0,75 kg, iar cealalt jumtate ntre 0,75 i 1,5 kg de pine pe zi. Mo Modala - variabila discret NMo = max(N1, N2, N3, N4) NMo = 40 Mo = 0,5 - cele mai multe gospodrii consum zilnic n jur de 0,5 kg de pine. 2) Se calculeaz: rx2 y ! V EXP VTOT

VTOT (Y ) !

2,25  0,89 2 5  0,5  0,89 2 40  1  0,89 2 30  1,5  0,89 2 25 ! 0,18


Y
r i !1 i

Y N

N
2

100

i.

VTOT !

Y/x
J

Y N

N
2

.j

VEXP !

j !1

90

Calculm mediile condiionate ale lui Y n funcie de X. 0,25 5  0,5 5 ! 0,35 10 0,5 30  1 5 ! 0,57 Y 2 ! Y / x2 ! 35 0,5 5  1 15  1,5 5 !1 Y 3 ! Y / x3 ! 25 1 10  1,5 20 ! 1,33 Y 4 ! Y / x4 ! 30 Y 1 ! Y / x1 ! V EXP (Y ) !

100 2,9  3,5,025  5,7 12,35 ! ! ! 0,12 100 100 VEXP 0,12 rx2 ! ! 0,66 66% y ! VTOT 0,18 - consumul zilnic de pine de gospodrie depinde de numrul de membrii al gospodriei n proporie de 66%. 3) Analiza numeric i caracterizarea intensitii legturii ntre cele 2 variabile - X, Y variabile cantitative intensitatea legturii se studiaz cu ajutorul raportului de corelaie (rXY)
2 rXY ! rX Y !

0,35  0,89 2 10  0,57  0,89 2 35  1  0,89 2 25  1,33  0,89 2 30 !

V EXP [0;1] VTOT

2 rXY ! rX 0,66 ! 0,81 p 1 legtura intens ntre cele dou variabile. Y !

Problema 5 Cunoscnd seriile cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu studii medii (Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive, respectiv: mii persoane 10 28,3 6,2 0,5

Lun a X Y W

1 22,2 3 3,86 0,39 6

2 22,2 4 3,87 0,39 5

3 22,3 4 3,98 0,41 9

4 23,2 1 4,52 0,43 7

5 24,7 4,1 0,35 7

6 26,8 5 4,53 0,40 6

7 28,7 4,91 0,45 5

8 29,1 5,28 0,48 7

9 28,3 6,18 0,5

91

Se cere: 1. Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y, W; 2. Seria cronologic avnd la baz numrul total de omeri din judeul Cluj; 3. Numrul mediu lunar de omeri; 4. Indicele mediu i ritmul mediu al numrului total de omeri; 5. Diferena medie absolut a numrului total de omeri; 6. Primii 4 indici exprimnd variaia integral a numrului total de omeri, calculai cu baz fix; 7. Indicii factoriali de tip Paasche afereni fiecrui factor care influeneaz numrul total de omeri n luna 4 fa de luna 1.

1. z(t) = x(t) + y(t) + w(t); 2. Lun a z(t) 1 2

t ! 1, 10

10

26,4 86

26,2 05

27,7 39

28,1 67

29,1 54

31,7 86

34,0 65

34,8 67

34,9 80

35,0 00

3. z(t) este o serie cronologic de momente z(1) z(10)  z(2)  z(3)  .....  z(9)  2 ! 277 ! 30,77 z! 2 9 9 Numrul mediu de omeri din Cluj n cele 10 luni este de 30,77 mii 4. Iz !
10

z (t ) z(t  1)
i !1 10

[ z(t  1)]
i !1

26,505 26,486  26,739 26,505  ....  35 34,98 ! 1,03 26,486 2  26,505 2  ....  34,98 2

n primele 10 luni, numrul de omeri a crescut n medie de 1,03 ori de la o lun la alta. R z ! I z  1 ! 1,03  1 ! 0,03 ! 3% Numrul total de omeri a crescut n medie cu 3% de la o lun la alta. 5. ( z ! z(10)  z(1) ! 0,945 9 Numrul total de omeri a crescut n medie cu 0,954 mii persoane de la un an la altul.

92

2 /1 6. I z !

z 2 26,505 ! ! 1,007 z 1 26,486

Numrul total de omeri din judeul Cluj a crescut de 1,007 ori n luna a doua fa de prima.
/1 I3 ! z

4 /1 Iz

/1 I5 z

z 3 26,739 ! ! 1,0095 z 1 26,486 z 4 28,167 ! ! ! 1,063 z 1 26,486 z 5 29,154 ! ! ! 1,1 z 1 26,486

7. Numrul total de omeri z(t) depinde de factorii de influen astfel: z(t) = x(t) + y(t) + w(t) x 4  y 4  w 4 ! 1,036 x 1  y 4  w 4 Numrul total de omeri ar fi crescut de 1,036 ori n luna 4 fa de luna 1 datorit modificrii numrului de omeri muncitori.
/1 I4 P ! z/x /1 I4 P ! z/y

x 4  y 4  w 4 ! 1,023 x 4  y 1  w 4

Numrul total de omeri ar fi crescut de 1,023 ori n luna 4 fa de luna 1 datorit modificrii numrului de omeri cu studii medii.
/1 I4 P ! z/w

x 4  y 4  w 4 ! 1,0014 x 1  y 4  w 1

Numrul total de omeri ar fi crescut de 1,0014 ori n luna 4 fa de luna 1 datorit modificrii numrului de omeri cu studii superioare. Problema 6 Evoluia numrului de contracte de vnzare ncheiate de o societate n zilele lucrtoare ntr-o anumit perioad a fost urmtoarea: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Y: 20 21 22 21 19 21 22 24 23 22 23 24 25 24 23 Se cere: 1. Tendina mrimii analizate (dac se constat prezena factorilor sezonieri desezonalizai serie). 2. Previziunea mrimii pe urmtoarele 5 zile.

93

Rezolvare: 1. Pentru a determina tendina, trebuie s reprezentm cronograma n vederea stabilirii prezenei factorilor sezonieri: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Y: 20 21 22 21 19 21 22 24 23 22 23 24 25 24 23

30 25 20 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 24 21 22 21 19 21 23 22 22 23 24 25 24 23

Dup cum se observ din grafic, exist factori sezonieri, tendina fiind cresctoare. Deci, variaia numrului de contracte este de forma: y(t) = T(t) + S(t) + (t) unde: T(t) tendina S(t) componenta sezonier (t) factori neeseniali Ne organizm datele astfel: Ziua Spt. 1 2 3 II I 20 21 23 21 22 24 22 24 25 21 23 24 19 22 23 III IV V

Folosind procedeul mediilor mobile calculm seria desezonalizat dup relaia:

94

' Y13 !

Y11  Y12  Y13  Y14  Y15 5 Y  Y13  Y14  Y15  Y21 ' Y14 ! 12 5 . . . . Y  Y32  Y33  Y34  Y35 ' Y33 ! 31 5 Ziua Spt. 1 2 3 II I 21,4 23,4 21,8 23,6 20,6 22,4 23,8 20,8 22,8 21 23,2 III IV V

Calculm coeficienii de sezonalitate: Ziua Spt. 1 2 3 K K ts ! KI ! II I 0,98 0,98 0,98 Yts ' Yts K 2 I  K 3I 2 . . . . K 1V  K 2V 2 1,01 1,02 1,015 1,07 1,07 1,05 1,063 1,01 1,01 1,01 0,90 0,95 0,925 III IV V

KV !

2 3 4 5 6 7 8 9 10 11 1 Y('t ) : 20,6 20,8 21 21,4 21,8 22,4 22,8 23,2 23,4 23,6 23,8

95

25 24 23 22 21 20 19 1 2 3 4 5 6 7 8 9 10 20,6 20,8 21,4 21,8 22,8 22,4 23,2 23,4 23,6 23,8

Din grafic se observ c tendina cea mai probabil este o dreapt. Deci: T(t) = a + bt Punnd condiia ca: M?Y t  T t A =minim, obinem:
2

a ! M [ y(t ]  bM (t ) a  bM (t ) ! M [ y (t )] M [ y (t ) t ]  M [ y (t )] M (t ) b! aM (t )  bM (t 2 ) ! M [ y (t ) t ] 2 M (t 2 )  ?M (t )A 1  2  ...  11 !6 11 1 2  2 2  ...112 ! 4,61 M (t 2 ) ! 11 20,6  20,8  ...  23,8 ! 22,25 M y t ! 11 1 20,6  2 20,8  ...  11 23,8 ! 137,07 M y t t ! 11 137,07  22,25 6 b! ! 0,357 46,1  36 a = 22,25 0,357 6 = 20,108 M (t ) ! 6.1.1.1.1.1 T(t) = 20,108 + 0,357 t 2. Previziunea valorilor lui Y

96

Y4P ! T (14) K I ! 20,108  0,357 14 0,98 ! 24,6 } 25 I Y4P ! T (15) K II ! 20,108  0,357 15 1,015 ! 25,8 } 26 II Y4P ! T (16) K III ! 20,108  0,357 16 1,063 ! 27,44 } 27 III Y4P ! T (17) K IV ! 20,108  0,357 17 1,01 ! 26,4 } 26 IV Y4P ! T (18) K V ! 20,108  0,357 18 1,925 ! 24,54 } 25 V Problema 7 O agenie imobiliar dorete s dispun de o funcie cu ajutorul creia s poat evalua rapid valoarea de pia a apartamentelor. Pentru aceasta, are la dispoziie o baz de date cuprinznd 30 de apartamente observate n raport cu variabilele: Y = preul de vnzare n mii euro X 1 = suprafaa n metri ptrai X 2 = numrul de camere X 3 = finisaj*nr.camere. Se calculeaz prin nmulirea gradului de finisare (0 pentru nefinisat, 1 pentru semifinisat i 2 pentru finisat) cu numrul de camere.

97

Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

X1 22 74 21 32 52 88 48 35 78 80 45 39 68 42 92 50 26 60 64 28 30 83 44 71 28 49 46 22 65 69

X2 1 4 1 2 3 4 2 1 3 4 2 2 3 1 4 2 1 3 3 1 1 4 2 3 1 2 2 1 3 3

X3 2 4 1 4 0 4 0 0 6 8 0 2 0 0 4 0 1 3 6 0 1 0 4 0 2 2 2 1 6 6

15,3 42,0 13,0 20,0 25,8 46,6 24,7 18,9 41,5 47,5 24,0 22,3 33,5 20,7 49,5 26,6 16,0 32,7 38,1 15,1 15,6 39,8 27,0 35,0 17,3 25,5 25,0 14,5 39,5 41,5

Se cere:

98

1) Studiai grafic existena i forma legturii dintre pre i fiecare din variabilele dependente. 2) Calculai parametrii funciei liniare multiple dintre pre i toate variabilele explicative. 3) Este reprezentativ aceast funcie ? 4) S se fac cteva simulri ale valorii de pia a apartamentelor pentru diferite valori ale variabilelor explicative. 5) Comparai reprezentativitatea funciei obinute cu a funciilor de regresie simple. Rezolvare 1) Graficul care ne poate indica existena sau forma legturii este diferit n funcie de natura variabilei explicative: discret sau continu. a) Legtura dintre pre i suprafa. Deoarece suprafaa este o variabil continu, putem construi norul de puncte.

50 45 40
pret (mii euro)

35 30 25 20 15 10 5 0 0 20 40 60 suprafata (mp) 80 100

Se observ c legtura exist i este liniar. b) Legtura dintre pre i numrul de camere. Norul statistic se prezint astfel:

99

50 45 40 35 pret (mii euro) 30 25 20 15 10 5 0 0 1 2 numar camere 3 4

Dac forma legturii nu pare evident prin norul de puncte se poate utiliza i un grafic care folosete mediile condiionate, din grupe. Procednd analog i pentru variabila rmas, concluzionm c putem modela legturile dintre pre i fiecare din variabile prin funcii liniare. 2) Funcia de regresie liniar multipl se scrie : Y ! a1 X 1  a 2 X 2  a 3 X 3  I Prin aplicarea metodei celor mai mici patrate ajungem la ecuaia scris sub form implicit : M 00 ? Y  M (Y )A M 01 ?X 1  M ( X 1 )A M 02 ?X 2  M ( X 2 )A

 M 03 ?X 3  M ( X 3 )A! 0

Scriem matricea de variaie i covariaie : m00 ! m03 m13 m23 m33

M ( 4)

m01 m11

m02 m12 m22

2 m00 ! W Y ! 121,55

m01 ! M (YX 1 )  M (Y ) M ( X 1 ) ! 227 m02 ! M (YX 2 )  M (Y ) M ( X 2 ) ! 11,196 m03 ! M (YX 3 )  M (Y )M ( X 3 ) ! 16,229

100

2 m11 ! W X ! 443 1

m12 ! M ( X 1 X 2 )  M ( X 1 )M ( X 2 ) ! 21,39 m13 ! M ( X 1 X 3 )  M ( X 1 )M ( X 3 ) ! 23,19


2 m22 ! W X ! 1,143 2

m23 ! M ( X 2 X 3 )  M ( X 2 ) M ( X 3 ) ! 1,2767
2 m33 ! W X ! 5,41 3

M ( 4)

121,55 227 11,196 16,229 443 21,39 23,19 ! 1,143 1,2767 5,41

Calculm complemenii algebrici: M 00 ! 193,92 M 01 ! 82,58 M 02 ! 135,4 M 03 ! 195,79 Ecuaia de regresie devine : 193,92? Y  M (Y )A 82,58?X 1  M ( X 1 )A 135,4?X 2  M ( X 2 )A  195,79?X 1  M ( X 3 )A! 0

Prin nlocuirea valorilor medii, avem: 193,92? Y  28,48A 82,58?X 1  51,7A 135,4?X 2  2,3A  195,79?X 1  2,3A! 0

Dup efectuarea calculelor se obine ecuaia sub form explicit : Y ! 2,559  0,4258 X 1  0,698 X 2  1,01X 3  I

101

3) Reprezentativitatea funciei o apreciem prin coeficientul de corelaie liniar multipl: det M ( 4 ) 131,75 ! 1 ! 0,997 m00 M 00 121,55 193,92

RY , X 1X 2 X 3 ! 1 

deci funcia este foarte reprezentativ. 4) Pentru un apartament de 65mp, cu 3 camere, semifinisat : X 1 ! 66 X2 ! 3 X3 ! 3

Y (66,3,3) ! 2,559  0,4258 66  0,698 3  1,01 3 ! 35,8 mii euro Rezultatul este foarte realist dac privim baza de date iniial. 5) Rezolvarea acestui punct rmne la latitudinea cititorului.

102

LUCRRI PRACTICE LUCRAREA 1 P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare populaie selectat precizai: 1. denumirea populaiei, a unitii statistice i volumul acesteia; 2. scopul cercetrii statistice; 3. variabilele statistice n raport cu care s-ar face observarea statistic a populaiei. P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive, relativ la care se cere: 8. denumirea populaiei ce a fost supus observrii i volumul acesteia; 9. unitatea statistic; 10. caracterizarea variabilelor statistice n raport cu care a fost studiat populaia; 11. caracterizarea seriei statistice n raport cu toate criteriile cunoscute; 12. elaborarea seriei bidimensionale format cu frecvene relative, interpretare; 13. extragerea repartiiilor unidimensionale marginale i a celor condiionate; 14. pornind de la o repartiie marginal deducei celelalte serii statistice posibile, interpretare. P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie, avnd la baz o variabil de spaiu, relativ la care se cere: 6. denumirea populaiei statistice i volumului ei; 7. unitatea statistic; 8. caracterizarea seriei dup toate criteriile cunoscute; 9. deducerea seriei format cu frecvene relative; 10. interpretare. P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan (interpretri). P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate. P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare. P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul economic. LUCRAREA 2 Lund ca exemplu o populaie statistic studiat n raport cu un anumit numr de variabile (stabilite n raport cu obiectivul studiului), se cere: P1. Elaborarea tuturor seriilor statistice de repartiie unidimensionale P2. Elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una are la baz dou variabile cantitative) P3. Reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur, diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma. LUCRAREA 3

103

Considerm o populaie statistic din lucrrile anterioare observat n raport cu mai multe variabile. Se cere: 1. Alegei dou variabile (una cantitativ, cealalt calitativ) i construii repartiia populaiei n raport cu fiecare din ele; 2. Calculai i interpretai corespunztor parametrii tendinei centrale (valoarea medie, median, modal) pentru seria care are la baz variabila cantitativ; 3. Analizai reprezentativitatea parametrilor tendinei centrale (sub form absolut i relativ) 4. Folosind parametrii de structur analizai structura populaiei n raport cu variabila cantitativ; 5. Analizai gradul de dispersare a unitilor populaiei n raport cu variabila cantitativ; 6. Caracterizai sintetic concentrarea unitilor din populaie folosind variabila nenumeric; 7. Analiza statistic a asimetriei repartiiei de la punctul 1; 8. Analizai comparativ rezultatele obinute la punctele 5 i 6. LUCRAREA 4 P1. Pentru o distribuie n raport cu dou variabile calitative ntre care se presupune c ar putea exista vreo legtur, se cere : 1. Verificarea existenei legturii dintre cele dou variabile. 2. Dac legtura exist, ct de intens este aceasta ? P2. Pentru o populaie observat n raport cu dou variabile cantitative ntre care ar putea exista o legtur, se cere : 1. Aprecierea existenei i a intensitii legturii dintre variabile ; 2. S se formuleze pe baza unui grafic adecvat ipoteze cu privire la forma posibil a funciei de regresie dintre ele ; 3. Pentru funciile reinute ca fiind posibile, s se calculeze parametrii ; 4. Care din aceste funcii este mai reprezentativa ? 5. Pentru funcia aleas s se fac cteva simulri ale valorilor previzionate prin aceasta. P3. Pentru o populaie observat n raport cu mai multe variabile, n care presupunem c una din ele depinde de celelalte se cere : 1. Pe baza unui tip de grafic adecvat, s se stabileasc dac ar putea exista legtur ntre variabila dependent i fiecare din celelalte variabile; 2. n ipoteza unei legturi liniare multiple, s se calculeze parametrii funciei; 3. S se stabileasc reprezentativitatea acestei funcii i s se compare cu reprezentativitatea fiecreia dintre funciile liniare simple. LUCRAREA 5 P1. Pentru trei produse, n dou luni consecutive se cunosc preul de vnzare i respectiv cantitile vndute. Se cere : 1. Indicele variaiei integrale ; 2. Indicii factoriali ai preurilor i respectiv cantitilor vndute, prin metodele L, P, F. Este verificat sau nu condiia de completitudine ? P2. Din Anuarul Statistic al Romniei, extragei structura de consum a populaiei pentru trei grupe de produse :

104

- mrfuri alimentare - mrfuri nealimentare - servicii pentru dou luni consecutive. Se cere : 1. Indicii preurilor pe cele trei grupe ; 2. Calculai indicele preului (pe total) de tip L i P. P3. Dac pentru un co bursier format din trei aciuni se cunoate : - cursul fiecrei aciuni - numrul de aciuni tranzacionate s se calculeze indicele bursier. Lucrarea 6 P1. Alegnd o serie cronologic din lucrarea 1, care manifest component de tendin, se cere : 1. Diferena medie absolut, indicele mediu, ritmul mediu ; 2. Emiterea unor ipoteze privind forma tendinei ; 3. Estimarea parametrilor tendinei ; 4. Previziunea pentru urmtoarele trei perioade. P2. Pentru o serie cronologic ce prezint component sezonier, se cere : 1. Cronograma i precizarea componentelor prezente ; 2. Calculul mediilor mobile de ordin p (p=perioada componentei sezoniere) ; 3. Calculul i interpretarea coeficienilor sezonalitii ; 4. Estimarea parametrilor tendinei ; 5. Previziuni pentru urmtoarele 4 perioade de timp.

105