Sunteți pe pagina 1din 105

UNIVERSITATEA BABE -BOLYAI, CLUJ-NAPOCA Centrul de Formare Continu i nv mnt la Distan Facultatea de tiin e Economice i Gestiunea Afacerilor Specializarea:

Trunchi Comun Disciplina: Statistic Descriptiv

SUPORT DE CURS
ANUL II Semestrul 1

Cluj Napoca 2011

I. Informa ii generale 1.1. Date de identificare a cursului Date de contact ale titularilor de curs: 1. Nume: Conf. univ.dr. Anu a Buiga Birou: Birou 346 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: anuta.buiga@econ.ubbcluj.ro 2. Nume: Conf.univ.dr. Drago Cristian Birou: Birou 231 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: cristian.dragos@econ.ubbcluj.ro 3. Nume: Conf.univ.dr. Dorina Laz r Birou: Birou 527 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: dorina.lazar@econ.ubbcluj.ro 4. Nume: Lect.univ.dr. Cristian Litan Birou: Birou 231 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: cristian.litan@econ.ubbcluj.ro 5. Nume: Lect.univ.dr. Codruta Mare Birou: Birou 346 sediul Fac. de tiin e Economice i Gestiunea Afacerilor, str. Teodor Mihali 58-60 Telefon: 0264-418654 E-mail: codruta.mare@econ.ubbcluj.ro

MODULUL 1
Concepte de baz . Obiectul statisticii. Observarea, sistematizarea i prezentarea seriilor statistice. Obiective
y y y y y y definirea unei popula ii statistice, a variabilelor statistice ob inerea de informa ii cu privire la fenomenul supus cercetarii organizarea datelor i prezentarea acestora sub form de serii statistice eviden ierea structurii popula iei n raport cu variabilele observate eviden ierea evolu iei unui fenomen n timp sau spa iu reprezentarea grafic a datelor

Concepte de baz
y y y popula ie statistic , unitate statistic , volum, e antion, variabil statistic , observare statistic , indicator statistic, serie statistic observare statistic , serii statistice unidimensionale i bidimensionale reprezentarea grafic a datelor relativ la o variabil cantitativ , la o variabil calitativ i la dou variabile

Rezultate a teptate
Cunoa terea i st pnirea no iunilor statistice de baz , cunoa terea tehnicilor de culegere, grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul eviden ierii varia iei unei m rimi sau a structurii popula iei supuse studiului.

Sinteza
1. Concepte de baz 1.1. Popula ia statistic Popula ia statistic reprezint mul imea elementelor simple sau complexe, de aceea i natur , care au una sau mai multe nsu iri esen iale comune, proprii elementelor ct i popula iei privit ca un tot unitar. [Florea I.,1998] O popula ie este finit dac include un num r determinat de elemente, dar ea poate fi considerat drept reprezentativ pentru o popula ie teoretic infinit . Ca urmare apare necesitatea de a delimita o popula ie n: con inut, spa iu i timp. Se mai denume te i popula ia univers. Exemple de popula ii statistice: mul imea persoanelor dintr-o anumit ar (localitate, zon etc.) n anul t, mul imea gospod riilor din Romnia, la momentul t, mul imea consumatorilor unui produs, mul imea societ ilor produc toare sau concurente ale unui produs, mul imea societ ilor distribuitoare, angaja ii unei societ i, etc. Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc. Unitatea statistic constituie elementul component, al popula iei statistice, asupra c ruia se va efectua nemijlocit observarea. 3

Unitatea statistic este purt torul originar de informa ie sau subiectul logic al informa iei statistice. Datorit variet ii aspectelor sub care se poate prezenta n fapt, unitatea statistic comport o defini ie precis , care s exclud prin posibilitate de interpretare diferit de c tre observatori i astfel orice eroare ce poate prejudicia valoarea investiga iei. n exemplele citate mai sus, unit ile statistice sunt: persoana, gospod ria, consumatorul, societatea produc toare sau concurent , societatea distribuitoare, angajatul etc. Se noteaz cu minusculele corespunz toare majusculei ce simbolizeaz popula ia statistic , respectiv ai, bi etc.. Volumul popula iei reprezint num rul unit ilor statistice care alc tuiesc popula ia statistic , Acesta poate fi finit sau infinit, n func ie de tipul popula iei care poate fi la fel finit sau infinit . Se noteaz cu N, iar pentru o popula ie A, avem: A : {a1, a2, ..., aN} E antion reprezint o submul ime a unei popula ii statistice, constituit dup criterii bine stabilite. n raport cu procedeul de formare a e antionului avem e antioane aleatoare i e antioane dirijate. E antionul aleator este format din unit ile statistice care rezult printr-un procedeu aleator: procedeul tragerii la sor i, tabelul cu numere ntmpl toare, procedeul extragerilor sistematice. E antionul dirijat este constituit pe baza unor informa ii auxiliare existente la nivelul popula iei studiate sau l snd liber pe anchetator s aleag unit ile respectnd doar realizarea structurii e antionului n func ie de criteriile stabilite. Se noteaz cu n. Majoritatea studiilor au ca suport datele provenite de la nivel de e antion, de aici importan a constituirii acestuia i implicit, apelarea la inferen a statistic , pentru a estima parametrii la nivelul popula iei univers. 1.2. Variabila statistic Variabila statistic reprezint o nsu ire sau o tr s tur comun tuturor unit ilor unei popula ii. Nivelul nregistrat de o variabil statistic la o unitate oarecare al popula iei se nume te realizare sau starea variabile. [Florea I., 1998]. n general se noteaz cu majusculele de la sfr itul alfabetului, X, Y, Z etc. Dac se noteaz cu X o variabil statistic oarecare, atunci cu x1, x2, ..., xN se vor nota st rile variabilei respective. Variabilele statistice se clasific n raport cu natura, modul de exprimare i modul de varia ie. a) Dup natura lor variabilele statistice pot fi atributive, de timp i de spa iu. y Variabila atributiv exprim un atribut sau nsu ire esen ial (alta, dect timpul sau spa iul) unit ilor popula iei; y Variabila de timp ne arat timpul n care au luat fiin unit ile popula iei sau perioada de timp n care au existat (exista); y Variabila de spa iu ne arat spa iul n care exist sau au luat na tere unit ile popula iei. b) Dup modul de exprimare a st rilor deosebim: y Variabil cantitativ este variabila ale c rei st ri se exprim prin valori numerice. Se mai nume te i variabil metric .

Variabil calitativ este variabila ale c rei st ri se exprim prin cuvinte sau coduri. Se mai nume te variabil nominal (st rile se exprim prin cuvinte) sau variabil ordinal (st rile se exprim prin coduri). c) Dup modul de varia ie variabila cantitativ poate fi: y Variabil discret este acea variabil care, n intervalul s u de defini ie nregistreaz cel mult valori ra ionale, varia ia are loc n salturi. y Variabil continu este acea variabil care poate lua orice valoare real din intervalul s u de varia ie. Exemple de variabile statistice relativ la popula ia format din mul imea consumatorilor unui produs: - vrsta: variabil atributiv , cantitativ , continu X = { x1 = [15-20) [20-30) ... } - frecven a de cump rare: variabil atributiv calitativ Y = { y1 - foarte rar; y2 rar, ... } - num r de sortimente cump rate relativ la produsul analizat: variabil atributiv , cantitativ , discret : Z = { z1 = 1; z2 = 2, ... } - localizarea magazinelor de unde cump r : variabil de spa iu, calitativ S = { s1 cartierul M sau s2 strada P1, ... } - data ultimei cump r ri a produsului analizat: variabil de timp, cantitativ T = { t1 = 27.01.2002; t2 = 24.02.2002, ... } Variabila aleatoare Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mul imi finite sau infinite, cu o anumit probabilitate, rezultat dintr-o func ie asociat variabilei, numit lege de probabilitate. Ca i variabila statistic , variabila aleatoare n raport cu valorile sale poate fi discret sau continu . n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic constituie o nsu ire cert a unit ilor statistice din popula ie. Valorile unei variabile aleatoare sunt probabile i n strns leg tur cu un anumit experiment. St rile unei variabile statistice nu sunt probabile, ele cuantific o tr s tur proprie fiec rei unit i din popula ie. 1.3. Observarea statistic Observarea statistic const n identificarea unit ilor popula iei i nregistrarea st rilor variabilelor n raport cu care este studiat . Ansamblul st rilor variabilelor rezultate prin observare se numesc statistici. Dup gradul de cuprindere a popula iei statistice, observarea statistic este de dou feluri: total i par ial . Observarea total este acel tip de observare statistic n care are loc nregistrarea tuturor unit ilor care fac parte din popula ie statistic supus studiului. Recens mntul popula iei Romniei este un exemplu de observare total . Observarea par ial presupune observarea i nregistrarea unui anumit num r de unit i din popula ie, alese dup criterii bine definite. n cercetarea statistic a unei popula ii punctul de pornire l poate constitui fie statistice exhaustive rezultate prin observarea popula iei univers , fie statisticile rezultate din observarea par ial a unui e antion A, n ambele cazuri scopul final fiind acela i, respectiv ob inerea de informa ii la nivelul popula iei univers A.

1.4. Seria statistic


Seria statistic este o construc ie care red fie distribu ia unei popula ii n raport cu una sau mai multe variabile, fie varia ia unei m rimi n timp, n spa iu sau de la o categorie la alta. Seriile statistice se clasific n raport cu mai multe criterii, astfel: 1. n raport cu num rul variabilelor y Serii statistice unidimensionale, au la baz o singur variabil ; y Serii statistice multidimensionale, care au la baz dou sau mai multe variabile. 2. Dup natura variabilelor deosebim: y Serii atributive, care au la baz variabile atributive; y Serii cronologice (de timp sau istorice), care au la baz variabile de timp; y Serii de spa iu sau teritoriale, care au la baz o variabil de spa iu. 3. Dup modul de exprimare a st rilor variabilei deosebim: y Serii calitative, care au la baz variabile calitative; y Serii cantitative, care au la baz variabile cantitative i care dup modul de varia ie a variabilei pot fi: discrete (cnd variabila este discret ) i continue (cnd variabila este continu ). 4. n raport cu natura indicatorului din care este alc tuit seria, avem: y Serii de frecven sau serii de distribu ie (reparti ie); y Serii de varia ie. Seria statistic rednd distribu ia popula iei n raport cu una sau mai multe variabile constituie o descompunere a acesteia ntr-un num r R de clase. O astfel de serie este format n exclusivitate din frecven e (absolute cumulate sau necumulate, relative cumulate sau necumulate) i de aceea se numesc serie de frecven , de distribu ie sau de reparti ie. Prescurtat se mai folose te i denumirea de reparti ie statistic sau distribu ie statistic . Seria statistic ce red varia ia unei m rimi n timp, n spa iu sau de la o categorie la alta se nume te serie de varia ie. 1.4.1. Seria statistic de reparti ie Conform defini iei de mai sus, prin aceast serie se distribuie unit ile unei popula ii statistice n raport cu una sau mai multe variabile. Fie o serie statistic unidimensional avnd la baz variabila X, respectiv: x X : 1 N 1 x2 N2 ... xi ... xR ... N R (1.1)

... N i

Ni este frecven a absolut a clasei i, i ! 1, R i reprezint num rul de unit i ale popula iei din clasa pentru care variabila X a nregistrat valoarea Xi N1 + N2 + ... + NR = N. Clasa (grupa) de unit i n raport cu o variabil reune te acele unit i din cadrul popula iei care nregistreaz aceea i stare a variabilei sau st rile variabilei apar innd unui anumit interval de varia ie . Ca urmare, n raport cu o variabil statistic popula ia poate fi structurat ntr-un anumit num r de clase. De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X, poate fi format cu frecven e relative, frecven e cumulate absolute sau relative. Fie seria X format cu frecven e relative:

x X : 1 f 1 -

x2 f2

... xi ... fi

... x R ... f R

(1.2.)

fi - ne arat ponderea unit ilor din popula ie care au nregistrat pentru variabila X starea xi: N fi ! i i ! 1, R N

Pornind de la seria (1.1) se poate deduce seria format cu frecven e absolute cumulate, respectiv: x2 ... xi ... xR x (1.3) X: 1 N(x ) N(x ) ... N(x ) ... N(x ) 1 2 i R unde: N(xi) reprezint num rul de unit i din popula ia studiat pentru care variabila nregistreaz valori ce nu dep esc valoarea xi. Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecven e relative cumulate, respectiv: x2 ... xi ... xR x1 (1.4) X : F ( x ) F ( x ) ... F ( x ) ... F ( x ) N 1 N 2 N i N R unde: FN(xi) - exprim ponderea unit ii popula iei studiate pentru care variabila a nregistrat valori ce nu dep esc valoarea xi. FN(xi) = f1 + f2 + ... + fi N ( xi ) Sau FN ( xi ) ! (.100) i ! 1, R N Seria statistic de reparti ie bidimensional este o construc ie ce red distribu ia unei popula ii n raport cu dou variabile. Astfel, fie popula ia statistic A studiat n raport cu variabilele X i Y, rezultatele observ rii se pot grupa ntr-un tabel de forma urm toare: X Y y1 y2 . . yi . . yI Total unde: - Nij - reprezint num rul de unit i pentru care, variabila X nregistreaz starea xj i variabila Y nregistreaz starea yi ; - Ni. - num rul de unit i pentru care Y = yi, indiferent de nivelul nregistrat de variabila X; 7 x1 N11 N21 Ni1 NI1 N.1 x2 N12 N22 Ni2 NI2 N.2 ... ... ... ... ... ... xj N1j N2j Nij NIj N.j ... ... ... ... ... ... xJ N1J N2J NiJ NIJ N.J Total N1. N2. Ni. NI. N

(1.5)

- N.j - num rul de unit i pentru care X = xj, indiferent de nivelul nregistrat de variabila Y; - N - num rul total de unit i analizate. Din seria bidimensional se pot extrage serii unidimensionale de forma urm toare: x1 X : N .1 y Y : 1 N 1. x2 N .2 y2 ... xj ... xJ ... N . J ... yI ... N I .

... N . j ... yi

N 2. ... N i.

denumite i serii de reparti ie marginale, n raport cu X i Y ... ...

y1 Y / X ! xj : N 1j

y2 N2j

yi

... N ij

yI ... N Ij

j ! 1, J Y condi ionat de

denumit serie de reparti ie unidimensional n raport cu X = xj, num rul acestora fiind egal cu num rul de st ri a variabilei X. x1 X / Y ! yi : N i1 x2 N i .2 ... x j ... N ij ... x J ... N iJ i ! 1, I

denumit serie de reparti ie unidimensional n raport cu X condi ionat de Y = yi, num rul acestora fiind egal cu num rul de st ri a variabilei Y. De asemenea se poate elabora sau deduce seria de reparti ie bidimensional format cu frecven e relative, unde: N ij N. j N f ij ! f i. ! i. f. j ! i ! 1, I j ! 1, J N N N 1.4.2. Seria statistic de varia ie Conform defini iei seria de varia ie red varia ia unei m rimi, n timp, n spa iu sau de la o categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o variabil de timp), serii de spa iu (au la baz o variabil de spa iu) i serii categoriale (au la baz variabile atributive). Cele mai des ntlnite sunt seriile cronologice i seriile de spa iu. Seriile de varia ie au la baz m rimi absolute i relative. Dup unii autori din cadrul m rimilor absolute fac parte indicatorul de nivel i diferen a absolut a unei m rimi, iar din cadrul m rimilor relative fac parte: indicatorul relativ de intensitate, indicele statistic i diferen a relativ a unei m rimi. Indicatorul de nivel (Y) este o m rime ce reflect nivelul unui fenomen analizat. De exemplu: produc ia diferitelor produse, veniturile popula iei, suprafa a cultivat cu principalele culturi, transportul, exportul, importul etc. Diferen a absolut a unei m rimi ( ( Y ) exprim diferen a dintre nivelul cercetat i nivelul baz de compara ie al m rimii analizate. Se exprim n aceea i unitate de m sur n care este cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la altul. 8

Indicele statistic al unei m rimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul baz de compara ie al m rimii analizate. Ne arat de cte ori se modific acea m rime, de la un nivel la altul. Diferen a relativ a unei m rimi ( RY ) exprim raportul dintre diferen a absolut a m rimii respective i nivelul baz de compara ie al acesteia. Ne arat cu ct la sut se modific m rimea de la un nivel la altul. Indicatorul relativ de intensitate (d) se define te ca raport ntre doi indicatori de nivel de natur diferit i arat gradul de r spndire a fenomenului cuantificat de indicatorul de la num r tor n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: produc ia diferitelor culturi / ha, densitatea popula iei, produc ia principalelor produse / locuitor, rata omajului etc. Greutatea specific (g) reflect structura fenomenului analizat n raport cu st rile variabile X, de la baza seriei.

Seriile cronologice
Seria cronologic reflect evolu ia n timp a unei m rimi. Valorile variabilei ca func ie de timp pot fi fixate la un anumit moment de timp sau s se refere la un interval de timp. Seria cronologic de momente este o serie de observa ii ordonate n timp, exprimnd stocuri [Trebici V., 1985]. De exemplu, volumul popula iei, num r de universit i, b nci, institu ii, fonduri fixe, num rul salaria ilor, ntreprinderile mici i mijlocii din diferite domenii de activitate, unit ile de cazare turistic etc. ntr-o astfel de serie nsumarea m rimii analizate nu are sens din punct de vedere al con inutului, aceasta fiind permis din considerente de calcul, ajust ri etc. Seria cronologic de intervale este o serie de observa ii ordonate n timp exprimnd fluxuri. De exemplu: n scu ii vii, divor urile, decesele, produc ia diferitelor culturi sau produse, venituri, cheltuieli, produc ia industrial , agricol , exportul, importul etc.ntr-o astfel de serie are sens nsumarea m rimii analizate. Fie o serie cronologic de momente sau de intervale ce reflect evolu ia n timp a nivelului unei m rimi Y, 0 1 2 ... t ... T (1.6) Y : y 0 y1 y 2 ... y t ... yT Pornind de la aceast serie se pot deduce seriile formate cu diferen e absolute, indici i diferen e relative. n func ie de modul de raportare a st rilor variabilei timp t, m rimile de mai sus se pot calcula cu baz fix (t / t0) (baza de compara ie r mne aceea i) sau cu baz n lan (t / t-1) (baza de compara ie se schimb , fiind considerat cea precedent nivelului comparat). Fie seriile cronologice formate cu: - diferen e absolute cu baz fix : 0 1 (t y/ t 0 : 0 (1 / 0 y 2 (
2/0 y

...

t
t/0 y

...

... (

T ... (Ty/ 0

(1.7)

(t y/ 0 ! y (t )  y(0) - diferen e absolute cu baz n lan

1 0 (t y/ t 1 :  (1 / 0 y

2 (
2 /1 y

... ... (

t
t / t 1 y

... ... (

T
T / T 1 y

(1.8)

(t y/ t 1 ! y (t )  y(t  1) ntre cele dou tipuri de diferen e absolute cu baza fix i cu baz n lan , exist rela ii de leg tur ce ne permit exprimarea unora n func ie de celelalte. n acest context, nsumnd diferen ele absolute cu baza n lan se ob in diferen ele absolute cu baza fix . (t y/ 0 ! (1y/ 0  (2y/ 1  (3y/ 2  ...  (t y/ t 1 Sc znd diferen ele succesive cu baz fix se ob in diferen ele cu baz n lan .
 (t y/ 0  (t y 1 / 0 ! y (t )  y (0)  y (t  1)  y (0) ! y (t )  y (t  1) ! (t y/ t 1

Diferen a absolut ne arat cu ct se modific m rimea analizat de la un moment la altul. Se exprim n aceea i unitate de m sur n care este cuantificat fenomenul studiat. Dac fenomenul analizat se exprim valoric, atunci diferen a absolut nu reflect prea bine modific rile ce intervin, impunndu-se utilizarea m rimilor relative respective, indicele statistic i diferen a relativ . Fie seriile cronologice formate cu: - indici statistici cu baz fix 2 ... t 0 1 I ty / t0 : t 1/ 0 2/0 1 I Iy ... I y / 0 y
t I y/ 0 !

... T ... I T / 0 y

(1.9)

y (t ) ( x100) y (0)

- indici statistici cu baz n lan 2 ... ... t T 0 1 t I y / t 1 : 1/ 0 2 /1 t / t 1 T / T 1  I ... I y ... I y Iy y I ty / t 1 ! y (t ) ( x100) y (t  1)

(1.10)

ntre cele dou tipuri de indici exist urm toarele rela ii de leg tur : y F cnd produsul indicilor cu baz n lan pn la o anumit stare a variabilei t, se ob ine indicele cu baz fix al clasei respective. y(1) y(2) y (t ) y (t ) 2 t . . ... . I 1 / 0 .I y / 1 . ... .I ty / t 1 ! ! ! I y/ 0 y y(0) y (1) y (t  1) y (0) y mp r ind doi indici succesivi cu baz fix se ob ine un indice cu baz n lan : y(t ) y(t  1) y (t ) t I ty / 0 : I y1 / 0 ! : ! ! I ty / t 1 y(0) y (0) y (t  1)

10

Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este m rimea cel mai des folosit n caracterizarea evolu iei fenomenelor din economie. Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii formate cu: - diferen e relative cu baz fix 1 0 t R y / t0 : 0 R1 / 0 y R ty / 0 ! (t y/ 0 y (0 ) ! 2 R
2/0 y

t ... t ... R y / 0

... T ... R T / 0 y

(1.11)

y (t )  y (0) y (t ) t !  1 ! I y/ 0  1 y (0 ) y (0)

- diferen e relative cu baz n lan 1 0 t R y / t 1 :  R1 / 0 y R


t / t 1 y

2 R
2 /1 y

... ... R

t
t / t 1 y

... ... R

T
T / T 1 y

(1.12)

(t y/ t 1 y (t  1)

! I ty / t 1  1

sau

t I y / t 1 .100  100

Aceast m rime la fel ca i indicele statistice, se folose te frecvent n caracterizarea fenomenelor din economie. Dac seria cronologic analizat este de intervale, se poate deduce seria format cu greutatea specific : 0 g y : g 0 g (t ) !
T

1 g1 y (t )

2 g2

...

... g t

T ... g T ...

(1.13)

y (t )
t !1

Seria statistic de spa iu (teritorial ) Seria statistic de spa iu este o construc ie statistic ce reflect varia ia n spa iu a unei m rimi. Seria de spa iu prezint o importan din ce n ce mai mare, datorit dezvolt rii sistemului informa ional, a necesit ii compara iilor interna ionale i a compara iilor ntre regiunile unei ri. n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic teritorial i Statistic interna ional . n capitolul de Statistic teritorial sunt cuprinse informa ii privind: popula ia, for a de munc , condi ii de munc , veniturile popula iei, cheltuielile i consumul popula iei, locuin e, asisten social , s n tate, nv mnt, cultur , sport, conturi na ionale, rezultate i performan e ale ntreprinderilor, agricultur , silvicultur ,

11

industrie, transporturi, po t , telecomunica ii, turism, finan e, justi ie i starea infrac ional , pe cele 7 regiuni i Bucure ti. La baza seriei de spa iu se g sesc att m rimi absolute (indicator de nivel, diferen a absolut ), ct i m rimi relative (indicator relativ de intensitate, indicele statistic, diferen a relativ ). Fie seria statistic Z, de forma urm toare: s1 s 2 ... s i ... s R s Z : 0 Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R) (1.14)

unde: si este o stare a variabilei ce exprim spa iul, i ! 1, R ; Z(i) exprim o m rime (indicator de nivel sau relativ de intensitate). Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu: - diferen e absolute cu baz fix : ... ... s1 s2 si sR s (sZ/ s0 : 0 0 (s1 / s0 (s2 / s0 ... (si / s0 ... (s R / s0 (1.15) Z Z Z Z
i (sZ / s 0 ! Z (i )  Z (0) - indicii statistici cu baz fix ... ... s1 s2 si sR s s (1.16) I Z / s0 : 0 0 I s1 / s0 I s2 / s0 ... I si / s0 ... I s R / s0 Z Z Z Z Z (i ) s .(100) I Zi / s0 ! Z (0) - diferen e relative cu baz fix s1 s2 si sR ... ... s s RZ / s 0 : 0 0 R s1 / s0 R s2 / s0 ... R si / s0 ... R sR / s0 (1.17) Z Z Z Z

s I Zi / s0 !

i (sZ / s0 s ! I Zi / s0  100 Z (0 )

2. Observarea, sistematizarea i prezentarea seriilor statistice 2.1. Observarea statistic Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale, economice sau de alt natur , etap n care se culeg datele statistice despre fenomenul supus cercet rii. Cercetarea fenomenelor respective presupune cunoa terea popula iei statistice n vederea surprinderii ac iunii legilor care ac ioneaz la nivelul acesteia. De calitatea acestei etape, ntr-un proces de cercetare statistic , depinde i calitatea rezultatelor ob inute n celelalte faze. Observarea statistic presupune identificarea, urm rirea i nregistrarea, dup reguli unitare i precise, a nivelului atins de variabilele statistice studiate la unit ile din care este format popula ia luat n studiu[Florea I., 1998]. Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun cteva preciz ri. n primul rnd, observarea statistic presupune urm rirea i nregistrarea unui num r mare de unit i statistice, ceea ce implic un volum mare de munc . n al doilea rnd, pentru ca cercetarea popula iei s - i ating scopul, trebuie precizate care sunt variabilele 12

n raport cu care este studiat popula ia. Variabilele statistice ce urmeaz s fie urm rite i nregistrate la nivelul fiec rei unit i din popula ie, trebuie s fie esen iale i s prezinte interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii exacte pentru delimitarea corect a unit ilor statistice care alc tuiesc popula ia. i nu n ultimul rnd, dac observarea i nregistrarea datelor este f cut de mai multe persoane este necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea necesar datelor rezultate. Observarea statistic , ca prim etap ntr-un studiu de cercetare presupune: specificarea unit ilor statistice care trebuie s fie urm rite i nregistrate, alegerea variabilelor statistice care caracterizeaz cel mai bine popula ia i care r spund obiectivului urm rit, nregistrarea st rilor variabilelor statistice considerate. Atingerea scopului cercet rii statistice presupune rezolvarea urm toarelor probleme care s asigure o preg tire tiin ific a observ rii statistice: - delimitarea popula iei supuse observ rii; - definirea unit ilor statistice de observat; - timpul i locul unde va avea loc observarea; - programul observ rii; - alegerea purt torilor de informa ie; - preg tirea persoanelor ce urmeaz s fac observarea. Fiec reia din aceste probleme trebuie s i se acorde importan a cuvenit , fiindc fiecare dintre ele conduce la o preg tire ct mai complet a observ rii, de rezultatele c reia depinde corectitudinea celorlalte etape a cercet rii statistice. Delimitarea popula iei supuse observ rii fa de alte popula ii statistice cu care aceasta se afl n leg tur se realizeaz prin eviden ierea nsu irilor i tr s turilor comune ce caracterizeaz popula ia supus studiului. Definirea unit ilor statistice de observat presupune claritate i precizie pentru a nu da loc confuziilor. n momentul observ rii trebuie cunoscut exact care sunt unit ile statistice ce trebuie nregistrate n raport cu variabilele de studiat. Stabilirea timpului i a locului unde va avea loc observarea are importan din punct de vedere a comparabilit ii datelor rezultate din observare. No iunea de timp a observ rii are n statistic dou accep iuni: - momentul sau perioada la care se refer datele nregistrate (timpul de referin ); - durata observ rii. Locul observ rii reprezint punctul din spa iu n care se deruleaz procesul supus cercet rii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care popula ia o reprezint familiile etc.). n cadrul programului observ rii statistice trebuie stabilite variabilele statistice care urmeaz s fie studiate n popula ia de cercetat. Alegerea i definirea variabilelor statistice trebuie s fie n consens cu natura popula iei i obiectivul cercet rii statistice ntreprinse. Variabilele statistice care fac parte din programul cercet rii trebuie s surprind aspectele esen iale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i generalizarea acestora la nivelul ntregii popula ii. Alegerea purt torilor de informa ie se face n func ie de volumul datelor ce urmeaz a fi nregistrate. Purt torii de informa ie reprezint supor ii materiali pe care se nregistreaz datele din observarea unit ilor statistice. Observarea statistic se poate desf ura n diverse forme n raport cu: natura proceselor social-economice de studiat, obiectivul cercet rii, formele de organizare ct i posibilit ile practice de urm rire i nregistrare a unit ilor statistice din popula ie. Dup cum se tie, n raport cu gradul de cuprindere a popula iei considerate avem: observarea total i observarea par ial . Observarea total permite nregistrarea, n raport cu

13

variabilele statistice a tuturor unit ilor statistice din popula ie, implicnd un volum mare de munc , antreneaz , de obicei, un num r de persoane i dureaz mult timp. Ca urmare se creaz condi ii pentru apari ia de erori de observare, ceea ce va conduce la mic orarea eficien ei observ rii. Forma cea mai frecvent de observare total o constituie recens mntul popula ieiObservarea total se practic i n domeniul controlului tehnice de calitate, n cazul produselor de nalt tehnicitate , a a cum ar fi: televizoare, ma ini de sp lat, frigidere, automobile etc. Este necesar o observare total n acest caz, deoarece constatarea defec iunilor de c tre cump r tori ar implica cheltuieli mult mai mari cu remedierea acestora n compara ie cu organizarea unei observ ri totale a loturilor de produse ce urmeaz a fi scoase pe pia . n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative, este suficient realizarea unor observ ri par iale prin care s se asigure c rebuturile nu dep esc un anumit procent admis. O astfel de observare, care include doar o parte din unit ile popula iei supuse studiului corespunde observ rii par iale. Observarea par ial constituie o alternativ la observarea total n cazul popula iilor infinite sau chiar dac sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observ rii par iale se pot evalua rezervele de i ei, c rbune sau alte minerale, se poate evalua masa de material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea par ial se recomand n toate cazurile n care se consider mai avantajoas dect observarea total . E antionul, ca rezultat al observ rii par iale, presupune respectarea cu stricte e a principiului reprezentativit ii, n conformitate cu care fiecare unitate statistic din popula ie general s aib aceea i ans de a face parte din e antion. Asigurarea respect rii principiului reprezentativit ii n formarea e antionului de observat permite acestora o structur foarte apropiat cu cea a popula iilor din care sunt formate. Aceasta ne asigur , cu o anumit probabilitate dinainte fixat , c rezultatele ob inute la nivelul e antionului pot fi extinse la nivelul ntregii popula ii. n raport cu legea de probabilitate urmat de variabilele urm rite n popula ia general sunt dou tipuri de e antioane: e antioane de volum mare i e antioane de volum redus. Observarea statistic n raport cu procedeul folosit este de dou feluri: - observarea direct ; - observarea indirect . Observarea direct presupune o observare nemijlocit a unit ilor din popula ie, care sunt prev zute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct cu unit ile statistice, fie prin m surare, fie prin interogare, dac unit ile sunt persoane. Acest procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n vederea m sur rii nivelelor nregistrate de variabilele considerate. Observarea indirect presupune un intermediar ntre unit ile care urmeaz s fie supuse observ rii i observator. Intermediarul poate fi un document special conceput n vederea observ rii i atunci observarea este pe baz de document sau intermediarul poate fi o alt persoan dect observatorul, caz n care avem observare prin interogare. Suportul pentru culegerea datelor l reprezint chestionarul. 2.2. Sistematizarea i prezentarea datelor statistice Sistematizarea constituie o etap n cadrul prelucr rii datelor statistice n vederea prezent rii acestora sub form de serie statistic (tabele statistice). Datele ob inute ca urmare a procesului de observare statistic , n forma lor brut , permit o caracterizare am nun it a fiec rei unit i din popula ia considerat . Deoarece, datele

14

rezultate din observare se prezint sub form dezorganizat nu permit o caracterizare a popula iei n ansamblu. n vederea atingerii scopului cercet rii statistice ntreprinse i anume acela de a da o caracterizare de ansamblu a popula iei considerate este necesar ca datele rezultate din observare s fie supuse unor opera ii de sistematizare i prezentare n vederea deducerii a ceea ce este esen ial, tipic i general n leg tur cu popula ia. Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate sub forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie s fie n strns dependen cu scopul cercet rii i cu natura fenomenului cercetat. Odat precizate variabilele de la baza seriei, se tie care va fi con inutul primului ir de date i ca urmare este elucidat criteriul n raport cu care informa iile rezultate din observare vor fi ordonate, necunoscndu-se ns cum se face propriu-zis ordonarea i cum se completeaz primul ir al seriei. Opera ia de stabilire a claselor presupune mp r irea unit ilor unei popula ii n clase distincte n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit ordine. n urma unei asemenea opera ii, fiecare unitate trebuie s se g seasc n una i numai una din clasele rezultate. Aceast opera ie nu trebuie s conduc la pierderi de unit i, reg sindu-se ns ntr-o alt ordine dect cea dup care s-a realizat observarea. Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se spune c o clas este omogen dac , pentru unit ile care fac parte din ea, variabila de grupare nregistreaz varia ii nesemnificative. n cele ce urmeaz se va prezenta opera ia de stabilire a claselor n cazul unei serii unidimensionale. Dac la baza seriei avem o variabil calitativ , atunci clasele se stabilesc n raport cu st rile acesteia. Pentru fiecare stare a variabilei se va construi o clas . Ca urmare, n acest caz, ntr-o clas vor intra toate unit ile care au nregistrat aceea i stare n timpul observ rii n raport cu variabila considerat . n cazul unei serii care are la baz o variabil cantitativ discret (num rul st rilor nu este prea mare), clasele se stabilesc n mod asem n tor ca i la variabilele calitative, respectiv: x 2 ... x R x X : 1 N N ... N 1 2 R n condi iile n care cercetarea popula iei presupune elaborarea unei serii care are la baz o variabil cantitativ continu sau o variabil cantitativ discret , dar care n popula ia considerat nregistreaz un num r prea mare de st ri, clasele nu se mai pot stabili cu ajutorul st rilor variabilei. Pentru asemenea cazuri, gruparea unit ilor popula iei n clase se face cu ajutorul intervalelor de grupare (varia ie), fiecare interval cuprinznd un num r oarecare de valori ale variabilei. Ca urmare, pentru o serie continu , clasele se definesc cu ajutorul intervalelor de grupare. Dou probleme se pun n cazul elabor rii unei serii care are la baz o variabil cantitativ continu : y determinarea lungimii intervalelor de varia ie; y stabilirea formei de scriere a intervalelor de varia ie. Determinarea lungimii intervalelor de varia ie conduce la dou situa ii: y serii construire cu intervale de lungime egal ; y serii construite cu intervale de lungime diferite. Stabilirea num rului de intervale de varia ie trebuie s asigure satisfacerea urm toarelor condi ii:

15

informa ia care se pierde n urma opera iei de grupare s nu fie prea mare, iar popula ia s nu fie prea f rmi at n raport cu variabilele de grupare; - media aritmetic a fiec rei grupe (n raport cu valorile nregistrate) s fie ct mai aproape de centrul intervalului de varia ie respectiv; - s nu existe grupe vide; - reprezentarea grafic a seriei rezultate s permit conturarea unei regularit i a fenomenului de studiat din cadrul popula iei. Trebuie remarcat c acest lucru nu este posibil nici n cazul unui num r mic de intervale deoarece se pierd prea multe date, nici n cazul unui num r prea mare de intervale, popula ia f rmi ndu-se prea tare. Statisticianul american H.A. Struges a stabilit pentru cazul n care popula ia n raport cu variabila X este normal , urm toarea expresie: lx ! xmax  xmin 1  3,322 lg N (2.1)

(1+3,322 LgN, avnd semnifica ia de num r de intervale), pentru celelalte cazuri rezultatul fiind orientativ, servind la determinarea cu aproxima ie a lungimii intervalelor de varia ie n cazul n care acestea vor fi de lungime egal . n expresia de calcul a lungimii intervalelor intervine valoarea maxim i cea minim a variabilei, ct i volumul popula iei. n urma stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum urmeaz : ?x ; ( x  l ) ... ?xmin  (k  1)l x ; ( x min  kl x ) ... ?x min  ( R  1)l x ; ( xmin  R l x ) X : min min x N1 Nk NR dac se presupune c au rezultat R intervale, unde Nk, k ! 1, R reprezint volumele claselor n care s-a structurat popula ia. Numeroase sunt cazurile practice n care studiul unei popula ii n raport cu o variabil sau mai multe presupune mp r irea domeniilor de varia ie ale acestora n intervale de lungime neegal . n asemenea cazuri nu exist o rela ie de calcul n acest sens. Stabilirea intervalelor de varia ie se face n direct leg tur cu varia ia variabilelor i distribuirea unit ilor n raport cu acestea. Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative atunci clasele se stabilesc n raport cu fiecare din variabilele considerate prin st rile acestora (vezi seria 1.5), avem serii bidimensionale sau multidimensionale. Nu este recomandat ca num rul variabilelor n raport cu care se studiaz popula ia s fie prea mare, deoarece aceasta duce la o divizare exagerat a popula iei pierzndu-se din vedere aspectele principale. Dup ce clasele au fost definite, are loc repartizarea unit ilor popula iei n clasele respective, folosind n acest scop un algoritm adecvat. Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical Analysis System), STATGRAPHICS, etc. 2.3. Reprezent ri grafice Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spa iu) cu privire la forma static sau evolu ia dinamic a fenomenului cuantificat de seria respectiv . 16

Graficul asociat unei serii constituie o imagine spa ial a fenomenului de cercetat, permi nd eviden ierea rapid a structurii, dinamicii i tendin ei de dezvoltare a acestuia. Reprezent rile grafice sunt folosite att n scopul cunoa terii popula iei n cauz , ct i pentru popularizarea unor rezultate din diverse domenii de activitate. Elaborarea complet i corect n acela i timp a unui grafic presupune elucidarea urm toarelor elemente: titlul graficului, scara de reprezentare, re eaua graficului, semnele conven ionale i notele. Titlul graficului trebuie s fie scurt, clar i semnificativ pentru con inutul fenomenului reliefat prin seria considerat . Scara de reprezentare reune te mul imea tuturor punctelor cotate. n cazul n care variabila nregistreaz valori mici, gradarea sc rii ncepe n principiu de la zero, dac variabila nregistreaz valori mari se consider o alt origine stabilit cu aproxima ie. Pentru a nu nc rca prea mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un anumit interval convenabil ales. Distan ele dintre dou puncte cotate consecutive se nume te intervalul graficului. Cnd intervalele sunt egale atunci avem sc ri uniforme, n caz contrar avem sc ri neuniforme. Re eaua graficului permite identificarea cu u urin n plan sau n spa iu a punctelor corespunz toare valorilor nregistrate de variabilele n cauz . Sistemul axelor rectangulare (n plan sau spa iu) constituie cele mai uzuale re ele n reprezentarea grafic a seriilor statistice. Semnele conven ionale se pot materializa ntr-o reprezentare grafic prin inscrip ii, fie printr-o legend . Inscrip ia trebuie s fie scurt i semnificativ i plasat ct mai bine n raport cu elementul din grafic pe care l expliciteaz . Legenda se folose te pentru a explicita folosirea semnelor, culorilor sau diverselor ha uri folosite n graficul n cauz . Legenda se plaseaz nafara graficului, n col ul din stnga sau dreapta jos. n cazul graficelor complexe, pentru o n elegere mai bun , sunt necesare unele explica ii, care se dau sub form de note. Notele generale privesc n ansamblu graficul i se plaseaz chiar sub titlul graficului. Notele speciale privesc por iuni din grafic i sunt legate de acestea prin diverse semne de trimitere. Notele se plaseaz n partea de jos a diagramei, n col ul din stnga sub re ea. n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n reprezentarea seriilor statistice ce descriu fenomenele social-economice.

Histograma Graficul specific seriilor care au la baz o variabil continu (de intervale) este istograma. Aceasta se construie te ntr-un sistem de axe rectangulare dup cum urmeaz : pe abscis se trec intervalele de varia ie, iar pe ordonat se traseaz scara frecven elor. Scara frecven elor se construie te n conformitate cu respectarea principiului propor ionalit ii ntre frecven e i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de varia ie a seriei (xi-1 xi) se construie te un dreptunghi a c rui baz este chiar lungimea intervalului, iar cealalt latur se determin din condi ia propor ionalit ii ariei dreptunghiului cu m rimea indicatorului n clasa respectiv . Latura necunoscut a dreptunghiului, notat cu Li se determin din urm toarea rela ie: Li . li = k . Ni (2.2) unde: li = latura cunoscut a dreptunghiului corespunz tor intervalului (xi-1 - xi); Li = latura necunoscut a dreptunghiului corespunz tor intervalului (xi-1 - xi);

17

Ni = frecven a absolut a clasei i; k = un coeficient de propor ionalitate care se alege n raport cu scara de reprezentare. Din rela ia (2.2) se deduce Li: N Li ! k i , i ! 1, R li unde: li = xi - xi-1, adic diferen a dintre limita superioar i cea inferioar a intervalului de varia ie. Mul imea tuturor dreptunghiurilor astfel determinate, formeaz histograma ata at seriei. Poligonul frecven elor Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv cantitativ continu i format cu frecven e absolute sau relative, simple sau cumulate. Trasarea acesteia presupune realizarea n prealabil a histogramei. Poligonul frecven elor se ob ine unind prin segmente de dreapt mijloacele laturilor superioare ale dreptunghiurilor, din care este alc tuit histograma. Poligonul frecven elor este un grafic important pentru aproximarea formei distribu iei popula iei studiate, ct i pentru compararea a dou distribu ii pe aceea i diagram . Exemplu Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de reparti ie reprezentnd popula ia Romniei sub 40 de ani pe grupe de vrst .
Grupa de vrst (ani) 04 59 10 14 15 19 20 24 25 29 30 34 35 39 Popula ia 1147065 1330733 1737153 1701881 1978835 1792822 1698268 1335039

18

Distributia populatiei Romaniei sub 40 ani pe grupe de varsta

populatia
04

59

10 14

15 19

20 24

25 29

30 34

35 39

grupa de varsta (ani)

Figura 2.1 Histograma si poligonul frecventelor Diagramele de structur Punerea n eviden sub form grafic a structurii unei popula ii statistice este posibil apelnd la diagramele de structur . n acest sens se prezint : dreptunghiul, p tratul, cercul i semicercul de structur . Aceste tipuri de grafice permit reprezentarea grafic a seriilor unidimensionale construite cu m rimi de structur ( frecven e relative, greutate specific ). Cel mai des folosit este cercul de structur denumit i diagrama sectorial (piechart). Cercul de structur Se construie te un cerc de raz oarecare a c rei suprafa se consider c reprezint volumul ntregii popula ii n cauz (exprimat n frecven e absolute sau relative). Fiecare clas n care este divizat popula ia supus studiului este reprezentat printr-un sector de cerc de arie direct propor ional cu volumul clasei. Trasarea sectorului de cerc presupune determinarea m surii n grade a unghiurilor la centru a fiec rui sector. Unghiul la centru de 360o corespunde volumului ntregii popula ii. Unghiurile sectoarelor de cerc care reprezint clase din popula ie trebuie s fie propor ionale cu volumul acestora (exprimat n frecven e absolute sau relative). Unui procent i corespunde 3,6o cu procentul corespunz tor clasei respective. 360 o Qi ! f i (%). (2.3) 100 Exemplu Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz , rednd distribu ia voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie 1996:
Forma iunea Politic Voturi Ob inute (%) CDR 37,0 PDSR 28,7 USD 16,1 UDMR 7,7 PRM 5,6 PUNR 4,9

19

Rezultatele alegerilor parlamentare pentru Senat din 3 nov 1996

5,60% 7,70%

4,90%

37%

16,10%

CDR PDSR USD UDMR PRM PUNR

28,70%

Figura 2.2 Cercul de structura Diagramele prin benzi (barchart) Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribu ia unei popula ii n raport cu o variabil cantitativ discret sau calitativ . Benzile au aceea i l ime (baz ), iar lungimea (n l imea) lor este direct propor ional cu frecven a clasei reprezentate. Num rul benzilor este egal cu num rul claselor n care este mp r it popula ia studiat . De asemenea se pot lua n considerare o variabil sau dou . n reprezent ri se utilizeaz benzi simple sau benzi grupate. Pozi ia benzilor poate fi orizontal sau vertical . Exemplu Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz , rednd nivelul PNB/loc n $ calculat pe baza puterii de cump rare n Romnia i alte ri esteuropene, n 1998
ara PNB/loc ($) Bulgaria 4683 Cehia 12197 Polonia 7543 Romnia 6153 Slovacia 9624 Ungaria 9832

20

PNB/loc ($) in 1998


14000 12197 12000 10000 8000 6000 4683 4000 2000 0 7543 6153 9624 9832

Bulgaria

Cehia

Polonia

Romnia

Slovacia

Ungaria

Figura 2.3 Diagram prin benzi simple Cronograma (historiograma) O categorie foarte important de serii o constituie seriile cronologice, a c ror reprezentare grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz ntr-un sistem de axe rectangulare. Se consider seria cronologic de forma (1.7): 0 Y : y 0 1 y1 2 ... t T ... yT ...

y2 ... yt

unde: t ! 0,T , reprezint momentele (sau perioadele) de timp care se reprezint pe axa absciselor, iar m rimile yt se reprezint pe axa ordonatelor. Fiec rei perechi de valori (t, yt), t ! 0,T i corespunde un punct n planul axelor rectangulare. Unind prin segmente de dreapt punctele consecutive, astfel determinate, se ob ine ceea ce se nume te cronogram . n acela i sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care pot fi exprimate n aceea i unitate de m sur sau n unit i de m sur diferite. Cronogramele asociate unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii i sesizarea perioadelor critice n evolu ia acestora. Exemplu. Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz , rednd num rul total ta autoturisme nscrise n circula ie la sfr itul anului n Romnia n perioada 1994-1999.

21

Anul Autoturisme nmatriculate

1994 2020017

1995 2197477

1996 2391869

1997 2605465

1998 2822254

1999 2980014

Evolutia numarului de autoturisme inscrise in circulatie in perioada 1994-1999


3500000 numar autoturisme in circulatie 3000000 2500000 2000000 1500000 1000000 500000 0 1993

1994

1995

1996 anul

1997

1998

1999

2000

Figura 2.4 Cronograma Norul statistic Norul statistic constituie o modalitate de reprezentare grafic a seriilor atributive de reparti ie bidimensionale. Se consider o serie bidimensional de reparti ie n raport cu variabilele discrete X i Y. n sistemul de axe rectangulare xOy se marcheaz toate punctele de coordonate (xj, yi ); i ! 1, I; j ! 1, J pentru care frecven ele Nij { 0. M rimea acestor frecven e se poate marca pe grafic n dou moduri: - dac frecven ele sunt mici, atunci pentru fiecare punct de pe grafic (xj, yi ); i ! 1, I; j ! 1, J pentru care Nij { 0, se marcheaz attea puncte de cte ori se repet perechea respectiv . - dac ns frecven ele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame areale prin cercuri ale c ror arii trebuie s fie propor ionale cu r d cina p trat a frecven elor pe care le reprezint . n cazul n care cele dou variabile X i Y sunt continue, ntruct la intersec ia a dou intervale se formeaz o rubric (c su ), frecven ele diferite de zero se reprezint n interiorul acestei rubrici, fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele dou moduri de elaborare mai sus amintite. Exemplu Un produs a fost lansat simultan pe 13 pie e. Pe aceste pie e, produsul a fost propus la pre uri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urm tor:

22

Nr. Crt. Cerere (C) Pre (P)

1 15,4 1,4

2 3,2 5,1

3 4,9 2,5

4 10,5 1,7

5 8,0 1,8

6 5,1 3,4

7 7,6 2,1

8 11,3 1,6

9 14,0 3,6

10 6,4 3,5

11 13,2 1,9

12 8,8 1,8

13 12,1 1,9

18 16 14 12 cerere 10 8 6 4 2 0 0 1 2 3 pret 4 5 6

Figura 2.5 Norul de puncte n raport cu Pret i Cerere Cartograma i cartodiagrama Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor statistice de spa iu. Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spa iului (sub form de hart ) n interiorul c ruia se manifest fenomenul care este cuantificat de seria de reprezentat. n interiorul h r ii astfel realizat , prin diverse culori sau nuan e ale aceleia i culori, prin ha uri sau prin diferite diagrame, este eviden iat intensitatea dezvolt rii fenomenului cercetat precum i m rimea indicatorilor seriei. Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spa iu, realizndu-se ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi, cerc, p trat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de spa iu ce exprim volumul investi iilor str ine pe jude e, la noi n ar , se procedeaz astfel: n primul rnd se deseneaz harta Romniei, delimitndu-se jude ele; n cadrul fiec rui jude se deseneaz o figur geometric oarecare convenabil aleas , a c rei arie sau m rime s fie direct propor ional cu volumul investi iilor str ine din jude ul respectiv.

Probleme propuse
P1. Da i 5 exemple de popula ii statistice a c ror cercetare ar prezenta interes i pentru fiecare popula ie selectat preciza i: - denumirea popula iei, a unit ii statistice i volumul acesteia; - scopul cercet rii statistice; - variabilele statistice n raport cu care s-ar face observarea statistic a popula iei. P2. S se extrag din Anuarul Statistic sau alte surse informa ionale o serie statistic bidimensional ce red distribu ia unei popula ii n raport cu dou variabile atributive, relativ la care se cere: 23

denumirea popula iei ce a fost supus observ rii i volumul acesteia; unitatea statistic ; caracterizarea variabilelor statistice n raport cu care a fost studiat popula ia; caracterizarea seriei statistice n raport cu toate criteriile cunoscute; elaborarea seriei bidimensionale format cu frecven e relative, interpretare; extragerea reparti iilor unidimensionale marginale i a celor condi ionate; pornind de la o reparti ie marginal deduce i celelalte serii statistice posibile, interpretare. P3. Din Anuarul Statistic sau alte surse informa ionale extrage i o serie statistic de reparti ie, avnd la baz o variabil de spa iu, relativ la care se cere: 1. denumirea popula iei statistice i volumului ei; 2. unitatea statistic ; 3. caracterizarea seriei dup toate criteriile cunoscute; 4. deducerea seriei format cu frecven e relative; 5. interpretare. P4. Din Anuarul Statistic sau alte surse informa ionale extrage i dou serii cronologice avnd la baz indicatorul de nivel, una de momente, alta de intervale i deduce i seriile formate cu diferen e absolute, indici statistici, diferen e relative, cu baz fix i cu baz n lan (interpret ri). P5. Da i 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate. P6. Din Anuarul Statistic sau alte surse informa ionale extrage i o serie de spa iu format cu indicator de nivel sau indicator relativ de intensitate i deduce i seriile formate cu diferen e absolute, indici i diferen e relative, calculate cu baz fix . Interpretare. P7. Extrage i 5 exemple de serii de spa iu ce con in informa ii importante pentru domeniul economic. P8. Luand ca exemplu o popula ie statistic studiat n raport cu un anumit num r de variabile (stabilite n raport cu obiectivul studiului), se cere: 1. elaborarea tuturor seriilor statistice de reparti ie unidimensionale 2. elaborarea a trei serii statistice de reparti ie bidimensionale ( una are la baza dou variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ , una are la baz dou variabile cantitative) 3. reprezentarea grafic a: histogramei, poligonului frecven ei, cercului de structur , diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.

1. 2. 3. 4. 5. 6. 7.

Bibliografie:
1. Buiga, A., Drago C., Laz r D., Parpucea I., Statistic descriptiva, Ed. Mediamira, Cluj-Napoca, 2010; 2. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia , Ed. Presa Universitar Clujean , Cluj-Napoca, 2001; 3. Florea I., Parpucea I., Buiga A., Statistic descriptiv , Ed. Continental, Cluj-Napoca, 1998.

24

MODULUL 2
PARAMETRII REPARTI IILOR EMPIRICE UNIDIMENSIONALE Obiective
y y y cunoa terea i n elegerea modului de calcul precum i a semnifica iei parametrilor statistici. ilustrarea tr s turilor esen iale care caracterizeaz fenomenele social - economice cunoa terea i m surarea varia iei unei m rimi n raport cu nivelul mediu al acesteia

Concepte de baz
y y y y y valoare medie, median , modal parametrii de structur varia ie, abatere medie, dispersie parametrii concentr rii asimetrie i boltire

Rezultate a teptate
Cunoa terea modului de calcul i a semnifica iei parametrilor tendin ei centrale, a gradului de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei popula ii i formularea unei concluzii privind forma distribu iei unei popula ii.

Sinteza
2.1. Parametrii tendin ei centrale Parametrii din aceast grup au menirea de a eviden ia pozi ia n jurul c reia se grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast pozi ie exprimat printr-un num r se nume te pozi ie central . Ea poate fi eviden iat prin: - valoarea medie X ; - valoarea median M e X ; - valoarea modal M o X .

A. Valoarea medie Valoarea medie reprezint principalul parametru care caracterizeaz tendin a central a unei reparti ii statistice. n vederea definirii parametrului valoarea medie se consider o popula ie statistic studiat n raport cu variabila cantitativ X i o func ie G(x1,x2,,xR) unde xi, i ! 1, R , reprezint st rile variabilei X. Func ia G exprim o anumit nsu ire esen ial , un atribut al popula iei n raport cu variabila X. Aceast func ie se nume te func ie determinant .

25

Prin defini ie, valoarea medie X a variabilei X este parametrul care las invariant func ia determinant , adic : G x1 , x 2 ,..., x R ! G X , X ,..., X .

(2.0)

Aceast egalitate se ntlne te sub denumirea de rela ia lui BOIARSKI-KISINI. n func ie de forma analitic a func iei G, din rela ia (2.0) se deduce expresia analitic (indicatorul) de calcul a valorii medii X . Determinarea, pe aceast cale, a valorii medii X , este destul de anevoioas . Utilizarea acesteia presupune stabilirea con inutului (semnifica iei) i a formei analitice a func iei determinante G, pentru fiecare caz n parte. Dar, valoarea medie X poate fi definit ca un raport a dou m rimi din care se deduce aceea i expresie pentru X ca i din (2.0). Exist , a adar, dou modalit i echivalente de definire a valorii medii, criteriul rela iei determinante a lui Boiarski-Kisini i criteriul raportului, ultima fiind mai accesibil . Criteriul raportului presupune raportarea volumului fenomenului cercetat la volumul popula iei. Acesta presupune cuantificarea volumului fenomenului n func ie de natura lui. Pentru a exemplifica cele prezentate mai sus, se consider popula ia familiilor dintr-o localitate, cercetat n raport cu num rul de copii. Datele rezultate din observare se prezint ca o serie de reparti ie de forma: xi X : N i i !.1, R n acest caz, func ia determinant are urm toarea form : G x1 , x2 ,..., x R ! xi N i
i !1 R

semnificnd num rul total de copii din localitatea respectiv . Pentru a g si num rul mediu de copii pe familie se particularizeaz rela ia (2.0) dup cum urmeaz

xi N i ! X Ni
i !1 i !1

de unde rezult : X !

x
i !1 R i !1

Ni
i

La acela i rezultat se putea ajunge pornind de la faptul c num rul mediu de copii pe familie se poate exprima ca un raport ntre num rul total de copii i num rul de familii din localitatea respectiv , adic : X ! Nr. total de copii Nr. de familii (2.1)

n acest exemplu, fenomenul fiind de natur demografic , volumul acestuia se cuantific prin num rul total de copii la nivelul popula iei statistice considerate. Aceasta este

26

n direct concordan cu natura i semnifica ia variabilei n raport cu care se face cercetarea statistic . Cunoa terea naturii parametrului valoare medie, conduce la o defini ie mai complet i plin de semnifica ie. Pentru a n elege semnifica ia valorii medii X , trebuie subliniat faptul c , n general, varia ia unui fenomen, de orice natur , i n particular varia ia unei variabile X n raport cu care este cercetat o popula ie, este determinat de ac iunea simultan a dou categorii de factori: factori esen iali i factori neesen iali. n categoria factorilor esen iali intr acei factori care ac ioneaz asupra tuturor unit ilor popula iei n mod continuu i n acela i sens, determinnd, n principal, nivelul de dezvoltare a variabilei pentru fiecare unitate component din popula ie. Factorii esen iali se conjug n ac iunea lor cu factorii neesen iali, care, n general, au un caracter aleator, sunt numero i i neuniform r spndi i printre unit ile popula iei. Fiecare din factorii considera i neesen iali ac ioneaz numai asupra unui anumit num r de unit i din popula ie. Ca urmare, ace tia pot contribiu fie la cre terea nivelului variabilei (pentru unele unit i din popula ie), fie la sc derea nivelului variabilei (pentru alte unit i din popula ie). La rndul lor factorii esen iali nu ac ioneaz cu aceea i intensitate asupra tuturor unit ilor din cadrul popula ie considerate, determinnd, n acest fel, varia ia neuniform a variabilei respective n cadrul popula iei. n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a unei serii statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea nregistra variabila n cadrul popula iei cercetate n condi iile n care factorii neesen iali nu sar fi manifestat, iar factorii esen iali ar fi ac ionat asupra unit ilor din popula ie cu aceea i intensitate. Parametrul valoarea medie, calculat pentru o serie statistic , pune n eviden ceea ce este comun, general i esen ial sub aspectul nivelului de dezvoltare al variabilei, n raport cu care este studiat o popula ie. n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a indicatorilor cu care aceasta este construit , exist mai multe posibilit i de calcul a valorii medii. Func ia determinat G, sub forma sa cea mai general , are urm toarea expresie analitic :
1

R K K G x1 , x 2 ,..., x R ! xi f i i !1

(2.2)

Pentru diverse valori ale lui k, n strict concordan cu con inutul i semnifica ia func iei G, se ntlnesc mai multe tipuri de medii: - media armonic (k = -1); - media aritmetic (k = 1); - media p tratic (k = 2); - media cubic (k = 3); - media de ordinul k n general. n caz concret, valoarea medie real X este aceea care se ob ine prin indicatorul (mediu) rezultat fie prin aplicarea criteriului rela iei determinante, fie criteriului raportului. Modalit i de calcul a valorii medii

27

1. Media aritmetic Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii statistice, a a cum rezult din practica statistic . Se consider acum dou serii statistice de reparti ie, una format din frecven e absolute, iar cealalt din frecven e relative: xi X : N i i !.1, R xi X : f i i !.1, R

(2.3)

(2.4)

Media aritmetic pt cele dou serii se calculeaz astfel: xi N i ; X ! xi f i Nj Dac seria este de intevale, construit cu frecven e absolute avem:
X!

xi .N i N j Fie o serie de reparti ie, care are la baz o variabil continu X, respectiv,
X!

'

xi 1  xi X : f i i !.1, R xi  xi 1 ! xi' 2 unde x i' reprezint mijlocul intervalului i, ob inem rela ia: Folosind nota iile: X ! xi' f i
i !1 R

Rela ia ne arat c media aritmetic a unei serii de intervale se reduce la media aritmetic a unei serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de varia ie.

2. Media armonic Se consider o serie de forma: 28

xi X : N i i !1, R

(2.5)

n cazul unei serii discrete de forma (2.5), media armonic notat cu X 1 se define te prin:

X 1 !

N
i !1

i !1

1 Ni xi

(2.6)

numit

i formula mediei armonice ponderate.


R

Dac ponderile sunt egale ntre ele, adic N1=N2==NR=N*, atunci rela ia (2.6) devine:

X 1 !

N
i !1 R

1 x N* i !1 i

i !1

1 xi

(2.7)

care reprezint formula mediei armonice simple. n cazul unei serii care are la baz o variabil continu X, respectiv, x  x X : i 1 i N i i !1, R procednd ca la media aritmetic , pentru media armonic rezult :

X 1 !

N
i !1 R

1 x' Ni i !1 i

(2.8)

unde xi reprezint mijlocul intervalului i, i ! 1, R . i n acest caz, dac ponderile sunt egale, se ob ine rela ia de calcul a mediei armonice simple, de forma: X 1 ! R

x
i !1

1
' i

3. Media geometric Pentru o serie care are la baz variabila discret X, format cu frecven e absolute, media geometric notat cu X g (sau X o ) este definit prin expresia:
N N X g ! N x1N1 x2 2 ...xR R

(2.9)

Din (2.9), pentru media geometric ponderat exprimat cu frecven e relative se deduce:

29

Xg !

N1

x 2 ... x R

N2

NR

R N ! xi i i !1

1/ N

! xi
i !1

Ni / N

! xi i
f i !1

(2.10)

Dac variabila X, de la baza seriei este de varia ie continu , atunci rela iile de calcul pentru diversele variante de medie geometric , r mn variabile cu singura modificare c valorile xi, i ! 1, R , se nlocuiesc cu mijloacele intervalelor de varia ie, calculate conform formulei: xi' ! xi 1  xi , 2 i ! 1, R (2.11)

B. Valoarea median Valoarea median , notat cu M e este acea valoare a variabilei cantitative X care mparte reparti ia n dou p r i egale, respectiv: FN (M e ) ! 1 / 2 sau N (M e ) ! N 2 (2.12)

Calculul valorii mediane se face diferen iat, dup cum seria are la baz o variabil discret sau continu . Pentru o reparti ie discret , calculul medianei nu implic probleme deosebite i nici un volum mare de calcule. Se consider o reparti ie cu frecven e absolute: x x2 ... xi ... xR X : 1 N N ... N ... N . 2 1 i R a) volumul N al popula iei este un num r impar; b) volumul N al popula iei este un num r par. n ambele cazuri, calculul medianei presupune, n prima faz , determinarea rangului medianei, notat cu rM e , conform urm toarei rela ii: rM e ! 1 R N i ! N (M e ) 2 i !1 (2.14) (2.13)

n calculul valorii mediane a unei serii discrete, pot ap rea dou situa ii:

a) Dac volumul popula iei N este un num r impar, rangul medianei este un num r zecimal a N c rui parte ntreag indic num rul de unit i din popula ie pentru care variabila X a 2 nregistrat valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat N urm toare celei de rang adic : 2 M e ! x N
2 1

(2.15)

30

b) Dac volumul popula iei este un num r par, rangul medianei este un num r ntreg i ca urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci se g sesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora. Rela ia de calcul a medianei, n acest caz, este: x N  x N Me !
2 1 2

(2.16)

Pentru o reparti ie continu , calculul valorii mediane presupune verificarea egalit ii (2.12) i ca urmare, trebuie cunoscut densitatea de reparti ie f(x). Determinarea func iei f(x) implic un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat. Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit un volum redus de calcule. Pentru acesta se consider o reparti ie continu n raport cu variabila X, i anume: x  x1 x1  x 2 ... x i 1  x i ... x R 1  x R . X : 0 N ... ... N2 Ni NR 1 (2.17)

unde intervalele xi-1-xi, i ! 1, R pot fi de lungime egal sau neegal . Calcularea rangului medianei va permite stabilirea intervalului n care se afl valoarea median , interval numit i interval median. Se cumuleaz frecven ele absolute din aproape n aproape pn ce este ndeplinit inegalitatea: N 1  N 2  ...  N i u 1 N 2

Ultima frecven Ni cumulat , ne permite s indic m intervalul median ?x i 1  x i . Formula aproximativ de calcul a medianei: N (M e )  N ( xi 1 ) xi  xi 1 Ni

M e ! xi 1 

(2.18)

xi 1 ! xM e Ni ! N M e

- limita inferioar a intervalului median; - frecven a absolut a intervalului median;

xi  xi 1 ! lM e - lungimea intervalului median, C. Valoare modal Valoarea modal Mo (X) a unei reparti ii reprezint aceea valoare a variabilei X c reia i corespunde frecven a cea mai mare. Acest parametru se mai nume te modul, valoare dominant , sau mod se noteaz cu Mo. Mod de calcul: 31

a)

Pentru o serie de reparti ie discret , dat sub forma x x ... x i ... x R X : 1 2 f f ... f ... f . 1 2 i R

(2.19)

valoarea modal se cite te direct din serie, nefiind nevoie de nici o tehnic sau formul de calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru care frecven a este cea mai mare. b) Pentru serii de reparti ie continue, respectiv:
x  x1 x1  x 2 ... x i  2  x i 1 x i 1  x i X : 0 f f2 f i 1 fi ... 1 x i  x i 1 ... x R 1  x R f i 1 fR ...
(2.20)

Modala nu poate fi determinat direct. Intervalul c ruia i corespunde frecven a cea mai mare, se nume te intervalul modal i va con ine modala. S presupunem c intervalul modal este xi-1-xi. Formula de calcul a modalei: M o x ! x M o  unde: Mo xMo - reprezint valoarea modal ; - reprezint limita inferioar a intervalului modal; ( 1 lMo ( 1  ( 1 (2.21)

- reprezint diferen a dintre frecven a intervalului modal i frecven a intervalului ( 1 precedent; ( 1 - reprezint diferen a dintre frecven a intervalului modal i frecven a urm tor; lMo - reprezint lungimea intervalului modal. intervalului

O serie poate avea o singur valoare modal , caz n care seria se nume te unimodal . Dac o serie are mai multe valori modale, atunci se nume te plurimodal . O serie plurimodal eviden iaz faptul c popula ia n cauz este neomogen . Calculul valorii modale, n asemenea cazuri, presupune o delimitare mai riguroas a obiectului observ rii ct i a popula iei care urmeaz s fie studiat . O alt cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc., pn se ajunge la o serie unimodal . n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana. Pentru serii u or asimetrice, K. Pearson a stabilit urm toarea rela ie ntre cei trei parametri: Mo ! X  3 X  Me

unde X este media aritmetic a variabilei X. 32

Calculul valorii modale reprezint un deosebit interes pentru activitatea practic . Avnd n vedere c semnifica ia acestui parametru indic acea valoare a variabilei nregistrat de cele mai multe unit i din popula ie se poate afla: ora la care sunt solicitate cele mai multe convorbiri telefonice, ora de vrf privind transportul n comun, m rimea cea mai solicitat la nc l minte etc. Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea medie se bucur de o mai mare reprezentativitate. Dac , n plus, avem M e ! M o ! X , innd seama c valoarea median nu este influen at de valorile extreme ale variabilei, se poate afirma c mediana reprezint un grad de reprezentativitate mai mare dect valoarea medie. 2.2. Parametrii de structur Frecvente sunt cazurile cnd este necesar studierea structurii unei popula ii n raport cu o variabil sau alta. Parametrii statistici, n forma cea mai general , folosi i n caracterizarea structurii unei popula ii poart denumirea de valori quantile. Valorile quantile ale unei serii de reparti ie unidimensionale sunt acele m rimi nregistrate de variabila X, care mpart seria n n p r i egale (mai precis mparte popula ia n n p r i egale). n acest caz se vor calcula p quantile (p = n-1). Pentru o serie continu , a c rei densitate de probabilitate f(x) este cunoscut , urm toarea egalitate este satisf cut de cele p quantile:
q1

x1

f ( x)dx ! f ( x)dx ! ... !


q1

q2

xR

f ( x)dx !

q n 1

1 n

(2.22)

unde cele n-1 quantile s-au notat cu q1, q2, , qn-1. Rela ia (2.22) se particularizeaz pentru cazul seriilor discrete, cnd seria este construit cu frecven e relative:

f ! f
i x1 q1

q1

q2

! ... ! f i !
q n 1

xR

1 n

(2.23)

Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel: FN p ! p q N 1 sau N (q p ) ! p ,  p ! 1, n - 1 n n

Modul de calcul a valorilor quantile difer n raport cu tipul seriei. Fie o serie de reparti ie, care are la baz o variabil X discret , de urm toarea form : x x2 ... xi ... xR X : 1 N N ... N ... N . 2 1 i R (2.24)

Pentru calculul valorii quantile de ordinul p ( p ! 1, n  1) , n prima etap trebuie determinat rangul acesteia:

33

rq p ! N (q p ) ! p Se disting dou cazuri:

N n

(2.25)

a) dac pN se divide cu n atunci quantila de ordin p se calculeaz ca o medie aritmetic simpl a valorilor variabilei X, de ordinul rangului i al rangului majorat cu o unitate, dup cum urmeaz : qp ! x rq p  x ( rq p 1) 2 (2.26)

b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei X corespunz toare par i ntregi a rangului majorat cu 1: q p ! x[ rq (2.27)

1]

n cazul seriilor care au la baz o variabil continu , conform defini iei, cele n-1 quantile trebuie s satisfac rela ia (2.22). Determinarea quantilelor din asemenea egalit i ar presupune cunoa terea densit ii de probabilitate f(x). Ori n activitatea practic f(x) se aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule. n vederea g sirii unor formule aproximative de calcul a quantilei de ordin p ( p ! 1, n  1) se consider o serie de varia ie continu , ale c rei intervale de varia ie nu trebuie s fie neap rat egale ca lungime: x  x1 x1  x 2 ... x i 1  x i ... x R 1  x R . X : 0 N ... ... N2 Ni NR 1 (2.28)

n prima etap se determin rangul quantilei de ordinul p ( p ! 1, n  1) conform urm toarei rela ii: 1 R rq p ! N (q p ) ! p N i n i !1 (2.29)

Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i intervalul quantilei de ordinul p ( p ! 1, n  1) . Cumulnd frecven ele pe clase pn la egalarea s-au dep irea rangului, conform inegalit ii: 1 R N 1  N 2  ...  N i u p N i n i !1 (2.29)

ultima frecven adunat va corespunde intervalului quantilei de ordinul p ( p ! 1, n  1) . Prin urmare, quantila de ordinul p, qp, se calculeaz conform rela iei: q p ! x i 1  N (q p )  N ( x i 1 ) Ni ( x i  x i 1 ) (2.30)

34

x q p ! x i 1 - reprezentnd limita inferioar a intervalului quantilei de ordinul p; l q p ! x i  x i 1 - reprezint lungimea intervalului quantilei de ordinul p; N q p ! N i - reprezint frecven a absolut a intervalului quantilei qp,

Procedeul de determinare a quantilei de ordinul p ! 1, n  1 este acela i i n cazul n care seria (2.28) este format din frecven e relative. Caracterizarea structurii unei serii se poate face utiliznd diverse cazuri particulare de valori quantile. Valoarea median (Me) este i un parametru de structur ob inndu-se ca un caz particular de quantil , cnd n=2. Dac pentru o serie se cunoa te Me (quantila de ordinul 2), atunci structura popula iei poate fi redat astfel: X  Me X : min 50% M e  xmax 50% (2.31)

semnificnd faptul c jum tate din popula ia supus studiului a nregistrat pentru variabila X valori cuprinse ntre valoarea minim a lui X i median , iar cealalt jum tate din popula ie a nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X. Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4. Cele trei quartile, care se ob in, notate: Q1, Q2 i Q3 sunt acei parametri de structur care mpart popula ia n patru p r i egale. n raport cu mediana, quartila nti Q1, se nume te quartila mic (inferioar ), quartila a doua Q2 coincide cu mediana i se nume te quartila mijlocie, iar quartila a treia Q3 se nume te quartila mare (superioar ). Cunoscndu-se cele trei quartile, rezult urm toarea structur a popula iei n raport cu variabila X: x  Q1 X : min 25% Q1  Q2 25% Q2  Q3 25% Q3  X max 25% (2.32)

ceea ce semnific o structurare a popula iei supus studiului n patru par i egale. Aceasta nseamn c 25% din unit ile popupa iei nregistreaz valori pentru variabila X mai mici dect quartila mic , 25% din unit ile popula iei nregistreaz valori, n raport cu aceea i variabil X, cuprinse ntre quartila mic i cea mijlocie, 25% vor avea valori cuprinse ntre quartila mijlocie i quartila mare, iar restul 25% din unit ile popula iei vor avea valorile pentru variabila X cuprinse ntre quartila mare i valoarea maxim a lui X.

2.3. Parametrii varia iei Studiul unor popula ii statistice prezint importan numai din punct de vedere al unor m rimi care variaz de la o unitatea la alta sau de la un grup de unit i la altul.

35

Valorile nregistrate de o variabil cantitativ , n raport cu care este studiat o popula ie, se datoresc ac iunii diferi ilor factori esen iali i neesen iali. Intensitatea diferit cu care se pot manifesta factorii esen iali ct i sensul contrar cu care pot ac iona factorii neesen iali n raport cu fiecare unitate, provoac nivele diferite nregistrate de variabile n raport cu care este studiat popula ia. Problema m sur rii varia iei unei variabile cantitative este important pentru a vedea n ce m sur valoarea medie a acesteia poate reprezenta ntrega popula ie. Dac abaterile de la valoarea medie sunt neesen iale atunci se poate afirma c popula ia este omogen i c acest parametru poate reprezenta tendin a central , iar dac aceste abateri sunt mari atunci popula ia este eterogen i valoarea medie nu are capacitatea de a reprezenta popula ia. Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri, parametrul valoarea median poate s -i ia locul. Aceea i problem se pune i n acest caz, de a vedea n ce m sur valoarea median este sau nu reprezentativ pentru popula ia n cauz . O alt problem care nu se poate rezolva f r a studia i m sura varia ia nregistrat de o variabil n raport cu care este studiat o popula ie, o constituie verificarea de ipoteze. n activitatea practic , de multe ori pornind de la valorile unor parametrii calcula i pe baza datelor culese relativ la un num r mic de unit i, este necesar a fi extin i la nivelul ntregii popula ii sau de a se verifica anumite ipoteze statistice. Parametrii varia iei se pot calcula att sub form absolut ct i relativ , i m soar mpr tierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea median . Ca urmare, n func ie de elementul de referin folosit n m surarea varia iei, deosebim: parametrii varia iei n raport cu valoarea medie; parametrii varia iei n raport cu valoarea median .

2.3.1. Parametrii varia iei n raport cu valoarea medie Abaterea medie liniar Abaterea medie liniar , notat cu d x , reprezint media aritmetic a abaterilor variabilei X de la valoarea medie a acesteia, luate n valoare absolut : dx ! M X  X Rela ia (2.33) se particularizeaz n : (2.33)

dx !

x
i !1

i R

 X Ni (2.34)
i

N
i !1

Dac seria are la baz o variabil continu calculeaz astfel:

i se cunoa te f(x), atunci abaterea medie liniar se

36

xR

dx !

x1

x  X f ( x)dx

(2.35)

Densitatea de probabilitate f(x) se poate aproxima cu densitatea empiric i atunci pentru abaterea medie liniar se pot ob ine rela ii de calcul aproximativ, frecvent utilizate n activitatea practic , de forma:

dx !

x
i !1

'
i

 X Ni
R

Ni
i !1

sau

d x ! x 'i  X fi
i !1

(2.36)

dup cum seria n cauz este format cu frecven e absolute sau relative, unde: x i' ! x i 1  x i , i ! 1, R 2

este mijlocul intervalului i. Acest parametru serve te caracteriz rii sintetice a gradului de reprezentativitate a valorii medii, ar tnd cu ct se abate n medie orice valoare a variabilei X de la valoarea medie X , ntr-un sens sau altul. Sub forma relativ , acest indicator poart denumirea de coeficient simplu de varia ie i se calculeaz conform rela iei: Vx ! dx X 100 (2.37)

Coeficientul simplu de varia ie (Vx) arat cu ct se abate n medie orice valoare a variabilei X de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea valoare medie pentru care coeficientul simplu de varia ie este mai mic. Parametrul abaterea medie liniar , n forma absolut sau relativ , prezint unele deficien e deoarece nu este suficient de sensibil la abaterile mici, ad ugndu-se i unele inconveniente de natur teoretic , generate de exprimarea abaterilor n valoarea absolut . nl turarea acestor deficien e se poate realiza apelnd la un nou parametru privind m surarea varia iei, numit abatarea medie p tratic . Abaterea medie p tratic Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii medii ct i n scopul estim rii unor parametri necunoscu i. Abaterea medie p tratic , notat cu x , se define te ca fiind media p tratic a abaterilor valorilor variabilei X, de la valoarea medie X , adic : W x ! M (X  X )2 (2.38)

Un calcul intermediar n aflarea acestui parametru, l constituie calcularea p tratului abaterii medii p tratice, care se nume te dispersie sau varian i are urm toarea expresie de calcul: 37

2 W x ! M (X  X )2 ! D 2 (X )

(2.39)
2 x.

V(x) reprezint o alt nota ie pentru varian , pe lng

Varian a fiind un calcul intermediar n aflarea abaterii medii p tratice, n cele ce urmeaz se va prezenta modul de calcul al acesteia. Rela ia de calcul a varian ei se particularizeaz n raport cu tipul seriei. n cazul unei serii care are la baz o variabil X discret , conform defini iei, varian a are expresia:

2 Wx !

(x
i !1

 X )2 Ni
R

(2.40)
i

N
i !1

n cazul unei serii care are la baz o variabil X continu , varian a se calculeaz conform urm toarei rela ii:
xR 2 Wx !

x1

x  X f ( x) dx
2

(2.41)

a c rei aplicare presupune cunoa terea densit ii de reparti ie f(x). Pentru o serie dat , varian a calculat nu are interpretare, dar dac se extrage r d cina p trat din acesta se ob ine un num r care se exprim n acelea i unit i de m sur ca i variabila de la baza seriei. Acest num r (valoare) reprezint abaterea medie p tratic , simboliznd cu ct se abate n medie n plus sau minus orice valoare xi a variabilei X de la valoarea medie X . Parametrul abaterea medie p tratic se poate exprima i sub form relativ , caz n care se nume te coeficientul de varia ie a lui Pearson, i se noteaz cu Vx. Expresia de calcul este: Vx ! Wx X 100 (2.42)

i reprezint abaterea medie a orc rei valori a variabilei X de la valoarea medie, considerat egal cu 1 sau 100. Coeficientul de varia ie a lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit n aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate. Deoarece gradul de reprezentativitate a valorii medii este n raport invers cu m rimea coeficientului de varia ie a lui Pearson, se poate afirma, n cazul mai multor serii, c este mai reprezentativ valoarea medie a acelei serii pentru care Vx este mai mic. n concluzie, trebuie re inut c parametrul abaterea medie p tratic sub form absolut x i sub form relativ Vx sunt indicatori fundamentali utiliza i n m surarea varia iei unei variabile. Att abaterea medie liniar , ct i abaterea medie p tratic constituie o m sur a varia iei medii, primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x e W x ) . 2.3.2. Parametrii varia iei n raport cu valoarea median Abaterea interquartil

38

Abaterea interquartil , prin defini ie, este media aritmetic simpl a segmentelor Me Q1 i Q3 Me, respectiv: Q! M e  Q1  Q3  M e Q3  Q1 ! 2 2 (2.43)

i arat cu ct se abat n medie, n plus sau n minus, de la median , cele 50% din valorile variabilei cuprinse ntre Q1 i Q3. Forma relativ a acestui indicator notat cu Qr : Qr ! Q Q  Q1 100 ! 3 100 Me 2 Me (2.44)

se nume te coeficient de varia ie interquartilic i arat cu ct se abat n medie de la median (considerat egal cu 100), valorile variabilei nregistrate pentru cele 50% din unit ile popula iei cuprinse ntre Q1 i Q3. Ca atare, se apreciaz c mpr tierea unit ilor n cadrul popula iei studiate este cu att mai mare, n raport cu variabila de studiat, cu ct abaterea interquartil n valoarea absolut (2.43) sau relativ (2.44) este mai mare. Abaterea interquantil Pentru acest parametru, sub form absolut , avem: q! qn 1  M e  M e  q1 qn 1  q1 ! 2 2 q q q 100 ! n 1 1 100 Me 2 Me (2.45)

iar sub form relativ denumit qr !

i coeficient de varia ie interquantilic este: (2.46)

Cu ct abaterea interquantilic (relativ sau absolut ) este mai mic , cu att valoarea median este mai reprezentativ . 2.4. Parametrii concentr rii Energia informa ional Acest parametru a fost introdus de Acad. Octav Onicescu. Prin defini ie: E ! fi2
i !1 R

unde s-a notat cu E energia informa ional . Este un parametru utilizat n cazul n care seria are la baz o variant nenumeric .

39

n cazul unei popula ii caracterizat de un grad de concentrare maxim, va exista o clas care va avea frecven a relativ egal cu 1, iar celelalte vor avea frecven ele relative 0 i ca urmare: Emax = 1. Dac popula ia este caracterizat de o concentrare minim , atunci: x2 ... xR x X : 1 1 / R 1 / R ... 1 / R iar Emin ! R Se observ c : 1 e E e1 R Forma relativ a acestui parametru, notat cu Er, se deduce astfel: 1 E R ! Er ! 1 1 R de unde: 0 e Er e 1 Referitor la popula ia dat , studiat n raport cu o variabil X, se calculeaz Er, iar dac : - Er se apropie de 1, atunci popula ia respectiv este caracterizat de un grad nalt de concentrare; - Er se apropie de 0, popula ia n cauz se caracterizeaz printr-o concentrare minim . 2.5. Parametrii formei Din aplica iile practice, precum i din alte surse, s-au constatat c graficele pot avea diverse forme, dintre care: form de coplot, form de U, J, L sau alte forme. Ceea ce prezint importan , nefiind surprins de nici un parametru prezentat, l constituie modul de repartizare a valorilor variabilei de o parte i de alta a valorii medii, considerat i centrul de greutate a seriei. Acest lucru nu nseamn altceva dect eviden ierea acelei curbe care aproximeaz cel mai bine conturul poligonal al seriei respective i n acela i timp o imagine mai clar asupra gradului de reprezentativitate a valorii medii. n marea majoritate a cazurilor, distribu ia unit ilor unei popula ii se face dup un clopot (dup legea normal a lui Gauss). Dar unit tile nu se distribuie uniform n jurul valorii medii, ceea ce poate conduce la nclina ii ntr-o direc ie sau alta a valorii medii. Aceast distribuire neuniform poate conduce la cazul cnd diferite serii (diferit distribuite n jurul valorii medii) s aib aceea i medie, acela i i totu i o curb s fie mai aplatizat dect cealalt , simetric sau mai pu in simetric . Eviden ierea acestor diferen e poate fi realizat cu ajutorul parametrilor formei. Parametrii formei unei serii de reparti ie, dup con inut, se clasific n dou grupe:
R

1 1 ! 2 R R

f
i !1

2 i

 1 R

1 R

1

40

parametrii asimetriei; parametrii boltirii.

2.5.1. Parametrii asimetriei Asimetria unei serii se define te n raport cu dispunerea unit ilor ntr-o parte sau alta a valorii medii. n acest sens, o serie de reparti ie este simetric n raport cu media sa dac frecven ele valorilor variabilei X egal dep rtate de valoarea medie sunt egale ntre ele, adic : f X H ! f X H

oricare ar fi astfel nct X  H i X  H s se afle printre valorile lui X. Coeficientul de asimetrie al lui Fisher Acest parametru se noteaz cu
3,

iar expresia sa de calcul este:

M XX E3 ! 3 WX sau ntr-o form echivalent : E3 !

(2.47)

M  X X
M XX
3 2

Calculnd valoarea acestui parametru, n func ie de semnul ei, avem urm toarele cazuri: 1. 3 = 0, ceea ce nseamn c M X  X = 0, adic suma tuturor abaterilor cu semnul minus este egal cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare n acest caz se poate spune c seria este simetric . 2. 3 > 0, ceea ce nseamn c M X  X > 0. Aceasta este echivalent cu faptul c pe total suma abaterilor cu semnul plus de la valoarea medie este mai mare dect suma abaterilor cu semnul minus i ca urmare seria prezint o asimetrie pozitiv . 3. 3 < 0, deci M X  X < 0. Aceasta nseamn c pe total, suma abaterilor cu semnul minus este mai mare dect suma abaterilor cu semnul plus de la valoarea medie. O astfel de serie se spune c reprezint o asimetrie negativ .

2.5.2. Parametrii boltirii 41

Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a valorii medii ct i pentru compararea reprezentativit ii a dou sau mai multe valori medii ce reprezint serii diferite. Parametrul M X  X d o caracterizare numeric sub form absolut a gradului de boltire a unei serii. Sub form relativ , gradul de boltire se m soar cu parametrul: M X X B4 ! 4 WX

(2.48)

Pentru a n elege semnifica ia boltirii unei serii, se consider dou serii statistice care au la baz variabilele X i Y, iar X ! Y; W X ! WY Mai presupunem, n plus, c cele dou distribu ii au form de clopot pentru care 3X = 3Y , adic ambele sunt simetrice. De i s-ar p rea c cele dou serii nu au nimic care s le deosebeasc , totu i reprezentndu-le grafic rezult dou curbe de forma:

X !Y

W X ! WY

unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou serii nu sunt caracterizate de aceea i boltire. Boltirea unei serii este util pentru a da o caracetrizare mai exact reprezentativit ii valorii medii. n cazul exemplului prezentat mai sus, att mediile ct i abaterile medii p tratice sunt egale i ca urmare, coeficientul de varia ie al lui Pearson este acela i pentru cele dou serii. Deci rezult c ambele valori medii prezint acela i grad de reprezentativitate. Cu toate acestea, graficele celor dou serii contrazic concluzia dedus n urma compar rii celor doi coeficien i de varia ie. Valoarea medie cea mai reprezentativ n seria n care cele mai multe unit i ale popula iei cercetate au nregistrat valori, mai apropiate de valoarea medie. Pentru o astfel de serie, mpr tierea fa de valoarea medie fiind mic , graficul are o form mai ascu it n cazul seriei X i mai plat n cazul seriei Y.

42

Nivelul boltirii pentru o serie oarecare dat se m soar cu ajutorul parametrului B4, a c rui expresie de calcul este dat de rela ia (2.48). Valoarea lui B4 pentru o distribu ie normal este egal cu 3. Pentru orice alt curb corespunz toare unei serii date i aproximat cu un clopot, raportul ntre momentul centrat de ordinul patru i p tratul momentului centrat de ordinul al doilea, este un num r diferit de 3, curba respectiv fiind mai ascu it sau mai plat dect curba normal a lui Gauss. Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui Gauss, Fisher a stabilit urm toarea expresie de calcul al coeficientului boltirii, notat cu B4: M XX B ! 4 WX
' 4

3
4

sau:

B4 = B4-3

expresie cunoscut n literatura de specialitate sub denumirea de exces al seriei. Urm toarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii: - dac B4 =0 (adic B4 = 3) atunci seria n cauz prezint aceea i boltire cu a curbei normale (excesul este nul); - dac B4 > 0 (adic B4 > 3) atunci boltirea corespunz toare curbei respective este mai nalt i mai ascu it dect curba normal (serie leptokurtic ); - dac B4 < 0 (adic B4 < 3) atunci boltirea corespunz toare curbei respective este mai plat (mai joas i mai larg ) dect curba normal (serie platikurtic ). Asimetria i boltirea joac un rol nsemnat n caracterizarea formei unei serii atributive de reparti ie. Cu ajutorul parametrilor prezenta i poate fi format o imagine mai clar asupra unei serii deja construite, asupra m surii n care seria respectiv poate fi reprezentat de valoarea sa medie. Bibliografie: 1.Buiga, A., Drago C., Laz r D., Parpucea I., Statistic descriptiva, Ed. Mediamira, ClujNapoca, 2010; 2.Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia , Ed. Presa Universitar Clujean , Cluj-Napoca, 2001;

3.Florea I., Parpucea I., Buiga A., Napoca, 1998

Statistic

descriptiv , Ed. Continental, Cluj-

43

MODULUL 3
ANALIZA LEG TURILOR DINTRE VARIABILELE UNEI REPARTI II MULTIDIMENSIONALE Obiective
y y y nsu irea conceptelor de corela ie si regresie si utilizarea lor n economie Cunoa terea posibilit ilor de cuantificare a intensit ii leg turii dintre diversele m rimi economice nsu irea metodelor de stabilire a unei leg turi func ionale ntre variabile

Concepte de baz
y y y y Corela ia dintre variabile, coeficien i de asociere, coeficient de corela ie Corela ia rangurilor, coeficien ii lui Kendall si Spearman Metoda celor mai mici p trate, regresia liniar simpl Regresia liniar multipl , regresii neliniare: hiperbolic , parabolic , exponen ial

Rezultate a teptate
Dup parcurgerea acestui modul se cere studentului s st pneasc no iunile de corela ie i regresie, s poat identifica existen a unei eventuale leg turi ntre dou m rimi. De asemenea s tie m sura intensitatea leg turii dintre variabile, fie ele cantitative sau calitative. Se urm re te i cunoa terea metodelor de modelare func ional a leg turilor.

Sinteza
Ne propunem abordarea unor metode statistice caracteristice studiului seriilor multidimensionale. Scopul acestora este de a identifica i utiliza eventualele leg turi care se pot manifesta ntre dou sau mai multe variabile. Prezinta interes: existen a leg turii, intensitatea acesteia, forma func ional a leg turii, parametrii i reprezentativitatea ei privind fenomenul cercetat. Problematica leg turilor dintre variabile este foarte curent ntlnit n economie. Spunem c salariul unui angajat este n func ie de productivitatea muncii sale, vechimea n munc , responsabilitatea activit ii sale, etc ; sau cererea dintr-un produs este n func ie de pre ul produsului, venitul consumatorilor, etc. De fiecare dat , att n teoria economic , ct i n aplica ii se ntlne te expresia fie func ia cererii. n realitatea economic ns , aceast func ie nu se d , nu se cunoa te, ci trebuie estimat pornind de la o baz de date. Aceast problem de estimare a unei func ii i alte probleme colaterale ei fac obiectul acestui capitol. Pentru a putea aborda studiul leg turilor dintre variabile trebuie s tim n primul rnd dac exist sau nu o leg tur ntre variabilele studiate (sau ntre fenomenele pe care acestea le reprezint ) i care este natura acestora. Putem clasifica leg turile dinte variabile astfel : 1. Leg tura nul . Semnific lipsa oric rei leg turi ntre dou sau mai multe fenomene sau variabile care cuantific fenomenele. De exemplu, o leg tur nul se manifest ntre n l imea unui angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta primului ministru. Din punct de vedere statistic, spunem c ntre dou variabile X i Y exist o leg tur nul , sau nu exist leg tur , dac cov( x, y ) ! 0 . 2. Leg tura determinist . Spunem c ntre variabilele X i Y exist o leg tur determinist dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de leg turi 44

se ntlnesc n special n fizic , unde de exemplu viteza este egal cu distan a mp r it la timp: v ! d / t , sau for a este egal cu masa nmul it cu accelera ia: F ! m a . Astfel de exemple exist i n economie, unde rata profitului este egal cu profitul mp r it la cifra de afaceri: rT ! T / C . A. 100% . Leg tura este determinist pentru c variabila rT este perfect determinat de celelalte dou : T i C.A. Adic pentru o anumit valoare a profitului i o anumit valoare a cifrei de afaceri nu putem avea dect o singur valoare a ratei profitului. 3. Leg tura statistic . Se mai nume te i stocastic sau probabilist . Este tipul de leg tur cel mai des ntlnit n tiin ele sociale, deci i n economie. Fiec rei valori xi a variabilei X i corespunde o distribu ie de valori ale variabilei Y. Matematic, o astfel de leg tur se exprim sub forma y ! f (x)  I , unde am notat prin I componenta aleatoare rezidual , datorat ac iunii asupra lui Y a celorlal i factori dect X. De i s-ar putea spune c prin luarea n considerare a tuturor factorilor care influen eaz variabila Y, leg tura este intrinsec determinist , n tiin ele economice vom ntlni aproape ntotdeauna un num r foarte mare de factori, care nu pot fi identifica i i cuantifica i n totalitatea lor. Asfel, func ia care l expliciteaz pe Y are dou componente: una determnist , f ( x1 , x2 ,..., xn ) , cuprinznd variabilele cuantificabile de care depinde Y, i una aleatoare, I , cuprinznd variabilele ce nu au putut fi cuantificate. Sudiul leg turilor dintre variabile s-a dezvoltat ntr-o disciplin aparte, numit econometrie. n capitolul de fa nu ne propunem deci dect o introducere n aceast

problematic , f r a aborda elemente de inferen statistic specifice acestor leg turi. n cele ce urmeaz vom prezenta cteva aspecte legate de variabile i fenomenele reprezentate de acestea, probleme att de natura aparatului statistic utilizat, ct i de aplicabilitatea lui n contextul economic.

Analiza leg turii dintre variabilele unei reparti ii multidimensionale presupune abordarea urm toarelor probleme, care se pot constitui i n etape ce trebuie parcurse n demersul statistic necesar: 1. Organizarea rezultatelor observ rii popula iei sau e antionului n raport cu variabilele cercetate 2. Analiza statistic a existen ei leg turii 3. Analiza statistic a intensit ii leg turii sau a gradului de asociere dintre variabilele observate 4. Formularea unor ipoteze cu privire la forma matematic a leg turii 5. Estimarea parametrilor func iei de regresie 6. Analiza reprezentativit ii func iei de regresie Aceste etape pot fi parcurse integral sau par ial, n func ie de natura variabilelor. Pentru variabilele calitative nu vor fi parcurse (n statistica descriptiv ) dect primele trei, 45

deoarece posibilit ile de prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi parcurse n cazul variabilelor cantitative.

3.1. Organizarea rezultatelor observ rii popula iei sau e antionului n raport cu variabilele cercetate

n scopul utiliz rii facile a informa iei culese la nivelul popula iei sau e antionului, rezultatele observ rii vor fi sistematizate ntr-o form convenabil prelucr rii lor. Se prefer de obicei o form tabelar a prezent rii, care poate sugera unele idei de lucru pentru etapele urm toare, prin unele remarci cu privire la valorile pe care le-au nregistrat variabilele.

3.2. Analiza statistic a existen ei leg turii

n studiul analizei existen ei leg turii vom folosi att elemente de statistic deja abordate n capitolele anterioare, cum ar fi tabelele i graficele, ct i parametri

(coeficien i) specifici acestui capitol. Deoarece prezint particularit i distincte, vom aborda separat problematica subcapitolului n func ie de tipul variabilelor. 3.2.1. Analiza statistic a existen ei leg turii pentru variabile calitative Un prim instrument ce ne st la ndemn este tabelul de corela ie, un tabel cu dou intr ri, reprezentnd o reparti ie bidimensional . Modul de construc ie al unui astfel de tabel se cunoa te de la seriile statistice.

46

G !
2 i !1 j !1

 ( N ij  N ij ) 2  N ij

Ca o concluzie, distingem cele dou cazuri: 1) Dac G 2 ! 0 nu exist leg tur ntre variabile 2) Dac G 2 "" 0 exist leg tur ntre variabile Procedeul prezentat anterior ne permite identificarea existen ei leg turii dintre dou variabile, dar nu i a intensit ii acesteia. Totu i, pornind de la el se pot construi coeficien i care s ne permit sec iunile urm toare. i aprecierea intensit ii leg turii, a a cum se va vedea n

3.2.2. Analiza statistic a existen ei leg turii pentru variabile cantitative A a cum s-a v zut n capitolul anterior, dac dispunem de o reparti ie bidimensional , putem descompune varian a total a variabilei de explicat Y ca sum a varian elor datorate variabilei explicative X i respectiv celorlal i factori, adic :
2 2 2 WY ! WY / X WY/ X

Dac nu exist leg tur , adic X nu are nici o influen asupra lui Y, mediile condi ionate
2 Y / X vor fi identice, iar dispersia lor va fi nul : W Y / X ! 0 .

Putem re ine deci ca regul de decizie n statistica descriptiv :


2 1) Dac W Y / X ! 0 nu exist leg tur ntre variabile 2 2) Dac W Y / X "" 0 exist leg tur ntre variabile

3.3. Analiza statistic a intensit ii leg turii sau a gradului de asociere dintre variabilele observate

47

Ca i n cazul existen ei leg turii, o prim apreciere a intensit ii se poate face pe baza tabelului de corela ie i a norului de puncte. Cu ct frecven ele mai mari sunt mai grupate n jurul uneia din diagonalele tabelului de exemplu sau punctele norului sunt mai grupate n jurul unei linii, cu att leg tura este mai intens . n ceea ce prive te metodele cantitative de apreciere, ele sunt mult mai precise i ne pot oferi valori numerice ale intensit ii sau gradului de asociere. Aceste metode sunt ns diferite n func ie de tipul variabilelor i de aceea le vom aborda separat.

3.3.1. Gradul de asociere sau intensitatea leg turii dintre variabilele calitative Coeficientul de asociere (contingen ) al lui Pearson Rela ia de calcul a coeficientului este: G2 N G2

C!

unde N este volumul popula iei. dac G 2 ! 0 leg tura este nul (lipsa leg turii) dac G 2 ( 0 ; 0,3 ) leg tura este de intensitate slab dac G 2 [ 0,3 ; 0,7 ) leg tura este de intensitate medie dac G 2 [ 0,7 ; 1 ) leg tura este de intensitate puternic

3.3.2. Gradul de asociere sau intensitatea leg turii dintre variabilele ordinale

Coeficientul de corela ie a rangurilor al lui Kendall

48

Pentru a putea utiliza acest indicator toate unit ile popula iei trebuie s poat fi ordonate n raport cu variabilele pentru care cercet m intensitatea leg turii. Presupunem o popula ie de volum n observat n raport cu m variabile. Pentru a putea construi coeficientul, vom defini mai nti indicatorul de concordan concordan (P) i respectiv indicatorul de discordan (Q). Pe baza indicatorilor de

i discordan construim coeficientul de corela ie simpl a rangurilor al lui

Kendall, definit astfel: X! PQ P Q ! P  Q n(n  1) 2

n cazul unei leg turi directe de intensitate maxim , P va lua valoare sa maxim , iar Q pe cea minim , adic : P !
n(n  1) iar Q ! 0 , deci X ! 1 . 2

n cazul unei leg turi inverse de intensitate maxim , P va lua valoare sa minim , iar Q pe cea maxim , adic : P ! 0 iar, Q !
n (n  1) deci X ! 1 . 2

n cazul lipsei leg turii, P ! Q , iar X ! 0 . Putem determina astfel intervalul n care va fi cuprins X , respectiv X [-1 ; 1] . Interpretarea intensit ii leg turii pe baza acestui coeficient se va face astfel: dac dac dac dac

X " 0 leg tura este direct X ! 0 leg tura este nul X 0 leg tura este invers X [0 ; 0,3) leg tura este de intensitate slab

dac X [0,3 ; 0,7) leg tura este de intensitate medie dac X [0,7 ; 1] leg tura este de intensitate puternic

Coeficientul de corela ie a rangurilor al lui Spearman

49

Ca i coeficientul similar propus de Kendall, i acesta se calculeaz pornind de la tabelul de concordan a rangurilor. Ne vom folosi de diferen ele d i dintre ranguri pentru aceea i unitate a popula iei relativ la cele dou variabile. Coeficientul are urm toarea expresie: 6 d i2
i !1 n

L ! 1

n (n 2  1)

Limitele celor doi coeficien i sunt acelea i, la fel i interpret rile valorilor numerice.

3.3.3. Intensitatea leg turii dintre variabilele cantitative

Raportul de corela ie

Folosind regula de adunare a varian elor descompunem varian a total a variabilei de explicat Y ca sum a varian elor datorate variabilei explicative X i respectiv celorlal i factori, adic :
2 2 2 WY ! WY / X WY/ X

2 Varian a explicit W Y / X este cu att mai mare cu ct mediile condi ionate Y / X sunt mai

diferite ntre ele. Ceea ce le face s difere este numai influen a lui X, deoarece am mp r it popula ia n grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim varian a explicit ca o m rime absolut a intensit ii leg turii dintre X i Y i ponderea varian ei explicite n varian a total ca o m rime relativ . Raportul de corela ie are expresia:

50

RYX !

Vexp Vtot

! 1

Vrez Vtot

sau sub forma ei matematic :


2 WY / X 2 WY 2 WY / X 2 WY

RYX !

! 1

Pentru a-i g si limitele ne raport m la cele dou situa ii extreme: dac nu exist leg tur ntre X i Y, mediile condi ionate Y / X sunt egale ntre ele, 2 deci W Y / X ! 0 i RYX ! 0 dac leg tura este de intensitate maxim , nu exist influen e ale altor factori dect 2 X asupra lui Y, nu exist varia ie n cadrul grupelor, deci W Y / X ! 0 i RYX ! 1 .

n consecin , raportul de corela ie apar ine intervalului RYX [0 ; 1] . Interpretarea intensit ii leg turii pe baza acestui coeficient se va face astfel: dac dac dac dac

RYX ! 0 leg tura este nul RYX [0 ; 0,3) leg tura este de intensitate slab RYX [0,3 ; 0,7) leg tura este de intensitate medie RYX [0,7 ; 1] leg tura este de intensitate puternic .

3.4. Formularea unor ipoteze cu privire la forma matematic a leg turii Dac ntre dou variabile (ambele cantitative !) se constat existen a unei leg turi de o anumit intensitate, ne punem problema posibilit ii model rii leg turii printr-un model matematic. O prim etap n acest demers este formularea unei ipoteze ct mai verosimile cu privire la forma leg turii. n acest scop, pe baza tabelului de corela ie construim norul statistic i linia poligonal a mediilor condi ionate ale variabilei dependente.

Y Y / x4

Y / x3

Y / x2 Y / x1 51 X

n func ie de forma liniei frnte ob inute i a pozi iei punctelor norului fa de ea se formuleaz o ipotez cu privire la forma func iei de regresie. Dac dorim s studiem o leg tur multipl , respectiv dependen a lui Y fa de variabilele factoriale X 1 , X 2 ,..., X n atunci pentru fiecare pereche (Y , X 1 ) , (Y , X 2 ) , (Y , X n ) desen m cte un nor statistic. Forma general a variabilei Y n func ie de variabilele factoriale X 1 , X 2 ,..., X n se scrie: Y ! f ( X 1 , X 2 ,..., X n )  I unde f ( X 1 , X 2 ,..., X n ) reprezint func ia de regresie care aproximeaz cel mai bine forma leg turii, iar I o variabil aleatoare numit rezidual , care nsumeaz efectul altor factori dect cei lua i n calcul. 3.5. Estimarea parametrilor func iei de regresie Este o etap care se succede firesc alegerii formei func iei. n estimarea parametrilor va trebui s inem cont de abaterea punctelor norului fa de modelul matematic ales Y ( X 1 , X 2 ,..., X n ) , datorat altor factori dect X 1 , X 2 ,..., X n , considera i neesen iali, cuantifica i prin variabila rezidual I . Principiul de la care se porne te n estimarea parametrilor este cel al patratelor minime. Minimiz m suma patratelor abaterilor valorilor observate ale lui Y de la nivelul calculat prin Y ( X 1 , X 2 ,..., X n ) . Condi ia de minim a sumei este echivalent cu condi ia de minim a mediei: M ?  Y ( X 1 , X 2 ,..., X n )A ! M (I 2 ) minim Y
2

Ecua ia Y ( X 1 , X 2 ,..., X n ) care descrie leg tura dintre Y i factorii de influen X 1 , X 2 ,..., X n se nume te ecua ia de regresie. Metoda regresiei const n modelarea leg turilor statistice prin ecua ia de regresie. Deoarece problema de minim se poate rezolva doar cunoscnd forma particular a func iei, vom aborda estimarea parametrilor seprat, pe tipuri de func ii. Regresia liniar n ipoteza n care leg tura dintre Y i factorii s i de influen ecua ia de regresie va fi de forma:
Y ( X 1 , X 2 ,..., X n ) ! a0  a1 X 1  a 2 X 2  a n X n

X 1 , X 2 ,..., X n este liniar ,

52

Coeficien ii a0 , a1 , a 2 ,..., an se numesc parametrii modelului i vor rezulta din minimizarea urm toarei func ii cu (n+1) necunoscute: G (a0 , a1 ,..., an ) ! M ?  (a0  a1 X 1  ...  a n X n )A Y
2

Condi iile de minim constau n anularea celor (n+1) derivate par iale ale func iei G (a0 , a1 ,.., a n ) n raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la urm torul sistem de ecua ii: x G (a0 , a1 ,..., an ) ! 2 M ?  (a0  a1 X 1  ...  an X n )A! 0 Y xa0 x G (a0 , a1 ,..., an ) ! 2 M ?  (a0  a1 X 1  ...  an X n )A X j ! 0 Y xa j
j ! 1, n

sau ntr-o form echivalent : M a0  a1 X 1  ...  a n X n ! M (Y ) M a0  a1 X 1  ...  a n X n X n ! M (Y ) X j de unde rezult : a 0  a1 M ( X 1 )  ...  a n M ( X n ) ! M (Y ) a 0  a1 M ( X 1 X j )  ...  a n M ( X n X j ) ! M (YX j )

j ! 1, n

j ! 1, n

Prin rezolvarea acestui sistem liniar de ecua ii n raport cu necunoscutele a0 , a1 ,..., a n , se ob in valorile parametrilor ecua iei de regresie. Astfel, leg tura statistic dintre Y i X 1 , X 2 ,..., X n este modelat prin aproximare cu o leg tur func ional . Pentru cazul cu doi factori X 1 i X 2 , ecua ia de regresie se scrie: Y ( X 1 , X 2 ) ! a0  a1 X 1  a 2 X 2 iar sistemul de ecua ii devine: a 0  a1 M ( X 1 )  a 2 M ( X 2 ) ! M (Y ) 2 a0 M ( X 1 )  a1 M ( X 1 )  a 2 M ( X 1 X 2 ) ! M (YX 1 ) 2 a 0 M ( X 2 )  a1 M ( X 1 X 2 )  a 2 M ( X 2 ) ! M (YX 2 ) Prin substitu ia lui a 0 din prima ecua ie i nlocuirea lui n celelalte, ob inem:

53

2 2 a 1 M ( X 1 )  [ M ( X 1 )]  a2 ?M ( X 1 X 2 )  M ( X 1 ) M ( X 2 )A! M (YX 1 )  M (Y ) M ( X 1 ) 1 ?M ( X 1 X 2 )  M ( X 1 )M ( X 2 )A a2 M ( X 22 )  [ M ( X 2 )]2 ! M (YX 2 )  M (Y )M ( X 2 ) a

Dac pentru a aduce la o form mai simpl not m cu:

mij ! M [ X i  M ( X i )] [ X j  M ( X j )] ! M ( X i X j )  M ( X i ) M ( X j )
care reprezint covaria ia dintre variabilele X i i X j , ob inem:

a 1 m11  a 2 m12 ! m01 a 1 m12  a 2 m22 ! m02 de unde putem ob ine valorile parametrilor: m01m22  m12 m02 2 m11m22  m12 m11m02  m12 m01 2 m11m22  m12

a1 ! a2 !

De aici l vom deduce i pe a0 , care a fost substituit n prima ecua ie. Astfel, a0 , a1 , a 2 sunt valorile parametrilor modelului liniar cu trei variabile. nlocuind valorile parametrilor n ecua ia de regresie se ob ine: m11 m21  m10 m20 m m12 ( X 1 , X 2 )  M (Y )  10 Y m20 m22 m11 X 2  M ( X 2 ) ! 0 m21 m12 m22 X 1  M ( X 1 ) 

Pentru a face rela ia mai accesibil , introducem matricea de varia ie i covaria ie: M
( 3)

m00 ! m10 m 20

m01 m11 m21

m02 m12 m22

( i notnd complementul algebric al elementului m0 j cu M oj3) , j ! 0,1,2 ecua ia de regresie devine:

54

(3 (3 (3 M 00 ) ( X 1 , X 2 )  M (Y )  M 01 ) X 1  M ( X 1 )  M 02) X 2  M ( X 2 ) ! 0 Y

Pentru cazul mai general al leg turii liniare dintre Y i X 1 , X 2 ,..., X n , matricea de varia ie i covaria ie este: m00 m10 ! ... m n0 m01 ... m0 n m11 ... m1n ... ... ... mn1 ... mnn

M ( n 1)

iar ecua ia de regresie se poate scrie:


(n (n M 00 1) ( X 1 , X 2 )  M (Y )  M 01 1) X 1  M ( X 1 )  ...  M 0( n1) X n  M ( X n ) ! 0 Y n

Matricea de varia ie i covaria ie M ( n 1) este simetric n raport cu prima diagonal . Elementele mii de pe diagonala principal sunt varian ele variabilelor Y , X 1 , X 2 ,..., X n , iar elementele mij , i { j reprezint covarian ele dintre variabilele corespunz toare. Regresia liniar simpl n cazul regresiei liniare simple, cu variabila endogen Y i factorul X 1 , matricea de varia ie i covaria ie este: m M ( 2 ) ! 00 m 10 m01 m11

iar ecua ia de regresie devine:


m11 ( X )  M (Y )  m10 X 1  M ( X 1 ) ! 0 Y

de unde l putem exprima pe Y (X ) ca:

Y (X ) !

m m10 X 1  M (Y )  10 M ( X 1 ) m11 m11

de unde rezult coeficien ii:

55

a 0 ! M (Y )  a1 ! m10 X1 m11

m10 M ( X1 ) m11

Regresia parabolic n economie sunt numeroase exemplele n care leg tura dintre fenomene i deci variabilele care le cuantific nu este liniar . Dac Y reprezint recolta la hectar dintr-un produs agricol, iar X cantitatea de ngr minte, ne vom da seama chiar i intuitiv c o anumit cre tere a lui X nu provoac aceea i cre tere a lui Y pe tot intervalul de varia ie al celor dou variabile. La valori mari ale cantit ii de ngr minte, acestea provoac satura ie sau chiar nocivitate, ducnd la o stagnare, respectiv diminuare a produc iei. Alte exemple pot fi: leg tura dintre vechimea n munc i m rimea salariului, dintre cheltuielile cu publicitatea i volumul vnz rilor, etc. Determinarea parametrilor func iei parabolice de regresie se poate face fie aplicnd direct func iei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat anterior. n ambele cazuri vom exemplifica pentru parabola de ordinul doi. a) Estimarea parametrilor prin aplicarea direct a metodei patratelor minime Ecua ia de regresie a modelului se scrie:
Y ( X ) ! a0  a1 X  a2 X 2

Din condi ia de minimizare a expresiei: G (a0 , a1 , a2 ) ! M ?  Y ( X )A Y avem urm toarele egalit i: xG (a0 , a1 , a 2 ) !0 xa 0 xG (a0 , a1 , a 2 ) !0 xa1 xG (a0 , a1 , a 2 ) !0 xa 2
2

56

din care rezult sistemul de ecua ii: 2 M Y  (a0  a1 X  a 2 X 2 ) ! 0  2  2 M Y  (a0  a1 X  a 2 X ) X ! 0 2 2  2 M Y  (a0  a1 X  a 2 X ) X ! 0 care este echivalent cu: 0  a1 M ( X )  a 2 M ( X 2 ) ! M (Y ) a 2 3 a0 M ( X )  a1 M ( X )  a2 M ( X ) ! M (YX ) 2 3 4 2 a 0 M ( X )  a1 M ( X )  a2 M ( X ) ! M (YX ) Rezolvnd acest sistem n necunoscutele a0 , a1 , a2 , rezult parametrii ecua iei de regresie parabolice. n mod asem n tor se poate proceda pentru orice regresie neliniar .

? ? ?

A A A

b) Estimarea parametrilor prin reducerea la cazul liniar


Avnd modelul parabolic de ecua ie:
Y ( X ) ! a0  a1 X  a 2 X 2

facem substitu iile:

X ! X1
X 2 ! X2 dup care ecua ia devine: Y ( X 1 , X 2 ) ! a0  a1 X 1  a 2 X 2 care reprezint un model liniar cu doi factori. Elementele matricei de varia ie i covaria ie vor ar ta astfel:
2 m00 ! M (Y 2 )  ( M (Y )) 2 ! W Y

57

m01 ! m10 ! M (YX )  M (Y ) M ( X ) ! cov(Y , X ) m02 ! m20 ! M (YX 2 )  M (Y )M ( X 2 ) ! cov(Y , X 2 )


2 m11 ! M ( X 2 )  ( M ( X )) 2 ! W X

m12 ! M ( X 3 )  M ( X ) M ( X 2 ) ! cov( X , X 2 )
2 m22 ! M ( X 4 )  ( M ( X 2 )) 2 ! W X 2

Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o problem de regresie liniar , care se rezolv conform cazului liniar. n cazul mai general, dac ecua ia de regresie este un polinom de gradul n:
Y ( X ) ! a0  a1 X  a 2 X 2  ...  an X n

efectund substitu iile:


X ! X 1 ; X 2 ! X 2 ; ... ; X n ! X n

ob inem cazul liniar n raport cu (n+1) variabile. Regresia exponen ial Dac ecua ia de regresie are form exponen ial : Y (X ) ! a bX se ncearc aducerea la forma liniar . Mai nti se logaritmeaz ecua ia: lg Y ( X ) ! lg a  X lg b iar apoi se fac substiti iile: Z ( X ) ! lg Y ( X ) a0 ! lg a a1 ! lg b Rezult astfel modelul liniar simplu:

58

Z ( X ) ! a0  a1 X

Regresia hiperbolic Dac ecua ia de regresie are form hiperbolic : 1 X

Y (X ) ! a  b

se face substitu ia:


1 X

X1 !

de unde rezult modelul liniar: Y ( X 1 ) ! a  bX 1 n matricea de varia ie i covaria ie elementele vor fi:
2 m00 ! M (Y 2 )  ( M (Y )) 2 ! W Y

1 1 1 m01 ! m10 ! M Y  M (Y ) M ! cov Y , X X X 1 1 m11 ! M 2  M X X Alte tipuri de regresie n practica economic se ntlnesc frecvent i alte tipuri de func ii (unele chiar func ii compuse). Principiul de lucru pentru estimarea parametrilor va r mne ns ntotdeauna acela i: ncercarea de a aduce func ia la o form liniar . Foarte des ntlnite sunt func iile de produc ie. Forma general a acestora este:
m m Y ( X 1 , X 2 ,..., X n ) ! a X 1m1 X 2 2 ... X n n

2 ! W 1/ X

Printr-o astfel de func ie se define te o leg tur ntre nivelul produc iei Y i factorii de care aceasta depinde: productivitatea muncii, calificarea for ei de munc , gradul de nzestrare 59

cu capital fix, etc. Determinarea parametrilor se face prin reducere la cazul liniar prin logaritmare:
lg Y ( X 1 , X 2 ,..., X n ) ! lg a  m1 lg X 1  ...  mn lg X n

Dac n aceast nou ecua ie facem substitu iile: Z ( X 1 , X 2 ,..., X n ) ! lg Y ( X 1 , X 2 ,..., X n ) X i ' ! lg X i , i ! 1, n reducem ecua ia la una liniar multipl . 4.6. Analiza reprezentativit ii func iei de regresie Coeficientul de corela ie Construc ia lui este similar cu a raportului de corela ie, cu deosebirea c varian a n fiecare grup este calculat folosind suma patratelor abaterilor fa de valorile ajustate prin func ia de regresie i nu fa de media grupei. Ca urmare, coeficientul de corela ie va fi specific fiec rei func ii n parte. Expresia lui de calcul (admis aici f r demonstra ie) este: det M rYX ! 1  m00 M 00 rYX [0 ; 1] Interpretarea acestui coeficient n func ie de valorile pe care le poate lua este urm toarea: - dac rYX [0 ; 0,3] func ia nu este reprezentativ pentru modelarea leg turii dintre variabile - dac rYX (0,3 ; 0,7] func ia are o reprezentativitate medie pentru modelarea leg turii dintre variabile - dac rYX (0,7 ; 1] func ia este foarte reprezentativ pentru modelarea leg turii dintre variabile Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficien ilor este bine s fie comparate cu ale altor coeficien i, ai altor func ii. Pentru aceea i reparti ie de exemplu, pentru func iile de regresie alese ca fiind posibilecalcul m coeficien ii de corela ie i l re inem pe cel mai mare, considernd acea func ie ca fiind cea mai reprezentativ . n cazul regresiei liniare simple, formula coeficientului poate fi adus la o form echivalent mai simpl : m00 M ( 2) ! m 10 m01 m11

60

rYX ! 1  !

m m  m01 m10 det M ! 1  00 11 ! m00 M 00 m00 m11 m01 ! M ( XY )  M ( X )M (Y ) W Y W X

m01 m10 ! m00 m11

m00 m11

4.7. Corela ia par ial Prin corela ie simpl am studiat leg tura liniar dintre doi factori neglijnd influen a celorlal i factori, care ac ioneaz n acela i timp asupra variabilei endogene. n corela ia multipl am m surat influen a simultan a dou sau mai multe variabile exogene asupra celei endogene. Ne punem ns problema de a m sura influen a unei variabile independente asupra celei dependente, presupunnd celelalte variabile la un nivel constant. F r a recurge la demonstra ii, vom da modul de calcul al coeficien ilor de corela ie par ial pentru dou cazuri: a) Cazul unei variabile dependente Y i dou variabile independente X1 i X2: - corela ia dintre Y i X1, neglijnd influen a lui X2 : rYX 1 X 2 ! rYX 1  rYX 2 rX 1 X 2
2 YX 2

 r  r 1 1
2 X1X 2

- corela ia dintre Y i X2, neglijnd influen a lui X1 : rYX 2 X 1 ! 1 1  r  r


2 YX1 2 X1X 2

rYX 2  rYX 1 rX 1 X 2

b) Cazul unei variabile dependente Y i trei variabile independente X1, X2 i X3 : - corela ia dintre Y i X1, neglijnd influen a lui X2 i X3 : rYX 1 X 2 X 3 ! rYX1 X 2  rYX 3 X 2 rX 1 X 3 X 2 1 r
2 YX 3 X 2

1  r

2 X1 X 3 X 2

- corela ia dintre Y i X2, neglijnd influen a lui X1 i X3 : rYX 2 X 1 X 3 ! rYX 2 X 1  rYX 3 X 1 rX 1 X 3 X 2 1 r


2 YX 3 X 1

1  r

2 X 2 X 3 X1

- corela ia dintre Y i X3, neglijnd influen a lui X1 i X2 : rYX 3 X 1 X 2 ! rYX 3 X 1  rYX 2 X 1 rX 2 X 3 X 1

r 1

2 YX 2 X 1

 r 1

2 X 2 X 3 X1

Aceste formule ale coeficien ilor de corela ie par ial se pot generaliza i pentru cazul a k variabile independente.

Probleme propuse
61

Problema 1

Cunoa tem urm toarea distribu ie a 52 de societ i comerciale cu acela i profil de activitate, n raport cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnz rilor (mil. lei). X Y ( 600 ; 800 ] ( 400 ; 600 ] [ 200 ; 400 ] Total [ 30 ; 50 ] 2 3 14 19 ( 50 ; 70 ] 7 10 2 19 ( 70 ; 90 ] 8 5 1 14 Total 17 18 17 52

Se cere: 1) Pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a func iei de regresie. 2) n ipoteza unei forme liniare a dependen ei dintre Y i X, s se calculeze parametrii func iei de regresie. 3) S se studieze reprezentativitatea func iei de regresie pentru modelarea leg turii dintre cele dou variabile. 4) Care este valoarea medie a volumului vnz rilor pentru un nivel al cheltuielilor cu publicitatea de 55 milioane lei ? 5) Acelea i cerin e de la punctele 2, 3 i 4 pentru o form parabolic a dependen ei dintre Y i X. Problema 2

Un produs a fost lansat simultan pe 13 pie e. Pe aceste pie e, produsul a fost propus la pre uri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat sa nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urm tor: Nr. crt. 1 2 3 4 5 6 Cerere (C) 15,4 3,2 4,9 10,5 8,0 5,1 Pre (P) 1,4 5,1 2,5 1,7 1,8 3,4 Venit (V) 620 530 490 800 630 410

62

7 8 9 10 11 12 13 Se cere:

7,6 11,3 14,0 6,4 13,2 8,8 12,1

2,1 1,6 3,6 3,5 1,9 1,8 1,9

670 920 990 320 520 700 730

1) S se formuleze ipoteze cu privire la forma leg turii dintre cerere (C) i pre (P). Pentru formele func iilor de regresie re inute ca fiind posibile, s se calculeze parametrii func iilor i reprezentativitatea acestora. 2) Similar pentru leg tura dintre cerere i venit. 3) S se calculeze parametrii func iei care modeleaz leg tura liniar multipl dintre cerere i factorii s i e influen . Analiza i reprezentativitatea acestei func ii n raport cu reprezentativitatea func iilor de regresie simple. Care va fi valoarea estimat a cererii pe o pia unde pre ul de vnzare va fi 3,2 iar venitul mediu al consumatorilor de 550 ?

63

Bibliografie:
1. Buiga, A., Drago C., Laz r D., Parpucea I., Statistic descriptiva, Ed. Mediamira, Cluj-Napoca, 2010; 2. DROSBEKE J. J., lments de statistiques , Ed. Ellipses , Bruxelles , 1988 3. BUIGA A., DRAGOS C., LAZAR D., PARPUCEA I., TODEA A., "Statistica I", Ed. PUC, 2003 4. GOLDFARB B. , PARDOUX C. , Introduction la mthode statistique , Ed. Dunod , Paris , 1995 5. PY B. , Statistique descriptive , Ed. Economica , 1990 6. ROGER P. , Statistique pour la gestion , Ed. Management et socit , Caen , 2000 7. TASSI P. , Mthodes Statistiques , Ed. Economica , Paris , 1991 8. WONNACOTT T.H. , WONNACOTT R.J. , Statistique. conomie-GestionSciences-Mdecine , Ed. Economica , Paris , 1991

64

MODULUL 4
ANALIZA SI PREVIZIUNEA SERIILOR DE TIMP Obiective
Intelegerea si aplicarea metodelor de calcul a indicilor factoriali in analiza dinamicii indicatorilor economici; y Cuantificarea dinamicii medii a unui indicator; y Cunoasterea si utilizarea metodelor cantitative de previziune. Metoda clasica de descompunere a unei serii de timp. y

Concepte de baza
y y y y Indice al variatiei integrale, indice factorial, indice al pretului; Nivel mediu al unei serii de timp, indice mediu, ritm mediu, diferenta medie absoluta; Serie de timp, model dinamic, functii de tendinta, coeficientii sezonalitatii, ciclicitate Medii mobile, previziune, erori de previziune, netezire exponentiala.

Rezultate asteptate
Studentul intelege notiunile de indice factorial, nivel mediu, indice mediu, ritm mediu si stapaneste modalitatile de calcul a acestora. Utilizeaza metode cantitative in previziune; in acest sens, identifica componentele prezente intr-o serie de timp, modeleaza si extrapoleaza tendinta, utilizeaza adecvat o medie mobila, modeleaza componenta sezoniera si ciclica, utilizeaza metoda netezirii exponentiale in netezire si previziune.

Sinteza
4.1. INDICII STATISTICI 4.1.1. Indicii statistici: defini ii i tipologii Studiul fenomenelor economice i sociale presupune n marea majoritate a cazurilor i m surarea varia iei unor m rimi. Aceast varia ie poate fi urm rit n timp, spa iu sau relativ la ni te categorii. Se va folosi termenul generic de stare, notndu-se cu j starea luat ca baz de compara ie i cu k cea cercetat n raport cu aceasta. Se va nota cu Z m rimea care constituie obiectul de studiu, varia ia acesteia putnd fi exprimat att sub form absolut , ct i relativ . Dintre exprim rile sub form relativ un loc deosebit de important l ocup indicele statistic. n practic varia ia total a variabilei Z este datorat varia iei unor alte variabile a c ror evolu ie ntre dou st ri j i k influen eaz evolu ia lui Z. Avem de a face, a adar, cu Z de forma Z ! f ( X 1 , X 2 ,- , X m ) . Un astfel de model este un model de tip determinist n care cei m factori determin n totalitate nivelul lui Z . In cazul unui astfel de model se pot distinge trei categorii de indici: 1) indicele varia iei totale (integrale) a m rimii Z : Z (k ) f X 1 (k ), X 2 (k ),- , X m (k ) ! Z ( j ) f X 1 ( j ), X 2 ( j ), - , X m ( j ) 2) indici ai factorilor X i (individuali sau elementari):
k IZ / j !

65

k I X i/ j !

X i (k ) X i ( j)

k j 3) indici ai varia iei partiale ale lui Z sau indici factoriali: I Z // X i - ne arat de cte ori s-a

modificat Z n starea k fa

de starea j sub influen a exclusiv a factorului X i .

4.1.2. Indicii factoriali Indicii factoriali de tip Laspeyres. Acest indice este cel mai cunoscut i utilizat n practica economic . Mai poart i denumirea de indicele pre urilor. Dac se consider un co de r produse sau bunuri, volumul valoric al acestora Z se va calcula dup rela ia: Z ! p i q i .
i !1 r

Indicele factorial al pre urilor calculat prin metoda Laspeyres va avea expresia: r r p (k ) pi (k )qi ( j) pii ( j ) pi ( j ) qi ( j ) k j I Z // p (L ) ! i !1 ! i !1 r r pi ( j )qi ( j ) pi ( j ) qi ( j )
i !1 i !1

iar indicele factorial al cantit ilor (volumului fizic), expresia:


k I Z // qj ( L) !

p ( j )q (k )
i i

p ( j )q ( j )
i i i !1

i !1 r

unde p i ( j ) i p i (k ) sunt pre urile din perioada de baz i perioada curent , q i ( j ) sunt cantit ile din perioada de baz , iar k i m soar importan a1 produsului sau bunului i n co ul indicelui la momentul baz de compara ie. Pentru cazul general, cnd Z depinde de m factori de influen , iar forma func iei f este oarecare, Florea (1986) deduce o regul pentru elaborarea indicilor factoriali de tip Laspeyres. Indicii factoriali de tip Paasche. Acest indice a ap rut tot ca un indice al pre urilor, indicele factorial de pre de tip Paasche avand expresia:
k j I Z // p (P) !

p (k )q (k )
i i

p ( j ) q (k )
i i i !1 r

i !1 r

iar cel factorial al cantit ilor (volumului fizic), expresia:


k I Z // qj ( P) !

p (k )q (k )
i i

p (k )q ( j )
i i i !1

i !1 r

Pentru o func ie oarecare f , n care m rimea Z depinde de m factori, in Florea(1986) este prezentata o generalizare.

66

Indicii factoriali de tip Fisher. In 1922, I. Fisher propune o nou expresie de calcul a indicelui pre urilor. Acesta se va ob ine ca o medie geometric a indicilor de pre de tip Laspeyres i Paasche, astfel:
k j k j k j I Z // p ( F ) ! I Z // p (L) I Z // p (P)

De aceea i manier se ob ine i indicele de volum:


k k k I Z // qj ( F ) ! I Z // qj ( L) I Z // qj ( P)

Indicii factoriali genera i prin Metoda Drumului Factorilor (MDF). Indicele factorial al unei variabile Z ! f X 1 ,- , X m , n raport cu factorul X i , ob inut prin MDF este dat de rela ia (Florea, 1989): f ' X i X 1 ,- , X m k j I Z // X i ! exp dX i Pj ,Pk f X 1 ,- , X m unde

P , P
j k

reprezint i

por iunea arcului din drumul factorilor cuprins ntre punctele Pj X 1 (k ), - , X m (k ) , acest drum fiind descris de ecua iile

Pj X 1 ( j ), - , X m ( j )

parametrice X 1 ! X 1 (P ), - , X m ! X m (P ) , P fiind n general un parametru legat de timp. Exemple. Indicii factoriali calculati prin metoda Laspeyres. 1. O societate hotelier dispune de 3 tipuri de locuri de cazare: camere cu un singur pat(single), camere cu dou paturi(double) i apartamente. Num rul de camere nchiriate (X) i tariful practicat (Y) n dou luni consecutive sunt date n tabelul urm tor: Luna j Luna k X Y() X Y() Tipul camerei
Single Double Apartament
3

80 50 20

30 40 50

110 60 25

35 40 45

Volumul valoric al ncas rilor din nchirierea camerelor (Z) se va calcula dup rela ia: Z ! X i Yi . Indicii factoriali de tip Laspeyres vor fi:
i !1

k/ j Z/X

(L) !

X X
i !1 i !1 3

(k )Yi ( j ) ! ( j )Yi ( j )

110 30  60 40  25 50 ! 1,287 p volumul valoric al 80 30  50 40  20 50 de luna j de 1,287 ori sub influen a modific rii num rului

ncas rilor a crescut n luna k fa


3

de camere nchiriate. I

k/ j Z/X

( L) !

X
i !1 3 i !1

( j )Yi (k ) !
i

X ( j)Y ( j )
i

80 35  50 40  20 45 ! 1,055 p volumul 80 30  50 40  20 50

valoric al ncas rilor a crescut n luna k fa tarifului practicat.

de luna j de 1,055 ori sub influen a modific rii

2. Se consider m rimea Z ca fiind profitul brut al unei societ i i factorii X - veniturile totale respectiv Y - cheltuielile totale ale acelea i societ i. Modelul care leag cele trei m rimi va fi de forma: Z ! X  Y . In doi ani consecutivi variabilele X i Y au nregistrat valorile:

67

Variabila X (mld lei) Y (mld. Lei)

Anul
t 1
10 8

t
12 9

Expresiile i valorile indicilor factoriali de tip Laspeyres sunt: X (t )  Y (t  1) 12  8 t  ! - I Z//t X1 (L ) ! ! 2 p profitul brut a crescut n anul t fa de X (t  1)  Y (t  1) 10  8 anul t  1 de 2 ori sub influen a modific rii veniturilor totale; X (t  1)  Y (t ) 10  9 t  - I Z //tY 1 ( L) ! ! ! 0,5 p profitul brut a sc zut n anul t fa X (t  1)  Y (t  1) 10  8 de anul t  1 de 0,5 ori sub influen a modific rii cheltuielilor totale. 4.1.3. Indicii factoriali de tip Laspeyres, Paasche i Fisher prin prisma abord rii axiomatice Abordarea axiomatic se bazeaz pe stabilirea unor seturi de propriet i pe care un indice statistic trebuie s le verifice (Buiga & all, 2003). 4.1.4. Principalii indici utiliza i n economie Indicele pre urilor de consum este un indice de tip Laspeyres cu baz fixa: I
t/0 Z/p

(L) !

p (t )q (0)
i i

p (0)q (0)
i i i !1

i !1 n

!
i !1

p i (0)qi (0)

p (0)q (0)
i i i !1

n p i (t ) ! k i (0) I tpi/ 0 p i (0) i !1

unde: n - reprezint num rul de m rfuri i servicii din co ul indicelui; k i (0) - reprezint structura de consum, fiind ponderea m rfii sau serviciului i n consumul popula iei; p i (0) i p i (t ) sunt pre urile nregistrate de marfa sau produsul i n perioada de baz i perioada curent ; Ponderile k i (0) sunt ob inute prin Ancheta Integrat n Gospod rii i rezult din structura cheltuielilor medii lunare efectuate de o gospod rie pentru cump rarea m rfurilor i plata serviciilor necesare satisfacerii nevoilor de trai; aceste ponderi se actualizeaz la intervale de c iva ani. Pre urile corespunz toare celor n m rfuri i servicii din co ul indicelui se culeg lunar, n urma unei cercet ri selective organizate de Institutul National de Statistic . Indicele produc iei industriale m soar evolu ia de ansamblu a pre urilor produselor i serviciilor industriale fabricate i livrate de produc torii interni n perioada curent fa de perioada de baz , n primul stadiu de comercializare a produselor sau serviciilor. ndicele utlizat este tot un indice de tip Laspeyres. Indicele salariilor m soar evolu ia salariilor n perioada curent fa de perioada de baz . Al turi de indicele pre urilor de consum este folosit n evaluarea nivelului de trai. Se utilizeaz , de asemenea, un indice de tip Laspeyres, care m soar varia ia fondului de salarii total Z sub influen a modific rii salariilor medii S i corespunz toare ramurii i . Indicii bursieri. Principalii indici bursieri se diferen iaz prin mai multe elemente: e antionarea, respectiv alegerea titlurilor din co ul indicelui, reprezentativitate, modul de 68

calcul utilizat i natura variabilelor luate n calcul. Cei mai cunoscu i i urm ri i indici bursieri, cu excep ia familiei de indici Dow Jones se calculeaza ca si indici Laspeyres. 4.2. PREVIZIUNEA SERIILOR DE TIMP n derularea activit ii lor, frecvent agen ii economici sunt pu i n situa ia de a anticipa viitorul, iar apoi de a lua decizii n consecin . Oamenii de afaceri sunt nevoi i s previzioneze anual cifra de afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt interesa i de profitul viitor degajat de investi ie, respectiv guvernele de previziunea consumului sau a cheltuielilor guvernamentale etc.. Ob inerea rapid de previziuni utiliznd modele cantitative de previziune este la ndemna anali tilor, urmare i a softurile de statistic accesibile i u or de exploatat. Anticiparea, previziunea evolu iei viitoare a fenomenelor economice presupune n primul rnd cunoa terea istoriei acestora, punerea n eviden a unor legit i privind comportamentul lor trecut. Baza de date pe care se fundamenteaz analiza evolu iei fenomenelor n timp este constituit din serii cronologice. 4.2.1. Indicatori medii specifici seriilor cronologice a) Nivelul mediu (valoarea medie). Nivelul mediu reprezint nivelul teoretic atins de indicator n condi iile n care evolu ia sa ar fi constant n timp, factorii ce-i determin evolu ia ar ac iona cu aceea i intensitate pe ntreaga perioad de timp analizat . Modul de determinare a volumului fenomenului difer dup cum seria este de intervale respectiv de momente. Pentru serii cronologice de intervale nivelul mediu este: y  y 2  ...  y n Y! 1 n Pentru serii cronologice de momente nivelul mediu este definit de urm toarea rela ie:

Y!

tn

t1

y(t )dt
tn

. dt

t1

Daca se aproximeaz evolu ia indicatorului y (t ) ca fiind liniar ntre dou momente consecutive de timp, rezulta: T  Tn 1 T T1 T  T2  y2 1  ...  y n 1 n  2  y n n 1 2 2 2 2 Y! T1  T2  ...  Tn 1 rela ie numit medie cronologic ponderat . Daca nivelul indicatorului se nregistreaz la momente echidistante ( T1 ! T2 ! .... ! Tn 1 ), atunci rela ia anterioar devine: y1 y  y 2  ....  y n 1  n 2 Y! 2 n 1 i reprezint media cronologic simpl . y1 b) Indicele mediu. Ritmul mediu Pentru calculul acestui indicator se ntlnesc n literatur mai multe abord ri. Indicele mediu este parametrul modelului autoregresiv: yt ! I y yt 1  I t , t ! 2, 3,..., n

69

Utiliznd metoda celor mai mici p trate pentru estimarea parametrului I y , urm toarea expresie de calcul a indicelui mediu: Iy !

se ob ine

y
t !2 n t!2

t 1

yt

y
O alta expresie de calcul, adecvat exponen ial este urmatoarea:

2 t 1

Metoda este ntlnit n practic sub denumirea de metoda autoregresiv . pentru indicatori ce evolueaz aproximativ

I y ! n 1

yn y1

Ritmul mediu R y se determin pornind de la indicele mediu: R y ! I y  1 sau R y (%) ! I y 100  100 . c) Diferen a medie absolut Expresia de calcul a diferen ei medii absolute: (y ! sau echivalent:

y
t !2

 yt 1

n 1 (y !

(
t !2

t / t 1 y

n 1

y n  y1 . n 1

4.2.2. Componentele unei serii cronologice. Modelul clasic de descompunere O serie cronologic este o secven de observa ii asupra unei variabile, ordonate dup parametrul timp. Frecvent, m sur torile asupra variabilei sunt efectuate la intervale egale de timp, seria cronologic fiind prezentat sub forma: 1 2 ... t ... n Y : y y ... y ... y 1 t n 2 n abordarea tradi ional , fluctua iile din seriile cronologice sunt privite ca o rezultant a suprapunerii urm toarelor componente: tendin a T, componenta ciclic C, sezonier S respectiv rezidual E. Primele trei componente sunt considerate deterministe, sistematice, determinate de factori cu ac iune continu asupra fenomenului, n timp ce componenta rezidual are caracter aleator fiind efectul ac iunii unor factori imprevizibili, accidentali. Modelul clasic de descompunere a seriilor cronologice este de regul : y aditiv: Y ! T  C  S  E sau y multiplicativ: Y ! T C S E respectiv y o combina ie mixt a componentelor seriei. Tehnicile de analiz , in acest context, au ca obiective: - separarea fiec rei componente i modelarea comportamentului s u, respectiv

70

- previziunea evolu iei fiec rei componente, iar apoi compunerea acestora n scopul ob inerii de previziuni privind evolu ia fenomenului Y. Principiul de la baza acestei tehnici este descompune pentru a modela iar apoi recompune. 4.2.3. Estimarea componentei de tendin Func ii elementare utilizate n modelarea tendin ei Cele mai uzuale func ii utilizate pentru modelarea tendin ei indicatorilor din economie sunt redate n tabelul 1.. Tabelul 1. Func ii elementare utilizate n modelarea tendin ei Tendin Forma liniarizat Diferen e aprox. Constante liniar (t y/ t 1 ! y t  yt 1 Tt ! a  bt t / t 1 (2)  parabol T ! a  bt  cX (y ! (t y/ t 1  (t y 1 / t  2 2 Tt ! a  bt  ct unde X ! t hiperbol Tt ! a  b 1 t T ! a  bX unde X ! 1 t Z ! A  Bt unde Z t ! ln Tt ;
/ (ttyt 1 ! ty t  (t  1) y t 1

exponen ial Tt ! a b t

/  (tlnt y 1 ! ln yt  ln y t 1

putere Tt ! a t b

A ! ln a; B ! ln b Z ! A  bX unde Z t ! ln Tt ; A ! ln a; X ! ln t T ! a  bX unde X ! ln t

logaritmic Tt ! a  b ln t curba logistic a , Tt ! 1  e b ct a, c " 0

Stabilirea func iei adecvate pentru modelarea tendin ei n acest scop sunt utile urm toarele preciz ri: y cronograma seriei ini iale sau a valorilor netezite sugereaz func iile candidate, numite i linii posibile de tendin a; y cea mai adecvat func ie pentru modelarea tendin ei poate fi considerat aceea pentru 2 care se realizeaz minimul sumei p tratelor reziduurilor min y t  Tt ;
t

este adecvat tendin a liniar atunci cnd diferen ele absolute cu baza n lan (t y/ t 1 ! yt  yt 1 sunt aproximativ constante. De asemenea, preciz ri specifice n acest sens pentru parabol , exponen ial respectiv hiperbol g sim n tabelul 1.

71

Estimarea parametrilor tendin ei. Pentru estimarea parametrilor tendin ei liniare Tt ! a  bt se utilizeaz metoda celor mai mici p trate, expresiile de calcul a parametrilor a, b sunt deci urm toarele: b!

(t  t )( y
t !1 n t !1

Y) ,
2

(t  t )
sau echivalent b!

a ! Y  bt , M (tY )  M (t ) M (Y ) , M (t 2 )  [M (t )] 2

a ! Y  bt . Seria prezint o tendin de cre tere atunci cnd b > 0 respectiv de descre tere dac b < 0. Cu excep ia curbei logistice, celelalte func ii neliniare din tabelul1 pot fi aduse la o form liniarizat prin anumite substitu ii, respectiv prin aplicarea opera iei de logaritmare n cazul func iei exponen iale i a func iei putere. Exemplu. Estimarea tendin ei liniare Indicele lunar al pre ului produc iei industriale pentru pia a intern , n perioada ianuarie 1999 iunie 2000 baza de compara ie 1996, a avut o tendin cresc toare:
Luna (t) Indice (yt) 1 3.7 2 3.8 3 4.1 4 4.3 5 4.5 6 4.8 7 4.9 8 5.1 9 5.3 10 5.5 11 5.6 12 5.8 13 6.0 14 6.2 15 6.3 16 6.5 17 6.6 18 7.0

Cronograma seriei sugereaz prezen a unei tendin e liniare, peste care se suprapune o component aleatoare de amplitudine redus : yt ! a  bt  I t , t ! 1, 2,...,18. Parametrii tendin ei se determin din rela iile: M (tY )  M (t ) M (Y ) b! 2 M (t 2 )  ?M (t )A a ! M (Y )  bM (t ).

Figura 1. --S-- Indice pre productie industrial ; ------ Tendin a

72

Exemplific m din calculele intermediare: 1  2  .  18 M (t ) ! ! 9 .5 18 3.7  3.8  .  7.0 M (Y ) ! ! 5.33 18 (1 v 3.7)  (2 v 3.8)  .  (18 v 7.0) M (tY ) ! ! 55.72 18 12  2 2  .  18 2 M (t 2 ) ! ! 117,2 18 rezultnd 55.72  9.5 v 5.33 b! ! 0.19, 117.2  (9.5) 2 a ! 5.33  0.19 v 9.5 ! 3.55. Tendin a seriei se estimeaz prin func ia de gradul nti: Tt ! 3.55  0.19t , al c rei grafic este redat n figura 1. 4.2.4. Estimarea componentelor deterministe n cazul seriilor sezoniere Presupunem n acest paragraf c seria cronologic prezint tendin , sezonalitate i o component aleatoare. Vom prezenta modul de estimare a tendin ei respectiv a componentei sezoniere. 4.2.4.1. Modelul de descompunere. Perioada componentei sezoniere Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei. n general, este adecvat un model aditiv atunci cnd amplitudinea oscila iilor este aproximativ constant respectiv multiplicativ dac amplitudinea cre te sau scade n timp. Frecvent n practic este mai adecvat modelul multiplicativ. Perioada componentei sezoniere, notat cu p, reprezint num rul unit ilor de timp din cadrul unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata unui ciclu de un an, p fiind egal cu 4 n cazul datelor trimestriale respectiv 12 n cazul datelor lunare. Prin extensie pot fi studiate i fenomene cu durata unui ciclu mai mic de un an.

4.2.4.2. Mediile mobile Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplic datelor o medie mobil de ordin p egal cu perioada componentei sezoniere. Mediile mobile de ordin p, notate n continuare MM(p), sunt definite de urm toare rela ii: y daca p este impar p ! 2k  1 , mediile mobile de ordin p sunt y  yt  k 1  ...  y t  ...  y t  k yt ! t k ; t ! k  1, k  2,..., n  k ; p y daca p este par p ! 2k se definesc analog y t  k 0 ,5  yt k 1,5  ...  y t  0,5  yt 0 ,5  ....  y t  k  0 ,5 yt ! , p t ! k  0,5; k  1,5; ... ; n  k  0,5.

73

In cazul p par, se introduc mediile mobile centrate de ordin p definite prin: y t 0 ,5  y t  0 ,5 0,5 yt k  y t  k 1  ...  y t  ...  y t  k 1  0,5 y t  k ! yt ! . 2 p 4.2.4.3. Estimarea tendin ei n cazul seriilor cu component sezonier n cazul seriilor sezoniere se ntlnesc preponderent n literatur doua modalit i de estimare a tendin ei: y desezonalizarea seriei iar apoi estimarea tendin ei pornind de la valorile desezonalizate (vezi 4.2.3.); y modelarea tendin ei pornind de la mediile anuale. 4.2.4.4. Estimarea componentei sezoniere Nota ii: t indice pentru an (n general pentru un ciclu sezonier), variind de la 1 la n; s indice pentru sezon, variind de la 1 la p. Modelul de descompunere a seriei are forma: yij ! TC ij  S j  I ij respectiv yij ! TC ij S j I ij Metoda compar rii cu mediile mobile n cazul modelului multiplicativ yij ! TC ij S j I ij metoda se ntlne te n literatur i sub denumire de metoda raport rii la mediile mobile i const n urm toarele: y calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere; y calculul rapoartelor Sij ! yij / y ij ce cuantific abaterea datelor observate de la tendin - ciclu. Dac fix m indicele j (ne situ m n sezonul j), aceste diferen e constituie estima ii pentru S j ; y determinarea unui indice mediu pentru fiecare sezon ca o medie a estima iilor precedente: 1 n 1 Ij ! S ij ; j ! 1, 2,..., p , n  1 i !1 aceasta justificndu-se prin necesitatea elimin rii efectului aleator din S ij . Pentru a nu fi afecta i de valorile extreme, uneori nainte de calculul mediei, aceste valori se elimin , sau n loc de medie se ia valoarea median a estima iilor S ij ; y determinarea componentei sezoniere S j , etap ce const ntr-o corec ie adus indicilor medii I j astfel nct media lor s fie 1: 1 p S j ! I j / I i j ! 1, 2,..., p . p i !1 n cazul modelului aditiv y ij ! TC ij  S ij  I ij determinarea componentei sezoniere decurge analog. Exemplu. Estimarea componentelor deterministe n cazul seriilor sezoniere. Datele privind evolu ia trimestrial a produc iei de bere din ara noastr (zeci mii hl) n perioada 1996-2001 sunt indicate mai jos

74

An/Trim. 1996 1997 1998 1999 2000

I 124.1 130.1 157.5 169.7 177.5

II 263.2 280.2 301.2 340.0 407.6

III 252.4 260.6 353.3 350.9 417.2

IV 124.5 151.1 185.0 168.7 224.1

Figura 2. --S-- Produc ia de bere; -- -- MM(4); ---- Tendin a a) Calculul mediilor mobile de ordin p=4 Graficul seriei indic prezen a unei componente sezoniere predominante, de perioad p = 4. Mediile mobile de ordin p = 4 sunt calculate conform rela iei de defini ie a mediilor mobile centrate. Astfel, spre exemplu: 0.5 v y1  y2  y3  y4  0.5 v y5 y3 ! ! 4 0.5 v 124.1  263.2  252.4  124.5  0.5 v 130.1 ! ! 191.8 4 0.5 v y2  y3  y 4  y5  0.5 v y6 y4 ! ! 4 0.5 v 263.2  252.4  124.5  130.1  0.5 v 280.2 ! ! 194.7 4 .
0.5 v y 20  y21  y22  y 23  0.5 v y24 ! 4 0.5 v 224.1  202.9  385.3  425.6  0.5 v 196.6 ! ! 306.0. 4 Datele observate au fost numerotate aici n ordine cronologic y1, y2, ..., y24. Mediile mobile de ordinul 4 t MM(4) t MM(4) y 22 !
1 2 3 4 5 6 191.8 194.7 197.8 202.2 13 14 15 16 17 18 261.7 259.4 258.3 267.7 284.5 299.7

75

7 8 9 10 11 12

208.9 214.9 229.2 245.0 250.8 257.1

19 20 21 22 23 24

309.8 310.2 308.4 306.0 -

b) Estimarea tendin ei pornind de la valorile desezonalizate Seria mediilor mobile prezentat grafic relev o u oar tendin de cre tere a produc iei de bere. Vom considera tendin a liniar : Tt ! a  bt  I t , originea de m surare a timpului trimestrul II al anului 1996, unitatea de m sur un trimestru. Astfel, pentru trimestrul III 1996 avem t = 1 .a.m.d: t Valori desezonalizate (Z) 1 2 3 191.8 194.7 197.8 M (tZ )  M (t ) M ( Z ) b! , 2 M (t 2 )  ?M (t )A a ! M (Z )  bM (t ). ... ... 19 308.4 20 306.0

Calcule intermediare: M (t ) ! 10.5, M ( Z ) ! 252.9, M (t 2 ) ! 143.5, M (tZ ) ! 2884.9, b ! 6.9, a ! 180.44. Tendin a produc iei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin: Tt ! 180.44  6.9 v t . c) Estimarea componentei sezoniere prin metoda raport rii la mediile mobile Cum amplitudinea oscila iilor cre te u or n timp, cronograma seriei sugereaz luarea n considerare a unui model multiplicativ: yij ! Tij S j I ij ; i ! 1, 2,..., 6 iar j ! 1, 2, 3, 4 . Datele sunt disponibile pentru 6 ani i sunt prezente aici 4 sezoane. innd seama de nota iile specifice, yij reprezint nivelul produc iei de bere n anul i trimestrul j. Astfel, spre exemplu y13 ! y1996; III ! 252.4 sau y34 ! y1998;IV ! 185.0 . Mediile mobile din tabelul anterior vor fi transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim. 1996 1997 1998 1999 2000 2001 I 197.8 229.2 261.7 284.5 308.4 II 202.2 245.0 259.4 299.7 306.0 III 191.8 208.9 250.8 258.3 309.8 IV 194.7 214.9 257.1 267.7 310.2 -

Rapoartele S ij ! tabelul urmator

yij yij

100 , respectiv mediile acestora pentru fiecare sezon sunt indicate n Calculul indicilor sezonalit ii I II III INVE STI(I E
65.8 138.6 131.6 124.7 63.9 70.3

An/Trim.

1996 1997

76

1998 1999 2000 2001

Ij Sj

68.7 64.8 62.4 65.8 65.5 65.6

122.9 131.1 136.0 125.9 130.9 131.4

140.9 135.8 134.7 133.5 134.0

71.9 63.0 72.7 68.4 68.8

Media Media

99.6 100

Explica ii privind calculele: y y 252.4 124.5 S13 ! 13 100 ! 100 ! 131.6 , S14 ! 14 100 ! 100 ! 63.9 , y13 191.8 y14 194.7 y 130.1 100 ! 65.8 , .a.m.d. S 21 ! 21 100 ! 197.8 y 21 Cum era de a teptat, aceste rapoarte ntre datele observate i mediile mobile sunt mai mici dect 1 pentru trimestrele I i IV, cnd nivelul produc iei a fost sistematic mai mic (sub tendin ). S  S 31  S 41  S 51 I1 ! 21 ! 65.5, I 2 ! 130.9, 4 S  S 23  S 33  S 43 I 3 ! 13 ! 133.5, I 4 ! 68.4. 4 Valoarea medie a acestor indici este 99.6, astfel c este necesar o corec ie astfel nct media s fie 100: I 65.5 S1 ! 1 100 ! 100 ! 65.6, S 2 ! 131.4, S 3 ! 134.0, S 4 ! 68.8 . 99.6 99.6 Urmare a caracterului sezonier specific produc iei de bere, n trimestrul I produc ia a fost mai mic n medie cu 34.4% dect valorile corespunz toare de pe tendin . n trimestrul II produc ia a fost n medie mai mare de 1.314 ori dect valorile de pe tendin . Analog se interpreteaz S3 i S4. Componenta sezonier este dat de vectorul format cu indicii sezonalit ii: S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688). 4.2.5. Componenta ciclic . Componenta aleatoare a) Componenta ciclic Pentru separarea componentei ciclice se poate utiliza metoda compar rii cu tendin a. Spre exemplu n cazul modelului multiplicativ: Y ! T S C E , metoda const n calculul indicilor de ciclicitate. Astfel: y se estimeaz tendin a printr-o func ie elementar . Dac seria prezint sezonalitate se porne te de la datele desezonalizate sau de la mediile anuale; y se elimin componenta sezonier din datele observate, iar apoi se utilizeaz medii mobile n scopul elimin rii i a componentei aleatoare rezultnd valorile netezite y t (astfel y t ! T C ); y se calculeaz indicii de ciclicitate Ct prin raportare la tendin : y Ct ! t Tt b) Componenta aleatoare:

77

I ij !

y ij Tij C ij S j

n cazul modelului multiplicativ, respectiv

I ij ! y ij  (Tij  C ij  S j ) n caz aditiv. 4.2.6. Previziuni utiliznd modelul de descompunere. M surarea acurate ii previziunilor a) Previziuni utiliznd modelul de descompunere se ob in prin compunerea previziunilor realizate pentru fiecare component prezent n serie, innd seama de forma modelului: Y ! T  C  S respectiv Y ! T C S . b) M surarea acurate ii previziunilor. Dac modelul elaborat conduce la previziunile 1 , y 2 ,..., y p corespunz toare datelor y1 , y 2 ,..., y p , pentru a m sura calitatea acestuia de a y genera previziuni adecvate se utilizeaz o serie de indicatori sintetici ai erorilor de previziune, cei mai frecvent ntlni i fiind: 1 p 2 - eroarea medie p tratic : MSE ! y h  y h p h !1 - eroarea medie absolut : MAE ! 1 p yh  y h p h !1 MAPE ! 1 p yh  yh y h p h !1

- eroarea medie absolut exprimat procentual:

Exemplu (continuare). Previziunea produc iei de bere Tabelul urm tor con ine previziunile, datele reale respectiv erorile de previziune privind nivelul produc iei de bere.
An 2001 2002 Trim. III IV I Tendin 325.34 332.24 339.14 Sezonalitate 1.34 0.688 0.656 Previziune 435.95 228.58 217.9 Produc ie 425.6 196.6 203.2 Eroare -10.35 -31.98 -14.7

Prezent m modul de ob inere a rezultatelor anterioare pentru trim. III an 2001. Valorile tendin ei respectiv a componentei sezoniere sunt: T (21) = 180.44 + 6.9 v 21 = 325.34 respectiv S 3 = 1.34. Modelul de descompunere considerat a fost cel multiplicativ, astfel c previzionat este: y ! 325.34 v 1.34 ! 435.95 iar eroarea de previziune aferent : e ! 425.6  435.95 ! 10.35 Exemplu (continuare). Previziunea indicelui lunar al pre ului produc iei industriale. Avnd n vedere tendin a estimat privind evolu ia acestui indicator: Tt = 3.55 + 0.19t 78 valoarea

previziunile respectiv erorile de previziune pentru perioada Iulie - Decembrie 2000 sunt indicate mai jos: Luna Indice y Previziune y Eroare e I 7.40 7.16 0.24 A 7.66 7.35 0.31 S 7.96 7.54 0.42 O 8.26 7.73 0.53 N 8.47 7.92 0.55 D 8.65 8.11 0.54

Pentru luna Iulie 2000 avem t = 19, extrapolarea tendin ei conduce la: y19 = T19 =3.55 + 0.19 v 19 = 7.16 e19 = y19 - y19 = 0.24. 4.2.7. Alte metode de previziune a) Previziuni utiliznd modele de regresie. Odat estimat i validat, un model de regresie poate fi utilizat pentru previziunea variabilei dependente. b) Netezirea seriei respectiv previziuni utiliznd modele de netezire exponen ial Varianta simpl a acestei tehnici, n care previziunile sunt ob inute ca o medie ponderat a datelor reprezentnd trecutul: 0 y n (h) ! c (1  c) j y n  j , c ? ,1A
j !0 n 1

este adecvat previziunii seriilor sta ionare. Metoda generalizat n varianta Holt-Winters este adecvat pentru serii cu tendin i sezonalitate, model multiplicativ. Previziunile sunt date de o func ie de previziune local liniar , valorile de pe tendin a liniar fiind corectate cu un indice sezonier aferent sezonului pentru care se realizeaz previziunea. Atunci cnd cronograma seriei nu ofer indicii foarte clare privind prezen a respectiv forma tendin ei, este indicat a se utiliza n prealabil o tehnic de netezire ce atenueaz amplitudinea fluctua iilor aleatoare din serie, scopul fiind eviden ierea tendin ei. Tehnicile de netezire general utilizate sunt mediile mobile sau tehnicii netezirii exponen iale.

Teme de control. Probleme propuse


Problema 1. Estimarea si extrapolarea tendintei 1.1. Indicele lunar al pre ului produc iei industriale pentru pia a intern , n perioada ianuarie 1999 iunie 2000 baza de compara ie 1996, a avut o tendin cresc toare: Luna (t) Indice (yt ) 1 3.7 2 3.8 3 4.1 4 4.3 5 4.5 6 4.8 7 4.9 8 5.1 9 5.3

Luna (t) 10 11 12 13 14 15 16 17 18 Indice (yt ) 5.5 5.6 5.8 6.0 6.2 6.3 6.5 6.6 7.0 Se cere: a) estimarea parametrilor tendintei liniare b) previziunea indicelui lunar al pre ului produc iei industriale pentru urmatoarele doua luni. 1.2. Datele de mai jos redau evolu ia vnz rilor dintr-un produs pe o perioad de 10 luni consecutive:

79

Luna F M A M I I A S O N Vnz ri 20 32 40 47 52 60 62 63 65 67 Se cere: estimarea parametrilor parabolei de tendinta. 1.3. Popula ia Romniei a crescut n perioada 1980-1988 ntr-un ritm destul de accelerat, dup cum arat i datele de mai jos:
An Nr. pop. (mil. Loc.) 1980 22.20 1981 22.35 1982 22.48 1983 22.55 1984 22.62 1985 22.72 1986 22.82 1987 22.94 1988 23.15

Se cere: a) datele confirm ipoteza model rii tendin ei printr-o func ie exponen ial ? b) estimarea parametrilor tendintei exponentiale; c) previziunea popula iei Romniei pentru urmatorii cinci ani. Comparatii cu valorile reale. Problema 2. Descompunerea si previziunea seriilor sezoniere Datele privind evolu ia trimestrial a produc iei de bere din ara noastr (zeci mii hl) n perioada 1996-2001 sunt indicate in tabelul urm tor: An/Trim. I II III IV 1996 124.1 263.2 252.4 124.5 1997 130.1 280.2 260.6 151.1 1998 157.5 301.2 353.3 185.0 1999 169.7 340.0 350.9 168.7 2000 177.5 407.6 417.2 224.1 2001 202.9 385.3 425.6 196.6 Se cere: a) Estimarea tendin ei pornind de la valorile desezonalizate; b) estimarea componentei sezoniere; c)determinarea componentei ciclice respectiv aleatoare. Descompunerea seriei pe componente; d) previziunea produc iei de bere pentru urmatoarele patru trimestre. Problema 3. Determinarea nivelului mediu 3.1. Popula ia jude ului Cluj la principalele recens minte a fost: An 1930 1948 1956 1966 1977 1992 Nr. pop. (mii loc.) 475.5 520 580.3 629.7 715.7 736.3 Se cere: calculul popula iei medii anuale, pe perioada 1930 1992. 3.2. Num rul navelor utilizate n transportul m rfurilor n perioada 1991-2000 a nregistrat urm toarea evolu ie:
An Nr. nave 1991 269 1992 267 1993 256 1994 250 1995 255 1996 289 1997 283 1998 231 1999 203 2000 192

Se cere: calculul num rului mediu anual de nave utilizate in transportul marfurilor, in perioada considerata. Problema 4. Determinarea indicelui mediu, ritmului mediu respectiv a diferentei medii 4.1. Se cunoa te popula ia jude ului Cluj la ultimele dou recens minte: Recens. 5 ian 1977 7 ian 1992 Nr. pop. (mii loc.) 715.7 736.3 Se cere: indicele mediu anual. Interpretare 4.2. Produc ia de biciclete n Romnia a sc zut dup 1989: An 1990 1991 1992 1993 1994 1995 Prod. (mii buc.) 136 107 67 42 28 22

80

Se cere: a) calculul indicelui mediu prin metoda autoregresiv b) ritmul mediu anual. Interpretare. 4.3. Fondul de locuin e din ara noastr a nregistrat o cre tere lent dup 1990:
An Fond de loc. (mii) 1991 7659 1992 7683 1993 7710 1994 7749 1995 7782 1996 7811 1997 7837 1998 7860 1999 7883 2000 7907

Se cere: calculul si interpretarea diferen ei medii absolute. Problema 5. Cantitatile cumparate q respectiv preturile unitare de cumparare (mii lei) p, pentru 3 produse aflate in consumul populatiei, in doua luni consecutive, au fost:
Luna k-1 q p 8 kg 30 20 buc 70 4 litri 50 Luna q 10 kg 18 buc 5 litri

k
p 35 67 45

Produs 1 Produs 2 Produs 3

Se cere: indicii factoriali ai pretului respectiv ai cantitatii prin toate metodele cunoscute. Comparati rezultatele obtinute. Problema 6. Indicele variatiei integrale si indicii variatiilor factoriale Cunoscnd seriile cronologice cu privire la: num rul de omeri muncitori (X), num rul de omeri cu studii medii (Y), num rul de omeri cu studii superioare (Z) din jude ul Cluj n 10 luni consecutive, respectiv: mii persoane
1 luna X Y W 22,23 3,86 0,396 22,24 3,87 0,395 22,34 3,98 0,419 23,21 4,52 0,437 24,7 4,1 0,357 26,85 4,53 0,406 28,7 4,91 0,455 29,1 5,28 0,487 28,3 6,18 0,5 28,3 6,2 0,5 2 3 4 5 6 7 8 9 10

Se cere: a) Rela ia matematic ce exprim leg tura dintre num rul total de omeri (Z) i X, Y, W b) indicii exprimnd varia ia integral a num rului total de omeri, calcula i cu baz fix ; c) indicii factoriali de tip Laspeyres, Paasche, Fisher aferen i fiec rui factor care influen eaz num rul total de omeri, n ultima luna fa de prima luna.

Bibliografie
1. Buiga, A., Drago C., Laz r D., Parpucea I., Statistic descriptiva, Ed. Mediamira, ClujNapoca, 2010; 2. Buiga A., Dragos C., Lazar D., Parpucea I., Statistica I, Presa Universitara Clujeana, 2003. 2. Florea I., Parpucea I., Buiga A., [1998] , Statistic descriptiv . Teorie i aplica ii, Editura Continental, Alba Iulia, 1998. 3. Florea I., Parpucea I., Buiga A., Lazar D., [2000] , Statistic inferen ial , Presa Universitar Clujean , Cluj Napoca, 2000. 4. Melard G., Methodes des prevision a court terme, Ed. de Universite de Bruxelles, 1990.

81

APLICA II
Problema 1 Considernd rata omajului ca m rime analizat notat cu Z se cere: 1. Expresia de calcul a m rimii Z n func ie de factorii de influen ; 2. Avnd seriile cronologice relativ la num rul de omeri X i popula ia activ notat cu Y n 10 luni consecutive respectiv: - num rul de omeri 2 3 4 5 6 7 8 9 10 1 X : 330 420 370 480 520 550 600 580 630 635 - popula ia activ 2 3 4 5 6 7 8 9 10 1 Y : 3882 4827 4302 5485 5843 6189 6593 6304 6702 6738 reda i seria cronologic aferent ratei lunare a omajului; 3. Rata de omaj medie lunar ; 4. De cte ori au crescut n medie de la o lun la alta num rul de omeri; 5. Exprimarea, calcularea i interpretarea urm torilor indici: 5 5 5 I Z //1x ( F ) ; I Z //1y ( F ) ; I Z / 1 . 1) Z (rata omajului) este influen at de num rul de omeri direct propor ional i de num rul popula iei active invers propor ional. Z! S X 100 ! 100 Pa Y

2 3 4 5 6 7 8 9 10 1 2) Z : 8,5 8,7 8,6 8,75 8,90 8,90 9,1 9,2 9,4 9,42 3) Seria cronologic fiind de momente, nivelul mediu se determin dup urm toarea rela ie: 1 1 Z 1  Z 2  Z 3  Z 4  Z 5  Z 6  Z 7  Z 8  Z 9  Z10 2 Z! 2 ! 10  1 1 1 8,5  8,7  8,6  8,75  8,90  8,90  9,1  9,2  9,4  9,42 2 ! 8,945 2 ! 9 Rata de omaj medie lunar din perioada analizat este de 8,945. 4) IX !

X t  1 X t ! ?X t  1 A
2

82

330 420  420 370  370 480  480 520  520 550  550 600  600 580  580 630  630 635 330 2  420 2  370 2  480 2  520 2  550 2  600 2  580 2  630 2 1386  1554  1776  2496  2860  3300  3490  3654  40005 ! 1,056 1089  1764  1369  2304  2704  3025  3600  3364  3969

Num rul de omeri au crescut n medie de 1,056 ori de la o lun la alta. Z 5 8,9 ! ! 1,047 , rata omajului a crescut de 1,047 n luna a 5-a fa I1 8,5

5 5) I Z / 1 !

de luna 1.

5 5 5 I Z //1x F ! I Z //1x L I Z //1x P ! 1,57 1,57 ! 1,576

x5 y 520 3882 5 ! 1,576 I Z //1x L ! 1 ! x1 3882 330 y1 x5 y 5 I Z //1x P ! 5 ! 1,576 x1 y5 - rata omajului ar fi crescut de 1,576 datorit modific rii num rului de omeri, popula ia activ r mnnd constant ;
5 5 5 I Z //1y F ! I Z //1y L I Z //1y P ! 0,664

x1 y y 3882 5 ! 0,664 I Z //1y L ! 5 ! 1 ! x1 y 5 5843 y1 x5 y y 5 I Z //1y P ! 5 ! 1 ! 0,664 x5 y5 y1 - rata omajului ar fi sc zut de 0,664 datorit modific rii popula iei active, num rul de omeri r mnnd constant; 5 5 5 I Z //1x I Z //1y ! 1,57 0,66 ! 1,0465 ! I Z / 1

83

Problema 2 Din mul imea autoturismelor vndute prin licita ie s-a constituit un e antion de 30 de unit i, rezultatele observ rii n raport cu variabilele X vechimea autoturismelor exprimat n ani i y pre ul la care s-au vndut (n milioana lei) sunt prezentate n tabelul urm tor: Nr. crt. X 1 4 2 3 4 5 6 7 8 9 10 1 9 Y 30 40 20 Nr. crt. 11 12 13 14 15 16 17 18 19 20 X 6 Y 32 Nr. crt. X 21 7 22 23 24 25 26 27 28 29 30 Y 30

5 33 11 24 13 19 2 38 8 22 12 20 20 10 5 35 14 17

10 25 5 36 8 23 10 27 12 22 3 9 35 29

13 17 15 17 8 28 13 20 19 13 6 0 33 41

14 19 7 30

Se cere: 1. Elaborarea reparti iei bidimensionale tiind c num rul de intervale pentru variabila X = 4, iar lungimea unui interval pentru Y,ly = 8 intervalele fiind egale. 2. Parametrii tendin ei centrale n raport cu pre ul de vnzare i interpretarea acestora; 3. Studierea reprezentativit ii func iilor de regresie, liniar i hiperbolic i alegerea celei mai reprezentative; 4. Pentru func ia aleas la punctul precedent calcula i parametrii. X max  X min 20  0 ! !5 numar intervale 4

1) lungime interval =

10 15 ?0;5 ?5;10 ? ;15 ? ;20 X : 5 12 10 3 10 18 ? ;18 ? ;26 ?26;34 ?34;42 Y : 5 10 9 6 X Y [10;18) [18;26) [26;34) [34;42) TOTAL [0;5) 1 4 5 [5;10) 3 7 2 12 [10;15) 2 7 1 10 [15;20) 3 3 TOTAL 5 10 9 6 30

84

2) Media: 14 5  22 10  30 9  37,5 6 785 ! ! 26,26 N 30 30 - pre ul mediu de vnzare al ma inilor este de 26,26 mii lei 1 30 Mediana: rMe ! N ! ! 15 2 2 5  10 ! rMe ! 15 Me ? ;26 18 15  5 Me ! 18  8 ! 26 10 jum tate din ma ini se vnd cu un pre mai mic de 26.000 mii lei, iar cealalt jum tate cu un pre mai mare de 26.000.000 lei.
i

Y!

Y
i !1

'

Ni

10 ?  26 ?26;41 15 15 Modala: max(5, 10, 9, 6) = 10 Mo [18;26) Cele mai multe autoturisme se vnd cu un pre cuprins ntre 18.000 i 26.000 mii lei. 10  5 5 Mo ! 18  8 ! 18  8 ! 24,66 10  5  10  9 5 1 - cea mai mare parte a autoturismelor se vnd la un pre n jur de 24.666,666 mii lei. 3) Din tabelul de corela ie se observ c frecven ele diferite de zero sunt grupate, rezult c ntre cele dou variabile exist leg tur , ce poate fi modelat cu ajutorul func iei de regresie. a. Dac func ia de regresie este o drept Y ( X ) ! a  bx 1 b. Dac func ia de regresie este o hiperbol Y ( X ) ! a  b x Mai reprezentativ este func ia care are coeficientul de regresie mai mare. Ca urmare trebuie calculat acest coeficient pentru cele dou cazuri. M XY  M X M Y a. RYX ! W X W Y M ! 26,26 Y 2,5 5  7,5 12  12,5 10  17,5 3 M X ! ! 9,33 30 1 2 2 2 2 2 14 WY !  26,26 5  22  26,26 10  30  26,26 9  38  26,26 6 ! 62,86 30 1 2 2 2 2 2 WX ! 2,5  9,33 5  7,5  9,33 12  ,5  9,33 10  ,5  9,33 3 ! 19,1389 12 17 30

? ?

A A

M XY ! RYX

1 ?2,5 30 1  2,5 38 4  ...  17,5 14 3A! 216 30 216  9,33 26,26 ! ! 0,836 62,86 19,1389

85

b. RYX '

1 1 M Y  M M Y X X ! W 1 W Y
X

1 1 M ! 0,4 5  0,133 12  0,08 10  0,057 3 ! 0,152 X 30 1 1 2 2 2 2 W 2 ! 0,4  0,152 5  0,133,0152 12  0,08  0,152 10  0,057  0,152 3 ! X 30 ! 0,013 1 1 M Y ! ?0, 4 30 1  0,4 38 4  ...  0,057 14 3A! 4,632 X 30 4,632  0,152 26,26 RYX ' ! ! 0,7218 0,013 62,86 RYX > RYX ' , rezult c dreapta de regresie este mai reprezentativ . 4) Y X ! a  bX

Folosind metoda celor mai mici p trate, unde M Y  Y X - min, rezult :


2

a  bM ( X ) ! M (Y ) 2 aM ( X )  bM ( X ) ! M ( XY ) a ! M (Y )  bM ( X ) b! M ( XY )  M ( X ) M (Y ) M ( XY )  M ( X ) M (Y ) ! 2 2 WX M ( X 2 )  ?M ( X )A

M (X 2) !

1 ,52 5  7,52 12  12,52 10  17,52 3 ! 106,25 2 30

b!

216  9,33 26,26 ! 1,516 19,1389 a ! 26,26  1,516 9,33 ! 40,40

Y ( X ) ! 40,40  1,516 X

86

Problema 3 Pre ul unui produs a fost observat n 30 puncte de vnzare la un moment t dat. Valorile nregistrate sunt urm toarele: 21; 24; 26; 30; 25,9; 26; 20; 24,2; 27; 29; 25,6; 26,3; 27; 22; 24,5; 28; 25; 27,5; 22,5; 24,7; 26,6; 23,2; 25,1; 27,5; 23; 24,8; 23,7; 25; 22,8; 23. Se cere: 1. 2. 3. 4. elaborarea distribu iei statistice a punctelor de vnzare n raport cu pre ul; analiza reprezentativit ii pre ului mediu; reprezentarea grafic a structurii reparti iei; avnd seria cronologic ce red varia ia pre ului produsului studiat n 6 luni consecutive ca fiind urm toarea: 2 3 4 5 6 1 Y : 25 25,7 26 26,5 26,8 28 Calcula i i interpreta i: a) pre ul mediu lunar; b) ritmul mediu lunar.

1) elaborarea distribu iei statistice a punctelor de vnzare n raport cu pre ul: 30  20 10 - calcul m lungimea intervalului: l X ! ! !2 5 5 ?20  22 ?22  24 ?24  26 X : 2 7 10

?26  28 ?28  30
8 3

- serie de reparti ie unidimensional , avnd la baz o variabil atributiv , cantitativ continu i frecven a absolut . 2) Analiza reprezentativit ii pre ului mediu: 21 2  23 7  25 10  27 8  29 3 42  161  250  216  87 756 25,2 ! ! 30 30 30 - pre ul mediu este 25,2; X ! p analiz m reprezentativitatea mediei cu ajutorul varian ei i a coeficientului de varia ie a lui Pearson:
2 V (X ) ! W X !

X
R i !1

' i

X N

N
2

W (X ) ! W

2 X

! V (X )

87

CV ( X ) !

WX X

100

- dac CV(X) u 50% - media este nereprezentativ


2 WX !

30 - pre ul se abate n medie de la valoarea medie cu 2,15.


2 W X ! W X ! 4,63 ! 2,15

21  25,2 2 2  23  25,2 2 7  25  25,2 2 10  27  25,2 2 8  29  25,2 2 3 ! 4,63

CV ( X ) !

WX X

100 !

2,15 100 ! 0,0853 100 ! 8,53% 25,2

30% media este reprezentativ .

3) Reprezentarea grafic a structurii reparti iei: - reprezentarea grafic a structurii unei reparti ii se face cu ajutorul diagramelor de structur ; fi ! f1 ! f2 f3 f4 f5 Ni 100 p frecven a relativ N

2 100 ! 0,0667 100 ! 6,67% 30 7 ! 100 ! 0,2333 100 ! 23,33% 30 10 ! 100 ! 0,3333 100 ! 33,33% 30 8 ! 100 ! 0,2667 100 ! 62,67% 30 8 ! 100 ! 0,1 100 ! 10% 30 Q i ! f i 360 Q Q1 ! 24,01Q Q 2 ! 83,99 Q Q 3 ! 119,99 Q Q 4 ! 96,01Q Q 5 ! 36 Q

Titlu: Stuctura punctelor de vnzare n raport cu pre ul

10%

6,67% 1 23,33% 2 3 4 5 33,33%

26,67%

88

Legend : 1. 6,67% din punctele de vnzare au pre uri cuprinse ntre 20 i 22; 2 . 23,33% din punctele de vnzare au pre uri cuprinse n intervalul [22 - 24); 3 . 33,33% din punctele de vnzare au pre uri cuprinse n intervalul [24 - 26); 4 . 26,67% din punctele de vnzare au pre uri cuprinse n intervalul [26 - 28); 5 . 10% din punctele de vnzare au pre uri cuprinse n intervalul [28 - 30); 2 3 4 5 6 1 4) Y : 25 25,7 26 26,5 26,8 28 Calcula i i interpreta i: a) pre ul mediu lunar; b) ritmul mediu lunar. 1 1  25,7  26  26,5  26,8  28 2 2 ! 26,33 a) Y / luna ! 5 - pre ul mediu lunar este de 26,33 25

b) R Y ! I Y  1 ! I Y 100%  100% 25,7 25  26 25,7  26,5 26  26,8 26,5  28 26,5 ! 25 2  25,7 2  26 2  26,5 2  26,8 2 642,5  668,2  689  710,2  750,4 ! ! 625  660,49  676  702,25  718,24 3460,3 ! ! 1,0231 3381,98 IY ! R Y ! I Y  1 100 ! 0,0231 100 ! 2,31% - pre ul a crescut n medie de la o lun la alta cu 2,31%. Problema 4 Se consider un e antion de 100 gospod rii i variabilele X-num r de membrii i Y-cantitatea de pine consumat zilnic de o gospod rie (Kg), rezultatele fiind prezentate n tabelul urm tor: X Y 0,25 0,5 1 1,5 TOTAL 5 5 10 30 5 35 5 15 5 25 89 10 20 30 5 40 30 25 100 1 2 3 4 TOTAL

Se cere: 1. cantitatea medie, median i modal de pine consumat zilnic de o gospod rie (calcul i interpretare); 2. n ce propor ie cantitatea de pine depinde de num rul de membrii; 3. analiza numeric i caracterizarea intensit ii leg turii ntre cele dou variabile. 1) 0,25 0,5 1 1,5 Y : 5 40 30 25 Y - Media 0,25 5  0,5 40  1 30  1,5 25 1,25  20  30  37,5 88,75 Y! ! ! ! 0,89[kg ] 100 100 100

- 0,89 este cantitatea medie de pine consumat zilnic de o gospod rie. Me Mediana - variabila discret N=100 Y N  Y N Me !
2

N ! 50 2 Y50  Y51 0,5  1 ! ! 0,75 2 2

2 1

- jum tate din gospod rii consum zilnic pine ntre 0,25 i 0,75 kg, iar cealalt jum tate ntre 0,75 i 1,5 kg de pine pe zi. Mo Modala - variabila discret NMo = max(N1, N2, N3, N4) NMo = 40 Mo = 0,5 - cele mai multe gospod rii consum zilnic n jur de 0,5 kg de pine.
2 2) Se calculeaz : rxy !

V EXP VTOT

VTOT (Y ) !

2,25  0,89 2 5  0,5  0,89 2 40  1  0,89 2 30  1,5  0,89 2 25 ! 0,18


Y
r i !1 i

Y N

N
2

100

i.

VTOT !

Y / x
J

Y N

N
2

.j

VEXP !

j !1

90

Calcul m mediile condi ionate ale lui Y n func ie de X. 0,25 5  0,5 5 ! 0,35 10 0,5 30  1 5 ! 0,57 Y 2 ! Y / x2 ! 35 0,5 5  1 15  1,5 5 !1 Y 3 ! Y / x3 ! 25 1 10  1,5 20 ! 1,33 Y 4 ! Y / x4 ! 30 Y 1 ! Y / x1 ! V EXP (Y ) !

100 2,9  3,5,025  5,7 12,35 ! ! ! 0,12 100 100 V 0,12 2 rxy ! EXP ! ! 0,66 66% VTOT 0,18 - consumul zilnic de pine de gospod rie depinde de num rul de membrii al gospod riei n propor ie de 66%. 3) Analiza numeric i caracterizarea intensit ii leg turii ntre cele 2 variabile - X, Y variabile cantitative intensitatea leg turii se studiaz cu ajutorul raportului de corela ie (rXY)
2 rXY ! rXY !

0,35  0,89 2 10  0,57  0,89 2 35  1  0,89 2 25  1,33  0,89 2 30 !

V EXP [0;1] VTOT

2 rXY ! rXY ! 0,66 ! 0,81 p 1 leg tura intens ntre cele dou variabile.

Problema 5 Cunoscnd seriile cronologice cu privire la: num rul de omeri muncitori (X), num rul de omeri cu studii medii (Y), num rul de omeri cu studii superioare (Z) din jude ul Cluj n 10 luni consecutive, respectiv: mii persoane 10 28,3 6,2 0,5

Lun a X Y W

1 22,2 3 3,86 0,39 6

2 22,2 4 3,87 0,39 5

3 22,3 4 3,98 0,41 9

4 23,2 1 4,52 0,43 7

5 24,7 4,1 0,35 7

6 26,8 5 4,53 0,40 6

7 28,7 4,91 0,45 5

8 29,1 5,28 0,48 7

9 28,3 6,18 0,5

91

Se cere: 1. Rela ia matematic ce exprim leg tura dintre num rul total de omeri (Z) i X, Y, W; 2. Seria cronologic avnd la baz num rul total de omeri din jude ul Cluj; 3. Num rul mediu lunar de omeri; 4. Indicele mediu i ritmul mediu al num rului total de omeri; 5. Diferen a medie absolut a num rului total de omeri; 6. Primii 4 indici exprimnd varia ia integral a num rului total de omeri, calcula i cu baz fix ; 7. Indicii factoriali de tip Paasche aferen i fiec rui factor care influen eaz num rul total de omeri n luna 4 fa de luna 1.

1. z(t) = x(t) + y(t) + w(t); 2. Lun a z(t) 1 2

t ! 1, 10

10

26,4 86

26,2 05

27,7 39

28,1 67

29,1 54

31,7 86

34,0 65

34,8 67

34,9 80

35,0 00

3. z(t) este o serie cronologic de momente z(1) z(10)  z(2)  z(3)  .....  z(9)  2 ! 277 ! 30,77 z! 2 9 9 Num rul mediu de omeri din Cluj n cele 10 luni este de 30,77 mii 4. Iz !
10

z (t ) z(t  1)
i !1 10

[ z(t  1)]
i !1

26,505 26,486  26,739 26,505  ....  35 34,98 ! 1,03 26,486 2  26,505 2  ....  34,98 2

n primele 10 luni, num rul de omeri a crescut n medie de 1,03 ori de la o lun la alta. R z ! I z  1 ! 1,03  1 ! 0,03 ! 3% Num rul total de omeri a crescut n medie cu 3% de la o lun la alta. 5. ( z ! z(10)  z(1) ! 0,945 9 Num rul total de omeri a crescut n medie cu 0,954 mii persoane de la un an la altul.

92

2 6. I z / 1 !

z 2 26,505 ! ! 1,007 z 26,486 1 de prima.

Num rul total de omeri din jude ul Cluj a crescut de 1,007 ori n luna a doua fa I 3 /1 ! z
4 I z /1

I 5 /1 z

z 3 26,739 ! ! 1,0095 z 26,486 1 z 4 28,167 ! ! ! 1,063 z 26,486 1 z 5 29,154 ! ! ! 1,1 z 26,486 1

7. Num rul total de omeri z(t) depinde de factorii de influen astfel: z(t) = x(t) + y(t) + w(t) x 4  y 4  w 4 ! 1,036 x  y 4  w 4 1 Num rul total de omeri ar fi crescut de 1,036 ori n luna 4 fa num rului de omeri muncitori. I 4 // 1 P ! z x I 4 // 1 P ! z y x 4  y 4  w 4 ! 1,023 x 4  y  w 4 1 de luna 1 datorit modific rii

de luna 1 datorit modific rii

Num rul total de omeri ar fi crescut de 1,023 ori n luna 4 fa num rului de omeri cu studii medii. I 4 // 1 P ! z w x 4  y 4  w 4 ! 1,0014 x  y 4  w 1 1

Num rul total de omeri ar fi crescut de 1,0014 ori n luna 4 fa modific rii num rului de omeri cu studii superioare. Problema 6

de luna 1 datorit

Evolu ia num rului de contracte de vnzare ncheiate de o societate n zilele lucr toare ntr-o anumit perioad a fost urm toarea: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Y: 20 21 22 21 19 21 22 24 23 22 23 24 25 24 23 Se cere: 1. Tendin a m rimii analizate (dac se constat prezen a factorilor sezonieri desezonaliza i serie). 2. Previziunea m rimii pe urm toarele 5 zile.

93

Rezolvare: 1. Pentru a determina tendin a, trebuie s reprezent m cronograma n vederea stabilirii prezen ei factorilor sezonieri: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Y: 20 21 22 21 19 21 22 24 23 22 23 24 25 24 23

30 25 20 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 24 21 22 21 19 21 23 22 22 23 24 25 24 23

Dup cum se observ din grafic, exist factori sezonieri, tendin a fiind cresc toare. Deci, varia ia num rului de contracte este de forma: y(t) = T(t) + S(t) + (t) unde: T(t) tendin a S(t) componenta sezonier (t) factori neesen iali Ne organiz m datele astfel: Ziua S pt. 1 2 3 II I 20 21 23 21 22 24 22 24 25 21 23 24 19 22 23 III IV V

Folosind procedeul mediilor mobile calcul m seria desezonalizat dup rela ia:

94

' Y13 !

Y11  Y12  Y13  Y14  Y15 5 Y  Y13  Y14  Y15  Y21 ' Y14 ! 12 5 . . . . Y  Y32  Y33  Y34  Y35 ' Y33 ! 31 5 Ziua S pt. 1 2 3 II I 21,4 23,4 21,8 23,6 20,6 22,4 23,8 20,8 22,8 21 23,2 III IV V

Calcul m coeficien ii de sezonalitate: Ziua S pt. 1 2 3 K K ts ! KI ! II I 0,98 0,98 0,98 Yts ' Yts K 2 I  K 3I 2 . . . . K 1V  K 2V 2 1,01 1,02 1,015 1,07 1,07 1,05 1,063 1,01 1,01 1,01 0,90 0,95 0,925 III IV V

KV !

2 3 4 5 6 7 8 9 10 11 1 Y('t ) : 20,6 20,8 21 21,4 21,8 22,4 22,8 23,2 23,4 23,6 23,8

95

25 24 23 22 21 20 19 1 2 3 4 5 6 7 8 9 10 20,6 20,8 21,4 21,8 22,8 22,4 23,2 23,4 23,6 23,8

Din grafic se observ c tendin a cea mai probabil este o dreapt . Deci: T(t) = a + bt Punnd condi ia ca: M?Y t  T t A =minim, ob inem:
2

a ! M [ y(t ]  bM (t ) a  bM (t ) ! M [ y (t )] M [ y (t ) t ]  M [ y (t )] M (t ) 2 b aM 2 (t )  bM (t ) ! M [ y (t ) t ] ! M (t 2 )  ?M (t )A 1  2  ...  11 !6 11 1 2  2 2  ...112 ! 4,61 M (t 2 ) ! 11 20,6  20,8  ...  23,8 ! 22,25 M y t ! 11 1 20,6  2 20,8  ...  11 23,8 ! 137,07 M y t t ! 11 137,07  22,25 6 b! ! 0,357 46,1  36 a = 22,25 0,357 6 = 20,108 M (t ) ! 6.1.1.1.1.1 T(t) = 20,108 + 0,357 t 2. Previziunea valorilor lui Y

96

Y4P ! T (14) K I ! 20,108  0,357 14 0,98 ! 24,6 } 25 I Y4P ! T (15) K II ! 20,108  0,357 15 1,015 ! 25,8 } 26 II Y4P ! T (16) K III ! 20,108  0,357 16 1,063 ! 27,44 } 27 III Y4P ! T (17) K IV ! 20,108  0,357 17 1,01 ! 26,4 } 26 IV Y4P ! T (18) K V ! 20,108  0,357 18 1,925 ! 24,54 } 25 V Problema 7 O agen ie imobiliar dore te s dispun de o func ie cu ajutorul c reia s poat evalua rapid valoarea de pia a apartamentelor. Pentru aceasta, are la dispozi ie o baz de date cuprinznd 30 de apartamente observate n raport cu variabilele: Y = pre ul de vnzare n mii euro X 1 = suprafa a n metri p tra i X 2 = num rul de camere X 3 = finisaj*nr.camere. Se calculeaz prin nmul irea gradului de finisare (0 pentru nefinisat, 1 pentru semifinisat i 2 pentru finisat) cu num rul de camere.

97

Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

X1 22 74 21 32 52 88 48 35 78 80 45 39 68 42 92 50 26 60 64 28 30 83 44 71 28 49 46 22 65 69

X2 1 4 1 2 3 4 2 1 3 4 2 2 3 1 4 2 1 3 3 1 1 4 2 3 1 2 2 1 3 3

X3 2 4 1 4 0 4 0 0 6 8 0 2 0 0 4 0 1 3 6 0 1 0 4 0 2 2 2 1 6 6

15,3 42,0 13,0 20,0 25,8 46,6 24,7 18,9 41,5 47,5 24,0 22,3 33,5 20,7 49,5 26,6 16,0 32,7 38,1 15,1 15,6 39,8 27,0 35,0 17,3 25,5 25,0 14,5 39,5 41,5

Se cere:

98

1) Studia i grafic existen a i forma leg turii dintre pre i fiecare din variabilele dependente. 2) Calcula i parametrii func iei liniare multiple dintre pre i toate variabilele explicative. 3) Este reprezentativ aceast func ie ? 4) S se fac cteva simul ri ale valorii de pia a apartamentelor pentru diferite valori ale variabilelor explicative. 5) Compara i reprezentativitatea func iei ob inute cu a func iilor de regresie simple. Rezolvare 1) Graficul care ne poate indica existen a sau forma leg turii este diferit n func ie de natura variabilei explicative: discret sau continu . a) Leg tura dintre pre i suprafa . Deoarece suprafa a este o variabil continu , putem construi norul de puncte.

50 45 40
pret (mii euro)

35 30 25 20 15 10 5 0 0 20 40 60 suprafata (mp) 80 100

Se observ c leg tura exist

i este liniar .

b) Leg tura dintre pre i num rul de camere. Norul statistic se prezint astfel:

99

50 45 40 35 pret (mii euro) 30 25 20 15 10 5 0 0 1 2 numar camere 3 4

Dac forma leg turii nu pare evident prin norul de puncte se poate utiliza i un grafic care folose te mediile condi ionate, din grupe. Procednd analog i pentru variabila r mas , concluzion m c putem modela leg turile dintre pre i fiecare din variabile prin func ii liniare. 2) Func ia de regresie liniar multipl se scrie : Y ! a1 X 1  a 2 X 2  a 3 X 3  I Prin aplicarea metodei celor mai mici patrate ajungem la ecua ia scris sub form implicit : M 00 ?  M (Y )A M 01 ?X 1  M ( X 1 )A M 02 ?X 2  M ( X 2 )A Y

 M 03 ?X 3  M ( X 3 )A! 0

Scriem matricea de varia ie i covaria ie : m00 ! m03 m13 m23 m33

M ( 4)

m01 m11

m02 m12 m22

2 m00 ! W Y ! 121,55

m01 ! M (YX 1 )  M (Y ) M ( X 1 ) ! 227 m02 ! M (YX 2 )  M (Y ) M ( X 2 ) ! 11,196 m03 ! M (YX 3 )  M (Y )M ( X 3 ) ! 16,229

100

2 m11 ! W X 1 ! 443

m12 ! M ( X 1 X 2 )  M ( X 1 )M ( X 2 ) ! 21,39 m13 ! M ( X 1 X 3 )  M ( X 1 )M ( X 3 ) ! 23,19


2 m22 ! W X 2 ! 1,143

m23 ! M ( X 2 X 3 )  M ( X 2 ) M ( X 3 ) ! 1,2767
2 m33 ! W X 3 ! 5,41

M ( 4)

121,55 227 11,196 16,229 443 21,39 23,19 ! 1,143 1,2767 5,41

Calcul m complemen ii algebrici: M 00 ! 193,92 M 01 ! 82,58 M 02 ! 135,4 M 03 ! 195,79 Ecua ia de regresie devine : 193,92?  M (Y )A 82,58?X 1  M ( X 1 )A 135,4?X 2  M ( X 2 )A Y  195,79?X 1  M ( X 3 )A! 0

Prin nlocuirea valorilor medii, avem: 193,92?  28,48A 82,58?X 1  51,7A 135,4?X 2  2,3A Y  195,79?X 1  2,3A! 0

Dup efectuarea calculelor se ob ine ecua ia sub form explicit : Y ! 2,559  0,4258 X 1  0,698 X 2  1,01X 3  I

101

3) Reprezentativitatea func iei o apreciem prin coeficientul de corela ie liniar multipl : det M ( 4 ) 131,75 ! 1 ! 0,997 m00 M 00 121,55 193,92

RY , X 1X 2 X 3 ! 1 

deci func ia este foarte reprezentativ . 4) Pentru un apartament de 65mp, cu 3 camere, semifinisat : X 1 ! 66 X2 ! 3 X3 ! 3

Y (66,3,3) ! 2,559  0,4258 66  0,698 3  1,01 3 ! 35,8 mii euro Rezultatul este foarte realist dac privim baza de date ini ial . 5) Rezolvarea acestui punct r mne la latitudinea cititorului.

102

LUCR RI PRACTICE LUCRAREA 1 P1. Da i 5 exemple de popula ii statistice a c ror cercetare ar prezenta interes i pentru fiecare popula ie selectat preciza i: 1. denumirea popula iei, a unit ii statistice i volumul acesteia; 2. scopul cercet rii statistice; 3. variabilele statistice n raport cu care s-ar face observarea statistic a popula iei. P2. S se extrag din Anuarul Statistic sau alte surse informa ionale o serie statistic bidimensional ce red distribu ia unei popula ii n raport cu dou variabile atributive, relativ la care se cere: 8. denumirea popula iei ce a fost supus observ rii i volumul acesteia; 9. unitatea statistic ; 10. caracterizarea variabilelor statistice n raport cu care a fost studiat popula ia; 11. caracterizarea seriei statistice n raport cu toate criteriile cunoscute; 12. elaborarea seriei bidimensionale format cu frecven e relative, interpretare; 13. extragerea reparti iilor unidimensionale marginale i a celor condi ionate; 14. pornind de la o reparti ie marginal deduce i celelalte serii statistice posibile, interpretare. P3. Din Anuarul Statistic sau alte surse informa ionale extrage i o serie statistic de reparti ie, avnd la baz o variabil de spa iu, relativ la care se cere: 6. denumirea popula iei statistice i volumului ei; 7. unitatea statistic ; 8. caracterizarea seriei dup toate criteriile cunoscute; 9. deducerea seriei format cu frecven e relative; 10. interpretare. P4. Din Anuarul Statistic sau alte surse informa ionale extrage i dou serii cronologice avnd la baz indicatorul de nivel, una de momente, alta de intervale i deduce i seriile formate cu diferen e absolute, indici statistici, diferen e relative, cu baz fix i cu baz n lan (interpret ri). P5. Da i 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate. P6. Din Anuarul Statistic sau alte surse informa ionale extrage i o serie de spa iu format cu indicator de nivel sau indicator relativ de intensitate i deduce i seriile formate cu diferen e absolute, indici i diferen e relative, calculate cu baz fix . Interpretare. P7. Extrage i 5 exemple de serii de spa iu ce con in informa ii importante pentru domeniul economic. LUCRAREA 2 Lund ca exemplu o popula ie statistic studiat n raport cu un anumit num r de variabile (stabilite n raport cu obiectivul studiului), se cere: P1. Elaborarea tuturor seriilor statistice de reparti ie unidimensionale P2. Elaborarea a trei serii statistice de reparti ie bidimensionale ( una are la baza dou variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ , una are la baz dou variabile cantitative) P3. Reprezentarea grafic a: histogramei, poligonului frecven ei, cercului de structur , diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma. LUCRAREA 3

103

Consider m o popula ie statistic din lucr rile anterioare observat n raport cu mai multe variabile. Se cere: 1. Alege i dou variabile (una cantitativ , cealalt calitativ ) i construi i reparti ia popula iei n raport cu fiecare din ele; 2. Calcula i i interpreta i corespunz tor parametrii tendin ei centrale (valoarea medie, median , modal ) pentru seria care are la baz variabila cantitativ ; 3. Analiza i reprezentativitatea parametrilor tendin ei centrale (sub form absolut i relativ ) 4. Folosind parametrii de structur analiza i structura popula iei n raport cu variabila cantitativ ; 5. Analiza i gradul de dispersare a unit ilor popula iei n raport cu variabila cantitativ ; 6. Caracteriza i sintetic concentrarea unit ilor din popula ie folosind variabila nenumeric ; 7. Analiza statistic a asimetriei reparti iei de la punctul 1; 8. Analiza i comparativ rezultatele ob inute la punctele 5 i 6. LUCRAREA 4 P1. Pentru o distribu ie n raport cu dou variabile calitative ntre care se presupune c ar putea exista vreo leg tur , se cere : 1. Verificarea existen ei leg turii dintre cele dou variabile. 2. Dac leg tura exist , c t de intens este aceasta ? P2. Pentru o popula ie observat n raport cu dou variabile cantitative ntre care ar putea exista o leg tur , se cere : 1. Aprecierea existen ei i a intensit ii leg turii dintre variabile ; 2. S se formuleze pe baza unui grafic adecvat ipoteze cu privire la forma posibil a func iei de regresie dintre ele ; 3. Pentru func iile re inute ca fiind posibile, s se calculeze parametrii ; 4. Care din aceste func ii este mai reprezentativa ? 5. Pentru func ia aleas s se fac cteva simul ri ale valorilor previzionate prin aceasta. P3. Pentru o popula ie observat n raport cu mai multe variabile, n care presupunem c una din ele depinde de celelalte se cere : 1. Pe baza unui tip de grafic adecvat, s se stabileasc dac ar putea exista leg tur ntre variabila dependent i fiecare din celelalte variabile; 2. n ipoteza unei leg turi liniare multiple, s se calculeze parametrii func iei; 3. S se stabileasc reprezentativitatea acestei func ii i s se compare cu reprezentativitatea fiec reia dintre func iile liniare simple. LUCRAREA 5 P1. Pentru trei produse, n dou luni consecutive se cunosc pre ul de vnzare i respectiv cantit ile vndute. Se cere : 1. Indicele varia iei integrale ; 2. Indicii factoriali ai pre urilor i respectiv cantit ilor vndute, prin metodele L, P, F. Este verificat sau nu condi ia de completitudine ? P2. Din Anuarul Statistic al Romniei, extrage i structura de consum a popula iei pentru trei grupe de produse :

104

- m rfuri alimentare - m rfuri nealimentare - servicii pentru dou luni consecutive. Se cere : 1. Indicii pre urilor pe cele trei grupe ; 2. Calcula i indicele pre ului (pe total) de tip L i P. P3. Dac pentru un co bursier format din trei ac iuni se cunoa te : - cursul fiec rei ac iuni - num rul de ac iuni tranzac ionate s se calculeze indicele bursier. Lucrarea 6 P1. Alegnd o serie cronologic din lucrarea 1, care manifest component de tendin , se cere : 1. Diferen a medie absolut , indicele mediu, ritmul mediu ; 2. Emiterea unor ipoteze privind forma tendin ei ; 3. Estimarea parametrilor tendin ei ; 4. Previziunea pentru urm toarele trei perioade. P2. Pentru o serie cronologic ce prezint component sezonier , se cere : 1. Cronograma i precizarea componentelor prezente ; 2. Calculul mediilor mobile de ordin p (p=perioada componentei sezoniere) ; 3. Calculul i interpretarea coeficien ilor sezonalit ii ; 4. Estimarea parametrilor tendin ei ; 5. Previziuni pentru urm toarele 4 perioade de timp.

105

S-ar putea să vă placă și